Текст
                    Дж.Кемени,
Дж.СнЕЛА, Дж.ТОМПСОН
Введение
в КОНЕЧНУЮ
МАТЕМАТИ КУ


INTRODUCTION TO FINITE MATHEMATICS J. O. KEMENY, J. L. SNELL, O. L. THOMPSON Department of Mathematics, Dartmouth College ENGLEWOOD CLIFFS, N. Y., PRENTICE-HALL 1957
Дж. К ЕМ Eli И, Дж. СНЕЛЛ, Дж. ТОМПСОН ВВЕДЕНИЕ В КОНЕЧНУЮ МАТЕМАТИКУ Перевод с английского М. Г. Зайцевой Под редакцией И. М. Я г лома ИЗДАТЕЛЬСТВО ИНОСТРАННОЙ ЛИТЕРАТУРЫ Москва 1963
АННОТАЦИЯ В связи с широким развитием «машинной математики» математиков все больше начинают интересовать вопросы дискретной математики, т. е. математики, не связанной с по¬ нятием предельного перехода. В книге дается элементарное введение в эту область, вполне доступное студентам младших курсов как математических, так и технических или гумани¬ тарных специальностей. В ней излагаются некоторые вопросы математической логики, «дискретной» теории вероятностей, матричного исчисления, теории игр, математической эконо¬ мики и др. Изложение сопровождается большим числом при¬ меров и задач для упражнений. Книга написана очень живо и увлекательно и с успехом может быть использована лицами различных специальностей, желающими ознакомиться с этим важным разделом совре¬ менной математики. Немало новых и интересных постановок задач, нового освещения известных и малоизвестных вопро¬ сов найдут в ней и специалисты-математики. Редакция литературы по математическим наукам
ОТ РЕДАКТОРА РУССКОГО ИЗДАН ИЯ Возникшие в последние два десятилетия новые пути прило¬ жения математики, связанные с комплексом идей и методов, ныне объединяемых собирательным термином «кибернетика», повлекли за собой глубокие изменения в самой математической науке. Они не только вызвали к жизни новые большие направле¬ ния теоретической математики (из которых иные, такие, как тео¬ рия игр или теория информации, заняли уже положение само¬ стоятельных математических наук), но и способствовали измене¬ нию установившихся взглядов на ранее сложившиеся разделы. Наиболее существенным здесь является, по-видимому, то, что разделы математики, не связанные с представлением о бесконеч¬ ных множествах, пределах и непрерывности, представляются нам теперь гораздо более содержательными и важными, чем это думали математики XIX века или первой половины XX века. Если, начиная с XVII века, главенствующее положение в мате¬ матике занимало изучение (гладких) функций непрерывно ме¬ няющегося аргумента, являющееся основой всех приложений ма¬ тематики к физике и к технике, то сегодня можно говорить о воз¬ рождении интереса к так сказать «до-ньютоновской» или «конеч¬ ной» математике, оперирующей лишь с конечными множества¬ ми; при этом возникли новые подходы к этой ветви математики, идущие в основном от математической логики. Этот поворот в науке связан в первую очередь с появле¬ нием универсальных электронных цифровых вычислительных ма¬ шин, уже сегодня играющих колоссальную роль и в науке, и в народном хозяйстве. Прилагательное «цифровая» в названии этих машин подчеркивает принципиально дискретный, «конеч¬ ный» их характер, связанный со специфическими особенностями используемых в них электронных устройств. В свою очередь именно эти особенности машин обеспечивают и их «универсаль¬ ность», родственную универсальности любой числовой системы,
6 От редактора русского издания позволяющей записывать на условном языке цифр информацию самого различного характера; эта универсальность, наряду с быстродействием, составляет основное преимущество цифровых машин перед более старыми аналоговыми машинами непрерыв¬ ного действия, казавшимися вначале серьезными конкурентами цифровых машин. Появление универсальных цифровых машин вызвало в свою очередь необычайное расширение областей при¬ менения математики, «математизацию» целого ряда дисциплин, ранее далеких от всякого влияния математических методов— лингвистики и экономики, медицины и педагогики, психологии и теории искусства. Не во всех этих дисциплинах (и других, также явившихся объектом «математической экспансии» последних лет) матема¬ тика уже сейчас играет достаточно значительную роль. Однако нет ни малейшего сомнения, что роль эта будет в последующие годы все увеличиваться и что наметившееся сотрудничество ма¬ тематики, техники, естественных и гуманитарных наук приведет еще ко многим триумфам вроде расшифровки древних пись¬ менностей с помощью электронных счетных машин. И сейчас можно наблюдать, как с напряженным интересом штудируют математику пожилые лингвисты или врачи, долгие годы пола-’ гавшие, что им математика «ни к чему», и как в программы экономических или филологических факультетов университетов включаются курсы математики, по объему большие, чем те, ко¬ торые проходятся в высших технических учебных заведениях. При этом математика, которая нужна представителям гума¬ нитарных специальностей, как правило, оказывается совсем иной, чем та, которую изучают инженеры. При рассмотрении явлений, имеющих сугубо дискретную природу, не связанных с непрерывно меняющимися величинами — скажем, письменной речи, представляющей собой последовательность отдельных букв, каждая из которых может иметь (если речь идет о русском языке) одно из 32 возможных «значений», или высшей нерв¬ ной деятельности человека, складывающейся из дискретных из¬ менений в огромном числе нервных клеток (нейронов), состав¬ ляющих головной мозг, нам надо использовать специфические методы «конечной» математики, отличной от традиционной ма¬ тематики Ньютона. И учебные планы возникающих в последние годы «математических отделений» гуманитарных факультетов пестрят названиями, которые явятся новинкой для большин¬ ства выпускников втузов: линейное программирование и теория игр, исследование операций и теория информации, оптимальное планирование и методы Монте-Карло. Новые взгляды на математику повлекли за собой, естествен¬ но, и новые подходы к вопросам преподавания математики. При
От редактора русского издания 7 этом следует заметить, что очерченный выше поворот в науке явился весьма благодарным для целей преподавания, поскольку «новая» математика, именно в силу своего «конечного» харак¬ тера, гораздо более доступна для начинающих, чем классиче¬ ский математический анализ; она скорее может заинтересовать учащегося и вызовет меньше трудностей и поэтому -больше подходит для преподавания на ранних стадиях обучения. Это обстоятельство наряду с глубокой убежденностью многих мате¬ матиков и педагогов в жизненности и важности новых направ¬ лений математики придало большой размах международному движению за модернизацию преподавания математики в сред¬ ней и высшей школе. И одним из лидеров этого широкого дви¬ жения бесспорно является профессор Дартмутского колледжа в г. Ганновере (США) Джон Г. Кемени. Ученик выдающегося американского математика Джона фон Неймана, одного из создателей и современных электронных счетных машин и некоторых крупных разделов «конечной мате¬ матики» (таких, как теория игр или теория автоматов), Дж. Кеме¬ ни является видным математиком и организатором, а также тем¬ пераментным и умелым педагогом. Он и его коллеги и единомыш¬ ленники Дж. JI. Снелл, Дж. Л. Томпсон и X. Миркель превра¬ тили Дартмутский колледж в один из оплотов нового движе¬ ния. Плодом их коллективной работы явилось и настоящее учеб¬ ное руководство, предлагаемое ныне вниманию русского чита¬ теля. Эта книга представляет собой учебник нового типа, рассчи¬ танный скорее на ознакомление читателей с определенными идеями, с духом «новой» математики, чем на сообщение боль¬ шого количества конкретных фактов. Несмотря на это, содержа¬ ние книги оказалось довольно богатым: оно включает элементы математической логики и теории вероятностей — этих двух краеугольных камней «новой» математики, а также некоторые сведения из более специальных дисциплин (вроде линейного про¬ граммирования или теории игр). Однако многие сообщаемые здесь результаты не претендуют на серьезное самостоятельное значение, а носят скорее иллюстративный характер. По идее ав¬ торов настоящая книга призвана служить учебником в высшем учебном заведении по курсу, который читается параллельно с традиционным курсом математического анализа с тем, чтобы студенты могли по своему выбору начать с одного или с другого из этих курсов; при этом предполагается, что окончательно они прослушают оба курса. Эта программа довольно близка к тем, которые приняты у нас в настоящее время, скажем, на «матема¬ тических, отделениях» филологических факультетов.
8 От редактора русского издания Современная зарубежная математическая литература не так уж бедна книгами сходной тематики. Однако настоящая книга, бесспорно, является в этом ряду одной из самых удачных. Ав¬ торы уделили большое внимание подбору примеров и упражне- ний, несложных, но ярких и занимательных, способных заинте¬ ресовать читателя. Удачей авторов представляется нам послед¬ няя глава книги, убедительно иллюстрирующая некоторые из новых применений математики. Надо только иметь в виду, что эта последняя глава также имеет своей целью лишь пропаганду новых идей, и выводы ее не должны восприниматься как имею¬ щие непосредственное прикладное значение. Редакционная работа над книгой носила двоякий характер. Во-первых, вскоре после выхода в свет английского оригинала книги те же авторы (при участии X. Миркеля) выпустили в свет второй, больший по объему вариант своей книги, названный ими «Конечные математические структуры». В то время как первую книгу авторы рассматривают как учебник «конечной ма¬ тематики» для студентов нематематических специальностей, вто¬ рая книга рассчитана уже на студентов-математиков; в соответ¬ ствии с этим в ней несколько урезана «нематематическая» часть (сосредоточенная в последней главе книги), но зато значитель¬ но расширена математическая часть, как за счет более полного изложения доказательств теорем, так и за счет частичного от¬ каза от обязательного требования «конечности» рассматривае¬ мых объектов. В русском переводе за основу принят первый вариант книги; однако он пополнен довольно обширными встав¬ ками !) из второго ее варианта. Вставки эти не меняют харак¬ тера книги, однако пополняют ее некоторыми существенными моментами, быть может просто упущенными из виду авторами в первоначальном варианте их книги. К числу таких моментов относится включение в книгу фундаментального понятия функ¬ ции, вовсе не требующего для своего определения чуждого «ко¬ нечной математике» понятия математического континуума, а также существенные дополнения в главе о теории вероятностей, явно более удачной во втором варианте книги. Другое обстоятельство, которое необходимо было учесть при подготовке русского издания, заключается в следующем. При подборе примеров и упражнений авторы «стремились выбирать темы, с которыми студенты знакомы из своего жизненного опы¬ та». Однако жизненный опыт наших студентов во многом не сов¬ падает с жизненным опытом студентов в США, и поэтому ре¬ дакции пришлось пойти на немногочисленные замены (произво¬ димые каждый раз таким образом, чтобы математическое со- !) Эти вставки переведены с английского Э. Л. Наппельбаумом.
От редактора русского издания 9 держание примера оставалось в точности тем же, что и рань¬ ше): так нами были заменены все примеры, связанные с игрой на бирже, и некоторые другие примеры, непонятные нашему чи¬ тателю. в' совсем редких случаях пришлось даже пойти на полное исключение задач, содержание которых (достаточно близкое, по- видимому, американским студентам) не смогли понять ни редак¬ тор, ни переводчики книги (речь в этих задачах шла о мало из¬ вестных в нашей стране правилах игры в бейсбол). Заново со¬ ставлены списки «литературы для дополнительного чтения», содержащие указания и на более элементарную литературу, которая может служить для первоначального ознакомления с предметом. Наконец, редактору принадлежат все (довольно немногочисленные) подстрочные примечания в русском переводе книги. И. М. Яглом
ПРЕДИСЛОВИЕ Обычные программы по математике для студентов предусма¬ тривают изучение на первом и втором курсах лишь дифферен¬ циального и интегрального исчисления и примыкающих дисцип¬ лин. Несколько лет назад отделение математики Дартмутского колледжа решило ввести для первокурсников новый курс, кото¬ рый студенты могли бы выбирать наряду с более традиционными курсами. Этот курс предназначался для того, чтобы озна¬ комить студента с некоторыми понятиями современной матема¬ тики уже в начале пребывания его в колледже. Хотя курс мыслился прежде всего как математический, он должен был включать приложения к биологическим и социальным наукам и тем самым освещать точку зрения на математику «потребите¬ лей», отличную от точки зрения физиков. При планировании намеченного курса выяснилось, что не существует никакого учебника, отвечающего нашим целям, вви¬ ду чего нам пришлось самим написать такую книгу. Мы стре¬ мились выбирать темы, с которыми студенты знакомы из своего жизненного опыта, а также темы, важные для современной ма¬ тематики и ведущие к интересным и важным приложениям. Чтобы лучше ориентироваться в последнем пункте,, мы попро¬ сили нескольких ученых-бихевиористов ]) сообщить свое мне¬ ние о том, с какого рода математическими вопросами придется иметь дело будущему бихевиористу. Основные темы книги взяты из этого перечня. *) Бихевиоризм (от английского слова behaviour — поведение)—модный на Западе термин для направления науки (в первую очередь — психологии), ставящего во главу угла те факты поведения человека и животных, которые поддаются непосредственному наблюдению. Бихевиористы считают, напри- еР> что действующие в человеческом обществе законы могут быть выве¬ дены из наблюдений над поведением людей в различных ситуациях.
12 Предисловие При написании книги мы ставили себе целью изложить раз¬ личные темы с единой точки зрения. Чтобы достигнуть этого на элементарном уровне, мы ограничились рассмотрением «конеч¬ ных» проблем, т. е. таких проблем, в которых не используются понятия бесконечного множества, предельного перехода, непре¬ рывности и т. д. Такое ограничение позволило углубиться в на¬ меченные темы в большей степени, чем это было бы возможно без него. Мы находим, что основные идеи конечной математики излагаются легче их «непрерывных» аналогов, а теоремы дока¬ зываются значительно проще. Первые пять глав образуют единое целое. Изучение множе¬ ства логических возможностей (гл. I) приводит к идее о множе¬ стве истинности, соответствующем тому или иному высказыва¬ нию; это в свою очередь дает естественный способ определения вероятности того, что заданное высказывание истинно (гл. IV). Соответствие между логическими операциями (гл. I), операция¬ ми над множествами (гл. II) и операциями над вероятностями (гл. IV) становится особенно прозрачным в конечном случае. Для иллюстрации и облегчения понимания идей в этих и даль¬ нейших главах книги используется очень удобный педагогиче¬ ский прием, состоящий в построении «дерева» (диаграммы спе¬ циального типа). Это позволяет, в частности, обойтись элемен¬ тарными средствами при изложении начал теории стохастических процессов. Относящееся сюда понятие цепи Маркова подгота¬ вливает читателя к овладению теорией векторов и матриц, из¬ лагаемых в гл. V. Глава VI вводит студента в две новые области математики, оказавшиеся полезными для приложений, — линейное програм¬ мирование и теорию игр. Основные идеи обеих теорий удается изложить сравнительно быстро за счет того, что необходимые математические средства подготовлены в предыдущих главах. В заключительной гл. VII обсуждаются некоторые важные применения математики к бихевиористским наукам. Отбор их производился с таким расчетом, чтобы они представляли инте¬ рес как для математиков, так и для бихевиористов. В каждой из пяти наук — социологии, генетике, психологии, антрополо¬ гии и экономике — было выбрано по одной геме. Чтение разде¬ лов этой главы может показаться читателю более трудным, чем чтение предыдущих глав, но здесь никак нельзя было обойтись более простым материалом: чтобы оценить роль математики в смежных дисциплинах, надо рассмотреть нетривиальные прило¬ жения и продвинуться в их изучении достаточно далеко. Мы не ожидаем, что при чтении курса по нашей книге будут использо¬ ваны все темы этой главы. Однако мы надеемся, что гл. VII
Предисловие 13 будут пользоваться для справок и в качестве материала для са- мостоятельного изучения более инициативные студенты. Комиссия по составлению программ для студентов при Аме¬ риканской математической ассоциации планировала новую про- грамму по математике для первокурсников в то самое время, когда мы писали эту книгу. Она уже выпустила- первую часть «Общей математики», представляющей собой введение' в ана¬ литическую геометрию и дифференциальное и интегральное ис¬ числение, и составила план второй части. Когда председателю этой комиссии стало известно о сходстве плана нашей книги с планом второй части «Общей математики», он предложил од¬ ному из нас войти в комиссию. Мы думаем, что наша книга со¬ ответствует духу рекомендаций этой комиссии, и благодарны ей за разрешение использовать некоторые из подобранных чле¬ нами комиссии иллюстраций, главным образом — приложения к проблемам голосования. Доклад комиссии по вопросам преподавания математики со¬ циологам при Исследовательском совете социальных наук по¬ явился уже после того, как наши планы были завершены. К на¬ шему удовольствию оказалось, что по многим вопросам мы при¬ шли к тем же заключениям, что и эта комиссия. Она рекомен¬ дует двухлетнее обучение, при котором около половины времени учащихся обучают дифференциальному и интегральному ис¬ числению и около половины — тому, что мы называем «конеч¬ ной математикой». Годовой курс на базе нашей книги и годо¬ вой курс дифференциального и интегрального исчисления — та¬ ково распределение учебного времени студента в пропорции, рекомендованной этой комиссией. Ядро книги составляют не отмеченные звездочкой разделы гл. I—V. Этот материал должен охватываться любым курсом. Для удобства преподавателей мы включили также дополнитель¬ ный материал — необязательные (отмеченные звездочкой) раз¬ делы гл. I—V, а также гл. VI и VII. Курс в объеме первых пяти глав должен быть основным математическим курсом. Этот курс может выполнять роль курса математики для бихеовиористов при ориентировке на гл. VII и на разбор нескольких входящих в нее приложений. Гл. VI содержит подходящий дополнитель¬ ный материал для курсов каждого из этих типов. В конце ка¬ ждой главы мы поместили библиографию в помощь тем, кто ин¬ тересуется дальнейшим чтением. Математическая подготовка, необходимая для чтения этой книги, ограничивается тем, что проходится в средней школе. Книга прошла успешную проверку на первом курсе Дартмутско¬ го колледжа и использовалась в дополнительных лекциях на дру-
14 Предисловие гик курсах. Она также была использована в курсе математики длй преподавателей бихевиористских наук. / Мы хотим выразить благодарность Дартмутскому колледжу, снявшему с нас часть преподавательских обязанностей для того, чтобы мы смогли подготовить эту книгу. Мы благодарны также А. В. Таккеру за его ценные советы и нашим коллегам по Дартмутскому отделению математики за их многочисленные по¬ лезные предложения. Мы признательны Джемсу К. Шиллеру, прочитавшему рукопись и сообщившему свои впечатления чи- тателя-студента. Наконец, мы хотим поблагодарить Джоан Снелл, Маргарет П. Эндрью и Стефана Рассела за их неоце¬ нимую помощь в подготовке рукописи. Дж. Г. К. Дж. Л. С. Дж. J1. Т.
Глава I СОСТАВЫ ЫЕ ВЫСКАЗЫВАНИЯ § 1. ЦЕЛЬ ТЕОРИИ В первой главе мы собираемся изучить, как различными способами из отдельных высказываний можно построить новое высказывание. Например, из высказывания «У меня два туза» и высказывания «У вас на руках флеш-рояль»1) можно образо¬ вать более сложное высказывание: «Либо у меня два туза, либо у вас нет флеш-рояля». Это новое высказывание называется составным, в то время как высказывания, из которых оно было образовано, называются его простыми составляющими. Лю¬ бое высказывание (даже такое, которое на самом деле является сложным) может быть использовано в качестве одного из простых составляющих какого-то другого составного выска¬ зывания. Может показаться, что естественно прежде всего изучать сами высказывания, а затем уже приступить к изучению того, как из них образуются более сложные высказывания. Но мы решили не исследовать здесь внутреннюю структуру высказыва¬ ний потому, что: (1) такое исследование оказывается достаточно трудным и относится скорее к лингвистике, чем к математике; (2) для того чтобы понимать законы различных способов сочета¬ ния высказываний, вовсе не необходимо хорошо знать их природу. Ввиду бесконечного разнообразия простых высказываний тео¬ рия таких высказываний весьма сложна. Опыт математики по¬ казывает, что часто бывает выгодно предполагать, что та или иная трудная задача уже решена, и переходить к последующей задаче. Поэтому мы будем поступать так, как если бы мы знали все о простых высказываниях, и будем изучать лишь их соче¬ тания. Последнее представляет собой относительно легкую за¬ дачу. ') Флеш-рояль (пять карт одной масти, следующих одна за другой) — одна из старших комбинаций карточной игры покер.
16 Г л. /. Составные высказывания Первое систематическое рассмотрение этих вопросов можно найти уже в сочинениях Аристотеля, однако математические подходы к этим вопросам впервые были указаны Джорджем Булем около ста лет тому назад1). Современные более тонкие методы выработаны совместными усилиями многочисленных специалистов по математической логике в XX веке. Основное свойство каждого высказывания заключается в том, что оно либо истинно, либо ложно (и что оно не может быть истинным и ложным одновременно). Естественно, что нас интересует, какой из этих случаев в действительности имеет место. При этом приходится учитывать тот факт, что высказыва¬ ние вроде следующего «У меня на руках два туза», — может быть иногда истинным, а иногда ложным, в зависимости от того, какие я в настоящем случае имею карты. Пять карт, которые сдаются игроку в покер и которые я имею сейчас (а в следую¬ щей главе мы увидим, что возможны 2 598 960 различных ком¬ бинаций из пяти карт), это есть одна из так называемых логи¬ ческих возможностей — понятие, с которым мы ближе познако¬ мимся в § 5 настоящей главы. Прежде чем рассматривать любое высказывание, мы будем заранее определять множество логических возможностей, с которым оно связано. Для каждой из этих возможностей можно вполне определенно утверждать, что высказывание либо истинно, либо ложно. Обычно высказы¬ вание оказывается ложным в некоторых случаях и истинным в других, хотя, впрочем, существуют и такие высказывания, кото¬ рые оказываются истинными (или ложными) в любом случае. Для составного высказывания достаточно знать, какие из его компонент истинны, ибо «значения истинности» (т. е. истин¬ ность или ложность) этих компонент определяют (как именно — мы укажем ниже) значение истинности всего сочетания. Наша задача распадается, таким образом, на две части — нам надо вы¬ яснить: (1) Какими способами могут быть составлены (состав¬ ные) высказывания? (2) Как определить значение истинности составного высказывания по данным значениям истинности его компонент? Подготовим нужные нам для дальнейшего математические средства. В математических формулах встречаются символы трех сортов: константы, переменные, вспомогательные символы. Например, в формуле (х + у)2 константами являются знаки сложения и возведения в степень, переменными — буквы хну, а вспомогательным символами — скобки. Константы — это сим¬ 9 См. George Boole, Investigation of the laws of thought (Дж. Буль, Исследование законов мысли), London, 1854 (основополагаю¬ щий труд Буля многократно переиздавался).
§ 1. Цель теории 17 волы, смысл которых неизменен в данном контексте. Так, в пре¬ дыдущей формуле знак плюс указывает, что следует образо¬ вать сумму чисел х и у, а показатель 2 указывает, что выраже¬ ние х + у следует умножить само на себя. Переменные символы всегда обозначают объекты определенного рода, но использова¬ ние этих символов оставляет открытым вопрос о том, какие именно индивидуальные объекты имеются в виду. В предыду¬ щем примере буквы х и у обозначают неопределенные числа. Назначение вспомогательных символов сходно с ролью знаков препинания. Так, если в предыдущей формуле опустить скобки, то получится формула х + У2, имеющая совсем другой смысл, нежели формула (х + у)2. В этой главе мы намерены пользоваться переменными лишь одного рода. Эти переменные, которые мы обозначим буквами р, q, г и т. д., будут служить символами неопределенных вы¬ сказываний. Эти высказывания часто будут простыми высказы¬ ваниями, но могут также быть и составными. В любом случае мы знаем, что поскольку каждая переменная обозначает выска¬ зывание, она имеет некоторое, заранее неизвестное, «значение истинности» (т. е. она или истинна, или ложна). Константы, которыми мы собираемся пользоваться, будут обозначать некоторые связки, применяемые для сочетания вы¬ сказываний. У нас будет один символ для образования отрица¬ ния высказывания и несколько символов для определенных ком¬ бинаций двух высказываний. Во введении символов, позволяю¬ щих сочетать три или более высказывания, необходимости нет, ибо можно показать, что любая такая комбинация может быть образована сочетанием высказываний по два. На практике пользуются лишь небольшим числом основных констант, опре¬ деляя с их помощью другие. Можно даже обойтись одной-един- ственной связкой! (См. § 4, упр. 10 и 11.) Наши вспомогательные символы будут большей частью теми же, какими пользуется элементарная алгебра; во всех осталь¬ ных случаях будут даны разъяснения. Примеры. В качестве примеров простых высказываний возь¬ мем высказывания «Погода хороша» и «Очень жарко». Обо¬ значим первое из них через р и второе через q. Допустим, что мы хотим образовать составное высказыва¬ ние, утверждающее правильность обоих предыдущих высказы¬ ваний: «Погода хороша и очень жарко». Мы записываем это составное высказывание с помощью выражения р A q. Символ Л у читаемый как «и», будет нашей первой связкой. Вместо предыдущего сильного утверждения мы могли бы пожелать сделать более осторожное утверждение о том, что истинно хотя бы одно из этих двух высказываний; «Погода 2 Зак. 609,
18 Гл. I. Составные высказывания хороша или очень жарко». Это утверждение записывается как p V q. Символ V читаемый как «или» — это и есть вторая связка, которой мы будем пользоваться. Допустим, что мы считаем ложным одно из предыдущих вы¬ сказываний. Например, мы считаем, что «Не очень жарко». За¬ пишем это символически как ~q. Итак, ~ является нашей третьей связкой, которая может быть прочитана, как «не». Теперь можно образовывать более сложные составные вы¬ сказывания. Например, р Л —q обозначает высказывание «По¬ года хороша и не очень жарко». Упражнения 1. Следующие утверждения являются составными высказываниями или могут быть так интерпретированы. Найдите их простые компоненты. (a) Жарко и идет дождь. (b) Жарко, но не очень сыро. [Отв.: «Жарко»; «Очень сыро».] (c) Идет дождь или очень сыро. (d) Джек и Джил взобрались на холм. (e) Убийцей является Джонс или Смит. (f) Это ни необходимо, ни желательно. (g) Или эту книгу написал Джонс, или Смит не знает, кто ее автор. 2. В упр. 1 обозначьте буквами различные простые высказывания и запи¬ шите сложные высказывания (а) — (f) в символической форме. [Отв.: (b) р Л ~ q.] 3. Пусть р и q означают соответственно «Фрэд умен» и «Джордж умен». Запишите в символической форме следующие высказывания: (a) Фред умен и Джордж глуп. (b) Джордж умен и Фрэд глуп. (c) Фрэд и Джордж оба глупы. (d) Или Фрэд умен, или Джордж глуп. (e) Ни Фрэд, ни Джордж не умны. (f) Фрэд не умен, а Джордж глуп. (g) Неверно, что Фрэд и Джордж оба глупы. 4. Предположим, что Фрэд и Джордж оба умны. Какие из семи составных высказываний упр. 3 тогда будут истинны? 5. Запишите в символической форме следующие высказывания: (a) Фрэд любит Джорджа. (Высказывание р.) (b) Джордж любит Фрэда. (Высказывание q.) (c) Фрэд и Джордж любят друг друга. (d) Фрэд и Джордж друг друга не любят. (e) Фрэд любит Джорджа, но Джордж не отвечает ему тем же. (f) Джордж любим Фрэдом, но Фрэд не любим Джорджем. (d) Ни Фрэд не любит Джорджа, ни Джордж не любит Фрэда. (h) Неверно, что Фрэд и Джордж друг друга не любят. 6. Предположим, что Фрэд любит Джорджа, а Джордж не любит Фрэда. Какие из восьми высказываний упр. 5 истинны?
§ 2. Простейшие связки 19 7. Для каждого высказывания упр. 5 укажите одно из условий, при котором оно ложно. [Отв.: (с) Фрэд не любит Джорджа.] 8. Пусть р означает «Сейчас жарко», a q означает «Температура подни¬ мается». Сформулируйте словесно каждое из следующих высказываний: (a) pAq\ (b) рА~д; (c) ~~>pA~q-, (d) р V—q; (e) ~{pAq)\ (f) ~(pv?); (g) ~(~p\J~q). 9. Используя ответы п. (e), (f), (g) упр. 8, найдите более простые симво- лические высказывания, имеющие то же содержание. 10. Пусть р и q соответственно означают «У меня есть собака» и «У меня есть кошка». Переведите на разговорный язык и упростите: ^ р\1 ^ ^ q]/\^ ^р. § 2. ПРОСТЕЙШИЕ СВЯЗКИ Значение истинности составного высказывания определяется значениями истинности его компонент. При рассмотрении той или иной связки мы хотим знать, каким именно образом истин¬ ность составного высказывания, порожденного этой связкой, за¬ висит от истинности его компонент. Очень удобно изображать эту зависимость, пользуясь таблицей истинности. Рассмотрим составное высказывание р A q. Высказывание р может быть либо истинным, либо ложным, и то же самое мож¬ но сказать о высказывании q. Следовательно, возможны четыре пары значений истинности для этих высказываний, и мы хотим знать в каждом случае, истинно ли высказывание р A q. Ответ получается сразу: если р и q оба истинны, то р A q истинно, в противном случае р A q ложно. Это выглядит разумно, по¬ скольку утверждение р Aq выражает в точности то обстоятель¬ ство, что р и q оба истинны. Фиг. 1 дает таблицу истинности для р A q, конъюнкции р и Р- Таблица истинности содержит всю нужную информацию о связке Д , а именно сообщает нам значение истинности конъ¬ юнкции двух высказываний в зависимости от значений истинно¬ сти каждого из них. Обратимся теперь к составному высказыванию р V q, дизъ- юнкции р и q. Здесь утверждение состоит в том, что то или дру- ГОе из высказываний р и q истинно. Ясно, что если одно из 2*
20 Гл. I. Составные высказывания высказываний истинно, а другое ложно, то дизъюнкция истинна, тогда как если оба высказывания ложны, то дизъюнкция заведомо ложна. Следовательно, мы можем заполнить три ниж¬ ние строки таблицы истинности для дизъюнкции (см. фиг. 2). Заметим, что одна возможность осталась неразобранной. Именно, что будет в случае истинности обеих компонент? Надо сказать, что обиходное употребление связки «или» двусмыслен¬ но. Должно «или» пониматься в смысле «одно или другое или оба» или же в смысле «одно или другое, но не оба»? р я 1 РАЯ и И И и л л л и JI л л л р я Р V я и и ? и л И л и и л л л Ф и г. 1 Ф и г. 2 Для того чтобы правильно ответить на этот вопрос, уместно обратиться к примерам. Предложение «В этом сезоне я хочу пойти на ,,Кармен” или на ,,Аиду”» допускает возможность дву¬ кратного посещения оперы. Однако в предложении «Я намерен учиться в Дартмуте или в Принстоне» подразумевается, что бу¬ дет выбрано только одно из этих высших учебных заведений. Фраза «В будущем году я куплю телевизор или проигрыватель» может иметь оба смысла: говорящий может иметь в виду, что он остановит свой выбор на чем-нибудь одном, но может также иметь в виду, что он'сделает по крайней мере одну из этих по¬ купок, но, возможно, и обе. Мы видим, что иногда здравый смысл позволяет установить точное содержание фразы, но так бывает не всегда. Математик не станет тратить время на спор о том, что имен¬ но «должно» быть названо дизъюнкцией двух высказываний. Он предпочтет различать эти два вполне корректные употребле¬ ния связки «или», называя одно из них дизъюнкцией в неисклю¬ чающем смысле (одно или другое или оба), а другое — дизъ¬ юнкцией в исключающем смысле (одно или другое, но не оба). Символ V будет служить для обозначения дизъюнкции в неис¬ ключающем смысле, а для дизъюнкции в исключающем смысле будет использоваться символ V . На фиг. За и фиг. 36 приве¬ дены соответствующие таблицы истинности. Всюду в дальней¬ шем, если только не оговорено противное, мы будем пользо¬ ваться дизъюнкцией в неисключающем смысле.
§ 2. Простейшие связки 21 Перейдем к последней из рассматриваемых в этом разделе связок — отрицанию. Если р — некоторое высказывание, то сим¬ вол называемый отрицанием р, утверждает, что р ложно. Таблица истинности для отрицания указана на фиг. 4. И И Л Л И Л и /I и и и л р я р)1я и и Л и Л ' и л и и л л !■ Л Фиг. За Фиг. 36 ' р. Их р ~р и л л и Для образования составных высказываний наряду с единич¬ ным использованием каждой основной связки можно пользо¬ ваться основными связками многократно, получая более слож¬ ные составные высказывания — аналогично тому, как с помощью основных арифметических операций образуются сложные алгебраические выражения. Например, составными выска¬ зываниями будут —(р А <?), рА—Р и (р V q) V следует читать «изнутри наружу», подобно алгебраическим выражениям, в которых сна¬ чала группируются величины, заключенные в самые внутренние скобки, затем эти скобки в свою очередь группируются и т. д. Каждое со¬ ставное высказывание имеет свою таблицу истинности, которая может быть построена стандартным методом. Следующие примеры показывают, как нужно строить таблицы ис¬ тинности. Пример 1. Рассмотрим составное высказывание р V -—<7- Построение таблицы истинности начинаем с того, что выпи¬ сываем в первых двух столбцах четыре возможные пары значений истинности для высказываний р и q. После это¬ го записываем наше составное высказывание, оставляя ме¬ сто между символами с тем, чтобы можно было заполнять столбцы под ними. Затем воспроизводим значения истин¬ ности для р и q в столбцах под выражениями этих симво¬ лов в нашем составном высказывании. Этим завершается первый шаг построения (см. фиг. 5). Затем мы рассматриваем самое внутреннее сочетание — отрицание переменной q, завершая второй шаг (см. фиг. 6), Фиг. 4
22 Г л. I. Составные высказывания Наконец, заполнив столбец под символом дизъюнкции, мы получаем значения истинности нашего составного вы¬ сказывания для различных значений истинности входящих р Q Р V и И И и и л И Л л и л и л л л л Шаг № 1 1 1 р ч Р V ~ ц й И или и л и и л л И л л и л л лил Шаг № 1 2 1 Ф и г. 5 Ф и г. 6 в него переменных. Чтобы отметить это обстоятельство, мы проводим две вертикальные черты по обе стороны от окон¬ чательного столбца, завершая третий шаг (фиг. 7). р ч р V - Q и И и и л И и л и и и л л И л л л и л л л и и л Шаг № 1 3 2 1 Фиг. 7 В следующих двух примерах показаны составленные таким же способом таблицы истинности для более сложных сочета¬ ний. Имеются два основных правила, которые следует помнить при составлении таблиц: во-первых, двигаться «изнутри на¬ ружу»; во-вторых, значения истинности сложного высказывания смотреть в последнем столбце, заполненном в итоге всей про¬ цедуры. Пример 2. Таблица истинности высказывания (/? V—Я) Л —Р вместе с номерами, указывающими поря¬ док, в котором заполняются столбцы, показана на фиг. 8,
§ 2. Простейшие связки 23 р я (Р V - я) А - р и И И И л И л л и и Л и и и Л л л и л И л л л и л и л л Л л и и л и и л Шаг № 1 3 2 1 4 2 1 Фиг. 8 Пример 3. Таблица истинности сложного высказывания *—\(р Л я) v (—’Р Л —'<7)1 вместе с номерами, указывающи¬ ми порядок заполнения столбцов, показана на фиг. 9. р я 1 [(/> А <7) V р А 1-0 я) и И Л И . и и и л И л л И и Л и и л л л л и л и л л и и л л и л и л л л и л л л JI л л и и л и и л Шаг № 5 1 3 1 4 2 1 3 2 1 Фиг. 9 Упражнения 1. Укажите составное высказывание, имеющее смысл «р или q, но не оба», применяя к простым высказываниям р и q связки ~, V и Л. [Ошвл (/?Л— ?)V(~PAq).) 2. Постройте таблицу истинности для составного высказывания, фигурирую¬ щего в упр. 1, и сравните ее с фиг. 36. 3. Постройте таблицу истинности для символической формы каждого выска¬ зывания, фигурирующего в упр. 3 из § 1. Какова связь этой таблицы с упр. 4 из § 1? 4. Постройте таблицу истинности для каждого из следующих высказы¬ ваний: (a) ~(pAq); [Отв.: ЛИНИ.] (b) рА^Р’, [Отв.: ЛЛ.] (c) (р\1 q)\/ ^ р\ [Отв.: ИИИИ.] (d) — [(p\'q)A(~ р\!~ q)Y [Отв.: ИЛЛИ,]
24 Г л. I. Составные высказывания 5. Пусть р и q означают соответственно «Джонс выдержал экзамен» и «Смит выдержал экзамен». Выразите в символической форме высказы¬ вание «Неверно, что Джонс и Смит оба не выдержали экзамена». По¬ стройте таблицу истинности для этого составного высказывания. Выра¬ зите словесно условия, при которых это высказывание истинно. 6. Придумайте более простое высказывание о Джонсе и Смите, имеющее ту же таблицу истинности, что и высказывание упр. 5. 7. Пусть p\q выражает, что «р и q не могут быть оба истинными». Напи¬ шите символическое выражение для p/q, пользуясь связками ~ и Л. 8. Составьте таблицу истинности для p\q. 9. Составьте таблицу истинности для р\р. [Отв.: Та же, что и на фиг. 4.] 10. Составьте таблицу истинности для ( р\я)\(р\ч). [Отв.: Та же, что и на фиг. 1.] 11. Составьте таблицу истинности для каждого из следующих высказыва¬ ний: (a) ~(pV<?)V~-'(?VP); [Отв.: ЛЛЛИ.] (b) ~ (рУq) f\p\ [Отв.. ЛЛЛЛ.] (c) ^ (р у д); [Отв.: ИЛЛИ.] (d) ~ (р | q). [Отв.: ИЛЛЛ.] 12. Используя только связки ~, V и А, постройте два символических выска¬ зывания, которые имеют в качестве таблиц истинности соответственно (а) и (Ь) (фиг. 10). § 3. ДРУГИЕ СВЯЗКИ Предположим, что мы хотим сделать не категорическое утверждение, а утверждение, содержащее некоторое условие. В ка¬ честве примеров рассмотрим следующие предложения: «Если бу¬ дет хорошая погода, то я пойду гулять», «Если следующее ут¬ верждение истинно, то я могу доказать эту теорему», «Если успеваемость будет продолжать падать, то декан примет реши¬ тельные меры». Каждое из этих высказываний имеет форму: «если р, то q». Таким образом, мы имеем дело с новой связкой, которую назовем импликацией и будем обозначать стрелкой Разумеется, для точного определения этой новой связки надо задать ее таблицу истинности. Если как р, так и q истинно, то, конечно, р —> q истинно, если же р истинно, a q ложно, то, ко¬ нечно, p->q ложно. Итак, первые две строки таблицы истинно¬ сти могут быть заполнены без труда (фиг. На). Предположим теперь, что р ложно. Что тогда следует впи¬ сать в последние две строки таблицы истинности на фиг. 11а? Может показаться, что всего лучше сохранить здесь полную не¬ определенность. Но в таком случае был бы нарушен наш основ¬ ной принцип, согласно которому каждое высказывание должно быть либо истинным, либо ложным. р я (а) (Ь) и И и и и л л л л и и л л л и и Фиг. 10
§ 3. Другие связки 25 Поэтому мы совершенно произвольно решаем, что имплика¬ ция p-+q истинна всякий раз, когда р ложно, независимо от значения истинности q. Это решение позволяет нам закончить построение таблицы истинности для импликации (фиг. 116). Из этой таблицы сразу видно, что импликация р-> q считается лож¬ ной только в случае, когда р истинно, a q ложно. Можно, если угодно, рационализировать упомянутое произвольное решение, считая, что, когда высказывание р ложно, мы оправдываем им¬ пликацию p-+q «за недостаточностью улик» и рассматриваем ее как истинную (см. упр. 1). р Q P-+Q и и и и л л л и ? л л ? р Q р-*ч и и и и л л л и и л л и Фиг. 11а Фиг. 116 В повседневной речи простые высказывания обычно комби¬ нируются лишь в тех случаях, когда между ними существует какая-то связь. Мы можем сказать «Сегодня идет дождь, и я возьму зонт», но мы не станем говорить «Я читаю хорошую кни¬ гу и я возьму зонт». Однако не вполне ясное требование вну¬ тренней связи трудно соблюсти. Понятия, связанные между со¬ бой с точки зрения одного лица, не обязательно связаны с точки зрения другого. В наших рассмотрениях не будет предпола¬ гаться существования внутренней связи между двумя состав¬ ными высказываниями, сочетаемыми посредством той или иной связки. Это свободное употребление импликации приводит ино¬ гда к результатам, которые могут показаться странными. На¬ пример, в соответствии с таблицей истинности на фиг. 116 вы¬ сказывание «Если 2x2 = 5, то существуют ведьмы» истинно, тогда как высказывание «Если 2 X 2 = 4, то коровы суть обезь¬ яны», — ложно. Поскольку обычно мы употребляем форму «если..., то...» лишь в случае, когда между двумя высказываниями имеется причинная связь, может возникнуть побуждение отнести оба приведенные высказывания к разряду бессмысленных. Здесь важно усвоить, что связка -> не означает никакой причинной связи; смысл импликации полностью определен изображенной на фиг. 116 таблицей и ничего другого импликация не подразу¬ мевает. В § 7 мы еще вернемся к этому вопросу в связи с от¬ ношением следствия.
26 Гл. I. Составные высказывания С импликацией тесно связана так называемая «двойная им¬ пликация» p+->q, которая может быть прочитана так: «р, если и только если q». Двойная импликация p^^q означает, что если р истинно, то q истинно, а если р ложно, то q лож¬ но. Поэтому двойная импликация ис¬ тинна в этих случаях и ложна в осталь¬ ных, так что соответствующая таблица истинности должна быть заполнена, как на фиг. 12. Двойная импликация — последняя из тех пяти связок, которыми мы бу¬ дем пользоваться в этой главе. В сле¬ дующей таблице перечислены все эти связки и номера тех фи¬ гур, на которых изображены их таблицы истинности. Название Символ Истолкование Таблица истинности Конъюнкция Л «И» Фиг. 1 Дизъюнкция в неис¬ ключающем смысле V «или» Фиг. 3 Отрицание «не» Фиг. 4 Импликация -> «если ..., то ... » Фиг. 116 Двойная импликация «если и только если» Фиг. 12 Напоминаем, что каждая из этих связок полностью опреде¬ ляется своей таблицей истинности. Следующие примеры пока¬ зывают употребление двух новых связок. Примеры. На фиг. 13 и 14 таблицы истинности двух вы¬ сказываний составлены с помощью процесса, описанного в § 2. р я р -> (р V я) И И и и и И И И л и и и и л л И л и л и и л л л и л л л Шаг № 1 3 1 2 1 р я р<~>я и и и и л л л и л л л и Фиг. 12 Фиг. 13
§ 3. Другие связки 27 р я - р <—> (.Р -> - я) и И л И и И л л И и Л л и л и и и л л и и л и л и л и л л и л и л и и' л Шаг № 2 1 4 1 3 2 1 Фиг. 14 Можно образовать и составные высказывания из трех или более простых высказываний. Последующий пример — составное высказывание, образованное из трех простых вы¬ сказываний р, q и г. Здесь имеется восемь возможных р я г [/> -> (<7 V Г)] А - [р <—> - Г] и И и и и и и и и и и л л и и и л и и и и л л л и и и л и л и и и л и и и и и л л и и л л и л л J1 л л л и и и л л и и л и и и и л л л и л и л и л л и и и л и и л л и л л л и л и л и и л л л и л и л л л л и л л л и и л л и л Шаг № 1 3 1 2 1 5 4 1 3 2 1 Фиг. 15 троек значений истинности, и таблица истинности рассма¬ триваемого составного высказывания будет иметь восемь строк (фиг. 15). Упражнения 1. Один способ заполнения, отмеченных вопросительными знаками мест изображенный на фиг. 11а таблицы, дан в табл. фиг. 116. Возможны еще три способа. (а) Выпишите соответствующие три таблицы истинности,
28 Г л. I. Составные высказывания (Ь) Покажите, что каждую из этих таблиц истинности можно интерпре¬ тировать в терминах уже известных нам связок. 2. Выпишите таблицы истинности для дА р, q V Р, q ->р. Сравните их с таблицами истинности, изображенными на фиг. 1, За, 116 и 12. 3. Постройте таблицы истинности следующих высказываний: (a) р ->(?V /*); [Отв.: ИИИЛИИИИ.] (b) (рУ г)А(р -> q)\ [Отв.: ИИЛЛИЛИЛ.] (c) (руq)<-^(q\Jр)\ [Отв.: ИИИИ.] (d) рА^р: [Отв.: ЛЛ.] (e) (р->р)У(р->^р): [Отв.: ИИ.] (f) (py^q)Ar, [Отв.: ИЛИЛЛЛИЛ.] (g) lP->(q~> г)] -> [(/> -> q) -> (/> -> г)]. [Отв.: ИИИИИИИИ.] 4. Для каждого из следующих высказываний (1) найдите символическую форму; (2) постройте таблицу истинности. Воспользуйтесь буквенными обозначениями: р для «Джо умен», q для «Джим глуп», г для «Джо получит приз». (a) Если Джо умен, а Джим глуп, то Джо получит приз. [Отв.: ИЛИИИИИИ.] (b) Джо получит приз в том и только том случае, если он умен или если Джим глуп. [Отв.: ИЛИЛИЛЛИ.] (c) Если Джим глуп, а Джо не удастся получить приз, то Джо не умен. [Отв.: Так же, как и для (а).] 5. Постройте таблицы истинности и объясните смысл следующих высказы¬ ваний: (a) (р-+q)A(q ->р)', (Ср. с фиг. 12.) (b) (pAq)->p\ (c) q^-(p\/q); (d) (р->q) (~pvq). 6. Таблица истинности высказывания, составленного из двух простых вы¬ сказываний, состоит из четырех строк, а таблица истинности высказы¬ вания, составленного из трех простых высказываний, — из восьми строк. Сколько строк должна иметь таблица истинности высказывания, состав- вленного из четырех простых высказываний? Сколько — из пяти? Сколько — из п? Укажите способ систематической записи таблиц истин¬ ности для произвольного п? 7. Пусть р означает «Идет дождь», a q означает «Дует ветер». Запишите в символической форме следующие высказывания: (a) Если идет дождь, то дует ветер. (b) Если дует ветер, то идет дождь. (c) Ветер дует тогда и только тогда, когда идет дождь. (d) Если дует ветер, то дождя нет. (e) Неверно, что ветер дует тогда и только тогда, когда нет дождя. 8. Постройте таблицы истинности для высказываний упр. 7. [Отв.: ИЛИИ, ИИЛИ, ИЛЛИ, ЛИИИ, ИЛЛИ.] 9. Постройте таблицу истинности для (a) {p\q)^(—rA^s)\ (b) (PA?)-»~-'[~p/\(rv.s)].
§ 4 *. Высказывания с заданными таблицами истинности 2У jO. Постройте таблицу истинности для [Отв.: ИИИИИИЛИ.] II. Найдите более простое высказывание, имеющее ту же таблицу истинности, что и высказывание упр. 10, § 4*. ВЫСКАЗЫВАНИЯ С ЗАДАННЫМИ ТАБЛИЦАМИ ИСТИННОСТИ В двух предыдущих параграфах было показано, как строить таблицу истинности любого составного высказывания. Интерес представляет и обратная задача: по заданной таблице истинно¬ сти найти одно или несколько высказываний с этой таблицей истинности. Обратная задача всегда имеет решение, причем ре¬ шение, использующее лишь связки A V и Мы проведем рассуждение для таблицы истинности с тремя переменными, но его легко перенести на случай п переменных. В предыдущем параграфе отмечалось, что таблица истинно¬ сти с тремя переменными имеет восемь строк, соответствующих восьми возможным тройкам значений истинности. Предполо¬ жим, что последний столбец заданной таблицы истинности со¬ стоит из одних Л. Легко видеть, что точно таким же будет и последний столбец таблицы истинности высказывания р Д—р, так что это высказывание может служить ответом к нашей за- р я г Основные конъюнкции и и и Р А q А г и и л м q А ~ г и л и р А ~ q А г и л л р А ~ q А ^ г л и и ~ р А q А г л и л q А г л л и р/\ ^ q А г л л л р/\ ~ qA ~ г Ф и г. 16 даче. Нам остается рассмотреть лишь такие таблицы истинно¬ сти, в последнем столбце которых стоит по меньшей мере одно И. Наш метод будет состоять в построении высказываний.
30 Гл. I. Составные высказывания истинных только в одном случае, с последующим построением искомого высказывания в виде их дизъюнкции. Построение высказываний, истинных лишь в одном случае, не составляет труда. На фиг. 16 записаны восемь высказыва¬ ний, каждое из которых истинно ровно в одном случае. Назовем их основными конъюнкциями. Такая конъюнкция содержит ка¬ ждую переменную или ее отрицание — соответственно тому, стоит ли под этой переменной в той строке фиг. 16, на которой записана эта конъюнкция, И или JI. Заметим теперь, что дизъюнкция двух основных конъюнк¬ ций будет истинной ровно в двух случаях, дизъюнкция трех конъюнкций — ровно в трех случаях, и т. д. Итак, чтобы найти высказывание с заданной таблицей истинности, надо просто взять дизъюнкцию основных конъюнкций из тех строк фиг. 16, которым в заданной таблице истинности соответствует значе¬ ние И. Пример 1. Найти высказывание, таблица истинности ко¬ торого имеет в первой, второй и последней строке И, а во всех остальных строках Л. Искомое высказывание будет дизъюнкцией первой, вто¬ рой и восьмой основных конъюнкций, т. е. СРА q А Г) v (р A q А — г) V (~Р А ~<7Л ~г). Проделав упр. 2, читатель убедится, что это высказы¬ вание имеет требуемую таблицу истинности. Пример 2. Один логик попал в плен к дикарям и был заключен в темницу, имеющую два выхода. Вождь дика¬ рей предложил пленнику следующий шанс на спасенье: «Один выход ведет на верную смерть, другой — на сво¬ боду. Ты можешь избрать любой. Сделать выбор тебе по¬ могут два моих воина. Они останутся здесь, чтобы отве¬ тить на один твой вопрос — любой, какой ты пожелаешь им задать. Но я предупреждаю тебя, что один из моих воинов всегда говорит правду, а другой — всегда лжет». И вождь ушел, думая, что дал своему пленнику лишь на¬ дежду на случайное спасенье. После минутного размышления сообразительный логик задал один вопрос, после чего безошибочно выбрал тот выход, который вел на свободу. Что это был за вопрос? Пусть р означает высказывание «Первый выход ведет на свободу», a q означает «Ты правдив». Ясно, что сами по себе р и q бесполезны как вопросы, поэтому испробуем составные высказывания. Мы хотим задать единственный вопрос, ответ «да» на который означал бы, что р истинно, а ответ «нет» — что р ложно, независимо от того, к какому
§ 4 *. Высказывания с заданными таблицами истинности 31 воину этот вопрос обращен. Желаемые ответы на эти во¬ просы выписаны на фиг. 17. Дальше следует рассмотреть, какой должна быть таб¬ лица истинности вопроса с желаемыми ответами. Если воин отвечает «да» и если он правдив, т. е. если q истинно, то значением истинности будет И. Но если он отвечает «да» и если он лжец, т. е. если^ ложно, то значением ис¬ тинности будет Л. Аналогичный анализ проводится и для ответа «нет». Значения истинности искомого вопроса даны на фиг. 17. р я Желаемые ответы Таблица истинности вопроса и И да И и л да л л и нет л л л нет и Фиг. 17 Следовательно, мы свели рассматриваемую задачу к задаче о нахождении высказывания, имеющего своей таб¬ лицей истинности таблицу фиг. 17. Следуя общему методу, развитому выше, мы найдем, что такую таблицу истинно¬ сти имеет высказывание (Р A q) V Л ~<7)- Итак, наш логик задает вопрос: «Верно ли, что или первый выход ведет на свободу и ты правдив, или второй выход ведет на свободу и ты лжец?» Читатель может проверить (упр. 3), что также и высказывание p+->q имеет своей таблицей истинности изображенную на фиг. 17 таблицу. Поэтому более коротким был бы следующий, как оказы¬ вается, эквивалентный первому, вопрос: «Ведет ли первый выход на свободу в том и только том случае, если ты прав¬ див?» Как можно видеть из примера 2, наш метод не обязательно приводит к простейшему из возможных составных высказыва¬ ний. Однако он имеет два несомненных достоинства: (1) Он дает механический прием нахождения высказывания, решающего Данную задачу; (2) Высказывание получается в стандартной форме. Последнее будет использовано при конструировании переключательных схем (см. § 12).
32 Гл. I. Составные высказывания Упражнения 1. Покажите, что таблица истинности основной конъюнкции, стоящей на фиг. 16 в k-и строке (где k = 1, 2, 3, ..8), имеет И в /г-й строке и Л в остальных семи строках. 2. Найдите таблицу истинности составного высказывания, построенного в примере 1. 3. Покажите, что высказывание p^-^q имеет своей таблицей истинности таблицу, изображенную на фиг. 17. 4. Постройте одно или большее число составных высказываний, имеющих каждую из следующих таблиц истинности (а), (Ь) и (с). р Q г (а) (Ь) (С) и и и и л и и и л л л и и л и и л . и и л л л и л л и и л л и л и л л л и л л и и л л л л л л л и 5. Используя только связки V, А и напишите высказывание, эквива¬ лентное каждому из следующих: (a) p*r+q\ (b) р ^ q\ (c) ~(p-+q). 6. Используя только связки V и ~, напишите высказывание, эквивалентное р A q Опираясь на этот результат, докажите, что любая таблица истин¬ ности может быть реализована составным высказыванием, использующим только две связки V и В упр. 7—10 мы будем изучать новую связку \ , где р ф q выра¬ жает «ни р, ни q». 7. Постройте таблицу истинности для р | q. 8. Постройте таблицу истинности для р ф р. Какое другое составное выска¬ зывание имеет ту же таблицу истинности? [Отв.: То же, что и в случае фиг. 5.] 9. Постройте таблицу истинности для (р ф q) \(р i q). Какое другое со¬ ставное высказывание имеет эту же таблицу истинности? [Отв.: То же, что и в случае фиг. 4.] 10. Используя результаты упр. 6, 8 и 9, покажите, что любая таблица истин¬ ности может быть реализована посредством составного высказывания, в котором используется единственная связка ф. 11. Используя результаты упр. 9, 10 из § 2, покажите, что любая таблица истинности может быть реализована посредством составного высказыва¬ ния, в котором используется единственная связка | .
§ 5. Логические возможности Г Из простых высказывании р, q и г постройте составное высказывание, которое было бы истинно тогда и только тогда, когда истинна только одна (безразлично какая!) из компонент. 13. Для высказываний с единственной переменной р «основными конъюнк- ц и я м и» являются р и ^ р. Исследуйте различные составные высказы¬ вания, которые могут быть из них построены посредством дизъюнкции. Как связаны р и ~ р с возможными таблицами истинности для выска- зываний с одной переменной? Что можно^ утверждать- о произвольном составном высказывании, безразлично какой длины, содержащем только одну переменную р? [Отв.: Возможных таблиц истинности четыре.] 14. В примере 2 логик может задать другой вопрос, таблица истинности которого отлична от таблицы, изображенной на фиг. 17. Что это за вопрос? 15. На экзамене преподаватель предлагает студенту пять утверждении, относительно которых надо ответить, истинны эти утверждения или ложны. Студент знает, что преподаватель всегда дает истинных утвер¬ ждений больше, чем ложных, и никогда не задает три вопроса подряд, требующие одинакового ответа. Из содержания первого и последнего утверждений ему ясно, что ответы на них должны быть противоположны. Единственный вопрос, ответ на который ему известен, — второй. Это уже гарантирует ему правильные ответы на все вопросы. Что знает он о втором вопросе? Какими должны быть ответы на эти пять вопросов? 1 [Отв.: ИЛИИЛ.] § 5. ЛОГИЧЕСКИЕ ВОЗМОЖНОСТИ Одним из наиболее важных примеров пользы, которую при¬ носит математика при решении той или иной научной проблемы, является способность математики обеспечить для этой проб¬ лемы исчерпывающий анализ логических возможностей. Роль науки заключается тогда в открытии фактов, которые исклю¬ чат все возможности, кроме одной. В повседневной практике мы многократно пишем или про¬ износим одно и то же предложение, используя его в различных ситуациях. Для того чтобы решить, является ли истинным или ложным утверждение «У меня на руках имеется флеш-рояль», нужно знать, какие карты вам сдали. Поэтому мы, естественно, попытаемся включить это свойство нашего языка в структуру элементарной логики. Для этого свяжем каждое высказывание с определенными логическими возможностями. Эти последние предполагаются фиксированными и известными заранее, и мы условимся считать предложение бессодержательным и не рас¬ сматривать его как высказывание до тех пор, пока не опреде¬ лены связанные с этим высказыванием логические возможности. Когда мы одновременно рассматриваем несколько высказыва¬ ний (а мы, как правило, так и поступаем, поскольку основная задача этой главы состоит в изучении составных высказыва¬ ний), то мы будем требовать, чтобы каждое из этих высказы¬ ваний было связано с одним и тем же множеством логических 3 Зак. 609
34 Гл. I. Составные высказывания возможностей. При решении научных задач обычно прежде всего составляется полный список всех логических возможно¬ стей, а уж затем рассматриваются различные высказывания, относящиеся к этим возможностям. После того как анализ логических возможностей произве¬ ден, мы можем для каждого утверждения, касающегося какой-то проблемы, и для каждой логической возможности спросить, истинно ли наше утверждение в данном случае. Как правило, за¬ данное высказывание во многих случаях окажется истинным и во многих случаях ложным, и единственное, что здесь может сделать логика, — это указать случаи, когда оно будет истин¬ ным. Однако существуют два важных исключения: во-первых, высказывание может быть истинно в каждом логически воз¬ можном случае; во-вторых, оно может быть во всех случаях ложно. В этих двух случаях одной логики достаточно для пол¬ ного определения значения истинности. Если высказывание истинно в каждом логически возможном случае, то его называют логически истинным. Истинность та¬ кого высказывания вытекает из смысла слов и формы выска¬ зывания и контекста проблемы, с которой это высказывание свя¬ зано. Ниже мы встретимся с рядом примеров логически истин¬ ных высказываний. Высказывание, ложное в каждом логически возможном случае, называется логически ложным, или противо¬ речивым. Например, конъюнкция любого высказывания и его отрицания всегда будет противоречивым высказыванием, так как она не может быть истинной ни при каких условиях. Пример 1. В теории вероятностей часто имеют дело с задачами такого типа: «Имеются две урны, первая из ко¬ торых содержит два черных и один белый шар, а вторая — один черный и два белых шара. Выберем наудачу одну урну и вынем из нее последовательно два шара. Какова вероятность того, что...?» Не затрагивая здесь вопроса о ве¬ роятности, исследуем, какие возможности могут иметь ме¬ сто. На фиг. 18 и 19 даны два способа анализа логических возможностей. На фиг. 18 произведен анализ возможностей лишь по¬ стольку, поскольку нас интересует цвет вынутых шаров. Такой анализ может быть достаточным для многих целей. На фиг. 19 дан более тонкий анализ, в котором принято во внимание различие между шарами из одной урны, имею¬ щими одинаковый цвет. Для некоторых целей может ока¬ заться необходимым этот более тонкий анализ. Важно понимать, что логические возможности для данной проб¬ лемы можно анализировать многими различными спосо¬ бами, от совсем грубого подразделения возможностей до
§ 5. Логические возможности 35 весьма тонкого. К анализу логических возможностей предъ¬ является только два требования: (1) в любых мыслимых условиях должна осуществляться одна и только одна из этих возможностей и (2) анализ должен быть настолько Случай Урна Первый шар Второй шар 1 1 черный черный 2 1 черный белый 3 1 белый черный 4 2 черный белый 5 2 белый черный 6 2 белый белый Фиг. 18 тонким, чтобы значение истинности каждого высказыва¬ ния, рассматриваемого в связи с данной проблемой, могло быть определено в каждом случае. Случай Урна Первый шар Второй шар 1' 1 первый черный второй черный 2' 1 второй черный первый черный 3' 1 первый черный белый 4' 1 второй черный белый 5' 1 белый первый черный 6' 1 белый второй черный V 2 черный первый белый 8' 2 черный второй белый 9' 2 первый белый черный 10' 2 второй белый черный 1Г 2 первый белый второй белый 12' 2 второй белый первый белый Фиг. 19 ( ко Убедиться в том, что оба данных нами анализа (фиг. 18 и 19) удовлетворяют первому требованию. Удо¬ влетворяют ли они также и второму требованию — это за¬ висит от природы задачи. Если нас интересует следующее
36 Г л. /. Составные высказывания высказывание: «Из первой урны вынуты два черных ша¬ ра», то оба анализа достаточны (см. фиг. 20 и 21). Возможности Знамение истинности высказывания • «Из первой урны вынуты два черных шара» 1 И 2 л 3 л 4 л 5 л 6 л Фиг. 20 Но если мы хотим рассмотреть высказывание «Из пер¬ вой урны вынут сначала второй черный шар, а затем пер¬ вый черный шар», то потребуется более тонкий из наших двух анализов. Возможности Значение истинности высказывания «Из первой урны вынуты два черных шара» 1' И 2' и 3' л 4' л 5' л 6' л 7' л 8' л 9' л 10' л 11' л 12' л 1 Фиг. 21 Рассмотрим высказывание «Вынут один белый и один черный шар». При анализе логических возможностей, да¬ ваемом таблицей, изображенной на фиг. 18, это высказы¬ вание истинно в. случаях 2, 3, 4 и 5 и ложно в случаях 1
§ 5. Логические возможности 37 И 6. Высказывания, с которыми мы будем иметь дело, как правило, будут в некотором числе случаев истинными и в некотором числе случаев ложными. Исключение составляют такие высказывания,как «Вынуто не более чем два черных шара»; это высказывание истинно в каждом случае (при обоих анализах): из самих условий задачи следует, что мы не можем вынуть более двух шаров; следовательно, это вы¬ сказывание логически истинно. По аналогичной причине вы¬ сказывание «Вынуто три белых шара» логически ложно. Какие логические возможности имеют место для данной си¬ стемы высказываний, это зависит от контекста, т. е. от рассма¬ триваемой проблемы. Если эти возможности не известны, то это означает, что мы не разобрались в стоящей перед нами за¬ даче. Это не исключает возможности того, что анализ этих ло¬ гических возможностей может быть проведен несколькими спо¬ собами. Так, в примере 1 даны два различных анализа, но мог¬ ли быть еще и другие. Вообще, ответ на вопрос «Для сколь¬ ких случаев р истинно?» зависит от анализа возможностей. (Это будет играть для нас важную роль при изучении теории вероятностей.) Однако логически истинные и логически ложные высказывания являются в этом отношении исключениями. Вы¬ сказывание, логически истинное (ложное) при одном анализе, будет логически истинным (ложным) и при всяком другом ана¬ лизе данной проблемы. Для анализа логических возможностей в начале настоящей главы были использованы таблицы истинности; они доставляют хотя и очень грубый, зато удобный метод. Допустим, что мы имеем высказывание, составленное из трех простых высказыва¬ ний р, q и г. В соответствии с каким-нибудь тонким анализом здесь может представиться сотня возможных случаев, но ряд из них можно объединить, так как нам необходимо различать лишь те случаи, когда значения истинности трех компонент оказы¬ ваются различными. Тогда мы можем получить самое большее восемь случаев, соответствующих восьми строкам таблицы ис¬ тинности. Например, если 5 есть составное высказывание /?">К?уг), то изображенная на фиг. 22 таблица представ¬ ляет собой просто-напросто модификацию таблицы истинности Для высказывания р ->(~ q V г). Однако нет никаких оснований предполагать, что всегда мо¬ ет иметь^ место любая комбинация значений истинности вы- ЗЫваний Р, q и г. Предположим, например, что в задаче об задав И ШаРах из примера 1 при грубом анализе возможностей, след аемом из°браженной на фиг. 18 таблицей, рассматриваются Q УюЩие^три высказывания р, q и г: р — «выбирается урна 1»: ..«первый вынутый шар — белый» и г—«второй вынутый
38 Гл. /. Составные высказывания щар — черный». На фиг. 23 приведены значения истинности для р, ц и г в каждом из шести возможных случаев примера 1, Возможности Значение истинности 5 И И И и и и л л или и и л л и ЛИИ и лил и ЛЛИ и л л л и Возможности р Q г 1 И л и 2 и л л 3 и и и 4 л л л 5 л и и 6 л и л Фиг. 22 Фиг. 23 Из этой таблицы видно, что события, описываемые строками. ИИЛ и ЛЛИ таблицы истинности, никогда не могут иметь ме-’ ста. Отсюда для данных конкретных высказываний р, q, г мы должны исключить возможности ИИЛ и ЛЛИ из таблицы фиг. 22, после чего в ней останется только шесть строк, изобра¬ женных на фиг. 24. Но теперь мы видим, что сложное высказы¬ вание 5 является логически истинным, поскольку оно оказыва¬ лось ложным только в том случае, который не соответствует никакой реальной логической возможности. Возможности Значения истинности 5 и и и и или и и л л и ЛИИ и л и л и л л л и Фаг- 24 Если три высказывания р, q, г таковы, что логически воз¬ можными оказываются все восемь строк таблицы истинности, мы говорим, что эти высказывания (логически) независимы. Этр свойство высказываний более подробно изучается в § 8.
§ 5. Логические возможности В тех стучаях когда характер взаимосвязи между высказыва- ниями Р q Г заранее нам не известен, при анализе таблиц истинности составных высказываний, образованных из них, обыч¬ но предполагают, что р, q иг независимы. Ведь если составное высказывание, образованное каким-то способом из высказыва¬ ний р q г, оказывается логически истинным хотя бы при одном выборе независимых простых высказываний р, q и г, то оно ло¬ гически истинно по своей форме и будет логически истинным при любом другом выборе высказываний р, q и г как независи¬ мых, так и связанных между собой. Например, составное вы¬ сказывание вида р —^ (/? V q) должно быть истинным в каждом мыслимом случае. Можно рассмотреть сто случаев, в которых значения истинности р и q варьируются какими-то способами, но поскольку речь идет о рассматриваемом составном высказы¬ вании, каждый из этих ста случаев будет соответствовать одной из четырех строк таблицы истинности. В каждом из этих четы¬ рех случаев наше составное высказывание истинно и, следова¬ тельно, оно будет логически истинным. Примером может слу¬ жить «Если Джонс умен, то он умен или счастлив» или «Если у меня два туза, а у вас флеш-рояль, то у меня два туза»; при этом нас совершенно не интересует, какая связь существует между простыми высказываниями «У меня два туза» и «У вас флеш-рояль». Мы, однако, уже видели, что если между компонентами со¬ ставного высказывания существует логическая связь, то один анализ таблицы истинности может нас подвести. Вот еще один пример того же рода. Обозначим через р высказывание «Джим ростом выше Билла», а через q высказывание «Билл ростом выше Джима» и рассмотрим высказывание «Или Джим ростом не выше Билла, или Билл ростом не выше Джима», т. е. Р V Построив таблицу истинности этого составного вы¬ сказывания, мы найдем, что оно ложно в первом случае. Но этот случай логически невозможен, так как ни в каком случае высказывания р и q не могут быть истинными одновременно! И хотя наше составное высказывание логически истинно, из таблицы истинности этого не видно; здесь необходим более тща¬ тельный анализ возможностей для роста двух людей (ср., на¬ пример, упр. 11 из § 8). Пример 2. В качестве более сложного примера возьмем произведенную на фиг. 25 классификацию людей по росту, Цвету волос и полу. Достаточно ли такого анализа, вклю¬ чающего в себя 24 случая, — это будет зависеть от поста¬ вленной задачи. Например, если мы хотим учесть случай седых волос или отсутствия волос, то нам следует рассмо¬ треть большее число случаев.
40 Гл. /. Составные высказывания Высказывание «Он — мужчина высокого роста» истин¬ но в случаях 1, 3, 5, 7 и ложно в остальных. Высказывание «Она — женщина не низкого роста и не рыжеволосая» ис¬ тинно в случаях 2, 4, 6, 10, 12 и 14. С другой стороны, вы¬ сказывание «Этот человек высокого, среднего или низкого Случай Рост Цвет волос Пол 1 высокий блондин мужской 2 высокий блондин женский 3 высокий шатен мужской 4 высокий шатен женский 5 высокий брюнет мужской 6 высокий брюнет женский 7 высокий рыжий мужской 8 высокий рыжий женский 9 средний блондин мужской 10 средний блондин женский 11 средний шатен мужской 12 средний шатен женский 13 средний брюнет мужской 14 средний брюнет женский 15 средний рыжий мужской 16 средний рыжий женский 17 низкий блондин мужской 18 низкий блондин женский 19 низкий шатен мужской 20 низкий шатен женский 21 низкий брюнет мужской 22 низкий брюнет женский 23 низкий рыжий мужской 24 низкий рыжий женский Фиг. 25 роста» не доставляет нам никакой информации — оно истинно в каждом случае и, следовательно, логически истинно. Наконец, высказывание «Этот человек имеет рост ниже среднего, не блондин, не шатен и не рыжий и не яв¬ ляется брюнетом низкого роста» логически ложно или про¬ тиворечиво. Из всех этих логических возможностей одна и только одна соответствует фактам, т. е. для каждого человека
§ 5. Логические возможности 41 один и только один из 24 случаев дает описание реальной ситуации. Чтобы определить этот случай, необходимо иметь фактическую информацию. Когда мы говорим, что некото¬ рое высказывание «истинно», не анализируя его, то мы подразумеваем, что оно истинно в этом реальном случае. Но, как было сказано ранее, вопрос о том, какой случай имеет место на самом деле, лежит вне сферы логики. Ло¬ гика может лишь указать, при каких условиях (логических возможностях) то или иное высказывание истинно. Упражнения 1. Покажите, что высказывание, являющееся отрицанием логически истин¬ ного высказывания, будет логически ложным, а высказывание, являю¬ щееся отрицанием логически ложного высказывания, будет логически истинным. 2. Определите для каждого из следующих высказываний, будет ли оно (i)' логически истинным, (п) противоречивым, (iii) ни тем, ни другим. (a) р; [Отв.: Логически истинное.] (b) (c) (ру«у)-*-»- (дад); [Отв.: Ни то, ни другое.] (d) (р -э- ~ д) ->• (q ~ р); (e) (р q)/\(qг)А~ (р-+г); [Отв.: Противоречиво.] (f) (P^q)^P\ (g) ->Р- 3. На фиг. 25 указаны логические возможности классификации людей по росту, цвету волос и полу, относящиеся к одному человеку. Сколько будет случаев, если классифицировать по этим признакам совместно двух человек? [Отв.: 576.] 4. Для каждого из 24 случаев фиг. 25 определите, будет ли истинным сле¬ дующее высказывание: «Данный человек имеет рыжие волосы и если он женщина, то низкого роста». 5. Укажите те из перечисленных на фиг. 18 случаев (относящихся к при- меРУ 1), в которых истинны следующие высказывания: (a) выбрана первая урна; (b) вынут по меньшей мере один белый шар; (c) вынуто не более одного белого шара; (d) если первым вынут белый шар, то вторым вынут черный; (e) два шара различного цвета вынуты в том и только в том случае, если выбрана первая урна. В примере 1 укажите два логически истинных и два логически ложных 7. вЫСКазывания (отличные от приведенных в тексте). можССИЮ стУдент сДает четыре предмета, по каждому из которых он е! получить одну из четырех отметок. Сколько логических возмож- Теи ^ожет иметь место, если нас интересует содержание соответ- вующей страницы зачетной книжки студента (неудовлетворительная Ценка также фиксируется — хотя бы тем, что в соответствующей графе оценка оказывается не проставленной). [Отв.: 256.]
42 Гл. I. Составные высказывания 8. Некто имеет пять монет общим достоинством в 78 центов |). Каковы логи¬ ческие возможности распределения монет? [сУказание: Имеются три возможности.] 9. В условиях упр. 8 определите, какие из следующих высказываний логи¬ чески истинны и какие логически ложны: (a) Некто имеет по меньшей мере одно пенни. [Отв.: Логически истинно.] (b) Он имеет по меньшей мере один никель. [Отв.: Ни то, ни другое.] (c) Он имеет в точности 2 никеля. [Отв.: Логически ложно ] (d) Он имеет в точности 3 никеля в том и только в том случае, если он имеет в точности один дайм. [Отв.: Логически истинно.] 10. Пусть в условиях упр. 8 некто не имеет никелей. Что из этого можно заключить? 11. Бросаются две игральные кости. Какой из следующих анализов логи¬ ческих возможностей удовлетворяет указанному на стр. 35 первому тре¬ бованию, предъявляемому к таким анализам? Что неправильно в других анализах? Сумма появившихся очков: (a): (1) 6, (2) не 6; (b): (1) четное число, (2) менее 6, (3) более 6; (c): (1) 2, (2) 3, (3) 4, (4) более 4; (d): (1) 7 или 11, (2) 2, 3 или 12, (3) 4, 5, 6, 8, 9 или 10; (e): (1) 2, 4 или б, (2) нечетное число, (3) 10 или 12; (f) : (1) менее 5 или более 8, (2) 5 или 6, (3) 7, (4) 8; (g): (1) более 5 или менее 10, (2) самое большее 4, (3) 7, (4) 11 или 12. [Отв.: (а), (с), (d), (f) удовлетворяют требованию.] 12. Пусть р и q связаны между собой таким образом, что их значения истин¬ ности всегда одинаковы. Исследуйте вновь составные высказывания упр. 2 (с) и 2 (f) при этом предположении. 13. Обозначим через р высказывание «Джим выше 5 футов», через q — «Джим ниже 6 футов» и через г — «Рост Джима равен 5 футам 10 дюй¬ мам». Выпишите все восемь возможных комбинаций значений истинно¬ сти высказываний р, q, г и исключите из них противоречивые. Сколько комбинаций при этом останется? 14. Дайте словесное описание высказывания s, таблица истинности которого приведена на фиг. 24. По этому описанию докажите, что 5 логически истинно. § 6. ДЕРЕВЬЯ ЛОГИЧЕСКИХ ВОЗМОЖНОСТЕЙ Очень удобным средством анализа логических возможностей является вычерчивание «дерева». Этот способ будет проиллю¬ стрирован несколькими примерами. Пример 1. Рассмотрим снова тот же пример, что и в случае фиг. 25. Предположим, что классификация людей производится следующим образом: сначала, до классифи- !) Для решения этой и последующих задач следует иметь в виду, что в США имеются следующие виды разменной монеты: 50 центов (V2 дол¬ лара), 25 центов («квотер»), 10 центов («дайм»), 5 центов («никель») и 1 цент («пенни»), '
$ 6. Деревья логических возможностей 43 кации, все люди рассматриваются как образующие одну группу; затем эту большую группу людей разбивают на три подгруппы, объединив в одну группу людей низкого роста, в другую — людей среднего роста и в третью — вы¬ соких’ людей; затем каждую из этих подгрупп разбивают на четыре меньшие группы (всего таких подгрупп полу¬ чится двенадцать) соответственно цвету волос; наконец, каждую из этих подгрупп разбивают на две части, относя к одной из них мужчин, а ко второй — женщин. Тогда в результате последней классификации группа всех людей (Конец) М Ж М Ж М Ж МЖ МЖ М Ж МЖ МЖ МЖ М Ж МЖ МЖ ЛЧЧЧМ\11/ШЖ БЛ ШТ БР РЖ БЛ ШТ БР РЖ БЛ ШТ БР РЖ ^ \\^ Высокие Средние Низкие Все люди ( Начало) Фиг. 26 разобьется на 24 подгруппы. Графическое изображение описанного процесса дано на фиг. 26. По очевидным со¬ ображениям подобную фигуру, начинающуюся из одной точки, а далее разветвляющуюся, мы будем называть де¬ ревом. Заметим, что подобное дерево содержит всю информа¬ цию, относящуюся к данной классификационной проблеме. Каждый путь вдоль дерева, ведущий от его начала к кон¬ цу (от основания к вершине), соответствует некоторой ло¬ гической возможности. Всех путей 24, по числу концевых точек дерева, и столько же случаев содержит таблица фиг. 25. Последовательность отдельных стадий такой клас¬ сификации может быть любой: с равным успехом мы могли бы классифицировать людей сначала по цвету волос, затем по полу и наконец по росту. При этом число логических возможностей остается равным 24, но получающееся де¬ рево отличается от дерева, изображенного на фиг. 26 (см. упр. 1).
44 Гл. 1. Составные высказываний Пример 2. Рассмотрим далее пример, к которому отно¬ сится фиг. 18. Ему отвечает процесс, включающий три ста¬ дии: сначала мы выбираем урну, затем вынимаем шар и затем вынимаем второй шар. Дерево логических возмож¬ ностей изображено на фиг. 27. Отметим, что полное число логических возможностей здесь равно шести. В самом деле, если выбрать первую урну (содержащую два черных шара и один белый) и вынуть из нее черный шар, то вто¬ рой вынутый шар может быть любого цвета; если же сна¬ чала вынуть белый шар, то второй вынутый шар — непре¬ менно черный. Аналогично обстоит дело и в том случае, если выбрана была вторая урна. Фиг. 27 Обращаем внимание читателя на то, что в случае изо¬ браженного на фиг. 26 дерева, от всех точек, лежащих на одном и том же уровне (например, от точек «второго этажа» диаграммы), отходит одинаковое число ветвей, тогда как в случае дерева, изображенного на фиг. 27, дело обстоит не так. Пример 3. В качестве последнего примера рассмотрим дерево логических возможностей для исходов первенства США по бейсболу, в котором принимают участие Доджерс и Янки1). На фиг. 28 изображена половина этого дерева, соответствующая тому случаю, когда первую игру выигры- !) Популярные в Соединенных Штатах Америки бейсбольные команды. Правила розыгрыша первенства страны по бейсболу предусматривают серию встреч между одними и теми же командами; выигравшей считается та ко¬ манда, которая первой выигрывает у противника четыре игры (не обяза¬ тельно подряд).
§ 6. Деревья логических возможностей вает Доджерс (пунктирная линия у основания ведет к дру- ГОЙ половине дерева). На этой фигуре «Д» означает вы¬ игрыш Доджерс, а «Я» — выигрыш Янки. На показанной половине дерева имеется 35 возможных исходов (им соот¬ ветствуют буквы, обведенные кружочком), так что первен¬ ство по бейсболу может завершиться 70 способами. Этот пример отличается от двух предыдущих тем, что пути вдоль дерева оканчиваются на разных уровнях. Это соответствует тому, что встречи Доджерс и Янки могут за¬ кончиться после разного числа игр — надо только, чтобы одна из команд выиграла четыре игры. Фиг. 28 Не всегда требуется такой детальный анализ, как в преды¬ дущих примерах. Если в примере 2 допустить, что мы хотим знать лишь цвет шаров и последовательность, в какой они были вынуты, но нас не интересует, из какой их взяли урны, то вместо шести логических возможностей мы будем иметь только четыре, В таком случае второй и четвертый пути на фиг. 27 (считая слева) представляют один и тот же исход «за черным шаром следует белый шар». Точно так же третий и пя¬ тый пути представляют один и тот же исход. Наконец, если бы мы хотели знать лишь цвет вынутых шаров, не интересуясь тем, в какой последовательности их вынимали из урны, то имелось бы только три логические возможности: или два черных шара, или два белых шара, или один белый и один черный шар. Для первенства США по бейсболу также возможен менее Детальный анализ возможностей. Например, эти возможности можно анализировать таким образом: Доджерс побеждает после 4 игр; или после 5 игр; или после 6 игр; или после 7 игр. овая классификация уменьшает число возможностей с 70 до 8. Фугие возможности при этом не ликвидируются, а просто
46 Гл. Г Составные высказывания некоторые из них объединяются. Так, «Доджерс побеждает по¬ сле 4 игр» может осуществиться только одним путем, тогда как «Доджерс побеждает после 7 игр» может осуществиться 20 пу¬ тями (см. фиг. 28). Еще менее детальным анализом была бы классификация по числу игр в сериях. Здесь имеются только четыре логические возможности. Читатель убедится в том, что часто требуется произвести несколько проб, прежде чем удается найти «наилучший» способ классификации логических возможностей для данной проблемы. Упражнения 1. Постройте дерево для примера 1, если классификация производится в следующем порядке: цвет волос, пол и рост. Сделайте то же самое при таком порядке классификации: пол, рост и цвет волос. Имеются ли дру¬ гие пути проведения этой классификации? 2. В 1955 году Доджерс проиграла первые две игры первенства по бейсболу, но окончательно выиграла во всей серии игр. Сколькими способами мо¬ жет проходить серия игр, если проигрывающая команда выигрывает первые две игры? [Отв.: 10.] 3. В генетике типичен следующий процесс: каждый родитель имеет два гена, ответственных за данный признак: АА, Аа или аа. Ребенок наслег дует по одному гену от каждого родителя. Каковы возможности насле¬ дования для ребенка, если оба родителя имеют гены АА? Если один из родителей имеет гены АА, а другой аа? Если один имеет АА, а дру¬ гой Аа? Если оба имеют Аа? Постройте дерево процессов наследования. [Пусть первой стадией будет выбор гена, наследуемого от первого роди¬ теля, а второй стадией — выбор гена, наследуемого от второго родителя. Сколько различных генетических ти¬ пов будет в результате представлено посредством ветвей?] 4. Часто случается, что генетические типы Аа и АА (см. упр. 3) внешне легко отличимы от типа аа. Какие логические возможности имеются в том случае, когда оба родителя при¬ надлежат к заметно разным типам? 5. Некий психолог учит крысу пробегать через лабиринт, форма которого по¬ казана на фиг. 29. Допустим, что если крыса попадает в тупик, она воз¬ вращается к последнему встреченному ею перекрестку и пробует ход, отличный от тех, которым она следовала раньше, но всегда в напра¬ влении стрелок. Сколько имеется возможных путей? Сколько их имеется при условии, что крысу останавливают после того, как она ошиблась дважды? [Отв.: 20; 1.2.] 6. Произведем эксперимент, подобный схематизированному на фиг. 18. До¬ пустим, что в первой урне имеется два черных и два белых шара, а во зторой урне имеется один белый и четыре черных шара. Выбираем одну урну и вынимаем из нее три шара. Постройте дерево логических воз¬ можностей. Сколько здесь имеется случаев? [Отв.: 10] Фиг. 29
§ 6. Деревья логических возможностей 47 7 Пользуясь деревом, построенным в упр. 6, ответьте на следующие во¬ просы: (a) Во скольких случаях мы вынем три черных шара? (b) Во скольких случаях мы вынем два черных и один белый шар? (c) Во скольких случаях мы вынем три белых шара? (d) Сколько случаев остается? Какие это случаи? [Отв.: 3.] 8 Сколькими способами могут окончиться встречи между Доджерс и Янки в первенстве по бейсболу (см. фиг. 28), если Доджерс выигрывает пер¬ вую игру и (a) никакая команда не выигрывает две игры подряд; [Отв.: 1.] (b) Доджерс выигрывает во всяком случае все игры с нечетными номе¬ рами; [Отв.: 5.] (c) команда-победитель выигрывает четыре игры подряд; [Отв : 4.] (d) команда, потерпевшая поражение, выигрывает четыре игры. [Отв.: 0.] 9. Некто предполагает поехать в отпуск в одно из четырех мест. После его приезда погода в каждом из этих мест может улучшиться, ухудшиться или остаться прежней. Начертите дерево логических возможностей. 10. Для дерева, построенного в упр. 9, приведите высказывание, которое было бы: (a) истинно в половине случаев; (b) ложно во всех случаях, кроме одного; (c) истинно во всех случаях, кроме одного; (d) логически истинно; (e) логически ложно. 11. Пусть в упр. 6 мы хотим произвести более грубую классификацию логи¬ ческих возможностей. Какие ветви дерева, построенного в этом упраж¬ нении, сольются, если (a) нас не интересует, в какой последовательности вынуты шары; (b) нас не интересует ни последовательность шаров, ни номер выбранной урны; (c) нас интересует лишь, какая выбрана урна и одинакового ли цвета вынутые шары. 12. Решить упр. 7 предыдущего параграфа, пользуясь деревом логических возможностей. 13. В меню входят: овощной суп или бульон на первое, бифштекс, цыпленок или рыба на второе и компот или мороженое на третье. Полный обед состоит из одного блюда на первое, одного блюда на второе и одного блюда на третье. Нарисовать дерево возможных полных обедов. (a) Сколько может быть различных полных обедов? [Отв.: 12.] (b) Сколько может быть полных обедов с бифштексом в качестве вто¬ рого? [Отв.: 4.] (c) Сколько может быть полных обедов для человека, который ест моро¬ женое только в том случае, если на второе у него был бифштекс? [Отв.: 8.] 14. Пусть С, К и D — три арифметические операции. Операция С заклю¬ чается в прибавлении 2 к заданному числу. Операция К заключается в возведении данного числа в квадрат, а операция D — есть операция деления на 2. Нарисуйте дерево, показывающее, в каком различном порядке можно выполнять эти операции (каждая операция используется только один раз). Укажите число возможных различных порядков дей¬ ствий. [Оргв.: Ь|
48 Гл. I. Составные высказывания. 15. Используйте дерево, построенное в упр. 14, для того, чтобы получить все результаты выполнения трех операций (во всевозможных порядках) над числом 0. 16. Используя дерево, построенное в упр. 14, покажите, что произойдет при выполнении трех операций в различном порядке над произвольным чис¬ лом х. Для каждого из 6 случаев выясните, не совпадает ли результат сложной операции с исходным числом х. § 7. ЛОГИЧЕСКИЕ ОТНОШЕНИЯ До сих пор мы рассматривали изолированные высказывания. Но иногда бывает желательно рассмотреть взаимоотношение двух высказываний. Наиболее интересное из таких отношений имет место, когда из одного высказывания (логически) следует другое. Если из р следует q, мы говорим также, что q является следствием р, или что q (логически) выводимо из р. Например, во всякой математической теореме из условий теоремы следует ее заключение. Исходя из анализа логических возможностей для пары вы¬ сказываний р и q, отношение следствия можно охарактеризовать таким образом: из р следует q, если q истинно всякий раз, когда истинно р, т. е. если q истинно во всех логически возможных случаях, в которых р истинно. В случае составных высказываний, имеющих одни и те же компоненты, таблицы истинности дают удобный метод для про¬ верки того, имеет ли место отношение следствия. Фиг. 30 иллю¬ стрирует этот метод. р q Р <--> Я р q р у q и И И И И и Л Л Л И J1 и Л И И л л и И Л Ф и г. 30 Возьмем в качестве посылки р q. Так как это высказывание истинно только в первом и четвертом случаях, и в обоих этих случаях истинно также высказывание р-> q, то мы видим, что из p<-+q следует р —► q. С другой стороны, высказывание р V q в четвертом случае ложно, так что из p*-^q не следует p\Jq. Аналогично сравнение двух последних столбцов фиг. 30 показы-
§ 7. Логические отношения 49 ва-ет, что из высказывания р -> q не следует р V q, из р \/ q не следует р —> q. Между отношением следствия и импликацией имеется тесная связь, но важно не путать эти два понятия. Импликация — это новое высказывание, составленное из двух данных, а след- ствие — отношение между двумя высказываниями. Связь между ними такова: из р следует q тогда и только тогда, когда импли¬ кация р ->q логически истинна. Что это действительно так, доказывается весьма просто. Из высказывания р следует высказывание q, если q истинно всякий раз, когда истинно р. Это означает, что невозможен случай, когда р истинно, a q ложно, т. е. ни в каком случае р -> q не будет ложным. Но это в свою очередь означает, что p—>q ло¬ гически истинно. В упр. 1 наш результат будет применен к фиг. 30. Займемся теперь «парадоксами» импликации. Высказывание с импликацией при отсутствии смысловой связи между его ком¬ понентами звучит парадоксально. Например, странно слышать, что высказывание «Если погода ясная, то мел сделан из дерева» истинно в дождливую погоду. Необходимо вспомнить, что при¬ веденная импликация — не более и не менее, как выражение одного из следующих обстоятельств: (1) Погода ясная и мел сделан из дерева или (2) Погода не ясная и мел сделан из де¬ рева, или (3) Погода не ясная и мел не сделан из дерева. [См. фиг. 116.] И в дождливую погоду оказывается верным (3). Но отнюдь не верно, что из «Погода ясная» следует «Мел сделан из дерева». Логически возможен случай, когда первое из этих высказываний истинно, а второе ложно (в самом деле, так будет при ясной погоде и обычном способе изготовления мела); поэтому отношение следствия не имеет места. Таким образом, хотя цитированная в предыдущем абзаце импликация истинна в определенную погоду, она не является логически истинной. В обычном разговоре утверждение «если..., то...» чаще всего имеет логическую основу. Поэтому всякий раз, когда подобное утверждение оказывается истинным, не будучи логически истин¬ ным, оно звучит парадоксально. То же самое можно сказать и о разговорном употреблении «тогда и только тогда». Если двойная импликация не только истинна, но и логи¬ чески истинна, то это устанавливает некоторое отношение между Р и q. Поскольку р ^-><7 истинно в каждом логически возмож¬ ном случае, значения истинности высказываний р и q одина- к°вы. При этих обстоятельствах мы говорим, что р и q (логи¬ чески) эквивалентны. Проверку эквивалентности двух состав- Ных ньшказываний, имеющих одни и те же компоненты, удобно 0сУН1ествлягь при помощи таблиц истинности. Для этого ^ Зак. (30Q
50 Гл. I. Составные высказывания достаточно лишь посмотреть, одинаковы ли таблицы истинности у этих составных высказываний. Из фиг. 31 видно, что p-+q эквивалентно V q. Два высказывания р и q называются несовместимыми, если из истинности одного из них необходимо следует ложность другого. Другими словами, несовместимость высказываний р и q означает, что они никогда не могут оказаться одновременно истинными. Это понятие легко распространить на любое число высказываний: высказывания рх, ръ . . ., рп называются несов¬ местимыми, если не может ока¬ заться, что все они являются од¬ новременно истинными. В частно¬ сти, одно высказывание (п = I) несовместимо, если оно заклю¬ чает внутреннее противоречие. Если несколько составных вы¬ сказываний построены из одних и тех же простых составляющих, то можно предложить простой ме¬ тод проверки их совместимости. Этот метод заключается в том, что нужно построить таблицы истинности для каждого из высказываний и исследовать сово¬ купность одинаковых строк во всех таблицах. Если среди всех строк найдется по крайней мере одна, в которой все составные высказывания истинны (одни только И в левых частях строки), то составные высказывания совместимы. В противном случае они оказываются несовместимыми. Иллюстрация этого метода доставляет фиг. 30. Здесь исследуются три таблицы истинности, и поскольку мы видим, что в первом случае (ему отвечает первая строка таблицы) все составные высказывания истинны, то вы¬ сказывания p*^~*q, P~>q и р V q совместимы. Но если мы доба¬ вим к этим трем высказываниям еще одно, ложное в первом слу¬ чае (например, ~ р), то эти четыре высказывания уже будут не¬ совместимыми. Упражнения 1. Покажите, что высказывание (р ► «7) -» (р -> q) логически истинно, а (p+r+q)->(p\jq) — нет. 2. Докажите, что р эквивалентно q тогда и только тогда, когда из р сле¬ дует q и из q следует р. 3. Постройте таблицы истинности следующих составных высказываний: (a) рАд\ (b) р-*■ — q; (c) ~pv~q\ (d) (e) р A —f р я p->q ^ р V q и И и и и л л л л и и и л л и и Фиг. 31
§ 7. Логические отношения 51 Для каких пар имеет место отношение следствия или эквивалентности? Юте.: (Ь) эквив. (с); из (а) следует (d); из (е) следует (Ь), (с).] 4. Постройте таблицы истинности следующих составных высказываний и расположите их в таком порядке, чтобы из каждого высказывания сле¬ довали все стоящие после него: (a) ~p+-+q\ (b) р-+ (~р ->q)\ (c) ~ [p^(q^p)Y, (d) pVq\ (e) ~pAq; [Отв.: (с), (е), (a), (d), (b).] 5. Постройте составное высказывание, эквивалентное р Л р, используя только связки и V- 6. Постройте составное высказывание, эквивалентное Р+-+Я, используя только связки -> и Л . (Ср. с упр. 2.) 7. Постройте составное высказывание, эквивалентное р\] q, используя только связки и Л . :8. Каково наибольшее число утверждений из числа приведенных ниже, в которые может, не впадая в противоречие, поверить один человек? (a) Джо ловкач. (b) Джо не везет. (c) Джо везет, но он не ловкач. (d) Если Джо ловкач, то ему не везет. (e) Джо является ловкачем в том и только в том случае, если ему везет. (f) Либо Джо ловкач, либо ему везет, но не то и другое одновременно. [Отв.: 4.] 9. Покажите, что пять высказываний, собранных в упр. 3, несовместимы. Можно ли найти среди них четыре совместимых высказывания? Ю. Докажите, что 9 сложных высказываний, составленных из двух одних и тех же простых высказываний р и q, могут быть совместимыми только в том случае, когда среди них имеется по крайней мере два эквивалент¬ ных высказывания. П. Доказать, что если р логически истинно, то (a) p\jq логически истинно; (b) —' р Aq логически ложно; (С) рf\q эквивалентно р; (d) ~ p\Jq эквивалентно p. 12. Если р и р логически истинны, а г логически ложно, то что можно ска¬ зать о высказывании (р V~ <?)Л~ г? [Отв.: Логически истинно.] Докажите, что конъюнкция и дизъюнкция высказывания с самим собой 34 т?квивалентны самому этому высказыванию. • Докажите, что двойное отрицание высказывания эквивалентно самому 15 т?ысказыванию- • Докажите, что высказывание, из которого следует его отрицание, про- 16 1ТивоРечиво- 17* r° МОЖно сказать о высказывании, эквивалентном своему отрицанию? *\акое отношение имеет место между двумя логически истинными выска¬ зываниями? Между двумя противоречивыми высказываниями?
52 Гл. I. Составные высказывания 18. Докажите, что логически истинное высказывание следует из любого высказывания и что из противоречивого высказывания следует любое. 19. Воспользовавшись результатами упр. 10 и 11 из § 4 докажите, что для любого составного высказывания существует эквивалентное ему состав¬ ное высказывание: (a) использующее единственную связку ф . (b) использующее единственную связку | . § 8*. СИСТЕМАТИЧЕСКИЙ АНАЛИЗ ЛОГИЧЕСКИХ ОТНОШЕНИЙ Отношение следствия характеризуется невозможностью истинной посылки и ложного заключения; если два высказыва¬ ния эквивалентны, то невозможно, чтобы одно из них было истинным, а другое ложным. Таким образом, чтобы следствие имело место, должен быть исключен один случай в таблице истинности для пары высказываний, а для эквивалентности та¬ ких исключенных случаев должно быть два (из четырех возможных). Отсут¬ ствие одного или более случаев в таб¬ лице истинности является характерной чертой логических отношений. В этом разделе мы исследуем все отношения между двумя высказываниями, какие только возможны. Назовем два высказывания несвя¬ занными, если может иметь место ка¬ ждый из четырех табличных случаев (см. фиг. 26). Два высказывания на¬ зываются связанными, если из четырех случаев, указанных на фиг. 32, один или более не может иметь место. [Ср. с § 5.] Если высказывания р и q таковы, что из случаев, представ¬ ленных на фиг. 32, исключается в точности один, то мы ска¬ жем, что эти высказывания связаны простым отношением. Оче¬ видно, возможны следующие четыре простых отношения: (а) если исключен случай 1, то высказывания не могут быть истинными одновременно — в этом случае р и q называются несовместимыми, или противоречивыми; (Ь) если исключен слу¬ чай 2, то из р следует q (ср. § 7); (с) если исключен случай 3, т. е. случай, когда q истинно, а р ложно, то из q следует р\ (d) если исключен случай 4, и, следовательно, высказывания не могут быть ложными одновременно, т. е. одно из них наверное истинно, то высказывания назовем J1 -несовместимыми. Если высказывания р и q таковы, что из представленных на фиг. 26 случаев исключены ровно два, то мы будем говорить, что эти высказывания связаны 2-отношением. Два случая из р Q Случай N° и и 1 и л 2 л и 3 л л 4 Ф м г. 32
§ 8 *. Систематический анализ логических отношений 53 четырех могут быть выбраны шестью способами, но некоторые из них не дают интересных отношений. Например, пусть исклю- чены случаи 1 и 2; тогда р не может быть истинным, т. е. яв¬ ляется логически ложным. Аналогично, если исключены случаи 1 и 3, то q логически ложно. С другой стороны, если исклю¬ чены случаи 3 и 4, то р логически истинно; и если исключены случаи 2 и 4, то q логически истинно. Итак, мы видим,’что эти четыре способа выбора двух из четырех случаев не дают нам новых отношений; они означают только, что одно из этих выска¬ зываний логически истинно или ложно. Теперь остаются только две возможности: (А) исключены случаи 2 и 3, что означает эквивалентность наших двух высказываний; (В) исключены случаи 1 и 4, что означает невозможность для этих высказыва¬ ний быть одновременно истинными или ложными — одно из вы¬ сказываний должно быть истинным, а другое ложным. Тогда мы говорим, что высказывания р и q противоположны. Легко видеть, что не существует «3-отношений», так как если на фиг. 32 исключить три случая, то для каждого из двух высказываний останется только одна возможность; следова¬ тельно, каждое из них должно быть логически истинным или логически ложным. Мы уже изучили отношения следствия и эквивалентности и отметили их аналогию с импликацией и двойной имплика¬ цией. То же самое можно сделать и для трех оставшихся от¬ ношений. Если р и q Л-несовместимы, то они не могут быть ложными одновременно; а так как дизъюнкция их была бы ложной только в этом случае, то мы видим, что р и q Л-несов¬ местимы тогда и только тогда, когда р V q логически истинно. Если р и q несовместимы, то они не могут быть истинными од¬ новременно; так как конъюнкция их истинна только в этом случае, то мы видим, что р и q несовместимы тогда и только тогда, когда р A q логически ложно. Наконец, если р и q про¬ тивоположны, то исключены случаи 1 и 4 на фиг. 32; поэтому Р q логически ложно. (Заметим также, что если р и q про¬ тивоположны, то логически истинно рVq.) Изображенная на фиг. 33 таблица резюмирует наше исследование этих шести от¬ ношений. «П-несовместимость не имеет большого теоретического зна¬ чения, но несовместимость и противоположность очень важны. Каждое из этих отношений можно обобщить на случай более чем двух высказываний. Мы уже определили выше несовме- £7имость п различных высказываний: она означает, что все эти высказывания не могут быть истинными одновременно, т. е. что конъюнкция этих высказываний представляет собой логиче- СКи ложное высказывание. С другой стороны, если имеется п
54 Гл. /. Составные высказывания различных высказываний, из числа которых может быть истин¬ ным одно и только одно, то говорят, что эти высказывания об¬ разуют полную систему альтернатив. Частными случаями пол¬ ной системы альтернатив будут: при п= 1—одно логически истинное высказывание, при п = 2 — пара противоположных высказываний. Исключенные случаи Отношения Другое определение И—И Л—JI и—л Л—и И—Л и Л—И И—И и Л—Л Несовместимость Л-несовместимость Из первого следует второе Из второго следует первое Эквивалентность Противоположность р A q логически ложно р V q логически истинно р -> q логически истинно q -* р логически истинно р q логически истинно р q логически ложно Фиг. 33 Таблицы истинности снова дают нам метод для распознава¬ ния отношений между высказываниями. Следующие примеры показывают, как действует этот метод. Примеры. Рассмотрим представленные на фиг. 34 пять составных высказываний, имеющих одинаковые компонен¬ ты. Найдем все отношения, существующие между парами этих высказываний. р Я РАЯ р У q - р V я ^ р р -> я И И И л И Л И И л л и Л л Л Л и л и И и и Л л л и И и и Номер высказывания 1 2 3 4 5 Фиг. 34 Прежде всего мы замечаем, что высказывания 3 и 5 имеют одинаковые таблицы истинности, поэтому они эк¬ вивалентны. В силу этого достаточно рассматривать только одно из них, скажем, высказывание 3. Высказыва¬
§ 8 *. Систематический анализ логических отношений 55 ния 1 и 2 имеют прямо противоположные таблицы истин¬ ности, поэтому они противоположны. При сравнении вы¬ сказываний 1 и 3 мы не находим случая И—Л, так что из 1 следует 3. Поскольку 1 и 4 никогда не истинны оба, они несовместимы, тогда как высказывания 2 и 3 не могут быть ложны оба и потому они Л-несовместимы. Наконец, при сравнении высказываний 2 или 3 с высказыванием 4 мы не находим случая Л—И и, таким образом, 2 и 3 сле¬ дуют из 4. Итак, на фиг. 34 имеются примеры всех шести найденных нами отношений. Заметим еще, что высказы¬ вания р и q дают пример пары несвязанных высказыва¬ ний. [Ср. § 5.] Упражнения 1. Постройте таблицы истинности следующих четырех высказываний и опре¬ делите, как связаны между собой высказывания шести образуемых ими пар: (a) ~р; (b) ~ я; (c) pA~q; (d) p\jq). [Отв.: (а) и (Ь) независимы; (а) несовместимо с (с), (d); из (с), (d) следует (Ь); (с) эквивалентно (d).] 2. Постройте таблицы истинности для каждого из следующих шести выска- зываний. С помощью этих таблиц укажите пример пары несвязанных высказываний и пример каждого из шести возможных отношений между высказываниями: (a) р -«—*■ q; (b) р -> q; (c) ~^р A ~q; (d) (pAq)V(~pA~q)-, (e) ~q; (f) p A~ q. 3- Докажите следующие утверждения. (a) Дизъюнкция двух противоположных высказываний логически истинна. (b) Два высказывания эквивалентны тогда и только тогда, когда из каждого из них следует другое. (c) Если два высказывания несовместимы, то противоположные им высказывания Л-несовместимы. 4* Каким отношением связаны между собой следующие два высказывания: (a) P~>lpA^(q\/r)]; (b) q A—г). [Отв.: Эквивалентны.J
56 Г л. /. Составные высказывания 5. Пусть любые два из высказываний р, q и г являются несвязанными; кроме того, известно, что для этих трех высказываний таблицы истин¬ ности содержат только четыре строки. Докажите, что г эквивалентно либо р q, либо р У q. 6. Докажите следующие утверждения. (a) Если два высказывания эквивалентны, то эквивалентны и противо¬ положные им высказывания. (b) В полной системе альтернатив любые два высказывания несовме¬ стимы. (c) Если р и q Jl-несовместимы и если каждое из них влечет г, то г логически истинно. 7. Выберите полную систему четырех альтернатив из следующих высказы¬ ваний: (a) идет дождь, но нет ветра; (b) дождь идет тогда и только тогда, когда дует ветер; (c) неверно, что идет дождь и дует ветер; (d) идет дождь и дует ветер; (e) нет дождя и нет ветра; (f) неверно, что идет дождь или нет ветра. [Отв.: (a), (d), (е), (f).] 8. Как связаны высказывание [р (q VO V(.pAs)] и высказывание ~(Р Aq Ar As)? [Отв.: Л-несовместимы.] 9. Предположим, что р и q несовместимы. Как тогда связаны (a) р и ~ q\ (b) —' р и q\ (c) ^ р и ^ q\ (d) р и ^ р? 10. Пусть р, q и г — три высказывания, каждые два из которых несвязанные. Исследуйте возможные отношения между этими тремя высказываниями. [Указание. Если не учитывать порядка расположения этих выска¬ зываний, таких отношений существует 14. Эти отношения будут самое большее 4-отношениями. Имеются два 4-отношения, а остальные отно¬ шения могут быть получены из них путем исключения каких-то недо¬ пустимых случаев.] П. В § 5 был рассмотрен пример на сравнение двух человек по росту. Допустим, что мы учитываем такие возможности: ниже 5 футов 9 дюймов, 5 футов 9 дюймов, 5 футов 10 дюймов, 5 футов 11 дюймов, 6 футов, выше 6 футов. Мы будем считать, что два человека имеют одинаковый рост, если они при таком анализе попадают в одну и ту же категорию. (a) Постройте систему всех возможностей для двух человек, Джима и Билла. (b) Определите, в каких случаях истинно «Билл выше Джима». (c) Определите, в каких случаях истинно «Джим выше Билла». (d) Все ли четыре табличные случая для высказываний (Ь) и (с) могут иметь место? (e) Как связаны эти два высказывания? 12. Постройте систему логических возможностей для классификации людей по семейному положению и полу. (а) Покажите, что высказывание «если данный субъект холост, то он не женат» логически истинно,
§ 9. Варианты импликации (b) Покажите, что высказывание «если субъект является старой девой, то этот субъект — мужчина» логически ложно. (c) Найдите отношение между высказываниями «данный субъект есть мужчина» и «данный субъект холост». (d) Найдите простое высказывание, которое Л-несовместимо с высказы¬ ванием «данный субъект есть мужчина», но не образует с ним пару противоречивых высказываний. § 9. ВАРИАНТЫ ИМПЛИКАЦИИ Импликация двух высказываний отличается от их двойной импликации, а также от их дизъюнкции и конъюнкции тем, что она несимметрична. Так, р V q эквивалентно q \j р; Рf\q эк¬ вивалентно q А р и p^-^q эквивалентно q^-^P; но p—>q не эк¬ вивалентно q—>p. Последнее высказывание, q -> /?, называется конверсией высказывания p-^q. Многие из наиболее распро¬ страненных ошибок в рассуждениях происходят от смешения какого-либо высказывания с его конверсией. j Импликация Конверсия импликации Конверсия контрапозиции Контрапозиция р я р -» Я q^p и и и И И И и л л И И л л и и Л Л и л л и И И и Фиг. 35 Интересно поэтому рассмотреть те импликации, которые мо¬ гут быть образованы из высказываний р и q. Таблицы истин¬ ности этих четырех импликации и названия их даны на фиг. 35. Мы замечаем, что p—>q эквивалентно >~р. Последнее называется контрепозицией первого. Контрапозиция является очень удобной формой импликации во многих рассуждениях. Аналогично высказывание ~p—>~q представляет собой кон- иерсию контрапозиции. Так как контрапозиция эквивалентна Р~~* Ч, то конверсия этой контрапозиции эквивалентна конвер- сии этой импликации, что можно видеть на фиг. 35. Если обращение с импликацией усваивается с большим тру- д°м, чем обращение с прочими связками, это вызвано, быть Может, отсутствием симметрии, а возможно также и тем, что
58 Гл. I. Составные высказывания способы для выражения импликации очень разнообразны. Во многих случаях только тщательный анализ условного выска¬ зывания в состоянии решить, имеет ли в виду субъект, делаю¬ щий такое утверждение, данную импликацию или ее конвер¬ сию. Конечно, иногда он имеет в виду и то, и другое, т. е. двой¬ ную импликацию. (См. упр. 5.) Высказывание «Я пойду гулять только в том случае, если будет солнечный день», является вариантом условного выска¬ зывания с импликацией. Высказывание, имеющее форму «р, только если q» тесно связано с высказыванием «Если р, то р», но как именно? Фактически оба выражают одну и ту же мысль. Высказывание «р, если только q» констатирует, что «Если ~ q, то ~ р», поэтому оно эквивалентно «Если р, то q». Таким образом, высказывание, приведенное в начале этого аб¬ заца, эквивалентно высказыванию «Если я пойду гулять, то бу¬ дет солнечный день». Другими примерами фраз, означающих условное высказы¬ вание, могут служить постоянно упоминаемые математиками «необходимое условие» и «достаточное условие». Сказать, что р является достаточным условием для q, означает то же самое, что сказать: если имеет место р, то q также будет иметь место. Таким образом, предложение «р является достаточным . усло¬ вием для q» эквивалентно предложению «Если р, то q». Подобным же образом предложение «р является необходи¬ мым условием для q» эквивалентно «qy только если р». Так как нам известно, что последнее эквивалентно «Если р, то р», мы приходим к заключению, что утверждение необходимого усло¬ вия является конверсией утверждения достаточного условия. Наконец, если сделано как условное высказывание, так и его конверсия, то тем самым сделано высказывание двойной импликации. Итак, утверждение «р является необходимым и достаточным условием для q» эквивалентно утверждению «р, если и только если q». Упражнения 1. Пусть р означает «Я сдам этот экзамен», a q означает «Я буду регу¬ лярно выполнять домашние задания». Запишите в символической форме следующие высказывания. (a) Я сдам этот экзамен только в том случае, если буду регулярно выполнять домашние задания. (b) Регулярное выполнение домашних заданий является необходимым условием того, что я сдам этот экзамен. (c) Сдача этого экзамена является достаточным условием того, что я ре¬ гулярно выполнял домашние задания. (d) Я сдам этот экзамен в том и только том случае, если я буду регу¬ лярно выполнять домашние задания.
§ 9. Варианты импликации 59 (е) Регулярное выполнение домашних заданий есть необходимое и достаточное условие для того, чтобы я сдал этот экзамен. Взяв высказывание п. (а) предыдущего упражнения, образуйте его кош версию, контрапозииию и конверсию этой контрапозиции. Выразите каждое из них как в словесной, так и в символической форме. 3. Пусть р означает «Идет снег», a q означает «Поезд опаздывает». Выра¬ зите следующие высказывания в символической форме. (a) Выпадение снега является достаточным условием для опоздания поезда. (b) Выпадение снега является необходимым и достаточным условием для опоздания поезда. (c) Поезд опаздывает только в случае, когда идет снег. 4. Взяв высказывание п. (а) предыдущего упражнения, образуйте его кон¬ версию, контрапозицию и конверсию его контрапозиции. Выразите ка¬ ждое из них в словесной форме. 5. Докажите, что конъюнкция импликации и ее конверсии эквивалентна двойной импликации. 6. Чему эквивалентна конъюнкция контрапозиции и ее конверсии? 7. Докажите, что (a) ~ ^ р эквивалентно р\ (b) контрапозиция контрапозиции эквивалентна первоначальной импли¬ кации. 8. «Для того чтобы матрица имела обратную матрицу, необходимо, чтобы ее определитель был отличен от нуля». Какие из приведенных ниже высказываний следуют из этого? [Никакого знания теории матриц здесь не требуется.] (a) Для того чтобы матрица имела обратную, достаточно, чтобы ее определитель был равен нулю. (b) Для того чтобы определитель матрицы был отличен от нуля, доста¬ точно, чтобы эта матрица имела обратную. (c) Для того чтобы определитель матрицы был равен нулю, необходимо, чтобы эта матрица не имела обратной. (d) Матрица имеет обратную тогда и только тогда, когда определи¬ тель ее не равен нулю. (e) Определитель матрицы равен нулю тогда только, когда эта матрица не имеет обратной. [Отв.: (Ь), (с), (е).] 9. «Дифференцируемая функция непрерывна». Это высказывание истинно для всех функций, но конверсия его не всегда истинна. Какое из сле¬ дующих высказываний будет истинным для всех функций? [Никакого знания теории функций здесь не требуется.] (a) Функция дифференцируема только в случае ее непрерывности. (b) Функция непрерывна только в случае ее дифференцируемости. (c) Дифференцируемость функции есть необходимое условие ее непре¬ рывности. (d) Дифференцируемость функции есть достаточное условие ее непре¬ рывности. (в) Дифференцируемость функции есть необходимое и достаточное усло¬ вие ее дифференцируемости. 10 [Отв.: (a), (d), (е).] Доказать, что отрицание высказывания «р есть необходимое и доста- °чное условие для q» эквивалентно высказыванию «р есть необходи¬ мее и достаточное условие для ^ д»,
Гл. /. Составные высказывания § 10. ПРАВИЛЬНЫЕ АРГУМЕНТЫ Одной из важнейших задач логика является проверка аргу¬ ментов. Под аргументом мы будем понимать утверждение того, что некоторое высказывание (заключение) следует из других высказываний (посылок). Аргумент будет называться правиль¬ ным тогда и только тогда, когда из конъюнкции посылок сле¬ дует заключение, т. е. всякий раз, когда все посылки истинны, заключение также является истинным. Важно иметь в виду, что постольку, поскольку речь идет лишь о проверке правильности аргумента, истинность самого заклю¬ чения для нас не существенна. Истинность заключения не яв¬ ляется ни необходимым, ни достаточным условием правильности аргумента. Это видно из следующих двух примеров, которые также показывают форму записи аргументов, используемую нами в дальнейшем: сначала мы выписываем посылки, затем под ними проводим черту и пишем заключение. Пример 1. Если Шекспир — великий драматург, то его произведения ставятся в театрах. Но произведения Шекспира ставятся в театрах. Следовательно, Шекспир — великий драматург. Конечно, это заключение истинно. Однако этот аргу¬ мент неправилен, потому что заключение не следует из этих двух посылок. Пример 2. Хорошие стихи обладают рифмами. Уолт Уитмен писал стихи. В стихах Уитмена рифмы отсутствуют. Следовательно, стихи Уитмена не хороши. Здесь заключение ложно, но аргумент правилен, ибо заключение следует из посылок. Парадокс исчезает, если мы заметим, что первая посылка ложна. Не удивительно, что из ложных посылок корректным путем выводится лож¬ ное заключение. Если аргумент правилен, то из конъюнкции посылок следует заключение. Таким образом, если все посылки истинны, то за¬ ключение также будет истинным. Но если одна или более из посылок окажется ложной, так что конъюнкция всех этих посы¬ лок ложна, то заключение может быть либо истинным, либо ложным. Может быть и так, что все посылки ложны, заклю¬ чение истинно и аргумент правилен, как показывает следую¬ щий пример.
§ 10. Правильные аргументы 61 Пример 3. Все собаки имеют по две ноги. Все двуногие животные плотоядны. Следовательно, все собаки плотоядны. Здесь аргумент правилен и заключение истинно, но обе посылки ложны! Каждый из этих примеров подчеркивает тот факт, что ни значения истинности, ни содержание высказываний, встречаю¬ щихся в аргументе, не влияют на его правильность. Вот две формы правильных аргументов: Р-+Я Р~*Я Р —я • ‘ • Я .-.~Р Символ означает «следовательно». Таблицы истинности для этих форм аргументации представлены на фиг. 36. р я р ->я р я р -> я ^ я ~ р и И И И и И Л л и л Л и л л и л л и и л и и л и л л и л JI и и и Фиг. 36 Для первого из наших двух аргументов мы видим и из таб¬ лицы, что обе посылки истинны только в одном случае, а именно в первом, и в этом случае заключение истинно, так что этот ар¬ гумент правилен. Подобным же образом во втором аргументе обе посылки истинны в одном лишь четвертом случае, и в этом случае заключение также истинно, так что и этот аргумент пра¬ вилен. Аргумент, не являющийся правильным, называется ложным выводом. Примерами ложных выводов могут служить следую¬ щие две (достаточно распространенные!) формы аргументации* Р~+Я Р~*Я Я ~Р я
62 Гл. I. Составные высказывания. В первом ложном выводе обе посылки истинны в первом и третьем случае изображенной на фиг. 36 таблицы, однако в третьем случае заключение ложно, так что этот аргумент не¬ правилен (именно эта форма была рассмотрена в примере 1), Подобным же образом, во втором ложном выводе обе посылки истинны в двух последних случаях, однако в третьем случае заключение ложно. Правильность аргумента не зависит от того, что представ¬ ляют собой его компоненты, и, таким образом, определяется только его формой. Таблицы истинности, собранные на фиг. 36, показывают, что при истинности обеих посылок заключения на¬ ших первых двух аргументов также истинны. Для случая при¬ веденных выше ложных выводов таблицы истинности показы¬ вают, что можно сделать обе посылки истинными, не делая при этом истинным заключение, а именно, взяв р ложным, а а истинным. Пример 4. Рассмотрим следующий аргумент: Р-+Я Я -+г .• .р^г Таблица истинности этого аргумента приведена на фиг. 37. р я г р -> я Я -+Г Р-+Г и и и и И и и и л и л л и л и л и и и л л л и л л и и и и и л и л и л и л л и и и и л л л и и и Фиг. 37 На первой, пятой, седьмой и восьмой строках этой таблицы обе посылки истинны. Так как в каждом из этих случаев заключение также истинно, то этот аргумент пра¬ вилен. (Пример 3 может быть записан в такой форме.)
§ 10. Правильные аргументы 63 Упражнения 1. Проверьте правильность следующих аргументов: (a) р^Я (b) PW <с) р ~Р ~p-+q 77~q -'-Я .'.~q [Отв.: (а), (Ь) правильны.] 2. Проверьте правильность следующих аргументов: (a) F->q (Ь) P->q ,—/ q —, г ^ г -> ^ q Г -> Р ^ Г р 3. Проверьте правильность аргумента p+-+q q V г ^ г ’. р 4. Проверьте правильность аргумента plq q г ~p\j~r ~'-~Р 5. Проверьте правильность аргумента p->q ~p->^q р Л ^ г s в. Даны посылки р -> q и ^ г -> ^ q. Мы хотим найти правильное за¬ ключение, содержащее в себе риг (если такое найдется). (a) Постройте таблицы истинности обеих посылок. (b) Отметьте случаи, в которых заключение должно быть истинным. (c) Постройте таблицу истинности комбинации, состоящей только из р иг, ставя И там, где это необходимо. (а) Заполните оставшуюся часть этой таблицы истинности буквой Л. (е) Какая комбинация из р и г имеет такую таблицу истинности? (Это будет некоторое правильное заключение.) [Отв.: р\/г.] Покажите, что метод, предложенный в упр. 6, всегда годится для того, чтобы получить заключение о связи между двумя данными переменными. Докажите, что этот метод позволяет получить самое сильное из всех озможных утверждений (в том смысле, что из него следует каждое дру¬ гое подобное утверждение), [Отв.\ (Ь) правилен.] [Отв.: Неправилен.]
64 Гл. /. Составные высказывания 8. С помощью метода, описанного в упр. 6, получите заключение о связи между р и q из следующего аргумента: р-+г ~ Г V 5 ? ? ? 9. С помощью метода, описанного в упр. 6, получите заключение о связи между р и q из следующего аргумента: q->r г —> (s \/ (t /\ и) ) ~ р (t s) р \J^u ? ? ? 10. С помощью метода, описанного в упр. 6, найдите наиболее сильное за¬ ключение о связи между высказываниями «Я сдам этот экзамен» и «Я буду заниматься», исходя из следующей аргументации: Если мне повезет, то я сдам этот экзамен. Либо я буду заниматься, либо мне повезет (но не то и другое одновременно). ? ? ? 11. Представьте в символической форме следующий аргумент и проверьте его правильность: Если этот курс хорош, то он полезен. Или экзаменатор снисходителен, или этот курс бесполезен. Но экзаменатор не снисходителен. Следовательно, этот курс плох. [Отв.: Правильный.] 12. Представьте в символической форме следующий аргумент и проверьте его правильность: «Для того чтобы перейти на следующий курс, достаточно сдать этот предмет по крайней мере на .«удовлетворительно». Я сдам этот предмет лишь в том случае, если разберусь в доказательстве теоремы о зависимо¬ сти решения дифференциального уравнения от параметра. [Разумеется, для понимания аргументации совершенно не нужно знать, про какую теорему идет здесь речь.] Но я не в состоянии разобрать доказательство этой теоремы. Следовательно, я перейду на следующий курс. 13. Представьте в символической форме следующий аргумент и проверьте его правильность: «Отец хвалит меня только тогда, когда я сам могу быть доволен со¬ бой. Или я успешно занимаюсь спортом, или я не могу быть собой дово¬ лен. Если я плохо учусь, то я не могу успешно заниматься спортом. Сле¬ довательно, если отец меня хвалит, то я учусь неплохо». 14. Следующее рассуждение дополните заключением, которое превратило бы его в правильный аргумент. [Адаптировано по Льюису Кэрролу1).] !) К- Л. Додже он (литературный псевдоним Льюис К эррол) — известный деятель математического просвещения в Англии и популяризатор математической логики, одновременно — автор очень популярных во всем мире (в первую очередь — в странах английского языка) сказок «Алиса 0 стране чудес», «Алиса в Зазеркальи».
§11. Косвенный метод доказательства 65 «Если он пойдет в гости, то он должен не забыть причесаться. Для того чтобы элегантно выглядеть, необходимо быть опрятным. Если он курит опиум, то он не может владеть собой. Если он причешется, то будет выглядеть элегантно. Он наденет белые лайковые перчатки только в том случае, если он пойдет в гости. Если он не владеет собой, то этого достаточно для того, чтобы вы¬ глядеть неопрятно. Поэтому...» § 11*. КОСВЕННЫЙ МЕТОД ДОКАЗАТЕЛЬСТВА Доказательство — это аргумент, показывающий, что услов¬ ное высказывание вида р<7 логически истинно. (Именно, р есть конъюнкция посылок, a q—заключение аргумента.) Иногда удобнее бывает показать, что логически истинно некоторое эк¬ вивалентное исходному условное высказывание. Пример 1. Пусть х и у — целые положительные числа. Теорема. Если ху — нечетное число, то х и у оба не¬ четные. Доказательство. Предположим противное, т. е* что х и у не оба нечетные. Тогда одно из них должно быть четным, скажем х = 2г. Тогда ху = 2zy будет четным, вопреки предположению. Тем самым наша теорема дока¬ зана. Пример 2. «Он не знает прозвища декана факультета; следовательно, он не может быть студентом этого факуль¬ тета. Почему? Потому что все студенты этого факуль¬ тета называют декана (за его спиной) его прозвищем. Следовательно, если бы он действительно был студентом факультета, то он наверное знал бы прозвище декана». Можно дать простые примеры одной весьма общей формы аргументации, часто используемой как в математических, так и в повседневных рассуждениях. Попробуем раскрыть эту форму. Дано: ху— нечетное число. Он не знает прозвища декана [/?]. Доказать: х и у оба нечетные числа. Он не является студентом факуль¬ тета [q]. Предположим: х и у не оба нечет- Он является студентом факультета ные числа. q], Тогда: ху четное число. Он должен знать прозвище декана 1~Р}- Таким образом, мы делаем предположение, противоречащее ^аключению, и получаем посредством правильного аргумента Результат, противоречащий предположению. Это и есть одна из Ф°рм косвенного метода доказательства. 5 Зак. 609.
66 Гл. I. Составные высказывания Резюмируем: мы хотим показать, что импликация р —> q ло¬ гически истинна; в действительности мы показываем, что логи¬ чески истинна контрапозиция'—q->~p. Поскольку эти два вы¬ сказывания эквивалентны, то наша процедура правильна. Существуют некоторые другие важные варианты этого ме¬ тода доказательства. Легко проверить, что следующие высказы¬ вания имеют ту же таблицу истинности, что и импликация p->q (т. е. эквивалентны ей): (1) (р Л~д)^~р, (2) (р А — (3) (/?Л~<7)->(гЛ~г). Первое из них показывает, что при косвенном методе доказа¬ тельства можно вместе с противоречащим допущением ~q пользоваться первоначальной гипотезой. Второе показывает, что можно также использовать это двойное предположение в прямом доказательстве заключения q. Третье показывает, что если это двойное предположение р и ~ q ведет к противоречию вида г Д ~ г, то доказательство первоначального высказывания выполнено. Эту последнюю форму косвенного доказательства часто называют приведением к абсурду (reductio ad absurdum). Эти последние формы весьма полезны по следующим причи¬ нам. Во-первых, мы видим, что в качестве гипотезы в дополне¬ ние к р всегда можно брать и —q. Во-вторых, мы видим, что, кроме q, имеются два других заключения (~ р или некоторое противоречие), которыми мы имеем право заменить заключе¬ ние q. Упражнения 1. Постройте косвенные доказательства следующих утверждений: (a) Если х2 нечетно, то х нечетно (х — целое число). (b) Чтобы сдать этот экзамен, я должен регулярно выполнять домашние задания. (c) Если он хорошо знает математику, то он не преподает в нашей школе. 2. Произведите символический анализ следующего аргумента: «Если он хочет достигнуть цели, он должен много знать и быть удачливым. Ибо если он не обладает обширными знаниями, то он не сможет достигнуть цели; если же он не удачлив, то он обязательно где-нибудь сорвется». 3. Постройте косвенные доказательства следующих утверждений: (a) если ру q и ^ q, то р\ (b) если р -<г-> q и q->^r и г, то ^ р. 4. Произведите символический анализ следующего аргумента: «Если Джонс — убийца, то ему точно известны время смерти Смита и чем он был убит. Поэтому, если он не знает, когда умер Смит или не знает, чем он был убит, то он не является убийцей».
§ 12 *. Применения к переключательным схемам 67 с убедитесь, что приведенные выше формы (1), (2) и (3) эквивалентны fi дайте пример косвенного доказательства какого-нибудь высказывания, где бы из р и ^ Q выводилось некоторое противоречие. 7 Напишите высказывание, эквивалентное (pf\q)->r и выраженное в тер¬ минах ~ р, ^ Я и ^ г- Укажите, как оно может быть использовано в до¬ казательствах с двумя посылками. § 12* ПРИМЕНЕНИЯ К ПЕРЕКЛЮЧАТЕЛЬНЫМ СХЕМАМ Теория составных высказываний имеет много ‘ применений вне чистой математики. В качестве примера мы изложим тео¬ рию простых переключательных схем. Переключательная сеть представляет собой устройство из проводов и переключателей, связывающих полюсы Т\ и Т2- Каждый переключатель может быть «разомкнут» или «замк¬ нут». Разомкнутый переключатель препятствует прохождению Т, • 0 — Ъ Т> * 0 0 *Тг Ф и г. 38 Ф и г. 39 электрического тока, а замкнутый пропускает ток. Мы хотим решить следующую задачу: зная, какие переключатели в дан¬ ной сети замкнуты, определить, будет ли проходить ток от Т\ к Т2. На фиг. 38 изображена простейшая сеть, в которой зажимы связаны единственным проводом, содержащим переключатель Р. Если Р замкнут, то между зажимами будет протекать ток; в противном случае тока не будет. Сеть на фиг. 39 имеет два переключателя Р и Q, соединенных «последовательно». В этом случае ток протекает лишь тогда, когда замкнуты как Р, так и Q. Чтобы показать, каким образом сформулированная выше задача может быть решена с помощью нашего логического ана- лиза, сопоставим с каждым переключателем некоторое выска¬ зывание. Пусть р означает «переключатель Р замкнут» и q оз¬ начает «переключатель Q замкнут». Тогда сеть на фиг. 38 будет пропускать ток в том и только том случае, если р истинно. нелогично сеть на фиг. 39 будет пропускать ток в том и только том случае, если истинно как р, так и р, т. е. истинно р A q. аким образом, первая схема представлена посредством р, а °Рая посредством р Д q. па фиг. 40 изображена сеть с «параллельным» соединением реключателей Р и Q. В этом случае ток будет проходить, если 5*
68 Гл. I. Составные высказывания замкнут один ила другой из переключателей Р и Q, и данная схема может быть представлена высказыванием р V Я- Изображенная на фиг. 41 сеть представляет собой комбина¬ цию последовательного и параллельного типов соединения пере¬ ключателей. Верхняя ветвь этой сети представлена высказыва¬ нием р Д q, а нижняя — высказыванием г Л s\ следовательно, всю схему представляет (р Д q) V (г Л 5). Так как всех пере¬ ключателей четыре и каждый может быть либо разомкнут, либо замкнут, то имеется 24 = 16 возможных установок переключа¬ телей. Подобным же образом высказывание (р Д q) V (г Д s) за¬ висит от четырех переменных, так что его таблица истинности содержит 16 строк. Установки переключателей, при которых имеет место прохождение тока, соответствуют тем строкам этой таблицы истинности, при которых наше составное высказыва¬ ние истинно. Переключатели не всегда действуют независимо друг от друга. Два или более из них можно связать таким образом, чтобы они размыкались и замыкались одновременно. Чтобы показать это на чертеже, условимся обозначать все идентич¬ ные (т. е. замкнутые или разомкнутые одновременно) переклю¬ чатели одной и той же буквой. Два переключателя можно спа¬ рить, причем таким образом, что, когда один из них замкнут, другой будет разомкнут. На чертеже будем обозначать первый из них через Р, второй через Р'. Тогда высказывание «Р замк¬ нут» истинно тогда и только тогда, когда высказывание «Р7 зам¬ кнут» ложно. Следовательно, если р означает высказывание «Р замкнут», то ~р означает высказывание «Р' замкнут». Пример такой схемы дает фиг. 42. Соответствующее состав¬ ное высказывание имеет вид \р V (—рА — q)]V[pAq]- Так как это высказывание ложно, только если р ложно и q истинно,, ток не будет проходить только тогда, когда Р разомкнут и Q замкнут. Можно проверить это и непосредственно. Если Р замк¬ нут, ток пойдет через верхнюю ветвь независимо от установки Q. Если разомкнуты оба переключателя, то Р' и Q7 будут замк¬ нуты и ток пойдет через среднюю ветвь. Но если Р разомкнут и Q замкнут, то никакая ветвь не будет пропускать ток. Отметим, что мы ни разу не приняли во внимание прохож¬ дение тока через нижнюю ветвь. Логическим выражением этого Фиг. 40 Фиг. 41
§ 12*. Применения к переключательным схемам 69 обстоятельства является то, что высказывание, соответствую¬ щее этой сети, эквивалентно высказыванию [р V (~ Р Л ~ q)], которому в свою очередь соответствуют две верхние ветви на (Ьиг 42. Таким образом, электрические свойства схемы, изобра¬ женной на фиг. 42, останутся прежними, если нижнюю ветвь убрать. " Рассмотрим, наконец, задачу построения переключательной схемы с наперед указанными свойствами. Эквивалентная про¬ блема, которая была решена в § 4, состоит в построении со¬ ставного высказывания с задан¬ ной таблицей истинности. Как и в том разделе, мы ограничим¬ ся высказываниями с тремя пе- т *_ ременными, хотя наши методы легко перенести и на общий случай. В § 4 мы развили общий ме- Фиг. 42 тод нахождения высказывания с. заданной таблицей истинности, не состоящей целиком из JT. (Схема, соответствующая высказыванию с таблицей истинности, состоящей из одних Л, вообще не проводит тока и потому не представляет интереса.) Каждое такое высказывание может быть построено в виде дизъюнкции основных конъюнкций. Так как основные конъюнкции имеют форму р Д q Д г, р Д q Д ^г и т. д., то каждая из них будет представлена посредством схемы, состоящей из трех последовательно соединенных переключате¬ лей, и будет называться основной последовательно соединенной схемой. Дизъюнкция некоторых таких основных конъюнкций бу¬ дет тогда представлена посредством схемы, полученной парал¬ лельным соединением основных последовательно соединенных схем. Полученная в результате сеть не будет, вообще говоря, самой простой из всех сетей, удовлетворяющих данным требо¬ ваниям, но этот метод всегда достаточен для нахождения одной такой сети. Пример. Комитет из трех человек хочет применить электрическую схему для регистрации тайного голосова¬ ния простым большинством голосов. Построим такую схему, чтобы каждый член, голосующий «за», нажимал кнопку и не нажимал ее, если он голосует против, и чтобы в случае, если большинство членов комитета проголосует «за», загоралась сигнальная лампочка. Пусть р означает высказывание «Первый член комите¬ та голосует ,,за”», q означает высказывание «Второй член комитета голосует ,,за”» и г означает высказывание «Тре¬ тий член комитета голосует „за”». Таблица истинности 'Ъ —пл ГпЪ
70 Гл. I. Составные высказывания высказывания «Большинство членов комитета голосует „за”» приведена на фиг. 43. Пользуясь этой таблицей, р Q г Желаемое значение истинности Соответствующая основная конъюнкция и и и И Р А ЯГ г и и л и Р А Я а ~ г и л и и р А - ^ Я А г и л л л р А- ^ Я А г л и и и ~р А Я А г л и л л ~р А Я А ^ г л л и л ^ р А ^ q А г л л л л ~ р А - ^ Я А г Фиг. 43 можно следующим образом записать искомое составное высказывание: (р Л q Л Г) V (р А Я Л ~r) V (р Л V (~Р AqAr). Кнопки для голосования Фиг. 44 Схема, требуемая для реализации этой процедуры го¬ лосования, изображена на фиг. 44. Упражнения 1. Какой схеме соответствует логически истинное высказывание? Приведите пример*
§ 12*. Применения к переключательным схемам 71 2 Постройте сеть, соответствующую высказыванию [(рЛ ^ q) V Р Л <?)] V(~Л ~ q)> 3 Посредством какого составного высказывания может быть представлена схема, изображенная на фиг. 45? Фиг. 45 4. Постройте таблицу истинности для высказывания из упр. 3. Что она го¬ ворит нам об этой схеме? 5. Придумайте схему с теми же свойствами, что и схема упр. 3, но более простую. 6. Постройте сеть, соответствующую высказыванию \{Р V q) Л r\ V [(~ р Л г) V q]. 7. Постройте простейшую сеть, эквивалентную изображенной на фиг. 42, 8 Постройте цепь для «электрифицированной версии» известной игры с мо- н-етами: «По установленному сигналу каждый игрок замыкает или размы¬ кает переключатель, находящийся под его управлением. Если оба делают одно и то же, то выигрывает игрок А; если же они делают противопо¬ ложное, то выигрывает В». Постройте такую схему, чтобы в случае, когда выигрывает А, зажигался свет. 9. Требуется, чтобы в большом зале можно было включать и выключать свет при помощи любого из четырех переключателей, расположенных па че¬ тырех стенах. Это осуществимо путем конструирования схемы, в которой свет включается, когда замкнуто четное число выключателей, и выклю¬ чается, когда замкнуто нечетное число переключателей. (Почему это ре¬ шает задачу?) Придумайте такую схему. Ш. Комитет состоит из пяти членов. Решения выносятся большинством голосов; однако, если председатель голосует «против», решение не мо¬ жет быть принято (т. е. для того чтобы решение было принято, необхо¬ димо, чтобы председатель голосовал «за»). Постройте такую схему, чтобы голосование каждого члена комитета за принятие решения производилось путем нажатия кнопки и чтобы свет загорался в том и только том случае, И если решение принято. б\^ППа кандидатов Держит экзамен, состоящий из четырех вопросов, тре- ующих^ установить истинность или ложность определенных утверждений. с00СтТр0ИТе такУю схему, чтобы кандидат мог отвечать, нажимая кнопки, и ч ве7ствУЮШ'ие тем вопросам, на которые он хочет дать ответ «истинно», о ы эта схема показывала число правильных ответов. nnanL Казание• Взять пять лампочек соответственно числам 0, 1, 2, 3, 4 12. Раз а; Ьных ответов.] ЧЯтРЛотать СПособ составления таблиц истинности с помощью переклю- ^цельных схем.
72 Гл. /. Составные высказывания ЛИТЕРАТУРА ДЛЯ ДОПОЛНИТЕЛЬНОГО ЧТЕНИЯ Тарский А., Введение в логику и методологию дедуктивных наук, М., ИЛ, 1948, гл. I и II. Г и л ь б е р т Д. и Аккерман В., Основы теоретической логики, М., ИЛ, 1947, гл. I. Новиков П. С., Элементы математической логики, М., Физматгиз, 1959, гл. I. Кальбертсон Дж. Т., Математика и логика цифровых устройств, М., Учпедгиз (в печати), гл. V, VII, VIII. Беркли Э., Символическая логика и разумные машины, М., ИЛ, 1961, гл. 1—6. Шестаков В. И., Математическая логика и автоматика, Математика в школе, № 6, 1958; № 1, 1959.
Глава II МНОЖЕСТВА И ПОДМНОЖЕСТВА § 1. ВВЕДЕНИЕ Множеством принято называть вполне определенную сово¬ купность объектов. Рассматриваемое во всей своей общности, это понятие исключительно важно для математики, ибо всю ма¬ тематику можно построить на его основе. Различные предметы меблировки данной комнаты образуют некоторое множество. То же самое можно сказать про книги данной библиотеки или про целые числа между 1 и 1 ООО ООО, или про всевозможные идеи, которые имело человечество, или про людей, которые жили, живут и будут жить между одним миллиардом лет до нашей,, эры и десятью миллиардами лет нашей эры. Все эти примеры служат примерами конечных мно¬ жеств, т. е. множеств, имеющих конечное число элементов.. Множества, рассматриваемые в этой книге, как правило, будут конечными множествами. Имеется два существенно различных способа задания мно-, жеств. Можно либо указать правило для определения того, при¬ надлежит или не принадлежит рассматриваемому множеству любой данный объект, либо дать полный перечень элементов этого множества. Первый способ мы назовем описанием мно¬ жества, а второй способ — перечислением множества. Напри¬ мер, одно и то же множество из четырех человек мы можем опре¬ делить или как (а) участников музыкального квартета, высту¬ павшего накануне вечером в городе, или как (Ь) людей по фамилиям Джонс, Смит, Браун и Грин. Элементы перечисляе¬ мого множества принято заключать в скобки; соответственно этому только что определенное множество запишется так: Щжонс, Смит, Браун, Грин}. ; Нас часто будут интересовать множества логических возмож- н°стей> потому что анализ таких множеств может сыграть основ¬
74 Гл. II. Множества и подмножества ную- роль при решении той или иной проблемы. Предположим, например, что нас интересуют результаты трех участников математической олимпиады (назовем их А, В и С). Пусть на олимпиаде были предложены задачи по арифметике, по алгебре, по геометрии и логическая задача; при этом по ус¬ ловиям соревнования учитывается лишь результат участника, решившего данную задачу первым. Предположим еще, что участник В не пытался решить задачу по арифметике, которой он владеет сравнительно слабо, а участник С не решил геомет¬ рическую задачу. Перечень всех логических возможностей со¬ бран в таблице, изображенной на фиг. 46. Так как арифмети¬ ческую и геометрическую задачу могут решить один из двух участников, а алгебраическую и логическую — три (мы считаем, что соревнование продолжается до тех пор, пока все задачи не будут решены), то всего имеется 2*2-3-3 = 36 различных логических возможностей. Множество, состоящее из некоторых элементов другого мно¬ жества, называется подмножеством этого последнего множе¬ ства. Например, множество тех логических возможностей на фиг. 46, для которых истинно высказывание «участник А решил первым по меньшей мере три задачи», является подмножеством множества всех логических возможностей. Это подмножество можно также задать путем перечисления его элементов: {В 1, В2, ВЗ, В4, В7, В13, В19}. С целью изучения всех подмножеств данного множества введем’ следующую терминологию. Исходное множество мы бу¬ дем называть универсальным множеством,; подмножества, со¬ держащие один элемент, будут называться единичными множе¬ ствами; множество, вовсе не содержащее никаких элементов, будет называться пустым множеством. В качестве примера возьмем универсальное множество 21, состоящее из трех эле¬ ментов [а, Ь, с). Собственные подмножества 21 суть те множе¬ ства, которые содержат некоторые, но не все элементы U. Этими собственными подмножествами являются три множества из двух элементов {а, b}, [а, с} и [Ь, с) и три единичных множе¬ ства {а}, {6} и {с}. Для полноты картины мы рассматриваем уни¬ версальное множество как подмножество (но не собственное!) самого себя и также считаем подмножеством множества 21 пус¬ тое множество О, не содержащее никаких элементов 21. С пер¬ вого взгляда может показаться странным, что мы включаем в число подмножеств 21 множества 21 и О. Основания для такого включения станут ясными впоследствии. Мы видим, что рассмотренное нами множество U из трех элементов имеет 8 = 23 подмножеств. Вообще множество из п элементов имеет 2п подмножеств, что можно показать следующим
Номер возможности Участник соревнования, первым решивший арифметическую задачу алгебраическую задачу геометрическую задачу логическую задачу В1 А А А А В2 А А А В ВЗ А А А С В4 А А В А В5 А А В В В6. А А В С В7 А В А А В8 А В А В В9 А В А С В10 А В В А В11 А В В В В12 А В В С В13 А С А А В14 А С А В В15 А С А С В16 А С В А В17 А С В В В18 А С В С В19 С А А А В 20 С А А В В21 С А А С В22 с А В А В23 с А В В В24 с А В С В25 с В А А В26 с В А В В27 с В А С В28 с В В А В29 с В В В ВЗО с В В С В31 с С А А В32 с С А В ВЗЗ с С А С В34 с С В А В35 с С В В В36 с С В С Фиг. 46
76 Гл. II. Множества и подмножества образом. Будем строить подмножества Р множества U, рас¬ сматривая по очереди каждый элемент U и решая, включать ли его в это подмножество. Если мы решим включить в Р каж¬ дый элемент из U, то получим универсальное множество, а если мы решим не включать в Р никакого элемента, то получим пустое множество О. Большей частью включенными в Р ока¬ жутся некоторые, но не все элементы, и тогда будут получены собственные подмножества множества U. Мы должны принять п решений, по одному для каждого элемента множества, и для каждого решения должны сделать выбор из двух альтернатив. Имеется 2 • 2 • • • 2 = 2п способов принятия таких решений — это и есть число тех различных подмножеств множества U% которые могут быть построены. Отметим, что наша форму¬ ла не была бы столь простой, если бы в число подмно¬ жеств U мы не включили универсальное множество и пустое множество. В рассмотренном примере исходов математической олимпи¬ ады имеется 236, или около 70 миллиардов, подмножеств. Ра¬ зумеется, в практической задаче мы не можем справиться с таким большим числом подмножеств. К счастью, нас обычно интересуют лишь немногие подмножества. Наиболее интерес¬ ными подмножествами являются те, которые можно задать с помощью простого правила, вроде «Множество всех тех логи¬ ческих возможностей, при которых участник С не решил (пер¬ вым) по меньшей мере две задачи». Дать простое описание под¬ множества {В 1, В4, В14, ВЗО, В34} было бы трудно. С другой стороны, в следующем параграфе мы увидим, как можно оп¬ ределить новые подмножества, исходя из определенных ранее подмножеств. Примеры. Проиллюстрируем два различных способа задания множеств, используя пример с тремя участниками олимпиады. Пусть универсальное множество U состоит из логических возможностей, перечисленных в таблице на фиг. 46. 1. Указать подмножество, характеризуемое тем, что участник В решил (первым) большее число задач, чем каждый из его соперников. Ответ: (ВИ, В12, В17, В23, В26, В28, В29}. 2. Указать подмножество, характеризуемое тем, что две задачи решил один участник и две другой. Ответ: (В5, В8, BIO, В15, В21, ВЗО, В31, В35}. 3. Описать множество {В 1, В4, В19, В22}. Ответ: Мно¬ жество тех возможностей, при которых А решил алгебраи¬ ческую и логическую задачи.
§ 1. Введение 77 4. Каким образом можно описать множество {В 18, В24. В27}? Ответ: Множество тех возможностей, при которых С решил логическую задачу, а три остальных задачи ре¬ шили разные участники соревнования. Упражнения 1. В примере с тремя участниками олимпиады перечислите элементы каждого из следующих множеств: (a) множество, для которого С решил по меньшей мере две задачи; (b) множество, для которого первые три задачи решил один и тот же участник олимпиады; (c) множество, для которого все четыре задачи решил В. 2. Один из участников олимпиады объявляется победителем, если он решил первым либо три задачи из четырех, либо две задачи, включая сюда и логическую задачу. Перечислите множество логических возможностей, в которых имеется победитель олимпиады. 3. Дать простые описания следующих множеств (исходя из того же при-* мера с участниками олимпиады): (a) {ВЗЗ, В36}; (b) {BIO, В11, В12, В28, В29, ВЗО}; (c) {В6, В20, В22}. 4. Джо, Джим, Пит, Мэри и Анна должны сфотографироваться. Они хотят стать в ряд таким образом, чтобы юноши и девушки чередовались. Дайте перечень множества всех возможностей. 5. В условиях упр. 4 перечислите следующие подмножества: (a) множество, для которого Пит и Мэри находятся рядом; (b) множество, для которого Анна находится между Джо и Джимом; (c) множество, для которого Джим находится в центре; (d) множество, для которого Мэри находится в центре; (e) множество, для которого юноши находятся с краю. 6. В упр. 5 укажите все такие пары множеств, для которых одно множество является подмножеством другого. 7. Режиссер телевизионной студии составляет программу получасовой пере¬ дачи. Он хочет, чтобы в ней сочетались художественное чтение, легкая музыка и объявления. В предположении, что на каждую из этих частей программы отводится время, кратное пяти минутам, постройте множество возможных распределений времени. (Рассматривать только суммарное время, отводимое на каждую часть.) 8. В упр. 7 перечислите следующие подмножества: (a) множество, для которого на художественное чтение отводится боль¬ ше времени, чем на легкую музыку; (b) множество, для которого на объявления отводится больше времени, чем на музыку или чем на художественное чтение; (c) множество, для которого на музыку отводится ровно пять минут; (d) множество, для которого выполнены условия всех трех п. (а) — (с) В условиях упр. 8 найдите два множества, каждое из которых есть соб¬ ственное подмножество множества п.(а), а также множества п.(с),
78 Гл. II. Множества и подмножества § 2. ОПЕРАЦИИ НАД ПОДМНОЖЕСТВАМИ В гл. I нами были рассмотрены способы, которыми из дан¬ ных высказываний могут быть образованы новые высказывания. Теперь мы будем рассматривать аналогичный процесс — обра¬ зование новых множеств из данных множеств. Мы будем пред¬ полагать, что каждое из множеств, которое мы используем в этом процессе, является подмножеством некоторого универсаль¬ ного множества, и будем требовать, чтобы вновь образованное множество было подмножеством того же самого универсального множества. Как и всегда, мы можем задавать вновь образован¬ ное множество или путем описания, или путем перечисления. По заданным множествам Р и Q мы определим новое мно¬ жество Р П Q, называемое пересечением Р и Q, следующим обра¬ зом: Pfl Q есть множество тех и только чех элементов, которые принадлежат и Р и Q. В качестве примера рассмотрим логиче¬ ские возможности, перечисленные на фиг. 46. Пусть Р означает подмножество, для которого участник А решил первым по мень¬ шей мере три задачи, т. е. множество {В 1, В2, ВЗ, В4, В7, В13, В19}, и пусть Q — подмножество, для которого А решил (пер¬ вым) первые две задачи, т. е. множество (В 1, В2, ВЗ, В4, В5, В6}. Тогда пересечением PDQ будет множество, для которого имеют место оба указанные события, т. е. А решил первые две задачи и решил по меньшей мере три задачи. Таким образом, PflQ есть множество {В 1, В2, ВЗ, В4}. По заданным множествам Р и Q следующим образом опреде¬ лим теперь новое множество Р U Q, называемое объединением Р и Q; PUQ есть множество тех и только тех элементов, которые принадлежат или Р, или Q (или обоим). В примере из предыду¬ щего абзаца объединение Р U Q представляет собой множество логических возможностей, при которых А или решил первые две задачи, или решил по меньшей мере три задачи, т. е. мно¬ жество {ВЬ В2, ВЗ, В4, В5, В6, В7, В13, В19}. Чтобы помочь наглядному представлению этих операций, бу¬ дем изображать их на специального рода диаграмме, называе¬ мой диаграммой Венна1). Пусть прямоугольник обозначает уни¬ версальное множество, а круги внутри прямоугольника — под¬ множества. На фиг. 47 показаны два множества Р и Q в виде заштрихованных кругов. Тогда область, заштрихованная дважды, 9 В русской литературе чаще употребляется (более обоснованное) на¬ звание круги Эйлера. (Диаграммами Венна иногда называют аналогичные иллюстрации, где отдельные множества изображаются не обязательно кру¬ гами.)
§ 2. Операции над подмножествами 79 представляет пересечение Р П Q, а вся заштрихованная об¬ ласть — объединение Р U Q. Если Р — данное подмножество универсального множества U, то новое множество Р, называемое дополнением Р, мы опре¬ делим следующим образом: Р есть множество всех, тех элемен¬ тов U, которые не содержатся в Р. Например, если,, как и Фиг. 47 прежде, через Q обозначено множество, для которого участ¬ ник А решил первые две задачи, то Q есть множество {В7, В8, ..., В36}. На фиг. 48 заштрихованная область означает дополнение множества Р. Отметим, что дополнением пустого множества О служит универсальное множество М и дополне¬ нием универсального множества служит пустое множество. Иногда нас будет интересовать только часть дополнения множества. Например, мы можем интересоваться той частью Дополнения множества Q, которая содержится в Р, т. е. мно¬ жеством Р П Q. Область Р П Q заштрихована на фиг. 49. Несколько более выразительное определение этого множества Может быть дано следующим образом; пусть Р — Q есть
80 Гл. II. Множества и подмножества разность Р и О, т. е. множество тех элементов Р, которые не при¬ надлежат Q. Фиг. 49 показывает, что PflQ и Р — Q — одно и то же множество. В ппимере с участниками олимпиады множе¬ ством Р — Q будет {В7. В13, В19}. Дополнение подмножества представляет собой частный слу¬ чай разности множеств, так как можно написать Q= U—Q. Если Р и Q — непустые подмножества, пересечение которых пусто, т. е. Р П Q = О, то их называют непересекающимися под¬ множествами. Примеры. Пусть в примере с участниками олимпиады R означает множество, для которого А решил первые три за¬ дачи, т. е. множество {В1, В2, ВЗ}, и пусть S означает мно¬ жество, для которого А решил последние две задачи, т. е. множество (В 1, В7, В13, В19, В25, ВЗ 1}. Тогда /?П5 = {В1} есть множество, для которого А решил первые три задачи, а также последние две задачи, т. е. первым решил все четыре задачи. Мы имеем также #US={B1, В2, ВЗ, В7, В13, В19, В25, В31}. Это множество можно описать как такое, для которого А решил либо арифметическую, алгебраическую и геометриче¬ скую задачу, или же геометрическую и логическую задачи. Множество, для которого А не сумел первым решить три первые задачи, есть R = (В4, В5, ..., В36}. Наконец мы ви¬ дим, что разность R — S представляет собой множество, для которого А решил первые три задачи, но не обе последние. Это множество может быть получено путем удаления из R элемента (В 1} — общего для R и 5, так что R—S = {B2, ВЗ}. Упражнения 1. Нарисуйте диаграммы Венна для множеств Pf)Q> PflQ» PflQ> PflQ* 2. Осуществите шаг за шагом построение диаграммы Венна для множества - (P-Q)[}(P(]Q). 3. Диаграммы Венна полезны и тогда, когда даны три подмножества. По¬ стройте такую диаграмму с тремя (пересекающимися) подмножествами Р, Q и R. Для каждой из восьми получившихся областей объясните, как она составлена из множеств Pf Q и R. 4. Для точек гладкой кривой проводится классификация по следующим при¬ знакам: а) по зна.ку первой производной в этой точке (характеризующему возрастание или убывание соответствующей функции) и Ь) по знаку вто¬ рой производной (характеризующему выпуклость или вогнутость кривой). Постройте диаграмму Венна, на которой были бы видны все четыре воз¬ можности. 5. В качестве иллюстрации к упражнению 4 для всех четырех классов точек кривой приведите примеры кривых, у которых все точки принадлежат данному классу.
§ 2. Операции над множествами 81 6. Выполните классификацию множества целых положительных чисел (ска- жем, не превосходящих 1 ООО ООО) по следующим признакам: а) по чет¬ ности, Ь) по тому, является ли число полным квадратом или нет, с) по тому, является ли последняя цифра числа (в десятичном его представле¬ нии) пятеркой или нет. Постройте диаграмму Венна. Приведите, если можно, примеры для каждого из возможных восьми случаев. 7. На изображенной на фиг. 50 таблице показана реакция некоторого числа зрителей на одну телевизионную передачу. Все фигурирующие в. таблице категории можно выразить в терминах следующих четырех: М (мужско¬ го пола), В (взрослый), П (понравилось), О (очень). Очень понравилось Понравилось, но не очень Не понравилось, | но не очень Очень не понра- [ вилось Мужчины 1 3 5 10 Женщины 6 8 3 1 Мальчики 5 5 3 2 Девочки 8 5 1 1 Фиг. 50 Сколько человек попадает в каждую из следующих категорий: (a) М; [Отв.: 34.] (b) П; (c) О; (d) М П в П Н П О; [Отв.: 2.] (e) МПВПП; (0 (МДВ) U (П П О); (g)(М П В); [Отв.: 48.] (h) (М U В); (i) (М-В); (]) [М-(ВПППО)]. 8. Обследование 100 студентов дало следующие результаты о количестве сту¬ дентов, изучающих различные иностранные языки: испанский 28; немец¬ кий 30; французский 42; испанский и немецкий 8; испанский и француз¬ ский 10; немецкий и французский 5; все три языка 3. (a) Сколько студентов не изучает ни одного языка? [Отв.: 20.] (b) Сколько студентов изучает один французский язык? [Отв.: 30.] (c) Сколько студентов изучает немецкий язык в том и только том сдучае, если они изучают французский язык? [Отв.: 38.] [Указание. Нарисуйте диаграмму Венна в виде трех кругов, обозна¬ чающих множества студентов, изучающих соответственно французский, немецкий и испанский языки. В каждую из восьми областей впишите Данные, используя приведенные цифры. Начните с конца списка и двигай¬ тесь к началу.] 6 Зак. 609,
82 Гл. II. Множества и подмножества 9. При более позднем обследовании 100 студентов (см. упр. 8) были найдены следующие данные о числе студентов, изучающих различные иностранные языки: только немецкий 18; немецкий, но не испанский 23; немецкий и французский 8; немецкий 26; французский 48; французский и испанский 8; никакого языка 24. (a) Сколько студентов изучают испанский язык? [Отв.: 18] (b) Сколько студентов изучают немецкий и испанский языки, но не фран¬ цузский? [Отв.: Ни одного.] (c) Сколько студентов изучают французский язык, в том и только том случае, если они не изучают испанский? [Отв.: 50.] 10. В отчете об обследовании 100 студентов (см. упр. 8) сообщалось, что ко¬ личество студентов, изучающих различные языки, таково: все три языка 5; немецкий и испанский 10; французский и испанский 8; немецкий и фран¬ цузский 20!; испанский 30; немецкий 23; французский 50. Инспектор, пред¬ ставивший этот отчет, был уволен. Почему? И. Произведенным недавно обследованием 100 студентов Дартмутского колледжа получены данные о девушках, с которыми они знакомы. Эти данные приведены в таблице фиг. 51. Красивая и умная Некрасивая и умная Красивая и глупая Некрасивая и глупая Блондинка 6 9 10 20 Брюнетка 7 11 15 9 Рыжая 2 3 8 0 Фиг. 51 Пусть БЛ — блондинки, БР — брюнетки, РЖ — рыжие, КР — красивые, ГЛ— глупые. Определите, сколько человек содержит каждый из следую* щих классов: (a) БЛПКРПГЛ; (b) БР; (c) РЖП ГЛ; (d) (БРЦРЖ)П(КРЦГЛ); (e) БЛи(КРПГЛ). 12. В условиях упр. 11 определите для каждой из следующих пар множеств, какое множество содержит больше лиц (в качестве элементов множества): [Отв.: 10.] [Отв.: 46.] (a) (БЛиБР) или РЖ; (b) ГЛ П КР или Б Л — (ГЛ ПКР); (c) О или РЖПКРПГЛ.
§ 3. Множества и составные высказывания 83 § 3. СООТНОШЕНИЕ МЕЖДУ МНОЖЕСТВАМИ И СОСТАВНЫМИ ВЫСКАЗЫВАНИЯМИ В предыдущих разделах читатель несколько раз мог заме¬ тить, что существует тесная связь между множествами, с одной стороны, и высказываниями — с другой, а также между опера¬ циями над множествами, с одной стороны, и операциями обра¬ зования составных высказываний — с другой. В настоящем раз¬ деле мы эти связи формализуем. Если рассматривается несколько высказываний, то имеется естественный способ сопоставления с каждым из этих высказы¬ ваний некоторого множества. Сначала мы образуем множество всех логических возможностей для рассматриваемых высказы¬ ваний и называем его универсальным множеством. Затем каж¬ дому высказыванию мы ставим в соответствие подмножество тех логических возможностей универсального множества, для которых это высказывание истинно. Эта идея столь важна, что она бесспорно заслуживает и формального определения. Определение. Пусть р, q, г,... означают некоторые вы¬ сказывания и пусть U — их множество логических возможно¬ стей. Пусть Р, Q, Р, .. . означают подмножества И, для которых истинны соответственно.высказывания р, q, г, ... . Тогда Р, Q, R, ... называются множествами истинности высказываний р, q, г, ... . Если р и q — высказывания, то р V q и р Л q — также вы¬ сказывания, и, следовательно, они должны иметь множества истинности. Чтобы найти множество истинности высказывания р V q, заметим, что это высказывание истинно, когда истинно р или истинно q (или оба). Таким образом, высказыванию pV Я мы должны поставить в соответствие те логические возмож¬ ности, которые лежат в Р или в Q (или в них обоих); иначе го¬ воря, мы должны поставить в соответствие р V q множество P\}Q. С другой стороны, высказывание pAq истинно, только когда истинно и р, и q, так что высказыванию р Л q мы должны поставить в соответствие множество Р П Q. Итак, мы видим, что существует тесная связь между логи¬ ческой операцией дизъюнкции и операцией объединения мно¬ жеств, а также между конъюнкцией и пересечением. Вниматель¬ ный анализ определений объединения и пересечения показывает, что в определении объединения встречается слово «или», а в определении пересечения встречается слово «и». Поэтому не уди¬ вительно, что между этими двумя теориями имеется связь. Ввиду того что в определении дополнения множества встре¬ чается связка «не», не удивительно, что множеством истинности Для будет Р, Это вытекает из того, что —р истинно тогда, 6*
84 Гл. II. Множества и подмножества когда р ложно, так что множество истинности для ~р содержит те логические возможности, для которых р ложно, т. е. множеством истинности для ~р будет Р. Множества истинности двух предложений р и q показаны на фиг. 52. На диаграмме отмечены также различные логические возможности для этих двух высказываний. Читатель отыщет на этой диаграмме множества ис¬ тинности высказываний р V q> />Л<7,. ~ри~q. Связь между высказыва¬ нием и его множеством истин¬ ности создает возможность «пе¬ ревода» любой задачи, отно¬ сящейся к составным высказы¬ ваниям, в задачу теории мно¬ жеств. Возможно также и обратное: если поставлена ка¬ кая-то задача, касающаяся множеств, то универсальное множество можно себе пред¬ ставлять как некоторое множе¬ ство логических возможностей, подмножества которого являются множествами истинности некоторых высказываний. Следова¬ тельно, задачу, относящуюся к множествам, можно также «пе¬ ревести» на язык составных вы¬ сказываний. До сих пор нами изучались лишь такие множества истин¬ ности составных высказываний, которые образованы посредством связок V, Л и Все осталь¬ ные связки можно определить через эти три основные и тем самым вывести, какие множества истинности им соответствуют. На¬ пример, мы знаем, что р—><7 эк¬ вивалентно ~p\Jq (см. фиг. 34 гл. I). Поэтому множество ис¬ тинности для р -> q будет тем же, что и множество истин¬ ности для ~p\Jq, т. е. оно будет иметь вид PllQ. Соответствующая диаграмма Венна изображена на фиг. 53; здесь заштрихованная область означает множество истинности этого высказывания. Отметим, что незаштрихованная область на фиг. 53 изображает множество Р—Q = P[\Q, представляющее Оба ложны Фиг. 52
§ 3. Множества и составные высказывания 85 собой множество истинности высказывания р Д—q. Поэтму заштрихованная область будет множеством (Я—Q)=^f|Q. кото¬ рое является множеством истинности высказывания—(ЯЛ~<7)- Таким образом, мы установили, что (p->q)> (—РУФ и ~(РЛ ~ q) эквивалентны. Вообще, два высказывания эквива¬ лентны тогда и только тогда, когда они имеют одни и- те же множества истинности. Мы также видим, что диаграммы Венна помогают обнаруживать отношения между высказываниями. Предположим теперь, что р— логически истинное высказы¬ вание. Что представляет собой его множество истинности? По¬ скольку р логически истинно тогда и только тогда, когда оно истинно в каждом логически возможном случае, множеством истинности р должно быть U. Подобным же образом, если р логи¬ чески ложно, то оно ложно в каждом логически возможном случае, и поэтому его множеством истинности будет пустое множество О. Рассмотрим, наконец, отношение следствия. Напоминаем, что из р следует q тогда и только тогда, когда импликация р ~^>q логически истинна. Но высказывание р—> q тогда и только тогда логически истинно, когда его множество истинности совпадает с U, т. е. (Р—Q) = Uу или (Р — Q) = О. Из фиг. 49 мы видим, что если Р — Q пусто, то Q включает в себя Р. Отношение вклю¬ чения мы будем обозначать следующим символом: «Р есть под¬ множество Q» записывается как Р с Q. Таким образом, p->q логически истинно тогда и только тогда, когда Р a Q. Подведем краткий итог. Каждому высказыванию соответ¬ ствует его множество истинности. Каждой логической связке соответствует операция над множествами. Каждому отношению между высказываниями соответствует отношение между множе¬ ствами истинности. Множествами истинности высказываний РУ q, Р /\q, ~Р и р -> <7 служат Р U Q, Р П Q, Р и Р— Q. Вы¬ сказывание р логически истинно, если P = U, и логически ложно, если Р = О. Высказывания р и q эквивалентны тогда и только тогда, когда Р = Q; из р следует q тогда и только тогда, когда Рс Q. Пример 1. Докажем, пользуясь диаграммой Венна, что высказывание [pV(~/*V<?)] логически истинно. Этому высказыванию соответствует множество [PU(^UQ)1; от¬ вечающая ему диаграмма Венна изображена на фиг. 54. Множество Р заштриховано на этой фигуре вертикальными черточками, а множество P\jQ — горизонтальными. Вся заштрихованная область является их объединением и сов¬ падает с множеством U, так что наше составное высказы¬ вание логически истинно.
86 Гл. II. Множества и подмножества Пример 2. Докажем, пользуясь диаграммой Венна, что Р V (q Л г) эквивалентно (р V я) Л (р V г). Множество ис¬ тинности высказывания р V (ЯЛг) совпадает со всей заштрихован¬ ной областью на фиг. 55, а мно¬ жество истинности высказывания (р V Я) Л {р V г) совпадает с дважды заштрихованной обла¬ стью на фиг. 56. Так как эти мно¬ жества совпадают, то мы видим, что наши два высказывания экви¬ валентны. Пример 3. Покажем, пользу¬ ясь диаграммой Венна, что из я следует p-+q. Множество истинности высказывания р-+Я совпадает с заштрихованной областью на фиг. 53. Фиг. 54 Ф и г. 55 Ф и г. 56 Так как эта заштрихованная область включает в себя множество Q, то мы видим, что из я следует р~>Я- Упражнения Замечание. В упр. 1, 2 и 3 сначала найдите множество истинности каждого высказывания. 1. Воспользовавшись диаграммой Венна, определите, какие из следующих высказываний логически истинны или логически ложны: (a) p\J~p\ (b) рА~р\ (c) p\Z(~pAq); (d) /?-*(? ->Р)\ (e) РЛ~ (?->/>)• [Отв.: (а) и (d) логически истинны; (Ь) и (е) логически ложны.]
§ 3. Множества и составные высказывания 87 2. Воспользовавшись диаграммой Венна, определите, какие из следующие высказываний эквивалентны: (a) p\/~q-, (b) ~(рЛ?); (c) ^(qA^p); (d) p^>~q; (e) ~psj~q. [Отв.: (а) и (с) эквивалентны; (b)', (d) и (е) эквивалентны.] 3. Воспользовавшись диаграммой Венна, определите, какие из выписанных ниже пар высказываний состоят из высказываний, одно из которых яв¬ ляется следствием другого; (a) р\ рА q\ (b) pA~q; ~p->~q; (c) q->p; (d) pAq; pA~q. 4. Два высказывания называются несовместимыми, если они не могут быть истинными оба сразу. Придумайте систему вопросов, положительные или отрицательные ответы на которые определяют, являются данные два вы¬ сказывания несовместимыми или нет. 5. Три или более высказывания называются несовместимыми, если они не мо¬ гут быть истинными все сразу. Что можно сказать о множествах истин¬ ности таких высказываний? 6. Для следующих трех составных высказываний (а) введите буквенные обо¬ значения для компонент, (Ь) дайте символическое выражение, (с) най¬ дите множества истинности и (d) проверьте их совместимость. Если этот курс интересен, то я буду упорно над ним работать. Если этот курс не интересен, то я получу по нему плохую отметку. Я не буду упорно работать, но получу по этому курсу хорошую от¬ метку. [Отв.: Несовместимы.] Замечание. В упр. 7—9 каждому множеству поставьте в соответ¬ ствие высказывание, имеющее это множество своим множеством истинности. 7. Воспользовавшись таблицами истинности, определите, какие из следующих множеств пусты: (a) (PUQ)fi(PUQ); (b) (ЯП0)П(<?ПЛ); (С) (PflQ) — Р\ (d) (PUP)n(PUQ). [Отв.: (Ь) и (с).] 8. Воспользовавшись таблицами истинности, определите, являются ли попар¬ но различными следующие множества: (a) Pfl(QUP); (b) (P-Q)U(Q-P); (c) (PUQ)fl(PUQ); (d) (PflQ)U(PnP); (e) (Р Г) Q Л Р) U П Q П Р) U (Р П Q П Р) U (Р П Q П Р)-
88 Гл. II. Множества и подмножества 9. Воспользовавшись таблицами истинности, определите, в каких из следую¬ щих пар множеств одно из множеств является подмножеством другого: (a) Р; Pf]Q; (b)ЯП<?; ОПЯ; (c) P — Q; Q — Р; (d) PfiQ; -PUQ- 10. Докажите как с помощью таблиц истинности, так и с помощью диаграмм Венна, что высказывание р Д (q V О эквивалентно высказыванию (Р А я) V (р Л О- 11. В § 2 были построены различные подмножества множества 36 логических исходов математической олимпиады. Постройте высказывания, для кото¬ рых эти подмножества являются множествами истинности. 12. Постройте множества истинности следующих высказываний: (a) А решил первым все задачи; [Отв.: В1.] (b) А и В решили по две задачи; (c) С решил две задачи; [Отв.: В15, В18, В21, В24, В27, ВЗО, В31, В32, В34, В35.] (d) С решил все задачи. § 4*. АБСТРАКТНЫЕ ЗАКОНЫ ОПЕРАЦИЙ НАД МНОЖЕСТВАМИ Введенные нами операции над множествами подчинены не¬ которым очень простым абстрактным законам, которые будут перечислены в этом разделе. Эти законы могут быть доказаны либо с помощью диаграмм Венна, либо путем их перевода в высказывания и проверки с помощью таблиц истинности. Приводимые ниже абстрактные законы очень напоминают элементарные законы алгебры, хорошо известные каждому. Это сходство можно еще усилить, заменив U на + и П на X. По этой причине говорят, что множество, его подмножества и законы сочетания подмножеств образуют алгебраическую си¬ стему, называемую булевой алгеброй — по имени английского математика Джорджа Буля, который впервые изучил эти си¬ стемы с алгебраической точки зрения. Любая другая система, подчиняющаяся этим законам, например система составных вы¬ сказываний, изученная в гл. I, также называется булевой ал¬ геброй. Любую из этих систем можно изучать или с алгебраиче¬ ской, или с логической точки зрения. Ниже перечислены основные законы, действующие в булевых алгебрах. Доказательство этих законов переносится в упраж¬ нения.
§ 4 *. Абстрактные законы операций над множествами Законы для объединения и пересечения. А1. АиЛ = А. А2. А П А = А. АЗ. А()В = ВиА. А4. AftB = В Г\А. А5. Л U (5 U С) = (А и В) U С. А6. Л П П С) = {А п В) П С. А7. Л П (В U С) = (Л П 5) U (Л П С). А8. A U (# П С) = (A U £) П (A U С)- А9. Л U U = U. А10. Апб>=6>. АП. А П ^ = А. А12. Л U <5 = Л. Законы для дополнений. В1. 1 = А. В2. АиЛ = ^. ВЗ. Л П Л = 0. В4- (Ли В') = АпВ. В5. (М\В)= А\}В. В6. й=о. Законы для разностей множеств. С1. Л— В = А[\В. С2. и—А = А. сз. л — и = о. С4. А — 0 = А. С5. О — А = 0. Сб. А — А = 0. С7. (А-В)- С = А —(В U С). С8. Л - (В - С) = (А - В) U (А П С). С9. Л U (5 — С) = (Л U 5) — (С — Л). сю. Ап (5 — С) = (Л П 5) —(Л ПС). Упражнения Ь Проверьте законы группы А1—А12 с помощью диаграмм Венна. «Переведите» все A-законы в законы для составных высказываний. Про¬ верьте их с помощью таблиц истинности,
90 Гл. II. Множества и подмножества 3. Проверьте законы групп В и С с помощью диаграмм Венна. 4. «Переведите» В- и С-законы в законы для составных высказываний. Проверьте их с помощью таблиц истинности. 5. Из 28 основных законов получите следующие результаты: (a) Л = (ЛП5)и(ЛПД); (b) ^US = (»nB)UC4nS)LMnS); (c) ЛП(Л1|В) = Л (d) ли(1пВ) = Л11£. 6. Из А- и В-законов и из С1 получите С2 — Сб. 7. Воспользовавшись А1—А12 и С2—СЮ, получите В1, В2, ВЗ и В6. § 5. ПРЕДИКАТЫ Высказывания, в которых одно или несколько переменных являются свободными (т. е. заранее не уточняются), назы¬ ваются предикатами. В дальнейшем мы будем рассматривать только такие предикаты, в которых свободным является лишь одно переменное, которое мы будем обозначать через х. С предикатами очень часто приходится сталкиваться в ал¬ гебре. Типичный пример доставляет, скажем, уравнение х2 — Зх + 2 = 0. Свободное переменное х может принимать здесь любое числовое значение. Для некоторых чисел х (а именно, х = 1 и х = 2) утверждение, содержащееся в этом уравнении, истинно; в остальных случаях оно ложно. В подобных случаях, когда истинность или ложность предиката зависит только от значения, принимаемого свободным переменным х, множество всех допустимых значений х можно рассматривать как множе¬ ство логических возможностей U, а множество всех значений этого переменного, при которых наше высказывание истинно, — как его множество истинности. В приведенном выше примере множество U состоит из всех вещественных чисел (или из всех целых чисел, или из всех целых чисел, не превосходящих по абсолютной величине 1 ООО ООО, — в зависимости от того, в какой области мы ищем решение нашего уравнения), а множеством истинности является множество {1, 2}. В результате введения понятия множеств истинности для предикатов мы сможем распространить на них ранее получен¬ ные результаты. Например, нам известно, что множество истин¬ ности конъюнкции двух высказываний есть пересечение мно¬ жеств истинности каждого из них. Решить уравнение — это зна¬ чит найти один элемент (или все элементы) его множества истинности. При решении же системы двух уравнений у нас практически имеется предикат, представляющий собой конъюнк¬
§ 5. Предикаты 91 цию двух уравнений. Поэтому мы ищем элементы пересечения двух множеств истинности. Если это пересечение пусто, то си¬ стема уравнений не имеет решений: Такие уравнения назы¬ ваются несовместными, поскольку их множества истинности не имеют общих элементов х. Пример 1. Решить систему уравнений х2 — Зх + 2 = 0 и х2=\. За U примем множество всех действительных чисел1). Мы уже видели, что множество истинности первого уравне¬ ния — это множество (1, 2}. Множество истинности второго уравнения есть {1,— 1). Пересечением этих двух множеств является множество {1}, содержащее только один элемент. Поэтому система уравнений имеет единственное решение. Пример 2. Пусть И есть множество всех жителей Со¬ единенных Штатов Америки. Рассмотрим предикаты р: «х выше 1 м 60 см», q\ «х больше 30 лет от роду», и г: «х моложе 10 лет». Множества истинности Р, Q, R суть множества жителей США — выше 1 м 60 см, старше 30 лет и моложе 10 лет. Множеством истинности р Л q является Р П Q, т. е. множество всех лиц выше 1 м 60 см и старше 30 лет. Поскольку не существует людей, которые удовле¬ творяли бы первому и третьему условиям одновременно, множество истинности для р Д г пусто. Поэтому высказы¬ вания р и г оказываются несовместимыми. Понятие множества истинности удобно не только в вопросах, связанных с решением уравнений, но и при рассмотрении не¬ равенств. Если U состоит из всех вещественных чисел, то мно¬ жество истинности неравенства х <0 состоит из всех отрица¬ тельных вещественных чисел. Множество же истинности нера¬ венства х > —3 состоит из всех вещественных чисел, больших чем —3. Если мы потребуем теперь, чтобы оба эти неравенства выполнялись одновременно, то в качестве множества истинности нового высказывания мы получим пересечение двух исходных множеств истинности, содержащее все числа, лежащие между ■—3 и 0. Пример 3. Пусть снова U есть множество всех веще- ственных чисел. Рассмотрим два предиката р: Xs —х = 0 и q: х2 < г/4. !) Если стремиться к тому, чтобы во всех случаях не выходить за рамки конечных множеств, то можно, разумеется, и здесь ограничиться, скажем, целыми решениями уравнений, не слишком большими по модулю; например, такими, что \х\ < 1010. Так как, однако, условие конечности рассматривав¬ ши множеств здесь и в других случаях не является существенным, то оно Иногда будет игнорироваться*
92 Гл. II. Множества и подмножества Соответствующими множествами истинности являются Р = {—1, 0, 1}, множество Q, содержащее все числа, лежащие между —*/2 и +7г- Поскольку Pf|Q = {0), то оба условия вместе определяют единственное число 0. Понятие множества истинности предиката позволяет выяс¬ нить, чем разнятся между собой уравнения и тождества. Когда мы предлагаем кому-либо решить уравнение, мы тем самым просим его найти один из элементов множества истинности этого уравнения или все такие элементы (это уже отмечалось ранее). Если же мы утверждаем, что (х—1) (л*+1) тожде¬ ственно равно х2—1 (в математике это записывается так: (х — 1) (х + 1) = х'2—1), то тем самым мы утверждаем, что это уравнение справедливо для всех х. Таким образом, тожде¬ ство представляет собой уравнение, множество истинности кото¬ рого совпадает с универсальным множеством 21\ оно является примером логически истинного высказывания. Теперь полезно будет проследить за правильным и непра¬ вильным методами решения кубического уравнения, фигурирую¬ щего в примере 3. Сначала решим его правильно. Пусть дано х3 — х = 0, тогда (1) х(х — 1)(х4- 1) = 0, (2) х = 0, или х— 1=0, ИЛИ Х-\- 1 = (3) х = 0, или х=\ или х = —1, (4) * = 0, или 1, или —1. На первом этапе исходное уравнение приводится к эквивалент¬ ной ему форме. Такая операция правомощна, поскольку экви¬ валентные высказывания имеют одинаковые множества истин¬ ности. На втором этапе мы записали исходное уравнение в виде дизъюнкции трех уравнений. Это возможно потому, что произве¬ дение равно нулю тогда и только тогда, когда один из множи¬ телей равен нулю. Так как мы знаем, что указанная дизъюнкция эквивалентна исходному уравнению, мы и на этом этапе не изменили множества истинности. На третьем этапе мы перепи¬ сываем каждое из трех уравнений в эквивалентной ему форме. Наконец, мы замечаем, что множество истинности для дизъюнк¬ ции есть объединение множеств истинности каждого высказы¬ вания. Из (3) ясно, что множество истинности для каждого из трех уравнений состоит из единственного элемента, так что
§ 5. Предикаты 93 в конце концов мы получ.аем, что множество истинности исход¬ ного уравнения содержит три элемента. Рассмотрим теперь неправильный путь решения. Пусть дано хг— х = 0, тогда, сократив на я, получим (5) х2—1 = 0, (6) *2=1, отсюда (7) х=\. Нам удалось найти один элемент множества истинности исход¬ ного уравнения, но мы не получили всех его элементов. Это объясняется тем, что дважды, .при переходе к уравнениям (5) и (7), мы получали новые уравнения, не эквивалентные пред¬ шествующим. Совершенно справедливо, что из (5) следует ис¬ ходное уравнение, но оно не эквивалентно исходному. Это зна¬ чит, что множество истинности уравнения (5) меньше, чем мно¬ жество истинности исходного уравнения. Для каждого х, удо¬ влетворяющего уравнению (5), удовлетворяется и исходное уравнение, но обратное несправедливо для а: = 0. (Вспомним, что мы можем умножать обе части уравнения на 0, но не можем делить на 0.) Таким образом, мы «потеряли» элемент 0 нашего множества истинности. ; Точно так же справедливо, что если х=А, то обязательно и х2 = 1; поэтому из (7) следует (6). Но обратное несправед¬ ливо, поскольку множество истинности уравнения (7) меньше множества истинности уравнения (6). В самом деле, на этом этапе мы потеряли один элемент нашего множества истин¬ ности — элемент х = — 1. При решении уравнений для того, чтобы быть уверенным б правильности решения, имеет смысл на каждом этапе пере¬ ходить от заданного уравнения к эквивалентному. Это обеспе¬ чивает нам неизменность исходного множества истинности. Если:. Же мы перейдем к уравнению, из которого следует исходное, но которое не эквивалентно ему, то тем самым мы сократим чцело элементов множества истинности исходного уравнения. В то же время, если мы перейдем к уравнению, которое яв¬ ляется следствием исходного, но не эквивалентно ему, то мы Увеличим число элементов множества истинности. В первом случае мы «теряем некоторые корни уравнения», а во втором — «получаем посторонние корни».
94 Гл. II. Множества и подмножества Упражнения 1. Пусть И есть множество всех вещественных чисел. Постройте множество истинности для каждого из следующих предикатов: (a) х2 — 4 = 0; [Отв.: Множество истинности {2,—2}.] (b) jc2 —4 = 0; [Отв.: Множество ист. О-] (c) л:2 — 4jc -f- 3 = 0; (d) х2 — 4л: 4 = 0; (e) х2 — 4х + 5 = 0. 2. Что происходит с множеством истинности уравнения, обе части которого умножаются на k, если (a) £^=0? (b) k = 0? 3. Что происходит с множеством истинности неравенства, х2 < 2х — 1, если обе его стороны умножить на k, где (a) £>0? (b) k=£07 (c) & < 0? 4. Найдите множество истинности конъюнкции следующих предикатов (U есть множество всех действительных чисел): (a) х2 х — 2 = 0, х2 = 4; [Отв.: {—2}.] (b) х2 — 4 = 0, х2 — 4л: -j- 4 = 0; (c) х3 + 6х2 + 1U — 6 = 0, х2 — 4л: -|- 3 = 0; [Отв.: {1,3}.] (d) л:3 = 1, л2 — 4* +4 = 0. 5. Найдите множества истинности конъюнкций следующих пар неравенств (U есть множество всех целых чисел): (a) лс >3, л:< 10; [Отв.: {3, 4, 5, 6, 7, 8, 9, 10}.] (b) лс2<4, л — 1 > 1; (c) л; <0, х2 — 2х <; 0. 6. Пусть V. есть множество всех действительных чисел х, таких, что 0 х < 2п. Найдите множество истинности для каждого из следующих тригономе¬ трических уравнений (a) sin х = cos х; [Отв:. }.} (b) sin х = sin 2х; (С) tg*=l; (d) sin л: = 3 + sin х; (e) sin2 х = I — cos2 лр.
§ 6. Функции 95 7. Исследуйте следующие аргументы: Дано х = 5; тогда х2 = 25, х2 — 5х = 25 — 5х, х(х — 5) = — 5 (х — 5); отсюда х = — 5 и 5 = — 5. 8. Исследуйте следующие аргументы: Необходимо решить х— 1 = 0. Прибавим к каждой части по —1: х — 2 = —1. Возведем в квадрат: х2 — 4х + 4 = 1. Вычтем 1: л:2 — 4х + 3 = 0. Разделим на х— 1: х — 3 = 0. Прибавим 3: х = 3. 9. Приведите пример внутренне противоречивого предиката (такого, что его множество истинности пусто). 10. Докажите, что если из системы уравнений можно получить противоречие, то эта система не имеет решений. 11. Докажите, что если система уравнений не имеет решений, то из конъ¬ юнкции уравнений этой системы следует любое уравнение. 12. Используйте результаты упражнений 10 и 11 для того, чтобы показать, что система уравнений не имеет решений тогда и только гогда, когда из нее можно вывести равенство 1 = 0. 13. Для следующих двух уравнений покажите, (а) что у них нет общих ре¬ шений и (Ь) что из них можно вывести 1 = 0: 2х + 1 = 0; Зх + 2 = 0. 14. Используйте метод упр. 10, для того чтобы показать, что уравнения х2 — Зх + 1 = 0 и 2*2 — 6х + 1 = 0 не имеют общих решений. 15. Используйте метод упр. 10, для того чтобы показать, что неравенства 1 и х2 + 2х + 1 < 3 несовместны. § 6. ФУНКЦИИ Правило, по которому каждому элементу данного множеств:, ставится в соответствие некоторый объект, называется функ¬ цией. Понятия функции и множества лежат в основании всех Разделов математики. Рассмотрим понятие функции в более конкретной форме. Пусть дано множество D, которое называется областью опреде¬ ления функции, и правило /, которое каждому элементу мно¬ жества D ставит в соответствие некоторый объект. (Функции Мы всегда будем обозначать буквами, набранными жирным ^Рифтом.) Тогда f называется функцией, определенной на мно¬ жестве D. Если х — любой элемент из D, то мы будем обозначать
96 Гл. II. Множества и подмножества объект, поставленный в соответствие ху через /(*), и называть его значением функции / в точке х. Этот объект может ока¬ заться, вообще говоря, в свою очередь элементом множества D, но так будет не всегда. Может случиться, что каждый объект, поставленный в соответствие определенному элементу множе¬ ства D, будет отличаться от всех остальных значений функции, либо что все значения функции будут одними и теми же, либо что имеет место промежуточный случай. Множество R всех объектов/(х), которые ставятся в соответствие элементам мно¬ жества D, называется областью изменения /. Все эти понятия проиллюстрированы на фиг. 57. Пример 1. Пусть D есть множество людей, скажем, мно¬ жество жителей, проживающих в настоящее время в США. Через / (х) обозначим возраст лг, округленный до ближай¬ шего целого числа лет. Область изменения f представляет собой множество целых чисел, начиная с 0, и наверное включающее все целые числа вплоть до 100 и даже не¬ сколько чисел, больших 100. Пример 2. Пусть опять элементами D являются все жи¬ тели США и пусть/(х) есть имя жителя х. Тогда область значений этой функции есть множество, состоящее из очень большого (но, разумеется, конечного!) числа различных имен. Пример 3. Пусть D есть множество всех взрослых жите¬ лей штата Нью-Йорк и пусть f (х) есть рост жителя х, вы¬ раженный в дюймах. Тогда область изменения / состоит из действительных чисел, заключенных, надо думать, ме¬ жду 30 и 100, что позволит учесть рост как карликов, так и великанов 1). Пример 4. Пусть D = {0, 1, 2, 3, 4), далее положим, /(0) = 2, /(1) — 2, /(2) = 17, / (3) = 0, /(4) = 17. 0 30 дюймов — это (с большой степенью точности) 75 см, 100 дюймов — 2,5 м.
§ 6. Функции 97 Тогда область R изменения / состоит из трех элементов {О, 2, 17} (см. фиг. 58). Пример 5. Пусть D есть множество всех действительных чисел и пусть/ (х) = х2— 3. Область изменения этой функ¬ ции также есть множество действительных чисел, но на этот раз уже не множество всех действительных чисел (см. упр. 1). Пример 6. Пусть D — любое множество и пусть f {х) = х для любого * из D. Тогда область R изменения функции совпадает с ее областью определения D. Такая функция называется тождественной функцией, определенной на мно¬ жестве D. Пример 7. Пусть D — любое множество и пусть я*)-* для любого а: из D; здесь а есть некоторый определенный объект. Тогда область R изменения функции / состоит всего из одного элемента {а}. В этом случае функция / называется постоянной на множестве D. Эти несколько примеров должны показать, сколь разно¬ образными могут быть функции, их области определения и об¬ ласти изменения их значений. Область определения функции может быть конечным множеством, как в примерах 1—4, или бесконечным множеством, как в примере 5. Функцию можно описать словами, как в примерах 1—3, или выписать в явном виде все ее значения, как в примере 4, или задать с помощью какой-то формулы, как в примере 5. [Конечно, выписать все значения функции можно только в том случае, если D конечно, а практически это возможно только в том случае, когда число элементов D к тому же и не слишком велико.] Область изменения функции R может совпадать с областью определения D, как в примере 6, либо быть подмножеством множества D, как в примере 5, или пересекаться с D, как в при- Мере 4; R может также содержать элементы совершенно другой •7 Зак 609
98 Гл. II. Множества и подмножества природы, чем D, как в примерах 1—3. Область R может содер¬ жать такое же число элементов, как и D (именно так будет обстоять дело, например, для тождественных функций), либо меньшее число элементов, как в примерах 1—4. Может даже оказаться, что множество D бесконечно, а множество R — ко¬ нечно, например R содержит единственный элемент (если функ¬ ция постоянна). Однако R не может содержать больше элемен¬ тов, чем D, так как каждому элементу из D отвечает по крайней мере один элемент из R. Короче говоря, и D и R могут быть вполне произвольными множествами. Единственное ограничение, которое наклады¬ вается на них, заключается в том, что У* должно ставить в соот¬ ветствие каждому элементу D единственный элемент R и что при этом должен быть использован каждый элемент R. Теперь мы можем определить понятие равенства двух функ- ц ий. Определение. Функции / и g называются равными (что записывается, как f=g)> если их области определения совпа¬ дают и если для каждого элемента х из D совпадают элементы fix) и g(x). Естественно, что равные функции имеют одинаковые области изменения (см. упр. 2). Равные функции должны рассматри¬ ваться, как «одна и та же функция». Так, например, х2 — 1 и (х—1) (х+1) есть два выражения для одной и той же функции. В качестве более сложного примера заметим, что на мно¬ жестве D = (0, 1} функции, описываемые выражениями х2 + 1 и 2х2 — х + 1, равны. Конечно, если изменить область определе¬ ния указанных выше функций, то они могут оказаться уже не равными. Однако это не может нас интересовать, поскольку мы рассматриваем функции, определенные на указанном мно¬ жестве D. Пример 8. Пусть D — произвольное множество, А — под¬ множество D. Определим функцию / следующим образом: / (х) = 1, если х принадлежит А\ f (х) =0, если х принад¬ лежит А. Такая функция называется характеристической функцией подмножества А. Областью изменения характе¬ ристической функции обычно является множество {0, 1} (см. упр. 3—6). Эту функцию можно использовать для описания подмножества А. Если/ —любая функция, определенная на множестве D, а а — элемент области ее изменения, то / (х) = а является пре¬ дикатом с множеством D в качестве множества логических воз¬ можностей. Множество истинности такого высказывания состоит из всех элементов D, которым / ставит в соответствие объект а.
§ 6. Функции Подобные множества истинности играют основную роль в теории вероятностей. Например, если D состоит из всевозможных ре¬ зультатов эксперимента, то множество истинности для f{x) = а представляет собой множество всевозможных экспериментов, в результате которых была получена величина а. Для того чтобы подсчитать вероятность того, что в результате экспери¬ мента мы получим именно это значение а, мы обязательно должны знать, каково соответствующее множество истинности. (Ср. ниже гл. IV.) Используя понятие множества истинности, мы можем лучше уяснить себе смысл понятия равенства двух функций. Пусть / И g — две функции, определенные на одном и том же мно¬ жестве D. Предикат f(x) = g(x) имеет определенное множество истинности, состоящее из точек х, для которых эти две функции имеют одинаковое значение. Естественно, что это множество истинности может оказаться и пустым, если эти две функции не имеют совпадающих значений в одинаковых точках. Однако мо¬ жет оказаться, что множество истинности рассматриваемого предиката совпадает с Z), и в этом случае мы говорим, что f=g. Другими словами, две функции называются равными, если f(x) = g(x) оказывается тождеством, или если это выска¬ зывание логически истинно, или если множество истинности этого высказывания совпадает со всей областью определения функций /и g. В § 3 мы строили множества истинности для высказываний, не являющихся предикатами. Однако в каждом подобном слу¬ чае легко найти простой метод построения эквивалентного пре¬ диката, т. е. предиката с тем же множеством истинности. По¬ этому при желании мы всегда можем рассматривать множество истинности как нечто связанное с понятием предиката. Мы мо¬ жем даже ограничиться использованием предикатов вида f(x) = a. Пример 9. В задаче о сравнении результатов трех участников математической олимпиады, которой мы зани¬ мались в § 1, рассмотрим множество истинности высказы¬ вания «А первым решил логическую задачу». При желании мы можем определить функцию f на множестве из 36 ве¬ роятных исходов, значением которой в каждом случае ока¬ жется фамилия участника состязания, решившего первым рассматриваемую задачу. Тогда высказывание «А решил логическую задачу» эквивалентно высказыванию «f(x) = = А», и, следовательно, интересующее нас множество ис¬ тинности можно рассматривать, как множество истинности этого предиката, 7*
100 Гл. II. Множества и подмножества Метод, использованный в этом примере, в большинстве слу¬ чаев приводит к цели. Однако существует другой, более простой, хотя и менее естественный метод, который позволяет решить задачу наверняка. Пусть р— любое высказывание, определен¬ ное на множестве логических возможностей U9 f—характери¬ стическая функция его множества истинности. Тогда f (х) = 1, если р истинно в случае х,/и (х) = 0, если р в этом случае лож¬ но. Такая функция также называется характеристической функ¬ цией высказывания р. Совершенно очевидно, что высказыва¬ ние р эквивалентно предикату «f(x) = 1». 1. Найдите область изменения функции, рассмотренной в примере 5. 2. Выведите из определения равенства двух функций доказательство совпа¬ дения областей изменения этих функций. 3. В примере 8 утверждалось, что область значений характеристической функ¬ ции подмножества А «вообще говоря» состоит из двух элементов. Какие два подмножества А являются исключением из этого правила? 4. Пусть А и В — два подмножества D, / и g— их характеристические функ¬ ции. Пусть далее h (х) для каждого х из D есть меньшее из двух чисел / (-*) и g (х)• Докажите, что h есть характеристическая функция множе¬ ства А П В. 5. Как построить характеристическую функцию множества А\]В, зная харак¬ теристические функции множеств А и В (ср. с упр. 4)? 6. Как построить характеристическую функцию множества А, зная характе¬ ристическую функцию множества А (ср. с упр. 4)? 7. Пусть множество D состоит из всех жителей США. Какие из следующих «величин» можно считать функциями (с областью определения D): 8. Для функций из упр. 7, определенных на множестве Д найдите области их изменения. 9. Опишите какую-либо функцию с областью определения D и с областью изменения R, где (b) D есть множество всех целых чисел, a R есть множество всех нечет¬ ных чисел; (c) D есть множество всех целых чисел, a R = {0, 1, 2}; (d) D есть множество всех действительных чисел, a R = {5}. Упражнения (a) f(x) — отец х; (b) f(x) — сын х; (c) /(х) —дедушка х; (d) f(x) — дедушка х со стороны матери; (e) f(x) — старшая дочь х. [Отв.: Функция.] [Отв.: Не функция.] (a) D = {1,2,3}, a R = {3,5};
§ 7. Числовые функции 101 10. Пусть / определяется таблицами, изображенными на фиг. 59—61. Ука¬ жите для каждого случая область определения и область изменения функции /. /и- а b а а а fix) 5 2 1 3 4 X . /(*) а ! b 0 с * d : * е ! Ф и г. 59 Ф и г. 60 Фиг. 61 11. Определите непустое множество D, на котором функции / (л:) = 2л:2—1 и g(x) = 1 — Зл: равны. Постройте другую область Dв которой они не равны. 12. Пусть D — произвольное множество,/—определенная на D тождествен¬ ная функция, a g—постоянная функция, единственным значением кото¬ рой является элемент d области D. Каково множество истинности преди¬ ката f(x) = g (х)? 13. Пусть / и ^—постоянные функции, определенные на D. Докажите, что множество истинности предиката / (х) = g (х) есть либо D, либо О. 14. В примере об участниках математической олимпиады из § 1 D есть мно¬ жество 36 возможных исходов, а / определяет число задач, которые ре¬ шил С. Каково множество истинности предиката f(x) = 2? 15. Мы подбрасываем монету дважды. Пусть 2/ = {ГГ, ГЦ, ЦГ, ЦЦ}, где Г и Ц означают выпадение (в первом и во втором случаях) герба или цифры. Постройте два различных предиката, эквивалентных высказыва¬ нию «Оба раза выпадает герб». § 7. ЧИСЛОВЫЕ ФУНКЦИИ Особое значение имеют специальные функции, область изме¬ нения значений которых состоит из чисел. Такие функции назы¬ ваются числовыми функциями. Во многих случаях не так уже важно точно знать, что представляет собой область изменения Функции, однако весьма ценной является информация о совпа¬ дении этой области с некоторым подмножеством множества всех чисел; поэтому о подобных функциях кратко говорят, что это суть числовые функции, определенные на каком-либо мно¬ жестве D. .При этом множество D вовсе не обязательно должно быть множеством чисел. Для числовых функций, определенных на одном и том же множестве, можно ввести операции сложения и умножения.
102 Гл. 11. Множества и подмножества Если /и g- суть числовые функции на множестве D, то суммой h=f+g этих функций мы назовем функцию Л, удовлетворяю¬ щую равенству h (х) =f(x)-\-g(x) при любом х из D. [По¬ скольку /(*) и g( х) — числа, то все значения суммы функций могут быть определены.] Таким образом, сумма функций опре¬ деляется как функция, значения которой равны сумме значений слагаемых. Аналогичным же образом можно ввести и операцию умножения функций: произведение k=fg функций / и g опре¬ деляется как функция, удовлетворяющая равенству k(x) = =/(•*) ё (*) ПРИ любом х из D. Пример 1. Пусть D есть множество {а, b, с, d} и пусть значения функций / и g* собраны во втором и третьем столбцах изображенной на фиг. 62 таблицы. Тогда значе¬ ния суммы h и произведения к функций / и g совпадают с теми, которые приведены на той же таблице. X /,jr. g'.X) h 'X) k (X) а 1 2 3 2 Ь 2 0 2 0 с V 2 4 9/2 2 d 5 _2 3 — 10 Ф и г. 62 Пример 2. Пусть D есть множество вещественных чисел. Пусть f(x) = х2, a g есть постоянная функция, всегда рав¬ ная 3, g’=:3. Тогда сумма h этих функций определяется выражением А(л;) = л;2 + 3, а их произведение k—выраже¬ нием к{х) = Зх2. Для числовых функций обычно широко используют и другие операции. Так, например, через /2 обозначают произведение функции/на себя, т. е. //= через 3/— произведение постоян¬ ной функции со значением 3 на функцию /; через—/ обозна¬ чают функцию, значения которой для любого л: из D равны —/ (х). Точно так же мы можем ввести операции/—g,f!g и т. д. Если / и g заданы с помощью формул того типа, которые используются в элементарной алгебре, то формулы результата определенных операций над этими функциями можно получить, выполнив эти же операции над соответствующими формулами. Пример 3. Пусть f(x) = x — 3 и g (х) = х2 — 2х + 5, где за область определения этих функций принято мно¬ жество всех действительных чисел. Тогда / + g = л2 —
§ 7. Числовые функции 103 — x-j-2; произведение fg = [х — 3) (х2 — 2х -+- 5) или про¬ ще fg = хъ — ох2 -|- 1 1л:— 15; разность g—f= х2 — Зх-\- 8, г, х — 3 . х х2 — 2х 4- 5 а частные f,g=-^-— и g/f = х_3 ■ Из самого определения частного двух функций следует, что в этом случае нужно принять определенные меры предосторож¬ ности. Значение этой функции определено только тогда, когда знаменатель не обращается в нуль. Поэтому, если в некоторых точках знаменатель f функции g/f обращается в ‘0, то в этих точках функция g/f не определена. В связи с этим очень часто в качестве области определения функции g/f выбирается не вся область D, а только ее подмножество, для которого f(x) Ф0. Так в примере 3 функция g/f определена на множестве всех действительных чисел, за исключением числа 3. С другой сто¬ роны, f/g определена на множестве всех действительных чисел, так как на этом множестве х2—2х + 5 не может обратиться в нуль. Если исходные функции заданы с помощью таблиц, т. е. прямым указанием всех значений функции, то, вычисляя после¬ довательно значения новой функции для каждого х, мы легко определим любую комбинацию исходных функций. X til • X i n X) P X) а —3 —37 4 b 2 6 0 с -15/2 -637/2 32 d 9 55 7s Ф и г. 63 Пример 4. Пусть функции / и определяются первым и вторым столбцами изображенной на фиг. 62 таблицы. Тогда функции т = f— 2g, n = Zf— 5g3 и p — g2/f опре¬ деляются таблицей, изображенной на фиг. 63. Упражнения Пусть / и g—характеристические функции двух подмножеств D. Дока¬ жите, что fg есть характеристическая функция пересечения этих под- множеств. • Пусть/ — характеристическая функция подмножества А множества D, а 7 постоянная функция, определенная на D и равная единице. Дока-
104 Гл. II. Множества и подмножества жите, что j—/ есть характеристическая функция подмножества А. Какое подмножество имеет своей характеристической функцией функцию У? 3. Проверьте значения функций, указанные на фиг. 63. 4. Пусть / и g определяются из таблиц, при¬ веденных на фиг. 64. Составьте таблицы для следующих функ¬ ций: X /00 ffUо а 1 5 b 0 —1 с —2 3 Фиг. 64 (а )/+*; (b) ft. (c) f—g; (d) fig; (e) f2—fg [Отв.: 6, —1, —5.] [Отв.: 1/5, 0, 2/3.] 5. Пусть D = {0, 1}. Для приведенных ниже пар функций определите, равны эти функции или нет: (a) f(x) = x и g(x) = x2; (b)f(x) = 2x+l и g (х) = 2х3 + 1; (с )f(x) = x и g(x) = — х\ (d)/(x) = l и g(x) = 2x2 — x+\. § 8* БАЗИС ПРОСТРАНСТВА ЛОГИЧЕСКИХ ВОЗМОЖНОСТЕЙ Пусть fi, f2, ..fn— функции; определенные на множе¬ стве U, и пусть х — любая точка этого множества. Тогда зна¬ чения функций /г1(х) = а1, /2(А:) = а2, (*) = ап однознач¬ ным образом определяются выбором х. Теперь мы хотим узнать, является ли х единственной точкой множества, в которой ука¬ занные функции принимают эти значения. Если это так, то мы можем утверждать, что и х также однозначно определяется зна¬ чениями указанных функций. Если набор функций обладает тем свойством, что их значения однозначно определяют каждый элемент множества, то мы говорим, что эти функции описы¬ вают U. Пусть в нашем распоряжении имеется серия из п опытов. Естественно избрать пространством логических возможностей множество возможных последовательностей исходов этих опы¬ тов, которое графически можно изобразить в виде дерева. Опре¬ делим теперь п функций исходов > fn как функции, областью определения которых является множество всевозмож¬ ных путей на дереве исходов и таких, что функция ft опреде¬ ляет исход /-го эксперимента. Функцию ft можно также рас¬ сматривать как определенный ярлык, приписываемый /-й ветви каждого пути на дереве. Совокупность п функций исходов опи¬ сывает пространство логических возможностей.
§ 8 *. Базис пространства логических возможностей 105 Пример 1. Вернемся вновь к примеру, составляющему содержание фиг. 27, из §'6 гл. I (ср. фиг. 27 с фиг. 65). Здесь пространство логических возможностей, как пока¬ зано на фиг. 65, состоит из = 1 или 2 в зависимости Фиг. > возможностей. Пусть f\ (х) = от того, какая из урн была f,(x) fp(X) ?з(я) 1 Ч Ч / ч Б 1 . 6 Ч 2 ч 6 2 Б ч 2 Б б 65 выбрана, и пусть /2(х) и /3(х) определяют цвет вынутого 1-го шара и 2-го шара. Тогда, как легко видеть.на фиг. 65, эти три функции исхо- Ф и г. 66 f,(x) Г Г Г Г Г Г ц и и и ц и Гг(х) да полностью определяют пространство логических возможностей. Дерево для этого примера изображе¬ но на той же фиг. 65. Пример 2. Пусть мы подкидываем монету и бросаем игральную кость. Эту операцию можно рас¬ сматривать как последо¬ вательность двух экспери¬ ментов, где областями воз¬ можных значений функ¬ ций исходов /l и /2 соот¬ ветственно являются Rj = = {Г, Ц} и /?2 = {1, 2, 3, 4, 5, 6). В пространстве логических возможностей имеется 12 точек, торых однозначно описывается значениями дов. Дерево для этого примера изображено на фиг. 66 Если последовательность функций описывает пространство логических возможностей, то мы знаем, что каждая точка этого пРостранства U описывается определенной комбинацией значе- / 2 Ъ 4 5 6 / 5 4 5 6 каждая из ко- функций исхо-
106 Гл. II. Множества и подмножества ний этих функций. Однако, вообще говоря, отсюда еще не сле¬ дует, что любая комбинация значений этих функций описывает некоторую точку из U. Так в примере 1 комбинация f\{x) = \, /2 (х) = Б и/3(х) = Б не может нам встретиться. И действи¬ тельно, если бы были возможны любые комбинации значений функций, то U содержало бы 2 X 2 X 2 — .8 элементов, вместо 6. С другой стороны, в примере 2 возможной является любая ком¬ бинация значений функций исходов. Определение. Если fu /2. , fn — функции, опреде¬ ленные на заданном множестве U, и если каждая комбинация значений этих функций является возможной, то мы говорим, что функции fxjfz’ - > fn логически независимы. Если эти функ¬ ции логически независимы и, кроме того, описывают простран¬ ство U, то мы говорим, что они образуют базис простран¬ ства U. Для последовательности опытов функции исхода описывают пространство логических возможностей, но, вообще говоря, не являются логически независимыми. Утверждать, что эти функ¬ ции логически независимы — значит утверждать, что исход лю¬ бого подмножества возможных исходов никак не ограничивает множество исходов оставшихся опытов в противоположность тому, что имело место в приведенном выше примере 1. Напро тив, функции исхода в примере 2 логически независимы, и, сле¬ довательно, образуют базис пространства U. Пример 3. Пусть р и q — два независимых высказыва¬ ния. За пространство логических возможностей мы прини¬ маем в этом случае множество из четырех точек, описываю¬ щих различные возможные случаи в таблице истинности: {ИИ, ИЛ, ЛИ и ЛЛ}. Пусть f и f2—характеристиче¬ ские функции этих двух высказываний р и q, т. е. такие функции, которые принимают значение 1, если высказы¬ вание истинно, и 0, если оно ложно. Элементы простран¬ ства U и значения этих функций приведены в таблице на фиг. 67. Из этой таблицы легко видеть, что характеристи¬ ческие функции описывают пространство логических воз¬ можностей. Кроме того, мы можем заметить, что возмож¬ ными оказываются все четыре комбинации значений этих функций, и, следовательно, эти функции логически незави¬ симы и образуют базис пространства. Если бы исходные высказывания не были независимыми, то по крайней мере один из случаев оказался неосуществимым; следовательно, характеристические функции не были бы логически неза¬ висимыми. Таким образом, мы видим, что понятие логи¬ ческой независимости функций является обобщением по¬ нятия независимости высказываний.
§ 8 *. Базис пространства логических возможностей 107 На фиг. 67 приведены еще значения функции /3—ха¬ рактеристической функции составного высказывания р Л q. Очевидно, что пара функций fx и /3 так же, как и пара функций /2 и /3, не является базисом пространства U, так р <1 /. /? /* и и 1 1 1 и л 1 0 0 л и 0 1 0 л л 0 0 0 Фиг. 67 как ни одна из этих пар не описывает пространства логи¬ ческих возможностей. Пример 4. Пусть fX9 /2, - .-,/7— функции исхода встреч между командами Доджерс и Янки в первенстве США по бейсболу (см. пример 3 на стр. 44). Тогда об¬ ласть возможных значений для каждой из первых четырех функций исхода есть {Д, Я}, где буквой обозначено назва¬ ние выигравшей команды. Однако область возможных значений последних трех функций несколько шире, а имен¬ но она имеет вид {Д, Я, Н}, где буква Н означает, что игра не была сыграна. Пространство логических возможностей для такой ситуации описывается деревом, приведенным на фиг.-28 (стр. 45), в которое надо внести следующие из¬ менения: те пути, которые содержат меньше семи ветвей, надо дополнить добавлением ветвей с ярлыком Н, до тех лор пока все пути не будут иметь ровно семь ветвей. Легко видеть, что функции исхода описывают простран¬ ство логических возможностей, но не образуют его базис. На самом деле, если бы они могли служить базисом этого пространства, то в данной ситуации было 2 X 2 X 2 X 2 X X 3 X 3 X 3 = 432 возможных исходов вместо имеющихся в действительности 70. Если нас интересует сейчас только исход первых трех игр, то в качестве пространства логи¬ ческих возможностей мы можем использовать дерево, по¬ строенное для первых трех этапов с 8-ю возможными пу¬ тями. Поскольку первые три функции для такого ограни¬ ченного пространства логических возможностей логически независимы, то они образуют базис этого нового простран¬ ства. Если нам нужно построить функцию g, которая
108 Гл. П. Множества и подмножества определяет число побед команды Доджерс в первых трех играх, то нас удовлетворит и это более простое про¬ странство. Теперь может возникнуть вопрос о том, существует ли ба¬ зис для любого пространства логических возможностей. Легко показать, что по крайней мере один такой базис наверное су¬ ществует. Действительно, если /—тождественная функция, за¬ данная на множестве U, то функция /, взятая сама по себе, об¬ разует базис пространства U (см. упр. 6). Базис, состоящий из одной функции, мы будем называть тривиальным базисом пространства логических возможностей U. Второй интересный вопрос заключается в том, можно ли дополнить базис некоторой функцией с тем, чтобы расши¬ ренная система функций по-прежнему являлась базисом. Если функции /, /2, fn образуют базис U, то любая комбина¬ ция значений этих функций достигается в одной и только в од¬ ной точке U. Предположим теперь, что к этому базису мы до¬ бавили еще одну какую-то функцию g\ Пусть f1(x) = a1,... • • *» fn(x) = ап есть какая-то комбинация значений функций, до¬ стигаемая в единственной точке л;. Если g{x) = b, то Ь есть единственное значение g, которое может встретиться в комби-' нации с заданными значениями исходных п функций. Поэтому, если функция g на множестве U принимает еще какое-нибудь значение, то она не является логически независимой от первых п функций. С другой стороны, если это постоянная функция, то мы построили новый более широкий базис. Таким образом, мы можем дополнить базис сколь угодно большим числом по¬ стоянных функций, но не можем добавить к нему ни одной функции, отличной от постоянной. Обычно предполагается, что базис не содержит постоянных функций, так как эти функции являются избыточными, и их всегда можно исключить; при этом условии данный базис никак не может быть расширен. Поскольку мы отметили, что тождественная функция сама по себе образует базис пространства U, то возникает вопрос, какие еще функции обладают тем же свойством. Если / есть функция, определенная на множестве U, и если она сама по себе образует базис этого пространства, то она должна описы¬ вать его и должна быть логически независимой от всех осталь¬ ных функций базиса (последнее условие в данном случае яв¬ ляется тривиальным). Для того чтобы/ описывала простран¬ ство U, необходимо, чтобы / принимала различные значения в различных точках 21. Функция, которая не принимает никакого значения дважды, называется взаимно однозначной, поскольку она взаимно однозначным образом связывает каждый элемент области определения с каждым элементом области значений
§ 8 *. Базис пространства логических возможностей 109 функции. Любая взаимно однозначная функция образует три¬ виальный базис пространства. Пример 5. Пусть U есть множество всех студентов данного высшего учебного заведения и пусть f(x) номер студенческого удостоверения студента х. Тогда f есть вза¬ имно однозначная функция, и следовательно, она образует базис этого множества. Это позволяет различать студен¬ тов, указывая номера их студенческих удостоверений. Упражнения 1. Подбрасывается монета, а затем случайным образом выбирается одно из чисел от 1 до 4. Опишите множество логических возможностей У и две функции исхода. Покажите, что функции исхода образуют базис. 2. Подбрасывается монета. Если выпадает герб, то подбрасывается другая монета; если же выпадает цифра, то бросается игральная кость. Для этой ситуации постройте дерево. Опишите У с помощью двух функций исхода (по одной на каждый опыт). Покажите, что функции исхода не : образуют базиса. 3. Пусть /j и/2— характеристические функции независимых высказываний р и q. Чему равны характеристические функции следующих высказы¬ ваний; (a) РА4; (b) PVq; (c) 4. Пусть р и q—;два таких высказывания, что из р следует q. Образуют ли базис характеристические функции этих высказываний? 5. Докажите, что если /i, /2 и /3 образуют базис пространства И и если области их значений содержат соответственно пи п2 и п3 элементов, то У содержит п\ X п2 X п3 элементов. Что можно сказать по этому же поводу, если указанные функции описывают У, но не являются логиче¬ ски независимыми? 6. Пусть У—произвольное множество и пусть/—тождественная функция, определенная на этом множестве. Докажите, что функция / сама по себе образует базис У. 7. Пусть У содержит 7 элементов. Докажите, что если нельзя использовать постоянные функции, то любой базис пространства должен быть триви¬ альным. (Указание: см. упр. 5.). 8. Рассмотрим функции, определенные в примере 4. Какое из множеств ука¬ занных ниже функций является логически независимым?. (a) flt /2; [Отв.: Независимы.] (b) /„Л./з.Л; (c) Л» /г»'Уз* /4» [Отв.: Не независимы.] (d) /4, /5; (e) U U 9- Рассмотрим следующую последовательность из двух опытов. Сначала слу¬ чайным образом выбирается целое число в пределах от 1 до 5. Если это число равно п, то затем также случайным образом выбирается другое число в пределах от 1 до п. Постройте для этой последовательности
110 Гл. II. Множества и подмножества дерево и для каждого пути на нем определите значения функций / и где / определяет сумму двух выбранных чисел, a g— их разность. Опи¬ сывают ли эти функции дерево? Образуют ли они его базис? 10. Для функции / из упр. 9 докажите, что ни один базис не может содер¬ жать ее. 11 Множество функций называется разделяющим две точки х и у, если в этом множестве содержится такая функция/, для которой /(у). Дока¬ жите, что множество функций разделяет любую пару точек пространства И в том и только том случае, когда это множество описывает U. 12. Бросаем три раза игральную кость. В качестве пространства логических возможностей берется 216 возможных последовательностей исходов. Пусть f\y /2, /з — три функции исхода. Какие из нижеследующих мно¬ жеств функций (a) /,. f2, U (b) /, +/2. /, /,; (c) /i> f\ "Ь/г» f\ “Ь/г “Ь/з*> (d) /1 +/2» /1 +/з» /2 +/з описывают пространство? Какие из них образуют базис? [Отв.: все они описывают пространство; только функции (а) обра¬ зуют базис.] § 9*. КВАНТОРЫ Высказывание, в котором утверждается, что множеством истинности предиката является все множество U, называется универсальным. Примерами универсальных высказываний мо¬ гут служить тождества или утверждения о равенстве двух функций. Столь же важную роль играют и высказывания дру¬ гого типа, в которых утверждается, что множество истинности некоторого предиката не пусто. Такое высказывание называется экзистенциальным. Универсальное высказывание может иметь следующую форму: «Для всех х из U ...», а экзистенциальное высказывание — следующий вид: «По крайней мере для од¬ ного х из U...» Выражения «Для всех х из U ...» и «По крайней мере для одного х из...» могут служить примерами кванторов. В сочета¬ ние с предикатом (с одной свободной переменной) квантор образует новое высказывание, не зависящее от значения сво¬ бодного переменного предиката. Высказывание «Для всех х из U имеем f (х) = 0» либо истинно, либо ложно в зависимости от того, как определено множество U и функция /(*), но не зави¬ сит от выбора х. Приведем еще несколько примеров кванторов: «Ровно для трех х из U ...» и «Не более чем для десяти к из U...». Рассмотрим теперь отрицание экзистенциального высказыва¬ ния. Рассмотрим высказывание «по крайней мере для одного х из 26 имеет место равенство /М = ЙЧ-*)». Отрицание этого вы-
§ 9 * Кванторы 111 оказывания состоит в том, что U не содержит такого элемента х, который обладал бы этим свойством. Это эквивалентно выска¬ зыванию «/(х)Фё(х) для любого а: из U». Таким образом, от¬ рицание экзистенциального высказывания есть некоторое уни¬ версальное высказывание. И вообще, пусть р(х)—некоторый предикат и Р — его множество истинности. Тогда соответствую¬ щее экзистенциальное высказывание «По крайней мере для од¬ ного х из U, р(х)» утверждает, что РфО. Отсюда отрицание этого высказывания утверждает, что Р = 0. Множество истин¬ ности высказывания —р(х) есть Р. Отрицание экзистенциаль¬ ного высказывания предполагает, что P = U, т. е. что «Для лю¬ бого х из U, ~р(х]». Аналогичным же образом отрицанием универсального выска¬ зывания оказывается экзистенциальное высказывание. Высказы¬ вание «Для любого х из U, р(х)» предполагает, что P — U. По¬ этому его отрицание равносильно утверждению, что Рфи и, следовательно, РфО. Отсюда следует, что это отрицание экви¬ валентно высказыванию «По крайней мере для одного х из И. ~ р(х)». Например, утверждать, что /Фё значит утверждать, что по крайней мере для одного х мы имеем f(x) Ф g(x). Пример 1. В теории чисел, исследующей свойства це¬ лых чисел, очень легко найти простые примеры экзистен¬ циальных и универсальных высказываний. Прежде всего введем понятие простого числа. Целое число называется простым, если оно больше 1 и делится без остатка только на два числа, а именно на 1 и на самое себя. 2, 3, 5, 7, 11 являются примерами простых чисел. Исследуя простые числа, меньшие 100, мы можем прийти к выводу, что любое множество из 10 последова¬ тельных чисел содержит по крайней мере одно простое число. Для большей определенности обозначим через и множество всевозможных комбинаций, содержащих 10 по¬ следовательных целых чисел. Множество U, безусловно, является бесконечным. Тогда наше предположение выгля¬ дит следующим образом: для каждого X из U последова¬ тельность X содержит простое число. Так как это выска¬ зывание является универсальным, то любой пример последовательности X, не содержащей простого числа, опровергает его. Таким опровергающим примером яв¬ ляется, например, последовательность целых чисел от 114 до 123 включительно, не содержащая простых чисел. Рассмотрим также знаменитое еще не доказанное (но и не опровергнутое) универсальное высказывание, извест¬ ное под названием проблемы Гольдбаха. Пусть множество
112 Гл. II. Множества и подмножества логических возможностей состоит из всех четных целых чи¬ сел >-4. Проблема Гольдбаха заключается в том, что пред¬ полагается, что для любого х из U число х можно пред¬ ставить в виде суммы двух простых чисел. В то же время Л. Г. Шнирельман уже довольно давно доказал следующее универсальное высказывание, предста¬ вляющее собой первый шаг на пути решения проблемы Гольдбаха: пусть множество, логических возможностей U для х то же, что и раньше; тогда для любого х из U число х можно представить в виде суммы менее чем 300 ООО про¬ стых чисел *). Приведем, наконец, пример экзистенциального высказы¬ вания, истинность которого читатель легко докажет само¬ стоятельно. Пусть множество логических возможностей U состоит из всех простых чисел. Тогда по крайней мере для одного х из U число 2х — 1 не является простым (см. упр. 7). Рассмотрим теперь методы доказательства и опровержения истинности универсальных высказываний. Доказать истинность экзистенциального высказывания гораздо проще, чем истинность универсального высказывания. В действительности, для того что¬ бы доказать истинность высказывания «По крайней мере для одного х, р(х)», необходимо только указать единственное значе¬ ние х, обладающее указанным свойством. Другими словами, до¬ казательство истинности экзистенциального высказывания, как правило, состоит в построении соответствующего примера. Отри¬ цание универсального высказывания есть экзистенциальное вы¬ сказывание, и, следовательно, оно тоже может быть доказано с помощью единственного примера. Такой опровергающий при¬ мер доказывает, что универсальное высказывание общности лож¬ но. Таким образом, для того чтобы доказать, что высказывание «для любого х из U, р(х)» ложно, необходимо только найти единственное х из U, не обладающее указанным свойством. На¬ пример, утверждение «Все простые числа нечетны» опровергается указанием не нечетного простого числа — числа 2. Пример 2. В математике очень часто один математик выдвигает гипотезу, а другой опровергает ее, построив противоречащий пример. Например, выдающийся теоре- тико-числовик П. Ферма выдвинул гипотезу о том, что для любого целого х число 22х + 1 есть простое число. Но *) Л. Г. Шнирельман получил свой результат в 1930 г. В настоящее время его методом удалось доказать, что каждое четное число может быть представлено в виде суммы не более чем 20 простых чисел. Другим мето¬ дом И. М. Виноградов доказал, что каждое четное число, большее некото¬ рого (весьма большого!) числа N, можно представить в виде суммы не более чем 4 простых чисел.
§ 9 * Кванторы 113 Эйлер позднее показал, что при х = 5 это выражение не дает простого числа. Если множество U бесконечно, то доказать истинность уни¬ версального высказывания, перебирая различные значения х, ра¬ зумеется, нельзя. Необходим более мощный метод доказательства. Таким методом является, например, метод математической ин¬ дукции. Однако иногда истинность универсального высказыва¬ ния можно доказать и косвенным путем. Пусть, например, нам нужно доказать истинность высказывания «Для любого х, р(х)». Предположим истинность отрицания этого высказывания: «По крайней мере для одного х, ~ р(х)». После этого достаточно рассмотреть объект, удовлетворяющий этому условию и пока¬ зать, что существование такого объекта ведет к противоречию. Пример 3. Докажем этим методом истинность высказы¬ вания «Любое простое число большее двух — нечетно». Предположим, что это высказывание ложно. Тогда суще¬ ствует по крайней мере одно целое число я, которое яв¬ ляется одновременно простым и четным. Но если оно четно, то оно делится на два. По предположению п Ф 2, а, следовательно, п не может быть простым, что и приво¬ дит нас к противоречию. Упражнения 1. Постройте отрицание каждого из следующих высказываний: (a) Для любого х из 2/, х2 > 4. [Отв.: по крайней мере для одного х из 2/, х2 <; 4.] (b) Для любого х из 2/, х-\-\ = х3 — 2. (c) По крайней мере для одного х из U, х2 — 2х -f- 1 = 0. (d) По крайней мере для одного х из 2/, 1 < х < 2. 2. Пусть И есть множество всех жителей США. Укажите, какие из нижесле¬ дующих высказываний являются универсальными, а какие экзистенциаль¬ ными, и постройте их отрицания (как можно более простого вида). (a) Все люди смертны. [Отв.: некоторые люди бессмертны.] (b) Некоторые люди — дети. (c) Все мужчины выше 5 футов. (d) Некоторые мужчины не ниже 7 футов или не выше 4 футов. 3. Сформулируйте отрицание тождества в виде экзистенциального высказы¬ вания. Как может это помочь опровергнуть определенное тождество? 4- Методом упр. 3 опровергните каждое из предполагаемых тождеств (здесь ^ — множество всех действительных чисел): (a) Vx2=x; (b) sin х -\- cos х = 1; (c) ах + Ьх = (а + Ъ)х. 8 Зак. 609,
114 Гл. II. Множества и подмножества 5. Пусть U — множество всех действительных чисел. Покажите, что каждое из приведенных ниже высказываний справедливо, по крайней мере для одного значения х, но не справедливо для любого х из 2/: (a) х2 > х; (b) (* + 1)3 = *3 + 1; (c) sin х =— cos х. 6. Докажите, что если универсальное высказывание истинно в данном мно¬ жестве логических возможностей, то - оно истинно и в любом подмноже¬ стве этого множества. Покажите, что в то же. время это не всегда спра¬ ведливо для экзистенциальных высказываний. 7. Покажите, что 2Р— 1 простое число, если р = 2, 3, 5, 7, но не при р = 11. § 10. ДВОИЧНЫЕ ЧИСЛОВЫЕ СИСТЕМЫ В десятичной системе счисления любое число может быть записано посредством всего лишь десяти цифр: 0, 1,2, 3, 4, 5, 6, 7, 8, 9. Могут быть построены и другие числовые системы, ис¬ пользующие большее или меньшее число цифр. По-видимому, простейшей числовой системой является двоичная числовая си¬ стема, использующая только две цифры 0 и 1. Мы рассмотрим все возможные способы построения числовых систем, использующих только две эти цифры. Основными арифметическими операциями являются сложение и умножение. Чтобы овладеть какой- либо арифметической системой, на¬ до уметь складывать и умножать любые две цифры. Так, для понимания десятичной системы надо изучить таблицу сложения и таблицу умножения, содержащие по сто элементов (от 0 + 0 = 0 до 9 + 9= 18 соответственно от 0*0 = 0 до 9*9 = 81). Для понимания двоичной системы надо изучить таблицы сложения и умножения, содержащие всего лишь по четыре элемента. Эти таблицы изображены на фиг. 68. Изображенная здесь таблица умножения полностью опреде¬ ляется двумя известными правилами, согласно которым умно¬ жение любого числа на нуль дает нуль, а умножение любого числа на единицу оставляет его без изменения. Для сложения у нас имеется только правило, согласно которому прибавление нуля к любому числу не меняет этого числа. Этого правила достаточно для заполнения всех мест изображенной на фиг. 68 таблицы сложения, кроме одного. Нам еще остается решить, чему должна равняться сумма 1 + 1. Каковы возможные пути заполнения пустого места в таб¬ лице сложения? Однозначных чисел имеется только два: 0 и 1, + 0 / 0 0 / 1 1 ? Ф и г. • 0 I 0 0 0 1 0 / 68
§ 10. Двоичные числовые системы 115 л каждое из них приводит к интересной системе. Если обра¬ титься к возможным двузначным числам, то мы видим, что 00 и 01 не отличаются соответственно от 0 и 1 и потому не даюг ничего нового. Число 11 или любое другое большее число ввело бы в таблицу «скачок», так что в качестве единственной воз¬ можности остается 10. Таблицы сложения в этих трех различ¬ ных числовых системах показаны на фиг. 69; таблица умноже¬ ния для всех систем та же, что и на фиг. 68. Каждая из этих систем представляет значительный интерес, как покажут даль¬ нейшие интерпретации. Целое положительное число может быть либо четным, либо нечетным. Условимся называть его числом рода 0 в первом случае и числом рода 1 во втором случае. Рассмотрение таб¬ лицы, изображенной на фиг. 69, а вместе с таблицей умноже¬ ния, убеждает нас в том, что первая из наших числовых си¬ стем может служить для определения рода суммы или произ¬ ведения двух целых положительных чисел в зависимости ог 0 1 ♦ 0 1 + о / 0 0 1 0 0 1 0 0 I 1 1 0 / / I / / to аде Фиг. 69 рода каждого числа. Так, 0*1=0 говорит нам, что умножение четного числа на нечетное число дает четное число, тогда как 1 + 1=0 показывает, что сложение двух нечетных чисел дает четное число, и т. д. Таким образом, первая числовая система совпадает с той системой, которая получается из арифметики Целых положительных чисел, если мы будем принимать во вни¬ мание только четность или нечетность чисел; она называется арифметикой вычетов по модулю два. Вторая система счисления, таблица сложения которой изо¬ бражена на фиг. 69, б, интерпретируется на языке множеств. Пусть О соответствует пустому множеству, а 1 соответствует универсальному множеству U. Пусть сложение чисел соответ¬ ствует объединению множеств, а умножение чисел соответствует пересечению множеств. Тогда 0*1=0 говорит о том, что б'П U~09 а 1 + 1 = 1, что U\} 21 = 21. Интерпретация в терми¬ нах множеств других арифметических действий, возможных в Этой числовой системе, предоставляется читателю. Эта арифме¬ 8*
116 Га. II. Множества и подмножества тическая система представляет собой простейший пример ал¬ гебры Буля (см. § 4 этой главы). Наконец, третья числовая система, таблица сложения ко¬ торой изображена на фиг. 69, в, представляет собой так назы¬ ваемую двоичную систему счисления. Каждое обычное целое число может быть записано в виде двоичного целого числа. При этом двоичный 0 соответствует обычному нулю, а двоич¬ ная 1—обычной единице. Двоичное число 10 означает «еди¬ ницу более высокого порядка» и соответствует обычному числу два (не десяти!). Двоичное число 100 означает тогда два, взя¬ тое дважды, т. е. четыре. Вообще, если двоичное число запи¬ сано в виде bnbn _ 1 . . . b2blb(), где каждая цифра есть либо 0, ли¬ бо 1, то соответствующее обычное целое число / определяется по формуле I = Ьп • 2 -\-Ьп_х - 2 + ... -f- b2 • 2 -\- Ьх • 2 -(- Ь0. Таким образом, двоичному числу 11001 соответствует 24 + 25 + -+-1 = 16 + 8+1= 25. В изображенной из фиг. 70 таблице указаны некоторые двоичные числа и их («десятичные») экви валенты. Двоичное число 1 10 11 100 101 110 111 1000 1001 1010 1011 1 100 10 000 100 000: ! Целое число 1 2 3 4 5 6 7 8 9 10 11 12 16 32 | 1 Фиг. 70 Двоичная система обозначений позволяет значительно упро¬ стить процедуру выполнения арифметических операций. Для того чтобы выполнять сложение, достаточно пользоваться только двумя правилами: прибавление 0 к числу не изменяет этого числа и 1 + 1 = 10. Используем эти правила для того, чтобы вычислить сумму десяти и одиннадцати (см. таблицу, изобра¬ женную на фиг. 70): 10 10 10 11 10 10 1 Характер выполненных операций очевиден, если помнить, что ] + 1 = 10, и следовательно, мы должны перенести на один
§10. Двоичные числовые системы 117 разряд единицы из второго и четвертого столбца. В результате получим 1 • 24 + 0-25+1 . 22 -h 0 • 21 -h 1 -2° = 21. Умножение в двоичной системе оказывается даже еще более простым. Здесь, как и в десятичной системе счисления, мы умно¬ жаем последовательно на каждый разряд, а результаты склады¬ ваем между собой. При этом мы пользуемся двумя чрезвычайно простыми правилами: произведение числа на 0 есть 0, а про¬ изведение числа на 1 есть само это число. Умножим, например, 5X5. Так как двоичным эквивалентом числа 5 служит число 101, то умножение производится следующим образом: 101 101 101 ООО 101 11001 « В ответе получилось двоичное число 11001, которое, как мы ви¬ дели выше, эквивалентно числу 25. Вот несколько более сложный пример: возведем в квадрат число 10 (см. таблицу, изображенную на фиг. 70): 1010 1010 0000 1010 0000 1010 1100100 В результате получаем 1 • 26 + 1 • 25 + 1 • 22 = 100. Такое упрощение арифметических операций при использо вании двоичной системы привело к тому, что эта система ши¬ роко применяется в современных быстродействующих электрон¬ ных вычислительных машинах. В этих машинах каждый разряд моделируется электронной лампой (или другим аналогичным
118 Г л. II. Множества и подмножества электронным устройством) и считается, что двоичное число в этом разряде равно 1, если через лампу течет ток, и равно О, если ток не идет. Арифметические операции, описанные выше, выполняются простейшими электрическими цепями. Упражнения 1. Завершите интерпретации таблиц сложения и умножения для систем счис¬ ления, представляющих: (а) четность или нечетность, (Ь) множества U и О- 2. (а) Укажите двоичные числа, которые соответствуют числам 11; 20; 52; 75; 80; 128; 144; 200. [Отв.: 1010000 соответствует 80.] (Ь) Укажите числа, которые соответствуют двоичным числам 1111, 1000000, 1010101, 11011011. [Отв.: 1010101 соответствует 85.] 3. Используя результаты упр. 2, выполните в двоичной системе следующие операции сложения. Проверьте полученные результаты. (a) 20 + 80; (b) 75 + 80; (c) 128+ 128; (d) 128 + 200; (e) 80 + 200. 4. Используя результаты упр. 2, выполните в двоичной системе следующие операции умножения. Проверьте полученные результаты (a) 20 X20; (b) 20X 80; (c) 128 X 128. 5. Используя результаты упр. 2, выполните в двоичной системе операцию вычитания 200—128. 6. Как определить, является ли четным или нечетным число, записанное по двоичной системе счисления? 7. Какие из приведенных ниже законов действуют в каждой из рассмотрен¬ ных в этом параграфе трех числовых систем? (a) х + у = у + х. (b) х + х = х. (c) X X + X = X. 8. Условимся понимать под «суммой» а + 6 наибольшее из чисел а и Ь, а под «произведением» а • Ъ — наименьшее из них. Напишите таблицы «сложе¬ ния» и «умножения» для чисел а и Ь. Сравните результат с тремя выше приведенными системами. [Отв.: Те же таблицы, что и в случае И, О-системы.] 9. Чго говорят о второй рассмотренной нами числовой системе законы А1—А10 из § 4 этой главы? 10. Первую из рассмотренных нами числовых систем можно представлять себе как систему, в которой производятся действия с остатками от деления
§ 10. Двоичные числовые системы 119 целых чисел на 2. Для четного числа такой остаток равен 0, для нечет¬ ного 1. Постройте таблицы сложения и умножения для остатков от деле¬ ния целых чисел на 3. [Указание. Это. будет 3 X 3-таблицы.] 11. Мы хотим занумеровать все подмножества четырехэлементного множе¬ ства У.. С этой целью построим для каждого такого подмножества двоич¬ ное число, определенное следующим образом: расположим в определен¬ ном порядке элементы данного множества; пусть первой цифрой кон¬ струируемого числа будет 1 в том и .только том случае, если первый эле¬ мент множества V принадлежит рассматриваемому подмножеству; второй цифрой числа будет 1 в том и только том случае, если второй элемент U содержится в этом подмножестве, и т. д. Докажите, что при этом ка¬ ждому подмножеству отвечает единственное двоичное число, заключенное между 0 и 15. .12. Используйте метод упр. 11 для того, чтобы перенумеровать-все подмно¬ жества множества У — {а, Ь, с}. 13. Используйте метод упр. 11 для того, чтобы доказать, что число собствен¬ ных и' несобственных подмножеств множества из п элементов равно 2п. 14. В тесте многократного выбора ’) ответы занумерованы числами 1, 2, 4 и 8. Студентам сказали, что среди этих ответов правильными могут быть один или более и может вообще не быть правильных ответов. Студен¬ тов попросили складывать номера правильных ответов или писать О, если никакой ответ не является правильным. (a) Используя результаты упр. И показать, что результат такого сло¬ жения дает преподавателю всю информацию, какая ему требуется. (b) Для данного вопроса правильная сумма равна 7. Три студента ука¬ зали соответственно числа 4, 8 и 15. Какой ответ наиболее близок к истине? Какой ответ хуже всех? [Отв.: 15 — наилучший, 8 — наихудший.] 15. Объясните смысл числа 2907, записанного в обычной десятичной системе счисления по аналогии с формулой для числа /, записанного в двоичной системе счисления. 16. В троичной системе счисления числа изображаются цифрами 0, 1 и 2, так что, например, 201 в этой системе означает 2 • З2 + 0 • 3 + 1*1 = .19. (a) За.пишите в троичной системе все целые числа от 1 до 30. (b) Постройте таблицу сложения и умножения для цифр 0, 1 и 2. (c) Выполните в этой системе умножение 5-5. Проверьте полученный ответ. 17. Представьте числа 80 и 200 в системе счисления с основанием 8 (восьме¬ ричная система счисления). Сложите получившиеся числа и проверьте ре¬ зультат. 18. Сравните операцию сложения, составляющую содержание упр. 17, с опе¬ рацией сложения из упр. 3 (е). Исходя отсюда, определите, как можно использовать восьмеричную систему в качестве сокращенной формы запи¬ си действий, производимых в двоичной системе2). [Указание. Каждый разряд восьмеричной системы замешает три раз¬ ряда двоичной системы.] *) Тест многократного выбора заключается в том, что на каждый вопрос Дается несколько ответов, из которых испытуемый должен выбрать пра¬ вильный. 2) Отмеченная в этом упражнении связь между двоичной и восьмеричной системами счисления также нередко используется в современных электронных счетных машинах.
120 Гл. II. Множества и подмножества § 11*. ГОЛОСУЮЩИЕ КОАЛИЦИИ В качестве применения наших понятий, относящихся к мно¬ жествам, рассмотрим роль коалиций в голосующих группах людей. Универсальным множеством здесь будет некоторое мно¬ жество людей, которые образуют принимающую решения группу. Примерами такого универсального множества могут служить члены какого-нибудь комитета, городского совета или парламента, участники конференции или собрания и т. д. Каж¬ дый член может иметь некоторое количество голосов. Решение о проведении или непроведении какой-то меры может прини¬ маться простым большинством или большинством в 2/з от об¬ щего числа голосов и т. д. Теперь допустим, что некоторое подмножество членов группы образует коалицию с целью проведения какой-то меры. Весь вопрос в том, располагают ли они достаточным числом голосов, обеспечивающим проведение этой меры. Если они имеют число голосов, достаточное для проведения этой меры, то мы скажем, что они образуют выигрывающую коалицию. Если члены, не входящие в эту коалицию, могут провести свое решение вопреки желанию рассматриваемой группы, то мы скажем, что первона¬ чальная коалиция — проигрывающая. Наконец, если члены этой коалиции не могут сами по себе провести никакого реше¬ ния и если члены, не принадлежащие коалиции, также не мо¬ гут провести никакого решения, то рассматриваемую коалицию назовем блокирующей. Переведем эти определения на язык теории множеств. Коали¬ ция С называется выигрывающей, если она располагает чис¬ лом голосов* достаточным для предрешения исхода; коалиция С называется проигрывающей, если коалиция с — выигрывающая; наконец, коалиция С называется блокирующей, если ни С, ни С не есть выигрывающая коалиция. Следующие факты вытекают непосредственно из этих опре¬ делений. Дополнением выигрывающей коалиции является про¬ игрывающая коалиция. Дополнением проигрывающей коалиции является выигрывающая коалиция. Дополнением блокирующей коалиции является блокирующая коалиция. Пример 1. Комитет состоит из шести человек, имеющих по одному голосу каждый. Исход решается простым боль¬ шинством голосов. Тогда любая коалиция из четырех или более членов будет выигрывающей, любая коалиция из одного или двух членов будет проигрывающей и любая коалиция из трех членов — блокирующей. Пример 2. Допустим, что в примере 1 одному из шести членов (скажем, председателю) дано право решающего
§ 11*. Голосующие коалиции 121 голоса в случае равного счета голосов в двух группах. Тогда любая коалиция из трех членов, в которой он уча¬ ствует, будет выигрывающей, в то время как другая коа¬ лиция из трех членов будет проигрывающей; следова¬ тельно, здесь нет блокирующих коалиций. Другие коали¬ ции будут те же, что и в примере 1. Пример 3. Пусть универсальным множеством U слу¬ жит множество {х, у, w, z}, где х и у имеют по одному го¬ лосу каждый, w имеет два голоса и z имеет три голоса. Допустим, что для проведения данной меры требуется пять голосов. Тогда выигрывающими будут коалиции {z, w}, {z, X, у}, {z, w, х), {z, w, у} и U. Проигрывающими коалициями будут дополнения этих множеств. Блокирую¬ щими коалициями будут {г}, {г, х), {г, г/}, {w, х}, {w, у) и {W, X, у). Последний пример показывает, что иногда нет необходимо¬ сти перечислять все члены выигрывающей коалиции. Например, если коалиция {z, w} выигрывающая, то очевидно, что коалиция {z, w, у} также будет выигрывающей. Вообще, если какая-то коалиция С выигрывающая, то. всякое другое множество, имею¬ щее С своим подмножеством, также будет выигрывающей коа¬ лицией. Таким образом, мы приходим к понятию минимальной выигрывающей коалиции. Минимальная выигрывающая коали¬ ция— это такая выигрывающая коалиция, которая не содержит в качестве своего собственного подмножества никакой другой выигрывающей коалиции. Иначе это можно выразить так: мини¬ мальная выигрывающая коалиция — это такая выигрывающая коалиция, которая перестает быть выигрывающей, если она те¬ ряет одного своего члена. Зная минимальные выигрывающие коалиции, мы тем самым знаем о проблеме голосования все, что нам нужно. Выигры¬ вающими коалициями будут все те множества, которые содер жат некоторую минимальную выигрывающую коалицию, а про¬ игрывающими коалициями будут дополнения выигрывающих коалиций. Все остальные множества суть блокирующие коали¬ ции. В примере I минимальными выигрывающими коалициями являются множества, состоящие из четырех членов. В приме¬ ре 2 минимальными выигрывающими коалициями являются все трехчленные коалиции, в которые входит член комитета, имею¬ щий решающий голос, а также коалиции из четырех членов, не содержащие этого члена комитета. Минимальными выигрываю¬ щими коалициями в третьем примере являются множества {z, ш} и \г. х. у).
122 Гл. II. Множества и подмножества В некоторых случаях те или иные члены комитета наделены специальными правами или ограничены в правах. Если какой- нибудь член может единолично провести любую меру, мы на¬ зовем его решающим членом комитета. Таким образом, член комитета х будет решающим тогда и только тогда, когда {*} — выигрывающая коалиция. Несколько более слабым, но все же очень могущественным членом комитета является тот, который может единолично бло¬ кировать любую меру. Такого члена комитета х мы назовем блокирующим членом комитета; очевидно, что это будет иметь место тогда и только тогда, когда коалиция {х} — блокирую¬ щая. Наконец, если х не является членом ни одной минималь¬ ной выигрывающей коалиции, то мы назовем его бесправным членом комитета. Таким образом, х бесправен в том и только в том случае, если любая выигрывающая коалиция, членом ко¬ торой х является, будет выигрывающей коалицией и без него. Пример 4. Интересным примером группы, принимаю¬ щей решения, служит Совет Безопасности Организации Объединенных Наций. Совет Безопасности состоит из одиннадцати членов: пяти постоянных представителей ве¬ ликих держав, называемых Большой пятеркой, и шести представителей малых наций. Для принятия Советом ка¬ кой-то меры необходимо, чтобы за нее проголосовали семь членов, включая Большую пятерку. Таким образом, семи¬ членные множества, состоящие из Большой пятерки и двух представителей малых наций, образуют минимальные выигрывающие коалиции. Следовательно, проигрываю¬ щими коалициями будут те множества, которые состоят из четырех или менее представителей малых наций. Бло¬ кирующими коалициями будут те множества, которые не являются ни выигрывающими, ни проигрывающими. В ча¬ стности, любое единичное множество, состоящее из одного представителя Большой пятерки, является блокирующей коалицией. В этом смысле каждый член Большой пятер¬ ки является блокирующим членом Совета Безопасности. Решающих и бесправных членов Совет Безопасности не содержит. [Возможность «воздержания» несущественна в предыдущем рассуждении.] Упражнения 1. В комитет входят члены w (председатель), х, у и г. Председатель до имеет два голоса, остальные члены комитета имеют по одному голосу каждый. Перечислите выигрывающие, проигрывающие и блокирующие коалиции.
I олосующие коалиции 123 2. Комитет состоит из п членов, имеющих по одному голосу каждый. Исход решается большинством голосов. Какими будут выигрывающие, проигры¬ вающие и блокирующие коалиции? 3. Муниципальный совет, утверждающий нью-йоркский городской бюджет, состоит из восьми членов, голоса которых распределены следующим об¬ разом: Мэр 3 голоса Инспектор 3 голоса Председатель совета 3 голоса Президент района Бруклин 2 голоса Президент района Манхеттен 2 голоса Президент района Бронкс 1 голос Президент района Ричмонд 1 голос Президент района Квинсленд 1 голос Исход решается простым большинством голосов. Перечислите мини¬ мальные выигрывающие коалиции. Перечислите блокирующие коалиции. Проделайте то же самое в предположении, что мэр имеет дополнительное право изменять решение в случае равенства голосов. 4. В референдуме принимают участие 100 ООО человек, имеющие по одному голосу каждый. Сколькими голосами должна располагать определенная партия для того, чтобы быть решающим участником референдума и сколь¬ кими для того, чтобы быть блокирующим участником? [Отв.: 50001; 50000.] 5. Если в условиях упр. 4 решение принимается большинством в 2/з голосов, то сколькими голосами должна располагать определенная партия для того, чтобы являться решающим или блокирующим участником референ¬ дума? [Отв.: 66667; 33334.] 6. Докажите, что если один из членов какого-нибудь комитета является ре¬ шающим, то все остальные члены этого комитета бесправны. 7. По аналогии с минимальными выигрывающими коалициями можно опре¬ делить максимальную проигрывающую коалицию. Каким соотношением связаны максимальные проигрывающие и минимальные выигрывающие коалиции? Дают ли максимальные проигрывающие коалиции всю инфор¬ мацию о возможных исходах голосования? 8. Докажите, что любые две минимальные выигрывающие коалиции имеют по меньшей мере одного общего члена. 9. Найдите блокирующие коалиции в примере Совета Безопасности. 10. Докажите, что если некое лицо является блокирующим членом комитета и если оно совместно с некоторым другим членом может провести угод¬ ное им решение, то распределение остальных голосов уже никакой роли не играет. ЛИТЕРАТУРА ДЛЯ ДОПОЛНИТЕЛЬНОГО ЧТЕНИЯ Тарский А., Введение в логику и методологию дедуктивных наук, М., ИЛ, 1948, гл. IV. Кальбертсон Дж. Т., Математика и логика числовых устройств, М.. Учпедгиз (в печати), гл. IV и VI. Беркли Э., Символическая логика и разумные машины, М., ИЛ, 19G1, гл. 5, 6 и 12. Новиков П. С., Элементы математической логики, М., Физматгиз, 1959. гл. 1П- и г Л о м А. М. и Яглом И. М., Вероятность и информация, М., Физмат- ГИЗ, 1960, § 4 гл. I. Л ы н к и н Е. Б. и Успенский В. Г., Математические беседы, М.—Л.,. Гостехиздат, 1952, гл. I раздела 2.
Глава III РАЗБИЕНИЯ И СОЧЕТАНИЯ § 1. РАЗБИЕНИЯ Задачу, изучаемую в этой главе, удобнее всего описывать в терминах разбиений множества. Разбиением множества 21 на¬ зывается подразделение этого множества на непересекающиеся и исчерпывающие его подмножества, так что каждый элемент U принадлежит одному и только одному из подмножеств. Подмнот жества At в таком разбиении называются ячейками. Итак |А, А2, Аг\ будет разбиением множества 21, если выпол¬ нены два условия: П) Д-П Aj = 0 при i Ф / (ячейки не пересе¬ каются) и (2) Д U Л2 U • • • U Ar = 21 (эти ячейки исчерпывают все множество U ). Пример 1. Если 2С = {а, b, с, d, е], то {{а, Ь}, {с, d, е}]9 \[Ь, с, е}, {а}, {d)\ и \{а], [Ь}У {с}, [d], {е}\ представляют собой три различных разбиения множества U . Последнее из них является разбиением на единичные подмножества. Переход от детального анализа множества логических воз¬ можностей к менее детальному осуществляется фактически по¬ средством некоторого разбиения. Например, рассмотрим логиче¬ ские возможности для исходов первых трех встреч команд Ян¬ ки и Доджерс в первенстве США по бейсболу. Перечислим все возможности, указывая победителя каждой игры: {ЯЯЯ, ЯЯД, ЯДЯ, ДЯЯ, ЯДД, ДЯД, ДДЯ, ДДДЬ Отнеся к одной ячейке все исходы с одинаковым числом побед, одержанных Янки, мы получим разбиение [{ЯЯЯ}, {ЯЯД, ЯДЯ, ДЯЯ}, (ЯДД, ДЯД, ДДЯ}, {ДДДЛ. Таким образом, если мы интересуемся числом побед Янки в трех играх, то мы производим менее детальный анализ, получен¬ ный из предыдущего путем отождествления возможностей в ка¬ ждой ячейке нашего разбиения.
§ 1. Разбиения 125 Если [А\, Л2, Аг\ и [Вь ^2, Вг] — два разбие¬ ния одного и того же множества U, то мы получаем новое раз¬ биение, рассматривая систему всех подмножеств U вида Д. П В (см. упр. 7). Это новое разбиение называется измельчением двух первоначальных разбиений. Пример 2. Обычно измельчениями разбиений пользуют¬ ся в проблеме классификации. Например, множество ^всех живых форм можно подвергнуть разбиению [Ж, Р], где Ж означает множество всех животных, а Р — множество всех растений. Можно также образовать разбиение [В, С], где В — множество всех вымерших живых форм, а С — мно¬ жество всех ныне существующих живых форм. Измельче¬ ние [Ж П В, ЖпС, PflB, PflC] дает полную классифи¬ кацию, соответствующую этим двум разным принципам классификации. Многие из примеров, которые нам встретятся в дальнейшем, связаны с рассмотрением процессов, осуществляемых в несколь¬ ко этапов. Разбиения и измельчения разбиений служат удобным средством для представления отдельных этапов процесса. Гра¬ фическим представлением такого процесса служит, естественно, дерево. Например, предположим, что этот процесс состоит в по¬ следовательном узнавании значений истинности некоторого ряда высказываний, имеющих отношение к заданной ситуации. Если U—множество логических возможностей для этой ситуации и р — высказывание, относящееся к U, то знание значения истин¬ ности р равносильно знанию того, какая из ячеек разбиения [Р, Р] содержит реализующуюся возможность. Напоминаем, что Р — это множество истинности высказывания р, а Р — множество истинности —р. Допустим теперь, что мы выяснили значение истинности некоторого второго высказывания q. Эта информа¬ ция опять-таки может быть описана посредством разбиения, именно [Q, Q]. Вместе эти два высказывания дают нам инфор¬ мацию, которая может быть представлена посредством измель¬ чения этих двух разбиений: [PflQ, PflQ, PflQ, PflQ]. Иначе говоря, если мы знаем значения истинности р и q, то мы знаем также, какая из ячеек этого измельчения разбиений со¬ держит ту логическую возможность, которая описывает дан¬ ную 'ситуацию. Обратно, если нам известно, какая из ячеек со¬ держит эту возможность, то нам известны и значения истинно¬ сти высказываний р и q. Информация, получаемая от дополнительного знания значе¬ ния истинности некоторого третьего высказывания т, имеющего
126 Гл. III. Разбиения и сочетания своим множеством истинности /?, может быть представлена по¬ средством измельчения трех разбиений [Р, Р], [Q,Q] и [/?,/?]. Этим измельчением будет [PflQnfl, PflQnP, PnQnR, PnQflP, PnQnP, PnQOR, PftQnR, PnQnR}. Отметим, что теперь мы ограничили множество возможных ва¬ риантов указанием одной из 8 = 23 возможных ячеек. Подобным же образом, если известны значения истинности п высказыва¬ ний, то наше разбиение содержит 2п ячеек. Если бы множество U содержало 220 (приблизительно один миллион) логических возможностей и если бы мы могли за¬ давать вопросы, требующие ответа «да» или «нет», таким обра¬ зом, чтобы знание значения истинности для каждого вопроса сокращало бы каждый раз число возможностей вдвое, то по¬ средством двадцати вопросов мы смогли бы определить лю¬ бую заданную возможность из множества U. Мы можем осу¬ ществить такой опрос, например, в случае, когда у нас имеется перечень всех возможностей и нам разрешается спрашивать «Лежит ли реализующаяся возможность в первой половине списка возможностей?», и если ответ утвердительный, то «Лежит ли она в первой четверти?» и т. д. На практике, как правило, у нас не имеется такого перечня, и мы можем осуществить ука¬ занную процедуру лишь приближенно. Пример 3. В известной игре «двадцать вопросов» *) яв¬ ляется весьма обычной ситуация, когда отгадывающий стремится произвести разбиение описанного выше типа. Например, предположим, что задан какой-либо город. От¬ гадывающий может спросить: «Этот город в Северной Аме¬ рике?», и если ответ утвердительный, то: «Он в Соединен¬ ных Штатах?», и если последует ответ «да», то: «Он ле¬ жит к западу от Миссисипи?», и если последует ответ «нет», то: «Он относится к Новой Англии2)?», и т. д. Конечно, на самом деле при такой процедуре не происходит разделения возможностей в точности пополам. Если число всех воз¬ можностей не превышает миллиона, то с тем большей уве¬ ренностью можно ожидать получения ответа после два¬ дцати вопросов, чем точнее разделение возможностей на две равные части в результате каждого из них. !) Эта игра требует от «водящего» определения заданного объекта с по¬ мощью 20 вопросов, на которые ему отвечают лишь «да» или «нет». 2) Так называют густонаселенный район на северо-востоке Соединенных Штатов, включающий в себя 6 штатов; этот район явился первым объектом европейской колонизации на территории США.
§ 1. Разбиения 127 Упражнения 1 Пусть U — множество целых чисел от 1 до 6. Найдите измельчение сле¬ дующих пар разбиений: (a) [{1, 2, 3}. {4, 5, 6}] и [{1, 4}, {2, 3, 5, 6}]; (b) [{1, 2, 3, 4, 5}, {6}] и [{1, 3, 5), {2, 6}, {4}]. [Отв.: (а) {1}, {2, 3}, {4}, {5, 6}.] 2 Монета бросается три раза. Дайте перечень возможностей выпадения мо¬ неты гербом или цифрой. Произведите разбиение множества возможно¬ стей гаким образом, чтобы в одной и той же ячейке находились все те возможности, для которых число выпадений герба является одним и гем же. 3. Пусть р и q — два высказывания, имеющие соответственно множества истинности Р и Q. Что можно сказать об измельчении подразделений [Р, Р] и [Q, Q] в случае, когда (a) р влечет q? [Отв.: Р П Q = О] (b) р эквивалентно <7? (c) р и q несовместимы? 4. Рассмотрим множество, составленное из восьми штатов США: Иллинойс, Колорадо, Мичиган, Нью-Йорк, Вермонт, Техас, Алабама и Калифорния. (a) Покажите, что путем трех вопросов, на которые отвечают «да» или «нет», можно определить любой из этих восьми штатов. (b) Придумайте систему из трех вопросов, ответы «да» или «нет» на которые могут быть даны независимо друг от друга и которые до¬ статочны для определения любого из этих штатов. 5. В некотором весьма подробном словаре на 3000 страницах имеется около 600 000 слов. Если из такого словаря выбирается одно слово, то воз¬ можно ли определить его посредством двадцати вопросов, на которые отвечают лишь «да» или «нет»? Если это возможно, то опишите исполь¬ зуемую вами процедуру и исследуйте ее выполнимость. [Отв.: Одно решение будет таково: 12 вопросов испульзуются для фиксации страницы; тогда для нахождения слова на этой стра¬ нице достаточно 8-ми вопросов.] 6. Мистер Джонс имеет двух родителей; каждый из его родителей имел двух родителей; каждый из последних также имел двух родителей, и т. д. По¬ строение фамильного дерева на 40 поколений назад (что составляет около 1000 лет) показывает, что мистер Джонс имеет 240 предков, что превышает численность всех людей, живших на Земле за последние 1000 лет. В чем ошибочность этого рассуждения? 7. Пусть [ЛиА2,Лз\ и [Ви В2]— два разбиения. Докажите, что измельчение этих двух разбиений действительно является разбиением, т. е. удовлетво¬ ряет требованиям (1) и (2), предъявляемым к разбиениям. 8. Измельчение разбиений, образованных множествами истинности п выска¬ зываний, имеет 2п ячеек. Как мы видели в гл I, таблица истинности вы¬ сказывания, составленного из п высказываний, имеет 2п строк. Какая имеется связь между этими двумя фактами? « Пусть р и q — высказывания с множествами истинности Р и Q; им отвечает разбиение ^flQ* ^flQ]* В каждом из следующих случаев установите, какие из ячеек должны быть пустыми для того, чтобы данное высказывание было логически истинным:
128 Гл. III. Разбиения и сочетания 10. Разбиение [Аи А2, Ап] называется вписанным в разбиение [В 1, В2, . .., Вт], если каждое Aj является подмножеством некоторого Bj. Покажите, что измельчение двух разбиений вписано в каждое из этих разбиений. 11. Возьмем разбиение контингента студентов высшего учебного заведения, произведенное в соответствии с делением на курсы. Разделение на учеб¬ ные группы определяет другое разбиение. Покажите, что оно вписано в первое разбиение. Укажите третье разбиение, отличное от этих двух и не вписанное ни в одно из них. 12. Что можно сказать об измельчении двух разбиений, если одно из них вписано в другое? 13. Имеется девять предметов, о которых известно, что восемь из них имеют одинаковый вес, а девятый несколько тяжелее остальных. Покажите, что более тяжелый предмет может быть отделен от других посредством двух взвешиваний на чашечных весах (без гирь). 14. Предположим, что имеется тринадцать предметов, из которых двенадцать имеют одинаковый вес, а один предмет тяжелее или легче остальных (тяжелее или легче — неизвестно!). Покажите, что трех взвешиваний на чашечных весах без гирь достаточно для отделения этого предмета от двенадцати других *). 15. Полная классификация каких-либо объектов может быть произведена путем введения нескольких простых подразделений и взятия их измель¬ чения. Так, например, университетские курсы могут быть подразделены по содержанию, числу слушающих курс студентов, их успеваемости, ко¬ личеству часов в неделю и т. д. Для каждого из следующих объектов определите пять или более раз¬ биений и установите, сколько ячеек будет при полном измельчении всех разбиений в каждом случа.е: (а) болезни; (Ь) анекдоты. § 2*. ПРИЛОЖЕНИЯ Мы рассмотрим здесь три примера приложений понятия раз¬ биений для математического описания различных ситуаций. Примеры такого рода получат более полное развитие в даль¬ нейших главах. 1°. Простая игра. Смит и Джонс играют в следующую игру: Джонс прячет в кулаке казначейский билет достоинством либо в один, либо в два доллара. Смит старается угадать достоинство билета, и если это ему удается, он его получает. В одной из сле¬ дующих глав мы рассмотрим вопрос о том, какую сумму дол¬ жен внести Смит, чтобы эта игра была безобидной. Но сейчас нас интересует только описание возможностей для этой игры. Игра содержит два этапа: на первом Джонс выбирает билет достоинством з один или в два доллара; на втором Смит назы¬ вает 1 или 2. Эти варианты можно представить на дереве с че¬ тырьмя ветвями (фиг. 71). Четыре возможные варианта игры *) Ср., например, Шклярский Д. О., Ч е н ц о в Н. Н., Я г л о м И. М., Избранные задачи и теоремы элементарной математики, ч. I, М., Физматгиз, 1959. решение задачи 6а).
§ 2 *. Приложения 129 представлены посредством четырех путей на дереве, которые мы обозначили а\Л а2, #4- Развитие этой игры можно также представить с помощью последовательности трех разбиений: начало: выбор Джонса: [{aL, a2}, (a3, a4)]; выбор Смита: {л2}, (a3), (a4}|. Отметим, что каждому уровню этого дерева соответствует не¬ которое разбиение. Ячейка этого разбиения, соответствующая данному уровню, содержит все пути, проходящие через точку разветвления на этом уровне. Разбиения можно также использовать для указания возмож¬ ностей влияния каждого игрока на исход игры. Влияние Джонса может быть указано Выбор Джонса Выбор Смита посредством разбиения [{аь а2}, {а3, а4}]. От Джон- Нет пищи Пища Фиг. 72 са зависит, которая из двух ячеек этого разбиения будет уча¬ ствовать в игре. Аналогично этому Смит может предписать, какая из двух ячеек разбиения [{ab a3}, {а2, а4}] участвует в игре. Конечное разбиение представляет собой измельчение этих двух разбиений. 2°. Пример из психологии. Предположим, что психолог про¬ изводит следующий эксперимент с группой крыс. Каждой крысе предстоит при каждом испытании пробежать через Т-образный лабиринт (фиг. 72). Если крыса повернет направо, то она полу¬ чит пищу, а если она повернет налево, то не получит пищи. В других экспериментах могут использоваться иные условия выдачи пищи. Например, пища может быть положена справа в /з всех испытаний или в любой другой их доле. Пищу можно Даже класть каждый раз в стороне, противоположной той, в ко- Т0РУЮ крыса повернула в предыдущем испытании. Психолог интересуется предсказанием поведения группы крыс, подвергну- тЫх последовательности таких испытаний. 9 Зак. 609.
130 Гл. III. Разбиения и Сочетания Рассмотрим эксперимент описанного типа и обозначим че¬ рез U множество всех крыс, используемых в этом эксперименте. После того как все крысы пройдут лабиринт, можно образовать разбиение, отнеся к одной ячейке тех крыс, которые повернули направо, а к другой — тех, которые повернули налево. Таким образом, каждое испытание в этом эксперименте определяет не¬ которое разбиение множества U. Разбиение, соответствующее п-му испытанию, обозначим [Пп, Лп], где Пп означает множе¬ ство крыс, которые при п-м испытании повернули направо, а Лп — множество крыс, которые при этом повернули налево. Пси¬ холог хотел бы предсказывать некоторые свойства разбиений после большого числа экспериментов. Например, он мог бы поставить следующие вопросы: Если пищу всегда кладут справа, то совпадает ли Пп в кон¬ це концов со всем или почти со всем множеством U ? Другими словами, будут ли крысы «обучены» поворачивать направо и получать пищу? Что произойдет, если каждой крысе давать пищу лишь в 2/3 случаев, когда она поворачивает направо, и в 7з случаев, когда она поворачивает налево? Что произойдет, если экспериментатор при каждом испыта¬ нии создает условия, противоположные поведению крысы в пре¬ дыдущем испытании? 3°. Поведение маленькой группы людей. Некоторые социо¬ логи занимаются изучением поведения небольших групп лиц, которым поручено совместное решение какой-то задачи. Приме¬ ром такой группы может служить суд присяжных, который дол¬ жен вынести приговор заключенному. Прежде чем прийти к ре¬ шению, члены этой группы посвящают много времени спорам и обсуждению, и эксперименты предназначены для изучения роли каждого субъекта в такой ситуации. В таком эксперименте на¬ блюдатель записывает имя субъекта, делающего каждое заме¬ чание, вместе с именем того субъекта, к которому направлено это замечание. Иногда отмечается природа этого замечания, а также время, когда оно было сделано. Рассмотрим эксперимент такого рода, произведенный над четырьмя лицами а, 6, с, d. Пусть 21 — множество всех сделан¬ ных замечаний. Образуем разбиение [Sa, Sb, Sc, S^] множества U, где Sa — множество всех замечаний, сделанных a, Sb— мно¬ жество всех замечаний, сделанных b, и т. д. Образуем также разбиение [Та, Тb, Тс, Тd\ множества U, где Та — множество всех замечаний, адресованных ка, Ть — множество всех замеча¬ ний, адресованных к 6, и т. д. Пусть, например, социолога интересует следующий вопрос. Упорядочим ячейки S-разбиения соответственно числу элемен-
§ 2 *. Приложения 131 тов, имеющихся в каждой ячейке. Сохранится ли тот же поря¬ док следования, если проделать то же самое с ячейками для Г-разбиения? Иначе говоря, справедливо ли следующее: лицу, сделавшему наибольшее число замечаний, адресовано ли также наибольшее число замечаний; лицо, стоящее на втором месте по числу сделанных замечаний, занимает ли второе место также и по числу замечаний, адресованных к нему, и т. д.? Вторая проблема состоит в следующем. Предположим, что во множестве U произведено разбиение [£Л, t/2, ^з], где U\ — множество замечаний, сделанных в первый промежуток времени, £/2 — множество замечаний, сделанных во второй промежуток времени, и Us—множество замечаний, сделанных в третий и заключительный промежуток времени. Тогда, если мы образуем измельчение этого разбиения и каждого из двух предшествую¬ щих, то мы будем иметь более тонкий анализ, который показы¬ вает изменение процесса обсуждения во времени. Например, та¬ кой анализ может показать, что дискуссия, которая велась в трех направлениях, перешла затем в двухстороннюю дискуссию. Может также обнаружиться, что некое лицо сделало много за¬ мечаний, но само вызвало их мало. Природа этих разбиений будет зависеть, конечно, от данной группы лиц и данного экс¬ перимента. Упражнения 1. У Джонса имеется две монеты, а у Смита — одна монета. Они условились сравнивать зажатые в кулаках монеты три раза, причем если монеты были зажаты у обоих в одной руке, их получа.ет Джонс, а если в раз¬ ных— Смит; возможно также, что игра кончится ранее трех партий тем, что один из играющих останется без денег. Нарисуйте дерево для пред¬ ставления возможных вариантов в этой игре. Покажите развитие этой игры при помощи последовательности разбиений. [Отв.: Имеется четыре пути.] 2. Какую информацию дает измельчение разбиений [Пi, Лi] и [П2, Л2] в экспе¬ рименте с поведением крыс? 3- Предположим, что в эксперименте с поведением крыс психолог делает сле¬ дующие допущения относительно результатов эксперимента при данных условиях выдачи пищи. При любом отдельном испытании 80% тех крыс, которые повернули направо при предыдущей попытке добраться до пищи, пойдет направо и при этой попытке, и 60% тех крыс, которые ранее по¬ вернули налево, сейчас пойдут направо. (a) Если при первом испытании направо повернуло 50%, то какой про¬ цент можно ожидать во втором испытании? [Отв.: 74%.] (b) Если при первом испытании направо повернуло 75%, то какой про¬ цент повернувших направо крыс можно' ожидать во втором испыта¬ нии? В третьем? В сотом? 4- Постройте дерево, представляющее 16 возможностей для четырех пробегов крысы через Т-образный лабиринт. Укажите те возможности, при которых крыса достигает успеха по крайней мере три раза, если; 9*
132 Гл. III. Разбиения и сочетания (a) пища кладется всегда справа; (b) снзчала пища кладется справа, затем слева., затем опять справа и затем опять слева; (c) пища кладется сначала справа, а затем перекладывается в сторону, противоположную той, в которую крыса повернула в предыдущем испытании [Отв.: Имеется пять таких путей.] 5. Пусть в условиях упр. 4 крыса знает, чго использован один из трех воз¬ можных способов кормления. Каким образом она может обеспечить себя пищей в трех испытаниях из четырех? [Отв.: Пойти направо, налево, направо, направо.] 6. Какую информацию может дать измельчение разбиений [5д, Sl}, S(,, Srf] и \Та, Тъ, Tc,Td] в примере, относящемся к поведению маленькой группы лиц? 7. Предположим, что при изучении поведения небольшой группы лиц произ¬ ведено разбиение [V, V] множества 2/, где V есть множество всех заме¬ чаний, имеющих форму вопроса. Какую информацию доставит нам из¬ мельчение разбиений [К, V] и Sc, S^]? Какую информацию до¬ ставит нам измельчение разбиений [V, V] и [LJ\y U2y t/3]? 8. Будем считать, что каждый житель США — либо республиканец, либо де¬ мократ. Начнем с разбиения людей, принадлежащих к данному поколе¬ нию. Допустим, что подобное разбиение производится для их сыновей, для их внуков и т. д. на протяжении нескольких поколений. Какие во¬ просы мог бы рассмотреть, используя эти разбиения, ученый, изучающий политическую историю США? 9. Предположим, что в данном поколении х человек являются республикан¬ цами, а у человек — демократами. Пусть, кроме того, известно, что в ка¬ ждом поколении среди сыновей республиканцев 20% демократов, а среди сыновей демократов — 30% республиканцев. Каким условиям должны удовлетворять числа х и у, чтобы процент республиканцев был одним и тем же в каждом поколении. Пусть общая численность жителей США в каждом поколении равна 50 миллионам. Имеется ли более чем один выбор чисел х и у, удовлетворяющих нашим условиям? Если нет, то чему должны равняться х и у? [Отв.: Должно быть 30 млн. республиканцев.] 10. Предположим, что в стране имеется 30 млн. демократов и 20 млн. респу¬ бликанцев. Известно, что р% детей демократов являются республикан¬ цами и q% детей республиканцев являются демократами. Пусть общее число жителей США остается равным 50 млн. Какому условию должны удовлетворять числа р и qt для того чтобы численность каждой партии оставалась неизменной? Имеется ли более одного выбора чисел р и (/, удовлетворяющих нашим условиям? § 3. ЧИСЛО ЭЛЕМЕНТОВ МНОЖЕСТВА Вся оставшаяся часть настоящей главы будет посвящена не¬ которым задачам на вычисление. Для любого (конечного!) мно¬ жества X мы будем обозначать через п(Х) число его элементов. Предположим, что дано несколько множеств, число элемен¬ тов каждого из которых нам известно, и мы хотим узнать, сколь¬ ко элементов содержится в двух множествах, связанных с дан¬ ными посредством операций объединения, пересечения и допол¬ нения. В качестве примера рассмотрим следующую задачу.
§ 3. Число элементов множества 133 Нам сообщили, что 100 студентов изучают математику, а 150 студентов изучают экономику. Можем ли мы тогда сказать, сколько студентов изучают математику или экономику? Ясно, что ответ на этот вопрос будет отрицательным, так как нам, очевидно, надо еще знать, сколько студентов изучают оба эти курса. Если нам известно, что ни один студент не изучает оба курса, т. е. известно, что эти два множества студентов — непересе- кающиеся, то ответом будет слу¬ жить сумма этих двух чисел, т. е. 250 студентов. Вообще, если даны непересе¬ кающиеся множества Л и В, то справедлива формула п (A U В) = п (Л) + п (В). Теперь предположим, что А и В пересекаются (фиг. 73). Множе¬ ство А можно разбить на две непересекающиеся подмноже¬ ства ЛрВ и А П В. Аналогично множество В можно разбить на непересекающиеся подмножества Af\B и А П В. Таким об¬ разом, п (А) = п (А П В) -f п [А П В), п (В) = п (А П В) + п (А П В). Сложив эти два равенства почленно, получим п (Л) —j— п (В) ==-■ п (Л П В) —|— ^ (Л П В) —(— (2п (Л П В). Так как множества Л П В, ЛпВиЛпВ попарно не пересе¬ каются и объединением их служит множество Ли В, то мы при¬ ходим к формуле п (Л) + п (В) = п (Л и В) + п (Л П В), которая справедлива для любых двух множеств Л и В. Пример 1. Вернемся к нашим студентам, 200 из кото¬ рых изучают математику, а 150 — экономику. Спраши¬ вается, сколько студентов изучают либо тот, либо другой предмет? Так как п (Л U В) = п [А) + п (В) — п (Л П В), где Л есть множество студентов-математиков, В — мно¬ жество студентов-экономистов, а число п (Л П В) нам не из¬ вестно, то ясно, что на поставленный вопрос ответить
134 Гл. III. Разбиения и сочетания нельзя. Если же известно, что 20 студентов занимаются и тем и другим предметом, то тогда можно определить и число студентов, занимающихся по крайней мере одним из них; оно равно 200 + 150 — 20 = 330. Если ни один из студентов-математиков не занимается экономикой и ни один из студентов-экономистов — матема¬ тикой, то, как мы уже отмечали, математиков и экономи¬ стов в совокупности будет 350 человек. Наконец, если ка¬ ждый студент-экономист обязан изучать математику, то число студентов, изучающих хоть один из указанных пред¬ метов (быть может, и оба вместе), равно 200. Пример 2. Пусть р и q — высказывания, относящиеся к множеству U логических возможностей. Обозначим че¬ рез Р и Q множества истинности этих высказываний. Мно¬ жеством истинности высказывания р V q служит Р U Q, а множеством истинности высказывания р Л q служит Р Г) Q. Таким образом, найденная формула дает нам возможность определить число случаев, когда р V q истинно, если из- . вестно число случаев, когда истинны р, q и р Л q. Рассмотрим теперь более чем два множества. Можно вы¬ вести общую формулу для числа элементов множества, которое является объединением всех наших множеств (см. упр. 6), но обычно бывает удобней пользоваться диаграммой Венна. Пред¬ положим, например, что относительно группы в 30 студентов из¬ вестно, что1) 19 студентов изучают математику, 17 » » музыку, 11 » » историю, 12 » » математику и музыку, 7 » » историю и математику, 5 » » музыку и историю, 2 » » математику, историю и музыку. Нарисуем диаграмму Венна (фиг. 74) и проставим на ней числа, показывающие число элементов каждого подмножества, дви¬ гаясь от конца нашего списка к началу. Так как 2 студента изучают все три предмета, а 5 изучают музыку и историю, то 3 изучают историю и музыку, но не математику и т. д. После 9 В США, как и во многих других странах, выбор предметов, изучаемых в высшем учебном заведении (да и в старших классах средней школы), в значительной степени зависит от учащегося.
§ 3. Число элементов множества 135 простановки всех цифр мы можем для любого сочетания пред¬ метов прочесть на диаграмме, каково число студентов, соответ¬ ствующих этому сочетанию. Например, число изучающих исто¬ рию, но не математику, равно 3+1=4. К л Р КпР с \ d КпР НпР Фиг. 75 Пример 3. Исследование рака. Следующее рассуждение часто встречается в статистических исследованиях о влия¬ нии курения на заболевание раком легких. Пусть иссле¬ дование показало, что доля курильщиков среди тех, кто болен раком легких, больше доли курильщиков среди тех, кто не болен раком легких. Утверждается тогда, что про¬ цент курильщиков, болеющих раком легких, больше, чем процент некурящих, больных этой болезнью. Докажем это. Пусть К означает множество курильщиков, а Р озна¬ чает множество всех людей, больных раком легких. Пусть далее а = П{К[\Р), Ь = п(К[\Р), с = п(КпР) и d = n{K{\P), как обозначено на фиг. 75. Интересующие нас проценты равны а с а Ь Pl a -j- b Р2 с ! d Р3 а + с Р4 Ь + d ’ где р 1—доля курящих среди больных раком легких, р2 — доля курящих среди не больных раком легких, р3— доля больных раком легких среди курящих и р4 — доля больных раком легких среди некурящих. Мы утверждаем, что если р\ > р2у то р3 > рА. Предпо- а ^ с ложение - ^ > —^_'d истинно тогда и только тогда, когда ас + ad > ас + Ьс, т. е. тогда и только тогда, когда ad > be. Заключение — с > j-yH истинно тогда и только тогда,
.136 Гл. III. Разбиения и сочетания когда ab + ad> ab + Ьс, т. е. тогда и только тогда, когда ad>bc. Таким образом, высказывания р\ > р2 и ръ> Ра эквивалентны, что нам и требовалось доказать. Упражнения 1. В примере, которому отвечает фиг. 74, найдите: (a) число студентов, изучающих математику, но не изучающих историю; [Отв.: 12.] (b) число студентов, изучающих в точности два предмета из трех; (c) чиспо студентов, изучающих лишь один из перечисленных предметов или ни одного из них. 2 Лекции по химии посещают 20 студентов, а лекции по психологии — 30 студентов. Найдите число студентов, посещающих лекции по пси¬ хологии или лекции по химии, если: (a) эти лекции происходят в одно время; [Отв.: 50.] (b) эти лекции происходят в разные часы, и 10 студентов слушают оба курса. [Отв.: 40.] 3. Множество истинности высказывания р состоит из 10 элементов, а множе¬ ство истинности высказывания q состоит из 20 элементов. Найдите число элементов множества истинности высказывания р \/ q, если (а.) р и q несовместимы; (Ь) р и q совместимы и множество истинности высказывания р /\ q со¬ стоит из 2 элементов. 4. Пусть р — высказывание, которое истинно в десяти случаях, a q — выска¬ зывание, которое истинно в пяти случаях. Найдите число случаев, в ко¬ торых истинно как р, так и q, если известно, что р\/q истинно в десяти случаях. Каким логическим отношением связаны р и р? 5. Допустим, что имеется 5 больных раком легких на каждые 100 000 человек и что, согласно подсчету, курят 75% всех больных раком легких и 60% из тех, кто не болен этой болезнью. (Эти цифры вымышленные.) Под¬ считайте долю больных раком легких среди курильщиков и среди неку¬ рящих. [Отв.: 18,75 и 9,375 на 100 000.] 6. Пусть Л, В и С — любые три подмножества универсального множества U Нарисуйте диаграмму Венна и покажите, что п (A (J В U С) = п (А) + п (В) + п (С) — -п(А[\В)-п(В[\С)-п(А[\С)+п(А[\В[\С). 7. Проанализируйте следующие данные и нарисуйте диаграмму Венна, ана¬ логичную изображенной на фиг. 74. В предположении, что каждый уча¬ щийся в школе изучает хоть один из указанных трех языков, найдите общее число учащихся : в школе. (а) (Ь) 28 36 учащихся изучают английский, 23 23 » » французский, 23 13 » » немецкий, 12 6 » » английский и французский, И 11 » » английский и немецкий, 8 4 » » французский и немецкий, 5 1 » » все три языка. Объясните результат в случае (Ь).
§ 4. Перестановки 137 8. Пусть при обследовании читательских вкусов студентов оказалось, что 60% студентов читает журнал А, 50% » » журнал В, 50% » » журнал С, 30% » » журналы А и By 20% » » » В и С, 30% » » » А и С, 10% » » все три журнала. (a.) Сколько процентов студентов читает в точности два журнала? [Отв.: 50.] (Ь) Сколько процентов не читает ни один из этих журналов? [Отв.: 10.] 9. Если р и <7 — эквивалентные высказывания и п (Р) = 10, то чему равно n(P\J Q)? 10. Докажите, что если из р следует q, тоя(Я11С?) = п (Р) + n(Q). 11. В трансконтинентальном самолете находится: 9 мальчиков, 5 американ¬ ских детей, 9 взрослых мужчин, 7 иностранных мальчиков, 14 американ¬ цев, 6 американцев мужского пола и 7 иностранок женского пола. Сколько всего людей было в самолете? [Отв.: 33 ] § 4. ПЕРЕСТАНОВКИ Здесь мы хотим рассмотреть вопрос о числе способов распо¬ ложения п различных объектов какой-то группы. Расположение п различных объектов в заданном порядке называется переста¬ новкой этих п объектов. Сначала рассмотрим случай, когда имеется три объекта а, b и с. Возможные перестановки этих трех объектов можно представить в виде путей на дереве, как это показано на фиг. 76. Каж¬ дый путь изображает одну воз¬ можную перестановку, и всего таких путей шесть. Мы можем также перечислить эти переста¬ новки: abCy Ьса, acby cab у bac, cba. Построив такое дерево для п объектов, мы бы нашли, что для получения общего числа путей надо перемножить числа п, п— 1 у п — 2 и т. д. до числа 1. Число, получаемое таким обра¬ зом, встречается столь часто, что заслуживает специального обозначения: его записывают символом п!, который читается «п факториал». Например, 3! = 3 • 2 • 1 =6, 4! = 4 • 3 ■ 2 ' 1 =24 и т. д. По причинам, которые станут ясны позднее (см. упр. 2 и
138 Гл. III. Разбиения и сочетания 9 из § 5), мы полагаем 0! = 1. Таким образом, имеется п! раз¬ личных перестановок и отличимых один от другого объектов. Пример 1. Предположим, что мы имеем семь карточек, на каждой из которых написана одна буква, и мы хотим с их помощью образовать все слова из семи букв. Если эти семь букв все различны, то мы должны рассмотреть 7! =5040 разных «слов» (большинство из которых, разу¬ меется, будут бессмысленными). Пример 2. Вратарь десять раз выбрасывает мяч в игру. Предположим, что тренер рекомендовал ему подавать мяч каждый раз другому игроку своей команды. Сколько воз¬ можных вариантов может выбрать вратарь? Поскольку футбольная команда состоит из 11 игроков (т. е., помимо вратаря, имеется еще 10 игроков команды), то вратарь мо¬ жет выбрать любой из 101= 3 628 800 порядков выбрасы¬ вания мяча. Пример 3. Сколькими способами могут расположиться за круглым столом п человек? При такой постановке во¬ проса обычно подразумевается, что два расположения счи¬ таются различными тогда и только тогда, когда в этихдвух; случаях хоть один из сидящих за столом людей имеет с ка¬ кой-либо стороны (например, слева от себя) разных сосе¬ дей. Зафиксируем положение одного человека. Тогда ос¬ тальные могут расположиться (п— 1)! способами. Теперь мы учли все расположения, которые считаются различ¬ ными. Почему? Общий принцип. Существует много комбинаторных задач, в которых невозможно указать простую формулу для числа допу¬ скаемых задачей логических возможностей. Во многих из таких задач единственный способ подсчета числа возможностей состоит в построении соответствующего дерева (см. упр. 4). В некото¬ рых задачах оказывается полезным следующий общий принцип: Пусть некоторый выбор может быть сделан в точности г раз¬ личными способами; для каждого из этих способов некоторый второй выбор может быть сделан в точности s различными спо¬ собами; для каждой пары первых двух выборов некоторый тре¬ тий выбор может быть сделан в точности t способами и т. д. Тогда число способов для последовательности этих выборов по¬ лучается перемножением соответствующих чисел, т. е. равно r-s• t.... Справедливость этого общего принципа можно проверить, представив себе дерево всех возможных способов, какими мо¬ жет быть сделана данная последовательность выборов. Из на¬ чального положения должно отходить г ветвей. От каждой та¬ кой ветви должно отходить 5 новых ветвей, от каждой из них t
§ 4. Перестановки 139 ветвей, и т. д. Число путей на этом дереве равно произведению г • s • t... . Пример 4. Число перестановок п различных объектов може'1 быть получено как частный случай этого принципа. Если требуется перебрать все возможные перестановки, то для выбора первого объекта имеется п возможностей; для выбора второго объекта в каждом случае остается уже только п — 1 возможностей и т. д. Наконец, мы придем к последнему объекту, для которого имеется' только одна возможность. Таким образом, всего имеется п(п — 1)...1 = = п\ возможностей. Пример 5. Если имеется три дороги, ведущие от городаХ к городу Y, и две дороги, ведущие от города Y к городу Z, то из города X в город Z можно проехать через город Y 3*2 = 6 различными путями. Пример 6. Предположим, что в соревновании или кон¬ курсе участвуют п человек. Трое судей должны независимо друг от друга перенумеровать эти п лиц в порядке, отра¬ жающем их успехи в соревновании (по мнению судьи). Лицо считается победителем, если его назовут первым по край¬ ней мере двое судей из трех. Какая доля всех возможных заключений судей, характеризующаяся тем, что один из участников объявляется победителем? Мы будем вместо этого искать долю тех заключений судей, при которых по¬ бедителя установить не удается. Искомая доля получится вычитанием найденного числа из 1. Косвенный подход та¬ кого рода при решении задач часто бывает эффективнее, нежели прямой подход. Общее число возможных заключе¬ ний равно (я!)3, так как каждый судья может упорядочить п участников соревнования п\ различными способами. Если какое-то заключение судей не позволяет установить побе¬ дителя, то это значит, что у всех трех судей первыми в спи¬ ске указываются разные лица. Согласно нашему общему принципу, такой выбор первых лиц может быть сделан п(п—1) (/2 — 2) различными способами. Для каждого из возможных выборов трех первых лиц имеется еще [(п—I)!]3 способов перечисления остальных участников. Таким образом, число заключений судей, не ведущих к установлению победителя, равноп(п—1)(п — 2)[(п—I)!]3. Разделив это число на (я!)3, получим число (/1-1) (Я-2) п2 показывающее, какая доля заключений судей не дает же¬ лательного результата (заключающегося в объявлении
140 Гл. III. Разбиения и сочетания одного из участников соревнования победителем). Доля заключений, при которых один из участников оказывается победителем, может быть найдена вычитанием этого числа из 1, что дает Зп — 2 п2 * Для случая трех участников мы видим, что 7/э всех воз¬ можностей приводят к установлению победителя. В этом случае описанная процедура может быть подвергнута кри¬ тике на том основании, что если даже судьи совсем неком¬ петентны или результаты участников практически одина¬ ковы, так что заключения судей имеют чисто случайный характер, то все же имеется весьма много шансов, что на основании их отзывов какой-то участник состязания ока¬ жется победителем. Если же п = 10, то доля случаев, при которых обнаруживается победитель, равна только 0,28, так что здесь оценкам судей, из которых следует превос¬ ходство одного из участников над другими, можно придать большее значение. Упражнения 1. Сколькими различными способами можно поставить в ряд пять человек для выполнения их группового портрета? Сколькими различными спосо¬ бами можно это сделать, если желать поставить трех человек в перед¬ нем ряду и двух в заднем? [Отв.: 120; 120.] 2. Футбольная команда определяется составом игроков и ролью, которую играет r команде каждый отдельный игрок. Сколько разных футбольных команд можно составить из 13 лиц (общее число игроков в футбольной команде 11 человек), если a) каждое из этих лиц может занимать в команде любое место; b) двое играющих могут служить лишь вратарями. 3. Четверо студентов получают оценки А, В, С или D. (a) Сколькими различными способами можно расставить оценки так, чтобы никакие два студента не получили одну и ту же оценку? [Отв.: 24.] (b) Сколькими способами могут быть расставлены оценки так, чтобы никакие два студента не получили одну и ту же оценку и один оп¬ ределенный из наших четырех студентов (назовем его Смит) полу¬ чил более высокую оценку, чем какой-то другой из них (назовем этого последнего студента Джонс)? [Отв.: 12.] (c) Сколькими способами могут быть расставлены оценки так, чтобы все четверо студентов получили высшие оценки С и D? [Отв.: 16.]
§ 4. Перестановки 141 4. В сборную команду страны вводятся семь новых членов, четверо из кото¬ рых представляют спортивный клуб А и трое — спортивный клуб В Эти семь человек включаются в сборную команду по одному, и притом так, чтобы среди новых членов команды представителей клуба А было всегла больше, чем представителей клуба В. Постройте дерево, на котором были бы представлены все возможные способы расширения сборной команды (при этом новые члены ее различаются только по их принад¬ лежности к тому или иному спортивному клубу). 5. Города А и В соединены один с другим тремя различными • дорогами. Сколькими способами можно совершить круговой рейс от А к В и обратно? Сколько будет таких способов, если на обратном пути обязательно изби¬ рать новую дорогу? [Отв.. 9; 6.] 6. Сколькими различными способами можно ответить на тест многократного выбора *), состоящий из десяти вопросов, если для каждого вопроса имеется три возможных ответа: 1-й, 2-й и 3-й? Сколькими различными способами можно это сделать, если ответы на любые два последователь¬ ных вопроса должны занимать в списке возможных ответов разные места? 7. Изменим условия примера 6 следующим образом: для того, чтобы счи¬ таться победителем, участник состязания должен стоять первым в списках двух судей и быть первым или вторым в списке третьего судьи. Какая часть возможных заключений судей позволяет установить победителя в случае трех участников? В случае п участников? [Отв.: 4/9; 4/п2.] 8. В институте учатся 1240 студентов. Нужно связаться с каждым из них по телефону, чтобы известить о собрании. Комитетом, состоящим из г сту¬ дентов, решено, что каждый из этих г лиц позвонит s студентам и попро¬ сит каждого навестить t других студентов и рассказать им о собрании. Если при таком методе ни одно лицо не извещается дважды, то (a) сколько человек узнает о собрании по телефону? (b) Пусть комитет состоит из 40 студентов и намечено известить о со¬ брании всех 1240 студентов. Если s и t должны быть одинаковы, то чему они равны? 9. Пусть в условиях примера 1 на карточках написаны буквы А, П, П. А, Р, А, Т. Сколько имеется различимых расположений для этих семи букв? [Отв.: 420.] 10. Сколько различных ожерелий можно составить (a) из семи бусинок разных размеров? [Отв : 360.] (b) из шести одинаковых бусинок и еще одной несколько большей? [Отв: 1.] (c) из пяти одинаковых бусинок и двух несколько больших? [Отв.: 3.] П. Докажите, что в Вашингтоне проживают по крайней мере два человека с одинаковыми инициалами. 12. Найдите число различимых расположений следующих пяти символов (одни и те же буквы с разными значками означают разные объекты): (a) А|, А2, В,, В2, В3; [Отв.: 120,] (b) А, А, В,, В2, В3; [Отв.: 60.] (c) А, А, В, В, В. [Отв.: 10.) ') См. подстрочное примечание на стр. 119.
142 Гл. III. Разбиения■ и сочетания 13. Покажите, что число различимых расположений п объектов, среди кото¬ рых имеется п\ (неразличимых) объектов типа 1, п2 объектов типа 2 и 1. д., равно п\ п}\ п2\ ... пг\ ’ где г есть общее число типов объектов (и, очевидно, ri\ + п2 4- ... . . . + Пг = П) . § 5. ЧИСЛО УПОРЯДОЧЕННЫХ РАЗБИЕНИЙ До сих пор мы не рассматривали разбиения [(1,2), (3,4)] и [(3,4), (1,2)] множества целых чисел 1, 2, 3 и 4 как различные разбиения. Теперь удобно сделать это, и для обозначения этого различия мы введем термин «упорядоченное разбиение». Упо¬ рядоченным разбиением с г ячейками назовем разбиение, в ко¬ тором учитывается распределение объектов по г ячейкам (неко¬ торые из них могут быть пустыми) и порядок, в котором эти ячейки рассматриваются. Мы хотим сосчитать число возможных упорядоченных раз¬ биений множества, содержащего п объектов, если число ячеек равно г и число элементов в каждой ячейке указано заранее. Для иллюстрации общей процедуры рассмотрим сначала один частный случай. Предположим, что имеется восемь студентов А, В, С, D, Е, F, G и Н, которых мы хотим расселить в трех комнатах студен¬ ческого общежития, две из которых (комната № 1 и комната № 2) являются трехместными, а третья (комната № 3) двух¬ местной. Сколькими различными способами может быть осу¬ ществлено такое расселение? Один способ состоит в том, что комнаты даются студентам в том порядке, в каком они при¬ бывают, т. е. первые три студента помещаются в комнату № 1, следующие три — в комнату № 2 и последние два — в комнату № 3. Имеется 8 различных порядков, в которых студенты мо¬ гут прибыть в институт, но не все они приводят к различным расселениям по комнатам. Расселение, соответствующее одному возможному порядку прибытия студентов, можно представить следующей схемой: | ВСА | DFE | HG|, которая означает, что студенты В, С и А помещаются в ком¬ нату № 1, студенты D, F и Е — в комнату № 2 и студенты Н и G — в комнату № 3. Заметим, что те порядки прибытия студен¬ тов, которые просто изменяют порядок мест студентов внутри тех же комнат, приводят к тому же самому расселению. Число
§ 5. Число упорядоченных разбиений 143 различных порядков прибытия, приводящих к тому же самому расселению по комнатам, что и выписанное выше, равно числу тех расположений, которые отличаются от данного расположе¬ ния только порядком мест студентов в группах, заключенных в вертикальные черточки («внутри комнат»). Число таких раз¬ личных порядков прибытия студентов равно 3!3!2!, ибо трех сту¬ дентов в комнате № 1 можно упорядочить 3! различными спо¬ собами; для каждого из этих способов трех студентов в ком¬ нате № 2 можно упорядочить 3! различными способами; далее, оставшихся двух студентов, попавших в комнату № 3, можно упорядочить 2! различными способами. Таким образом, 8! раз¬ личных порядков прибытия студентов можно разбить на группы из 3!3!2! элементов в каждой группе, причем порядки прибытия, принадлежащие одной и той же группе, приводят к одному и тому же расселению. Ясно, что общее число различных групп будет равно ; этому числу будет равно и количество раз¬ ных возможных способов распределения восьми студентов по трем комнатам. Аналогичное рассуждение может быть применено и для слу¬ чая п студентов и k комнат, первая из которых имеет п\ мест, вторая п2 мест и т. д. Это приводит к следующему результату. Пусть пи /г2, •••, щ— целые неотрицательные числа и п{ -f- + л2+ ... пп = п. Тогда Число упорядоченных разбиений \А{, Л2, Л3, . . ., Ак] множе¬ ства из п элементов по k ячейкам, первая из которых содержит П\ элементов, вторая — п2 элементов, и т. д., равно п\ п{\ п2\ ... nk\ ' Это число мы будем обозначать символом ( " )• \п 1, п2 nkJ Особенно важен тот частный случай, когда число k ячеек рав¬ но двум. Тогда наша задача становится эквивалентной задаче нахождения числа тех подмножеств из г элементов, которые могут быть выбраны из множества, содержащего п элементов. Это видно из того, что каждый выбор определяет некоторое раз¬ биение [А, А], где Л есть множество выбранных элементов и Л — множество оставшихся элементов. Число таких разбиений Равно 7Г(к —гУТ’ - столько должно быть подмножеств из
144 Г л. III. Разбиения и сочетания г элементов. Наше обозначение^ п — г) Удо^но записывать со¬ кращенно в виде Заметим, что есть число подмножеств из п — г эле¬ ментов, которые могут быть выбраны из множества, содержа¬ щего п элементов, и оно же есть число разбиений вида [А, А]. Ясно, что число этих разбиений будет то же самое, что и число разбиений [А, А]. Следовательно, СХ-гУ Символ ) .«1. п2 пк! (, можно также понимать как выражение числа различных спо¬ собов, которыми можно распределить к различных ярлыков аи а2у . . ., ап между п предметами, при условии, что у нас есть ti] ярлыков типа аи п2 ярлыков типа а2,..., nk ярлыков типа ak: Если ti\ Н~ fi2 "Ь ... + nk не равно п, то подобное распределение ярлыков невозможно, и поэтому мы будем считать, что в этом случае число ( п )равно нулю. Если сумма пх + п2 +. . . \ п I f п2,..., п^} равна /г, то всегда существует по крайней мере один способ распределения ярлыков, и, следовательно, ( п п п п^ есть целое положительное число. Повторим, изменив несколько форму, вывод формулы для этого числа. Пусть, например, у нас имеется 6 предметов и два красных, три синих и один черный ярлык. По определению число различ¬ ных способов распределения ярлыков равно 3 l)' Предпо¬ ложим, что затем мы решили использовать ярлыки шести раз¬ личных цветов по одному на каждый предмет. При этом число способов распределения шести ярлыков будет равно 6! — числу перестановок шести объектов. В таком случае нам придется за¬ менить два красных ярлыка двумя различными ярлыками, ска¬ жем, двумя ярлыками с различными оттенками красного цвета. Заменить два красных ярлыка двумя новыми можно 2! различ¬ ными способами. Аналогично 3 синих ярлыка можно заменить ]) В русской литературе число (число сочетаний из п элементов рр г) чаще обозначается символом
§ 5. Число упорядоченных разбиений 145 тремя синими ярлыками различных оттенков 3! способами, а черный 1! способами. На основании этого мы можем написать равенство (2J, ,)-2!3! И = в!, поскольку нам известно, что ярлыки шести цветов можно рас¬ пределить 6! способами. Отсюда имеем ^ ' ( 6 \= б! \ 2, 3, 1 / 2! 3! 1! Ясно, что наше рассуждение применимо и к общему случаю. Пусть необходимо распределить среди п предметов яр¬ лыки k различных типов (где ярлык типа а, используется щ раз; П\ + п2 + . . . + nh = п). Число различных способов, кото¬ рыми это можно сделать, по определению равно ( п V \ /2,, П2, . . ., П]г} Для того чтобы затем перейти к распределению п различных ярлыков, надо заменить п( ярлыков каждой группы а{ (где i может быть равно 1,2,.. ., /е) на различных ярлыков и рас¬ пределить эти новые ярлыки между теми предметами, которые ранее имели ярлыки группы а{. Для i-й группы (группы пред¬ метов, имевших ярлыки а,-) это можно сделать я,- ! разными спо¬ собами. Очевидно, что таким образом мы получим всевозмож¬ ные распределения п различных ярлыков, и поэтому ( п ) • пх! п2\ . . . пР\ = п\\ \пи п2,..., nk ) 1 к следовательно, [ п W . \ /2,, П2у . . 1lk 1 п, \ П2\ . . . nk\ Пример 1. Футбольная команда колледжа должна сы¬ грать за сезон 6 игр с командами других колледжей. Сколь¬ кими различными способами может пройти сезон для этой команды, если в результате она выиграет два матча, три проиграет и один сведет вничью? В качестве множества предметов мы рассмотрим мно¬ жество из 6 команд, с которыми играет наша команда; этим командам приписываются ярлыки трех различных ти¬ пов: победа, ничья, поражение (нашей команды!). Теперь задача сведена к задаче «распределения ярлыков» между 6 командами, где ярлыки могут быть трех различных ти¬ пов, и ярлыки первого типа используются два раза, 10 Зэк. 609»
146 Гл. III. Разбиения и сочетания второго — один и третьего — три раза. Отсюда искомый ответ имеет вид: Этот же результат мы получим, если для каждого исхода шести встреч образуем разбиение команд, выступающих прртив команды нашего колледжа. В первую ячейку мы поместим те команды, у которых наша команда выигры¬ вает, во вторую — те команды, с которыми она играет вни¬ чью, и в третью ячейку — те команды, которым наша коман¬ да проигрывает. (Это описание делает ясным, что схема с разбиением команд по ячейкам ничем не отличается от схемы с распределением ярлыков.) Имеется =60 таких разбиений, и, следовательно, 60 способов заверше¬ ния сезона нашей командой. Пример 2. В игре в бридж 52 карты сдаются четырем игрокам N, Е, S и W по 13 карт каждому. Это определяет разбиение 52 карт на четыре ячейки по 13 элементов в ка- « х * 521 ждои. Таким образом, имеется щ; 1з; различных сдач карт. Это число приблизительно равно 5,3645 - 1028, или около 54 миллиардов миллиардов миллиардов сдач. Пример 3. Следующий пример будет иметь значение в теории вероятностей, которой мы займемся в главе IV. Если бросать шесть раз монету, то имеется 26 воз¬ можностей для исхода этих бросаний, так как каждое бро¬ сание может иметь своим результатом выпадение либо герба, либо цифры. Сколько имеется возможных исходов, в результате которых четыре раза выпадает герб и два ра¬ за— цифра? Каждая последовательность шести выпадений герба или цифры определяет следующее разбиение чисел от 1 до 6 на две ячейки: в первую ячейку помещаем числа, соответствующие тем бросаниям, в результате кото¬ рых выпадает герб, а во вторую ячейку — числа, соответ¬ ствующие тем бросаниям, в результате которых выпадает цифра. Мы требуем, чтобы первая ячейка содержала че¬ тыре элемента, а вторая ячейка—два элемента. Следова¬ тельно, число тех из 26 возможностей, которые приводят к четырем выпадениям герба и двум выпадениям цифры, равно числу разбиений шести элементов на две ячейки, со¬ держащие соответственно четыре элемента и два элемента. / 6 \ Это число равноf4 ) =15. Подобный же анализ показы¬ вает, что в случае n-кратного бросания монеты существует ( 6 2, 1, 3 ; 2! 1! 3!
§ 5. Число упорядоченных разбиений 147 ^ j различных последовательностей Г и Ц длины п, кото¬ рые содержат г букв Г (г выпадений гербов) и п — г букв Ц (выпадений цифры). Упражнения 1. Найдите следующие числа: (a) Q; [Отв.: 21.] <Ь> (г)1 (c)(2); (2. 0. 2 V- ( 250у V 249 ; ’ (d)(S2); [Отв.: 250.] (е) lo): (0 ( 1, 2, 2 (g) ( 4 [2, 0,2 (h) ( 2 ' Л, 1, 1, 2. Какой смысл имеют числа (q) И (”). Можно ли из этого извлечь довод в пользу того, чтобы считать 0! — 1? 3. Сколькими способами можно расселить девять студентов в трех комнатах, рассчитанных на трех человек каждая? Сколькими способами это можно сделать, если какие-либо два из этих студентов отказываются поселиться вместе? [Отв.: 1680; 1260] 4. Компания из семи юношей и десяти девушек танцует. Если в каком-то танце участвуют все юноши, то сколько имеется вариантов участия деву¬ шек в этом танце? Сколько имеется вариантов, если учитывать лишь те, какие из девушек оказываются неприглашенными? Решить тот же вопрос в условиях, когда относительно трех девушек можно с уверенностью ска¬ зать, что они будут приглашены на танец? 5. Предположим, что по 15 студентов могут явиться на стадион для выпол¬ нения обязательного задания в один из трех указанных им дней. (a) Сколькими способами могут студенты распределиться по дням явки на стадион? [Отв.: З15.] (b) Сколько имеется способов распределения студентов по дням явки на стадион, если в каждый из этих дней выполняют задание одина¬ ковое число студентов? [Отв.: 756 756.] 6. Преподаватель рассчитывает читать один и тот же курс в течение 35 лет. Чтобы не наскучить студентам своими шутками, он решил рассказывать каждый год в точности три анекдота и не повторять никакие два года подряд одни и те же три анекдота. Каково минимальное число анекдо¬ тов, которые он должен приготовить? Чему равно число анекдотов, если преподаватель решил не повторять ни одного анекдота два года подряд? 7. Сколькими способами можно ответить на десять вопросов, в которых предлагается установить истинность или ложность некоторых десяти ут¬ верждений, если на половину вопросов отвечать утвердительно и на по¬ ловину — отрицательно? Сколькими способами можно ответить на эти вопросы, если желать, чтобы никакие два последовательных ответа не были одинаковыми? • Комиссия из 8 человек должна быть разбита на три подкомитета, состоя¬ щих из 3, 2 и 3 человек соответственно, причем никакой из членов 10*
148 Г л. III. Разбиения и сочетания комиссии не должен одновременно участвовать в двух подкомитетах. Сколькими различными способами можно провести деление комиссии на подкомитеты? [Отв.: 560.] 9. Сколькими различными способами можно распределить два красных и два синих ярлыка между четырьмя предметами? Сколькими различными спо¬ собами между этими же предметами можно распределить красные, си¬ ние и зеленые ярлыки при условии, что у нас есть два красных, два синих и ни одного зеленого ярлыка? Используйте полученный ответ для того, чтобы показать разумность соглашения о том, что 0! = 1. 10. Выведите из полученной в тексте формулы равенство ( п ) = ( п )■ \пи п2. п3 ) \п3, п2, /г, / Докажите это же равенство, исходя из смысла, символа ( П ). \пI, n2t пъ] 11. Студенту надо выбрать два факультативных курса из шести возможных. (a) Сколькими способами он может сделать выбор? [Отв.: 15.] (b) Сколько имеется способов выбора, если чтение каких-то двух курсов совпадает по времени? [Отв.: 14.] (c) Сколько имеется способов для выбора, если чтение двух курсов на¬ чинается в 10 часов, чтение двух других — в 12 часов, а в остальном курсы не пересекаются по времени? [Отв.: 13] 12. Покажите, что число способов распределения среди 12 предметов ярлы¬ ков трех различных цветов, где ярлык каждого цвета встречается ровно 4 раза, больше числа способов распределения ярлыков тех же трех цве¬ тов, где (заданные) количества ярлыков разных цветов не равны между собой. § 6. НЕКОТОРЫЕ СВОЙСТВА ЧИСЕЛ Введенные в предыдущем параграфе числа будут играть важную роль в последующем изложении. Мы приведем здесь некоторые из наиболее важных свойств этих чисел. Выше мы уже видели, что ("МАНтст это есть число способов, каким можно выбрать из п объектов группу в / объектов. Связь числа (yjc более общим символом ( п ^ определяется равенством ОМ//-;)- Пример 1. В колледже имеется 60 играющих в футбол студентов. Из них надо составить три футбольные команды,
§ 6. Некоторые свойства чисел 149 т. е. отобрать 3-11=33 игроков; остальные 60 — 33 = 27 студентов будут являться кандидатами в состав команд. Отобрать 33 члена команд можно ^ способами; 27 кан¬ дидатов можно отобрать (27) спос°бами. Эти два числа, разумеется, совпадают, они показывают, что выбор футбо¬ листов можно произвести более чем миллиардом миллиар¬ дов способов. Пример 2. В примере 2 предыдущего параграфа мы рассмотрели число всевозможных способов распределения карт между данными четырьмя игроками при игре в бридж. Если интересоваться лишь тем, какие карты может полу¬ чить один из этих игроков, скажем игрок N, то мы будем / 52 \ / 52 \ иметь ( I возможных вариантов. Число I ^ ) превосходит 635 миллиардов; оно все еще очень велико, но несравненно меньше, чем число возможных способов раздачи карт. г-о / j" ^ =2 г-з ""' ' * ' / п-3 / 3 3 I у • • Фиг. 77 Удобный способ для получения чисел дает знаменитый треугольник Паскаля, изображенный на фиг. 77. Чтобы полу¬ чить этот треугольник, напишем по обеим его сторонам единицы. Любое другое число в этом треугольнике обладает тем свой¬ ством, что оно является суммой двух чисел, лежащих над дан¬ ным числом в верхней строке. Таким образом, следующая за выписанными строка этого треугольника будет иметь вид 1, 6.
150 Гл. III. Разбиения и сочетания 15, 20, 15, 6, 1. Чтобы найти число мы фиксируем строку, отвечающую числу д, и смотрим, в каком месте пересекает ее диагональная линия, соответствующая числу у. Например, число ^2) = 6 лежит в строке, отмеченной номером п = 4, и на диаго¬ нали, отмеченной номером у = 2. Построение треугольника Паскаля основано на следующем свойстве чисел (”|1)==(y-i) + (”)- Это равенство может быть проверено непосредственно (см. упр. 6), но более интересно следующее доказательство. Число / п -)- 1 \ у j j означает число тех подмножеств из у элементов, кото¬ рые могут быть выбраны из множества, содержащего п + 1 элементов. Возьмем один из этих п + 1 элементов, скажем х. подмножеств можно разбить на такие подмножества, которые содержат х, и на такие, которые х не содержат. По¬ следние представляют собой подмножества из у элементов, обра¬ зованные из п объектов; следовательно, их число равно (у)- Всякое же подмножество, содержащее х, получается путем при¬ соединения х к подмножеству из у—1 элементов, не содержа¬ щему х; следовательно, число таких подмножеств равно )* В результате получаем (Л 1 ) = ) + (”)■ Обратим теперь внимание на то, что числа в каждой строке треугольника Паскаля сначала растут, а потом начинают убы¬ вать. Этот факт может быть доказан в общем виде, если рас¬ смотреть отношение двух соседних членов: ш 0) U ~\~ 1)! О —J 1)! п\ ; + 1 ■ Числа определенной строки треугольника Паскаля растут, пока это отношение остается больше единицы, т. е. пока п — / > у + 1 или —1). Мы должны различать случаи четного и не¬ четного п. Например, если п = 10, то у должно быть меньше, чем 4(10 — 1) = 4,5. Следовательно, вплоть до у = 4 числа ра-
§ 6. Некоторые свойства чисел 151 сТут, а начиная с / = 5 убывают. Для /2=11 число у должно.быть меньше чем ^-(11 — 1) = 5. Для / = 5, (п —/)/(/+ 1) = 1. Сле¬ довательно, вплоть до / = 5 числа растут, затем мы имеем Пример 3. В статистической механике существует про¬ стая модель, предложенная Эренфестом, о которой мы бу¬ дем еще говорить в гл. V. В этой модели рассматривается газ, находящийся в объеме, разбитом на две части про¬ ницаемой перегородкой. Газ состоит из п молекул, и нас интересует, сколько молекул находится в каждой из двух областей. Очевидно, что в каждый момент времени мно¬ жество молекул распадается на два подмножества. Все молекулы можно разделить на два подмножества таким образом, чтобы в первое попало ровно i молекул, (^раз¬ личными способами. Теперь мы определим энтропию та¬ кого распределения молекул с помощью формулы В этом случае несущественно, какое число мы возьмем за основание системы логарифмов, так как это изменит лишь единицу, с помощью которой мы измеряем энтропию1). формацию об энтропии распределений молекул. Известно что Отсюда следует, что распределение, при котором i молекул попадают в первую область, обладает той же энтропией, что и распределение, при котором i молекул попадают во вторую область. Кроме того, нам известно, что при фикси- нии i. Отсюда вытекает, что наиболее равномерное распре¬ деление молекул обладает и наибольшей энтропией. Более того, чем больше неравномерность распределения молекул, тем меньше энтропия такого распределения. В предельном после чего числа начинают убывать.. Наши сведения о числах ( ^доставляют некоторую ин- рованном п величина принимает наибольшее значение при i = п/2 или ближайшем к этой величине целом значе- !) Ибо logfcjV = loga N • log^а; постоянный множитель log&a называется модулем перехода от одной системы логарифмов к другой.
152 Гл. III. Разбиения и сочетания случае, когда все молекулы попадают в одну из областей, получим: 0. ^=^=iog[(S)]=i°gi Упражнения 1. Доведите построение треугольника Паскаля до п= 16. (Этот результат бу¬ дет использован в дальнейшем, поэтому его следует сохранить.) 2. Найдите число комитетов из трех человек, которые могут быть образованы из трех студентов факультета А и трех студентов факультета В, если (a) не накладывать больше никаких органичений на состав комитета; [Отв : 20.] (b) включить в комитет только студентов факультета А; [Отв.: 1.] (c) включить в комитет двух студентов факультета А и одного студента факультета В; [Отв.: 9.] (d) включить в комитет одного студента факультета А и двух студентов факультета В; [Отв.: 9.] (e) включить в комитет лишь студентов факультета В. [Отв.: 1.] Каково соотношение между ответом на п. (а) и ответами на четыре остальных пункта? 3. Упр 2 наводит на мысль о следующем равенстве: Ш:)(:)+(?)(.-.)+(;)(.-2)+~ +00- Докажите его справедливость. 4. Докажите, что (S)+(J)+(2)+-+(»)=2’’ воспользовавшись тем, что множество из п элементов содержит 2п под¬ множеств. 5. Докажите, что множество из десяти элементов содержит больше подмно¬ жеств из пяти элементов, чем подмножеств из любого другого фиксиро¬ ванного числа элементов. 6. Воспользовавшись тем фактом, что = Г + 1 '(/*)' вычислите / 30 \ / 30 \ (1 при s = 1, 2, 3, 4, исходя из того, что у 0 1 = 1. [Отв.: 30, 435, 4060, 27405.] / 52 \ 7. В бридже каждый игрок получает одну из ( ^ j возможных комбинаций карт (см. пример 2). Допустим, что составлен список всех этих комбина¬ ций и что в этом списке в каждой комбинации карт вычеркнута первая карта. После этого у нас остается список комбинаций ка.рт, состоящих из двенадцати карт каждая. Докажите, что по меньшей мере две комби¬ нации карт в последнем списке состоят в точности из одних и тех же карт,
§ 6. Некоторые свойства чисел 153 8. Докажите, / л + 1 \ ( П \ ( п\ [ТО ^ . ] “ \ у 1 ) \ j ) 9 воспользовавшись п\ тем, что \(n-j)\ * 9. Постройте треугольник, родственный треугольнику Паскаля и отличаю¬ щийся от него лишь тем, что сложение двух чисел производится в соот¬ ветствии с таблицей сложения, изображенной на фиг. 69, а (стр. 115). Доведите построение нового треугольника до 16 строк. Что можно вы¬ вести из полученного результата о свойствах чисел, составляющих тре¬ угольник Паскаля? Используйте полученный «числовой треугольник» для проверки системы чисел, выписанных при решении упр. Г. 10. Каким общим свойством обладают первая, вторая, четвертая и шестна¬ дцатая строки треугольника из упр. 9? Что это означает для чисел, расположенных в соответствующих строках треугольника Паскаля? Ка кое можно сделать предсказание относительно элементов тридцать вто рой строки треугольника Паскаля? 11. Дана следующая таблица: 1 1 1 1 1 1. 2 3 4 5 6 7. 3 6 10 15 21 28. 4 10 20 35 56 84. 5 15 35 70 126 210. 6 21 56 126 252 462. 7 28 84 210 462 924. Установите, каким образом числа каждой строки этой таблицы полу¬ чаются из чисел предыдущей строки и укажите, какое отношение имеет эта таблица к треугольнику Паскаля. 12. В таблице упр. 11 занумеруем столбцы числами 0, 1, 2, ..., а строки — числами 1, 2, 3, Пусть / (п, г) означает элемент, стоящий в столбце с номером п и строке с номером г. Таблица построена по следующее-/ закону: f(n, r)=f(n— 1, r)+f(n, г— 1) для п > 0 и г > 1; /(«. о=/(°. о = 1 для всех п и г. Проверьте, что удовлетворяет этим условиям и что лишь это число / (п, г) удовлетво¬ ряет им. 13. Рассмотрим множество {а, а, а) из трех неотличимых друг от друга объ¬ ектов. Различными упорядоченными разбиениями на две ячейки в этом случае будут разбиения: [{а, а, а), о]; [{а, а), (а)]; [{«}. {«. а}\, [О, {а, а, а}]. Перечислите все различные упорядоченные разбиения на три ячейки. Каково их число? [Отв.: 10 ]
154 Гл. III. Разбиения и сочетания 14. Пусть f{n, г) означает число различных упорядоченных разбиений на г ячеек множества из п неразличимых объектов. Покажите, что / (п, г) удовлетворяет условиям: /(«.>) =/(«—1. Г) +/(Л, /-—1) для п > О и г > 1; /(л. 1) =/(0, г) = 1 для всех п и г. [Указание. Покажите, что /(/г, г'— 1) есть число разбиений, у которых последняя ячейка пуста, и что / (п—1, г) есть число разбиений, имею¬ щих в последней ячейке по крайней мере один элемент.] 15. Пользуясь результатами упр. 12 и 14, покажите, что число различимых упорядоченных разбиений на г ячеек множества из п неразличимых объектов, равно 16. Допустим, что почтальон должен опустить семь идентичных писем в три почтовых ящика. Сколькими способами он может это сделать? [Отв.: 36.] 17. Под упорядоченным разбиением числа п на г слагаемых мы понимаем последовательность неотрицательных чисел (некоторые из них могут быть равны нулю), записанных в определенном порядке и дающих в сумме п. Например, {1 0, 3} и {3, 0, 1} служат двумя различными упо¬ рядоченными разбиениями числа 4 на три слагаемых. Показать, что чис¬ ло упорядоченных разбиений числа п на г слагаемых равно 18. В условиях примера 3 определите приращение энтропии при переходе еще одной молекулы в первую область. Другими словами, найдите про¬ стое выражение для разности —еп{. Используйте этот результат для того, чтобы показать, что энтропия возрастает тогда и только тогда, когда увеличивается равномерность распределения. г» • § 7. БИНОМИАЛЬНАЯ И ПОЛИНОМИАЛЬНАЯ ТЕОРЕМЫ Довольно часто приходится раскрывать скобки в выраже¬ ниях вида (х + у)3, (x + 2y+\\z)r° и т. д. В этом параграфе мы покажем, как эго следует делать. Рассмотрим сначала частный пример выражения (х + у)3. Запишем его в виде (.х + у)3 = (х + у) (х + у) (л: + у). Чтобы выполнить умножение справа, мы выбираем в каждом из трех множителей или х, или у и перемножаем эти элементы; так мы поступаем со всеми возможными способами выбора х или у в трех сомножителях и складываем полученные результаты. Каждый из полученных на этом пути одночленов (сумма кото¬ рых и дает требуемый результат) отвечает определенному раз¬ биению тройки чисел 1, 2, 3 на две ячейки. К первой ячейке мы относим номера тех множителей (х + у), в которых мы выбрали слагаемое х. Например, разбиение [{1, 3}, {2}] соответствует вы¬
$ 7. Биномиальная и полиномиальная теоремы 155 бору х из первого и третьего множителя и выбору у из второго множителя. Полученное таким образом произведение равно хух = х2у. Коэффициентом при х2у в искомом выражении для (х + у)3 будет число тех разбиений, которые приводят к выбору двух х и одного у. Иначе говоря, это будет число 2^ = 3, рав¬ ное числу разбиений множества трех чисел на две ячейки — с двумя элементами в первой ячейке и одним элементом во вто¬ рой. Вообще, коэффициент при члене вида xJy3~J (где / = 0,1,2 или 3) будет равен (у)- Таким образом, искомое выражение имеет вид (х + у)з = (3)х3 + (3)х2у+(3)^у2 + (3)уз = = X3 4- Зх2у + 3ху2 + у3. Такое же рассуждение в применении к выражению (х + у)п приводит к известной биномиальной теореме (теореме о биноме Ньютона): Биномиальная теорема. Результат раскрытия скобок в выражении (х + у)п имеет вид {x + yT = xn + (n1l)x»-'y + (nn_2)x"-Y+ ••• • • • + Пример 1. Найдем, чему равно (а — 2Ь)3. Чтобы вос¬ пользоваться биномиальной теоремой, положим а = х и —2b = у. Тогда будем иметь (а — 2 Ь)3 = а3 + За2 (— 2 Ь) + За (— 2 Ь)2 + (— 2 bf = = а3 — 6 a2b + 12 ab2 — 8 Ь3. Обратимся теперь к задаче о нахождении куба трехчлена (* + у + г)3. Снова пишем (х -by +z)3 = (-Х + У + Z) (х + у + z) (х + у + z). На этот раз мы выбираем из каждого множителя или х, или у, или 2. Таким образом, мы приходим к разбиению множества чисел {1, 2, 3} на три ячейки: в первую ячейку входят номера тех множителей, из которых мы выбрали х, во вторую ячейку — номера множителей, из которых мы выбрали у, ив третью ячейку — номера множителей, из которых мы выбрали 2. Напри¬ мер, разбиение [{1, 3}, О, {2}] соответствует выбору х из первого и третьего множителей и выбору 2 из второго множителя.
156 Гл. III. Разбиения и сочетания Полученный член равен xzx = x2z. Коэффициентом при члене x2z в искомом выражении будет число всех разбиений множества из трех элементов на три ячейки, первая из которых содержит два элемента, вторая — ни одного и третья — один элемент. Число таких разбиений равно о l) = ^’ Вообще, коэффи¬ циент при члене xaybzc в выражении для (х + у + г)3 будет ра- вен {a t с) = ^тТйГ,Найдя этим способом коэффициенты для всех возможных а, b и с, получим (х 4- у + zf = л;3 + у3 + г3 + Зх2у -+- Зху2 + 3yz2-\- 3 y2z -f- 3 xz2 + 3 x2z + 6 xyz. Такой же метод применим и в общем случае для нахождения выражения (х1-\-х2-\- ••• -+ хг)п. Из каждого множителя мы выбираем или хи или х2, или х3. . . , или хг, образуем произведе¬ ние этих элементов и складываем затем все полученные таким путем произведения. Мы получим всего гп произведений, но многие из них будут одинаковыми. Выбор одного слагаемого из каждого множителя определяет разбиение множества чисел от 1 до п на г ячеек. К первой ячейке мы отнесем номера тех мно¬ жителей, из которых выбран член Х\, ко второй ячейке — номера множителей, из которых выбран член л:2 и т. д. Каждый отдель¬ ный выбор слагаемых дает нам член вида хпххх\2 . . . хпггУ где ••• -\-пг = п; этому члену отвечает разбиение, для которого первая ячейка содержит П\ элементов, вторая ячейка п2 элементов и т. д. Для каждого подобного разбиения мы по¬ лучаем один член Х”'Х22 .. . хптг. Следовательно, число таких членов равно числу этих разбиений, т. е. равно ( п \ = «! . \nlt п2, ..., пг ) пх\ п2\ ... Пг\ Окончательно мы приходим к следующей полиномиальной теореме: Полиномиальная теорема. Выражение {хх -f- • • . . . 4~ хг)п равно сумме всевозможных членов вида V «I. «2 Яг/ 1 2 г где «1 + «2 + • • • + пг — п-
§ 7. Биномиальная и полиномиальная теоремы 157 Упражнения 1. Пользуясь биномиальной теоремой, найдите (a) (х + у)4; (b) (1 -I- xf- (c) (х — у)3; (d) (2х + ау-, (e) (2х — Зу)3; ({) (100—I)5. 2. Пользуясь полиномиальной теоремой, найдите (a) (x + y + z)*; (b) (2х + у — г)3; (c) (2 -|-2 -|- I)3. (Вычислите двумя способами.) 3. (а) Чему равен коэффициент при члене x2yzz2 в выражении (х + у + г)7? [Отв.: 210.] (Ь) Чему равен коэффициент при члене x6yzz2 в выражении (х—2г/ + 5г)и? [Отв.: —924 000.] 4, Используя биномиальную теорему, докажите, что 5. При помощи рассуждения, подобного использованному в § б, докажите, что (Указание. Докажите выполнимость условий упр. 12 из § 6, показав, что f(n, г— 1) есть число тех членов, которые не содержат хг, а f(n—1, г) есть число членов, содержащих хг (Можно также исполь¬ зовать упр. 17 из § б, показав, что каждый член в разложении опре¬ деляет упорядоченное разбиение числа п на г слагаемых.) 7. Сколько членов имеется в каждом из выражений: 6. Пусть / (/г, г) означает число членов в полиномиальном разложении для (хх + х2 + • • • + хг)п• Покажите, что (a) (х + у + г)6? (b) (а + 2b ]- 5с -f dy? (c) (r + s + t + u + v)*? [Отв.: 28.] [Отв.: 35.] [Отв.: 210.] 8. Докажите, что сумма всевозможных чисел i ), где п фикси ' г1> г2> ■ •■» rkJ ровано и гi + г2 + ... + rk = п, равна kn.
158 Гл. III. Разбиения и сочетания § 8*. ВЕС ПРИ ГОЛОСОВАНИИ Вернемся к задаче, поставленной в § 11 гл. II. Теперь мы бу¬ дем интересоваться не только голосующими коалициями, но также и весом отдельных участников голосования. Мы введем числовую меру, оценивающую этот вес, следуя Л. С. Шепли и М. Шубику (L. S. Shapley, М. Shubik) и рассмотрим некоторые относящиеся сюда примеры. Нетрудно понять, что само по себе число голосов, которым располагает данное лицо, не является хорошей мерой его веса в голосовании. Например, если лицо х имеет три голоса, а лицо у один голос, то из этого вовсе не следует, что х имеет в три раза больший вес, чем у. Так, если комитет состоит из трех членов {х, у, z} и z также имеет только один голос, то голос х является решающим, а у бесправен. Основная идея Шепли и Шубика заключается в рассмотре¬ нии всевозможных позиций членов комитета при отдельных го¬ лосованиях. Если расположить п членов комитета по степени их готовности голосовать за данное мероприятие, то получится не¬ которая позиция хь х2 ..., хп — другими словами, мы считаем, что Х\ является наиболее убежденным сторонником данного ме¬ роприятия, за ним в этом отношении следует х2 и т. д. Чтобы провести мероприятие, надо, чтобы за него проголосовал ряд членов комитета, начиная, разумеется, с Х\\ члены Х\, х2 и т. д. Если коалиция {хи х2, ..., xt} выигрывающая, а коалиция {*1, л*2 Xi-i) еще не выигрывающая, то достаточно убедить xt проголосовать за данное мероприятие; при этом члены коми¬ тета Хи х2, . . . , Xi-1 тем более проголосуют за него. Из числа всех i необходимых членов голосующей коалиции трудней всего будет убедить именно xt, который явится решающим членом коалиции. Мы назовем хь ведущим в данном голосовании. При чисто математическом подходе к определению веса ка¬ кого-либо члена комитета мы не рассматриваем конкретных взглядов отдельных членов. Вместо этого мы исследуем все возможные позиции членов комитета при различных голосова¬ ниях и посмотрим, как часто оказывается ведущим данное лицо. Для этого требуется рассмотреть все п\ перестановок. В каждой перестановке один член будет ведущим. Частота, с которой дан¬ ное лицо оказывается при голосовании ведущим, и может слу¬ жить мерой его веса в голосованиях. Определение. Весом члена комитета в голосованиях мы назовем число позиций, в которых он оказывается ведущим, де¬ ленное на общее число позиций. (При числе членов комитета, равном я, общее число позиций, разумеется, равно п\.)
§ 8 *. Вес при голосовании 159 Пример 1. Если все члены комитета имеют по одному голосу каждый и если мероприятия принимаются простым большинством голосов, то легко видеть (это следует из со¬ ображений симметрии), что каждый член оказывается ве¬ дущим в 1/я части всех позиций. Следовательно, каждый член имеет вес 1/я. Проиллюстрируем это положение для случая я = 3. Всего имеется 3! = 6 позиций. Чтобы меро¬ приятие было принято, достаточно двух голосов; следова¬ тельно, второй член всегда буает ведущим. Возможные позиции суть 123, 132, 213, 231, 312, 321. Ведущие члены обозначены жирными цифрами. Каждый член оказывается ведущим дважды, и, следовательно, имеет вес, равный 2__ J_ 6 — 3 ‘ Пример 2. Пересмотрим с этой точки зрения пример 3 из § 11 гл. II. Всего имеется 24 перестановки четырех чле¬ нов. Выпишем их, обозначая ведущий член жирной буквой: wxyz wxzy wyxz wyzx wzxy wzyx xwyz xwzy xywz xyzw xzwy xzyw yxwz yxzw ywxz ywzx yzxw yzwx zxyw zxwy zyxw zywx zwxy zwyx. Мы видим, что вес г равен 14/24, все w равен 6/24, а вес каждого из лиц хну равен 2/2». (Или, проще, их веса равны соответственно 7/i2, 3/12, V12, V12.) Мы замечаем, что отношения весов расходятся гораздо заметней, чем отношения для числа голосов, которые даются пропорцией 3:2: 1 : 1. Тройной голос стоит столько же, сколько стоят семь единичных голосов, и стоит более чем в два раза больше, чем двойной голос. Пример 3. В комитете из пяти человек каждый член имеет один голос, причем голос председателя является бло¬ кирующим (председатель имеет «право вето»). Следова¬ тельно, минимальные выигрывающие коалиции состоят из трех членов, включая председателя. Всего имеется 5! = 120 перестановок. Ведущий член не может предшествовать председателю, потому что коалиция без председателя не может быть выигрывающей. Следовательно, когда предсе¬ датель занимает место с номером 3, 4 или 5, то он является ведущим. Это имеет место в 3/5 всех перестановок. Когда он находится в положении 1 или 2, то ведущим является член с номером 3. Число тех перестановок, в которых пред¬ седатель занимает одно из первых двух положений, а дан¬ ный член занимает третье место, равно 2 • 3! = 12. Следо-
160 Гл. Ш. Разбиения и сочетания 1 1 1 ■ 3 ’ 3 1 3 • 1 1 2 = ш 6 , 6 ’ 3 * [Отв.: : 0, о, i; 1 1 2 : ш 6 , 6 ’ 3 • ,• 1 1 1 : у, 3 ’ з ■_ вательно, председатель имеет вес, равный 3/5, а каждый из остальных членов имеет вес, равный 7ю- Упражнения 1. В комитете, состоящем из трех человек, решения принимаются большин¬ ством голосов. Выпишите все позиции и подсчитайте вес в голосованиях каждого из трех членов, если эти члены имеют (a) по одному голосу каждый; (b) двое по одному голосу, а третий два голоса; (c) двое по одному голосу, а третий три голоса; (d) один, два и три голоса соответственно; Г Отв.: (e) двое по два голоса, а третий три голоса. 2. Докажите, что в любой выигрывающей коалиции сумма весов ее членов равна 1. 3. Чему равен вес лица, имеющего решающий голос? Чему равен вес бес¬ правного члена комитета? 4. В референдуме участвуют 100 000 человек. Две большие партии обладают соответственно 50 000 и 49 999 голосов; кроме того, имеется еще 1 неза¬ висимый. Вычислите веса двух партий и независимого участника голосо- вания. [Отв.: з , -g-. -g-.] 5. Комитет состоит из 100 рядовых членов, имеющих по одному голосу каж¬ дый и председателя, голос которого является решающим в случае ра¬ венства голосов двух сторон. Подсчитайте распределение весов. (Не пы¬ тайтесь выписывать все перестановки!) 6. В условиях упр. 5 дадим председателю блокирующий голос. Как это по¬ влияет на распределения весов? [Отв.: Председатель имеет вес, равный 50/ioi-] 7. Как изменятся веса в условиях упр. i, если комитет станет принимать ре¬ шения большинством в 3Д голосов? 8. Если в комитете из пяти человек, принимающем решения большинством голосов, каждый член имеет один голос, то вес каждого равен Vs- Пред¬ положим теперь, что два члена объединились и всегда голосуют одина¬ ковым образом. Увеличится ли от этого их вес? Всего лучше эту ситуа¬ цию можно представить, допуская только те перестановки, в которых эти два члена стоят рядом. [Отв.: Да, вес этой пары возрос с 0,4 до 0,5.] 9. Покажите, что если дано количество голосов, которым располагает каж¬ дый член выигрывающей коалиции, то можно определить минимальные выигрывающие коалиции. Покажите, что если известны все минимальные выигрывающие коалиции, то вес каждого члена можно определить, ни¬ чего не зная о числе голосов, которым располагают отдельные члены. 19. Для комитета, состоящего из трех членов, дайте ответы на следующие вопросы: (а) найдите все возможные множества минимальных выигрывающих коа¬ лиций;
§ 8 *. Вес при голосовании 161 (b) для каждого множества минимальных выигрывающих коалиции най¬ дите распределение весов в голосованиях; (c) проверьте, что различные распределения весов, найденные в упр. 1 и 7, являются единственно возможными. 11. В упр. 1 пункты (а) и (е) имеют одинаковый ответ; также пункты (Ь) и (d) упр. 1 и упр. 4 имеют одинаковый ответ. Воспользуйтесь резуль¬ татами упр. 9 для обоснования этого. ЛИТЕРАТУРА ДЛЯ ДОПОЛНИТЕЛЬНОГО ЧТЕНИЯ Кальбертсон Дж. Т., Математика и логика цифровых устройств, М., Учпедгиз (в печати), гл. II. Радемахер Г. п Теплиц О., Числа и фигуры, М., Физматгиз, 1962, гл. 9. Я глом А. М. п Я г л о м И. М., Неэлемептарные задачи в элементарном изложении, М., Гостехиздат, 1954, цикл. 5 раздела I. И Зак. 609
Глава IV ТЕОРИЯ ВЕРОЯТНОСТЕЙ § 1. ВВЕДЕНИЕ Часто мы слышим высказывания такого типа: «Вероятно, сегодня пойдет дождь», «Я имею все шансы сдать этот пред¬ мет», «С равной вероятностью монета может упасть кверху гер¬ бом или цифрой» и т. д. В каждом случае наше высказывание относится к событию, в исходе которого мы не уверены, но мы выражаем в той или иной степени веру в исполнение нашего предсказания. Теория вероятностей представляет собой матема¬ тическую схему для изучения подобных утверждений. Рассмотрим эксперимент, исход которого неизвестен. Пред¬ положим, что делается некоторое утверждение р об исходе этого эксперимента, и мы хотим приписать р определенную вероят¬ ность. Когда высказывание рассматривается изолированно, то обычно не напрашивается никакого естественного определения вероятности. Но наша цель другая: мы хотим найти средство приписывать вероятности всем мыслимым высказываниям, ка¬ сающимся исхода данного эксперимента. С первого взгляда эта задача может показаться безнадежной, потому что нет конца высказываниям, которые можно делать по поводу этого экспе¬ римента. Однако здесь нам помогает следующий фундаменталь¬ ный принцип. Основное допущение. Любым двум эквивалентным вы¬ сказываниям приписывается одна и та же вероятность. Пока у нас имеется конечное число логических возмож¬ ностей, множеств истинности будет только конечное число, и, следовательно, процесс приписывания вероятностей конечен. Мы действуем в три приема: (1) сначала определяем множество воз¬ можностей U, т. е. множество всех логических возможностей; (2) каждому подмножеству X множества U мы приписываем
§ 1. Введение 163 некоторое число, называемое мерой т(Х)\ (3) каждому выска¬ зыванию р мы приписываем в качестве вероятности этого вы¬ сказывания числот(Р) —меру множества Р истинности этого вы¬ сказывания. Вероятность высказывания р обозначается через Р[р]. Аналогичным образом определяют вероятность предиката f(x) = ci. Пусть А есть множество истинности этого высказыва¬ ния. Тогда PI f=a\ = m(A). Вероятность высказывания f (х) = а мы обозначили следую¬ щим образом: Р[/=а], что читается как «вероятность того, что f принимает значение а». Этим обозначением мы будем пользоваться в дальнейшем на протяжении всей книги. Первый шаг—определение множества логических возмож¬ ностей — мы рассмотрели в предшествующих главах. Важно на¬ помнить, что не существует однозначного метода для анализа логических возможностей. В одной и той же проблеме мы мо¬ жем производить очень тонкий или очень грубый анализ воз¬ можностей, в зависимости от чего U будет иметь большее или меньшее число элементов. После того как U выбрано, следующий шаг будет заклю¬ чаться в том, что мы сопоставим каждому подмножеству X мно¬ жества U некоторое число — его меру, которое в свою очередь будет принято за вероятность любого высказывания, имеющего X своим множеством истинности. Это достигается следующим образом. Приписывание меры. Поставим в соответствие каждо¬ му элементу множества U некоторое положительное число (вес) так, чтобы сумма всех весов равнялась 1. За меру произвольно¬ го подмножества множества U примем сумму весов всех его эле¬ ментов. Меру пустого множества О положим равной 0. В приложениях теории вероятностей к научным проблемам приписывание мер и анализ логических возможностей зависят от имеющейся у нас фактической информации и, следовательно, наилучшим образом эти операции могут быть произведены спе¬ циалистом, занимающимся данным вопросом. После того как каждому элементу приписан определенный нес, для нахождения вероятности отдельного высказывания сле¬ дует найти его множество истинности и затем подсчитать сумму весов, приписанных всем элементам найденного множества истинности. Эта проблема, которая может показаться легкой, часто заключает в себе большие математические трудности. 11*
164 Гл. IV. Теория вероятностей Развитие техники решения проблем такого рода составляет главную задачу теории вероятностей. Пример 1. Брошена обычная игральная кость. Какова вероятность того, что выпавшее количество очков будет меньше 4? Множество логических возможностей здесь бу¬ дет иметь вид U ={1, 2, 3, 4, 5, 6}. Симметрия игральной кости наталкивает на мысль считать, что вероятность вы¬ падения какой-либо грани будет одной и той же для всех граней. В соответствии с этим мы приписываем каждому из шести исходов вес 7в- Множеством истинности высказы¬ вания «Выпавшее количество очков меньше 4» будет мно¬ жество {1,2, 3). Следовательно, вероятность этого высказы- 3 1 вания равна ~§=~2 — сумме весов всех элементов его мно¬ жества истинности. Пример 2. Некто присутствует на бегах, в которых уча¬ ствуют три лошади А., В и С. Он чувствует, что А и В имеют примерно одинаковые шансы выиграть и что А (а следовательно, и. В) имеет вдвое больше шансов на вы¬ игрыш, нежели С. Какова вероятность того, что выиграет А или С? Примем за U множество {А. В. С}. Если исходу С мы припишем вес а, то каждому из исходов А и В мы дол¬ жны будем приписать вес 2а. Так как сумма этих весов должна равняться 1, то 2а + 2а + а = 1, откуда а = 7б- Поэтому исходам А, В и С мы приписываем соответственно 2 2 1 веса 5"’ у и 5"* Множеством истинности высказывания «Выигрывает лошадь А или С» служит множество (А, С}. ^ 2 I 1 Сумма весов элементов этого множества равна = у Следовательно, вероятность того, что выиграет А или ^ 3 С, равна -g-. Пример 3. Дважды подбрасывается монета. Тогда мно¬ жество логических возможностей можно записать так: U = (ГГ, ГЦ, ЦГ, ЦЦ}, где Г — выпадение герба, Ц — вы¬ падение цифры. Веса всех элементов множества Ч будем считать одинаковыми, равными {U для каждого элемента. Обозначим через / заданную на множестве U функцию, значение которой равно числу выпавших гербов. Тогда мно¬ жество истинности предиката f(x) = 1 имеет вид {ГЦ, ЦГ}. Мера этого множества равна 7г и, следовательно р [/= и = ]/2.
§ 1. Введение 165 Упражнения 1. Предположим, что данный эксперимент может иметь п разных исходов. Каким образом следует приписать веса этим исходам, если у нас нет оснований считать один из исходов более вероятным, чем другой? 2. Пусть U — {а, b, с}. Припишите веса трем элементам этого множества таким образом, чтобы никакие два элемента не имели одинакового веса, и найдите меры всех восьми подмножеств И. 3. Для Джонса вероятность победить в спортивном соревновании равна 7г» для Смита — 7з и для Блэка — ’/б. (a) Постройте И. (b) Припишите веса. (c) Найдите меры восьми подмножеств. (d) Укажите пару неэквивалентных высказываний, имеющих одинаковые вероятности. 4. Укажите множество возможностей U для каждого из следующих экспе¬ риментов: (a) Играется партия в шахматы с участием шахматистов А и В. (b) Выбирается наугад одно число, заключенное между 1 и 5. (c) Бросается (правильная) монета. (d) Студента спрашивают, когда его день рождения. 5. Для каких экспериментов из числа фигурирующих в упр. 4 естественно всем исходам эксперимента, приписать равные веса? 6. Предположим, что возможным результатам опускания монеты в неисправ¬ ный автомат для продажи орехов приписаны следующие вероятности: вероятность того, что вы ничего не получите, равна V2; вероятность того, что вы либо получите назад вашу монету, либо получите орехи (но не то и другое вместе) равна 7з- (а) Какова вероятность того, что вы получите назад вашу монету и, (Ь) Можно ли на основании имеющейся информации вычислить вероят¬ ность того, что вы получите орехи? [Отв.: Нет.] 7. Игральная кость налита свинцом таким образом, что вероятность выпа¬ дения каждой грани пропорциональна числу очков на ней. (Например, 6 очков выпадает в три раза чаще, чем 2 очка.) Какова вероятность вы- 8. Монета бросается три раза подряд. Перечислите восемь возможностей для исходов этих трех последовательных бросаний. Например, один из исхо¬ дов может быть записан в виде ГЦГ. Определите вероятностную меру, приписав каждому исходу один и тот же вес. Найдите вероятности сле¬ дующих высказываний: (г) Число выпадений герба больше числа выпадений цифры. кроме того, получите орехи? падения при одном бросании четного числа очков? [Отв.: (s) Выпадает в точности два герба. (t) Результаты всех бросаний одинаковы.
166 Гл. IV. Теория вероятностей 9. Какие из следующих равенств будут справедливы для высказываний г, <?, t, фигурирующих в упр. 8? (a) Р [ry s] = P[r] + P[s]; (b) Р[5 V t] = P[s] + P[t]\ (c) P[rv-r] = P[r] + P[-r]; (d) P[r V t] = P[r] + P\t}. 10. Какие из следующих пар высказываний' (см. упр. 8) несовместимы (на¬ поминаем, что два высказывания несовместимы, если их множества истинности не имеют общих элементов): (a) г, 5? (с) г, —' г? г/-л /кч / Ч1 (b) s, о (d) г, а [0тв- (Ь) и (с)-1 11. Сформулируйте теорему, подсказываемую результатами упр. 9 и 10. 12. Пусть К есть пространство логических возможностей, а тз и w— две ве¬ совые функции, задающие веса отдельных элементов в соответствии с нашими требованиями [v и w — функции, заданные на U]. Докажите, что тз -|- w не может быть весовой функцией. 13. Пусть и и v — две разные весоьые функции, определенные на одном про¬ странстве логических возможностей U. Пусть, кроме того, а и b—два неотрицательных числа, в сумме равные единице. Докажите, что аи + -|- bv также можно принять за весовую функцию. 14. Монету подбрасывают трижды. Обозначим через U пространство логи¬ ческих возможностей, содержащее восемь возможных исходов экспери¬ мента. Припишем всем элементам этого множества одинаковые веса. Пусть / есть функция с областью определения U, описывающая число выпавших «гербов». Определите множества истинности предикатов f(x) — = 1, f(x) = 2,f(x) = 3 и вероятности Р [/= 0], Р [/= 1], Р[/=2], Р[/=3]. [Частичный отв.: Р [/= 3] = У8, Р [/= 1] = 3/8-] 15. Игральная кость бросается дважды. Каждому из 36 элементов простран¬ ства логических возможностей U приписывается один и тот же вес. Пусть / есть функция с областью определения 2/, равная сумме выпав¬ ших чисел. Определите Р [f= а] для а = 2, 3, ..., 12. [Частичный отв.: Р [/= 11] = Vis» Р [/= П = У6-] § 2. СВОЙСТВА ВЕРОЯТНОСТНОЙ МЕРЫ Прежде чем изучать специальные вероятностные меры, мы рассмотрим некоторые общие свойства вероятностных мер, кото¬ рые будут полезны для вычислений и для общего понимания тео¬ рии вероятностей. Три основных свойства вероятностной меры таковы: (A) т(Х) = 0 тогда и только тогда, когда X = О, (B) 0 Cm (X) С 1 для любого множества X. (C) Для двух множеств X и Y m (ATи У) = rn (X) -(■ пг (У)
§ 2. Свойства вероятностной меры 167 тогда и только тогда, когда А и У не пересекаются, т. е. пе имеют общих элементов. Доказательство свойств (А) и (В) переносится в упражне¬ ния (см. упр. 19). Докажем свойство (С). Мы видим, что m(X)-\-m(Y) есть сумма весов всех элемен¬ тов подмножества X, сложенная с суммой весов всех элементов подмножества У. Если А и У не пересекаются, то вес каждого элемента из АиУ фигурирует в сумме m(X}~y m(Y) один и только один раз, и следовательно, т {Х)-\-т (Y) = т (XU У). Допустим теперь, что А и У пересекаются. В таком случае вес каждого элемента, содержащегося как в А, так и в Y, т. е. в А П У, фигурирует в сумме т (Х)-\~т [У) дважды. Таким образом, эта сумма больше чем т(Х\] У) на величину т (уУП У). В силу (А) и (В), если Х[\ У — непустое множество, то т {X П У) > 0. Следовательно, в этом случае мы имеем т *Аг)-|- -Ут (У) > т (ATU У). Таким образом, если А и У пересекаются, то равенство (С) не имеет места. Из нашего доказательства видно, что в общем случае спра¬ ведливо предложение: (С') Для любых двух множеств X и У m{XU Y) = m(X)-y m(Y) — m(Xf] У). Ввиду того что вероятности высказываний получаются не¬ посредственно из вероятностной меры пг (А), всякое свойство вероятностной меры может быть прочтено на языке вероятностей высказываний. Например, рассмотренные выше свойства (А) — (С7) звучат на этом языке так: (a) Р [/?] = 0 тогда и только тогда, когда р логически лолсно. (b) 0<Р[р]<:1 для любого высказывания р. (c) Равенство Р[/> V <7] = РН + РМ справедливо тогда и только тогда, когда высказывания р и q не¬ совместимы. (с7) Для любых двух высказываний р и q Р[р V <7] = Р[р| + РМ — Р1^ Л <?]• Еще одно свойство вероятностной меры, часто используемое при вычислениях, состоит в следующем: (D) m{X) = 1—т(Х), или, на языке вероятностей высказываний, (d) Р[~/>] = 1-Р1/>].
168 Гл. IV. Теория вероятностей Доказательство свойств (D) и (d) переносится в упражнения (см. упр. 20). Важно обратить внимание на то, что наша вероятностная мера приписывает вероятность, равную 0, только логически лож¬ ным высказываниям, т. е. таким высказываниям, которые лож¬ ны для каждой логической возможности и для которых предска¬ зание истинности высказывания будет заведомо неправильным. Подобным же образом высказыванию приписывается вероят¬ ность 1 тогда и только тогда, когда оно истинно во всех слу¬ чаях, т. е. логически истинно, и предсказание истинности выска¬ зывания будет заведомо правильным. (Хотя эти свойства вероятностной меры и кажутся вполне естественными, в тех слу¬ чаях, когда приходится иметь дело с бесконечными множествами возможностей, их необходимо несколько ослабить. В этой книге мы будем рассматривать только конечные множества возмож¬ ностей.) Займемся теперь интерпретацией вероятностей, не равных ни 0, ни 1. Мы остановимся лишь на нескольких интуитивных идеях, которые обычно возникают при рассмотрении вероятно¬ стей. Хотя эти идеи могут быть оформлены математически более точным образом, мы приводим их здесь только для ориенти¬ ровки в интуитивных рассмотрениях. Предположим, что в связи с данным экспериментом какому- то высказыванию была приписана вероятность р. Из этого часто заключают, что если последовательность таких экспериментов проведена при идентичных условиях, то доля экспериментов, исход которых делает это высказывание истинным, приблизи¬ тельно равняется р. Математической версией этого служит «за¬ кон больших чисел» теории вероятностей (о котором будет идти речь в § 11). В тех случаях, когда не имеется естественного спо¬ соба введения вероятностной меры, вероятность высказывания оценивается экспериментально. Производится серия эксперимен¬ тов, и доля тех экспериментов, при которых это высказывание оказывается истинным, принимается за приближенную вероят¬ ность этого высказывания. Вторая, родственная предыдущей интерпретация вероятно¬ стей, имеет отношение к пари. Предположим, что некоторому высказыванию приписана вероятность р. Мы хотим предложить пари, что это высказывание окажется в действительности истин¬ ным. Мы соглашаемся заплатить г долларов, если это высказы¬ вание окажется ложным, при условии, что нам заплатят s дол¬ ларов, если оно окажется истинным. Какими должны быть г и 5, чтобы пари было честным? Если верно, что при большом числе таких пари доля выигрышей в s долларов равна р и доля проигрышей в г долларов равна 1—р, то наш средний
§ 2. Свойства вероятностной меры 169 выигрыш, приходящийся на одно пари, будет равняться sp — r( 1 —р). Чтобы пари было честным, средняя величина выигрышей должна равняться нулю, что будет иметь место, если sp = r( 1 —р) или r/s = р/( 1 —р). Заметим, что этим определяется только отноше¬ ние чисел г и 5. Про такое отношение г : 5 говорят, что оно опре¬ деляет шансы сторон в данном пари или условия, при которых пари будет честным. Пример. Допустим, что некоторой лошади приписана вероятность 3/4 выиграть на скачках. Тогда шансы сторон в пари относятся как -^г'Т * ^то отношение можно также записать в виде 3:1, 6:2, 12 : 4, и т. д. Для того чтобы пари было честным, надо условиться платить 3 доллара, если эта лошадь проиграет, и взимать 1 доллар, если она выиграет. При другом варианте честного пари следует пла¬ тить 6 долларов, если лошадь проиграет, и взимать 2 дол¬ лара, если она выиграет. 2. Используя результат упр. 1, найдите 1 2 3. Пусть р и q — такие высказывания, что Р [/?]= — и Р[(/] = у. Совме¬ стимы ли р и #? [Отв.: Да.] 4. Покажите, что если Р[р]-{- Р [q] > 1, то р и q совместимы. 5. Студент озабочен предстоящими экзаменами по английскому языку и по истории искусств. По его мнению, вероятность того, что он сдаст анг¬ лийский язык, равна 0,4; вероятность того, что он сдаст по крайней мере один предмет, равна 0,6, но вероятность того, что он сдаст оба предме¬ та, равна всего лишь 0,1. Какова вероятность того, что он сдаст экза¬ мен по истории искусств? [Отв.: 0,3.] 6. Известно, что студент имеет вероятность 0,9 сдать некоторый экзамен и вероятность 0,6 сдать его ниже, чем на «отлично». Какова вероятность того, что студент получит оценку «хорошо» или «удовлетворительно»? [От» - -g-] Рассмотрим такую игральную кость, у которой вероятность выпадения каждой грани пропорциональна числу точек, выгравированных на этой грани (ср. упр. 7 из § 1). Пусть / еств функция, указывающая исход опыта по бросанию кости; эга функция принимает значения {1, 2, . .., 6}.: Упражнения 1. Пусть р и q — такие два высказывания, что р[/?д^] = —, и Р[<7] = у. Чему равна Р [p\fq]*?
170 Гл. IV. Теория вероятностей Вычислите (a) Р [(/ = 2)\/(/ = 4)\/(/ = 6)]; [Отв.;!.] (b) Р[(/= l)V(/=2)v(/=5)]; (c) Р [/¥= 2]; (d) Р [/ > 2]; [Отв.: у.] (e) P[(/=7)V(/=jfe'7)]; (f) Р [(/ = 4) V(/> 2)]. 8. Монета подбрасывается дважды. Обозначим через f\ и /2 функции, ука¬ зывающие исходы первого и второго экспериментов. Область возможных значений каждой из этих функций имеет вид {Г, Ц}, а область опреде¬ ления— {ГГ, ГЦ, ЦГ, ЦЦ}. Вычислите (a) Р [C/i = Г] V (Л ¥= Г)]; (b) Р IЛ = Щ; (c) P[(/i = r)V(/2 = r)]; (d) Р[/2^Ц]. 9. Дважды бросается (правильная) игральная кость. Обозначим через f\ и /2 функции, указывающие исходы первого и второго экспериментов. Вы¬ числите . (a) Р [(/, = 3)Л(/2 < 4)]; [отв.: ~ .] (b) РК/, ^6)Л(/2 > 3)]; [Отв.: (c) P[(/,^7)v(/2<5)]; (d) Р [(/, = 7) V (/г Ф 3)]- Отв.: 1.] Отв.: . 10. Каковы условия честного пари, в котором некто утверждает, что при бро¬ сании игральной кости выпадет шесть очков? 11. При каком условии следует соглашаться держать пари, что на бегах, о которых говорится в примере 2 из § 1, первой придет одна из лошадей А или В? 12. Докажите, что если условия честного пари о том, что данное высказы¬ вание истинно, записываются дробью г : s, то вероятность того, что это высказывание окажется истинным, равна r/(r + s). 13. Используя результат упр. 12 и определение «условий честного пари», по¬ кажите, что если г : s — условия честного пари о том, что данное вы¬ сказывание истинно, то 5 : г — условия честного пари о том, что это вы¬ сказывание ложно. 14. Некто готов держать пари с условиями 5 : 4, что в первенстве США по бейсболу выиграет команда Доджерс. Какой должна быть вероятность 5 выигрыша Доджерс для того, чтобы это пари было честным? [Отв.: д-.] 15. Некто путем многократных наблюдений за.ключил, что в 85% тех слу¬ чаев, когда он моет свой автомобиль, на следующий день идет дождь. На каких условиях он должен держать пари, что это произойдет и в следующий раз? 16. Некто предлагает пари с условиями 1 : 3, что наступит событие А и пари с условием 1 : 2, что наступит событие В. Он знает, что А и В не могут
§ 3. Симметричная мера 171 иметь место одновременно. На. каких условиях он согласится держа1Ь пари, что наступит одно из двух событий А или В? [Отв.: 7 : 5.] 17. Некто предлагает пари с условием 3 : 1, что наступит событие А и пари с условием 2:1, что наступит событие В. Он знает, что А и В не могут иметь место одновременно. На каком условии он согласится держать пари, что наступит одно из двух событий А или В? 18. Из определения вероятностной меры вывести, что т(Х) = 1 тогда и только тогда, когда X = U. . 19. Из определения вероятностной меры выведите ее свойства (А) и (В), указанные в тексте. 20. Выведите указанное в тексте свойство (D) вероятной меры'. Почему свой¬ ство (d) вытекает из (D)? 21. Докажите, что если R, S и Т — три попарно не пересекающиеся множе¬ ства, то m(R[jSU Т) = m{R) + m (S) + m (Г). 22. Докажите, что если X и У— такие два множества, что X является под¬ множеством У, то m (X) ^ m (Y). 23. Докажите, что если р и q— такие высказывания что из р следует qs го Р[р]<РМ. 24. Пусть даны п высказываний и каждому высказыванию приписана вероят¬ ность, не превосходящая г. Докажите, что вероятность дизъюнкции этих высказываний не превосходит пг. 25. Ниже приведено доказательство свойства (С'), отличное от данного в тексте. Обоснуйте каждый шаг. (a) X\jY = (X П?)[](ХПУ)и(ГПХ), (b) m(XUY) = m(X(]?) + m(X(]Y) + m(2t(]Y), (c) m(XUY) = tmX) + m(Y) — m(X()Y). 26. Докажите, что для трех множеств X, Y и Z и любой вероятностной меры m (ATU У U Z) = m (X) + т(У) + т (Z) — — т (Х(] У) — т (УП Z) — т (Xf]Z) + т (Х{] Y[\Z). 27. Переведите результат упр. 26 на язык вероятностей высказываний. 28. Ста.вится доллар против цента за то, что некоторое событие произойдет. В предположении, что пари честное, найдите вероятность наступления ЮО 1 этого события. итв.. -. § 3. СИММЕТРИЧНАЯ МЕРА Выше мы уже рассмотрели несколько примеров, в которых при введении вероятностной меры оказалось естественным при¬ писать всем логическим возможностям один и тот же вес. Ве¬ роятностную меру, определенную таким образом, назовем сим¬ метричной. В случае симметричной меры выражение для меры множеств приобретает очень простую форму. В самом деле, если U содержит п элементов и если вероятностная мера сим¬ метричная, то для любого множества X имеем: ш(Х) = r/я, где г'— число элементов множества X. Это следует из того, что вес кпждого элемента множества X равен 1/я, потому сумма ве¬ сов всех элементов X равна г/я.
172 Гл. IV. Теория вероятностей Эта простота симметричной меры делает ее особенно удоб¬ ной при вычислениях. В связи с этим важно отметить, что в од¬ ной и той же ситуации один выбор множества возможностей может привести к симметричной мере, в то время как другой выбор к ней не приводит. Например, возьмем случай двукратного бросания обычной монеты. Предположим, что нас интересует высказывание о числе выпадений герба. Если в качестве множе¬ ства возможностей взять U — {ГГ, ГЦ, ЦГ, ЦЦ}, то будет ра¬ зумно приписать один и тот же вес каждому исходу, что приве¬ дет нас к симметричной мере. Если бы, с другой стороны, в каче¬ стве возможных исходов мы взяли множество U = {ни одного Г, один Г, два Г}, то было бы неразумным приписывать всем исходам один и тот же вес, потому что один герб может выпасть двумя различными способами, тогда как каждая из других воз¬ можностей может осуществиться только одним способом. Пример 1. Предположим, что мы бросаем две различ¬ ные игральные кости. На каждой кости может выпасть не¬ которое число очков, равное одному из чисел от 1 до 6; следовательно, имеется 6*6 = 36 возможностей. Припишем каждой возможности вес -gg-. Тогда всякое предсказание, истинное в / случаях, будет иметь вероятность -gg-• На¬ пример, «Сумма очков на обеих костях равна 5» будет истинно, если выпадет 1 + 4, 2 + 3, 3 + 2 или 4 + 1 очков. Следовательно, вероятность того, что сумма очков будет к 4 1 ^ равна 5, равна -gg- = —g-. Сумма очков может равняться 12 только в одном случае, при выпадении 6 + 6 очков. Сле¬ довательно, вероятность выпадения 12 очков равна -gg- • Пример 2. Предположим, что из колоды в 52 игральные карты выбираются последовательно две карты. Какова ве¬ роятность, что обе они червонные? Для первой карты имеется 52 возможности и для каждого выбора первой карты для второй карты остается 51 возможность. Следо¬ вательно, для выбора двух карт (где мы различаем, какая карта была взята первой, а какая — второй) имеется 52-51 возможностей. Мы введем симметричную меру. Вы¬ сказывание «Обе карты червонной масти» истинно для 13-12 из 52-51 возможностей. Следовательно, вероят¬ ность этого высказывания равна (13- 12)/(52-51) Пример 3. Допустим, что предлагается метод, позволяю¬ щий по некоторым признакам судить о будущих успехах студентов, и что в применении к студентам А, В и С при
I 1 § 3. Симметричная мера 173 поступлении их в колледж этим методом было получено следующее предсказание: после четырех лет учебы при окончании колледжа наибольших успехов достигнет А, за ним будет идти С, а В будет последним из троих. Предполо¬ жим, что это предсказание в точности сбылось. Если рас¬ сматриваемый метод предсказания не имеет никакой цен¬ ности и, следовательно, предсказания равнозначны -просто¬ му угадыванию, то чему равна вероятность того, что такое предсказание окажется правильным? Имеется 3! = 6 воз¬ можных порядков распределения студентов в зависимости от их успехов по окончании ими колледжа. Если предсказания в действительности равнозначны угадыванию, то мы можем приписать один и тот же вес каждому из шести исходов. В таком случае вероятность того, что сбудется отдельное предсказание, равна Поскольку эта вероятность доста¬ точно велика, мы поколебались бы заключить, что данный метод предсказания действительно полезен, на основании единственного эксперимента. Предположим, с другой сто¬ роны, что этим методом правильно предсказан порядок ше¬ сти человек. Тогда аналогичный анализ показал бы, что в случае угадывания вероятность правильного предсказания равна gy = 'y^Q- Следовательно, здесь мы можем заключить о наличии сильного довода в пользу того, что предложен¬ ный метод не лишен ценности. Упражнения 1. Из слова «наугад» выбирается наугад одна буква. Какова вероятность того, что это будет буква у? Какова вероятность, что это будет гласная? |Отв.: 6 ; 2 .j 2. Выбирается наугад одно число между 3 и 12 включительно. Какова ве¬ роятность того, что это число будет четным? Что оно будет четным и будет делиться на 3? 3- Из колоды в 52 карты выбирается наугад одна карта. (a) Какова вероятность того, что это будет карта червонной масти или трефовый король? j^Owe.: - J (b) Какова вероятность того, что это будет или червонная дама или «картинка» (т. е. валет, дама, король или туз)? j^Ome.: 4. Из множества слоев И = {поп, лоб, лось, авось, любовь} выбрано наугад одно слово. Пусть р, q и г означают высказывания: р: Это слово имеет две гласные. q: Первой буквой этого слова является буква л, г: Это слово рифмуется со словом морковь.
174 Гл. IV. Теория вероятностей I Найдите вероятности следующих высказываний; (a) Р\ (b) q; (c) п (d) pAq; (e) (PVq)A~n (f) p-+q. [Ome:. y.J 5. Бросается игральная кость. Найдите вероятность того, что (a) выпадет нечетное число очков; (b) выпадет более двух очков; (c) выпадет семь очков. 6. Предположим, что в примере с участниками математической олимпиады (см. § 1 гл. II) все 36 результатов олимпиады одинаково вероятны. Най¬ дите (a) вероятность того, что участник А решит большее число задач, чем каждый из его соперников; j^O/тгв.: -~| (b) вероятность того, что все задачи решит первым один и тот же участ¬ ник соревнования; . j. (c) вероятность того, что различные задачи решат первыми различные участники. [Отв.: 0.] 7. Игральная кость бросается дважды. Какое значение суммы очков при двух бросаниях имеет наибольшую вероятность? Найдите значение или значения суммы очков, имеющие самую меньшую вероятность выпадения. 8. Фотограф располагает одного мальчика и двух девочек в ряд случайным образом. Какова вероятность того, что на фотографии мальчики и де¬ вочки будут чередоваться? j^Ome.: —— .j 9. В одном колледже имеется 500 студентов, причем известно, что 300 изучают французский язык, 200 изучают немецкий язык, 50 изучают русский язык, 20 изучают французский и русский языки, 30 изучают немецкий и русский языки, 20 изучают немецкий и французский языки, 10 изучают все три языка. Из этого колледжа выбирается наугад один студент. Какова вероят¬ ность того, что выбранный студент; (a) изучает два и только два языка? (b) изучает по крайней мере один из трех языков? 10. Предположим, что трое лиц садятся за стол, за которым стоят подряд шесть стульев. Если они выбирают свои места наугад, то какова ве¬ роятность того, что они рассядутся таким образом, что между ними не будет пустых стульев? Какова вероятность того, что между любыми дву» мя из них будет находиться по крайней мере один пустой стул?
§ 3. Симметричная мера 175 11. Найдите вероятность получения следующих карт при игре в покер. (В покере каждый игрок получает пять карт, выбранных наугад из ко¬ лоды в р2 карты.) (a) «Фле^-рояль» (десятка, валет, дама, король, туз одной масти). ^ \Otne.: 4Д 52 ) « 0,0000015. j (b) «Стрит\флеш» (пять последовательных карт одной масти, ■ но не флеш-рояль). j^Ome.: (40—4)^ ^ « 0,000014.J (c) «Каре» (четыре карты одного и того же значения). [Отв.: 624Д 52 ) як 0,00024. j (d) «Фул» (две карты одного значения и оставшиеся три карты также одного и того же значения). j^Ome.: 3744^ ^ ^ 0,0014. j (e) «Флеш» (пять карт одной масти, но не «стрит-флеш» и не «флеш- рояль»). (5148—40)/^ ^ 0,0020. j (f) «Стрит» (пять последовательных карт, но не все одной масти). | Отв.: (10 240—40) Д 52 ) як 0,0039. j (g) «Стрит» или лучше, чем «стрит». [Отв.: «0,0076] 12. Пусть десять человек располагаются за круглым столом случайным об¬ разом. Какова вероятность того, что два данных человека сядут рядом? 13. В комнате находится группа из п человек, каждый из которых имеет зна¬ чок с номс.-ром от 1 до п. Если выбираются наугад два человека, то ка¬ кова вероятность того, что человек с большим номером имеет номер 3? Решите эту задачу для случаев п = 5, 4, 3, 2. j^Ome.: -g-; O.j 14. В условиях упр. 13 предположим, что мы видели, как два человека поки¬ нули комнату, причем больший из номеров их значков был 3. Какие предположения мы можем строить относительно номеров значков людей, оставшихся в комнате? 15. Найдите вероятность того, что игрок в бридж (см. пример 2 из § 5 гл. Ill i получит (a) 5 карт одной масти, 4 другой, 3 третьей и 1 четвертой. (13) (b) 6 карт одной масти, 4 второй, 2 третьей и 1 четвертой. [Отв.: « 0,047.] (c) 4 карты одной масти, 4 второй, 3 третьей и 3 четвертой. [Отв.: « 0,216.] (d) 4 карты одной масти, 3 второй, 3 третьей и 3 четвертой. [Отв.: «0,105.] *«• При сдаче карт в бридже каждый игрок заранее имеет ^ —6,35* 10й
176 Гл. IV. Теория вероятностей / возможностей. Найдите вероятность того, что при случайном/распределе¬ нии карт все 13 карт окажутся одной и той же масти. Какой порядок величины должно иметь среднее число сдач карт, приходящееся на каж¬ дого из 150 000 (примерно) потенциальных игроков в бридж в Соединен¬ ных Штатах Америки, для того, чтобы можно было считать вероятной в течение года сдачу карт, при которой кто-нибудь получит карты одной и той же масти? ' 17. Из колоды в 52 карты последовательно извлекаются три/карты. Пусть/ есть функция, определяющая число извлеченных карт черных мастей. Об¬ ласть изменения значений / есть {0, 1, 2, 3}. Определите Р[/ = я] для а = 0, 1, 2, 3. 18. Пусть / есть функция, определяющая сумму номеров двух выбранных людей, фигурирующих в упр. 13. Тогда областью изменения значений / является {3, 4, ..., 2п—1}. Вычислите Р[/ = 5] для п = 5, 4, 3 и 2. 19. В кармане одного человека имеются восемь монет: три дайма и пять никелей1). Человек наугад выбирает три из них и записывает вели¬ чину вынутой суммы (в центах). Обозначим эту сумму через /. Вычислите § 4*. ДВА ПРИМЕРА, НЕ ПОДКРЕПЛЯЕМЫХ ИНТУИЦИЕЙ Может оказаться, что ответ на какую-нибудь задачу, полу¬ ченный с помощью теории вероятностей, совершенно не согла¬ суется с нашей интуицией. Очень поучительна в этом отношении задача о совпадении дней рождения. Пусть в некоторой комнате. присутствует г человек, и мы держим пари, что из этих г человек по крайней мере двое роди¬ лись в один и тот же день, т. е. в один и тот же месяц и одного и того же числа. Мы хотим определить значение г, для которого пари будет честным. Немногие бы согласились заключить это пари на равных условиях, если число людей в комнате меньше 100. Большинство назвало бы в качестве приемлемого количе¬ ства людей 150. Однако мы увидим, что при г = 150 имеется примерно 45 • 1014 шансов против одного, что по крайней мере у двоих присутствующих день рождения один и тот же. Мы увидим также, что пари следует держать на равных условиях уже при наличии 23 человек в комнате. [Отв.: V5, 7з, 7з, 0.] (a) Р [/ > 20]; (b) Р [/ ^ 22]; (c) P[/=10V/>25]. 0 См. подстрочное примечание на стр. 42.
§4*. Два примера, не подкрепляемых интуицией 177 Найде^ сначала вероятность того, что никакие два из г че¬ ловек не имеют одного и того же дня рождения. Для дня ро¬ ждения каждого человека имеется 365 возможностей (мы пре¬ небрегаем 366-й возможностью, связанной с днем 29 февраля). Тогда для дней рождения г человек имеется 365г возможностей. Мы считаем все эти возможности равновероятными. Для нахо¬ ждения вероятности того, что никакие двое из присутствующих Число человек в комнате Вероятность совпадения дней рождения по край¬ ней мере двух человек Приблизительное условие честного пари 5 0,027 10 0,117 15 0,253 20 • 0,411 70: 100 21 0,444 80: 100 22 0,476 91 : 100 23 0,507 103: 100 24 0,538 103: 100 25 0,569 132: 100 30 0,706 242: 100 40 0,891 819: 100 50 0,970 33: 1 60 0,994 169: 1 70 1 200: 1 80 12 000: 1 90 160 000: 1 100 33 • 105 : 1 125 31 • 109 :1 150 45- 1014: 1 Фиг. 78 не имеют одного и того же дня рождения, мы должны найти число тех возможностей для дней рождения, в которых никакой День не фигурирует дважды. Первый человек может иметь в качестве своего дня рождения любой из 365 дней. Каждый из них оставляет для второго человека (день рождения которого Должен быть другим!) 364 возможности. Для третьего человека имеется 363 возможности, если требовать чтобы его день ро¬ ждения был отличен от дней рождения двух предыдущих л*одей и т. д. Таким образом, вероятность того, что в группе из г человек никакие два человека не имеют одного и того же днц 12 За к. 609,
178 Гл. IV. Теория вероятностей рождения, равна л 365 • 364 ... (365 — г + 1) Чг— 36У • Вероятность того, что по крайней мере два человека имеют один и тот же день рождения, равна Pr = 1—Яг• На фиг. 78 приведены для ряда значений г величины рг и условия ЛУО — Рг) честного пари. Рассмотрим теперь вторую задачу, в которой интуиция так¬ же не помогает в получении правильного ответа. Мы видели, что имеется п\ перестановок чисел от 1 до п. Будем рассматри¬ вать каждую из этих перестановок как операцию, приписываю¬ щую каждому из чисел одну из п возможных позиций (каждое число занимает одну и только одну позицию). Предполагается, что позиции занумерованы последовательными числами от 1 до п. Будем говорить, что Те число (т. е. число, занимающее i-ю позицию) оставляется на месте данной перестановкой, если эта перестановка приписывает позицию (номер) i числу i. На¬ пример, если п = 3, то перестановка 123 оставляет все числа на месте, перестановка 213 оставляет одно число на месте, и пере¬ становки 312 и 231 не оставляют на месте ни одного числа. [Очевидно, что при п = 3 не могут остаться на месте в точности два числа. (Почему?).] Определение. Перестановка называется полной, если она не оставляет на месте ни одного числа. Задача, которую теперь мы хотим рассмотреть, формули¬ руется следующим образом. Пусть выбирается наугад переста¬ новка п чисел; какова вероятность того, что эта перестановка окажется полной? Эту задачу можно также представить в сле¬ дующей наглядной форме. Гардеробщица выдала номерки п лицам, сдавшим в гардероб п шляп. Выдав все номерки одно¬ временно, она после этого безнадежно перепутала все шляпы и повесила их наугад. Какова вероятность того, что каждому из этих п лиц гардеробщица выдаст чужую шляпу? В этой задаче одним людям интуиция подсказывает, что для большого числа шляп искомая вероятность должна быть очень маленькой, дру¬ гим— что она должна быть большой. Немногие догадаются, что эта вероятность не мала и не велика и что она почти не зависит от числа фигурирующих шляп. Чтобы найти эту вероятность, допустим, что все п\ переста¬ новок равновероятны и, следовательно, нам нужно только под¬ считать число полных перестановок из п элементов. Пусть w п означает число таких перестановок. Тогда искомая вероятность равна pn = wtJn!. Произведя нужные вычисления (см. упр. 10), мы найдем __i L_i_J +_L Рп — 2! 3! ' 4! • • ' — п\ '
\ §4*. Два примера, не подкрепляемых интуицией 179 где последний член берется со знаком плюс при четном п и со знаком минус при нечетном п. На фиг. 79 приведены значения числа р для нескольких значений п. Число ШЛЯ Г1 Вероятность того, что ни один посетитель не получит своей шляпы 2 0,500000 3 0,333333 4 0,375000 5 0,366667 6 0,368056 7 0,367857 8 0,367882 Фиг. 79 Можно показать, что с возрастанием числа шляп эти вероят¬ ности неограниченно приближаются к числу \/е = 0,367879..., где е = 2,7182818... есть число, играющее важную роль во многих разделах математики *). Упражнения 1. В школе имеется три выпускных класса, в каждом из которых 30 человек. , На каком условии согласились бы вы держать пари, что по меньшей ме¬ ре два выпускника имеют один и тот же день рождения? [Отв.: 160 000 : 1.] 2. Какова вероятность, что по меньшей мере два студента вашей группы имеют один и тот же день рождения? 3. На каком условии согласились бы вы держать пари, что по меньшей мере два участника сборной команды страны по футболу имеют один и тот же день рождения? 4. На каком условии согласились бы вы держать пари, что по меньшей мере два академика родились в один и тот же день года? 5. Четыре человека сда.ют свои шляпы в гардероб. В предположении, что шляпы возвращаются наугад, найти вероятность того, что все четверо 9 Число е — основание системы натуральных, или неперовых, логарифмов— можно определить как lim (Ч-К-Уили как lim (l -f- -Ч -f- Ч- + • • • + —Ч п-> оо \ п) /г-> оо \ 1.2! П.) (т> е. как сумму бесконечного ряда 1 -f- -j-j—1—^—[- ... -f- 4j 4~ ...j. 12*
180 Гл. IV. Теория вероятностей получат свои собственные шляпы. Какова вероятность того, что свои собственные шляпы получат в точности 3, 2, 1, 0 человека? \0тв:- 24 ’ 0: 7’ 3s T’j 6. 50 мужчин и . их жены начинают танцевать. Партнеры в танце выбираются по жребию. Какова приближенная вероятность того, что ни один муж¬ чина не будет танцевать со своей женой? 7. Докажите, что вероятность совпадения дней рождения в точности двух человек из общего числа г человек равна / г \ 365 • 364 ... (365 — г + 2) г “ \ 2 ) Ш * 8. Покажите, что tT = ^ ^ ) 355^ r » г^е tr определено в упр. 7, a qr есть вероятность того, что никакие два человека не имеют одного и того же дня рождения. 9. Используя результат упр. 8 и результаты, приведенные в таблице на фиг. 78, найдите (для случаев г = 15, 20, 25, 30, 40 и 50) вероятность того, что в группе из г человек имеется в точности два человека с одним и тем же днем рождения. [Отв.: 0,22; 0,32; 0,38; 0,38; 0,26; 0,12.] 10. Пусть wn означает число полных перестановок п чисел. (a) Покажите, что w i=0, w2 = 1, .. Wn = (п — 1) wn_x -|- (/г — 1) wn_2, /2 = 2, 3 (Указание. Любая полная перестановка п чисел может быть полу¬ чена из полной перестановки п—1 чисел, или из такой перестановки п — 1 чисел, которая оставляет на месте ровно одно число. Опишите, каким образом это можно сделать, и покажите, что первый и второй члены правой части нашего равенства равны числу тех полных пере¬ становок, которые можно получить соответственно первым и вторым спо¬ собом.) (b) Пусть рп означает вероятность того, что выбранная наугад переста¬ новка п чисел будет полной. Из (а) выведите, что п 1 р 1=0, р2 = -J, П—1 ,1 Q л Рп = —— Рп-\+— Рп-2> /2 = 3, 4 (c) Пусть vn = рп — рп-\ для /г = 2, 3, 4 Из (Ь) выведите, что n(Pn — Pn-\) = — (Pn-i—Pn-2)> п = 3, и, следовательно, что nvn = — vn_lf /2 = 3, ... . (d) Используя тот факт, что рх = 0 и р2 = -g- , найдите v2. Используя результат (с), найдите v3, v4, vn. (e) Используя результат (d), покажите, что 11. 1
§ 5. Условная вероятность 181 11. В известной карточной игре «солитер» игрок последовательно по одной открывает карты тщательно перетасованной колоды из 52 карт и одно¬ временно в заранее выбранном порядке перечисляет все карты этой ко¬ лоды. Его цель заключается в том, чтобы перебрать все карты, ни разу не назвав открывшуюся карту. Какова здесь вероятность выигрыша? Ка¬ кой будет вероятность выигрыша, если ограничить колоду лишь картами одной и то же масти (например, пик)? § 5. УСЛОВНАЯ ВЕРОЯТНОСТЬ Пусть дано множество U, всем подмножествам которого при¬ писана определенная мера. Если р— некоторое высказывание, то оно имеет вероятность Р[р\ = пг(Р). Предположим теперь, что мы получаем дополнительную информацию, согласно которой некоторое другое высказывание, скажем q, истинно. Каким об¬ разом эта дополнительная информация изменит вероятность высказывания р? Вероятность высказывания р после получения такой инфор¬ мации о высказывании q называется условной вероятностью и обозначается символом Pq[p\> который следует читать «вероят¬ ность р при условии q». В этом разделе будет изложен метод нахождения условной вероятности при помощи меры пг. Если известно, что q истинно, то тем самым первоначальное множество возможностей U сводится к некоторому множеству Q; следовательно, мы должны задать меру на подмножествах Q, а не Разумеется, каждое непустое подмножество X множе¬ ства Q является и подмножеством U, так что мера пг(Х) была известна нам еще до появления информации q. Однако, посколь¬ ку q сокращает число возможностей, то новая мера m'(X) мно¬ жества X должна быть больше его первоначальной меры т(Х). Основная идея, на которой основано задание меры пг', со¬ стоит в следующем. Хотя нам известно, что множество возмож¬ ностей сведено к Q, мы не располагаем никакой новой информа¬ цией о подмножествах Q. Поэтому, если X и У, скажем, такие подмножества Q, что пг [X) = 2т (Y), то желательно, чтобы было также пг' (X) = 2m'(Y). Это будет иметь место, если меры всех подмножеств Q увеличены в одно и то же число раз: m' (X) = k • пг(Х). Остается только определить множитель про¬ порциональности k. Так как известно, что 1 = m'.(Q) = k • m(Q), то k~\/m(Q) и наша новая мера на подмножествах U за¬ дается формулой ”'<*>=-£{§• с» Как это влияет на вероятность высказывания р? Прежде всего множество истинности р стало меньшим. Так как
182 Гл. IV. Теория вероятностей исключаются все элементы множества Q, то новым множеством истинности высказывания р будет PflQ и, следовательно, P,l/>l = /»'(PnQ) = i^ = -^f. (2) Отметим, что если первоначальная мера пг была симметричной, то новая мера m' также будет симметричной мерой (на множе¬ стве Q). Мы должны, естественно, потребовать, чтобы знаменатели в (1) и (2) были отличны от нуля. Заметим, что ш (Q) — 0 только в том случае, если Q — пустое множество; последнее означает, что высказывание q противоречиво (т. е. ложно во всех мысли¬ мых случаях) и этот случай единственный, для которого Р[^] = 0. По этой причине мы вводим естественное требование, чтобы высказывание q, доставляющее нашу информацию, не было противоречивым (было выполнимо). Пример 1. Пусть вероятность того, что участник А спор¬ тивного состязания займет первое место, равно 0,4, для участника В эта вероятность равна 0,3, для участника С она равна 0,2 и для участника D равна 0,1. Перед самым состязанием выясняется, что С не сможет принять в них участие. Каковы теперь шансы трех других участников? Пусть q есть высказывание, утверждающее, что С не побе¬ дит, т. е., что победит или А, или В, или D. Поскольку m = 0,8, то при условии, что q истинно, все другие веро¬ ятности должны возрасти в 1/0,8 = 1,25 раз. Теперь вероят¬ ность победить для участника А равна 0,5, для участника В равна 0,375 и для участника D равна 0,125. Пример 2. Из множества всех семей, имеющих в точ¬ ности двух детей (не близнецов), выбрана наугад одна семья. Какова вероятность, что в этой семье имеются два мальчика, если известно, что в ней есть один мальчик? Не имея никакой информации, мы должны были бы ввести симметричную меру на множестве U = {ММ, МД, ДМ, ДД}, где первая буква пары указывает пол младшего ребенка, а вторая — пол старшего ребенка. Информация о наличии одного мальчика сокращает множество логических возмож¬ ностей U до множества {ММ, МД, ДМ}. Новая мера остается симметричной и, таким образом, условная вероят¬ ность того, что имеется два мальчика при условии, что в семье есть один мальчик, равна 7з. Если бы еще было из¬ вестно, что мальчик — это старший ребенок, то условная вероятность равнялась бы !/2. Специальный интерес представляет случай, когда Рq\p\ = - Р[Р\ Здесь новая информация q не влияет на вероятность вы-
§ 5. Условная вероятность 183 оказывания р, поэтому мы говорим, что высказывание р неза¬ висимо от q (при заданной вероятностной мере). Если мы в (2) заменим Рд[р] на Р[р] и умножим обе части равенства па Р[р], то получим, что р [Р Л ?] = Р[р] • Р[q\ К тому же самому резуль¬ тату мы придем и в случае, когда q независимо от р. Следова¬ тельно, свойство независимости двух высказываний является взаимным, и мы можем сказать, что р и q независимы друг от друга тогда и только тогда, когда выполнено выписанное выше условие. Определение. Пусть U — множество логических возмож¬ ностей, на котором определена вероятностная мера т, и р, q — высказывания, связанные с множеством U. Эти высказывания р и q называются независимыми высказываниями (относительно меры т), если р \р л ч\ = р М • р М- (3) Хотя мы и обладаем некоторым интуитивным представле¬ нием о независимости, может случиться, что какие-нибудь два высказывания, которые не кажутся независимыми, на самом деле являются независимыми. Рассмотрим, например, троекрат¬ ное подбрасывание монеты, и пусть г означает «Все три раза мо¬ нета выпадает одной и той же стороной», а 5 означает «Выпа¬ дает, самое большее, один герб». Тогда г и 5 будут независи¬ мыми высказываниями (см. ниже упр. 10). Пример 3. Монета подбрасывается дважды, и все че¬ тыре возможных исхода считаются равновероятными. Обозначим через р высказывание «В первый раз выпадает герб», а через q высказывание «Во второй раз выпадает цифра». Тогда Р[р] = РЫ = 1/2> а Р [р Д q\ = !/4, и, сле¬ довательно, высказывания р и q независимы (относительно симметричной меры). Предположим теперь, что характер проведения опыта изменен следующим образом. Первый раз подбрасывается обычная монета; если выпадает герб, то вторично подбрасывается та же монета, если же выпа¬ дает цифра, то подбрасывается другая монета, у которой вероятность выпадения цифры в три раза больше вероят¬ ности выпадения герба. В этом случае вероятности событий ГГ и ГЦ равны между собой и равны вероятность со¬ бытия ЦГ равна Vs, а вероятность события ЦЦ — 3/s- По¬ этому, если р и q определены как и раньше, то Р [/?] = х/2, P[q} = %,aP\p Л Я] = lU> так чт0 относительно новой ве¬ роятностной меры высказывания р и q не независимы. Это обстоятельство подчеркивает тот факт, что независимость высказываний существенно зависит от способа задания веро¬ ятностной меры на пространстве логических возможностей,
(84 Гл. IV. Теория вероятностей Пример 4. Обычную монету подбрасывают трижды. Обозначим через/число выпадений герба. Тогда Р[/=3] = Р[/=0] = 78 и P\f=2\ = P[f=\\ = %. Рассмотрим теперь два высказывания »{f= 3) V (/= 0)“ и'/ или, другими словами, высказывания «Все три раза монета падает одной стороной» и «Выпадает не более одного герба». Относительно симметричной меры эти выска¬ зывания, которые с первого взгляда не кажутся независи¬ мыми, являются независимыми (об этом мы уже упоми¬ нали выше). С другой стороны, нетрудно построить на пространстве логических возможностей такую меру, что эти же два высказывания уже не будут независимыми (см. упр. 22). От понятия независимости высказываний нетрудно перейти к понятию независимости функций. Определение. Пусть U есть множество логических воз¬ можностей с заданной на нем вероятностной мерой m Hg^g^ ••• gr— функции, определенные на этом множестве U. Эти функции называются независимыми (относительно меры m), если Р KgTi = й\) Л (§2 = аг) А ••• A(gr = ar)] = = P[gri = «il • Р[£2 = я2] ... Р\gr = ar] для любых значений а19 а2, ..аг. В тех случаях когда нам будет необходимо отличить незави¬ симость в только что определенном смысле от логической неза¬ висимости, о которой говорилось в гл. II (или от понятия линей¬ ной независимости, фигурирующего в гл. V), мы будем назы¬ вать эту независимость вероятностной. Можно показать (ср. упр. 21), что если некоторое множество функций независимо относительно некоторой вероятностной меры/и, то независимым окажется и любое подмножество этого множества функций. Пример 5. Монету подбрасывают трижды. Пусть U = = (ГГГ, ГГЦ, ГЦГ, ГЦЦ, ЦГГ, ЦГЦ, ЦЦГ, ЦЦЦ}. Обозна¬ чим через fv f<l' Уз три функции, определяющие исходы первого, второго и третьего бросаний. Предположим, что на U определена симметричная мера; мы хотим выяснить, являются ли функции /, /2 и /3 независимыми или нет. Для этого нужно проверить, например, справедливо ли ра¬ венство Р [(/1 — Г) Л (/2 = Ц.) Л (/= Г)] = - р1Л = Г]-Р1/г = Ц].Р1/з==П.
§ 5. Условная вероятность 185 Множество истинности высказывания в левой части равен¬ ства состоит из единственного элемента {ГЦГ} и, следова¬ тельно, вероятность этого высказывания равна Vs- Каждое из трех высказываний в правой части имеет вероятность 72 и, следовательно, их произведение также равно Vs. Анало¬ гичные вычисления для других возможных наборов значе¬ ний функций исходов показывают, что функции /, / и /3 являются независимыми (относительно симметричной ме¬ ры). Отсюда следует, что для этой же меры любые две из этих функций, например / и /3, являются попарно незави¬ симыми. Выясним теперь, как связаны между собой понятия вероятно¬ стной и логической независимости. Мы будем исследовать только случай двух функций. Пусть/ и g— две функции, опре¬ деленные на множестве U и не являющиеся логически незави¬ симыми. Это значит, что для некоторых а и b высказывания f(x) = a и g(x) = b не являются логически ложными, в то время как высказывание (f(x) = а) Д (g(x) = b) логически ложно. Поскольку вероятность высказывания равна нулю тогда и только тогда, когда оно логически ложно, то независимо от характера выбранной вероятностной меры Р[/=а] . P|g- = 6] фО, а Р [(/ — а) Л (ff = b)\ — 0. Отсюда следует, что если fug логически зависимы, они не могут быть и вероятностно независимыми. Таким образом, ло¬ гическая независимость высказывания является необходимым, условием для вероятностной независимости. Можно даже показать, что логическая независимость функ¬ ций / и g является необходимым и достаточным условием су¬ ществования такой вероятностной меры, что / и g оказываются вероятностно независимыми относительно этой меры. Мы уже видели, что логическая независимость является необходимым условием вероятностной независимости. Покажем теперь, что Для любой пары логически независимых функций существует по крайней мере одна (а обычно их много) вероятностная мера, относительно которой эти функции становятся вероятностно не¬ зависимыми. Пусть аи а2, ат есть множество возможных значений функции/ а Ьи Ь2) Ьп— множество возможных значений функции g. Введем теперь на множестве логических возможностей такую вероятностную меру, чтобы вес множества истинности высказывания (f{x) = aJ)/\(g(x) = bk) был равен 1/тм. Это можно сделать следующим образом: из логической независимости функций / и g следует, что рассматриваемое множество истинности непусто; если оно содержит t элементов, То мы припишем каждому элементу этого множества вес l/mnt.
186 Гл. IV. Теория вероятностей У нас имеется пгп множеств истинности указанного вида; эти множества не пересекаются и содержат все элементы 11 . Вес каждого из множеств истинности выбран равным 1 \тп и, следо¬ вательно, суммарный вес всего множества U равняется тп • (\/тп) = 1. Поэтому построенная таким путем мера яв¬ ляется вероятностной. При этом наша мера такова, что Р [(/=«,) л= Теперь заметим, что Р|/=я/1 = Р|(/=о,-)л(в'=#1)| + р|(/=<1/)л<г+ (.,)[+ ... ... + р !(/=»/) л (г = *„)! = -йг ■= Аналогичным же образом P[g=b] = \/n и, следовательно, Р !(/=«;) Л (g = bk)] = \lmn = P\f=a}\ • P[sr = 6ftl. Поэтому относительно определенной таким способом вероятно¬ стной меры наши функции оказываются вероятностно независи¬ мыми. Пример 5 (продолжение). Обозначим через gx функ¬ цию, равную 1, если в первый раз выпадает герб, и 0, если в первый раз выпадает цифра; через gb обозначим функ¬ цию, определяющую общее число выпадений герба в трех бросаниях. Тогда g*i может принимать значение 1, a g2— О, но обе функции не могут принимать эти значения одновре¬ менно. Следовательно, g\ и g2 логически зависимы. По¬ этому независимо от выбранной меры эти функции не мо¬ гут оказаться вероятностно независимыми. Упражнения 1. Из колоды в 52 карты выбирается наугад одна карта. Какова вероят¬ ность того, что это будет пятерка при условии, что значение карты заключено между 2 и 7? 2. Игральная кость бросается два раза. Какова вероятность того, что сумма выпавших очков будет больше десяти, при условии, что один раз выпа¬ дает шестерка? При условии, что при первом бросании выпадет ше¬ стерка? j^Owe.: -pj-; -i.J 3. Игральная кость сделана таким образом, что вероятность выпадения того или иного числа очков пропорциональна количеству очков.
Упражнения 187 (а) Какова вероятность выпадения трех очков, если известно, что выпало (Ь) Какова вероятность выпадения четного числа очков, если известно, 4. Вернемся к упр. 9 из § 3 гл. IV. Какова вероятность того, что выбранный студент изучает немецкий язык, если (a) он изучает французский язык? (b) он изучает французский и русский языки? (c) он не изучает ни французского, ни русского языка? 5. Пусть в примере с участниками математической олимпиады из § 1 гл. II введена симметричная мера. Найдите вероятность того, что А решит пер¬ вым по меньшей мере две задачи, при условии, что участник В является 7. Студент держит экзамен, состоящий в установлении истинности или лож¬ ности пяти утверждений. Какова вероятность того, что он правильно от¬ ветит на все вопросы, если (a) он просто угадывает? (b) ему известно, что преподаватель предлагает на экзамене всегда больше истинных утверждений, чем ложных? (c) ему также известно, что преподаватель никогда не задает подряд три вопроса, требующие одинакового ответа? (d) ему также известно, что ответы на первый и последний вопросы должны быть противоположными? (e) ему также известно, что ответом на второй вопрос должно быть 8. Три человека А, В и С выстроены наугад в одну линию. Пусть г означает высказывание «В стоит справа от А» а 5 — высказывание «С стоит справа от А». ды. Из такой колоды выбираются наугад две карты. Найдите (а) вероятность того, что обе эти карты — валеты, при условии, что (Ь) вероятность того, что обе эти карты — валеты, при условии, что (с) вероятность того, что обе эти карты — валеты, при условии, что одна нечетное число очков? что выпало больше, чем три очка? 6. Если Р Г—'/?] = у и Рp[q] то чемУ Равна р \Р^ЧР слабым геометром. «ложно»? (а) Чему равна P[rAs]? (b) Независимы ли г и 5? [Отв.: Нет.] 9* Пусть колода карт состоит из валетов и дам, отобранных из полной коло- одна из них—валет; одна из них — валет красной масти; из них — червонный валет.
188 Гл. IV. Теория вероятностей 10. Докажите, что высказывания, фигурирующие в примере 4, независимы (относительно симметричной меры). 11. Следующий пример показывает, что г может не зависеть от р и q, не будучи независимым от р/\д и p\J q. Бросаем два раза монету. Пусть р означает «При первом бросании выпадет герб», q означает «При втором бросании, выпадет герб» и г означает «При обоих бросаниях монета падает одной и той же стороной». Вычислите 13. Допустим, что р и q — независимые высказывания. Докажите, что выска¬ зывания каждой из следующих пар высказываний также независимы: 14. Докажите, что для любых трех высказываний р, q и г имеет место со¬ отношение 15. Докажите, что два высказывания вероятностно независимы (относительно некоторой вероятностной меры) тогда и только тогда, когда вероятност¬ но независимы (относительно той же меры) характеристические функции этих высказываний. 16. Докажите, что для существования вероятностной меры, относительно ко¬ торой два данных высказывания оказываются вероятностно независи¬ мыми, необходимо и достаточно, чтобы эти высказывания были логически независимыми. 17. Пусть U есть множество из восьми возможных исходов трехкратного бросания монеты. Обозначим через р высказывание «В первый раз вы¬ падает герб» и через q высказывание «Выпадает не меньше двух гербов». (a) Являются ли высказывания р и q логически независимыми. [Отв.: Да.] (b) Если все элементы 2/ равновероятны, то являются ли р и q вероят¬ ностно независимыми? [Отв.: Нет.] (c) Постройте на U такую вероятностную меру, относительно которой р и q вероятностно независимы. 18. Пусть U есть множество из 16 возможных исходов четырехкратного бро¬ сания монеты. Для каждой из следующих пар функций определите (i) являются ли они логически независимыми и (ii) являются ли они ве¬ роятностно независимыми (относительно симметричной меры): (a) f(x) = 1, если во второй раз выпадает герб и/{х) = 0 в остальных случаях; g(x) определяет число выпадений герба в третьем и четверо том бросаниях; (b) f(x) определяет число выпадений герба в первых трех бросаниях, a g М — число выпадений герба в двух последних бросаниях; (c) f(x) — характеристическая функция высказывания «Исход первых двух бросаний одинаков», a g(x) — характеристическая функция вы¬ сказывания «По крайней мере два раза выпала цифра». РИ. РрИ. Р?И. Ррд,И. Ppv^l- (a) р и ~q\ (b)~?и р; (c) ~р н ~ д. Р [pAqhr] = Р [р] ■ Рр М • Рр л? И-
Упражнения 189 19. Пусть fyguh — любые три функции. Докажите, что Р[(/=в)Л(*=й)Л(А = с)] = = Р [/= а] ■ Pf=a [g = Ь] ■ Р(/яв)л(,„Ь) [А = с], где а, b и с принадлежат области изменения функций /, g и h соответ¬ ственно. 20. Пусть функции / и g вероятностно независимы относительно заданной вероятностной меры, а и b какие-то возможные значения этих функций. Докажите, что р,=ь[/=*] = р [/=«]• 21. Пусть /1,/г*/з независимы относительно заданной вероятностной меры. Докажите, что каждая из перечисленных пар функций относительно той же меры также независима: (a) (b) /i +/2» /з- 22. Припишите веса элементам пространства логических возможностей экс¬ перимента из примера 4 таким образом, чтобы два высказывания, рас¬ сматривавшиеся в этом примере, не были независимыми. {Указание. Используйте идею, родственную реализованной в при¬ мере 3.) 23. Бросаются две кости, описанные в упр. 3, и записывается сумма выпав¬ ших очков. Обозначим через / функцию исхода этого опыта; ее область изменения имеет вид {2, 3, ..12}. Определите Р [/=#], для я = - 2, 3, ..., 12. [Частичный отв:. Р [/= 7] = 8/63, Р [/= 11] = 20/147 .] 24. Из обычной колоды в 52 карты выбираются 13 карт червонной масти, а из этих 13 карт случайным образом выбираются две карты. Рассмотрим следующие три высказывания: р—выбираются две «картинки»; Я— первая выбранная карта «картинка»; г — среди выбранных карт имеется по крайней мере одна «картинка». («Картинка» — это тузы, короли, дамы и валеты.) Вычислите следующие вероятности: (a) Рq[p\\ [Отв:. ‘/е-1 (b)Р,[/>]1 [Отв.: Ч (c)РгМ; [Отв.: «/.I-] (d) PQ [г]. [Отв.: 1.] 25. Пусть р и q — такие два высказывания, что из р следует q. Покажите, что р и q могут быть вероятностно независимыми тогда и только тогда, когда либо я логически истинно, либо р логически ложно. Обозначим через /1, /2 и /3 функции исхода эксперимента, состоящего в трехкратном бросании (правильной) монеты. Вычислите вероятности каждого из следующих высказываний:
190 Гл. IV. Теория вероятностей (а) Р(/2 = ц) V (/з = Г) [/i = П; [Отв.: 1/2.] (k) Р(/, = Ц) v |/> = Г) t/i “ ^1» [Отв.: 73.] (с) Р(/1 = п v (/2 = Г) v (/, = Г) K/i = П V(/2 = Г]. [Отв.: 6/7.] 27. Обозначим через f\ и /2 функции исхода эксперимента, состоящего в двух¬ кратном бросании (правильной) игральной кости. Вычислите вероятности следующих высказываний: (а) Р/2 > 2 t/i — 3]; P(/i¥=2)A(/2>3) Ifl <4li (c) Р/,+/2=9 Г/! = 5]; (d) Р/1+/з=9[/.=2]. § 6*. МЕРЫ КАК ПЛОЩАДИ Для многих целей оказывается удобным изображать меры посредством площадей. Универсальное множество U изобра¬ жается в виде единичного квадрата и каждому элементу U ста вится в соответствие площадь, равная весу этого элемента. Бу¬ дем выбирать эти площади так, чтобы они не налегали друг на друга и, следовательно, покрывали весь квадрат. Если теперь любому множеству поставить в соответствие всю площадь, соответствующую его элемен¬ там, то эта площадь будет равна его мере. Пример 1. Пусть U = {а, Ь, с}. Припишем элементам а, b и с соответственно веса 72, 7з и 7б. На фиг. 80 показаны площади, со¬ ответствующие отдельным элементам, а так¬ же показана посредством штриховки пло¬ щадь, соответствующая множеству {а, с}. Разумеется, эта площадь равна 7г + 7б = = 2/з- Нет необходимости начинать с изображения отдельных весов. Можно наносить на диаграмму подмножества непосредственно. Нужно только следить за тем, чтобы каждому подмножеству, представленному на диаграмме, соответствовала площадь, рав¬ ная его мере. Такая геометрическая интерпретация помогает уяснить мно' гие теоретические соображения. В качестве примера рассмотрим вопрос о мере объединения двух множеств. Пусть т (Р) = 0,5 и m(Q) = 0,3; чему равна m(PuQ)? Мы ставим в соответствие Р площадь, численно равную 0,5, после чего хотим включить в нашу диаграмму Q. Множество Q имеет меру 0,3, но какая
§ 15 *. Меры как площади 191 часть этой площади должна пересекаться с Р? Если (а) пересе¬ чения нет, то общая площадь равна 0,8, тогда как если (b) Q на¬ ходится внутри Р, то общая площадь равна 0,5; наконец, если (с) площадь пересечения равна, скажем 0,2, то общая площадь Ф и г. 81 равна 0,6. (Эти три возможности показаны на фиг. 81.) Так как в каждом случае пересечение соответствует множеству PflQ, то у нас нет выбора: мы обязаны положить площадь пересече¬ ния, равной m(P[\Q). Формулу m(P\}Q) = m(P)^rtn{Q)—m(P[\ Q) хорошо иллюстрирует фиг. 81, в. На фиг. 81, а показан случай, когда Р и Q не пересекаются. Если мы имеем дело только с одним подмножеством U, ска¬ жем Р, то всегда можно изображать его посредством вертикаль¬ ной полосы, т. е. прямоугольника с высотой, равной 1. Но если [У/У////У//////Л '— еще присоединяется подмноже- т1$А/Шт(Р(\Ц)/У Q ство Q, то мы не всегда можем изобразить его посредством пол- / ной горизонтальной полосы, что т(Р) можно видеть на фиг. 81. Рассмотрим специальный слу¬ чай, показанный на фиг. 82, когда такое представление воз- можно. Основание множества Р Равно т(Р)у а высота равна 1. Фиг. 82 Множество Q имеет основание 1 и высоту m(Q). Площадь пересечения PflQ равна т(Р) - m(Q). Это значит, что т (Р П Q) = т (Р) • т (Q), чт° соответствует тому специальному случаю, когда наши вы¬ сказывания независимы. 1ц т(Р) р Фиг. 82
192 Г л. IV. Теория вероятностей Чтобы изобразить вероятности высказываний, мы должны изобразить меры их множеств истинности. Следовательно, опи¬ санный метод с равным успехом может быть применен и для изображения вероятностей. Его можно также использовать для изображения условных вероятностей: поскольку Р,И = Р|Р Л <?1/Р\q\ = m(P(]Q)m (Q), то условную вероятность можно представлять себе как отноше¬ ние площади пересечения Р и Q к обшей площади Q. Пусть на фиг. 83 пг{Р) = х-\- у, m{Q) = x-\-z, m(Pf\Q) = x\ тогда рq\p] = xH.x + z) и Pp\q] = xl(x-±y). В качестве применения нашей геометрической интерпрета¬ ции мы выведем теорему Байеса. Простейший случай этой тео¬ ремы используется для решения следую¬ щего вопроса. Предположим, что изве¬ стна вероятность осуществления р и позднее мы получаем дополнительную информацию q, также находящуюся в известном отношении к осуществлению или неосуществлению р. Каким образом новая информация изменяет вероят¬ ность р? Более точно: сначала нам изве¬ стны Р[/?], Р[а] и Рp[q\ и мы хотим определить Р^ [р]. Пример 2. Предположим, что име¬ ются две урны, первая из которых содержит два черных и один белый шар, а вторая — два белых и один черный шар. Выбирается одна урна посредством некоторой процедуры случайного выбора, делающего вероятность выбора первой урны равной 3Д. За¬ тем из выбранной урны вынимается наугад один шар. Если вынутый шар оказывается черным, то какова вероятность того, что он был вынут из первой урны? Пусть р означает утверждение, что мы вынимаем шар из первой урны, a q — что мы вынимаем черный шар; Р[р] = Vi, РрМ = 2/з. РрЫ = ’/з; требуется найти Рд[р]. Эти данные представлены на фиг. 84. Мы видим, что X2~V— xil(xi + У i) = •у и + У2) — §• „ 3 2 1 111 Отсюда хх = ^ • -3 = т и *2 = 3- • -4 = Y2' Наконец, X Z У Р Ф н г. 83
§ 6 * Меры как площади 193 В этом примере мы исходили только из двух альтернатив, р и р. Но теорема, о которой идет речь, применима к любому числу альтернатив. Рассмотрим ее для случая четырех альтер¬ натив. Про высказывания рь р2, Рз и р4 говорят, что они обра¬ зуют полную систему альтернатив, если одно и только одно из них является истинным. (См. § 8, гл. I, стр. 54.) В таком случае их множества истинности не пересекаются и объединением этих множеств истинности будет U. Пусть q означает какое-то дру¬ гое высказывание. Эта ситуация представлена на фиг. 85. X, х2 хз Х4 У, Уг Уз Уо Ф и г. 84 Ф и г. 85 В качестве исходных данных мы имеем вероятности четырех альтернатив и условную вероятность q при условии реализации каждой из альтернатив: PlAl = -*i Ч-уй рл, М = ХЛХ\ Ч-уО; Р I Pl\ = *2 Ч~ У2> РРз\Я\ — x2lix2 Ч- Уг)> РЬз1 = -*зЧ-у3; РаМ = *з/(-*з+Уз); Р|а1 = ^ + У4; Рр< [<?1 — xJ(x4ч~у4)- 1аким образом, нам известны площади четырех вертикальных полос и для каждого случая отношение площади верхней части к площади всей полосы. Отсюда находятся площади четырех верхних частей: перемножением двух вероятностей, стоящих в каждой строке, мы получим л:, = Р[р1]-РР1|^|, х2 = Р[/?2]'РлМ и т. д. Нас интересует нахождение вероятности одной из этих че¬ тырех альтернатив, скажем р2, при условии, что имело место q. Другими словами, мы хотим знать, какую часть площади Q со¬ ставляет х2. Легко проверить, что искомая вероятность дается следующей формулой: Р,1/>2] = - -- р1Ы-р/Д</1 р 1Ы • р/л 1^1 + р [Р*\ pPl М + р [Р3\ ■ рР, М + р 1Ы • рр, М ■ 13 З^к. ij09
194 Гл. IV. Теория вероятностей Для других альтернатив имеют место аналогичные формулы, и они допускают очевидное обобщение на случай любого числа альтернатив. Эта система формул, выписанных для самого об¬ щего случая, и называется теоремой Байеса. Пример 3. Предположим, что один учащийся должен был выбрать между математикой, физикой, химией и астро¬ номией, предложенными ему . в качестве основного курса. Основываясь на данных беседы с этим учащимся, лицо, консультировавшее его при поступлении, склонно было при¬ писать выбору им каждого из этих курсов вероятности 0,4, 0,3, 0,2 и 0,1. Консультант не.знал, какой курс был выбран на самом деле, но к концу семестра ему становится изве¬ стным, что этот учащийся получил по выбранному им курсу высшую оценку а. Учитывая сравнительные трудности изу¬ чения этих курсов, консультант считает вероятность полу¬ чения оценки а по математике равной 0,1, по физике 0,2, по химии 0,3 и по астрономии 0,9. Какую поправку может внести консультант в свою первоначальную оценку вероят¬ ностей выбора учащимся различных курсов? Используя теорему Байеса, мы получаем: Р [Учащийся выбрал математику] — Учащийся получил оценку а] (0,4) (0,1) — (0.4) (0,1) + (0,3) • (0,2) 4- (0,2) • (0,3) -f (0,1). (0,9) 25 — АО* Подобные же вычисления приводят к вероятностям 0,24, 0,24 и 0,36 для грех других курсов. Таким образом, новая информация о получении студентом оценки а мало повлия¬ ла на вероятность выбора им физики или химии, но сде¬ лала гораздо менее вероятным выбор математики и го¬ раздо более вероятным выбор астрономии. Важно заметить, что знание условных вероятностей q по отношению к альтернативам рь р2. ... еще не достаточно. Пока мы не знаем еще и вероятностей исходных альтернатив, мы не можем применять теорему Байеса. Однако иногда бывает ра¬ зумно допустить, что все альтернативы являются равновероят¬ ными. Тогда множители Р[р,], ..., Р[/?4) в нашей основной фор¬ муле сокращаются, и мы получаем частный случай теоремы Байеса: Если РЫ = Р|/>2| = Р|/>з! = рЫ. т0 Р __ !йЁ „ г«|/'2' - Р |,/j Г \q\ -I Р \q\ +■ Р [q\ I 2 3 ' 4
§ 6 *. Меры как площади 195 Пример 4. В одном эксперименте группе лиц вручается четыре конверта, в каждом из которых заключено условие одной задачи. Группе предлагается вскрыть один конверт и постараться решить помещенную в нем задачу в течение 10 минут. На основе предыдущего опыта экспериментатор знает, что вероятность решения за 10 минут самой трудной задачи равна 0,1, а для других задач эти вероятности равны 0,3, 0,5 и 0,8. Допустим, что данная группа справи¬ лась с задачей в течение положенного времени. Какова ве¬ роятность того, что был вскрыт конверт, с самой трудной задачей? Так как экспериментируемые не имели никакой возможности узнать, какая задача находится в том или ином конверте, то они выбирали конверт наугад, и потому мы приписываем выбору различных задач одинаковые ве¬ роятности. Следовательно, можно воспользоваться преды¬ дущей простой формулой. Вероятность того, что была вы¬ брана самая трудная задача, равна ОД 1 ОД + 0,3 + 0,5 + 0,8 — 17 * Пример 5. Допустим, что мы сдаем вступительный эк¬ замен и можем выбирать любого из трех экзаменаторов; при этом вероятность сдать экзамен равна для нас 0,1. Пусть один приятель сообщил нам, что один из этих экза¬ менаторов очень добр и вероятность сдать ему экзамен равна 0,4. Мы выбираем наугад одного из экзаменаторов и экзаменуемся. Какое влияние окажет наш результат на интересующую следующего отвечающего вероятность того, что мы выбрали доброго экзаменатора? Если мы сдадим экзамен, то вероятность того, что мы выбрали доброго экзаменатора, можно приравнять 0,4 2 . 0,4 +ОД +0,1 — 3 ’ если же мы не сдадим экзамен, то эту вероятность следует считать равной 0>6+-^ + 0 9 =1. Так как первоначальная вероятность была равна у, то мы видим, что сдача экзамена доставляет гораздо больше информации, чем провал. И это естественно, потому что при нашей подготовке провал является весьма вероятным даже в случае доброго экзаменатора.
196 Гл. IV. Теория вероятностей Упражнения I. Изобразите Р и Q в виде площадей внутри квадрата, если: (a) пг (Р) = m (Q) = 0,5, m (Р П (?) = 0,3; (b) пг (Р) = 0,5, m (Q) = 0,4, m(P\jQ) = 0,8; (c) пг(Р) = 0,6, m(Q) = 0,4, Р и Q не пересекаются. 2. Пользуясь следующими данными о высказываниях р и q, изобразите их множества истинности Р и Q в виде площадей: 3. В мае вероятность дождливого дня равна 0,2. Для команды Янки вероят¬ ность выиграть в ясный день равна 0,7, но зато в дождливый день эта вероятность равна лишь 0,4. Если нам известно, что в мае они выиграли некоторую игру, то какова, вероятность того, что в тот день шел дождь? 4. Проиллюстрируйте геометрически множества истинности различных выска¬ зываний из предшествующего упражнения. 5. Тест многократного выбора !) предоставляет для ответа на каждый во- . прос четыре возможности. Таким образом, если студент знает правиль¬ ный ответ, то для него вероятность правильного ответа, равна 1; если же он идет по пути угадывания, то вероятность правильного ответа равна 0,25. Предположим, далее, что хороший студент знает 90% ответов, а плохой студент только 50%. Если хороший студент ответил правильно, то какова вероятность того, что он просто угадывал? Решите тот же 6. Некогда были предложены одновременно три экономические теории, кото¬ рые на основании имевшихся данных представлялись равновероятными. В течение последующего года состояние экономики находилось под на¬ блюдением, и оказалось, что вероятность того развития, какое она полу¬ чила на самом деле, в соответствии с первой теорией была равна 0,6, а в соответствии с двумя другими — 0,4 и 0,2. Каким образом это изме¬ няет вероятности правильности трех теорий? 7. Пусть р\, р2, Рз и р4 образуют полную систему равновероятных альтерна- тив. Пусть Рр_ [<?] = а, Ррг [q] = Ь, Ррз [?] = с, Рр< [q] = d. Покажите, что если а+ b + с + d = 1, то при осуществлении q пересмотренные ве¬ роятности этих альтернатив равны соответственно а, Ь, с и d. 8. В покере Смит имеет очень сильные карты и делает большую ставку. Вероятность, что его противник Джонс имеет более сильные карты, рав¬ на. 0,5. С более сильными картами Джонс повысил бы ставку с вероят¬ ностью 0,9, но с худшими картами — только с вероятностью 0,2. Пред¬ положим, что Джонс повышает ставку. Какова новая вероятность того, 9. Крыса может выбирать наугад один из пяти лабиринтов. Известно, что вероятности ее выхода из различных лабиринтов за три минуты равны (a) Р[р] = Р[?]=0,4, Р[рЛ?]=0,2; (b) Р [р] = Р М = 0,5, Р [pv</] = 0,75; (c) Р [р] = Р [<?] = Р [рЛд'] = 0,3; (d) Р [р] = Р [q] = 0,4, Рр[р]=0,5. [Отв.: 0,125.] вопрос для плохого студента. что он имеет более сильные карты, чем Смит? ') См. подстрочное примечание на стр. 119.
§ 7. Конечные стохастические процессы 197 0,6, 0,3, 0,2, 0,1, 0,1. Пусть оказалось, что кргса вырвалась из лабиринта через три минуты. Какова вероятность того, что она выбрала первый В § 5 гл. I мы рассмотрели способы описания такой последо¬ вательности опытов, где возможные исходы каждого экспери¬ мента зависят от исходов предыдущих экспериментов. Про¬ странство логических возможностей, относящееся ко всему мно¬ жеству экспериментов, мы изображали в виде дерева (см. § 6 гл. I), причем каждой отдельной логической возможности соот¬ ветствовал свой путь на этом дереве. Для каждого из экспери¬ ментов мы определили функции исхода и выяснили, что эти функ¬ ции описывают пространство логических возможностей. Сейчас мы сначала более подробно исследуем возникающие на этом пути деревья, а затем покажем, как, используя информацию о функцч ях исхода, построить вероятностную меру на множестве всевоз¬ можных путей соответствующего дерева логических возмож¬ ностей. Рассмотрим дерево логических возможностей для последова¬ тельности опытов. Каждой конкретной последовательности воз¬ можных исходов этих опытов соответствует определенный путь на дереве. Отрезки, составляющие каждый путь, называются ветвями. Дерево начинается из начальной точки, и ветви, выхо¬ дящие из этой точки, образуют первый ряд дерева. Конец ка¬ ждой из ветвей отвечает одному из возможных исходов первого эксперимента. Из каждого из этих концов ответвляется новое множество ветвей, концы которых в свою очередь отвечают воз¬ можным исходам второго опыта. Эти ветви образуют второй ряд Дерева. Таким образом, мы продолжаем строить дерево ряд за Рядом до тех nop, пока не будут исчерпаны все эксперименты в рассматриваемой последовательности. Точки, в которых берут начало некоторые ветви, называются точками ветвления. Ка¬ ждая точка ветвления в /-ом ряду дерева соответствует един¬ ственной последовательности исходов первых- / опытов. Предположим теперь, что исход каждого отдельного экспе¬ римента зависит от некоторых неконтролируемых факторов, не¬ сет элемент случайности. Всякая такая последовательность экс¬ периментов называется стохастическим процессом1). (Греческое слово «стохос» означает «догадка».) Мы будем предполагать, что имеется конечное число экспериментов и что каждый экспе- ') В русской литературе употребляются также термины «случайный про лабиринт? Второй ла.биринт? § 7. КОНЕЧНЫЕ СТОХАСТИЧЕСКИЕ ПРОЦЕССЫ. ДЕРЕВЬЯ, ВЕСА ПУТЕЙ И ВЕСА ВЕТВЕЙ с>>. «вероятностный процесс».
198 Гл. IV. Теория вероятностей римент имеет конечное число возможных исходов. Мы предпола¬ гаем также, что если известны исходы всех экспериментов, пред¬ шествовавших данному, то для этого последнего эксперимента определятся как возможные исходы, так и вероятности осуще¬ ствления каждого из этих исходов. Нашей целью является прогнозирование хода всего процесса в целом. Например, в случае многократного бросания обычной монеты мы исходим из предположений о том, что каждый от¬ дельный эксперимент может иметь два исхода и что вероятность каждого из этих исходов (независимо от исходов всех остальных экспериментов!) равна V2; нас интересуют вероятности истинно¬ сти высказываний следующего типа: «Более чем две трети всех бросаний приводит к выпадению герба» или «Число выпадений герба и цифры одно и то же» и т. д. На подобные вопросы можно ответить только тогда, когда всему процессу в целом приписана некоторая вероятностная мера. Формализуя те построения, которые играют основную роль в теории стохастических процессов, введем следующее Определение. Пусть U есть множество всех путей на не¬ котором дереве. Тогда весовая функция (вероятностная мера), определенная на множестве U, называется весовой функцией путей для этого дерева. Веса ветвей дерева задаются так, что сумма весов всех вет¬ вей, выходящих из любой точки ветвления, равна 1. В любом дереве ветви, выходящие из точки ветвления в /-ом ряду, описывают возможные исходы /-ого опыта при условии, что исходы первых /— 1 экспериментов уже известны. Веса, ко¬ торые приписываются этим ветвям, подсказываются рассмотре¬ нием опыта, реализующегося после того, как достигнута эта точка ветвления. В случае с бросанием монеты возможные ис¬ ходы /-опыта, а также их вероятности (веса) не зависят от пред¬ шествующих результатов. Однако мы не будем вводить ограни¬ чений такого рода, потому что в общем случае они не имеют места. Пример 1. Вернемся к примеру 1 из § 5 гл. I. У нас имеются две урны; в первой из них лежат два черных и один белый шар, а во второй — два белых и один черный. Наугад выбирается одна из урн и из нее последовательно (без возвращения) вынимаются два шара. Соответствую¬ щее дерево изображено на фиг. 86. На этом дереве есть 6 различных путей, которые мы обозначили через хи х2, ••• ..., х6. Итак, на первом этапе эксперимента случайным обра¬ зом выбирается одна из двух урн. Поэтому каждому из двух возможных исходов первого эксперимента мы припи¬ сываем вес (вероятность) V2 (см. фиг. 86). Если была вы¬ брана первая урна, то, поскольку она заключает два чер'
§ 7. Конечные стохастические процессы 199 ных и один белый шар, то вероятность выбрать черный шар будет равна 2/з, а вероятность вынуть белый шар всего '/з- Если была выбрана вторая урна, то вероятность выбрать черный шар будет равна 7з, а вероятность вынуть белый шар — 2/3. На третьем этапе, если была выбрана 1-я урна и первый шар оказался черным, то вероятности выбрать белый или черный шар будут равны между собой/ т. е. равны 72; однако если в первый раз вынут белый шар, то вероятность вынуть черный шар становится равной 1. Ана¬ логичным же образом вычисляются вероятности от осталь¬ ных ветвей, обозначенные на фиг. 86. Для дальнейшего будет важно ввести рациональную систему обозначений для весов ветвей. Пусть abc ... st одна из возмож¬ ных последовательностей исходов первых / экспериментов. Вес исхода t /-го опыта при условии, что исходы первых /— 1 опы¬ тов описываются последовательностью abc ... s, мы обозначим через Рabc ... s, t‘ Вес исхода первого опыта естественно обозначить через ра. На¬ пример, в примере 1 рх = V2, А, ч = 2/з и Р\, чч = V2. Теперь мы хотим рассмотреть высказывания, связанные со всей последовательностью экспериментов. Для того чтобы опре¬ делить вероятности этих высказываний, нам нужно построить вероятностную меру на множестве путей данного дерева. Мы бу¬ дем исходить при этом из весов отдельных ветвей и выберем меру так, чтобы эти веса были равны соответствующим услов¬ ием вероятностям- Рассмотрим последовательность из трех экспериментов. Обозначим через х произвольный путь на соответствующем де¬ реве логических возможностей. Нам известно, что функции ис- °Да описывают пространство логических возможностей таким
200 Гл. IV. Теория вероятностей образом, что х есть единственный элемент, содержащийся во множестве истинности высказывания типа (/l W = а) Л (/2 W = Ь) Л (/з (М = с). Поэтому вес w (х) элемента х равен Р K/i = а) А (/2 = Ь) Д (/3 = с)]. Но эту последнюю вероятность можно переписать в следующем виде: Р [/i = а] • Р/( =в 1/2 = Ь\ • P(/j=t) Л (/(=а) [/3 = с] (см. упр. 19 из § 5). Из самого определения весов ветвей ясно, что нам следует положить Р[/1=Я| =Ра> Р/, =« l/з = = Ра, Ь> P(/i=a)/\(/2 = 6) I/3 = ^1 =РаЬ, с- Если мы хотим обеспечить справедливость всех этих ра¬ венств, то мы должны положить ч»(.х) = рара<ьраЬ'С. Другими словами, каждому пути мы должны приписать вес, равный произведению весов, приписанных ветвям, составляю¬ щим этот путь. Можно доказать, что если веса путей и веса ветвей связаны таким образом, то веса ветвей всегда оказываются равными соответствующим условным вероятностям. Пример 1 (продолжение). Если веса ветвей выбраны так, как это было указано в примере 1, то произведение весов ветвей, составляющих каждый из путей дерева, ока¬ зывается равным Уе (см. фиг. 87). X У/(Х) ft(x) ff(X) X, Ць \ Ч Ч *2 t/б 1 ч Б хз i/e / Б Ч *4 1/6 2 Ч Б х5 i/б г Б Ч Х6 1/6 2 Б Б
§ 7. Конечные стохастические процессы 201 Всего на дереве имеется 6 путей; следовательно, мы дей¬ ствительно построили вероятностную меру. Вычислим те¬ перь для проверки условные вероятности вдоль пути хг. Вычисляя подобным же образом веса других ветвей, мы убедимся в том, что они совпадают с весами, приписан¬ ными ветвям в начале примера 1. Повторим еще раз нашу конструкцию на более абстрактном примере. Пусть у нас имеется последовательность трех экспери¬ ментов, возможные исходы которых указаны на фиг. 88. Сово¬ купность всех исходов, возможных в каком-либо из этих экспе¬ риментов, дается множеством {а, 6, с, d, е, /}. Если исход первого эксперимента есть 6, то возможными исходами второго экспери¬ мента являются а, е и d\ аналогично, если исход первого экспе¬ римента есть Ьу а второго эксперимента — а, то для третьего эксперимента окажутся возможны лишь исходы с и /. Вероят¬ ности того, что исход первого эксперимента будет а или b мы в соответствии с принятыми соглашениями обозначим через ра и рь\ аналогично обозначаются и другие вероятности. Мы счи¬ таем, что нам известны все эти числа. То обстоятельство, что они представляют собой вероятности исходов, означает, что все они положительны и что ра + Рь = 1, Рь, а + Рь,е + рь, d = 1, Рьа, а + pbd, с = 1 и т. д., т. е. что сумма чисел, сответствующих ветвям, исходящим из какой-либо точки ветвления, равна 1. Пути, который соответствует исходу b в первом эксперименте, исходу d во втором и исходу с в третьем, мы приписываем вес Рь• Pbd• pbd, с — это есть произведение вероятностей ассоции¬ рованных с каждой ветвью, идущей вдоль рассматривае¬ мого пути. Таким способом мы определим вероятность каждо- г° пути на дереве. Нетрудно показать, что этот метод всегда определяет вероят¬ ностную меру, т. е. что веса всех путей положительны и сумма Их равна 1. Они положительны, потому что представляют собой Р\ = Р l/i = 1] = ^ (*i) + w (х2) + w (jc3) = V2; _ P[(/2 = 4)A(/1 = 1)] _ P [/. = 1] __ w (x^) + w (x2) w (*,) !- w (x2) + it) (x3) Л,чч= Р(/’,"1)Л(Л = ч)[^з = Ч| = Р[(/з = Ч)Л(/2 = Ч)Л(/, = 1)] ~ Р[(Л = Ч)л(/, = 1)1 _ И1(ЛГ|) _ _1_ _ w (*,) + w (х2) 2 *
202 Гл. IV. Теория вероятностей произведение положительных чисел. Чтобы показать, что сумма их равна 1, найдем сначала сумму весов всех путей, соответ¬ ствующих определенному исходу первого эксперимента — ска¬ жем 6, и определенному исходу второго эксперимента — скажем d. Мы имеем Pb ' Рb, d ’ Рbdt а ~~I- Рb ’ Рb, d ’ Рbd, с Рb * Рb, d IР bd, а ~~Рbd, с\ Рb *Рb, d' Для каждой пары двух первых исходов результат будет ана¬ логичным. Например, сумма весов путей, соответствующих исходу а первого эксперимента и исходу с второго эксперимен¬ та, равна ра*Ро.-с- Несколько забегая вперед, заметим сле¬ дующее: величина ра*Ра, с есть вероятность того, что исходами первого и второго эксперимен¬ тов будут соответственно а Ь и с. Но этот факт можно счи¬ тать доказанным лишь после ^ того, как будет показано, что .е мы имеем дело с вероятностной мерой. Далее мы находим сумму весов, приписанных тем путям, которые соответствуют исходу b в первом эксперименте. Для этого нужно сложить суммы, соответствующие всевозможным исходам второго эксперимента. Но в силу предыдущего вычисления иско¬ мая сумма весов равна Рь • Pb,a~\~Pb * Рь, е + Pb ' Pb, d= Pb\Pb, а ~^Рь, е ~^~Pb, d\ = Pb• Подобным же образом сумма весов, приписанных тем путям, которые соответствуют исходу а в первом эксперименте, равна ра. Следовательно, сумма всех весов равна ра 4-pb = 1. Итак, мы действительно имеем вероятностную меру. Заметим, что мы доказали также совпадение вероятности, приписанной исходу а в первом эксперименте, с вероятностью ра. Поскольку составному высказыванию Фиг. [(/l (*) = ь) Л (/2 (х) = d) Д (/з (х) = с)] была приписана вероятность рь • pb>d • pbdt с> высказыванию 1СЛ (■*) = Ь) Л (fi(x) = d\, как мы уже отмечали, приписана веро¬
$ 7. Конечные стохастические процессы 203 ятность рь • Рь, d, и высказыванию [А(х) = Ь) вероятность рь, то n I г , v . * Pb, d Pbd, с 2'x)=d)M<f\ (х)=Ь) [/з W —Ч — —Pbd,c> ИЬ yb, d р/, 1Л (*) = rfl = “ ь и т. д. Таким образом, мы видим, что наши вероятности, заданные заранее в предположении, что известны предыдущие результаты, становятся условными вероятностями при их вычислении с по¬ мощью весовой функции путей дерева. При мер 2. Пусть имеются две урны. Урна 1 содержит два черных и три белых шара. Урна 2 содержит два чер¬ ных и один белый шар. Выбирается наугад одна урна и из нее выбирается наугад один шар. Какова вероятность того, что будет выбран белый шар? На первый взгляд может показаться, что поскольку число белых и черных шаров одинаково и все делается слу¬ чайно, то вероятность выбора белого шара равна V2. Этот и аналогичные ему необдуманные ответы указывают на не¬ обходимость более тщательного анализа. Мы рассматриваем два эксперимента, первый из кото¬ рых состоит в выборе урны, а второй — в выборе шара. Первый эксперимент может иметь два исхода, причем мы приписываем выбору первой и второй урн одинаковые ве¬ роятности Р\=Р2— V2. Если на первом этапе выбрана урна 1, мы приписываем выбору белого шара вероятность Л, б~5"; подобным же образом задаются вероятности — А* —±. —А Р\, Ч 2 ’ Р2, Б 3 » Р2, Ч 3 • Эти вероятности указаны на дереве, изображенном на фиг. 89. Вероятность того, что будет вынут белый шар, находится как сумма весов всех п^тей, ведущих к исходу Б второго эксперимента; она равна + -g- = . Пример 3. Некто вышел из бара и не может вспомнить, какая улица ведет к его дому. Он знает, что бар, который расположен на перекрестке четырех улиц, отстоит от его дома на один квартал, и пробует поочередно идти наугад по каждой из четырех выходящих к бару улиц, возвраща¬ ясь обратно после неудачи и не выбирая одну и ту же улицу
204 Гл. /V. Теория вероятностей дважды. Какие имеются возможности для его поисков дома и какова вероятность каждого из возможных путей? Обозначим выходящие к бару улицы через А, В, С и Дом. Исходы экспериментов и их вероятности (веса ветвей дерева) указаны на фиг. 90. Вероятность каждого отдель¬ ного пути находится по¬ средством перемножения ве¬ роятностей составляющих его ветвей. Предположим теперь, что мы построили дерево и вероят¬ ностную меру на нем для по¬ следовательности из пг экспери¬ ментов. Иногда нас интересуют высказывания, значения истин¬ ности которых зависят от ис¬ ходов п первых эксперимен¬ тов, где п < т. Исследовать такие высказывания можно по более простому дереву, со-, стоящему из первых п рядов m-ярусного дерева. Любая этому дереву, оказывается равной соответствующей вероятности, вычисленной по полному m-ярусному дереву. Дом i/4 / у, С / s' //4 X. А Фиг. 90 w{x) Фиг. 89 вероятность, вычисленная по Например, рассмотрим в примере 1 высказывание р: «Пер¬ вый вынутый шар черный». Множеством истинности этого вы-
§ 7. Конечные стохастические процессы оказывания, как видно из фиг. 86, является множество p = {jci,\x2, х4}. Отсюда следует, что Р[р] = т(Р) = '/2. Одна¬ ко это высказывание имеет отношение только к первым двум этапам эксперимента, и, следовательно, для него можно по¬ строить и более простое дерево (см. фиг. 91). Рассматри¬ вая наше высказывание уже на этом дереве, мы видим, что мно¬ жество истинности высказывания р состоит всего из двух эле¬ ментов {*i, Хз}. Мера этого множества равна '/2 и, следовательно, как и раньше, Р[р] = 7г. В рассмотренных выше примерах мы начали с весов ветвей и определили отсюда веса путей. Иногда, однако, мы можем непосредственно опреде¬ лить веса путей. Отсюда не¬ трудно единственным образом построить множество весов вет¬ вей так, чтобы это не противо¬ речило известным значениям весов различных путей. Пример 4. Рассмотрим с новых позиций примерЗ из § б. Первокурсник вы¬ бирает для изучения одну из четырех дисциплин: ма¬ тематику, физику, химию или астрономию. Основываясь на своем знании наклонностей студента, его советчики оцени¬ вают вероятности выбора каждой из этих дисциплин вели¬ чинами 0,4, 0,3, 0,2, 0,1. Кроме того, исходя из трудности каждого курса, вероятность получения студентом высшей оценки а по математике оценивается величиной 0,1, по фи¬ зике — 0,2, по химии — 0,3 и по астрономии — 0,9. В ре¬ зультате можно построить дерево и приписать веса ветвям и путям так,, как это сделано на фиг. 92, где буквами М, Ф, X и А обозначен выбор математики, физики, химии или астрономии. Предположим теперь, что советчик пытается оценить вероятность получения студентом высшей оценки а или любой другой отметки (~а), не зная еще, какой курс вы¬ бран студентом. Это равносильно исследованию логиче¬ ских возможностей в обратном порядке, когда сначала рассматривается полученная отметка, а уже затем — вы¬ бранный курс. Новое дерево логических возможностей построено на фиг. 93. Каждый путь на этом дереве по-прежнему опреде¬ ляет и отметку, и выбранный курс. Возможные исходы обоих
206 Гл. IV. Теория вероятностей экспериментов здесь обозначены так же, как и на фиг. 92. Вес пути X] должен, естественно, равняться вероятности того, что студент получит оценку а и выберет математику. Но отсюда следует, что этот вес равен весу пути Х\ и на дереве фиг. 92. Таким обра¬ зом, одинаковые пути на этих двух деревьях получают и одинаковые веса. Таким образом, мы по¬ строили дерево логических возможностей и определили весовые функции путей; нам нужно еще определить веса отдельных ветвей. Например, определим веса ветвей, со¬ ставляющих путь хи т. е. ра и Ра,м' Нам известно, что /?a = P[/i = a] и что мно¬ жество истинности выска¬ зывания /. (*) = а имеет вид {хь лг3, лс5, х7). Мера этого множества равна 0,04 + 0,06 + 0,06 + 0,09 = 0,25, так что ра = 0,25. 1 WIX) 0,16/ м 0,04 ф Ч 0,06 0,24 ЧД36 X Ч 0,06 ‘А Ч 0,09 0,46 У -м Ч 0,36 /о№ • ф Ч 0,24 ^0JS7 13 -х Ч 0,14 4 А ч 0,01 Фиг. 93 Мы знаем также, что рара, ж = 0,04 и, следовательно, Ра, м — 0,16. Точно таким же способом определяются и веса других ветвей.
§7. Конечные стохастические процессы 2Qf7 \На этом примере видно, как информация о полученной студентом оценке влияет на результат предсказания вы¬ бранного им курса. Не принимая во внимание эту инфор¬ мации, мы полагали, что студент выберет математику с вероятностью 0,4. Однако известие о том, что студент полу¬ чил по выбранной дисциплине оценку а, заставляет нас по¬ низить эту вероятность до 0,16; наоборот, узнав, что ему не удалось получить высшего балла, мы повышаем вероятность выбора математики до 0,48 (ср. выше, стр. 194). Упражнения 1. В группе А имеется 30% студентов, получающих только высшие оценки, 40% успевающих студентов (получающих высшие оценки не по всем предметам) и 30% неуспевающих; в группе В соответственно 40%, 50% и 10%. Выбирается наугад одна из этих двух групп и в этой группе последовательно выбираются наугад два студента. Постройте меру пу¬ тей дерева и найдите вероятности того, что эти два студента успевают, но получают высшие оценки не по всем предметам. Найдите вероятность того, что второй из этих студентов не успевает. [Отв.: 0,205; 0,2.] 2. Бросается монета. Если выпадет герб, то бросают кость, если же выпадет цифра, то бросают монету второй раз. Постройте меру путей дерева для этой последовательности двух экспериментов. Найдите вероятность того, что будет брошена кость и что на ней выпадет шесть очков. 3. Для того чтобы выиграть некоторое соревнование, нужно выиграть под¬ ряд две игры из трех игр, играющихся поочередно с двумя противни¬ ками А и В. А играет сильнее, чем В: вероятность выигрыша у В равна 2/з, а у А—всего лишь 7з- Постройте на дереве логических возможно¬ стей вероятностную меру в предположении, что первой состоится встре¬ ча с А. Постройте другую . меру для случая, когда первой состоится встреча с В. В каждом из этих случаев определите вероятность выигры¬ ша двух последовательных партий. Что выгоднее: два раза встречаться с более сильным или с более слабым противником? [Отв.: 10/27, 8/27; лучше играть дважды с более сильным противником.] 4. Постройте вероятностную меру для дерева, описывающего четырехкратное бросание обычной монеты. При этом следует предположить, что вероят¬ ность выпадения герба при любом бросании равна */2 независимо от ис¬ ходов других бросаний. 5. Студент утверждает, что он умеет отличать пиво от эля. Его подвергают трем испытаниям. При каждом испытании ему дают две кружки с пи¬ вом и одну с элем и просят указать эль. Если он дает два или более правильных ответа, его утверждение считается доказанным. Нарисуйте дерево возможных исходов для описанного эксперимента (на каждой стадии студент может указать эль либо правильно, либо неправильно). Постройте меру путей на этом дереве, отвечающую случаю простого уга¬ дывания. Найдите вероятность того, что утверждение студента будет со¬ чтено доказанным, если при каждом испытании он действует методом простого угадывания. [Owe.: 7/27-1 6- Внутри ящика находятся три неисправные электрические лампочки и семь исправных. Вынимаются одна за другой наугад три лампочки (после того, как лампочка вынута, ее уже не возвращают в ящик). Постройте дерево возможных исходов, меру путей на нем и найдите вероятность того, что будет вынута по меньшей мере одна исправная лампочка. Най-
208 Гл. IV. Теория вероятностей дите вероятность того, что окажутся исправными все три лампочки, если первая лампочка была исправна. j^Ome.: ~ПГ'] 7. Вычислите вероятность того, что лицо, о котором шла речь в/ примере 3, найдет свой дом в результате самое большее двух попыток. 8. Шахматист играет подряд три партии. Психологическая особенность его такова, что он выигрывает каждую данную партию q вероятностью (1 \/г-г 1 -тр) , где k — число предыдущих выигранных им партий. (Так вероят¬ ность выигрыша первой партии равна для него V2, вероятность того, что он выиграет вторую партию, если он уже выиграл первую, равна 1Д, и т. д.) Какова вероятность того, что из этих трех партий он выиграет по меньшей мере две? 9—13. Решите упр. 3, 5, 6, 8, 9 из § б, используя построение дерева, отвечаю¬ щего содержанию соответствующих упражнений. 14. Имеются две урны А и В. Урна А содержит один черный и один красный шар. Урна В содержит два черных и три красных шара. Вынимается на¬ угад один шар из урны А и этот шар кладется в урну В. Затем выни¬ мается наугад один шар из урны В. (a) Какова вероятность того, что вынутые шары будут одного цвета? [Отв.: Via-] (b) Какова вероятность того, что шар, вынутый первым, был красным при условии, что шар, вынутый вторым, был черным? [Отв.: 2/5 ] 15. Предположим, что в матчах на первенство США по бейсболу вероят¬ ность выигрыша каждой встречи каждой командой равна V2 независимо от исходов остальных игр. Постройте меру для соответствующего дерева логических возможностей. (См. дерево из § б гл I.) Определите вероят¬ ности того, что встреча кончится после 4 игр, после 5, после 6 или после 7 игр. 16. Предположим, что в первенстве США по бейсболу одна команда сильнее другой и в каждой игре вероятность ее выигрыша равна 2/з. Введите ме¬ ру для путей дерева логических возможностей и найдите следующие ве¬ роятности: (a) Вероятность того, что более сильная команда победит после 4 игр, после 5 игр, после б игр или после 7 игр. (b) Вероятность того, что более слабая команда победит после 4 игр, после 5 игр, после 6 игр или после 7 игр. (c) Вероятность того, что серия игр окончится после 4, 5, 6 или 7 игр. [Отв.: О, 21; 0,30; 0,27; 0,22.1 (d) Вероятность того, что более сильная команда победит. [Отв.: 0,83.] 17. Из множества целых чисел ll\ = {1, 2, 3,4, 5} наугад выбирается число. Если выбрано число п, то второе число выбирается наугад уже из мно¬ жества 212 = {1, 2, . . ., п). Постройте для этих двух опытов дерево и определите на нем вероят¬ ностную меру. Обозначим через f\ и f2 две функции исхода и через /1 +л их сумму. Определите (a) Р [/, = а], а= 1, 2, 3, 4, 5; (b) Р [f2 = a]t а= 1, 2, 3, 4, 5; (c) Р [/, +/2 = а\, а = 1, 2, 3, 4, 5, 6, 7, 8, 9, 10. 18. Численность бактерий растет следующим образом: в каждом поколении каждая бактерия производит с вероятностью XU ни одной, с вероятностью 7г — одну и с вероятностью lU — Две новых бактерии и затем гибнет. При этом плодовитость каждой бактерии совершенно не влияет на
I § 8. Три типа стохастических процессов 209 плодовитость остальных. Предположив, что для начала у нас имеет¬ ся всего \уща бактерия, постройте дерево логических возможностей и меру на нем дл^ двух поколений бактерий. В качестве исхода мы будем рассма¬ тривать чйсло вновь созданных в каждом поколении бактерий. Обозначив через /1 и /2 функции исхода, определите следующие вероятности: Определите вероятность того, что в третьем поколении'не будет ни одной живой бактерии. 19. Пусть /о = 1, а /, и /2— функции исхода опытов из упр. 18. (/0 описы¬ вает первоначальную численность бактерий.) Пусть =/0 +/i и w2 = = /о Н“ /i +/г- Какой реальный смысл имеют функции и w0, ? Опре¬ делите область изменения каждой из этих функций и вероятности того, что каждая из-этих функций примет каждое из возможных для нее значений. В предыдущем параграфе мы изложили способ определения вероятностной меры для любой последовательности случайных экспериментов, каждый из которых имеет конечное число воз¬ можных исходов. Хотя этот способ дает основу для общего изу¬ чения стохастических процессов, он является слишком общим, чтобы его можно было изучить во всех деталях. По этой при¬ чине в теории вероятностей делают упрощающие предположе¬ ния, которые облегчают рассмотрение вероятностной меры. При этом естественно потребовать, чтобы такие предположения вы¬ полнялись для достаточно широкого класса экспериментов, ко¬ торые могут встретиться на практике. Мы знаем, что конечный стохастический процесс полностью описывается деревом логических возможностей и заданием весов всех его ветвей (или весов путей), как это было описано в предыдущем параграфе. Выделять отдельные типы стохастиче¬ ских процессов можно, накладывая определенные требования на Функции исхода этого процесса. Здесь мы дадим определение и приведем примеры стохастических процессов трех важных ти¬ пов: процессов с независимыми значениями, процессов незави- симых испытаний и марковских цепей. Определение. Конечный стохастический процесс с функ¬ циями исхода fi, f2> • • •, fn> • • • называется процессом с неза¬ висимыми значениями, если для любого п и произвольных исхо¬ дов t, s, г, . . ., а имеет место равенство (a) Р [/, > 0]; (b) Р [/2 > 0]; (c) Р/2 = 1[/i = l]. [Отв.: 3/4.] [Отв.: зэ/64.] [Отв.: 4/5-] § 8. ТРИ ТИПА СТОХАСТИЧЕСКИХ ПРОЦЕССОВ 14 Зак. 609.
210 Г л. IV. Теория вероятностей Другими словами, для процесса с независимыми значениями вероятность любого исхода п-го опыта (выбранного из множе¬ ства возможных исходов) не зависит от исходов предшествую¬ щих экспериментов. X w(x) х, 1/12 Начало хг 5/12 Х3 1/12 х4 5/12 Для того чтобы выяснить, является ли данный стохастический процесс процессом с независимыми значениями или нет, полезно исследовать пучок ветвей, выходящих из каждой точки ветвле¬ ния. Так на фиг. 94,6 изображены пучки, исходящие из точек ветвления Начало, Г и Ц для дерева, приведенного на фиг. 94, а. Два пучка называются эквивалентными, если они состоят из вет¬ вей, отвечающих одним и гем же исходам, причем в обоих пуч¬ ках одинаковым исходам отвечают одинаковые вероятности. Процессы с независимыми значениями характеризуются тем, что в каждом ряду дерева все пучки ветвей эквивалентны между собой. Важное свойство процессов с независимыми значениями за¬ ключается в следующем. Рассмотрим процесс с тремя функ¬ циями исхода. При этом Р K/i = а)А (/2 = Ь) Л (/3 = с)] = = Р(/1 = а| • Р/,=Д/2 = И • Р(/,=й)л(/2=<-)!/з = 4 Если наш процесс является процессом с независимыми значе¬ ниями, то, очевидно,
§8. Три типа стохастических процессов 211 р |(/, = а)\А if2 = Ь) Л (/3 = с)] = Р 1/ == а\ • Р [/2 = 6] • Р [/3 = с|. Это означает, что функции исхода f\, /2 и /з процесса с не- зависимыми значениями вероятностно независимы (относительно вероятностной меры путей дерева его логических возможностей). И вообще, любое подмножество множества функций исхода про¬ цесса с независимыми значениями должно .быть независимым (относительно вероятностной меры, определенной для дерева логических возможностей, отвечающего этому процессу). Пример 1. В качестве примера стохастического про¬ цесса с независимыми значениями рассмотрим последова¬ тельность из подбрасывания монеты и бросания игральной кости, где в опыте, состоящем в бросании игральной кости, нас интересует лишь, выпали ли б очков или не 6 очков. Дерево и соответствующая ему вероятностная мера изобра¬ жены на фиг. 94, а (Здесь ~6 обозначает, что выпало меньше 6 очков.) Важным частным случаем процессов с независимыми зна¬ чениями является процесс независимых испытаний. Определение. Конечный стохастический процесс назы¬ вается процессом независимых испытаний, если этот процесс является процессом с независимыми значениями и если Р1Л = Я] = Р1/,П = Я1 для любых п и m и а. Из самого определения процесса независимых испытаний ясно, что для дерева этого процесса все пучки ветвей должны быть эквивалентны, в то время как для процесса с независи¬ мыми значениями требуется лишь эквивалентность пучков, при¬ надлежащих одному и тому же ряду дерева. Пример 2. Выберем в качестве эксперимента операцию подбрасывания «неправильной» монеты, для которой ве¬ роятность выпадения герба при каждом бросании равна 2/з. Для любого числа бросаний мы можем построить дерево и соответствующую ему вероятностную меру; случаю п = 3 соответствует фиг. 95. Все три функции исхода процесса имеют одинаковую область изменения R = {ГЦ} и для каж¬ дой из трех функций исхода Р [/, = Г| = 2/3; Р [/, = Ц] = 73- Для процессов с независимыми значениями веса всех ветвей °Дного ряда одинаковы, т. е. не зависят от исходов предыдущих °пытов. Теперь мы рассмотрим процесс, для которого веса всех в^твей одного ряда зависят лишь от исхода предшествующего °пыта. Такой процесс называется марковской цепью.
212 Гл. IV. Теория вероятностей Определение. Конечный стохастический процесс с функ¬ циями исхода /о, f\y • • • > fn называется марковской цепью, если его исходное состояние /0 фиксировано, рл.,.!1Л = '1 = р/„.1-1Л, = <] для всех п^2 и любой последовательности исходов, а, ...» 5, t. х W(X) Xj a/Z7 Xz 1/г7 x3 4127 Xj г/27 X5 4/27 X6 2127 X7 2J27 X8 1/27 Другими словами, исход данного опыта зависит только от исхода предшествующего опыта, и, более того, характер этой зависимости одинаков для всех этапов последовательности опытов. Если две точки ветвления дерева марковского процесса ха¬ рактеризуются одинаковыми исходами, то независимо от того, принадлежат эти точки одному или разным рядам дерева, выхо¬ дящие из этих точек пучки ветвей должны быть эквивалентны. В соответствии с этими особыми свойствами марковских цепей мы дадим теперь этим процессам новое определение, эквива¬ лентное предыдущему. Определение. Пусть {sly s2, sr} есть множество воз¬ можных состояний некоторой системы; система характеризуется одним и только одним из этих состояний в каждый момент вре¬ мени. С течением времени она переходит последовательно из одного состояния в другое. Каждый такой переход называется шагом процесса. Вероятность того, что система переходит из со- стояния Si в состояние s;-, зависит только от состояния s,-, из которого она исходит в процессе рассматриваемого перехода. Фиг. 95
§ в. Три типа стохастических процессов 213 Марковская цепь характеризуется тем, что вероятности перехода ри, задающие вероятность перехода системы из состояния s£- в состояние Sj, определяются для всех упорядоченных пар со¬ стояний. Кроме того, должно быть задано исходное состояние, в котором, по предположению, находится наша система в на¬ чальный момент времени. На основании этих данных можно построить для любого (ко- вечного) числа шагов марковской цепи дерево логических воз¬ можностей и вероятностную меру на нем. Пример 3. Всем хороша Земля Оз, но только не своим климатом. Здесь никогда не бывает двух ясных дней под¬ ряд. Если сегодня ясно, то завтра с одинаковой вероятно¬ стью пойдет дождь или снег. Если сегодня снег (или дождь), то с вероятностью 72 погода не изменится. Если же все же она изменяется, то в половине случаев снег за¬ меняется дождем или наоборот, и лишь в половине случаев на следующий день будет ясная погода. Сегодня на Земле Оз ясный день. Используя всю имею¬ щуюся в нашем распоряжении информацию, займемся по¬ строением марковской цепи. В качестве состояний этой цепи мы примем различные виды погоды Д, Я, С. Теперь мы можем подсчитать вероятности перехода из одного со¬ стояния в другое. Удобнее всего свести все эти вероятности в квадратную таблицу вида Числа в первой строке таблицы представляют собой ве¬ роятности различной погоды после дождя. Числа во второй строке — вероятности различной погоды после ясного дня, а в третьей строке — после снега. Воспользовавшись этой таблицей, мы можем теперь построить дерево логических возможностей для погоды на три последовательных дня и определить меру на нем. Это дерево изображено на фиг. 96. Это дерево позволяет сделать прогноз о возможности дождя в каждый из трех следующих дней. А именно мы находим, что д Я с 1/2 • V* / 4 p\A = JX] = j, Р|/2 = Д]=|.
214 Гл. IV. Теория вероятностей 13 р!/з = Д1 = й ^4 *5 Ха 10 Чз Ъ14 w(x) 4/зг г/зг г/зг г/зг 2/32 1/32 1/32 г/зг г/зг 1/32 1/32 г/зг 2/32 2/32 г/зг 4/32 Фиг. 96 Более подробно мы займемся марковскими цепями в § 15, а также в гл. V. Упражнения 1. Пусть / равно числу выпадений герба в примере 2. Найдите Р[/ = 0], P[/=l], Р [/= 2] и Р [/= 3]. 2. В примере 3 найдите Р [fx = Я], Р [f2 = Я], Р [/3 = Я]. 3. В каждом из перечисленных случаев определите: является ли описанный процесс
§ 8. Три типа стохастических процессов 215 (a) процессом с независимыми значениями, (b) процессом независимых испытаний, (c) марковской цепью, (d) ни тем, ни другим и ни третьим. I. Несколько раз бросается кость. [Отв.: (b).J II. Проводится первенство США по бейсболу; здесь мы предпола¬ гаем, что каждая команда имеет одинаковые шансы на выигрыш любой игры. III. Проводится серия игр между двумя командами, причем победи¬ тель в каждой игре выигрывает следующую игру с вероятностью 2/з. [Отв.: (с).] IV. Проводится серия игр между двумя командами, которые по оче¬ реди играют то у себя на поле, то у противника. Вероятность выигрыша на своем поле принимается равной 2/з. 4. Предположим, что в условиях примера 1 сначала бросают игральную кость. Постройте дерево логических возможностей и определите на нем вероят¬ ностную меру. 5. Имеются две монеты: одна — правильная, а у другой вероятность выпа¬ дения герба равна 2/з. Если в предыдущий раз выпал герб, то подбрасы¬ вают правильную монету; в противном случае бросается вторая монета. Пусть в первый раз выпала цифра. Постройте дерево логических возмож¬ ностей, охватывающее исходы трех последующих бросаний, и определите нд нем вероятностную меру. Какова вероятность того, что по крайней мере два раза выпадет герб? [Отв.: 2/3.] 6. Покажите, что процесс, описанный в упр. 5, представляет собой марковскую цепь. Выпишите для нее вероятности перехода. 7. В играх между командами А и В вероятность победы А равна 0,6, веро¬ ятность поражения — 0,3 и ничьей — 0,1. Постройте дерево логических возможностей и определите на нем меру для последовательности из трех игр. 8. В упр. 7 предположим, что за победу команде дается 2 очка, за ничью 1 и за поражение 0. Какова вероятность того, что в этом матче каждая команда набирает по 3 очка? [Отв.: 0.109.] 9. Известно, что сыновья выпускников Гарвардского университета с вероят¬ ностью 0,8 поступают в Гарвардский университет, а остальные идут в Йельский. 40% сыновей выпускников Йельского университета поступают в тот же университет, что и их отцы, а остальные делятся поровну между Гарвардским университетом и Дартмутским колледжем1). 70% сыновей выпускников Дартмутского колледжа поступают в Дартмутский колледж, 20% — в Гарвардский университет и только 10% в Йельский универ¬ ситет. (a) Выпишите для этой марковской цепи таблицу вероятностей перехода. (b) Если в нынешнем поколении рассматривать круг людей, состоящий на 40% из выпускников Гарвардского университета, на 40% — из вы¬ пускников Йельского университета и на 20% — из выпускников Дарт¬ мутского колледжа, то каково б*удет распределение высших учебных заведений в следующем поколении этих семей? (c) Предположим, что сын выпускника Гарвардского университета навер¬ няка поступает в Гарвардский университет. Как изменится при этом таблица, вероятностей перехода? ') Университеты и колледжи в США можно сравнить с университетами и Учебными институтами в СССР (в частности, роль наших педагогических иц- Дитутов в США играют так называемые учительские колледжи).
216 Гл. IV. Теория вероятностей § 9. НЕЗАВИСИМЫЕ ИСПЫТАНИЯ С ДВУМЯ ИСХОДАМИ Выше мы видели, что процесс независимых испытаний опи¬ сывается следующей схемой. Пусть имеется последовательность случайных экспериментов, состоящих в многократном повторе¬ нии одного и того же эксперимента, причем результат каждого осуществления нашего эксперимента никаким путем не влияет на результаты всех других его осуществлений. Обозначим воз¬ можные исходы отдельного эксперимента через аи . . ., аг. Допу¬ стим также, что заданы вероятности рь . . ., рг каждого исхода нашего эксперимента (остающиеся одними и теми же для всех осуществлений). Дерево возможностей для этой последователь¬ ности экспериментов будет в каждой точке ветвления иметь одинаковые (эквивалентные) пучки ветвей. В этом и следующих параграфах мы специально рассмотрим важный случай двух исходов для каждого эксперимента. Более общий случай будет изучаться в § 13. В случае двух исходов принято один исход называть «успехом», а другой — «неудачей». Например, при многократном бросании монеты можно усло¬ виться считать успехом герб, а неудачей — цифру. Вероятность р успеха и вероятность q = 1 — р неудачи мы будем предпола¬ гать известными. Введение меры на дереве для последователь¬ ности трех таких экспериментов проиллюстрировано на фиг. 97. Веса, приписанные путям, указаны в конце каждого пути. Теперь мы решим следующий вопрос. Пусть дан процесс не¬ зависимых испытаний с двумя исходами. Чему равна вероят¬ ность w(n, х; р) в точности х успехов при п экспериментах? (Мы обозначили эту вероятность через w(n, х; р), чтобы пока¬ зать, что она зависит от п, х и р.) Допустим, что мы уже построили дерево для этой общей си¬ туации, аналогичное дереву для трех экспериментов, изображен¬ ному на фиг. 97; точки ветвления обозначаются у нас буквами У и Н, символизирующими «успех» и «неудачу». Тогда множе¬ ство истинности высказывания «Число успехов равно х» будет состоять из всех путей, проходящих через х точек ветвления, обозначенных буквой У, и через п—х точек ветвления, обозначен¬ ных буквой Н. Чтобы найти вероятность нашего высказывания, мы должны сложить веса всех таких путей. Здесь мы впервые вос¬ пользуемся тем фактом, что введенная на нашем дереве вероят¬ ностная мера приписывает каждому такому пути один и тот же вес, а именно pxqn~x. Последнее видно из того, что каждой ветви, ведущей к У, приписана вероятность р, и каждой ветви, ведущей к Н, приписана вероятность р, в результате чего в про¬ изведение вероятностей будет входить х раз р и п — х раз q- Для определения искомой вероятности нам остается только
§ 9. Независимые испытания с двумя исходами 217 найти число путей, принадлежащих множеству истинности вы¬ сказывания «Число успехов равно х». Каждому такому пути можно поставить в соответствие упорядоченное разбиение мно¬ жества целых чисел от 1 до я на две ячейки, из которых первая Фиг. 97 содержит х элементов, а вторая содержит п — х элементов. Мы делаем это, помещая номера экспериментов, приведших к успеху, в первую ячейку, а номера экспериментов, приводящих к не¬ удаче,— во вторую ячейку. Так как число всех таких разбиений равно то столько же будет и путей во множестве истин¬ ности рассматриваемого высказывания. Итак, мы доказали сле¬ дующее утверждение: Для процесса независимых испытаний с двумя исходами ве¬ роятность в точности х успехов при п экспериментах дается формулой w(n, х; p) = {nx)pxqn-x. Пример 1. Рассмотрим п бросаний обычной монеты. Назовем выпадение герба «успехом», а выпадение цифры «неудачей», и будем считать, что вероятность успеха равна ~2 при любом бросании независимо от исхода любого дру¬
218 Гл. IV. Теория вероятностей гого бросания. Тогда вероятность того, что герб выпадет в точности л: раз, равна Например, при 100 бросаниях вероятность того, что герб выпадет в точности 50 раз, равна что приблизительно равно 0,08. Таким образом, мы видим, что выпадение герба ровно в половине бросаний совсем маловероятно. С другой стороны, пусть нас интере¬ сует вероятность того, что выпадение герба было резуль¬ татом примерно половины бросаний. Для боль¬ шей определенности вычислим вероятность того, что число выпадений герба отклоняется от 50 не более чем на 10. Чтобы найти эту вероятность, мы должны сложить числа мы найдем, что искомая вероятность приблизительно равна 0,96. Итак, хотя выпадение в точности 50 гербов и мало¬ вероятно, но весьма вероятно, что число выпадений герба будет отклоняться от 50 не более чем на 10. Пример 2. Пусть у нас есть машина, которая на основе имеющейся информации должна предсказать победу рес¬ публиканцев или демократов на выборах. Мы предполагаем, что если одинаковую информацию ввести в две идентичные машины, то и ответ их будет одинаков. Однако бла¬ годаря возможности неполадок в электрической или меха¬ нической системах машина с некоторой вероятностью q мо¬ жет изменять свое предсказание. Для того чтобы повысить точность предсказания, имеющаяся информация вводится в г идентичных машин, а в качестве ответа принимается ответ, получившийся наибольшее число раз. Для того что¬ бы исключить возможность равенства числа разных пред¬ сказаний, будем считать г нечетным. Посмотрим теперь, как увеличение числа машин понижает вероятность ошиб¬ ки предсказания, вызванной неполадками в ее устройстве. Рассмотрим последовательность из г экспериментов, состоящих в том, что информация задается одной машине. В качестве исходов эксперимента мы рассматриваем ее «успех» и «неудачу», под которыми понимается то, ука¬ зывает ли машина истинный результат или нет. Вероят- для х = 40, 41, 42, .. ., 60. Проделав это,
§ 9. Независимые испытания с двумя исходами 219 ность успеха равна р = 1 —q. Предсказание большинства машин будет совпадать с предсказанием безупречно рабо¬ тающей машины, если число успехов превосходит г/2. Предположим, например, что мы имеем 5 машин, для ка¬ ждой из которых вероятность выдачи искаженного пред¬ сказания вследствие ее неисправности равна 0,1. Тогда вероятность успеха равна 0,9. Следовательно, вероятность того, что предсказание большинства машин будет совпа¬ дать с предсказанием исправной машины, равна ^(5,3; '0,9) +да (5,4; 0,9) +да (5,5; 0,9), что приблизительно равно 0,991 (см. упр. 3). Таким образом, наша процедура уменьшает вероят¬ ность ошибки, обусловленной неисправностями, от 0,1 в случае одной машины до 0,009 в случае пяти машин. Упражнения 1. Вычислите для п = 4, п — 8, п = 12 и п = 16 вероятность выпадения герба точно в половине из п бросаний обычной монеты. [Отв.: 0,375; 0,273; 0,226; 0,196.] 2. Вычислите для п = 4, п — 8, п = 12, п = 16 вероятность того, что доля гербов, приходящихся на п бросаний, отклоняется от 1/2 менее чем на 7б- 3. Проверьте, что вероятность 0,991 в примере 2 указана правильно. 4. Допустим, что Петр и Павел сравнивают монеты, подбрасывая четыре раза одинаковые монеты. [При игре в сравнение монет (в ней Петр забирает обе монеты, если они упали одной стороной и теряет свою монету в про¬ тивном случае) вероятность выиграть монету равна ]/2 как для Петра, так и для Павла.] Какова вероятность того, что Петр выиграет больше, чем Павел? То же самое для случая пяти бросаний. То же самое для случая 12 917 бросаний. -i-; i.J 5. Бросается четыре раза обычная игральная кость. Какова вероятность того, что выпадут в точности две шестерки? 6. Какова вероятность получения 70% или более правильных ответов при простом отгадывании на экзамене, состоящем в определении, истинности или ложности десяти утверждений? j^O/ne.: . J 7. Монета бросается восемь раз. Чему равно наиболее вероятное число вы¬ падений герба? Чему равно наиболее вероятное число выпадений герба при условии, что в результате первых четырех бросаний выпадает герб? 8. На одном маленьком предприятии работает десять служащих. Эти служа¬ щие завтракают в одной из двух закусочных, причем выбор ими той или другой закусочной одинаково вероятен. Если владельцы закусочных хотят быть уверенными более чем на 95% в том, что у них найдется достаточно мест, то сколько мест должно быть в каждой закусочной? [Отв.: Восемь мест.]
220 Гл. IV. Теория вероятностей 9. Предположим, что у пяти человек, выбранных наугад, спросили, поддер¬ живают ли они некоторое мероприятие. Если мероприятие поддерживает всего лишь 30% населения, то какова вероятность того, что большинство из пяти выбранных человек ответит положительно? 10. Пусть в примере 2 вероятность искажения ответа машиной вследствие ее неисправности равна 0,2. Сколько потребовалось бы машин, чтобы сде¬ лать большей 0,89 вероятность гого, что полученный ответ совпадет с от¬ ветом исправной машины? [Отв.: Три машины.] 11. Предположим, что согласно произведенному подсчету вероятность попа¬ дания торпеды в корабль равна 7з- Сколько должно быть выпущено тор¬ пед, чтобы вероятность по меньшей мере одного попадания в цель была больше чем 0,9? 12. Студент считает, что если он возьмется изучать четыре предмета, то веро¬ ятность сдачи экзамена, по каждому из них равна 0,8. Если он возьмется изучать пять предметов, то вероятность сдать каждый предмет равна 0,7, а в случае семи предметов вероятность сдачи каждого из них равна 0,5. Его единственная цель — сдать экзамен по меньшей мере по четырем предме¬ там. Сколько предметов должен он выбрать, чтобы иметь наилучшие шансы достигнуть своей цели? [Отв.: 5.] § 10. БИНОМИАЛЬНАЯ МЕРА И ЕЕ ПУАССОНОВСКАЯ АППРОКСИМАЦИЯ Продолжим рассмотрение процесса независимых испытаний, для которого каждый эксперимент имеет лишь два возможных исхода а и b или У и Н. Теперь нам будет удобнее обозначать исходы каждого эксперимента через 0 и 1. Пусть /2, . . ., /л— функции исхода этого процесса. Тогда функция sn=fx-\~ +/2 + ... -\-fn определяет число повторений исхода 1 (ранее мы называли его исходом У) в последовательности из п экспе¬ риментов. Из § 9 мы знаем, что р[*„=у1 = (")/>УЧ где р есть вероятность исхода У в одном, отдельно взятом испы¬ тании, a q= 1— р есть вероятность исхода Н. Эти вероятности мы обозначали через w (п, /; р). Функция w (я,/; р) (или w (/; п, р)) носит название бино¬ миального распределения вероятностей. На фиг. 98 мы изобра¬ зили графически W (/; 8, 3/4), а на фиг. 99—w(j\ 7,3/4). Легко ви¬ деть, что в первом случае, функция w достигает максимума в точке / = 6 и после этого начинает убывать. Во втором случае функция w растет до j = 5, сохраняет свое значение в точке / = = 6 и загем уже начинает монотонно убывать. Эти два случая являются, вообще говоря, типичными. Возвращаясь к распределениям общего вида, рассмотрим отношение значений функции w в двух соседних точках j И
§ 10. Биномиальная мера и ее пуассоновская аппроксимация 221 ^ 1. Очевидно: «■(/+ 1; п, р) UlRV- w п, р) 7-1 n — j р У+1 ‘ Я Это отношение больше 1, если (я —j)p > (/ + l)gv или, други¬ ми словами, если / < пр — п Если число пр — q не целое, то £ (VT Ф и г. 98 0,4 0,3 QO 0,2 * 0,1 0,3 П 0,203 0,087 0,000 0000 004 0,023 i ош 0,100 о 1 3 А 5 Фиг. 99 рачения w возрастают до некоторого максимума з точке, в ко- °Рой целое число / впервые оказывается больше пр — q, и за- ем убывают. Если же пр — q — целое, tow, возрастая сначала,
222 Гл. IV. Теория вероятностей принимает наибольшее значение в двух соседних точках j = пр— q и j = пр — q + 1, и только после этого начинает убы¬ вать. Пример 1. Игральная кость бро¬ сается шесть раз. Обозначим через s6 число выпавших шестерок. Тогда P|s, = /| = ni(y; 6, '/«НуКтШГ'- Значения этой функции приведе¬ ны на фиг. 100. В этом случае функ¬ ция w принимает максимальное зна¬ чение в единственной точке / = 1. Заметим теперь, что, рассматривая определенную на множестве U ={0,1,2,... . . ., п) функцию при фиксированных п и р, мы находим, что она обладает всеми свойствами весовой функции. Такая весо¬ вая функция пригодна для грубого анализа логических возмож¬ ностей, связанных лишь с числом повторения определенного исхода а (или У). Определенная таким образом вероятностная мера обычно называется биномиальной. Значения функции w при больших п очень плохо поддаются вычислению. Однако существуют приближенные методы опреде¬ ления этих вероятностей для больших п. Наиболее распростра¬ ненный из этих методов, связанный с так называемым «распре¬ делением Гаусса», существенно не конечен по своему характеру и требует знания интегрального исчисления1). В этом параграфе мы рассмотрим другой метод. Теорема. Рассмотрим биномиальное распределение вероят¬ ностей w(j\ пу р) и положим., что / остается постоянным, п стре¬ мится к бесконечности, ар — к нулю, причем, так, что произве¬ дение пр остается постоянным и равным т. Тогда / -т , . v те lim w (у; п, р) — —р—. где е= lim (l +4-^ = 2,71828 ... /г ->оо \ П / — основание системы натуральных логарифмов. X w (У; 6, ’АО 0 0,33490 1 0,40180 2 0,20093 3 0,5359 4 0,00804 5 0,00064 6 0,00002 Фиг. 100 ]) Относительно теоремы Лапласа, устанавливающей связь биномиаль¬ ного распределения с нормальным распределением Гаусса, см., например, указанные в конце этой главы книги Б. В, Гнеденко и В. Ф ел л ер а.
§ К). Биномиальная мера и ее пуассоновская аппроксимация 223 Доказательство. Напишем п(п— 1) ... (п — j + 1) nJ п _ nV4_j w (у; n, p) = W-v-v-J + VpJ (i Поскольку p = га/я, то правая часть этого тождества равна п (п — 1) ... {п — / + 1) / т \ j j 1 т\п~1 ? : / т у (1 т \ n~J 1тг; у~т) > что можно переписать и так (,_iy Воспользуемся теперь следующим известным результатом *): lim (l - — )"== е~т. /1->осЛ п> Так как j и га фиксированы, то lim 1 (1 . (l — ini\ = 1 л->оо \ п> \ п ) Отсюда lim (l — — V= 1. /1-юЛ п) rr)j р ~ т lim w (у; п р) = ——- . /г->оо / Значение этой теоремы заключается в том, что вследствие ее для последовательности большого числа п испытаний с малой вероятностью р одного из их исходов биномиальное распределе¬ ние можно заменить распределением вида Jo~m w (у; т) ■ Л ’ где га = пр. Пример 2. Предположим, что типографский наборщик делает в среднем одну ошибку на 1000 слов. Пусть он на¬ бирает сейчас книгу, каждая страница которой содержит 100 слов. Обозначим через s число ошибок, допущенных при наборе одной страницы. Каждое набранное слово мы 0 См любой курс математического анализа (или указанную в конце Главы книгу А. М. Яглом и И. ДА. Я глом, Неэлемептарные задачи в эле- Гитарном изложении, задача 157).
224 Гл. IV. Теория вероятностей рассматриваем как отдельный эксперимент и предполагаем, что вероятность ошибки в каждом отдельно взятом слове равна 0,001. Рассматривая теперь набор страницы как про¬ цесс независимых испытаний, получим, что P|s = y|=- = w (у; 100; 0,001). Значение этой функции w и ее прибли¬ женные значения, полученные при использовании формулы дляге;(/, т), где m = tip = 100 • 0,001 =0,1, с точностью до пяти знаков воспроизведены в таблице фиг. 101. 0 \]р~0Л Здесь W (j; 0,1) = . j \ w(j\ 100; 0,001) 1 w{j\ 0,1) 0 0,90480 0,90484 1 0,09057 0,09048 2 0,00449 0,00452 3 0,00015 0,00015 4 0,00000 0,00000 Фиг. 101 Рассмотрим теперь гипотетический эксперимент, исходом ко¬ торого может быть любое положительное целое число, т. е. U ={1,2, . . .}. По аналогии с экспериментами с конечным чис¬ лом исходов мы можем определить на U такую меру, что сумма всех весов равна 1. На основании теоремы, доказанной ранее г этом параграфе, можно предположить, что вероятность исхода / описывается формулой , . ч mJe~m w (J; пг) = —J—. Разложив е'п в ряд '), мы убедимся в гом, что vwWra)„v^!=e-,»S-=1; j j j поэтому, выбрав таким образом функцию веса w, мы действи¬ тельно определили на U вероятностную меру. Эта мера назы¬ вается пуассоновской мерой; о смысле параметра пг мы еще скажем в дальнейшем. Биномиальное распределение описывает множество весов, определенных на множестве Un ={ 1, 2, ...,/г}. Пуассоновское ') См. любой курс математического анализа (или книгу А. М. ЯглоМ и И. М Яглом, Неэлементарные задачи в элементарном изложение- задача 158).
§ 10. Биномиальная мера и ее пуассоновская аппроксимация 225 j Пуассо¬ новская мера т = 0,1 Биномиаль¬ ная мера /2=10 /7 = 0,01 Пуассонов¬ ская мера ш= 1 Биномиаль¬ ная мера /2=100 ■ /7 = 0,01 Пуассонов¬ ская мера /72=10 Биномиаль¬ ная мера /2=100.) /7 = 0.01 0 0.9048 . 0,9044 0,3679 0,3660 0,0000 0,0000 1 0,0905 0,0914 0,3679 0,3697 0,0005 0,0004 2 0,0045 0,0042 0,1839 0,1849 0,0023 0,0022 3 0,0002 0,0001 0,0613 0,0610 0,0076 0,0074 4 0,0000 0,0000 0,0153 0,0149 0,0189 ‘ 0,0186 5 0,0031 0,0029 0,0378 0,0374 6 0,0005 0,0005 0,0631 0,0627 7 0,0001 0,0001 0,0901 0,0900 8 0,0000 0,0000 0,1126 0,1128 9 0,1251 0,1256 10 0,1251 0,1257 И 0,1137 0,1143 12 0,0948 0,0952 13 0,0729 0,0731 14 0,0521 0,0520 15 0,0347 0,0345 16 0,0217 0,0215 17 0,0128 0,0126 18 0,0071 0,0069 19 0,0037 0,0036 20 0,0019 0,0018 21 0,0009 0,0009 22 0,0004 0,0004 23 0,0002 0,0002 24 0,0001 0,0001 25 0,0000 0,0000 Фиг. 102 же распределение определяет множество весов на множестве (0, 1, 2, . . .,п, . . .} всех целых неотрицательных чисел. На¬ ша теорема устанавливает, что веса, определяющиеся бино¬ миальной мерой с параметрами пир, приближенно совпадают с весами пуассоновской меры для т = пр при условии, что п велико, а р мало. На фиг. 102 приведено несколько случаев ап¬ проксимации биномиальной меры пуассоновской. Упражнения Примечание. При решении этих задач следует использовать таблицы функции е~т. 15 Зак. 609
226 Гл. IV. Теория вероятностей 1. Пусть для исходов эксперимента определена пуассоновская мера, где m = о 3 Обозначим через /функцию исхода.. Определите Р[/=0]> Р[/=]| и Р[/ > 1]. [Отв.: 0,741; 0,222; 0,037.] 2. Вероятность того, что на руках одного из четырех игроков в бридж ока¬ жутся все червонные карты, равна 6,3 * 10-12. Одному специалисту по теории вероятностей, жившему в городе с населением 50 000 человек, регу¬ лярно раз в год (обычно поздно вечером) звонили по телефону и сооб¬ щали, что только что один из партнеров получил 13 червонных карт. Сле¬ дует ли предположить, что некоторые из этих счастливых партнеров яв¬ ляются продуктами мистификации? [Отв.: Да. Если предположить, что ежедневно каждый житель города получает карты пятьдесят раз, то и тогда вероятность сдачи в одни руки всех червонных карт в течение одного года оказывается мень¬ ше 0,01.] 3. Предположим, что в среднем на каждую тысячу человек только один имеет особенно редкую группу крови. (a) Какова вероятность того, что в городе с населением в 10 000 чело¬ век не найдется ни одного человека с такой группой крови? [Отв.: 0,00005.] (b) У скольких людей надо взять на исследование кровь, чтобы с ве¬ роятностью, большей 0,5, обнаружить человека с кровью этой группы? 4. Надо выпечь 500 штук печений с изюмом. Определите, каким должно быть минимальное число изюминок, для того чтобы вероятность того, что' в одном из этих 500 печений не окажется ни одной изюминки, не превы¬ шала 0,01. ;5. Один владелец автомашины никогда не платил за стоянку (стоимость сто- j янки — 5 центов). Он полагал, что вероятность быть пойманным равна | 0,05. Известно, что в первый раз вы отделываетесь предупреждением, | второй раз с вас берется штраф в 50 центов и в последующие разы штраф размером в один доллар. Сравните при этих условиях сред¬ нюю величину штрафа за 20 стоянок со стоимостью этих стоянок по счетчику. 6. Агент по рекламе распространяет в городе 10 000 проспектов. В этом го¬ роде имеется 2000 кварталов. Пусть каждый проспект с одинаковой веро¬ ятностью может попасть в любой квартал. Какова вероятность того, что хоть один квартал останется без проспектов? [Отв.: 0,007.] 7. Пусть для некоторого эксперимента была определена пуассоновская мера с параметром т. Покажите, что наиболее вероятным является такой исход k этого эксперимента, что т — 1 k При каких условиях наиболее вероятными окажутся два исхода этого эксперимента.? 8. Один человек получал в среднем по десять писем в день. Однажды он не получил ни одного письма и спросил себя, а не закрыта ли сегодня почта. Для того чтобы ответить себе на этот вопрос, он вычислил ве¬ роятность того, что за десять лет по крайней мере один раз ему не придет ни одного письма. При этом он предполагал, что число получае¬ мых писем имеет пуассоновскую меру. Какова подсчитанная им вероят¬ ность? (Указание. Пуассоновскую меру нужно здесь использовать дважды, чтобы определить вероятность того, что в определенный день этот чело¬ век не получит ни одного письма, и для того, чтобы вычислить вероятность того, что среди 3000 дней не найдется ни одного, в который он не получил бы ни одного письма; почта доставляется приблизительно 300 дней в году)- [Отв.: 0,13]
§ li. Закон больших чисел 227 § 11. ЗАКОН БОЛЬШИХ ЧИСЕЛ В этом параграфе мы изучим некоторые дальнейшие свой¬ ства процесса независимых испытаний с двумя исходами. В § 9 мы видели, что вероятность х успехов при п испытаниях дается формулой f{n, х; Р) = (")рхдп~х. Отношение вероятности х успехов при п испытаниях к веро¬ ятности х— 1 успехов при п испытаниях ( п \рх+'ап-х-1 4 п — х р _'+i ’ будет, как мы знаем, больше единицы при (п — х'р > (х-\- V q, (т. е. при x<inp — q), а затем становится меньше единицы (см. § 10). Таким образом, наибольшая вероятность соответ¬ ствует числам х, близким к пр. Это не означает, что для отдель¬ ного х, близкого к пр, вероятность л: успехов велика, а означает лишь то, что она велика по сравнению с вероятностью для чи¬ сел х, более удаленных от пр. Например, при 100 бросаниях мо¬ неты пр = 100 - 72 = 50. Вероятность выпадения в точности 50 гербов равна приблизительно 0,08. Вероятность выпадения в точности 30 гербов равна приблизительно 0,00002. Более ценную информацию дает изучение вероятности за¬ данного отклонения доли успехов х/п от числа р, т. е. изучение для е, большего нуля, вероятности Р [/> — При любых фиксированных п, р и е последнюю вероятность можно найти путем сложения всех значений f(n, х\ р) для тех ^ х ^ значении х, которые удовлетворяют неравенству р — е < — < < р + е. Это может оказаться утомительной задачей для конкрет¬ ного выбора п, р и в. Однако в учебниках по теории вероятно¬ стей доказывается, что р[р— <4</>+«]>i— Каким бы малым ни было е, всегда можно выбором доста¬ точно большого п сделать величину 1 — pqjnz2 как угодно близ- к°й к 1. Таким образом, вероятность отклонения доли успехов °т р менее чем на е можно сделать как угодно близкой к 1 пу- Тем выбора достаточно большого п, Тот факт, что это может 15*
228 Гл. IV. Теория вероятностей быть сделано, есть частный случай одной весьма общей теоре¬ мы теории вероятностей, называемой законом больших чисел. Положим в предыдущем неравенстве е = k pqjn - Тогда мы будем иметь ИЛИ Р [np — kVnpq <х< np + kVnpq]^ 1 ^ , что в свою очередь может быть записано в виде Р [— k Vnpq <x — np<k Vnpq\ >1 Величина пр называется средним значением, или математи¬ ческим ожиданием числа успехов (см. ниже § 14), а величина Vnpq — дисперсией, или стандартным отклонением числа успехов Мы видим, что вероятность отклонения числа успехов от среднего значения на величину, большую k стандартных откло.- нений, не превосходит 1/62. Следовательно, для большого k эта вероятность будет мала. В более подробной теории доказывается, что Р[— k Vnpq <x — np<k Vnpq\^zk, где zh — число, которое может быть найдено для любого поло¬ жительного k и не зависит ни от пу ни от р. Символ ~ означает, что указанная вероятность только приближенно равна zk. Это приближение улучшается с увеличением п, но даже для доволь¬ но больших п ошибка может быть заметной и потому на прак¬ тике таким приближением нужно пользоваться с осторожно¬ стью. Заметим, что данное выше приближение можно интерпрети¬ ровать также следующим образом: вероятность того, что х— пр больше, чем k Vnpq,.или меньше, чем —kVnpq, приближенно равна 1—zk. Во многих приложениях интересуются лишь ве¬ роятностью того, что х — пр больше, чем kVnpq• Из более подробной теории следует, что эта вероятность приближенно равна (1—zk)/2. Следовательно, и вероятность того, что х — пр меньше, чем —k Vnpq, приближенно равна (1 —zk)l2. Удобно представлять себе стандартное отклонение (диспер* сию) как единицу измерения. В таком случае zk означает при¬ ближенную вероятность отклонения менее чем на k единиц, или k стандартных отклонений. Значения zh для k = 1,2 и 3 равны
§11. Закон больших чисел 229 Zl = 0,683 .. z2 = 0,956 .. z3 = 0,997 .... Таким образом, мы видим, что при большом числе испытаний очень маловероятно получить отклонение от среднего значения на величину, боль¬ шую трех стандартных отклонений. С другой стороны, z0i\ = 0,080.... Это показывает, что также чрезвычайно мало¬ вероятно, что отклонение от среднего значения будет меньше одной десятой стандартного отклонения. Пример 1. При бросании обычной монеты 10 000 раз среднее значение числа гербов равно 5000, а дисперсия для числа гербов равна V ЮООоШ (-^) = 50. С ледователь- но, вероятность того, что число выпадений герба отклонит¬ ся от 5000 менее чем на одну дисперсию, т. е. менее чем на 50, равна приближенно 0,683. Вероятность отклонения менее чем на две дисперсии, т. е. менее чем на 100, при¬ ближенно равна 0,954. Вероятность отклонения менее чем на 0,1 дисперсии, т. е. отклонения менее чем на 5, равна приближенно 0,080. Утверждение, что число гербов откло¬ няется от 5000 менее чем на 150, эквивалентно утвержде¬ нию, что доля гербов отклоняется от 0,5 менее чем на Пример 2. Предположим, что в одном большом городе выбрали наугад 900 человек и спросили их, поддерживают ли они некоторое мероприятие. Из 900 опрошенных 550 вы¬ сказались в пользу этого мероприятия, а 350 высказались против. Будет ли маловероятным, что такое убедительное большинство получено в выборке 900 человек, если насе¬ ление города разделяется поровну на тех, кто поддержи¬ вает мероприятие, и тех, кто его не поддерживает? Если население разделено поровну, то можно предположить, что 900 опрошенных человек образуют процесс независимых испытаний с вероятностью У2 «за» и V2 «против». Тогда стандартное отклонение (дисперсия) для числа ответов му было бы весьма маловероятно, чтобы мы получили от¬ клонение от среднего значения 450 более чем на 45. Тот факт, что в данной выборке отклонение от среднего значе¬ ния равняется 100, свидетельствует, очевидно, о неправиль¬ ности гипотезы о разделении мнений поровну. Предполо¬ жение о том, что фактическая доля тех, кто поддерживает мероприятие, равна некоторому числу, меньшему, чем V2, тем более привело бы к заключению, что в выборке из 900 человек наличие 550 человек, поддерживающих меро¬ 10 000 «за» в 900 испытаниях равно Поэто-
230 Гл. IV. Теория вероятностей приятие, весьма маловероятно. Это заставляет нас думать, что истинная доля больше, чем V2. С другой стороны, если бы из 900 человек число тех, кто «за», равнялось бы 465, то в предположении, что мнения разделены поровну, мы имели бы отклонение лишь на одну дисперсию. Поскольку такое отклонение не является маловероятным» то на основании нашей выборки мы не могли бы исключить возможность разделения мнений поровну.. Упражнения 1. Если обычную игральную кость бросают 20 раз, то чему равно среднее значение числа выпадений шести очков? Чему равно стандартное откло¬ нение для числа выпадений шести очков? W 5 1 \Orne:. -3-; -.j 2. Предположим, что обычная игральная кость бросается 450 раз. Чему равно среднее значение числа бросаний, имеющих результатом 3 или 4 очка? Чему равно стандартное отклонение для числа таких бросаний? 3. Чему равно среднее значение числа выпадений герба при 16 бросаниях обычной монеты? Чему равно стандартное отклонение для числа выпаде¬ ний герба? [Отв.: 8; 2.] 4. Для 16 бросаний монеты найдите точную вероятность того, что число гербов отклоняется от среднего значения числа гербов (а) менее чем на одно стандартное отклонение и (Ь) не более чем на одно стандартное откло¬ нение. То же самое для случая двух стандартных отклонений и для слу¬ чая трех стандартных отклонений. Покажите, что приближения, указан¬ ные для больших п, лежа.т между полученными значениями, но в нашем случае п = 16 не очень точны. [Отв.: 0,546; 0,790; 0,923; 0,979; 0,996; 0,999] 5. Рассмотрим п независимых испытаний с вероятностью успеха р. Пусть г и s — такие числа, что р < г < s. Что говорит 'закон больших чисел о р[г<т<4 когда п неограниченно возрастает? Тот же вопрос для случая г < р < s. 6. Известно, что некоторое лекарство эффективно в 20% тех случаев, когда оно применяется. В это лекарство ввели новую составную часть, и из последующих 900 случаев его применения оно оказалось эффективным в 250 случаях. Что можно сказать об эффективности нового лекарства? 7. Рассмотрим большое число независимых испытаний с вероятностью успе¬ ха р. Чему равна, приближенная вероятность того, что число успехов отклонится от среднего значения числа успехов более чем на одно стан¬ дартное отклонение, но менее чем на два стандартных отклонения? [Отв.: 0,271.] 8. Чему равна приближенная вероятность того, что при 10 000 бросаниях обычной монеты число выпадений герба будет заключено между 4850 и 5150? Какова приближенная вероятность того, что число гербов лежи г в том же интервале, при условии, что в результате первых 1900'бросаний выпадает 1600 гербов? 9. Допустим, мы хотим сделать равной приближенно 0,95 вероятность того, что доля выпадений шести очков при я-кратном бросании кости не откло¬ нится более чем на 0,01 от значения -g-. Ка.к велико должно быть я? [Отв.: Приблизительно 5555.)
§ 12 *. Проблема выбора решения 231 Ю Две железнодорожные компании конкурируют из-за перевозки 1000 пас¬ сажиров, отправляя поезда в одно и то же время. Если каждый пасса¬ жир может с одинаковой вероятностью выбрать поезд как одной, так и другой компании, то по скольку мест должны предусмотреть эти компа¬ нии, если они хотят быть уверенными, что вместительность их поездов окажется достаточной в 99 случаях из 100? [Отв.: 547.] 11. Предположим, что в одном городе 10% всего населения болеет раком. Чему равно среднее значение числа больных раком при выборе наугад 900 человек из этого города? Чему равно стандартное отклонение? Чему приблизительно равна вероятность того, что более чем 108 человек из этих 900 больны раком? [Отв.: 90; 9; 0,023.] 12. Предположим, что в условиях упр. 11 900 человек выбраны наугад из курящих жителей города. В предположении, что курение не оказывает никакого влияния на заболеваемость раком, найдите среднее значение числа больных раком среди этих 900 человек. Предположим, что более 120 из 900 выбранных человек больны раком. Что можно тогда сказать относительно гипотезы об отсутствии связи между курением и заболе¬ ваемостью раком? 13. В примере 2 мы предполагали в наших вычислениях, что если фактиче¬ ская доля населения, поддерживающего мероприятие, равна р, то 900 вы¬ бранных наугад человек образует процесс независимых испытаний с ве¬ роятностью р ответа «за» и вероятностью 1— р ответа «против». Ука¬ жите способ зыбора 900 человек, при котором такое предположение оправдано. В чем состоит неправильность приведенных ниже способов? (a) Выбираются первые 900 человек в регистрационном списке респу¬ бликанцев. (b) Выбирается наугад 900 фамилий из телефонной книги. (c) Выбирается наугад 900 цомов, и в каждом из них опрашивается один человек, причем дома посещаются в первой половине дня. 14. Пусть для п бросаний обычной монеты tn таково, что р [- < <„]= 0,997. где х означает число выпадений герба. Найдите (п для п = 104, п = 10б и п = 1020. [Отв.: 0,015; 0,0015; 0,000 000 000 15.] 15. Допустим, что при решении некоторой задачи вычислительная машина производит миллион операций. Пусть в каждой операции машина с веро¬ ятностью -^-делает погрешность +10~5 и с вероятностью погрешность —10~5. Предположим, что эти погрешности не зависят друг от друга. Ка¬ кую точность разумно приписать окончательному ответу? То же самое в предположении, что машина производит 10 операций. [Отв.: ±0,01; ±1.] § 12* ПРОБЛЕМА ВЫБОРА РЕШЕНИЯ В предыдущих параграфах мы имели дело с проблемой вы¬ числения вероятности тех или иных высказываний в предполо¬ жении, что вероятностная мера известна. В задачах статистики часто приходится принимать некоторое решение в условиях, когда выбор такого решения был бы довольно прост, если бы мы умели определить вероятности интересующих нас высказы- ваний, чего, однако, на самом деле нет. Например, если пред¬
232 Гл. IV. Теория вероятностей ложена вакцина против какой-либо болезни, то предстоит решить, следует ли применять эту вакцину. Мы могли бы при¬ нять то или другое решение, если бы можно было сравнить ве¬ роятность того, что заболеет человек, которому сделана привив¬ ка этой вакцины, с вероятностью того, что заболеет человек, которому прививка не делалась. Статистическая теория разра¬ батывает методы получения на основании экспериментов неко¬ торой информации, которая помогает оценить эти вероятности или выбрать нужное решение. Мы проиллюстрируем типичную процедуру такого рода. Смит утверждает, что он может отличить эль от пива, и по этому поводу предлагает Джонсу пари на доллар. Смит и не претендует на то, что он может отличить эль от пива со сто процентной уверенностью, но полагает, что может отличить один напиток от другого в такой доле случаев, которая заметно превышает -тр. Пусть можно указать число р, выражающее вероятность того, что когда Смиту предлагается стакан пива и стакан эля, он сумеет выбрать стакан с элем. Будем считать, что если р = =^~2' то Смит не обладает никакой способностью различения, если р то он способен к некоторому различению, а если р <у> то он может различать, но имеет ошибочное представле¬ ние об эле. Если бы мы знали р, то мы должны были бы прису¬ дить доллар Джонсу при р < и Смиту при р > у Но пока мы ничего не знаем ори, следовательно, не в состоянии судить о том, кто выиграл пари. Мы следующим образом производим эксперимент, позволяющий нам принять решение. Смиту предлагают два стакана: один с элем, другой с пивом; его просят указать стакан с элем. Эту процедуру повторяют де¬ сять раз, замечая число правильных ответов. Если это число равно по меньшей мере восьми, мы присуждаем Смиту доллар, а если оно меньше восьми, то доллар присуждается Джонсу. Исследуем описанную процедуру. Математическое содержа¬ ние ее можно описать следующим образом. Рассматриваемое нами пространство логических возможностей задается деревом, отвечающим десятикратному осуществлению определенного эксперимента — ответа Смита на вопрос о том, в каком из стака¬ нов находится эль. Введем функции исхода (где /= 1,2,... .. ., 10), которым мы будем придавать значение 1 в случае пра¬ вильного ответа, и значение 0 в случае неправильного ответа. Нас интересует сумма s10=/i -Ь/г+Уз-!- • • • +/ю- Если исход
§ 12 *. Проблема выбора решения 233 х всей процедуры таков, что s10 < 8, то мы присуждаем доллар Джонсу; если s10>8, то доллар получает Смит. Мы полагаем, что вероятностная мера выбрана так, как полагается в случае процесса независимых испытаний. (Это предположение не будет оправдано, если стаканы достаточно велики.) Ясно, что вероят¬ ностная мера зависит от величины вероятности р успеха одно¬ кратного эксперимента. Мы обозначим через Рр \г] вероятность высказывания г оказаться истинньгм в предположении, что ве¬ роятность успеха в одном эксперименте равна р. Так Р0)5 И есть вероятность высказывания г в предположении, что р = = 0,5 = 2“’ т- е- в предположении, что Смит указывает стакан с элем наугад; Р0,8 И есть вероятность г в предположении, что способность Смита различать пиво и эль оценивается значением 0,8 вероятности р. Рассмотрим теперь нашу процедуру как с точки зрения Джонса, так и с точки зрения Смита. Мы можем допустить ошибку двух видов. Мы можем присудить доллар Смиту, когда на самом деле правильное значение р меньше или равно у, или мы можем присудить доллар Джонсу, когда правильное значение р больше, чем у. Не имеется никакого средства, га¬ рантирующего, что мы не совершим одну из этих ошибок. Однако мы надеемся, что наша процедура убедит каждого из участников парй, что если он прав, то, по всей вероятности, он выиграет пари. Джонс полагает, что истинное значение р есть у. Мы вы¬ числим вероятность того, что Джонс выиграет пари, если это Действительно так. Мы исходим из предположения о независи¬ мости исходов отдельных испытаний; в таком случае вероят¬ ность того, что Джонс выиграет пари, есть вероятность ^о,5 [$ю < 8]. Пользуясь таблицей, изображенной на фиг. 103, мы найдем, что Ро, 5 [«ю = 81 + Р0.5 |«н> = 9] + Ро, 5 [«ю - 20] - 0,055, и, следовательно, интересующая нас вероятность приблизитель¬ но равна 1—0,055 = 0,945. Итак, Джонс видит, что если он прав, То он по всей видимости выиграет пари. Смит, с другой стороны, считаем, что р значительно больше i. Р г-сли он полагает, что р есть число порядка 0,9, то вероятность Не менее восьми правильных ответов равна 0,930, как это видно
234 Гл. IV. Теория вероятностей из таблицы фиг. 103. Таким образом, обе стороны должны быть удовлетворены условием парй. Предположим, однако, что, по мнению Смита, р равно при¬ близительно 0,75. Тогда вероятность того, что он даст восемь или более правильных ответов и, следовательно, выиграет пари, равна всего лишь 0,526. В таком случае имеются лишь примерно равные шансы на то, что эксперимент выявит его способность различать пиво и эль, и он, по-видимому, не будет удовлетворен условиями, определяющими победителя. Если Смит думает, что на самом деле его способность различения характеризуется зна¬ чением р, близким к -j-, то нам следует выбрать другой метод присуждения доллара. Мы можем, например, предложить при¬ судить его Смиту, если тот даст семь или более правильных ответов. Если Смит имеет вероятность дать правильный ответ при одном испытании, то вероятность того, что он выиграет пари, приблизительно равна 0,776. Если же р =, вероятность того, что Джонс выиграет пари, при этом новом соглашении приблизительно равна 0,828. Для Джонса, таким образом, шан¬ сы уменьшились, но Смит может убедить его, что эта процедура более справедлива, чем первая. Ч Р 1 х 0,1 0,25 0,50 0,75 0,90 0 0,349 0,056 0,001 0,000 0,000 1 0,387 0,188 0,010 0,000 0,000 2 0,194 0,282 0,044 0,000 0,000 3 0,057 0,250 0,117 0,003 0,000 4 0,011 0,0146 0,205 0,016 0,000 5 0,001 0,058 0,246 0,058 0,001 6 0,000 0,016 0,205 0,146 0,011 7 0,000 0,003 0,117 0,250 0,057 8 0,000 0,000 0,044 0,282 0,194 9 0,000 0,000 0,010 0,188 0,387 10 0,000 0,000 0,001 0,056 0,349 Таблица значений Рр [s10 = х\ Фиг. 103 В разобранном примере можно было допустить ошибки двух родов. Большая или меньшая возможность ошибки зависела от механизма эксперимента и от метода, использованного нами
§ 12 *. Проблема выбора решения 235 для принятия нужного решения. В некоторых случаях мы не очень заботимся об ошибках и можем произвести относительно простой эксперимент. В других случаях ошибки очень суще¬ ственны, и эксперимент должен быть осуществлен с учетом этого факта. Например, возможностью ошибки несомненно нельзя пренебречь в случае, когда против какой-нибудь болезни предложена вакцина, и статистика просят помочь решить, сле¬ дует или не следует ее применять. В этом случае можно предпо¬ ложить, что имеется некоторая вероятность р того, что человек заболеет, если ему не сделают прививку вакцины, и вероятность г того, что он заболеет, если ему сделают прививку. Если мы имеем некоторое представление о приблизительном значении р, то нам предстоит построить эксперимент, имеющий целью ре¬ шить, будет ли г больше, чем р, равно р или меньше р. Первый случай должен означать, что вакцина на самом деле благопри¬ ятствует данной болезни; второй, что она не производит никакого эффекта; третий, что она предотвращает болезнь. Таким обра¬ зом, мы можем допустить ошибки трех видов. Мы можем поре¬ комендовать прививку вакцины, когда на самом деле она вред¬ на, можем порекомендовать прививку, когда она не производит никакого эффекта, или, наконец, можем забраковать ее, когда на самом деле она эффективна. Первая и третья ошибки могут привести к потере жизней, вторая — к потере времени и денег тех, кто производит эксперимент. Здесь, конечно, очень важно сделать малой вероятность ошибок первого и третьего типа. Чтобы показать, каким образом можно уменьшить вероятность обеих ошибок, вернемся к случаю Смита и Джонса. Предположим, что требование по меньшей мере восьми пра¬ вильных ответов мы заменяем требованием, чтобы Смит дал по меньшей мере 60 правильных ответов при 100 испытаниях. (Теперь стаканы должны быть очень маленькими.) Рассмотрим сначала случай р = 0,5. В этом случае среднее значение числа правильных ответов равно 50; стандартное отклонение (диспер¬ сия) будет иметь величину ]/*100 • 0,5 • 0,5 = 5. Для того чтобы Смит дал 60 или более правильных ответов, надо, чтобы истин¬ ное значение s отклонялось от своего среднего значения не ме¬ нее чем на удвоенное стандартное уклонение; поэтому весьма маловероятно, чтобы мы присудили доллар Смиту, когда на са¬ мом деле его должен был получить Джонс. Можно даже вычис¬ лить вероятность этого события; она равна 0,023. Поэтому Джонс может быть спокоен относительно исхода пари. Смит считает, что р = 0,75. В этом случае среднее значение величины 5юо равно 75, а стандартное уклонение измеряется ве¬ личиной У 100 • 0,75 • 0,25 ^ 4,3. Значение 60 меньше среднего
236 Гл. IV. Теория вероятностей значения на 15, т. е. примерно на 3,5 стандартных уклонения. Вероятность, что истинное значение 5юо будет на столько мень¬ ше стандартного уклонения, очень мала: она равна 0,0002. По¬ этому Смит смело может идти на подобное пари. Вероятности того, что пари выиграет Смит, вычисленные при разных значениях р, показаны на графике, изображенном на фиг. 104. Пунктирная кривая приведена для сравнения вероят¬ ностей с соответствующими вероятностями в случае эксперимен¬ та, в котором от Смита требуется восемь правильных ответов из десяти. Заметим, что при 100 испытаниях, если р =-^-, вероят¬ ность того, что Смит выиграет пари, равна почти 1, тогда как р Фиг. 104 в случае десяти испытаний она составляет величину всего лишь порядка-^ - Таким образом, в случае ста испытаний легко убе¬ дить как Смита, так и Джонса, что тот, кто прав, имеет очень большие шансы выиграть пари. Итак, мы видим, что вероятность ошибки каждого рода мо¬ жет быть сделана маленькой за счет увеличения числа экспе¬ риментов. Упражнения 1. Допустим, что в эксперименте с пивом и элем Джонс согласен уплатить Смиту, если Смит даст по меньшей мере девять правильных ответов из десяти. (a) Какова вероятность того, что Джонс уплатит Смиту, хотя Смит и не умеет различать пиво и эль и указывает стакан с элем наугад? [Отв.: 0,11.] (b) Предположим, что Смит способен различать с вероятностью 0,9. Ка¬ кова вероятность того, что он не выиграет пари с Джонсом? [Отв.: 0,264.] 2. Пусть в эксперименте с пивом и элем Джонс хочет сделать вероятность того, что Смит случайно выигрывает, хотя он указывает стакан с элем
§ 12 *. Проблема выбора решения 237 наугад, меньшей чем 0,1. Сколько правильных ответов из десяти должен он потребовать от Смита? 3. При рассмотрении эксперимента с пивом и элем мы предполагали, что раз¬ личные испытания независимы. Исследуйте несколько вариантов, в кото¬ рых вследствие зависимости отдельных испытаний друг от друга может быть допущена ошибка, и подумайте о том, как эта ошибка может быть устранена. (Например, стаканы, в которые наливается пиво и эль, могут чем-либо отличаться друг от друга.) 4. Рассмотрим следующие две процедуры для проверки способности Смита отличать пиво от эля. (a) При каждом испытании наливается четыре стакана, 1*ри с пивом и один с элем, и Смита просят указать стакан с элем. Эту процедуру повторяют десять раз. Правильных ответов должно быть семь или более. (b) Смиту наливают десять стаканов и сообщают ему, что пять из них с элем и пять — с пивом. Его просят указать пять стаканов, которые, по его мнению, содержат эль. Все пять стаканов он должен указать правильно. Найдите в каждом отдельном случае вероятность того, что Смит до¬ кажет свою способность путем простого угадывания. Имеются ли основа¬ ния предпочесть одну из этих процедур другой? 5. Некая организация, занимающаяся разработкой тестов, предлагает метод, который позволяет предсказывать для группы первокурсников порядок их следования по успеваемости по окончании колледжа. Колледж согла¬ шается испытать этот метод на группе из пяти студентов и обещает принять метод, если по отношению к этим пяти студентам предсказание либо полностью подтвердится, либо может быть сделано правильным, если переставить в предсказанном порядке двух студентов, стоящих ря¬ дом. Если этот метод равносилен простому угадыванию, то какова веро- 6. Стандартный метод лечения некоторой болезни приводит к излечению в всех случаев. Утверждается, что некоторый новый метод вылечи- 3 вает в -^-всех случаев. Этот новый метод хотят испробовать на десяти больных, страдающих данной болезнью. Если будут вылечены семь боль¬ ных или более, новый метод будет принят. Если вылечены будут трое или менее больных, метод не будет рассматриваться дальше. Если число вылеченных окажется равным четырем, пяти или шести, результат испы¬ таний будет признан неокончательным и будут производиться дальней¬ шие исследования. Найдите вероятность каждой из этих альтернатив в предположении, что (а) новый метод имеет ту же эффективность, что и старый; (Ь) предложенный метод лечения — правильный. 7. Трое студентов обсуждают способности студентов-математиков в области шахматной игры. Один студент утверждает, что большинство математи¬ ков (скажем, 90% их общего числа) хорошо играют в шахматы. Второй утверждает, что лишь очень немногие математики (скажем, 10%) хорошо играют в шахматы, а третий студент утверждает, что математик с одина¬ ковой вероятностью может оказаться хорошим шахматистом или не ока¬ заться им. Они решили произвести анализ способностей десяти матема¬ тиков к шахматной игре, классифицируя их на хороших шахматистов и лиц, не являющихся таковыми. Студенты условились, что пари выигры- [Отв.: (а) 0,003; (Ь) 0,004.] ятность того, что он будет принят?
238 Гл. IV. Теория вероятностей вает первый из них, если хорошими шахматистами окажутся восемь или более математиков, второй — если два или менее, и третий — во всех остальных случаях. Для каждого студента найдите вероятность того, что он выиграет пари, если он прав. [Отв.: 0,930; 0,930; 0,890/ 8. Десять студентов отвечают на. десять вопросов. Каждый студент имеет 1 вероятность ответить правильно на каждый вопрос, если ему не под сказывают другие. Преподаватель определяет для каждого вопроса число студентов, которые дали на него правильный ответ. Если он находит, что на четыре или более вопроса было дано менее трех или более семи пра¬ вильных ответов, он рассматривает это как убедительное доказательство того, что студенты общались друг с другом. Дайте обоснование для этой процедуры. [Указание: Следует использовать приведенную на фиг. 103 таблицу дважды: один раз для нахождения вероятности менее трех или более семи правильных ответов на данный вопрос, и второй раз для на¬ хождения вероятности того, что это произойдет в случае четырех или более вопросов.] § 13. ПРОЦЕСС НЕЗАВИСИМЫХ ИСПЫТАНИЙ БОЛЕЕ ЧЕМ С ДВУМЯ ИСХОДАМИ Рассмотрим теперь процесс независимых испытаний, в кото¬ ром каждый эксперимент имеет более чем два возможных ис¬ хода. Эти исходы мы обозначим через ах, а2, ak, а их ве¬ роятности через ри р2> ---./V Пусть функция f(ru г2, rk\ Р\>Рч' • • • > Pk) означает вероятность того, что при п = rx -j- г2 + . . . ... -\-rk таких испытаний исход ах будет иметь место п раз, исход а2 будет иметь место г2 раз, и т. д.; соответствующую величину f(ru г2; ри р2) для случая двух исходов мы записы¬ вали в § 9 как w(n,rx\ рх), поскольку здесь г2 = п — гх и р2 = = 1—Р\ определяются по п, гх и рь Мы покажем общий способ нахождения величины flrx, г2, . . rk\ рх, р2> . . ., р^)\ однако для простоты мы ограничимся разбором случая k = 3, п = 5 и найдем /(1, 2, 2; рх, р2, Рг)- На фиг. 105 представлена та часть дерева этого процесса, которая нужна, чтобы указать вероятности отдельных ветвей, из которых складывается путь, отмеченный жирной линией и соот¬ ветствующий исходам а2, а3, аь а2, аъ именно в этом порядке. Согласно введенной на нашем дереве вероятностной мере, этому пути приписан вес р2 • Рг * Р\ * Рч * Рг =Р\ * р\' Р% Существуют, конечно, и другие пути на дереве, соответствую¬ щие осуществлению одного исхода аь двух исходов а2 и двух исходов а3. Однако в соответствии с отвечающей дереву мерой им всем должен быть приписан один и тот же вес рхр\р\- Сле¬ довательно, чтобы найти f( 1, 2, 2; рг, р2, /?3), мы должны умно¬ жить этот вес на число путей, которым отвечает заданное нами число осуществлений каждого исхода.
§ 13. Процесс независимых испытаний более чем с двумя исходами 239 Мы замечаем, что наш путь а2у а3, аь а2, аъ задается разбие¬ нием на три ячейки [{3}, {1, 4}, {2, 5]] системы целых чисел от 1 до 5. Здесь первая ячейка содержит номера экспериментов с исходом аь вторая ячейка содержит номера экспериментов с исходом а2 и третья — номера экспериментов с исходом а3. Обратно, любое разбиение множества чисел {1, 2, . . .,• 5} на три ячейки с одним элементом в первой ячейке, двумя элементами Фиг. 105 во второй и двумя в третьей соответствует единственному пути интересующего нас вида. Следовательно, число этих путей рав¬ но числу таких разбиений, т. е. равно ( 5 )—*- \1, 2, 2/ 1! 2! 3! (см. § 5 гл. III). Итак, вероятность осуществления одного исхода аи двух исходов а2 и двух исходов аъ равна ( 1, 2, 2) ’ ' ^2 * Р\- Предыдущее рассуждение, проведенное для случая независи¬ мых испытаний с исходами а19 а2, аЛ, имеющими соответ¬ ственно вероятности рь Рг, • • • , Ри, позволяет установить сле¬ дующий результат: Вероятность rh появлений аь г2 появлений а2 и т. д. нахо¬ дится по формуле f{rv г2, г к\ ри р2, pk) = Г2 " _ rJ р^рЧ . . . рч • Этому утверждению можно придать еще и следующую фор¬ му. Рассмотрим процесс независимых испытаний с возможными
240 Гл. IV. Теория вероятностей исходами а, 6, .. h\ вероятности этих исходов мы по-прежнему обозначим через рх, р2> •••> pk (гДе А + /72+ ••• +А = 1). Обозначим через ga функцию, определенную на множестве пу¬ тей соответствующего дерева и равную числу повторений исхода а, через gb функцию, равную числу повторений исхода b и т. д. Тогда р l(e,e = /’i) Л (Яь = г2) Л • • • Л {gn = rn)\ = = L Г П г )p'l'PrJ' ••• 'Рг* \м> ' 2> • • •» • п/ а о п (где rv г29 - гп— неотрицательные целые числа, такие, что Г\ *4“ Г 2 ••• А~ГП = П)' На фиг. 106 изображен случай k = 3, п = 3, на котором чи¬ татель легко проверит соответствующую формулу (так, на¬ пример, Р \(ga = 1) Л (gb = 2) Л ge = °)1 = = w (*5) н- w (*„) + w (*13) = зрар\, = (,2,o) = W = 3). Пример 1. Игральная кость бросается 12 раз. Какова вероятность того, что каждое возможное число очков вы¬ падет два раза? Здесь имеется шесть исходов 1, 2, 3, 4, 5,6, соответствующих шести граням кости. Каждому исходу мы приписываем вероятность-^-. Нам нужно определить f{2' 2> 2> 2’ 2> 2; б"’ ~6’ “6 * ~6’ ТГ' ~б) = = Pl(eTi = 2) Л (g2 = 2) Д (g3 = 2) Д (g*4 = 2) Д (g^ = 2) Д (g*6 = 2)]. Раскрывая это выражение, мы найдем: (2,гД,ДЩ1)’(Д(Д(Д(Д = 0.0034.... Пример 2. Пусть некоторая команда выигрывает ка¬ ждую игру с вероятностью 0,6, проигрывает ее с вероятно¬ стью 0,3 и делает ничью с вероятностью 0,1. Каковы веро¬ ятности различных комбинаций числа побед, ничьих и поражений в последовательности из трех игр? Эту последовательность можно рассматривать как про¬ цесс независимых испытаний, состоящий из трех экспери¬ ментов с возможными исходами В, П и Н, вероятности ко¬ торых соответственно равны 0,6; 0,3 и 0,1. Тогда для лю¬ бых г, 5 и t имеем р \igB = г) л {gn — s) Д {gn = t)\ = (r> I t) • (0,6У (0,3)* (0,1/.
X X/ х2 Х7> *5 X* Х7 Ха *43 /4 я, 75 Х|- Х,| х,£ ^20 Х2, ^22 ^23 ^24 ^25 Х26 иП WIX) Ра РаРь РаРс РаРь РаРь Ра Рь Рс Ра Рс Ра Pb Рс РаРс РаРь РаРь РаРьРа Ра Рь Р3ь Р2ьРе Ра Рь Рс Р2ьРс РьРс РаРс РаРьРс РаРс РаРьРс РгъРс РьРс РаРс РьРс Рс
Гл. IV. Теория вероятное гей В таблице приведены вероятности всевозможных ком¬ бинаций выигрышей, поражений и ничьих. Из этой таблицы легко определить вероятности и других интересных собы¬ тий. Например, вероятность того, что команда выиграет ровно две игры, равна 0,324 + 0,108 = 0,432. Пример 3. Рассмотрим процесс независимых испытаний с четырьмя исходами аи а2, аз, я4, имеющими соответствен¬ но вероятности ри р2, р3, р4. Может оказаться, что нас интересуют только вероятность ггкратного осуществления исхода а\ и ггкратного осуществления исхода а2, безотно¬ сительно к числу осуществлений каждого из остальных возможных исходов. Чтобы найти эту вероятность, мы про¬ сто рассмотрим новый эксперимент с исходами аи а2, «з, где а3 соответствует появлению в нашем первоначальном эксперименте одного из исходов а3 или а4. Соответствую¬ щие вероятности равны Пусть г3 = п—{г\ + г2). Тогда наша задача сводится к нахождению вероятности того, что в новом эксперименте исход а\осуществится Г\ раз, исход а2 осуществится г2 рая и исход а3 осуществится г3 раз. Эта вероятность равна Г S Р[ г выигрышей, Л [s проигрышей^ Л (/ ничьих)] 3 0 0 0 3 0 0 0 3 2 1 0 2 0 1 1 2 0 0,216 0,027 0,001 0,324 0,108 0,162 0,108 0,018 0,027 0,009 1 0 2 0 2 1 0 1 2 Ри Р2 и р3> гДе />3 = />3 + /V Г О Г2, Г3 + Г4 п ) Р[' ' PT<i (Pz+PaV Vr' Аналогично можно рассуждать и в случае эксперимента с любым числом исходов, где нас интересует число появле*
§ 13. Процесс независимых испытаний более чем с двумя исходами 243 ний не всех, а лишь отдельных исходов. Например, если бросается 10 раз игральная кость, то вероятность в точно¬ сти двух выпадений одного очка и в точности трех выпаде¬ ний трех очков равна 1. Предположим, что в некотором институте 30% студентов получают только высшие оценки, 60%—просто успевают (не получают ■ высших оценок по всем предметам) и 10%—не успевают. Какова вероятность того, что среди трех выбранных наугад студентов окажется один студент, имеющий только высшие оценки, один просто успевающий студент и один неуспе¬ вающий студент? [Отв.: 0,108.] 2. Три лошади А, В и С участвуют в четырех забегах. Допустим, что в ка¬ ждом забеге все лошади имеют одинаковые шансы. Какова вероятность того, что А выиграет два забега, а В и С выиграют каждая по одному забегу? Какова вероятность того, что одна и та же лошадь выиграет все четыре забега? г 4 j -| J Отв.: 27 -J 3. Допустим, что в одном большом колледже 40% всех студентов составляют первокурсники, 30% второкурсники, 20% третьекурсники и 10% старше¬ курсники. Из этих студентов выбирается наугад комиссия из восьми че¬ ловек. Какова вероятность того, что в комиссию войдет одинаковое число представителей каждого курса? 4. Предположим, что для отдельной торпеды вероятность потопить корабль равна "2“, вероятность повредить его равна и вероятность пройти мимо корабля равна . Предположим еще, что после двух повреждений ко¬ рабль идет ко дну. Какова вероятность того, что четыре торпеды потопят 5. В одном доме живут Джонс, Смит и Грин. Почтальон заметил, что Джонс и Смит получают в среднем одинаковое число писем, а Грин получает писем в два раза больше, чем Джонс, и, следовательно, также в 2 раза больше, чем Смит. Если почтальон несет в дом четыре письма, то какова вероятность того, что каждое из названных лиц получит по меньшей мере одно письмо? 6. Бросаются три кости. Найти вероятность того, что выпадут одна шестерка и две пятерки, при условии, что число очков, выпавших на каждой кости, больше трех. Г 1 '] 7. Некто играет в турнире три партии. В каждой партии он имеет вероят¬ ность выиграть -g-, вероятность проиграть и вероятность сделать ничью независимо от исходов других игр. Чтобы победить в турнире, он должен иметь больше выигранных игр, чем проигранных. Какова ве¬ роятность того, что он победит в турнире? Упражнения корабль? 16*
244 Гл. /V. Теория вероятностей 8. Пусть вероятность того, что выбранный наудачу студент получит по опре¬ деленному предмету оценку А, равна 0,1, оценку В — 0,2, оценку С — 0,4, оценку D — 0,2 и оценку Е—0,1. Какое распределение отметок наиболее вероятно в случае четырех студентов? [Отв.: Одна оценка В, две оценки С, одна оценка D.] § 14. СРЕДНЕЕ ЗНАЧЕНИЕ В этом разделе мы рассмотрим понятие среднего значения (математического ожидания). Это понятие, возникшее в связи с изучением азартных игр, оказывается существенным почти во всяком теоретико-вероятностном рассуждении. Определение. Если в каком-нибудь эксперименте воз¬ можными исходами являются числа а\, а2, ак и вероятно¬ сти этих исходов соответственно равны рх, р2> pk, то сред¬ нее значение определяется формулой М = ахрх + а2р2 + ... + akPk- Не следует представлять себе среднее значение как такую величину, которая обязательно является исходом одного из экспериментов. Например, если кто-нибудь держит пари на 1 доллар, что при бросании монеты выпадет герб, то он может либо выиграть 1 доллар, либо проиграть 1 доллар. Среднее значе¬ ние (математическое ожидание) в этом случае равно(1) • (у) + 4~(— 1) • (у) = 0, что не является одним из возможных исходов. Термин «среднее значение» обязан своим происхождением сле¬ дующему факту. Если мы повторяем наш эксперимент большое число раз и если мы ожидаем появления а{ в доле р\ всех слу¬ чаев, а2 в доле р2 всех случаев и т. д., то средняя величина, по¬ явления которой мы ожидаем при одном эксперименте, равна М = ci\P\ 4“ а2Р2 + ••• ~h akPk- Например, в азартной игре М интерпретируется как средний выигрыш, которого можно ожи¬ дать при большом числе игр. Здесь среднее значение выигрыша часто принимается за оценку выгодности игры. Игра с положи¬ тельным средним значением выигрыша называется выгодной: игра с нулевым средним значением выигрыша называется без- обидной; наконец, если среднее значение выигрыша является отрицательным, то игра квалифицируется как невыгодная. Эти названия не следует понимать слишком буквально, так как мно¬ гие с большим удовольствием играют в игры, которые с точки зрения теории вероятностей являются невыгодными. Пример 1. В качестве первого примера использования понятия среднего значения рассмотрим игру в рулетку 13
§ 14. Среднее значение 245 том виде, как она ведется в Монте-Карло. Имеется не¬ сколько видов пари, которые может держать игрок; мы рас¬ смотрим два из них. На колесе отмечены число 0 и числа от 1 до 36, расположенные против прорезей, находящихся на одинаковом расстоянии друг от друга. Колесо приво¬ дится во вращение, и бросается шарик, попадающий в одну из прорезей. Если игрок поставил, скажем, 1 доллар на определенное число и шарик попал в соответствующую прорезь, то крупье выплачивает игроку выигрыш в размере 36-кратной ставки, т. е. 36 долларов. Таким образом, при ставке в 1 доллар среднее значение выигрыша равно 36 = 0,973. Это означает, что при длительной игре игрок должен ожидать потери около 2,7% поставленной им суммы. Второй способ игры состоит в следующем. Игрок может ставить на «красное» или «черное». Числа от 1 до 36 де¬ лятся поровну на «красное» и «черное» (выписанные крас¬ ной или черной краской). Если игрок ставит на «красное» и результатом является красное число, он получает сумму в размере двойной ставки. Если выпадает черное число,он теряет свою ставку. Если появляется 0, то колесо запу¬ скается снова до тех пор, пока оно не остановится на каком-нибудь числе, отличном от 0. Если это число черное, игрок проигрывает, но если оно красное, то он получает уже не двойную, а только свою первоначальную ставку. При таком способе игры при ставке 1 долл. среднее значение выигрыша равно 2 (w) 1 (я) = Й = 0,9865. В этом случае при продолжительной игре игрок должен ожидать проигрыша около 1,35% поставленной им суммы. Таким образом, здесь ожидаемый проигрыш составляет только половину ожидаемого проигрыша в предыдущем случае. Пример 2. Игрок бросает игральную кость и получает число долларов, равное числу выпавших очков. Какую сумму игрок должен внести, чтобы сделать эту игру без¬ обидной? Чтобы ответить на этот вопрос, заметим, что игрок может выиграть 1, 2, 3, 4, 5 или 6 долларов,, причем вероятность каждого из этих выигрышей равна 7б. Следо¬ вательно, среднее значение выигрыша здесь равно 1 (7 + 2 Ш +3 Ш +4 (i) +5 (т)+6 Ш = 3 i-
246 Гл. IV. Теория вероятностей Таким образом, при внесении игроком 3,5 долл. его ожи¬ даемый выигрыш будет равен нулю. Пример 3. Каково математическое ожидание числа успехов в случае четырех независимых испытаний с веро¬ ятностью успеха 7з? Мы знаем, что вероятность х успехов равна Пример 4. В игре в «крэпс» один из игроков бросает две кости. Если сумма выпавших очков равна 7 или 11, то он выигрывает. Если она равна 2,3 или 12, то он проигры¬ вает. Если сумма очков равна какому-то другому числу, то этот игрок должен продолжать бросать кости до тех пор, пока не выпадет либо первоначальная сумма очков, либо сумма очков, равная 7. В первом случае он выигрывает, во втором случае проигрывает. Предположим, что он выигры¬ вает или проигрывает 1 доллар. Тогда возможными исхода¬ ми будут + 1 и — 1. Вычислим среднее значение выигрыша в этой игре. Сначала мы должны найти вероятность вы¬ игрыша. Представим возможности на дереве, имеющем два уровня (фиг. 107). Хотя теоретически не исключена воз¬ можность того, что эта игра будет продолжаться бесконеч¬ но, мы такую возможность рассматривать не будем. Это значит, что наш анализ применим только к тем играм, ко¬ торые действительно оканчиваются на некотором шаге. Для нахождения ветвей на первом уровне мы предста¬ вляем себе 36 возможностей для бросания двух костей как одинаково вероятные и в качестве вероятности каждой ветви принимаем долю соответствующих этой ветви воз¬ можностей. Вероятности ветвей на втором уровне находят¬ ся следующим образом. Если, например, пед вым исходом была сумма очков 4, то при окончании игры сумма выпав¬ ших очков должна равняться 4 или 7. Соответствующими возможными исходами бросания двух костей будут {(3,1Ь (1,3), (2,2), (4,3), (3,4), (2,5), (5,2), (1,6), (6,1)}. Мы снова рассматриваем эти возможности как равновероятные и приписываем каждой ветви вероятность, равную доле тех . Следовательно, 108 81 3 '
§ 14. Среднее значение 247 исходов, которые соответствуют этой ветви. Например, ветви, идущей к 4 В, мы приписываем вероятность — Вероятности других ветвей находятся аналогичным обра¬ зом. После того как мера дерева введена, для того чтобы найти вероятность выигрыша, мы должны просто сложить веса всех путей, ведущих к выигрышу. Проделав это; мы получим ^95"- Таким образом, среднее значение выигры¬ ша игрока, бросающего кости, равно Следовательно, можно ожидать, что при длительной игре этот игрок потеряет 1,41% своих ставок. Интересно заме¬ тить, что игра в «крэпс» невыгодна для него приблизитель¬ но в такой же мере, как игра на рулетке при условии, что он все время ставит лишь на «красное» или на «черное». Пример 5. Рассмотрим эксперимент, имеющий беско¬ нечное число возможных исходов, которыми могут служить все (неотрицательные) целые числа 0, 1,2,...; при этом ве¬ роятность осуществления исхода, характеризующегося чис- mje-m лом /, мы положим равной pf = ——— , где пг — некоторый
248 Гл. IV. Теория вероятностей параметр (распределение вероятностей Пуассона; см. §10). По аналогии с экспериментом с конечным числом исходов определим среднее значение так: м = 0 • р0 -j- 1 • р\ + 2 • р2 + • • • = 2 j * Рр где справа стоит сумма бесконечно большого числа слагае¬ мых (бесконечный ряд). В таком случае имеем м Ч^ • mje~m V rnJ~l М = 2^ J j\— = me~ * 2j (у — l)! = me~ -em = m j > о j > о — параметр m распределения Пуассона совпадает со сред¬ ним значением исхода соответствующего эксперимента. Определение среднего значения можно сформулировать не¬ сколько по-иному. Пусть / — некоторая числовая функция, определенная на пространстве логических возможностей U с вероятностной мерой W (х). В таком случае среднее значение этой функции определяется так: M[/| = 2/w-ww, х где суммирование происходит по всему множеству логических возможностей. Эту же формулу можно переписать еще так: м 1/] = 2у ■ р [f=j\, j где суммирование происходит по множеству значений функции/. Пример 6. Пусть / есть число дождливых дней среди трех дней, следующих за ясным днем на Земле Оз. Вероят¬ ности высказываний / = / могут быть определены из фиг. 96 на стр. 214, они собраны в следующей таблице: j р [/=Л 0 8/32 1 П/32 2 9/32 3 V 32 Исходя из этих вероятностей, находим среднее значение числа дождливых дней: м1/] = 0,^ + 1 •52+2‘^+3,^==1^-
§ 14 Среднее значение 249 Пример 7. Рассмотрим процесс независимых испыта¬ ний, состоящий из п экспериментов, каждый из которых имеет исход а с вероятностью р и исход b с вероятностью q = 1 — р. Пусть fj — функция, значение которой равно 1, если в /-м эксперименте осуществился исход а, и равно О, если осуществился исход Ь. В таком случае, оче¬ видно, р\fj=1\=P и P\f) = 0] = q и, следовательно, М [/у! = 1 -p + 0-q = p. Обозначим теперь через sn функцию /1+/2+ • • • указывающую число осуществлений исхода а в п экспери¬ ментах. В таком случае имеем W [5J = М t/i +/2 + * • -+/J = М [/i| + М [/2] + - • . + М \fn\=pn (здесь мы пользуемся тем, что для любых функций f и g имеет место равенство М [/+§*1 = М [/] + М [g*], ибо при любой Mepetc;(x) на пространстве логических возможно¬ стей имеем M[/+ff] = 2(/(*) + srtx))w(*) = Jf = S/W W w + 2 g(x) w(x) = M [/] + M [g-], X X где, разумеется, предположено, что обе функции f и g оп¬ ределены на одном и том же множестве U). Последний результат можно распространить на любой про¬ цесс независимых испытаний с произвольным числом исходов. Пусть а есть один из этих исходов и р — его вероятность; под Ь мы будем понимать событие, заключающееся в том, что исход а не имел места; вероятность b равна q = 1 — р. В таком слу¬ чае можно применить результат, полученный в примере 6, в силу которого среднее число осуществлений исхода а равно рп. Упражнения I* Допустим, что А бросает две монеты и получает 2 доллара, если выпадут два герба, 1 доллар, если выпадет один герб, и не получает ничего, если не выпадет ни одного герба. Чему равно для него среднее значение вы¬ игрыша в этой игре? [Отв.: 1 доллар.] 2* Смит и Джонс играют в сравнивание монет. Если две подброшенные мо¬ неты упадут одной стороной, Смит получает 1 доллар, а если разными, то Джонс получает 1 доллар,
250 Г л: IV. Теория вероятностей (a) Чему равно среднее значение выигрыша для Смита, если сравнивание монет происходит дважды? (b) Допустим, что если первый раз выигрывает Смит, то он прекращает игру, а если он первый раз проигрывает, то играет вторично. Джонсу не позволяется выходить из игры. Чему равно среднее значение вы¬ игрыша для Смита в этом случае? 3. Чему равно среднее значение числа выпадений герба при бросании пяти 4. Монета бросается до первого выпадения герба, либо до тех пор, пока три раза подряд не выпадет цифра. Найдите среднее значение числа броса¬ ний монеты. 5. Некто хочет купить газету, которая стоит 5 центов. В его кармане имеется одна десятицентовая монета, и пять монет в 1 цент. Газетчик предложил этому покупателю газету в обмен на одну монету, вынутую наугад из его кармана. (a) Безобидное ли это предложение, и если нет, то кому оно выгодно? [Отв.: Выгодно покупателю.] (b) Ответьте на те же.вопросы, что и в (а), в предположении, что газет¬ чик предложил вынуть наугад из ка.рмана покупателя две монеты. [Отв.: Безобидное предложение] 6. А держит с В пари на 50 центов против х центов, что две карты, сданные из перетасованной колоды обычных игральных карт, будут одинакового цвета. Каким должно быть х, чтобы это пари было безобидным? 7. Докажите, что если в данном эксперименте среднее значение успеха равно М, то после добавления к каждому исходу одного и того же числа k среднее значен-ие успеха в этом новом эксперименте сделается равным М + k. 8. Докажите, что если в данном эксперименте среднее значение успеха равно М, то после умножения каждого из возможных исходов на. одно и то же число k среднее значение успеха в таком новом эксперименте сделается равным k • М. 9. В примере 3 из § 7 найдите среднее значение числа улиц, испробованных 10. В урне лежат два черных и три белых шара. Из этой урны вынимаются друг за другом и без возвращения шары до тех пор, пока не будет вынут ■ -jpHbm шар. Найдите среднее значение числа требующихся выниманий. 11. Используя результат упр. 15 и 16 из § 7, найдите среднее значение числа игр.в первенстве США по бейсболу (а) в предположении, что обе коман¬ ды имеют в каждой игре равные шансы на выигрыш; (Ь) в предположе¬ нии, что в каждой игре вероятность выигрыша более сильной команды 2 равна -д-. [Отв.: 5,81; 5,50 ] 12. Допустим, что мы модифицировали игру в «крэпс» таким образом: при сумме очков 7 или 11 игрок, бросающий кости, выигрывает 2 долл., при сумме 2, 3 или 12 он проигрывает 3 долл., а во всем остальном игра остается прежней. Найдите среднее зна.чение выигрыша в новой игре и сравните полученный результат с прежним значением. 13. Предположим, что при игре в рулетку в Монте-Карло мы ставим 50 пе11' тов на «красное» и 50 центов на «черное». Чему равно среднее значение выигрыша в этой игре? Лучше это или хуже, чем ставить 1 долл. на «красное»? монет? прежде чем будет найден дом.
§ 15. Марковские цепи 251 |4. Ставку на. «красное» в рулетке грубо можно описать следующим обра¬ зом. Мы выигрываем с вероятностью 0,49, получаем наши деньги назад с вероятностью 0,01 и проигрываем с вероятностью 0,5. Постройте дерево для трех таких игр и вычислите с точностью до трех десятичных знаков вес каждого пути. Какова вероятность того, что мы окажемся в выигрыше в итоге этих трех игр? [Отв.: 0,485.] 15. Пусть условием пари, что некоторое высказывание окажется истинным, является г : 5. Если А получает 5 долларов, когда это высказывание ока¬ жется истинным, и платит г долларов в противном случае, то чему для него равно среднее значение выигрыша? 16. В упр. 9 из § 3 найдите среднее значение числа языков, которые изучает выбранный наугад студент. 17. В упр. 5 из § 4 найдите среднее значение числа посетителей, которые по¬ лучат свои собственные шляпы. [Отв.: 1] § 15. МАРКОВСКИЕ ЦЕПИ В этом разделе мы вернемся к так называемым марковским цепям, кратко охарактеризованным уже в § 8 настоящей главы (стр. 212). Процессы этого типа можно описать следующим образом. Рассмотрим последовательность экспериментов со следующи¬ ми свойствами. Исходом каждого эксперимента служит один исход из конечного числа возможных исходов al9 а2, ап причем в каждом эксперименте вероятность исхода aj либо во¬ все не зависит от исходов предшествующих экспериментов, либо зависит лишь от исхода единственного эксперимента, не¬ посредственно предшествующего данному. Эта зависимость за¬ дается числами Pij, представляющими вероятность исхода а, заданного эксперимента при условии, что предшествующий эксперимент имел исход at. Исходы ах, а2, • а г называются состояниями, а числа Pij— вероятностями перехода. Вероятности перехода можно представлять двумя различ¬ ными способами. Первый способ состоит в том, что вероятности перехода записываются в виде квадратной таблицы (см. выше, стр. 213). Для марковской цепи с состояниями а\, а2 и аъ такая таблица имеет вид: / Рх X Рх2 Рх 3 J° = ( Рп Р2 2 Р2Л \Рл X Ръ2 Рзз Эта таблица является частным случаем матрицы. Матрицы игра¬ ет важную роль при изучении марковских цепей, так же как и многих других вопросах математики. Ими мы будем зани¬ жаться в следующей главе, содержащей также некоторое даль- Нейшее развитие учения о марковских цепях,
252 Гл. IV. Теория вероятностей Второй способ представления вероятностей перехода состоит в построении диаграммы перехода. На фиг. 108 изображена та¬ кая диаграмма для одного частного случая. Стрелки, идущие от каждого состояния, указывают состояния, в которые это состоя¬ ние может переходить в рассматриваемом процессе. Матрица вероятностей перехода, соответствующая этой диа¬ грамме, имеет вид а\ 0 Р = а 2 #2 1 \_ 2 о 4т 4т 4- о Нули означают невозможность соответствующих переходов. Заметим, что в матрице Р сумма элементов каждой строки равна 1. Это должно быть справедливым для любой матрицы вероятностей перехода. В самом деле, элементы i-й строки представляют веро¬ ятности всех возможностей рассматри¬ ваемого процесса, находящегося в состоя¬ нии а{. Вопрос, который интересует нас в пер¬ вую очередь при изучении марковских це¬ пей, состоит в следующем. Пусть про¬ цесс начинается из состояния i. Какова вероятность того, что через п шагов он перейдет в состояние /? Обозначим эту вероятность через pfj (не следует смеши¬ вать p(?j с п-й степенью числа Более того, нас интересует эта вероятность для всех возможных начальных состояний i и всех возможных конечных состояний /. Эти числа удобно представить также в виде матрицы. Например, для марковской цепи с тремя состояниями эти вероятности можно записать в виде матрицы Фиг. 108 р{п) __ (п) П(п) [р\1 Рё Рё р{п) Р\2 Щ рё рё р(ё рё Пример 1. Для марковской цепи с вероятностями пере¬ ход*, указанными на фиг. 108, найдем вероятности различ-
§ 15. Марковские цепи 253 ных возможных состояний через три шага для случая, когда процесс начинается из состояния а\. Мы находим эти вероятности путем построения дерева и соответствующей вероятностной меры, как это осуществлено на фиг. 109. Фиг. 109 Вероятность , например, есть сумма всех весов, при¬ писанных введенной нами вероятностной мерой тем путям нашего дерева, которые оканчиваются состоянием аг: р'$ = = 1 * 7г ‘ УгЧ- 1 * 7г • 2/з~ ?/i2- Подобным же образом pf^ = = 1 • V-2 • V2 = V4 И = 1 • V2' 7з = '/б- Построив меру дере- ва в предположении, что начальным состоянием является а2, мы можем найти р$, р^ и р\^. Аналогично определяются Рз\> Р32 и Рзз' Проделав это (см. упр. 7), мы можем запи¬ сать результаты в форме матрицы ах ( 1 1 7 6 4 12 7 7 37 36 24 72 4 7 25 27 18 54 j Сумма элементов каждой строки по-прежнему равна еди¬ нице. Это соответствует гому факту, что из какого бы состояния ни начинать, через три шага мы обязательно до¬ стигнем либо первого состояния, либо второго, либо треть¬ его. Отметим еще, что все элементы нашей матрицы поло¬ жительны. Это соответствует возможности перехода через три шага из любого состояния в любое другое состояние. В следующей главе мы дадим простой способ вычисления Г) (^) матрицы Р .
254 Гл. IV. Теория вероятностей Пример 2. Допустим, что нас интересует вопрос, какая из двух партий — республиканцев или демократов — собе¬ рет больше голосов в данном штате на выборах. Мы хо¬ тим сделать предсказания, рассчитанные на длительный срок, и потому не рассматриваем специфических условий избирательной кампании в том или ином году. Наши пред¬ сказания будут основаны только на истории предшествую¬ щих выборов, каждый раз дающих перевес либо республи¬ канцам, либо демократам. Ясно, что знание результатов предшествующих выборов должно влиять на наши пред¬ сказания, относящиеся к будущему времени. В качестве первого приближения мы принимаем, что при оценке ве¬ роятности того или иного исхода выборов играет роль лишь знание результата выборов, непосредственно предше¬ ствующих рассматриваемым. В этих условиях мы прихо¬ дим к марковской цепи с двумя состояниями Р и Д и матри¬ цей вероятностей перехода: р д Р / 1 —а а \ Д\ Ъ 1 — b)' Числа а и Ь могут быть оценены по известным нам ре¬ зультатам предшествующих выборов следующим образом. За а можно принять долю тех прошлых лет, исход которых был в пользу республиканцев, в то время как в следующем году он оказывался уже в пользу демократов, а в качестве b — долю противоположных перемен. Можно получить несколько лучшее приближение, если учитывать результат не одной, а двух предшествующих избирательных кампаний. В этом случае состояниями бу¬ дут пары РР, РД, ДР и ДД, указывающие исходы двух последовательных предшествующих кампаний. Например, состояние РР означает, что последние две кампании окон¬ чились победой республиканцев. Если следующие после победы республиканцев выборы ознаменуются победой де¬ мократов, то мы будем иметь состояние РД. Если исходами выборов каких-либо последовательных семи лет служат ДДДРДРР, то в нашем процессе осуществляется переход от состояния ДД к ДД, от ДД к ДР, от ДР к РД от РД к ДР, и, наконец, от ДР к РР. Отметим, что первая буква со¬ стояния, к которому мы переходим, совпадает со второй буквой состояния, от которого мы исходим, так как эти буквы относятся к одному и тому же году выборов. Мат¬
§ 15. Марковские цепи 255 рица вероятностей перехода будет теперь иметь вид: рр ДР РД ДД рр 1 - а 0 а 0 ДР Ь 0 1 -ь 0 РД 0 1 —с 0 с дд 0 d 0 1 —d Здесь снова нужно оценить числа а, Ь, с и d. Изучение этого примера будет продолжено в § 9 гл. V. Пример 3. Следующий пример марковской цепи исполь¬ зовался в физике в качестве простой модели диффузии га¬ зов. Позднее мы увидим, что аналогичная модель приме¬ нима к идеализированной задаче об изменяющихся попу¬ ляциях. Представим себе п черных шаров и п белых шаров, ко¬ торые распределены по двум урнам таким образом, что в каждой урне имеется п шаров. Отдельный эксперимент со¬ стоит в том, что из каждой урны вынимается наугад по одному шару, после чего шар, вынутый из первой урны, пе¬ рекладывается во вторую урну, а шар, вынутый из второй урны, — в первую. В качестве состояния мы будем рассма¬ тривать число черных шаров в первой урне. Всякий раз, когда это число известно, известен и точный состав каждой урны. А именно, если в урне 1 имеется / черных шаров, то в урне 2 должно быть п — у черных шаров; п — у белых шаров должно быть в урне 1 и у белых шаров в урне 2. Пусть процесс находится в состоянии у. После обмена ша¬ ров он перейдет либо в состояние у—1 (если из урны 1 был вынут черный шар, а из урны 2 — белый), либо в преж¬ нее состояние у (если вынутые шары были одного цвета), либо в состояние у + 1 (если из урны 1 был вынут белый шар, а из урны 2 — черный). Вероятности перехода будут равны (см. упр. 12): pjh = 0 при Иф j— 1, у, /+ 1. Физик может интересоваться, например, предсказанием состава урн после того, как было произведено некоторое
256 Гл. IV. Теория вероятностей число обменов. Очевидно, любое предсказание, относя¬ щееся к ранней стадии этого процесса, должно зависеть от первоначального состава урн. Так, если с самого начала все черные шары находились в урне 1, то мы должны ожи¬ дать, что в течение некоторого времени в урне 1 черных шаров будет оставаться больше, чем в урне 2. С другой сто¬ роны, можно ожидать, что после большого числа обменов влияние первоначального распределения шаров будет по¬ степенно исчезать. В § 8 гл. V мы увидим, что так и будет на самом деле. 1. Нарисуйте диаграммы состояний для марковских цепей, вероятности пере¬ хода которых заданы следующими матрицами: Упражнения 3 3 3 О 1 о 3 3 3 3 3 2 0 10 0 10 0 0 о о 2 2' о о 2 2 2. Напишите матрицы вероятностей перехода, соответствующие диаграммам состояний, изображенным на. фиг. 110.
§ 15. Марковские цепи 257 3. Найдите матрицу Р^ для марковской цепи, определенной посредством • матрицы вероятностей перехода Р== Отв.: 4. Какую матрицу вероятностей перехода имеет марковская цепь примера 3 для случая двух белых и двух черных шаров? 5. Найдите матрицы Р(2), Я(3), ЯбО для марковской цепи с матрицей вероят¬ ностей перехода 1 0> То же самое для марковской цепи с матрицей ' 0 1 с ;)■ 6. Рассмотрим марковскую цепь с двумя состояниями а\ и а2 и матрицей ве¬ роятностей перехода 1 1 3 3 _1_ _1_ 2 2 С помощью особого устройства случайного выбора мы выбираем состоя¬ ние, с которого начинается процесс. Это устройство выбирает ах с веро¬ ятностью-^" и а2 с вероятностью-^-, Найдите вероятность того, что после первого шага этот процесс перейдет в состояние а\. То же самое для случая, когда это устройство выбирает а\ с вероятностью -g- и а2 с веро¬ ятностью -g-. [Оте:. А; ±.] 7. Для марковской цепи с вероятностями перехода, указанными на фиг. 108, постройте вероятностную меру, приписанную соответствующему дереву логических возможностей, и найдите следующие величины: P2V Ри- рШ и Рз1> Рз1 Рзз- Одна вычислительная машина использует только цифры 0 и 1. В некотором цикле операций предполагается передача одной какой-либо цифры. Однако для каждой операции имеется определенная вероятность р того, что цифра, передаваемая в процессе этой операции, вследствие ошибки изме¬ нится на вторую цифру. Для представления процесса передачи мы обра¬ зуем марковскую цепь, принимая в качестве состояний цифры 0 и 1. Ка¬ кой будет матрица вероятностей перехода? 9. Для марковской цепи из упр 8 нарисуйте дерево и введите вероятностную меру в предположении, что процесс начинается из состояния 0 и 17 Зак. 609.
258. Гл. IV. Теория вероятностей проходит цикл из трех операций. Какова вероятность того, что после трех операций машина выдаст верную цифру, т. е. О? Какова вероятность того, что в процессе передачи ни разу не произойдет изменение цифры о на цифру 1? [Отв.. (1 — р)3 + Зр2(1 — р); (1 — р) \] 10. Предположим, что мужчин можно разделить по их профессиям на работ¬ ников умственного труда, квалифицированных рабочих и неквалифициро¬ ванных рабочих. Допустим, что 80% сыновей работников умственного труда становятся работниками умственного труда, 10% становятся ква¬ лифицированными рабочими и 10% — неквалифицированными рабочими. Пусть из сыновей квалифицированных рабочих 60% становятся квали¬ фицированными рабочими, 20% — работниками умственного, труда и 20%—неквалифицированными рабочими. Наконец, 50% сыновей неква¬ лифицированных рабочих пусть будут неквалифицированными рабочими, и по 25% пусть приходится на долю двух других категорий. В предпо¬ ложении, что каждый мужчина имеет одного сына, постройте марковскую цепь, чтобы проследить за несколькими поколениями какой-то семьи. Вы¬ пишите матрицу вероятностей перехода. Найдите вероятность того, что внук неквалифицированного рабочего станет работником умственного труда. [Отв.: 0,375 ] 11. В упр. 10 мы предположили, что у каждого мужчины есть сын. Теперь допустим, что для мужчины вероятность иметь сына равна 0,8. Образуем марковскую цепь с четырьмя состояниями. Первые три состояния пусть будут те же, что и в упр. 10, а четвертое состояние отвечает случаю, ко¬ гда мужчина не имеет сына, и процесс на этом кончается. Это состояние представляет те семьи, в которых мужская линия вымерла. Выпишите матрицу вероятностей перехода и найдите вероятность того, что внук неквалифицированного рабочего будет работником умственного труда. [Отв.: 0,24.] 12. Объясните, почему вероятности перехода в примере 3 имеют значения, выписанные на стр. 255. ЛИТЕРАТУРА ДЛЯ ДОПОЛНИТЕЛЬНОГО ЧТЕНИЯ Гнеденко Б. В. и Хинчин А. Я., Элементарное введение в теорию вероятностей, М., Физматгиз, 1961. Я г л о м И. М. и Я г л о м А. М., Вероятность и информация, гл. I, М., Физ¬ матгиз, 1960. Кальбертсон Дж. Г., Математика и логика цифровых устройств, гл. III, М., Учпедгиз (в печати). Д ы н к и н Е. Б. и Успенский В. А., А^атематические беседы, раздел III, М.—Л., Гостехиздат, 1952. Я г л о м А. М. и Яглом И. М., Неэлементарные задачи в элементарном изложении, раздел I, цикл задач 6, М., Гостехиздат, 1954. Ф ел л ер В., Введение в теорию вероятностей и ее приложения, М., ИЛ, 1952. Гнеденко Б. В., Курс теории вероятностей, М., Физматгиз, 1961.
Глава V ВЕКТОРЫ И МАТРИЦЫ § 1. ВЕКТОРЫ-СТОЛБЦЫ И ВЕКТОРЫ-СТРОКИ Вектором-столбцом называется упорядоченная система чи¬ сел, записанных в виде одного столбца. Вот примеры таких век¬ торов: 0,6 0,4 Отдельные числа этих столбцов называются компонентами вектора. Число компонент вектора служит одной из его отличи¬ тельных характеристик. Первые два из выписанных выше векто¬ ров имеют по две компоненты, следующие два имеют по три компоненты и последний — четыре компоненты. В общем случае n-компонентный вектор-столбец (мы его будем также называть п-мерным вектором) запишется так: их И 2 U = ' Аналогично вектором-строкой называется упорядоченная си¬ стема чисел, записанных в виде одной строки. Примерами векто¬ ров-строк могут служить векторы: (1, 0), (--2, 1), (2, -3, 4, 0), (-1, 2, -3, 4, -5). Каждое число, входящее в состав такой строки, снова назовем компонентой вектора-строки. Число компонент вектора-строки снова является одной из важнейших его характеристик. В при¬ еденных примерах первые два вектора будут двухкомпонент- ными или «двумерными», третий вектор — четырехкомпонентпым 17*
260 Г л. V. Векторы и матрицы (четырехмерным) и четвертый — пятикомпонентным (пятимер¬ ным) . Два вектора-строки или два вектора-столбца тогда и только тогда считаются равными, когда равны их соответствующие ком¬ поненты. Таким образом, если « = (1, 2), 'э = ^2)’ ® —(Ь 2)’ х = (2, 1), ТО мы видим, что и — W, НО и ф V и и ф X. Если и и v — трехмерные векторы-столбцы, то их сумму и + v мы определим посредством покомпонентного сложения, т. е. следующим образом: / иЛ / u + v = i и2 I -И \и3/ \^з, Аналогично определим сумму двух трехмерных векторов-строк и и v: и+ ■» = («!, и2, и3)+('У1, v2, vz) = («! +г»!, u2-\-v2> и3Н-г)3>. Заметим, что сложение двух трехмерных векторов дает снова трехмерный вектор. Например, -1^ + ^ 3^ = ^и(4,-7, 12)+ (3, 14, -14) = (7, 7, -2). Аналогичным образом определяется посредством покомпо¬ нентного сложения и сумма двух ti-мерных векторов (строк или столбцов), которая представляет собой снова /г-мерный вектор. Заметим, что сложение векторов мы определили лишь для слу¬ чая, когда они являются либо оба векторами-столбцами, либо оба векторами-строками и если к тому же число их компонент одинаково. Так как порядок, в котором складываются числа, не имеет значения, то то же самое можно сказать и про сложение век¬ торов, так что И -j- 'V — Т) —J— U) где и и v — либо оба векторы-столбцы, либо оба векторы-строки. В этом состоит так называемый коммутативный закон сложения векторов. Числовым примером может служить равенство ышж
§ 1. Векторы-столбцы и векторы-строки 261 После того как сложение определено для двух векторов, лег¬ ко сложить три или более вектора, группируя их попарно, как это делают при сложении чисел. Например, и (1, 0, 0) + (0, 2, 0) + (0, 0, 3) = (1, 2, 0)-+ (0, 0, 3) = = (1, 0, 0) + (0, 2, 3) = (1, 2, 3). Вообще сумма любого числа векторов (строк или столбцов), имеющих одинаковое число компонент, будет вектором, у кото¬ рого первая компонента равна сумме первых компонент этих векторов, вторая компонента равна сумме вторых компонент и т. д. Умножение вектора v на число а мы определим посредством умножения на а каждой компоненты вектора V. В случае трех¬ мерного вектора имеем для векторов-столбцов и av = a(vu v2, v3) = (avv av2, avs) для векторов-строк. Если же и — л-мерный вектор (столбец или строка), то аи определяется аналогично посредством умноже¬ ния на а каждой компоненты вектора и. Если и — произвольный вектор, то противоположным ему век¬ тором — и назовем вектор —и = (—1 )и. Следовательно, в слу¬ чае трехмерного вектора-строки — и = (—\)(ии и2, и3) = (— и19 — и2, —и3). Пользуясь определением противоположного вектора, мы смо¬ жем вычитать векторы, а, следовательно, складывать их «алге¬ браически». В случае трехмерных векторов-столбцов имеем: /яЛ fvx\ f иг- v,\ и — V — I U2 I — I v2 .1 = I и2 — V2 I . \«3/ \^2 / \Из— ^3/ Конкретные примеры на вычитание векторов имеются в упраж¬ нениях этого раздела.
262 Гл. V. Вектора и матрицы Важную роль играет нулевой вектор, т. е. вектор, все ком¬ поненты которого равны нулю. Например, будут трехмерными нулевыми векторами. В тех случаях когда не может возникнуть путаницы, будем употреблять символ О для обозначения нулевого вектора (столбца или строки). Смысл его будет ясен из контекста. Нулевой вектор обладает тем важным свойством, что, каков бы ни был вектор и, всегда и + 0 = и. Докажем это для трехмерного вектора-столбца: Одним из главных преимуществ векторной записи является то, что она дает возможность обозначить одной-единственной буквой, например и, v, ..., целую систему чисел и обращаться с этой системой, как с одной величиной. Векторная запись по¬ зволяет выражать в простой форме весьма сложные отношения. Много примеров этому читатель найдет в настоящей и в сле¬ дующих двух главах. и -j- 0 — «А и7 \ = и. uj Упражнения 1. Произведите указанные ниже действия над векторами (b) — V, (c) 2и — v; (ch V -f- w\ (е) и 4“ у Щ
§ /. Векторы-столбцы и векторы-строки 263 (f) 2и — ‘3v — w; (g) 3и — v 2w. г Отв.: 9 —2 8 2. Произведите указанные в п. (а) — (g) упр. 1 действия над векторами 3. (а) Покажите, что нулевой вектор не изменится от умножения его на лю¬ бое число. (Ь) Покажите, что 0 + и = и, каким бы ни был вектор, и. 4. Докажите, что если и и v— два вектора (оба векторы-столбцы или оба векторы-строки) с одинаковым числом компонент, то и + 0 • v =■-- и и О • и -f v = V. 5. Если 2и — v = 0, то какое соотношение связывает компоненты и и v? 6. Ответьте на вопрос, поставленный в упр. 5, для случая равенства —3и + 5у + и — 7v = 0, связывающего векторы и и v. То же самое для • равенства 20у — Ъи + 5v + 8и = 0. 7. Найдите следующие суммы, а в тех случаях, когда это невозможно, объ¬ ясните причину: и = (7, 0, —3), v = (2, 1, —5), w = (1, —1, 0). [Отв.: vi — 2uj.] (b) (2, —1, —1) +■ 0 (4, 7, —2) = ? 8. Найдите ии и2 и и3, если 9. Найдите компоненты vu v2, v3 вектора v, если Ю. Что можно сказать о компонентах иi, и2) из вектора и, если
264 Гл. V. Векторы и матрицы 11. Что можно сказать о компонентах U\, U2, из вектора w, если 12. Пусть каждому человеку поставлен в соответствие трехмерный вектор- строка, компоненты которого равны возрасту, росту и весу этого человека. Имеет ли смысл сложение двух векторов, сопоставленных двум разным людям? Имеет ли смысл умножение такого вектора на число? 13. Пусть каждому человеку, выходящему из магазина с самообслуживанием, поставлен в соответствие вектор-строка, компоненты которого показы¬ вают для каждого вида товаров, имеющихся в этом магазине, количество товаров, купленных этим человеком. Ответьте на те же вопросы, что и в упр. 12. 14. Каждому магазину с самообслуживанием поставим в соответствие вектор- столбец, компоненты которого показывают цены на все запасенные то¬ вары. Имеет ли смысл сложение векторов, сопоставленных различным магазинам? Имеет ли смысл умножение таких векторов на числа? Укажите различие ситуаций, данных в упр. 12, 13 и 14. § 2. ПРОИЗВЕДЕНИЕ ВЕКТОРОВ. ПРИМЕРЫ Читатель может спросить: зачем нужно было вводить два рода векторов — векторы-столбцы и векторы-строки, — если их свойства аналогичны? Ответить на этот вопрос можно по-раз¬ ному. Во-первых, во многих приложениях имеют дело с величи¬ нами двух родов, которые исследуются одновременно, и поэтому одну из них удобно представить в виде вектора-строки, а дру¬ гую — в виде вектора-столбца. Во-вторых, существует один спо¬ соб комбинирования векторов-строк и векторов-столбцов, ко¬ торый очень удобен для определенных типов вычислений. Покажем это на следующем простом примере из области эко¬ номики. Пример 1. Смит зашел в бакалейную лавку, чтобы ку¬ пить по дюжине яиц и апельсинов, по полдюжине яблок и груш и три лимона. Представим его покупки посредством вектора-строки: х = [6 (яблок), 12 (яиц), 3 (лимона), 12 (апельсинов), 6 (груш)] — = (6, 12, 3, 12, 6). Пусть поштучные цены на эти продукты будут: яблоки — 4 цента, яйца — 6 центов, лимоцы — 9 центов, апельсины — 5 центов и груши — 7 центов за штуку. Мы можем предста¬
§ 2. Произведение векторов. Примеры 265 вить эти цены посредством вектора-столбца: У = Теперь, очевидно, встает вопрос: какова вся сумма, ко¬ торую должен уплатить Смит за покупки? Мы хотим умно¬ жить вектор количества продуктов * на вектор у цен так, чтобы результат равнялся счету, который был предъявлен Смиту. Очевидно, наше умножение должно иметь следую¬ щую форму: Г 41 4 цента за яблоко 6 центов за яйцо 9 центов за лимон 5 центов за апельсин 7 центов за грушу. х-у = (6, 12, 3, 12, 6) = 6-4+12-6 + 3-9 + 12-5 + 6-<7= = 24 4“ 72 4“ 27 4-60 4~ 42 = 225 центов, т. е. 2,25 долл. Именно такой расчет и производит кассир, предъявляю¬ щий счет Смиту. Содержащееся в этом примере определение умножения век¬ тора-строки на вектор-столбец мы примем и в общем случае: Определение. Пусть и — вектор-строка и v — вектор-стол¬ бец с тем же числом п компонент; произведение uv мы положим равным uv = ulvl + u2v2 + ... + unvn. Заметим, что мы всегда пишем сначала вектор-строку, а потом вектор-столбец, и что это единственный тип умножения векто¬ ров, который мы будем рассматривать. Приведем два примера умножения векторов: (2, 1, —1) • ^ — 1 ^ = 2 • 3+ 1 (—1)4- (—1)*4=1, (1, = 1 • 0 + 0 • 1 =04“0 = 0. Обратим внимание на то, что результат такого умножения век¬ торов всегда будет некоторым числом.
266 Гл. V. Векторы а матрицы Пример 2. Рассмотрим сверхупрощенную экономику с тремя отраслями промышленности, скажем, угольной, элек¬ трической и сталелитейной, и с тремя потребителями 1, 2 и 3. Пусть каждый потребитель расходует некоторую долю продукции, выпускаемой каждой отраслью, и пусть каждая отрасль расходует некоторую долю продукции, выпускае¬ мой двумя остальными. Мы предполагаем, что расходуе¬ мые количества положительны или равны нулю, так как расходование отрицательного количества продукции непосредственно не может быть интерпретировано. Нужды каждого потребителя и каждой отрасли могут быть пред¬ ставлены посредством трехмерного вектора (строки) спроса, у которого первая компонента означает количество угля, требуемое этим потребителем или этой отраслью, вторая компонента означает количество требуемой электроэнер¬ гии, а третья компонента — количество требуемой стали в некоторых подходящих единицах. Например, векторами спроса трех потребителей могут быть dj = (3, 2, 5), d2 = (0, 17, 1), rf3 = (4, 6, 12); а векторами спроса каждой отрасли могут быть dy = (0, 1, 2), d3 = (20, 0, 8), dc = (30, 5, 0),: ’ где индексы «у», «э» и «с» служат для обозначения угля, электричества и стали. Тогда спрос на эти товары со сто¬ роны всех потребителей может быть представлен суммой d\ + d2-\~ d2> = (3, 2, 5) + (0, 17, 1) + (4, 6, 12) = (7, 25, 18). Аналогично общий спрос на эти товары со стороны про¬ мышленности опять может быть представлен суммой dy —|- d3 —Ь etc = (50, 6, 12). Следовательно, полный общий спрос может быть предста¬ влен суммой (7, 25, 18)+ (50, 6, 12) = (57, 31, 30). Предположим теперь, что единица угля стоит 1 доллар, единица электричества 2 доллара и единица стали 4 дол¬ лара. Тогда эти цены можно представить посредством век- И тора-столбца р — \ 2 • Рассмотрим сталелитейную про¬ мышленность: она продает 30 единиц стали „по 4 доллара за единицу, так что ее общий доход равен 120 долларам. Сто¬ имость того, что потребляется ею в процессе производства, можно представить произведением векторов
§ 2. Произведение векторов. Примеры 267 х=(а,Ь) dz> р = (30, 5, 0) • 2 ■ = 30 + 10 = 40 долларов. Итак, прибыль в сталелитейной промышленности равна 120 — 40 = 80 (долларов). В упражнениях к этому пара¬ графу требуется найти прибыль в других отраслях. Эта модель экономики нереальна в двух отношениях. Во- первых, мы не взяли здесь реальных цифр для различных входящих в нее величин. Во-вторых, и это еще более важно, мы не учли того факта, что чем больше отрасль промышленности производит, тем больше она требует Хг вложений. . Последнее усложнение будет рассмотрено в гл. VII. Рассмотрим теперь прямоуголь¬ ную систему координат на плоско¬ сти (фиг. 111). Двумерный вектор х = (а, Ь) можно рассматривать как точку этой плоскости, положение которой относительно осей коорди¬ нат определено, как показано на чертеже. Чтобы найти точку х, нуж¬ но выйти из начала координат и О4 ' xt продвинуться вдоль оси Х\ на рас¬ стояние а, а затем продвинуться Фиг. 111 вдоль линии, параллельной оси *2, на расстояние Ь. Если у нас имеются две такие точки, скажем, х = (а, Ь) и у — (с, d), то х + у, х — у, у — х и — х — у будут точками, геометрический смысл которых виден на фиг. 112. Понятие умножения вектор-строки на число также можно интерпретировать геометрически. На фиг. 113 изображены точки, соответствующие вектору х= (1, 2) и векторам 2ху ух, —х и — 2х. Заметим, что все эти точки лежат на одной прямой, про¬ ходящей через начало координат. Другой векторный величиной, имеющей геометрический смысл, является вектор г = ах + +' (1—а)у, где а — любое вещественное число, заключенное между 0 и .1. На фиг. 114 мы видим, что все точки г лежат на отрезке прямой, проходящей через точки х и у. Если а = -у, то соответствующая точка будет серединой этого отрезка. Таким образом, если х = (а, Ь) и у = (с, d), то точка У = I / ач I 1 / wv (а + с b + d\ u . = у (а, о) -+- y (с, d) = l—2—’ —W~) служит серединой отрез-: ка прямой, концами которого служат точки х н у.
268 Г л. V. Векторы и матрицы Фиг. 112 -х-Ы,-2) f / / *Zx-[-Z.-4) I ?2х-12,4) / fx-U.2) / f4zx{i/z,1) Фиг. 113 y\ 'yz- ax+(1-a)y \ \ \ Середина '\^/2Х + ,/гУ \ \ \ \ \ \ Фиг. 114 Упражнения 1. Найдите указанные ниже величины, где и = ( 1, -1,4), х = (О, 1, 2),
§ 2. Произведение векторов. Примеры 2б9 [Отв.: (±, 0, |j.j (a) u-vх-у = ? [Отв.: 12.] (b) (— и -|- 5л:) • (3v — 2у) = ? (c) 5и • v + 10 [х • (2v — у)] = ? [Отв.: 55.] (d)2[(«-jc).(i; + y)] = ? 2. Постройте точки, соответствующие векгорам-строкам х = (3,4) и у — (—2,7). Найдите и постройте точки, отвечающие следующим векто¬ рам: / ч 1 I 1 (a) -j х + -j у, (b) х + у, (c) х — 2у, (d)|x + ly. (e) Зх —2у, (f) 4у — Зх. 3. Пусть л: = (1,—1,2) и у — (0,1,3)—точки пространства; найдите сере¬ дину отрезка прямой, соединяющего х с у. 4. Пусть и — трехмерный вектор-строка, v — вектор-столбец с тем же числом компонент и а — число. Докажите, что a(U’V) = (аи) • v = и • (av). 5. Предположим, что Браун, Джонс и Смит пришли в бакалейный магазин и купили следующие продукты: Браун: два яблока, шесть лимонов и пять груш; Джонс: две дюжины яиц, два лимона и две дюжины апельсинов; Смит: десять яблок, дюжину яиц, две дюжины апельсинов и полдюжины груш. (a) Сколько различных видов продуктов они купили? [Отв.: 5.] (b) Запишите покупку каждого из них в виде вектора-строки с числом компонент, равным ответу на вопрос пункта (а). (c) Используя вектор цен, указанный в примере 1, определите счет, предъявленный магазином каждому из этих лиц. [Отв.: 0,97 доллара, 2,82 доллара, 2,74 доллара.] (d) С помощью сложения векторов запишите общий итог их покупок в виде вектора-строки. (e) Найдите двумя различными способами общую сумму, израсходован¬ ную ими в бакалейном магазине. [Отв.: 6,53 доллара.] 6. Докажите, что умножение векторов обладает следующими двумя свой¬ ствами: (i) и • (а • v) = а {а • v)y (ii) и • (у + w) = и • v а • wt где и — трехмерный вектор-строка, v и w — трехмерные векторы-столбцы и а — некоторое число. 7. Изготовление книги включает в себя несколько стадий: сначала ее наби¬ рают, затем печатают и, наконец, делают к ней обложку и переплетают. Допустим, что наборщик берет 6 долларов в час, бумага стоит 'м цента за лист, печатник берет 11 центов за каждую минуту работы его пресса,
270 Гл. V.' Векторы и матрицы обложка стоит 28 центов и переплетчик берет 15 центов за переплетение каждой книги. Допустим теперь, что издатель хочет напечатать книгу, для которой требуется 300 часов работы наборщика, 220 листов бумаги на один экземпляр и пять минут работы печатного пресса на каждый экземпляр. (a) Напишите пятимерный вектор-строку, дающий объем материалов и работы по первой книге. Напишите другой вектор-строку, дающий объем материалов и работы по второму, третьему, .. . экземпляру книги. Напишите пятимерный вектор-столбец, компоненты которого дают цены различных материалов и работ по каждой книге в том же порядке, в каком они представлены в двух предыдущих векторах. (b) Используя умножение векторов, найдите стоимость издания одного экземпляра книги. [Отв.: 1801,53 долларов.] (c) Используя сложение и умножение векторов, найдите стоимость пе¬ чатания первого издания тиражом 5000 экземпляров. [Отв.: 9450 долларов.] (d) Предполагая, что набор, изготовленный для первого издания, был использован снова, найдите стоимость печатания второго издания в количестве 5000 экземпляров. [Отв.: 7650 долларов ] 8. Произведите следующие вычисления, относящиеся к примеру 2. (a) Найдите сумму, которую должна уплатить каждая отрасль промыш¬ ленности и каждый потребитель за приобретенные ими товары. (b) Найдите прибыль, полученную в каждой отрасли промышленности. (c) Определите общую денежную сумму, выплачиваемую всеми отрас¬ лями и потребителями. (d) Какая доля от общей денежной суммы, определенной в (с), выпла¬ чивается всеми отраслями промышленности? Какая доля выплачи¬ вается потребителями? 9. Подрядчик-строитель получил заказы на пять домов в стиле ранчо, семь домов в стиле Кейп-Код1) и двенадцать домов в колониальном стиле. На¬ пишите трехкомпонентный вектор-строку х, компоненты которого указы¬ вают, какое число домов каждого типа должно быть построено. Допустим, что для одного дома в стиле ранчо требуется 20 единиц леса, для дома в стиле Кейп-Код— 18 единиц и для дома в колониальном стиле — 25 еди¬ ниц. Напишите вектор-столбец и, компоненты которого указывают количе¬ ство леса, необходимое для строительства дома каждого типа. Найдите общее количество требуемого леса, перемножив между собой векторы х и и. [Отв.: 526.] 10. Пусть х = (хь х2) и пусть векторы а и b равны: -С) -(!)■ Определите х\ и х2, если х • а = —1 и х • 6 = 7. [Отв.: х\ = — 31, х2 = 23.] 11. Пусть х = (хь х2) и пусть векторы а и b равны -О- -(Д Определите х\ и х2, если х • а = х\ и х • b = х2. х) Кейп-Код — песчаный мыс в Атлантическом океане на юго-востоке штата Массачусетс, популярное дачное место. С этим районом в США свя¬ зывают определенный тип дачных домов.
§ 3. Матрицы и их комбинации с векторами 271 § 3. МАТРИЦЫ И ИХ КОМБИНАЦИИ С ВЕКТОРАМИ Матрицей называется прямоугольная таблица, имеющая вид Здесь буквы a:j означают какие-то действительные- числа, a m и п целые числа: m является числом строк, а п — числом столб¬ цов нашей матрицы. Такую матрицу называют (тХ ^-матри¬ цей. Если m = п, то матрицу называют квадратной (а чи¬ сло пг = п ее порядком). Вот несколько примеров матриц: Первым примером служит трехмерный вектор-строка, являю¬ щийся (1 X 3)-матрицей, вторым примером служит трехмерный вектор-столбец, являющийся (3 X 1)-матрицей; третьим приме¬ ром служит квадратная (2 X 2)-матрица; т. е. квадратная мат¬ рица второго порядка; четвертым — квадратная матрица четвер¬ того порядка и последним (3 X 5)-матрица. Две матрицы, имеющие одинаковые размеры (т.е. имеющие одинаковое число строк и одинаковое число столбцов), назы¬ ваются равными тогда и только тогда, когда равны их соответ¬ ственные элементы. Вспомним, что в § 15 гл. IV матрица появилась естественным образом при рассмотрении марковского стохастического про¬ цесса. Чтобы дать другой пример того, как матрицы возникают на практике и как они используются в соединении с векторами, мы рассмотрим следующий пример. Пример 1. Предположим, что подрядчик-строитель по¬ лучил заказ на 5 домов в стиле ранчо, 7 домов в стиле Кейп-Код и 12 домов в колониальном стиле. Представим этот заказ посредством вектора-строки х = (5, 7, 12). Под¬ рядчику, конечно, известны виды «сырья», идущего на / а\\ а\2 • • • а\п \ ^21 ^22 • * • ^2п (1, 2, 3), / 1 0 0 0\ 0 10 0 0 0 1 о Г \0 О О 1 /
272 Гл. V. Векторы и матрицы каждый тип домов. Пусть этим сырьем будет сталь, лес, стекло, краска и рабочая сила. Элементы приведенной ниже матрицы дают количество каждого вида сырья и рабочей силы, идущих на каждый тип домов, выраженное в подхо¬ дящих единицах. (Эти цифры взяты произвольно и не со¬ ответствуют реальным данным.) Сталь Лес Стекло Краска Рабочая Ранчо / 5 20 16 7 Кейп-Код ( 7 18 12 9 Колониальный V 6 25 8 5 Каждая строка является пятимерным вектором-стро¬ кой, дающим количества сырья каждого вида и рабочей силы, требуемые для данного типа домов, а каждый стол¬ бец— трехмерным вектором-столбцом, дающим количество данного сырья (или рабочей силы), требуемые для ка¬ ждого типа домов. Ясно; что это — очень компактный спо¬ соб записи всей интересующей нас информации. Предположим теперь, что подрядчик хочет узнать, сколько потребуется сырья каждого вида и рабочей силы для выполнения заказа. Обозначим нашу матрицу через R. Подрядчик хотел бы образовать нечто вроде произведения xRy так чтобы это произведение указывало, какие он дол¬ жен сделать заказы. Это произведение должно иметь вид /5 20 16 7 17\ xR = (5, 7, 12) 7 18 12 9 21 = \6 25 8 5 13/ = (5-5 + 7.7+ 12-6, 5-20 + 7-18+ 12-25, 5 • 16+7 • 12 + 12*8, 5-7 + 7-9 + 12-5, 5-17 + 7-21 + 12-13) = (146, 526, 260, 158, 388). Итак, мы видим, что подрядчик должен заказать 146 еди¬ ниц стали, 526 единиц леса, 260 единиц стекла, 158 единиц краски и 388 единиц рабочей силы. Заметим, что наш ответ представляет собой пятимерный вектор-строку и что ка¬ ждый элемент этого вектора получается путем умножения вектора х на соответствующий столбец матрицы R. Подрядчика интересует также, сколько он должен упла¬ тить за материалы и рабочую силу. Предположим, что еди¬ ница стали стоит 15 долларов, единица леса 8 долларов,
§ 3. Матрицы и их комбинации с векторами 273 единица стекла 5 долларов, единица краски 1 доллар и еди¬ ница рабочей силы 10 долларов. Тогда эти цены можно записать в виде вектора-столбца: 151 8 5 1 Ю Стоимость домов каждого типа определяется произведе¬ нием Ry. Это произведение должно иметь вид: 151 Ry = 15 + 20-8+16 15+18 -8+12 15 + 25-8+ 8 5 + 7 -1 + 17 5 + 9 • 1+21 5 + 5 • 1 + 13 Итак, стоимость сырья и рабочей силы равна 492 долларам для дома в стиле ранчо, 528 долларам для дома в стиле Кейп-Код и 465 долларам для дома в колониальном стиле. Наконец, подрядчик хочет узнать, какова общая стои¬ мость сырья и рабочей силы, требуемых для постройки всех домов. Легко видеть, что она равняется величине xRy, ко¬ торую можно найти двумя путями: 15 xRy = (xR) у = (146, 526, 260, 158, 388) 5 1 Ю J : 1 1 736, или ' 492 \ xRy = x(Ry) = (5, 7, 12) •[ 528 =11 736. .465 / Общая стоимость строительства равна И 736 долларам. Зак. 609
274 Г л. V. Векторы и матрицы Мы распространим это определение на общий случай умно¬ жения матрицы на вектор-строку или на вектор-столбец. Определение. Пусть А — (m X п)-матрица,х — т-мерный вектор-строка и и — ^-мерный вектор-столбец. Произведения хА и А и мы определяем следующим образом: / xA — (xlt х2 хт) ап а\2 • .. а[п \ а2\ а22 . • • а2п а,п\ Я ,,2 - ■ • ■ атп> = ix\a\\ + х&г\ + • • • 4 хта„Л, ххап + х2а,п + ... -+• хта, m2) CL \ I Ап = 1'22 CL \ц а2п 1т\ ат2 ап Х\а\п^Г х2а2п + апщ + апи2 + a2]ii\ а22 и2 + . + аХпип ^ • + а2пап Wi«i И- &,п2и2 + . . .-\-а;пи, Читатель научится легко обращаться с этими формулами, если заметит, что каждый элемент в произведении хА или Ли получается путем умножения вектора х или и на некоторый столбец или строку матрицы А. Отметим, что умножать вектор- строку на матрицу можно только в том случае, когда число строк этой матрицы равно числу компонент этого вектора, и что результат будет другим вектором-строкой; аналогично при умно¬ жении матрицы на вектор-столбец число столбцов этой матри¬ цы должно равняться числу компонент этого вектора, и резуль¬ тат такого умножения будет другим вектором-столбцом. Вот некоторые численные примеры умножения векторов н матриц: (1, 0, -1) 1+0-3 —1 -8) = = (i, -7); 3 2 - Г 5 1 0 2 ! '\ -3 0 3 1 0 = —2 5-4 7 V -2/ -9 т CN1 СО 1 . — 1.
§ 3. Матрицы и их комбинации с векторами 275 Заметим, что если х — /л-мерный вектор-строка и А— (тХп)- матрица, то хА будет n-мерным вектором-строкой; аналогично если и — л-мерный вектор-столбец, то А и будет m-мерным век- тором-столбцом. Это можно было видеть и на предыдущих при¬ мерах. Пример 2. В упр. 6 § 15 гл. IV мы рассмотрели марков¬ скую цепь с матрицей вероятностей перехода Начальное состояние выбиралось с помощью случайной вы¬ борки, которая выдавала каждое из состояний а{ и а2 с ве¬ роятностью ~2~. Пусть выбор начального состояния харак¬ теризуется вектором = ij)’ где первая компонента означает вероятность выбора состояния аь а вторая ком¬ понента— вероятность выбора начального состояния а2. Вычислим произведение р(0)Р. Мы имеем: Рф)р = а’ У 7 7| = (т + Т’ У + т) = (У гУ- 2 2 ) Воспользовавшись методами гл. IV, можно показать, что после одного шага вероятность того, что процесс перейдет в состояние аь равна и вероятность того, что он перей- 7 дет в состояние а2, равнаПусть р(1) — вектор, первая компонента которого есть вероятность того, что после од¬ ного шага процесс окажется в состоянии ai, а вторая ком¬ понента есть вероятность перехода после одного шага в состояние а2. В нашем примере мы имеем Р'"={Т2- И)=Гяр- Вообще формула р{1)=р([))Р верна для любого марков¬ ского процесса с матрицей вероятностей перехода Р и век¬ тором начальных вероятностей р^°К 18*
276 Гл. V. Векторы и матрицы У пражнения 1. Произведите следующие действия: <->U <b)<3’-4)(J “JH [Ошв:. (11, —11).] (с) 1 3 7 —1 -8 14 9 2 10 —6 0 3 —5 7 О -1 = ? <d)(2.2>(_; ;).г <•>(_: 1)(55и [Отв.: О, 0.] (f) (0, 2, -3) • I 7 —8 -1 14 3 —5 = ? ? [Отв.: (ах, + сх2, bx] + dx2).\ (j) х. (j) 2. Какое число имеет свойство, аналогичное свойству матрицы в п. (i) и предыдущего упражнения? 3. Отметим, что в п. (d) упр. 1 в результате умножения вектора-строки, ни одна из компонент которого не равна нулю, на матрицу, ни одна из ком¬ понент которой не равна нулю, получается нулевой вектор-строка. Найдите другой аналогичный пример. То же самое для п. (е) упр. 1. 4. Найдите указанные величины в тех случаях, когда это возможно. (a) (Х\, х2) ^ ^ ^ = (7, 0). Найдите вектор х. [Отв.: (3, 1).] (b) (2, — 1)^“ *) = (6, 3). Найдите матрицу
§ 3. Матрицы и их комбинации с векторами 277 Определяется ли в этом случае решение однозначно? 1 — 1\/И| \ /3 (С) ( -1 1 ) ( и\ ) = ( 4 ) • Найдите вект°Р “■ ^ ( 2 8)( w' )= ( 6 )' ^айдите вектоР “• Сколько решений вы можете указать? £о/яв.: и = ^ k ^ j, где k — любое число, j 5. Найдите указанные ниже величины. / 0 2 \ (а) (1, —1)1 ^ j = л - (1, — 1); найдите а. [Отв:. а = 2.] Dcho ; найдите и. Сколько решений вы можете указать? Г / k \ 1 Отв:. и = I 2^ I, где k — любое число. (с) ( 3 ^ j ^ ^ ^ j ; найдите и. Сколько решений имеется? в. Используя упр. 5 предыдущего параграфа, постройте (3 X 5) -матрицу, строки которой означают соответственно различные покупки Брауна, Джонса и Смита. Умножением справа на пятикомпонентный вектор-стол¬ бец цен найдите трехкомпонентный столбец, элементы которого показы¬ вают счет, предъявленный каждому из них. Умножением слева на вектор- строку х = (1,1, 1) и справа на вектор цен найдите общую сумму, из¬ расходованную ими в магазине. 7. Допустим, что в примере 1 настоящего параграфа подрядчик должен по¬ строить 7 домов в стиле ранчо, 3 в стиле Кейп-Код и 5 в колониальном стиле. Пересчитайте, используя матричное умножение, общую стоимость сырья двумя различными способами, как это было сделано и в этом при¬ мере. 8. Пусть в примере 2 настоящего раздела вектор начальных вероятностей имеет вид /Н°) ^(з"» "з")* Найдите вектор /ПО. “g-j-J 9. Пусть для марковского процесса с матрицей вероятностей перехода О 1 О 0 1 1 Р = \ 2 2 1 0 1 3 - вектор начальных вероятностей имеет вид /Н°) = ^ . Постройте дерево логических возможностей процесса и соответствующую вероят¬
278 Г л. V. Векторы и матрицы ностную меру. Вычислите />()) с помощью этой меры, а также исходя из формулы /?(|) =/7(0)Я и покажите, что оба результата совпадают. 10. Рассмотрим марковский процесс с двумя состояниями и матрицей вероят¬ ностей перехода р = ( а х~а), \ 1 — ь ь I где а и b — неотрицательные числа. Предположим, что вектор начальных „'О) _ /„(0 л(0)ч „(0) вероятностей для процесса имеет вид У' —\Р\ 'Р2 )> где Р\ — на- чальна.я вероятность выбора состояния 1 и У2 — начальная вероятность выбора состояния 2. Выведите формулу для компонент вектора рМ. [Отв:. рт = {а/У,0) + (1 — Ь) pf\ (1 — a) pf] + bpf>\.] 11. В условиях примера 2 покажите, используя связанную с деревом логиче¬ ских возможностей вероятностную меру, что р( 2) = /?(!)/>. 12. Следующая матрица показывает в надлежаще выбранных единицах со¬ держание витаминов для трех пищевых продуктов: Витамин: А в С Продукт I / 0,5 0,5 0 Продукт II 0,3 0 0,2 Продукт III \ 0,1 0,1 0,2 Сколько витаминов каждого типа мы потребляем, съедая 5 единиц про¬ дукта I, 10 единиц продукта II и 8 единиц продукта III? Предполагая, что мы платим только за содержание витаминов в каждом продукте из расчета соответственно 10, 20, 25 и 50 центов за единицу каждого вита¬ мина, найдите стоимость единицы каждого типа продуктов. Подсчитайте двумя способами общую стоимость принятой нами пищи. Г f15) 1 Отв.: (6,3; 3,3; 3,6; 5,0); I 13 I; 4,69 доллара. \ 33/ § 4. СЛОЖЕНИЕ И УМНОЖЕНИЕ МАТРИЦ Две матрицы одного и того же размера, иначе говоря с оди¬ наковым числом строк и одинаковым числом столбцов, могут быть сложены путем сложения их соответствующих компонент. Например, если А и В —две (2 X 3)-матрицы, то <*12 а\Л_^[ЬП ЬП 613\ а22 а23 ) \ ^21 ^22 ^23 / / 011 + ^11 012 + ^12 013 + ^13^ \ 021 Н~ ^21 022 + ^22 а23 ~Т ^23 У А + В (аи V а21
§ 4. Сложение и умножение матриц Заметим, что сложение векторов (строк или столбцов), яв¬ ляется частным случаем сложения матриц. Вот численные при¬ меры сложения матриц: (1, 0, -2) 1 О .0 1 (0, 5, 0) = (1, 5, -2); 4- — 1 0 о 0\ о о)’ 7 0 0 -8 0 1 -1 0 г -3 1 —6 4 5 -1 1 6 —7 4 0 7 + 0 3 0 = 4 3 7 0 —2 —2 — 1 1 —1 -1 — 1 -3 1 1 1 0 —4 2, 1 -3 3. Другие примеры даны в упражнениях. Обращаем внимание чи¬ тателя на то, что матрицы неодинакового размера складывать нельзя. Если А — матрица и к— любое число, то произведение кА числа k на матрицу А мы определяем следующим образом: кА = к /Яц а2\ Ч\п \ ... а. '2 п / ^аи ка2{ каю . . . kay Л 'ml ... ап k&yi \ kamj ka„,2 . . . к&2П ■ • • ka„.n! Заметим, что это просто покомпонентное умножение, уже встре¬ чавшееся нам при изучении векторов. Дадим примеры умноже¬ ния матриц на число: /7 —2 8 \ /—14 4 —16 \ —2 \0 5 -1/ \ 0 —10 2) ’ Умножение вектора на число является частным случаем умноже¬ ния матрицы на число. При некоторых условиях две матрицы могут быть перемно¬ жены, в результате чего получается некоторая новая матрица.
280 Гл. V. Векторы и матрицы Пусть, например, А—(2 X 3)-матрица и В—(3 X 2)-матрица. Тогда произведение АВ определим так: АВ = Ci\ CL<) 12 '22 ^31 ^32' #1 Al + #12^21 + #13^31 #11^12 + #12^22 + #13^32 #21^11 Ч~ #22^21 + ^23^31 #21^12 #22^22 Н“ #23^; 32 Заметим, что это произведение является (2 X 2)-матрицей. Отметим также, что каждый элемент новой матрицы равен про¬ изведению одной из строк матрицы А на один из столбцов мат¬ рицы В; например, элемент, который стоит во второй строке и первом столбце, будет произведением /Ь"\ (#21 #22 #2з) I ^21 I — #21^11 4" #22^12 + #23^13* \bj В общем случае умножение матриц определяется следующим образом: Определение. Пусть А—(гп X k)-матрица и В — (k X п)-матрица; тогда матрица-произведение С = АВ есть (m X п)-матрица, компоненты которой равны CiJ — (ail #/2 * • • aik) lj b2j bkj “ #/2^27+ • • • + #i/A ikuk}' В этом определении важно обратить внимание на следующее: во-первых, умножение матрицы А на матрицу В возможно толь¬ ко в случае, если число столбцов матрицы А равно числу строк матрицы В\ во-вторых, матрица-произведение С = АВ имеет то же число строк, что и Л, и то же число столбцов, что и В; нако¬ нец, элемент матрицы АВ, стоящий в i-й строке и /-м столбце, получается умножением /-й строки А на /-й столбец В. Заметим, что произведение вектора на матрицу является частным случаем умножения матриц,
§ 4. Сложение и умножение матриц 281 Приведем численный пример 3-1+1 • 1+4-0 3-3+1 • 1+4-0 3-0+1-0+4-1 3-0+1-0+4-1 2-1+0-1+5-0 2-3+0-14-5-0 2-0+0-0+5-1 2-0+0-0+5-1 10 4 4 6 5 5 Вот еще несколько примеров умножения матриц: 16 Зч \. — 6 - -9, )* 1 4 1 1 -1 - -2 0 \ 2 2 2 М 10 4 4N у 2 6 5 Квадратная матрица п-го порядка /1 0... 1 = 0 1 \о о о о о «главной диагонали», обладает следующим У которой элементы аи, стоящие на равны 1, а остальные элементы — нули свойством: IA = А для любой (п X т) - матрицы Л, AI --= А для любой (т X п)-матрицы А (см. упр. 2). В частности, AI = IA = А для любой квадратной матрицы порядка п\ и1 = и для любого п-мерного вектора-стро¬ ки и и 1х = х для любого я-мерного вектора-столбца х. Таким образом, в матричном умножении матрица / играет ту же роль, что и 1 при умножении обычных чисел. Такую матрицу / мы бу¬ дем называть единичной. Точно так же нулевая матрица (не обязательно квадратная) О, все элементы которой равны 0, обладает тем свойством, что
•282 Гл. V. Векторы и матрицы АО = О или ОА = О или и то и другое вместе в зависимости от того, какое из произведений имеет смысл (см. упр. 4—6). На¬ пример, если А есть (2 X 3)-матрица, а О — нулевая (3 X 4)-мат- рица, то АО будет нулевой (2 X 4)-матрицей. Теперь, естественно, встает вопрос о перемножении более чем двух матриц. Пусть А.— (пг X А)-матрица, В — (А X А)-мат¬ рица и С— (k X Аг)-матрица. Тогда, мы можем, конечно, опреде¬ лить произведения (АВ)С и А (ВС). Оказывается, что эти два произведения равны. Это их общее значение мы полагаем по определению равным ABC, т. е. Правило, выраженное этим равенством, называется ассоциатив¬ ным законом для умножения матриц. Мы не будем здесь дока¬ зывать этот закон. В упр. 8—9 читателю предлагается проверить его на частных примерах. Если А и В — квадратные матрицы одинакового порядка, то можно умножить как А на В, так и В на А. Однако неверно, что произведение АВ обязано быть равным произведению ВА. Например, если ABC = А (ВС) = (АВ) С. го мы имеем тогда как и, очевидно, АВ ф В А. Упражнения 1. Выполните следующие операции: 6 4 2 О —4
§ 4. Сложение и умноэюение матриц 283 Ы” Л3)-] = 0/?2б.: О 1 О 7 —4 О —2 2. Пусть Л — любая (3 X 3)-матрица и пусть /— единичная матрица: (1 ° °\ / = I 0 1 0 . V 0 0 1 / Проверьте, что Л/ = IА = А. 3. Постройте такую квадратную матрицу третьего порядка С, чтобы для любой квадратной матрицы третьего порядка А было справедливо ра¬ венство СА = ЗА. 4. Пусть А — (3 X 3)-матрица и пусть О — нулевая матрица: /О 0 0\ 0 = 10 О О I. \0 О О/ Проверьте, что АО = ОА = О при любой матрице Л. Покажите также, что Л + 0 = 0 + Л= Л при любом Л. 5. Докажите, что /О 0 0\ /О' при любом трехмерном векторе-столбце х. 6. Докажите, что /О 0 Од и I О О О I = (О О 0) \о о о/ ..для любого 3-мерного вектора-строки и. 7 т-, ,/00\ г, / ^ 0 \ / 0 б \ _ '• Покажите, что если Л = ^ ^ j и £ = ^ 0 /.'’ Т° ~ \ q О ким образом, произведение двух матриц может быть нулевой матрицей, даже если ни одна из перемножаемых матриц не является нулевой ма¬ трицей. Найдите другой пример, иллюстрирующий го--же/обстоятельство.
284 Гл. V. Векторы и матрицы 8. Известно, что умножение матриц подчиняется приведенным ниже алгебра^ ческим законам. (Мы каждый раз предполагаем, что размеры матриц таковы, что все перечисленные операции имеют смысл.) (1) (А + В)С = АС + ВС, (2) А(В + С) = АВ + АС, (3) (сА)В = с(АВ) = А(сВ), (4) А (ВС) = (АВ) С (ассоциативный закон для умножения матриц). Убедитесь в справедливости этих утверждений на примере следующих квадратных матриц 2-го порядка: и: :)• -с -1)- м; Л) и числа с = 1/2. 9. Проверьте ассоциативный закон для умножения матриц на примере: . /—1 0 5ч „ А-( 7 -2 о)’ 10. Рассмотрим матрицы С = 1 1 1 2 2 2 3 3 3 ООО С = D = Эти матрицы имеют размеры 2X3, 4X3, 3X3 и 3X2 соответственно. Определите размеры следующих матриц: (a) АС. (b) DA, (c) AD, (d) ВС, (e) СВ, (f) DAC, (g) BCDA. [Отв.: 4X3.] 11. В условиях упр. 10 найдите: (a) компоненту, стоящую во второй строке и втором столбце матрицы АС; [Отв.: 40.] (b) компоненту, стоящую в четвертой строке и пятом столбце матрицы ВС; (c) компоненту, стоящую в последней строке и последнем столбце ма¬ трицы DA; [Отв.: 58.] (d) компоненту, стоящую в первой строке и первом столбце матрицы СВ* 12. Если А — квадратная матрица, то ее можно умножать саму на себя; следовательно, мы можем определить (используя ассоциативный закон) А2 = А • А, А* = А2 • А = А • А • А, Ап __ ап 1. А = А • А ... А (п сомножителей).
§ 4. Сложение и умножение матриц 285 Эти матрицы естественно называть «степенями» матрицы А, первую из них — квадратом, вторую — кубом и т. д. Вычислите указанные степени следующих матриц: / 1 0\ (a) А = I \ \ найдите А2, А3 и А4. 1б); (й в*)' (ж ж)'] (b) / и О — матрицы, определенные в упр. 2 и 4; найдите /2, /3, /п, О2, О3 и Оп. °\ найдите А2, Л3 и Л". (d) А = ^ | j j ; найдите Лл. 13. Возведите в куб матрицу / о Сравните полученный ответ с матрицей примера 1 § 15 гл. IV и объ¬ ясните этот результат. 14. Рассмотрим марковский процесс с двумя состояниями и матрицей веро¬ ятностей перехода > __ / Ри Р12 \ \ Р2\ Р22 / Р21 Р22 - (a) Предположив, что этот процесс начинается из состояния 1, постройте дерево, отвечающее трем стадиям процесса, и определите вероятност¬ ную меру. Сделайте то же самое в предположении, что процесс на¬ чинается из состояния 2. (b) Используя деревья, построенные в п. (а), найдите величины р\3, Р*\2' Р2\ и Р22' Выпишите матрицу Р^3К (c) Найдите куб Р3 матрицы Р. (d) Сравните ответы, полученные в п. (Ь) и (с), и покажите, что рХз) _ рз 15. Покажите, что все степени матрицы /010 0 0 1 \ 1 10 начиная с пятой, содержат одни положительные элементы. Покажите, что этим свойством не обладает никакая меньшая степень той же ма¬ трицы.
286 Г л. V. Векторы и матрицы 16. Пусть в примере 1 § 3 наряду с покупкой ценой сырья подрядчик хочет учесть также цену перевозки сырья к строительному участку. Предполо. жим, что эти цены задаются следующей матрицей Q: Продажная цена Транспорт 15 4,5 ' Сталь 8 2 ■ Лес 0 = 5 3 Стекло 1 0,5 Краска 10 0 . Рабочая В условиях этого примера: (a) вычислив произведение RQ, найдите (3 X 2)-матрицу, элементы которой представляют собой покупные цены и' цены перевозки ма¬ териалов для каждого типа домов; (b) найдите произведение xRQ, являющееся двухкомпонентным вектором- строкой, первая компонента которого дает общую покупную стои¬ мость, а вторая компонента дает общую стоимость перевозки; (c) Пусть Вычислите xRQz, т. е. общую стоимость материалов и перевозки для всех подлежащих постройке домов. [Отв.: 14 304 доллара ] 17. Пусть в одном учебном заведении зачеты, сдаваемые студентами, распре¬ деляются следующим образом: первокурсники сдают в течение года один зачет по дисциплине естественно-научного цикла и один зачет по дисци¬ плине математического цикла; второкурсники сдают один зачет по дисци¬ плине естественно-научного цикла, три зачета по дисциплинам математи¬ ческого цикла и один зачет по бихевиористской дисциплине1); каждый студент третьего курса сдает три зачета по дисциплинам естественно-на¬ учного цикла, два зачета по дисциплинам математического цикла и два зачета по бихевиористским дисциплинам; наконец, каждый студент по¬ следнего — четвертого — курса сдает три зачета по бихевиористским дисциплинам. Известно, кроме того, что каждый зачет по дисциплинам естественно-научного цикла требует изучения трех книг, выступления с двумя докладами, выполнения двух домашних заданий и одной кон¬ трольной работы; каждый зачет по дисциплине математического цикла требует изучения пяти книг, .выступления с четырьмя докладами, выпол¬ нения одной домашней работы и трех контрольных работ; каждый зачет по бихевиористской дисциплине требует изучения одной книги, выступ¬ ления с четырьмя докладами и выполнения четырех контрольных работ; кроме того, мы полагаем, что изучение каждой книги требует 50 часов работы, подготовка к докладу (и выступление с ним) — 15 часов, выпол¬ нение домашней работы—10 часов, подготовка к контрольной работе и ее выполнение — 5 часов (все эти данные, разумеется, являются довольно фантастическими). Предполагая, что в учебном заведении имеется 500 первокурсников, 400 второкурсников, 300 третьекурсников и 200 выпуск¬ ников: ]) См подстрочное примечание на стр. 11.
§ 5. Системы линейных уравнений 287 (a) найдите общее число зачетов, сдаваемых в течение года по дисци¬ плинам естественно-научного цикла, математического цикла и по бихе¬ виористским дисциплинам; (b) найдите общее число условий разного вида (число изученных книг, прочитанных докладов, выполненных заданий и контрольных работ), необходимых для сдачи зачетов всеми студентами; (c) найдите количество часов работы, необходимое для сдачи зачета по дисциплине естественно-научного цикла, математического никла и по бихевиористской дисциплине; (с!) двумя способами найдите общее число часов, затрачиваемое за год на учебу всеми студентами. § 5. СИСТЕМЫ ЛИНЕЙНЫХ УРАВНЕНИЙ В этом параграфе мы разовьем эффективный общий метод, позволяющий определять, имеет ли данная система линейных уравнений по крайней мере одно (общее) решение, и вычислять все возможные решения, если только они существуют. Метод, о котором мы собираемся рассказать, пригоден для произволь¬ ной системы линейных уравнений и удобен как при расчетах вручную, так и при вычислениях, производимых с помощью вы¬ числительной техники. Линейное уравнение а1х1+а2х2 + ... +апхп = мы запишем в следующем виде: (av а2, ..., ап) x = w, 'Х\ 4 : W где х - х2 Хп — вектор-столбец, или в еще более сжатой форме, обозначая через и вектор-строку (а\, а2, . . . , а (1) их = W. Э.то уравнение представляет собой предикат в смысле § 4 гл. II. Пространство логических возможностей для этого предиката со¬ стоит из всевозможных /т-мерных векторов-столбцов, а множе¬ ство истинности (которое в геометрии иногда называют геоме¬ трическим местом) уравнения (1) состоит из всех решений этого Уравнения. При п = 2 множество всех решений этого уравнения называется прямой, при п = 3 — плоскостью и при п> 3 — ги¬ пер-плоскостью.
288 Гл. V. Векторы и матрицы Рассмотрим теперь систему линейных уравнений u1x = wl, ^2) U2X = W2, ■ ятх = wm. Здесь у нас есть m предикатов. Обозначим множество истинно¬ сти каждого из них соответственно через Si, S2, . . . , Sm. Теперь если нам надо найти общие решения для этой системы, то нам нужно просто построить множество истинности для конъюнкции всех этих предикатов. Как было показано в гл. II, для этого нужно построить пересечение 5 = 5!П52п5зП ••• П5т множеств истинности отдельных предикатов. В связи с тем что нам нужно определить множество истинно* сти конъюнкции всех этих высказываний (уравнений), в системе (2) мы можем заменять эти высказывания другими, конъюнкция которых эквивалентна конъюнкции первоначальных высказыва¬ ний. Другими словами, мы можем заменить эти высказывания такими, которые не изменят множество истинности их конъюнк¬ ции. Метод решения системы линейных уравнений, который мы собираемся изложить, заключается в следующем. Шаг за ша¬ гом мы будем заменять одну систему предикатов другой, экви¬ валентной ей системой с тем, чтобы после конечного числа ша¬ гов прийти к такой системе, множество истинности которой является очевидным. Это множество истинности должно пол¬ ностью совпадать с множеством истинности исходной системы и может быть (а) пустым, если система уравнений не имеет общих решений; (Ь) содержать единственный элемент, если решение системы уравнений является единственным, или (с) содержать бесконечное множество решений. Приведенные ниже примеры демонстрируют каждую из этих возможностей. Мы будем развивать этот метод прежде всего на конкретных примерах. Рассмотренная в примере 1 система имеет единствен¬ ное решение, рассмотренная в примере 2 система — бесконечное множество решений, а рассмотренная в примере 3 система реше¬ ний не имеет вовсе. Перечисленные здесь три ситуации являются единственно возможными, поскольку (как мы увидим в даль¬ нейшем) из существования двух различных решений системы линейных уравнений следует и существование бесконечного мно¬ жества ее решений.
§ 5. Системы линейных уравнений 289 Пример 1. Рассмотрим следующие три линейных урав¬ нения с тремя неизвестными: Эти уравнения можно записать в следующей форме: Одно из достоинств векторных и матричных обозначений заключается в том, чго с их помощью можно записать большое число линейных уравнений в виде одного простого уравнения, подобного только что написанному. Решать нашу систему линейных уравнений мы будем следующим методом. Сначала исключим переменную Х\ из уравнений (2) и (3), воспользовавшись для этого уравне¬ нием (1), для чего из (3) вычтем (1), а из (2) вычтем (1), предварительно умножив его на 2; в результате получим: на — 3, получим: х2 -3 х* = - • Воспользуемся этим уравнением для исключения х2 из двух других уравнений. Для этого умножим его на 4 и вычтем из (Р), а также ум¬ ножим на 7 и сложим с (3'); мы получим: о) (2) (3) Х\ + 4*2 -|- З*3 = 1, 2*i -j- 5*2 -1- 4*з = 4, *1 — 3*2 — 2*3 = 5. ихх = 1, и2х = 4, и3х = 5, (У) (20 (30 ОТ (2") (З'О I Л I 1 _ И *1 + 0 + у *3 — у , *2+ з *3- - у, 19 За к. 609
290 Г л. V. Векторы и матрицы Наконец, разделим (3") на —-д-, т. е. на коэффициент при *3, и придем к уравнению х3 = 2; воспользуемся им для исключения Хз из первых двух уравнений: (Г") ^ + 0 + 0 = 3, (2'") *2+0 = -2, (3"0 *3 = 2. Из этих уравнений сразу видно искомое решение: Х\ = 3, х2 = —2 и х3 = 2. Для проверки правильности ре¬ шения читатель должен подставить эти значения в перво¬ начальные уравнения (1), (2), (3). Пример 2. Рассмотрим следующую систему: (4) хг — 2*2 — 3*з = 2, (5) *i — 4*2 13*з — 14» (6) — 3*i +- 5*2 +■ 4*з = 0. Как и в предыдущем примере, воспользуемся первым из этих уравнений для исключения переменной х\ из двух дру¬ гих уравнений. Имеем: (40 *! — 2*2 — З*3 = 2, (50 —2*2 — 10*з= 12, (60 — *2 — 5*3 = 6. Действуя, как и раньше, разделим уравнение (50 на —2 и получим уравнение х2 + 5х3 = —6. Воспользуемся им для исключения переменной л:2 из двух других уравнений, а именно умножим его на 2 и сложим с (40, после чего сложим его с (60: (4'0 + + 0 + 7*з = — 10, (5'0 *2 5*з = — 6, (6'0 0 = 0. Обратим внимание на то, что мы полностью исключили по¬ следнее уравнение. Кроме того, мы видим, что переменной л:3 в этих уравнениях можно придать какое угодно значе¬ ние. Чтобы подчеркнуть это, перенесем члены, содержащие *3, в правую часть: (4'") *, = - Ю-7*з, (5 ) *2 = 6 5*3.
§ 5. Системы линейных уравнений 291 Читатель должен проверить, подставляя полученные значе¬ ния Х\ и Х2 в уравнения (4), (5) и (6), что они являются решением при любом *3. Чтобы получить числовое решение, нужно подставить вместо х3 какое-нибудь число. Так, если мы положим *з=1, 0, —2 и произведем вычисления по формулам (4) и (5), то получим соответственно следующие числовые решения: Читателю рекомендуется подставить все эти числа в (4), (5) и (6) для проверки того, что они образуют решение. Итак, система уравнений в нашем втором примере имеет бесконечное множество решений, соответствующих разным числовым значениям *3 в уравнениях (4///) и (б'"). Пример 3. Изменим уравнение (6), поставив в его пра¬ вой части вместо числа 0 число 2. Будем иметь: Выполнив прежнюю процедуру исключения Х\ из (8) и (9) посредством (7), мы получим: Разделив (8') на —2 (коэффициент при *2), получим, как и раньше, *2 + 5*з = —6. Воспользовавшись этим уравне¬ нием для исключения х2 из двух других уравнений, будем иметь: Мы видим, что последнее уравнение заведомо ложно. Так как наша процедура исключения неизвестных привела к ложному результату, мы приходим к выводу, что система уравнений (7), (8), (9) не имеет решения. Читатель дол¬ жен всегда иметь в виду эту возможность при рассмотре¬ нии системы уравнений, Хх = — \7, х2 =— 11, X'S = 1, хг = — 10, х2 == — 6, хъ = О, Xi= 4 х2 — 4, лг3 = — 2. (7) (В) (9) (70 (80 (90 х, — 2х2 — Зл3 — 2, — 2х2— 10х3= 12, — х2— 5л:3= 8. (7") (80 (90 •*i Ч- О-f- 7л:3 — — 10, х2 5л;3 = — 6, 0= 2. 19*
292 Гл. V. Векторы и матрицы В этих примерах число неизвестных было равно числу урав¬ нений. В следующем примере число уравнений меньше числа неизвестных, а в последнем примере — больше. Пример 4. Рассмотрим такие два уравнения с тремя не¬ известными: Используя описанный выше метод исключения, разделим (10) на —4, умножим результат на 5 и вычтем из (И), что даст: Умножим (11') на —3 и сложим с (10'), после чего умно¬ жим (IP) на —4. Тогда будем иметь: Мы можем теперь, придавая хъ любое значение, разрешить эти уравнения относительно Х\ и х2. Чтобы подчеркнуть этот факт, перепишем их, следуя схеме, использованной в примере 2, так: Читатель должен произвести проверку, а также найти чис¬ ленное решение этой системы, выбирая частные значения для *3. Пример 5. Пример 4 наводит нас на мысль о возможно- С1й еще одного случая, когда число уравнений больше чи¬ сла неизвестных. Рассмотрим следующую систему: (10) (11) — Ах\ —I- 3^2 “-j- 2х3 — — 2, 5xi — 4^2 Ч~ == 3. (ЮО з Х\ ~4 Х2 2 хз — 2 ’ 7 1 2 ' (11') (Ю") (11") Xi —0 — 11лг3 — — 1, х2— \4х3 = — 2. (Ю"0 (Щ *1 = 11*3— 1, х2— 14х3— 2. (12) (13) (14) — 4xi —|— Зх2 — 2, 5Х[ 4х2 — О» 2хг — х2 = а,
§ 5. Системы линейных уравнений 293 где а — произвольное число. Воспользовавшись уравнением (12) для исключения хх из двух других уравнений, мы по¬ лучим: (12') хх — = (130 -4*2= 4 (14') ~2 х2 — а -Ь 1 • Затем воспользуемся (13') для исключения х2 из осталь¬ ных уравнений, что даст (12//) Xi —f- 0 = — 8, (13") jc2 = —10, (14") 0 = а + б‘ Эти уравнения напоминают случай, с которым мы встрети¬ лись в примере 3, поскольку в случае, если не будет выпол¬ нено условие а = —6, мы придем к ложному результату. Мы видим, что система уравнений (12), (13) и (14) имеет решение х\ = —8 и х2 = —10, если а = —6. Если же а ф —б, то система уравнений не имеет решения. Рассмотренные примеры иллюстрируют все возможности, ко¬ торые могут встретиться в общем случае. Система уравнений мо¬ жет не иметь ни одного решения, может иметь в точности одно решение и может иметь бесконечное число решений. Использованная нами процедура позволяет преобразовать любую систему линейных уравнений в такую эквивалентную ис¬ ходной систему уравнений, для которой уже легко решить во¬ прос как о существовании решений, так и об их вычислении. Чи¬ татель, знакомый с другими способами решения систем линей¬ ных уравнений, может задать вопрос: почему мы воспользова¬ лись именно этой процедурой, которая вовсе не всегда приво¬ дит к решению кратчайшим путем? Ответ на этот вопрос заклю¬ чается в следующем: мы воспользовались ею, потому что она Действенна во всех случаях, т. е. является канонической проце¬ дурой, применимой к любой системе линейных уравнений. Более быстрые методы обычно применимы лишь к таким системам Уравнений, для которых существуют решения, и даже в этом случае они могут не приводить к нахождению всех решений. А значение надежного стандартного метода, в особенности при вычислениях, использующих современные счетные машины, труд¬ но переоценить.
294 Гл. V. Векторы и матрицы Упражнения 1. Найдите все решения следующих систем уравнений: (a) ( 4х j -J- 5х3 = 6, { х2 — 6х3 = — 2, ( Зх, + 4х3 = 3; [Отв.: хх = 9, х2 — — 38, х3 = — 6.] (b) j’ Зхj — х2 — 2х3 = 2, { 2х2 — х3 = —1, { 2>Х\—5х2 =3; [Отв.: Решений нет.] (c) J" — Х\ -f- 2х2 -J- Зх3 = О, { хх — 4х2 — 13х3 = О, { —3^1-f-5^2+ 4х3 = О. [Отв.: х, =— 7х3, х2 =— 5х3.] 2. Найдите все. решения следующих систем уравнений: (a) j' X]-j-x2-b *з = { 2х1 + 4х2 Зх3 = О, I 4х2 -)- 4х3 = 0; (b) ^ х,-|- х2-j~ х3 =— 2, { 2х, -f- 4х2 Зх3 = 3, I 4х2 ~г 2х3 = 2; (c) f 4хх + 4х3 = 8, { х2 — 6х3 == — 3, [ 3xj —j— х2 — Зх3 = 3. 3. Найдите числа хи х2 и х3, которые служат решением системы уравнений, указанной в упр. 1 (с), и одновременно удовлетворяют следующему нелинейному уравнению: х\ (2*2 — 5*з) = 1- 4. Найдите все решения следующих систем уравнений: i (a) f 5xj — Зх2 = — 7, { — 2ж, + 9лг2 = 4. г 17 2 1 { 2х,+4х2 = — 2; [Отв.. лг, _ 13 > *2 - 13 -J (b) -*i + 2х2 = 1, { —3.*!-|-2х2 = — 2, 1 2xj + Зх2 = 1; [О/тгб,: Решений нет.] (c) | 5xj—Зх2— 7х3 + х4 = 10, ^ — хх —j— 2х2 -j- 6х3 — ЗХ4 = — 3, I Xj -f~ *г ~b 4x^— 5X4=0.
§ 5. Системы линейных уравнений 295 5. Покажите, что система уравнений ( — 4х} + Зх2 + ах з = с, \ 5xi — 4х2 + Ьх з = d имеет решение при любых значениях а, Ь, с и d. 6. Какое условие нужно наложить на а, b и с, чтобы система уравнений — 4хх + Зх2 = л, 5л:, — 4х2 = Ь, — Зх\ + 2лг2 = с имела решение. 7. (а) Пусть х = (ль х2) и пусть А означает матрицу /3 —4\ "=(2 -с)- [Отв.: 2а + b = с.] [Отв.: х = (0,0).] Найдите все решения уравнения хА = х. (Ь) Пусть х = (лгь х2) и А означает матрицу 4J _.*)■ Найдите все решения уравнения хА = х. [Отв.: х— (k,k), где k — любое число.) 8. Пусть х = (*ь а2) и Р означает матрицу I 1 р = I 3 3 (a) Найдите все решения уравнения хР = х. (b) Укажите решение, для которого Х\ -f х2 = 1. 9. Пусть х = (ль х2, х3) и А означает матрицу Iх ~2 4 А--=\ 0 5 4 I \ 0 —6 —4/ Найдите все решения уравнения хА = х. 5 I* -к 2 4 • |^Отв.: л: = ^ Ю. Пусть х ={хих2,х2) и Я означает матрицу 1 1 Р = 2 4 3 4-0 4 где k — любое число. Найдите все решения уравнения хР = х. Укажите единственное решение, Для которого Х\ + х2 + A3 = 1,
296 Гл. V. Векторы и матрицы 11. Найдите все решения системы *! -f 2х2 + З*3 4*4 = 10, 2* j *2 4” Х3 Х4 === 1» 3* j 4“ Х2 ~I- 4*3 4- 3*4 == 11, — 2*1 4~ 6*2 + 4*3 4- 10*4 = 18. 19 12. Допустим, что мы закупаем три вида пищевых продуктов. В продукте I содержится одна единица витамина А, три единицы витамина В и четыре единицы витамина С. В продукте II содержатся соответственно две, три и пять единиц этих витаминов. В продукте III содержится по три еди¬ ницы витаминов А и С, а витамин В отсутствует. Нам нужно имен, 11 единиц витамина А, 9 единиц витамина В и 20 единиц витамина С. (a) Найдите все возможные комбинации количеств этих трех продуктов, которые обеспечивают нас требуемым количеством витаминов. (b) Если единица продукта I стоит 60 центов, а единица каждого из остальных продуктов стоит 10 центов, то существует ли решение, при котором требуемое количество продуктов стоит ровно 1 доллар? Если А — квадратная матрица и В — другая квадратная мат¬ рица того же порядка, обладающая тем свойством, что АВ = I (где I — единичная матрица), то В называется матри¬ цей, обратной к А. Матрица, обратная к А, если она существует, обозначается символом А~х. Чтобы получить числовой пример, рассмотрим следующие матрицы А и Л-1: [Отв.: Да; 1, 2, 2.j § 6. ОБРАТНАЯ МАТРИЦА Тогда Если перемножить эти матрицы в другом порядке, то в резуль¬ тате снова получится единичная матрица:
§ 6. Обратная матрица 297 Можно показать, что и в общем случае если А— квадратная матрица, и А-1— обратная ей матрица, то А~'А = АА~' = 1. Легко видеть, что квадратная матрица может иметь только одну обратную. В самом деле, пусть, кроме Л-1, имеется еще матрица В, такая, что ВА = /. Тогда мы имеем В = В1 = В (АА-1) = (ВА) А~1 = М"1 = АТ1- Нахождение обратной матрицы аналогично нахождению об¬ ратного для данного числа. Однако эта аналогия не является полной. Для каждого числа, отличного от нуля, имеется обрат¬ ное к нему число, в то время как существуют ненулевые мат¬ рицы, для которых не существует обратных. Например, если ( 1 —1\ /11 А = \-Х l) " в = (, 1 то 1 —1\ /1 1\ /О О лв \-1 1/Д1 \) \0 о/ °* Отсюда следует, что ни Л, ни В не могут иметь обратной мат¬ рицы. Чтобы доказать это, предположим, что для Л существует обратная матрица А~1. Тогда В = (А~'А)В = А~' (АВ) = А~Х 0 = 0, что противоречит условию В Ф О. Аналогично доказывается, что не существует матрицы, обратной к В. Попытаемся вычислить матрицу, обратную к (2 X 2)-матрице Л, т. е. найдем, каким условиям должна удовлетворять матрица В, чтобы выполнялось равенство ВА = /. Допустим, что 1 0\ (bu Ь12\ (аи аХ2 .0 1 ] \ Ъ2Х b22 J \ #21 #22 ^иап ~f ^12^21 Ь\\а\ч “Ь Ь{2а22 , ^2\ап ^22а2\ ^2\а\2 ^22а22 , Для выполнения этих равенств необходимо, чтобы удовлетво¬ рялись следующие уравнения: (1) ^11#11 —Ь ^12^21 = 1 * (2) ^11 #12 Н“ ^\2а22 = 0» (3) ^21^11 Н- ^22^21 = 0, (4) b2ldi2 -|- b22a22 = 1.
298 Гл. V. Векторы и матрицы В этих уравнениях числа b должны рассматриваться как неиз¬ вестные, а числа а как коэффициенты. Неизвестные Ьи и 612 входят только в уравнения (1) и (2), а неизвестные Ь2\ и Ь22 — только в уравнения (3) и (4). Чтобы исключить неизвестное Ь12 из уравнений (1) и (2),. умножим уравнение (1) на а22, а урав¬ нение (2) на а2ь что даст нам ^11#11#22 Ч" ^12#21#22 = #22» b\\d\2CL2\ -f- ^12^22^21 = О- Вычитая второе уравнение из первого, получим: Ь11 (#ц#22 #i2#2l) ~ #22• Если коэффициент при Ьи в этом уравнении не равен нулю, то можно разделить на него обе части и получить 6ц в виде: Ьп = CLn ^11^22 ^2 1 ^ 12 Аналогичным образом и остальные неизвестные можно выразить посредством формул: Д1 1^22 #21^1 Ь2\ — ^22 ~ ДI 1^22 а2\а\2 Дм #1 1^22 ^21^19 Отметим, что знаменатель во всех последних формулах один и тот же. Эта величина является настолько важной, что ей дали специальное название — определитель матрицы А. Определитель матрицы А записывается так: |Л| = а п а12 #21 #22 — #11#22 — #i9&< 12^21 • Таким образом, для обозначения определителя используются прямые вертикальные линии, тогда как матрица обозначается посредством круглых скобок. Вот числовые примеры определителей: 1 2 3 4 1 -1 — 1 1 = 4 — 6 = —2, = 1 — 1=0.
§ 6. Обратная матрица 299 IAы ввели понятие определителя только для (2 X 2)-матриц. Можно распространить его и на случай квадратных матриц бо¬ лее высокого порядка, но мы этим заниматься не будем. Заметим, что мы можем находить обратную матрицу лишь в случае, когда определитель заданной (2 X 2)-матрицы не равен нулю. Используя полученные выше формулы, мы находим, что обратной к матрице лю, поэтому рассмотренные выше уравнения не могут быть ре¬ шены и для этой матрицы не существует обратной. Аналогичное обстоятельство справедливо и в общем случае, так что может быть высказана следующая Теорема. Для того чтобы квадратная матрица имела об¬ ратную, необходимо и достаточно, чтобы определитель этой мат¬ рицы был отличен от нуля. Эта теорема верна также для квадратных матриц более вы¬ сокого порядка, но мы ее доказывать не будем. является матрица (- 2 1 А= А _ _L • 2 2 . Для проверки этого достаточно умножить А на А~х: С другой стороны, определитель равен ну- Упражнения 1. Найдите определители следующих матриц: (а) / 1 6 \. (е) / 2 —3
300 Гл. V. Векторы и матрицы 2. Для матриц, выписанных в упр. 1, найдите обратные матрицы в тех слу¬ чаях, когда это возможно. Проверьте правильность ваших вычислении. 3. Пусть Л — квадратная матрица, имеющая обратную. Покажите, что реше¬ нием уравнения Ах = b является х = А~1Ь. 4. Используя результат упр. 3, решите систему уравнений хх + 2х2 = 1, Зл:, 4х2 = 2. (Указание. Обратная матрица была ■ найдена в тексте этого параграфа.) х] = 0, х2 = ~ . 5. Пусть А — одна из матриц упр. 1 и пусть ЛГ = (^1)и^==(з^* Используя обратные матрицы, найденные (в тех случаях, когда они существуют) в упр. 2, решите уравнение Ах = b (см упр. 3). 6. Пусть аЬ — сйфО. Найдите матрицу, обратную к 7. Пусть А — матрица из упр. 6 и пусть с :)• [ пусть Ж) ■ '-(*)■ Используя обратную матрицу, найденную в упр. 6, решите систему Ax = f. 8. Пусть А — квадратная матрица, имеющая обратную Л-1; покажите, что матрицей, обратной к Л2, является матрица [Л-1]2 = Л“2. Покажите, что матрицей, обратной к Ап, является [Л-1]л = А~п. 9. Решите систему уравнений: 4х -f 5<г = 7, у — 6г = 2, Зх -f- 4z = — 1, записав ее в виде Ах = b и воспользовавшись обратной к Л матрицей, найденной в начале параграфа (см. упр. 3). [Отв.: х = 33, у = —148, z = —25.] 10. (a.) Докажите следующее тождество: b \ ( е f\ ht с ж о а b * / с d g h (Ь) Покажите на примере, что определитель суммы двух матриц не обя¬ зан быть равен сумме определителей этих матриц. 11. Используя результат упр. 10 (а), покажите, что определитель произведе¬ ния двух матриц может быть равен нулю только в том случае, если по крайней мере у одной из этих матриц определитель равен нулю. 12. Пусть Л и В — матрицы порядка пу имеющие обратные: (а) используя упр. 11, докажите, что матрица АВ имеет обратную. (d) выразите матрицу, обратную к АВ, через Л-1 и В~1.
§ 7. Применение теории матриц к марковским цепям 301 § % ПРИМЕНЕНИЕ ТЕОРИИ МАТРИЦ К МАРКОВСКИМ ЦЕПЯМ Для простоты мы ограничимся рассмотрением марковских цепей с тремя состояниями, хотя аналогичная процедура будет годиться для любой марковской цепи. В § 15 гл. IV мы видели, что каждой марковской цепи соот¬ ветствует матрица вероятностей перехода. Например, в случае трех состояний а2 и а3 эта матрица имеет вид: Напомним, что сумма элементов каждой строки матрицы Р рав¬ на 1. Такая матрица называется стохастической. Определение. Квадратная матрица называется стохасти¬ ческой, если все ее элементы неотрицательны и сумма элементов каждой строки равна 1. Чтобы получить марковскую цепь, нужно еще определить, с какого состояния начинается процесс. Предположим, что началь¬ ное состояние выбирается посредством некоторого случайного выбора, дающего состояние а;- с вероятностью/^. Эти началь¬ ные вероятности могут быть записаны в виде вектора р(0) — — Р2]> Рг]У Как и в упр. 14 § 4, мы можем построить меру дерева для какого угодно числа шагов. Пусть pW—вероятность того, что процесс перейдет в состояние а;- через п шагов. Эти ве¬ роятности мы запишем в виде вектора р{п) = (р[п)> р2п\ Р(гп)У Определение. Вектор-строку р назовем вероятностным вектором, если все его компоненты неотрицательны и их сумма равна 1. Очевидно, р(0) и р<п)— вероятностные векторы. Вероятност¬ ным вектором является также любая строка стохастической мат¬ рицы. В общем случае для того, чтобы полностью определить марковскую цепь с г возможными состояниями, нужно задать некоторую стохастическую квадратную матрицу r-го порядка — матрицу вероятностей перехода и некоторый вероятностный ''-мерный вектор — начальное состояние цепи (если это начальное состояние фиксировано, то одна из компонент соответствующего вектора равна 1, а остальные равны 0). Располагая этой инфор¬ мацией, мы можем построить дерево, задающее пространство логических возможностей для первых п шагов цепи (это дерево а1 а<£ аъ
302 Гл. V. Векторы и матрицы будет иметь п уровней). Обозначим через fj j-ю функцию! исхо¬ да. Наше дерево описывают п функций исхода fx, Пусть теперь нас интересуют какие-то вопросы, касающиеся исхода п-го шага. В этом случае на множестве 21-—\ах, а2, . . .,аг) исходов соответствующего процесса можно построить следую¬ щую весовую функцию: P"4a;) = P[fn = aj]=P(f- Через р(/г) мы обозначим вектор р{п) = (р\п), pf\ р{;г)у Пример 1. В § 8 гл. IV мы описывали погоду на Земле Оз как марковскую цепь. Состояниями этой марковской цепи были дождь, ясная погода и снег. Матрица вероятно¬ стей перехода выглядела следующим образом: д я С Д1 Г/ 2 v4 V4 я ( V2 0 V2 с Ч V 4 V2 Предположим, что мы начинаем с ясного дня. Рассмо¬ трим процесс для первых трех шагов. В этом случае мы получим дерево и меру на нем в том виде, как это изобра¬ жено на фиг. 115 (ср. с фиг. 96, стр. 214). Для этого дерева и соответствующей ему вероятностной меры можно найти компоненты векторов р{1), р{2\ р^К На¬ пример, определим /?(3) (Д), другими словами, определим ве¬ роятность дождя на 3-й день. Пути, принадлежащие мно¬ жеству истинности этого высказывания, помечены на фиг. 115 кружками в концах этих путей. Складывая веса этих путей, получим (Д) = Р [/з = Д] = -g + yg -f ^ + ye + Тб + Тб = 32 ’ Точно так же, используя вероятностную меру, приписан¬ ную нашему дереву, можно определить и другие компонен¬ ты векторов р[1)у р{2), р{3). Таким образом, мы получим р{1) = ( Ч» о, 1/2), р{2)=(% % 3/8), Р(3)=(13/32. 6/з2’ 13/32).
§ 7. Применение теории матриц к марковским цепям 303 ИсЬользуя меру дерева, можно показать, что наши вероятно сти удовлетворяют следующим условиям: рМ=р?-»ри +P{2n-l)P2l+Pin-l)Pav pin) =pin-l)p^ + p^-Up22 _(_ p(n-np3v Р{Г1)Рп+Р(2~1)Р2Ъ + Р'Г1)РзЗ- Р(зП) Легко понять смысл этих условий. Первое из них, например, вы¬ ражает тот факт, что вероятность перехода в состояние а{ через п W(X) Гг(х) f3(x) 1/8 д п а - я 1/16 л д я » с 1/16 а д с -© и 16 д я д * с 1/16 а я с 1/3? д с д - я 1/32 д с я - с 1/16 д с с -® 1/16 с л д - я 1/32 с д я - с 1/32 с д с ~® 1/16 с я д - с 1/16 с я с -® 1/16 с с д - я 1/16 с G я -5 1/8 с с с шагов является суммой вероятностей перехода в каждое из трех возможных состояний через п—1 шагов и последующего пере¬ хода в состояние а\ на п-м шаге. Аналогично интерпретируются и остальные условия. Вспомнив определение умножения вектора на матрицу, мы Можем записать эти условия в виде одного равенства pW = pW-Vp,
304 Г л. V. Векторы и патрицы Подставляя вместо п числа 1, 2, 3 .. ., мы получаем равенства: /7(1) =р0 Я; р{ 2) = р{\) р = р{0) ръ р{ 3) =р(2)р=рф)р$ и т. д. В общем случае справедливо равенство р{п _ рф)р*ш Итак, мы видим, что если вектор, начальных вероятностей /?(°) умножить на п-ю степень матрицы вероятностей перехода Р, то получится вектор р{п\ компонентами которого являются ве¬ роятности перехода в каждое из трех состояний через п шагов. Допустим, например, что р{0) = (1, 0, 0); это равносильно предположению, что процесс начинается из состояния а\. Из предыдущего равенства видно, что в таком случае р(п) будет первой строкой матрицы Рп. Следовательно, элементы первой строки матрицы Рп дают нам для каждого из состояний вероят¬ ность того, что через п шагов процесс перейдет в это состояние в предположении, что начальным состоянием было а\. Точно так же, если взять р(0) = (0, 1, 0), то мы заключим, что вторая стро¬ ка матрицы Рп указывает вероятности того, что процесс перейдет в одно из заданных состояний через п шагов при условии, что начальным было состояние а2. Аналогично третья строка даег эти вероятности при условии, что начальным состоянием процес¬ са было аъ. В § 15 гл. IV мы рассматривали конкретные марковские цепи, начинавшиеся с данных фиксированных состояний. Там мы при¬ шли к матрице Р{П)' i-я строка которой давала вероятности окончания процесса в различных состояниях при условии на¬ чального состояния а,-. Сравнивая эти рассмотрения с только что проведенными, мы видим, что матрица Р{п) является просто п-й степенью матрицы Р, т. е. Р'п) = Рп. (Ср. с упр. 13 и 14 из § 4.) Таким образом, умножение матриц дает удобный способ для вычисления требуемых вероятностей. Равенство р^=р^п~^Р допускает еще одну интересную ин¬ терпретацию. Вектор р(п) получается из вектора р{п~1) посред¬ ством преобразования, состоящего в умножении его на матрицу Р. Вектор p<n-V получается из р{п~2> посредством такого же преобразования и т. д. Обозначим это преобразование стрелкой; таким образом, мы имеем р(0) р{ 1) р(2) р(п-1) р(п) В § 11 мы покажем, что это преобразование является так на¬ зываемым линейным преобразованием множества векторов. Мы будем говорить, что это преобразование переводит вектор р(0) в вектор р(1), вектор р(1) в вектор р(2) и т. д.
§ 7. Применение теории матриц к марковским цепям 305 I Пример 1 (продолжение). В примере с Землей Оз оказалось, что ' д я с f 26 13 251 64 64 64 13 6^ 13 32 32 32 25 13 26 64 64 64 Д /»=я с Теперь мы видим, что вероятность хорошей погоды через з) 13 ~ три дня после дождя равняется р д —54- Отметим, что во второй строке стоят вероятности любой погоды через три дня после ясного дня. Эти вероятности совпадают с теми, которые были вычислены с помощью дерева логических возможностей и соответствующей вероятностной меры. Иногда можно найти вероятностный вектор t, который цри преобразовании Р переходит сам в себя, т. е. такой, что t = tP. Определение. Вероятностный вектор t называется непод¬ вижным вектором преобразования Р, если t = tP. Пример 2. Рассмотрим стохастическую матрицу ( -2 3 _1_ 2 1) 3 J_ 2 0,667 0,333 0,500 0,500 Если t = (0,6; 0,4), то мы видим, что 2_ _1_ 3 3 2 2 tP = (0,6; 0,4) = (0,6; 0,4) = t. Следовательно, t является неподвижным вектором пре¬ образования Р. Если бы мы выбрали вектор t в качестве вектора начальных вероятностейР(0), то мы имели бы р^=р^)Рп = tPn = t=p0). В этом случае вероятность перехода в любое данное состояние ^Ыла бы одной и той же на всех ступенях данного процесса. Такой процесс называется стационарным марковским процессом. Как мы видели, при изучении марковских цепей важную роль Играют степени матрицы Р. Для выяснения того, что происхо- 20 Зак. 609
306 Гл. V. Векторы и матрицы дит с этими степенями, продолжим рассмотрение нашего при¬ мера. | Пример 2 (продолжение). Вычисляя степени матрицы Ру мы находим Похоже на то, что с возрастанием п матрица Рп стремится к матрице Можно показать, что так оно и есть на самом деле. Соот¬ ветствующая ситуация будет подробнее рассмотрена в сле¬ дующем параграфе. (Когда мы говорим, что Рп стремится к Г, то это означает, что элементы матрицы Рп неограни¬ ченно приближаются к соответствующим элементам матри¬ цы Т.) Отметим, что каждая строка Т является неподвиж¬ ным вектором t матрицы Р. В заключение рассмотрим еще несколько примеров марков¬ ских процессов. Пример 3. В каждом заезде определенная лошадь вы* игрывает заезд с вероятностью 2/5, делит первое и второе место с вероятностью Vs и проигрывает заезд с вероятно¬ стью 2/б, независимо от исхода любого предыдущего заезда. В этом случае мы имеем процесс независимых испытаний, но его можно рассматривать также и с точки зрения тео¬ рии марковских цепей. Матрица вероятностей перехода в этом случае выглядит следующим образом: Пример 4. Пусть 80% сыновей выпускников Гарвард' ского университета поступают в Гарвард, а остальные в Иелл, 40% сыновей выпускников Иелльского университета поступают в Иелл, а остальные распределяются поровну между Гарвардом и Дартмутом и, наконец, 70% сыновей выпускников Дартмутского колледжа поступают в Дарг-
§ 7. Применение теории матриц к марковским цепям 307 мут, 20% в Гарвард, а 10%—в Иелл. Мы построили мар¬ ковскую цепь с матрицей вероятностей перехода гид Г /0,8 0,2 0 \ р= и I 0,3 0,4 0,3 • Д V 0,2 0,1 0,7 / Пример 5. Изменим теперь условия примера 4, предпо¬ ложив, что сын выпускника Гарварда всегда поступает в Гарвард. Тогда матрица вероятностей перехода примет вид: гид Г / 1 о о \ Я=и ( 0,3 0,4 0,3 . Д \0,2 0,1 0,7/ Пример 6. Рассмотрим частный вид модели, которая используется для объяснения явления диффузии газов. Та¬ кая модель самого общего вида будет подробно изучена в § 10. Итак, в ящике находятся три шара. У ящика имеется два отделения. Каждую секунду выбирается один из трех шаров случайным образом и перекладывается из одного отделения в другое. В качестве состояния марковской цепи рассмотрим число шаров в первом отделении. В этом слу¬ чае матрица вероятностей перехода имеет вид 0 1 2 3 0 0 1 0 0 1 Чъ 0 2/ /з 0 2 0 2/з 0 73 3 0 0 1 0 Пример 7. У животных наследование признаков имеет простейший характер в том случае, когда признак опреде¬ ляется одной парой генов, каждый член которой может быть одного из двух типов, скажем Q и g. Каждый индивидуум может обладать генами в одной из трех возможных комби¬ наций GG, gg, или Gg (что с точки зрения генетики эквива¬ лентно gG). Очень часто комбинации GG и Gg внешне не¬ 20*
308 Гл. V. Векторы и матрицы различимы и тогда мы говорим, что ген G доминирует над геном g. В этом случае индивидуум с генами GG называет¬ ся доминантным, индивидуум с генами gg называется ре¬ цессивным, а индивидуум с генами Gg — гибридом. При скрещивании двух животных их потомство наследу¬ ет по одному гену от каждого из родителей и в основу гене¬ тики кладется предположение о том, что эти гены выби¬ раются случайным, независимым друг от друга образом. Это предположение определяет вероятность появления по¬ томства каждого типа. Так, потомство двух доминантных родителей должно быть доминантным, потомство двух рецессивных родителей должно быть рецессивным, а по¬ томство одного доминантного и одного рецессивного ро¬ дителя должно быть гибридом. При скрещивании доми¬ нантного животного и гибрида их потомство должно полу¬ чить ген G от первого родителя, а от второго родителя — с вероятностью 7г ген G и с вероятностью 7г ген g. Отсюда вероятности получения либо гибридного потомства, либо доминантного потомства равны. В то же время при скре¬ щивании рецессивного родителя с гибридом вероятность получения рецессивного или гибридного потомства одинако¬ ва. При скрещивании двух гибридов их потомство с вероят¬ ностью 7г получает гены каждого типа от каждого из роди¬ телей. Поэтому вероятность получить гены GG равна 74, гены Gg— 7г и гены gg — {U- Рассмотрим теперь процесс непрерывного скрещивания. В качестве одного из родителей в самом начале мы берем индивидуум с неизвестными генетическими признаками, а в качестве второго мы берем гибрид. Потомство этой пары вновь скрещивают с гибридом и т. д. Получившийся про¬ цесс является марковской цепью. Его состояниями являют¬ ся доминантные, рецессивные индивидуумы и гибриды, что мы и будем обозначать буквами Д, Р и Г. Матрица вероятностей перехода в данном случае имеет вид д г р д /72 72 0 Р= г Vй 72 74 р \ 0 72 7а Пример 8. Изменим условие примера 7 следующим об¬ разом: вновь получившееся потомство мы будем скрещи¬ вать с доминантным животным. В этом случае матрица
§ 7. Применение теории матриц к марковским цепям 309 вероятностей перехода будет иметь вид Д Г Р Д / 1 0 0 \ Р=г1 V2 72 о . Р \ 0 1 о / Пример 9. В самом начале у нас есть два животных противоположного пола. Мы скрещиваем их, выбираем из их потомства два животных различного пола, скрещиваем их и т. Д. Для того чтобы сделать этот пример более про¬ стым, предположим, что рассматриваемый признак не за¬ висит от пола. Здесь каждое состояние процесса определяется парой животных, поэтому состояниями этого процесса являются: а, = (ДД), а2 = (ДГ), а3 = (ДР), а4 = (ГГ), а5 = (ГР) и а6 = (РР). Покажем, как вычисляются вероятности пере¬ хода на примере состояния а2. Если процесс находится в этом состоянии, то у одного из родителей имеются гены GG, а у другого Gg. Таким образом, вероятность появления до¬ минантного (соответственно гибридного) потомства равняет¬ ся 7г для каждого из потомков. Поэтому вероятность пере¬ хода в состояние а\ (вероятность выбрать двух доминант¬ ных животных) равна 74, вероятность перехода в состояние а2 равна 7г, а в состояние а4 — lU- Полная матрица вероят¬ ностей перехода в этом случае выглядит следующим обра¬ зом: а 1 CL*} «3 а4 а5 а6 «1 1 0 0 0 0 0 а2 74 72 0 % 0 0 а3 0 0 0 1 0 0 а4 7ш 74 78 74 74 Vw «5 0 0 0 74 72 74 а6 0 0 0 0 0 1 Рассмотрение этого примера будет продолжено в гл. VII. Упражнения Г На Земле Оз идет дожд. Постройте дерево и соответствующую ему ве¬ роятностную меру для погоды в течение следующих трех дней. Опреде¬ лите Р^2К Р{ъ) и сравните полученные результаты с тем, что полу¬ чится в результате возведения матрицы Р во вторую и в третью степени
310 Гл. V. Векторы и матрицы 2. Найдите Р2 и Р3 в условиях примера 3. Как будет выглядеть матрица Р'о [Отв.: Рп = р‘] 3. В условиях примера 4 определите вероятность, с которой внук выпускника Гарвардского университета поступает в Гарвард. 4. В условиях примера 5 определите вероятность того, что внук выпускника Гарвардского университета поступает в Гарвард. [Отв.. 1] 5. Пусть в условиях примера 7 мы начинаем с гибрида. Найдите р(3К Как выглядит вектор рМ? [Отв.: р№ == р(1).] 6. Найдите Р2, Р3, Р4 и Рп для марковской цепи с матрицей вероятностей перехода -и ?)• Проделайте то же самое для марковской цепи с матрицей вероятностей перехода -(? !)■ Для каждой из цепей объясните полученные результаты. 7. Вычислите первые пять степеней матрицы /0,8 0,2 \ \ 0,2 0,8/' Пользуясь ими, угадайте, каков будет неподвижный вектор L Проверьте этот результат. 8. Покажите, что все стохастические матрицы вида /1 — а а \ \ а 1 — a j где 0 < а < 1, имеют один и тот же единственный неподвижный вектор. \Оте.: / = (1, 1).] 9. В упр. 7 вычислите рР, рР2, рР3, рРА и рР5, где р = (0,7; 0,3). Сравните по¬ лученные результаты с неподвижным вектором t. 10. Найдите неподвижный вектор матрицы 5 = (од °’9). V 0,6 0,4/ Возьмите р = (0,5; 0,5) и вычислите pS, pS2 и р53. [Отв.: pS = (0,35, 0,65), pS2 = (0,425, 0,575) pS3 = (0,3875, 0,6125), t = (0,4, 0,6).] § 8*. ЭРГОДИЧЕСКИЕ МАРКОВСКИЕ ЦЕПИ Первым типом марковского процесса, который мы собираем¬ ся изучить достаточно подробно, будет регулярная марковская цепь. Определение. Марковская цепь называется регулярной, если* какая-либо степень ее матрицы вероятностей перехода не ■ содержит нулевых элементов. Очевидно, что любая матрица вероятностей перехода, не со*
§ 8*. Эргодические марковские цепи 311 держащая нулей, определяет регулярную марковскую цепь. В примере с Землей Оз нулю равнялся элемент ряя матрицы вероятностей перехода, однако уже матрица Р2 не содержала нулей, так что рассматривавшийся там процесс является регу¬ лярной марковской цепью. В качестве примера нерегулярной марковской цепи можно указать цепь с матрицей перехода Любая степень этой матрицы будет содержать 0 в правом верх¬ нем углу. Регулярность марковских цепей имеет следующий вероят¬ ностный смысл: марковская цепь является регулярной, если в некоторый момент времени мы можем оказаться в любом из состояний этой цепи независимо от начального состояния про¬ цесса. Самый простой способ проверки цепи на регулярность заключается в том, что нужно проследить, являются ли элемен¬ ты степеней матрицы перехода положительными или нет. При этом нет никакой необходимости вычислять истинные значения этих элементов. Вместо этого мы будем обозначать элемент че¬ рез х, если он отличен от нуля, и через 0 в противном случае. Пусть мы исследуем матрицу вероятностей перехода Для проверки на регулярность поступим следующим об- При исследовании на регулярность выгодно вычислять как можно более высокие степени Р. Поэтому каждый новый резуль¬ тат мы снова возводили в квадрат. Отметим теперь две важные теоремы, относящиеся к регу¬ лярным цепям. Теорема 1. Пусть Р есть матрица вероятностей перехода Регулярной цепи. Тогда: разом:
312 Г л. V. Векторы и матрицы (1) матрицы Рп сходятся к некоторой матрице Т (т. е. каж¬ дый элемент Pv стремится к соответствующему элементу Т); (2) строки матрицы Т образуют одинаковый вероятностный вектор t\ (3) все компоненты t положительны. Напомним, что элемент матрицы Рп описывает вероят¬ ность того, что процесс окажется в состоянии aj после п шагов, исходя из начального состояния а,-. Таким образом, в (1) утвер¬ ждается, что для больших п долгосрочный прогноз может быть дан раз и навсегда независимо от значений п. Другими словами, p'Pj приблизительно равно //у для всех больших п. В (2) мы утверждаем, что этот долгосрочный прогноз не зависит и от на¬ чального состояния. Другими словами, = зависит только от рассматриваемого состояния aJf а не от начального состояния. Поэтому вероятность оказаться в состоянии после большого числа шагов приблизительно равна tj независимо от начального состояния. Эти закономерности были проиллюстрированы на примере 2 из § 7. Пример 1. Рассмотрим несколько степеней матрицы ве¬ роятностей перехода для примера с Землей Оз. С точ¬ ностью до трех десятичных знаков эти матрицы будут иметь вид: д я с Д/0,5 0,25 0,25 \ Я 0,5 0 0,5 ; С \0,25 0,25 0,5 J Д Я С Д /0,437 0,187 0,375 Я 0,375 0,250 0,375 С \ 0,375 0,187 0,437 д я с Д /0,402 0,199 0,398 Я 0,398 0,203 0,398 С V 0,398 0,199 0,402 д я с Д /0,400 0,200 0,400 Я ( 0,400 0,200 0,400 С \ 0,400 0,200 0,400
§ 8*. Эргодические марковские цепи 313 Таким образом, мы видим, что уже элементы восьмой степени матрицы Р с точностью до трех десятичных знаков составляют одинаковые строки. Поэтому вероятность до¬ ждя через восемь дней после дождливого дня с большой точностью равна вероятности дождя через восемь дней после ясного дня или чер^з восемь дней после снега. Следующая теорема позволяет определить элементы матри¬ цы Т. Теорема 2. Если Р есть матрица вероятностей перехода регулярной цепи, а Т и t определены как в теореме 1, то (1) если р есть любой вероятностный вектор, то рРп стремит¬ ся к t\ (2) вектор t является единственным вероятностным вектором, удовлетворяющим равенству tP = t. Доказательство теоремы 1 мы опустим; однако мы укажем вывод теоремы 2 из теоремы 1. Доказательство. Рассмотрим сначала вектор рТ. В пер¬ вом столбце матрицы Т в каждой строке стоит элемент Сле¬ довательно, при вычислении первой компоненты рТ каждая компонента р умножается на t\. В результате t{ умножается на сумму компонент р, что дает t\. Проделав то же самое для дру¬ гих компонент, мы замечаем, что рТ равняется просто t. Но век¬ тор рРп стремится к рТ\ следовательно, он стремится к t. Таким образом, если любой вероятностный вектор многократно преоб¬ разуется посредством Р, то он стремится к неподвижному век¬ тору t. Этим доказывается пункт (1). Так как степени Р стремятся к 71, то рп+1 = рп . р стремится к Т\ но также стремится к Т и Т • Р; следовательно, ТР = Т. Рас¬ смотрение какой-нибудь одной строки этого матричного равен¬ ства показывает, что tP = /, следовательно,^ — неподвижный вектор преобразования Р (то, что t — вероятностный вектор, сле¬ дует из теоремы 1). Мы должны также доказать единственность вектора t. Пусть и — любой неподвижный вектор преобразова¬ ния Р. В силу (1) иРп стремится к t. Но так как и — непод¬ вижный вектор, то иРп = и. Следовательно, и, оставаясь неиз¬ менным, «стремится» к t. Это возможно лишь в том случае, если w = t. Таким образом, t — единственный неподвижный вектор, чем и завершается доказательство пункта (2). Следующее обстоятельство является важным следствием из нашей теоремы. Если принять за р векгор р(0), указывающий начальное распределение вероятностей, то вектор р(°)рп=р№ укажет распределение вероятностей всех состояний на п-м эта¬ пе процесса, а этот вектор стремится к t. Следовательно, если Матрица Р регулярна, то независимо от того, каковы были на¬
314 Гл. V. Векторы и матрицы чальные вероятности, после большого числа шагов вероятность того, что процесс перейдет в состояние будет очень близка к tj (ср. с выводом, сделанным из теоремы 1). Пример 2. Вернемся к примеру 2 из § 7 и примем/?^ == = (0,1; 0,9); посмотрим, как этот вектор распределения вероятностей изменяется при* последовательных преобразо¬ ваниях. Воспользовавшись матрицей Р и её степенями из примера 2 (стр. 305—З'Об), мы получим, что р{{) = (0,5167, 0,4833), р(2) = (0,5861, 0,4139) и р<3> = (0,5977, 0,4023). Вспомнив, что /=(0,6; 0,4), мы видим, что эти векторы стремятся к t. Они изображены на фиг. 116. Фиг. 116 Пример 3. Выведем формулу для неподвижного вектора стохастической (2 X 2)-матрицы с положительными элемен¬ тами. Такая матрица имеет вид: где 0 < а < 1 и 0 < 6 < 1. Так как S — регулярная матри¬ ца, она имеет единственный неподвижный вероятностный вектор t= (ti, t2). Его компоненты должны удовлетворять
§ 8*. Эргодические марковские цепи 3l£ уравнениям: tx (1 — a) -f- t2b = tlf txa + — b) = ^2* Эта система уравнений сводится к одному уравнению t\a = t2b. Это единственное уравнение имеет бесконечное множество решений. Но вследствие того, что ^ —вероят¬ ностный вектор, мы должны также иметь t\ + t2 = 1, и это новое условие дает нам точку [b/(a + b)f a/(a + b)] в качестве единственного неподвижного вектора мат¬ рицы 5. Много интересных свойств регулярных марковских цепей базируются лишь на том факте, что такие цепи имеют един¬ ственный вероятностный неподвижный вектор с положительны¬ ми элементами. Это свойство характерно и для более широкого класса марковских цепей. Определение. Марковская цепь называется эргодической, если из каждого ее состояния мы можем попасть в любое дру¬ гое состояние. Очевидно, что регулярная цепь всегда является эргодической. Это следует из того, что все элементы п-й степени матрицы ве¬ роятностей перехода оказываются положительными и, следова¬ тельно, из каждого состояния можно перейти в любое другое, по крайней мере за п шагов. С другой стороны, эргодическая цепь не обязательно должна быть регулярной. Пусть, например, из данного состояния мы можем попасть в одно из других со¬ стояний только за четное число шагов, а в какое-то еще состоя¬ ние— только за нечетное число шагов. В этом случае любая степень матрицы перехода будет содержать нули. Мы продемон¬ стрируем эту возможность на примере несколько ниже. Еще одну теорему мы приведем без доказательства. Теорема 3. Пусть Р есть матрица вероятностей перехода эргодической цепи. Тогда: (1) существует единственный вероятностный вектор t такой, что tP = t\ (2) все компоненты вектора t положительны; (3) пусть средняя доля времени, в течение которого процесс находится в состоянии a.j, для п шагов равна h^n)\ тогда для лю¬ бого е > 0 независимо от начального состояния имеем Р [\hf-tj |>е]->0. То, что мы говорили о векторе t после теоремы 2, справедли¬ во лишь в частном случае регулярных цепей. В самом деле, на любом фиксированном этапе процесса вероятность оказаться в определенном состоянии для эргодической цепи может быть
316 Г л. V. Векторы а матрицы равна 0. Однако теорема 3 доставляет нам некоторый вариант «закона больших чисел» (см. § И гл. IV) для всех эрго;щ. ческих цепей (в том числе и для регулярных). Пример 1 (продолжение). Возвратимся еще раз к при¬ меру с Землей Оз. Используем теперь теорему 2 для по¬ строения предельной матрицы Т. Нам известно, что строка матрицы Т должна быть вероятностным вектором, т. е. если t = it и *2, h), то t\ + t2-\-13 = 1. Кроме того, этот вектор должен быть неподвижным, т. с. (t\j t'L'» <з) 1 1 1 ' 2 4 Т 1 2 0 1 2 1 1 1 4 4 2 — (^i, t2, tz). Таким образом, мы получаем для компонент вектора t си¬ стему из следующих четырех уравнений: t\ + t2-\- /3=1, + V 2^2 + lUh = tl9 ~I- V4^3 == t2> lUt\ + X\4cl + V 2^3 = ^3* Единственным решением этой системы является вектор t = (0,4; 0,2; 0,4). Таким образом, Рп сходится к матрице /0,4 0,2 0,4' Т = { 0,4 0,2 0,4 \ 0,4 0,2 0,4, независимо от начального состояния и вектор рп стремится к (0,4; 0,2; 0,4) при яоо. Это значит, что в конце концов 40% всех дней будут дождливыми, 20% ясными, а в осталь¬ ные дни будет идти снег. Пример 4. Последние 365 дней на Земле Оз наблюда¬ лась следующая погода:
§ 8*. Эргодические марковские цепи 317 ссдссссядддсяддддддсяссяддссясссядясяс сяссссддясядяддддяддясддясяддсяссссдяд сдяссссядддяссясясддсддяддддддсссссдд дяддссссссдядссяддддсдясссядддсдссддд ясдяссддддддддсядсяддясяддддддддддсс дясяссясссдяддясдддяддссясясссдядядядс сяссссяяядяссддядссдсссдддддссддядяддд ясясяссдсссядсссяддяддясддсссясядссясся сддяддядсядсддясдддсяссссссддддяссддя дядсдясяссдядяссясссдяддяссс. Итак, 140 дней шел снег, 77 дней было ясно, а 148 дней шел дождь. Отношение числа дней каждого типа к общему числу дней определяется вектором д Я с tx = (0,41 0,21 0,38). Этот вектор весьма мало отличается от своего теоретиче¬ ского прототипа Д Я С tr == (0,4 0,2 0,4). Найти неподвижный вектор для регулярной марковской цепи, может быть, чрезвычайно трудно, если размеры матрицы вероятностей перехода достаточно велики. Однако часто удает¬ ся чисто интуитивно предска зать значение компонент этого вектора. С этим мы столкнем¬ ся в примерах из § 10, где мы будем рассматривать различ¬ ные задачи из физики. Здесь в качестве иллюстрации ситуа¬ ции подобного рода мы рас¬ смотрим более простой при¬ мер. Пример 5. Белую мышь Фиг. 117 помещают в лабиринт, по¬ казанный на фиг. 117. В этом лабиринте имеется девять по¬ мещений, соединенных между собой так, как изображено. Из одного отделения в другое мышь переходит случайным образом. Другими словами, если какое-то помещение мож¬ но покинуть разными способами, то мышь с одинаковой вероятностью выбирает любой из них. Передвижение мыши
318 Гл. V. Векторы и матрицы может быть описано марковской цепью с матрицей вероят- ностей перехода следующего вида: 1 2 3 4 5 6 7 8 9 1 0 v2 0 0 0 Va 0 0 0 2 Vs 0 Vs 0 Vs 0 0 0 0 3 0 v2 0 Va 0 0 0 0 0 4 0 0 Vs 0 Vs 0 0 0 Vs 5 0 V4 0 v4 0 V4 0 lu 0 6 Vs 0 0 0 Vs 0 Vs 0 0 7 0 0 0 0 0 Va 0 Va 0 8 0 0 0 0 Va 0 Va 0 Va 9 0 0 0 Va 0 0 0 Va 0 То, что эта цепь не является регулярной, видно из следую¬ щего: из нечетных состояний процесс может переходить только в четные состояния, а из четных — только в нечет¬ ные. Поэтому, начавшись из состояния аь процесс попере¬ менно проходит через состояния с четными и с нечетными номерами. Следовательно, любая степень Р будет содер¬ жать нули либо в нечетных, либо в четных столбцах пер¬ вой строки. С другой стороны, совершенно очевидно, что конструкция лабиринта такова, что в нем из любого состоя¬ ния можно попасть в любое другое состояние, а значит, рассматриваемая цепь является эргодической. Для того чтобы найти неподвижный вероятностный век¬ тор для такой матрицы, нам пришлось бы решать систему из десяти уравнений с девятью неизвестными. Однако мы знаем, что компоненты неподвижного вектора должны быть пропорциональны той доли общего времени, которую мышь проведет в каждом из помещений. Поэтому мы можем предположить, что такой вектор «пропорционален» вектору jc = (-2, 3, 2, 3, 4, 3, 2, 3, 2), у которого i-я компонента равна числу входов в i-e поме¬ щение. Легко проверить, что и в самом деле хР = х, а, сле¬ довательно, единственный вероятностный вектор получается из этого вектора х с помощью такой нормировки, после которой сумма всех его компонент равняется 1. Таким век¬ тором будет /1 1 1 1 1 1 1 1 1 \ 1 \12’ 8 ’ 12 ’ 8 ’ 6 ’ 8 ’ 12 ’ 8 12 .Г
§ 8*. Эргодические марковские цепи 319 Упражнения j. Какие из следующих матриц регулярны? (а)('/г Va)’ (Ь) ( 'Л Зл) [Отв.: регулярная.] (d) ^ ^ ^ [Отв.: регулярная.] [Отв.: не регулярная.] [Отв.: не регулярная.] 2. Покажите, что квадратная стохастическая матрица 2-го порядка /1 — а а \ Ч 6 1 -ь) регулярна тогда и только тогда, когда ни а, ни b не равны 0 и когда оба они одновременно не равны 1. 3. Определите неподвижный вектор, для матрицы упр. 2 в каждом из пере¬ численных там случаев. \отв • ( ^ а \ 1 L \ & ~\~ b а -\- b ) \ 4. Определите неподвижный вероятностный вектор t для каждой из следую¬ щих регулярных матриц: [Отв.: t == (2/3, '/з).] (а) I Си > 0/, /2 / Г 0,9 0,1 \ (Ь)| 0,9 J Г> си 0 (с) | 0 2/з '/з v 'и 72 [Отв.: (2/7, Vt. V?)-] 5. Предполагая, что процесс начинается из состояния аи вычислите (р2) р(3) для каждой из матриц, фигурирующих в упр. 4 (а) и (Ь). Насколько эти векторы отличаются от неподвижных вероятностных векторов указан¬ ных матриц? 6. Пусть /?(°) y) * Вычислите Р^ у Р^ и для каждой из матриц упр. 4 (а) и 4 (Ь). Приближаются ли они к неподвижным векторам этих матриц? 7. Рассмотрим марковскую цепь с двумя состояниями и матрицей вероятно¬ стей перехода #i а2 , = <г,/° 1\ а2 \1 О/
320 Г л. V. Векторы и матрицы Какова вероятность того, что после п шагов процесс перейдет в со¬ стояние а\, если он начался из состояния а2? Будет ли эта вероятность зависеть от начального положения при больших п? Если будет, то должна быть неприменимой теорема настоящего параграфа. Почему^ Имеет ли эта матрица единственный неподвижный вектор? Является ли соответствующая цепь эргодической? (Ср. упр. 2.) [Отв.: цепь является эргодической.] 8. Рассмотрим матрицу вероятностей перехода из упр. 2, где а = 0 и b = \/2 Вычислите единственный неподвижный вероятностный вектор для этой матрицы и докажите, что цепь не является эргодической. 9. Покажите, что матрицы 1 0 0 1 0 0 (а) р = 1 4 1 2 1 4 , (Ь) 1 2 0 1 2 , 0 0 1 0 0 1 имеют более чем один неподвижный вероятностный вектор. Найдите матрицу, к которой стремится Рп, и покажите, что у нее не все строки одинаковы. 10. Покажите, что матрица 0 1 0 0 0 1 является регулярной. 11. Докажите, что если матрица вероятностей перехода 3-го порядка обла¬ дает тем свойством, что сумма всех элементов в любом ее столбце равна 1, то (7з, 7з, 7з) есть неподвижный вероятностный вектор этой матрицы. Сформулируйте аналогичное утверждение для матрицы вероятностей пе¬ рехода я-го порядка. Объясните полученные результаты с точки зрения теории эргодических цепей. (В упражнениях 12—16 мы будем ссылаться на примеры из § 7.) 12. Покажите, что процессы, рассмотренные в примерах 5, 8 и 9 из § 7, не являются эргодическими цепями. 13. Каким окажется неподвижный вероятностный вектор процесса независи¬ мых испытаний, если рассматривать этот процесс как марковскую цепь? Всегда ли такая цепь должна быть регулярной? Проиллюстрируйте это на примере 3 из § 7. 14. Покажите, что цепь примера 4 из § 7 регулярна, и найдите ее неподвиж¬ ный вероятностный вектор. Объясните полученный результат. 15. Покажите, что цепь примера 6 из § 7 является эргодической, но не ре¬ гулярной. Определите ее неподвижный вероятностный вектор. Покажите, что те же вероятности получаются и в том случае, если шары кладутся в ящик по одному, причем каждый из них помещается в первое отделе¬ ние с вероятностью 7г- !G. Покажите, что цепь примера 7 из § 7 является регулярной. Используйте результат упр. 5 из § 7 для того, чтобы на.йти неподвижный вероятност¬ ный вектор для этой цепи. ‘7 На фабрике есть две машины, из которых в любой момент времени ра' ботает только одна. Ежедневно работающая машина с вероятностью р вы¬ ходит из строя. Починить машину может только один человек, который тратит 2 дня на починку одной машины и который может чинить их
§ 9*. Дальнейшие примеры марковских цепей 321 только по очереди. Рассмотрим теперь марковскую цепь, выбрав в каче¬ стве состояний пару чисел (х, у), где х есть число машин, находящихся в рабочем состоянии в конце данного дня, а у равняется 1, если к началу рабочего дня ни одна из машин еще не чинилась, и равняется 0 в осталь¬ ных случаях. Матрица вероятностей перехода для этого случая имеет вил (2,0) (1,0) (1,1) (0,1) (2,0) Я р 0 0 (1,0) 0 0 я р (1Л) Я р 0 0 (ОД) 0 1 0 0 где р + q = 1. Докажите, что эта цепь является регулярной и постройте для нее неподвижный вероятностный вектор. § 9* ДАЛЬНЕЙШИЕ ПРИМЕРЫ МАРКОВСКИХ ЦЕПЕЙ В этом параграфе мы применим результаты предыдущего параграфа к различным марковским цепям. Некоторые из этих марковских цепей рассматриваются здесь впервые, а некоторые взяты из примеров § 15 гл. IV. Пример 1. Допустим, что президент Соединенных Шта¬ тов Америки сообщает какому-то лицу А о своем намере¬ нии выставить или не выставить свою кандидатуру на следующих выборах. Затем А передает эту новость В, ко¬ торый в свою очередь передает это сообщение С, и т. д., причем каждый раз это сообщение передается новому лицу. Пусть для каждого лица, получившего сообщение, имеется некоторая вероятность р > 0 того, что это сообщение будет им передано следующему лицу с изменением смысла на противоположный. Какова вероятность того, что п-е лицо, услышавшее сообщение, получит известие о том, что пре¬ зидент выставит свою кандидатуру? Мы можем рассма¬ тривать это как марковскую цепь с двумя состояниями, обо¬ значенными через «да» и «нет». Процесс находится в со¬ стоянии «да» на п-м шаге, если п-е лицо, получившее сообщение, было поставлено в известность, что президент выставит свою кандидатуру, и в состоянии «нет», если его известили, что президент не выставит свою кандидатуру. Матрица Р вероятностей перехода будет иметь вид да нет Да /1 —р р \ нет \ р 1 — р ) ' 21 Зак. 609
322 Г л. V. Векторы и матрицы В этом случае матрица Рп определяет вероятность того, что /i-е лицо передаст то или другое сообщение в предпо¬ ложении, что президент сказал «да» (первая строка), или в предположении, что президент сказал «нет» (вторая строка). Мы знаем, что эти строки стремятся к t. По фор¬ мулам предыдущего параграфа t = Следователь¬ но, для п-го лица вероятность услышать «да» стремится к у независимо от первоначального решения президента. Для большого числа людей мы можем ожидать, что при¬ близительно одна половина их узнает, что президент вы¬ ставит свою кандидатуру, а другая половина — что не вы¬ ставит, независимо от подлинного решения президента. Изменим теперь наши предположения следующим обра¬ зом. Будем считать для каждого лица вероятность а пере¬ мены в сообщении при передаче его следующему лицу «да» на «нет» отличной от вероятности b перемены «нет» на «да». Тогда матрица вероятностей перехода примет вид: В этом случае t — [b/(a + b)t a/(a + b)]. Таким обра¬ зом, вероятность того, что /2-е лицо услышит о выставлении президентом кандидатуры, равна приблизительно b/(a + b). При большом п эта вероятность также не зависит от по¬ длинного решения президента и мы можем ожидать, что доля услышавших о выставлении президентом своей кан¬ дидатуры будет приблизительно равна Ь/(а + 6), а доля услышавших противоположное приблизительно равна а/(а + Ь). Важно отметить, что из наших предположений следует, что не президент, а сами люди определяют вероят¬ ность того, что какое-либо лицо услышит «да» или «нет», а также долю людей, которые услышат то или другое из этих предсказаний. Пример 2. Продолжим изучение примера 2 из § 15 гл. IV. Первое приближение, рассмотренное в этом приме¬ ре, приводит к марковской цепи с двумя состояниями, и по¬ лученные результаты аналогичны результатам только что разобранного нами примера 1. Второе приближение при¬ вело к марковской цепи с четырьмя состояниями и матрицей да нет 1 — а b
§ 9*. Дальнейшие примеры марковских цепей 323 вероятностей перехода рр ДР РД ДД рр 1 - а 0 а 0 ДР b 0 1 —Ь 0 РД 0 1 — с 0 с дд 0 d 0 1 —d Если все числа а, Ь, с и d отличны от 0 или 1, то квадрат этой матрицы не содержит нулей и, следовательно, эта матрица регулярна. Неподвижный вектор находится обыч¬ ным способом (см. упр. 12). Это будет вектор / bd ad ad са \ \bd ~j- 2ad —j- са bd —j— 2ad —ca bd —|— 2ad —)-• ca bd —f— 2ad —j— ca) Заметим, что вероятность состояния (РД) после большого числа шагов равна вероятности состояния (ДР). Это пока¬ зывает, что при равновесии изменение от (Р) к (Д) долж¬ но иметь ту же самую вероятность, что и изменение от (Д) к (Р). Неподвижный вектор позволяет найти вероятность того, что выборы в далеком будущем заверщатся победой рес¬ публиканцев. Эта вероятность находится путем сложения вероятностей состояния (РР) и состояния (ДР), что даст bd —(— ad bd —|— 2ad —j— ca Отметим, что для нахождения вероятности победы респуб¬ ликанцев в году, предшествующем некоторому году в да¬ леком будущем, следует сложить вероятности состояния (РР) и состояния (РД)^ То, что при этом мы получаем тот же самый результат, соответствует тому факту, что пред¬ сказания далекого будущего существенно не зависят от индивидуального года, в отношении которого делается предсказание. Другими словами, процесс протекает так, как если бы он был стационарным. Пример 3. Следующий пример показывает, что описан¬ ные идеи могут быть применены к ситуации, которая не кажется связанной с понятием вероятности, и тем не менее может быть исследована вероятностными методами. Допустим, что в каждом городе каждый год четыре процента жителей переселяется в пригороды, а один про¬ цент жителей пригородов переселяется в город. Предпола¬ гая, что число жителей города и его пригородов остается 21*
324 Гл. V. Векторы и матрицы постоянным, найдем окончательное распределение жите¬ лей между городом и пригородами. Ситуация описывается матрицей 5, изображенной на фиг. 118. Обозначим через х{0) вектор где xf)— доля городского населения в начале исследуемого периода и х!!>0)— доля пригородного населения в это же время. Через Х{П) _ x'v} обозначим вектор, дающий соответствую¬ щие доли спустя п лет. Тогда на основании тех же сообра¬ жений, которые используются и в случае марковской цепи, мы получаем, что Точно так же, поскольку наша матрица S может быть ин¬ терпретирована как регулярная матрица вероятностей пере¬ хода для некоторой марковской цепи и поскольку вектор х(0) есть вероятностный вектор, то мы можем применить тео¬ рему из теории марковских цепей и получить в результате, что вектор х{п) стремится к вектору t = (tu t2) — един¬ ственному неподвижному вектору стохастической матрицы S. Этим вектором будет вектор = (0,2; 0,8). Следова¬ тельно, мы можем сделать вывод, что через много времени в самом городе будет приблизительно 20% населения и в пригородах — 80% независимо от первоначального распре¬ деления населения города и пригородов. Отметим, что по истечении длительного времени из города в пригороды бу¬ дет ежегодно переселяться доля населения, равная 0,2-0,04 = 0,008, а из пригородов в город — доля, равная 0,8-0,01 = 0,008. Иными словами, при «равновесии», кото¬ рое будет достигнуто через большой промежуток времени, из города в пригороды будет переселяться ровно столько народу, сколько из пригородов в город. Пример 4. Предположим, что в условиях примера 3 нас интересует следующий вопрос. Допустим, что первоначально в городе и в пригородах имеется какое-то известное число республиканцев и демократов. Допустим также, что не про¬ исходит изменений в составе обеих партий и что в любой момент времени принятие решений о переселении не зави¬ население города население пригородов переселение переселение в город в пригороды /0,96 0,04 \ \0,01 0,99 ) Фиг. 118 x{n) = x{b)Sn'
§ 9*. Дальнейшие примеры марковских цепей 325 сит от партийной принадлежности. Какова при этих усло¬ виях вероятность того, что через много времени в этом городе будет заданное число республиканцев и демокра¬ тов? Из предыдущего примера мы знаем, что в конечном счете происходит ежегодное переселение некоторого фик¬ сированного числа людей из города в пригороды и того же самого числа из пригородов в город. Мы покажем, как можно решить поставленную задачу в одном очень простом частном случае. Допустим, что когда равновесие достигнуто, имеется два человека в городе и 8 человек в пригородах, причем ежегодно один человек пере¬ селяется из города в приго- Город Пригороды роды и один из пригородов в город. Допустим далее, что . всего имеется четыре респуб¬ ликанца и шесть демократов. Образуем марковскую цепь, принимая за состояние чис¬ ло городских жителей, явля¬ ющихся республиканцами. Таким образом, состояния могут быть представлены чис¬ лами 0, 1 и 2. Вероятности перехода могут быть вычислены следующим образом. Допустим, например, что мы рассма¬ триваем состояние 1. Ситуация в этом случае представлена схематически на фиг. 119. Чтобы перейти из состояния 1 в состояние 0, мы долж¬ ны переселить одного республиканца из города и одного демократа из пригородов. Это произойдет с вероятностью 15 5 2" • — "кГ • Чтобы перейти из состояния 1 в состояние 1, мы должны переселить из каждого места либо по одному республиканцу, либо по одному демократу. Вероятность 13.15 1 ~ такого переселения равна | 2"' Остальные вероятности перехода находятся аналогично. Мы получаем матрицу вероятностей перехода О 1 2
326 Г л. V. Векторы и матрицы Эта матрица регулярная, потому что ее квадрат содер- , / I 8 2 \ жит лишь положительные элементы, и t = y-g, -yg-> (См. упр. 7.) Таким образом, вероятность того, что че¬ рез много времени в городе не будет ни одного республи¬ канца, равна приблизительно -j, что будет один республи- 8 2 канец -jg- и что будет два республиканца -yg-. Эти вероят¬ ности опять-таки не зависят от начального состояния. Мы получим эти же предельные вероятности, если пред¬ ставим себе, что из группы, состоящей из десяти человек, среди которых имеется четыре республиканца и шесть демократов, выбираются наугад два человека, и находится вероятность наличия среди них ни одного, одного или двух республиканцев. (См. упр. 8.) Интересно отметить, что здесь мы пришли к цепи, по¬ добной цепи, используемой физиками в качестве грубой модели диффузии газов. (См. пример 1 из следующего па¬ раграфа) . Пример 5. Допустим, что перед вами две лотерейные машины, каждая из которых в случае выигрыша выплачи¬ вает одну и ту же сумму. Вам сообщили, что вероятность выиграть на машине А равна -у,а на машине В — только Если вы собираетесь играть на одной из этих машин, то, естественно, вы захотите играть на А. Однако вам не указали, какая из этих машин А и какая В. Мы рассмо¬ трим две системы игры, которые могут быть здесь исполь¬ зованы, и для каждой системы найдем долю попыток, при которых можно ожидать выигрыша. При первой системе для принятия решения, играть ли следующий раз на той же самой машине или переменить машину, используется лишь результат последней игры. Предполагается, что при первой игре вы выбираете маши¬ ну наугад. Если вы при этом выигрываете, то условная д 2 вероятность того, что вы играли на машине А, равна (почему?). Следовательно, если при первой игре вы вы¬ игрываете, то следующий раз вы играете на той же маши¬ не. Если же при первой игре вы проигрываете, то условная вероятность того, что вы играли на машине А, равно, как нетрудно подсчитать, Следовательно, в этом случае вы
$ 9*. Дальнейшие примеры марковских цепей 327 должны переменить машину. Поскольку вы руководствуе¬ тесь только предыдущим результатом, каждая игра делает¬ ся похожей на первую, так что вы всегда решаете играть в следующий раз на прежней машине, если перед этим вы выиграли, и на другой машине, если перед этим вы про¬ играли. Чтобы узнать, к чему может привести эта система, об¬ разуем марковскую цепь, взяв в качестве состояний'машину А и машину В. Если вы играете на машине А, вероятность того, что вы будете играть на ней же в следующий раз, равна -у, т. е. вероятности того, что вы выиграете. Другие вероятности перехода находятся подобным же образом, и мы получаем матрицу А В f 1 1 2 2 3 1 4 4 J Неподвижный вектор этой матрицы ^-g-, yj дает для ка¬ ждой из машин вероятность того, что после достаточно большого числа игр вы будете играть на этой машине. Та¬ ким образом, при этой системе можно ожидать, что вы бу¬ дете играть на машине А ву всех случаев. Следовательно, вы будете выигрывать в доле всех игр, приблизительно равной |-4- + I-Т = Т = Э’4- Вторая система предполагает, что в принятии реше¬ ния— менять или не менять машину — вы руководствуе¬ тесь исходами двух последних игр. Допустим, что после принятия каждого решения вы играете два раза и на осно¬ вании исхода этих двух игр принимаете следующее реше¬ ние. В этом случае условная вероятность того, что вы шмели дело с машиной А, при условии, что исходом двух последних игр был «выигрыш — выигрыш», будет больше у. Она также больше у и в случае, если исходом этих двух игр был «выигрыш — проигрыш» или «проигрыш — выигрыш». (См. упр. 10.) Следовательно, в каждом из этих случаев вы не меняете машину и при следующих двух играх. В случае «проигрыш — проигрыш» вероятность того, что вы имели дело с машиной А, меньше у, и вы меняете
328 Г л. V. Векторы и матрицы машину. При такой системе игры матрица вероятностей перехода имеет вид: А В А 3^ 4 _9 16 В 4 7 Тб Здесь А означает двукратную игру на машине А, а В — двукратную игру на машине В. Неподвижным вектором для этой матрицы будет Таким образом, при та¬ кой системе вы будете играть на А приблизительно в ~ всех случаев и выиграете приблизительно в ^ * у “h ^ ' j ~ = -^-=0,42 всех случаев. Итак, более сложная система увеличила среднее значение вашего выигрыша только на 0,02. При любой системе в самом лучшем случае можно рассчитывать на среднее значение выигрыша, равное • Упражнения 1. Покажите, что при разумных предположениях относительно значения р (или значений а и Ь) цепи, полученные в примере 1, являются регулярными. (Указание. Используйте результат упр. 2 из § 8.) 2. Используя результат упр. 3 из § 8, приближенно определите число людей, которым сообщено, что президент выставит свою кандидатуру на выбо¬ рах. Объясните, почему это число не зависит от начального состояния. 3. Пусть в примере 2 а = у , о = с■= и d = . Найдите неподвижный вектор. В какой доле будущих выборов можно ожидать победы респу¬ бликанцев при этих предположениях? 4. Пусть в примере 2 а = 1, b = 1. с = d и с отлично как от 0, так и от 1. Покажите, что соответствующая матрица будет регулярной. На.йдите не¬ подвижный вектор. Какое ограничение эти предположения налагают на возможные последовательности исходов выборов? [Отв.: / = (1, 1,3. j)-] 5. Пусть в примере 2 а = 0, a b, end отличны как от 0, так и о г 1. Будет ли соответствующая матрица регулярной? Покажите, что вектор (1, 0, 0, 0) является неподвижным вектором. Интерпретируйте этот вектор в терми¬ нах долгосрочного предсказания. 6. Пусть в примере 2 о = 0, d = 0, а 6 и с отличны как от 0, гак и от 1. Что можно сказать в этом случае о данной политической системе по истече¬ нии длительного времени? [Отв.: Через некоторое время партия, стоящая у власти, будет продол¬ жать оставаться у власти.]
§ 9*. Дальнейшие примеры марковских цепей 329 /1 8 2 \ 7. Проверьте, что неподвижный вектор в примере 4 равен (у, , "yiH • 8. Пусть из группы в десять человек, среди которых имеется четыре респу¬ бликанца и шесть демократов, выбираются наугад двое. Найдите веро¬ ятность того, что (а) эти два человека являются республиканцами; (Ь) демократами, (с) один из них республиканец, а другой — демократ. 9. Предположим, что некий коммивояжер ездит всегда из города А в го¬ род В и из города В в город С. Но из города С он ездит с вероятностью 1 д 1 „ гп, ~2 в город А и с вероятностью-g- в город В. Представьте поездки ком¬ мивояжера посредством марковской цепи. Будет- ли регулярной матрица вероятностей перехода? Если да, то найдите неподвижный вектор. [От., Да;< = (1. J).] 10. Предполагая в примере 5, что игра ведется по второй системе, найдите вероятность того, что игрок выбрал машину А при условии, что первые два исхода были «выигрыш — выигрыш». То же самое в случае каждой из трех остальных возможностей для первых двух исходов. Г 4 4 \Отв.: „Выигрыш — выигрыш": „выигрыш — проигрыш": у; „про- 4 4 “I игрыш — выигрыш": у*, „проигрыш — проигрыш": -уу. 11. Пусть в примере 5 после каждых трех игр игрок принимает решение, на какой машине он будет'играть следующие три раза. Он меняет машину в том и только том случае, когда вероятность того, что он играл на ма¬ шине А при условии трех последних исходов будет меньше у. В какой доле случаев игрок может ожидать выигрыша при такой системе? Лучше ли эта система, чем та система из примера 2, которая основана на учете результатов только двух предыдущих игр? [Отв.: 0,41; нет ] 12. Показать, что вектор, указанный в примере 2, является неподвижным вектором матрицы вероятностей перехода. 13. В упр. 10 из § 15 гл. IV найдите неподвижный вероятностный вектор и объясните полученный результат. 14. Некий профессор старается не слишком часто опаздывать на лекции. Если он однажды опоздал, то в 90% случаев в следующий раз он приходит вовремя. Если он пришел вовремя, то в следующий раз в 30% слу¬ чаев он опаздывает. Как часто в конечном счете он опаздывает на лекции? 15. У некоего профессора имеются три излюбленных вопроса, один из которых он задает на каждом экзамене (студенты хорошо знают его привычки!). Он никогда не задает один из этих вопросов два. раза подряд. Если в прошлый раз им был задан вопрос № 1, то он бросает монету и задает вопрос № 2, если выпадает герб. Если это был вопрос № 2, он бросает две монеты и переходит к вопросу № 3, если выпадают два герба. Если это был вопрос № 3, то он бросает три монеты и переходит к вопросу № 1, если выпадают три герба. Какой из этих вопросов задает он в об¬ щем наиболее часто и как часто? [Отв.- Вопрос № 2; в 40% случаев.)
330 Гл V. Векторы и матрицы § 10*. ПРИМЕРЫ МАРКОВСКИХ ЦЕПЕЙ В ФИЗИКЕ. ЭНТРОПИЯ В физике, и в особенности при изучении газовых смесей, мы сталкиваемся со многими интересными примерами марковских цепей. В настоящем параграфе мы рассмотрим упрощенную модель молекулярного механизма перемешивания газов, пред¬ ложенную двумя физиками и названную моделью Эренфеста. Кроме того, мы рассмотрим две простые модели явления диф¬ фузии. Хотя число молекул газа, рассматриваемое здесь и зна¬ чительно меньше того, что наблюдается на практике, получен¬ ные результаты помогут объяснить экспериментально наблю¬ дающиеся явления. Пример 1. В первом примере мы рассмотрим простую модель перемешивания двух газов, которая уже рассматри¬ валась выше (см. пример 3 из § 5 гл. 4). Пусть у нас имеется 2п шаров, п белых и п черных, помещенных в две урны таким образом, что в каждой из урн находится по п шаров. Единичный эксперимент заключается в том, что из каждой урны случайным образом выбирается по одному шару, который и перекладывают в другую урну. Состояние процесса характеризуется числом / черных шаров в первой урне; при этом первая урна содержит п — / белых шаров, а вторая урна п — j черных шаров и j белых шаров. Веро¬ ятности перехода для рассматриваемой марковской цепи (ср. выше, стр. 255) равны: Легко видеть, что получившаяся марковская цепь является эргодической (более того, как показано в упр. 2, она яв¬ ляется регулярной). В физике нас интересует процентное содержание шаров каждого типа в каждой из урн после большого числа шагов. Для того чтобы ответить на этот вопрос, можно было бы вычислить неподвижный вектор, соответствующий матрице вероятностей перехода. Однако более интересно попытаться предугадать ответ. По-видимому, разумно предположить, что после большого числа обмена шарами они будут достаточно хорошо перемешаны и что вероят¬ ность найти какие-то определенные п шаров в урне 1 долж- Pj,k = 0 для всех остальных значений k.
§ 10*. Примеры марковских цепей в физике. Энтропия 331 на быть такой же, как если бы мы просто наугад выбирали п шаров из 2п возможных и помещали их в урну 1. В этом случае вероятность того, что в этой урне окажется j черных шаров, равна Можно проверить, что эти вероятности и в действительно¬ сти удовлетворяют уравнениям, определяющим компоненты неподвижного вероятностного вектора матрицы вероятно¬ стей перехода. Частный случай этой задачи рассматри¬ вается в упр. 2. Пример 2. В качестве второго примера рассмотрим мо¬ дель поведения молекул газа, помещенных в объем, разделенный на две части тонкой проницаемой перегород¬ кой. Как и раньше, мы сформулируем нашу задачу, исполь¬ зуя в качестве модели урны с шарами. Представим себе, что у нас есть две урны и 2п шаров, на этот раз одинакового цвета. Ежесекундно случайным образом выбирается один из 2п шаров и перекладывается из одной урны в другую. Если в первой урне находятся / шаров, то вероятность выбрать шар из первой урны рав¬ няется j/2n, а вероятность выбрать шар из второй урны — (2п— j)/2n. В качестве характеристики состояния системы выберем число / шаров в первой урне. Тогда из состояния j мы можем перейти непосредственно только либо в состоя¬ ние / + 1, либо в состояние /— 1, причем вероятности пере¬ хода равны Эти величины задают матрицу вероятностей перехода эр- годической, но не регулярной марковской цепи (см. упр. 3). Здесь, как и раньше, для физика представляет интерес во¬ прос о том, в какое состояние мы придем за большое число шагов. Как и в случае примера 1, мы можем интуитивно предугадать правильный ответ. После многих повторений описанного выше процесса можно ожидать, что независимо от начального распределения шаров процесс будет эквива¬ лентен тому, как если бы мы клали шары по одному в слу¬ чайным образом выбранную урну. Такой процесс является о) р п — 2n~j • Pj’j+1— 2 п ’ Pj,k = О ПРИ k=Pj—\, у+1.
332 Гл. V. Векторы и матрицы процессом независимых испытаний. Вероятность того, что в первую урну попадет / шаров, здесь равна В § 6 гл. III мы определили энтропию рассматриваемой /. Энтропия только на константу отличается от логарифма /-й компоненты неподвижного вероятностного вектора. Энтропия системы будет тем больше, чем ближе к равно¬ мерному распределение молекул между двумя областями рассматриваемого объема. Прогнозируя состояние системы на длительный срок вперед, можно сказать, что состояние с большей энтропией в среднем является более вероятным, чем состояние с ма¬ лой энтропией. В термодинамике это обстоятельство учиты¬ вается в связанных с вероятностями рассуждениях, где указывается, что система должна эволюционировать, пере¬ ходя из состояния с низкой энтропией к состоянию с высо¬ кой энтропией. Так как соответствующая цепь является эргодической, то с течением времени мы можем из любого состояния попасть в любое другое состояние. Поэтому можно ожидать и перехода из состояния с высокой энтро¬ пией в состояние с низкой энтропией. Однако время, необ¬ ходимое на то, чтобы перейти из состояния с высокой энтропией в состояние с низкой энтропией, намного боль¬ ше, чем время, необходимое па переход из состояния с низ¬ кой энтропией в состояние с высокой энтропией. Рассмотрим, например, частный случай описанной выше ситуации, предположив, что у нас имеется всего 4 шара. Тогда у процесса имеется 5 различных состояний, соответ¬ ствующих тому, что в первую урну попадает 0, 1, 2, 3, 4 шара. Матрица вероятностей перехода в этом случае имеет (2) Рj 22п ’ системы если система находится в состоянии вид: 0 12 3 4 0(01 ООО Р = 2 0 0 J 0 4(000 1 0
§ 10*. Примеры марковских цепей в физике. Энтропия 333 Легко проверить, что неподвижным вектором этой матрицы является следующий вектор: — (_L А А А А\ * —\16’ 16’ 16’ 16’ 16)' Используя этот неподвижный вектор, мы можем сразу определить средний период повторения каждого из состоя¬ ний. Так, если мы выйдем из состояния 0, то у нас уйдет в среднем 16 шагов на возвращение в это же состояние. Точно так же, исходя из состояния 1, необходимо сделать 2 в среднем 4 шага, из состояния 2 — в среднем 2-j шага до возвращения в первоначальное состояние. Среднее время повторения состояния 3 будет таким же, как и для состояния 1, а среднее время повторения состояния 4 — та¬ ким же, как и для состояния 0. Энтропия системы равняется log 1 = 0, если система находится в одном из состояний 0 или 4, log 4, если систе¬ ма находится в состояниях 1или 3, и log6, если система находится в состоянии 2. Найдем теперь среднее время перехода в состояние 0, т. е. в состояние с низкой энтро¬ пией. Для того чтобы определить это время, мы будем счи¬ тать состояние 0 «поглощающим состоянием», т. е. будем считать, что из него система уже не переходит ни в какое другое состояние. (См. § 4 гл. VII.) При этом мы получим новую матрицу вероятностей перехода 0 1 ю 0 0 0 1 1 4 0 3 4 0 0 2 0 1 2 0 1 2 0 3 0 0 3 4 0 1 4 4 , 0 0 0 1 0 . Для того чтобы определить среднее время перехода в «поглощающее состояние» 0, надо вычеркнуть из получен¬ ной матрицы строку и столбец, отвечающие состоянию 0; мы получим матрицу 0 со 0 0 1/2 0 */2 0 0 3/4 0 ]и 0 0 1 0
Гл. V. Векторы и матрицы Образуем теперь матрицу N', обратную к матрице -Q' = 10 0 0 0 10 0 0 0 10 0 0 0 1 о 3/4 о о 72 0 '/2 О О 3/4 о о 0 '/4 = 1 0 . 1 - -3/4 0 0 -V* 1 -’/2 0 о - 1 V4 0 0 - 1 1 эта матрица будет иметь вид 1 1 2 N' = n 3 4 ]6 3 20 3 20 3 Вычислив произведение N'c, где с есть четырехмерный вектор-столбец, все компоненты которого равны 1, мы опре¬ делим среднее число шагов, необходимое на то, чтобы по¬ пасть в поглощающее состояние, как функцию начального состояния; доказательство этого будет приведено в § 4 гл. VII. В нашем случае это произведение будет иметь вид вектора: IV'с = 4 6 4 1 4 8 16/з 7з 4 8 20/з 7з 4 8 20/з 8/з J 1 1 1 1. 15 18 20 21 3 Таким образом, для того чтобы прийти в состояние 0, ис¬ ходя из состояния 1, системе требуется в среднем 15 шагов, а для того чтобы прийти в состояние 0 из состояния 3 — в среднем 20Уз шагов. Отметим, что все эти числа до-
л 10*. Примеры марковских цепей в физике. Энтропия 335 статочно велики (даже для начального состояния 1). Таким образом,\мы можем заключить, что процесс попадает в со¬ стояние с минимальной энтропией лишь после большого числа шагов. Определи^ теперь среднее число шагов, необходимых для того, что^ы впервые попасть в состояние с максималь¬ ной энтропией,,т. е. в состояние 2. Для этого будем считать состояние 2 поглощающим. В этом случае новой матрицей вероятностей перехода будет матрица 2 0 1 3 4 1 0 0 0 0 0 0 1 0 0 3 4 1 4 0 0 0 3 4 0 0 0 1 4 0 0 0 1 0 Далее последовательно имеем О 1 О О О Q" = О 74 о о о ооо v4 0 0 10 / — Q" = 1 ли о о -1 1 о о о 0 1 — 1 о: о V 4 3 4 0 0 0 0 4 1 3 3 4 4 3 У 0 1 4 4 3 3 1 4 3 У 0 0 0 0
336 Г л. V. Векторы и матрицы Отсюда следует N"c = 0 '2Т 1 ’I 3 4 i24i компоненты этого вектора имеют заметно меньшие значе¬ ния, чем компоненты вектора N'c. Это указывает на то, что для достижения состояния с максимальной энтропией тре¬ буется гораздо меньше времени, чем на достижение со¬ стояний 0 или 4. Пример 3. В качестве последнего примера рассмотрим область, разделенную на части так, как это показано на фиг. 120. Если молекула выхо¬ дит из одной из областей, она с равной вероятностью может попасть в любую из двух дру¬ гих областей. Возвращаясь к нашим задачам с урнами, мы можем построить следующую мо¬ дель такого перехода; у нас имеется 3п шаров одинакового цвета, распределенных между тремя урнами. Предположим, что в первой урне находятся /, во второй — /, а в третьей — k шаров. Тогда с вероятностью //Зл мы вынимаем шар из первой урны и с равной вероят¬ ностью кладем его в любую из двух оставшихся урн. Аналогично обстоит дело и для остальных урн. Для того чтобы описать этот процесс, мы хотим уменьшить возможное число его состояний и для этого объединить некоторые из элементарных состояний в одно новое состоя¬ ние. Это позволит нам уменьшить размеры матрицы вероят¬ ностей перехода. Такое объединение состояний следует вы¬ полнять с достаточной осторожностью. (См. упр. 7, 8.) В качестве состояния для нового процесса мы будем рас¬ сматривать тройку чисел (/, /, k), где i^j^k. Это зна¬ чит, что мы объединили в одно состояние все состояния, описывающиеся одинаковыми тремя числами независимо от того, в какой из областей находится интересующее нас число молекул. Теперь нам нужно исследовать различные Фиг. 120
§ Ю*. Примеры марковских цепей в физике. Энтропия 337 возможности перехода. Ясно, что процесс переходит из со¬ стояния (/,}', k) в состояния (/—1, /+1, k) и (/—1, /, k+ \) с вероятность //6/г; в состояния (/, / — 1, k + 1) и (i + 1, /— 1,'^) с вероятностью //6/г; наконец, в состояния (i + 1, у, k— 1) и (/, j -f 1, k— 1) с вероятностью k/6п. Записывая состояния, в которые переходит процесс, мы предполагаем, что при необходимости числа в скобках переставляются таким образом, чтобы они располагались там в порядке убывания. Если мы хотим, как и раньше, предсказать значения предельных вероятностей, нам при¬ дется учесть объединение состояний. Если, бы такого объ¬ единения не было, то можно было бы ожидать, что по исте¬ чении достаточно большого времени вероятность находить¬ ся в состоянии (/, /, k) будет определяться выражением ш з3п Однако в том случае, когда несколько состояний объеди¬ няются в одно, необходимо складывать и отвечающие им вероятности. Если i = j = k = пу то никакого объединения состояний не произойдет; если i, = j Ф k или i Ф j = k, то возможны три состояния, объединяемые в одно; наконец, если i Ф j Ф k, то шесть состояний объединяются в одно. Таким образом, мы получим предельные вероятности сле¬ дующих трех типов. Если i = j = k = /г, то вероятность соответствующего состояния равна ( Зл ) \/7, П, /7 / 3 Зп Если i = j ф k или i Ф j = k, то вероятность состояния равна , Зя \ /, у, k ) З3п~1 Если 1ф]фк, то вероятность состояния равна Для того чтобы проиллюстрировать эту задачу, рассмо¬ трим случай п = 2; другими словами, рассмотрим распре¬ деление шести шаров между тремя урнами. Перед объеди- 22 Зак. 609.
338 Г л. V. Векторы и матрицы нением нам нужно было рассматривать 28 состояний, а после него — только 7. (См. упр. 4.) После объединения состояний матрица вероятностей перехода примет вид 6,0,0 5,1,0 4,2,0 4,1,1 3,3,0 3,2,1 2,2,2 6, 0, 0 0 1 0 0 0 0 0 5, 1, 0 1 12 1 12 5 12 5 12 0 0 0 4, 2, 0 0 1 6 0 1 '6 1 3 1 3 0 4, 1, 1 0 1 6 1 6 0 0 2 3 0 О со со 0 0 1 2 0 0 1 2 0 3, 2, 1 0 0 1 12 1 6 1 12 5 12 1 4 2, 2, 2 0 0 0 0 0 1 0 Неподвижный вероятностный вектор, вычисленный по ука¬ занным выше правилам, выглядит так: — /_L 1 J0_ 20 i0 Щ \243’ 81’ 81 ’ 81 * 243’ 81 * 81 J' Для системы, рассмотренной в этом примере, энтропия состояния определяется логарифмом числа возможных рас¬ пределений молекул, при котором система окажется в рас¬ сматриваемом состоянии. Рассмотрим состояния до объеди¬ нения. Для состояния с i шарами в урне 1, j шарами в урне 2 и k шарами в урне 3, энтропия будет равна В приведенном выше примере мы получим следующие энтропии для различных состояний: Состояние Энтропия состояния 6, 0, 0 5, 1, 0 4, 2, 0 3, 3. 0 4, 1, 1 3, 2, 1 2, 2, 2 log 1=0 log 6 log 15 log 20 log 30 log 60 log 90 T
§ 10*. Примеры марковских цепей в физике. Энтропия 339 Наибольшей энтропией обладает состояние 2, 2, 2. Заметим также, что, например, энтропия состояния 3,3,0 меньше, чем энтропия состояния 3, 2, 1 и т. д. Можно показать, что среднее количество шагов, необ¬ ходимое на то, чтобы перейти в состояние с наибольшей энтропией 2,2,2, не превышает 12 шагов, в то время как среднее число шагов, необходимое на то, чтобы перейти из состояния 2,2,2 в состояние 6,0,0, имеет порядок 280 шагов. Как и в предыдущем примере, наибольшую энтропию имеет наиболее равномерное распределение. Доказатель¬ ство этого основывается на свойствах полиномиальных коэффициентов. Проведем соответствующее доказательство для рассмотренного в этом примере случая. Доказательство того же положения для других, более сложных, случаев принципиально не отличается от рассматриваемого. Теорема. Энтропия состояния системы (я, я, п) боль¬ ше энтропии любого другого состояния. Доказательство. Рассмотрим некоторое другое состояние (/, у, k), где i + j + k = 3п. Переменив, если нужно, номера урн, мы можем считать, что/;>/>£ и, ко¬ нечно , что по крайней мере одно из этих неравенств яв¬ ляется строгим. Мы знаем, что: энтропия системы в состоя¬ нии (я, я, п) равняется log энтропия системы в со¬ стоянии (i, у, k) равняется log(/'у2*)* Легко видеть, что из состояния (п, п, п) в состояние (i, у, k) можно перейти за несколько шагов, каждый из которых состоит в уменьше¬ нии на 1 одного из характеризующих состояние трех чисел и в увеличении на 1 числа, стоящего слева от первого чи¬ сла. Покажем, что на каждом таком шаге энтропия систе¬ мы уменьшается. Рассмотрим переход из состояния (г, 5, t) в состояние (г+1, 5, t—1), Отношение соответствующих полиномиальных коэффициентов равно где последнее неравенство вытекает из того, что г 1. Лег¬ ко показать, что и остальные элементарные шаги также вызывают уменьшение энтропии. А поскольку из состоя¬ ния (я, я, я) можно перейти в состояние (/, у, k) с помо-
340 Гл. V. Векторы и матрицы щью одних таких шагов, на каждом из которых энтропия системы уменьшается, то энтропия состояния (/, /, k) дол- жна быть меньше энтропии состояния (п, п, п) . 1. Покажите, что в задаче, разобранной в примере 1, р.. = 0 только при / =- о или /г, а у матрицы Р2 все диагональные элементы положительны. Вос¬ пользуйтесь этим для того, чтобы показать, что соответствующая марков¬ ская цепь является регулярной. [Указание. Для доказательства эргодического характера марковской цепи, для которой матрица вероятностей перехода Р не содержит нуле¬ вых элементов на главной диагонали, надо показать, что элементы ма¬ трицы рг'Л (где г — число состояний) положительны.] 2. В случае примера 1 постройте матрицу вероятностей перехода при усло¬ вии, что /г = 3. Покажите, что неподвижный вероятностный вектор этой матрицы определяется равенством (1), стр. 331. 3. В случае примера 2 постройте матрицу вероятностей перехода при усло¬ вии, что п = 3. Покажите, что соответствующая марковская цепь является эргодической, но не регулярной. Проверьте, совпадает ли предельный ве¬ роятностный вектор с вектором, заданным равенствами (2), стр. 332. 4. Используйте результаты упр. 15 из § 6 гл. III для доказательства того, что число состояний в примере 3 до их объединения равно Используйте эту формулу для того, чтобы показать, что при /2 = 2, г = 3, число состояний равно 28. Чему будет равно это число при /2 = 3 н г = 3? При г = 3, /2 = 4? 5. Обозначим через fm функции исхода m-го эксперимента в примере 2. Если m велико, то можно предположить, что Определите среднее значение fm . [Указание. Сравните эту задачу с задачей об определении числа гер¬ бов, выпавших в процессе 2п бросаний монеты.] 6. Пусть в примере 2 п = 2; предположим, что процесс начинается из состояния 4. Обозначим через /ь/2,/з первые три функции исхода этого процесса. Найдите среднее значение каждой из этих функций. Сделайте то же самое в предположении, что процесс начинается из состояния 2. 7. Рассмотрим регулярную марковскую цепь с матрицей вероятностей пере- Упражнения ( хода '12 3 10 0 1 р = 2 7з 7з 7з з 72 о 72 Преобразуйте этот процесс в процесс с двумя состояниями, считая со¬ стояние (1, 2) старого процесса за первое состояние нового, а состояние
§ 11 *. Линейные функции и линейные преобразований, 341 3 старого процесса за второе состояние нового. Покажите, что сообще¬ ние о том, что система находилась в состоянии (1,2) в течение двух последних шагов, содержит больше информации, чем сообщение о том, что система находилась в этом состоянии в течение последнего шага. Это будет означать, что такой объединенный процесс уже больше не является марковским. 8. Достаточное условие для того, чтобы марковская цепь после объединения ее состояний оставалась марковской, можно сформулировать следующим образом. Обозначим через Еь Е2, . .., Ег множества объединенных между собой состояний. Вероятность перехода из состояния, принадлежащего Е i в состояние, принадлежащее множеству £у, должна быть одинаковой для всех состояний, принадлежащих £/. Покажите, что для объединения, вы¬ полненного в примере 3, это условие выполняется. Покажите, что оно не выполняется в случае, рассмотренном в упр. 7. § 11* ЛИНЕЙНЫЕ ФУНКЦИИ И ЛИНЕЙНЫЕ ПРЕОБРАЗОВАНИЯ Векторы и матрицы используются в науке прежде всего для представления нескольких различных величин в виде одной. На¬ пример, спрос на продукцию, производимую разными отраслями промышленности Соединенных Штатов Америки, можно предста¬ вить посредством вектора-строки х. Мы рассматривали примеры, когда такая строка умножалась на вектор-столбец у ив резуль¬ тате получалось число х-у. Компоненты вектора у могут озна¬ чать стоимость единицы продукции каждой отрасли. Тогда х-у показывает общую денежную стоимость требуемой продукции. Этот пример типичен для случаев, которые могут встретиться в научном исследовании. Отметим, что здесь имеют место сле¬ дующие два условия. Во-первых, если увеличить спрос в задан¬ ное число k раз, то в силу (kx) - у = k(xy) получим, что общая стоимость умножится на тот же самый множитель k. Во-вторых, если мы имеем сумму двух векторов спроса х и х\ то (* + х')-у = (х-у) + (х'-у), следовательно, отвечающие им общие стоимости также складываются. Итак, мы видим, что посредством умножения на вектор-стол¬ бец у каждый вектор-строка х переводится в некоторое число / (я), причем выполнены следующие два простых условия: Такое сопоставление каждой строке х некоторого числа/(х) мы назовем линейной функцией от х. Мы видим, что каждый век¬ тор-столбец с п компонентами определяет некоторую линейную Функцию от вектора-строки с п компонентами. Линейные функции дают простейший тип зависимости. К сча¬ стью, очень многие задачи можно решать, по крайней мере при¬ 0) (И) f(kx) = kf(x)\ f(x-J\-x')=f (х) -f-f(xr).
342 Г л. V. Векторы и матрицы ближенно, с помощью линейных функций. Хотя, вообще говоря, и не верно, что производство ста тонн стали обходится в десять раз дороже, чем производство десяти тонн, такое упрощение мо¬ жет служить разумным приближением. То же самое можно ска¬ зать о необходимом сырье, рабочей силе, стоимости перевозок и т. д. Обращение с линейными функциями настолько просто, что с ними стараются иметь дело всякий раз, когда для этого есть основания. Каждый вектор-столбец определяет некоторую линейную функцию. Верно и обратное: каждая линейная функция от век¬ торов-строк может быть получена таким образом. Мы докажем это для линейных функций от трехмерных векторов-строк. Предположим, что / ставит в соответствие каждому трех¬ мерному вектору х некоторое число/(х) и обладает свойствами (i) и (ii). Рассмотрим три вектора специального вида: в! = (1, 0, 0), е2= (0, 1, 0), £>3= (0, 0, 1). Обозначим/(^i) через yuf(e2) через у2 и f{ez) через г/3- Пусть У\ У 2 Уз х = х{е\ + х2е2 + х^ез. Воспользовавшись свойствами (i) и (ii), мы получим /(•*) =/(•* А + х2?2 + х3е3) = — f (xlel) +/(х2е2) +/(*3*3) == Х\ f (el) "Ь Х2/ (ё2) + Хз/ (ез) ~ = ххух + Х2у2 + хзУъ = Х-у- Следовательно, вектор-столбец у определяет нашу линейную функцию /. Пример 1. Одно учреждение закупает бумагу трех сор¬ тов: высшего, первого и второго. Количество покупаемой бумаги (в пачках) представлено вектором-строкой х = = (20, 50, 70). Цена за пачку каждого сорта представлена /160 \ (в центах) вектором-столбцом у = I 140 . Тогда /(*) = \ 120 / = х-у= 186 долларов означает общую стоимость заказа. Пока у определяет линейную функцию от х. Но для по¬ купателя, заказывающего 100 или более пачек одного сорта, обычно делается скидка. И если расчет производится по но¬ вым правилам, то тем самым вводится новая функция, от¬ личная от/. Обозначим ее буквой g. Тогда g{2х) <2g(x), Если х = (*i, *2, *з), то можно написать, что
§ 11*. Линейные функции и линейные преобразования 343 потому что на бумагу первого и второго сорта делается скидка. Следовательно, функция g—нелинейная. Многие из функций, встречающихся в науке, являются почти линейными для значений компонент, принадлежащих некоторой ограниченной области, но перестают быть даже приближенно линейными вне этой области. Иногда векторам-строкам ставятся в соответствие не просто числа, а системы чисел. Тогда говорят, что эти векторы преоб¬ разуются в другие векторы. Мы встречались с примером такого рода в § 3, когда вектор-строка, показывающая, сколько строится домов различного типа, преобразовывалась в вектор- строку, показывающую количество строительных материалов. Преобразование вектора называется линейным преобразова¬ нием, если каждая компонента получаемого в результа¬ те вектора является линейной функцией от преобразуемого вектора. Из определения линейного преобразования непосредственно следует, что его можно представить с помощью некоторой си¬ стемы векторов-столбцов, которая может быть также записана в виде матрицы. Обратно, каждая матрица определяет некото¬ рое линейное преобразование векторов Наконец, из (i) и (ii) следует, что всякое линейное преобразование Т обладает свой¬ ствами T(kx) = kT(x) и Т(х + х') = Т(х) + Т(х/)1 где х и х' — векторы, a k — число. Пример 2. Допустим, что граждане Соединенных Шта¬ тов Америки разделены на пять групп соответственно их годовому доходу. Компоненты вектора-строки х означают число людей, принадлежащих каждой категории. Скажем, Х\ человек имеют доход в 100 000 долларов и выше, х2 че¬ ловек имеют доход от 20 000 до 100 000 долларов и т. д. Если для каждой категории известно среднее число авто¬ мобилей, находящихся во владении одного человека, то можно записать эти пять чисел в виде вектора-столбца, и мы получим общее число личных автомобилей как линей¬ ную функцию от х. Подобным же образом мы можем по¬ лучить общее число находящихся в частном владении яхт, домов, телевизоров. Каждая из этих четырех величин является линейной функцией от х (по крайней мере при¬ ближенно) и каждая определяется пятимерным вектором- столбцом, элементы которого указывают среднее число соответствующих предметов, находящихся во владении од¬ ного человека. Записав эти четыре вектора вместе в виде прямоугольной таблицы, мы получим некоторую (5X4)- матрицу. Эта матрица определяет линейное преобразова¬ ние, переводящее х в четырехмерный вектор-строку, ком¬
344 Гл. V. Векторы и матрицы поненты которого означают соответственно среднее число автомобилей, яхт, домов и телевизоров, каким владеет лицо с данным имущественным состоянием. Упражнения 1. х = (хьх2, х3). Для каждой из следующих функций проверьте, обладает ли она свойствами (i) и (ii): (a) f(x) = 3х{ + х2 — 2х3; [Отв.: Да.] (b) f(x) = x^x2x3; (c) / (х) = /{Х\У 4- (х2)2 + (ЛГ3)2; [Отв.: Нет.] (d) f(x) = д:2. 2. х= (xi,x2). Для каждого из следующих преобразований х в у проверьте, будет ли оно линейным: (a) у, = 2хх + Зх2 и у2 = Х\ — х2\ [Отв.: Лилейное.] (b) ух = х1-\-2х2 и у2 — — ххх2\ [Отв.: Нелинейное.] (С) у, = *2 И У2 “ -^1* Для каждого преобразования, оказавшегося линейным, напишите мат¬ рицу, представляющую это преобразование. 3. Докажите, что функция /(х) = с, где х — двумерный вектор-строка, а с — константа, будет линейной функцией тогда и только тогда, когда с = 0. 4. Докажите, что функция/(х) = ахх + Ьх2 4 с, где х — двумерный вектор- строка, а а, b и с — константы, будет линейной функцией тогда и только тогда, когда с = 0. 5. Докажите, что преобразование Т(х) = хА + с, где х и с — двумерные векторы-строки, а А — квадратная матрица второго порядка, будет ли¬ нейным преобразованием тогда и только тогда, когда с = 0. 6. Докажите, что / (х) = (наименьшей компоненте х) не есть линейная функ¬ ция. 7. Пусть х—12-мерный вектор-строка, компонентами которого служат числа рисунков в двенадцати математических книгах. Приведите пример (a) линейной функции от х, [Отв.: Общее число рисунков во всех книгах ] (b) линейного преобразования х, (c) нелинейной функции от х. 8. Пусть компонентами вектора х служат: число научных книг, число про¬ чих книг и число журналов, имеющихся в какой-то библиотеке. Уста¬ новите, какие из следующих функций являются линейными функциями от х: (a) число всех изданий; [Отв.: Линейная.] (b) число всех карточек в каталоге. (Следует считать, что на каждую книгу заведены две карточки, а на всякий журнал одна карточка.) 9. Если в (i) и (ii) понимать под х вектор-столбец, то мы получим опре¬ деление линейной функции от вектора-столбца. Каким образом мож1Ю
§ J2*. P-матрицы 345 представить такую функцию? Каким образом можно представить линей¬ ное преобразование вектора-столбца? 10. Покажите, что матрицу /?, определенную в § 3, можно рассматривать и как преобразование вектора-строки и как преобразование вектора-столбца. В гл. III перестановкой п объектов было названо расположе¬ ние этих объектов в определенном порядке. Так, для множества [а, Ь, с} имеется шесть перестановок: abc, acb, bac, bca, cab и cba. Можно рассматривать перестановки и с несколько иной точ¬ ки зрения. Мы можем представлять себе, что первоначально наше множество было задано в определенном порядке, напри¬ мер abc. Тогда перестановку можно мыслить как некоторое изменение порядка в этом множестве. Например, одна из пере¬ становок изменит порядок abc на Ьас, т. е. первый элемент ста¬ вит на второе место, второй — на первое место, а третий элемент оставляет на месте. Чтобы для числа всех перестановок получа¬ лось прежнее значение п\, мы должны учесть и «изменение по¬ рядка», ничего не меняющее, т. е. такую перестановку, которая «меняет» abc на abc. Будем считать наши п объектов компонен¬ тами некоторого вектора-строки. Каждая перестановка перево¬ дит любой вектор-строку в другой вектор-строку, имеющий те же самые компоненты, но, возможно, расположенные в изменен¬ ном порядке. Удобно описывать перестановки матрицами специального вида. Например, приведенное выше изменение порядка трех эле¬ ментов можно получить, рассматривая произведение Здесь мы не обязаны считать xt числами. Это могут быть объ¬ екты любой природы, для которых умножение на 0 и на 1 и сло¬ жение определено, как для чисел. Тогда (3 X 3)-матрица может служить для представления нашей перестановки. Ее элементами являются только нули и единицы, причем в каждой строке и каждом столбце стоит точно одна единица. Определение. P-матрицей называется квадратная мат¬ рица, в каждой строке и в каждом столбце которой имеется в точности один элемент 1, а на всех остальных местах стоят элементы 0. § 12*. Р-МАТРИЦЫ (хх, Х2, Хо) • = (хъ Хх, х3).
346 Гл. V. Векторы а матрицы Примеры Р-матриц указаны на фиг. 121, где имеется одца матрица порядка 2, две — порядка 3 и одна матрица порядка 4 А = 0 1 1 О D = 0 1 0\ 1 f\ 0 0 0 1 ■ с= 0 1 1 0 0 J г \ Vo 0 0 1 0 0 1 0 0 0 0 0 1 0 0 0 0 1. Ф и г. 121 Теорема 1. Любая Р-матрица порядка п определяет некото¬ рую перестановку п объектов, и каждая такая перестановка имеет единственное представление с помощью Р-матрицы. Рассмотрим п объектов х{, х2, хп, которые после ка^ ' кой-то перестановки располагаются в измененном порядке: Уь • • • > Уп• Здесь каждый у является некоторым л: и каждый х является некоторым у. Если y~xif это означает, что объект, стоявший на i-м месте, переведен на у’-е место. В этом случае мы полагаем &ц = 1 и aik = 0 для k Ф i. Проделав это для каж¬ дого /, мы получим P-матрицу А порядка п такую, что (1) (хи х2, . . •, хп) А = (уи у2, . . ., уп). Тот факт, что в каждой строке (столбце) матрицы А стоит в точности одна 1 (т. е. что А является P-матрицей), вытекает из того, что при перестановке каждый элемент фигурирует в изме¬ ненном расположении один и только один раз. С другой стороны, если задана некоторая Р-матрица А, то за¬ дать перестановку мы можем с помощью произведения (1). То обстоятельство, что каждый столбец матрицы А содержит точ¬ но одну 1, означает, что каждый yj является некоторым а то, что каждая строка матрицы А содержит точно одну 1, означает, что каждый Xi фигурирует в качестве только одного у-}. Следо¬ вательно, компоненты вектора (yi, у2> •••> Уп) представляют со¬ бой перестановку компонент вектора {xlf х2, •••, хп)9 чем и за¬ вершается доказательство теоремы. В последующем рассуждении мы ограничимся для иллюстра¬ ции случаем п = 4, но все полученные нами результаты будут
$ 12*. P-матрицы 347 справедливы для любого п. На фиг. 122 мы видим четыре Р-мат- риды четвертого порядка / = ООО 1 О 0 О 1 О К = 0 0 0 1 0 1 1 /= 10 о 1 о о О О 1 0 0 10 10 0 0 L = о о ООО 0 0 0 1 0 0 10. Фиг. 122 10 о 1 о о о О 1 о 1 1 0 о 1 о о о Мы хотим исследовать произведение двух P-матриц. Если X = (хи х2, х3, х4), то х/ — (х4, хи Х3, Х2) И хК = (х2, XI, х4, х3). Первая из этих перестановок переводит первую компоненту на второе место, вторую компоненту на четвертое место и четвер¬ тую компоненту — на первое место; третья компонента остается на месте. Вторая перестановка меняет местами две первые и две последние компоненты. Что получится, если выполнить эти две перестановки одну за другой? Рассмотрим сначала Х\. После первого преобразования эта первая компонента делается второй компонентой, после второго преобразования вторая компонента делается первой. Следовательно, в результате х\ возвращается на свое первое место. Компонента х2 сначала переводится на четвертое место, а затем вторым преобразованием переводится на третье место. Следовательно, х2 становится в итоге третьей компонентой. Компонента х3 сначала оставляется на месте, а затем преобразуется в четвертую компоненту. Компонента х4 при первом преобразовании переводится на первое место, а при втором преобразовании — на второе место. Следовательно, начав с вектора-строки х, после выполнения двух преобразований мы приходим к вектору {хх, х4, х2, х3). Теперь рассмотрим произведение 1 0 0 01 0 0 10 0 0 0 1 JK= 0 1 0 0] Матрица JK снова является P-матрицей, и легко проверить, что она дает в точности описанную выше перестановку.
348 Гл. V. Векторы и матрицы Теорема 2. Произведение JK двух Р-матриц одинакового порядка снова является P-матрицей. Эта матрица соответствует результату последовательного выполнения сначала перестановки J, затем перестановки К. Эту теорему очень легко доказать, если воспользоваться из¬ вестными свойствами произведения матриц. Мы хотим узнать, что представляет собой x(JK). На основании ассоциативного за¬ кона (см. § 4) это выражение совпадает с (xJ)K. Но xJ яв¬ ляется результатом перестановки /, а (х])К — результатом при¬ менения перестановки К к xJ. Тем самым теорема доказана. Вернемся теперь снова к фиг. 122 и рассмотрим произведе¬ ния IJ и JI. Ясно, конечно, что // = // = /. В этом случае теорема 2 говорит нам, что последовательное выполнение пере¬ становки / и перестановки / (или наоборот) равносильно выпол¬ нению одной только перестановки /. Принимая во внимание, что перестановка / оставляет все компоненты вектора на месте, можно считать этот результат очевидным. Рассмотрим теперь произведение JL, где / и L снова заим¬ ствованы из фиг. 122. Это произведение равно I, следовательно, L = /_1. По теореме 2 перестановка L, выполненная вслед за /, дает тот же самый результат, что и перестановка /, т. е. вообще ничего не меняет. Таким образом, мы видим, что L = J~l уничто¬ жает все изменения, произведенные перестановкой /. Обратим внимание на сходство в структуре / и L: вторая из этих матриц получается из первой путем поворота вокруг главной диагонали (т. е. диагонали, идущей от верхнего левого угла к нижнему пра¬ вому углу). Другими словами, элемент матрицы L, стоящий в Тй строке и /-м столбце, равен элементу матрицы /, стоящему в /-й строке и i-м столбце. Определение 2. Матрицей, транспонированной по отно¬ шению к квадратной матрице Л, называется матрица Л*, полу¬ ченная путем поворота А вокруг ее главной диагонали, т. е. та¬ кая, элементы которой а., определены следующим образом: <i=air Теорема 3. Если А является Р-матрицей, то А* — обратная к ней матрица. Иначе говоря, Л* осуществляет перестановку, уничтожающую действие перестановки Л. Мы должны показать, что Л* уничтожает действие Л; все остальное вытекает из предыдущих рассуждений и § 6. Предпо¬ ложим, что#*;-=1. Тогда#,.. = 1; следовательно, перестановка Л переводит компоненту Xj в Те положение. Но затем вслед¬ ствие а* - = 1 эта компонента переходит из Тго положения в /-е* Следовательно, Xj возвращается в у-е положение, в котором она вначале находилась. Это происходит с каждой компонентой, и,
§ 12*. P-матрицы 349 таким образом, Л* уничтожает действие Л. Теорема до¬ казана. Определение 3. Множество объектов образует гриппу (по умножению), если (i) произведение двух элементов множества снова является элементом этого множества; (и) во множестве имеется элемент /, называемый единичным элементом, такой, что для каждого А, принадлежащего множе¬ ству, IA = AI = А; (iii) для каждого Л, принадлежащего множеству, имеется элемент Л-1, также принадлежащий этому множеству и такой, что ЛЛ-1 = Л-1 Л = /; (iv) для любых Л, В, С, принадлежащих множеству, А(ВС)=АВ(С). Определение 4. Множество объектов образует коммута¬ тивную группу, если, кроме предыдущих четырех свойств, выпол¬ няется следующее свойство: (v) Для любых Л и В, принадлежащих множеству, ЛВ = ВЛ. Теорема 4. Р-матрицы п-го порядка образуют группу (от¬ носительно умножения матриц). При п> 2 эта группа неком¬ мутативна. Доказательство. Свойство (i) доказано в теореме 2. Свойство (п) следует из того более общего факта, что 1М = = MI = М для всякой матрицы М порядка п. Из теоремы 3 мы знаем, что Л имеет обратную матрицу, а именно Л-1 = Л*. Легко видеть, что Л* снова будет Р-матрицей (см. упр. 1). Отсюда вы¬ текает (iii). Справедливость (iv) опять-таки следует из более общей теоремы, согласно которой умножение любых матриц под¬ чиняется ассоциативному закону (см. § 4). С другой стороны, для любого п> 2 легко привести пример, когда ЛВ Ф ВА (см. упр. 3). Этим завершается доказательство теоремы. Группа, образованная матрицами порядка я, известна под названием группы перестановок (или группы подстановок) п-й степени. Так как перестановками пользуются для изучения сим¬ метрии, то эту группу также называют симметрической группой я-й степени. Упражнения 1. Докажите, что матрица, транспонированная по отношению к Р-матрице, снова является P-матрицей, т. е. что если Р удовлетворяет определе¬ нию 1, то и Р* удовлетворяет этому определению. 2. Выпишите все Р-матрицы порядка 1. Выпишите все Р-матрицы порядка 2. Покажите, что соответствующие две группы коммутативны. 3. При п > 2 мы можем построить матрицу А, которая переставляет только х\ и х2, и матрицу В, которая переставляет только х\ и х$. Какие
350 Гл. V. Векторы и матрицы перестановки производят матрицы АВ и ВА? Будут ли они одинаковыми? Воспользуйтесь этим для доказательства того, что группа перестановок любой степени п > 2 некоммунативна. 4. Напишите матрицы перестановок, переводящих (xi, х2, х3, х4) в: (a) (х2, х3. х4, х,); (b) (*i, х3, хг, х4); (c) (х2, Х3, Ху, х4)\ (d) (хх, хг, х3, х4). ’ 0 0 0 1 ' - 1 0 0 0 Отв.: (а) 0 1 0 0 . 0 0 1 0 . 5. Для следующих пар матриц найдите перестановки, ими представленные. Покажите для каждого случая, что АВ представляет перестановку Л, производимую вслед за перестановкой В, и что ВА представляет пере¬ становку В, производимую вслед за перестановкой А. /0 1 0> (а) А = ( 0 0 1 \ 1 о о > В = /0 10' (b) А = I 0 О 1 \ 1 0 0. /0 О 1' В=11 о о \0 1 о, (с) А = ■ 0 1 0 0 ' ' 0 1 0 0 0 0 0 1 , В = 1 0 0 0 1 0 0 0 0 0 0 1 k 0 0 1 0 . k 0 0 1 0 . [Отв.: (а) хА = (х3, xlf х2); хВ — (х{, х3, х2); хАВ = (х3 х2, х^ хВА = (х2, xlf х3).] 6. Докажите, что множество всех (3 X 3)-матриц не образует группы (отно¬ сительно умножения матриц). 7. Воспользовавшись теоремой 3, найдите матрицы, обратные к шести матри¬ цам, фигурирующим в упр. 5. Проверьте полученные результаты путем умножения этих матриц на обратные к ним. /0 0 1\ у 1 0 0\ ~ Отв.: (а) А~х = I 1 0 0 I; В"1 = 0 0 1 ). \0 1 0/ \0 1 0/ _ 8. Операцию деления обычно вводят, говоря, что b/а служит решением уравнения ах = Ъ (или ха = Ь). (а) Докажите, что в группе уравнение АХ = В всегда имеет единствен¬ ное решение,
§ 13*. Подгруппы группы Перестановок 351 (b) Докажите, что в группе уравнение ХА = В всегда имеет единствен¬ ное решение. (c) Покажите на примере, что эти два уравнения не обязаны иметь одно и то же решение. 9. Во множестве чисел {1, 2, 3, 4} мы зададим «умножение» посредством следующей таблицы: х 1 2 3 4 1 1 2 3 4 2 I 2 4 1 3 3 3 1 4 2 4 4 3 2 1 (Эта таблица построена путем отбрасывания чисел, кратных 5. Напри¬ мер, 2X4 = 8, но мы отбрасываем число 5, сохраняя только остаток 3. Подобным же образом, 3 X 4 = 12, но мы отбрасываем число 10, являю¬ щееся кратным числа 5, и сохраняем только остаток 2.) Докажите, что это множество с так определенным умножением представляет собой ком¬ мутативную группу. 10. Выпишите таблицу умножения для чисел множества {1, 2, 3, 4, 5, 6}, построенного путем отбрасывания кратных числа 7. (См. упр. 9.) Дока¬ жите, что таким образом мы получим коммутативную группу. 11. Напишите таблицу умножения для чисел множества {1, 2, 3, 4, 5, 6}, построенную путем отбрасывания кратных числа 6. (Ср. упр. 9 и 10.) Докажите, что в результате мы не получим группы. Почему числа 5 и 7 приводят к группе, а число 6 — нет? 12. Выпишите все Р-матрицы порядка 3 и обозначьте их буквами. Напишите таблицу умножения для этой группы. Каким образом из одной только этой таблицы можно увидеть, что выполнены свойства (i), (ii) и (iii)? Как можно увидеть, что свойство (v) не выполнено? § 13*. ПОДГРУППЫ ГРУППЫ ПЕРЕСТАНОВОК Иногда в группе может содержаться меньшая группа. Здесь мы будем изучать некоторые подгруппы группы перестановок. Условимся, что всякий раз, когда мы говорим о группе, мы имеем в виду множество с конечным числом элементов. Это от¬ носится, в частности, к нижеследующим теоремам, так как не¬ которые из них не верны для групп с бесконечным числом эле¬ ментов. Понятие группы имеет важные применения к бесконеч¬
352 Гл. V. Векторы и матрицы ным множествам, но этот случай не рассматривается в нашей книге. Определение 1. Если данное множество G (с заданным законом умножения элементов) образует группу и некоторое его подмножество Н также образует группу, то Н называется подгруппой G. Теорема 1. Степени любого элемента группы образуют коммутативную группу. Доказательство. Возьмем какой-нибудь элемент А за¬ данной группы; нужно показать, чго степени Ап обладают свой¬ ствами (i) — (v), перечисленными в предыдущем параграфе. Про¬ изведение двух степеней снова будет степенью: AjAk = Ajvk. Следовательно, (i) выполняется. Заметим далее, что все степени не могут быть различными, так как в противном случае в груп¬ пе оказалось бы бесконечно много элементов. Поэтому должно выполняться равенство А* = Ah, скажем, с j > k. Но это значит, что А*~к = 1. Таким образом, / является некоторой степенью Л, скажем I = Am. Следовательно, (ii) выполняется. Если m= 1 или 2, то А будет обратным к самому себе (см. упр. 9). С дру¬ гой стороны, если m > 2, то среди степеней А будет находиться Am~\ и AAm~l = Ат= I, так что Ат 1 будет элементом, обрат¬ ным к А. Таким образом, и свойство (iii) выполняется. Выполне¬ ние ассоциативного закона (iv) следует из его выполнимости для всех элементов исходной группы. Наконец, коммутивность (v) следует из того, что AjAk = Aj+l{ = Ak+j = AkAJ. Этим са¬ мым все доказано. Определение 2. Группа, состоящая из степеней одного элемента Л, называется циклической группой, порожденной А. Таким образом, чтобы образовать какую-нибудь цикличе¬ скую подгруппу данной группы, нужно взять один элемен! А и построить все его степени. Пример 1. В группе • перестановок степени 4 имеется 4! = 24 элементов. Рассмотрим циклическую подгруппу, по¬ рожденную J (см. фиг. 122). Мы находим, что /2 = L = /-1, так что /3 = JJ2 = /. Таким образом, наша циклическая под¬ группа состоит из /, J2 —L и Л = /. Если продолжать брать более высокие степени, то полу¬ чатся /4 = /, /5 = L, /6 = /, и т. д. Элементы повторяются, снова и снова проходя исходный «цикл». Отсюда и произо¬ шел термин «циклическая группа». Пример 2. Чтобы получить большую циклическую под¬ группу, возьмем матрицу М и все ее степени (см. фиг. 123).
§ 13*. Подгруппы группы перестановок 353 Эта подгруппа имеет четыре элемента, поэтому .'И-1 = М* = М3 и М4 = /. М = I0 О О \l /° М3: 1 0 °\ /° 0 1 °\ 0 1 0 1 NP = 0 0 0 1 0 0 1 1 0 0 0 0 0 о / \о 1 0 о J 0 0 ц Iх 0 0 0 °\ 0 1 0 0 01 |. Л14 = 1 0 1 0 01 0 0 1 0 0 1 0/ \о 0 0 1/ Фиг. 123 Теорема 2 Если в группе выбрать любое подмножество, обладающее свойством (i), то это подмножество образует под¬ группу. Доказательство. Требуется установить, что это подмно¬ жество обладает также свойствами (ii) — (iv). Пусть А — лю¬ бой элемент подмножества. Ввиду (i) АА = А2 также принадле¬ жит подмножеству, а тогда и А А2 = А3 принадлежит подмноже¬ ству и т. д. Следовательно, все степени А лежат в этом подмно¬ жестве. В числе этих степеней окажутся / и А~1. Следовательно, свойства (ii) и (iii) выполняются. Свойство (iv) опять-таки сле¬ дует из того, что оно присуще элементам всей группы. Теорема доказана. Теперь мы располагаем практическим способом для нахожде¬ ния подгрупп. Выбрав из элементов группы один или несколько элементов, мы образуем из них все возможные произведения, используя при этом каждый элемент нужное число раз. После того как будут получены все возможные произведения, среди них будет находиться и произведение любых произведений, так что свойство (i) будет выполнено. Тогда по теореме 2 мы имеем подгруппу. Эта подгруппа называется подгруппой, порожденной данными элементами. Один элемент порождает циклическую подгруппу. Некоторые очень интересные подгруппы порождаются Двумя элементами. Пример 3. Возьмем /2 (см. фиг. 122) и D (см. фиг. 121) и найдем порождаемую ими подгруппу. Прежде всего мы получим степени /, именно У, J2 = L и У3 = /, как и в при¬ мере 1. Затем мы имеем D и D2 = /. В произведениях, об¬ разованных с участием как У, так и D, достаточно рассма¬ тривать только У, У2 и D, так как следующая более высокая 23 Зак. 609
354 Гл. V. Векторы и матрицы степень равна I, а затем эти степени повторяются. Теоре¬ тически следовало бы рассмотреть произведения вроде DJDJ2 и JDJDJDJ, но такие длинные произведения не дают ничего нового, что можно показать следующим образом. Во-первых, DJ = J2D, так что в длинном произведении всегда можно заменить DJ на J2D и тем самым переме¬ стить все / в начало, а все D в конец. (См. упр. 14.) По¬ этому единственные произведения, которые нужно доба¬ вить, имеют вид Ja Db\ а так как J может появиться только в первой или во второй степени, a D — только в первой, из этих новых произведений останутся лишь JD и J2D. Следо¬ вательно, наша подгруппа состоит из шести элементов: /, У2, D, /, JD и J2D. Ввиду JD Ф DJ эта подгруппа не комму¬ тативна. Найденные нами до сих пор подгруппы состоят из 3, 4 и 6 элементов. Каждое из этих чисел является делителем числа 24 — числа всех элементов рассматриваемой группы. Можно пока¬ зать, что число элементов подгруппы всегда является делителем числа элементов самой группы, но мы не станем здесь доказы¬ вать этого факта. Пример 4. Найдем подгруппу, порождаемую D и /(.' Так как D2 = / = /С2, то в произведениях будут фигуриро¬ вать только первые степени D и К. Кроме того, DK = КО; следовательно, подгруппа будет иметь только четыре эле¬ мента: /, Д К и DK. Эта подгруппа коммутативная. То обстоятельство, что данная подгруппа оказалась коммута¬ тивной, есть частный случай следующей теоремы: Теорема 3. Если элементы А и В коммутируют (т. е АВ = £Л), то любые два произведения, образованные из А и В. также коммутируют. Следовательно, подгруппа, порожденная А и В, будет коммутативной. Доказательство. В любом произведении, составленном из /1 и В, скажем ААВВВАВАВ, мы можем, воспользовавшись соотношением АВ = ВА, собрать все А в начале и все В в конце. Следовательно, это произведение можно записать в виде A‘BJ. Второе такое произведение можно записать в виде AkBm. В их произведении (AlBj) • (AkBm) снова можно собрать все А вна¬ чале. Следовательно, (AlBJ)-(AkBm) = Al+*BJ + m = Ak^Bm - = (AkBm) • (AlBJ), что и требовалось доказать. Мы нашли коммутативные подгруппы двух типов: (1) цикли¬ ческую подгруппу и (2) подгруппу, порожденную двумя комму¬ тирующими элементами. Во втором случае удобно иметь способ для нахождения двух коммутирующих элементов. Мы изложим один метод нахождения таких пар.
§ 13*. Подгруппы группы перестановок 355 Определение 3. Эффективным множеством Р-матрицы называется множество всех тех компонент вектора-строки, кото¬ рые не остаются на месте в результате перестановки. Например, {х\, х2} будет эффективным множеством для D, {*ь *2, *4} Для /, {*i, Л'2, х3, Ха) для /С, а эффективным множе¬ ством для / будет пустое множество. Определение 4. Р-матрица, эффективное множество ко¬ торой содержит все компоненты, называется полной Р-матрицей. Например, К является полной Р-матрицей. Теорема 4. Две P-матрицы, эффективные множества ко¬ торых не пересекаются, коммутируют. Доказательство. Пусть эффективным множеством мат¬ рицы А\ является Аф, а эффективным множеством матрицы А2 является Х2, так что Х\ П Х2 = О. Тогда А\А2 произведет сначала некоторое изменение Хи а затем некоторое изменение Х2. Пер¬ вое изменение не затрагивает Х2у поскольку Х\ и Х2 не имеют общих элементов. Следовательно, мы получим тот же результат, если выполним сначала перестановку А2, а затем переста¬ новку А\. Теперь мы располагаем простым способом получения комму¬ тативной группы, отличной ог циклической: мы выбираем любые две матрицы (отличные от /) с непересекающимися эффектив¬ ными множествами и находим порождаемую ими подгруппу. Упражнения 1. Выпишите все P-матрицы третьего порядка. 2. Для каждой из шести матриц упр. 1 образуйте порождаемую этой матри¬ цей циклическую подгруппу. Будут ли все эти подгруппы различными? [Отв.: Пять различных групп; одна из одного элемента, три из двух, две из трех.] 3. Докажите, что не существует никаких подгрупп группы перестановок сте¬ пени 3, отличных от найденных в упр. 2 и от всей этой группы. 4. Выпишите 24 P-матрицы четвертого порядка. 5. Образуйте все циклические потгруппы группы матриц упр. 4. Сколько получается различных подгрупп? Сколько элементов имеет каждая из них? [Отв.: 17 различных групп; одна из одного элемента; 9 из двух; 8 из трех; 6 из четырех.] 6. Покажите на примере, что подгруппами, найденными в упр. 5, не исчер¬ пываются подгруппы группы перестановок 4-й степени (отличные от всей группы). 7. Докажите следующие свойства перестановок: (a) перестановка I порождает единичную подгруппу; (b) перестановка, которая лишь переставляет элементы одной или более пар, порождает подгруппу из двух элементов; (c) всякая другая перестановка порождает подгруппу, более чем с двумя элементами. 23*
356 Гл. V. Векторы и матрицы 8. Докажите, что подгруппа, порожденная А и В, будет циклической тогда и только тогда, когда или А является степенью В, или В является сте¬ пенью А. 9. Докажите, что если подгруппа, порожденная матрицей, состоит из одного или двух элементов, то эта матрица совпадает со своей обратной. 10. Матрица М называется симметричной, если т.. = т.. для всех i и у. До- LJ JI кажите, что P-матрица тогда и только тогда будет симметричной, когда она совпадает со своей обратной.. 11. Найдите подгруппу, порождаемую / и АГ- . [Отв.: Подгруппа из 12 элементов.] 12. Докажите следующие предложения об эффективных множествах: (a) Эффективное множество матрицы / пусто. (b) Эффективное множество P-матрицы, которая лишь переставляет ка¬ кие-нибудь два элемента, состоит из двух элементов. (c) Для всех остальных P-матриц эффективное множество содержит по меньшей мере три элемента. (d) P-матрица является полной тогда и только тогда, когда число эле¬ ментов ее эффективного множества равно ее порядку. 13. Мы желаем образовать коммутативную подгруппу группы перестановок 4-й степени с помощью описанного выше метода. Мы хотим взять две матрицы (отличные от единичной) с непересекающимися эффективными множествами и получить порождаемую ими подгруппу. (a) Используя результат упр. 12, определите, сколько элементов должны иметь эти два эффективных множества. [Отв.: 2; 2.] (b) Выберите нужную пару матриц. (c) Найдите подгруппу. 14. Докажите следующие предложения, относящиеся к примеру 3: (a) DJ = J2D\ (b) DJ2 = JD. [Указание. Воспользуйтесь результатом (а).] (c) В любом произведении, построенном из D и /, можно собрать все / вначале. 15. Если А = / и т — четное число, то Ат/2 будет элементом, обратным к самому себе. Докажите это. Что это означает в случае т = 2? 16. Докажите, что циклическая группа, порожденная А2, является подгруп¬ пой циклической группы, порожденной А. В каком случае эти две rpynnoi будут различными? ЛИТЕРАТУРА ДЛЯ ДОПОЛНИТЕЛЬНОГО ЧТЕНИЯ Узко в А. И., Векторные пространства и линейные преобразования, Энцикло¬ педия элементарной математики, кн. II, Гостехиздат, М.—Л., 1951, стр. 9—126. ШрейерО. и Шпернер Г., Введение в линейную алгебру в геометри¬ ческом изложении, ОНТИ, М.—Л., 1934. Шилов Г. Е., Введение в теорию линейных пространств, Физматгиз, М., 1956. Гельфанд И. М., Лекции по линейной алгебре, М., 1951. Мальцев А. И., Основы линейной алгебры, М., 1956. Александров П. С., Введение в теорию групп, Учпедгиз, М., 1938.
Глава VI * ЛИНЕЙНОЕ ПРОГРАММИРОВАНИЕ И ТЕОРИЯ ИГР § 1. ВЫПУКЛЫЕ МНОЖЕСТВА Образом линейного уравнения вида ах + by = с мы назы¬ ваем совокупность всех точек плоскости, координаты которых (х, у) удовлетворяют этому уравнению. Например, путем подбо¬ ра можно обнаружить, что образ уравнения (a) 2.x —|— Зу :=: б представляет собой прямую, изображенную на фиг. 124. В част¬ ности, положив х = 0, мы получим у = 2, так что образу урав¬ нения 2л: + Зг/ = 6 принадлежит точка (0, 2); подобным же об¬ разом, л = 1 дает у = 4/з, так что (1, 4/3) принадлежит этому образу; точно так же ему принадлежит и точка (3, 0) и т. д. Рассмотрим теперь образы линейных неравенств с перемен¬ ными х и у. Возьмем в качестве примера неравенство (b) 2л -4-Зу < 6. Какие точки (х, у) удовлетворяют этому неравенству? Можно найти много таких точек путем подбора. В частности, (1,1) при¬ надлежит образу неравенства, так как 2-1 +3-1 = 5 < 6; с другой стороны, (1, 2) не принадлежит ему, так как число 2* 1 + 3*2 = 8 больше, чем 6. Между этими двумя точками мы находим точку (1, 4/з), лежащую на границе, т. е. принадлежа¬ щую образу уравнения (а). Мы замечаем, что при возрастании у точка покидает образ, с убыванием у она входит в образ. Так будет и во всех случаях. Если задана какая-то точка, принадле¬ жащая образу (а), то уменьшение у даст число, меньшее чем 6, и, следовательно, полученная таким путем точка будет удовле¬ творять (Ь). Мы видим, что образ неравенства (Ь) состоит из всех точек, лежащих под прямой (а). На фиг. 124 этот образ изображен в виде заштрихованной области плоскости. Область, ограниченная прямой и лежащая по одну сторону от нее, назы¬ вается открытой полуплоскостью,
358 Глава VI*. Линейное программирование и теория игр Точно такой же анализ можно провести в случае неравенства (с) 2х —|— 3у 6 и показать, что образом этого неравенства будет открытая полу¬ плоскость, расположенная над прямой (а). Это может быть вы¬ ведено также из того факта, что образы (а), (Ь) и (с) не пере¬ секаются и что объединением их является вся плоскость. Если у нас имеется неравенство 2л:+3у <!6, то его образ будет объединением образов (а) и (Ь); следовательно, он яв¬ ляется объединением открытой полуплоскости и ее границы, ко¬ торое мы назовем замкнутой полуплоскостью. Подобный же ана¬ лиз показывает, что ах + by = с всегда имеет в качестве образа прямую линию, ах + Ьу<с — открытую полуплоскость, а ах + by — замкнутую полуплоскость. Дадим несколько иное истолкование образов, которое при¬ даст приведенным рассмотрениям большую ясность. Уравнение или неравенство относительно х и у можно мыслить как выска¬ зывание, истинность или ложность которого зависит от того, ка¬ ковы х и у, т. е. какова точка (х, у). Таким образом, каждая точка плоскости представляет одну логическую возможность, а всю плоскость можно мыслить как множество U всех логических возможностей. Тогда «образ» будет просто множеством истин¬ ности соответствующего высказывания. Так как (а), (Ь) и (с) образуют полную систему альтернатив (см. § 8 гл. I), то их мно¬ жества истинности не пересекаются, и объединением их будет U (см. § 1 гл. II); следовательно, они образуют разбиение мно¬ жества U. Высказывание 2х-\-Зу^6 эквивалентно (а) V (Ь), и,
§ 1. Выпуклые множества 35 9 следовательно, его множеством истинности будет объединение множеств истинности (а) и (Ь). Предположим теперь, что мы рассматриваем системы нера¬ венств и разыскиваем их совместные решения. Например, рас¬ смотрим систему (d) *>0, (e) У >0, ({) Чх-\- Зу <6. Здесь мы утверждаем, что истинны три высказывания, т. е. конъ юнкция этих трех высказываний. Следовательно, множеством истинности будет пересечение трёх соответствующих множеств истинности. Мы уже знаем, что образом (f) является замкнутая полуплоскость, заштрихованная на фиг. 124. Образом (d) яв¬ ляется правая замкнутая полуплоскость, а образом (е) служит верхняя замкнутая полуплоскость Их пересечение представляет собой треугольник (вместе с его сторонами), заштрихованный на фиг. 125. Эта область содержит все точки, удовлетворяющие нашей системе неравенств. Определение. Пересечение замкнутых полуплоскостей называется многоугольным выпуклым множеством. Теорема. Точки, удовлетворяющие системе линейных не¬ равенств типа < , образуют многоугольное выпуклое множество. Эта теорема вытекает из того факта, что каждое неравенство типа (но не <) имеет своим множеством истинности замкну¬ тую полуплоскость и что система таких неравенств имеет своим Множеством истинности пересечение этих полуплоскостей. Упражнения 4. Изобразите многоугольные выпуклые множества, которые задаются реше¬ ниями следующих систем линейных неравенств. (Указание. Сначала
366 Глава VI*. Линейное программирование и теория игр постройте отдельные замкнутые полуплоскости и затем возьмите их пере¬ сечение.) (а) *<3, (Ь) 2* + Зу>6, У < 2, — х + у < 2, 2х -f- Зу > 0; х у < 3; (с) 2х + Зу < 6, (d) у > 0, — X + у < 2, * > О, х + у < 3; х < 2; (е) *<2, (f) Зх-|-2у< — 6, х > — 2, 3* -|~ 2у < 6; У <3, У > — 3; (g) 3* + 2у>6, (h) * — у>0, Зх -f- 2у < 6; х + У < 0; (О х ^.2, (j) Зх -J- 2у ^ 6, х > 5; 2х + Зу > 6, х>0, У >0. (к) 2л: + у>7, О, У <0; 2. Возьмем следующие множества: 2/—вся плоскость; А — полуплоскость, являющаяся образом неравенства 2х + у < 3 В — полуплоскость, являющаяся образом неравенства — 2х + у > 3 С — полуплоскость, являющаяся образом неравенства — 2х + г/< 3 D. — полуплоскость, являющаяся образом неравенства —2х + у^3\ L — прямая, являющаяся образом равенства — 2х + у = 3; О — пустое множество. Покажите, что для этих множеств имеют место соотношения: Л = Д £ = С, L^A{jB, Cf[D =z L, А[\В = о, А[\С = А, Bf)D = B, A\JD = U, B\}C = l£, А[}С = С, B\JD = Д A\JL = C, B[)L = D. Можете ли вы указать другие соотношения? 3. Какие из многоугольных выпуклых множеств, построенных в упр. 1» лежат в ограниченной части плоскости и какие простираются в беско¬ нечность? Что служит границей первых множеств? [Отв.: (с), (d), (f), (h) и (j) простираются в бесконечность; (g) есть прямая.] 4. Для каждой из следующих полуплоскостей укажите неравенство, имею¬ щее эту полуплоскость своим множеством истинности: (a) Открытая полуплоскость, лежащая над осью х. [Отв.: у > 0.] (b) Замкнутая полуплоскость, лежащая над биссектрисой угла, образо¬ ванного осями координат.
§ 1. Выпуклые множества 361 Упражнения 5—9 относятся к ситуации, в которой одно семейство решает купить х книг и у альбомов. Каждая книга стоит 4 доллара и каждый альбом стоит 3 доллара. 5. Нельзя купить отрицательное число книг или альбомов. Запишите это условие в виде неравенств и изобразите их множества истинности. 6. Имеется всего 6 книг и 6 альбомов, которые им нравятся. Учитывая это обстоятельство, видоизмените множество, построенное в упр. 5. 7. Семейство собирается истратить не более 24 долларов. Видоизмените множество, построенное в упр. 6. 8. Оно решило истратить на книги по крайней мере в два раза больше де¬ нег, чем на альбомы. Видоизмените множество в упр. 7. 9. Семейство решило истратить на альбомы 9 долларов. Какая имеется свобода выбора возможностей? [Отв.: Никакой.] 10. Предположим, что следующие высказывания истинны: организм каждого человека требует по меньшей мере 0,02 г фосфора в день; каждому взрослому, человеку требуется 0,01 г кальция; детям (но не младенцам) требуется 0,03 г кальция, а каждому младенцу — 0,04 г кальция. Будем откладывать по оси у количества фосфора, а пб оси х — количества кальция. Постройте выпуклые множества минимальных потребностей для взрослых, младенцев и детей. Укажите, какие из следующих утвер¬ ждений истинны: (a) Потребности взрослых удовлетворены только тогда, когда удовле¬ творены потребности детей. (b) Если удовлетворены потребности детей, то удовлетворены и потреб¬ ности младенцев. (c) Потребности детей удовлетворены только тогда, когда удовлетворены потребности младенцев. [Отв.: (а) Истинно. (Ь) Ложно, (с) Ложно] 11. Предположим, что минимальные количества фосфора и кальция, требую¬ щиеся людям, даются следующей таблицей: Фосфор Каль¬ ций Взрослые Дети Младенцы 0,02 0,03 0,01 0,01 0,03 0,02 Пусть по оси у откладываются количества фосфора, а по оси л; — коли¬ чества кальция. Постройте выпуклые множества минимальных норм для взрослых, детей (не младенцев) и младенцев. Определить, какие из сле¬ дующих утверждений истинны: (a) Если удовлетворены потребности детей, то удовлетворены и потреб¬ ности взрослых. (b) Потребности младенцев удовлетворены только тогда, когда удовле¬ творены потребности детей. (c) Потребности взрослых удовлетворены только тогда, когда удовлетво¬ рены потребности младенцев. ^ (d) Потребности как взрослых, так н младщщев удовлетворены только тогда, когда удовлетворены потребности детей. (e) Можно удовлетворить потребности взрослых, не удовлетворив потреб¬ ности младенцев,
362 Г лава VI*. Линейное программирование и теория игр § 2. МАКСИМУМЫ И МИНИМУМЫ ЛИНЕЙНЫХ ФУНКЦИЙ Многоугольное выпуклее множество может располагаться в конечной части плоскости или простираться в бесконечность. Эти возможности были проиллюстрированы в упр. 1 предыду¬ щего параграфа. Множества, заключающиеся в конечной части плоскости, подобно множеству, изображенному на фиг. 125, со¬ стоят из замкнутой ломаной и точек внутри нее. Удобно назы¬ вать такое множество многоугольником; таким образом, много¬ угольник представляет собой многоугольное выпуклое множе¬ ство, расположенное в конечной части плоскости. Так как ка¬ ждый такой многоугольник представляет собой выпуклое мно¬ жество (см. упр. 8 этого параграфа), то мы будем называть его выпуклым многоугольник ом. Многоугольник с п сторонами имеет и п углов. Например, треугольник, изображенный на фиг. 125, имеет три угла (0, 0), (3, 0) и (0, 2). Вершина получается в результате пересечения двух прямых, следовательно, вершина многоугольника является пересечением границ двух полуплоскостей. Теперь мы можем интерпретировать различные точки выпук¬ лого многоугольника в терминах системы неравенств. Всякая вершина угла лежит на двух граничных прямых, поэтому для нее два из. этих неравенств превращаются в равенства. Точка, лежащая на стороне и не являющаяся вершиной, принадлежит одной граничной прямой; следовательно, для нее одно неравен¬ ство превращается в равенство. Внутренняя точка многоуголь¬ ника должна, очевидно, соответствовать тому случаю, когда все неравенства являются строгими неравенствами, т. е. такими, для которых выполнено не только условие < но и условие <. Приведенное описание годится для общего случая. В случаях, когда, например, в одной точке пересекаются три прямые или некоторые неравенства являются лишними, могут быть сделаны очевидные видоизменения. Пример 1. Рассмотрим систему уравнений (d) — (f) из предыдущего параграфа. В вершине (0, 0) неравенства (d) и (е) обращаются в равенства * = 0 и у = 0. Для вершины (0, 2) в равенства обращаются (d) и (f), для вершины (3, 0) — (е) и (f). Что же касается граничных точек, отлич¬ ных от вершин, то для стороны, принадлежащей оси у-ов, (d) обращается в равенство; для стороны, принадлежащей оси х-ов, в равенство обращается (е), а для наклонной стороны—(f). Для внутренних точек треугольника не вы¬ полняется ни одно из этих равенств.
§ 2. Максимумы и минимумы линейных функций 363 Пример 2. Найдем многоугольное выпуклое множество, определенное следующей системой неравенств: 2х —(- у -j— 9 О, — х —Зу -\- 6 О, х 4- 2у — 3 О, уже грубый набросок соответствующего чертежа показы¬ вает, что эго множество будет треугольником. Следователь¬ но, мы можем найти вершины, заменяя каждые два из этих неравенств равенствами и решая полученные системы урав¬ нений. Первые два дадут (—3, —3), первое и третье — ■ Следовательно, иско¬ мый многоугольник будет треугольником с вершинами в этих точках. Пример 3. Предположим, что в некоторой деловой за¬ даче х и у являются величинами, которые мы можем выби¬ рать по усмотрению в пределах ограничений, имеющих форму неравенств. Будем считать, что выбор х и у ограни¬ чен системой неравенств, заданной в предыдущем примере. Предположим, что величины х и у обусловливают прибыль, равную х 2у долларов. Каковы наибольшее и наимень¬ шее значения возможной прибыли? Мы должны найти ми¬ нимальное и максимальное значение х + 2у для точек (.х, у) треугольника. Испробуем сначала вершины. В точке (—3, —3) мы должны иметь прибыль, равную —9, т. е. убыток в 9 долларов. В точке (—7, 5) мы имеем прибыль в 3 доллара и в точке у)— также прибыль в 3 дол¬ лара. Что можно сказать об остальных точках треуголь¬ ника? Последнее неравенство эквивалентно неравенству х + 2у <. 3. Следовательно, прибыль не может превышать 3 доллара. Если первое неравенство мы умножим на у,; 3 второе на у и сложим эти неравенства, то получим лг + 2у>— 9; следовательно, убыток не может превышать 9 долларов. Это показывает, что как наибольшая прибыль, так и наибольший убыток достигаются в вершинах. Ниже мы покажем, что это верно и в общем случае. Пусть имеется выпуклый многоугольник и функция ах + by (понимаемая как линейная функция от точек плоскости). Мы хо¬ тим доказать, что максимальное (минимальное) значение функ¬ ции ах + by всегда принимается ею в некоторой вершине много¬ угольника. Сначала мы покажем, что значения функции ах + by (—7,5), а два последних — ^у
361 Глава VI*. Линейное программирование и теория игр на любом отрезке прямой лежат между значениями этой функ¬ ции в двух граничных точках отрезка (возможно, совпадая со значением в граничной точке). Будем представлять каждую точку плоскости посредством вектора-строки (х, у), компоненты которого равны координатам этой точки. Тогда, очевидно, наша функция будет линейной функцией, представимой вектором-столбцом Пусть гранич¬ ными точками отрезка будут р = (х, у) и q = (х\ у'). В гл. V мы видели (ср. фиг. 114), что промежуточные точки можно за¬ писать в виде tp + (1 — t)q, где 0<Ctf^l. Если значения функ¬ ции в точках р и q равны соответственно А и В (для определен¬ ности пусть В <М), то вследствие линейности этой функции в промежуточной точке tp + (1—t)q она принимает значение Наименьшее значение В, У принимаемое в вершине Я tA + (1 — t)B. Это значение равно В + {А — B)t — числу, кото¬ рое не меньше чем В и не больше чем А. Теперь мы в состоянии доказать факт, проиллюстрированный на примере 3. Теорема. Линейная функция, определенная на выпуклом многоугольнике, принимает максимальное (минимальное) значе¬ ние в некоторой вершине этого многоугольника. Доказательство этой теоремы иллюстрируется фиг. 126. Пусть наибольшее из значений, принимаемых функцией в вер¬ шинах многоугольника, принимается ею в вершине р и равно А, а наименьшее из таких значений принимается в вершине^ и рав¬ но В. Пусть, далее, г—произвольная точка многоугольника. Проведем прямую через р и г до пересечения с точкой и, лежа¬ щей на стороне многоугольника, которая соединяет, скажем, вер¬ шины sat. (Эта прямая может пересечь границу многоугольни
§ 2. Максимумы и минимумы линейных функций 365 ка в вершине s\ наш анализ от этого не изменится.) По предпо¬ ложению значение функции в любой из вершин должно лежать между В и А. Согласно предыдущему результату, значение функции в точке и заключено между теми значениями, которые она принимает в точках s и / и, следовательно, также между В и А. Опять, согласно предыдущему результату, значения функ- •ции в точке г заключено между ее значениями в р и в и и, следо¬ вательно, также между В и А. Так как г—произвольная точка многоугольника, то наша теорема доказана. Допустим, что вместо линейной функции ах + by рассматри¬ вается функция ах + by + с. Прибавление константы с сводится к изменению каждого значения этой функции, включая ее ма¬ ксимальное и минимальное значения, на величину с. Следова¬ тельно, рассуждение о том, где эта функция принимает макси¬ мальное и минимальное значения, может быть проведено, как и в случае линейной функции, и мы имеем следующую (более об¬ щую) теорему: Теорема. Функция ах + by + с, определенная на выпуклом многоугольнике, принимает свое максимальное (минимальное) значение в некоторой вершине этого многоугольника. Метод нахождения максимума или минимума функции ах + by + с на выпуклом многоугольнике состоит в следующем. Мы находим вершины этого множества, которых имеется конеч¬ ное число; подставляем их координаты в функцию; наибольшее из полученных таким образом значений будет максимумом этой функции, а наименьшее — минимумом. Иллюстрацией этого ме¬ тода может служить пример 3, разобранный выше. Упражнения 1. (а) Нарисуйте выпуклый многоугольник, полученный в примере 2. (b) Нарисуйте выпуклое множество, заданное неравенствами 2х + у-|-9<0, — jc -)- Зу + 6 <; о, х -\-2 у — 3 < 0. (c) Какое имеется соотношение между этими двумя множествами? 2. Найдите вершины выпуклых многоугольников, заданных в пп. (а), (Ь) и (е) упр. 1 предыдущего параграфа. [Отв.: (а) (3—2), (3, 2), (-3, 2); (е) (2, 3), (-2, 3), (2, —3), (-2, -3).] 3. (а) Покажите, что три прямые, заданные уравнениями 2х+ у+ 9 = 0, — х -|- Зу -Ь 6 = 0, х -]- 2у — 3 = 0,
366 Глава VI*. Линейное программирование и теория игр разбивают плоскость на семь выпуклых областей. Обозначим эти области римскими цифрами I—VII. (b) Для каждой из семи областей, найденных в п. (а), напишите систему трех неравенств, имеющую эту область своим образом. [Указание. Две из этих систем неравенств рассмотрены в упр. 1.] (c) Имеется еще один способ получения системы неравенств из системы трех уравнений, заданных в п. (а). Что служит образом этой послед¬ ней системы неравенств? [Отв.: Пустое множестве О.] 4. (а) Найдите максимум и минимум функции /(X, у) = -2х + 5у + 17 на каждом из выпуклых многоугольников, заданных в пунктах (а), (Ь) и (е) упр. 1 из § 1. [Отв.: (а) 33, 1; (е) 36, —2.] Найдите минимум, если он существует, функции f(x, у) = 5х + 3у—6 на каждом из многоугольных выпуклых множеств, заданных в пп. (h), (i) и (j) упр. 1 из § 1. [Отв.: (h) Нет ни минимума, ни максимума; (j) минимум равен 3.] 5. (а) Найдите вершины выпуклого многоугольника, заданного посредством неравенств 2х -|— у -|- 9 О, — х -j- Зу -|- 6 ^ О, х -|- 2у — 3<0, X + у <о. [Указание. Используйте некоторые результаты примера 2 в тексте.] (Ь) Найдите максимум и минимум функции f(x, у) = 7х + Ъу — 3 на вы¬ пуклом многоугольнике, заданном в п. (а). [Отв.: максимум = 0, минимум = —39.] 6. Выпуклый многоугольник имеет своими вершинами точки (—I, 0), (3, 4), (0, —3) и (1, 6). Найдите систему неравенств, которая определяет этот выпуклый многоугольник. 7. Рассмотрим многоугольное выпуклое множество Р, определенное посред¬ ством неравенств — 1<дг<4, 0 < у < 6. Найдите четыре различные системы условий на константы а и Ь, при которых функция f(x, у) = ах + by имела бы максимум в одной и только одной из четырех вершин множества Р. Найдите условия, при которых / имела бы минимум в каждой из этих точек. [Отв.: Например, максимум будет в (4, 6), если а>0 и b > 0.] 8. Множество точек называется выпуклым, если всякий раз, когда оно со¬ держит две точки, оно содержит также и весь отрезок прямой, их соеди¬ няющий. Покажите, что: # (a) если две точки принадлежат множеству истинности какого-нибудь линейного неравенства, то любая точка соединяющего их отрезка также принадлежит этому множеству истинности; (b) каждое многоугольное выпуклое множество является выпуклым мно¬ жеством в указанном смысле.
§ 3. Задачи линейного программирования 367 9. Приведите пример четырехугольника, не являющегося выпуклым множе¬ ством. 10. Докажите, что для любых трех векторов р, q и г множество всех точек вида ар + bq + сг (а >- 0, b ^ 0, с ■> 0, a + b + c= 1) есть выпуклое множество. Какую геометрическую фигуру представляет этот образ? [Отв.. В общем случае это будет треугольник.] § 3. ЗАДАЧИ ЛИНЕЙНОГО ПРОГРАММИРОВАНИЯ Важный класс практических задач составляют те задачи, в которых требуется найти максимум или минимум функции вида ах 3- by Л- с, определенной на выпуклом множестве точек. Мы проиллюстрируем эти так называемые задачи линейного про¬ граммирования на следующих примерах. Пример 1. Некий предприниматель заказывает телеви¬ зионной компании рекламу своей продукции; при этом он хочет воспользоваться выступлением комического артиста для того, чтобы привлечь зрителей. Всего на передачу ему отпускается полчаса и он должен распределить время. Пусть х есть число минут, отводимое на рекламу, а у — число минут, отводимое на выступление артиста. По са¬ мому своему определению величины х и у неотрицательны. Предположим, что заказчик настаивает на том, чтобы пе¬ редача рекламы продолжалась не менее трех минут, а те¬ левизионная компания требует, чтобы передача рекламы продолжалась не более 15 минут. По условию продолжи¬ тельность передачи рекламы плюс продолжительность вы¬ ступления артиста составляет полчаса, т. е. х + у = 30. По¬ следнее уравнение может быть записано в виде двух нера¬ венств х + у ^ 30 HX + f/<^30. В итоге мы получаем сле¬ дующую систему неравенств: *>3, х < 15, У >0, х у ^ 30, х-\-у < 30. «Многоугольник», определенный этими неравенствами, представляет собой отрезок прямой, изображенный на фиг. 127. Вершинами его служат точки (3, 27) и (15, 15). У заказчика имеется два мотива: он хочет по возмож¬ ности уменьшить стоимость передачи и увеличить число людей, которые смотрят ее. Предположим, что минута вы¬ ступления артиста стоит 200 долларов, а минута рекла-
368 Глава VI*. Линейное программирование и теория игр мы — 50 долларов. Тогда функцией стоимости будет С = 50х + 200у. Кроме того, предположим, что каждая минута выступления артиста увеличивает число телезрите¬ лей на 70 000, а каждая минута рекламы увеличивает это число на единицу. Тогда для N (общего числа зрителей) мы получаем формулу N = х + 70 000у. Заказчик хочет минимизировать С и максимизировать N. Путем подстановки координат вершин нашего «много¬ угольника» вместо х и у мы на¬ ходим, что точка (15, 15), т. е. 15 минут рекламы и 15 минут выступления артиста, дает наи¬ меньшую стоимость передачи, равную 3750 долларам. С дру¬ гой стороны, точка (3, 27), т. е. три минуты рекламы и 27 минут выступления арти¬ ста, дает максимальное число зрителей, именно 1 890 003. Эти результаты находятся в полном согласии со здравым смыслом. Пример 2. Допустим теперь, что комический артист от¬ казывается (из-за недостатка в шутках) выступать в про¬ должение более чем 22 минут. Чтобы заполнить остаю¬ щееся время, в передачу включают выступление оркестра. Теперь мы имеем х + у <1 30 для числа минут, отводимого на рекламу и выступление артиста, 30 — х — у для числа минут, отводимого на выступление оркестра. Мы получаем следующие неравенства: *>3, х < 15, У >0, у < 22, х-\-у < 30. Многоугольник, соответствующий этим неравенствам, пока¬ зан на фиг. 128. Он имеет пять вершин (3, 0), (15, 0), (15, 15), (8, 22) и (3, 22). Предположим, что выступление оркестра в течение одной минуты стоит 250 долларов; тогда функцией стоимости будет С = 50* + 200у + 250 (30 — * — у) = 7500 — 200* — 50у.
§ 3. Задачи линейного программирования 369 Точкой минимальной стоимости служит (15, 15); соответ¬ ствующая стоимость передачи равна 3750 долларам. Так как х + у = 30, то мы видим, что при этом решении оркестр не участвует в передаче. Обращаясь к вопросу о максимальном числе зрителей, допустим вначале, что оркестр не пользуется никаким успе¬ хом у телезрителей. Тогда функция N будет такой же, что и в примере 1. Точкой максимума зрителей служит точка (8, 22), дающая 1 540 008 зрителей. Снова х + у = 30, так что оркестр опять не играет. Точна максимума зрителей; если оркестр пользуется успехом Точка минимальной стоимости, если оркестр играет бесплотно Точка максимума зрителей, если оркестр не пользуется успехом у- Точка минимальной стоимости, / если выступление оркестра (15 15) 6 течение одной минуты стоит 250 долларов Отрезок точек минимальной стоимости, если выступление оркестра стоит * столько же, сколько выступление артиста Точка минимальной стоимости, если выступление оркестра в тече¬ нии одной минуты стоит 150 долларов Допустим теперь, что оркестр пользуется успехом у зри¬ телей. Для определенности предположим, что каждую ми¬ нуту, когда играет оркестр, число зрителей увеличивается на 10 000. Тогда наша функция N принимает вид: N = jc + 70000у + 10000(30 — х — у) = = — 9999х 4- 60 000у + 300 000. Здесь точкой максимума зрителей будет точка (3, 22), даю¬ щая наибольшее число зрителей, равное 1 590 003. Отметим, что в этом случае оркестр играет 5 минут. Пример 3. Предположим теперь, что заказчик находит затруднительной оплату подобной передачи и хочет отка¬ заться от своего заказа. Чтобы сохранить заказ, телеви¬ зионная компания снижает стоимость выступления оркестра до 150 долларов в минуту. Функция стоимости принимает тогда вид С = 50х + 200у + 150(30 — х — у) = - IOOjc + 50у + 4500, 24 За к. 60?
370 Глава VI*. Линейное программирование и теория игр В этом случае точкой минимальной стоимости будет (15,0). Это означает, что комический артист не участвует в передаче, которая теперь состоит из 15 минут рекламного текста и 15 минут оркестровой музыки. Минимальная стои¬ мость равна 3000 долларов. Допустим, что эта стоимость все еще слишком высока для заказчика, и телевизионная компания предлагает орга¬ низовать выступление оркестра бесплатно при условии, что заказчик продолжает платить за рекламу. Функция стои¬ мости в этом случае будет иметь вид С = 50х -4- 200у. Здесь точкой минимума стоимости будет (3, 0). Это озна¬ чает, что программа состоит из 27 минут оркестровой му¬ зыки и трех минут рекламы. Минимальная стоимость пере¬ дачи равна 150 долларам. Пример 4. Предположим, что в условиях примера 2 как выступление оркестра, так и выступление комического ар¬ тиста обходится в 200 долларов за минуту. Тогда функция стоимости запишется так: С = 50* + 200у +- 200 (30 — * — у) = — 150* + 6000. Здесь появляется нечто новое, так как обе вершины (15, 15) и (15, 0) дают одинаковую минимальную стоимость в 3750 долларов. Заметим, что в одном случае 15 минут от¬ водится на выступление артиста и совсем не отводится времени на музыку, а в другом случае 15 минут отводится на музыку и совсем не отводится времени на выступление артиста. Какое из этих решений следует принять? Посколь¬ ку нас интересует лишь стоимость передачи, то это не имеет значения: оба решения одинаково хороши. Более того, если мы произвольно распределим 15 минут между выступлением оркестра и выступлением артиста, это также приведет нас к некоторому решению, дающему минималь¬ ную стоимость. Таким образом, каждая точка (15, у), где 0 У < 15, дает нам решение вопроса о минимальной стои¬ мости передачи. Мы обнаружили общий принцип: всякий раз, когда наша функция принимает одно и то же значение в каждой из двух вершин, то она принимает это же значение во всякой точке от¬ резка прямой, соединяющего вершины. Это следует из того, что значение на отрезке прямой всегда лежит между значениями, принимаемыми в его концевых точках (см. предыдущий пара- траф). Следовательно, если обе вершины дают минимальное (или максимальное) значение рассматриваемой функции, то то
§ 3. Задачи линейного программирования 371 самое имеет место и для каждой точки соединяющего их от¬ резка. Вышеприведенные примеры показывают, что любая вершина или даже любая точка отрезка, соединяющего две из них (и, следовательно, любая точка многоугольника), может служить решением задачи линейного программирования в зависимости от того, каковы фактические данные и чего хотят достичь. Эти фактические данные полностью определяются заданием зна¬ чений рассматриваемой функции в вершинах многоуголь¬ ника. Нижеследующие упражнения могут быть решены тем же способом. Сначала надо найти вершины выпуклого многоуголь¬ ника, затем подставить их координаты в функцию, которую требуется минимизировать или максимизировать, и, наконец, определить, какая вершина (или вершины) дает решение за¬ дачи. Упражнения 1. Допустим, что в примере 2 комический артист и оркестр, каждый в от¬ дельности, обходятся дороже, чем реклама. Покажите, что если заказчик хочет минимизировать стоимость передачи, то будут истинны следующие высказывания: (a) если комический артист обходится дороже, чем оркестр, то он не должен участвовать в передаче; (b) если оркестр обходится дороже, чем комический артист, то он не дол¬ жен участвовать в передаче; (c) если комический артист и оркестр обходятся одинаково, то в точке минимальной стоимости 15 минут отводится на рекламу, а остальные 15 минут делятся в любой пропорции между оркестром и артистом. 2. В известном детском стишке говорится: «Хилый Джек не ест сала. Его жена Джилл не ест постного мяса...» Допустим, что Джек съедает в день не менее одного фунта постного мяса, а Джилл требуется в день 0,4 фунта сала. Предположим, что они покупают только говядину, на 10% состоящую из сала и на 90% — из постного мяса, и свинину, на 40% состоящую из сала и на 60%—из постного мяса. Джек и Джилл хотят удовлетворить свои потребности, затратив наименьшее количество денег. (a) Пусть х — количество говядины, а у — количество свинины, покупае¬ мые ими в день. Постройте выпуклое множество точек, предста¬ вляющих те покупки, которые обеспечивают каждодневный рацион мяса и сала. (b) Наложите ограничение на покупки, превращающие это множество в выпуклый многоугольник. (c) Покажите, что если фунт говядины стоит 1 доллар, а фунт свинины стоит 50 центов, то самая дешевая закупка продуктов будет состоять только из свинины. Найдите эту минимальную стоимость покупки. [Отв.: 0,83 доллара.] 24*
3 72 Г лава VI*. Линейное программирование и теория игр (d) Покажите, что если фунт говядины стоит 75 центов, а фуыг свнпинЬ1 50 центов, то точки, минимизирующие стоимость покупки, заполняют целый отрезок. Найдите минимальную стоимость. [|Отв.: 0,83 доллара.] (e) Покажите, что если говядина и свинина стоят по 1 доллару за фунт то единственная точка минимальной стоимости представляет покупку] включающую как говядину, так и свинину. Найдите минимальную стоимость. [Отв.: 1,40 доллара] (f) Покажите, что ограничения, наложенные в п. (Ь), не изменяют отве¬ тов на пп. (с) — (е). 3. В условиях упр. 2 (d) покажите, что для всех точек минимальной стои¬ мости, кроме одной, количество сала превышает минимальный рацион, тогда как количество постного мяса всегда равно минимальному рациону Джека. Покажите, что для всех точек минимальной стоимости, кроме одной, количество говядины не равно нулю. 4. В условиях упр. 2 (е) покажите, что как Джек, так и Джилл получают в точности минимальный рацион. 5. Пусть фунт свинины стоит 1 доллар. До какой величины должна пони¬ зиться цена на говядину, чтобы Джек и Джилл перестали покупать сви¬ нину? [Отв.: 0,25 доллара.] 6. Пусть в условиях упр. 2 Джек решил уменьшить свой минимальный ра¬ цион постного мяса до 0,6 фунта. Как изменится выпуклое множество? Как изменятся ответы к пп. (с), (d) и (е) упр. 2? 7. Один фермер-птичник занимается разведением кур, уток и индеек и имеет на своей ферме помещение для 500 птиц. Он хочет, чтобы общее число; птиц равнялось 500, но чтобы число уток ни в какой момент не превы¬ шало 300. Предположим, что выкормить курицу стоит 1,5 доллара, утку 1 доллар и индейку 4 доллара. Предположим, что фермер может продать кур по 3 доллара, уток — по 2 доллара и индеек — по Т долларов за штуку. Он хочет решить, какой вид птиц следует разводить для получе¬ ния максимальной прибыли. (a) Пусть х — число кур и у — число уток, которых фермер хочет выкор¬ мить. Тогда 500 — х — у равно числу выкармливаемых им индеек. Каково выпуклое множество возможных значений х и у, удовлетво¬ ряющих описанным ограничениям? (b) Найдите выражение для стоимости выкармливания х кур, у уток и 500 — х — у индеек. Найдите выражение для общей суммы, которую фермер получит за этих птиц. Вычислите прибыль, которую он полу¬ чит при этих условиях. (c) Покажите, что если Т = б долларов, то для получения максимальной прибыли фермер должен разводить одних только индеек. Какова максимальная прибыль? [Отв.: 1000 долларов.] (d) Покажите, что если Т = 5 долларам, то фермер должен разводить одних кур. Найдите максимальную прибыль.. [Отв.: 750 долларов.] (e) Покажите, что если Т = 5,5 доллара, то фермер может разводить любую комбинацию кур и уток. Найдите максимальную прибыль. [Отв.: 750 долларов.] 8. Проделайте упр. 7 для случая, когда цена курицы равна 2 долларам, а Т равно (а) 6 долларам, (Ь) 5 долларам, (с) 4,5 доллара и (d) 4 дол¬ ларам. 9. В условиях упр. 7 покажите, что если цена индейки падает ниже 5,5 дол¬ лара, то фермер должен разводить только кур. Покажите также, чтр если эта цена превышает 5,5 доллара, то он должен разводить только индеек.
§ 4. Строго детерминированные игры 373 10. Пусть /—линейная функция точки (*,#), где {х, у)— вероятностный вектор. (a) Запишите ограничения на х и у. (b) Найдите множество истинности этой системы условий. (c) Для каких вероятностных векторов функция / может достигнуть максимума? [Отв.: (1,0) или (0,1).] Упражнения 11—20 относятся к следующей задаче. На одной птицеферме имеется 10 кур и 32 яйца. В данный период времени ку¬ рица может использоваться либо для высиживания 4 цыплят, либо для снесения б яиц. Фермер хочет использовать имеющийся в его рас¬ поряжении материал в течение двух периодов времени, после чего продать всех кур и все яйца. (Продукция первого периода может быть использована во втором!) Как должен фермер использовать своих кур, чтобы получить максимальный доход? 11. Допустим, что в первый период х кур высиживают цыплят, а 10 — * не¬ сутся. Какие ограничения на л налагаются имеющимся числом кур и яиц? (Мы предполагаем, что яйца могут сохраняться и, следовательно, могут использоваться лишь частично.) [Отв.: 0<;*<;8.] 12. Сколько кур будет к концу первого периода, считая первоначальных кур и вновь высиженных? Сколько будет яиц, считая первоначальные и вновь снесенные, но без тех, которые использовались для высижи¬ вания цыплят? 13. Предположим, что во втором периоде у кур высиживают цыплят, а остальные несутся. Какие ограничения на у налагаются имеющимся числом кур и яиц? Сколько кур будет нестись? 14. Постройте выпуклый многоугольник, определенный посредством ограниче¬ ний на л* и у. [Указание. Он имеет пять сторон.] 15. Сколько яиц и сколько кур будет иметься к концу второго периода? [Отв.: 152+14*—10#; 10 + 4* + 4#.] 16. Пусть яйца продаются по 5 центов, а куры — по 25 центов. Выразите доход фермера через * и у. [Отв.: 1010 + 170* + 50# центов.] 17. При каких х и у этот доход будет наибольшим? Чему равен максималь¬ ный возможный доход? [Отв.: х = 8, у = 3; 25,20 долларов.] 18. Для варианта, указанного в решении упр. 17, определите число яиц и кур на каждой стадии. Чем характеризуется это решение? [Отв.: Каждый раз высиживается максимально возможное число цыплят.] 19. Пусть яйца продаются по 5 центов, а куры — по 35 центов. Какие * и у дают максимальный доход? Чему он равен? [Отв.: 2, 18; 31,50 долларов.] 20. Определите число яиц и кур и сравните с результатами упр. 18. § 4. СТРОГО ДЕТЕРМИНИРОВАННЫЕ ИГРЫ Мы переходим теперь от линейного программирования к тео¬ рии стратегических игр. Хотя на первый взгляд эти две теории совершенно различны, однако на самом деле между ними суще¬ ствует тесная связь. В задаче линейного программирования речь идет об одном человеке, который старается максимизиро¬ вать или минимизировать функцию от двух или более перемен¬
374 Глава VI*. Линейное программирование и теория игр ных, заданную на многоугольном выпуклом множестве. Теория игр рассматривает ситуации, в которых участвуют два человека (а иногда и более), причем их поведение влияет на исход неко¬ торого события,, не определяя его полностью. Отдельные участ¬ ники игры обычно преследуют различные цели. Теория игр по¬ зволяет находить для таких игр решение, основанное на прин¬ ципе, что каждый игрок старается действовать так, чтобы обес¬ печить себе некоторый итог независимо от действий противника. Большинство развлекательных игр, как, например, крестики и нолики, шашки, триктрак1), шахматы, покер, бридж и другие карточные игры, можно рассматривать как стратегические игры. Азартные игры вроде игры в кости, рулетки и т. д. обычно не относятся к разряду стратегических игр, так как человек, играющий в них, всего лишь «играет со случаем» 2). Упомянутые стратегические игры слишком сложны, чтобы их можно было полностью проанализировать. Вместо этого мы спе¬ циально построим некоторые более простые игры, быть может недостаточно занимательные с точки зрения игрока, но доступ¬ ные исследованию и могущие служить для иллюстрации общей теории. В этом и следующем параграфах мы рассмотрим несколько простых примеров игр. В § 6 будет дано общее определение матричной игры. Пример. Рассмотрим следующую карточную игру. Имеется два игрока, назовем их А и В. Игрок А получает красную пятерку и черную пятерку, а игрок В черную пя¬ терку и красную тройку. Игра, которая ими ведется, со¬ стоит в следующем. По данному сигналу игроки одновре¬ менно показывают одну из своих двух карт; если эти карты одного цвета, то игрок А выигрывает (положительную) разность числа очков на картах; если же карты различного цвета, то игрок В выигрывает (положительную) разность числа очков. Очевидно, стратегическое решение, принимае¬ мое каждым игроком, заключается в выборе того, какую карту ему следует открыть. Эту игру удобно представить посредством матрицы, ко¬ торая изображена на фиг. 129. (В теории игр принято за¬ писывать матрицы в виде разграфленных таблиц.) Строки представляют возможные выборы игрока А, столбцы —- 9 Триктрак — старинная французская игра (аналогичная широко попу¬ лярной у нас на Кавказе и в Средней Азии игре «нарды»), в которой про¬ тивники передвигают фишки по специально разграфленной доске, бросая пе¬ ред каждым ходом кости, результат выпадения которых указывает возмоЖ' ные ходы. 2) К этой же категории «чисто случайных игр» относится и известная карточная игра «пьяница».
§ 4. Строго детерминированные игры 375 возможные выборы игрока В. Число, находящееся в строке с номером i и столбце с номером /, представляет выигрыш игрока А при выборе игроком А i-Й строки, а игроком В /-го столбца. Если какой-нибудь элемент положителен, это означает, что игрок В уплачивает игроку А. Отрицатель¬ ный «выигрыш» игрока А означает, что А уплачивает игроку В. Например, если А выбирает 1-ю строку (ходит ч. 5), а В выбирает 1-й столбец (ходит ч. 5), то А выигры¬ вает разность чисел 5 и 5, т. е. 0. Если А выбирает 1:ю стро¬ ку, но В выбирает 2-й столбец (ходит к.З), то В выигрывает раз¬ ность 2 минус 0, представленную элементом —2 нашей матрицы. Стратегические особенности игры полностью описываются этой мат¬ рицей. Игра, описанная посредством фиг. 129, называется матричной игрой. Любую (2 X 2)-матрицу можно рассматривать как матрицу, задающую игру с дву¬ мя противниками, если считать, что один игрок распоря¬ жается строками, а другой — столбцами и что элементы матрицы определяют размер выигрыша. В § 6 мы уви¬ дим, что матрицу с любым числом строк и столбцов так¬ же можно использовать для задания некоторой матричной игры. Какого образа действий должны придерживаться игроки в матричной игре, представленной на фиг. 129? Игроку В хочется сделать результатом игры элемент — 2 матрицы. Для этого он должен выбрать второй стол¬ бец матрицы; но тогда игрок А может выбрать вторую строку, и В вместо того, чтобы выиграть 2, проиграет 2. С другой стороны, если В выберет первый столбец (т. е. пойдет ч.5), то он обеспечит себе ничейный исход при любом ходе А. Очевидно, А ничего не проиграет, а, воз¬ можно, выиграет, если выберет вторую строку. Следова¬ тельно, так он и должен поступить. Зная, что А так именно и поступит, В укрепляется в своем решении выбрать пер¬ вый столбец. Итак, оптимальные процедуры для игроков состоят в том, что А должен пойти к. 5, а В должен пойти ч.5. Если оба игрока сыграют таким образом, то никто из них не выиграет у другого. Таким образом, эта игра является безобидной. Указание вида: «Пойти ч. 5» или «Пойти к.З» называется стратегией. Если игрок А применит стратегию «Пойти к.5» игроп д ч 5 игрой А /1.5 Ф и г. 129 ч.5 п.З 0 -2 0 2
376 Г лава VI*. Линейное программирование и теория игр в игре, матрица которой дана на фиг. 129, то независимо от поведения В он обеспечит себе самое меньшее нулевой элемент матрицы. Подобным же образом, если В применит стратегию «Пойти ч.5», то независимо от поведения А он обеспечит себе самое большее нулевой элемент матрицы, т. е. самое большее нулевой проигрыш. Так как А не может обеспечить себе независимо от действий В более чем нуле¬ вой выигрыш, а В не может обеспечить себе независимо от действий А менее чем нулевой проигрыш и так как эти два числа равны, то мы называем предыдущие стратегии оп¬ тимальными стратегиями в рассматриваемой игре. Мы также называем нуль ценой нашей игры. Это число служит исходом игры при использовании каждым игроком своей оптимальной стратегии. Определение. Будем говорить, что игра с (2 X 2)-матри¬ цей строго детерминирована, если эта матрица содержит эле¬ мент, скажем vy который одновременно является минимальным элементом в содержащей его строке и максимальным элементом в содержащем его столбце. Тогда оптимальные стратегии игро¬ ков состоят в следующем: для игрока А: «Выбрать строку, содержащую v», для игрока В: «Выбрать столбец, содержащий V». Ценой этой игры называется число v. Игра называется безобид¬ ной, если ее цена равна нулю. В § 6 будет показано, что определенные здесь стратегии оптимальны в упомянутом выше смысле и что значение v яв¬ ляется наилучшим из всех возможных для каждого игрока. Игра, заданная изображенной на фиг. 129 матрице, — строго детерминированная, так как 0, стоящий в левом нижнем углу матрицы, является минимальным элементом второй строки и максимальным элементом первого столбца. Заметим, что в этом примере оптимальные стратегии, получаемые из нашего общего определения, совпадают со стратегиями, найденными выше. Цена этой игры, согласно определению, равна нулю; следова¬ тельно, игра является безобидной. Для строго детерминированной игры решение находится осо¬ бенно легко, потому что каждый игрок знает оптимальную стра¬ тегию своего противника и, следовательно, знает, что ему де¬ лать. Не для всех игр с (2 X 2)-матрицей решение находится столь же просто, в чем мы убедимся в следующем параграфе. На фиг. 130 показаны три игры, заданные матрицами. Игра, представленная изображенной на фиг. 130, а матрицей, — строго детерминированная и безобидная. Оптимальные стратегии для
$ 4. Строго детерминированные игры 377 этой игры состоят в выборе игроком А первой строки, а игроком В—-первого столбца. Игра, представленная изображенной на 0 1 -3 10 0 1 2 0 а б в ' Фиг. 130 фиг. 130, б матрицей, — строго детерминированная, но не без¬ обидная, так как ее цена равна 2. [Каковы для нее оптимальные стратегии?] Наконец, игра, представленная фиг. 130, в, не является строго детерминированной. Разбор подобных игр по¬ служит темой следующего параграфа. Упражнения t. Определите, какие из игр являются строго детерминированными и какие являются безобидными. В тех случаях, когда игра строго детерминиро¬ вана, найдите оптимальные стратегии игроков. (а) (с) (е) (g) (0 0 2 ; (Ь) 5 0 —1 4 0 2 3 1 ; (d) i —1 4 0 -l 1 3 1 ; (0 0 4 —4 0 0 2 7 0 (h) 0 0 0 0 0 —7 0 0 ; (i) 1 1 0 0 1 1 [Отв.: (а) Строго детерминированная и безобидная; А выбирает 1-ю строку, В выбирает 1-й столбец; (Ь) не строго детерминирован¬ ная; (е) строго детерминированная, но не безобидная; А выбирает
378 Глава VI*. Линейное программирование и теория игр 1-ю строку, В выбирает 2-й столбец; (j) строго детерминированная, но не безобидная; каждый из игроков может применять любую стратегию.] 2. Пусть в примере 2 игрок А получает карты к. 5 и ч. 3, а игрок В — ч. 3 и к. 3. Укажите матричную игру, соответствующую этим условиям. Будет ли она строго детерминированной? Будет ли она безобидной? Найдите оптимальные стратегии игроков. [Отв.: Да. Да. Оба ходят ч. 3.] 3. Игроки показывают одновременно один или два пальца, и В платит А сумму, равную общему числу показанных пальцев. Напишите матрицу этой игры. Докажите, что эта игра .является строго детерминированной и найдите цену и оптимальные стратегии. 4. Игроки показывают (одновременно) один или два пальца, и В платит А сумму, равную произведению чисел показанных пальцев, а А платит В сумму, равную общему числу показанных пальцев. Постройте матрицу игры (элементы матрицы указывают чистый выигрыш А). Найдите цену и оптимальные стратегии. [Отв.: и = 1, А должен показывать один палец. В может показывать один или два пальца.] 5. Докажите, что строго детерминированная игра является безобидной тогда и только тогда, когда существует элемент, равный нулю, и такой, что оба элемента содержащей его строки неотрицательны, а оба элемента содер¬ жащего его столбца не положительны. 6. Рассмотрим игру с матрицей 2 5 —1 а (а) Покажите, что эта игра является строго детерминированной при лю¬ бом значении а. (б) Найдите цену G. [Отв.: 2.] (c) Найдите оптимальные стратегии игроков. (d) Если а= 1000 000, то, очевидно, А хотел бы иметь это число в ка¬ честве своего выигрыша Существует ли для него способ обеспечить себе такой выигрыш? К чему привела бы попытка А добиться его? (e) Покажите, что цена этой игры равна лучшему, чего может добиться Л. 7. Рассмотрим игру с матрицей G = а а с d Покажите, что эта игра строго детерминирована при каждом наборе значений для а, с и d. Покажите, что такой же результат справедлив в случае матрицы с одинаковыми элементами какого-нибудь столбца. 8. Найдите необходимые и достаточные условия для того, чтобы игра с мат¬ рицей G = а 0 0 b была строго детерминированной. (Указание. Они выразятся соотношениями между числами а и Ь и числом 0.)
§ 5. Не строго детерминированные игры 379 9. Допустим, что в примере, рассмотренном в тексте, игрок А получает карты ч.хик.у, а игрок В карты ч. и и к. о, где х,у,и wv — целые поло¬ жительные числа. Пусть матрица игры, в которую они играют, имеет вид: ч.х Игрок А к.у (a) Покажите, что если х = w, v > х и у то эта игра строго детер¬ минирована и безобидна. (b) Покажите, что если у = V, у х и то эта игра строго детер¬ минирована и безобидна. 10. Рассмотрим строго детерминированную игру с (2 X 2)-матрицей G. Пусть и и v — элементы этой матрицы, каждый из которых является минимальным элементом в содержащей его строке и максимальным эле¬ ментом в содержащем его столбце. Покажите, что тогда и = v. Игрок В ч.и K.V ^ — и V — X и — у у — V § 5. НЕ СТРОГО ДЕТЕРМИНИРОВАННЫЕ ИГРЫ Как видно из конкретных примеров предыдущего параграфа, некоторые матричные игры не являются строго детерминиро¬ ванными, т. е. соответствующая им матрица не содержит эле¬ мента, который был бы одновременно минимальным в своей строке и максимальным в своем столбце. Не строго детермини¬ рованные матричные игры с (2 X 2)-матрицей можно охаракте¬ ризовать следующим образом. Теорема. Игра с матрицей G = а ь с d не является строго детерминированной тогда и только тогда, когда выполнено одно из следующих двух условий: (i) а <by а < су d <Ь и d <с: (ii) а> by а> с, d> b и d> с. [Эти соотношения означают, что элементы, принадлежащие глав¬ ной диагонали матрицы, должны быть меньше (больше) каждого из двух элементов другой диагонали.] Доказательство. Если выполняется какое-либо из усло¬ вий (i) или (ii), то, как нетрудно проверить, ни один элемент матрицы не может быть одновременно минимальным в той
380 Глава VI*. Линейное программирование и теория игр строке, которой он принадлежит, и максимальным в том столбце, которому он принадлежит; следовательно, игра не будет строго детерминированной. Чтобы доказать вторую часть теоремы, вспомним, что, со¬ гласно упр. 7 предыдущего параграфа, игра является строго детерминированной, если в соответствующей ей матрице равны два элемента какой-либо строки или столбца. Следовательно, можно предположить, что никакие два элемента одной и той же строки или одного и того же столбца не равны. Допустим теперь, что а < Ь. Тогда а < с, иначе элемент а будет минимальным элементом своей строки и максимальным элементом своего столбца. Кроме того, с > d, иначе элемент с будет минимальным элементом своей строки и максимальным элементом своего столбца. Наконец, d < 6, иначе элемент d бу¬ дет минимальным элементом строки и максимальным элементом столбца. Следовательно, предположение а < b приводит к отме¬ ченному выше случаю (i). Аналогично предположение а>Ь приводит к случаю (И). Теорема доказана. Пример 1. Рассмотрим карточную игру из примера, при¬ веденного в предыдущем параграфе, и предположим, что игрок А имеет ч. 5 и к. 3, а игрок В имеет ч. 3 и к. 5. Пра¬ вила игры остаются прежними. Матрица игры имеет вид: Игрок В ч.З к.5 ч.5 Игрок А к.З Очевидно, эта игра не является строго детерминированной. Пример 2. Вернемся к примеру 1 из § 2 гл. III. Напо¬ минаем, что Джонс прячет билет в 1 или в 2 доллара, а Смит называет одно из чисел 1 или 2 и в случае правиль¬ ного ответа выигрывает билет. Матрица этой игры имеет вид: Число, названное Смитом 1 2 Билет в 1 долл. Выбор Джонса Билет в 2 долл. -1 0 0 -2 2 0 0 2 Эта игра также не является строго детерминированной.
§ 5. Не строго детерминированные игры 381 Как следует играть в случае, когда игра не является строго детерминированной? Убедимся прежде всего в том, что ни для какого игрока ни один выбор не может рассматриваться как безусловно оптимальный. В примере 1 А хотел бы выиграть 2. Но если он определенно выбирает ч.5, а В узнает об этом, то может сделать ход к. 5, сведя тем самым выигрыш А к нулю. Если же А выбирает к. 3, то В может свести его выигрыш к нулю, открыв карту ч. 3. Подобным же образом, если выбор В становится известным А, то А может выиграть 2. Итак, каждый игрок должен каким-то образом помешать другому игроку уз¬ нать, с какой карты он собирается пойти. Мы также замечаем, что когда эта игра играется один раз, то между двумя стратегиями нет разницы, если только стратегия одного игрока не отгадана его противником. Пусть теперь эта игра играется много раз. Как должен действовать А? Очевидно, он не должен ходить все время одной и той же картой, иначе В может заметить, как ведет себя А, и воспользоваться этим. По¬ этому А должен ходить иногда одной картой, а иногда — другой. Теперь мы сформулируем ключевой вопрос: «Как часто А дол¬ жен ходить каждой из своих карт?» Исходя из симметрии зада¬ чи, можно ожидать, что каждой картой он должен ходить так же часто, как и другой, т. е. в половине всех игр. (В дальнейшем мы увидим, что такой образ действий в самом деле является оптимальным.) В каком порядке он должен это делать? Напри¬ мер, должен ли он попеременно ходить ч. 5 и к. 3? Это опасно, потому что если В заметит эту систему, то он обратит это в свою пользу, зная каждый раз заранее ход А. Таким образом, А дол¬ жен ходить ч.5 в половине всех случаев, но следуя какой-то неотгадываемой системе. Единственный надежный способ за¬ ключается в том, чтобы ходить случайным образом. Можно, на¬ пример, бросать монету (не показывая ее В) и ходить ч. 5, если выпадет герб, и к. 3, если выпадет цифра. Тогда В не сможет отгадать решения А, поскольку А сам не знает его заранее. Та¬ ким образом, рациональный путь игры для каждого игрока со¬ стоит в смешении стратегий, т. е. в выборе иногда одной, иногда другой стратегии. Эти стратегии должны выбираться случайным образом с некоторой фиксированной вероятностью выбора каждой из них. Под смешанной стратегией для игрока А мы будем понимать указание вида «Выбирать 1-ю строку с вероятностью р\ и вто¬ рую строку с вероятностью р2», где по предположению Рг^О, Р2^0 и р\ + р2 = 1. Аналогично смешанной стратегией для игрока В будет указание вида «Выбирать первый столбец с ве¬ роятностью q\ и 2-й столбец с вероятностью <72», где 9i!>0, 9г^0 и 91 + 92=1. Вектором смешанной стратегии для
382 Глава VI*. Линейное программирование и теория игр игрока А будет вектор-строка вероятностей (рь р2), а дЛя игрока В вектором смешанной стратегии будет вектор-столбец вероятностей j. Примерами смешанных стратегий могут служить ^ и (i\ и I . Читатель может спросить, каким образом игрок может фактически осуществить подобную вероятностную стратегию. Смешанная стратегия ’ т) РеализУется без тРУДа> так как дело сводится к простому бросанию монеты. Несколько труднее реализовать смешанную стратегию 4 ввиду отсутствия в обиходе случайного уст¬ ройства, которое выдавало бы эти ве¬ роятности. Однако легко получить та¬ кое устройство, например, с помощью „ 4 диска с подвижной стрелкой, пло¬ щади которого заштриховано, как это Фиг. 131 изображено на фиг. 131. Игрок В про¬ сто приводит во вращение стрелку (конечно, не показывая ее А). Тогда, если стрелка останавли¬ вается на незаштрихованной части, он выбирает первый столбец, если же она останавливается на заштрихованной части, то он выбирает второй столбец и, таким образом, реализует требуемую стратегию. Варьируя заштрихованную площадь диска, можно реализовать и другие смешанные стратегии. Рассмотрим не строго детерминированную игру с матрицей G = а Ь с d После того как мы убедились в том, что игроки должны приме¬ нять смешанные стратегии, нужно еще решить, как выбирать оптимальную смешанную стратегию. Определение. Для не строго детерминированной игры с матрицей G число v называется ценой этой игры, а векторы
$ 5. Не строго детерминированные игры 383 / ^ 1 \ р° = (р^у Ръ') и Ч'] — ( (0) )— оптимальными стратегиями игро¬ ков А и В, если имеют место следующие неравенства: (1) paG=(p"', />«»)(" bd)>(v, v); (Если г и w — векторы, то неравенство z^w означает, что каждая компонента г больше соответствующей компоненты w или равна ей.) Игра называется безобидной, если v = 0. Пусть А выбирает смешанную стратегию р = (р\, рг) и (не¬ зависимо) В выбирает смешанную стратегию q = ( ). Тогда ' Я 2 J игрок А выигрывает сумму а с вероятностью P\Q\, сумму b с ве¬ роятностью р 1 <72, сумму с с вероятностью P2PI и сумму d с ве¬ роятностью Р2<72- Следовательно, среднее значение его выигрыша (см. § 14 гл. IV) имеет величину apxq\ t bp{q<? + с pop > + dp2q^ = pGq. Аналогично находится и среднее значение выигрыша игрока В. Оно равно этому же выражению, но с обратным знаком. Чтобы оправдать данное выше определение, мы должны по¬ казать, что если для матрицы G существуют у, р°, q° с указан¬ ными свойствами, то игрок А может сделать среднее значение своего выигрыша равным v или большим щ а игрок В может сделать это среднее значение равным v или меньшим v. Пусть q — любая стратегия для В. Умножив (1) справа на q, мы полу¬ чим соотношение p()Gq > (v, v) q v, которое показывает, что при любой игре игрока В игрок А может обеспечить себе вы¬ игрыш, среднее значение которого по меньшей мере равно v. Аналогично пусть р будет любой вектор стратегии для А. Умно¬ жив (2) слева на р, мы получим соотношение pGq° <p(l)=v, которое показывает, что при любой игре игрока А игрок В мо¬ жет сделать среднее значение выигрыша А равным самое большее V. Именно в этом смысле стратегии р° и q° являются оптимальными. Мы видим далее, что если оба игрока играют оптимальным образом, то для игрока А среднее значение вы¬ игрыша равно v, а для игрока В среднее значение выигрыша равно —V. (Ср. упр. 10.) Теперь мы должны решить вопрос о существовании страте¬ гий р° и q° в не строго детерминированной игре. Тогда как при более сложных играх нахождение оптимальных стратегий оказы¬ вается трудной задачей, решение этого вопроса в случае не
384 Г лава VI*. Линейное программирование и теория игр строго детерминированной игры с (2 X 2)-матрицей может быть получено по следующим формулам: (3) (4) (5) 6) С) d — с Р°2 = а d — b — с а — b d — b — с d — b а 7° = /1 а у d — ь — с я* а — с а + d — b — с ad — be Легко проверить (см. упр. И), что найденные по формулам (3) — (7) векторы р, q и число v удовлетворяют условиям (1) — (2). В действительности неравенства (1) и (2) в этом простом случае переходят в равенства. Этот факт не имеет места в общем случае не строго детерминированных игр, матрица которых имеет большее число строк или столбцов. Знаменатель каждой из формул (3) — (7) представляет собой разность между суммами элементов по двум диагоналям. Так как для не строго детерминированной игры элементы по одной диагонали должны превосходить элементы по другой диагонали, то знаменатель не может обратиться в нуль. В числителе дроби для v стоит выражение, в котором читатель узнает определитель = ad — be. Воспользуемся этими формулами для исследования приве¬ денных ранее примеров. Пример 1 (продолжение). Решение легко находится пу¬ тем подстановки числовых данных. Мы получаем ^у, у^ в качестве оптимальной стратегии для А и в качестве оптимальной стратегии для В. Следовательно, для получе¬ ния оптимальных результатов каждый игрок должен при¬ менять стратегию бросания монеты. Цена игры равна + 1- Это означает, что условия этой игры благоприятствуют игроку А, так что для А среднее значение выигрыша при одной такой игре равно 1.
§ 5. Не строго детерминированные игры 385 Пример 2. (продолжение). Из наших формул мы полу¬ чаем у) в качестве оптимальной стратегии для А и |\ ^ j в качестве оптимальной стратегии для В. Цена игры з / 2 равна —у Таким образом, условия игры благоприят¬ ствуют Смиту. Смит должен перед началом игры внести 2 66 у цента. Это служит ответом на вопрос, поставленный в гл. III. Упражнения 1. Найдите оптимальные стратегии каждого игрока и цены в следующих играх: (а) (с) (е) 1 2 3 4 2 3 1 4 —6 (Ь) (d) (I) 1 0 —1 2 15 3 —1 2 3 15 —1 10 ) v = 3; (0, 1); 1 . /3 ) *=2 ’ \ 4 ’ 1 v = 3; О. 0); (е) v = 43 /- (3 Щ | 8 U6 ’ 16 )’ ^ _1_ ■] 2. Представьте в матричной форме игру со сравнением монет (ср. упр. 1 к § 2 гл. III), найдите ее цену и оптимальные стратегии. Каким образом игроки реализуют эти стратегии на практике? 25 Зак. 609.
386 Глава VI*. Линейное программирование и теория игр 3. Рассмотрим следующую игру. Каждый из двух игроков показывает один или два пальца, и если общее число показанных пальцев четно, то игрок д получает сумму, равную этому числу, а если нечетно, то игрок В полу¬ чает сумму, равную этому числу. (а) Покажите, что матрица игры имеет следующий вид: Игрок В 1 2 1 Игрок А 2 (Ь) Найдите оптимальные стратегии игроков и цену игры. [°тв/- \-ш> 4'); ^-тИ 4. Рассмотрим следующую «военную» задачу. Бомбардировщики атакуют объект, защищаемый истребителями. При этом бомбардировщики могут каждый раз атаковать либо «высоко», либо «низко». Низкая атака делает бомбежку более меткой. Точно так же истребители могут каждый раз искать бомбардировщиков либо «высоко», либо «низко». Бомбардиров¬ щикам приписываются 6 очков, если они уклонятся от истребителей, п О очков, если истребители их обнаружат. Кроме того, бомбардировщикам приписывается три дополнительных очка за меткость, если они летят низко. (a) Напишите матрицу игры. (b) Найдите оптимальные стратегии игроков. (c) Каким образом командиры бомбардировщиков и истребителей могут принимать решения с помощью бросания монет? ['Отв.\ (с) Командир бомбардировщика должен бросать одну монету, чтобы решить, лететь ли ему высоко или низко. Командир истре¬ бителя должен бросать две монеты и лететь высоко, если выпадут два герба.] 5. Обобщите задачу из упр. 4, приписав бомбардировщикам л: очков за укло¬ нение от истребителей и у очков за низкий полет. (Предполагается, что х и у положительны.) (a) Напишите матрицу игры. (b) Покажите, что если у > х, то игра строго детерминирована, и най¬ дите оптимальные стратегии. (c) Покажите, что если у < х, то игра не строго детерминирована. Найдите оптимальные стратегии. (d) Объясните эти результаты, уделяя особенное внимание стратегии бомбардировщиков. 6. Докажите, что если игра с матрицей а b с d 2 —3 —3 4
§ 6. Матричные игры 387 не строго детерминированная, то она будет безобидной тогда и только тогда, когда а b = ad — be = 0, 7. Докажите, что в формула* (3) — (7) рi > 0, рг > 0, q\ > 0 и q2 > 0. Должно ли v быть больше нуля? 8. Воспользовавшись резупьтатами упр. 8 предыдущего параграфа, найдите необходимые и достаточные условия для того, чтобы матрица G = а 0 0 Ъ была матрицей не строго детерминированной игры. Найдите оптимальные стратегии для каждого игрока и цену игры, когда она не строго детер¬ минирована. [Отв.: Числа а и b должны быть либо оба положительными, либо оба отрицательными. р] = b/(a-\-b)'t р2 = aj(a + b)\ = Ь/(а + Ь)\ q2 = af(a -|- b)\ v = ab/(a 4- b).] 9. Допустим, что игрок А получает карты ч. х и к. у, а игрок В карты ч. и и к. v (где х, у, и и v — положительные числа). Пусть они играют в игру с матрицей Игрок В ч.и K.V ч.х Игрок А к.у хи — XV — Уи yv Покажите, что эта игра всегда будет не строго детерминированной и безобидной. 10. Покажите, что если G, р°, q° и v определены, как выше, то v = p°Gq°. 11. Проверьте, что значения (3) — (7) удовлетворяют условиям (1) и (2). § 6. МАТРИЧНЫЕ ИГРЫ В этом разделе мы рассмотрим один большой класс игр и проведем его изучение при весьма общих предположениях. Наши игры являются играми между двумя игроками, и они будут проводиться согласно строго определенным правилам. Каждый игрок производит некоторые действия, определенные правилами игры. В конце игры может оказаться, что один игрок должен за¬ платить другому игроку некоторую сумму денег. Игра может быть повторена много раз. В течение такой игры игрок может быть поставлен перед не¬ обходимостью принять много стратегических решений. Под 25*
3.88 Глава VI*. Линейное программирование и теория игр (частой) стратегией для игрока мы понимаем полную систему правил о том, как он должен принимать эти решения. Мы пока¬ жем это на примере игры в крестики и нолики (сходные заме¬ чания применимы к любой игре, в которой игроки по очереди делают ходы). Рассмотрим стратегию того игрока, который ходит первым. Его первое решение касается выбора начального хода. В его распоряжении девять квадратов, и стратегия должна сказать, какой из них он должен выбрать. Пусть, например, ему рекомендуется заполнить квадрат в верхнем левом углу. Его противник может ответить одним из восьми возможных спосо¬ бов, и далее стратегия первого игрока должна учитывать ка¬ ждую из восьми альтернатив. Она должна включать восемь пра¬ вил, как, например, «Если противник выберет центральный ква¬ драт, то выбирайте квадрат в правом нижнем углу». На каждый такой ход противник может отвечать одной из нескольких альтернатив, и стратегия первого игрока снова должна преду¬ сматривать ответный ход на каждую из них и т. д. Следова¬ тельно, стратегия учитывает каждое мыслимое положение и предписывает, какой ход делать в каждом случае. Стратегию можно мыслить как такую систему инструкций, даваемую машине, при которой машина смогла бы играть в; точности так же, как играли бы мы. Занумеруем стратегии первого игрока числами 1, 2, ..., т, а стратегии второго игрока числами 1, 2, ..., п. Так как каждый игрок должен играть согласно одной из своих стратегий, то наша игра может осуществиться одним из тпп способов, и если каждый игрок выбирает определенную стратегию, то исход оп¬ ределен. Допустим, что если первый игрок выбирает стратегию i, а второй — стратегию /, то первый выигрывает сумму, равную atj. Мы располагаем эти числа в виде (m X п)-матрицы, на¬ зываемой матрицей игры. Тогда мы можем представить себе, что игра заключается в выборе первым игроком строки и выборе вторым игроком столбца. Следовательно, мы видим, что всякую игру с определенными правилами можно мыслить как матрич¬ ную игру. Обратно, всякую матрицу можно рассматривать как матрицу некоторой игры с двумя игроками. Это будет игра, в которой игрок А выбирает одну из пг строк, а игрок В одновременно вы¬ бирает один из п столбцов рассматриваемой (пг X п)-матрицы. Исход игры состоит в том, что В платит А сумму, равную эле¬ менту матрицы, который стоит в пересечении выбранной строки и выбранного столбца. (Как и раньше, отрицательный элемент означает, что А платит В.) В игре с (пг X я)-матрицей игрок А имеет m чистых страте¬ гий, а игрок В имеет п чистых стратегий. Как мы видели в пре^
§ 6. Матричные игры 389 дыдущем параграфе, кроме чистых стратегий следует рассматри¬ вать смешанные стратегии игроков. Мы распространим это по¬ нятие на случай игры с (m X п)-матрицей. Определение, m-мерный вектор-строка р называется вектором смешанной стратегии для игрока А, если этот вектор является вероятностным вектором; аналогично /2-мерный век¬ тор-столбец q называется вектором смешанной стратегии для игрока В, если этот вектор является вероятностным вектором. (Напомним, что в гл. V мы назвали вектор вероятностным, если у него все компоненты неотрицательны, а их сумма равна 1.) Пусть V и V' обозначают векторы V=(v, v, ... у v) и in компонент где v — некоторое число. По условию v называется ценой игры, а р° и q° — оптимальными стратегиями игроков в том и только в том случае, если имеют место следующие неравенства: P°G>V, G(7°< V'. В §§ 4 и 5 мы рассмотрели несколько примеров матричных игр, а также их решения. Заметим, что мы не доказали суще¬ ствование цены игры и оптимальных стратегий игроков в случае произвольной матричной игры. Этот вопрос будет рассмотрен в следующем параграфе. Теорема. Если матричная игра имеет цену и оптимальные стратегии, то эта цена игры единственна. Доказательство. Допустим, что v и до— различные цены игры с матрицей G. Пусть векторы-строки V = (v, v, ..., v) и W = (до, до, . . ., до) имеют по m компонент, а векторы-столбцы ' V ' до V до V' = II S v . до. имеют по п компонент. Пусть, далее, р° и q° — оптимальные век¬ торы смешанной стратегии, отвечающей цене vt так что (a) p°G > V, (b) Gq° <К', v V V' j п компонент, J
390 Глава VI*. Линейное программирование и теория игр Аналогично пусть р1 и ql — оптимальные векторы смешанной стратегии, отвечающей цене w, так что (c) p'G>W, (d) Gqx < W'. Если теперь умножить (а) справа на q\ мы получимp°Gql >- ^ Vqx = v. Аналогично, умножая (d) слева на р°, мы получим p°Gq] Эти два неравенства показывают, htow^v. Затем мы умножим (Ь) слева на р1 и (с) справа на q° и по¬ лучим неравенства v ^p1Gq° и p1Gq°^w, из которых следует, что v^w. Но из неравенств v w и следует, что v = w, т. е. что рассматриваемая игра имеет единственную цену. Теорема. Для игры с матрицей G, ценой v и оптималь¬ ными стратегиями р° и q° имеет место соотношение z) = p°Gq°. Доказательство. По определению v, р° и q° удовлетво¬ ряют условиям p°G > V и Gq° ^ V'. Умножая первое из этих неравенств справа на р°, мы получим pQGqQ^v. Аналогично, умножая второе неравенство слева на р°, мы получим p0Gq°^.v. Из этих двух неравенств следует ра¬ венство v=p°Gq°, которое нам и требовалось доказать. Только что доказанная теорема важна тем, что она позво¬ ляет интерпретировать цену игры как среднее значение в смысле теории вероятностей (см. § 14 гл. IV). Коротко эту интерпрета¬ цию можно охарактеризовать следующим образом: если игра неоднократно повторяется, причем каждый раз игрок А приме¬ няет смешанную стратегию р°у а игрок В — смешанную страте¬ гию 9°, то цена v игры будет средним значением выигрыша игрока А. Из закона больших чисел следует, что при достаточно большом числе игр средняя величина выигрыша игрока А, при¬ ходящаяся на одну игру, будет (с большой вероятностью) сколь угодно близкой к цене v. В качестве примера рассмотрим игру в сравнение монет, т. е. игру с матрицей 1 —1 -1 1 Оптимальными стратегиями в этой игре служат: для А — выбор каждой строки с вероятностью у, а для В — выбор каждого
§ 6. Матричные игры 391 столбца с вероятностью —. (См. упр. 2 предыдущего пара¬ графа.) Цена игры равна нулю. Заметим, что единственно воз¬ можными выплатами в каждой отдельной игре является + 1 и —1. Ни одно из этих значений не равно цене игры (нулю). Однако если игра повторяется многократно, то средняя вели¬ чина выигрыша (в расчете на одну игру) будет стремиться к нулю, т. е. к цене этой игры. Теорема. В игре с матрицей G, ценой v и оптимальными стратегиями р° и q° цена v представляет собой наибольшее среднее значение выигрыша, которого может добиться игрок А. Аналогично v есть наименьшее среднее значение проигрыша, которого может добиться игрок В. Доказательство. Пусть р — любая смешанная стратегия для А и пусть с]0 — оптимальная стратегия для В. Умножив со¬ отношение G<7°< V' слева на р, мы получим pGq°^v. Послед¬ нее соотношение показывает, что если В выбирает оптимальную стратегию, то самое большее, чего может добиться А, это сред¬ него значения v выигрыша. Теперь пусть р° — оптимальная стра¬ тегия для А; тогда для каждого q мы имеем p°Gq^> v, так что А действительно может обеспечить себе среднее значение v. Вторая часть теоремы доказывается аналогично. Эта теорема дает интуитивное обоснование для определения цены и оптимальных стратегий игры. Таким образом, цена — это «наилучшее», чего игрок может добиться, а оптимальные стратегии являются средством достижения этого «наилучшего». Определение. Игра с матрицей G называется строго де¬ терминированной, если G содержит элемент gLj, который яв¬ ляется минимальным элементом в /-й строке и максимальным элементом в /-м столбце. Если игра строго детерминированная, то путем перестановки и изменения нумерации строк и столбцов матрицы G можно до¬ биться того, чтобы элемент gu был минимальным в первой строке и максимальным в первом столбце. Теорема. Пусть игра с матрицей G строго детерминиро¬ вана, причем G приведена к только что указанному виду. То¬ гда цена v этой игры будет равна gn, а оптимальными страте¬ гиями для игроков будут 1 О />° = ( 1, О, О, ..., 0) и <7°= 0 0J
392 Г лава VI*. Линейное программирование и теория игр [Эти оптимальные стратегии попросту означают, что А должен выбрать ту строку, которая содержит элемент gn (первую строку), а В должен выбрать тот столбец, который содержит элемент gw (первый столбец). Сравните эти оптимальные стра¬ тегии с теми, которые были найдены в § 4 для случая строго детерминированных (2 X 2)-игр.] Доказательство. Предположим, что игра с матрицей G строго детерминирована и что строки и столбцы G расположены и занумерованы таким образом, что элемент gn— минимальный в первой строке и максимальный в первом столбце. Положим v = g'n, и пусть р° и q° будут стратегиями, о которых говорится в формулировке теоремы. Мы имеем: P°Q = (gn> gl2’ ■■■’ g\n)Xgll> glU ■■■> gll)= V> где мы воспользовались тем фактом, что элемент gn является минимальным в первой строке. Подобным же образом, исполь¬ зуя тот факт, что элемент g'n является максимальным в первом столбце, мы получим ' gn £n £21 £11 < . ■ . £п . Из этих двух соотношений и данного выше определения матрич¬ ной игры мы заключаем, что v есть цена игры, а р° и q° — опти¬ мальные стратегии. Теорема. Если gn и gtj— два элемента матрицы G, являющиеся минимальными в тех строках и максимальными в тех столбцах, которым они принадлежат, то v — gn = g1;. = gn = gij. Доказательство. Используя тот факт, что gn и gtJ яв¬ ляются минимальными в тех строках и максимальными в тех столбцах, которым они принадлежат, мы находим, что ВIj'^'Bll> Bij Bil ^ gll* (Эти неравенства верны и в случае, когда i = 1 или j = 1.) Из этих двух систем неравенств мы получаем gtJ = glj = gn = gu = = v, что и доказывает теорему. Пример 1. Мы доказали единственность цены игры. Но может случиться, что игра имеет более чем одну пару опти-
§ 6. Матричные игры 393 мальных стратегий. Например, рассмотрим игру с матри¬ цей 1 5 1 7 —2 8 0 -9 1 12 1 3 Мы видим, что эта игра — строго детерминированная с це¬ ной 1, Оптимальными стратегиями будут (1, 0, 0) и (0, 0, 1) для игрока А и (1\ /°\ 0 0 о и 1 ^о/ \о/ для игрока В. Следующая теорема показывает, что для этой игры имеются еще и другие оптимальные стратегии. Теорема. Если р° и р{ — две оптимальные стратегии для игрока А в игре с матрицей G, то стратегия р = ар° + ( 1 —а)р\ где а — любое число, удовлетворяющее условию 0 а < 1, также будет оптимальной стратегией для А. Аналогично если q° и qx —оптимальные стратегии для игрока В в игре с матрицей G, то стратегия q = aq°A-( 1 —a) q\ где а — любое число, удовлетворяющее условию также будет оптимальной стратегией для В. Доказательство. Мы докажем только первое утвер¬ ждение, а второе оставим в качестве упражнения (см. упр. 3). Легко показать, что р — вероятностный вектор. По предположе¬ нию p°G^V и p1G'^V. Следовательно, pQ = [apb-\-( 1 —a)px\G = ap^G-{-(\ —a)plG> >aV + ( 1 —a)V= V. Отсюда видно, что р также является оптимальной стратегией, и теорема доказана.
394 Глава VI*. Линейное программирование и теория игр Из этой теоремы следует, что в нашем примере стратегии вида а(1, 0, 0) + (1 — а) (0, 0, 1) = (а, 0, 1 — а) являются опти¬ мальными для А. Так, например, ^ > 0, и 0, — две оптимальные стратегии такого вида. Упражнения 1. Найдите цену и все оптимальные стратегии для следующих игр: (а) 15 2 —3 6 5 7 —7 4 0 jbffze.: г> = 5; (0, 1, 0); | 1 (Ь) 5 2 1 —1 —1 1 1 0 1 3 0 -3 7 (с) 0 5 6 —3 1 —1 2 3 1 2 3 4 —1 0 7 5 2. Найдите цену и все оптимальные стратегии для следующих игр: (а) 5 10 6 5 5 7 8 5 0 5 6 5 (Ь) —2 0 —1 —5 7 8 (с) 0 0 1 0 1 0 0 0 1 0 1 0 (d) 3 2 3 6 2 7 5 1 4
§ 6. Матричные игры 395 3. Покажите, что если q° и ql — оптимальные стратегии для игрока В в игре с матрицей G, то стратегия <7 = а<7°-И1— a)ql, где постоянная а удовлетворяет условию 0^#-^ 1, также является опти¬ мальной. 4. Проверьте, что стратегии р° = ^ , у, и q°= являются опти¬ мальными в игре с матрицей G = 1 0 0 0 1 0 0 0 1 Чему равна цена этой игры? 5. Обобщите результат упр. 4 на случай игры, матрицей которой служит единичная (п X п)-матрица. 6. Допустим, что игрок А разыскивает игрока В в одном из трех городов X, Y и Z. Расстояние между X и Y равно 5 милям, расстояние между Y и Z равно 5 милям и расстояние между Z и X равно 10 милям Пред¬ положим, что В может направиться в один и только в один из этих трех городов и что если А направится в тот же город, то А «задерживает» В, в противном же случае В «ускользает». Будем приписывать игроку А 10 очков, если он -задерживает В, а игроку В число очков, равное рас¬ стоянию его от А, если В ускользает. (a) Выпишите матрицу этой игры. (b) Покажите, что оба игрока имеют одинаковые оптимальные стратегии, а именно появляться с равной вероятностью в городах X и Z и 1 с вероятностью — в городе Y. (c) Найдите цену этой игры. 7. Рассмотрим следующую игру с двумя играющими. Каждый игрок показы¬ вает от одного до пяти пальцев, и общее число показанных пальцев делится на 3. Если сумма делится на 3 без остатка, то никаких выплат не производится. Если остаток равен 1, то игрок А выигрывает сумму, равную общему числу показанных пальцев, а если остаток равен 2, то игрок В выигрывает сумму, равную общему числу показанных пальцев. (a) Выпишите матрицу этой игры. (Указание. Эго будет (5 X 5)-матрица.) (b) Проверьте, что стратегия, состоящая в том, чтобы показывать один или пять пальцев с вероятностью -g-f два или четыре пальца с ве¬
396 Глава VI*. Линейное программирование и теория игр роятностью -д- и три пальца с вероятностью , является оптималь¬ ной для каждого игрока. (с) Безобидная ли это игра? [Отв.: Да ] 8. Рассмотрим игру со следующей матрицей: G = а 0 0 0 ъ 0 0 0 с (a) Покажите, что если числа а, b и с не все одного знака, то эта игра — строго детерминированная с ценой нуль. (b) Покажите, что если все числа а, b и с одного знака, / be са аЪ \ \ ab —|— Ьс —|— са ab -j— be -j- са ab —|— be —J— са } доставляет оптимальную стратегию для игрока А. (c) Найдите оптимальную стратегию для игрока В в случае (Ь). (d) Найдите цену этой игры в случае (Ь) и покажите, что она будет положительной, если все числа а, b и с положительны, и отрицатель¬ ной, если все они отрицательны. 9. Два игрока договорились играть в следующую игру. Первый игрок будет показывать 1, 2 или 4 пальца. Одновременно второй игрок будет показывать 2, 3 или 5 пальцев. Если общее число показанных паль¬ цев равно 3, 5 или 9, то первый игрок получает такую же сумму. В противном случае не производится никакой выплаты. (a) Напишите матрицу этой игры. (b) Воспользуйтесь результатами упр. 8 для решения этой игры. (c) Какую сумму согласится внести первый игрок перед началом игры? [Ош.: §.] 10. Рассмотрим (симметричную) игру с матрицей G = 0 — а — Ь а 0 — с Ъ с 0 (a) Покажите, что если а и b оба положительны или оба отрицательны, то эта игра строго детерминирована. (b) Покажите, что если b и с оба положительны или оба отрицательны, то эта игра строго детерминирована. (c) Покажите, что если а > 0, b < 0 и с > 0, то для игрока А оптималь¬ ной будет стратегия
§ 7. Еще о матричных играх: основная теорема 397 (d) В условиях п. (с) найдите оптимальную стратегию для игрока В. (e) Покажите, что если а < О, b > 0 и с < 0, то стратегия, заданная в п. (с), будет оптимальной для А. Какая стратегия будет опти¬ мальной для игрока В? (f) Докажите, что цена этой игры всегда равна нулю. 11. В известной детской игре каждый из двух игроков произносит слово «камень», «ножницы» или «бумага». Если один произносит «камень», а другой «ножницы», то первый выигрывает монету. Аналогично «нож¬ ницы» выигрывают у «бумаги», а «бумага» у «камня». Если оба игрока называют один и тот же предмет, то игра считается сыгранной .вничью. (a) Выпишите матрицу этой игры. (b) Используйте результаты упр. 10 для решения этой игры. 12. Пусть в условиях упр. 11 выплаты будут разными для разных случаев. Пусть когда «камень» разбивает «ножницы», выплачивается один цент, когда «ножницы» режут «бумагу», выплачивается два цента, и когда «бумага» покрывает «камень», выплачивается три цента. (a) Напишите матрицу игры. (b) Используйте результаты упр. 10 для решения этой игры. [Отв.: «камень», «ножницы», -д- «бумага»; v = 0.] о Z О § 7. ЕЩЕ О МАТРИЧНЫХ ИГРАХ: ОСНОВНАЯ ТЕОРЕМА Продолжим изучение основных свойств матричных игр. Сна¬ чала мы посмотрим, что произойдет с игрой, если каждый эле¬ мент ее матрицы умножить на неотрицательную константу или если к каждому элементу матрицы прибавить одну и ту же кон¬ станту. Затем мы приведем основную теорему существования для матричных игр. Теорема. Если k — неотрицательное число, т. е. &!>0, и если v — цена игры с матрицей G, то kv будет ценой игры с матрицей kG и всякая стратегия, оптимальная в игре с матри¬ цей G, будет также оптимальной в игре с матрицей kG. (Напо¬ минаем, что матрица kG получается из матрицы G путем умно¬ жения каждого элемента на число k.) Доказательство. Пусть р° — оптимальная стратегия для игрока А в игре с матрицей G, т. е. p°G > V. Тогда мы имеем: p°(kG) = k(pW)>kV. Аналогично если q° — оптимальная стратегия для игрока В в игре с матрицей G, то (kG)q° = k(Gq*)^kV. Эти два неравенства показывают, что kv есть цена игры с матри¬ цей kG и что оптимальные стратегии в игре с матрицей G яв¬ ляются также оптимальными в игре с матрицей kG.
398 Глава VI*. Линейное программирование и теория игр Следует обратить внимание на то, что при доказательстве этой теоремы существенно использовалась неотрицательность /е, так как умножение неравенства на отрицательное число влечег изменение смысла неравенства на противоположный. Следую¬ щий пример показывает, что приведенная теорема не верна для отрицательных k. Пример. Пусть k = — 1 и пусть G = 2 3 -1 0 и (—1)0 = —2 -3 1 0 Мы видим, что каждая из этих игр является строго детер¬ минированной и что цена первой игры равна 2, тогда как цена второй игры равна 0 (т. е. числу, не равному (—1) *2 = = —2). Кроме того, в игре с матрицей G оптимальная стратегия для А состоит в выборе первой строки с вероят¬ ностью 1, а оптимальная стратегия для В — в выборе пер¬ вого столбца с вероятностью 1, и ни одна из этих стратегий не оптимальна в игре с матрицей (—1)G. Теорема. Пусть v — цена игры с (m X п) -матрицей G, Е—(m X п)-матрица, все элементы которой равны 1, и k— любая константа. Тогда каждая стратегия, оптимальная в игре с матрицей G, будет также оптимальной в игре с матрицей G + kE, а цена последней игры будет равна v + k. (Матри¬ ца G + kE получается из матрицы G путем прибавления к ка¬ ждому элементу числа /г.) Доказательство. Пусть р° и q° — оптимальные страте¬ гии в игре с матрицей G; тогда p"G > V и Gq° ^ V\ Мы имеем: /7° (G + kE) = рЮ + р° (kE) = p°G -f k (p°E) > > (vt v, v)+-(k, k, k) = (v + k9 v H- k9 . . ., v + k). Аналогично получим 1 V k ' V + k ' V k v-{-k (G + kE) g° — Gq° + k (Eq°) < + - V , A 1) -j- k Эти неравенства показывают, что ценой игры с матрицей G + kE служит v + k и что каждая стратегия, оптимальная в игре с матрицей G, будет также оптимальной в игре с матри¬ цей G + kE.
§ 7. Еще о матричных играх: основная теорема 399 Матричные игры не представляют большого интереса до тех пор, пока мы не знаем, при каких условиях такие игры имеют решение. Основная теорема теории игр говорит о том, что каж¬ дая матричная игра имеет решение. Доказательство этой тео¬ ремы в общем случае слишком сложно, чтобы можно было его приводить в этой книге, и мы ограничимся рассмотрением слу¬ чая (2 X 2)-матриц. Основная теорема. Для игры с любой (m X п) -матри¬ цей существует цена v и оптимальные стратегии: р° для игрока А и q° для игрока В. Другими словами, каждая матричная игра имеет решение. Доказательство для случая (2X2)-матриц. Для случая строго детерминированной игры цена и оптимальные стратегии были найдены в § 4. Если игра не является строго детерминированной, то оптимальные стратегии и цена опреде¬ ляются по формулам (3) — (7) из § 5. Так как всякая игра является либо строго детерминированной, либо не строго детер¬ минированной, то мы разобрали все случаи. Упражнения 1. Для матриц G, данных в упр. 1 из § 6, найдите цены игр с матрицами kG и G + kE, где k принимает значения 3, 0 и —2. 2. Пусть G — любая матрица и k = 0. Найдите все оптимальные стратегии для каждого игрока в игре с матрицей kG. [Отв.: Любая стратегия будет оптимальной.] 3. Пусть G — любая матрица и пусть k > 0. Покажите, что каждая стра¬ тегия, оптимальная в игре с матрицей kG, будет также оптимальной в игре с матрицей G. ^Указание. Умножьте матрицу kG на • j 4. Покажите, что если G — любая матрица и k — любая константа, то каж¬ дая стратегия, оптимальная в игре с матрицей G + kE будет опти¬ мальной также в игре с матрицей G. 5. Допустим, что перед началом матричной игры игрок В уплачивает игроку А сумму в размере k долларов. В таком случае мы будем гово¬ рить, что В произвел внеигровой платеж k в пользу А. (Если k отри¬ цательно, то это будет внеигровой платеж игрока А в пользу игрока В.) (a) Покажите, что если В произвел внеигровой платеж k в пользу А, после чего А и В сыграли в игру с матрицей G, то это равно¬ сильно игре с матрицей G + kE. (b) Найдите цену игры с матрицей G — vE, где v — цена игры с матри¬ цей G. (c) Используя результаты пп. (а) и (Ь) покажите, что любую матричную игру с матрицей G и ценой и можно превратить в безобидную игру, если потребовать, чтобы В произвел внеигровой плажет —v в пользу А. 6. Покажите, что любую матрицу G путем прибавления одного и того же числа к каждому элементу этой матрицы и путем умножения каждого
400 Г лава VI*. Линейное программирование и теория игр элемента на положительное число можно превратить в матрицу безобид, ной матричной игры, причем каждый элемент этой матрицы будет заклю¬ чен между —1 и 1. 7. Покажите, что после преобразований, указанных в упр. 6, множество оптимальных стратегий для каждого игрока не изменится. Как изме¬ няется после таких преобразований цена игры? 8. Рассмотрим игру с матрицей а Ъ b b а Ъ b b а (a) Покажите, что эта матрица может быть получена из единичной матрицы путем умножения ее на подходящее число и сложения с матрицей ЬЕ. (b) Решите эту игру, воспользовавшись результатами упр. 4 из § 5. [Отв.: v = а/3 + 26/3.] 9. Допустим, что элементы матричной игры переписаны в новых единицах (например, доллары вместо центов). Покажите, что денежная цена игры от этого не изменится. 10. Рассмотрим игру в сравнение монет, матрица которой имеет вид 1 —1 —1 1 Если элементы этой матрицы представляют выигрыш или проигрыш од¬ ного пенни, то согласились ли бы вы сыграть в эту игру хотя бы один раз? Если элементы представляют выигрыш или проигрыш одного дол¬ лара, то согласились ли бы вы сыграть в эту игру хотя бы один раз? Если они представляют выигрыш или проигрыш одного миллиона долла¬ ров, то стали бы вы играть в нее хотя бы один раз? Покажите, что в каждом из этих случаев цена равна нулю, а оптимальные стратегии будут одними и теми же. Обсудите практическое применение теории игр в свете этого примера. § 8. ИГРЫ, МАТРИЦЫ КОТОРЫХ ИМЕЮТ ТОЛЬКО ДВЕ СТРОКИ ИЛИ ТОЛЬКО ДВА СТОЛБЦА После (2 X 2)-игр наиболее простыми матричными играми являются (2 X п)- и (т X 2)-игры, т. е. такие игры, при которых один из игроков имеет в своем распоряжении в каждой игре только два выбора. Здесь мы рассмотрим решения таких игр. Пример 1. Допустим, что Джонс прячет в руке одну из следующих четырех ассигнаций: 1 или 2 доллара США или
§ 8. Игры с матрицами из двух строк или двух столбцов 401 1 или 2 канадские доллара. «Канада», и получает эту сказал правильно. Матрица США Джонс выбирает Канада Смит произносит: «США» или ассигнацию, в случае если он этой игры имеет вид: Смит произносит США Канада 1 долл. — 1 0 2 долл. —2 0 1 долл. 0 — 1 2 долл. 0 -2 Очевидно, Джонс предпочтет выбирать каждый раз ассигнацию (канадскую или США) в 1 доллар, а не в 2 дол¬ лара, так как тем самым он может уменьшить свой про¬ игрыш и заведомо не увеличит его. Это можно наблюдать на приведенной матрице, так как каждый элемент второй строки не превосходит соответствующего элемента первой строки и каждый элемент четвертой строки не превосходит соответствующего элемента третьей строки. В сущности мы можем выкинуть вторую и четвертую строку и свести эту игру к игре со следующей (2 X 2)-матрицей: Смит произносит США Канада США 1 долл. Джонс выбирает Канада 1 долл. -1 0 0 —1 Новая матричная игра является не строго детерминиро¬ ванной с оптимальными стратегиями для Джонса и (*\ I j для Смита. Цена этой игры равна • Это означает, что Смит должен перед началом игры уплатить Джонсу 50 центов. Определение. Будем говорить, что i-я строка матрицы мажорирует l-ю строку, если каждый элемент /-й строки больше 26 Зак. 609;
402 Глава I7/*. Линейное программирование и теория игр соответствующего элемента /-й строки (или равен ему). Анало¬ гично будем говорить, что /-й столбец мажорируется k-м столб¬ цом, если каждый элемент /-го столбца меньше или равен соот¬ ветствующего элемента k-ro столбца. Любую мажорирующую строку, а также любой мажорирую¬ щийся столбец матрицы игры можно удалить, не оказывая влияния на решение этой игры. Мы видим, что в примере 1 в первоначальной матрице игры 1-я строка мажорирует 2-ю стро¬ ку и 3-я строка мажорирует 4-ю строку. Пример 2. Рассмотрим снова карточную игру, описан¬ ную в § 4, только пусть на этот раз А получает ч. 5 и к. 3, а в В получает ч. 6, ч. 5, к. 4 и к. 5. Выпишем матрицу этой игры: ч. 5 к. 3 Мы видим, что 3-й столбец мажорируется 4-м столбцом. Это означает, что игрок В никогда не должен играть к. 5. Таким образом, наша игра может быть сведена к игре со следующей (2 X 3)-матрицей: ч. 5 к. 3 Больше нельзя удалить никакой строки и никакого столбца. Следовательно, чтобы решить эту игру, мы долж¬ ны использовать новую технику. Можно показать (мы не будем этого делать), что решение (2 X п)- или (га X 2)-игры сводится к решению некоторого числа (2 X 2)-игр. Каждая из последних получается путем вычеркивания столбцов (или строк) первоначальной матрицы игры до тех пор, пока не останется (2 X 2)-матрица; соответствующая игра на¬ зывается игрой, производной от первоначальной игры. Можно показать, что оптимальная стратегия каждого игрока является оптимальной в одной из производных игр и что цена игры является ценой одной из производных игр. Следовательно, наша задача сводится к решению всех про- ч. 6 ч. 5 к. 4 1 0 - 1 -3 -2 1 ч. 6 ч. 5 к. 4 к. 5 1 0 -1 0 -3 —2 1 2
§ 8. Игры с матрицами из двух строк или двух столбцов 403 изводных (2 X 2)-игр и испытанию каждой стратегии для каждого игрока, а также каждой цены, для того чтобы определить, какие из стратегий будут оптимальными стра¬ тегиями и какая цена будет ценой всей игры. Предыдущая (2 X 3)-игра имеет следующие три про¬ изводные игры: 4.6 ч.5 ч.б к.4 ч.5 к.4 ч.5 1 0 ч.Б 1 -1 ч.б .0 —1 к.З -3 -2 к.З -3 1 к.З —2 1 Первая из них является строго детерминированной игрой, остальные не обладают этим свойством. Оптимальными стратегиями игрока А в каждой из этих производных игр служат соответственно (1, 0),^у, и yj. Оптималь¬ ными стратегиями для В служат соответственно / 1 \ / 1 \ G) (})■ Цены этих игр равны 0, —у и —у Применяя эти три A-стратегии к первоначальной игре, мы видим, что при пер¬ вой стратегии А может проиграть 1, при второй он может проиграть у, а при третьей он не может проиграть более чем у. Следовательно, стратегия будет для него оптимальной и — у будет ценой игры. Чтобы применять В-стратегии в производных (2 X 2)-играх ко всей игре, мы должны сначала продолжить их до четырехкомпонентных стратегий. Тогда они примут вид: о 0 V о / 1 0 3 1 0 2 1 » 1 3 2 , 0. . 0 . Легко проверить, что последняя стратегия ной для В, будет оптималь- 26*
404 Глава VI*. Линейное программирование и теория игр Решение всех (2 Хп)- или (m X 2)-матричных игр можно отыскать тем же путем. Сначала следует определить, является ли игра строго детерминированной. Если она не является строго детерминированной, то надо удалить все мажорирующие строки и мажорирующиеся столбцы. Затем остается решить все воз¬ можные производные (2 X 2)-игры, полученные путем вычерки¬ вания одной или более строки или столбца. Цена первоначаль¬ ной игры находится как цена одной из этих (2 X 2)-игр, а опти¬ мальные стратегии первоначальной игры выбираются из опти¬ мальных стратегий производных игр (которые, как правило, должны быть продолжены путем добавления нулей). Пример 3. Рассмотрим (3 X 2)-игру с матрицей 6 —1 0 2 4 3 Эта игра — строго детерминированная, так как элемент 3. является минимальным в своей строке и максимальным в своем столбце. Цена игры равна 3, а оптимальными стра¬ тегиями служат р° = (0, 0, 1) и q° = (j ). Пример 4. Вот другой числовой пример. 1 — 1 2 -3 —1 1 0 1 Здесь четвертый столбец мажорируется вторым и первый столбец мажорируется третьим. Игра сводится тогда к игре с матрицей 1 —3 —1 1 Цена новой игры равна —а оптимальными стратегия- /1\ (1 2 \ / 3 ми служат р° = (-j . -т) и <7° = ( 1 V “3 последняя страте-
§ 8. Игры с матрицами из двух строк или двух столбцов 405 гия продолжается до стратегии которая является оптимальной для первоначальной игры. Упражнения 1. Найдите решения игр с матрицами: (а) (Ь) (с) (d) (е) (0 3 0 1 ю СО 7 5 10 5 4 6 18 3 3 4 1 0 2 0 3 2 0 2 1 3 —1 0 2 0 1 2 3 4 | 2 1 [Отв.: v = 5; (0, 0, 1); /т\ [°"г ” = 7> (4 т); | •] о / 1 0 1 1 2 0 —1 —2 —3 —10
406 Гл. VI*. Линейное программирование и теория игр 2. Найдите решения игр с матрицами: (а) (с) 0 15 8 0 — 10 20 10 12 (Ь) —1 2 0 —3 —4 —2 1 0 2 5 —1 5 —1 —2 8 10 3 —6 1 8 —9 —8 3. Найдите решение игры с матрицей 0 J_ 12 J_l_ 12 О О О 1 2 3 3 2 1 Поскольку для игрока В имеется более чем одна оптимальная стратегия, найдите для этого игрока семейство оптимальных стратегий. (См. § 6, упр. 3.) 4. Пусть в карточной игре, разобранной в примере 2, игрок А имеет ч. 9, ч. 5, к. 7 и к. 3, а игрок В имеет ч. 8 и к .4. Выпишите отвечающую этой игре матрицу и найдите решение соответствующей игры. [Отв.: v = 1; А показывает ч. 4 и к. 7, каждую из этих карт с ве¬ роятностью ~2'у В показывает каждую из своих карт с вероятно* 1 1 стью ~2 . 5. Допустим, что Джонс прячет в руке один, два, три или четыре серебря¬ ных доллара, а Смит отгадывает «четный» или «нечетный». Если Смит отгадывает правильно, он выигрывает ту сумму, которую прятал Джонс, в противном случае он обязан уплатить такую же сумму Джонсу. За¬ дайте соответствующую матричную игру. Найдите для каждого игрока такую оптимальную стратегию, в которой все его (чистые) стратегии имеют положительный вес. Безобидная ли это игра?
§ 8. Игры с матрицами из двух, строк или двух столбцов 407 6. Рассмотрим следующую игру. Игрок А объявляет «один» или «два»; после этого оба игрока пишут независимо друг от друга одно из этих двух чисел. Если сумма этих трех чисел оказывается нечетной, то В платит А эту нечетную сумму в долларах; если же она оказывается четной, то А платит В эту четную сумму в долларах. (a) Каковы стратегии для А? (Указание. Он имеет четыре стратегии.) (b) Каковы стратегии для В? (Указание. Каждая такая стратегия должна указывать В, что ему делать после того, как объявлено «два». Следовательно, В имеет четыре стратегии.) (c) Выпишите матрицу этой игры. (d) Ограничимся случаями, когда игрок А объявляет «два», и оставим только те стратегии В, в которых число, записываемое В, не зависит от числа, объявляемого А. Решите игру с полученной (2x2)-ма¬ трицей. (e) Продолжите смешанные стратегии предыдущего пункта до стратегий первоначальной игры и покажите, что это будут оптимальные стра¬ тегии. (f) Благоприятствует ли эта игра игроку А? Если да, то в какой сте¬ пени? 7. Рассмотрим игру, отличающуюся от игры из упр. 6 тем, что четную сумму получает А, а нечетную сумму получает В. Ответьте на те же вопросы, что и в упр. 6 (за исключением того, что в п. (d) игрок А огра¬ ничивается объявлением числа «один»). Какая игра более благоппият- ствует А? Смогли бы вы предсказать это, не прибегая к теории игр? 8. Ответьте на вопросы упр. 7 из § б в случае, когда выплаты производятся следующим образом. Если общее число показанных пальцев четно, то А получает одну единицу, а если оно нечетно, то В получает одну единицу. Предположим, что каждый игрок показывает только один или два пальца; тогда матрица этой игры будет такой же, что и для игры в сравнение монет. Покажите, что оптимальные стратегии этой игры после их продолжения становятся оптимальными стратегиями всей игры. 9. Рассмотрим следующую игру. Каждый игрок показывает от одного до трех- пальцев; игрок А всегда платит В сумму, равную числу пальцев, показанных игроком В; если В показывает в точности на один палец больше или на два пальца меньше, чем А, то В платит А некоторую положительную сумму х (где х не зависит от числа показанных пальцев). (a) Выпишите матрицу игры для произвольного х. 1 (b) Покажите, что при х = игра будет строго детерминированной. Найдите ее цену. £ Отв.: v = — у .j (с) Покажите, что если х — 2, то имеется пара оптимальных стратегий, при которых первый игрок показывает один или два пальца, а вто¬ рой игрок показывает два или три пальца. (Указание. Решите некоторую производную (2 X 2)-игру. Найдите цену этой игры.) (d) Покажите, что если х = 6, то одной из оптимальных стратегий для А будет использование смешанной стратегии Покажите,
408 Глава VI*. Линейное программирование и теория игр что оптимальной смешанной стратегией для В будет выбор каждой из его трех стратегий с вероятностью -g-. Найдите цену этой игры. 10. Другой вариант предыдущей игры заключается в следующем. Каждый игрок показывает от одного до трех пальцев; если общее число показан¬ ных пальцев окажется четным, то игрок А получает сумму, равную числу пальцев, показанных игроком В; если же общее число показанных паль¬ цев нечетно, то В получает сумму, равную числу пальцев, показанных А. (a) Выпишите матрицу этой игры. (b) Сведите эту игру к игре с (2 X 2)-матрицей. (c) Найдите оптимальные стратегии для каждого игрока и покажите, что эта игра — безобидная. 11. Две компании, большая и маленькая, изготовляющие один и тот же про¬ дукт, хотят выстроить по новому магазину в одном из четырех городов, / г з * Фиг. 132 расположенных вдоль шоссе. Примем все население этих четырех горо¬ дов за 100%. Пусть распределение населения и расстояния между горо¬ дами таковы, как это показано на схеме, изображенной на фиг. 132. Пред¬ положим, что на долю большой компании приходится 80% всего оборота в каждом городе, находящемся от ее магазина на меньшем расстоянии, чем магазин маленькой компании; 60% оборота в городе, лежащем на равных расстояниях от этих двух магазинов; 40% оборота в городе, лежащем ближе к магазину маленькой компании. (a) Выпишите матрицу игры. (b) Проверьте, имеются ли мажорирующие строки и мажорирующиеся столбцы. (c) Найдите оптимальные стратегии и цену этой игры и объясните полу¬ ченные результаты. [Отв.: Обе компании должны построить магазины в городе 2; боль¬ шая компания захватывает 60% оборота.] 12. Решите поставленные в упр. 11 вопросы для случая, когда на долю боль¬ шой компании приходится соответственно 90, 75 и 60% всего товаро¬ оборота. 13. Мы приняли без доказательства, что любая (2 X п) -игра может быть решена путем рассмотрения только ее производных (2x2)-игр. Про¬ верьте, что это имеет место для случая игры вида В а 0 1 0 Ь 1
§ 9. Упрощенный покер 409 (a) Покажите, что если или 6 1, то столбец 3 мажорирует дру¬ гой столбец. Решите игру. (b) Решите три производные (2 X 2)-игры, если а> 1 и b > 1. (Указание. Две из них строго детерминированы.) (c) Покажите, что если а > 1, b > 1, но ab < а + 6, то для обоих игроков оптимальными стратегиями служат оптимальные стратегии не строго детерминированной производной игры. (d) Покажите, что если ab > а + Ь, то А имеет своей оптимальной стра¬ тегией ту же стратегию, что и в п. (с), но В имеет в качестве своей оптимальной стратегии некоторую чистую стратегию. (e) Используя предыдущие результаты, покажите, что в каждом случае цена игры равна наименьшей из цен трех производных игр. § 9. УПРОЩЕННЫЙ ПОКЕР Чтобы показать, каким образом игра, определенная прави¬ лами, может быть представлена в виде матричной игры, мы проделаем это для упрощенного варианта одной хорошо извест¬ ной карточной игры. Пример, изучением которого мы сейчас зай¬ мемся, является упрощением (принадлежащим А. В. Таккеру) игры в покер, рассмотренной на стр. 211—219 книги Дж. фон Неймана и Оскара Моргенштерна «Теория игр и экономическое поведение» (J. von Neumann, О. Morgenstern, The Theory of Games and Economic Behavior, Princeton, 1944 (3-е изд., Princeton, 1953). Колода, используемая в упрощенном покере, состоит из карт всего лишь двух типов, причем тех и других имеется поровну. Карты одного типа мы назовем «старшими», а другого — «млад¬ шими». Например, можно использовать обычную колоду из 52 карт, считая старшими карты красной масти, а младшими — карты черной масти. Каждый игрок «ставит» денежную сумму, равную по величине а, и получает одну-единственную карту. Под распределением карт мы будем понимать пару карт, первая из которых сдана игроку А, а вторая — игроку В. Таким образом, (С, С) означает распределение, при котором каждый игрок по¬ лучает старшую карту. Возможны четыре распределения, а именно (С, С), (С, М), (М, С), (М, М). Если колода достаточно велика, то с большой степенью точности можно считать (см. упр. 1), что эти распределения карт равно- 1 вероятны, т. е. что вероятность каждого из них равна -j- После сдачи карт игрок А делает первый ход, имея в своем распоряжении две альтернативы: он либо «открывает карту», либо «повышает ставку» путем прибавления суммы b. Если А открывает карту, то В также открывает карту. При этом игрок
410 Глава VI*. Линейное программирование и теория игр с более сильной картой забирает обе ставки, в случае же оди¬ наковых карт (обе старшие или обе младшие) каждый игрок получает назад свою ставку. Если А повышает свою ставку, то В имеет в своем распоряжении две альтернативы: он либо «па¬ сует», либо «играет» путем прибавления к имеющимся ставкам суммы Ь. Если В пасует, то А забирает ставки (не показывая своей карты). Если же В играет, то более сильная карта заби¬ рает обе ставки, а в случае одинаковых карт ставки делятся по¬ ровну. В этом и заключаются все правила игры. Чистой стратегией для игрока будет команда, содержащая точное указание того, как ему поступать в каждой мыслимой ситуации, которая может возникнуть в ходе игры. Примером чистой стратегии для А служит: «Повысить ставку, если вы по¬ лучаете старшую карту, и открыть карту, если вы получаете младшую карту». Сокращенно мы будем записывать эту страте¬ гию как «повысить — открыть». Легко видеть, что А имеет че¬ тыре чистые стратегии: «повысить — повысить», «повысить — открыть», «открыть — повысить» и «открыть — открыть». Ана¬ логично В имеет четыре чистые стратегии: «спасовать — спасо¬ вать», «спасовать — играть», «играть — спасовать», «играть — играть». Если чистые стратегии каждого . игрока фиксированы, то в зависимости от распределения карт имеется в точности четыре возможности для протекания игры. Например, предположим, что А выбрал стратегию «открыть — повысить», а В выбрал стра¬ тегию «спасовать — спасовать». В случае распределения (С, С) игрок А открывает карту, и ставки возвращаются назад, так что никто не выигрывает; в случае (С, М) игрок А открывает карту и забирает ставки, что делает его выигрыш равным а; в случае (М, С) игрок А повышает ставку, а игрок В пасует, так что А выигрывает а; наконец, в случае (М, М) игрок А повышает ставку, а игрок В пасует, так что А выигры¬ вает а. Так как вероятность каждого такого распределения 1 д За равна -j-, то среднее значение выигрыша игрока А равно -j-. Вычислим теперь среднее значение выигрыша, отвечающее стратегии «открыть — повысить» для А и стратегии «играть — спасовать» для В. В случае распределения (С, С) игрок А от¬ крывает карту и не- выигрывает ничего; в случае (С, М) игрок А открывает карту и выигрывает а; в случае (М, С) игрок А повышает ставку, а игрок В играет и выигрывает а + Ь; нако¬ нец, в случае (М, М) игрок А повышает ставку, игрок В пасует, и А выигрывает а. Математическое ожидание выигрыша игрока А равно (а — Ь) /4.
§ 9. Упрощенный покер 411 Продолжая в том же духе, мы можем вычислить ожидаемый исход игры для каждого из 16 возможных выборов пар страте¬ гий. Получающаяся матрица выплат имеет вид: Старшая спасовать спасовать играть играть младшая j спасовать играть спасовать игра-ь открыть открыть | ! 1 0 0 0 0 открыть повысить За ~т 2а 4 а — b 4 ь "" 4 повысить открыть а т a -j- /) 4 0 ь 4 повысить повысить 4 а 4 За + b 4 а — b 4 0 Таким образом, осуществлен перевод игры, определенной на¬ шими правилами, в матричную игру. Так как а и b — положительные числа, то мы видим, что в написанной матрице четвертая строка мажорирует вторую, а третья строка мажорирует первую. Аналогично третий столбец мажорируется первым и вторым столбцами. Мы можем свести эту (4 X 4)-матрицу к следующей (2 X 2)-матрице: Консерва¬ тивная: Блефовая: Стратегию «повысить — открыть» мы называем «консерватив¬ ной» для А, так как представляется благоразумным повышать ставку в случае старшей карты и открывать младшую. Страте¬ гию «повысить — повысить», которая диктует повышение ставки и в случае младшей карты, мы называем «блефовой», так как эта стратегия соответствует обычному пониманию блефа1). По- *) «Блефовать» — термин, употребляемый в игре в покер (с принципиаль¬ ной стороны весьма близкой к описанной здесь игре); он означает повыше¬ ние ставки без сильной карты на руках в надежде запугать противника и вы¬ нудить его к отказу от игры (к «пасу»). Старшая Консервативная играть Блефовая: играть младшая пасовать играть повысить открыть 0 Ь 4 повысить повысить а — b 4 0
412 Глава VI*. Линейное программирование и. теория игр добным же образом стратегию «играть — пасовать» мы назвали «консервативной», а стратегию «играть — играть» — блефом для игрока В. Пример 1. Пусть а = 4 и b = 8. Тогда предыдущая матрица принимает вид: Консервативная Блефовая Консервативная Блефовая 0 2 —1 0 Игра здесь строго детерминированная и безобидная. Опти¬ мальная стратегия для каждого игрока — консервативная. Пример 2. Пусть а = 8 и b = 4. Тогда матрица игры имеет вид: Консервативная Блефовая Консервативная Блефовая О 1 1 Здесь цена игры равна • Это означает, что игра благо¬ приятствует игроку А. Оптимальная стратегия для каждого игрока — блефовая с вероятностью и консервативная 1 с вероятностью • В последнем примере мы столкнулись с интереснейшим ре¬ зультатом теории игр: для осуществления оптимальной страте¬ гии необходимо в части играемых партий идти на блеф. Упражнения 1. Пусть для игры в упрощенный покер берется обычная колода в 52 карты, причем старшими считаются карты красной масти, а младшими — карты черной масти. Вычислите с точностью до четырех десятичных знаков ве¬ роятность вынуть красную карту при условии, что одна красная карга уже была вынута. Пользуясь этим результатом, исследуйте, насколько точным является предположение об одинаковой вероятности четырех распределений карт. Как может быть улучшена точность этого пред¬ положения? 2. В найденной выше (4 X 4)-матрице положим а = 4, b = 8. Путем вы¬ черкивания мажорирующих строк и мажорирующихся столбцов свели ее к (2 X 2)-матрице. Будет ли эта матрица такой же, что и в при¬ мере 1? То же самое при а = 8, Ь = 4 и для примера 2. 3. Покажите, что если а^СЬ, то упрощенный покер является строго детер¬ минированной и безобидной игрой. Покажите также, что оптимальные стратегии обоих игроков — консервативные.
§ 9. Упрощенный покер 413 4. Покажите, что если а> 6, то упрощенный покер благоприятствует игроку А. Покажите также, что при оптимальном образе действий каждый игрок должен блефовать с положительной вероятностью, и най¬ дите оптимальные стратегии. 5. При а > 6 исследуйте, каким образом можно сделать игру безобидной. 6. Покажите, что при 6!>а оптимальная стратегия для игрока А не един¬ ственна. Покажите также, что, хотя он имеет две «оптимальные» стра¬ тегии, стратегия «повысить — открыть» в определенном смысле предпочти¬ тельнее другой. 7. Покажите, что при а = 8, 6 = 4 оптимальную стратегию игрока А можно описать следующим образом: «В случае старшей карты всегда повышать 1 ставку, в случае младшей карты повышать ставку с вероятностью »• Опишите аналогично оптимальную стратегию игрока В. В упражнениях, приводимых .ниже, рассматривается один вариант упрощенного покера. Для реального покера характерно, что чаще всего игроки получают плохие карты и очень редко — хорошие. Можно сде¬ лать нашу модель покера более реальной, если ввести предположение, что сдача младшей карты вероятней сдачи старшей карты. Мы будем 1 считать, что вероятность сдачи старшей карты равна всего лишь . Правила игры остаются такими же, как и выше. 8. Найдите вероятность распределений карт (С, С), (С, М), (М, С) и (М, М). 9. Стратегии обоих игроков — те же, что и в тексте. Следовательно, мы имеем аналогичную (4 X 4)-матрицу игры. Вычислите тем же способом, что и в тексте, но используя результат упр. 8, элемент, стоящий в строке «открыть — повысить» и столбце «пасовать — пасовать». То же самое для элемента строки «открыть — повысить» и столбца «играть — пасо¬ вать». [Отв.: 24а/25; (16—46)/25.] 10. Вычислите остальные элементы и выпишите матрицу игры. 11. Покажите, что две строки мажорируют другие строки и два столбца мажорируются другими столбцами. 12. Покажите, что получающаяся в результате (2 X 2)-игра будет строго детерминированной тогда и только тогда, когда 6 4а. Чему при этом условии равна цена игры? 13. Пусть, как и в тексте, а = 4, 6 = 8. Решите игру и сравните решение с решением в тексте. 16 [Отв.: Каждый игрок должен в половине случаев блефовать; v=—; в первом варианте при этих условиях блеф не использовался, и игра была безобидной.] 14. Пусть, как и в тексте, а = 8, 6 = 4. Решите игру и сравните решение с решением в тексте. [Отв.: Каждый игрок играет более консервативно; условия игры несколько более благоприятствуют игроку А, нежели в первом ва¬ рианте.] 15. Игроки договорились о том, что размером первоначальной ставки являются 4 доллара. Они обдумывают, какой им выбрать размер повышающей ставки. На каком значении для 6 должен настаивать игрок А? (Указание. Он не хочет, чтобы игра была безобидной. Какими должны быть соответствующие значения 6? Найдите цену (2 X 2) -игры для любых таких 6 и найдите максимальную цену путем испытания нескольких значений для 6.)
414 Глава VI*. Линейное программирование и теория игр ЛИТЕРАТУРА ДЛЯ ДОПОЛНИТЕЛЬНОГО ЧТЕНИЯ ЧарнсА., Купер Вм Хендерсон А., Введение в линейное программи¬ рование, АА, Изд. Моск. гос. эконом, ин-тута, 1960. Гасс С.., Линейное программирование, М., Физматгиз, 1961. Юдин Д. Б., Гольштейн Е. Г., Задачи и методы линейного программи¬ рования, М., «Сов. радио», 1961. Венцель Е. С., Элементы теории игр, М., Физматгиз, 1961. Вильямс Дж. Д., Совершенный стратег или Букварь по теории стратегиче¬ ских игр, М., «Сов. радио», 1960. Мак-Кинси Дж., Введение в тероию игр. М., Физматгиз, 1960. Лыос Р. Д., Райфа X., Игры и решения. Введение и критический обзор М., ИЛ, 1961. Линейные неравенства (сборник переводов), М., ИЛ, 1959. Матричные игры (сборник переводов), М., Физматгиз, 1961с
Глава VII* ПРИМЕНЕНИЕ К БИХЕВИОРИСТКИМ ПРОБЛЕМАМ § 1. СОЦИОМЕТРИЧЕСКИЕ МАТРИЦЫ Матрицы, все элементы которых равны либо 0, либо 1, ис¬ пользовались социологами для анализа структуры отношений доминирования в группах индивидуумов (животных или людей). Для обозначения того, что индивидуум Д «доминирует» над индивидуумом Д, мы будем применять запись А{^>А2. Напри¬ мер, по способности склевывать корм на птичьем дворе курица Л] может доминировать над курицей А2, т. е. Д^>Д означает, что «курица A j проворнее курицы А2». Другой пример: пусть Д и Л2 — спортивные команды, а отношение А] А2 означает, что «команда А\ сильнее команды А2 (г. е. выигрывает у этой команды)». Мы будем говорить, что отношение является отношением доминирования, если оно обладает следующими двумя свой¬ ствами: (i) Неверно, что Д^>>Д. Иными словами, никакой инди¬ видуум не может доминировать над самим собой. (И) Для каждой пары индивидуумов Д и А2 либо Д^Э> Д, либо Д^> Д, но не могут иметь место оба эти отношения. Иначе говоря, в каждой паре индивидуумов в точности один индивидуум доминирует над другим. Было замечено, что способность кур склевывать пищу опи¬ сывается отношением доминирования. Также и в любом спор¬ тивном состязании, проводимом в один круг и без ничьих (вроде состязания по бейсболу1)), отношение команд, устанавливаемое результатами состязания, есть отношение доминирования. Читатель может удивиться отсутствию условия транзитивно¬ сти: требования, чтобы из Д^> Д и Л2^> Д следовало Д Д. 1) Или по волейболу,
416 Гл. К//*. Применение к бихевиористским проблемам Стоит, однако, обдумать эти вопросы более тщательно, чтобы убедиться в неосновательности требования транзитивности отно¬ шения доминирования. Действительно, если, скажем, команда А выигрывает у команды В, а команда В выигрывает у команды С, то отсюда еще вовсе не всегда следует, что команда А обяза¬ тельно должна выиграть у команды С. Почти в каждом фут¬ больном сезоне можно наблюдать примеры отклонения от этого правила. Для изображения отношений доминирования удобно пользо¬ ваться так называемыми направленными графами. Два таких графа изображены на фиг. 133. Индивидуумы изображаются точками и обозначаются буквами, а отношение доминирования 4* Фиг. 133 между двумя индивидуумами — направленным отрезком прямой (отрезком со стрелкой), соединяющим эти две точки. Граф на фиг. 133, а изображает случай, когда А\ доминирует над А2, А2 доминирует над Л3 и Л3 доминирует над А\. Аналогично на фиг. 133,6 А\ доминирует над А2 и Л3, а А2 доминирует над Л3. Эти графы изображают две существенно различные ситуации, связанные с отношением доминирования, которые могут иметь место в случае трех индивидуумов (ср. упр. 1). Еще один способ описания отношений доминирования заклю¬ чается в использовании так называемых матриц доминирования, у которых каждый элемент равен либо 0, либо 1. На фиг. 134 приведены две такие матрицы. Мы пометили строки и столбцы буквами, служащими для обозначения индивидуумов. Элемент 1 в строке, помеченной Д, и столбце, помеченном Д, означает, что индивидуум Д доминирует над индивидуумом Д, т. е. ДО^> Aj. Аналогично элемент 0 служит для указания того, что Д не доминирует над Д. Читатель может проверить, что слу-
§ 1. Социометрические матрицы 417 чаи доминирования, представленные на фиг. 133, а и 133,6, те же, что и на фиг. 134, а и 134,6. Л А Лч (о 1 А 0 0 А Vo 0 б Фиг. 134 Так как матрица доминирования отражает отношение доми¬ нирования, то можно проследить, какие ограничения наклады¬ вают на нее приведенные выше условия (i) и (ii). Условие (i) означает просто, что все элементы матрицы, стоящие на главной диагонали (диагонали, идущей слева направо и вниз), должны быть нулями. Условие (ii) означает, что если некоторый эле¬ мент, расположенный над главной диагональю, равен 1, то сим¬ метричный ему относительно главной диагонали элемент будет равен нулю, и наоборот. Чтобы сформулировать эти условия бо¬ лее точно, предположим, что имеется п индивидуумов и матрица доминирования D с элементами dtj. Тогда наши условия примут вид: (i) du = 0 для i = 1, 2, ..п. (ii) Если i Ф /, то dtj= 1 тогда и только тогда, когда djt = 0. Единицы, стоящие в i-й строке, соответствуют тем индивиду¬ умам, над которыми доминирует At. Единицы, стоящие в /-м столбце, соответствуют тем индивидуумам, которые домини¬ руют над Aj. Матрица доминирования — квадратная, поэтому всегда мо¬ жно найти ее степени D2, D3 и т. д. Пусть Е = D2; рассмотрим элемент, стоящий в /-й строке и /-м столбце матрицы Е. Мы имеем: eij — dildlj^-di2d2j-\- ••• -\~dindnj. Слагаемое вида dikdkj не равно нулю только в том случае, когда не равны нулю оба сомножителя, т. е. когда оба они равны 1. Но если dik = 1, то индивидуум Аь доминирует над Akt а если dkj= 1, то индивидуум Ak доминирует над Aj. Другими словами, At^> Ak^>Aj. Доминирование такого типа мы будем называть двучленным доминированием. (Чтобы быть последова¬ тельными, мы будем называть At^> Aj одночленным доминиро¬ ванием.) Теперь можно сказать, что элемент равен числу 27 За к. 609
418 Г л. VII*. Применение к бихевиористским проблемам двучленных доминирований индивидуума Д над индивиду¬ умом А). Пусть, например, D есть матрица Тогда D2 есть матрица D1 — 1° 1 1 *\ 0 0 1 1 0 0 0 1 \0 0 0 0/ /° 0 1 2\ 0 0 0 1) 0 0 0 0 \о 0 0 0/ Итак, мы видим, что в этом примере Ai имеет одно двучленное доминирование над Аг и два двучленных доминирования над Л4. Точно так же А2 имеет одно двучленное доминирование над А^. Символически это может, быть записано следующим об¬ разом: Д »Д»Д, Д» Л:» Л, Л>Д>Д д»д»д. Фиг. 135 Эти отношения доминирования представлены направленным графом на фиг. 135. Читатель должен проследить на нем выпи¬ санные двучленные доминирования. В следующем параграфе будет доказана Теорема. Пусть на множестве из п индивидуумов Ль А2, ... ..., Ап определено отношение доминирования Тогда суще¬ ствует по крайней мере один индивидуум, который может доми¬ нировать одночленным или двучленным образом над каждым из остальных индивидуумов данной группы. Аналогично суще¬ ствует по крайней мере один индивидуум, над которым домини¬ рует одночленно или двучленно каждый из остальных индивиду¬ умов. На языке матриц эту теорему можно сформулировать сле¬ дующим образом. Пусть S = D + D2. Тогда существует по край¬ ней мере одна строка (а также столбец) матрицы S, все элемен-
§ /. Социометрические матрицы 419 ты которой, кроме элемента, стоящего на главной диагонали, отличны от нуля. Для иллюстрации этой теоремы рассмотрим случай домини¬ рования, представленный на фиг. 136. Матрица доминирования D и ее квадрат D2 имеют вид: D = -0110. D2 = /0 1 2 0 10 0 0 0 10 1 10 10 Соответствующая матрица S равна / 0 2 2 1 \ 10 10 110 1 \l 1 2 о/ Мы видим, что А\л Л3 и Л4 могут доминировать одночленно или двучленно над каждым из остальных индивидуумов, но А2 не может доминировать таким образом над А4. Точно так же над каждым из индивидуумов Ль Л2 и Л3 доминирует одночленна или двучленно каждый из осталь¬ ных индивидуумов, тогда как над А4 не может доминировать таким образом Л2. Полезно про¬ верить справедливость этих вы¬ сказываний на направленном гра- д « фе, изображенном на фиг. 136. 3 В качестве последнего приме¬ нения матриц доминирования мы дадим определение ранга индивидуума. Рангом индивидуума при данном отношении доминирования называется число всех, одночленных и двучленных доминирований, которые этот инди¬ видуум может осуществить. Число всех одночленных доминиро¬ ваний, осуществляемых индивидуумом Л/, равно сумме элемен¬ тов i-й строки матрицы D, а число всех двучленных доминиро¬ ваний, осуществляемых Aif равно сумме элементов i-й строки матрицы D2. Следовательно, ранг индивидуума Аь равен сумме элементов i-й строки матрицы Фиг. 136 S = D + D2. 27*
420 Гл. VII*. Применение к бихевиористским проблемам Легко убедиться> что в примере, изображенном на фиг. 136, различные индивидуумы имеют следующие ранги: ранг Аг равен 5; ранг А2 равен 2; ранг Л3 равен 3; ранг А4 равен 4. Пример. Понятием ранга индивидуума можно пользо¬ ваться для оценки результатов спортивных соревнований. Пусть, например, один тур какого-то матча дал следующие результаты: команда А выиграла у команд В и D; команда В выиграла у команды С; команда С выиграла у команды А; команда D выиграла у команд С и В. Легко видеть, что этот случай доминирования совпадает с тем, который представлен на фиг. 136. В соответствии с проведенным выше анализом мы можем расположить эти команды в следующем порядке по их рангу: A, D, С и В. Необходимо заметить, что данное здесь определение ранга индивидуума не является единственно возможным. В упр. 10 этого параграфа используется другое определе¬ ние ранга, которое приводит к другим результатам. Прежде чем воспользоваться тем или другим из этих определений, социолог должен решить, какое из них лучше отвечает его целям (если вообще годится хоть одно из них). Упражнения 1. Покажите, что сравнение способности трех кур склевывать корм дает лишь два существенно различных типа отношений доминирования, а имен¬ но те, которые даны на фиг. 133. [Указание. Воспользуйтесь направленными графами.] 2. Найдите матрицы доминирования Д которые соответствуют направлен¬ ным графам, изображенным на фиг. 137. (b) 0 10 1 0 0 0 0 110 0 0 110 ■] 3. Вычислите матрицы D? и S = D + D2 для примеров, перечисленных в упр. 2, и определите ранг каждого из индивидуумов. j^O/ne.: (b) D2 = 0 1 1 0 0 2 1 1 ’ 0 0 0 0 ; s = 0 0 0 0 0 1 0 1 1 2 0 1 . 1 1 0 0 , k i 2 1 0 . 4, 0, 4, 4.]
§ 1. Социометрические матрицы 421 4. Определите ранг каждого индивидуума в ситуации доминирования, задан¬ ной матрицей доминирования ' 0 1 0 0 1 1 1 0 0 1 1 1 0 1 1 0 0 1 0 1 0 1 0 0 0 1 1 1 0 0 1 0 0 0 0 0 1 0 0 1 0 1 0 0 1 0 1 0 0 [Отв.: Эти ранги равны соответственно 14, 14, 14, 14, 4, 10, 6.] 5. Найдите все существенно различные типы отношений доминирования, возможные при сравнении способности четырех кур склевывать корм. [Отв.: Возможны четыре существенно различных типа.] А3 Ф и г. 137 6. Пусть D — матрица доминирования. Дайте интерпретацию для элементов столбцов матрицы 5 = D + D2. Дайте также интерпретацию сумм эле¬ ментов столбцов матрицы 5. 7. Пусть D — матрица доминирования. Дайте интерпретацию элементов ма¬ трицы D3; дайте также интерпретацию сумм элементов строк или эле¬ ментов столбцов матрицы D3; то же самое сделайте для элементов и для сумм элементов строк (или столбцов) матрицы S(3) = D + О2 + DЛ 28 Зак. С09
422 Гл. VIIм. Применение к бихевиористским проблемам [Отв.: Элементы Z-й строки матрицы D3 дают трехчленные доминиро¬ вания, осуществляемые индивидуумом А/; сумма элементов /-строки матрицы D3 дает число всех трехчленных доминирований, осуще¬ ствляемых Ai. Элементы матрицы S дают число одночленных, дву¬ членных и трехчленных доминирований, осуществляемых Л/, а сумма элементов Z-й строки матрицы S дает число всех таких домини¬ рований.] 8. Пусть D — матрица доминирования. Дайте интерпретацию элементов матрицы s(n) = D + D2 + D3+ ... +Dn. Дайте также интерпретацию сумм элементов строк (или столбцов) этой матрицы. <9. Теннисный матч между четырьмя игроками дал следующие результаты: Смит выиграл у Брауна и у Джонса; Джонс выиграл у Брауна; Тейлор выиграл у Смита, у Брауна и у Джонса. Путем нахождения ранга каждого игрока разделите между ними первое, второе, третье и четвертое места. Согласуется ли такое разделение с ва¬ шей интуицией? [Отв.: Ранг Тейлора = 6, ранг Смита = 3, ранг Джонса = 1 и ранг Брауна = 0.] 10. Будем для обозначения ранга индивидуума, определенного в основном тексте, применять запись «ранн». Определим теперь новый ранг индиви¬ дуума— «ранг2» — следующим образом. Если D — матрица доминирова¬ ния для группы объектов из п индивидуумов, то ранг2 индивидуума Л равен сумме элементов /-й строки матрицы s, = d + 1d*. Для каждой из спортивных команд разобранного в тексте примера най¬ дите ранг2. Покажите, что для одной и той же команды, рани и ранг2 могут не совпадать. Прокомментируйте полученные результаты. 11. Найдите ранг2 каждого из игроков, фигурирующих в упр. 9. Для ка¬ ждого игрока рассмотрите связь между его рангом! и рангом2. 9 5 [Отв.: Ранг2 Тейлора равен , ранг2 Смита равен -g-, ранг2 Джонса равен 1 и ранг2 Брауна равен 0.] 12. Интерпретируйте элементы следующей матрицы: Sm_1 = D + ±D* + ^D» + ... +^-Ят. Дайте также интерпретацию суммы элементов, ее строки или столбца. 13. Используя результат упр. 5, докажите, что если о результатах матча ме¬ жду четырьмя игроками судить по рангам игроков, то случится одно из двух: либо разные игроки займут в таблице разные места, либо одно ме¬ сто (первое или второе) разделится между тремя игроками. В последнем случае покажите, пользуясь соображениями симметрии, что не существует рационального метода, который позволил бы отдать предпочтение тому или иному из игроков (без проведения дополнительной игры). 14. В разобранном в тексте примере замените глагол «выиграть» глаголом «проиграть». Приведет ли это к изменению порядка команд в зависимо¬ сти от их ранга на противоположный? Решите тот же вопрос в приме¬ нении к ситуации, описанной в упр. 9. [Отв.: Нет; С, В, A, D; да.]
§ 2. Коммуникационные сети 423 § 2. КОММУНИКАЦИОННЫЕ СЕТИ Коммуникационной сетью называется множество из п лиц (назовем их Л2, ..., Ап) с некоторым числом связей между ними. Каждая такая связь устанавливает сообщение между дву¬ мя лицами и может быть либо односторонней, либо двусторон¬ ней. Двустороннюю связь может, например, осуществлять теле¬ фон или радио, одностороннюю связь — курьер, сигнальная лам¬ почка, взрыв, и т. д. Мы снова будем употреблять символ^, но теперь Д^>Д означает, что индивидуум А£ может сооб¬ щаться с индивидуумом Aj (в направлении от Д к Д). Един¬ ственное требование, которое мы теперь налагаем на символ заключается в следующем: Фиг. 138 (i) Ни для какого i не может иметь места Д^> Д, т. е. ни¬ какой индивидуум не может (или не имеет надобности) сооб¬ щаться с самим собой. Заметим, что мы опустили второе из условий, принятых в предыдущем параграфе: мы теперь не требуем, чтобы для ка¬ ждой пары индивидуумов по меньшей мере один мог сообщаться с другим. Допускается также, что как Д^> Д, так и Д^Д,-, т. е. допускается двусторонняя связь. Для изображения коммуникационных сетей мы будем, как и в предыдущем разделе, пользоваться направленными графами. На фиг. 138 изображены два таких графа. Стрелки здесь ука¬ зывают, в каком направлении может быть передано сообщение. Две стрелки означают, что сообщение может быть передано в обоих направлениях. Как и раньше, мы можем также представлять коммуника¬ ционные сети при помощи матриц С, у которых каждый элемент 28*
424 Гл. VII*. Применение к бихевиористским проблемам равен либо 0, либо 1, и которые мы будем называть коммуника¬ ционными матрицами. Элемент, принадлежащий i-й строке и /-му столбцу матрицы С, должен быть равен 1, если может передать сообщение Aj, и равен 0 в противном случае. Коммуни¬ кационные матрицы, соответствующие коммуникационным сетям, изображенным на фиг. 138, приведены на фиг. 139. С- / С = 0 1 О Vo 1 0 \ 0 0 \ 0 1 1 0 0 1 0 о/ б Фиг. 139 Заметим, что в матрицах, приведенных на фиг. 139, все диа¬ гональные элементы матрицы равны 0. Это обстоятельство имеет место для всех коммуникационных матриц, так как условие (i), выраженное на языке матриц, означает, что си = 0 для всех /. Легко видеть, что любая матрица, у которой каждый элемент равен либо 0, либо 1 и все элементы главной диагонали равны нулю, является коммуникационной матрицей некоторой сети. Квадрат коммуникационной матрицы может быть интерпре¬ тирован аналогично интрепретации квадрата матрицы доминиро¬ вания. Если С — коммуникационная матрица, то элемент, стоя¬ щий в i-й строке и /-м столбце матрицы С2, означает число двухзвенных сообщений, ведущих от Аь к Aj. Например, квад¬ рат матрицы, фигурирующей на фиг. 139, а, равен С2: П 0 0 \l 0 1 1 о 1 о 0 1 0 1 1 о/ Элемент 1, стоящий в верхнем левом углу, показывает, что Ах может сообщаться сам с собой, используя два звена связи. Дей¬ ствительно, коммуникационной сетью в этом случае может быть Ах~^> А2^> Ах. Мы видим также, что, например, А4 может посы¬ лать двузвенные сообщения как Аи так и А3. Эти и другие дву¬ звенные связи, представленные матрицей С2, можно видеть на графе, изображенном на фиг. 138, а. Как и в § 1, нас будет интересовать сумма матриц С и С2. Пусть S = С + С2. Следующая теорема является обобщением теоремы, сформулированной в § 1 (см. упр. 7 настоящего па¬ раграфа) .
§ 2. Коммуникационные сети 425 Теорема. Пусть коммуникационная сеть из п индивиду¬ умов такова, что между каждыми двумя индивидуумами воз¬ можна по крайней мере одностороняя связь. Тогда существует по меньшей мере один индивидуум, который может послать ка¬ ждому из остальных индивидуумов однозвенное или двузвенное сообщение. Аналогично существует по меньшей мере один инди¬ видуум, который может получать от каждого из остальных инди¬ видуумов однозвенное или двузвенное сообщение. На языке матриц эта теорема формулируется так: Пусть С — коммуникационная матрица описанной выше сети; тогда в мат¬ рице S = С + С2 имеется по меньшей мере одна строка, все эле¬ менты которой (за исключением, быть может, элемента, находя¬ щегося на главной диагонали) не равны нулю. Аналогично имеется по меньшей мере один столбец с этим же свойством. Доказательство. Мы докажем только первое утвержде¬ ние теоремы, потому что второе доказывается аналогично. Покажем прежде всего, что если индивидуум Д не может послать однозвенное или двузвенное сообщение индивидууму Д, где i Ф 1, то число индивидуумов, которым Д может послать однозвенное сообщение, по меньшей мере на единицу больше числа индивидуумов, которым может послать однозвенное сооб¬ щение Д. Доказательство этого утверждения мы разобьем на два шага. Прежде всего из условия теоремы следует, что (a) Если Д не может послать Д однозвенное сообщение, т. е. если неверно, что Д^>Д, то Д^>Д. (b) Если Д не может послать Д двузвенное сообщение, т. е. если для всех k неверно, что Д Ak^> Д, то из Ах^§> А/г сле¬ дует также, что и Д Д. В самом деле, если Д Д, то неверно, что Д^> Д. Сле¬ довательно, по условию теоремы, ДД> Ak. Утверждение (Ь) говорит, что если А\ может передать одно¬ звенное сообщение какому-нибудь индивидууму, то тому же са¬ мому индивидууму может передать однозвенное сообщение так¬ же и Д. Отсюда и из (а) следует, что Д может передать по крайней мере на одно однозвенное сообщение больше, чем Д. Вернемся к доказательству теоремы. Пусть гХУ г2, •••,Oz — суммы элементов строк матрицы С. Переименовав, если нужно, Д, . . Д, мы можем добиться того, чтобы наибольшей из этих сумм была сумма гх, т. е. чтобы было rx ;>rk при k = 1, 2, . . . , п. Покажем, что Д может передать однозвенное или двузвенное сообщение каждому из остальных индивидуумов. Доказатель¬ ство имеет косвенный характер. Предположим противное, т. е. что имеется индивидуум Д , i> 1, которому Д не может пере¬ дать однозвенное или двузвенное сообщение. В таком случае, как мы уже знаем, число индивидуумов, которым Д может
426 Гл. VIIм. Применение к бихевиористским проблемам передать однозвенное сообщение, по крайней мере на единицу больше числа индивидуумов, которым может передать однозвен¬ ное сообщение А{. Но отсюда следует, что гг- > Г\ — а это проти¬ воречит нашему предположению о том, что rx^rt. Это противо¬ речие и доказывает теорему. Из нашего доказательства так же следует, что индивидуум, которому отвечает наибольшая сумма элементов строки матрицы С, может передавать однозвенное или двузвенное сообщение ка¬ ждому из остальных индивидуумов. Аналогично индивидууму, для которого сумма элементов столбца наибольшая, может пе¬ редать однозвенное или двузвенное сообщение каждый из остальных индивидуумов. Пример. Сеть, изображенная на фиг. 140, удовлетворяет условию нашей теоремы. Поэтому для нее верно и заклю¬ чение этой теоремы. Коммуникационная матрица этой сети имеет вид 0 1 1 0' 0 0 1 0 0 1 0 1 1 1 0 0. Здесь максимальную сумму элементов, равную 2, имеют первая, третья и четвертая строки. Следовательно, Ai, А3 и А4 могут передавать однозвенное или двузвенное сообщение ка¬ ждому индивидууму. (Укажите на фиг. 140 пути, реализующие эти передачи.) Но А2 может пе¬ редать только трехзвенное сооб¬ щение А\. Сумма элементов вто¬ рого столбца является макси¬ мальной и равна 3. Следователь- Фиг. 140 но, А2 может получать однозвен¬ ное или двузвенное сообщение от каждого индивидуума. (На самом деле здесь можно обойтись далее одними лишь однозвенными сообщениями.) Оказывается, что А3 и А4 тоже могут получать однозвенное или двузвенное сообщение от каждого индивидуума, но А\ не может, как это было замечено выше. Ни одна из сетей, изображенных на фиг. 138, не удо¬ влетворяет условию теоремы, причем сеть, изображенная на фиг. 138, а, удовлетворяет заключению теоремы, а сеть, изо¬ браженная на фиг. 138,6, не удовлетворяет ему. (См, упр. 4.)
§ 2. Коммуникационные сети 427 Упражнения 1, Напишите коммуникационные матрицы для коммуникационных сетей, изо¬ браженных на фиг. 141. | Отв.: (а) ' 0 0 1 0 1 0 0 0 1 1 0 0 . 1 о' 1 1 . Л, Фиг. 141 2. Вычертите направленные графы, соответствующие следующим коммуни¬ кационным матрицам: (Ь) 0 1 0 1' 0 1 0 г 0 0 0 0 1 0 0 1 1 0 1 0 0 0 0 0 ; (с) ; (d) 0 0 0 1 1 0 0 1 1 0 0 0 ,1 1 1 0. ^0 1 1 0. 0 0 1 0. 3. Какие из коммуникационных сетей, соответствующих матрицам, выписан¬ ным в упр. 2, удовлетворяют условию теоремы этого параграфа? [Отв.: (а) и (с).] 4. Покажите, что для сети, изображенной на фиг. 138, а, верно заключение теоремы, а для сети, изображенной на фиг. 138,6, оно не верно. 5. Для каждой коммуникационной матрицы из числа выписанных в упр. 2 найдите матрицу S и с ее помощью укажите индивидуумы, которые мо¬ гут передавать сообщения (однозвенные или двузвенные) каждому из
428 Гл. VII*. Применение к бихевиористским проблемам остальных, а также индивидуумы, которым может быть передано одно¬ звенное или двузвенное сообщение от каждого индивидуума. В некоторых случаях таких индивидуумов может и не быть. (См. упр. 3.) [Отв.: (а) Каждый. (Ь) Каждый, (d) Нет ни тех, ни других.] 6. Найдите все коммуникационные сети для трех индивидуумов, удовлетво¬ ряющие условию теоремы настоящего параграфа. Сколько среди них су¬ щественно различных сетей? [Отв.: Семь.] 7. Покажите, что теорема, сформулированная в предыдущем параграфе, яв¬ ляется следствием теоремы, доказанной в настоящем параграфе. 8. Объясните смысл элементов матрицы С3, где С — некоторая коммуникаци¬ онная матрица. То же самое для матрицы С4. [Отв.: Элемент, принадлежащий i-й строке и /-му столбцу матрицы С3, дает число возможных трехзвенных сообщений, связывающих А-ь и Aj. Соответствующий элемент матрицы С4 дает число всех возмож¬ ных четырехзвенных сообщений, связывающих А-ь и Aj.] 9. Какой смысл имеют элементы матрицы = С + С2 + С3 + ... + Ст, где С коммуникационная матрица? 10. Докажите второе утверждение теоремы настоящего параграфа. 11. Докажите истинность следующего высказывания: для того чтобы в ком¬ муникационной сети, связывающей трех индивидуумов, сообщение, по¬ сланное любым из индивидуумов, могло быть получено любым другим индивидуумом, необходимо и достаточно, чтобы каждый индивидуум мог посылать сообщения по меньшей мере одному индивидууму и мог полу¬ чать сообщения по меньшей мере от одного индивидуума. 12. Покажите, что условие упр. 11 имеет следующую матричную форму: ка¬ ждая строка и каждый столбец коммуникационной матрицы должен со¬ держать по крайней мере один ненулевой элемент. 13. Будет ли истинным утверждение упр. II для коммуникационной сети из двух индивидуумов? Из четырех или более? [Отв.: Да; нет.] § 3. СТОХАСТИЧЕСКИЕ ПРОЦЕССЫ В ГЕНЕТИКЕ Вернемся к схеме наследования определенных признаков, за¬ тронутой в примерах 7—9 из § 7 гл. V. Там шла речь о наслед¬ ственных признаках, определяемых одной парой генов, переда¬ ваемых потомству каждым из родителей; эти гены могут быть двух существенно разных типов, которые мы обозначили бук¬ вами G и g. Данная особь может иметь эти гены или в комбина¬ ции GG, или в комбинации Gg (что генетически не отличается от комбинации gG), или в комбинации gg. Если особи, несущие гены GG и Gg, неразличимы по внешнему виду (что очень часто имеет место), то говорят, что ген G доминирует над геном g. Особь называется доминантной по данному признаку, если она имеет комбинацию генов GG, рецессивной, если она имеет ком¬ бинацию gg, и гибридной, если она имеет комбинацию Gg. Основное допущение генетики заключается в том, что выбор генов, отбираемых по одному гену из пары генов каждого из родителей, происходит случайно и независимо. Это допущение дает возможность определить вероятность появления потомства
§ 3. Стохастические процессы в генетике 429 каждого типа. Потомок двух доминантных особей заведомо бу¬ дет доминантным, потомок двух рецессивных особей — рецессив¬ ным, а потомок рецессивной и доминантной особей — гибридом. Потомок доминантной особи и гибридной особи унаследует от первой особи ген G, а от второй особи с одинаковой вероятно¬ стью, равной у, ген G или g. Следовательно, в этом случае с одинаковой вероятностью можно получить доминантное или гиб¬ ридное потомство. Аналогично при скрещивании рецессивной особи с гибридной с одинаковой вероятностью можно получить рецессивное или гибридное потомство. Наконец, при скрещива¬ нии двух гибридов вероятность наследования потомком от ка¬ ждого из родителей гена G или гена g равна у. Следовательно, вероятность признака GG равна у, вероятность признака Gg 1 1 / равна у и вероятность признака gg равна у (см. выше, стр. 307—309). Пример 1. Рассмотрим следующий процесс последова¬ тельных скрещиваний. На первом шаге особь, генетический характер которой неизвестен, скрещивается с гибридом. Потомок снова скрещивается с гибридом и т. д. Этот про¬ цесс представляет собой марковскую цепь с состояниями «доминант», «гибрид» и «рецессив». Как видно из предыду¬ щего абзаца, матрица вероятностей перехода имеет вид: Д Р = Г д 2 _1_ 4 Г J_ 2 J_ 2 ~2 Р О (1) Ввиду того что все элементы матрицы Р2 положительны (см. упр. 1), существует, и притом единственный, непо¬ движный вероятностный вектор, т. е. такой вероятностный вектор р, что рР = р (см. § 8, гл. V). Решив систему трех уравнений, мы найдем этот неподвижный вектор: р = = (т* Т ’ т)' Следовательно, к какому бы типу ни принад¬ лежала первая особь, вероятность появления доминантной особи после большого числа скрещиваний равна приблизи-
430 Гл. VII*. Применение к бихевиористским проблемам тельно -j , вероятность появления гибридной особи равна 1 - * 1 ~2 и вероятность появления рецессивной особи равна Пример 2. Если последовательные скрещивания произ¬ водить каждый раз не с гибридом, а с доминантной особью, то результат получится совершенно иной. Матрица вероят¬ ностей перехода здесь равна Р' = п 0 1 1 2 2 Уо 1 0 \ о 0/ (2) Никакая ее степень не состоит из одних положительных элементов, поэтому общая теорема § 8 гл. V здесь не при¬ менима. Решение уравнения рР' = р показывает, что вектор (1, 0, 0) является единственным неподвижным вероятност¬ ным вектором, но не все его компоненты положительны. Итак, можно сказать почти с полной уверенностью, что по истечении достаточно длительного времени мы получим доминантное потомство. Это легко проверяется. В самом деле, если даже мы начнем с рецессивной особи, то особь, получившаяся в результате первого скрещивания, уже не обязана быть рецессивной. Она может оказаться гибридной, но вероятность того, что п раз подряд будет получаться (1\п гиорид, равна (у) и с возрастанием п стремится к нулю. А как только мы получим доминантную особь, то все после¬ дующие особи будут доминантными. Исследование скрещи¬ вания с рецессивной особью может быть проведено совер¬ шенно аналогично (см. упр. 2). Эти результаты можно интерпретировать на процессе скрещивания большого числа особей. Если особи данной популяции скрещивать с гибридами, их потомки тоже скрещивать с гибридами и т. д., то в конечном счете мы будем иметь приблизительно -j доминантных особей, Y гибридов и рецессивных особей. Если же скрещивать их с доминантными особями, то после достаточно большого числа скрещиваний мы можем ожидать появления одних лишь доминантных особей. В примере 1 можно поставить более трудный вопрос. Пусть, как и в примере 1, Р — регулярная матрица; состояния обозна¬ чим через #!, ап. Процесс проходит через все состояния»
§ 3. Стохастические процессы в генетике 431 Если мы имеем состояние aif то через сколько в среднем ша¬ гов процесс возвратится в состояние а,? Можно поставить и более общий вопрос: сколько, в среднем, шагов потребуется на переход из состояния aL в состояние а;-? Среднее здесь понимается в том смысле, который придается выражению «среднее значение» в теории вероятностей. Пусть р{ означает вероятность того, что процесс перейдет впервые в со¬ стояние а,; за один шаг, р2— за два шага и т. д.; тогда среднее значение числа шагов равно Р\ * 1 ~\~Р2 * 2 + • • • • (См. § 14 гл. IV.) В общем случае вычисление этой величины оказывается трудным. Имеется, однако, гораздо более простой способ нахождения среднего значения. Пусть среднее значение числа шагов, необ¬ ходимое для перехода из состояния at в состояние ajf рав¬ но niij. Но как можно попасть из в ар Прежде всего мы с вероятностью pik переходим за один шаг из состояния аь в со¬ стояние ak. Если k = ]\ то переход в состояние уже осуще¬ ствлен. Если жek=pj, то на переход в состояние aj потребуется в среднем еще mkj шагов. Следовательно, т/;- равно сумме всех pikmkj, где k+jy плюс 1: fnij = Pnrnij +- ••• Pi, j-\- Pi, j+\mj+\, j “h + • • • 4VPinmnj~\- 1. Обозначим через M матрицу, получающуюся из матрицы М путем замены каждого ее диагонального элемента та нулем, и через С — квадратную матрицу, у которой все элементы рав¬ ны 1. Тогда наши уравнения можно будет записать одним мат¬ ричным равенством М = РМ+С. (3) Решив эту систему уравнений, мы найдем mtj. (См. упр. 8.) Умножим обе части равенства (3) на Рп. Учитывая то, что РС = С и, следовательно РпС = С (см. упр. 9), мы получим РпМ = Рп+1М-+С. (4) Мы знаем, что если Р — регулярная матрица, то Рп стремится к матрице, все строки которой одинаковы и равны неподвижному вектору р. Следовательно, уравнения, полученные приравнива¬ нием строк матриц, стоящих в обеих частях равенства (4), стре¬
432 Гл. VII*. Применение к бихевиористским проблемам мятся к одному и тому же векторному уравнению рМ = рМ-\-(\, ..1), (5) ИЛИ р(М-М) = ( 1, 1). (6) Но все элементы матрицы М — М, за исключением диагональ¬ ных, равны 0. Следовательно, наше уравнение просто означает, что р-ти= 1 для всех /, т. е. что ти = — .Таким образом, сред- Pi нее число шагов, необходимое на возвращение из состояния аь в состояние ai} есть величина, обратная предельной вероятности перехода в состояние at. В примере 1 это означает, что если на данном шаге мы имеем доминантную особь, то следующий раз мы получим доминантную особь в среднем через четыре шага; если мы имеем гибрид, то следующий раз мы получим гибрид в среднем за два шага, и если мы имеем рецессивную особь, то снова мы ее получим в среднем через четыре шага. Пример 3. Более интересным, но также и более слож¬ ным оказывается процесс, при котором особи данной попу¬ ляции скрещиваются между собой, затем скрещиваются ме¬ жду собой потомки, и т.д. Пусть в нашей популяции имеется доля d доминантных особей, доля h гибридов и доля г ре¬ цессивных особей. Тогда d + h + r=l. Если популяция очень многочисленна и скрещивание носит случайный ха¬ рактер, то (по закону больших чисел) можно ожидать, что доля скрещиваний двух доминантных особей равна d2, доля скрещиваний доминантных особей с гибридными равна 2dh, и т. д. Следовательно, можно получить простые фор¬ мулы для (приближенной) доли потомков различных типов. В качестве примера найдем долю доминантных особей. Доминантная особь может произойти либо от двух до¬ минантных родителей, либо от доминантного и гибридного, либо от двух гибридов. В первом случае потомство всегда будет доминантным, во втором случае вероятность появле- 1 ния доминантного потомства равна у, а в третьем случае эта вероятность равна . Следовательно, доля доминант¬ ного потомства равна d2+T • 2dh + \h? = d'l + dh+\h\ Если для данного поколения представить доли г/, h и г
§ 3. Стохастические процессы в генетике 433 в виде вектора-строки, то наш процесс можно мыслить как некоторое преобразование Г, которое переводит один век¬ тор-строку в другой вектор-строку: (d, h, г) Т — = + dh + rh-{-2dr + ^h2, г2 + Пг +1. (7) (См. упр. 4.) К сожалению (см. упр. 3), преобразование Т не является линейным. Однако мы знаем, что результатом п скрещиваний является распределение (d, h, г) Тп, так что если бы удалось найти простую формулу для Тп, то это при¬ вело бы к простой формулировке результатов. К счастью, это удается сделать. Вычислим Г2, т. е. посмотрим, что произойдет, если при¬ менить наше преобразование дважды. Потомство первого поколения распределится соответственно формуле (7). Под¬ ставим теперь в эту формулу вместо d первую компоненту, а вместо h и г соответственно вторую и третью компоненту правой части; вычислим d2 + dh + j- h2 и т. д. К нашему удивлению оказывается, что Т2 = Т. (См. упр. 5.) Следова¬ тельно, Тп = Т. Итак, (rf, h, r)T = (d, hf r)Tn, а это значит, что и через много поколений распределение типов в популяции останется точно таким, каким оно было в потомстве первого поколения. Поэтому можно сказать, что процесс достигает состояния равновесия за один шаг. Однако следует помнить, что наши доли взяты прибли¬ женно и что хорошее приближение может быть получено лишь для очень большой популяции. Этот результат очень интересен с точки зрения генетики. Он показывает, что если в популяции не происходит ни от¬ бора, ни мутаций, то вся «эволюция» завершается за одно поколение. С математической точки зрения этот процесс интересен тем, что он дает пример квадратичного преобразования, являющегося более сложным, нежели изучавшиеся нами до сих пор линейные преобразования. Упражнения X. Вычислите Р2, Р3, Р4 и Р5, где Р — матрица из примера 1. Проверьте, что все элементы матрицы Р2 положительны и что степени Р приближаются к предельной матрице. (См. § 8 гл. V.)
434 Гл. VII*. Применение к бихевиористским проблемам 2. Выпишите матрицу, аналогичную матрице Р' примера 2, которая полу¬ чается в случае последовательных скрещиваний с рецессивными особями. Найдите неподвижный вероятностный вектор и объясните его смысл. 3. Докажите, что преобразование Т не является линейным. [Указание. По¬ кажите на примере, что Т не удовлетворяет одному из условий линей¬ ности, сформулированных в § 11 гл. V.] 4. В основном тексте была найдена первая компонента правой части фор¬ мулы (7). Проверьте, что и две другие компоненты указаны в (7) пра¬ вильно. 5. Вычислите Г2, подставив в (7) вместо d первую компоненту правой ча¬ сти (7), вместо h — вторую и вместо г — третью. Используя тот факт, чго d + h + г = 1, докажите равенство Т2 = Т. 6. Вектор (d, /г, г) является неподвижным вектором преобразования Т, если (rf, /г, г)Т = (d, /1, г). Выпишите условия, которым должен удовлетворять такой вектор и приведите три примера неподвижных векторов. Каков генетический смысл такого распределения? [ Отв.: Например, (4 ’ 4 ’ 4) '] 7. Вторая строка матрицы Р равна неподвижному вектору. Что означает, этот факт? 8. В условиях примера 1 решите систему 9-ти уравнений, эквивалентную (3), и проверьте, что тц = — . [Частичный отв.: т\\ = 4, т\2 = 2, т\з = 8.] Pi 9. Используя определение стохастической матрицы (см. § 7 гл. V), дока¬ жите, что PC = С. 10. Докажите, что если Р — регулярная стохастическая (п X п)-матрица, в которой сумма элементов каждого столбца равна 1, то для того, чтобы вернуться из любого состояния в то же самое состояние, потребуется в среднем п шагов. (Ср. упр. 11 из § 8 гл. V.) 11. На Земле Оз идет дождь. Через сколько дней Волшебник с Земли Оз мо¬ жет рассчитывать устроить пикник? (См. § 7 гл. V.) [Отв.: 4.] В последующих упражнениях дается простой способ исследования не¬ линейного преобразования Г, о котором идет речь в основном тексте. 12. Пусть п — доля генов G в данной популяции, a q = 1 — р — доля генов g. Выразите р и q через d, h и г. . . 1 , , 1 , \Отв.-. /> = <*+_ Л, q = r+ h. 13. Предположим, что мы берем все гены, имеющиеся в данной популяции, тщательно их перемешиваем и каждого потомка наделяем парой генов, выбранных наугад. Покажите, используя результат упр. 12, что получаю¬ щееся в результате распределение доминантных, гибридных и рецессивных особей в точности совпадает с распределением, данным в (7). [Отв.: .(d, hy г)Т = (р2, 2pqy q2).] 14. Введем обозначение (d, h, r)T = (d't h\ г'). Используя результат упр. 13, покажите, что h'2 = 4а'г'. 15. Покажите, что необходимым условием равновесия является h2 = 4dr. 16. Покажите, что если h2 = 4dr, то р2 = dt q2 = г и 2pq = /г, т. е. что это условие является также и достаточным для равновесия. 17. Покажите, используя результаты упр. 14—16, что данная популяция до¬ стигает состояния равновесия за одно поколение.
§ 4. Марковские цепи с поглощением и генетика 435 § 4. МАРКОВСКИЕ ЦЕПИ С ПОГЛОЩЕНИЕМ И ГЕНЕТИКА Существует принципиальное различие между результатами двух первых примеров предыдущего параграфа. В примере 1 процесс мог спустя много времени находиться в любом из трех возможных состояний, и все, что мы о нем знали, — это вероят¬ ность каждого из этих трех состояний. Мы смогли найти эти вероятности, используя факт существования единственного не¬ подвижного вероятностного вектора, все компоненты которого положительны. В этом примере вся интересующая нас инфор¬ мация о процессе представлена неподвижным вектором. В примере 2 неподвижный вектор указывал нам лишь то, что в конце концов процесс должен будет перейти в первое состоя¬ ние и уже не покидать его. Характерный признак этого первого состояния заключается в том, что если процесс однажды пере¬ ходит в это состояние, то он уже не может из него выйти. Такое состояние называется поглощающим. Определение. Состояние марковской цепи называется по¬ глощающим, если из него невозможно перейти ни в какое дру¬ гое состояние. Определение. Марковская цепь называется цепью с по¬ глощением, если (1) она имеет по меньшей мере одно поглощаю¬ щее состояние и (2) из каждого состояния возможен переход в поглощающее состояние (возможно, не за один шаг). Пример 1. Рассмотрим блуждание частицы по прямой; положим, что в каждый момент времени частица с вероят- 1 ностью ~2 сдвигается на один шаг налево или на один шаг направо. Участок, по которому двигаются частицы, мы огра¬ ничим двумя барьерами, поглощающими частицы (можно представить себе, что частица прилипает к барьеру). Для определенности положим, что весь участок частица может пройти за 4 шага, так что ее положение может иметь одно из пяти значений: 0, 1, 2, 3 и 4. Матрица вероятностей пе¬ рехода в этом случае имеет вид 0 1 2 3 41 0 ' 1 0 0 0 0' 1 1 2 0 1 2 0 0 2 0 1 2 0 1 2 0 3 0 0 1 2 0 1 2 4 . 0 0 0 0 1 .
436 Г л. VII*. Применение к бихевиористским проблемам Мы видим, что состояния 1, 2 и 3 не являются погло¬ щающими, а состояния 0 и 4 — поглощающие; далее из ка¬ ждого непоглощающего состояния можно за конечное число шагов добраться до одного из поглощающих состояний, т. е. состояний 0 или 4. Таким образом, рассмотренная здесь марковская цепь является цепью с поглощением. Со¬ ответствующий случайный процесс называется процессом случайного блуждания. Теорема. Для марковской цепи с поглощением вероятность того, что через п шагов процесс закончится в одном из погло¬ щающих состояний, с возрастанием п стремится к 1. Таким образом, здесь можно почти с полной уверенностью ожидать, что процесс завершится переходом в одно из погло¬ щающих состояний. Мы укажем лишь основную идею доказательства этой тео¬ ремы. По условию (2), из каждого непоглощающего состояния aj возможен переход в поглощающее состояние. Обозначим через пj минимальное число шагов, требуемых для перехода из состояния aj в какое-нибудь поглощающее состояние, а через Pj вероятность того, что процесс не перейдет из состояния а;. в какое-нибудь поглощающее состояние за nj шагов. Тогда рj < 1. Пусть п равно наибольшему из всех Яу, а р — наиболь¬ шей из всех pj. Вероятность того, что процесс не перейдет в по¬ глощающее состояние за п шагов, будет не больше р, вероятность того, что он не перейдет в поглощающее состояние за 2п ша¬ гов— не больше р2, и т. д. Так как р < 1, то эти вероятности стремятся к нулю. Мы рассмотрим три интересных вопроса, касающихся мар¬ ковских цепей с поглощением: (a) Какова вероятность того, что процесс завершится пере¬ ходом в данное поглощающее состояние? (b) Сколько в среднем требуется шагов на переход процесса в какое-нибудь поглощающее состояние? (c) Сколько в среднем раз проходит процесс через каждое непоглощающее состояние? Ответы на все эти вопросы зависят, вообще говоря, от того, из какого состояния начинается процесс. Так, если погло¬ щающих состояний по меньшей мере два, а\ и а2, то ответ на вопрос (а) будет зависеть от начального состояния процесса: ясно, что если процесс начинается из состояния аь то с вероят¬ ностью 1 он в этом состоянии и окончится, а если он начинается из а2, то вероятность того, что он окончится в состоянии аи равна 0. Ответы же на вопросы (Ь) и (с) будут зависеть от на-
4. Марковские цепи с поглощением и генетика 437 чального состояния также и в том случае, если поглощающее со¬ стояние— единственное. Так если процесс начинается из.погло¬ щающего состояния, то ответом на оба эти вопроса будет слу¬ жить число 0; если же процесс начинается из непоглощающего состояния а, то на переход в какое-то поглощающее состояние потребуется по меньшей мере один шаг, и по меньшей мере в од¬ ном непоглощающем состоянии (а именно в а) он будет нахо¬ диться по меньшей мере один раз. (См. упр. 1.) Пусть Р — матрица вероятностей перехода для марковской цепи с поглощением и а — какое-то поглощающее состояние. Мы хотим найти вероятность того, что процесс окончится в а (эта вероятность зависит от начального состояния). Пусть dt—ве¬ роятность того, что процесс, начавшись из состояния а-ь , окон¬ чится в а. Образуем вектор-столбец d, i-й компонентой которого служит dt. Из состояния at процесс переходит в состояние ау- с вероятностью Если этот переход осуществился, то после него процесс перейдет в состояние а с вероятностью d;-. Следо¬ вательно, вероятность перехода из в а через состояние aj равна Pijdj. Сумма всех таких членов дает полную вероятность перехода из at в а. Таким образом, получаем: di= Pi\dx-\-pi2d2Jr ••• Л-Pindjv где i = 1, 2, ..., п. Но эта сумма представляет собой i-ю компо¬ ненту вектора Pd. Следовательно, нашу систему уравнений можно кратко записать в виде одного векторного уравнения d = Pd. (1) Мы видим, что d можно рассматривать как «неподвижный вектор» матрицы Р с той лишь разницей, что здесь вместо век- гора-строки фигурирует вектор-столбец. Для марковских цепей с поглощением уравнение (1) часто имеет своим решением бо¬ лее чем один вероятностный вектор. Мы выбираем единственное нужное нам решение при помощи следующего условия: Компонента вектора d, отвечающая состоянию а, равна 1; компонента d, отвечающая любому другому поглощающему со¬ стоянию, равна 0. (2) Это условие позволяет находить для каждого поглощающего состояния единственный неподвижный вектор d. Различие между такими векторами определяется лишь условием (2). Займемся теперь решением вопроса (с), из которого будет непосредственно следовать ответ на вопрос (Ь); после этого мы дадим также еще одно решение вопроса (а), тесно связан¬ ное с решениями вопросов (Ь) и (с). Пусть процесс начинается из 29 Зак. 609
43В Гл. VII*. Применение к бихевиористским проблемам непоглощающего состояния а{. Сколько раз следует ожидать его прохождения через непоглощающее состояние ау? [Здесь слово «ожидание» мы употребляем в .смысле среднего значения (ма¬ тематического ожидания) соответствующей величины; см. § 14 гл. IV.] Обозначим это число через ttj. Из состояния at процесс переходит в состояние ak с вероятностью pik. Если ak —погло¬ щающее состояние, то процесс уже никогда не придет в состоя¬ ние aj9 а если ak — непоглощающее состояние, то в дальнейшем процесс пройдет через состояние в среднем tkJ раз. Следова¬ тельно, мы должны взять сумму piktkj по всем непоглощающим состояниям ak. Но это еще не дает полного ответа на наш во¬ прос, ибо если i = /, то мы должны учесть также исходное со¬ стояние ар т. е. прибавить к нашей сумме 1. Итак, для непогло¬ щающих состояний аь и а;- *ц = Рп*ч + ••• +Pi,n-mtn-nu] (4-1. если /=у); суммирование производится по всем непоглощающим состояниям. Эту систему уравнений можно записать в виде одного ма¬ тричного уравнения. Образуем с этой целью матрицу Q, получае¬ мую из Р вычеркиванием всех строк и столбцов, соответствующих поглощающим состояниям; если число поглощающих состояний равно т, то Q будет ({п — т) X (п — т))-матрицей. Так как эле¬ менты ttj интересующей нас матрицы Т определены лишь для непоглощающих состояний at и ajf то квадратная матрица Т будет иметь тот же порядок, что и матрица Q. Написанная выше сумма представляет собой произведение i-й строки матрицы Q на /-й столбец матрицы Г, следовательно, она равна элементу матрицы QT, стоящему в i-й строке и /-м столбце. Если i = /, то к этой сумме следует прибавить 1, т. е. соответствующую компоненту единичной матрицы (напомним, что при i ф j ком¬ понента единичной матрицы равна нулю!). Таким образом, мы получаем матричное уравнение Т = QT1. (3) Уравнение (3) можно записать иначе: I=T — QT = (I — Q) Т. Умножив обе части слева на (/ — Q)-1, мы получим Т = (/— Q)-1. (4) Это и есть решение уравнения (3). Компоненты матрицы Т = (I — Q)-1 дают ответ на вопрос (с). Они помогают также ответить и на вопрос (Ь). Пусть мы хотим узнать, через сколько в среднем шагов процесс, находящийся в
§ 4. Марковские цепи с поглощением и генетика 439 непоглощающем состоянии ai9 перейдет в какое-нибудь погло¬ щающее состояние. Каждое прохождение процесса через какое- нибудь непоглощающее состояние составляет один шаг. Следо¬ вательно, общее число шагов, при которых процесс переходит в какое-нибудь непоглощающее состояние, равно числу шагов, требуемых для достижения поглощающего состояния. Но это общее число шагов есть не что иное, как среднее число прохо¬ ждений процесса, начавшегося из состояния ait через все непо¬ глощающие состояния, равное в свою очередь сумме всех эле¬ ментов i-й строки матрицы T = (I — Q)-1* Следовательно, суммы элементов строк матрицы Т дают ответ на вопрос (Ь). Запишем последнее условие в векторной форме. Пусть ti оз¬ начает среднее значение числа шагов, затрачиваемых на пере¬ ход из непоглощающего состояния at в какое-нибудь поглощаю¬ щее состояние, и пусть t означает вектор-столбец, i-я компонен¬ та которого равна tL. Как мы знаем, компонентами t являются суммы соответствующих строк матрицы (4). Обозначая через с вектор-столбец, все компоненты которого равны 1, мы можем записать t в виде t = (I-Q)~'c. (5) Вернемся, наконец, к вопросу (а). Пусть а* есть непогло¬ щающее состояние нашей марковской цепи, a at— поглощающее состояние; нас интересует вопрос о вероятности Ьп того, что процесс, начавшийся в состоянии закончится в состоянии at. Вероятность перехода за один шаг из состояния а,- в состояние at равна ри ; если же процесс за первый шаг перейдет в состоя¬ ние ak (вероятность этого равна pik), то он либо так и оста¬ нется в этом состоянии (если состояние ak — поглощающее), либо перейдет затем в состояние аг с вероятностью bkl (если состояние аи — непоглощающее). Таким образом, мы получаем Ьц=Рц +Pi\b\i +Рг2^21+ Pi, n-mP n — m> I (суммирование производится по всем непоглощающим состоя¬ ниям). Последнее равенство можно записать также в матричной фо,рме. Пусть R—((п — т) Хт)-матрица, получаемая из матри¬ цы вероятностей перехода Р вычеркиванием отвечающих погло¬ щающим состояниям строк и отвечающих непоглощающим со¬ стояниям столбцов; так как элементы Ьи интересующей нас матрицы В определены лишь для непоглощающего состояния at и поглощающего состояния av то порядок матрицы R совпа¬ дает с порядком матрицы В. В таком случае мы имеем B = R+QB,
440 Гл. VIIм. Применение к бихевиористским проблемам или наконец B = (I—Q)~lR=TR. (6) Последняя формула и дает ответ на вопрос (а). Резюмируем полученные результаты. Пусть нам известна (п X п)-матрица Р вероятностей перехода, характеризующая марковскую цепь с поглощением; обозначим далее через Q ((п — пг) X (п — пг)) -матрицу, получаемую из Р вычеркиванием строк и столбцов, отвечающих поглощающим состояниям, и че¬ рез R— ((n — m) X tn)-матрицу, получаемую из Р вычеркиванием строк, отвечающих поглощающим состояниям, и столбцов, отве¬ чающих непоглощающим состояниям. Образуем, наконец, еще матрицу Т = (I — Q)-1 (ввиду фундаментальной важности этой матрицы в теории марковских цепей с поглощением ее называют иногда фундаментальной матрицей цепи) и (п — пг)-мерный век¬ тор-столбец с, все компоненты которого равны 1. В таком случае (с) элемент ta матрицы Т указывает среднее число прохо¬ ждений цепи через непоглощающее состояние aj в предположе¬ нии, что исходным является непоглощающее состояние а*; (Ь) компонента t-t вектора-столбца t = Тс указывает сред¬ нее число шагов, через которое наш процесс попадет в погло¬ щающее состояние, если он исходит из непоглощающего состоя¬ ния а*; (а) элемент Ьц матрицы В = TR указывает вероятность того, что процесс закончится в поглощающем состоянии av если он начался в непоглощающем состоянии а,-. Пример 1 (продолжение). При случайном блуждании, описанном выше, имеем 1 2 3 1 ' О 7 0 Q=2 у 0 у 3 о 2 о и, следовательно, 1 2 О
§ 4. Марковские цепи с поглощением и генетика 441 Вычисляя Т = (/—Q) \ получаем 1 Т = 2 3 Таким образом, если «блуждание» начинается из со¬ стояния 2, то до конца процесса частица в среднем побы¬ вает в первом состоянии 1 раз, во втором состоянии — 2 раза и в третьем состоянии — 1 раз. Далее, 1 2 3 • 3 1 1 2 2 1 2 1 1 1 3 2 2 1 t = Тс = 2 3 2 3 1 1 ' 2 ! 1 / 2 1 • 1 3 2 \i Поэтому среднее число шагов, которые сделает частица до поглощения, равно 3, если она исходит из первого со¬ стояния, 4, если частица исходит из второго состояния, и 3, если частица исходит из третьего состояния. Так как частица, исходящая из второго состояния, должна обяза¬ тельно перейти в первое или в третье состояние, то нетруд¬ но понять, что, исходя из второго состояния, она сделает в среднем на один шаг больше, чем исходя из первого или из третьего состояний. Наконец, ясно, что в этом случае О 4 1 R = 2 3 Отсюда получаем B = TR ТГ о = 2 0 4 3 1 4 4 1 1 2 2 1 3 4 4
442 Гл. VII*. Применение к бихевиористским проблемам Поэтому если частица исходит из второго состояния, то она имеет равные шансы очутиться в нулевом или в чет¬ вертом состояниях; если же она исходит из первого состоя¬ ния, то она с вероятностью 3/4 поглотится барьером 0 и лишь с вероятностью */4— барьером 4. Перейдем теперь к примерам, заимствованным из генетики. Пример 2. Вернемся к примеру 2 предыдущего пара¬ графа. Матрица Р\ выписанная на стр. 430, соответствует марковской цепи с одним поглощающим состоянием аь Легко видеть, что решением уравнения d = P'd может слу¬ жить любой вектор-столбец, все компоненты которого равны между собой. Из условия (2) следует, что первая компо¬ нента вектора должна равняться 1. Поэтому и все осталь¬ ные компоненты равны 1. Итак, Это значит, что из какого бы состояния ни начался данный процесс, вероятность его перехода в состояние а\ равна 1,’ что согласуется с нашей теоремой, поскольку данный про¬ цесс имеет лишь одно поглощающее состояние. Напишем теперь «урезанную» матрицу Мы видим, что если процесс начался из состояния а2, то можно ожидать, что через это состояние он пройдет два¬ жды (включая начальное положение). Если же начальным является состояние а3, то можно ожидать, что через это состояние он пройдет только один раз, а именно в начале. Это вполне очевидно, потому что процесс не может вер¬ нуться в состояние а3. Начав процесс из состояния а3, мы можем ожидать прохождения его через а2 два раза. а 2 аъ Тогда
§ 4. Марковские цепи с поглощением и генетика 443 Наконец, t = Следовательно, можно ожидать, что переход в состояние ах произойдет из состояния а2 за два шага, а из состояния аг за три шага. Пример 3. Построим теперь более сложный пример мар¬ ковской цепи с поглощением. Сначала мы скрещиваем две особи противоположного пола; затем отбираем в их потомстве две особи противоположного пола и также их скрещиваем, и т. д. Для простоты будем предполагать, что фигурирующий в нашем рассмотрении признак не зависит от пола. Состояние процесса определяется парой особей. Следо¬ вательно, состояниями будут: ах = (Д, Д), а2 = (Д, Г), аг = (Д, Р), а4 = (Г, Г), а5 = (Г, Р) и а6 = (Р, Р). Покажем на примере состояния а2у как вычисляются ве¬ роятности перехода. Когда процесс находится в этом со¬ стоянии, то один из родителей обладает комбинацией ге¬ нов GG, а другой — комбинацией Gg. Поэтому вероятно¬ сти появления доминантного и гибридного потомства оди¬ наковы и равны 72. Следовательно, вероятность перехода в состояние а\ (выбор двух доминантных особей) равна 74, вероятность перехода в состояние а2 равна х)2 и ве¬ роятность перехода в а4 равна 74. Матрица вероятностей перехода для этого процесса имеет следующий вид (см. стр. 309): Р" = а\ #2 #3 а4 а5 а6 а, 1 0 0 0 0 0' а2 1 4 1 2 0 1 4 0 0 аг 0 0 0 1 0 0 аА 1 1 1 1 1 1 16 4 8 4 4 16 а5 0 0 0 1 4 1 2 1 4 а6 , 0 0 0 0 0 1 Поглощающими состояниями здесь, естественно, будут состояние ах = (ДД) и а6= (РР). Вероятности поглощения в состоянии ах находятся путем решения уравнения d = P"d при условии dx = 1 и d§ = 0, в результате чего мы
441 Гл. VII*. Применение к бихевиористским проблемам d = получаем вектор (ср. ниже, стр. 445) 1 3^ 4 J_ 2 4_ 2 J_ 4 . О Так как сумма двух таких векторов d должна равняться вектору с (см. упр. 12), то отсюда следует, что другой век¬ тор, дающий вероятности поглощения в а6у равен с — d. С генетической точки зрения поглощение означает, что в результате большого числа скрещиваний либо ген G, либо ген g должен исчезнуть. Вид найденного нами век¬ тора d позволяет обнаружить также следующий интерес¬ ный факт: если процесс начинается из какого-то состояния, то вероятность того, что процесс завершится на чисто до¬ минантном потомстве, характеризуемом наличием одних лишь генов G, равна доле генов G для исходного состоя¬ ния. Выпишем теперь «урезанную» матрицу а2 а3 а4 #2 1 2 0 1 4 0 аг 0 0 1 0 а4 1 1 1 1 4 8 4 4 ^5 0 0 1 4 1 2 и найдем также матрицу / — Q" = тг 0-4- 4 4 0 4 2
§ 4. Марковские цепи с поглощением и генетика 445 и матрицу Т = {1 — QT1 Далее можно определить вектор _1_ 6 £ 3 J_ 3 J_ 6 4 — * 6 6 3 5 — b 3 указывающий, что если начать процесс из любого состоя¬ ния, отличного от состояния (Д, Д) или (Р, Р), то можно ожидать, что приблизительно через пять или шесть шагов мы придем либо в (Д, Д), либо в (Р, Р). (Компоненты вектора t указывают точную величину среднего значения числа шагов.) Матрица Т доставляет более подробную информацию, а именно она показывает, сколько раз можно ожидать появления потомков каждого из типов (Д, Г), (Д, Р), (Г, Г) и (Г, Р), если начать процесс из данного непоглощающего состояния. Наконец, мы можем составить матрицу 1 2_ 3 3 B = TR. 1 4 ' 3 1 ' 0 4 4 0 0 1 2 1 2 1 1 = 1 2 1 2 16 16 0 1 1 3. 4 4 4 столбцы которой (несущественно отличающиеся от выпи¬ санных выше векторов d и с — d) дают вероятности завер¬ шения процесса в состоянии а\ или а6. А все вместе эти величины дают превосходное описание того, что можно ожидать при данном процессе.
446 Гл. VII*. Применение к бихевиористским проблемам Упражнения 1. Видоизмените пример с Землей Оз (см. § 8 гл. IV, стр. 213) так, чтобы состояние Д стало поглощающим. При этом матрица вероятностей пере¬ хода будет иметь вид Я С Найти фундаментальную матрицу 7\ а также вектор Тс и матрицу TR. Объясните полученные результаты. 2. В модели, описывающей процесс диффузии газов (см. пример 6 из § 7 гл. V, стр. 307), положим, что состояния 0 и 3 являются поглощающими. Найдите фундаментальную матрицу Т полученной марковской цепи с по¬ глощением, а также вектор Тс и матрицу TR. Интерпретируйте получен¬ ные результаты. 3. В примере со случайным блужданием (пример 1 этого параграфа) поло-' жим, что вероятность сдвига вправо по прямой равна 2/з, а вероятность сдвига влево — всего Уз. Найдите 7\ Тс, TR. Сравните полученные ре¬ зультаты с найденными в тексте. 4. Число х выбирается случайным образом из чисел 1, 2, 3, 4 и 5. После того как х выбрано, следующее число выбирается случайным образом среди тех из наших чисел, которые не больше jc. Процесс завершается, когда выбранным окажется число 1. Состояния соответствующего мар¬ ковского процесса (цепи) задаются числами, которые могут быть выбраны. Г = 2 3 4 5 1 0 0 0 ' 1 72 0 0 1 V 2 Уз 0 1 72 Уз У 4 . +/. где I есть единичная матрица четвертого порядка. Каково среднее число выборов числа? j^O/яв.: .J 5. Обобщите результаты упр. 4, сделав заключение о виде фундаментальной матрицы для того случая, когда в начале процесса выбирается наугад одно целое число х из чисел 1, 2, 3, . . ., п. Каково будет среднее число выборов числа в том случае, если на первом этапе процесса мы выби¬ раем целое положительное число, не превосходящее 10? 6. Три танка ведут бой, каждый с двумя другими. Танк А уничтожает танк, по которому он ведет огонь, с вероятностью 7г; танк В — с вероят¬ ностью 7з; танк С — с вероятностью 7б- Танки открывают огонь одновре¬ менно и каждый танк стреляет по сильнейшему из не уничтоженных к этому моменту противников. Образуйте марковскую цепь, принимая за состояние наличие к данному моменту тех или иных из наших танков.
§ 4. Марковские цепи с поглощением и генетика 447 Найдите матрицу Т, вектор Тс, матрицу TR и интерпретируйте получен¬ ные результаты. 7. Примените к примеру со случайным блужданием первый метод опреде¬ ления вероятности для процесса окончиться именно в данном поглощаю¬ щем состоянии; сравните полученные результаты с найденными в тексте. 8. Докажите, что для марковских цепей с поглощением (a) вероятность перехода в данное поглощающее состояние не зависит от начального положения тогда и только тогда, когда "поглощающее состояние единственно; (b) среднее значение числа шагов, требуемых для достижения какого- нибудь поглощающего состояния, не зависит от начального состояния тогда и только тогда, когда каждое состояние поглощающее. 9. Проверьте, что обратная матрица (/ — Q')-1 найдена в тексте правильно. 10. Проверьте, что обратная матрица (/ — Q")-1 найдена в тексте правильно. 11. Решите уравнение d = P'd, где Р' — матрица из примера 2 предыдущего параграфа. 12. Найдите два решения уравнения d = P"d, одно из которых соответствует поглощению в а\, а другое — поглощению в аб. Проверьте, что сумма их равна с (т. е. вектору, все компоненты которого равны 1). 13. Рассмотрим все векторы d, представляющие собой вероятности поглоще¬ ния в данном поглощающем состоянии. Интерпретируйте сумму двух таких векторов. Интерпретируйте сумму всех таких векторов. Чему равна последняя сумма? 14. Найдите два различных неподвижных вероятностных вектора матрицы Р". [Отв.: (1, 0, 0, 0, 0, 0); (0, 0, 0, 0, 0, 1).] 15. Матрицу Т можно вычислить также следующим способом: находятся вероятности перехода из состояния а/ в состояние aj за п шагов, после чего суммируются полученные вероятности, отвечающие всем возможным значениям п\ полученная сумма и будет равна ttj. (a) Покажите, что для п = 0 эти вероятности представляются матри¬ цей /. (b) Покажите, что для п > 0 шагов эти вероятности представляются матрицей Qn. (c) Покажите, что 7' = / + Q + Q2 + Q3 + ... . (d) Найдите сумму этого ряда, обращаясь с ним как с обыкновенной геометрической прогрессией. (e) Проверьте, что полученный ответ совпадает с (4). 16. Для нахождения вектора t существует более простой способ, чем приве¬ денный в тексте. Пусть ti означает среднее значение числа шагов, тре¬ бующихся для перехода из состояния at в какое-нибудь поглощающее состояние. Это число равно сумме произведений patj, распространенной по всем непоглощающим состояниям aj, плюс 1. (a) Обоснуйте утверждение о том, что tt = 1 + сумма ptjtj , распростра¬ ненная по всем непоглощающим состояниям. (b) Запишите систему этих уравнений в виде одного векторного урав¬ нения. (c) Разрешите это уравнение относительно t. (d) Проверьте, что решение будет даваться вектором (5). 17. Допустим, что гибриды характеризуются высоким процентом смертности. Пусть, скажем, половина гибридов погибает, не достигнув зрелого воз¬ раста, тогда как число погибающих до достижения зрелости доминантных и рецессивных особей настолько мало, что им можно пренебречь. (а) Внесите изменения в матрицу Р" примера 3, учитывающие эти обстоя¬ тельства.
448 Г л. VII*. Применение к бихевиористским проблемам (b) Какие состояния являются поглощающими? (c) Проверьте, что рассматриваемая цепь является цепью с поглощением. (d) Найдите векторы d, представляющие вероятности поглощения в раз¬ личных поглощающих состояниях. Остальные задачи относятся к вопросу о наследовании цветовой слепоты, являющейся признаком, сцепленным с полом. Имеется пара генов С и N, первый из которых обусловливает цветовую слепоту, а второй нормальное зрение. Ген N является доминантным. Но у муж¬ чин имеется только один ген, и если он оказывается геном С, это вле¬ чет цветовую слепоту. Мужчина наследует один ген из пары генов своей матери, тогда как женщина наследует по одному гену от каждого из родителей. Следовательно, мужчина может принадлежать к типу С или N, тогда как женщина может принадлежать к типу СС или к типу CN, или к типу NN. Мы рассмотрим процесс скрещивания, аналогич¬ ный процессу, рассмотренному в примере 3. 18. Перечислите состояния процесса. [Указание. Всего имеется шесть состоя¬ ний.] 19. Вычислите вероятности перехода. 20. Покажите, что рассматриваемая цепь является цепью с поглощением, и дайте интерпретацию поглощающих состояний. [Отв.: В одном из состояний исчезает ген N, в другом утрачивается ген С.] 21. Докажите, что вероятность окончательного перехода в состояние, имеющее только ген С, равна доле генов С в начальном состоянии. 22. Найдите фундаментальную матрицу Т и интерпретируйте ее элементы. 23. Найдите вектор t и интерпретируйте его компоненты. и гены N, то после пяти или шести скрещиваний можно ожидать 1 9/ 10 0 (e) Найдите матрицу Т и интерпретируйте ее. (f) Найдите вектор t и интерпретируйте его. 65 26 117 26 91_ 26 65 26 j если в начальном состоянии имеются как гены С так исчезновения одного из этих генов.] 24. Найдите матрицу В = TR и интерпретируйте ее элементы.
§ 5. Модель обучения И стаза 449 § 5. МОДЕЛЬ ОБУЧЕНИЯ ИСТИЗА Этот параграф посвящен математической модели обучения, предложенной У. К. Истизом (W. К. Estes). Мы не станем раз¬ вивать самую общую теорию обучения, а лишь рассмотрим не¬ которые частные случаи. Целью этой теории является объяснение определенных типов обучения, примером которых может служить следующий экспе¬ римент. В Т-образный лабиринт (см. § 2, гл. III, стр. 129) поме¬ щают крысу, которая может бежать либо направо,< либо налево. С какой-то стороны экспериментатор кладет пищу, и если крыса бежит в эту сторону, она получает вознаграждение. Опыт по¬ вторяется много раз, причем используется определенная после¬ довательность расположений пищи слева или справа. Смысл таких опытов заключается в попытке предсказать поведение крысы для различных последовательностей расположения пищи. Например, если пищу всегда класть справа, то научит ли это крысу бежать каждый раз направо? Аналогичный эксперимент, но уже производимый над чело¬ веком, заключается в следующем. Испытуемому демонстри¬ руется монета то со стороны, на которой изображен герб, то со стороны, на которой указана ценность монеты («цифра»), и ка¬ ждый раз ему предлагают угадать, что появится в следующий раз. Испытуемый старается угадать правильно как можно боль¬ шее число раз. Опять-таки экспериментатор располагает выбо¬ ром последовательностей Г и Ц. Смысл таких опытов заклю¬ чается в выяснении того, каким образом испытуемый будет распознавать характер последовательности. В модели Истиза предполагается, что существует конечное число так называемых «раздражителей», каждый из которых в любой фиксированный момент времени связан либо с реак¬ цией R0, либо с реакцией R\ испытуемого. Эти связи, вообще говоря, могут меняться от эксперимента к эксперименту. Существует определенная, не зависящая ни от эксперимента, ни от раздражителя вероятность б того, что в данном экспери¬ менте данный раздражитель подействует на испытуемого или будет воспринят испытуемым. Имеется в виду, что воспринятые субъектом раздражители, связанные с /?о, побуждают субъекта реагировать посредством Ro, а воспринятые им раздражители, связанные с Rь — реагировать посредством R Предполагается, что восприятия различных раздражителей образуют процесс независимых испытаний (см. § 8 гл. IV). В частности, если, например, имеются три раздражителя а, b и с, то вероятность того, что а будет воспринят, b не воспринят и с воспринят, должна равняться 6(1—0)0.
450 Гл. VII*. Применение к бихевиористским проблемам Предполагается также, что экспериментатор оказывает на испытуемого одно из двух возможных «направляющих» воздей¬ ствий А0 или А1. Такое воздействие может иметь место или до, или после того, как испытуемый будет реагировать на экспери¬ мент, но мы будем считать, что испытуемый узнает о выборе экспериментатора лишь после того, как сам выберет, как сле¬ дует реагировать ему. На большинство экспериментов испытуе¬ мый хотел бы реагировать посредством Ro, если эксперимента¬ тор оказывает воздействие Л0, и посредством если экспери¬ ментатор оказывает воздействие Ах. Мы будем говорить, что испытуемый «угадывает правильно», если его выбор согла¬ суется с выбором экспериментатора, т. е. если он реаги¬ рует посредством R0 в ответ на А0 и посредством Rх в ответ на А\. В некоторых экспериментах (например, в описанном выше эксперименте с крысой) испытуемый (крыса) получает поощрение, если он угадывает правильно выбор эксперимен¬ татора. Мы делаем два основных допущения. Допущение А. Вероятность того, что субъект прореагирует посредством Ru равна доле воспринятых раздражителей, свя¬ занных с R\. Если не был воспринят никакой раздражитель, то предполагается, что ответы R0 и Ri равновероятны. Допущение В. Если в данном эксперименте эксперимента¬ тор выбрал Л0, то все связанные с R\ раздражители из числа вос¬ принятых становятся связанными с Ro. Если же эксперимента¬ тор выбрал А\, то связанные с Ro раздражители из числа вос¬ принятых становятся связанными с Rь Заметим, что в каждом отдельном эксперименте фактически играют роль лишь те раздражители, которые были восприняты, и лишь у таких раздражителей могут под действием этого эксперимента измениться связи. Однако при различных экспе¬ риментах будут восприняты, вообще говоря, различные множе¬ ства раздражителей, так что воспринятым в каком-то экспери¬ менте может оказаться каждый раздражитель. Из допущений А и В видно, что будущие выборы субъекта зависят от выбора экспериментатора. Следовательно, мы долж¬ ны описать метод, применяемый экспериментатором при выборе им А0 или А\. Следующие схемы являются типичными для тех, которые встречались в реальных экспериментах. (i) Выбирать Ао с вероятностью р независимо от выбора, про¬ изводимого субъектом. (ii) Делать выбор, согласованный с выбором субъекта (т. е. выбирать А0, если субъект выбрал R0i и выбирать Ль если субъект выбрал Ri). (iii) Выбирать Л0, если в предыдущем эксперименте субъект
§ 5. Модель обучения Истиза 451 прореагировал посредством Ro. Выбирать А0 и А\ с одинаковой вероятностью, если он прореагировал посредством R{. Мы можем описать некоторый общий класс схем типа только что приведенных следующим образом. Допустим, что экспери¬ ментатор выбирает А\ с вероятностью а, если в предыдущем эксперименте субъект прореагировал посредством Ro, и выби¬ рает Ао с вероятностью Ъ, если в предыдущем эксперименте субъект прореагировал посредством R\. Выборы эксперимента¬ тора для каждого выбора субъекта можно описать посредством матрицы А) А Rof\—a а \ RA b 1 -ь)ш Этот класс схем содержит рассмотренные примеры: (i) пред¬ ставляет случай, когда 1 — а = b = р, (п) представляет слу¬ чай, когда а = О, b = 0, и (iii) представляет случай, когда а = О, b = В настоящем и следующем параграфах мы будем рассматри¬ вать случай двух раздражителей (назовем их г и s). В случае большего числа раздражителей исследование проводится анало¬ гично, хоть оно и становится несколько более сложным. Многие результаты не зависят от числа используемых раздражителей. На фиг. 142 представлены с помощью дерева различные ста¬ дии одного эксперимента. Верхние индексы 0 и 1 означают, что раздражитель, к которому они относятся, связан соответствен¬ но с Ro или Rь Предположим, что первоначально г обусловли¬ вает R1, а 5 обусловливает Ro, т. е. за начальную точку мы при¬ нимаем {Г1, 5°}. С последовательностью таких экспериментов мы можем сле¬ дующим образом связать марковскую цепь. Примем за состояние число раздражителей, связанных в данный момент с RТаким образом, мы имеем всего три состояния: 0, 1 и 2. Ввиду того что все наши вероятности зависят только от числа воспринятых раз¬ дражителей, (г1, 5°} и {г°, s1} можно мыслить как одно и то же состояние. Это оправдывает выбор нами в качестве состояния числа раздражителей, обусловливающих R\. Вероятности пере¬ хода находятся следующим образом. Чтобы найти pi,о, мы оты¬ скиваем на нашем дереве все пути, ведущие к {г°, 5°}, и склады¬ ваем их вероятности. Проделав это, мы получим: Р\, о — ~2 ^ — а) А ~2 ^ ® О —
452 Гл. VIIм. Применение к бихевиористским проблемам При помощи того же дерева можно найти р1Л и ph2. Чтобы найти другие вероятности перехода, мы должны построить ана¬ логичное дерево в предположении, что в начальном положении никакой элемент не связан с Ri, а также в предположении, что Напольные Восприятия ' Выборы Выборы связи испытуемого испыту- эпсперимен- гпатора Связи не изменяются Вероятность измененные выбора связи ветвей - (rV) 1/гвг(1-а) - {r'.s’) 1/гвга - { ГV} t/zffb - {r’.s1} 1/гвг(1-Ь) - {rV} в(1-0)Ь - {>V} в(1-в)(1-Ь) - {r'.s0} ВЦ-в)(1-а) - ('V) в(1-в)а - {fv} (1-в)г Ф и г. 142 оба элемента связаны с R\. (См. упр. 1.) Проделав это, мы по¬ лучим полную матрицу вероятностей перехода: О 1 2 (1 —6)2а+1—а 26(1 — 0) а 02а 102(1- а) + (1—0)2+0 (1 —в) (I —л) -Ь |б2(1 ~Ь) + + у9(2 — 0)Ь +6(1 —0)(1—6) + у 0 (2 — 0) а Щ 20(1 — 0 )b (1— 0)26+(1 — Ь)) В следующем параграфе мы изучим эту марковскую цепь бо¬ лее детально. Упражнения 1. Постройте дерезо, показывающее возможные связи после одного экспери¬ мента для случая, когда в начале эксперимента оба раздражителя были связаны с R\. Сделайте то же самое для случая, когда в начале экспе¬ римента ни один раздражитель не связан с R\. О р = 1 2
§ 6. Предельные вероятности в модели Истиза 453 2. Используя построенные в упр. 1 деревья, проверьте, что вероятности пере¬ хода p0)j и p2,j указаны в тексте правильно. 3. Какова вероятность того, что реакцией испытуемого будет Ri, если в на¬ чале эксперимента с каждой реакцией связан один раздражитель? Чему равна эта вероятность, если в начале эксперимента оба раздражителя связаны с реакцией Ri? г i i \Om..: т; ^+0-2 0*.] В следующих упражнениях найдите матрицу вероятностей перехода при указанных конкретных условиях. Выясните, будет ли получаю¬ щаяся марковская цепь цепью с поглощением или регулярной. Интерпре¬ тируйте каждый из указанных случаев в терминах реальных экспери¬ ментов. Для регулярных процессов найдите предельные вероятности. Для процессов с поглощением найдите среднее значение числа шагов, предшествующих поглощению, при каждом из возможных начальных состояний. (См. § 4, упр. 16.) 4. а = 1, b = 1,0 = 72. [Отв.: Цепь регулярная; (0,3; 0,4; 0,3).] 5. а = 1, Ъ =0. [Отв.: Цепь с поглощением; t0 = (3 — 20)/(20 — О2); ^ = 1/0.] 6. а = 4-, й = 4-, 0 = 0,1. 4 4 7.а = 0.6 = 1 6=4. 8. а= 1, 6 = 1. 6 = 1. 9. а = О, Ъ = 0. 10. 0 = 0. 11. Рассмотрим случай 0 = 1, 0 < а < 1 и 0 < 6 < 1.- Покажите, что матрица вероятностей перехода не будет отвечать ни регулярной цепи, ни цепи с поглощением. 12. В условиях упр. И покажите, что если процесс начинается из состояния 0 или из состояния 2, то он никогда не придет в состояние 1. Следова¬ тельно, это состояние можно отбросить. Покажите, что если это сделать, то полученная в результате марковская цепь с двумя состояниями будет иметь регулярную матрицу вероятностей перехода. Найдите предельные 13. В условиях упр. 11 покажите, что имеется предельная вероятность пре¬ бывания в каждом из состояний, не зависящая от начального состояния. Найдите предельные вероятности. Сравните ответ с результатом упр. 12, § 6. ПРЕДЕЛЬНЫЕ ВЕРОЯТНОСТИ В МОДЕЛИ ИСТИЗА Теперь перейдем к изучению предельных вероятностей вы¬ бора испытуемым и экспериментатором каждой из возможных альтернатив. Мы интересуемся в первую очередь воздействием, оказываемым раздражителями. Если испытуемый не воспри¬ нимает ни одного из раздражителей, то они не оказывают
451- Гл. VII*. Применение к бихевиористским проблемам никакого воздействия. Поэтому все наши вероятности мы будем вычислять в предположении, что субъект воспринимает по меньшей мере один раздражитель. Это сводится к простому исключению всех экспериментов, в которых испытуемый не воспринял ни одного раздражителя. В настоящем параграфемы будем предполагать, что такое исключение проделано, и при всяком упоминании эксперимента будет подразумеваться, что в таком эксперименте испытуемый воспринимает по меньшей мере один раздражитель. При таком соглашении, если наш процесс находится в дан¬ ном эксперименте в состоянии 0, то вероятность того, что реак¬ цией субъекта будет /?0, равна 1 (в силу допущения А). Если он находился в состоянии 1, то, по соображениям симметрии, эта вероятность равна V2, и если он находился в состоянии 2, то (в силу допущения А) эта вероятность равна 0. Матрица Р будет регулярной тогда и только тогда, когда все величины а, 6, 0 и 1—0 не равны нулю (см. упр. 1). Если эта матрица — регулярная, то существует предельная вероятность попадания в каждое из состояний. Эти вероятности можно пред¬ ставить посредством вектора р = (ро, Рь Р2), который может быть найден из уравнения рр=р. Решив это уравнение, мы получим _ ЬО + 2i>2 (1 — 0) Ро ~ (а 4- Ь) 0 +■ 2 (а + Ь)2 (1 — 0) ’ п 4ab (1 — 0) Р' ~ (а + Ь) 0 4- 2 (а 4- Ь)2 (1 — 0) ' д0 4- 2лг (1 — 0) Pi — (а + Ь) 0 J- 2 (а 4- b)2 (1 — 0) ‘ Отсюда предельная вероятность того, что реакцией испытуе¬ мого будет /?0, равна 1 -Po + Y’P' + O'P^-ZTb' а предельная вероятность того, что реакцией испытуемого будет R1, равна а/(а + Ь). Для нахождения вероятности того, что экспериментатор сде¬ лает выбор Л0, мы должны взять сумму произведений вероятно¬ стей выборов испытуемого на вероятность того, что эксперимен¬ татор выберет Ао при условии, что испытуемый сделал тот или другой выбор. Следовательно, предельная вероятность того, что экспериментатор сделает выбор Л0, равна: b (1 — а) , ab b а \- b ' а + b а »|- Ь
§ 6. Предельные вероятности в модели Истиза 455 Как мы видим, предельная вероятность того, что реакцией испытуемого будет /?0, равна предельной вероятности того, что экспериментатор выберет А0. С помощью этих вероятностей мы можем найти предельную вероятность того, что испытуемый уга¬ дает правильно. (См. упр. 3.) Если же предположить, что экспериментатор делает выбор Aq с вероятностью р, не зависящей от выбора испытуемого, то испытуемый может максимизировать среднее значение числа правильных реакций, реагируя всегда посредством Ro, если р> у, и посредством R\, если р< у. (См. упр. 5.) Наша схема предсказывает менее рациональный, выбор со стороны субъекта. Это не должно казаться неудовлетворительным в слу¬ чае экспериментов с крысой, но от экспериментов с людьми можно было бы ожидать лучших результатов. К несчастью, эксперименты подтвердили, что прогнозируемые нашей схемой результаты близки к истинным даже в том случае, когда испы¬ туемыми являются люди. Следующий интересный эксперимент проделывался У. К. Ис- тизом и др. над испытуемыми различных типов. В половине всех случаев, когда испытуемый выбирал /?0, он получал поощрение, если же он выбирал Rь то поощрения не получал. Можно было бы ожидать, что испытуемый научится выбирать /?0, однако это было не так. Но что предсказывает теория? Если выбирается /?0, то в половине случаев это влечет поощрение. Следовательно, а = ~2 • Если же выбирается Rь то никакого поощрения не сле¬ дует. Следовательно, 1 —6 = 0, или 6 = 1. Теория предсказы¬ вает, что предельная вероятность выбора испытуемым реакции Ro равна 6/(а + 6) =-%• Это хорошо согласуется с данными экспериментов. Рассмотрим теперь случай поглощения. Точнее, мы рассмот¬ рим случай а = 0 и 6=1. Это означает, что экспериментатор всегда выбирает А0. Матрица вероятностей перехода будет тогда иметь вид Для изучения этой марковской цепи мы воспользуемся мето¬ дами, разработанными в § 4. Мы имеем одно поглощающее состояние, а именно 0. Следовательно, мы знаем, что в конеч¬ ном счете процесс перейдет в это состояние и останется в нем.
456 Гл. VII*. Применение к бихевиористским проблемам Согласно допущению А (см. предыдущий параграф), пребыва¬ ние в этом состоянии означает, что испытуемый с вероятностью 1 реагирует посредством R0. Таким образом, поглощение можно интерпретировать как тот факт, что испытуемый «обучается» тому, что экспериментатор всегда выбирает А0. Мы видели, что для марковской цепи с поглощением можно найти среднее значение числа пребываний процесса в каждом состоянии до поглощения, предполагая заданным некоторое предельное состояние. Пусть означает среднее значение числа прохождений процесса через состояние /, если он на¬ чинается из состояния i. Прежде чем вычислять ty, посмотрим, какими сведениями об эксперименте обогатит нас знание этих величин. Мы видим, что каждый раз, когда процесс находится в состоянии 1, субъект выбирает Ri с вероятностью у и, сле¬ довательно, реагирует ошибочно с вероятностью -g-. Каждый раз, когда процесс находится в состоянии 2, субъект с вероят¬ ностью 1 реагирует посредством т. е. ошибочно. Таким обра¬ зом, среднее значение числа ошибочных реакций субъекта до того времени, как он обучится, равно в предположении, что процесс начинается из состояния i. Мы находим tij способом, изучавшимся в § 4. Сначала образуем «урезанную» матрицу Q, получаемую из Р выбрасы¬ ванием столбца и строки, соответствующих поглощающему со¬ стоянию: Затем, используя (1), мы получаем 1/20 в качестве среднего значения числа ошибочных реакций, если процесс начинается из состояния 1, и 1/0 в качестве среднего значения числа оши¬ бочных реакций, если процесс начинается из состояния 2. Конечно, в реальном эксперименте начальное состояние не должно быть известно. Однако нельзя назвать неразумным предположение о том, что при первом эксперименте раздражи¬ 0) _/ 1-0 0 ' Q = V20 (1 — 0) (1-0)2. Затем находим T = (I — Q) 1:
§ 6. Предельные вероятности в модели Истиза 457 тели связываются с Ro и Ri случайным образом. Это должно означать, что из состояния 0 процесс начинается с вероятностью 1 1 1 о из состояния 1 с вероятностью и из состояния 2 с ве¬ роятностью -i*. При таком предположении мы получим, что среднее значение числа ошибочных реакций субъекта до того времени, как он обучится, равно (2) ±.J_ + l.i=_L w 2 20 ^ 4 0 20 Упражнения 1. Докажите, что матрица Р из § 5 будет регулярной тогда и только тогда, когда все числа а, Ь, 0 и 1 — 0 отличны от нуля. [Указание. Покажите, что если хотя бы одно из этих чисел равно 0, то матрица не будет регулярной.] 2. Путем вычисления 1 • ро + 'Д • Р\ + 0 • р2 проверьте, что для испытуемого вероятность реакции Ro равна Ь/(а + Ь). 3. Покажите, что предельная вероятность согласования выбора испытуемого с выбором экспериментатора равна а(\ — Ь) + Ь(\—а) а + Ь 4. Допустим, что экспериментатор выбирает А0 всегда с некото¬ рой фиксированной вероятностью р} не зависящей от выбора испы¬ туемого. Какую долю правильных реакций можно ожидать от испытуе¬ мого? [Отв.: 1 —2 р + 2 р2.] 5. В условиях упр. 4 предположим, что испытуемый всегда реагирует по¬ средством Ro. Покажите, что если р > , то при таком методе испытуе¬ мый прореагирует правильно в среднем большее число раз, нежели при методе, предсказанном нашей схемой. 6. Рассмотрим случай а = l/2, 6 = 0 и 0 = у. Для каждого возможного начального состояния найдите среднее значение числа прохождений про¬ цесса через каждое состояние до перехода в поглощающее состояние. [Отв.: too — 3; = 2; t\o — V2; ^11 = 3.] 7. Проделайте то же самое, что и в упр. 6, для случая а = 0 и 6 = 0. 8. В условиях упр. 6 и 7 для каждого возможного начального состояния най¬ дите среднее значение числа ошибочных реакций испытуемого. 9. В условиях упр. 6 и 7 найдите, аналогично тому, как это было сделано в (2), среднее значение числа ошибочных реакций испытуемого в пред¬ положении, что в первом эксперименте связи имеют случайный характер. [Отв.: 4, 2, 0; О, О, О.] 10. Если испытуемый выбирает У?0, он получает поощрение с вероятностью р; если он выбирает R1, то он не получает никакого поощрения. (См. при¬ мер с р — ~2 в основном тексте) Найдите а \\ Ь. Чему равна пре¬ дельная вероятность того, что испытуемый выберет Ro? Как часто он 30 Зак. G09
458 Гл. VII*. Применение к бихевиористским проблемам получает поощрение? Как часто получал бы он поощрение, если бы выби¬ рал всегда Ro? Сравните эти два значения для Р = > ~2 > ~J"* [Отв.: 1/(2 — р); р/(2 — р); р.] 11. Пользуясь формулами настоящего параграфа, вычислите ро, Pi, Р2 для случаев, рассмотренных в упр. 4—9 предыдущего параграфа. Проверьте, что для регулярных матриц эти величины дают предельные вероятности, найденные в этих упражнениях. Что означают ро, pi, р?. для цепей с по¬ глощением? § 7. ПРАВИЛА БРАКОСОЧЕТАНИЯ В ПЕРВОБЫТНЫХ ОБЩЕСТВАХ В некоторых первобытных обществах мы находим строгие правила относительно того, в каких случаях допустимы браки. Эти правила направлены на предотвращение браков между слишком близкими родственниками. Они допускают точную ма¬ тематическую формулировку в терминах P-матриц. Наше изло¬ жение этой темы частично основано на работах Андре Вейля и Роберта Р. Буша. Правила бракосочетания, о которых идет речь, характери- . зуются следующими аксиомами. Аксиома 1. Каждому члену данного общества приписы¬ вается определенный брачный тип. Аксиома 2. Двум индивидуумам разрешается вступать в брак только в том случае, если они принадлежат к одному и тому же брачному типу. Аксиома 3. Тип индивидуума определяется полом инди¬ видуума и типом его родителей. Аксиома 4. Два мальчика (или две девочки), родители которых принадлежат к разным типам, сами принадлежат к разным типам. Аксиома 5. Правило, разрешающее или не разрешающее мужчине вступать в брак со своей родственницей, зависит только от вида родства. Аксиома 6. В частности, мужчине не разрешается женить¬ ся на своей сестре. Аксиома 7. Для любых двух индивидуумов можно ука¬ зать таких их потомков, которым разрешается вступать друг с другом в брак. Пример. Предположим, что имеются три брачных типа, fi, U и t3. Двое родителей в данной семье должны принал* Лежать к одному и тому же типу, поскольку лишь в этом случае они могли вступить в брак. Таким образом, для браков имеются только три логические возможности,
§ 7. Правила бракосочетания в первобытных обществах 459 В каждом случае мы должны установить, каким будет тип сына или дочери. Этот тип зададим таблицей; Тип их сына Тип их дочери ^ 2 h k k 11 t2 . Тип родителей k k k Мы должны еще проверить выполнимость всех аксиом. Некоторые аксиомы проверяются легко (см. упр. 1); другие аксиомы проверить труднее. Ниже мы докажем одну об¬ щую теорему, из которой будет следовать, что наше прави¬ ло удовлетворяет всем аксиомам. Для полного исследования проблемы мы должны распола¬ гать простым и единообразным методом записи отношений род¬ ства. С этой целью мы будем применять родословное дерево, каким пользуются антропологи. Общепринятыми являются сле¬ дующие символы: А Мужчина Женщина ;—~~ Бран J Потомок Г '—I Братья или сестры На фиг. 143 изображены четыре родословных дерева, предста¬ вляющих четыре вида отношения «двоюродные» между мужчи¬ ной и женщиной. Ф и г. 143 Пример (продолжение). Разрешает ли наше правило брак между мужчиной и дочерью брата его отца? Это от¬ ношение родства изображено на фиг. 143,а. Для исходной
460 Гл. VI1*. Применение к бихевиористским проблемам пары родителей (дедушки или бабушки) возможны три типа. На фиг. 144 разобраны все три случая. Мы видим, что в каждом случае мужчина и женщина принадлежат к различным типам. Следовательно, такие браки никогда не разрешаются. А может ли мужчина вступить в брак Ф и г. 144 с дочерью брата своей матери? Это отношение изображено на фиг. 143, г. Соответствующие три случая разобраны на фиг. 145. Мы видим, что такие браки всегда разрешаются. Фиг. 145 Теперь мы подготовлены к тому, чтобы дать нашим прави¬ лам математическую формулировку. Общество устанавливает несколько, скажем п, брачных типов (аксиома 1). Назовем их t\ct2, . . ., tn. Наше правило состоит из двух частей, одна из ко¬ торых касается сыновей, а другая — дочерей. Рассмотрим брач¬ ный тип сыновей. Родители должны принадлежать к одному и тому же брачному типу (аксиома 2). Сыну мы обязаны при¬ писать тип, зависящий только от общего типа родителей (аксиома 3). Если родители принадлежат к тину С, то сам он будет принадлежать к типу tj. Кроме того, если какой-то юноша имеет родителей, принадлежащих к типу, отличному от t-L, то он должен будет принадлежать к типу, отличному от tj (аксио¬ ма 4). Это определяет некоторую перестановку множества брачных типов (см. § 12, гл. V); тип сына получается из типа родителей посредством некоторой перестановки, определенной
§ 7. Правила бракосочетания в первобытных обществах 461 существующими в данном обществе брачными правилами. По¬ этому мы образуем вектор типов t = (/ь . . ., tn) и описываем перестановку, о которой идет речь, P-матрицей S порядка п. Если типом родителей служит i-я компонента вектора t, то ти¬ пом их сыновей служит i-я компонента вектора tS. Путем анало¬ гичного рассуждения мы приходим к матрице Д определяющей тип дочерей. Мы показали, что математическое выражение первых четы¬ рех аксиом состоит в том, что вводится вектор-строка t и две P-матрицы S и D. Последние три аксиомы налагают некоторые ограничения на выбор матриц 5 и Д этим вопросом мы зай¬ мемся в следующем параграфе. Мы неоднократно видели, каким образом векторные и ма¬ тричные обозначения позволяют заменять системы уравнений одним уравнением. В настоящей проблеме эти обозначения по¬ зволяют нам представить данный вид отношений родства для всех брачных типов посредством единственной диаграммы. Фактиче¬ ски это можно сделать, ничего не зная о том, сколько имеется типов в данном обществе или в чем со¬ стоят брачные правила. Проиллю¬ стрируем это на примере фиг. 145. Пара, соответствующая верхушке дерева, принадлежит к одному из типов, представленных нашим век¬ тором t. Сын принадлежит к типу tS, а дочь — к типу tD. Далее, сын сына принадлежит к типу tSSy дочь сына — к типу tSD, и т. д. Таким образом, три (или больше — при большем числе брачных типов) диаграммы, изображенные на фиг. 145, заменяются единственной «векторной» диаграммой, воспроизведенной на фиг. 146. Пример (продолжение). Наш вектор t имеет вид t = (t\, 12, t3) и /О 1 0\ /0 0 1\ D = ( 0 0 1, S = i 10 0. \I 0 0/ \0 1 0/ Как мы видели из фиг. 145, мужчине всегда разрешается вступать в брак с дочерью брата его матери'. Можно, .ли усмотреть это из фиг. 146? Брак будет разрешаться всегда, если вектор (DS всегда равен tSD, что эквивалентно
462 Г л. VII*. Применение к бихевиористским проблемам матричному равенству DS = SD. Для наших S и D это ра¬ венство оказывается верным. Но на фиг. 146 мы можем усмотреть нечто большее. Сколько бы ни было типов, рас¬ сматриваемый тип брака всегда разрешается тогда и толь¬ ко тогда, когда SD = DS, т. е. когда матрицы 5 и D пере¬ становочны. Итак, на одном примере мы видели, каким образом свой¬ ства матриц S и D определяют виды родства, при которых раз¬ решается вступать в брак. Этот вопрос будет служить предме¬ том изучения в следующем параграфе. Упражнения 1. Проверьте, что правило, фигурирующее в примере, удовлетворяет аксио¬ мам 1, 3 и 4. 2. Проверьте, что выписанные в тексте матрицы S и D представляют данное в примере правило. 3. Постройте диаграмму для отношения родства брат — сестра. 4. Используя диаграмму, построенную в упр. 3, покажите, что в условиях примера браки брата с сестрой никогда не разрешаются. 5. Какому условию должны удовлетворять матрицы S и Д чтобы браки брата с сестрой всегда разрешались? [Отв.: S = D.] В первобытном обществе Кариера !) имеется четыре брачных типа, приписываемых согласно следующим правилам: Тип родителей Тип сына Тип дочери t{ t з tA t2 tA t3 t3 tx t2 12 Упражнения 6—И относятся к этому обществу. 6. Найдите t, S и D для общества Кариера. 7. Покажите, что в обществе Кариера никогда не разрешаются браки между братом и сестрой. 8. Покажите, что матрицы S и D перестановочны. Что это говорит нам по поводу браков между двоюродным братом и сестрой в обществе Ка¬ риера? 9. Покажите, что в обществе Кариера никогда не разрешаются браки между двоюродными братом и сестрой, если они находятся в отношении род¬ ства, представленном на фиг. 143, а и б. 10. Покажите, что в обществе Кариера всегда разрешаются браки между двоюродными братом и сестрой, если они находятся в отношении род¬ ства, представленном на фиг. 143, в. 11. Найдите группу (см. § 13 гл. V), порожденную матрицами S и D для общества Кариера. ]) Общество Кариера (Kuriera society) — одно из сообществ аборигенов Австралии*
§ 8. Составление правил бракосочетания 463 В первобытном обществе Тарау *) имеется также четыре брачных типа. Сын всегда принадлежит к тому же типу, что и его родители. Тип дочери задается следующим правилом: Тип родителей Тип дочери h и ^2 Л ^3 ^2 U и Остальные упражнения относятся к этому обществу; 12. Найдите t, S и D для общества Тарау. 13. Покажите, что в обществе Тарау , никогда не разрешаются браки между братом и сестрой. 14. Покажите, что матрицы S и D перестановочны. Что это говорит нам по поводу браков между двоюродными братом и сестрой в обществе Тарау? 15. Покажите, что в обществе Тарау никогда не разрешаются браки между двоюродными братом и сестрой, если они находятся в отношении родства, представленном на фиг. 143, а и б. 16. Покажите, что в обществе Тарау никогда не разрешаются браки между двоюродными братом и сестрой, если они находятся в отношении родства, представленном на фиг. 143, б. 17. Найдите группу (см. § 13 гл. V), порожденную матрицами 5 и D для общества Тарау. § 8. СОСТАВЛЕНИЕ ПРАВИЛ БРАКОСОЧЕТАНИЯ В предыдущем разделе мы видели, что правила бракосоче¬ тания в первобытном обществе определены посредством вектора t и матриц S и D. Аксиомы совершенно не затрагивают числа типов, и мы увидим, что в качестве числа типов может фигури¬ ровать любое число п > 1. Что же касается матриц S и D, то, как мы увидим, их выбор строго ограничен. Это говорит о том, что со¬ здание правил бракосочетания в существовавших первобытных обществах требовало большой изобретательности. Теперь мы должны рассмотреть последние три аксиомы. Для аксиомы 5 нам нужно иметь простой способ описания вида родства. Фамильное дерево служит для нас основным инстру¬ ментом, но мы хотели бы заменить его подходящей матрицей. Рассмотрим фиг. 146. Вместо того чтобы, начиная с дедуш¬ ки и бабушки, находить типы внука и внучки, мы можем начать с внука и подниматься до дедушки и бабушки, после чего спу¬ ститься до внучки. Для этого мы должны выяснить, что озна¬ чает «подниматься» в терминах наших матриц. Если родители !) Общество Тарау, или Тарая (Tarau society), существует в Восточной Индонезии,
464 Гл. VII*. Применение к бихевиористским проблемам жринадлежат к типу ty то их сын принадлежит к типу tS. Сле¬ довательно, если сын принадлежит к типу t, то его роди¬ тели принадлежат к типу tS~l (см. § 12 гл. V). Аналогич¬ но, если дочь принадлежит к типу t, то ее родители принадле¬ жат к типу Ю~х. На фиг. 147 изображен этот новый вариант фиг. 146. Легко видеть, что такую процедуру можно проделать для любого вида родства. Вид родства определяет матрицу /И, обла¬ дающую тем свойством, что если мужчина в рассматриваемом виде родства принадлежит к ти¬ пу /, то женщина принадлежит к типу Ш. На фиг. 147 мы ви¬ дим, что для «дочери брата ма¬ тери» М = S~lD-lSD. Будем назы¬ вать М матрицей родства. Вся¬ кая такая матрица представляет собой произведение, образован¬ ное из матриц S, D и обратных к ним матриц, и, следовательно, является элементом группы, по¬ рожденной матрицами S и D. Рассмотрим аксиому 5. По за¬ данному отношению родства ме¬ жду мужчиной и женщиной мы образуем матрицу М этого род¬ ства. Мужчине разрешается вступать в брак со своей родствен¬ ницей тогда и только тогда, когда оба они принадлежат к од¬ ному и тому же типу, т. е. когда определенная компонента t совпадает с соответствующей компонентой tM. Иными словами, эта компонента не должна измениться от перестановки М, что доказывает нашу первую теорему: Теорема 1. Мужчине разрешается вступать в брак с жен¬ щиной, находящейся с ним в определенном отношении родства, в том и только том случае, если его брачный тип не принадле¬ жит эффективному множеству матрицы этого родства (см. § 13 гл. V, стр. 355). Вторая теорема выводится из первой без труда: Теорема 2. Браки между лицами, состоящими в родстве определенного вида, разрешаются всегда, если эффективное множество матрицы этого родства пусто; такие браки не разре¬ шаются никогда, если эффективное множество этой матрицы является универсальным множеством. Теорема 3. Аксиома 5 означает, что в группе, порожден¬ ной матрицами S и D, каждый элемент, кроме I, является пол¬ ной P-матрицей (см. § 13 гл. V, стр. 355). Фиг. 147-
§ 8. Составление правил бракосочетания 465 Доказательство. Аксиома 5 утверждает, что для лю¬ бого данного отношения родства брак либо всегда разрешается, либо никогда не разрешается. Следовательно, по теореме 2 эф¬ фективное множество матрицы этого родства должно быть либо пустым множеством, либо универсальным. Первое означает, что эта матрица равна /, а второе означает, что она является пол¬ ной P-матрицей. Следовательно, всякая матрица родства должна либо совпадать с /, либо являться полной Р-матри¬ цей. Эти матрицы являются элементами группы, порожденной S и D. Обратно, если дан любой элемент группы, порожденной S и Д который, очевидно, может быть записан в виде про¬ изведения, построенного из S и D, то мы можем нарисовать фа¬ мильное дерево, имеющее эту матрицу своей матрицей родства. Следовательно, множество матриц родства совпадает с множе¬ ством элементов этой группы. Это означает, что все элементы группы, кроме /, должны быть полными P-матрицами, что и до¬ казывает теорему. Теорема 4. Аксиома 6 означает, что S~]D является полной Р-матрицей. Эта теорема непосредственно следует из того факта, что матрица родства брат — сестра имеет вид S~lD. Теорема 5. Аксиома 7 означает, что для любых i и j в группе, порожденной S и D, имеется матрица, переводящая ti в tj. Доказательство. Выберем двух индивидуумов, принад¬ лежащих соответственно к типам t{ и tj. Должен существовать потомок первого из этих индивидуумов, которому разрешалось бы вступить в брак с некоторым потомком второго индивиду¬ ума. Следовательно, эти два потомка должны принадлежать к одному и тому же типу. Это означает, что существуют такие перестановки М\ и М2, что М{ переводит U в тот же тип, в ка¬ кой М2 переводит tj. Тогда MiMf1 переводит tl в tj. Отсюда следует наша теорема. Итак, мы преобразовали аксиомы 5--7 в следующие три ус¬ ловия, накладываемые на матрицы 5 и D: (1) Группа, поро¬ жденная 5 и D, состоит из матрицы / и из полных Р-матриц; (2) S~lD является полной Р-матрицей; (3) Для каждой пары типов в группе, порожденной S и D, имеется перестановка, ко¬ торая переводит один тип в другой. Определение. Группа Р-матриц называется регулярной, если (а) она является полной, т. е. каждый элемент этой груп¬ пы, отличный от /, является полной P-матрицей, и (Ь) для каждых двух объектов, выбранных из множества п объектов,
466 Гл. VII*. Применение к бихевиористским проблемам в группе имеется матрица, которая перезодит один из этих объектов в другой. Основная теорема. Для того чтобы выполнялись все наши аксиомы, надо, чтобы (различные!) P-матрицы S и D по¬ рядка п порождали регулярную группу перестановок. Доказательство. Выписанные выше условия (1) и (3) означают в точности то, что группа, порожденная S и D, регу¬ лярна. Но в регулярной группе каждый элемент, отличный от /, является полной перестановкой; следовательно, условие (2) требует лишь, чтобы матрица S~lD была отлична от /. Но так как S~lD = I равносильно тому, что S = D, то мы должны по¬ требовать только, чтобы D Ф S. Теорема доказана. Важно уметь распознавать регулярные группы Р-матриц. Здесь на помощь нам приходит одна очень простая и хорошо известная теорема: подгруппа группы перестановок п-й степени является регулярной тогда и только тогда, когда она имеет п элементов и является полной. Это приводит нас к относительно простой процедуре. Сна¬ чала выбираем п. Затем мы должны взять группу P-матриц по¬ рядка пу состоящую из п элементов и являющуюся полной, и отобрать два различных элемента, которые порождают эту группу. При п > 1 это всегда возможно (см. упр. И). Одна из отображенных матриц принимается за S, а другая за D. Так как для любого п существует лишь небольшое число регуляр¬ ных групп перестановок, то наш выбор будет весьма ограничен. Пример. Будем искать все возможности для общества с четырьмя брачными типами. Прежде всего, мы должны отыскать регулярные подгруппы симметрической группы 4-й степени, т. е. группы перестановок четырех объектов, состоящие из четырех элементов и являющиеся полными. Среди таких подгрупп имеются циклические группы. Любые две из них имеют одинаковую структуру и, следо¬ вательно, приводят к эквивалентным правилам. Допустим, что мы выбрали группу перестановок, порожденную матрицей /О 1 0 0\ _/ 0 0 1 0' Рг=1о 0 0 1' V1 0 0 О / Эта группа состоит из Р, Р2, Р3 и I. Каждый из элементов Р и Р3 порождает эту группу, и, следовательно, оба эле¬ мента играют в ней одинаковую роль. Поэтому можно счи¬ тать, что одной из отобранных матриц является Р. Это дает нам следующие возможности: (Р, Р2), (Р, Р3) и (Р, /).
§ 8. Составление правил бракосочетания 467 Мы должны еще решить, какая из них будет 5 и какая D. Во втором случае это безразлично, так как Р и Р3 играют в группе одинаковую роль, но в первом и третьем случаях это влияет на результат. В итоге мы получаем пять воз¬ можностей: 1. S = P, D = P2; 2. 5 = Р2, D = P\ 3. S = P, D = Я3; 4. S = P, D = I ; 5. S = f, D = P. (Это соответствует обществу Tapay l).) Имеется только одна нециклическая полная подгруппа с четырьмя элементами, состоящая из / и трех перестано¬ вок, которые переставляют две пары элементов. Эта груп¬ па дает по существу лишь один новый случай, так как все три перестановки играют в ней одинаковую роль. 6. Общество Кариера !). Итак, окончательно, мы имеем всего шесть возможно¬ стей, причем две из этих шести возможностей иллюстри¬ руются примерами реальных первобытных обществ. Упражнения 1. На фиг. 147 указана матрица одного вида двоюродного родства. Найдите матрицы трех остальных видов двоюродного родства. 2. Докажите, что брак между лицами, состоящими в некотором родстве, разрешается в том и только том случае, если матрица этого родсгва равна /. 3. Докажите, используя результат упр. 2, что ни в каком обществе не раз¬ решается брак между двоюродным братом и сестрой, родство которых указывается фиг. 143, а и б. 4. Какое из выписанных в примере в тексте шести правил бракосочетания разрешает брак между мужчиной и дочерью сестры его отца? [Ошв : 3, 6.] 5. Покажите, что все указанные в примере шесть правил разрешают браки между мужчиной и дочерью брата его матери. 6. Имеется восемь видов троюродного родства между мужчиной и женщи¬ ной. Нарисуйте родословное дерево для каждого вида. 7. Найдите матрицу родства для каждого из восьми видов родства, фигури¬ рующих в упр. 6. 8. Существует ли какой-нибудь вид троюродного родства, при котором брак запрещался бы всеми возможными правилами? [Отв.: Да.] 9. Для каждого вида троюродного родства (кроме найденных в упр. 8) выясните возможность брака при каждом из шести возможных правил, указанных в примере в основном тексте. 10. Рассмотрим перестановку п объектов, которая i-й элемент (где i = 1, 2,..., п— 1) переводит в (i + 1)-й, а последний элемент ставит на первое место. Покажите, что циклическая группа, порожденная этой перестановкой, яв¬ ляется регулярной. 1) См. упражнения к § 7,
438 Г л. 1/IIм. Применение к бихевиористским проблемам 11. Используя результат упр. 10, покажите, что общество может иметь любое число п брачных типов, если только п > 1. 12. В примере предыдущего параграфа докажите, что S и D порождают регулярную группу перестановок. 13. Докажите, что следующие матрицы задают правило, удовлетворяющее всем аксиомам: ■ 0 1 0 0 0 0 ' ' 0 0 0 1 0 0 0 0 1 0 0 0 0 0 0 0 0 1 1 0 0 0 0 0 , D = 0 0 0 0 1 0 0 0 0 0 0 1 0 0 1 0 0 0 . 0 0 0 1 0 1 . . 0 1 0 0 0 0 . 14. Докажите, что правило, указанное в упр. 13, не разрешает никаких бра¬ ков между двоюродными братом и сестрой. § 9. МОДЕЛЬ РАСШИРЯЮЩЕЙСЯ ЭКОНОМИКИ Настоящая модель является видоизменением модели, пред¬ ложенной Дж. фон Нейманом. Она предназначена для изуче¬ ния экономики, которая расширяется в некотором фиксирован¬ ном темпе, сохраняя в других отношениях равновесие. При этом делаются некоторые предположения о поведении экономики при • равновесии. Они представляют собой идеализацию, и следует надеяться, что в дальнейшем модель будет заменена лучшей. В настоящее время многие экономисты рассматривают модель фон Неймана как удовлетворительное приближение к действи¬ тельности. Нам эта модель нужна лишь для того, чтобы пока¬ зать, как методы конечной математики могут быть применены в экономических задачах. Экономика включает в себя /г товаров и m процессов. Това¬ ром может быть сталь, уголь, дома, обувь и т. д. Товары яв¬ ляются продукцией производственных процессов в этой эконо¬ мике. Для измерения товаров можно брать любые единицы из¬ мерения, если эти единицы фиксированы раз и навсегда. Ради удобства мы допускаем возможность рассматривать произволь¬ ные кратные этих единиц. Например, мы будем говорить не толь¬ ко о 2,75 тонны стали, но также и о 2,75 дома. Последняя цифра может быть интерпретирована как некоторое среднее. В процессе производства в качестве сырья используются определенные товары (будем называть их входами) и произво¬ дится один или несколько товаров (будем называть их выхо¬ дами). Примерами такого процесса может служить превраще¬ ние стали, леса, стекла и т. д. в дом. Конечно, этот процесс мо¬ жет быть использован для изготовления более чем одного дома, вследствие чего можно говорить об интенсивности его исполь¬ зования. Одним из наших основных допущений является уело
§ 9. Модель расширяющейся экономика 469 вие линейности, означающеее, что на k домов каждого вида сырья потребуется в k раз больше, чем на один дом. Это позво¬ ляет для каждого процесса выбрать произвольную «единицу интенсивности», и процесс определен полностью, если известны все необходимые входы и все произведенные выходы для этой единичной операции. Процессу номер £, используемому с единичной интенсивно¬ стью, потребуется в качестве входа определенное количество товара /. Это количество мы будем обозначать через ац. (В ча¬ стности, если в процессе i не используется товар /, то = 0.) Через bij мы будем обозначать количество товара /, производи¬ мого в процессе i. Мы допускаем, что в данном процессе про¬ изводится несколько различных товаров (например, основной выход и побочные продукты). Но, конечно, допускаются и такие процессы, в которых производится всего лишь один товар. Тогда для рассматриваемого i все ft*.?, кроме одного, равны.нулю. Все a-Lj и bLj— неотрицательные числа. Обозначим (m X п)-матрицу с компонентами ai:j через Л, а (т X п)-матрицу с компонентами через В. Вся экономика может быть описана посредством этих двух матриц. Нам остается рассмотреть фактор времени. Обычно считают, что экономика работает по стадиям, или циклам. Продолжи¬ тельность одной такой стадии как раз достаточна для того, чтобы входы aij превратились в выходы bij. Тогда в следующей стадии эти выходы в свою очередь могут быть использованы как входы. В качестве длины этого цикла может быть выбран любой удобный для изучения данной экономики промежуток времени. Это может быть месяц, год или несколько лет. Пример. Пусть нашей экономической системой является птицеферма. Товарами здесь служат куры и яйца; в каче¬ стве единиц естественно принять одну курицу и одно яйцо. Процессов у нас два: несение яиц и высиживание цыплят. Предположим, что если курицу использовать для несения яиц, то за один месяц она снесет их около 12 штук, если же курицу использовать для высиживания цыплят, то за это же время она высидит в среднем четырех цыплят. Исходя из этой информации, мы можем построить матрицы А и В. Длину нашего цикла будем считать равной одному ме¬ сяцу. «Курица» будет товаром 1, «яйцо» будет товаром 2, «несение» будет процессом 1 и «высиживание» будет про^ цессом 2. Единицей интенсивности процесса будет то, что может произвести одна курица за один месяц. Вход про¬ цесса 1 состоит из одной курицы, т. е. из одной единицы товара 1. Выход будет состоять из дюжины яиц плюс на¬ седка. (Про нее нельзя забывать, потому что эта курица
470 Г л. VII*. Применение к бихевиористским проблемам может быть еспо-льзована снова в следующем цикле.) Сле¬ довательно, этот выход состоит из одной единицы товара 1 и двенадцати единиц товара 2. Вход процесса 2 состоит из одной курицы и четырех яиц, а выход состоит из пяти кур (одна первоначальная плюс четыре высиженные). Следовательно, наши матрицы имеют вид: курица яйцо несение яиц /1 0 \ высиживание цыплят \ 1 4 / курица яйцо несение яиц /1 12 \ высиживание цыплят \ 5 0 / Предположим, что сначала у нашего фермера имеется три курицы и восемь яиц, из которых он хочет вывести цыплят. Тогда две курицы ему понадобятся для высижи¬ вания цыплят из этих восьми яиц и одна курица будет нестись. Следовательно, он использует процесс 1 с интен¬ сивностью 1, а процесс 2 — с интенсивностью 2. Мы записы¬ ваем это с помощью вектора интенсивности х = (1, 2). За¬ метим, что входами служат компоненты вектора хА. Одна курица снесет 12 яиц. Кроме того, фермер будет иметь трех прежних кур плюс восемь новых. Следовательно, вы¬ ход равен И единицам товара 1 и 12 единицам товара 2. Эти числа являются компонентами вектора хВ. Из И кур только три могут быть использованы для высиживания цыплят, следовательно, на этот раз фермер использует век¬ тор интенсивности (8, 3). Легко проверить, что (см. упр. 1) выходы будут (8, 3)В = (23, 96). Теперь у фермера имеет¬ ся 96 яиц и только 23 курицы, так что не все яйца могут быть использованы. Теперь сделаем другое предположение, а именно, что наш фермер начинает с двух кур и четырех яиц. В этом случае он использует интенсивность (1, 1). Одна курица снесет 12 яиц, а число кур вместе с четырьмя высиженными станет равным шести. Этот результат представлен произ¬ ведением (1, \) • В = (6, 12). В результате первого цикла фермер утроил количество кур и яиц. В следующем цикле он может использовать интенсивность (3, 3), что даст ему (3, 3)Б = (18, 36), т. е. снова утраивает как количество
§ 9. Модель расширяющейся экономики 471 кур, так и количество яиц. Таким образом, он может про¬ должать использовать оба эти процесса в одинаковой про¬ порции и в каждом цикле утраивать свой выход. Такая экономика удерживается в равновесии. Из разобранного примера видно, что интенсивности процес¬ сов естественно представлять посредством вектора-строки: если интенсивность использования /-го процесса равна хг-, то вектор л = (хи ..., хт) называется вектором интенсивности. Посред¬ ством умножения матриц без труда находится общее коли¬ чество каждого необходимого товара и каждого произведенного товара. Вектор хА имеет в качестве своей /-й компоненты сумму х\а\у+ ••• ~^гхта,пр здесь хха{] дает количество /-го товара, используемого в процессе 1, x2a2j—количество этого товара, ис¬ пользуемого в процессе 2, и т. д. Следовательно, /-я компонента вектора хА показывает общее количество /-го товара, потребляе¬ мое в качестве входа. Аналогично хВ дает общее количество раз¬ личных товароз на выходе. Теперь мы должны установить цены на различные товары. Пусть у) означает цену одной единицы товара /; число yj должно быть неотрицательным числом, но может быть нулем. (Последнее означает, что данный товар продается столь деше¬ во, что «практически ничего не стоит».) Предполагается, что k у1 единиц товара / стоят ky . Вектор-столбец у = • называется .У/i вектором цен. Рассмотрим произведения Ау и By. Вектор Ау имеет в качестве своей /-й компоненты величину апу{ -f- • • • . .. А-ЯщУп' произведение ап ух равно количеству товара 1, потре¬ бляемого в процессе / единичной интенсивности, умноженному на цену одной единицы товара 1, т. е. стоимости товара 1, исполь¬ зуемого в этом процессе; ai2y2 есть стоимость используемого товара 2 и т. д. Следовательно, /-й компонентой вектора Ау бу¬ дет полная стоимость входов в процессе / единичной интенсив¬ ности. Аналогично By дает стоимость выходов. Наконец, рассмотрим произведения хАу и хВу. Так как * есть (1 X т)-матрица, А и В суть (m X п)-матрицы и у есть (п X 1)-матрица, то каждое из этих произведений является (1 X 1)-матрицей, т. е. числом. Анализ, подобный предыдущему, показывает, что хАу представляет собой общую стоимость вхо¬ дов, если экономика работает с интенсивностью х и ценами у, а хВу — стоимость всех произведенных товаров. (См. упр. 2.) Пример (продолжение). Допустим, что курица стоит 10 денежных единиц, а яйцо стоит 1 единицу; тогда
472 Га. VIIм. Применение к бихевиористским проблемам у .=Д Здесь Это означает, что процесс 1 несения яиц умножает наше вложение в 2,2 раза, а процесс 2 (высиживание) приносит свыше 3,5 доллара на каждый вложенный доллар. Это вы¬ нуждает использовать кур исключительно для высижива¬ ния цыплят, что приводит к сокращению количества яиц, вызывая резкое изменение цен. Допустим теперь, что ку¬ рица стоит только в шесть раз больше, чем яйцо, т. е. чае каждый процесс утраивает наше вложение и это не вызовет колебания цен. Следовательно, фермер может ис¬ пользовать свои процессы таким образом, чтобы сохраня¬ лось равновесие, и при этом структура цен была стабиль¬ ной. Последний фактор, который остается рассмотреть, — это рас¬ ширение экономики. Мы предполагаем, что все расширяется в некотором постоянном отношении, т. е. что имеется фиксиро¬ ванный коэффициент расширения а такой, что если в данном цикле процесс используется с интенсивностью х, то в следующем цикле он будет использоваться с интенсивностью ах, затем а2х и т. д. С деньгами происходит также нечто подобное расшире¬ нию: благодаря получению процентов у денежных единиц пре¬ вращаются в конце цикла в j3у денежных единиц. Мы снова предполагаем, что коэффициент дохода р фиксирован в находя¬ щейся в равновесии экономической системе раз и навсегда. Эти коэффициенты обычно бывают больше единицы, но последнее вовсе не обязательно. Случай а = 1 представляет стационарную экономику, случай а< 1—сокращающуюся экономику. На этом заканчивается обзор основных понятий. Теперь мы должны сформулировать наши предположения, касающиеся по¬ ведения экономики, находящейся в равновесии. Эти предполо¬ жения играют роль аксиом. Прежде всего мы должны гарантировать, чтобы в каждом цикле каждый товар производился в количестве, достаточном для обеспечения входов следующего цикла. Если в данном цикле экономика функционирует с интенсивностью х, то в сле¬ дующем цикле она будет функционировать с интенсивностью ах. Тогда В этом слу-
§ 9. Модель расширяющейся, экономика 473 Выходы в этом цикле будут иметь вид хВ, а входы в следую¬ щем цикле — ахА; следовательно, должно иметь место Аксиома 1. хВ ^ ахА. (Когда мы пишем неравенство, связывающее два вектора, то подразумеваем, что это неравенство выполняется для каждой компоненты векторов.) Разумеется, подобные же требования мы должны выдвинуть и в дальнейшем. Например, выходы во вто¬ ром цикле представлены вектором а хВ, а входы, необходимые для третьего цикла, — вектором а2хА. Но если мы запишем усло¬ вие а хВ ;>а 2хА, то а сократится, и мы снова придем к условию аксиомы 1. Следовательно, эта аксиома обслуживает все циклы. Первое условие обеспечивает возможность расширения эко¬ номики в постоянном отношении а. Мы должны также обеспе¬ чить финансовое равновесие экономики. Допустим, что стои¬ мость выхода некоторого процесса превосходит стоимость входа более чем в j3 раз. Тогда мы должны быть готовы обеспечить более высокий процент дохода всякому лицу, желающему вло¬ жить капитал в наш процесс. Это привело бы к увеличению |3. Следовательно, при равновесии этого не должно быть; никакой процесс не может приносить больший процент дохода, чем тот, который доставляется вложением капиталов в этот процесс. Если мы оперируем с процессами единичной интенсивности, то вектор Ау дает стоимости входов, а вектор By — стоимости вы¬ ходов. Для любого процесса последние не могут превышать первые более чем в |3 раз: Аксиома 2. By *С&Ау. Следующее предположение касается сверхпродукции. Если данный товар мы производим в количестве, превышающем ко¬ личество этого товара, используемое всей экономикой, то цены резко падают, так как предприниматели стараются избавиться от своей продукции. Обычно делают упрощающее предположе¬ ние, что такие товары являются бесплатными, т. е. полагают их цену равной нулю. Разность векторов хВ — ахА = х(В — а А) (неотрицательная в силу аксиомы 1!) дает количество сверх¬ продукции, так что /-я компонента этой разности будет поло¬ жительна тогда и только тогда, когда имеет место перепроиз¬ водство товара /. Если этим товарам приписывается цена нуль, го в произведении предыдущего вектора на вектор у каждая не¬ нулевая компонента первого вектора умножается на множитель нуль; следовательно, произведение этих двух векторов равно 0: Аксиома 3. х(В — &А)у =■ 0. Теперь мы обратимся к вопросу, стоит ли применять данный процесс. В соответствии с аксиомой 2 никакой процесс не может дать больше прибыли, чем простое вложение капитала. Но если он дает хоть сколько-нибудь меньше, то вместо того, чтобы 31 Зак. G09
474 Гл. VII*. Применение к бихевиористским проблемам применять его, лучше инвестировать наш капитал. Поэтому мы образуем разность By — ВАу левой и правой части неравенства аксиомы 2, и если i-я компонента этой разности отрицательна, то процесс i применять не стоит: ему должна быть приписана интенсивность 0. Рассуждение, аналогичное тому, которое ис¬ пользовалось в случае аксиомы 3, показывает, что умножение нашей разности на .г должно дать нуль: Аксиома 4. х(В — $А)у = 0. Наше заключительное предположение состоит в том, что эко¬ номика производит некоторую полезную продукцию, т. е. что стоимость всех производимых товаров является положительной величиной: Аксиома 5. хВу > 0. Если для данной экономики (данных А я В) найдены век¬ торы х и у и числа ос и р, удовлетворяющие нашим пяти аксио¬ мам, то мы говорим, что для этой экономики найдено некоторое возможное равновесное решение. Пример (продолжение). Мы видели, что если х = (1,1), то экономика расширяется в постоянном отношении а = 3. Можно проверить, что аксиома 1 удовлетворяется. Дей¬ ствительно, хВ оказывается равным ахА. Аналогично мы /6\ отметили денежное равновесие при у = ( ЕВ этом случае процесс умножает вложенный в него капитал с коэффици¬ ентом дохода р = 3. Можно проверить выполнимость аксиомы 2. Действительно, в этом случае By равно рАу. Из этих двух равенств мы можем также заключить, что х(В — а А) и (В — р А) у тождественно равны нулю; следо¬ вательно, выполняются аксиомы 3 и 4. Наконец хВу = 48; общая стоимость произведенных товаров положительна, так что выполняется и аксиома 5. Следовательно, эти зна¬ чения х, у, а и р обеспечивают равновесие экономики. Можно также показать, что это суть единственно возмож¬ ные значения для а и р и что х и у должны быть пропор¬ циональны приведенным (что можно просто мыслить как переход к другим единицам). В разобранном примере мы нашли для экономики одно и только одно состояние равновесия и нашли, что в этом случае а = р. Это вызывает несколько очень естественных вопросов: (1) Возможно ли равновесие для каждой экономики? (2) Если да, то будет ли оно единственным? (3) Всегда ли коэффициент расширения должен быть тем же самым, что и коэффициент дохода? В следующем параграфе мы получим следующие от¬ веты на эти вопросы: (1) Для каждой экономики, удовлетво¬
§ 9. Модель расширяющейся экономики 475 ряющей некоторому условию (этому условию, несомненно, удо¬ влетворяют все существующие экономики), возможно равнове¬ сие. (2) Равновесий может быть более одного, хотя число различных возможных коэффициентов расширения конечно. (В рассмотренном примере имелась по существу одна возмож¬ ность для х и у, однако в общем случае это неверно.) (3) В случае равновесия коэффициент дохода всегда равен ко¬ эффициенту расширения. Упражнения 1. В разобранном в тексте примере, полагая (1, 2), проверьте для трех циклов, что хА и хВ правильно дают входы и выходы. 2. Интерпретируйте хАу и хВу: (a) используя данные выше интерпретации векторов хА и хВ\ (b) используя данные выше интерпретации векторов А у и Ву\ (c) покажите, что результаты пп. (а) и (Ь) совпадают. 3. Пусть в примере текста две курицы несутся, а три высиживают цыплят. Найдите х, хА и хВ. Подставьте эти величины в условие аксиомы 1 и найдите наибольший возможный коэффициент. [Отв:. а. = 2.] 4. Пусть в примере одна курица стоит 80 центов, а одно яйцо стоит 5 цен¬ тов. Найдите х, хА и хВ. Подставьте эти величины в условие аксиомы 2 и найдите наименьший, возможный коэффициент дохода. [Отв.: (3 =4.] 5. Покажите, что х, у, а и р, найденные в двух предыдущих упражнениях, не приводят к равновесию, доказав, что не выполняются аксиомы 3 и 4. 6. Покажите, что если а = |3 = 3, то единственно возможные х и у пропор¬ циональны указанным выше. [Указание. Покажите, что аксиомы выну¬ ждают Нас ПРИНЯТЬ Х\ = X2 и у\ = 6t/2-] Остальные задачи относятся к следующей экономической системе. На птицеферме имеется порода кур, представители которой несут в месяц Q 1 16 в среднем по 16 яиц и высиживают в месяц в среднем 3-g- = -g- цыплят. 7. Выпишите матрицы А и В. 8. Пусть три из наших кур несутся, а пять высиживают цыплят. Найдите х, хА и хВ. Чему равен коэффициент а? [Отв.: х = (3, 5); хА = (8, 16); хВ = (24, 48); а = 3.] 9. Пусть курица стоит 40 центов, а яйцо стоит 5 центов. Найдите у, Ау и By. Чему равно (3 ? 10. Проверьте путем подстановки в пять аксиом, что х, у, а и 3, найденные в предыдущих упражнениях, обеспечивают равновесие экономики. 11. Пусть мы начинаем с 16 кур и 32 яиц. Подберите такие интенсивности, чтобы экономика находилась в равновесии, и найдите результат первых трех месяцев. [Отв.: х= (6, 10); 432 курицы и 864 яйца.] 12. Пусть мы начинаем с 16 кур и 32 яиц, причем только пять кур исполь¬ зуются для высиживания цыплят, а остальные несутся. Покажите, что через три месяца мы получим меньшее число кур, чем мы их получили бы в условиях равновесия. (См. упр. 11.) 31*
476 Гл. Vil\ Применение к бихевиористским проблемам § 10. СУЩЕСТВОВАНИЕ ЭКОНОМИЧЕСКОГО РАВНОВЕСИЯ Возникает вопрос, всегда ли можно удовлетворить аксио¬ мам, т. е. допускает ли наша модель экономики равновесие. Разумеется, нас интересуют лишь такие экономические си¬ стемы, которые могут реально существовать. Это значит, что рассматриваемые товары должны быть товарами, которые как- то производятся и которые не могут быть произведены из ни¬ чего. Следовательно, в каждом процессе должен затрачиваться по меньшей мере один сырьевой материал и для каждого то¬ вара должен существовать по меньшей мере один процесс, про¬ изводящий этот товар. Резюмируем это. Ограничение. В каждой строке матрицы Айв каждом столбце матрицы В имеется по меньшей мере один положитель¬ ный элемент. Теорема. Если А и В удовлетворяют указанному выше условию, то равновесие возможно. Мы приведем набросок доказательства. Согласно аксиоме 3, хВу = <ххАу, тогда как, согласно аксио¬ ме 4, хВу = $хАу. Следовательно, ахАу = $хАу. Далее, из ак¬ сиомы 5 следует, что хВу не равно нулю, поэтому хАу также не равно нулю. Отсюда а = (3. Итак, при равновесии коэффициент расширения обязательно равен коэффициенту дохода. Если а = |3, то аксиомы 3 и 4 становятся эквивалентными. Перепишем, используя наш результат, первые две аксиомы в следующем виде: Аксиома Р. х(В — аЛ)>0. Аксиома 2'. (В — а Л) у < 0. Если первое неравенство умножить справа на у, а второе умно¬ жить слева на у, то станет очевидным, что аксиома 3 (а следо¬ вательно, и аксиома 4) вытекает из этих двух аксиом. Следова¬ тельно, мы должны заботиться лишь об удовлетворении аксиом Г, 2/ и 5. Идея доказательства заключается в том, что наша задача интерпретируется как некоторая задача теории игр. Это делает¬ ся вопреки тому, что в рассматриваемой модели нет речи ни о какой игре. Математические результаты теории игр исполь¬ зуются просто как средство. Аксиомы Г и 2' наводят нас на мысль рассматривать матрицу В — а А как матрицу некоторой игры. Тогда векторы х и у можно рассматривать как смешанные стратегии двух игроков. Эти векторы неотрицательны, но суммы их компонент не обя¬ заны быть равными 1. Однако мы знаем, что умножение век¬ тора х на константу можно рассматривать как переход к дру¬
§ ](). Существование экономического равновесия 477 гим единицам интенсивности, а умножение вектора у на константу — как переход к другим единицам различных това¬ ров. Следовательно, можно считать, не умаляя общности, что суммы компонент векторов х и у равны 1, и мыслить эти век¬ торы как смешанные стратегии. Тогда первые две аксиомы озна¬ чают, что цена этой игры равна нулю .и что хну образуют пару оптимальных стратегий двух игроков. Таким образом, наша первая задача заключается в выборе такого а, чтобы цена «игры» с матрицей В — а А была равна нулю. Пример 1. Будем рассматривать пример' предыдущего параграфа как игру с матрицей Если за смешанную стратегию для первого игрока (кото- хМ = [3 — а, 2(3 — а)]. Если а < 3, то обе компоненты по¬ ложительны; следовательно, цена этой игры больше нуля. Если за смешанную стратегию второго игрока (который Если а > 3, то обе компоненты отрицательны и, следова¬ тельно, цена игры отрицательна. Итак, единственным зна¬ чением а, при котором еще цена игры может равняться нулю, является а = 3, а из предыдущего мы знаем, что в этом случае цена действительно равна нулю и что х и у являются оптимальными стратегиями. (См. упр. 1.) Теперь мы должны показать, что рассмотренный пример яв¬ ляется типичным в том смысле, что всегда можно найти а, при котором цена игры с матрицей В — а А равна нулю. Эту матрицу можно записать в виде суммы В + а(—А) и представить игру как комбинацию игры с матрицей В и игры с матрицей (—Л). Согласно нашему ограничению, каждый столбец матрицы В имеет положительный элемент. Вектор стратегии у второго иг¬ рока имеет по крайней мере одну положительную компоненту. Следовательно, по меньшей мере одна компонента произведе¬ ния By должна быть положительной; поэтому цена игры с ма¬ трицей В положительна. Так как каждая строка матрицы А имеет положительный элемент, то каждая строка матрицы (—А) рый распоряжается строками) принять то
478 Гл. V7/*. Применение к бихевиористским проблемам должна иметь отрицательный элемент. Следовательно, по край¬ ней мере одна компонента вектора х(—А) должна быть отри¬ цательной, и цена игры с матрицей (—А) отрицательна. В выражении В + а(—А) при очень малом а вторым чле¬ ном можно пренебречь. Следовательно, при таком а цена игры будет положительной.. Будем теперь увеличивать а. Это равно¬ сильно тому, что к некоторым элементам матрицы В + а(—А) прибавляются большие отрицательные величины, т. е. эти эле¬ менты убывают. Следовательно, цена игры все время убывает. При очень большом а первым членом можно пренебречь и, сле¬ довательно, комбинированная игра имеет отрицательную цену. Для некоторого промежуточного значения а цена этой игры должна равняться нулю. Пример 1 (продолжение). Цена игры с матрицей М при различных а показана на фиг. 148. Так как цена игры с матрицей В равна > а цена игры с матрицей (—А) рав¬ на — 1 (см. упр. 2), то при малых а цена игры с матрицей М близка к При больших а она будет близкой к 2 — а, т. е. значительно меньше нуля (см. упр. 3). Мы знаем, что имеется по крайней мере одно а, при котором цена игры с матрицей В — а А равна нулю. Всякое такое а вме¬ сте с парой х, у оптимальных стратегий дает систему величин, для которой выполнены аксиомы V и 2'. Выполнение аксиомы 5 пока что остается под вопросом. Если р и q — два значения а, при которых цена игры равна нулю, то этим же свойством обладает каждое число, заключен¬ ное между р и q. Это следует из того, что, как мы видели, с воз¬ растанием а цена игры не может возрастать. Следовательно, в рассматриваемом случае дело обстоит так, как это предста¬ влено на фиг. 149. Можно показать, однако, что в большинстве А 3 2 Ъ Фиг. 148 Фиг. 149
§ 10. Существование экономического равновесия 479 ;воем эти значения соответствуют экономикам, которые не про¬ изводят ничего полезного, т. е . случаю, когда не выполнена аксиома 5. При выполнении аксиомы 5 новые а могут получать¬ ся лишь за счет введения по меньшей мере одного нового про¬ цесса. Но так как процессов имеется лишь конечное число, то в интервале между р и q может быть лишь конечное число раз¬ личных возможных а. Если р — наименьший из возможных коэффициентов расширения, a q — наибольший, то р w q тако¬ вы, что может быть удовлетворена аксиома 5. Между ними на¬ ходится конечное число дополнительных а. Пример 2. В химической промышленности нас интере¬ сует изготовление соединений Р, Q и R, Мы предполагаем, что основные химикалии имеются в изобилии ив данном рассмотрении стоимостью их можно пренебречь. Но для изготовления соединения Р необходимо иметь в налично¬ сти единицу как Р, так и Q, а для изготовления Q необхо¬ димо иметь Р и R. Соединение R является побочным про¬ дуктом обоих процессов изготовления. Числовые данные таковы: Р Q R Р Q R Тогда Пусть 6 и у= з 2 Тогда
48и Гл. VII*. Применение к бихевиористским проблемам Отсюда мы видим, что при а < 3 для игрока, распоряжаю¬ щегося строками, гарантирована прибыль, а при а > 3 для игрока, распоряжающегося столбцами, гарантирована при¬ быль. Таким образом, случай а = 3 является единственной возможностью. Для этого случая цена игры действительно равна нулю, а векторы х и у являются оптимальными стра¬ тегиями. Последнее видно из того, что все компоненты векторов хМ и Му равны нулю. Таким образом, имеется единственный случай равновесия, а именно при а = (3 = 3. Мы видим также, что смешанная стратегия является единственной. Это означает, что оба процесса должны использоваться с одной и той же интенсивностью. Однако стратегия у не единственна. Вместо нее можно взять стра¬ тегию 1 ’ 0 2 1 1 или у" =. 4 2 3 .0, 4 или любую комбинацию ty' + (1 — t)y'\ 0 < / 1. Наша стратегия у получается при ^ = _з'- Следовательно, воз¬ можны различные структуры цен, приводящие к одному и тому же коэффициенту расширения. Пример 3. Эта «экономика» представляет схематически производство в некотором обществе необходимых предме¬ тов и предметов роскоши. Все товары делятся на два типа, N (необходимые товары) и R (предметы роскоши). Для изготовления N требуются только необходимые товары (по¬ скольку все, что требуется для изготовления необходимых товаров, является необходимым). Для изготовления R мо¬ жет потребоваться сырье обоих типов. Пусть наша эконо¬ мика функционирует следующим образом: NR Изготовление необходимых товаров /1 0\ Изготовление предметов роскоши \0 1/ NR Изготовление необходимых товаров /4 0\ Изготовление предметов роскоши \0 2/ Тогда / 4 — а 0 \ М = В-аА = ( \ —а 2 — а /
§ 10. Существование экономического равновесия 481 Запасшись некоторым терпеньем, можно определить це¬ ны игр с матрицей М для различных значений а, что даст нам кривую, изображенную на фиг. 149. (См. упр. 4.) Сле¬ довательно, а должно лежать между 2 и 4. При а = 4 мы имеем оптимальные стратегии х= (1, 0) и у = ^ ^ удо¬ влетворяющие всем нашим аксиомам, тогда как при а = 2 мы имеем Для промежуточных значений а аксиома 5 не выполняется. (См. упр. 5—7.) Следовательно, возможны два случая равновесия: (1) Общество решает производить только не¬ обходимые товары, и в этом случае производство их будет быстро расти. (2) Установив достаточно высокие цены на предметы роскоши, общество достигает равновесия, при котором производятся товары обоих типов, но от этого заметно снижается коэффициент расширения. Итак, мы получили исчерпывающие ответы на все три во¬ проса, поставленные в конце предыдущего параграфа. Эти от¬ веты дают математическое решение ряда экономических задач. Упражнения 1. В примере 1 проверьте, что при а = 3 цена игры с матрицей М равна 0 и что приведенные х и у являются оптимальными стратегиями. 2. В примере 1 решите (2 X 2)-игры В и —А, т. е. найдите их цены и пары оптимальных стратегий. 3. В примере 1: (a) Покажите, что для каждого ос игра с матрицей М является не строго детерминированной. (b) Найдите цену игры с матрицей М для любого ос. [Отв.: (5 + сс)(3 —а)/(4 + а).] 15 (c) Покажите, что при ос = 0,01 эта цена очень близка к -j-. (d) Покажите, что при ос = 100 эта цена очень близка к —98. (e) Покажите, что при положительном ос эта цена равна нулю тогда и только тогда, когда ос = 3. 4. В примере 3 найдите цену игры с матрицей М для ос= 0, 1, 2, 3, 4, 5 и б. (Указание. Некоторые из этих игр являются строго детерминиро¬ ванными). [Отв.: 1,33; 0,60; 0; 0; —1,00; —2,00.] 5. В примере 3 проверьте, что при ос = 4 приведенные стратегии являются оптимальными и выполняется аксиома 5. 6. В примере 3 проверьте, что при ос = 2 приведенные стратегии являются оптимальными и выполняется аксиома 5.
482 Ул. W/i:. Применение к бихевиористским проблемам 7. В примере 3 найдите для а = 3 единственные оптимальные х и у и пока¬ жите, что аксиома 5 не выполняется. Докажите, что то же самое имеет место для каждого 2 <> < 4. В остальных задачах рассматривается следующая экономика. Имеется четыре товара и пять процессов; матрицы А и В имеют вид 0 0 1 1 0 0 4 2 ' 0 0 2 2 0 0 5 7 0 4 0 2 , в =. 6 5 4 0 2 1 1 0 0 4 0 3 . 0 1 0 2 . .3 0 6 0 . Пусть также л: = ^ , -i-, 0, 0, 0); *' = ^0,0, ^ , 0^; 1 0 3 0 2 1 3 . У = 2 0 1 0 2 8. Проверьте, что А и В удовлетворяют ограничению, сформулированному в начале этого раздела. 9. Найдите М = В —а А. 10. Найдите хМ, х'М, Му и Му'. 11. При каком условии все компоненты вектора х'М положительны? При ка¬ ком условии все компоненты вектора Му' отрицательны? Какие при этом имеются возможности для а ? [Отв/.а < 2; а < 3; 2 а 3.[ 12. Покажите, что для всех остальных возможных значений а цена иг¬ ры с матрицей М равна нулю, а х и у являются оптимальными страте¬ гиями. 13. Покажите, что при наибольшем возможном значении а векторы х и у' дают оптимальные стратегии, удовлетворяющие аксиоме 5. 14. Покажите, что при наименьшем возможном значении а векторы х' и у дают оптимальные стратегии, удовлетворяющие аксиоме 5. 15. Покажите, что если а заключено между двумя его предельными возмож¬ ными значениями, то (a) последние две компоненты вектора хМ положительны и, следова¬ тельно, второй игрок может использовать только две первые свои стратегии; (b) последние три компоненты вектора Му отрицательны и, следова¬ тельно, первый игрок может использовать только две первые свои стратегии; (c) для этих случаев аксиома 5 не выполняется. 16. Процесс номер пять находится в особом положении. Почему? [Отв.: Он никогда не применяется.] 17. Используя результаты упр. 8—16, покажите, что для этой экономики возможны в точности два случая равновесия. Интерпретируйте каждый
§ 10. Существование экономического равновесия 483 случай и укажите разницу между двумя способами функционирования экономики. [Отв.: За счет снижения коэффициента расширения экономика может производить больше различных товаров. Чтобы это имело место, дополнительные виды товаров должны цениться (относительно) очень высоко.] ЛИТЕРАТУРА ДЛЯ ДОПОЛНИТЕЛЬНОГО ЧТЕНИЯ Duncan L. R., Perry A. D., A method of matrix analysis of group struc¬ ture, Psychometrica, 14, 1949, стр 95—116. Estes W. K-, Burke C. J., Application of a statistical model to simple discrimination learning in human subjects, Journ. Exp. Psychol., 50, 1955, стр. 81—88. Буш P. P., M о с т e л л е р Ф., Стохастические модели обучения. М., Физмат- гиз, 1962. Weil A., Sur l’etude de certains types de lois de marriage (Systeme Murngin), в приложении к первой части книги Levi-Strauss С., Les structures elementaire de la parente, Paris, 1949, стр. 278—285. Kemeny J., Morgenstern O., Thompson G. L., A generalisation of the von Neumann model of an expanding economy, Econometrica, 24, 1956, стр. 115—135. К e m e n у J. G., S n e 11 J. L., Finite Markov Chains, Princeton, 1959. Kemeny J. G., Snell J. L., Mathematical Models in the Social Sciences, Boston — New York, 1962.
ОГЛАВЛЕНИЕ От редактора русского издания 5 Предисловие 11 ГЛАВА I. СОСТАВНЫЕ ВЫСКАЗЫВАНИЯ 15 § 1. Цель теории 15 § 2. Простейшие связки 19 § 3. Другие связки 24 § 4*. Высказывания с заданными таблицами истинности 29 § 5. Логические возможности 33 § 6. Деревья логических возможностей 42 § 7. Логические отношения 48 § 8*. Систематический анализ логических отношений 52 § 9. Варианты импликации 57 § 10. Правильные аргументы 60 § 11*. Косвенный метод доказательства 65 § 12*. Применения к переключательным схемам 67 Литература для дополнительного чтения 72 ГЛАВА II. МНОЖЕСТВА И ПОДМНОЖЕСТВА 73 § 1. Введение 73 § 2. Операции над подмножествами 78 § 3. Соотношение между множествами и составными высказываниями 83 § 4*. Абстрактные законы операций над множествами 88 § 5*. Предикаты 90 § 6. Функции 95 § 7. Числовые функции 101 § 8*. Базис пространства логических возможностей 104 § 9*. Кванторы 110 § 10. Двоичные числовые системы 114
Оглавление 485 § 11*. Голосующие коалиции 120 Литература для дополнительного чтения 123 ГЛАВА III. РАЗБИЕНИЯ И СОЧЕТАНИЯ 124 § 1. Разбиения 124 § 2*. Приложения 128 § 3. Число элементов множества 132 § 4. Перестановки . . 137 § 5. Число упорядоченных разбиений 142 § 6. Некоторые свойства чисел 148 § 7. Биномиальная и полиномиальная теоремы 154 § 8*. Вес при голосовании 158 Литература для дополнительного чтения 161 ГЛАВА IV. ТЕОРИЯ ВЕРОЯТНОСТЕЙ 162 § 1. Введение 162 § 2. Свойства вероятностной меры 166 § 3. Симметричная мера 171 § 4*. Два примера, не подкрепляемых интуицией 176 § 5. Условная вероятность 181 § 6*. Меры как площади 190 § 7. Конечные стохастические процессы. Деревья, веса путей и веса ветвей 197 § 8. Три типа стохастических процессов 209 § 9. Независимые испытания с двумя исходами 216 § 10. Биномиальная мера и ее пуассоновская аппроксимация 220 §11. Закон больших чисел 226 § 12*. Проблема выбора решения 231 § 13. Процесс независимых испытаний более чем с двумя исходами . . 238 § 14. Среднее значение 244 § 15. Марковские цепи 251 Литература для дополнительного чтения 258 ГЛАВА V. ВЕКТОРЫ И МАТРИЦЫ 259 § 1. Векторы-столбцы и векторы-строки 259 § 2. Произведение векторов, примеры 264 § 3. Матрицы и их комбинации с векторами 271 § 4. Сложение и умножение матриц 278 § 5. Системы линейных уравнений 287 § 6. Обратная матрица 296 § 7. Применение теории матриц к марковским цепям 301 § 8*. Эргодические марковские цепи 310 § 9*. Дальнейшие примеры марковских цепей 321
486 Оглавление § 10*. Примеры марковских цепей в физике. Энтропия 330 § 11*. Линейные функции и линейные преобразования 341 § 12*. Р-матрицы 345 § 13*. Подгруппы группы перестановок 351 Литература для дополнительного чтения 356 ГЛАВА VI*. ЛИНЕЙНОЕ ПРОГРАММИРОВАНИЕ И ТЕОРИЯ ИГР 357 § 1. Выпуклые множества 357 § 2. Максимумы и минимумы линейных функций 362 § 3. Задачи линейного программирования 367 § 4. Строго детерминированные игры 373 § 5. Не строго детерминированные игры 379 § 6. Матричные игры 387 § 7. Еще о матричных играх: основная теорема 397 § 8. Игры, матрицы которых имеют только две строки или только два столбца 400 § 9. Упрощенный покер 409 Литература для дополнительного чтения 414 ГЛАВА VII*. ПРИМЕНЕНИЕ К БИХЕВИОРИСТСКИМ ПРОБЛЕМ...W 415 § 1. Социометрические матрицы 415 § 2. Коммуникационные сети 423 § 3. Стохастические процессы в генетике 428 § 4. Марковские цепи с поглощением и генетика 435 § 5. Модель обучения Истиза 449 § 6. Предельные вероятности в модели Истиза 453 § 7. Правила бракосочетания в первобытных обществах 458 § 8. Составление правил бракосочетания 463 § 9. Модель расширяющейся экономики 468 § 10. Существование экономического равновесия 476 Литература для дополнительного чтения 483
Док.. К вмени, Док. Снелл, Дж. Томпсон ВВЕДЕНИЕ В КОНЕЧНУЮ МАТЕМАТИКУ Релактор В. В. Гольдберг Художник Н. А. Зарин Технические редакторы Е. //. Шилина и Л. М. Харьковская Корректор Т. А Палладина Сдано в производство 2/V1II 1962 г. Подписано к печати 12/11 1963 г. Бумага 6С х 92*/ь. = 15,3 бум. л. 30,5 печ. л., Уч.-изд. л. 27,7 Изд. № 1/5188 Цена 2 р. 14 к. Зак. № 609 ИЗДАТЕЛЬСТВО ИНОСТРАННОЙ ЛИТЕРАТУРЫ Москва, 1-й Рижский пер., 2 Типография № 2 им. Евг. Соколовой УЦБ и ПП Ленсовнархоза. Ленинград, Измайловский пр., 29