Текст
                    ВВЕДЕНИЕ В ТЕОРИЮ
ВЕРОЯТНОСТЕЙ
И ЕЕ ПРИЛОЖЕНИЯ
ВВЕДЕНИЕ
В ТЕОРИЮ
ВЕРОЯТНОСТЕЙ
И ЕЕ
ПРИЛОЖЕНИЯ


AN INTRODUCTION TO PROBABILITY THEORY AND ITS APPLICATIONS WILLIAM FELLER (1906—1970) Eugene Higgins Professor of Mathematics Princeton University VOLUME I Third Edition Revised Printing John Wiley & Sons New York • Chichester • Brisbane ♦ Toronto 1970
В. ФЕЛЛЕР ВВЕДЕНИЕ В ТЕОРИЮ ВЕРОЯТНОСТЕЙ И ЕЕ ПРИЛОЖЕНИЯ В 2-х томах Том 1 Перевод с пересмотренного третьего английского издания Ю. В. Прохорова с предисловием А. Н. Колмогорова МОСКВА «МИР» 1984 ScanAAW
ББК 22.171 ФЗО УДК 519.21 Феллер В. ФЗО Введение в теорию вероятностей и ее приложения. В 2-х томах. Т. 1: Пер. с англ.—Мл Мир, 1984.—528 с., ил. Перевод первого тома известного курса теории вероятностей, написанного выдающимся американским математиком, выполнен заново с пересмотренного третьего издания. Предыдущие издания (М.: ИЛ, 195 2; М.: Мир, 1964; М. Мир, 1967) быстро разошлись. Первый том содержит изложение той части теории вероятностей, которая имеет дело с дискретными распределениями. Такой отбор материала позво* ляет автору ввести читателя в круг основных идей теории вероятностей без приме* нения сложного аналитического аппарата. Для математиков разных уровней подготовки — от студентов до специалистов по теории вероятностей, для физиков и инженеров, а также для биологов, для кото* рых вероятностные методы являются главными математическими методами. 1702060000-263 041 (01)-84 31-84, ч. 1 ББК 22.171 517.8 Редакция литературы по математическим наукам © Перевод на русский язык, «Мир»,. 1984
ПРЕДИСЛОВИЕ ПЕРЕВОДЧИКА Вниманию читателей предлагается новый перевод двухтомного Курса В. Феллера «Введение в теорию вероятностей и ее приложе- ния». В. Феллер (1906—1970) — один из выдающихся представите- лей современной теории вероятностей — родился в Загребе (Югос- лавия). Математику изучал в Геттингенском университете в Герма- нии, где получил в 1926 г. степень доктора. В 1933 г. покинул Германию. Работал в Копенгагене и Стокгольме и в 1939 г. пере- ехал в США. Профессор Брауновского (1939—1945), Корнеллского (1945—1950) и Принстонского (1950—1970) университетов. Член ряда академий и научных обществ х). Перевод выполнен с последних английских изданий (с пересмот- ренного третьего издания первого тома, 1970, и со второго издания второго тома, 1967). Феллер посвятил созданию, переработке и улучшению курса почти четверть века и делал это с неослабеваю- щим энтузиазмом, никогда не уставая от этого занятия. Ни одна другая книга по теории вероятностей не может сравниться с этой —• так удачно в ней соединены математическая строгость, совершенство доказательств и многочисленность рассматриваемых приложений. Излагая самые сложные математические вопросы, автор не упускает цз виду тех явлений действительности, к которым может быть Применена развиваемая теория. Характер курса таков, что он еще долго не устареет. Воспроизведенные ниже предисловия к прежним изданиям пер- вого тома (как к русским, так и к английским) позволяют мне быть более кратким. В этом томе в целом удачно демонстрируется тот факт, что сравнительно простые модели позволяют хотя бы в пер- вом приближении правильно описать широкий круг практических задач (такими являются, например, модели размещений г шаров по п ящикам и урновые модели). Во многих случаях, особенно там, где интуиция не подсказывает правильного порядка соответствую- х) См. Cramer Н. William Feller.— Rev. Int. Stat. Inst., 1970, v. 38, No. 3# 435—436, а также статьи Doob J. L. William Feller and twentieth century pro- bability и Kac M. William Feller, in memoriam.-— В книге: Proc. Sixth Berkeley Symp. Math. Stat, and Prob,— vol, IL— Berkeley and Los Angeles: Univ, Calif, Press, 1972*
6 Предисловие переводчика щих вероятностей, автор приводит численные результаты. Большое внимание уделено различным приближенным формулам. Их точность иллюстрируется примерами. Используемые при этом рассуждения «типичны для многих предельных теорем теории вероятностей» (с. 122). Весьма полезны (и не только для начинающих читателей) при- веденные в томе результаты «случайных экспериментов», которые создают представление о том, как выглядит «случайность» и сколь неожиданными могут оказаться отклонения от интуитивных пред- ставлений о ней. В связи с результатами случайных экспериментов довольно рано ставится вопрос о способах проверки согласия модели с эк- спериментом и о способах оценки неизвестных вероятностей по данным опыта. Используется критерий %2, упоминается (по конкрет- ному поводу) понятие оценки максимального правдоподобия (с. 66), указываются некоторые критерии случайности. Эта тенденция возможно более раннего показа типичных «статистических выводов», несомненно, целесообразна. Следует отметить, что автор постоянно заботится о приданий терминологии надлежащей точности (см., например, замечание на с. 322 о термине «рекуррентное событие»). Это очень важная сторона дела. Часто начинающие изучать теорию вероятностей запутыва- ются, так как, скажем, слово «событие» на одних и тех же стра- ницах учебников используют и в описательном «донаучном» смысле, и в смысле, предписываемом аксиоматической теорией. Точно так же выражение «произведем п независимых наблюдений случайной величины X» употребляют обычно без упоминания о том, что оно не имеет смысла в аксиоматической теории и служит лишь «разго- ворным вариантом» выражения «рассмотрим п независимых случай- ных величин, имеющих одно и то же распределение вероятностей». Ограничение дискретными пространствами элементарных собы- тий позволяет свести весь используемый аппарат к комбинаторике и к производящим функциям, а в случае, когда последние рацио- нальны, к разложению их на простейшие дроби как методу иссле- дования соответствующих распределений вероятностей. Убедитель- но показана мощь этих методов (гл. Ill, XII — XIV, XVI). В качестве «дефекта» ограничения дискретным случаем автор отмечает, что оно «уменьшает изящество математических рассужде- ний» (с. 211). Можно добавить к этому, что в рамках теории, исполь-
Предисловие переводчика 7 зующей дискретные пространства элементарных событий, оказыва- ется невозможным отразить тесные и важные связи теории вероят- ностей с другими разделами современной математики. «Дискрет- ный подход» позволяет прекрасно объяснить идею независимости, в меньшей степени идею марковской зависимости и совсем остав- ляет в стороне идею «спектрального анализа». При подготовке к изданию перевода первого тома мне оказали большую помощь К. А. Боровков, А. М. Зубков, В. Г. Миранцев, В. В. Ульянов, А. П. Ушакова, В. Г. Ушаков, Н. Г. Ушаков и редактор издательства Г. М. Ильичева. Как и в работе над вторым томом, я пользовался советами А. В. Прохорова и В. В. Сазонова. Им всем я выражаю глубокую благодарность. Москва, август 1983 Ю. Прохоров
ИЗ ПРЕДИСЛОВИЯ КО ВТОРОМУ РУССКОМУ ИЗДАНИЮ Первое издание книги Феллера получило в СССР широкое при- знание. Сейчас вниманию читателей предлагается перевод второго английского издания, во многих деталях усовершенствованного автором. Во втором английском издании книга по-прежнему назы- вается «Введение в теорию вероятностей и ее приложения», пер- вый том двухтомного курса. Так как публикация второго тома вновь откладывается, то в русском издании сохранен подзаголовок [«дискретные распределения» — подзаголовок русского перевода первого издания.— Ю. 77.], указывающий на принцип отбора материала, принятый автором для первого тома своего курса. Именно этот принцип отбора материала позволяет книге Феллера занять самостоятельное место в литературе по теории вероятностей. Ограничиваясь дискретными распределениями, автор имеет возмож- ность достигнуть вполне современной строгости и отчетливости изложения, не выходя за пределы элементарных чисто арифмети- ческих средств, и на твердой теоретической основе довести читателя до ряда важных принципиальных вопросов и большого числа практически интересных задач. Несомненно, что при серьезном систематическом изучении тео- рии вероятностей нельзя оставить в стороне непрерывные распре- деления. Но хорошо известно, что точное определение таких поня- тий, как условная функция распределения F(x| i/)=P(£<x|n=f/) случайной величины £ при заданном значении ч\—у случайной величины т], в случае непрерывных распределений требует трудно воспринимаемых формальных конструкций, что строгое и в то же время общее изложение вопроса о суммировании произвольных независимых случайных величин требует хорошего владения те- орией интеграла Стилтьеса и т. д. Ввиду практической важности непрерывных распределений часто обходятся более элементарными и не всегда строгими средствами. Но именно тем, кто для случая непрерывных распределений ограничится несколько кустарным или не вполне строгим изложением, будет особенно полезно проследить уже с полной отчетливостью параллельное развитие основных веро^
Из предисловия ко второму русскому изданию 9 ятностных идей для дискретного случая. Подробное изучение теории и применений производящих функций целочисленных случайных величин (см. гл. XI книги) является хорошим введением в более трудную и общую теорию характеристических функций произволь- ных случайных величин. Монографическое изучение марковских процессов с конечным или счетным числом состояний, данное в гл. XV—XVII, будет полезно многим читателям, предполагающим впоследствии изучать общую теорию случайных процессов. Более квалифицированный читатель, для которого указанные преимущества первоочередного изучения дискретных распределений не существенны, заинтересуется книгой Феллера по преимуществу просто в качестве собрания большого числа частных задач и про- считанных до получения вполне конкретных результатов примеров. При разборе задач Феллер выдвигает на первый план решение их «прямыми», специфически вероятностными средствами. Эта тенден- ция видеть за аналитическими преобразованиями их «вероятност- ный» смысл принадлежит к числу наиболее ценных сторон книги Феллера. Заслуживает внимания также стремление автора книги на тщательно подобранных примерах наглядно показать характер дей- ствия вероятностных закономерностей. Во многих случаях автору удается ввести читателя в действительно интересные вопросы со- поставления статистических данных с вероятностной теорией явле- ния. 1964 А. Н. Колмогоров
Нейгебауэруr) о et praesidium et dulce decus meum * 2) ПРЕДИСЛОВИЕ К ТРЕТЬЕМУ ИЗДАНИЮ Когда эта книга впервые была задумана (более 25 лет тому назад) немногие математики за пределами Советского Союза виде- ли в теории вероятностей полноправную ветвь математики. Прило- жения имели ограниченные цели, а исследования конкретных проб- лем часто приводили к непостижимым усложнениям. Если учесть эти обстоятельства, то задуманная книга была бы написана не для существовавшей тогда аудитории и не удовлетворяла бы осознанным в то время потребностям. Однако автор надеялся привлечь внимание к мало известным сторонам теории вероятностей, установить связи между отдельными ее частями, развить единые методы и указать на возможные или вероятные приложения. Бла- годаря возрастанию интереса к теории вероятностей книгу неожи- данно часто использовали те, кто работал за пределами математичес- ких дисциплин. Ее широкое применение в те годы объяснимо, ибо принятая в ней точка зрения была новой, а изложенный материал был недоступен иным путем. Но книга остается популярной даже и теперь, когда содержание большей части ее глав можно найти в рабо- тах, посвященных отдельным областям и хорошо приспособленных для удовлетворения более специальных нужд. По этой причине и в новом издании характер книги остался тем же самым. Я надеюсь, что она будет продолжать обслуживать самые разнообразные тре- бования и что по-прежнему найдутся читатели, которые прочтут ее просто для удовольствия и из любознательности. На протяжении многих лет я с благодарностью получал много- численные сообщения от тех, кто пользовался книгой, и эти сообще- ния были причиною различных усовершенствований. Многие пара- графы были переписаны, чтобы облегчить изучение. Процесс чтения облегчен также за счет лучшего шрифта и благодаря превосходной редакторской работе, которую проделала г-жа Мак-Дугал, сохра- нившая сочувствие к требованиям читателей и доводам здравого смысла, несмотря на свою принадлежность к профессиональным редакторам. Наибольшие изменения произведены в гл. III. Вопросы, входя- Отто Нейгебауэр (р. 1899, с 1939 г. в США) — австрийский матема- тик, историк математики и астрономии. На русском языке опубликованы его книги «Лекции по истории античных математических наук. Том I. Догрече- ская математика».— М.— Л.^ ОНТИ, 1937 и «Точные науки в древности». — М., 1968.— Прим, перев, 2) О отрада моя, честь и прибежище! — К Меценату («Славный внук, Ме- ценат»), перевод А. Семенова-Тян-Шанского. — В кн.: Квинт Гораций Флакк. Оды. Эподы. Сатиры. Послания.— М.: Художественная литератураг 1970. — Прим, перев.
Предисловие к третьему изданию 11 щие в эту главу, были включены лишь во второе издание. Практи- ческой причиной этого явилось прежде всего неожиданное открытие, что ее увлекательные выводы можно получить элементарными ме- тодами. Старое изложение опиралось на остроумные комбинаторные соображения, которые теперь заменены более простыми и более естественными вероятностными соображениями. По существу эта глава написана заново. Среди прочих добавлений наиболее заметными являются новые параграфы, посвященные ветвящимся процессам, цепям Маркова и теореме Муавра — Лапласа. Глава XIII перестроена; небольшие изменения сделаны во многих местах книги; появились новые приме- ры и задачи. Я сожалею о том, что именной указатель может ввести в заблуж- дение, но я чувствовал себя обязанным давать точную ссылку каждый раз, когда идея или пример восходили к определенному источнику. Это означало, увы, что цитаты часто берутся из попутных замечаний и поэтому редко отражают истинный характер цитируемой статьи. Кроме того, многие примеры и задачи были навеяны чтением нема- тематических статей, в которых другими методами изучались сход- ные положения. (В написанных позже учебниках при цитировании этих нематематических статей считают, что они содержат мои при- меры. Это показывает, как быстро развивается теория вероятно- стей, но одновременно показывает и ограниченную полезность ци- тат.) Недостаток места и умения помешали мне дать более подроб- ные исторические указания и описать, каким образом теория ве- роятностей от полумистических рассуждений двадцатых годов пере- шла в современное состояние процветания. На протяжении многих лет я имел благоприятную возможность работать со студентами и своими более молодыми коллегами. Я мно- гим обязан их помощи и их воодушевлению. Возможность работать с ними явилась во многих отношениях следствием той поддержки, которую оказывало исследованиям по теории вероятностей, проводя- щимся в Принстонском университете, Научно-исследовательское управление Армии США. Я выражаю особую благодарность Дж. Голдману за серьезный меморандум, описывающий его педагогический опыт, и Л. Питту за преданную помощь при чтении корректур. Июль 1967 Вильям Феллер,
ПРЕДИСЛОВИЕ К ПЕРЕСМОТРЕННОМУ ТРЕТЬЕМУ ИЗДАНИЮ В отличие от первого издания книги третье ее издание содержало тревожащее число неточностей. В настоящем пересмотренном изда- нии все обнаруженные неточности устранены. Многие формулиров- ки улучшены, а также добавлены указания к задачам в тех случаях, когда это не требовало переверстки. Я благодарен издательству, разрешившему сделать эти дорогостоящие изменения, которые направлены к тому, чтобы книга читалась более легко. Почти все изменения были предложены или профессором Р. Ма- холом и доктором Дж. Крофтом, работающими вместе в Чикаго, или подполковником (теперь в отставке) Королевской армии Дании Пребеном Кюлем. Они прочли книгу необычайно внимательно и с глубоким пониманием. Мне была весьма полезна последовавшая в результате этого приятная переписка. Принстон, 1970
ПРЕДИСЛОВИЕ К ПЕРВОМУ ИЗДАНИЮ Первоначально у автора было намерение написать книгу об аналитических методах теории вероятностей, которая трактовала бы эту теорию с точки зрения чистой математики. Изложение при этом было бы более единообразным и поэтому более удовлетвори- тельным в эстетическом отношении; кроме того, оно было бы при- влекательнее для чистых математиков. Однако щедрая поддержка, оказываемая Научно-исследовательским управлением Военно-мор- ских сил США работам по теории вероятностей, ведущимся в Кор- неллском университете, склонила автора к скорее ведущей к успе- ху, но менее благодарной попытке удовлетворить разнородные запросы более широкого круга читателей. Целью этой книги является строгое изложение теории вероят- ностей как самостоятельной математической дисциплины, избегаю- щее нематематических понятий. В то же время автор старался описать эмпирические основания теории вероятностей и развить у читателя ощущение всего многообразия ее приложений. Чтобы достигнуть второй цели, приведены многочисленные задачи, рас- четы и примеры, которые прерывают основной ход изложения. Они четко выделены в тексте и отличаются более образным и менее формальным языком. В книгу включено некоторое количество спе- циальных тем, чтобы показать силу общих методов и сделать книгу более полезной специалистам различных направлений. Чтобы облегчись чтение, отступления (detours) от основного пути отмечены звездочкой. Отмеченные разделы для понимания остальной части текста не обязательны. Автором была предпринята серьезная попытка достичь един- ства методов. Специалисты найдут в книге много упрощений в су- ществующих доказательствах, а также и новые результаты. В част- ности, для нужд этой книги была развита теория рекуррентных со- бытий. Она позволяет по-новому изложить теорию цепей Маркова, что приводит к упрощениям даже в случае конечного числа состоя- ний. Примеры сопровождаются задачами (числом около 340), причем для большей части задач даны полные решения. Некоторые из этих задач — простые упражнения, но в основном они содержат добавоч- ный иллюстративный материал или же так или иначе дополняют текст. Одно из назначений этих примеров и задач — развить вероят- ностную интуицию читателя и его умение формулировать вероятно- стные утверждения. Решение задач, кажущихся трудными, может потребовать совсем незначительных усилий, если их сформулиро- вать естественным образом и включить в надлежащий контекст, а также предпослать им несколько разобранных примеров.
14 Предисловие к первому изданию В преподавании теории вероятностей часто стремятся возможно быстрее сводить вероятностные задачи к задачам математического анализа, забывая при этом особенности самой этой теории. Такой подход основан на негодном определении случайной величины, которое обычно вводится в самом начале. В полную противополож- ность этому настоящая книга построена на понятии пространства элементарных событий. Вводить случайные величины без этого понятия — значит демонстрировать искусство вводить в заблужде- ние. Чтобы отразить истинное положение вещей и избежать при этом теоретико-множественных и других чисто математических трудностей, в этом томе рассматриваются только дискретные про- странства элементарных событий. Это жесткое ограничение, но его будут приветствовать читатели, не являющиеся математиками. Оно позволяет включить в книгу специальные вопросы, которые нелегко найти в литературе, и в то же время дает возможность, начав изло- жение элементарно, почти исчерпывающим образом рассмотреть такие глубокие темы, как теория случайных блужданий и теория цепей Маркова. Общая теория случайных величин и их распределе- ний вероятностей, предельные теоремы, теория диффузионных процессов и некоторые другие темы отложены до следующего тома. Эта книга не могла бы быть написана без поддержки Научно- исследовательского управления Военно-морских сил США. Как одно из следствий этой поддержки возникли постоянные личные контакты с Дж. Л. Дубом; его критические замечания и неизменно одобрительное отношение были неоценимы. Ему я выражаю свою особую благодарность. Затем я благодарю Дж. Риордана, который внимательно прочитал два варианта рукописи. Многие поправки и усовершенствования были предложены моей женой, которая прочи- тала и рукопись, и корректуру книги. Автор обязан также Чжун Кайлаю, М. Донскеру и С. Голдбергу, которые прочитали рукопись и исправили некоторые неточности; решения большинства задач были подготовлены С. Голдбергом. В заключение я благодарю К. Холленбах, которая терпеливо и ис- кусно перепечатала рукопись, а также Е. Ельяша, В. Хоффмана и Дж. Р. Кинни за помощь при чтении корректур. Корнеллский университет Январь 1950 г. Вильям Феллер
КАК ПОЛЬЗОВАТЬСЯ ЭТОЙ КНИГОЙ *) В изложении имеется много отступлений, и оно не всегда идет от простого к сложному; сравнительно трудные с формальной точки зрения разделы встречаются в самом начале, а совсем легкие — в гл. XV и XVII. Неискушенный читатель отнюдь не должен сле- дить за многочисленными побочными линиями, иначе он за деревья- ми не увидит леса. Вводные замечания к главам книги и звездочки, которыми помечены заголовки отдельных параграфов, должны облегчить ориентацию и выбор пропускаемых читателем разделов. Не помеченные звездочками разделы образуют единое целое, и для их понимания остальные разделы не нужны. Первоначальное введение в основные понятия теории вероятно- стей содержится в главах I, V, VI, IX; начинающему следует изучить их с наименьшим возможным числом пропусков. Глава II предназначена для развития у читателя технических навыков и вероятностной интуиции; некоторое знакомство с ее содержани- ем желательно, но нет нужды изучать ее систематически: предпоч- тительнее, быть может, в дальнейшем возвращаться к этим простым иллюстрациям по мере надобности. Для первоначального ознаком- ления с элементарной теорией непрерывных распределений требу- ются лишь весьма немногие дополнительные разъяснения (соответ- ствующий материал содержат элементарные главы тома 2). Во вводном курсе можно от гл. IX сразу перейти к гл. XI, в которой Производящие функции рассматриваются по образцу более общих преобразований. За гл. XI должны следовать какие-либо приложения из гл. XIII (рекуррентные события) или из гл. XII (цепные реакции, безгранично делимые распределения). Не исполь- зуя понятия производящей функции, можно двигаться в одном из следующих направлений: предельные теоремы и теория флуктуаций (гл. VIII, X, III); стохастические процессы (гл. XVII); случайные блуждания (гл. III и основная часть гл. XIV). Главы, посвященные каждому из этих направлений, почти независимы одна от другой. Хотя теория цепей Маркова (гл. XV) опирается на понятия и факты теории рекуррентных событий, но ее можно изучать и независимо, если читатель пожелает принять без доказательства основную эрго- дическую теорему. Глава III стоит в стороне от остальных глав. Ее содержание привлекательно само по себе, но, кроме того, она в высшей степени показательна с точки зрения новых взглядов и новых методов х) Этот раздел отсутствовал в двух первых английских изданиях (во вто- ром английском издании соответствующие указания были включены в преди- словие автора)в—Прим, перев,
16 Как пользоваться этой книгой теории вероятностей. Результаты, касающиеся флуктуаций, возни- кающих при последовательных бросаниях монеты, демонстрируют, что широко распространенные представления о действии закона больших чисел обманчивы. Эти результаты поразительны и резко расходятся с обычными представлениями; даже искушенные люди сомневались в том, что монеты в действительности ведут себя столь «неправильно», как предсказывает теория. Именно поэтому в § 6 включены результаты моделирования. Эта глава рассматривает лишь простейшую схему — бросание монеты, однако полученные выводы представительно отражают и значительно более общую ситуацию. Знак ► указывает на завершение доказательства или на конец серии примеров. Автор надеется, что подробный указатель поможет читателю сог- ласовать при работе с книгой различные ее разделы.
ВВЕДЕНИЕ ПРИРОДА ТЕОРИИ ВЕРОЯТНОСТЕЙ § 1. ИСХОДНЫЕ ПРЕДСТАВЛЕНИЯ Теория вероятностей — математическая дисциплина, родствен- ная таким дисциплинам, как, например, геометрия или теоретиче- ская механика. В каждой дисциплине мы должны заботиться о раз- личении трех сторон теории: а) формального логического содер- жания, б) интуитивных представлений, в) приложений. Не рас- сматривая этих трех сторон в их взаимосвязи, нельзя правильно оценить отличительные черты теории в целом и ее привлекатель- ность. а. Формальное логическое содержание С точки зрения аксиоматического подхода математика занима- ется исключительно соотношениями между неопределяемыми объек- тами. Эту сторону дела хорошо поясняет пример игры в шахматы. Невозможно «определить» шахматы иначе, как сформулировав систему правил игры. Можно до некоторой степени описать услов- ную форму фигур, но не всегда ясно, например, какая из них явля- ется королем. Шахматная доска и фигуры полезны, но можно обой- тись и без них. Суть дела состоит в том, как ходят и действуют фи* гуры, и бессмысленно говорить об «определении» или «истинной природе» пешки или короля. Аналогично этому геометрия не беспокоится о том, чем «на самом деле» являются точки и прямые. Они остаются неопределяе- мыми понятиями, и аксиомы геометрии лишь устанавливают связи между ними: две точки определяют прямую и т. п. Это «правила игры», и в них нет ничего неприкосновенного. Различные геометрии основаны на различных системах аксиом, и логическая структура каждой из неевклидовых геометрий не зависит от ее отношения к действительности. Физики исследовали движение тел в предполо- жении, что закон тяготения имеет форму, отличную от открытой Ньютоном, и такое изучение имеет смысл, даже если считать, что в природе действует закон Ньютона. б. Интуитивные представления В отличие от шахматных правил аксиомы геометрии и теоре- тической механики опираются на интуитивные представления. В самом деле, геометрическая интуиция столь сильна, что склонна опережать логическое рассуждение. Вопрос о том, до какой степени
18 Введение. Природа теории вероятностей 4 взаимозависимы логика, интуиция и физический опыт,— это проб- лема, в которую нам незачем вникать. Несомненно, что интуицию можно совершенствовать упражнениями и развивать. Теряющийся в шахматной игре новичок делает ходы осторожно, вспоминая от- дельные правила, в то время как опытный игрок с одного взгляда оценивает сложную позицию и не может объяснить свою интуицию разумными доводами. Подобным же образом и математическая интуи- ция растет вместе с опытностью, и можно развить, скажем, интуитив- ное восприятие соотношений в четырехмерном пространстве. Создается впечатление, что и общая интуиция человечества усиливается. Ньютоновские понятия поля сил и действия на рас- стоянии, а также максвелловская идея электромагнитных волн сна- чала открыто осуждались и считались «невообразимыми» и «про- тиворечащими интуиции». Современная техника и радиоприемники в домах сделали эти понятия столь распространенными, что они стали частью повседневного словаря. Аналогично этому современный студент не в состоянии оценить способы рассуждений, предрассудки и прочие трудности, с которыми приходилось бороться теории ве- роятностей в первое время ее существования. В наши дни газеты сообщают о выборочных обследованиях общественного мнения, и ма- гия статистики охватывает все стороны жизни в такой степени, что молодые девушки следят за статистикой, оценивая свои шансы выйти замуж. Поэтому каждый приобретает интуитивное представ- ление о смысле таких утверждений, как «за это событие — три шанса из пяти». Эта интуиция (хотя и расплывчатая) является достаточной предпосылкой для первых шагов. Она будет развиваться по мере изучения теории и ознакомления с некоторыми весьма непростыми ее приложениями. в. Приложения В приложениях геометрии и теоретической механики теоретиче- ские понятия отождествляются с некоторыми физическими объекта- ми, но способ этого отождествления гибок и меняется от случая к случаю, так что нельзя дать общих правил. Понятие твердого тела — одно из основных и полезных понятий теоретической механики, и все же ни один физический объект не является твердым. Можно ли данное тело рассматривать как твердое, зависит от обстоятельств и требуемой точности приближения к действительности. Резина не может быть примером твердого тела, однако, обсуждая движение автомобиля по льду, учебники обычно рассматривают резиновые покрышки как твердое тело. В зависимости от целей теории мы можем пренебрегать атомной структурой вещества; мы можем также рассматривать Солнце то как шар из непрерывного вещества, тй как материальную точку. В приложениях абстрактные модели служат лишь орудием, и од- но и то же явление, наблюдаемое опытным путем, могут описывать различные модели. Способ применения математических теорий не
§2. Способ изложения 19 обусловливается какими-либо заранее сложившимися мнениями; это направленное к определенной цели умение, зависящее от опытности и меняющееся вместе с ней. Вполне уместен философский анализ этого умения, но такой анализ находится вне области математики, физики или статистики. Философское рассмотрение оснований тео- рии вероятностей должно быть отделено от математической теории вероятностей и математической статистики в такой же мере, как рассмотрение наших интуитивных представлений о пространстве отделяется теперь от геометрии. § 2. СПОСОБ ИЗЛОЖЕНИЯ История теории вероятностей (и математики вообще) свидетель- ствует о стимулирующем взаимодействии теории и ее приложений: достижения теории открывают новое поле приложений, а приложе- ния в свою очередь приводят к новым проблемам и плодотворно влияют на направление исследований. В настоящее время теорию Вероятностей применяют во многих далеких друг от друга областях, и общая теория должна быть достаточно гибкой, чтобы разработать средства подхода ко множеству разнообразных проблем. Мы долж- ны противостоять соблазну (к которому присоединяется давление обстоятельств) разработать теорию, терминологию и математический аппарат, слишком приближая их к какой-либо одной частной обла- сти приложений. Вместо этого мы намерены развить общую теорию, родственную тем, которые привели к успеху геометрию и теоретиче- скую механику. Мы начнем с простейших опытов, таких, как бросание монеты или игральной кости, где все утверждения имеют очевидный инту- итивный смысл. Эти интуитивные соображения будут переведены на язык некоторой абстрактной модели, которая будет обобщаться по- степенно, шаг за шагом. Иллюстративные примеры будут объяснять эмпирические предпосылки теории и развивать интуицию читателя, но сама теория будет иметь математический характер. будем пытаться объяснить «истинный смысл» вероятностей не больше чем современный физик останавливается на «действительном смысле» массы и энергии или геометр объясняет природу точки. Вместо этого мы будем доказывать точные теоремы и приводить примеры их применения. История показывает, что первоначально теория вероятностей развивалась для описания очень ограниченного круга опытов, свя- занных с азартными играми, и основные усилия были направлены на вычисление определенных вероятностей. В соответствии с этим и мы в нескольких первых главах вычислим некоторые типичные вероятности. При этом следует иметь в виду, что вовсе не отыскание этих численных значений вероятностей является целью общей тео- рии. Объектом последней является раскрытие общих законов и за-
20 Введение. Природа теории вероятностей висимостей, а также построение абстрактных моделей, которые могут в удовлетворительной степени описывать физические явления* Вероятности играют для нас ту же роль, что и массы в теоре- тической механике: можно обсуждать движение планетной системы, не зная масс отдельных планет и не рассматривая методов их дей- ствительного измерения. Можно также с пользой (для проясне- ния сути дела) изучать гипотетическое движение несуществующей планетной системы. Точно так же и вероятностные модели могут быть полезны даже в том случае, когда они описывают объекты, кото- рые не могут наблюдаться или не заслуживают наблюдения. Напри- мер, миллиарды долларов вкладывают в развитие систем автомати- ческой телефонной связи. При этом используют простые вероятност- ные модели, позволяющие сравнивать различные осуществимые системы. Лучшая в соответствии с этой теорией система принима- ется, другие же никогда не будут реализованы. Аналогично в стра- ховом деле теорию вероятностей используют для подсчета вероят- ности разорения страховой компании. На этой основе теория дает рекомендации, как избежать определенных нежелательных ситуа- ций, которые в результате никогда не будут наблюдаться. Теория вероятностей была бы действенной и полезной, даже если было бы нелегко найти хотя бы один численный результат* § 3. «СТАТИСТИЧЕСКАЯ» ВЕРОЯТНОСТЬ Успех современной математической теории вероятностей при- обретен следующей ценой: теория ограничивается лишь одной сто- роной «случайности». Интуитивное понятие вероятности связано с индуктивными умозаключениями и суждениями вроде следующих: «Павел, вероятно, счастливый человек», «вероятно, эта книга будет неудачной», «гипотеза Ферма, вероятно, ошибочна». Суждения такого рода интересны философам и логикам и являются также законным объектом математической теории х). Следует подчеркнуть, однако, что мы будем иметь дело не с модальностями индуктивных умозаключений, а с тем, что может быть названо физической или статистической вероятностью. Грубо говоря, мы можем охаракте- ризовать это понятие, сказав, что наши вероятности относятся не к мнениям, а к возможным исходам мыслимого эксперимента. Прежде чем говорить о вероятностях, мы должны условиться насчет идеали- зированной модели рассматриваемого мыслимого эксперимента, подобного бросанию монеты, составлению выборки из совокупности кенгуру, обитающих на Луне, наблюдению движения частицы при х) Koopman В. О., The axioms and algebra of intuitive probability, Ann, of Math., 41 (1940), 269—292; The bases of probability, Bull. AMS, 46 (1940), 763—774. В качестве современного курса, основанного на понятии субъективных вероятностей, можно рекомендовать Savage L. J., The foundations of statistics^ New York, John Wiley, 1954*
$ 4. Резюме 21 ь. диффузии или подсчету числа телефонных вызовов. С самого начала мы должны условиться о том, что представляют собой возможные исходы такого эксперимента (их совокупность будет нашим простран- ством элементарных событий г)) и каковы соответствующие им ве- роятности. Это аналогично обычному образу действий в теоретиче- ской механике, когда вводят воображаемую модель, включающую две, три или семнадцать материальных точек, и эти точки лишаются своих индивидуальных свойств. Подобным же образом, анализируя результаты бросаний монеты в игре, мы отвлекаемся от несуществен- ных черт реального опыта и принимаем в качестве объекта нашей теории последовательности символов типа «герб, герб, решетка, герб,...». В нашей системе нет места для догадок о вероятности того, что завтра взойдет Солнце. Прежде чем говорить о такой вероятно- сти, мы должны были бы условиться о (идеализированной) модели опыта, описание которой предположительно начиналось бы такз «случайным образом выбирается один из бесконечного множества миров...». Для того чтобы построить такую модель, не требуется особого воображения, но она представляется и неинтересной, и не- значительной. Астрономы говорят об измерении температуры в центре Солнца или о путешествии на Сириус. Эти действия кажутся невозможны- ми, и все-таки размышления о них не бессодержательны. По таким же причинам мы не будем беспокоиться о том, выполним или нет наш мыслимый эксперимент; мы будем анализировать абстрактные модели. В глубине нашей души мы сохраняем интуитивное истолко- вание смысла вероятности, и это истолкование в ряде приложений приобретает и практическое значение. Мы представляем себе экспе- римент, выполняемый очень много раз. Следует ожидать, что со- бытие, имеющее скажем, вероятность 0,6, будет происходить с ча- стотой шестьдесят случаев из ста. Это описание умышленно неопре- деленно, но оно создает образные интуитивные представления, достаточные для некоторых более простых приложений. По мере развития и усложнения теории практическое истолкование вероят- ности и интуитивное представление о ней будут принимать более определенные формы» § 4. РЕЗЮМЕ Мы будем иметь дело с теоретическими моделями, в которые вероятности входят в качестве свободных параметров, подобно мас- сам в теоретической механике. Эти модели применяют многими способами, которые также подвержены изменению. Умение приме- нять теорию и интуиция развиваются одновременно с развитием теории. х) В оригинале sample space, т. е. пространство, образуемое возможными результатами выборки (см. пример гл. I, 2, г)). Подробное разъяснение тер- минологии можно найти в гл. 25 книги Крамер Г. Математические методы статистики, -2-е изд,—M,i Мир, 1975,— Прим, перев.
22 Введение. Природа теории вероятностей Это обычный путь, принятый и в других математических дисцип- линах и оказавшийся плодотворным. Никто не предложил другого пути, который мог бы в достаточной мере удовлетворить все разнооб- разные нужды и потребности как растущего организма, называемого теорией вероятностей, так и приложений этой теории. Можно сетовать на то, что интуитивное понятие вероятности недостаточно для научной теории, но это исторический факт. В примере гл. I, 6, б) мы исследуем случайное размещение частиц по ячейкам. Соответствующее «естественное» распределение вероятно- стей представлялось совершенно очевидным каждому и прини- малось без колебаний физиками. Однако оказалось, что физические частицы не обладают «здравым смыслом», и «естественное» распре- деление Больцмана пришлось в одних случаях заменить на распре- деление Бозе — Эйнштейна, а в других — на распределение Фер- ми — Дирака. Не существовало никаких интуитивных доводов, почему фотоны ведут себя иначе, чем протоны и почему частицы обоих типов не подчиняются «априорным» законам. Если бы теперь и уда- лось обосновать эти факты, то это свидетельствовало бы только о том, что интуиция развивается вместе с теорией. Во всяком случае, даже для приложений существенны свобода и гибкость теории, и было бы пагубной ошибкой сковывать ее слишком жесткими ограничениями. Утверждали также, что современная теория вероятностей слиш- ком абстрактна и слишком обща, чтобы быть полезной. Столь же воинственный крик поднимался в свое время практически мысля- щими людьми против максвелловской теории поля. Чтобы опроверг- нуть эти доводы, достаточно было бы указать на неожиданные новые применения, появившиеся благодаря абстрактной теории случайных процессов или на новые достижения современной теории флуктуаций, которые противоречат наивной интуиции и приводят к пересмотру некоторых практических рекомендаций. Однако этот спор просто бесполезен: осуждать слишком легко. Те вещи, которые стали сегодня практически важными, еще вчера порицались как непрактичные, и теории, которые станут практически важными завтра, практические люди сегодняшнего дня всегда будут клеймить и называть ничего не стоящей абстрактной игрой. § 5. ИСТОРИЧЕСКИЕ ЗАМЕЧАНИЯ Статистический или эмпирический подход к вероятности был развит главным образом Фишером х) и Мизесом * 2). Понятие прост- х) Фишер Роналд Эймлер (Fisher R. А.; 1890—1962) — английский стати- стик и генетик, один из основателей математической статистики и математической популяционной генетики. В русском переводе издана книга Фишер Р. Э. Стати- стические методы для исследователей.— М.: Статиздат, 1958.— Прим, перев* 2) Мизес Рихард (von Mises R.; 1883—1953) — немецкий математик и меха- ник. Основные работы относятся к теории вероятностей, гидродинамике и при- кладной механике. В 1933 г, эмигрировал из Германииг с 1939 г. жил в США,—• Прим, переев
§ 5. Исторические замечания 23 ранства элементарных событий х) идет от Мизеса. Это понятие сделало возможным построение строгой математической теории вероятностей на основе теории меры. Такой подход развивался постепенно в течение 20-х годов под влиянием многих авторов. Аксиоматический подход на современном уровне был разработан А. Н. Колмогоровым * 2). Мы будем следовать этому направлению, хотя термин «аксиоматическое построение», может быть, звучит слишком торжественно, ибо в этом томе речь идет только о простом случае дискретных вероятностей.. х) Немецкий термин Merkmalraum (пространство меток). Основной курс Мизеса Wahrscheinlichkeitsrechnung появился в 1931 г. Обновленный вариант (изданный и дополненный Хильдой Гейрингер) опубликован в 1964 г. под назва- нием Mathematical theory of probability and statistics, New York, Academic Press. Философские взгляды Мизеса получили наибольшую известность благо- даря его более ранней книге, изданной в 1928 г. (пересмотренное X. Гейрингер издание Probability, statistics and truth, London, Macmillan, 1957). [Имеется русский перевод издания 1928 г.: Мизес Р. Вероятность и статистика / Под ре- дакцией и с предисловием А. Я. Хинчина.— М. — Л.: ГИЗ, 1930.— Перев.} 2) Колмогоров А. Н., Основные понятия теории вероятностей.— М.— Л.: ОНТИ, 1936,— 2-е изд.— М.: Наука, 1974; первоначальное издание — Grund- begriffe der Wahrscheinlichkeitsrechnung, Berlin, Springer, 1933,
ГЛАВА I ПРОСТРАНСТВА ЭЛЕМЕНТАРНЫХ СОБЫТИЙ § 1. ЭМПИРИЧЕСКИЕ ОСНОВАНИЯ Математическая теория вероятностей приобретает практическую ценность и наглядный смысл в связи с такими действительными или мыслимыми опытами, как, например, бросание монеты сто раз, бросание трех игральных костей, сдача колоды карт, сопоставление двух колод карт, игра в рулетку, наблюдение продолжительности существования радиоактивного атома или жизни человека, выбор наудачу некоторой группы людей и подсчет среди них числа левшей, скрещивание двух сортов растений и наблюдение фенотипов потом- ков. Сюда же относятся такие явления, как пол новорожденных, колебание числа занятых междугородных линий на телефонной станции или числа телефонных вызовов, наличие случайных шумов в системах связи, результаты выборочного контроля качества про- мышленной продукции, непостоянство частоты несчастных случаев, а также числа двойных звезд на различных участках неба или поло* жения частицы при диффузии. Пока описание всех этих явлений довольно неопределенно, и чтобы придать теории точный смысл, мы должны условиться о том, что мы понимаем под возможными исходами рассматриваемого опыта или наблюдения. При бросании монеты не обязательно выпадает герб или решет- ка; монета может куда-нибудь закатиться или встать на ребро.Тем не менее мы условимся рассматривать герб и решетку как един- ственно возможные исходы бросания монеты. Это соглашение упро- щает теорию и не сказывается на возможностях ее применения* Идеализация подобного рода проводится постоянно. Невозможно безошибочно измерить продолжительность существования какого- либо атома или время жизни какого-либо лица; однако в теоретичес- ких исследованиях целесообразно считать эти величины точными числами. Но при этом возникает вопрос: какие числа могут и какие не могут представлять продолжительность жизни человека? Су-* ществует ли максимальный возраст, сверх которого жизнь невозмож? на, или для возрастов возможны любые значения? Мы, конечно, не решимся допустить, что человек может дожить до 1000 лет, и тем не менее обычная практика страхового дела не принимает никакой границы для продолжительности жизни. В соответствии с формула- ми, на которых основаны современные таблицы смертности, доля лю- дей, доживающих до 1000 лет, имеет величину порядка единицы, деленной на 1О1оЭ6»— числа, начинающегося с 1027 миллиардов ну-
§ 7. Эмпирические основания 25 лей. Это утверждение лишено смысла с точки зрения биологии или социологии, но если его рассматривать исключительно с точки зре- ния статистики, то оно не противоречит опыту. В течение столетия рождается менее чем 1010 людей, и чтобы статистически опровергнуть приведенное выше утверждение, потребовалось бы более чем 1О1о3а столетий, что превышает возраст земного шара более чем в 101()34 раз. Очевидно, столь исключительно малые вероятности совместимы с нашим представлением о невозможности. Можно было бы подумать, что их употребление является полным абсурдом; в дей- ствительности оно совершенно безвредно и приводит к упрощению многих формул. Кроме того, если бы мы решили всерьез исключить возможность дожить до 1000 лет, то мы должны были бы допустить существование максимального возраста. А право же, предположе- ние, что можно дожить до х лет, но нельзя прожить х лет и две секунды столь же непривлекательно, как и представление об отсут- ствии границы для продолжительности жизни. Любая теория обязательно предполагает некоторую идеализа- цию. Мы начинаем ее с возможных исходов «опыта» или «наблюде- ния». Если мы хотим построить абстрактную модель опыта, то мы должны сначала установить, что представляют собой возможные исходы идеализированного опыта. Для единства терминологии результаты опытов или наблюдений будут называться событиями. Так мы будем говорить о событии, которое состоит в том, что из пяти брошенных монет более трех вы- пали гербом вверх. Аналогично «эксперимент», состоящий в сдаче карт для игры в бридж х), может иметь своим результатом «событие», заключающееся в том, что игрок «Север» получил два туза. Состав выборки («среди выбранных 85 людей — двое левшей») и результат измерения («температура 120°», «семь междугородных линий сво- бодны») будут также называться событиями. Мы будем различать составные (или разложимые) события и эле- ментарные (или неразложимые) события. Например, сказать, что сумма очков, выпавших при бросании двух игральных костей, равна шести, все равно что сказать, что произошло событие «(1, 5), или (2, 4), или (3, 3), или (4, 2), или (5, 1)», и это перечисление раз- лагает событие «сумма очков равна шести» на пять элементарных событий. Аналогично этому событие «выпали две грани с нечетным числом очков» допускает разложение «(1, 1), или (1, 3), или . . . х) Определение бриджа и покера. Колода карт для игры в бридж состоит из 52 карт, которые делятся на четыре равные группы по масти. Карты каждой ма- сти различают по значению. Имеется 13 значений (2, 3, . . ., 10, валет, дама, ко- роль, туз). Четыре масти называются: пики, трефы, червы и бубны. Две последние масти — красные, две первые — черные. Карты одного значения называют од- нотипными. Для нас игра в бридж означает сдачу колоды карт четырем игрокам (которых мы будем называть «Север», «Юг», «Восток» и «Запад» и для краткости обозначать N, S, Е, W [первые буквы слов North, South, East, West.— Перев.]\ по 13 карт каждому. Игра в покер означает по определению выбор пяти карт из колоды,
26 Гл. I. Пространства элементарных событий' или (5, 5)» на девять элементарных событий. Заметим, что если в результате нашего эксперимента мы получили (3, 3), то одни и те же бросания привели и к событию «сумма очков равна шести», и к со- бытию «выпали две грани с нечетным числом очков». Эти события не являются взаимно исключающими и поэтому могут происходить одновременно. В качестве второго примера рассмотрим возраст человека. Каждое частное значение х представляет элементарное событие, тогда как утверждение о том, что данному человеку пошел шестой десяток, описывает составное событие «50 < х < 60». Итак, каждое составное событие может быть разложено на элементарные события; иначе говоря, составное событие есть совокупность элемен- тарных событий. Если мы хотим говорить об «опытах» и «наблюдениях» в рамках нашей теории и без каких бы то ни было неясностей, то мы должны прежде всего условиться, каковы элементарные (неразложимые далее) события, представляющие собой мыслимые исходы опыта или наблюдения; они определяют идеализированный опыт (заметим, что термин «элементарное (или неразложимое) событие» остается столь же неопределенным, что и термины «точка» или «прямая» в геомет- рии). По определению каждый неразложимый исход (идеализирован- ного) опыта представляется одним и только одним элементарным событием. Совокупность всех элементарных событий будем называть пространством элементарных событий г), а сами элементарные со- бытия — точками этого пространства. Все события, связанные с данным (идеализированным) опытом, могут быть описаны как совокупности элементарных событий. Прежде чем формализовать это основное соглашение, мы обсу- дим несколько типичных примеров, которые будут играть опреде- ленную роль и в дальнейшем. § 2. ПРИМЕРЫ а) Размещение трех шаров по трем ящикам. Табл. 1 содержит все возможные исходы «опыта», состоящего в размещении трех ша- |)ов по трем ящикам. Каждое из этих размещений представляет неразложимый исход эксперимента, т. е. элементарное событие. Событие А «существует ящик, содержащий не менее двух шаров», происходит при размеще- ниях с номерами 1—21, и мы выражаем это, говоря, что событие А есть множество элементарных событий 1—21. Аналогично этому событие В «первый ящик не пуст» можно описать как множество то- чек (элементарных событий) 1, 4—15, 22—27. Событие С «произо- шло и А, и В» есть множество, состоящее из тринадцати элементар- ных событий (1, 4—15). При выбранных А и В оказывается, что каждая из 27 точек принадлежит или А, или В (или одновременно См. примечание на cs 21.— Прим,, перев^
§ 2. Примеры 21 Таблица 1 1. 2. {а6с| — | } { — |а&с| — } 10. {а 1 и-} |а с| —} 19. { — fa | be} 11. { ь 20. { — | b \а с} 3. { - 1 - labc] 12. { с \ab | — } 21. {- | c\ab } 4. {ab | с|—} 13. {а 1 — 1 Ьс} 22. {« 1 ь | с} 5. {а с] Ь | — } 14. { ъ 1 — 1а с} 23. {а 1 с\ Ь } 6. { Ьс\а | — } 15. { с 1 — \ab } 24. { b |а I с} 7. {ab | — | с} 16. {- \ab | с) 25. { b 1 с\а } 8. {а с| — | 6 } 17. {- \а с| Ъ } 26. { с| \а 1 Ъ } 9. { *с| — ]а } 18. {- | Ьс\а } 27, { с 1 Ь |а }. и Л, и В); поэтому событие «произошло или Л, или В, или одновре- менно и А и В» совпадает со всем пространством элементарных событий и происходит с абсолютной достоверностью. Событие D «4 не произошло» состоит из точек 22—27 и может быть описано усло- вием, что нет пустых ящиков. Наконец, событие «первый ящик пуст, и не существует ящика, содержащего более одного шара», невозмож- но (не может произойти), так как не существует элементарных собы- тий, удовлетворяющих этим условиям. б) Размещение г шаров по п ящикам. Более общий случай разме- щения г шаров по п ящикам может быть рассмотрен аналогичным образом, однако число возможных исходов эксперимента быстро возрастает с ростом г и п. Для г=3 шаров и п=4 ящиков соответ- ствующее пространство элементарных событий состоит уже из 81 точки, а для г=лг=10 это число точек равно 1010; полная таблица заняла бы примерно сто тысяч больших томов. Мы воспользуемся примером, чтобы разъяснить тот важный факт, что природа пространства элементарных событий не играет роли для нашей теории. Для нас это пространство (вместе с заданным на нем распределением вероятностей) определяет идеализированный эк- сперимент. Мы пользуемся образным языком шаров и ящиков, но то же самое пространство допускает большое число интерпретаций. Чтобы пояснить нашу точку зрения, а также для удобства дальней- ших ссылок мы приведем ряд схем, внешне весьма различных, но по существу эквивалентных абстрактной схеме размещения г шаров по п ящикам в том смысле, что соответствующие исходы отличаются лишь словесным их описанием. Вероятности, приписываемые эле- ментарным событиям, могут при этом быть различными в различных примерах, и эта сторона дела будет обсуждаться впоследствии. (6.1) Дни рождения. Распределение дней рождения г человек соответствует размещению г шаров по п=365 ящикам (полагаем, что в году 365 дней). (6.2) Несчастные случаи. Разделение несчастных случаев на груп- пы по дням недели, в которые они происходят, равносильно разме-, щению г шаров по п=7 ящикам.
28 Гл. J. Пространства элементарных событий' (б.З) При стрельбе по п мишеням пули соответствуют шарам, мишени — ящикам. (6.4) Выборочное обследование. Пусть группа из г человек разби- вается на классы, скажем, по возрасту или по профессии. Классы играют роль ящиков, люди — шаров. (6.5) Облучение в биологии. Когда сетчатка глаза подвергается воздействию света, кванты света играют роль шаров, а клетки сетчатки соответствуют ящикам. Аналогично при исследовании гене- тического эффекта облучения хромосомы соответствуют ящикам, а а-частицы — шарам *). (6.6) При экспериментах с космическими лучами частицы, попа- дающие в сетчики Гейгера, играют роль шаров, а сами счетчики — ящиков. (6.7) Лифт отправляется с г пассажирами и останавливается на п этажах. Распределение пассажиров по группам в зависимости от этажа, на котором они выйдут, соответствует размещению г шаров по п ящикам. (6.8) Игра в кости. Возможному исходу эксперимента, состоя- щего в бросании г игральных костей, соответствует распределение г шаров по п=6 ящикам. Если бросают монеты, то имеют дело с п=2. (6.9) Случайные цифры. Каждой последовательности из г слу- чайных цифр соответствует размещение г шаров (десятичных разря- дов) по п=10 ящикам с номерами 0, 1, 2, . . ., 9. (б. 10) Распределение г человек по признаку пола. В этом случае имеется п=2 ящика и г шаров. (б. 11) Собирание купонов* 2). Различные типы купонов соответ- ствуют ящикам, все собранные купоны — шарам. (6.12). Распределение тузов между игроками при игре в бридж. Четыре игрока соответствуют четырем ящикам, четыре туза — шарам. (6.13) Распределение генов. Каждый потомок некоторой особи (человека, животного или растения) наследует определенные гены родителя. Если некоторый ген может находиться в одной из п форм Лх, . . ., Ап, то потомков можно классифицировать по формам данного гена. Потомки особи соответствуют шарам, генотипы At, ... ♦ .., Ап — ящикам. (6.14) Химические реакции. Предположим, что молекулярные цепочки некоторого полимера взаимодействуют с кислородом. Каж- дая цепочка может прореагировать с 0, 1, 2, . . . молекулами х) Здесь (как и в других примерах, связанных с генетикой) используется тер- минология, принятая в книге Мюнтцинг А. Генетика. Общая и прикладная.— М.: Мир, 1967.— Прим, перев. 2) Под купоном здесь понимается торговый ярлык, фирменная обертка, этикетка или аналогичное свидетельство сделанной покупки. Некоторое количе- ство собранных купонов дает право на известные льготы при приобретении то- варов.— Прим, перев.
§2. Примеры 29 кислорода. Реагирующие молекулы кислорода играют роль шаров, а цепочки полимера — роль ящиков, в которых размещают шары* (6.15) Теория светочувствительных материалов. Фотографичес- кая пластинка покрыта слоем светочувствительных зерен, причем каждое зерно реагирует, если в него ударяется определенное число г квантов. Для теории черно-белой фотографии важно знать число прореагировавших зерен (т. е. тех, в которые попало г квантов). В этом случае мы получаем типичную задачу о размещении, где зерна эмульсии соответствуют ящикам, а кванты света — шарам. (В действительности дело обстоит сложнее, так как пластинка обычно бывает покрыта зернами различной чувствительности.) (6.16) Опечатки. Возможные распределения г опечаток в книге, содержащей п страниц, соответствуют размещениям г шаров по п ящикам, если только г меньше, чем число печатных знаков на стра- нице. в) Случай неразличимых шаров. Вернемся к примеру а) и пред- положим теперь, что все три шара одинаковы. Это означает, что мы больше не делаем различия между такими размещениями, как 4, 5, 6 и т. п. В этом случае табл. 1 сводится к табл. 2, которая опреде- ляет новое пространство элементарных событий. Соответствующий мыслимый эксперимент мы назовем размещением трех неразличимых шаров по трем ящикам. Аналогичные рассуждения применимы и к более общему случаю г шаров и п ящиков. Таблица 2 1 * {*** ] —» | —— } 2. { —- |***| —> } 3. { -- | — |***} 4. {** |*| — } 5. {** | — | * } 6, { * |**|—} 7, { * |—I**} 8. {—]**| *} 9. ( | * j **) 10. { * | *| *}. Различимы ли шары на самом деле, для нашей теории несущест- венно. Если это даже и так, мы можем условиться считать их нераз- личимыми. Тузы в бридже [пример (б. 12)] или люди в лифте [пример (6.7)], конечно, различимы, и тем не менее часто предпочтительнее считать их неразличимыми. Игральные кости в примере (6.8) можно окрасить и сделать их тем самым различимыми, но выберем ли мы при решении какой-либо данной задачи схему с различимыми или схему с неразличимыми шарами, определяется поставленными целями и достигаемыми преимуществами. Характер задачи может предписать определенный выбор, но в любом случае нашу теорию можно развивать только после того как соответствующая модель выбрана, т. е. после того как определено пространство элементар- ных событий.
30 Гл. 7. Пространства элементарных событий В приведенном выше примере мы рассматривали неразличимые шары, но в табл. 2 еще различаются первый, второй и третий ящики, и их порядок существен. Мы можем пойти еще дальше и считать, что даже ящики неразличимы (например, ящики можно выбирать на- удачу независимо от их содержимого). Если и шары, и ящики неразличимы, то возможны только три размещения, а именно {»»*|— |—}, —}, {*|*|*}. г) Выборочное обследование. Предположим, что с целью оценить число курящих выбрана группа в 100 человек. При этом единствен- ное интересующее нас свойство данной выборки — число х курящих; оно может быть равно любому целому числу от 0 до 100. В этом случае мы можем принять, что наше пространство элементарных событий состоит из 101 «точки» х=0, 1, • . ., 100. Итог каждой отдельной выборки (или наблюдения) полностью описывается зада- нием соответствующей точки х. Примером составного события может служить следующее: «большинство людей в данной выборке — курящие». Это означает, что опыт заканчивается одним из 50 эле- ментарных событийх=51, 52, . . 100 (безразлично, каким именно). Аналогично и любое другое свойство выборки можно описать, перечислив соответствующие случаи или элементарные события. Для единства терминологии мы предпочитаем говорить о событиях, а не о свойствах выборки. G математической точки зрения событие является просто множеством соответствующих точек пространства элементарных событий. д) Выборочное обследование (продолжение). Допустим теперь, что выбранные нами 100 человек делятся на классы не только по признаку «курящие» или «некурящие», но и по полу. Выбранная группа может быть теперь охарактеризована четверкой чисел Мк, Жк, Мн, Жн, означающих по порядку число курящих мужчин, число курящих женщин, число некурящих мужчин и число неку- рящих женщин. В качестве элементарных событий мы возьмем четверки целых чисел, принимающих значения от 0 до 100 и даю- щих в сумме 100. Таких четверок существует 176 851; они и образуют пространство элементарных событий (см. гл. II, 5). Утверждение, что в выборке «среди мужчин доля курящих больше, чем среди жен- щин», означает, что для нашей выборки отношение Мк/Мк больше отношения Жк/Жк. Точка (73, 2, 8, 17) этим свойством обладает, а точка (0, 1, 50, 49) не обладает. По существу наше событие может быть описано перечислением всех четверок чисел, обладающих за- данным свойством. е) Бросание монеты. Если монета бросается три раза, то про- странство элементарных событий состоит из восьми точек, которые удобно обозначить следующим образом: ГГГ, ГГР9 ГРГ, РГГ, ГРР, РГР, РРГ, РРР [Г означает выпадение гррба при соответ- ствующем бросании, Р — решетки.— Перев.]. Событие А «выпало не менее двух гербов» совпадает с множеством первых четырех точек.
<S 3. П ростр анство элементарных событий. События 31 Событие В «выпала ровно одна решетка» означает или ГГР, или ГРГ, или РГГ; мы говорим, что В содержит эти три точки. ж) Возраст супругов. Страховые компании интересуются рас- пределением возрастов супругов. Пусть х означает возраст мужа, а у — возраст жены. Каждое наблюдение дает пару чисел (х, у). В качестве пространства элементарных событий мы берем первый квадрант плоскости х, у, так что каждая точка х >> 0, у > 0 будет элементарным событием. Событие А «мужу свыше 40 лет» представ- ляется всеми точками, лежащими справа от прямой х=40; событие В «муж старше жены» представляется областью, лежащей между осью х и прямой у=х, т. е. множеством точек, для которых х > у; собы- тие С «жене свыше 40 лет» представляется точками первого квадран- та, расположенными выше прямой //=40. Для геометрического представления возрастов двух супружеских пар нам потребовалось бы четырехмерное пространство. з) Фазовое пространство, В статистической механике каждое возможное «состояние» системы называют «точкой фазового простран- ства». Отличие здесь только в терминологии. Фазовое пространство есть просто наше пространство элементарных событий, а его точки — наши элементарные события х). § 3. ПРОСТРАНСТВО ЭЛЕМЕНТАРНЫХ СОБЫТИЙ. СОБЫТИЯ Из предыдущего должно быть ясно, что мы никогда не будем говорить о вероятностях вне связи с каким-либо пространством элементарных событий (или, говоря на физическом языке, вне связи с некоторым мыслимым опытом). М.ы начинаемо понятия простран- ства элементарных событий и его точек; впредь они будут рассмат- риваться как данные. Они являются первоначальными и неопределяе- мыми понятиями теории, так же как понятие «точка» и «прямая» остаются неопределяемыми при аксиоматическом построении евк- лидовой геометрии. Природа элементарных событий не играет роли в нашей теории. Пространство элементарных событий служит моде- лью идеализированного опыта в том смысле, что по определению любой мыслимый исход опыта полностью описывается одной и толь- ко одной точкой этого пространства. О каком-либо событии А имеет смысл говорить только тогда, когда для каждого исхода опыта из- вестно, произошло или не произошло событие А. Совокупность точек, представляющих все те исходы, при которых происходит событие А, полностью описывает это событие. Обратно, произвольно заданное множество А, содержащее одну или более точек нашего пространства, можно назвать событием; оно происходит или не происходит в зависимости от того, принадлежит или не принадле- жит множеству А точка, представляющая исход опыта. Для нас х) См., например, Хинчин А. Я. Математические основания статистической механики.— М.— Л.: ОГИЗ, 1943.— Прим, перев.
§2 Гл. J. Пространства элементарных событий поэтому слово событие будет означать то же самое, что некоторое множество элементарных событий. Мы будем говорить, что событие А состоит из определенных точек (или содержит эти точки), а именно из точек, представляющих те исходы идеализированного опыта, при которых происходит событие А. Пример. В пространстве элементарных событий примера 2, а) рас- смотрим событие U, состоящее из точек с номерами 1, 7, 13 (см. табл. 1). Это определение является формальным и самым простым, но U можно описать и многими другими способами. Например, U можно определить как событие, состоящее в одновременном выпол- нении следующих трех условий: (1) второй ящик пуст, (2) шар а находится в первом ящике, (3) номер ящика, где находится шар Ь, не превышает номера ящика, где находится шар с. Каждое из этих трех условий в свою очередь определяет событие. Событие Ut, определяемое только условием (1), состоит из точек 1, 3, 7—9, 13—15. Событие U2, определяемое условием (2), состоит из точек 1, 4, 5, 7, 8, 10, 13, 22, 23, и, наконец, событие U3, определяемое условием (3), состоит из точек 1—4, 6, 7, 9—11, 14, 16, 18—20, 22, 24, 25. Событие U можно теперь описать как одновременное осуще- ствление всех трех событий Ui, U3. ► Хотя термины «событие» и «элементарное событие» вызывают определенные интуитивные представления, для нас они будут равносильны терминам «точечное множество» и «точка», как их понимают во всех разделах математики. Предыдущий пример и пример 2, а) показывают, что по данным двум или более событиям можно определить новые события. Опира- ясь на подобные примеры, мы введем теперь систему обозначений, относящихся к формальной алгебре событий (т. е. алгебре точечных множеств). § 4. ОТНОШЕНИЯ МЕЖДУ СОБЫТИЯМИ Теперь мы предположим, что задано произвольное, но фиксиро- ванное пространство элементарных событий Мы будем использо- вать заглавные латинские буквы для обозначения событий, т. е. множеств элементарных событий. Тот факт, что точка х содержится В событии А, обозначим символом х£А. Так, для любой точки х имеем х£ @. Мы пишем А—В в том и только том случае, когда эти события состоят из одних и тех же точек. События будут, вообще говоря, определяться некоторыми усло- виями, налагаемыми на их точки. Удобно ввести символ, выражаю- щий тот факт, что ни одна из точек не удовлетворяет определенно- му набору условий. Этой цели служит следующее определение. Определение 1. Мы будем пользоваться записью 4=0 для выра^ жения того, что событие А не содержит элементарных событий
§ 4, Отношения между событиями 33 '(событие А невозможно). Нуль следует понимать символически, а не как цифру х)* Каждому событию А соответствует некоторое другое событие, определяемое условием «событие А не произошло». Оно содержит все точки, не содержащиеся в А. Определение 2. Событие, состоящее из всех точек, не содержащих- ся в событии А, называют событием, противоположным событию А (или отрицанием А), и обозначают через Д' 2). В частности, ©'=0. С любыми двумя событиями А и В можно связать два новых События, определенных условиями «имеют место и А, и В» и «имеют место или А, или В, или и А, и В». Эти события будут обозначаться соответственно АВ и А и В. Событие АВ содержит все точки, общие событиям А и В. Если события Л и В взаимно исключают друг друга, то они не имеют общих точек и событие АВ невозможно; 'аналитически это описывают формулой ДВ=0, (4.1) которая должна читаться так: «события Л и В несовместны». Событие ДВ' означает, что произошло и Д, и В', т. е. что событие А произошло, а событие В не произошло. Аналогично Д'В' озна- чает, что ни А, ни В не произошли. Событие ДиВ означает, что хотя бы одно из событий А или В произошло; оно содержит все точки, за исключением точек, не принадлежащих ни Д, ни В. С точки зрения теории вероятностей мы можем охарактеризовать событие АВ как одновременное осуществление событий ДиВ. По стандартной математической терминологии событие АВ называют (логическим) пересечением событий ДиВ. Подобным же образом событие ДиВ называют объединением событий ДиВ. Введенные нами понятия переносятся и на случай многих событий А, В, С, Определение 3. Любой совокупности событий А, В, С, . . . мы сопоставляем два новых события следующим образом. Множество, состоящее из элементарных событий (точек), принадлежащих одно- временно всем заданным событиям, будет обозначаться через АВС. . , и называться пересечением (или одновременным осуществлением) событий А, В, С, . . .3) (см. рис. 1). Множество, состоящее из эле- ментарных событий, каждое из которых принадлежит хотя бы одному из заданных событий, будет обозначаться через А и В и С . . . ---------- I х) Часто предпочитают другой символ, а именно 0.— Прим, перев. \ 2) Такое событие иногда называют дополнительным событием (дополне-* нием A, complementary event) и обозначают также через А или Ас.— Прим, перев. 3) Стандартное математическое обозначение для пересечения двух или более множеств таково: ЛПВ, Это обозначение в определен- ных случаях удобнее (см. гл. IV, 1 тома 2). Здесь мы используем обозначе-, ние АВ, ABCt для тогог чтобы облегчить труд наборщика. 2 № 221
34 Гл. t. Пространства элементарных событий и называться объединением заданных событий (или осуществлением хотя бы одного из них). События А, В, С, . . . попарно несовместны (взаимно исключают друг друга), есл и никакие два из них не имеют общих точек, т. е. если АВ^= О, АС^= О, . . ВС=О, .... Мы нуждаемся еще в символе для обозначения того, что со- бытие А не может произойти, если не произошло В, или того, что событие В является следствием события А. Это означает, что каждая точка события А содержится в событии В. Примером может слу- жить множество всех матерей, являющееся частью множества всех женщин: все матери суть женщины, но не все женщины суть матери. Рис. 1. Область, ограниченная внешним контуром, является объ- единением A U В U С. «Треуголь- ная» (дважды заштрихованная) область является пересечением АВС. Область в форме полуме- сяца (заштрихована) является пересечением В и события, про- тивоположного ди с. в Рис. 2. Пересечение и раз- ности событий. Определение 4. Символы А а: В и В zd А означают одно и тоже* а именно что каждая точка А содерж ится в В; словесно это выражают так: «событие А влечет за собой событие В» или соответственно «событие В является следствием события Л». В этом случае мы будем также писать В—А вместо В А' для обозначения того, что событие В произошло, а событие А не произошло (см. рис. 2). Событие В—А содержит все точки события В, не являющиеся точками события Ах). Пользуясь этим обозначением, напишем Л' = ©—А и А— Л = 0. Примеры, а) Если события А и В несовместны, то осуществле- ние события А влечет за собой осуществление события В', и наобо- рот. Следовательно, Л В—О означает то же самое, что Л сВ' и Вс: А \ !) Именно так определяют разность множеств В и Д, не предполагая, что АсВ (другое обозначение В\Д). Наряду с так определенной разностью множеств В и А определяют и их симметрическую разность (В\Д)П(Д\В) (обозначения Д+В или ДДВ). Вводя в дополнение к так определенной опе- рации «сложения» операцию «умножения» и полагая ДВ = ДВ, нетрудно показать, что по отношению к операциям Д- и • класс всех подмножеств & будет кольцом (в алгебраическом смысле); так как Д.Д = Д, то оно будет булевым кольцом с единицей т. е. булевой алгеброй,— Прим, персе.
§ 5. Дискретные пространства элементарных событий 35 б) Событие А—АВ означает, что произошло событие Я, но не произошли одновременно оба события А и В. Поэтому А—АВ~ *=АВ'\ в) В примере 2, ж) событие АВ означает, что мужу свыше 40 лет и что он старше своей жены, тогда как АВ' означает, что ему свыше 40 лет, но он не старше своей жены. Событие АВ поэтому изобра- жается неограниченной трапециевидной областью, лежащей между осью х и прямыми я—40 и у=х. Событие АВ' изображается неогра- ниченной треугольной областью, лежащей между прямыми х=40 и у—х, с включенной второй границей. Событие АС означает, что каждому из супругов свыше 40 лет. Событие Л и С означает, что хотя бы одному из них свыше 40 лет, тогда как Л и В означает, что либо мужу свыше 40 лет, либо, если это не так, он хотя бы старше своей жены (выражаясь юридически «возраст мужа превосходит 40 лет или возраст жены, смотря по тому, что из них меньше» х)). г) Пусть в примере 2, a) Et означает событие, состоящее в том, что ящик с номером i пуст (t=l, 2, 3). Аналогично пусть Sz, Dit Tt соответственно означают события, состоящие в том, что ящик с номером i содержит один шар, два шара, три шара. Тогда <=Т3, SiS^aSg и П1П2=0. Заметим также, что T'j.cEs и т. д. Собы- тие £>iUH2[jD3 определяется условием, что существует хотя бы один ящик, содержащий два шара. д) Бридж (см. примечание к § 1). Пусть А, В, С, D означают события, состоящие соответственно в том, что при сдаче колоды карт для игры в бридж игрок «Север», «Юг», «Восток», «Запад» полу- чил по крайней мере одного туза. Ясно, что хотя бы один из игро- ков имеет туза, так что по крайней мере одно из четырех событий должно иметь место. Следовательно, Л и В и C\jD=<& есть все про- странство элементарных событий., Событие ABCD происходит тогда и только тогда, когда каждый игрок имеет туза. Событие «игрок «Восток» получил всех четырех тузов» означает, что ни одно из со- бытий Л, В, С не произошло, или, что то же самое, что одновре- менно осуществились события Л4, В' и С, т. е. произошло событие А'В'С'. е) В примере 2, ж) мы имеем ВС с А, т. е. «если муж старше жены (В) и жене свыше 40 лет (С), то мужу свыше 40 лет (Л)». Как словесно описать событие Л—ВС? ► § 5. ДИСКРЕТНЫЕ ПРОСТРАНСТВА ЭЛЕМЕНТАРНЫХ СОБЫТИЙ Простейшими пространствами элементарных событий являются те, которые содержат конечное число п точек. Если п достаточно мало (как в случае бросания нескольких монет), то это пространств х) В подлинике фраза имитирует стиль английских юридических докумен-. тов,— Прим, перев, 2*
36 Гл. I. Пространства элементарных событий во легко себе представить. Пространство элементарных событий при сдаче карт для игры в бридж гораздо сложнее. Тем не менее можно представить себе, что каждое элементарное событие изображается какой-то фишкой, и затем рассматривать множество этих фишек как изображение пространства элементарных событий. Каждое событие А (например, «игрок «Север» получил двух тузов») изображается группой фишек; событие А' изображается остальными фишками. Остается сделать один шаг для того, чтобы представить себе ящик е бесконечным числом фишек или пространство элементарных собы- тий, состоящее из бесконечной последовательности точек Et, Ез, Е3....... Примеры, а) Условимся бросать монету до тех пор, пока не вы- падет герб. Тогда элементарными событиями будут: Е1=Г, Ез~РГ, Е3^=РРГ, Е^РРРГ и т. д. Мы можем допустить, что герб ни- когда не выпадет, или не допускать такой возможности. Допуская эту возможность, мы должны представить ее дополнительной точ- кой Ео. б) Три игрока а, b и с участвуют в игре (подобной игре в шахматы) по следующей системе. В первом туре играют а и Ь, а игрок с свободен. Проигравший заменяется игроком с, и во втором туре- играют победитель и с, а игрок, потерпевший поражение в первом туре, свободен. Соревнование продолжается таким образом до тех пор, пока один из игроков не выиграет двух партий подряд, и в этом случае его объявляют победителем. Для простоты мы исклю- чаем возможность ничьей в отдельной партии. Возможные исходы соревнования описываются тогда следующей схемой:' аа, асе, acbb, acbaa, acbacc, acbacbb, acbacbaa,. . . , . . bb, bcc, bcaa, bcabb, bcabcc, bcabcaa, bcabcabb, .... Наряду с этим вполне мыслимо, что ни один из игроков не вы- играет двух партий подряд, т. е. что соревнование будет продолжать- ся неограниченно долго по одной из двух следующих схем: acbacbacbacb. . ., bcabcabcabca .... (**) Пространство элементарных событий для нашего мыслимого опыта определяется формулами (») и (**) и является бесконечным. Од- нако ясно, что точки этого пространства можно занумеровать в простую последовательность. Для этого достаточно, например, на первые два места поставить точки (**), а на последующие — точки (*) в таком порядке: аа, bb, асе, Ьсс, .... (Продолжение этого примера см. в задачах 5 и 6, примере гл. V, 2,а) и задаче 5 гл. XV, 14.) ► Определение. Пространство элементарных событий называется дискретным, если оно состоит лишь из конечного числа точек или из бесконечного числа точек, которые могут быть занумерованы в про- стую последовательность Еи Ег, ... .
£ 6< Вероятности в дискретных пространствах, событий 37 Не каждое пространство элементарных событий дискретно. Известна теорема (принадлежащая Г. Кантору), утверждающая, что пространство элементарных событий, состоящее из всех положитель- ных чисел, не дискретно. Здесь мы сталкиваемся с разграничением, известным и в теоретической механике, где обычно сначала рассмат- ривают системы, составленные из отдельных материальных точек, каждая из которых имеет положительную массу, а затем переходят к случаю непрерывного распределения массы, когда каждая отдель- ная точка имеет массу, равную нулю. В первом случае масса систе- мы получается попросту сложением масс отдельных точек, во втором случае она вычисляется интегрированием плотности. Совершенно аналогично вероятности событий в дискретном пространстве эле- ментарных событий получаются просто сложением, тогда как в других пространствах необходимо интегрирование. Кроме аналити- ческих средств, которые приходится привлекать, эти два случая ничем существенным не отличаются. Желая изложить собственно вероятностные рассуждения, избегая при этом трудностей техничес- кого характера, мы сначала займемся лишь дискретными простран- ствами элементарных событий. Мы увидим, что даже этот частный случай приводит ко многим интересным и важным результатам. В этом томе мы будем рассматривать только дискретные про- странства элементарных событий. § 6. ВЕРОЯТНОСТИ В ДИСКРЕТНЫХ ПРОСТРАНСТВАХ Элементарных событий; подготовительные замечания Вероятности событий — числа той же природы, что и рассто- яния в геометрии или массы в теоретической механике. Теория предполагает, что они заданы, и не нуждается ни в каких предполо- жениях об их действительном численном значении или о способе их измерения на практике. Некоторые из наиболее важных прило- жений носят качественный характер и не зависят от численных значений вероятностей событий. В тех сравнительно немногих случаях, когда требуется знать численные значения вероятностей некоторых событий, вычислительные приемы столь же разнообраз- ны, сколь и методы определения расстояний. Когда плотник, землемер, лоцман и астроном измеряют расстояния, то в их дейст- виях мало общего. В этом же контексте мы можем рассмотреть коэффициент диффузии. Это понятие теории вероятностей. Чтобы найти численное значение этого коэффициента, требуются физичес- кие соображения, связывающие его с другими теориями; прямое же измерение невозможно. Статистические таблицы смертности, наобо- рот, составляются на основании наблюдений. В наиболее сущест- венных приложениях измерение вероятностей событий или сравне- ние результатов теории с данными наблюдений требуют применения довольно сложных статистических методов, опирающихся в свою очередь на развитую вероятностную теорию. Иначе говоря, хотя
38 Гл. I. Пространства элементарных событий наглядный смысл понятия вероятности и ясен, но лишь по мере развития теории мы сумеем увидеть, как следует применять это понятие. Все возможные «определения» понятия вероятности весьма неполно отражают реальную практику. Бросая «правильную» монету, мьь не колеблемся связать ве- роятность 1/2 с выпадением герба или решетки. Это приводит к вы- воду, что при п бросаниях монеты все 2" возможных случаев равно- вероятны. С теоретической точки зрения, это — допущение. Часто говорят, что такое допущение — логически неизбежное и единст- венно возможное. Однако были философы и статистики, которые отвергали это допущение и исходили из предположений, полно- стью его исключающих (в этом отражаются различные точки зре- ния на законы природы) х). Часто утверждают также, что значение 1/2 для вероятности по- лучается из опыта. На самом деле применение утонченных статисти- ческих методов к фактическим результатам опытов с бросанием мо- нет неизменно показывало, что выпадение герба и выпадение ре- шетки не являются одинаково вероятными событиями. Тем не ме- нее мы придерживаемся нашей модели «идеальной» монеты, хотя на самом деле правильных монет не существует. Мы сохраняем эту модель не только из-за ее логической простоты, но в основном из-за ее полезности и применимости. Во многих приложениях эта модель достаточно точно описывает действительность. Еще важнее тот извле- каемый из опыта факт, что отклонения от нашей схемы всегда свя- заны с такими явлениями, как, например, несовпадение центра тя- жести монеты с ее геометрическим центром. Таким образом, наши идеализированные модели могут быть в высшей степени полезными, даже несмотря на то, что они никогда не являются вполне точными. Например, в современном статистиче- ском контроле качества продукции* 2) идеализированные вероятност- ные модели используются для выявления «объяснимых причин» 3) бросающихся в глаза отклонений от этих моделей и последующего быстрейшего устранения неисправностей в работе машин и непра- вильностей течения производственного процесса. Подобные замечания относятся и к другим случаям. Число воз- можных распределений карт между игроками при игре в бридж равно почти 1030. Обычно мы соглашаемся считать эти распределения карт х) В оригинале в скобках стоят слова uniformity or non-uniformity in nature. Термин uniformity in nature в английском толковом словаре Вебстера (Webster’s third new international dictionary.— Springfield: C. G. Merriam Co., 1965) объяс- няется так: «доктрина или принцип, утверждающие неизменность или правиль- ность в природе; в более специальном понимании — принцип, утверждающий* что идентичные исходные состояния или идентичные причины неизменно имеют следствием идентичные эффекты».— Прим, перев. 2) В оригинале «основанном на методах Шухарта»; см. разд, б гл. II, 5.—• Прим, перев. 3) В оригинале «assignable causes», т. е. соображения, которые могут быть приведены в качестве^ причин,— Прим^ перев.
§ 6. Вероятности в дискретных пространствах событий 39 равновероятными. Для проверки этого допущения потребовалось бы более 1030 опытов, т. е. тысячи миллиардов лет круглосуточно*! цгры всех живущих на Земле людей, если считать продолжитель- ность игры равной одной секунде. Однако следствия нашего предпо- ложения могут быть проверены экспериментально посредством наблюдения, например, за частотой появления нескольких тузов у Одного игрока. Оказывается, что идеализированная модель описы- вает опыт с достаточной для предварительных целей точностью (в предположении, что карты тасуют лучше,чем это обычно делается). Еще важнее то, что в случаях когда наблюдаемые результаты не согласуются с идеализированной схемой, на основе этой схемы мож- но обнаружить «объяснимые причины» расхождения, например из- менение способа тасовки карт. Эти примеры имеют ограниченную ценность, но они свидетельствуют о полезности принятых моделей. Более интересные примеры встретятся при дальнейшем развитии теории. Примеры, а) Различимые шары, В примере 2,а) представляется естественным предположение о том, что все элементарные события равновероятны, т. е. что каждое из них имеет вероятность 1/27. Мы можем, отправляясь от этого определения, изучать его следст- вия. Будет или не будет наша модель достаточно точно описывать действительность, зависит от типа явлений, к которым ее будут при- менять. В одних приложениях равновероятность исходов является следствием физических соображений. В других приложениях ос- нованную на равновероятности исходов простейшую модель исполь- зуют для общей ориентировки, даже если совершенно очевидно, что это лишь самое первое, грубое приближение. [Сказанное хорошо иллюстрируют примеры 2, (6.1), дни рождения; 2, (6.7), лифт; 2, (6.11), собирание купонов.] б) Неразличимые шары, статистика Бозе — Эйнштейна, Об- ратимся теперь к примеру 2, в), связанному с размещением трех неразличимых шаров по трем ящикам. Можно рассуждать так: невозможность различать шары не отражается на сущности физи- ческого эксперимента, и остается по-прежнему 27 исходов, хотя только 10 из них оказываются различимыми. Эти рассуждения по- казывают, что десяти точкам табл. 2 надлежит приписать следую- щие вероятности: Номер точки 1 2345678910 Вероятность Следует отметить, что по отношению к большей части приложе- ний, перечисленных в примере 2, б), такое рассуждение звучит убедительно, и это оправдывает указанный способ задания вероят- ностей, соответствующих точкам табл. 2. Исторически это рассуж- дение долгое время принималось как безусловно верное и в статис-
40 Гл. I, Пространства элементарных событий тической механике служило основанием статистики Максвелла — Больцмана для размещения г частиц (шаров) по п ячейкам (ящикам). Тем больше было удивление, когда Бозе и Эйнштейн показали, что определенные типы частиц подчиняются статистике Бозе — Эйн- штейна (подробнее см. в гл. II, 5). В рассматриваемом случае г=п=3 модель Бозе — Эйнштейна сопоставляет каждому из деся- ти элементарных событий вероятность 1/10. Этот пример показывает, что в одном и том же пространстве элементарным событиям вероятности можно приписывать по-раз- ному. Он поясняет трудное для понимания взаимное действие друг на друга теории и практики и учит нас, в частности, не надеяться особенно на априорные аргументы и быть готовыми принять новые и непредвиденные схемы. в) Бросание монеты. Для частотного истолкования постулата о равенстве вероятностей элементарных событий необходимы дан- ные о результатах проведенных экспериментов. Бросание любой настоящей монеты приводит к искаженным результатам, из-за дей- ствия не поддающихся учету факторов. Можно, однако, осущест- вить физический эксперимент, результаты которого оказываются значительно ближе к идеальной «модели бросания монеты», чем для любой настоящей монеты. Для того чтобы дать представление о случайных колебаниях (флуктуациях), которые можно ожидать, мы приводим запись результатов подобного эксперимента, соответ- ствующую 10 000 бросаний монеты. Табл. 3 содержит числа «появ- лений герба» в ста последовательных сериях, каждая из которых насчитывает сто «бросаний». Суммарное число «появлений герба» равно 4979 х). Поглядев на эту таблицу, читатель, вероятно, скажет Таблица 3 Номера испытаний Число « появлений герба» Сумма по строке ' 1— 1000 54 46 53 55 46 54 41 48 51 53 501 1001— 2000 48 46 40 53 49 49 48 54 53 45 485 2001— 3000 43 52 58 51 51 50 52 50 53 49 509 3001— 4000 58 60 54 55 50 48 47 57 52 55 536 4001— 5000 48 51 51 49 44 52 50 46 53 41 485 5001— 6000 49 50 45 52 52 48 47 47 47 51 488 6001— 7000 45 47 41 51 49 59 50 55 53 50 500 7001— 8000 53 52 46 52 44 51 48 51 46 54 497 8001— 9000 45 47 46 52 47 48 59 57 45 48 494 9001—10000 47 41 51 48 59 51 52 55 39 41 484 х) На самом деле приведены числа появления четных цифр в одном из разде- лов таблицы случайных чисел A million random digits with 100 000 normal de- viates, RAND Corporation, Glencoe, Illinois, Free Press, 1955. [Для моделирования «бросания монеты» при этом используют генераторы случайных шумов; о других методах см., например, Ермаков С. М. Метод Монте-Карло и смежные вопросы,— М.: Наука, 1975,— Перев.}
§ 7, Основные определения и соотношения 41 с неопределенным чувством: «Ну и что же?». По правде говоря, су- дить о том, в какой степени такие эмпирические данные согласуются с нашей абстрактной моделью, можно лишь при помощи достаточно развитой теории. (Между прочим, мы вернемся к этому кругу воп- росов в гл. III, 6.) ► § 7. ОСНОВНЫЕ ОПРЕДЕЛЕНИЯ И СООТНОШЕНИЯ Основное положение 1). Пусть дано дискретное пространство элементарный событий ® с точками Ei, Е2,. . . . Мы полагаем, что с каждой точкой Ej связано число, называемое вероятностью Ej и обозначаемое Р{£;}. Эти числа должны быть неотрицательны и та- ковы, что P{Ei}+P{Ea}+. . . = 1. (7.1) Заметим, что мы не исключаем возможность равенства нулю вероятностей отдельных элементарных событий. Это допущение мо- жет показаться неестественным, но оно необходимо для того, чтобы избежать осложнений. В случае дискретного пространства элемен- тарных событий равенство нулю вероятности на практике рас- сматривают как невозможность и элементарное событие, имеющее вероятность, равную нулю, можно безнаказанно изъять из прост- ранства элементарных событий. Однако часто численные значения вероятностей заранее неизвестны, и без дополнительных, порой сложных, рассуждений невозможно решить, равна или не равна нулю вероятность некоторой точки. Определение. Вероятность Р{Л} любого события А есть сумма вероятностей элементарных событий, из которых оно состоит. По формуле (7.1) вероятность всего пространства ® элемен- тарных событий равна единице: Р{©} = 1. Далее, для любого события 0<Р{Д }<1. (7.2) Рассмотрим теперь два произвольных события Л$ и Д2. Чтобы вычислить вероятность Р{Л1 иЛ2) того, что имеет место либо собы- тие At, либо событие А 2, либо оба эти события, мы должны сложить вероятности всех точек, содержащихся в Ль и всех точек, содер- жащихся в А 2, считая, однако, каждую точку по одному разу. Мы имеем поэтому Р{Л1иЛ2}^Р{Д1}+Р{Л2). (7.3) Если теперь Е — любая точка, содержащаяся и в Aj, и в Л2, то Р{£) входит два раза в правую и один раз в левую часть неравенства J) В оригинале Fundamental convention. К нему с учетом определения веро- ятности (см. ниже) по существу сводятся аксиомы Колмогорова (см. книгу А. Н. Колмогорова, цитированную на с, 23) в случае дискретного пространства элементарных событий,— Прим, перев.
' 42 Гл. I, Пространства элементарных событий (7.3). Поэтому правая часть превосходит левую на P{AiA3}, и мы получаем простую, но имеющую полезные следствия теорему. Теорема. Для любых двух событий Ai и А 2 вероятность того, что имеет место либо событие At, либо событие А2, либо оба эти собы- тия, дается формулой Р{Лi и А 2}=Р{Л 1 }+Р{Л 2} - Р{ЛiA 2}. (7.4) Если Лр42=0, т. е. если события At и Аг несовместны, то (7.4) сводится к следующему виду'. Р{Л11М2}=Р{Д1}+Р{Д2). (7.5) Пример. Монета бросается два раза. В качестве пространства элементарных событий возьмем четыре точки ГГ, ГР, РГ, РР и свяжем с каждой вероятность 1/4. Пусть At и Л2 означают соот- ветственно события «при первом бросании выпал герб» и «при вто- ром бросании выпал герб». Тогда событие At состоит из точек ГГ, ГР и событие А 2 состоит из точек РГ, ГГ. Далее событие Л10 Л2 содержит три точки ГГ, ГР, РГ, в то время как событие Л1Л2 со- стоит из единственной точки ГГ. Таким образом, Р{ЛхЛ2}=1/2+1/2—1/4=3/4. > Вероятность Р{Л1 и Л 2и . . . U Л п} осуществления хотя бы од- ного из п событий может быть вычислена по формуле, аналогичной формуле (7.4); она будет получена в гл. IV, 1. Здесь мы лишь за- метим, что рассуждения, приводящие к (7.3), пригодны в случае любого числа объединяемых событий. Таким образом, для произ- вольно взятых событий At, А 2, . . . выполняется неравенство Р{Д1иЛ211 . . .}<Р{Л1}+Р{Л2}+. .. . (7.6) В частном случае, когда события Aj, Л2, . . . попарно несовместны, Р{Л1иЛ2и ...}=Р{Л1}+Р{Л2}+. .. . (7.7) Иногда неравенство (7.6) называют неравенством Буля х). Мы исследуем сначала [в гл. II и III.— ПеревА частный случай, когда пространство элементарных событий состоит из конечного числа N точек, вероятность каждой из которых просто равна 1/М. В этом случае вероятность любого события Л равна числу точек, входящих в Л, деленному на N. В старой литературе элементарные события называли «случаями», а элементарные события, входящие в Л,— «благоприятными случаями» (благоприятными для события Л). Если все элементарные события равновероятны, то вероятность события равна отношению числа благоприятных случаев к числу х) Буль Джордж (Boole J.; 1815—1864) — английский математик и логик. Он заложил основы математической логики. Его именем названы, например, буле<- вы алгебры,— Прим, перев.
§8. Задача 43 всех возможных случаев. К сожалению, этой формулировкой неод- нократно злоупотребляли, стараясь «определить» понятие вероят- ности. Часто утверждали, что в любом конечном пространстве эле- ментарных событий вероятности этих событий должны быть равны между собой. Это не так х). При однократном бросании неправиль- ной монеты пространство элементарных событий по-прежнему со- держит всего две точки (выпадение герба и выпадение решетки), но эти элементарные события могут иметь какие угодно вероятности р и q, лишь бы было Новорожденный — либо мальчик, либо девочка, но эти две возможности не равновероятны [по много- летним наблюдениям частота рождения мальчиков несколько боль- ше 0,51; см., например, таблицы в гл. 31 книги Г. Крамера, цити- рованной на стр. 21.— Перев.]. Еще одно опровержение содержит пример 6, б). Полезность пространств с равновероятными элемен- тарными событиями проявляется в основном при изучении азартных игр и в комбинаторном анализе. § 8. ЗАДАЧИ 1. Из цифр 1, 2, 3, 4, 5 сначала выбирают одну, а затем из оставшихся че- тырех — вторую. Допустим, что все 20 возможных исходов равновероятны. Найти вероятность того, что а) в первый раз, б) во второй раз, в) оба раза будет выбрана нечетная цифра. 2. В пространстве элементарных событий примера 2, а) припишем равные вероятности всем 27 точкам. Используя обозначения примера 4, г), проверить формулу (7.4) для двух событий Лх=5х и Л2=*$2« Сколько точек входит в собы- тие 3. Рассмотрим все 24 возможные перестановки цифр 1, 2, 3, 4 и свяжем в каждой вероятность 1/24. Пусть Л/— событие, состоящее в том, что цифра i оказалась на t-м месте (t=l, 2, 3, 4). Проверить формулу (7.4). 4. Монету бросают до тех пор, пока 2 раза подряд она не выпадает одной и той же стороной. Каждому возможному исходу, при котором бросания заканчи- ваются на n-м шаге, припишем вероятность 1/2"-1. Описать пространство эле- ментарных событий. Найти вероятности следующих событий: а) опыт окончится до шестого бросания; б) потребуется четное число бросаний. 5. В пространстве элементарных событий примера 5, б) припишем каждой точке из (*), содержащей ровно k букв, вероятность 1/2л. (Иначе говоря, аа и ЪЬ имеют вероятность 1/4, асб имеет вероятность 1/8 и т. д.) а) Показать, что сумма вероятностей всех точек из (*) равна единице (в силу этого каждая из двух точек (**) имеет вероятность, равную нулю), б) Установить, что с вероятностью 5/14 победителем будет игрок а. Вероятность того, что побе- дит игрок Z?, будет такой же, но аналогичная вероятность для о равна 2/7. J) Слабость приведенного выше утверждения понимали и ранее? например, еще А. А. Марков писал: «В известных теоретических вопросах равновозможность рассматриваемых событий представляется нашему уму вполне ясно; в других мы условимся, какие именно события считать равновозможными. В практических же вопросах мы можем быть вынуждены считать равновозможными и такие со- бытия, равновозможность которых весьма сомнительна.» (Марков А. А. Исчис- ление вероятностей.— М.: ГИЗ, 1924, с. 2—3.) А. А. Марков (1856—1922) — выда- ющийся русский математик, специалист по теории чисел, теории вероятностей и математическому анализу. С 1886 г. профессор Петербургского университета| с 1890 г, академик Петербургской Академии Наук,— ПримЛ nepeef
44 Гл. I. Пространства элементарных событий в) Вероятность того, что победитель не определится до &-го тура включи- тельно, равна 1/2^~х; проверить это. 6. Видоизменить пример 5,6), допустив, что партии могут заканчиваться вничью. Описать соответствующее пространство элементарных событий. Как ввести вероятности? 7. В задаче 3 показать, что А]А2А3 а: А4 и А^Аз CZ А£. 8. Используя обозначения примера 4, г), показать, что a) SiS2Z)3 = 0; б) SiD2 С Е3; в) Е3—D2S± zd S2D±. 9. Бросают две игральные кости. Пусть А—событие, состоящее в том, что сумма очков—нечетное число, а В—событие, состоящее в том, что хотя бы на одной из костей выпала единица. Описать события АВ, Ли#* АВ'. Найти их вероятности при условии, что все 36 элементарных событий равновероятны. 10. В примере 2, ж) выяснить смысл следующих событий: а) АВС; б) 4—АВ; в) АВ'С. 11. Проверить, что в примере 2, ж) АС'с^В. 12. Бридж (см. примечание к § 1). Пусть N& где &=1, 2, 3, 4—собы- тие, состоящее в том, что игрок «Север» получил не менее k тузов. Пусть Е^ и — аналогичные события для игроков «Юг», «Восток» и «Запад». Что можно сказать о числе тузов у игрока «Запад» при осуществлении событий а) Г!; б) Л/2В2;в) г) №2-Г3;д) МММ, е) ж) (N2]JS2)EJ 13. Проверить, что в предыдущей задаче a) S3 cz S2; г) N2S2 cz 6) S3IF2 = 0; д) (2V2US2)F3 = 0; в) ^2S1E1Fi = 0; e) 14. Проверить следующие соотношения x) а) (A(J В)'— А'В'; д) (4(JB) — AB —AB'(J A'B; 6) (4|JB) — B = A—AB —AB'; e) 4'(JB' = (4B)'; в) AA = A[)A = A; ж) (AjjB) C = AC(JBC. r) (4—4B)(JB = 4|JB; 15. Найти простые выражения для событий а) (4UВ) (4UВ'); б) (4(J В) (Л'(JВ') (4(J В'); в) (4(JB) (B(J0. 16. Установить, какие из следующих соотношений правильны: a) (4UB)-C=4U(B-C); б) 4BC = 4B(CUB); в) 4(JBUC = 4U(B — 4B)U(C—40; г) 4|J В = (4 —4B)(JB; д) 4B(JBCUC4zd ABC; е) (4BUBCUC4)cz(4UBU0; ж) (4(JB) — А —В; з) 4B'Ccz4UB; и) (4 (J B(J0' =А'В'С'; к) (4(J В)' С = 4'СиВ'0 л) (4 (J В)' С = А'В'С; м) (4LW C = C-C(4U0.^ 17. Пусть 4, В, С — три произвольно выбранных события. Найти выражения для событий, состоящих в том, что из 4, В, С а) произошло только 4; б) произошли 4 и В, но С не произошло; в) все три события произошли; г) произошло хотя бы одно из этих событий; д) произошло хотя бы два события; е) произошло одно и только одно из этих событий; х) Заметим, что (4 JВ)'означает событие, противоположное событию 4 (JВ; оно не совпадает с А'ЦВ\ Аналогично (АВ)' не то же самое2 что А'В',
$ 8. Задачи 46 ж) произошло два и только два события; з) ни одно событие не произошло; и) произошло не более двух событий. 18. Объединение A двух событий может быть выражено как объединение двух несовместных событий, именно A иВ=Л (J (Л—АВ). Выразить аналогичным образом объединение трех событий А, В, С. 19. Используя результат задачи 18, доказать, что Р {Л и в и с }=Р {А }+Р {В )+Р {С} — Р {АВ }—Р {Л С }-Р {ВС }+Р {АВС }. [Эта формула является частным случаем формулы (1.5) гл. IVJ
ГЛАВА II ЭЛЕМЕНТЫ КОМБИНАТОРНОГО АНАЛИЗА В этой главе поясняются основные понятия комбинаторного анализа и развиваются соответствующие вероятностные основания; в последней части главы описываются некоторые простые аналити- ческие приемы. Для дальнейшего изучения книги не требуется глу- бокого знания комбинаторного анализа, и читатель, специально им не интересующийся, может после беглого просмотра сразу пе- рейти к главе V, продолжающей основную теоретическую линию гл. I. Лучше всего читать отдельные параграфы этой главы в связи с имеющими к ним отношение темами в последующих главах. При изучении простых азартных игр, процедур случайного вы- бора, задач о размещении и упорядочении и т. д. мы, как правило, имеем дело с конечными пространствами элементарных событий, в которых всем точкам приписываются равные вероятности. В этом случае, для того чтобы найти вероятность некоторого события А9 мы должны разделить число элементарных событий в А («благо- приятные случаи») на общее число элементарных событий («воз- можные случаи»). Подсчет числа случаев облегчается системати- ческим использованием несколоких правил, к обзору которых мы сейчас перейдем. Простота и экономия мышления могут быть достигнуты постоянным применением нескольких стандартных прие- мов, и мы будем следовать этому способу действий вместо того, что- бы описывать кратчайший вычислительный метод в каждом конк- ретном случае х). § 1. ПРЕДВАРИТЕЛЬНЫЕ СВЕДЕНИЯ Пары. Из т элементов ат и п элементов bi, , . bn можно образовать тп пар (а^, bh), содержащих по одному элементу из каждой группы. х) Интересующийся этими вопросами читатель найдет обширный материал по элементарному комбинаторному анализу, обратившись к классической книге У. Уитворта (Whitworth W. A., Choice and chance, 5th ed., London, 1901; New York, Stechert G. E., 1942), Ее дополняет задачник того же автора DCC exercises, переизданный в Нью-Йорке в 1945 г. и содержащий 700 задач с полными решения- ми. [См. также книгу Сачков В. Н. Введение в комбинаторные методы дискретной математики.— М.: Наука, 1982 и задачник Комбинаторный анализ. Задачи и упражнения/Под ред. К» А* Рыбникова,—М,: Наука, 1982*—Перев.}
§ /. Предварительные сведении 47 Доказательство. Составим из этих пар прямоугольную таблицу (наподобие таблицы умножения) с т строками и п столбцами так, чтобы пара (ah bh) стояла на пересечении /-й строки и &-го столбца. Тогда каждая пара появляется один и только один раз, и утверж- дение становится очевидным. ► Примеры, а) Дарты для бриджа (см. примечание к § 1 гл. I). В качестве множеств элементов берутся четыре масти и трина- дцать значений соответственно. Каждая карта определяется своей мастью и значением, и существует 4-13=52 таких комбинаций (карт) б) «Семипозиционные торшеры». Так называются торшеры с тре- мя обычными лампами и подсветкой, которая может устанавливать- ся на трех уровнях или вообще не использоваться. Каждая из этих четырех возможностей может комбинироваться с включением О, 1, 2 или 3 ламп. Следовательно, существует 4-4=16 возможных комбинаций, из которых одна — назовем ее (0, 0) — означает, что торшер выключен. Остается пятнадцать (а не семь) способов вклю- чения торшера. ► Комбинации. Дано nt элементов at, ..., аП1, п2 элементов ..., &п2, ..., пг элементов xir ..., хПг; число возможных комби- наций (а^, bj2, ..., Xjr), содержащих по одному элементу каждого типа, равно щ*п2-... -пг. Доказательство. Если г=2, то утверждение сводится к первому правилу. Если г=3, то рассматриваем пару (сц, bj) как элемент но- вого типа. Существует П1/г2 таких пар и п3 элементов ck. Каждая тройка (at, bj, ch) в свою очередь является парой, состоящей из (aif bj) и элемента ck; следовательно, число троек равно П1П2п3. Утверждение для любого г получается по индукции. ► Многие применения основаны на следующей переформулировке последней теоремы: при г последовательных выборах (решениях) с ровно nh возможными исходами на k-м шаге можно получить пх-п^. . .'ПГ различных результатов. Примеры, в) Классификация по многим признакам. Предполо- жим, что люди классифицируются по полу, семейному положению и профессии. Различные категории играют роль элементов. Если имеется 17 профессий, то всего будет 2-2-17=68 классов. г) В сельскохозяйственном эксперименте проверяют влияние трех различных факторов (таких, как применение удобрений, оп* рыскивание и температура). Если эти факторы могут иметь п, и г3 уровней (или концентраций) соответственно, то всего существ вует г1г2г3 комбинаций или способов воздействия. д) «Размещение шаров по ящикам» равнозначно выбору ящика для каждого шара. Для г шаров мы имеем г независимых выборовt и поэтому г шаров можно рцзм&тить в п ящиках пг различными спо^
48 Гл, IL Элементы комбинаторного анализа собами, Вспоминая пример гл. I, 2, б), мы видим, что очень многие мыслимые эксперименты с абстрактной точки зрения эквивалентны размещению шаров по ящикам. Например, рассматривая грани иг- ральной кости как «ящики», получим, что при бросании г раз иг- ральной кости имеется 6Г возможных исходов, в 5Г из которых ни разу не появилась единица. Поэтому при предположении, что все исходы равновероятны, событие «в г бросаниях не было единицы» имеет вероятность (5/6)\ Мы можем наивно полагать, что при шести бросаниях «единица должна появиться», однако вероятность этого события равна только 1—(5/6)6, т. е. меньше, чем 2/3 (ср. с приме- ром 3, б)). е) Вывешивание флагов J). Рассмотрим менее тривиальный при- мер, а именно предположим, что г флагов различных цветов выве- шиваются на п шестах в ряд. Сколькими способами это можно сделать? Мы пренебрегаем, конечно, абсолютным положением фла- га на шесте и тем обстоятельством, что число флагов на шесте прак- тически ограничено. Мы предполагаем только, что флаги на каждом шесте располагаются в определенном порядке сверху вниз. Вывешивание можно осуществить последовательным выбором места для каждого из г флагов. Для первого флага выбирается один из п шестов. Этот шест, таким образом, делится на две части, и, следовательно, имеется п+1 возможных выборов положения для второго флага. Аналогично показывается, что для третьего флага возможно п+2 выбора и т. д. Отсюда следует, что возможно п(п+ + 1)-. . .• (п+г—1) различных способов вывешивания. ► § 2. УПОРЯДОЧЕННЫЕ ВЫБОРКИ Рассмотрим множество или «генеральную совокупность» из п элементов Я£, п2, . • ап. Упорядоченной выборкой объема г, из- влеченной из данной генеральной совокупности, называется любое упорядоченное множество а71, п/2, . . а/г из г его элементов. Для наглядности можно представить себе, что элементы выбираются один за другим. В этом случае возможны две процедуры. Первая — выбор с возвращением} здесь каждое извлечение делается из полной генеральной совокупности, так что один и тот же элемент может быть выбран несколько раз. Такие выборки — упорядоченные мно- жества, в которых допускаются повторения. Вторая процедура — выбор без возвращения] здесь элемент, выбранный однажды, исклю- чают из генеральной совокупности, так что выборка превращается в упорядоченное множество без повторений. Очевидно, в этом слу- чае объем выборки г не может быть больше объема генеральной совокупности п. l) Finucan Н. М,. A teaching sequence for nHri The Math. Gazette, 48 (1964), 440-441.
§ 2, Упорядоченные выборки 49 При выборе с возвращением каждый из г элементов может быть выбран п способами, и поэтому число возможных выборок будет пг\ это получается из последней теоремы при ni=n2=- . .=п. При вы- боре без возвращения мы имеем п возможных исходов для первого элемента, но только п—1 для второго, п—2 для третьего и т. д.; таким образом, всего существует п(п—1)-. . . • (п—г+1) выборок. Произведения такого типа появляются очень часто, поэтому удобно ввести обозначение х) (n)r=n(n—1)>. . ..(п-г+1). (2.1) Ясно, что (п)г=0 для таких целых г и п, что г>/г. Таким образом, мы получили следующую теорему. Теорема. Для генеральной совокупности из п элементов и фиксиро- ванного объема выборки г существует пг различных выборок с воз- вращением и (п)г выборок без возвращения. Отметим частный случай, когда г=п. При выборе без возвраще- ния выборка объема п включает всю генеральную совокупность и представляет собой переупорядочение (или перестановку) ее эле- ментов. Таким образом, п элементов а^ . . ., ап могут быть упо- рядочены (п)п=п* (п—1)*...‘2*1 различными способами. Вместо (п)п мы пишем п\, что является более употребительным обозначе- нием. Мы видим, что наша теорема имеет такое следствие. Следствие. Число различных перестановок из п элементов равно п\=п(п—\)>. . .‘2-1. (2.2) Примеры, а) Три человека Л, В и С составляют упорядоченную выборку из генеральной совокупности людей. Их дни рождения есть выборка из генеральной совокупности всех календарных дней, их возрасты есть выборка, составленная из трех чисел. б) Если под «словом из десяти букв» понимать (возможно, бес- смысленную) последовательность из десяти букв, то такое слово представляет собой выборку из генеральной совокупности, состоя- щей из 26 букв * 2). Поскольку повторения разрешаются, существует 2610 таких слов. С другой стороны, в типографии буквы существуют не только умозрительно, но также физически в виде литер. Для простоты предположим, что имеется ровно 1000 литер каждой бук- вы. Чтобы набрать слово, наборщик должен выбрать десять литер, и здесь повторения исключаются. Поэтому слово может быть на- брано (26000)ю различными способами. Практически это число мало отличается от 2600010 и превышает 1044. в) Мистер и миссис Смит образуют выборку объема два из ге- неральной совокупности всех людей; в то же время они образуют 0 Обозначение (п)г не общепринято, но мы будем систематически исполь- аовать его в этой книге (даже когда п не является целым числом). 2) Речь идет об английском алфавиту содержащем 26 букв,— Прим, перев*
50 Гл. II. Элементы комбинаторного анализа выборку единичного объема из генеральной совокупности всех супружеских пар. Этот пример показывает, что объем выборки оп- ределяется только относительно данной генеральной совокупности. Бросание монеты г раз является одним из способов получения вы- борки объема г из генеральной совокупности, состоящей из двух букв Г и Р. Это же упорядоченное множество из г букв Г и Р пред- ставляет собой элементарное событие в пространстве, соответствую- щем бросанию монеты г раз. / г) Об упорядочении и выборе на практике. Когда путем выбора исследуется число курящих в некоторой генеральной совокупности людей, может интуитивно показаться, что порядок внутри выборки не имеет значения, и поэтому начинающий склонен считать такие выборки неупорядоченными. Однако выводы при анализе выборки возможны лишь на основе некоторых вероятностных предполо- жений, для чего необходимо иметь подходящую модель для мысли- мого эксперимента формирования выборки. Такой эксперимент, очевидно, включает действия, исходы которых можно отличить один от другого, т. е. они как-то помечаются. Для теоретических целей в качестве меток проще всего использовать целые числа, что приводит к упорядочению выборки. На практике могут быть предпочтительнее другие процедуры, но даже указание «третий парень, которого Джоунз интервьюировал во вторник» является меткой. Иначе говоря даже в том случае, когда порядок внутри выборок можно в конечном счете игнорировать, мыслимый экспе- римент включает упорядоченные выборки, и мы увидим, что это приводит к надлежащему приписыванию вероятностей. ► Последовательное извлечение г элементов из генеральной сово- купности объема п является экспериментом, возможные исходы которого представляют собой выборки объема г. Их число равно пг или (п)г в зависимости от того, как производится выбор: с возвраще- нием или без возвращения. В каждом из этих случаев наш мысли- мый эксперимент описывается пространством элементарных собы- тий, в котором каждая отдельная точка означает выборку объема г, До сих пор мы не говорили о вероятностях, связанных с выбор* ками. Обычно мы будем приписывать всем им равные вероятности и говорить о случайной выборке. Слово «случайный» не определено строго, но применительно к выборкам или выбору оно имеет единст- венное значение. Использование термина случайный выбор предпо- лагает равновероятность всех исходов. Подобным образом, когда мы говорим о случайной выборке фиксированного объема г, прилага- тельное «случайная» означает, что все возможные выборки имеют одну и ту же вероятность, а именно при выборе с возвращением и 1/(п)г при выборе без возвращения, где п — объем генеральной совокупности, из которой производится выбор. Если п велико, а г относительно мало, то отношение (п)г!пг близко к единице. Это дает основание ожидать, что для больших генеральных совокупностей rfj
§3. Примеры 51 относительно малых выборок оба способа выбора практически эк- вивалентны (см. задачи 1 и 2 § 11, а также задачу 35 гл. VI, 10). Мы ввели терминологию, взятую из практики, но ничего не ска- зали о применимости наших моделей случайного выбора к действи- тельности. Бросание монеты или игральной кости и аналогичные действия можно рассматривать как эксперименты по практиче- скому осуществлению случайного выбора с возвращением, и наши вероятности численно близки к частотам, наблюдаемым в длинной серии экспериментов, хотя полностью симметричных монет или иг- ральных костей не существует. Типичным примером случайного выбора без возвращения является последовательное вытаскивание карт из перетасованной колоды (предполагается, что колода пере- тасована гораздо тщательнее, чем это делается обычно). При выбо- ре из генеральной совокупности людей статистик сталкивается со значительными и часто непредвиденными трудностями, и горький опыт показывает, что трудно получить даже грубое подобие слу- чайности. Упражнение. При выборе без возвращения вероятность того, что любой фиксированный элемент генеральной совокупности содержится в случайной выборке объема г, равна 1 — (Z2 — I )r/(n) r = 1 — (П — г)/П = Г ]п. При выборе с возвращением вероятность того, что некоторый элемент входит котя бы в одну выборку, равна 1 — (1 — 1/п)г. § 3. ПРИМЕРЫ Примеры этого параграфа представляют собой частные случаи следующей задачи. Из генеральной совокупности, содержащей п элементов, извлекается случайная выборка с возвращением объема г, Найдем вероятность события, состоящего в том, что ни один эле- мент не появляется дважды, т. е. что наша выборка могла быть так- же получена выбором без возвращения. Последняя теорема показы- вает, что всего существует пг различных выборок, из которых (п)г удовлетворяют указанному условию. Предполагая, что все исходы имеют одинаковую вероятность, заключаем, что вероятность от- сутствия повторения в нашей выборке равна Р = (и)г/пг = п(п—1)-... •(п—г 4* 1)/пг. (3.1) Следующие ниже конкретные интерпретации этой формулы демон- стрируют некоторые удивительные явления. а) Случайно выбранные числа. Пусть генеральная совокупность состоит из десяти цифр 0, 1, . . ., 9. Каждая последовательность из пяти цифр представляет собой выборку объема г=5, и мы пред- положим, что каждая такая упорядоченная последовательность имеет вероятность 10"Л В соответствии с (3.1) вероятность того, Что все пять последовательных случайных цифр различны, равна (Ю)5-10~&=0.3024,
52 Гл. IL Элементы комбинаторного анализа Мы интуитивно ожидаем, что в больших математических таб- лицах с большим числом десятичных знаков последние пять цифр будут обладать многими свойствами случайных чисел (в обычных логарифмических и многих других таблицах табличные разности примерно постоянны, и поэтому последние цифры изменяются регулярным образом). В качестве эксперимента были выбраны шестнадцатизначные таблицы х) и было найдено количество чисел, в которых последние пять цифр различны. В первых двенадцати группах по сто чисел каждая количество чисел с различными по- следними пятью цифрами составило 30, 27, 30, 34, 26, 32, 37, 36, 26, 31, 36, 32 соответственно. Теория малых выборок показывает, что величина флуктуаций хорошо согласуется с ожидаемыми преде- лами. Средняя частота равна 0,3142 и довольно близка к теорети- ческой вероятности 0,3024 (см. пример гл. VII, 4, ж)). Далее рассмотрим число е=2,71828 ... .Из первых 800 деся- тичных знаков ?) образуем 160 групп по 5 цифр, а группы объе- диним в 16 «связок» по 10 групп в каждой. Число групп, в ко- торых все пять цифр различны, в последовательных «связках» рав- но соответственно 3, 1,3, 4, 4, 1,4,4, 4, 2, 3, 1,5, 4,6, 3. Частоты также колеблются около значения 0,3024, и теория малых выборок подтверждает, что величины флуктуаций не превосходят ожидаемых. Средняя частота нашего события в 160 группах равна 52/160=0,325 и достаточно близка к р=0,3024. б) Если п шаров случайным образом размещаются в п ящиках, то вероятность того, что каждый ящик занят, равна п\!пп. Это поразительно мало: для п=7 она равна только 0,00612... . Отсюда следует, например, что если в некотором городе каждую неделю про- исходит семь автомобильных катастроф, то (в предположении, что все возможные распределения по дням недели равновероятны) практически все недели будут содержать дни, в которые произошло не менее двух катастроф, и в среднем только в одной неделе из 165 катастрофы будут равномерно распределены по дням. Этот пример показывает неожиданное свойство чистой случайности. (Все воз- можные расположения семи шаров в семи ящиках указаны в табл. 1 § 5. Вероятность того, что два или более ящиков останутся пустыми. *) Как было указано в предыдущем издании книги, здесь речь идет о следую- щем издании: Tables of probability function, v. I, Nat. Bureau of Standards, 1941, [Имеется перевод: Таблицы вероятностных функций. — 2-е стереотип, изд.— Мд ВЦ АН СССР, 1970.] — Прим, перев. 2) По поводу более полных исследований, проведенных с помощью современ- ных ЭВМ, см. Stoneham R. G., A study of 60 000 digits of the transcendental e, Amer. Math. Monthly, 72 (1965), 483—500 и Pathria R. K-, A statistical study of the first 10 000 digits of л, Mathematics of Computation^ 16 (1962), 188—197. [См. также Shanks D.,Wrench J. W., Jr., Calculation of л to 100 000 decimals, Mathe* matics Computation, 16 (1962), 76—99,— Перев.\
§ 3. Примеры 53 составляет около 0,87.) Для 6 вероятность п\п~п равна 0,01543.... Это показывает, сколь маловероятно, что при шести бросаниях правильной игральной кости выпадут все грани. (Вероятность того, что определенная грань не выпадет, близка к 1/3; см. пример 1,Д).) в) Лифт. Лифт начинает движение с г=7 пассажирами и оста- навливается на п=10 этажах. Какова вероятность р того, что ника- кие два пассажира не выйдут на одном и том же этаже? Для строгой постановки задачи предположим, что все возможные комбинации выхода пассажиров из лифта равновероятны (что является довольно грубым приближением). Тогда р=10-?(10)7= (10-9-8-7-6-5-4)-10~7=0,06048. Если такое событие однажды произошло, то нужно считать это исключительным явлением и можно ставить примерно 300 против 1, что подобное не повторится (ср. с ответом к задаче 43 § 10). г) Дни рождения. Дни рождения г человек образуют выборку объема г из совокупности всех дней года. Годы не одинаковы по продолжительности, и мы знаем, что рождаемость в течение года не остается постоянной. Однако в первом приближении можно считать, что в году 365 дней, и рассматривать случайный выбор людей вместо случайного выбора дней рождения. В этих предположениях, используя равенство (3.1), получаем, что вероятность того, что все г дней рождения различны, равна1) -w)- <3'2» Численные результаты снова удивительны. Так, для г=23 человек мы имеем р<1/2, т. е. для 23 человек вероятность того, что по крайней мере у двух из них дни рождения совпадают, превосходит 1/2. Формула (3.2) кажется громоздкой, но для р легко получить хорошее численное приближение. Если г мало, можно пренебречь перекрестными произведениями 2) и получить в первом приближе- нии 3) J 1+2+«*» + (^—О J Г (Г—1) zg пч Зб5 1 730 . Для г= 10 точное значение р=0,883..., тогда как (3.3) дает прибли- жение 0,877. Для больших 4) г мы получим гораздо более точное приближение, х) См. von Mises R., Uber Aufteilungs- und Besetzungs-Wahrscheinlichkeiten, Revue de la Faculte des Sciences de 1’Universite d’Istanbul, N. S., 4 (1938—1939)- 145-163. 2) To есть членами вида (i/365)(/7365), (j/365)(//365)(^/365) и t. д.— Прим, перев. 3) Знак « означает, что равенство только приближенное. Произведения вида (3.2) встречаются часто, и описываемый метод приближения широко применяется. 4) Точнее говоря, для г, больших, чем рассматривавшиеся выше, но малых по сравнению с числом дней в году,— Прим, перев,
54 Гл. II. Элементы комбинаторного анализа используя логарифмы. Для малых положительных х log(1— ж—х, и, таким образом, из (3.2) имеем log^-l+2+..^ + ^-1) = r(r-l) 730 * (3.4) Для г=30 это приводит к приближенному значению 0,3037, в то время как точное значение р=0,294. Для г^40 погрешность в (3.4) не превосходит 0,08 (к этим вопросам мы вернемся в § 7; см. также ответ к задаче 44 § 10). § 4. ПОДМНОЖЕСТВА И РАЗБИЕНИЯ Как и ранее, будем использовать термин генеральная совокупность объема п для обозначения множества из п элементов безотноситель- но к их порядку. Две генеральные совокупности считаются различ- ными только тогда, когда одна из них содержит элемент, не содер- жащийся в другой. Рассмотрим подмножество объема г из заданной генеральной совокупности, состоящей из п элементов. Произвольная нумерация элементов этого подмножества превращает его в ’ упорядоченную выборку объема г, и обратно, каждая такая выборка может быть получена указанным путем. Так как г элементов можно занумеро- вать г\ различными способами, отсюда следует, что число упорядо- ченных выборок объема г в г! раз больше, чем число подмножеств объема г. Поэтому число подмножеств объема г равно (п)г/г!. Выра- жения такого вида известны как биномиальные коэффициенты и обычно обозначаются так: /п\ Wr п (п—1).....(п-г-|-1) Таким образом, доказана следующая теорема. Теорема 1. Генеральная совокупность из п элементов имеет различных подмножеств объема г^.п\ Иначе говоря, подмножество из г элементов может быть выбрано различными способами. Такое подмножество однозначно опре- деляется п—г элементами, не принадлежащими ему и образующими подмножество объема п—г. Отсюда следует, что подмножеств объема п—г существует ровно столько же, сколько и подмножеств объема г, и, следовательно, для должно быть f п \ \n-rj* п г (4.2)
§4, Подмножества и разбиения 5$ Для того чтобы непосредственно доказать (4.2), заметим, что би- номиальный коэффициент (4.1) можно записать в виде п\ я! Г ) ~ г! (я—г)! (для этого достаточно умножить числитель и знаменатель (4.1) на (п—г)!). Заметим, что для г = 0 левая часть (4.2) не определена, а правая определена. Для того чтобы (4.2) было справедливо для всех целых г, таких, что 0 г п, мы положим и (п)0=1, (J)=l, 01 = 1 (4.4) Примеры.; а) Бридж и покер (см. примечание к § 1 гл. I). Поря- /52\ док карт игрока несуществен, и, следовательно, имеется ([3) = 1=635013 559600 различных комбинаций карт у одного игрока /52 \ при игре в бридж и ( 5 ) = 2598960 при игре в покер. Найдем вероятность х того, что при игре в покер фиксированный игрок имеет пять различных по значению карт. Значения карт могут быть выбраны ^5) способами, и для каждого значения мы свободны в выборе любой из четырех мастей. Отсюда следует, что x=t &4'\.5,/\.5) » что приблизительно равно 0,5071. Для бриджа /52\-1 вероятность тринадцати различных значении карт равна 41? I jg 1 , или приблизительно 0,0001057. б) Каждый из 50 штатов представлен двумя сенаторами. Рас- смотрим события, состоящие в том, что в комитете из 50 случайно выбранных сенаторов: 1) представлен данный штат, 2) представлены все штаты. В первом случае проще найти вероятность q противоположного события, а именно что данный штат не представлен. Всего имеется 100 сенаторов и 98 из них не из данного штата. Следовательно, /98\/100\-1 50-49 п ол-тлт 9 = (.50Д50; =кхГ99 = 0’24747- * * • Далее, из теоремы § 2 следует, что комитет, содержащий по одному сенатору из каждого штата, может быть образован 25° различными способами. Поэтому вероятность того, что все штаты представлены /100V11 в комитете, равна р=*2?°( 59 I . Используя формулу Стирлинга (см. § 9), можно показать, что р са К2л-5-2“5° « 4,126- 10-w. в) Задача о размещении. Еще раз рассмотрим случайное раз-
56 Гл. II. Элементы комбинаторного анализа мещение г шаров по п ящикам (т. е. каждое из пг возможный размещений имеет вероятность п~г). Для того чтобы найти веро- ятность рк того, что фиксированный ящик содержит ровно k шаров, заметим, что k шаров можно выбрать способами, а ос* тавшиеся г—k шаров можно разместить в оставшихся п—1 ящи- ках (п—1)Г-А способами. Отсюда следует, что /г\ 1 , . ( г\ 1 /, 1 у-л .. -х Рк~\k) * nr' (n— ”\k)’ ~ ~п) ‘ (4’5) Это частный случай так называемого биномиального распределения, которое будет изучено в гл. VI. Численные значения будут приве, дены в табл. 3 гл. IV. ► Различиемежду различимыми и неразличимыми элементами име- ет сходство с отношением между подмножеством и соответствующей упорядоченной выборкой. Вычеркивая все индексы в упорядочен- ной совокупности (или группе) из г элементов «!,..., аг, получаем совокупность г неразличимых букв. Обратно, произвольным об- разом занумеровав г неразличимых букв, получим упорядоченное множество аг, . . ., аТ. Эта процедура дает г! различных наборов при условии, разумеется, что любая перестановка и ак производит переупорядочение. Следующие примеры показывают, как этот принцип можно распространить на ситуации, когда элементы ак лишь частично являются неразличимыми. Примеры, г) Флаги одного или двух цветов. В примере 1, е) было показано, что г флагов можно вывесить на п шестах Af=n(«+l)x X... X (n+r—1) различными способами. Теперь мы рассмотрим ту же задачу для флагов одного цвета (рассматриваемых как неразли- чимые). Занумеровав флаги при таком способе вывешивания, полу- чим ровно rl способов вывешивания г различимых флагов, и, сле- довательно, г флагов одного цвета можно вывесить N 1г\ способами. Предположим, далее, что р флагов красные (и неразличимые между собой) и q — синие (где p+q—г). Легко видеть, что каждый способ вывешивания г занумерованных флагов может быть получен нумерованием красных флагов от 1 до р и синих флагов — от р+1 до p+q. Отсюда следует, что число различных способов вывешива- ния теперь равно N/(plq\). д) Последовательности, содержащие два типа элементов. Рас- смотрим число последовательностей длины p+q, состоящих из р букв альфа и q букв бета. Занумеровав альфы от 1 до р и беты от р+1 до p+q, получим упорядоченную последовательность из p+q различимых элементов. Таких последовательностей имеется (p+q)l, и ровно р!^! среди них соответствуют одному и тому же порядку альф и бет. Таким образом, р альф и q бет можно расположить
g 4. Подмножества и разбиения 67 ровно (р+<7)! (Р + Я\_( р+я\ pW \ Р / \ <7 / различимыми способами. . Тот же самый результат непосредственно следует из теоремы 1 и того факта, что все расположения р альф и q бет могут быть полу- чены выбором р из p+q возможных мест и помещением на эти места альф. е) Число кратчайших путей (составленных из сторон клеток шахматной доски), соединяющих нижний левый и верхний правый углы шахматной доски, равно ( о ) = 12 870. ► (4.7) п—G—г2 Теорема 2. Пусть г±, гh — целые числа, такие, что Г1+г2+. . .+rh-=n, r^Q. (4.6) Число способов, которыми генеральную совокупность из п элементов можно разделить на k упорядоченных частей (разбить на k под- множеств), из которых первая содержит г± элементов, вторая г$ элементов и т. д., равно _____п!_____ гх! г2Ь ... •/>! * (Числа (4.7) называются полиномиальными коэффициентами.) Отметим, что порядок подмножеств существен в том смысле, что г2—3) и (Г1?=3, г2—2) представляют собой разные разбиения; однако игнорируется порядок внутри групп. Отметим также, что 0! = 1, так что обращение гг в нуль не влияет на формулу (4.7). Так как Гг?=О допускается, п элементов разбиваются на k или менее под- множеств. Случай rz>0 разбиения ровно на k подмножеств рассмат- ривается в задаче 7 § 11. Доказательство. Повторное использование (4.3) показывает, что число (4.7) можно переписать в виде п—г±— ... ~rk_2\ /л оч \ г /Х r м г Г---------------а г п 2 ). (4.8) \г1/ \ G / \ / \ ) С другой стороны, для того, чтобы осуществить требуемое разбие- ние, мы должны сначала выбрать п элементов из данных п; из ос- тавшихся п—Г1 элементов мы выбираем вторую группу размера и т. д. После образования (k—1)-й группы остается п—1\—г2—. . .— —rh-i—fh элементов, образующих последнюю группу. Мы заключа- ем, что (4.8) на самом деле выражает число способов, которыми мо- жет быть выполнена операция разбиения. ► Примеры, ж) Бридж. При этой игре 52 карты делятся на четыре равные группы, и поэтому число различных раскладов равно 52! х д
58 Гл. II. Элементы комбинаторного анализа X (13!)~4= (5,36...) • 1028. Найдем теперь вероятность того, что каж- дый игрок имеет туза. Четыре туза можно упорядочить 4! =24 спосо- бами, и каждый порядок представляет одну возможность получения одного туза каждым игроком. Оставшиеся 48 карт можно распреде- лить (48!)-(12!)”4 способами. Следовательно, искомая вероятность равна 24-48!-(13)4/52!=0,105... . з) Игральные кости. В результате бросания двенадцати играль- ных костей может быть 612 различных исходов, каждому из которых мы приписываем одинаковую вероятность. Событие, состоящее в том, что каждая грань появляется дважды, может осуществиться столькими способами, сколькими двенадцать костей можно разбить на шесть групп по две в каждой. Следовательно, вероятность этого события есть 12!/(26’612)=0,003438... . § 5*). ПРИЛОЖЕНИЕ К ЗАДАЧАМ О РАЗМЕЩЕНИИ Примеры гл. I, 2 показывают широкую применимость модели случайного размещения г шаров по п ящикам. Во многих ситуациях необходимо считать шары неразличимыми. Например, в статисти- ческих исследованиях распределения автомобильных катастроф по дням недели или дней рождения по дням года интересуются лишь числом событий, а не ими самими. Далее, бросание г игральных костей эквивалентно размещению г шаров в п=6 ящиках. Хотя воз- можно следить за г отдельными результатами, обычно предпочи- тают указывать число единиц, двоек и т. д. В таких случаях мы можем по-прежнему предполагать шары занумерованными, но со- средоточить внимание на событиях, не зависящих от нумерации. Такое событие полностью описывается числами заполнения г19 Пу . . .,гп, где rk означает число шаров в k-м ящике. Каждый набор из п целых чисел, удовлетворяющих соотношениям Г1+г2+. . .+гп^=г, (5.1) описывает возможную комбинацию чисел заполнения. В случае неразличимых шаров два размещения различимы только тогдау когда соответствующие наборы (ri, . . гп) не одинаковы. Докажем те- перь следующую лемму. Лемма, (i) Число различимых размещений (т. е. число различных решений уравнения (5.1)) равно1) _/ra + r-l\_/n + r П г П—1 /• (и) Число различимых размещенийу при которых ни один ящик fr—ц не остается пустым у равно 1п____। ). *) Материал этого параграфа полезен и нагляден, но не будет непосредст- венно использоваться в дальнейшем. Частный случай г=100, п=4 был использован в примере гл» If 2t д).
§ 5, Приложение к задачам о размещении 59 Доказательство. Обозначим шары звездочками и изобразим п ящиков в виде п промежутков между п+\ вертикальными черточ- ками. Например, |***|*||||****| используется для обозначения раз- мещения г—8 шаров в п=6 ящиках так, что эти ящики содержат соответственно 3, 1,0, 0, 0, 4 шаров. При таком обозначении в на- чале и в конце обязательно стоят черточки, но остальные п—1 чер- точек и г звездочек могут быть расположены в произвольном по- рядке. Отсюда вытекает, что число различимых размещений равно числу способов выбора г мест из пА~г—1, а именно Аг,п. Условие, что ни один из ящиков не оказался пустым, означает, что нет двух стоящих рядом черточек. Между г звездочками име- ются г—1 промежутков, в п—1 из которых помещено по черточке; таким образом, мы имеем____j ^выборов, и утверждение доказано. Примеры, а) Существует ( 5 ) различимых исходов бросания г неразличимых игральных костей. б) Частные производные. Частные производные порядка г ана- литической функции f (xt, ..х„) от п переменных не зависят от порядка дифференцирования, а зависят только от того, сколько раз функция дифференцируется по каждому переменному. Таким образом, каждое переменное играет роль ящика, и, следовательно, /п-4-r—1\ в этом случае существует I ' ) различных частных производ- ных порядка г. Функция трех переменных имеет пятнадцать про- изводных четвертого порядка и 21 производную пятого порядка. > Рассмотрим теперь п фиксированных целых чисел, удовлетво- ряющих (5.1). Число размещений г шаров по п ящикам, при которых в ящиках содержится соответственно rj.....гп шаров, дается тео- ремой 2 § 4. Предполагая, что все пг возможных размещений равно- вероятны, получаем, что вероятность такого заполнения равна [г!/(гх!г2!... .тл!)]п- (5.3) Такое распределение вероятностей было использовано во всех упоминавшихся до сих пор приложениях, и считалось само собой разумеющимся, что это использование присуще интуитивному по- нятию случайности. Никакое альтернативное распределение, ос- нованное на вероятностных или интуитивных соображениях, даже не предлагалось. Поэтому большой методологический интерес пред- ставляет тот факт, что опыт заставил физиков заменить распреде- ление (5.3) другими, которые вначале противоречили интуиции. Это будет обсуждено в следующем разделе. В физике (5.3) известно как распределение Максвелла — Больцмана. В ряде случаев необходимо пойти дальше и рассматривать сами ящики как неразличимые: этим достигается то, что порядок чисел заполнения становится
60 Гл. II» Элементы комбинаторного анализа несущественным. Следующий пример поясняет стандартный метод решения полу- чающихся при этом задач. Пример, в) Размещения г=7 шаров по п=7 ящикам (ящики можно интер- претировать как дни недели, а шары как телефонные звонки, письма, происше- ствия и т. д.). Для определенности рассмотрим размещения с числами заполнения 2, 2, 1, 1, 1, 0, 0, расположенными в произвольном порядке. Эти семь чисел запол- нения порождают разбиение семи ящиков натри подмножества (категории), сос- тоящие соответственно из двух ящиков, содержащих по два шара, трех ящиков, содержащих по одному шару, и двух пустых ящиков. Такое разбиение на три группы объема 2, 3 и 2 может быть выполнено 71/ (2! *3! -2!) способами. Каждому отдельному сопоставлению чисел заполнения семи ящикам соответствует 7!/ (2! - 2! • 1! • 1! • 1! • 0! -0!)=7!/(2! *2!) различных распределений г—7 шаров по семи ящикам. Таким образом, общее число размещений, таких, что числа заполнения совпадают с числами 2, 2, 1, 1, 1, 0, 0, расположенными в определенном порядке, равно [7!/(2! 3! 2!)] [71/(2! 2!)]. (5.4) Отметим, что этот результат был получен двойным применением формулы (4.7), а именно и к шарам, и к ящикам. Тот же самый результат можно было бы получить й переформулировать многими способами, однако настоящий метод обеспечива- ет самый простой путь решения разнообразных задач (см. задачи 43—45 § 10). В табл. 1 приведены числа, аналогичные (5.4), и вероятности для всех возможных наборов чисел заполнения в случае г=п=7, Таблица 1 Случайное размещение 7 шаров по 7 ящикам Числа заполнения Число размещений равно 71X71, деленному на Вероятность (число размещений, деленное на 77) 1, 1, 1, 1> Ь 1, 1 71X11 0,006 120 2, 1,1, 1, 1, 1, 0 51x21 0,128518 2, 2, 1, 1, 1, 0, 0 2! 3121x2121 0,321295 2, 2, 2, 1, 0, 0, 0 3131x212121 0,107 098 3, 1, 1, 1, 1, 0, 0 4121X31 0,107 098 3, 2, 1, 1, 0, 0я 0 2131X3121 0,214 197 3, 2, 2, 0, 0, 0, 0 2141x312121 0,026 775 3, 3, 1, 0, 0, 0, 0 2141X313! 0,017 850 4, 1, 1, 1, 0, 0, 0 3131X4! 0,035 699 4, 2, 1, 0, 0, 0, 0 41X412! 0,026 775 4, 3, 0, 0, 0, 0, 0 51X413! 0,001 785 5, 1, 1, 0, 0, 0, 0 2141x5! 0,005 355 5, 2, 0, 0, 0, 0, 0 51X512! 0,001 071 6, 1, 0, 0, 0, 0, 0 51X6! 0,000 357 7, 0, 0, 0, 0, 0, 0 61X7! 0,000 008 а. Статистика Бозе — Эйнштейна и Ферми — Дирака Рассмотрим механическую систему, состоящую из г неразличи- мых частиц. В статистической механике обычно разбивают фазовое пространство на большое число п малых областей или ячеек, так
§ 5. Приложение к задам о размещении 61 что каждая частица приписывается ровно одной ячейке. В резуль- тате состояние всей системы описывается как случайное размеще- ние г частиц по п ячейкам. На первый взгляд кажется, что (во вся- ком случае при подходящем выборе п ячеек) все пг размещений бу- дут равновероятны. Если это так, то физики говорят о статистике Максвелла — Больцмана (термин «статистика» используется здесь в смысле, специфическом для физики). Делались многочисленные попытки доказать, что физические частицы ведут себя в соответст- вии со статистикой Максвелла — Больцмана, однако современная теория, вне сомнения, показала, что эта статистика не применима ни к каким известным частицам; ни в одном случае все пг разме- щений не являются примерно равновероятными. Были введены две различные вероятностные модели, каждая из которых удовлетво- рительно описывает поведение некоторого класса частиц. Достоин- ства конкретной модели зависят от успешности ее применения. Ни одна из них не претендует на универсальность, и не исключено, что когда-нибудь для некоторого класса частиц будет введена новая модель. Вспомним, что здесь мы имели дело только с неразличимыми частицами. Мы имеем г частиц и п ячеек. В статистике Бозе — Эйнштейна рассматриваются только различимые размещения, и каждому из них приписывается вероятность \1АТ,п> где Агп оп- ределяется формулой (5.2). В статистической механике показано, что это предположение справедливо для фотонов, атомных ядер и атомов, содержащих четное число элементарных частиц *). Для описания других частиц должно быть введено третье возможное распределение вероятностей. Статистика Ферми — Дирака ос- нована на следующих предположениях: 1) в одной ячейке не могут находиться две или более частиц и 2) все различимые размещения, удовлетворяющие первому условию, имеют одинаковую вероят- ность. Для выполнения первого предприятия необходимо, чтобы Тогда размещение полностью описывается указанием того, какие из п ячеек содержат частицу, и, так как существует г частиц, соответствующие ячейки могут быть выбраны способами. Сле- „ (п\ довательно, в статистике Ферми — Дирака существует ( г) воз- можных размещений, каждое из которых имеет вероятность Эта модель применима к электронам, нейтронам и протонам. Здесь мы имеем поучительный пример невозможности выбора и обосно- вания вероятностной модели на основании априорных соображений. Действительно, нет оснований говорить, что фотон и протон не под- чиняются одним и тем же вероятностным законам. (Существенные *) См. Margenau Н., Murphy G. М., The mathematics of physics and chemistry, New York, Van Nostrand, 1943, Ch, 12, n\“®. rj
62 Гл. II. Элементы комбинаторного анализа различия между статистиками Максвелла — Больцмана и Бозе — Эйнштейна обсуждаются в задачах 14—19 §11.) Подведем итог: вероятность того, что ячейки с номерами 1, 2, ...» п содержат г±, г^, . . ., гп частиц соответственно (где гх+ +. . .+гп==г), дается формулой (5.3) в случае статистики Макс- велла— Больцмана; она равна \!АГ п в случае статистики Бозе — (п\~* Эйнштейна, и при условии, что каждое г; равно 0 или 1 * равна ( r 1 в случае статистики Ферми — Дирака. Примеры, а) Пусть п = 5, г = 3. Размещение | * |—| я-1 * |—| имеет вероятность 6/125, 1/35 или 1/10 в зависимости от того, исполь- зуется ли статистика Максвелла—Больцмана, Бозе—Эйнштейна или Ферми—Дирака. Смотри также пример гл. 1,6,6). б) Опечатки. Книга содержит п символов (букв), г из которых являются опечатками. Распределение опечаток соответствует рас- пределению г частиц по п ячейкам, причем в каждой ячейке не мо- жет содержаться больше одной частицы. Поэтому естественно пред- положить, что приближенно для опечаток имеет место статистика Ферми — Дирака. (См. задачу 38 § 10.) б. Применения к сериям Рассмотрим некоторую упорядоченную последовательность, состоящую из элементов двух типов. Отрезок этой последовательности, состоящий из однотип- ных элементов и ограниченный с обеих сторон элементами другого типа, называ- ется серией. Например, последовательность ааофааРРРа начинается серией альф длиной 3, за которой следуют серии длиной 1, 2, 3, 1 соответственно. Серии из альф и бет чередуются так, что общее число серий всегда равно числу пар стоящих рядом разнотипных элементов плюс единица. Примеры применений.- Теория серий имеет многочисленные применения в статистике, однако главным образом она используется в задачах проверки слу- чайности и однородности. а) При проверке случайности задача состоит в том, чтобы решить, свойственна ли данному наблюдению случайность или в его основе лежат определенные за- кономерности. В качестве простого примера предположим, что наблюдениег) привело к следующему распределению свободных и занятых мест в кафе: СЗССЗСССЗСССЗСЗС. Заметим, что никакие два соседних места не заняты. Может ли это быть случайным? Из пяти занятых и одиннадцати свободных мест можно получить не более одиннадцати серий и в данном наблюдении получено именно такое их число. Позже будет показано, что если бы все варианты выбора ^ест пятью посетителями были равновероятны, то вероятность одиннадцати серий была бы равна 0,0578... . Столь малая вероятность вселяет подозрение, что имеет место тенденция к умышленному разделению. Это подозрение не может быть дока- вано статистическими методами, но дальнейшее подтверждение этого может быть получено в результате последующих наблюдений. Если кафе часто посещается семьями, то должна быть тенденция занимать соседние места, и это должно при- вести к относительно малому числу серий. Аналогично подсчет серий мальчиков и девочек, сидящих в классе, может обнаружить перемешивание, большее или меньшее случайного. Неправдоподобные расположения дают ключ к пониманию х) Swed F. S., Eisenhart С., Tables for testing randomness of grouping in a Sequence of alternatives, Ann. Math. Statist., 14 (1943), 66—87»
§ 6. Гипергеометрическое распределение 63 вызывающих их причин: избыток серий указывает на сильное перемешивание* недостаток — на сильную группировку. Конечно, эти заключения нельзя считать надежным доказательством, однако существующие эффективные статистические методы позволяют свести к минимуму риск сделать неверные выводы. Теория серий, как показал Шухарт, оказывается полезной при контроле ка- чества продукции. Изготовленные шайбы могут различаться по толщине. Длин- ные серии толстых шайб указывают на возможные неполадки в производственном процессе и заставляют устранять причины; таким образом предупреждается появ- ление брака и достигается большая однородность изготовляемой продукции* В полевых биологических экспериментах подсчитывают последовательности здоровых и больных растений, и длинные серии последних заставляют подозре- вать заражение. Метеоролог следит за чередованием сухих и влажных месяцев x)t чтобы найти ключ к разгадке закономерностей установления погоды. б) Для понимания типичных задач проверки однородности предположим, что на двух группах пациентов испытываются два вида лекарств или что мы интересуемся сравнительной эффективностью двух методов (в медицине, сель- ском хозяйстве или промышленности). Практически мы будем иметь два мно- жества наблюденных значений, скажем а1} а2, аа и ръ р2, •••» Рб, со- ответствующих двум методам или представляющих собой некоторые характе- ристики (такие, как вес) элементов двух совокупностей. Альфы и беты явля- ются числами, которые мы будем предполагать расположенными в порядке возрастания: <: а2 аа и pi гС р2*С • • • «С Рь- Теперь объединим оба множества в одну последовательность, элементы которой расположены в по- рядке возрастания. Крайним случаем является случай, когда все альфы пред- шествуют всем бетам, и это может рассматриваться как указание на большую разницу между двумя методами или совокупностями. С другой стороны, если оба метода одинаково эффективны, то альфы и беты должны располагаться в более или менее случайном порядке. А. Вальд и Дж. Вольфовиц* 2) пока- зали, что теория серий может быть успешно применена для обнаружения малых систематических различий (иллюстрирующий это пример, рассмотрен- ный, правда, другим методом, будет дан в гл. III, 1,6)). Большое число задач, связанных с сериями, могут быть решены чрезвы- чайно простым способом. Пусть даны а неразличимых альф и b неразличимых бет; из примера 4, д) мы знаем, что существуют различимых упоря- дочений. Если имеется п± серий из альф, то число серий из бет с необходим мостью равно одному из чисел п± ± 1 или nj. Получение из а альф п± серий эквивалентно размещению их по ячейкам так, что ни одна из последних не останется пустой. Из последней леммы следует, что это может быть сде- лано различимыми способами, Отсюда, например, следует, что суще- ствует (^«7 ) последовательностей, содержащих ni серий из альф и «1+1 серий из бет (продолжение в задачах 20—25 § 11). в) В физике теория серий используется для изучения кооперативных явле- ний. В теории одномерных решеток Изинга энергия зависит от числа соседних элементов разного типа, т. е. от числа серий. ► § 6. ГИПЕРГЕОМЕТРИЧЕСКОЕ РАСПРЕДЕЛЕНИЕ Многие задачи комбинаторики могут быть сведены к следующей модели. В генеральной совокупности из п элементов имеется ид х) Cochran W. G., An extension of Gold’s method of examining the apparent persistence of one type of weather, Quarterly Journal of the Royal Meteorological Society, 64, No. 277 (1938), 631—634. 2) Wald A., Wolfowitz J., On a test whether two samples are from the same population, Ann. Math. Statist., 2(1940), 147—162.
Гл. II. Элементы комбинаторного анализа элементов красного цвета и п2—п—пг черного. Случайным образом выбирается группа из г элементов. Найдем вероятность qh того, что так выбранная группа будет содержать ровно k красных эле- ментов. Здесь k может быть любым целым числом между нулем и наименьшим из чисел и г. Для того чтобы найти qk, заметим, что выбранная группа со- стоит из k красных и г—k черных элементов. Красные элементы могут быть выбраны различными способами, а черные й1) способами. Так как любой выбор красных элементов может ком- бинироваться с любым выбором черных, имеем Определенный таким образом набор вероятностей называется ги- пергеометрическим распределением Используя (4.3), можно пе- реписать (6.1) в виде Замечание. Вероятности qk определены только для k, не превос- ходящих г или пъ но, так как при b>a (&)=0, из формул (6.1) и (6.2) следует, что gfe=0, если либо либо k>r. Следовательно, определения (6.1) и (6.2) могут использоваться для всех при условии, что соотношение qk^= 0 интерпретируется как невозмож- ность такого выбора. Примеры, а) Проверка качества. При контроле качества продук- ции выборочной проверке подвергается партия из п изделий. Де- фектные изделия в партии играют роль красных элементов. Их чис- ло конечно, не известно. Производится выборка объема г и оп- ределяется число k дефектных изделий в ней. Тогда формула (6.1) позволяет нам сделать выводы относительно истинного значения П1-; это типичная задача статистического оценивания, выходящая, однако, за рамки данной книги. б) В примере 4, б) генеральная совокупность состоит из п=100 сенаторов, из которых лгх=2 представляют данный штат (являются «красными»). Случайным образом выбирается группа из г=50 се- наторов. Она может включать й=0, 1 или 2 сенаторов из данного штата. Из (6.2), учитывая (4.4), находим q0=qt= (50-49)/(100-99) =0,24747..., ^=50/99=0,50505.... Это значение qQ было получено другим способом в примере 4, б). х) Это название объясняется тем, что производящая функция (см. гл. XI) последовательности {qk} может быть выражена через гипергеометрические функции.
§ 6. Гипергеометрическое распределение 65 в) Оценка размера популяций по данным повторного отлова х). Предположим, что из озера вылавливают 1000 рыб, помечают их красной краской и выпускают обратно. При повторном отлове 1000 рыб среди них оказалось 100 помеченных. Какие выводы мож- но сделать относительно числа рыб в озере? Это типичная задача статистического оценивания. Мъ\ зашли бы слишком далеко, если бы стали описывать разнообразные методы, которые может исполь- зовать современный статистик, однако мы покажем, как гипергео- метрическое распределение дает ключ к решению этой задачи. Мы предполагаем, конечно, что результаты двух отловов можно рас- сматривать как случайные выборки из совокупности всех рыб в озере (на практике это предположение исключает тот случай, когда два отлова производятся в одном и том же месте и за короткий про- межуток времени). Мы предполагаем также, что число рыб в озере не меняется между двумя отловами. Обобщим задачу, рассмотрев выборки произвольного объема. Пусть п — (неизвестное) число рыб в озере, пг — число рыб в пер- вом улове (играющих роль красных элементов), г — число рыб во втором улове, k — число помеченных рыб во втором улове, qh (п) — вероятность того, что второй улов содержит ровно k помеченных рыб. При такой постановке задачи qh(n), очевидно, вычисляется по формуле (6.1). На практике щ, г и k могут наблюдаться, а п неиз- вестно. Отметим, что мы рассматриваем п как неизвестное число, ко- торое никоим образом не зависит от случая. Мы знаем, что было пой- мано П1+г—k различных рыб и поэтому —k. Это все, что можно сказать с полной уверенностью. В нашем примере Пх—г^ •=1000 и А=100; возможно, что в озере обитает только 1900 рыб, однако, отправляясь от этого предположения, мы придем к заклю- чению, что осуществилось событие фантастически малой вероятно- сти. Действительно, при предположении, что имеется всего п=1900 рыб, вероятность того, что две выборки объема 1000 каждая пол- ностью исчерпают всю генеральную совокупность, согласно (6.1), равна 1000 ( 900 (1900 V1 (1000!)2 100 ) \ 900 ) \ 1000 ) — 1001 1900! ’ Формула Стирлинга (см. § 9) показывает, что эта вероятность яв- ляется величиной порядка 10“430, и в такой ситуации здравый смысл заставляет отбросить наше предположение как неправдоподобное. Та же причина заставит нас отбросить предположение, что п очень х) Приводя этот пример в первом издании, мы не знали, что описанный метод широко используется на практике. Из работ по этому вопросу отметим Bailey N. Т. J., On estimating the size of mobile populations from recapture data, Biomet- rika, 38 (1951), 293—306 и Chapman D.G., Some properties of the hypergeometrio distribution with applications to zoological sample censuses, University of Cali- fornia Publications in Statistics, 1 (1951), 131—160» 3 № 221
66 Гл, IJ. Элементы комбинаторного анализа велико, скажем равно миллиону. Эти соображения побуждают нао искать такое значение п, при котором qk (п) достигает своего наиболь- шего значения, поскольку для такого п наше наблюдение имеет максимальную вероятность. Для каждого фиксированного набора наблюденных значений пи г, k значение п, при котором мак- симально, обозначается через п и называется оценкой максимального правдоподобия для п. Это понятие было введено Фишером. Для на- хождения п рассмотрим отношение Як (п)/[Як (« — 0] = («—«1) (П—r)/[(n—г 4-Al) л]. (6.3) Простые вычисления показывают, что это отношение больше еди- ницы при nk<ji±r и меньше единицы при nk^n^. Это означает, что с возрастанием п последовательность qh (п) сначала возрастает, а затем убывает; она достигает максимума, когда п является наиболь- шим целым числом, не превосходящим Пуг/k, так что п приблизи- тельно равно Пхг/k, В нашем конкретном примере оценка максималь- ного правдоподобия для числа рыб равна Я = 10 ООО. Истинное значение п может быть больше или меньше п, и можно поставить задачу нахождения пределов, о которых можно с доста- точной степенью уверенности сказать, что п находится внутри их. С этой целью проверим предположение, что п меньше, чем 8500. Подставим в (6.1) л=8500, п^г^ 1000 и найдем вероятность того, что второй улов содержит не более 100 помеченных рыб. Эта вероят- ность равна х= 7o+<7i+. . .+<7юо. Непосредственное вычисление х громоздко, однако, используя нормальное приближение (см. гл. VII), мы легко находим, что х=0,04. Аналогично, если п—12 000, то ве- роятность того, что второй улов содержит 100 или более помечен- ных рыб, примерно равна 0,03. Эти данные подтверждают предпо- ложение, что число рыб находится где-то между 8500 и 12 000. Су- ществуют другие способы получения этих выводов и другие методы оценивания, но мы не намерены обсуждать детали. ► Из определения вероятностей qk следует, что 9о + 91 + 92+‘ • . = 1. Из формулы (6.2) поэтому вытекает, что для любых положительных целых п, n-i и г (г\(п—г\ . (г\( п—г \ . , / r\fn—r\ / п\ (од 1/+'”+\«i/\ 0 / («J' Это тождество часто бывает полезным. Мы доказали его лишь для положительных целых п и г, но оно остается справедливым без этого ограничения для произвольных положительных или отрицательных /гиг (это равенство не имеет смысла, когда пг не является положи- тельным целым). (Указания на два способа доказательства даны в задачах 8 и 9 § 12.)
§ 7. Примеры, связанные с временем ожидания 67 Гипер геометрическое распределение легко обобщить на случай, когда исходная генеральная совокупность объема п содержит не- сколько классов элементов. Например, пусть генеральная сово- купность содержит три класса объемом п*, п2 и и—П1—п2 соответ- ственно. Если извлекается выборка объема г, то вероятность того, что она содержит k± элементов первого класса, k2 элементов второго и г—k±—k2 элементов третьего, по аналогии с (6.1) равна ni\ f п—ni — п%\ (п Vх М \А/ \ г~К—^2/ V / * (6-5) Разумеется, необходимо, чтобы k2^Jl2, г—kj_—k2^n—/?1—п2. Пример, г) Бридж. Совокупность из 52 карт состоит из четырех классов по тринадцати элементов в каждом. Вероятность того, что у какого-либо игрока будет пять пик, четыре червы, три бубны и одна трефа, равна 13 5 13 4 13 3 13 1 52 13 § 7. ПРИМЕРЫ, СВЯЗАННЫЕ С ВРЕМЕНЕМ ОЖИДАНИЯ В этом параграфе мы отступим от непосредственного изучения комбинаторного анализа, для того чтобы рассмотреть некоторые пространства элементарных событий нового типа, к которым при- водит простая модификация задач о размещении. Рассмотрим еще раз мыслимый эксперимент случайного размещения шаров по п ящикам. Однако на этот раз мы не будем фиксировать заранее число шаров г, а будем помещать шары один за другим до тех пор, пока не возникнет некоторая предписанная ситуация. Две такие возможные ситуации будут обсуждены подробно: (i) Случайное размещение ша- ров продолжается до тех пор, пока некоторый шар впервые попадет в уже занятый ящик. Процесс заканчивается при первом появлении ящика с двумя шарами, (ii) Мы фиксируем какой-либо ящик (ска- жем, ящик номер 1) и продолжаем размещение шаров все время, пока этот ящик остается пустым. Процесс заканчивается тогда, когда в заданный ящик впервые попадет какой-то шар. Несколько интерпретаций этой модели прольют свет на существо проблемы. Примеры, а) Дни рождения. В примере 3, г) с днями рождения число дней в году п=365 и дни соответствуют ящикам, а люди — шарам. Наша модель (i) теперь равнозначна следующему: если мы выбираем людей случайно одного за другим, то сколько их нужно взять, чтобы получить пару с одинаковыми днями рождения? Мо- дель (ii) соответствует ожиданию появления в выборке человека с моим днем рождения. 3*
68 Гл. 11 Элементы комбинаторного анализа б) Заоача о ключе. Человек хочет открыть свою дверь. У него п ключей, из которых только один подходит к двери. По причине, о которой можно только догадываться, он пробует ключи случайно, так что при каждой попытке каждый ключ имеет вероятность быть выбранным /г”1 и все возможные исходы, отвечающие данному числу попыток, равновероятны. Это частный случай модели (ii). Интерес- но сравнить описанный случайный поиск ключа с более системати- ческим подходом (задача 11 § 10; см. также задачу 5 гл. V, 8). в) В предыдущем примере мы можем заменить выбор ключей выбором из произвольной совокупности, скажем из набора купонов. Опять мы хотим узнать, когда ожидается первое повторение выбран- ного элемента или когда некоторый фиксированный элемент будет выбран в первый раз. г) Монеты и игральные кости. В примере гл. I, 5, а) монета бро- сается до тех пор, пока не появится герб. Это частный случай моде- ли (ii) с п^= 2. При бросании игральной кости до появления единицы применяется та же модель с п=6. (Другие времена ожидания рас- сматриваются в задачах 21, 22 и 36 § 10 и в задаче 12 § И.) ► Мы начнем с более простой для понимания модели (i). Для того, чтобы указать, что первый, второй, . . ., r-й шары заняли ящики с номерами /\, /2,.. ., jr и что процесс закончился на r-м шаге, удоб- но использовать набор символов (Д, /2, . . ., Д). Это означает, что ji — целое число между 1 и /г; кроме того, ju . . jr_i все различ- ны, a jr равно одному из них. Каждое упорядоченное множество такого типа представляет собой элементарное событие. Для г воз- можны только значения 2, 3, . . ., /г+1, так как повторное попадание в ящик не может произойти до размещения второго шара или после того, как (/г+ 1)-й шар занял ящик. Связь настоящей задачи с преж- ней моделью размещения фиксированного числа шаров по п ящикам приводит нас к приписыванию каждому элементарному событию (Д, • • •» jr)> соответствующему ровно г шарам, вероятности /г”г. Мы покажем, что такое соглашение допустимо (т. е. что сумма на- ших вероятностей равна единице) и что это приводит к разумным результатам. При фиксированном г совокупность всех элементарных событий (Д, • • •, /г) представляет собой событие, состоящее в том, что про- цесс закончится на r-м шаге. В соответствии с (2.1) числа j19 . . /г-i могут быть выбраны (п)г^ различными способами, а Д мы вы- бираем из г—1 чисел Д, . . ., jr_i. Отсюда следует, что вероят- ность того, что процесс закончится на r-м шаге, равна /1—1). /1£=2\г-1 (71) причем 71—0 и q2=Un. Вероятность того, что процесс будет про- должаться после r-го шага, равна рг=\—(71+72+. • .+7г)> откуда
$ 7. Примеры, связанные с временем ожидания, 69 Р1=1 и ft = ^=(1-7)---(1-Lr). <7-2> что может быть доказано простой индукцией. В частности, pn+f = 0 и 91+ ... +9„+1= 1, как и предполагалось. Кроме того, при п=365 формула (7.2) сводится к (3.2) и в общем случае наша новая модель приводит к тем же количественным результатам, что и пре- дыдущая модель с фиксированным числом шаров. Модель (ii) отличается от (i) тем, что она связана с бесконечным пространством элементарных событий. Последовательности (Д, . . ., /г) подчинены условию, что числа /ъ . . ., отличны от фик- сированного заранее числа а^п, a jr=a. Кроме того, нет никакой априорной причины, что процесс должен когда-нибудь закончиться. При фиксированном г мы снова припишем каждому элементарному событию (/1, . . /г) вероятность п~г, Для каждого из Д, . . ., имеем п—1 возможностей, а для Д выбора совсем нет. Мы получаем поэтому, что вероятность того, что процесс закончится на г-м шаге, равна q\ = \_(n— П/ц]7”1 (1//1), 7 = 1, 2, ... . (7.3) Суммируя эту геометрическую прогрессию, найдем, что 9* + 9» + + ...==1. Так как сумма вероятностей 9* равна единице, нет необ- ходимости вводить элементарное событие, соответствующее тому, что никакой шар не попадет в ящик с фиксированным номером а. Для вероятности того, что процесс будет продолжаться после r-го шага, получаем /?,* = (1--\/пУ, г == 1, 2, ..., (7.4) как и следовало ожидать. Медианой распределения {рД называется такое значение г, для которого /?! + ... + рг_} 1/2, но . + рг > 1/2; это озна- чает, что приблизительно одинаково вероятно, что процесс про- должится после медианы или закончится до нее1). (В примере 3, г) о днях рождения медиана г = 23.) Чтобы вычислить медиану для {ргД перейдем к логарифмам, как это делалось в (3.4). Когда г мало по сравнению с п, мы видим, что —log близок к г2/(2п). *) В общем случае медианой ряда значений Xf . *. ^хп, которые какая-то величина принимает с вероятностями pt, р2, ,рп соответственно^ k п называется значение х с таким индексом k, что 2 Р1^ 1/2 и 2 Р1^ 1/2.-— 1=0 i=& Прим, перев.
70 Гл. II. Элементы комбинаторного анализа Отсюда следует, что медиана {рг} близка к K^-2-log2, или при- ближенно к (6/5) |/п. Интересно, что медиана возрастает как корень квадратный из объема совокупности. В отличие от этого медиана распределения {р/} близка к n-\og2, или 0,7/г, и возрастает линейно с ростом п. Вероятность того, что время ожидания в модели (И) превысит п, равна (1—/г”1)" или приблизительно в"1=0,36788.... § 8. БИНОМИАЛЬНЫЕ КОЭФФИЦИЕНТЫ Мы использовали биномиальные коэффициенты только для целых положительных /г, но очень удобно расширить это определе- ние. Число (х)г, введенное формулой (2.1), а именно (х)Г=х(х—1). . .(х—г+1), (8.1) определено для всех действительных х, если г является целым по- ложительным числом. При r=0 положим (х)0=1. Тогда /х\ (х)г _х(х — 1)...(х— г+1) /о m уг) г! г! ' определяет биномиальные коэффициенты для всех значений х и всех положительных целых г. Для г = 0 положим, как и в (4.4), = 1 и 01 = 1. Для отрицательных целых г определим = г < 0. (8.3) Мы никогда не будем использовать символ , если г не являет- ся целым числом. Легко проверить, что при таком определении мы имеем, на- пример, (~2) = (--1/И+ 1). (8.4) Впоследствии будут использоваться три важные свойства бино- миальных коэффициентов. Первое: для любого целого положитель- ного п ^^ = 0, если либо г>п, либо г < 0. (8.5) Второе: для любого числа х и любого целого г ( ZQ Эти соотношения легко получают из определения. Доказательство третьего соотношения можно найти в курсах математического ана-
§ 9. Формула Стирлинга 71 лиза: для любого числа а и любого —1<7<1 справедлива формула бинома Ньютона (1 +/)а= 1+(^) / + (2) ^2 + (з) ^3+• • • . (8.7) Если а — целое положительное число, то все слагаемые в правой части, содержащие степени t выше ta, автоматически обращаются в нуль и формула справедлива при всех t. Если а не является целым положительным числом, правая часть (8.7) представляет собой бесконечный ряд. Используя (8.4), легко получить, что при а=—1 разложение (8.7) превращается в геометрический ряд 1/(1+/) = 1—. (8.8) Интегрируя (8.8), получаем еще одну формулу, которая окажется полезной впоследствии, а именно разложение натурального логариф- ма в ряд Тейлора log (1 = i-(1/2) Z2 + (1/3) Z3— (1/4) Z4 + ... . (8.9) Часто используются две другие формы соотношения (8.9) . Заменив t на —Z, получим log [1/(1 -/)]=+ + (1/2) Р + (1/3) Р + (1/4)^+... . (8.10) Сложив два последних равенства, имеем (1/2) log [(1+ Z)/(l-t)] = t + (1/3) Z3 + (1/5)Z*+... . (8.11) Все эти разложения имеют место только при —1<Z<1. Много полезных соотношений, получающихся из (8.7), будет приведено в § 12. Здесь мы укажем только, что при целом а=п и t=l из формулы (8.7) следует, что (S) + (?) + (2)+--+(")=2"' <8J2> Эта формула допускает простую комбинаторную интерпретацию. Левая часть представляет собой число способов, которыми множест- во из п элементов можно разделить на два подмножества, если объем первого подмножества может быть любым числом k=0, 1, . . ., п. С другой стороны, такое разделение можно выполнить непосредст- венно, положив, что каждый элемент может принадлежать либо первой, либо второй группе. (Аналогичные рассуждения показыва- ют, что сумма полиномиальных коэффициентов равна kn.) § 9. ФОРМУЛА СТИРЛИНГА Важным инструментом аналитической теории вероятностей яв- ляется классическая формула х), известная как *) Stirling J.? Methodus differentialis, 1730r
72 Гл. 11. Элементы комбинаторного анализа Формула Стирлинга: п\ ~ |/*2я пп+1/2 e“7Z, (9.1) где символ ~ указывает на то, что отношение двух выражений стре- мится к единице при п-+оо. Эта формула неоценима для многих теоретических исследований и может быть также использована для получения хороших числен- ных приближений. Хотя разность левой и правой частей (9.1) неог- раниченно возрастает, в действительности имеет значение лишь от- носительная погрешность. Она равномерно убывает, и приближение Стирлинга необыкновенно точно даже для малых п. Действительно, правая часть (9.1) дает 0,9221 для 1!, 1,919 для 2! и 118,019 для 5! — = 120. Относительные погрешности будут 8, 4 и 2% соответственно. Для 10! =3 628 800 приближение по формуле Стирлинга дает 3 598 600 с погрешностью 0,8%. Для 100! получается погрешность только 0,08%. Вывод формулы Стирлинга. Наша первая задача — получить оценку для log п\ = log 1+log 2+. . ,+log п. (9.2) Так как log х — монотонная функция от х, имеем k Ai+l J logx dx < log k < logxdx. (9.3) k-i k Суммируя no &=1, ...» n, получаем n n + 1 logxdx < logn! < logxdx, (9.4) 0 1 ИЛИ nlog n—n<Iog n\<(n+1) log (n+1)—n. (9.5) Это двойное неравенство наводит на мысль сравнить log п\ с некото- рой величиной, близкой к среднему арифметическому крайних чле- нов. Простейшей такой величиной является (n+l/2)logn—п, и поэтому будем оценивать разность х) dn = log n!—(n+ l/2)log n+n. (9.6) Заметим, что 4-A+1==(n+l/2)log [(n+l)/n]-l. (9.7) Ho n+l_l + l/(2n+l) n ” l-l/(2n+l) ’ ' °' x) Проведенное ниже изящное рассуждение и неравенство (9.14) принадлежа? Роббинсу (Robbins Н. Е,г Amer, Math, Monthly, 62 (1955), 26—29),
J 9. Формула Стирлинга 73 и, используя разложение (8.11), получаем dn dn+1 = ”^5 (2n4-l)4^ ' ’ • * Из сравнения правой части с геометрической прогрессией со зна- менателем (2п-|-1)~* 2 видно, что ° < dn—dn+i < з [(2п+1)2—1] = 12п~12(га4-1) ‘ 10) Из (9.9) заключаем, что последовательность {dn} убывает, в то вре- мя как (9.10) показывает, что последовательность \dn—(12/г)”1} возрастает. Отсюда следует, что существует конечный предел C=\imdn. (9.11) Но в силу (9.6) соотношение dn->C эквивалентно п! ~ ес -пп+1/2 е~п. (9.12) Это и есть формула Стирлинга, только константа С еще не опре- делена. В гл. VII, 2 будет доказано, что Доказатель- ство этого факта является элементарным и не зависит от матери- ала гл. IV—VI; оно отложено до гл. VII потому, что оно есте- ственно связано с теоремой о нормальном приближении1). Уточнения. Мы можем получить неравенство в другую сторону, анало- гичное (9.10). В самом деле, из (9.9) очевидно, что 4— dn+1 > 3 (2„-1-1)2 > 12я4-1 —12 (n+1) +1 • (9> 13) Отсюда следует, что последовательность {dn—(12/г+1)“х} убывает. А так как {</„—(12и)“х} возрастает, выполняется двойное неравенство С+ 1/(12п+ 1) < dn < С+ 1/(12п). (9.14) Заменив в последней формуле dn его выражением (9.6) и положив (пока без доказательства) ес— ]/" 2я, получим У2лпп+1^2 е~п•е^12п+1>)~1 < и! < У 2тп+1^2 е~п -. (9.15) Это двойное неравенство дополняет формулу Стирлинга замечательным обра- зом. Отношение крайных членов близко к 1 — (12/г2)“х, и, следовательно, величина в правой части (9.15) превзойдет n\t но с погрешностью меньшей, чем 9/г”2 %. В действительности погрешность намного меньше2): для п = 2 пра- вая часть (9.15) дает 2,0007, для п = 5 получаем 120,01. х) Обычно доказательство равенства ес=У2п основывается на формуле Валлиса. Простое прямое доказательство см. в статье автора (Feller W.t Amer. Math. Monthly, 1967). 2) Основываясь на (9.9), можно показать, что dn — С+(12/г)“х—. — (360п3) ~х4-*«•, где многоточие означает слагаемые* убывающие быстрее* чем
Гл. JJ. Элементы комбинаМбрного анализа ЗАДАЧИ Замечание. В § 10 включены стандартные упражнения. Задачи теоретического характера и различные дополнения к тексту содержатся в § 11 и 12. § 10. УПРАЖНЕНИЯ И ПРИМЕРЫ Замечание. В каждом случае предполагается, что все комбинации имеют рав- ные вероятности. 1. Сколько можно образовать различных инициалов, если каждый человек имеет одну фамилию и а) ровно два имени, б) не больше двух имен, в) не больше трех имен? 2. В азбуке Морзе буквы представляются последовательностями тире и точек с возможными повторениями. Сколько букв можно составить из десяти или менее символовх)? 3. Каждая кость домино помечается двумя числами. Кости симметричны, так что числа в парах не упорядочены. Сколько различных костей можно образовать, используя числа 1,2,..., и? 4. Числа 1, 2, . . ., и расположены в случайном порядке. Найти вероятность того, что числа а) 1 и 2, б) 1, 2 и 3 расположены рядом в указанном порядке. 5. Игрок А бросает шесть игральных костей и выигрывает, если выпадет хотя бы одна единица. Игрок В бросает двенадцать игральных костей и выигрывает, если выпадут хотя бы две единицы. У кого больше вероятность выиграть * 2)? Указание. Найти вероятности проигрыша. 6. а) Найти вероятность того, что из трех случайно выбранных цифр ровно 2, 1,0 будут повторяться, б) Решить ту же задачу для четырех случайно выбранных цифр. 7. Найти вероятность рг того, что среди г случайно выбранных цифр нет двух равных. Вычислить значение р10 по формуле Стирлинга. 8. Чему равна вероятность того, что среди k случайно выбранных цифр а) не встретится 0; б) не встретится 1; в) не встретится ни 0, ни 1; г) не встретится хотя бы одна из двух цифр 0 или 1? Пусть Л и В обозначают события а) и б). Выразить остальные события через А и В. 9. Найти вероятность того, что при случайном размещении п шаров по п ящикам ровно один ящик останется пустым. 10. На автомобильной стоянке двенадцать мест расположены в один ряд. Некто заметил, что на стоянке находится восемь автомобилей и что четыре сво- бодных места примыкают друг к другу (образуют одну серию). Является ли такое расположение четырех свободных мест неожиданным (указывающим на отсутствие случайности)? 11. Человеку дают п ключей из которых только один подходит к его двери. Он испытывает их последовательно (выбор без возвращения). Этот процесс может потребовать 1, 2, . . ., п испытаний. Показать, что каждый из этих исходов имеет вероятность п-1. 12. Каждая из п палок разламывается на две части — длинную и короткую. Затем 2/г обломков объединяются в п пар, каждая из которых образует новую «пал. -1) То есть сколько существует последовательностей не более чем из десяти тире и точек? — Прим, перев. 2) Это перефразировка вопроса, заданного в 1693 г. И. Ньютону знаменитым в свое время Сэмюелем Пипсом. [Пипс С. (Pepys S., 1633—1703) — выдающийся общественный деятель; в 1684 г. был избран президентом Королевского Общества. Знаменит прежде всего своим тайным дневником, частично опубликованным в 1825 г.— Перев.] Ньютон ответил, что «легкие вычисления» показывают преиму- щество А. В подтверждение он позже представил эти вычисления, но не смог убе- дить Пипса. Короткий документальный отчет см. в статье Schell Е. D., Samuel Pepys, Isaac Newton, and probability, The Amer. Statistician, 14 (1960), 27—30, где содержатся ссылки на Private correspondence and miscellaneous papers of Samuel Pepys, London, G. Bell and Sons, 1926.
§ 10. Упражнения и примеры ку». Найти вероятность того, что а) части будут соединены в первоначальном по- рядке, б) все длинные части будут соединены с короткими + 13. Проверка статистической гипотезы. Некий профессор Корнеллского университета был оштрафован двенадцать раз за незаконную ночную стоянку автомобиля. Все двенадцать штрафов налагались во вторник или в четверг. Найти вероятность этого события. (Имело ли смысл арендовать гараж только на вторники и четверги?) 14. Продолжение. Из двенадцати штрафов ни один не был наложен в воскре- сенье. Свидетельствует ли это о том, что в воскресенье штрафы не налагаются? 15. Ящик содержит девяносто годных и десять дефектных шурупов. Если ис- пользовать десять шурупов, какова вероятность того, что ни один из них не ока- жется дефектным? 16. Из генеральной совокупности, состоящей из пяти символов a, b, cf d, е, производится выборка с возвращением объема 25. Найти вероятность того, что выборка содержит по пяти символов каждого вида. Сравнить результат с таблица- ми случайных чисел 1 2), отождествив цифры 0 и 1 с а, цифры 2 и 3 с b и т. д. 17. Пусть п человек, среди которых находятся Л и В, становятся в ряд* Какова вероятность того, что между А и В окажется ровно г людей? Показать, что, если они становятся не в ряд, а в круг, эта вероятность не зависит от г и, следова- тельно, равна 1/ (п—1). (При круговом расположении рассматривать только дуги, идущие от А к В в положительном направлении.) 18. Чему равна вероятность того, что два бросания трех игральных костей дадут один и тот же результат, если а) кости различимы, б) кости не различимы? 19. Показать, что более вероятно получить хотя бы одну единицу при броса- нии четырех игральных костей, чем хотя бы одну пару единиц при 24 бросаниях! двух костей. Ответ известен под названием парадокса де Мере3). 20. Из генеральной совокупности, содержащей п элементов, извлекается вы- борка объема г. Найти вероятность того, что ни один из N данных элементов не будет содержаться в выборке, предполагая, что выбор производится а) без воз- вращения, б) с возвращением. Сравнить численные результаты при двух способах выбора, когда (i) п—100, л=А=3 и (ii) п—100, г=А/= 10. 21. Распространение слухов. В городе проживает п+1 человек. Один из них, узнав новость, сообщает ее другому, тот — третьему и т. д., причем передача но- вости осуществляется следующим образом: человек, которому сообщена новость, случайным образом выбирает одного из п жителей и сообщает новость ему, тот поступает точно так же и т. д. Найти вероятность того, что новость будет передана г раз без а) возвращения к человеку, который узнал ее первым, б) повторного со- общения кому-либо. Решить ту же задачу, когда на каждом шаге новость сообща- ется одним человеком группе из N случайно выбранных людей. (Первая часть задачи является частным случаем при М=1.) 22. Цепь писем. В генеральной совокупности из п+1 людей человек, назы- ваемый «прародителем», посылает письма двум случайно выбранным людям, об- 1) Когда клетки подвергаются воздействию губительной радиации, некоторые хромосомы (играющие роль наших «палок») разрываются. «Длинными» считаются те части, которые содержат так называемые центромеры. Если соединяются две «длинных» или две «коротких» части, то клетка гибнет. См. Catcheside D. G., The effect of X-ray dosage upon the frequency of induced structural changes in the chro- mosomes of Drosophila Melanogaster, Journal of Genetics, 36 (1938), 307—320, 2) Соответствие порой оказывается удивительно точным; см. Greenwood J. А., Stuart Е. Е. , Review of Dr. Feller’s critique, Journal for Parapsychology, 4 (1940)t 298—319, в особенности с. 306. 3) Неоднократно утверждалось, что эта задача возникла за игорным столом и что в 1654 г. де Мере предложил ее Паскалю. Как полагают, этот случай оказал большое стимулирующее воздействие на развитие теории вероятностей. На самом деле эта задача была поставлена Кардано (1501—1576); см. Ore О., Pascal and the invention of probability theory, Amer. Math. Monthly, 67 (1960), 409—419 и Cardano, the gambling scholar, Princeton, Princeton Univ. Press. 1953.
76 Гл. II. Элементы комбинаторного анализа . ------------------------------------------ ---- -пммм.- ,т ... -а разующим «первое поколение». Они делают то же самое, и вообще каждый полу- чатель письма посылает письма двум случайно выбранным людям независимо от всего предыдущего. Найти вероятность того, что «поколения» с номерами 1,2, . . . * . г не включают в себя «прародителя». Найти медиану распределения, считая п достаточно большим. 23. Семейная задача. В некоторой семье четыре сестры моют посуду по очереди. Из четырех разбитых тарелок три разбито младшей сестрой, и поэтому ее называ- ют неуклюжей. Можно ли ее оправдать, приписывая эти неудачи случайности? Обсудить связь со случайным размещением шаров. 24. Найти вероятность того, что а) дни рождения двенадцати человек придутся на двенадцать разных месяцев года (предположить, что все месяцы равновероят- ны), б) дни рождения шести человек придутся в точности на два месяца. 25. Найти вероятность того, что для данных 30 человек шесть из двенадцати месяцев года содержат по два дня рождения и шесть — по три. 26. В чулане лежат п пар ботинок. Случайно выбираются 2г ботинок (2г<п). Чему равна вероятность того, что среди них а) не будет ни одной пары, б) будет ровно одна пара, в) ровно две пары? 27. На автомобильной стоянке N мест расположены в один ряд. Прибывший на стоянку автомобиль занимает одно из свободных мест (не с краю). По возвра- щении его владелец обнаруживает, что ровно г мест еще заняты. Какова вероят- ность того, что оба соседних места свободны? 28. Группа из 2N мальчиков и 2N девочек делится на две равные части. Найти вероятность р того, что каждая часть содержит одинаковое число мальчиков и де- вочек. Оценить р, используя формулу Стирлинга. 29. Доказать, что при игре в бридж вероятность р получения «Западом» ровно k тузов равна вероятности того, что произвольный игрок имеет ровно k тузов. (Это интуитивно ясно. Заметим, однако, что эти две вероятности относятся к двум различным экспериментам, так как во втором случае случайно выбираются три- надцать карт, а в первом случае распределяются все 52 карты.) 30. Вероятность того, что при игре в бридж «Восток» получит т, а «Юг» п пик равна вероятности того, что в двух наборах по тринадцати случайным обра- зом извлеченных из колоды карт первый содержит т и второй п пик. 31. Чему равна вероятность того, что у «Севера» и «Юга» вместе имеется ровно k тузов, где /г=0, 1, 2, 3, 4? 32. Пусть tz, b, с, d — четыре неотрицательных целых числа, таких, что a-[-b-[-c-\-d= 13. Найти вероятность р(а, b, с, d) того, что при игре в бридж игроки «Север», «Восток», «Юг», «Запад» имеют tz, b, с, d пик соответственно. Описать схему размещения красных и черных шаров по ящикам, которая включает эту задачу в качестве частного случая. 33. Используя результат задачи 32, найти вероятность того, что один игрок получит а, второй Z?, третий с и последний d пик, если a) а=5, b=4, с=3, d=l;< б) a=b—c—4, d—l; в) zz=Z?=4, с=3, d~2. Заметим, что эти три случая сущест- венно различаются. 34. Пусть а, b, с, d — целые числа, такие, что a+6-HH-d=13. Найти веро- ятность q (а, Ь, с, d) того, что один из игроков в бридж будет иметь а пик, b черв, с бубен и d треф, и показать, что задача не сводится ни к одному из случайных раз- мещений тринадцати шаров по четырем ящикам. Почему? 35. Распределение тузов в наборе из г карт. Вычислить вероятности р0(г), рх(г), . . ., р±(г) того, что среди г карт, случайно извлеченных из колоды при игре в бридж, соответственно 0, 1, . . ., 4 туза. Проверить, что р0(г)=р4(52—г). 36. Продолжение: времена ожидания. Найти вероятности Л. (г), (И того, что при последовательном извлечении карт из колоды первый, . . ., чет- вертый туз появится при г-м испытании. Угадать медианы времени ожидания для первого, . . ., четвертого туза, а затем вычислить их. 37. Найти вероятность того, что каждый из двух наборов карт содержит ровно k тузов, если каждый набор составлен из г карт и выбор производится из а) одной и той же колоды для игры в бридж, б) двух таких колод. Показать, что приг=13
§11. Задачи и дополнения теоретического характера 77 вероятность события в случае а) равна вероятности того, что два фиксированных игрока получат ровно по k тузов каждый. 38. Опечатки. Каждая страница книги содержит N символов, причем воз* можны опечатки. Книга содержит п=500 страниц и г=50 опечаток. Показать, что а) вероятность того, что страницы с номерами 1, 2, ... , п содержат соответ- ственно г15 г2, . . ., гп опечаток, равна СШЭ-ЧЭГР б) для больших N эта вероятность может быть приближенно представлена формулой (5.3). Заключить отсюда, что г опечаток распределены по п страницам приблизительно в соответствии со случайным размещением г шаров по п ящикам. (Замечание. Распределение г опечаток по N имеющимся местам соответствует статистике Ферми — Дирака. Наше утверждение может быть сформулировано как общее предельное свойство статистики Ферми — Дирака; см. разд, а § 5.) Замечание. Следующие задачи имеют отношение к материалу § 5. 39. Найти число различимых способов размещения i\ неразличимых предметов одного вида и г2 неразличимых предметов другого вида по п ящикам. 40. Сколько существует различимых результатов совместного бросания гц игральных костей и г2 монет? 41. Сколькими различимыми способами можно расположить в ряд 1\ белых, г2 черных и г3 красных шаров? 42. Найти вероятность того, что при случайном расположении в ряд 52-х карт для игры в бридж никакие два туза не будут находиться рядом. 43. Лифт. В примере 3, в) лифт начинает движение с семью пассажирами и останавливается на десяти этажах. Различные распределения пассажиров по этажам символически можно представить записью вида (3, 2, 2), которая интер- претируется как событие, состоящее в том, что три пассажира вышли из лифта на одном этаже, еще два пассажира на другом этаже и последние два — на еще одном этаже. Найти вероятности пятнадцати возможных распределений пассажиров от (7) до (1, 1, 1, 1, 1, 1, 1). 44. Дни рождения. Найти вероятности возможных распределений дней рож- дения 22 человек. 45. Найти вероятность того, что у игрока в покер будет а) флеш ройяль (десятка, валет, дама, король и туз одной масти); б) каре (четыре карты одного значения); в) фул (три карты одного значения и две карты другого значения);! г) стрит (пять последовательных по значению карт произвольных мастей); д) тройка (три карты одного значения плюс две карты других значений, различа- ющиеся по значению между собой); е) две двойки (две пары карт одного значения в каждой паре плюс карта отличного от них значения); ж) одна двойка (пара карт одинакового значения плюс три отличные от них по значению и различные по значению между собой карты). § 11. ЗАДАЧИ И ДОПОЛНЕНИЯ ТЕОРЕТИЧЕСКОГО ХАРАКТЕРА 1. Генеральная совокупность из п элементов включает в себя пр красных и nq черных (p-[-q=l). По схеме выбора с возвращением извлекается случайная вы- борка объема г. Показать, что вероятность того, что она содержит ровно k крас- ных элементов, равна (Ц.1) 2. Предельная теорема для гипергеометрического распределения. Если п велико и пДп = р, то вероятность д#, задаваемая соотношениями (6.1) и (6.2)f близка к (11.1). Точнее, <qk<(k)pkqr~,i* (1L2)
78 Г л. 11. Элементы комбинаторного анализа Сравнение этой задачи с предыдущей показывает, что для больших генеральных совокупностей практически нет разницы между выбором с возвращением и выбо- ром без возвращения. 3. Из генеральной совокупности, содержащей п элементов, по схеме выбора без возвращения извлекается случайная выборка объема г. Вероятность иг того, что в выборке будут содержаться N данных элементов, равна иг=("_^)(") . (И.З) (Соответствующей формулой для выбора с возвращением является (11.10), но она не может быть получена прямыми рассуждениями. Другой вид записи (11.3) см. в задаче 9 гл. IV, 6.) 4. Предельный случай. Если п—> со и г—>оо так, что г In—> р, то > pH (см. задачу 13). Замечание1). Задачи 5—13 относятся к классической задаче о размещении (статистика Максвелла — Больцмана); иначе говоря, г частиц размещаются ло п ячейкам и каждое из пг возможных распределений имеет вероятность п ~г. 5. Вероятность р^ того, что данная ячейка содержит ровно k частиц, задается биномиальным распределением (4.5). Наиболее вероятным значением k является целое число v, такое, что (г — /1Д- 1)/и < v (r-j- 1)/п. (Иначе говоря, утверждается, что р0 < рг < ... < pv_r > pv+1 > ... > pr\ ср. с задачей 15.) 6. Предельное распределение. Если п—> оо и г—> оо так, что среднее число К = г/п частиц на ячейку остается постоянным, то (Н.4) (Это — распределение Пуассона, обсуждаемое в гл. VI; относительно соответст- вующей теоремы для статистики Бозе — Эйнштейна см. задачу 16). 7. Пусть Л (г, п) — число размещений, при которых ни одна ячейка не остается пустой. При помощи комбинаторных рассуждений показать, что г Л (г, »+!)=£ (0 А (г-Л я). (11.5) k= 1 Вывести отсюда, что п А (г, я)=£ (-‘)v (") (я-v)'. (11.6) v=o Указание. Воспользоваться индукцией: предположить, что (11.6) выполня* ется, и в соответствии с ним выразить А (г—k, п) в (11.5). Изменить порядок сум* мирования и использовать формулу бинома для представления А (г, п-\-1) в виде разности двух простых сумм. Заменить во второй сумме v+1 новым индексом сум- мирования и использовать (8.6). Замечание. Формула (11.6) дает теоретическое решение поставленной задачи,- но, очевидно, было бы неблагодарной работой использовать ее для вычисления, скажем, вероятности х того, что в деревне с г= 1900 жителями каждый день в го- ду является днем рождения. В гл. IV, 2 мы выведем (11.6) другим способом и по- х х) Задачи 5—19 играют определенную роль в квантовой статистике, теории светочувствительных материалов, счетчиков Гейгера — Мюллера и т. п. Поэтому некоторые формулы часто обсуждались и заново открывались в физической лите- ратуре, зачастую без выявления их классического и совершенно элементарного характера. Возможно, все эти задачи (хотя и в иной постановке) имеются в книге Уитворта, цитированной в начале этой главы»
11. Задачи и дополнения теоретического характера 79 лучим простую приближенную формулу (показывающую, например, что прибли- зительно х=0,135). 8. Показать, что число распределений, оставляющих ровно т ячеек пустыми, равно п-т Ет(г, п)=^)А(г, п-т) = (") ^(-iy^~^(n-m-vy, (Ц.7) V —о 9. Не используя предыдущие результаты, показать, что вероятность Рт У, п) = П~гЕт (г, п) того, что имеется ровно т пустых ячеек, удовлетворяет уравнению Рт(Г-у\, n) = pm(r, п) (n—m)/n + pm+i(r, п) (т4~1)/п. (11.8) 10. Используя результаты задач 7 и 8, показать прямыми вычислениями, что (11.8) выполняется. Показать, что этот метод обеспечивает новый вывод (индукцией по г) (11.6). 11. Из задачи 8 получить, что вероятность хт (г, п) того, что не менее т ячеек остаются пустыми, равна п-т v=o (При т^п это выражение равно нулю, как и должно быть.) Указание. Показать, что хт (г, п)—рт (г, п)=хт + 1 (г, п). 12. Вероятность того, что каждая из N заданных ячеек занята, равна и(г,п)=п-г^ (Jk) A(k, N) (n-Ny-b, (11.10) k=0 Вывести отсюда, что N <11И> v=o (Использовать формулу бинома. Для N — п имеем и (г, п) =п~гА (г, п). За- метим, что (11.11) является аналогохМ (11,3) для выбора с возвращениемх), Другой вывод см. в задаче 8 гл. IV, 6.) 13. Предельный случай. При предельном переходе, описанном в задаче 4, получается и (г, п) —> (1—e~P)Nt Замечание. В задачах 14—19 г и п имеют тот же смысл, что и ранее, но мы предполагаем, что шары неразличимы и все различимые размещения имеют равные вероятности (статистика Бозе — Эйнштейна). х х) Заметим, что и(г, п) можно интерпретировать как вероятность того, что время ожидания до момента, когда М-й элемент присоединится к выборке, меньше г. Результат может быть применен к случайному выбору цифр: здесь и(г, 10)— —и (г—1, 10) есть вероятность того, что потребуется последовательность из г эле- ментов, для того чтобы она включала все 10 цифр. Этот результат можно исполь- зовать в качестве критерия случайности. Р. Гринвуд (Greenwood R. Е., Coupon collector’s test for random digits, Mathematical Tables and Other Aids to Computa- tion, 9 (1955), 1—5) табулировал это распределение и сравнил его с результатами, которые дают соответствующие времена ожидания для первых 2035 десятичных знаков л и первых 2486 десятичных знаков е. Медиана времени ожидания полного набора всех десяти цифр равна 27. Вероятность того, что это время ожидания превзойдет 50, больше 0,05, а вероятность того, что время ожидания превзойдет 75, приблизительно равна 0,0037,
80 Гл. 1J. Элементы комбинатор него анализа 14. Вероятность того, что заданный ящик содержит ровно k шаров, равна (И.12) 15. Показать, что при п>2 наиболее вероятным числом шаров в любом задан- ном ящике является нуль или, точнее, qQ>qi>. . . (ср. с задачей 5). 16. Предельная теорема. Пусть п—>оо и г—>оо так, что среднее число шаров на ящик г!п стремится к X; тогда qk —>Х^/(1+Х)Л+1. (11.13) (Правая часть известна под названием гео метрического распределения.) 17. Вероятность того, что ровно т ящиков остаются пустыми, равна С+г'Г <"<> 18. Вероятность того, что группа из т фиксированных ящиков содержит в сумме ровно / шаров, равна ?/('«)=(m+iT1)(”_/”t-r/_1)C+r~1)’1- <11Л5) 19. Предельное распределение. При переходе к пределу, как в задаче 4, имеем (Правая часть является частным случаем отрицательного биномиального распре- деления, которое будет введено в гл. VI, 8.) Теоремы о сериях. В задачах 20—25 мы рассматриваем последовательности из альф и г2 бет и предполагаем, что все они имеют одинаковые вероятности 1см. пример 4, д)). Эта часть задач связана с разд, б § 5. 20. Вероятность того, что последовательность содержит ровно k серий обоих типов, равна при четном k (k — 2v) и (.„HlVXtlHtlX'CJK'tr' <"•>»> при нечетном k (& = 2v4-l). 21. Продолжение. Доказать, что наиболее вероятным числом серий яв- ляется целое число k, такое, что 2г1г2/(г£4-г2) < & < 2/'1Г2/(п: + г2)+ 3, (Указание. Рассмотреть отношения p2v+2/p2v и P2V+1/P2V.-,)- 22. Вероятность того, что последовательность начинается с серии альф длиной v^sO, равна (rj^/^i + ^v+i- (Указание. Выбрать v альф и бету, которая должна следовать за ними.) Что вытекает из этой теоремы при v —0? 23. Вероятность появления ровно k серий из альф равна р^=(гк~\)(г^(г^Г • (11Л9) Указание. Это легко следует из второй части леммы § 5. Кроме того, формулу (11,19) можно вывести из (11.17) и (11.18), но этот вывод более трудоемок. 24. Вероятность того, что n-й альфе предшествуют ровно т бет, равна
fl 12. Задачи, содержащие биномиальные коэффициенты 81 25. Вероятность того, что альфы образуют k серий, из которых kt имеют длину 1, k2 pjimiy 2, kv длину v (&f +1 *•+&v = &), равна да/ГГГ-Г' § 12. ЗАДАЧИ И ТОЖДЕСТВА, содержащие биномиальные коэффициенты 1, Для целого п^2 1-(”) + (2)-+-=°> («)+2(«)+3(^) + ...=п2-1, (")-2(^+з(")-+...=°, (12Л) 2-1 (з)+3-2(з)+4.з(2) + ...=«(« — !) 2«~2. Указание. Использовать формулу бинома. 2. Доказать, что для целых положительных п и k (?) ©-CD GCD+© (Й) - ± (“) ("»'’)-'>• <ад Более общее соотношение имеет вид1) Е(:)(Г">=©(1+/)Й* <12-3) 3. Для любого а > О (~^) = (-1)А(д+|-1). (12.4) Если а является целым, то это утверждение может быть доказано также повторным дифференцированием геометрической прогрессии х^=(1—х)~1» 4. Доказать, что 1(2„-2}2.,„1_(_1),,.i(-I/2-). <12'5) 5., Для целых неотрицательных п и г и для любых действительных а v=o Указание. Воспользуйтесь (8.6). Обычно используется частный случай п = а* 6. Для произвольного а и целого У (- !)v (“) = (-1)” 1) • (12-7) V=o Указание. Воспользуйтесь (8.6). х) Читателю следует вспомнить соглашение (8.5): если v пробегает все целые числа, то в сумме (12,3) только конечное число слагаемых отлично от нуля,
82 Гл. II. Элементы комбинаторного анализа & 7. Для целых положительных г и k МИг’Н'С'© <12-®> v= о а) Доказать это равенство, используя (8.6). б) Показать, что (12.8) — частный случай (12.7). в) Показать по индукции, что (12.8) приводит к новому дока- зательству первой части леммы § 5. г) Показать, что (12.8) эквивалентно равенству Ё ©)-("©). 02-м / — О 8. В § 6 мы отмечали, что члены гипергеометрического распределения должны давать в сумме единицу, Это равнозначно тому, что для любых це« лых положительных а, Ь, п ©©©?)©©+•+©©-©©• <129> Доказать это по индукции. Указание. Сначала доказать, что (12.9) выпол- няется для а=\ и любого Ь. 9. П родолжение. Сравнивая коэффициенты при tn в обеих частях равен- ства (1 + /)й (1 + 0&=(1 + /)а + &, (12.10) доказать, что (12.9) справедливо для любых чисел а, b (и целых п). 10. Используя (12.9), доказать, что (©+©+(?)+-+©-(© 11. Используя (12.11), доказать, что v=o 12. Доказать, что для целых 0 < а < b <12лз) /г=1 Указание. Используя (12.4), показать, что (12.11) является частным слу^ чаем (12.9). Другое доказательство состоит в сравнении коэффициентов прй 1а~1 в тождестве (1 — t)a (1 — /)-&~2 = (1 — /)«-&-2. 13. Вывести из (12.9) тождества ©-(4_.)+-.'.т(?)±1-(°71) и Е<-()' ©(V© СИ' <12-15> V имеющие место, если k, п и г—целые положительные числа. Указание Использовать (12.4).
§ 12. Задачиt содержащие биномиальные коэффициенты 83 14. Используя (12.9), доказать, что1) для произвольных at b и целого k k (I2J6> / = 0 Указание. Дважды применить (12.4). Другой способ — использовать (12.10), изменив знаки показателей. Отметим важные частные случаи Ь=\, 2. 15. Обращаясь к задачам § 11, отметим, что (11.12), (11.14), (11.15) и (11.16) определяют вероятности, поэтому в каждом случае их сумма должна равняться единице. Показать, что это вытекает соответственно из (12.8), (12.9), (12.16) и формулы бинома. 16. Из определения Л (г, /?) в задаче 7 § 11 следует, что Л (г, /г) = 0, если г < и, и Л (/г, ri) = n\. Иначе говоря, ССЛЙ г<п> “ 7 \k J [nA, если г = п. (12.17) а) Доказать (12.17) непосредственной редукцией от п к п—1. б) Доказать (12.17), рассматривая r-ю производную (1—е1)п при / = 0. в) Обобщить (12.17), исходя из (Н.Н) вместо (11.6). 17. Доказать по индукции, что если 0^ N^п, то для любого целого v . „V [ N \ . . /п—NX . (12.18) (Заметим, что правая часть обращается в нуль, если г < N или г > п.) Про- верить (12.18), рассматривая r-ю производную 1п~-М (t—1)^ при /=1. 18. Доказать по индукции (используя формулу бинома), что (1)т~(2)!+•*•+(- о"-1 (-г=1+т+т+”*+1’ (12л9) п — I Проверить (12.19) интегрированием тождества (1 —0V — U — (1 — о 19. Доказать, что для любого целого положительного т (х + у + г)'- - £ ЖГ Х<1уЬгС’ (12-20) где суммирование проводится по всем целым неотрицательным а, Ь, щ таким£ ^то а^Ь-\-с = т. 20. Показать, что Г(а-|-1) = дГ (о)2 *) для любого а > 0, откуда [ k 4 k\V (а) ’ (12.21) 21. Доказать, что для любых положительных целых а и b (rz+l)(tz + 2) ... (а + п) ~ Ь\ ъ {b-j- 1) (Ь-}-2) а! (12.22) х) Более изящное доказательство см. в задаче 15 гл. 1Х^ 9. 2) Функция Г (а) (гамма-функция) определена ниже; см. формулу (12.23). —, Прим, перев.
84 Гл. 11. Элементы комбинаторного анализа ____________________ 22. Гамма-функция определяется равенством Г (х) = J tx-'e-i di, (12.23) о где х > 0. Показать, что Г (х) ~)/2ле~х хх~1^. (Заметим, чтоесли х = п-^ целое число, то Г (n) = (/2—1)!.) 23. Пусть а и г—произвольные положительные числа, а п—целое поло- жительное число. Показать, что a(a+r)(a + 2r)...(a + nr) ~ Cr«+1/in+1/2 + a/r. (12.24) Постоянная С равна ]/”2л;/Г (a/r). 24. Используя результаты предыдущей задачи, показать, что a(g+r)(a+2f)...(g-Hf) Г (6/г) ia-b)/r Л 9 964 b(b + r)(b-\-2r)...(b + nr)^ Г(а/г) ' ' ’ 25. Вывести из (8.10) неравенство ^tld-t) < j_z < е- t. о < t < 1. (12.26)
ГЛАВА III *j ФЛУКТУАЦИИ ПРИ БРОСАНИИ МОНЕТЫ И СЛУЧАЙНЫЕ блуждания Эта глава стоит в стороне от нашей основной темы, которая будет теперь продолжена лишь в гл. V. Ее материал традиционно служил в качестве первого шага к более общим теориям. Простые методы вскоре приведут нас к результатам большой теоретической и прак- тической важности. Мы столкнемся с теоретическими заключениями, которые окажутся не просто неожиданными, но будут прямо про- тиворечить интуиции и здравому смыслу. Они покажут, что широко распространенные представления о случайных флуктуациях лишены основания и что смысл закона больших чисел часто неправильно ис- толковывается. Например, в различных приложениях предполага- ется, что наблюдения за результатами бросаний одной и той же монеты в течение длительного промежутка времени будут давать те же статистические характеристики, что и наблюдение результатов очень большого числа независимых бросаний в данный момент. Это не так. Действительно, мы придем к выводу, что (на распространен- ном ныне жаргоне) в популяции обычных монет большую их часть следует считать неправильными. (Эмпирические иллюстрации см. в § 6 и примере 4, б).) До недавнего времени материал этой главы получали с исполь- зованием аналитических методов, так что результаты казались довольно глубокими. Поэтому элементарный метод * * * * * х), используемый ниже, является хорошим примером вновь открытой силы комбина- торных методов. Результаты, справедливые для более широкого класса случайных флуктуаций 2), будут обсуждаться в томе 2. Все результаты будут получены заново, другими методами. Таким об- разом, эта глава предназначена для начинающих читателей, которые не спешат приниматься за систематическую теорию, или читателей, интересующихся духом теории вероятностей без желания специа- *) Эта глава может быть опущена или прочитана параллельно с последующими главами. Ссылки на нее будут сделаны в гл. X (законы больших чисел), XI (вре- мена первого достижения), XIII (рекуррентные события) и XIV (случайные блуж- дания), но материал главы в дальнейшем непосредственно использоваться не бу- дет. х) Открытие возможности элементарного подхода было основной причиной второго издания этой книги (1957 г.). Настоящий вариант является новым и зна- чительно усовершенствованным, так как в нем удалось избежать различных слож- ных комбинаторных приемов. 2) Смотри примечание к следствию из теоремы 2 § 4S
86 Гл. J J1. Флуктуации при бросании монеты; случайные блуждания ? лизироваться по ней. Для других читателей сравнение методов ока- жется поучительным и интересным. Таким образом, настоящая глава может быть прочитана по усмотрению читателя независимо от остальной части книги или параллельно с ней, § 1. ОСНОВНЫЕ ПОНЯТИЯ. ПРИНЦИП ОТРАЖЕНИЯ С формальной точки зрения мы будем иметь дело с упорядочен- ными конечными множествами плюс единиц и минус единиц. Рас- смотрим n=p-\-q символов 8Ъ . . ., 8П, каждый из которых означает + 1 или —1; предположим, что имеется р плюс единиц и q минус единиц. Частная сумма sft=8i+. . представляет собой раз- ность между числом плюсов и минусов, находящихся на первых k местах. Тогда SA—sA-i = eA = ± 1, so = O, Sn = p—q, (1.1) где k = 1, 2, ..n. Мы будем применять геометрическую терминологию и использо- вать ортогональные координаты t, х\ для определенности будем предполагать, что ось t горизонтальна, а ось х вертикальна. После- довательность (81? . . ., 8П) будет изображаться ломаной, в которой Л-е звено имеет наклон 8ft, а k-я. вершина имеет ординату sk. Такие линии будут называться путями. Определение. Пусть и х — целые числа. Путь (si, s2, < . • .«., sn) из начала координат в точку (п, х) представляет собой ло- маную, верилины которой имеют абсциссы 0, 1, . . ., п и ординаты So, sb . о >, sn, удовлетворяющие (1.1) с sn=x. Мы будем называть п длиной пути. Существует 2" путей длины п. Если среди имеется р положительных и q отрицательных, то «=р+<7> x—p—q. (1.2) Путь из начала координат в произвольную точку («, х) существует только тогда, когда п и х удовлетворяют (1.2). В этом случае р мест для положительных &k могут быть выбраны из n=p+q имеющихся мест *,...= (ТНТ) М различными способами. Для удобства положим Nn,x—0, если п и х не удовлетворяют (1.2). При таком соглашении существуют ровно NniX различных путей из начала координат в произвольную точку (п, х). Прежде чем перейти к главной теме этой главы, а именно к тео- рии случайных блужданий, мы проиллюстрируем возможные при- ложения нашей схемы.
§ 7. Основные понятия. Принцип отражения 87 Примеры, а) Теорема о баллотировке (ballot theorem). Следую- щее интересное утверждение доказано в 1878 г. У. Уитвортом и заново в 1887 г. Ж. Бертраном. Предположим, что на выборах кандидат Р набрал р голосов, а кандидат Q набрал q голосов, причем p>q. Вероятность того, что при последовательном подсчете голосов Р все время был впереди Q, равна (p—q)/(p+q). Подобные задачи под названием задач о баллотировке привлекли внимание специалистов по комбинаторному анализу. Новый рас- цвет комбинаторных методов увеличил их популярность, и сейчас это выражается в том, что очень многие важные задачи могут быть переформулированы как варианты некоторой обобщенной задачи о баллотировка х). Весь протокол голосования может быть изображен в виде пути длины p+q, в котором efe= + l, если k-Й голос подан за Р; обратно, каждый путь из начала координат в точку (p+q, р—q) можно ин- терпретировать как протокол голосования с данными итогами р и q. Ясно, что sh есть число голосов, на которое Р опережал Q или отставал от него после учета й-го голоса. Кандидат Р лидировал на всем протяжении выборов только в том случае, когда Si>0, . . , ,.., sn>0, т. е. когда все вершины лежат строго выше оси t (Путь такого типа из О в изображен на рис. 1.) В теореме о баллотиров- ок N Рис. 1. Положительные пути. Рисунок показывает также, что существует ровно столько же положительных путей из начала координат в точку (2п, 0), сколько неотрицательных путей из начала координат в точку (2п—2, 0). ке неявно предполагается, что все возможные пути равновероятны. Тогда ее утверждение сводится к теореме, доказанной в конце этого параграфа как непосредственное следствие леммы об отражении. б) Ранговый критерий Гальтона * 2). Предположим, что некоторая величина (например, высота растения) измеряется у каждого из г подвергнутых воздействию объектов и также у каждого из г конт- рольных объектов. Обозначим результаты измерений а±, . . ., аг п 1л, . . ., Ьг соответственно. Для ясности предположим, что каждая группа упорядочена по убыванию: а1>а2>-^ и Ь1>Ь2>.^. ♦ (Во г) Историю вопроса и обзор литературы можно найти в статье Barton D. E.f Mallows С. L., Some aspects of the random sequence, Ann. Math. Statist., 36 (1965), 236—260. Авторы этой статьи обсуждают также различные приложения. Самое последнее обобщение со многими приложениями к теории очередей принадлежит Л. Такачу. 2) Hodges J, L.? Biometrica, 42 (1955), 261—262»
88 Гл. Ill. Флуктуации при бросании момнеты; случайные блуждания избежание тривиальности мы предполагаем, что никакие два ре- зультата наблюдения не равны.) Объединим теперь эти две после- довательности в одну с числом элементов п=2г и упорядоченную по убыванию. Предшествование всех значений а всем значениям b указывает на весьма высокую эффективность воздействия, тогда как случайная комбинация значений а и b означает полную его бесполезность. Таким образом, об эффективности воздействия мож- но судить на основании числа различных значений а, предшествую- щих соответствующим Ь, т. е. на основании числа индексов k, для которых ak>bk. Эта идея впервые была использована Ф. Гальтоном в 1876 г. для исследования данных, предоставленных ему Чарльзом Дарвином. В этом случае г было равно 15 и в 13 случаях значения а предшествовали соответствующим значениям Ь. Не зная реальных вероятностей, Гальтон заключил, что воздействие было эффективным. Однако в предположении полной случайности вероятность того, что значения а предшествуют соответствующим b в 13 или более случаях, равна 3/16. Это означает, что в трех из шестнадцати слу- чаев совершенно бесполезное воздействие будет казаться не менее эффективным, чем воздействие, эффективное по Гальтону. Это пока- зывает, что численный анализ может быть полезным дополнением к нашей не совсем надежной интуиции. Для интерпретации при помощи путей положим £^ = + 1 или —1 в зависимости от того, элементом какого типа является &-й член объединенной последовательности: а или Ь. Полный путь длины 2г соединяет начало координат с точкой (2г, 0) на оси I. Событие ak>bh осуществляется тогда и только тогда, когда s2k_1 содержит по мень- шей мере k плюс единиц, т. е. когда s2k_t >0. Это влечет s2fe^0, и поэтому (2k—1)-е и 2^-е звенья лежат выше оси t. Отсюда следует, что неравенство akZ>bk выполняется v раз тогда и только тогда, когда 2v звеньев лежат выше оси Л В § 9 мы докажем неожиданный результат, состоящий в том, что вероятность этого равна 1/(г+1) и не зависит от v. (Соответствующие критерии, основанные на тео- рии серий, см. в разд, б гл. II, 5.) в) Критерии типа Колмогорова — Смирнова, Предположим, что мы наблюдаем две популяции одинакового биологического вида (животных или растений), находящиеся в разных местах, или что мы хотим сравнить продукцию двух аналогичных станков. Для определенности рассмотрим только одну поддающуюся измерению характеристику (например, высоту, вес или толщину) и предполо- жим, что для каждой из двух совокупностей мы имеем г наблюде- ний, скажем а±, . . ., аг и bi, . . ., br. Грубо говоря, вопрос заклю- чается в том, совместимы ли эти данные с гипотезой о том, что обе совокупности статистически идентичны. В этом виде задача нес- колько неопределенна, но для наших целей нет необходимости об- суждать более точную ее постановку в современной статистической теории. Достаточно сказать, что критерии основаны на сравнении двух эмпирических распределений. Для каждого t обозначим через
§ 1. Основные понятия. Принцип отражения 89 А (/) отношение klr, где k — число индексов г, для которых a^t. Так определенная на действительной оси функция называется эм- пирическим распределением значений а. Эмпирическое распределе- ние В определяется аналогично. Изящная математическая теория, созданная Н. В. Смирновым х), позволяет найти распределение вероятностей максимума отклоне- ния |Л (/)—В (/)| и других величин, которые могут быть использо- ваны для проверки указанной гипотезы. Теория довольно сложна, но она была значительно упрощена и сделана более понятной Б. В. Гнеденко, которому пришла удачная мысль связать ее с геомет- рической теорией путей. Как и в предыдущем примере, свяжем с дву- мя выборками путь длины 2г, ведущий из начала координат в точку (2г, 0). Сказать, что две совокупности статистически неразличимы, все равно, что сказать, что все возможные пути равновероятны. Тог- да легко видеть, что |Л (/)—В (i) |>£ для некоторого t тогда и толь- ко тогда, когда \sh |>gr для некоторого k. Вероятность этого собы- тия есть просто вероятность того, что путь длины 2г, ведущий из начала координат в точку (0, 2г), не ограничен полосой между ±£г, Эта вероятность давно известна, потому что она связана с задачей о разорении игрока и физическими задачами диффузии с поглощаю- щими барьерами (см. задачу 3). Этот пример выходит за рамки настоящей книги, но он показы- вает, как теорию случайных блужданий можно применять к зада- чам совершенно различной природы. г) Игра с бросанием правильной монеты и ее связь со случайными процессами. Путь длины п можно интерпретировать как результат мыслимого эксперимента, состоящего в п последовательных броса- ниях монеты. Если +1 приписывается гербам, то sh равна положи- тельной или отрицательной разности между суммарным числом гербов и решеток после k-ro бросания. При классическом описании вводится фиктивный игрок Петр, который в каждом испытании вы- игрывает или проигрывает определенную денежную единицу. Тогда последовательность sb s2, . .sn представляет собой последователь- ные значения его прибыли. Вскоре будет показано, что они явля- ются результатами случайной флуктуации с совершенно неожидан- ными свойствами. Образный язык азартных игр не уменьшает важности модели с бросанием монеты. В самом деле, эта модель может служить как первое приближение ко многим более сложным случайным процес- сам в физике, экономике и теории обучения. Такие величины, как энергия физической частицы, состояние индивидуума и накоплен- ный опыт крысы предполагаются изменяющимися вследствие по- х) Смирнов Н. В. Об уклонениях эмпирической кривой распределения.— Матем. сборник, 1939, т. 6 (48), № 1, с. 3—24; см. также Смирнов Н. В. Теория ве- роятностей и математическая статистика. Избранные труды,— Мл Наука, 1970.—• Прим, перев,
90 Гл. Il J. Флуктуации при бросании монеты* случайные блуждания следовательных случайных воздействий некоторого рода. В целях упрощения первоначального изучения предполагают, что отдель- ные приращения имеют одинаковую величину и что их знак опре- деляется игрой с бросанием монеты. Более совершенная модель при- нимает в расчет, что приращения и их вероятности изменяются от испытания к испытанию, но даже простая модель с бросанием моне- ты приводит к удивительным, даже потрясающим результатам. Эти результаты имеют большое практическое значение, так как показы- вают, что вопреки распространенным взглядам законы, характери- зующие длинные серии отдельных наблюдений, обнаруживают боль- шие отклонения от свойств популяции. Иначе говоря, популярные в наше время психологические тесты привели бы к тому, что в сово- купности из «правильных» монет большинство было названо «не- правильными». Отсюда следует, что случайные флуктуации при бросании моне- ты типичны для более общих случайных процессов накопления. Во всяком случае это приводит к констатации того, что, коль скоро даже простая игра с бросанием монеты приводит к парадоксальным результатам, противоречащим нашей интуиции, последняя не может служить надежным советчиком в более сложных ситуациях. Столь же удивительно, сколь и приятно, что наиболее важные заключения могут быть получены из приведенной ниже простой леммы. Рис. 2. принцип отражения. Пусть Л=(а, а) и В=^(Ь, |3) — точки с целочисленными коорди- натами, лежащие в положительном квадранте: оОО, Р>0. Под отражением А относительно оси t понимается точка Л'=(а, а) (рис. 2). Путь из Л в В определяется обычным образом. Лемма. (Принцип отражения х).) Число путей из А в В, которые касаются оси t или пересекают ее, равно числу всех путей из А' в В. я) Принцип отражения часто используется в различных формах, однако без Геометрической интерпретации он кажется остроумным, но непонятным трюком. В вероятностной литературе этот принцип приписывается Д. Андрэ (1887 г.). Он появляется в связи с разностными уравнениями для случайных блужданий
§ 2, Случайные блужданий 91 Доказательство. Рассмотрим путь (sa = a, sfl+i, . ..,s& = Р) из А в В, имеющий одну или несколько вершин на оси t. Пусть t—• абсцисса первой такой вершины (рис. 2), т. е. выберем t так, что sa > 0, .> 0, sz = 0. Тогда ( •••> 5^ = 0, S^ + j, S/ + 2, •••, S&) представляет собой путь, ведущий из Л' в В и имеющий в качестве первой вершины на оси t точку Т0). Звенья АТ и А'Т являются отражениями одно другого, поэтому существует взаимно однознач- ное соответствие между всеми путями из А' в В и такими путями из А в В, которые имеют вершины на оси t. Это доказывает лемму. В качестве непосредственного следствия мы докажем результат, обсуждавшийся в примере а). Это будет служить отправной точкой для всей теории настоящей главы. Теорема о баллотировке. Пусть п и х — целые положительные числа. Существует ровно (x/ri)Nn,x путей (%, . . sn=x) из начала координат в точку (п, х), таких что 8ь>0, . . ., sn>0. Доказательство. Очевидно, существует столько же допустимых путей, сколько существует путей из точки (1,1) в точку (п, х), кото- рые не касаются оси t и не пересекают ее. В силу последней леммы число таких путей равно N - — N- * * 72 — 1 . У — 1 * ’ п — 1 . V 4-1 I „ 1 / I — 19 *’П-1,Х-1 Л’П-1,Х + 1 i р 1 J р J ’ где р и q определены в (1.2). Простые вычисления показывают, что правая часть равна Nn,x(p—q)/(p+q)9 как и утверждалось. ► § 2. СЛУЧАЙНЫЕ БЛУЖДАНИЯ; ОСНОВНЫЕ ПОНЯТИЯ И ОБОЗНАЧЕНИЯ Игра с бросанием идеальной монеты теперь будет описана при помощи случайных блужданий, которые привлекают своей нагляд- ностью и лучше приспособлены для обобщений. Как показано в предыдущем примере, если путь (sb . . ., sp) рассматривается как запись результатов р последовательных бросаний монеты, то част- ные суммы sx, . . ., представляют собой последовательные значе- ния прибыли. Для геометрического описания удобно предположить, что бросания выполняются через равные интервалы времени, так чго п-в испытание осуществляется в момент времени п. Последова- в гл. XIV, 9, соответствующими некоторым дифференциальным уравнениям в частных производных, для которых принцип отражения является хорошо извест- ным приемом, называемым методом подобия, Он обычно приписывается Максвеллу и Кельвину, Об использовании повторных отражений см, задачи 2 и 3,
92 Гл. III. Флуктуации при бросании монеты; случайные блуждания тельные частные суммы Si, . . ., sn будут изображаться точками на вертикальной оси х\ они будут называться положениями «части- цы», совершающей случайное блуждание. Заметим, что частица движется единичными шагами вверх или вниз на прямой. Путь представляет собой график такого движения. Например, путь из О в N на рис. 1 означает случайное блуждание, заканчивающееся через шесть шагов возвращением в начало. Каждый путь длины р можно интерпретировать как результат некоторого случайного блуждания; имеется 2Р таких путей, и мы Приписываем вероятность 2~р каждому. (Другие распределения вероятностей будут введены в гл. XIV. Для того чтобы отличить рассматриваемое случайное блуждание от других, назовем его симметричным.) Мы завершили определение пространства элементарных событий и вероятностей на нем, но беспокоит зависимость их от числа р. Для того чтобы выяснить его значение, рассмотрим событие, состоя- щее в том, что путь проходит через точку (2, 2). Первые два шага должны быть положительными, и поэтому существует 2Р~2 путей с этим свойством. Как и следовало ожидать, вероятность этого собы- тия равна 1/4 независимо от значения р. В более общем случае для любого k^p существует 2Р"^ путей с фиксированным поведением на первых k шагах. Отсюда следует, что событие, определенное первыми k^p шагами, имеет вероятность, не зависящую от р. Поэтому на практике число р не играет роли, если оно достаточно велико. Ина- че говоря, любой путь длиной п может рассматриваться как началь- ная часть очень длинного пути, и нет необходимости определять длину последнего. И с интуитивной, и с формальной точки зрения наиболее удобно рассматривать неограниченные последовательности испытаний, но это привело бы к использованию несчетных прост- ранств элементарных событий. Поэтому в дальнейшем будем счи- тать, что длины р путей, составляющих пространство элементарных событий, больше числа шагов, фигурирующего в наших формулах. За исключением этого, мы будем с радостью позволять себе забывать о р. Для того чтобы согласовать символику с той, которая будет использоваться в общей теории, мы обозначим отдельные переме- щения через Xf, Х2, ..., а положения частицы через Sf, S2, ... . Таким образом, S„ = Xi+...+X„, So = O. (2.1) Для каждого конкретного пути можно указать соответствующие значения Х4, Х2, ..., т. е. Xk являются функциями пути1). На- пример, для пути на рис. 1, очевидно, Xi==X2 = X4== 1, а Х3 =; = Х6 = Х6 = —1. х) По терминологии, которая будет введена в гл. IX, Х„ представляют собой случайные величины.
2. Случайные блуждания 93 Как правило, мы будем описывать все события заданием под- ходящих условий для сумм Sk. Таким образом, событие «в момент времени п частица находится в точке г» будет обозначаться так: |Sn = r}. Его вероятность будем обозначать через рп,г. (Это со- бытие мы будем называть попаданием1) в точку г в момент вре- мени /г.) Число N п, г путей из начала координат в точку (п, г) дается соотношением (1.3), и, следовательно, P„r = P(S„ = r(_((,+“)/2)2-, (2.2) где подразумевается, что биномиальный коэффициент равен нулю, когда (zi + r)/2 не является целым числом, лежащим между 0 ип. Если Sft = 0, то возвращение в начало происходит в момент времени k. Здесь k обязательно четно и для fe = 2v вероятность возвращения в начало равна p2Vj 0. Так как эта вероятность часто встречается в дальнейшем, введем для нее специальное обозначение u2V. Таким образом, u2v=(2J)2-2v. (2.3) Когда биномиальный коэффициент выражен через факториалы, формула Стирлинга (9.1) гл. II непосредственно дает «2v ~ 1/ИJtv, (2.4) где знак ~ указывает, что отношение левой и правой части стре- мится к 1 при v —> оо; правая часть служит прекрасным прибли- жением 2) для u2V даже для небольших значений v. Среди возвращений в начало особый интерес представляет пер- вое возвращение. Первое возвращение происходит в момент време- ни 2v, если St=^= 0, ..., S2V_1^0, но S2v = 0. (2.5) Вероятность этого события будет обозначаться f2V. По определе- нию fQ = 0. Связь между вероятностями f2n и и2п представляет большой интерес. Попадание в начало в момент времени 2п может быть либо первым возвращением, либо первое возвращение произошло в момент времени 2k < 2п и далее за время 2п—2k вновь про- изойдет возвращение в начало. Вероятность последнего события равна f2ku2n_2k, так как имеется 22kf2k путей длины 2k, оканчи- вающихся с первым возвращением, и %2n~2ku2n_2k путей из х) В оригинале visit. — Прим, перев. 2) Для истинного значения u1Q — 0,2461 мы получаем приближение 0,2523; для t/20 = 0,1762—приближение 0,1784. Относительная погрешность убывает, грубо говоря, обратно пропорционально v.
94 Гл. IIJ. Флуктуации при бросании монеты; случайные блуждания точки (2£, 0) в точку (2п, 0). Отсюда следует, что ^2п = f 2^2п-2 4” f 4^272-4 “Ь • • • 4“ f 2/2^0» /1^1. (2-6) (См. задачу 5.) Нормальное приближение. Формула (2.2) не пригодна для прямого вы- числения вероятностей попадания Szz в заданные границы. Для этих целей служит приближенная формула, которая представляет собой частный случай центральной предельной теоремы и будет доказана в гл. VII, 21). Вероятность того, что а < Sn < b, получается суммированием вероятно- стей рп, г по всем г, лежащим между а и Ь. Для ее определения достаточно знать вероятности выполнения всех неравенств вида Sn > а. Такие вероятно- сти могут быть оценены благодаря тому факту, что для всех х при п—> оо 00 p{s„ > Л-К/7}—> 1-SR(X) = (1//2S) J е"^2 dt, (2.7) X где 5JJ — нормальная функция распределения, определенная в гл. VII, 1. На данном этапе ее свойства не представляют для нас особого интереса. Суще- ствование предела означает, что при больших п отношения имеют приблизительно одни и те же вероятности, и, таким образом, одно и то же приближение может быть использовано одновременно для всех больших п. Хорошее представление о вероятностях (2.7) дает табл. 1. Более под- робной и точной является табл 1 гл. VII. Таблица 1 X 0,5 1,0 1,5 2,0 2,5 з,о р (S„ > х ) 0,309 0,159 0,067 0,023 0,006 0,001 § 3. ОСНОВНАЯ ЛЕММА Как мы видели, вероятность возвращения в начало в момент времени 2v равна величине u2v, задаваемой равенством (2.3). По мере развития теории случайных блужданий неожиданно выясни- лось, что эта вероятность входит почти во все формулы. Одну из причин этого раскрывает следующая простая лемма, не пред- ставляющая большого самостоятельного интереса, но позволяющая доказать более глубокие теоремы следующего параграфа. Лемма 1 2). Вероятность того, что до момента 2п включи- тельно не произойдет ни одного возвращения в начало, равна ее- ?) Частный случай, который нам здесь потребуется, исследуется в гл. VII, 2 отдельно (без ссылки на общее биномиальное распределение). Доказатель- ство простое и может быть помещено в данном месте. 2) Эта лемма очевидна, если использовать вид производящей функции 2 fzks2fi (см. формулу (3.6) гл. XI), и должна быть отмечена за ее познава- тельное значение. Ее важность была установлена недавно. Геометрическое доказательство см. в задаче 7*
§ 3. Основная лемма 95 роятности того, что возвращение в начало произойдет в мо- мент времени 2л, т. е. Р^О, ..., S2^0} = P{S2„ = 0} = «2„. (3.1) Здесь, конечно, п > 0. При осуществлении события в левой части все Sy- либо положительны, либо отрицательны. Оба этих со- бытия являются одинаково вероятными, поэтому мы можем пере- писать (3.1) в виде P{Si>0.......S2n > 0} = (1/2) м2ч. (3.2) Доказательство. Рассматривая все возможные значения S2n, очевидно, имеем P{S1>0, S2„>0} = i]P{S1>0, ...,S2„_j>0, S2„ = 2r} r = 1 (3.3) (где все слагаемые при г>ц равны нулю). По теореме о балло- тировке число путей, удовлетворяющих условию, указанному в пра- вой части, равно N2n_t, 2/-i—гг+i» и> следовательно, r-e слагаемое суммы равно (1/2) (p2n-it 2Г-1 Ргп-1, 2Г + 1)* Отрицательная часть r-го слагаемого и положительная часть (г + 1)-го слагаемого взаимно уничтожаются, поэтому в результате сумма (3.3) сводится к (1/2)р2л_Ь1. Легко проверить, что p2n-i, i = и2п> 4ewt завершается доказательство. ► Лемма может быть переформулирована различными способами* например P{S;>0.......S2„>0} = «2„. (3.4) В самом деле, путь длиной 2п, все вершины которого расположен^ выше оси t, проходит через точку (1, 1). Взяв эту точку в каче- стве нового начала координат, мы получим путь длины 2/г— все вершины которого лежат выше новой оси t или на этой оси, Отсюда следует, что P{S1>0, .... S2„>0} = (l/2)P{S1>0, ..., S2n_r>0}.(3.5) HoS2/z_1—нечетное число, и следовательно, из неравенства S2„_T^0 вытекает также, что S2„^0. Вероятность в правой части (3.5) равна вероятности в левой части (3.4), и тем самым (3.4) доказано. (См. задачу 8.) Лемма 1 непосредственно приводит к явному выражению для распределения вероятностей первого возвращения в начало. Сказать «первое возвращение произошло в момент времени 2ц» все равно что сказать «условие S( 0, ... ? S2^ 0 выполняется для k = п — 1 f
96 Гл. Ш. Флуктуации при бросании монеты; случайные блуждания но не выполняется для & = п». Используя (3.1), отсюда получаем f 2П = ^2ZZ—2 71=1, 2, ... • (3*6) После простых преобразований приходим к выражению /2„==[1/(2/г —(3.7) Таким образом, нами доказана следующая лемма. Лемма 2. Вероятность того, что первое возвращение в начало произошло в момент времени 2п, дается соотношением (3.6) или (3.7). Из (3.6) следует, что /2+^4+* • -^l- Применительно к бросанию монеты это означает, что если игра продолжается достаточно долго, то в конечном счете уравнивание шансов становится практически несомненным. Этого можно было ожидать и из интуитивных сооб- ражений, удивление вызывает лишь число необходимых для этого испытаний. Например, вероятность того, что уравнивания не было в течение 100 испытаний, приблизительно равна 0,08. § 4. ПОСЛЕДНЕЕ ПОПАДАНИЕ И ПРОДОЛЖИТЕЛЬНЫЕ ЛИДИРОВАНИЯ Мы готовы теперь к строгому анализу природы флуктуаций при случайных блужданиях. Результаты поразительны. Согласно ши- роко распространенному убеждению, так называемый «закон сред- них» должен гарантировать, что при длительном бросании монеты каждый из игроков будет в выигрыше примерно половину времени и лидерство будет нередко переходить от одного игрока к другому. Представим себе, что имеются записи огромного числа результатов игр с бросанием идеальной монеты, причем каждая из игр содержит ровно 2п испытаний. Выберем случайным образом одну из них и найдем момент времени, когда в последний раз счет в игре был ни- чейным (иначе говоря, номер последнего испытания, в результате которого суммарные числа появившихся гербов и решеток стали равными). Это число четно, и мы обозначим его через 2k (так что O^k^jt). Частая смена лидерства должна означать, что k будет сравнительно близко к п, но это не так. Действительно, приведен- ная ниже теорема обнаруживает удивительный факт: распределение k симметрично в том смысле, что любое значение k имеет в точности ту же вероятность, что и п—k . Эта симметрия означает, в частности, что неравенства k>n/2 и k<Zn/2 равновероятны х). С вероятностью 1/2 уравнение счета не будет иметь места во второй половине игры х) Симметрия распределения для k была обнаружена эмпирически на ЭВМ и доказана теоретически без знания точного распределения (4.1). См. Blackwell D., Deuel Р., Freedman D,, Ann, Math. Statist., 35 (1964), 1344*
§ 4. Последнее попадание и продолжительные лидирования 97 независимо от ее длительности. Более того, вероятности максималь- ны вблизи крайних точек; наиболее вероятными значениями k явля- ются 0 и п. Эти результаты показывают, что интуиция ведет к оши- бочной вероятностной картине случайных флуктуаций. Поясним сказанное численными примерами. Примеры, а) Предположим, что очень много игр с бросанием монеты проводится одновременно, каждая со скоростью одно бро- сание в секунду, днем и ночью, в течение года. В среднем в одной из десяти игр последнее уравнение счета произойдет в первые 9 дней, и лидерство не изменится в течение последующих 356 дней. В одном из двадцати случаев последнее уравнивание будет иметь место в первые 21/4дня, и в одном из ста случаев оно осуществится в течение первых 2 часов 10 минут. i б) Предположим, что во время учебного эксперимента, продол- жающегося в течение года, один ребенок постоянно был отстающим, за исключением, быть может, первой недели. Другой ребенок по- стоянно был впереди, за исключением, возможно, последней неде- ли. Можно ли этих двух детей считать одинаково способными? Далее, пусть группа из 11 детей подвергается такому же учебному экспе- рименту, основанному не на способностях, а исключительно на слу- чае. Один из одиннадцати будет лидером все время, кроме одной недели, другой — отстающим все время, кроме одной недели. Точные вероятности для возможных значений k следующая теорема. Теорема 1. (Закон арксинуса для последних попаданий.) Вероят- ность того, что до момента времени 2п включительно последнее по- падание в начальное состояние произойдет в момент 2k, равна 2« = k = Q, 1, • ••» П. (4.1) Доказательство. Мы интересуемся путями, удовлетворяющими условиями S2£ = 0 и S2£+1 =7^= 0, ..., S2n#=0. Первые 2k вершин можно выбрать %2ku2k различными способами. Взяв точку (2k, 0) в качестве нового начала координат и используя (3.1), мы видим, что остальные 2п—2k вершин можно выбрать 22п“2^2п_2А: спосо- бами. Разделив на 22п, получим (4.1). Из теоремы следует, что числа (4.1) в сумме дают единицу. Распределение вероятностей, которое приписывает точке 2k вес a2ftt 2п, называться дискретным распределением арксинуса порядка п по той причине, что функция, обратная синусу, дает отличное численное приближение к нему. Это распределение симме- трично в том смысле, что а2£, 2га = а2«-2/г, гга- При п —2 имеется три значения 3/8, 2/8, 3/8; для случая п = 10 см. табл. 2. Наимень- шее значение всегда имеет центральный член. 4 № 221
98 Гл. III. Флуктуации при бросании монеты' случайные блуждания Таблица 2 Дискретное распределение арксинуса порядка 10 /г = 0 /г=10 А = 1 /г = 9 /г = 2 /г = 8 /г = 3 /г = 7 £=4 /г=6 Л=5 а2Л. 20 0,1762 0,0927 0,0736 0,0655 0,0617 0,0606 Особенности распределений арксинуса хорошо видны из графика функции f (%) = 1/(л)/\(1—х)), 0<х<1. (4.2) При помощи формулы Стирлинга можно показать, что и2п близко к 1/^шг, если п не слишком мало. Это дает следующее прибли- жение: ^2k.in^0/n)f(xk), где xk = k/n, (4.3) погрешность которого незначительна, за исключением тех случаев когда k очень близко к 0 или к п. Величина, стоящая в правой части Рис. 3. График функции/(%)== 1/[л—я)]. Рисунок поясняет приближе- ние (4.3), (4.3), равна площади прямоугольника высотой f(xft), основанием которого является интервал длины i/n с центром в xk (см. рис. 3), Поэтому для 0<р</7<1 и больших п сумма вероятностей 2П при pn<Jz<qn приблизительно равна площади области, лежащей
§ 4. Последнее попадание и продолжительные лидирования 99 ниже графика f в пределах интервала р<х<ср Это остается спра- ведливым и для р=0, 7=1, потому что полная площадь области, лежащей ниже графика, равна единице, что выполнено также и для суммы всех a2fet2n- К счастью, интеграл от правой части (4.2) можно найти в явном виде, и мы получаем, что для фиксированного 0<х<С1 и достаточно большого п выполняется приближенное равенство 2 «26.2п » (2/зт) arc sin }/"х. (4.4) k < хп Заметим, что правая часть не зависит от п; это означает, что табл. 3 подходит для всех распределений арксинуса высокого порядка. (На самом деле приближения оказываются довольно хорошими даже для относительно малых значений п.) Таблица 3 Непрерывное распределение арксинуса А (х) = (2/л) arc sin х X А (х) X А (х) X Д (X) 0,00 0,000 0,20 0,295 0,40 0,436 0,01 0,064 0,21 0,303 0,41 0,442 0,02 0,090 0,22 0,311 0,42 0,449 0,03 0,111 0,23 0,318 0,43 0,455 0,04 0,128 0,24 0,326 0,44 0,462 0,05 0,144 0,25 0,333 0,45 0,468 0,06 0,158 0,26 0,341 0,46 0,474 0,07 0,171 0,27 0,348 0,47 0,481 0,08 0,183 0,28 0,355 0,48 0,487 0,09 0,194 0,29 0,362 0,49 0,494 0,10 о,н 0,12 0,13 0,14 0,15 0,16 0,17 0,18 0,19 0,205 0,215 0,225 0,235 0,244 0,253 0,262 0,271 0,279 0,287 0,30 0,31 0,32 0,33 0,34 0,35 0,36 0,37 0,38 0,39 0,369 0,376 0,383 0,390 0,396 0,403 0,410 0,416 0,423 0,429 0,50 0,500 Для х> 1/2 использовать равенство А (1-х)=Т-Л (х). Мы видели, что вопреки общераспространенным суждениям вполне вероятно, что в длительной игре с бросанием монеты один из игроков практически остается все время в выигрыше, а другой — в проигрыше. Следующая теорема объясняет то же самое явление путем анализа доли времени, проводимой частицей на положитель- ной стороне. Интуитивно может показатьсяt что наиболее вероятен 4*
100 Гл. Ill. Флуктуации при бросании монеты; случайные блуждания случай, когда эта доля будет близка к 1/2, но верно обратное: зна- чение, ближайшее к 1/2, является наименее вероятным, тогда как крайние точки k=Q и k—n имеют наибольшую вероятность. Анализ облегчается тем благоприятным обстоятельством, что в теореме вновь фигурирует дискретное распределение арксинуса (4.1), кото- рое дважды встретится нам в § 8. Теорема 2. (Закон дискретного арксинуса для времени пребы- вания.) Вероятность того, что в интервале времени от 0 до 2п частица 2k единиц времени проведет на положительной стороне и 2п—2k единиц времени на отрицательной, равна аь2к^2п. (Полное время, проведенное на положительной стороне, обяза- тельно четно.) Следствие1). Если 0 <х< 1, то вероятность того, что не более хп единиц времени будет проведено на положительной сто- роне и не менее (1—х)п на отрицательной, стремится к (2/л) arc sin ]/" х при п—> оо. Примеры, в) Вероятность того, что за двадцать бросаний монеты лидерство ни разу не перейдет от одного игрока к другому, при- близительно равна 0,352. Вероятность того, что более удачливый игрок будет лидировать в течение 16 или более единиц времени, примерно равна 0,685. (При х=4/5 следствие дает приближенное значение 0,590.) Вероятность того, что каждый игрок лидировал на протяжении 10 единиц времени, равна всего лишь 0,06 ?). г) Пусть п велико. С вероятностью 0,20 частица проведет около 97,6% времени на той стороне, куда она попала в самом начале. В одном из десяти случаев частица проведет на этой стороне 99,4% времени. 0 Поль Леви (Paul Levy, Sur certains processus stochastiques homogenes, Compositia Mathematica, 7 (1939), 283—339) установил закон арксинуса для бро- уновского движения и указал на связь с игрой с бросанием монеты. Общий пре- дельный закон арксинуса для числа положительных частных сумм в последова- тельности взаимно независимых случайных величин был доказан П. Эрдёшем и М. Кацем (Erdos Р., Кас М., On the number of positive sums of independent random variables, Bull. Amer. Math. Soc., 53 (1947), 1011—1020). Широкая область приме- нения предельного закона арксинуса казалась в то время непостижимой. Целая теория была создана заново, когда Э. Спарре Андерсен сделал удивительное от- крытие, заключающееся в том, что многие аспекты теории флуктуаций сумм не- зависимых случайных величин имеют исключительно комбинаторную природу (см. Mathematica Scandinavica, 1(1953), 263—285; 2 (1954), 195—223). Первоначаль- ные доказательства были очень сложными, но они дали новые методы исследования и сейчас сильно упрощены. Теорему 2 впервые доказали Чжун Кайлай и Феллер довольно сложными методами (см. гл. XII, 5—6 первого издания этой книги); теорема 1 — новая. Г 2) Указанные в этом примере вероятности заимствованы из таблицы, имев- шейся в предыдущих изданиях книги и исключенной автором из настоящего изда- ния. На с, 101 воспроизводится эта таблица, в которую включены данные о рас- пределении лидерства при 20 бросаниях монеты.
g 4. Последнее попадание и продолжительные лидирования 101 д) В примере а) монета бросается со скоростью одно бросание в секунду в течение 365 дней. Следующая таблица показывает время tpi такое, что с фиксированной вероятностью р менее удачливый иг- рок будет лидировать в течение всего времени, не превосходящего р 1р_ Р ip 0,9 153,95 дня 0,3 19,89 дня 0,8 126,10 » 0,2 8,93 » 0,7 99,65 » 0,1 2,24 » 0,6 75,23 » 0,05 13,5 часа 0,5 53,45 » 0,02 2,16 » 0,4 34,85 » 0,01 32,4 минуты ► Доказательство теоремы 2. Рассмотрим пути фиксированной длины 2/т и обозначим через b2kt 2п вероятность того, что ровно 2k звеньев лежат выше оси t. Мы’должны доказать, что 2V а2Л. 2V (4*5) Из (3.4) следует, что 62V# 2V = u2V, и в силу симметрии имеем также ^0,2V : ^2V* Поэтому достаточно доказать (4.5) для 1 k v—1. Предположим, что ровно 2k из 2п единиц времени проведено на положительной стороне и —1. В этом случае первое возвращение в начало должно осуществиться в некоторый момент времени 2г < 2п, и имеются две возможности. Во-первых, 2г еди- ниц времени до первого возвращения могут быть проведены на положительной стороне. В этом случае r^Zk^n— 1 и отрезок пути после вершины (2г, 0) имеет ровно 2k—2г звеньев над осью. Очевидно, число таких путей равно (l/2).2^2r.^^bift_8r. г„_2г. Во-вторых, 2г единиц времени до первого возвращения могут быть проведены на отрицательной стороне. В этом случае отрезок пути после вершины (2г, 0) имеет ровно 2k звеньев над осью, откуда fe=20 /г = 2 fc = 18 /г = 4 fe=16 /?=б /?=14 fe = 8 /г=1 2 Л?= 1 0 Pk,2Q 0,1762 0,0927 0,0736 0,0655 0,0617 0,0606 0,3524 0,5379 0,6851 0,8160 0,9394 1 Здесь Pk,2o — uku2o—вероятность того, что k отрезков пути лежат на поло- жительной стороне (т. е. «Петр лидировал после k из 20 испытаний»), а Pk,2o—вероятность того, что один из игроков лидировал не менее чем после k испытаний, другой же—не более чем после 20 —k испытаний.—Поим, передо
102 Гл. III. Флуктуации при бросании монеты; случайные блуждания п— r^k. Число таких путей равно (l/2).2=72r.^«-^^i2n_2r. Следовательно, при —1 k n-k ^2k.2n=^/^) 2 f2r^2^-2r, 2П-2Г 4" (V2) 2 Аг^/г, 2П-2Г’ (^.6) r=l r=l Применим теперь индукцию. Соотношение (4.5), очевидно, спра- ведливо при v = 1; предположим, что оно справедливо при v п— 1. Тогда (4.6) сведется к k n-k ^2k, 2/i (1/2)ц2п_2& 2 Аг^2&-2г 4" (V^) U2^ 2 /2г^2тг-2Л — 2r • Г=1 Г=1 (4.7) С учетом (2.6) получаем, что первая сумма равна u2k, тогда как вторая равна u2n_2k. Следовательно, (4.5) справедливо при v = n. (Удивительный результат, связанный с законом арксинуса, со- держится в задаче 4 гл. XIV, 9.) § 5*). ПЕРЕМЕНЫ ЗНАКА При теоретическом исследовании случайных флуктуаций мы столкнулись со многими парадоксами. Например, можно было бы наивно ожидать, что в длительной игре с бросанием монеты наблю- даемое число смен лидерства возрастает примерно пропорционально продолжительности игры. В игре, которая по времени длится вдвое больше, Петр будет лидировать вдвое чаще. Это интуитивное рас- суждение ошибочно. Мы покажем, что число смен лидерства в п испытаниях в определенном смысле возрастает лишь как У п\ в 100п испытаниях можно ожидать лишь в 10 раз больше перемен лидерства, чем в п испытаниях. Это еще раз доказывает, что время ожидания между последовательными уравниваниями является, как правило, фантастически долгим. Вернемся к терминологии теории случайного блуждания. Будем говорить, что в момент времени п произошла перемена знака, если и S„+i имеют противоположные знаки, т. е. если путь пересекает ось. В этом случае Sn = 0, и, следовательно, п—четное (положительное) целое число. Теорема 1 * х),. Вероятность 2n+i того, что до момента вре- мени 2п + 1 произойдет ровно г перемен знака, равна 2p2n+i, 2r+i*> *) Материал этого, параграфа не будет явно использоваться в дальнейшем, х) По поводу аналогичных теорем для числа возвращений в начало см. задачи 9 и 10. По поводу другого доказательства см. задачу 11.
§5. Перемены знака ЮЗ иначе говоря, ^2n+i-2P{S2n+i = 2r + l}, r = 0, 1, ... . (5.1) Доказательство. Мы начнем с того, что переформулируем теорему в более удобном виде. Если первый шаг ведет в точку (1, 1), возьмем эту точку в качестве начала новой системы координат. Тогда пересечению горизонтальной оси в старой системе соответ- ствует пересечение прямой, лежащей непосредственно под новой осью, т. е. пересечение уровня—1. Аналогичная процедура применима в том случае, когда 8!= — 1, и, таким образом, видно, что теорема полностью эквивалентна следующему утверждению: вероятность того, что до момента времени 2п уровень —1 будет пересечен ровно г раз, равна 2р2л+1> 2r+i. Рассмотрим сначала случай г = 0. Уровень —1 не будет пере- сечен тогда и только тогда, когда путь не коснется уровня —2 (и не пересечет его). В этом случае S2„ — неотрицательное четное целое число. Для k^Q из основной леммы об отражении § 1 за- ключаем, что число путей из (0, 0) в (2м, 2k), которые касаются уровня —2, равно числу путей в (2n, 2k -|- 4). Вероятность попасть в точку (2м, 2k), не коснувшись уровня—2, равна, следовательно, Ал, 2^—Ргп, 2^+4- Вероятность того, что путь не касается уровня — 2, равна сумме этих величин при й = 0, 1,2, ... . Внутренние члены взаимно уничтожаются, и мы находим, что наша вероят- ность равна р2п.о + р2«,2- Это доказывает утверждение при г = 0, потому что Ръп+1,1 ~ 0/2) (р^п, о 4" Р2п, 2)* (5-2) Это очевидным образом следует из того факта, что каждый путь, проходящий через точку (2п +1, 1), проходит либо через (2п, 0), либо через (2м, 2). Далее, пусть г = 1. Путь, пересекающий уровень —1 в момент времени 2v—1, может быть разделен на участок от (0, 0) до (2v, —2) и путь длины 2п—2v, выходящий из (2v, —2). К по- следнему участку применим результат при г = 0, поменяв местами плюс и минус. Таким образом, число путей длины 2п—2v, выхо- дящих из точки (2v, —2) и не пересекающих уровень — 1, равно числу путей из (2v, —2) в (2п +1, —3). Но каждый такой путь комбинируется с начальным участком от (0,0) до (2n-j-l, —3). Отсюда следует, что число путей длины 2п, пересекающих уровень —1 ровно один раз, равно числу путей из начала координат в точку (2п+1, —3), т. е. 22n+1 p2n+f^ Это доказывает утверж- дение для г — 1. Утверждение для произвольного г доказывается теперь по ин- дукции, причем рассуждение второй части доказательства исполь- зуется без изменения. (Доказательство проведено для частного слу- чая г—1 только по той причине, что в общем случае потребуются громоздкие обозначения.)
5 104 Гл, III. Флуктуации при бросании монеты; случайные блуждания Неожиданным следствием теоремы является то, что вероятность ! L,n перемен знака в п испытаниях убывает с ростом г: • • • (5.3) Это означает, что независимо от числа бросаний событие, состоящее в том, что лидерство ни разу не переменится, более вероятно, чем любое заранее фиксированное число перемен. Примеры, а) Вероятности хг для ровно г перемен знака в 99 испытаниях имеют следующие значения: г хг г хг 0 0,1592 7 0,0517 1 0,1529 8 0,0375 2 0,1412 9 0,0260 3 0,1252 10 0,0174 4 0,1066 11 0,0111 5 0,0873 12 0,0068 6 0,0686 13 0,0040 б) Вероятность того, что в 10 000 испытаниях не будет ни одной перемены знака, приблизительно равна 0,0160. Вероятности хг для ровно г перемен убывают очень медленно; при г=10, 20, 30 соответствующие значения хг равны 0,0156, 0,0146, 0,0130. Вероят- ность того, что в 10 000 испытаниях произойдет не более 10 смен лидерства, приблизительно равна 0,174; иначе говоря, почти 'в каждой шестой такой серии испытаний будет не более 10 перемен лидерства. ► Приятным свойством равенства (5.1) является то, что оно дает возмож- ность применить нормальное приближение, рассмотренное в § 2. Предполо- жим, что п велико и х—фиксированное положительное число. Вероятность того, что до момента времени п произойдет менее х Уп перемен знака, прак- тически совпадает с 2Р {Sn < 2х У п}, а последняя вероятность, согласно (2.7), стремится к 9? (2х) —1/2 при п—> оо. Таким образом, мы имеем сле- дующую теорему. Теорема 2. (Нормальное приближение.) Вероятность того, что до мо- мента времени п произойдет менее хУп перемен знака, стремится к 2$Jt (2х) — 1 при п —> оо. Отсюда следует, что медиана числа перемен знака примерно равна 0,337}/* п; это означает, что при достаточно больших п вероятности того, что число перемен знака будет меньше 0,337 У п или больше него, прибли- зительно равны. С вероятностью 1/10 произойдет менее 0,0628 Уп перемен знака и т. д. х) х) Такое приближение дает 1/10 для вероятности не более 6 уравниваний в 10 000 испытаниях, Это заниженная опенка; истинное значение составляет около 0,112-
§ 6. Результат эксперимента 105 § 6. РЕЗУЛЬТАТ ЭКСПЕРИМЕНТА На рис. 4 приведен результат машинного эксперимента — моде- лирования на ЭВМ 10 000 бросаний монеты; эти же данные содер- жатся в таблице примера гл. I, 6, в). Верхняя часть графика содер- жит результаты первых 550 испытаний; следующие две части изобра- жают полную запись результатов 10000 испытаний, причем масштаб в горизонтальном направлении здесь изменен в отношении 1 : 10. Масштаб в вертикальном направлении одинаков для всех графиков. Когда большинство людей смотрят на график, их поражают длины интервалов между последовательными пересечениями оси. Фактически же график изображает довольно умеренный случай — был выбран самый умеренный из трех имеющихся графиков. Более поразительный пример получается, если на этот же самый график посмотреть в обратном направлении, т. е. изменить на противопо- ложный порядок, в котором в действительности производились эти 10 000 испытаний (см. § 8). Теоретически серия, изображенная на графике, и обратная серия, получаемая в обратном направлении, одинаково законны в качестве представителей идеального случайно- го блуждания. Обратное случайное блуждание имеет следующие характеристики. Выходя из начала координат, путь находится на отрицательной стороне первые 7804 шага следующие 2 шага следующие 30 шагов следующие 48 шагов следующие 2046 шагов положительной стороне следующие 8 шагов следующие 54 шага следующие 2 шага следующие 6 шагов Всего 9930 шагов Доля времени'. 0,993 Всего 70 шагов Доля времени: 0,007 Это выглядит абсурдно, однако вероятность того, что при 10 000 бросаниях идеальной монеты одна из сторон будет лидировать на протяжении более чем 9930 испытаний, а вторая менее чем 70 пре- восходит 1/10. Иначе говоря, в среднем результаты одной из десяти последовательностей испытаний будут выглядеть более абсурдно, чем только что описанные. Для сравнения заметим, что вероятность равновесия, лучшего, чем на графике, равна всего лишь 0,072. График, приведенный на рис. 4, имеет 78 перемен знака и 64 других возвращений в начало. Обратная серия имеет 8 перемен знака и 6 других возвращений в начало. Опрос мнения специалистов обнаруживает, что даже опытные статистики ожидают значительно больше чем 78 перемен знака в 10 000 испытаний, и никто не считает всерьез возможным только 8 перемен знака. На самом деле вероят- ность не более 8 перемен знака превышает 0а14а тогда как вероят-
100 200 300 40а 500 Рис. 4. Результаты 10 000 бросаний идеальной монеты (описанные в § 6). 06 Гл. III. Флуктуации при бросании монеты*, случайные блуждания
§ 7. Максимумы и первые достижения 107 ность более 78 перемен знака приблизительно равна 0,12. Что каса- ется числа перемен знака в этих двух сериях, то они равноправны, и теоретически ни одно из них не должно вызывать удивления. Если они кажутся неожиданными, то причиной тому наша достой- ная осуждения интуиция и наши сомнительные ссылки на таинст- венный «закон средних». § 7. МАКСИМУМЫ И ПЕРВЫЕ ДОСТИЖЕНИЯ Большинство наших результатов выводится из основной леммы 1 § 3, которая, в свою очередь, является простым следствием прин- ципа отражения. Сосредоточим теперь наше внимание на других интересных следствиях этого принципа. Вместо путей, проходящих выше оси /, рассмотрим пути, кото- рые лежат ниже прямой х=г, т. е. пути, удовлетворяющие условию so < Г, St<r, S„<r. (7.1) В этом случае мы говорим, что максимум пути < г. (Максимум неотрицателен, потому что So = O.) Пусть Д = (п, k)—точка с ор- динатой Путь из точки 0 в точку А касается прямой х = г или пересекает ее, если нарушается условие (7.1). Согласно прин- ципу отражения, число таких путей равно числу путей из начала координат в точку Л' = (п, 2г—k), которая является отражением точки А относительно прямой х = г. Это доказывает следующую лемму. Лемма 1. Пусть k^r. Вероятность того, что путь длины п ведет в точку А = (п, k) и имеет максимум ^г, равна рп 2r~k==l = Р {S„ = 2г—&}. Вероятность того, что максимум равен г, равна разности Pn.2r-k—Pn,2r+2-k- Суммируя по всем получаем вероят- ность того, что произвольный путь длины п имеет максимум, в точности равный г. После сокращений сумма приводится к виду Рп, г + Рп, г+1- Если п и г имеют одинаковую четность, то рп* r+i = 0, в противном случае рПуГ — 0. Таким образом, справедлива сле- дующая теорема. Теорема 1. Вероятность того, что максимум пути длины п равен г^О, совпадает с положительным членом пары рп%Г и Рп, r+i- Для г = 0 и четных моментов времени это утверждение сво- дится к равенству Р^О, S2<0, S2„<0} = M2„, (7.2) эквивалентному соотношению (3.4), которое представляет собой один из вариантов основной леммы. Следовательно, теорема 1 обоб- щает эту лемму.
108 Гл. III. Флуктуации при бросании монеты; случайные блуждания Введем теперь понятие, играющее важную роль в общей теории случайных процессов. Момент времени п называется моментом пер- вого достижения точки Л>0, если S^r, Sn_i<r, S„ = r. (7.3) В настоящем контексте было бы предпочтительнее говорить о пер- вом попадании, однако термин «первое достижение», берущий нача- ло из физической литературы х), более употребителен; кроме того, термин «попадание» не применим к непрерывным процессам. Очевидно, путь, удовлетворяющий (7.3), должен проходить через точку (п—1, г—1), и его максимум до момента п—1 должен быть равен г — 1. Мы видели, что вероятность такого события равна Pn-i.r-!—Pn-i, r+n и, таким образом, справедлива следую- щая теорема. Теорема 2. Вероятность фГ1 п того, что первое достижение t произошло в момент времени п, равна Фг, п = 0/2) [Рп-i, г-1 Рп-1. г+1]* (7*4) Простые вычисления показывают, что срг == —( П (7.5) n\(n+r)/2j v 7 (как всегда, биномиальный коэффициент полагается равным нулю, если (п+г)/2 не является целым). По поводу другого вывода форму- лы см. п. б § 8. Распределение (7.5) наиболее интересно, когда г велико. Для того чтобы получить вероятность того, что первое достижение г произойдет до момента времени V, нужно просуммировать <рГп п по всем n^N. Из нормального приближения (2.7) следует, что только те члены дащт значимый вклад в сумму, для которых г* 2!п не слишком велико и не слишком близко к 0, Для таких членов оценки из гл. VII, 2 дают приближение <рг, „ ~ К2/л (r//^) e-r’/(2n). (7.6) При суммировании нужно иметь в виду, что п должно иметь ту же четность, что и г. Сумма является интегральной суммой Римана для интеграла в (7.7), ,и мы приходим к следующему утверждению. Теорема 3. (Предельная теорема для первых достижений.) Для фиксирован* ного t вероятность того, что первое достижение г произойдет до момента времени tr2, при стремится к 2). г) В оригинале first passage; в литературе по теории вероятностей этому обычно соответствует термин «первое достижение», в физической литературе — термин «первое прохождение». В дальнейшем будут использоваться оба термина (в зависимости от контекста).— Прим, перев. 2) Формула (7.7)*определяет так называемое положительное устойчивое рас- пределение с показателем 1/2. По поводу обобщений теоремы 3 см. задачу 14 гл. XIV, 9,
§7. Максимумы и первые достижения 109 /2/л J e-s2/i ds=2[l-SR(l/K/)], (7.7) 1/Г7 еде St—нормальное распределение, определенное в гл. VII, 1, Отсюда следует, что, грубо говоря, время ожидания первого достижения г возрастает как квадрат г: вероятность того, что первое достижение произойдет после момента времени (9/4)г* 2, близка к 1/2. Распределение времен первого достижения непосредственно при- водит к распределению момента времени, когда частица в r-й раз возвращается в начало. Теорема 4. Вероятность того, что r-е возвращение в начало произойдет в момент времени п, равна величине cpn из (7.5). Это означает, что r-е возвращение в момент времени п имеет та- кую же вероятность, как первое достижение г в момент времени п—г. Доказательство х). Рассмотрим путь из начала координат в точ- ку (п, 0), все звенья которого лежат ниже оси и ровно г—1 внутрен- них вершин находятся на оси. Для простоты будем называть такие пути характерными 2). (На рис. 5 изображен такой путь с п^= 20 и г=5.) Характерный путь состоит из г участков, крайние точки которых лежат на оси, и для каждого характерного пути мы можем Рис. 5. Первые достижения и возвращения в начало. построить 2Г различных путей, приписывая вершинам каждого' отдельного участка определенный знак (т. е. отражая участки отно- сительно оси). Действуя так, мы получим все пути, заканчивающие- ся г-м возвращением, и, следовательно, имеется ровно в 2Г раз больше путей, заканчивающихся r-м возвращением в момент вре- мени п, чем характерных путей. Поэтому теорема может быть пере- формулирована следующим образом: имеется столько характерных х) По поводу доказательства методом производящих функций см. формулу (3.17) гд. XI. 2) В оригинале — representative,— Прим, перев»
ПО Гл. III. Флуктуации при бросании монеты; случайные блуждания путей длины п, сколько существует путей длины п—г, оканчиваю- щихся первым достижением г. Это имеет место потому, что если в характерном пути вычеркнуть г звеньев, у которых левые крайние точки лежат на оси, то получится путь длины п—г, заканчивающий- ся первым достижением г. Эта процедура обратима: для того чтобы получить исходный характерный путь, нужно, исходя из начала координат, вставить г звеньев с отрицательным наклоном и г—1 вершин, которые соответствуют первым достижениям 1, 2, . . . ... ,г—1 (см. рис. 5). ► Отсюда следует, что предельную теорему для первого достиже- ния можно применить для нахождения вероятности г-го возвраще- ния при г->оо: вероятность того, что r-е возвращение в начало прои- зойдет до момента времени tr2, стремится к величине (7.7). Этот результат обнаруживает другое неожиданное свойство флуктуаций при случайных блужданиях. Случайное блуждание в известном смысле начинается сначала каждый раз, когда частица возвращается в начало. Время до r-го возвращения есть, таким образом, сумма времен ожидания, которые можно интерпретировать как «результаты измерения одной и той же физической величины в одинаковых условиях». Считается, что среднее из г таких наблю- дений должно сходиться к «истинному значению». Однако в данном случае сумма является величиной такого же порядка, как г2, и по- этому среднее увеличивается примерно пропорционально г. Более глубокий анализ показывает, что одно из г времен ожидания явля- ется величиной того же порядка, что и вся сумма, а именно г2. На практике такое явление часто приписывается «ошибке эксперимен- та» или отбрасывается как «постороннее». Трудно заметить то, что не ожидаешь увидеть. § 8. ДВОЙСТВЕННОСТЬ. ПОЛОЖЕНИЕ МАКСИМУМА Каждому пути соответствует конечная последовательность плюс единиц и минус единиц; рассматривая их в обратном порядке, полу- чаем новый путь. Геометрически новый путь получается поворотом данного пути на 180 градусов вокруг его правой крайней точки и выбором последней в качестве начала новой системы координат. Каждому множеству путей таким образом ставится в соответствие новое множество такой же мощности. Если шаги исходного случай- ного блуждания суть Xi, Х2, . . ., Хп, то шаги нового случайного блуждания определяются следующим образом: Х1 = Х„, .... Х^ = Хр (8.1) Вершины нового случайного блуждания определяются частными суммами: s;=x;+...+xbs„-s„_ft (8.2)
§ 8. Двойственность. Положение максимума 111 (откуда So =0 и S„=Sn). Мы будем называть такое случайное блуж- дание двойственным. Каждому событию, определенному для ис- ходного случайного блуждания, соответствует событие равной веро- ятности в двойственном случайном блуждании, и, таким образом, почти каждое вероятностное соотношение имеет двойственное. Этот простой метод получения новых соотношений является более по- лезным, чем это может показаться на первый взгляд. В полной мере его мощь будет показана только в томе 2 в связи с общими случай- ными блужданиями и теорией очередей, но даже в данном контексте мы сможем без особых усилий получить некоторые новые интерес- ные результаты. Для того чтобы показать это, рассмотрим несколько пар двойст- венных событий, выделяя в каждом случае заслуживающий внима- ния аспект. В следующих примерах п считается заданным и для краткости крайняя правая точка пути (n, Sn) будет называться ко- нечной точкой. У кобыз начать с известных событий в двойственном случайном блуждании. а) Времена первого достижения. Из (8.2) следует, что события, определенные соответственно посредством S/>0, / = 1, 2, .... п. (8.3) и Sn>Sy, / = 0, 1, .... п— 1, (8.4) двойственны по отношению друг к другу. Второе из них означает, что конечная точка не достигалась до момента времени п. Из (3.2) мы знаем, что первое событие имеет вероятность (1/2) m2v, когда /2 = 2v > 0 четное; для n = 2v+ 1 вероятность та же самая, потому что из S2V > 0 следует S2V+1 > 0. Таким образом, вероятность того, что первое достижение уровня конечной точки произойдет в момент времени п, равна (1/2) u2v, где v = (l/2)n или v = (1/2) (м—1). (Это, очевидно, справедливо также для п=1, но неверно для п = 0.) Принцип двойственности привел нас к инте- ресному результату, который нелегко получить непосредственно. б) Продолжение. В предыдущем утверждении конечная точка заранее не фиксировалась. Задание точки г в качестве точки первого достижения означает добавление к (8.4) условия Sn—г. Двойствен- ное событие состоит из путей, идущих из начала координат в точку (п. г), у которых все промежуточные вершины расположены выше оси. Число таких путей находится непосредственно из леммы об отражении [с А — (1, 1) и В^= (п, г)], и мы получаем, таким образом, новое доказательство (7.4). в) Максимум в конечной точке. Если в (8.3) и (8.4) строгие нера- венства заменить нестрогими, то получится новая пара двойствен- ных событий. Второе событие осуществляется каждый раз, когда S„ максимально, даже если этот максимум уже достигался в неко-
112 Гл, IIL Флуктуации при бросании монеты; случайные блуждания торый предыдущий момент времени х). Обращаясь к (3.4), видим, что вероятность этого события равна u2Vi где v—(1/2)п или v — ==(1/2)(п+1). Заслуживает внимания, что эти вероятности равны удвоенным вероятностям, найденным в п. а. г) Событие, заключающееся в том, что было k возвращений в на- чало, двойственно событию, заключающемуся в том, что до момента времени п было k попаданий в конечную точку. Сходное утвержде- ние использовалось при изучении перемен знака. (Относительно вероятностей см. § 5, а также задачи 9 и 10). д) Закон арксинуса для первого попадания в конечную точку. Рассмотрим случайно выбранный путь длины n = 2v. В п. а мы видели, что с вероятностью (1/2) u2v значение S2v положительно и таково, что ни один из членов последовательности So, Sf, ..., S2v_t не равен S2v. Это же справедливо для отрицательных S2V, и, сле- довательно, вероятность того, что значение S2V не будет достигнуто до момента времени 2v, равна u2v; эта же величина определяет вероятность события S2v::=0, в котором конечное значение дости- гается уже в момент времени 0. Рассмотрим теперь более общее событие, состоящее в том, что первое попадание в конечную точку имеет место в момент времени 2k (иначе говоря, мы требуем, чтобы S2fe = S2v, но Sy=H=S2v при / < 2k). Это событие двойственно событию, состоящему в том, что последнее попадание в начало имело место в момент времени 2й, а в § 4 мы видели, что такие попадания подчиняются дискретному распределению арксинуса. Мы, таким образом, получили неожиданный результат: с вероятно- стью a2k, 2v = ti2ku2v^2k первое попадание в конечную точку S2V имело место в момент времени 2v—2k (£ = 0, 1, ..., v). Отсюда следует, в частности, что моменты времени 2k и 2v—2k равновероятны. Кроме того, очень ранние и очень поздние первые попадания гораздо более вероятны, чем первые попадания в другие моменты времени. е) Закон арксинуса для положения максимума. В качестве по- следнего примера применения принципа двойственности мы пока- жем, что результаты, полученные в п. а и в, позволяют непосредст- венно определить распределение вероятностей для моментов, в ко- торые последовательность So, Sb . . ., Sn достигает максимального значения. К сожалению, это максимальное значение может дости- гаться неоднократно, и, таким образом, мы должны делать различие между первым и последним максимумом. Результаты, впрочем, ана- логичны. Пусть для простоты п четно: n^=2v. Первый максимум имеет место в момент времени k, если So < $k, • • • i < Sk, (8.5a) S,+i<S„ ..., S2v<S,. (8.56) *) По терминологии гл. 12 тома 2 мы рассматриваем слабые лестничные точки в отличие от строгих лестничных точек, которые определяются усло- виями п, а.
§9, Теорема о равнораспределенности ИЗ Запишем k в виде & = 2р или fe = 2p +1. Согласно п. а, вероят- ность события (8.5а) равна (1/2) rz2p, исключая случай, когда р = 0. Событие (8.56) зависит только от участка пути после момента времени k, и его вероятность, очевидно, равна вероятности того, что у пути длины 2v—k все вершины лежат ниже оси t или на ней. В п. в было показано, что эта вероятность равна «2v_2p- Таким образом, если 0 < & < 2v, то вероятность того, что в по- следовательности So, ..., S2V первый максимум имеет место в момент времени fe = 2p или k = 2р +1, равна (1/2) i/2p w2v-2p. При k==0 и k — 2v эти вероятности равны u2v и (1/2) u2v соот- ветственно. (Для последнего максимума вероятности для моментов времени О и 2v меняются местами; остальные вероятности остаются неиз- менными при условии, что k записано в виде k~2p или k—2р—1.) Мы видим, что при подходящем соединении четных и нечетных индексов положение максимума описывается дискретным распре- делением арксинуса. При игре с бросанием монеты вопреки интуи- ции гораздо вероятнее, что максимальный суммарный выигрыш бу- дет в самом начале (или в самом конце) игры, чем в ее середине. § 9. ТЕОРЕМА О РАВНОРАСПРЕДЕЛЕННОСТИ Мы закончим эту главу доказательством теоремы, упоминавшей- ся в примере 1, б) в связи с ранговым критерием Гальтона. Она поучительна тем, что показывает, как, казалось бы, безобидные из- менения в условиях могут изменить характер результата. В § 4 было показано, что, число звеньев, лежащих выше оси t, описывается дискретным распределением арксинуса. Мы рассмот- рим теперь ту же задачу, но сосредоточим наше внимание на путях, ведущих из начала координат в точку на оси t. Результат является неожиданным сам по себе, а также потому, что в корне отличается от закона арксинуса. Теорема, Число путей длины 2п, таких, что S2n = 0 и ровно 2k звеньев лежат над осью t, не зависит от k и равно 22пи2п/(п-$~ 1) = ^=2^72п+2. (Здесь ЬО, 1, п.) Доказательство. Рассмотрим отдельно случаи k = Q и k — n. Число путей в (2п, 0), все звенья которых лежат выше оси равно числу путей из (1, 1) в (2п, 0), которые не касаются пря- мой, проходящей непосредственно под осью t. В силу принципа отражения это число равно f2n —1\ f2n —1\ 1 \ п J \n-f-l / п+1\п/ (9’1) Это доказывает утверждение при &=п и в силу симметрии также при
114 Гл. III. Флуктуации при бросании монеты; случайные блуждания При 1</г<п—1 воспользуемся индукцией. Теорему легко про* верить для случая п=Л', предположим, что она справедлива для всех путей, длина которых меньше 2п. Обозначим через 2г момент первого возвращения. Имеются две возможности. Если участок пу- ти до момента времени 2г расположен в положительной полуплос- кости, то 1<г<£ и второй участок имеет ровно 2k—2г звеньев над осью. По предположению индукции путь, удовлетворяющий этим условиям, может быть выбран 22п-2г 22"-2 22Г f 2Г ’ п_r_|_ 1 2Г = г __г_|_ 1)’ ^2Г-2^2п-2Г -2) различными способами. С другой стороны, если участок до первого возвращения в начало находится в отрицательной полуплоскости, то конечный участок длины 2п—2г содержит ровно 2k положитель- ных звеньев и, следовательно, в этом случае п—f^k. Для фиксиро- ванного г число путей, удовлетворяющих этим условиям, также рав- но (9.2). Таким образом, число путей обоих типов получается сумми- рованием (9.2) по и l^r^n—k соответственно. Во второй сумме заменим индекс суммирования г на р—п+1—г. Тогда р ме- няется от /г+1 до п и слагаемые имеют вид (9.2) с заменой г на р. Отсюда следует, что число путей, у которых k звеньев лежат в по- ложительной полуплоскости, получается суммированием (9.2) по l^r^n. Поскольку k не входит в (9.2), сумма не зависит от k, что и утверждалось. Поскольку общее число путей равно 22л и2п> отсюда находим (делением на п+1) число путей каждой категории. (Отно- сительно непосредственного вычисления см. задачу 13.) Имеет место аналогичная теорема для положения максимума (см. задачу 14). § 10. ЗАДАЧИ 1. а) Если а > 0 и b > 0, то число путей (s±, s2t ..., sn), таких, что Si >—b......s„_i >— b, sn = a, равно Nn< а — Nn, a+2b. б) Если b > а > 0, то имеется Nn,a — Nn,2b-a путей, удовлетворяющих условиям Si < b, ..., sn_x < b, sn=a. 2. Пусть я > с > 0 и b > 0. Число путей, которые касаются прямой х = а и затем ведут в точку (п, с), не касаясь прямой х — — Ь, равно Nn, 2а~с— Nn,2a+2b + c’ (Заметим, что сюда относятся пути, касающиеся пря- мой х — —Ь, 'до того как они коснутся прямой х = а.) 3. Повторные отражения. Пусть а и b положительны и —b < с < а. Число путей, ведущих в точку (и, с) и не имеющих общих точек с прямыми х — —b и х = а, равно сумме 2 №п, 2k (a + b) + c Nп, 2k (a + b) + 2a — с)> эта сумма берется по всем целым k от —оо до оо, но лишь конечное число слагаемых отлично от нуля. Указание. Применить и развить метод предыдущей задачи. Замечание. Эта задача связана с так называемой задачей о разорении, которая возникает при исследовании азартной игры, когда два игрока имеют начальные >
10. Задачи 115 капиталы а и Ь, так что игра заканчивается, если суммарный выигрыш достигает значения а или — Ь. По поводу связи со статистическими критериями см. пример 1,в). (Метод повторного отражения будет вновь применен в задаче 17 гл. XIV, 9 и в связи с теорией диффузии в томе 2, гл. X, 5). 4. Используя лемму 1 § 3, показать (без вычислений), что W0W2n+ ^2^272-2+ • » • +^2n«0= If 5. Показать, что «2П=(-1)П(-^2) , /2В=(-1)П“1(^2). Вывести тождество предыдущей задачи так же, как (2.6) выводится из формулы (12.9) гл. II. 6. Доказать геометрически, что существует ровно столько же путей, которые заканчиваются в точке (2п+2, 0) и все внутренние вершины которых лежат строго выше оси, сколько существует путей, которые заканчиваются в точке (2/г, 0) и все вершины которых лежат выше оси или на ней. Таким образом, Р {Si 0, ,<«, §277 — 1^0, ^2п = = 2/2rt +2* Указание. См. рис. 1. 7. Доказать лемму 1 §3 геометрически, показав, что взаимно однозначное соот- ветствие между двумя классами путей устанавливается следующим построением.. Обозначим самую левую точку минимума заданного пути, ведущего в точку (2 п, 0), через M=(k, т). Отразим участок, ведущий из начала координат в точку М, относительно вертикальной прямой t=k и передвинем отраженный участок так, чтобы его начальная точка совпала с точкой (2/г, 0). Если М принять за на- чало координат, то в новой системе координат новый путь ведет из начала в точку (2/г, 2m) и все его вершины лежат выше оси или на ней. (Это построение принадле- жит Э. Нелсону.) 8. Доказать формулу (3.5) непосредственно, рассмотрев пути, не имеющие общих точек с прямой х=—1. 9. Вероятность того, что до момента времени 2п произошло ровно г возвраще- ний в начало, равна вероятности того, что возвращение имело место в момент времени 2п и ему предшествовало по меньшей мере г возвращений. Указание., Использовать лемму 1 § 3. 10. Продолжение. Обозначим через £Г12п вероятность того, что до мо- мента времени 2/г включительно произошло ровно г возвращений в начало, Используя предыдущую задачу, показать, что zrt 2n = pr, 2n+pr+i, 2„+ ..., где pri2n—вероятность того, что r-е возвращение произошло в момент вре- мени 2/г. Применив теорему 4 § 7, доказать, что __ 1 (2п—г\ Zr< in ~ 22n~r * п )’ 11. Другой вывод формулы для вероятности числа перемен знака. Показать, что п-1 ^Г, 2п — 1 = (1/2) У1 f%k [£/ —f, 2n—f — 2fe"V" 2n —i —2fe]t fe=l Применяя индукцию, предположим, что (5.1) имеет место для всех моментов времени, предшествующих 2п — 1. Показать, что это равенство сводится к п-1 ё/, — % 2 ^2&P2n-2fe, 2/, 1 а это вероятность того, что точка (2/г, 2г) будет достигнута после возвра- щения в начало. Рассмотрев первый шаг и применив теорему о баллотировке, показать, что (5,1) справедливо*
116 Гл. III. Флуктуации при бросании монеты; случайные блуждания 12. Вероятность того, что S2n=0 и наибольшее из Sj, S2n_i равно kt есть P{S2n=2&}— Р {S2ra = 2Zs-f-2}. Доказать это, используя отражение» 13. При доказательстве теоремы § 9 было показано, что п 2 О/к (Я—Г+ 1)]} «2Г-2«2И-2Г= П/(« + 1)] «2П- Г=1 Показать, что это соотношение эквивалентно (2.6). Указание. Разложить дробь. 14. Рассмотрим путь длиной 2п, такой, что S2n = 0. Расположим звенья в круговом порядке, отождествив 0 и 2п, так что первое и последнее звенья окажутся соседними. Применив циклическую перестановку, рассмотреть этот путь в новой системе координат с началом в точке (k, S^), Показать, что такая перестановка сохраняет максимум, но сдвигает его не k шагов. Доказать, что когда применены все 2/г циклических перестановок, число случаев, в которых максимум достигается в момент времени г, не за- висит от г. Рассмотрим теперь случайный выбор пути, такого, что S2n = 0, и найдем место максимума, если последний является единственным; если существует несколько точек максимума, то выберем одну из них случайным образом. В результате получим число между 0 и 2п—1. Показать, что всевозможные значения равновероятны.
ГЛАВА IV*) КОМБИНАЦИИ СОБЫТИИ В этой главе мы будем иметь дело с событиями, которые опреде- ляются посредством некоторых других событий At, А$, . . А^ Например, при игре в бридж событие А «по крайней мере один игрок имеет полную масть» является объединением четырех событий Ак «игрок с номером k имеет полную масть» (й==1, 2, 3, 4). Из событий Ak одно, два или более могут осуществиться одновременно, и за счет этого частичного наложения вероятность события А не равна сумме четырех вероятностей Р{ЛЙ). Мы покажем, как для заданно- го множества событий At, . . ., AN вычислить вероятности того, что 0, 1, 2, 3, ... из них осуществились х). § 1. ОБЪЕДИНЕНИЕ СОБЫТИЙ Если At и А г — два события, то AlMs обозначает событие, состоящее в том, что осуществились либо At, либо Л г, либо они оба. Из гл. I мы знаем (формула (7.4)), что Р{Л }=Р{Л 1}+Р{Л i)-Р{Л1Л 2}. (1.1) Мы хотим обобщить эту формулу на случай 2V событий At, As, . . . . . ., Лдг, т. е. вычислить вероятность того, что осуществится хотя бы одно из событий Ак. Символически это событие записывается в виде Л = Лхи Л2и ... U Лдг. Для нашей цели недостаточно знать вероятности отдельных событий Лй, нам должна быть дана полная информация о всевозможных пе- ресечениях. Это означает, что для каждой пары (i, /), каждой тройки (i, /, k) и т. д. мы должны знать вероятности одновременного осу- ществления Лг и Aj, A t, Aj и Ак и т. д. Для удобства будем обозна- чать эти вероятности буквой р с соответствующими индексами. Та- ким образом, рг?=Р{Лг}, рг^Р{Л4ЛД, р/А=Р{ЛгЛ;Лл}...............1 (1.2) ♦) Материал этой главы непосредственно использоваться в дальнейшем не будет. Очень важна только первая теорема. По поводу дополнительной информации см. Frechet М., Les probabilites associees a un systeme d’evenements compatibles et dependants, Actualites scienti- fiques et industrielles, Яг 859 (1940); №942 (1943), Paris,
118 Гл. IV. Комбинации событий Порядок индексов несуществен, однако в целях однозначности мы всегда будем писать индексы в порядке возрастаниям так, мы пишем р317> и, а не р71 3, п. Два индекса не совпадают. Для суммы всех per индексами будем использовать обозначение Sr, т. е. положим Si~^Pi’ ^з — ^Pijky ••• • 0’3) Здесь i < j < k < ... Af, так что в суммах каждая комби- нация встречается один и только один раз; следовательно, Sr со- [N\ держит I j слагаемых. Последняя сумма SN сводится к единст- венному Pi, 2,3, которое является вероятностью одновремен- ного осуществления всех N событий. При ТУ = 2 имеется только две суммы и S2 и (1.1) можно записать в виде P{X}-Si-S2. (1.4) Обобщение на произвольное число N событий дает следующая тео- рема. Теорема. Вероятность Рг осуществления хотя бы одного из со- бытий Ль Л 2, . . ., An равна — + --• • • ± SN. (1.5) Доказательство. Докажем (1.5) так называемым методом вклю- чения и исключения (см. задачу 26). Для того чтобы вычислить Рь мы должны сложить вероятности всех элементарных событий, которые содержатся хотя бы в одном из Aif но каждое элементарное событие должно быть взято только один раз. Действуя последова- тельно, мы сначала возьмем все элементарные события, которые со- держатся только в одном Аь затем те, которые содержатся ровно в двух из At и т. д., и наконец элементарные события (если они су- ществуют), содержащиеся во всех Л^. Пусть Е — любое элементар- ное событие, содержащееся ровно в п из N событий At. Не ограни- чивая общности, мы можем занумеровать события так, что Е содер- жится в Лп Л2, . . ., Лп, но не содержится в Л„+1, Лп+2, . . ., AN. Тогда Р{£} является слагаемым в тех рь pih pijh, . . ., у которых индексы изменяются от 1 до п. Следовательно, Р{£} входит п раз / п\ в Si, I g ) раз — в S2 и т. д. В итоге, выразив правую часть (1.5) через вероятности элементарных событий, мы убедимся, что Р{£} входит в Pi с коэффициентом /п\ /п\ ( п\ n-{2j + \3j~+ ••• Цп/ (L6) Остается показать, что это число равно 1. Это непосредственно сле- дует из сравнения (1.6) с биномиальным разложением (1—1)л (см. формулу (8.7) гл. II). Последнее начинается с 1, и слагаемые из
§1. Объединение событий 119 (1.6) содержатся в нем с противоположными знаками, следователь- но, для любого п^1 выражение (1.6) равно 1. ► Примеры, а) Пусть при игре в бридЯс Д. есть событие «игрок /52\~1 с номером i имеет полную масть». Тогда pz = 4( 13) ; событие, состоящее в том, что два игрока i и j имеют полную масть, осуществляется в 4-3 случаях и имеет вероятность р,ч=* /52\~1/39\~1 7 12(13/ (13/ ’ аналогично находим ол/52\-1/39V1/26'V1 ^13/ \13/ ’ Наконец, piy 2i 4 = Pi, 2t 3, так как если три игрока имеют полную масть, то ее имеет и четвертый. Вероятность того, что хотя бы один игрок имеет полную масть, равна поэтому ^1 = 4^—6pli2 + + 4р1|2,з—Pi, 2, з,4- Используя формулу Стирлинга, находим, что приблизительно Р± = (1/4) 10~10. В этом частном случае Р± очень близко к сумме вероятностей Д;, но это скорее исключение, чем правило. б) Пары (совпадения). Следующая задача, известная в различ- ных вариантах и приводящая к неожиданному ответу, была пред- ложена Монтмором (1708). Она была обобщена Лапласом и многими другими авторами. Две одинаковые случайным образом перетасованные колоды, содержащие по N различных карт каждая, сравниваются друг с другом. Если карта находится на одном и том же месте в обеих колодах, то мы говорим, что имеет место пара (совпадение). Совпа- дения могут быть на любом из N мест и на нескольких местах одно- временно. Этот эксперимент может быть описан и в шуточной форме. Например, две колоды карт можно заменить множеством писем и предназначенных для них конвертов, и своенравный секретарь запе- чатывает письма в конверты случайным образом. Или можно пред- ставить себе, что шляпы в гардеробе перепутаны и распределяются между посетителями случайным образом. Совпадение имеет место, если посетитель получает свою собственную шляпу. Поучительно попытаться угадать, как вероятность совпадения зависит от N: как вероятность получения своей шляпы хотя бы одним из 8 гостей соотносится с соответствующей вероятностью в собрании из 10 000 человек? Кажется удивительным, что эта вероятность практически не зависит от N и близка к 2/3. (Более серьезные приложения см. в задачах 10 и 11.) Вероятности наличия ровно 0, 1, 2, 3, ... совпадений будут вычислены в § 4, а здесь мы найдем только вероятность Pt хотя бы одного совпадения. Для удобства занумеруем карты числами 1, 2, ..., N в том порядке, в котором они расположены в одной из колод, и предположим, что каждая перестановка карт во вто-
120 Гл. IV. Комбинации событий рой колоде имеет вероятность 1/NI. Пусть событие Ak означает, что имеет место совпадение на k-м месте. Это означает, что карта с номером k находится на &-м месте, а оставшиеся N—1 карт могут быть расположены в произвольном порядке. Очевидно, pk = (N—= 1/N. Аналогично для любой комбинации f, / имеем p.. = (N—2)!/^! = l/f/V (N — 1)] и т. д. Сумма Sr содержит слагаемых, каждое из которых равно (N—r)\/N\. Следовательно, 5г = 1/г!, и в силу (1.5) искомая вероятность равна Л = 1 —1/21 + 1/3! — + ... ± 1/Л+ (1.7) Заметим, что 1—Р± представляет собой Л/+1 первых членов разложения = 1 — 1 + 1/2! —1/3! + 1/4!-1- • • •, (18) и, следовательно, приблизительно 7^- 1—2-1 = 0,63212... . (1.9) Точность приближения видна из следующей таблицы истинных значений Рг: N == 3 4 5 6 7 = 0,66667 0,62500 0,63333 0,63196 0,63214. ► § 2. ПРИЛОЖЕНИЕ К КЛАССИЧЕСКОЙ ЗАДАЧЕ О РАЗМЕЩЕНИИ Вернемся теперь к задаче о случайном размещении г шаров по п ящикам, предполагая, что каждое размещение имеет вероятность п~г, Найдем вероятность рт(г,п) того, что ровно т ящиков остают- ся пустыми *). Пусть событие Ah заключается в том, что ящик с номером k пуст (Л—1, 2, . . ., п). При выполнении этого события все г шаров размещаются в остальных п—1 ящиках, и это может быть сделано (п—1)г различными способами. Аналогично существует (п—2)г размещений, при которых два фиксированных ящика остаются пус- тыми и т. д. Следовательно, = pz,. = (l-2/n)', p;7ft=(l-3/nr, (2.1) и поэтому для любого Вероятность того, что хотя бы один ящик пуст, задается соот- ношением (1.5), и поэтому вероятность того, что все ящики за- *) Эта вероятность была получена совершенно другим способом в задаче 8 гл, II, 11, Сравните также с заключительным замечанием § 3f
§ 2. Приложение к классической задаче о размещении 121 пяты, равна р0 (г, ft) = 1 —+ ^2----F п / \ = Е <—!)’(") (1—£)' (2-3) v= 0 \ / \ ✓ Рассмотрим теперь размещение, при котором ровно т ящиков оста- ются пустыми. Эти т ящиков могут быть выбраны способами. Тогда г шаров распределяются между остальными п—tn ящиками так, что каждый из них занят; число таких распределений равно (и—т)гро(г, п—т). Разделив на пг, найдем вероятность того, что ровно т ящиков остаются пустыми: / ч /ft \ /1 т у . ч Pm(r, «) = (ч/пДр0(г,п—т) = п-т 4 ' v=o \ / V / Мы уже использовали модель случайного выбора г цифр для иллюстрации случайного размещения г предметов по п=10 ящикам. Пустым ящикам соответствуют в этом случае отсутствующие циф- ры: если т ящиков пусты, то в данной последовательности встреча- ются 10—т различных цифр. Численная иллюстрация приводится в табл. 1. Таблица 1 Вероятности рт (г, 10), полученные по формуле (2.4) т г= 10 г =18 । т г=10 г=18 0 0,000 363 0,134 673 5 0,128 596 0,000 876 1 0,016 330 0,385 289 6 0,017 189 0,000 014 2 0,136 080 0,342 987 7 0,000 672 0,000 000 3 0,355 622 0,119 425 В 8 0,000 005 0,000 000 4 0,345 144 0,016 736 9 0,000 000 0,000 000 рт(г, Ю)—вероятность того, что ровно т из цифр 0, 1, ...» 9 не появятся в последовательности из г случайных цифр. Ясно, что непосредственное вычисление по (2.4) возможно в слу- чае относительно малых п и г. С другой стороны, задача о размеще- нии представляет собой интерес, когда п велико. Каковы шансы, что при размещении 10 000 шаров по 1000 ящикам хотя бы один ящик останется пустым? Каковы шансы, что для группы из 2000 человек есть хотя бы один день в году, не являющийся чьим-либо днем рождения? К счастью, на подобные вопросы можно ответить с помощью замечательно простой приближенной формулы, погреш-
122 Гл. IV. Комбинации событий ность которой стремится к нулю при п->оо. Это приближение и приводящие к нему рассуждения типичны для многих предельных теорем теории вероятностей. Таким образом, наша цель заключается в нахождении предель- ного вида (2.4) при п->оо и г->оо. Соотношение между г и п в прин- ципе может быть произвольным, но если среднее число r/п шаров на ящик чрезмерно велико, то мы не можем ожидать наличия пустых ящиков; в этом случае р^(г, п) близка к единице и все рт(г, п) при т^1 малы. С другой стороны, если r/п стремится к нулю, то прак- тически все ящики должны быть пустыми, и в этом случае pm(h п)->0 для любого фиксированного т. Поэтому действительный инте- рес представляет только промежуточный случай. Мы начнем с оценки величины Sv в (2.2). Так как (п—v)v < (n)v < nv, имеем nv (1 —v/n)v+r < v!Sv < nv (1 —v/riy. (2-5) Из разложения (8.10) гл. II следует, что при 0 < t < 1 значение —log (1 — t) лежит между t и //(1 — f). Поэтому |ne-(v+r)/(«-v)}v < v| sv < {ne~r/n}v. Положим для краткости ne-r/п^ (2-6) (2-7) и предположим, что г и п возрастают таким образом, что К оста- ется внутри конечного интервала 0 < а < к < Ь. Для каждого фиксированного v отношение крайних членов в (2.6) стремится к единице, и поэтому 0<V/v!— Sv —>0. (2-8) Это соотношение очевидно справедливо, когда X 0, и, следователь- но, (2.8) остается справедливым и тогда, когда г и п возрастают таким образом, что % остается ограниченным. Но е~к-р<, (г, и) = 2 (- l)v {V/v!-Sv} v=0 (2-9) и из (2.8) следует, что правая часть стремится к нулю. Кроме того, множитель при ра(г, п—т) в (2.4) равен Sm, и поэтому для каждого фиксированного т имеем Рт (г’ п) — е~кХт/т\ —>0. (2.10) Тем самым доказана следующая теорема.
Таблица 2 Пуассоновское приближение (2.11) для вероятностей наличия ровно т пустых ящиков при случайном распределении г шаров по п = 1000 ящикам г X р (tn; X) т = 0 т= 1 /72 = 2 т = 3 /72=4 /72=5 т = 6 /72 = 7 /72 = 8 /72=9 /72 = 1 0 /72= 1 1 5000 6,74 0,0012 0,0080 0,0269 0,0604 0,1017 0,1371 0,1540 0,1482 0,1249 0,0935 0,0630 0,0386 5500 4,09 0,0167 0,0685 0,1400 0,1909 0,1951 0,1596 0,1088 0,0636 0,0325 0,0148 0,0060 0,0023 6000 2,48 0,0838 0,2077 0,2575 0,2128 0,1320 0,0655 0,0271 0,0096 0,0030 0,0008 0,0002 6500 1,50 0,2231 0,3347 0,2510 0,1255 0,0471 0,0141 0,0035 0,0008 0,0001 7000 0,91 0,4027 0,3661 0,1666 0,0506 0,0115 0,0021 0,0003 7500 0,55 0,5777 0,3163 0,0873 0,0162 0,0023 0,0003 8000 0,34 0,7126 0,2406 0,0414 0,0049 0,0004 8500 0,20 0,8187 0,1637 0,0164 0,0011 0,0001 9000 0,12 0,8869 0,1064 0,0064 0,0003 § 2. Приложение к классической задаче о размещении
124 Гл. IV, Комбинации событий Теорема1). Если п и г стремятся к бесконечности, так что <k'=ne~rltl остается ограниченным, то для каждого фиксирован* ного т выполняется соотношение (2.10). Аппроксимирующее выражение р(т\ ty=e~K№/ml (2.11) определяет так называемое распределение Пуассона, которое имеет большое значение и описывает разнообразные явления; оно будет изучаться в гл. VI. На практике можно использовать p(m; X) в качестве приближе- ния, когда п велико. Для небольших значений п необходима оценка погрешности, однако мы заниматься этим не будем. Примеры, а) В табл. 2 приведены приближенные значения веро- ятностей того, что т ящиков окажутся пустыми при общем числе ящиков, равном 1000, и числе шаров, меняющемся от 5000 до 9000. При г=5000 медиана числа пустых ящиков равна шести: наличие семи или более пустых ящиков имеет приблизительно такую же вероятность, как шести и менее. Даже в случае 9000 шаров в 1000 ящиках мы имеем около одного шанса из девяти найти пустой ящик. б) В статистике дней рождения (пример гл. II, 3, г)) п = 365, а г равно числу людей. При г = 1900 приблизительно Х = 2. Веро- ятности Р[т1 того, что в поселке с 1900 жителями т дней в году не являются днями рождения, приблизительно таковыл Pw = 0,135, Р[Х] = 0,271, РГ2] = 0,271, Р(3] = 0,180, р[4] = 0,090, Р(5] = 0,036, Р[в] = 0,012, Р[7] = 0,003. в) Когда nlogn + шг шаров размещаются в п ящиках и п ве- лико, вероятность того, что все ящики заняты, равна 1—► Вместо пустых ящиков можно рассмотреть ящики, содержащие ровно k шаров. Здесь с небольшими изменениями применимы рассуждения, использованные выше в частном случае &= 0. Как показал Мизес, вероятность того, что ровно т ящиков содержат по k шаров, также аппроксимируется распределением Пуассона (2.11), но в этом случае X определяется следующим образом: h~n(e~rlnlk\) (r!n)k. (2.12) § 3. ОСУЩЕСТВЛЕНИЕ т ИЗ N СОБЫТИЙ Теорема § 1 может быть усилена следующим образом. Теорема. Для любого целого т, такого, что 1 вероят- ность Р1т} того, что одновременно осуществляется ровно т из N х) Принадлежит (с другим доказательством) Мизесу (von Mises R., Uber Aufteilungs- und Besetzungswahrscheinlichkeiten, Revue de la Faculte des Sciences de I’Universite d’Istanbul, N. S., 4 (1939), 145—163),
§ 4. Приложение к задачам о совпадениях и об угадывании 125 событий Л-р ...» Лдг, равна ( т+ 1\ /т+2\ /N\ elrn]—sm—( )sm+i+( )Sm+z—F.•. ±( (3.1) Замечание. Согласно (1.5), вероятность Pw того, что не осу- ществилось ни одно из событий Лу, равна Аоз = 1-Л=1—Si + S8-S8± ••• (3.2) Это показывает, что (3.1) дает правильное значение также и для т=0, если мы положим S0=l. Доказательство. Будем рассуждать так же, как при доказатель- стве (1.5). Пусть Е— произвольное элементарное событие;, пред- положим, что оно содержится ровно в п из N событий Aj. Тогда Р {£} дает вклад в Рт лишь тогда, когда n=m. Для того чтобы узнать, каким образом Р {£} входит в правую часть (3.1), заметим, что Р {£} входит в суммы Si, S2(. . ., Sn, но не входит в суммы S„+i,. . ., SN. Отсюда следует, что Р {£} не дает вклада в правую часть (3.1), если п < т. Если п=т, то Р {Е } входит в одно и только в одно слагаемое суммы Sm. Для завершения доказательства теоре- мы остается показать, что при п > т вклады Р {Е} в члены правой части Sm, Sm+1.....Sn взаимно уничтожаются. Действительно, Р {Е} входит в Sh с коэффициентом (fy, равным числу наборов по k событий из п событий, содержащих Е. Таким образом, при п> т полный вклад Р{Е} в правую часть (3.1) равен (3.3) Если выразить биномиальные коэффициенты через факториалы, то легко видеть, что это выражение сводится к следующему: В скобках имеем биномиальное разложение для (1 — 1)п-и, так что (3.3) обращается в нуль, что и утверждалось. ► Читателю предлагается проверить, что подстановка выражения (2.2) в (3.1) непосредственно приводит к (2.4). § 4. ПРИЛОЖЕНИЕ К ЗАДАЧАМ О СОВПАДЕНИЯХ И К ЗАДАЧЕ ОБ УГАДЫВАНИИ В примере 1, б) мы рассматривали совпадения карт в двух коло- дах и нашли, что Sh = \/k\. Подставив это выражение в (3.1), полу- чим следующий результат.
126 Гл. IV. Комбинации событии При случайном сопоставлении двух одинаковых колод, состоя- щих из N различных карт, вероятности Р[т} получить ровно т совпадений равны Ло] = 1 —1 + 2i • • • ± (/V—2)! + (/V —1)1 =*= ТГ ’ n 1 । ,1 — 1 111 1 21 3! (/у—2)! + (ЛГ—1)1 ’ р_____—/1____1-I-—____— -1___Ч________1 -т- * 1 ^(21—2! V 21 31^ •” =Ь (N—3)! + (IV—2)! ]• Лз]=-др {1 —1 +-2Г з|Н • • • ± 3)| | > С1-1) Ллг-sJ — (JV—2)! {1 1 21 } ’ (N—1)1 P[N1~ AJI • Последнее соотношение очевидно. Обращение в нуль выражает тот факт, что невозможно получить N—1 совпадение без того, чтобы все N карт в каждой колоде были расположены в одинаковом порядке. Выражения в фигурных скобках в правых частях (4.1) являются первыми членами разложения е-1. [Поэтому для больших N мы имеем приближенное равенство PlM^e-i/ml. (4.2) Ниже в табл. 3 колонки, озаглавленные Рш, дают точные зна- чения Р[т] при N — 3, 4, 5, 6, 10. В последней колонке приве- дены предельные значения ри = е“1//п!. (4.3) Числа рт дают довольно хорошее приближение для Рм даже при небольших значениях N. Для чисел рт, определенных формулой (4.3), мы имеем У1, Pfe — е 1(1-Ь1"1"_2Г“1*-з|- +•••)=£ 1е=1. Следовательно, рк могут трактоваться как вероятности. Отметим, что (4.3) является частным случаем распределения Пуассона (2.11) с Х=1. Пример. Проверка способности угадывать. При дегустации вин, в физических экспериментах и т. д. проверяемого просят назвать неизвестный ему порядок расположения N предметов, скажем карт. Действительная способность угадывать с его стороны будет про- являться как отклонение от случайности. Для оценки степени этой
4. Приложение к задачам о совпадениях и об угадывании \27 способности мы должны уметь находить вероятности случайных удач. Угадывающий может придерживаться разных систем, среди которых мы упомянем три крайние возможности, (i) Угадывающий выбирает одну карту и называет все время ее. При такой системе он будет иметь одно и только одно правильное угадывание в каж- дой серии; случайные флуктуации исключены, (ii) Угадывающий называет каждую карту один раз, так что каждая серия из N угадываний соответствует перетасовке колоды. Если проверяемый не обладает способностью угадывать, то можно применить фор- мулы (4.1). (iii) Третья возможность заключается в том, что каж- дое из N угадываний производится совершенно независимо от дру- гих. Здесь имеется NN возможных комбинаций. Несомненно, что каждый человек имеет свои привычки и склонен называть опре- деленные комбинации чаще других, однако в первом приближении можно считать все NN комбинаций равновероятными. Так как т верных и N—т неверных угадываний могут быть произведены / I UN—1)^“^ различными способами, вероятность ровно т вер- ных угадываний равна /ЛА (Л^ —l)iV-/n NN (4.4) (Это частный случай биномиального распределения, которое было получено в примере гл. II, 4, в).) Таблица 3 Вероятности т правильных угадываний в колоде из N различных карт т Л/ = 3 7V = 4 /7 = 5 | ZV = 6 I 7V=10 Pm Ьт р[т] Ьт Ьт P[ml Ьт Ьт 0 0,333 0,296 0,375 0,316 0,367 0,328 0,368 0,335 0,36788 0,34868 0,367879 1 0,500 0,444 0,333 0,422 0,375 0,410 0,367 0,402 0,36788 0,38742 0,367879 2 0,222 0,250 0,211 0,167 0,205 0,187 0,201 0,18394 0,19371 0,183940 3 0,167 0,037 0,047 0,083 0,051 0,056 0,053 0,06131 0,05740 0,061313 4 5 6 7 8 9 10 0,042 0,004 0,008 0,006 0,000 0,021 o,66i 0,008 0,001 0,000 0,01534 0,00306 0,00052 0,00007 0,00001 • • • • • 0,01116 0,00149 0,00014 0,00001 0,015328 0,003066 0,000511 0,000073 0,000009 0,000001 0,000000 Р[т\ заданы формулой (4.1), Ьт—формулой (4.4). В последнем столбце при- ведены предельные вероятности (4.3) (распределение Пуассона). В табл. 3 приведены вероятности успеха, когда угадывание производится по системе (ii) или (iii). Чтобы оценить достоинства
128 Гл. IV. Комбинации событий этих двух методов, необходимо найти средние значения и величины случайных флуктуаций. Оказывается, что среднее число правиль- ных угадываний одинаково при всех системах; случайные отклоне- ния несколько больше при системе (ii), чем при (iii). Просмотр табл.З показывает, что практически разница не очень велика. ► § 5. РАЗЛИЧНЫЕ ДОПОЛНЕНИЯ а. Осуществление по меньшей мере т событий В обозначениях § 3 вероятность Рт того, что одновременно осуществляются т или более из событий Aif AN, равна РЛ/я] + Лет + 11+ • • • (5-О Для того чтобы выразить Рт через Sk, проще всего действовать методом индукции, начиная с выражения (1.5) для Pt и используя рекуррентное соотношение Pm+i = Pm—Р[тГ При т^1 получаем / т \ Рт~$т _______ jy ^/w + i “Ь f m+ 1\ /m+2\ IN—1\ Соотношение (5.2) можно вывести также и непосредственно, исполь- зуя рассуждения, которые привели к (3.1). б. Прочие тождества Коэффициенты Sv можно выразить через P{k} или Рк следую- щим образом: Sv = Jt ( у P[k\ (5.3) *=v \ v / и (5.4) Идея доказательства. При заданных значениях Рм соотноше- ния (3.1) можно рассматривать как линейные уравнения относи- тельно неизвестных Sv, и мы должны доказать, что (5.3) представ- ляет собой их единственное решение. Если подставить (5.3) в выра- жение (3.1) для Р[т}, то коэффициент при Р1к} (m^.k^.N) в правой части будет равен При k = m это выражение равно 1. При k> т сумма пред- ставляет собой биномиальное разложение (1 — \)ь-т и поэтому равна нулю. Следовательно, подстановка (5.3) сводит (3.1) к тож-
§ 6. Задачи 129 деству Р[т} — Р1тГ Единственность решения (3.1) следует из того, что каждое последующее уравнение содержит только одно новое неизвестное по сравнению с предыдущим, так что Sv могут быть вычислены последовательно. Справедливость (5.4) может быть доказана аналогичным образом. в. Неравенства Бонферрони Ряд неравенств как для Р[/я], так и для Рт может быть полу- чен следующим образом. Если либо в формуле (3.1), либо в (5.2) оставлены лишь слагаемые, содержащие Sm, Sm+i, Ет+Г_^, а слагаемые, содержащие Sm+r, Sm+r+i, ..., SN, отброшены, то погрешность (т. е. истинное значение минус приближенное зна- чение) имеет знак первого отброшенного члена \а именно, (—1)г] и не превосходит его по абсолютной величине. Таким образом, при г = 1 и г = 2 Sm-(m + l)SB!+f<P[n2]<SCT (5.6) И Sm-rnSm+i^Pm^Sm. (5.7) Идея доказательства. Тождество (3.1) показывает, что утверж- дение (5.6) эквивалентно неравенству 2 (5.8) v=/ \ т у для любого t. Для того чтобы представить левую часть в виде линейной комбинации P[k}, воспользуемся соотношением (5.3). При t k N коэффициент при P[kl равен fk—т—1\ Последняя сумма равна К ) и, следовательно, положительна (задача 13 гл. II, 12). Дальнейшие неравенства можно найти в монографии Фреше, цитированной в начале главы. § 6. ЗАДАЧИ Замечание. Предполагается, что в каждом случае все комбинации равнове- роятны. 1. В чулане находится десять пар ботинок. Случайно выбираются четыре ботинка. Найти вероятность того, что среди выбранных четырех ботинок есть по крайней мере одна пара. 2. Бросаются пять игральных костей. Найти вероятность того, что по мень- шей мере на трех из них выпадут одинаковые грани (проверить методами гл. II, 5). 3. Найти вероятность того, что при пяти бросаниях монеты герб выпадет по меньшей мере три раза подряд, 5 №221
130 Гл. 1 У< Комбинации, событий 4. Решить задачу 3 для случая по меньшей мере пяти последовательных выпа- дений герба при десяти бросаниях. 5. Решить задачи 3 и 4 для выпадения единицы, если бросается игральная кость вместо монеты. 6. Две кости бросаются г раз. Найти вероятность рг того, что каждая из ше- сти комбинаций (1, 1), . s (6, 6) появится по меньшей мере один раз. 7. Четверки у игрока в бридж. При игре в бридж среди тринадцати карт од- ного игрока могут содержаться 0, 1, 2 или 3 четверки карт одного значения. Вы- числить соответствующие вероятности. 8. Выбор с возвращением. Из генеральной совокупности п людей извлекается выборка объема г. Найти вероятность иг того, что в этой выборке будут содержать- ся N заданных людей. (Это задача 12 гл. II, 11.) 9. Выбор без возвращения. Ответить на вопрос задачи 8 в этом случае и показать, что иг—> (Это задача 3 гл. II, И, но настоящий метод при- водит к другому по форме результату. Доказать тождественность результатов.) 10. Доказать, что в общем разложении детерминанта порядка N число слагае- мых, содержащих один или более диагональных элементов, равно N\Pi, гдеРц определяется соотношением (1.7). 11. Доказать, что число способов, которыми 8 ладей могут быть расставлены на шахматной доске так, что ни одна из них не бьет другую и ни одна не стоит на белой диагонали, равно 8!(1—Рх), где Р± определяется соотношением (1.7) при ЛА=8. 12. Задача о выборке (о собирании купонов). Колода карт состоит из s одина- ковых наборов, содержащих каждый п карт, занумерованных числами 1, 2, . .. . п. Из колоды извлекается без возвращения случайная выборка объема Вычислить вероятность иг того, что каждое число представлено в выборке. (При- менительно к колоде карт для игры в бридж при s=4, п=13 получается вероят- ность того, что среди г выбранных карт содержатся все 13 значений, а при $== 13, п=4 — вероятность того, что в выборке представлены все четыре масти.) 13. Продолжение. Показать, что при s—> оо иг—> р0 (г, п), где послед- няя величина определена формулой (2.3). Это означает, что в пределе наш выбор становится случайным выбором с возвращением из совокупности чисел 1, 2, ..., п. 14. Продолжение. Из результатов задачи 12 вывести, что при г < п п 2 (-’)* ( ь ) («S-Mr = 0. ft=о к k J а при г — п п / \ У (-!)* I 2 I (ns-ks)n = s"n\. ft = о \k J Чтобы проверить это, вычислить r-ю производную при х = 0 функции 15. В задаче 12 о выборке найти вероятность того, что потребуется ровно г извлечений для получения выборки, содержащей все числа. Перейти к пределу при S—>СО. 16. В ядре клетки содержатся N хромосом, между любыми двумя из которых возможен обмен частями. Предположив, что произошло г обменов (которые могут осуществиться (^)г различными способами), найти вероятность того, что в них участвовало ровно т хромосом х). 17. Найти вероятность того, что среди 5 случайно выбранных карт из колоды для игры в покер отсутствует ровно k мастей. J) О случае ЛЛ=6 см. Catcheside D. G., Lea D. Е., Thoday J. M., Types of chromosome structural change introduced by the irradiation of tradescantia micro- spores, Journal of Genetics, 47 (1945—1946), 113—149.
§ 6, Задачи 131 18. Найти вероятность того, что набор из тринадцати карт из колоды для игры в бридж содержит ровно k пар «туз — король» одной масти. 19. Кратные совпадения. Две одинаковые колоды из N различных карт каждая сравниваются одновременно с такой же третьей (контрольной) коло- дой. Найти вероятность ит того, что будет ровно т двойных совпадений. Показать, что uQ—>1 при N—> оо (откуда вытекает, что ит—>0прит^1). 20. Сложные совпадения. Процедура сравнения из предыдущей задачи модифи- цируется следующим образом. Из 2N карт случайно выбираются N, и только эти N карт сравниваются с контрольной колодой. Найти вероятность отсутствия совпа- дений. Доказать, что она стремится к 1/е при Л/->оо. 21. Сложные совпадения. Решить задачу 20, если вместо двух используется г колод. 22. В классической задаче о размещении вероятность Р[т] (k) того, что ровно в т ящиках окажется по k шаров, равна р (k\ = rl V (-IV___________ mln' " (/ —m)l (п—/)! (г—/й)! (й!)/’ где суммирование распространяется на те для которых j^n и kj^r, 23. Доказать последнее утверждение §2 в случае &=1. 24. Используя (3.1), найти вероятность того, что в случае статистики Бозе — Эйнштейна ровно пг ячеек останутся пустыми. 25. Проверить, что формула, полученная в задаче 24, тождественна формуле (11.14) гл. II. 26. Доказать (1.5) индукцией по
ГЛАВА V УСЛОВНАЯ ВЕРОЯТНОСТЬ. СТОХАСТИЧЕСКАЯ НЕЗАВИСИМОСТЬ С этой главы мы продолжим систематическое изложение основ теории вероятностей. § 1. УСЛОВНАЯ ВЕРОЯТНОСТЬ Понятие условной вероятности является основным инстру- ментом теории вероятностей, и удручает тот факт, что его крайняя простота отчасти затемняется чрезвычайно сложной терминологией. Следующие ниже рассуждения естественным путем ведут к формаль- ному определению. Предварительные примеры Предположим, что в генеральной совокупности из N человек NA страдают дальтонизмом и NH являются женщинами. Обозначим через А и Н соответственно события, состоящие в том, что слу- чайно выбранный человек страдает дальтонизмом или что он яв- ляется женщиной. Тогда (см. определение случайного выбора, гл. II, 2) Р {Л} = Na/N, Р {Н} = NH/N. (1.1) Мы можем теперь сосредоточить внимание на подмножестве, состоя- щем из женщин. Вероятность того, что лицо, случайно выбранное из этого подмножества, страдает дальтонизмом, равна NHA/NH, где N НА—число женщин-дальтоников. Мы не приходим здесь к новому понятию, но нуждаемся в новом обозначении, указываю- щем на то, какое именно подмножество исследуется. Наиболее широко распространено обозначение Р{Л|Я}, которое может читаться как «вероятность события А (дальтонизм) при условии события Я (случайно выбранное лицо является женщиной)». В сим- волической записи: P{A\H} = NahJNh = P{AH}/P{H}. (1.2) Разумеется, каждое подмножество может рассматриваться как отдельная генеральная совокупность; мы употребляем термин под- множество только для удобства, для того чтобы подсознательно помнить, что мы имеем более широкую генеральную совокупность.
§ 1. Условная вероятность 133 Страховую компанию может интересовать частота повреждений, вызванных молнией и приносящих фиксированный ущерб (событие Д). Вероятно, эта компания имеет различные категории застрахо- ванных объектов: индустриальные, городские, сельские и т. д. Изучение отдельно ущерба, нанесенного индустриальным объектам, означает исследование события А лишь в связи с событием Я — «ущерб причин индустриальному объекту». Формула (1.2) вновь применима очевидным образом. Заметим, однако, что для страховой компании, специализирующейся на индустриальных объектах, мно- жество Я совпадает со всем пространством элементарных событий и Р {А\Н} сводится к Р{Д}. Наконец, рассмотрим игрока «Север» при игре в бридж. После сдачи карт он знает свои карты и интересуется только распределе- нием остальных 39 карт. Это побуждает рассматривать совокупность всех возможных распределений оставшихся 39 карт как новое пространство элементарных событий, однако совершенно очевидно, что удобнее рассматривать их в связи с данным распределением 13 карт игрока «Север» (событие Я) и говорить о событии А (ска- жем, «Юг» имеет двух тузов) при условии события Я. Формула (1.2) вновь применима. ► По аналогии с (1.2) введем формальное определение. Определение. Пусть Я — событие положительной вероятности. Для любого события А будем писать Р {А\Н}=Р {АН}/Р {Я}. (1.3) Так определенная величина будет называться условной вероятностью А при условии Я (или при заданном Н). Если все элементарные события имеют равные вероятности, то Р{Л|Я} равно отношению NAH/NH числа элементарных событий, общих для А и Я, к числу элементарных событий в Я. Условные вероятности остаются неопределенными, когда собы- тие Я имеет нулевую вероятность. Эта ситуация не существенна в дискретном случае, но важна в общей теории. Хотя обозначение Р {А\Н} само по себе является практичным, его словесная расшифровка этим свойством не обладает и использу- ется реже. Так, в нашем вводном примере мы рассматривали веро- ятность того, что женщина страдает дальтонизмом, не говоря «ус- ловная вероятность того, что случайно выбранное лицо страдает дальтонизмом, при условии, что оно является женщиной». Часто слова «при условии Я» заменяют словами «если известно, что Я осуществилось». Короче говоря, наши формулы и символы недву- смысленны, но словесные выражения часто неформальны и требуют четкого истолкования. Для стилистической ясности вероятности на исходном простран- стве элементарных событий будут иногда называться безусловными
134 Гл. V. Условная вероятность. Стохастическая независимость (абсолютными) вероятностями в отличие от условных вероятнос- тей. Строго говоря, прилагательное «безусловная» излишне и мо- жет быть опущено. Рассмотрение условных вероятностей различных событий при одном и том же данном событии Н равносильно выбору Я в ка- честве нового пространства элементарных событий с вероятностями, пропорциональными первоначальным. Коэффициент пропорциональ- ности Р {Н} необходим для того, чтобы сделать вероятность нового пространства элементарных событий равной единице. Из сказанного следует, что все основные теоремы о вероятностях остаются спра- ведливыми для условных вероятностей, взятых относительно неко- торого фиксированного события Н. Например, основное соотноше- ние для вероятности осуществления одного из событий А или В или их обоих принимает вид Р{Л иВ|Я} = Р{Л\Н} + Р{В\Н} — Р{ЛВ|Я}. (1.4) Аналогично переносятся на случай условных вероятностей все тео- ремы гл. IV, касающиеся вероятностей осуществления т из N событий, однако они нам не понадобятся. Формула (1.3) часто используется в следующем виде: Р {АН}>=Р {Л|Я}-Р {Я}. (1.5) Это так называемая теорема об умножении вероятностей. Для того чтобы обобщить ее на случай трех событий Л, В, С, положим сна- чала Н^=ВС и затем дважды применим (1.5); получим Р {ЛВС}-Р {Л|ВС}-Р {В|С}-Р {С}. (1.6) Аналогично проводится обобщение на случай любого числа собы- тий. В заключение приведем простую, но часто используемую фор- мулу. Пусть Ях, . . ., Нп — множество взаимно исключающих событий, таких, что одно из них непременно произойдет (т. е. объе- динение Яъ. . ., Я7г дает все пространство элементарных событий). Тогда любое событие Л может осуществиться только одновременно с некоторым Hj, или символически Л-ЛЯхиЛЯ2и. . .иЛЯп. (1.7) Поскольку AHj попарно несовместны, их вероятности складыва- ются. Применяя (1.5) к Я=Я7- и суммируя, получаем р{дь2рМ1адр{//д (1.8) Эта формула полезна потому, что оценка условной вероятности Р часто оказывается проще, чем прямое нахождение Р {Л }. Примеры, а) Выбор без возвращения. Из генеральной совокуп- ности, содержащей п элементов 1, 2, . . п, извлекается упо- рядоченная выборка. Пусть i и / — два различных элемента, Какова вероятность того, что вторым извлеченным элементом будет
1. Условная вероятность 135 j (событие А), если первым извлеченным элементом был I (событие /7)? Ясно, что Р {АН}=1/[п(п~ 1)] и Р {А\Н}~1/(п— 1). Это выра- жает тот факт, что второй выбор относится к генеральной совокуп- ности, состоящей из п—1 элементов, каждый из которых может быть выбран с одинаковой вероятностью. Действительно, боль- шинство естественных определений случайного выбора таковы: «Каковы бы ни были первые г выбранных элементов, на (г-\А\м шаге для каждого из оставшихся п—г элементов вероятность быть выбранным равна 1/(п—г)». Это определение эквивалентно данному в гл. II, но мы не вводили его ранее, поскольку оно опирается на понятие условной вероятности. б) Четыре шара последовательно размещаются в четырех ящи- ках, причем все 44 комбинаций равновероятны. Какова вероятность того, что одна из ячеек будет содержать ровно три шара (событие А), если известно, что первые два шара оказались в разных ячейках (событие /7)? При данном Н событие А может осуществляться двумя способами, и, таким образом, Р {А\Н}=2• 4~2=1/8. (Легко непосредственно проверить, что события Н и АН содержат 12 х Х42 и 12-2 точек соответственно.) в) Распределение по признаку пола. Рассмотрим семьи с двумя детьми. Обозначим буквами м и д соответственно мальчика и де- вочку, и на первом месте будем указывать старшего ребенка. Имеем четыре возможности: мм, мд, дм, дд. Это четыре элементарных собы- тия, и мы припишем каждому из них вероятность 1/4. Какова веро- ятность того, что оба ребенка мальчики (событие А), если известно, что в семье уже есть мальчик (событие //)? Событие АН означает мм, а Н означает мм или мд или дм. Поэтому Р {А |//}=1/3; примерно для каждой третьей семьи, для которой выполнено собы- тие Н, следует ожидать также выполнения события А. Интересно, что большинство людей ожидают ответ 1/2. Это правильный ответ на другой вопрос, а именно: мальчик выбран случайным образом и оказалось, что он из семьи с двумя детьми; какова вероятность того, что второй ребенок мальчик? Различие может быть объяснено эмпирически. В нашей первой задаче мы имели дело с множеством семей, во второй — с множеством мужчин. В последней задаче каж- дая семья с двумя мальчиками представлена дважды, и этим объяс- няется различие в результатах. г) Неоднородные совокупности. Предположим, что генеральная совокупность людей состоит из подмножеств или классов Н±, Н2, . . . . Это могут быть расы, возрастные группы, профессии и т. д. Пусть pj — вероятность того, что случайно выбранный из генераль- ной совокупности индивидуум принадлежит Hj. Фраза «qj есть ве- роятность того, что индивидуум из Hj является левшой» служит для более короткого выражения следующего факта: «qj есть услов- ная вероятность события А (является левшой) при условии, что индивидуум принадлежит Hj». Вероятность того, что случайным образом выбранный индивидуум является левшой, равна ihqi+
136 Гл. V. Условная вероятность. Стохастическая независимость +р27г+Рз7з+- • . , что представляет собой частный случай (1.8). Если известно, что индивидуум левша, то условная вероятность того, что он принадлежит подмножеству Я7-, равна Р {Hj\A . .)• (1.9) 2. ВЕРОЯТНОСТИ, ОПРЕДЕЛЯЕМЫЕ ЧЕРЕЗ УСЛОВНЫЕ ВЕРОЯТНОСТИ. УРНОВЫЕ МОДЕЛИ В предыдущем параграфе нам были заданы вероятности эле- ментарных событий, и мы нашли некоторые условные вероятности. В приложениях многие эксперименты описываются указанием определенных условных вероятностей (хотя прилагательное «ус- ловный» обычно опускается). Теоретически это означает, что веро- ятности на пространстве элементарных событий должны быть най- дены из заданных условных вероятностей. Как уже было отмечено выше (пример 1, а)), выбор без возвращения лучше всего определить следующим образом: если известен результат первых г испытаний, то на (г+1)-м шаге любой оставшийся элемент может быть выбран с одинаковой вероятностью. Аналогично в примере 1, г) неоднород- ная популяция полностью описывается указанием абсолютных веро- ятностей pj каждого класса и условных вероятностей qj, характери- зующих левшей в каждом классе. Еще несколько примеров разъяс- нят общую схему лучше, чем прямое описание. Примеры, а) Возвратимся к примеру гл. I, 5, б), в котором в игре принимают участие три игрока а, b и с. В таблице (*) гл. 1,5 описано пространство элементарных событий, но мы еще не опре- делили на нем вероятности. Предположим теперь, что игра такова, что в каждой партии оба игрока имеют вероятность выигрыша 1/2. Это определение не содержит слов «условная вероятность», однако неявно ее использует. Оно означает, что если игрок а участвует в r-й партии (событие Я), то вероятность его выигрыша в этой партии равна 1/2. Из (1.5) следует, что вероятность того, что а вы- играет в первой и второй партиях, равна 1/4 (символически Р {аа}^ — 1/4). Повторное применение (1.5) показывает, что Р {асс}—\/8, Р {acbb}^= 1/16 и т. д., т. е. элементарное событие в схеме (#), включающее г букв, имеет вероятность 2“г. Такие же вероятности использованы в задаче 5 гл. 1,8, однако теперь их описание более наглядно. (Продолжение см. в задаче 14.) б) Семьи. Мы хотим истолковать следующее утверждение: «ве- роятность того, что в семье имеется ровно k детей, равна рк (где 2p/i = 1). При любом фиксированном числе детей в семье все воз- можные их распределения по признаку пола равновероятны». Пусть буква м означает мальчика, а д — девочку. Пространство элементарных событий состоит из точек 0 (нет детей), м, д, мм, мд, дм, дд, ммм,. . . . Второе из наших предположений более строго формулируется так: если известно^ что в семье ровно п
§ 2. У p новые модели 137 детей, то каждое из 2п возможных распределений их по признаку пола имеет условную вероятность 2~п. Вероятность условия равна рп, и из (1.5) находим, что безусловная вероятность любой последо- вательности из п букв м и д равна рп-2~п. Заметим, что это пример генеральной совокупности, разделенной на классы: семьи, имеющие / детей, образуют класс Hj. В качестве упражнения рассмотрим событие А «в семье есть мальчики, но нет девочек». Его вероятность, очевидно, равна Р {Л }^=pi-2“1+/?gx х2~2+. . . , что является частным случаем (1.8). Условием Hj в этом случае является событие «в семье / детей». Зададим теперь вопрос: чему равна (условная) вероятность того, что в семье один ребенок, если известно, что в ней нет девочек?» Здесь условием явля- ется А. Пусть И— событие «имеется только один ребенок». Тогда АН означает «имеется один ребенок, не являющийся девочкой» и Р М} = уру = ^2-1 + pJ-a +Рз2-з+ , ~ это частный случай (1.9). в) Урновые модели эффекта последействия. Рассмотрим для определенности завод, на котором возможны аварии. Каждую ава- рию можно рассматривать как результат случайности: из урны, содержащей красные и черные шары, через постоянные интервалы времени случайно извлекается один шар, причем красный шар оз- начает аварию. Если вероятность аварии постоянна во времени, то состав урны остается неизменным. Более реальной, однако, является ситуация, когда каждая авария приводит к эффекту последействия, в силу которого вероятность новой аварии либо увеличивается, либо уменьшается. Это соответствует урне, содержимое которой меняется по определенным правилам, зависящим от исходов последо- вательных извлечений. Легко придумать много таких правил, отве- чающих различным ситуациям, однако мы ограничимся обсужде- нием одной следующей модели *). Урновая модель. Урна содержит b черных и г красных шаров. Случайно извлекается шар. Он возвращается обратно, и, кроме того, добавляется с шаров одного с ним цвета и d шаров другого цвета. Производится новое случайное извлечение из урны, (теперь содержа- щей r-\-bA~cA~d) шаров, и описанная процедура повторяется. Здесь с и d — произвольные целые числа. Они могут быть выбраны отрицательными, однако в этом случае процесс может окончиться х) Идея использовать урновые схемы для описания эффекта последействия (заражения) была, по-видимому, впервые предложена Пойа. Его схема (впервые введенная в работе Eggenberger F., Polya G., Uber die Statistik verketteter Vor- gange, Zeitschrift fiir Angewandte Mathematik und Mechanik, 3 (1923), 279—289) послужила прототипом для многих других моделей, которым посвящена обшир- ная литература. Модель, описанная в тексте, и три ее частных варианта были пред- ложены Фридманом (Friedman В., A simple urn model, Communications on Pure and Applied Mathematics, 2 (1949), 59—70),
138 Гл. V. Условная вероятность. Стохастическая независимость после конечного числа извлечений из-за отсутствия шаров. В част- ности, выбирая с~ —1 и d~0, имеем модель случайного выбора без возвращения, который оканчивается через г+b шагов. Чтобы придать нашему образному описанию точный математи- ческий смысл, заметим, что оно определяет условные вероятности, из которых могут быть вычислены некоторые основные вероятности. Точку пространства элементарных событий, соответствующую п извлечениям, можно представить как последовательность п букв Ч и К. Событие «первым извлечен черный шар» (т. е. множество всех последовательностей, начинающихся с Ч) имеет вероятность b/(b+r). Если первый шар черный, то вероятность (условная) того, что при втором извлечении будет черный шар, равна (b+c)/ (b+r+c+d). Вероятность (безусловная) последовательности «черный, черный» (т. е. множество элементарных событий, начинающихся с ЧЧ) равна, следовательно, по (1.5) [b/(b+r)l[ (b+c)/ (b+r+c+d)]. (2.2) Вероятность последовательности «черный, черный, черный» равна (2.2), умноженному на (b+2c)/(b+r+2c+2d) и т. д. Таким способом могут быть вычислены вероятности всех элементарных событий. Легко проверить по индукции, что сумма вероятностей всех эле- ментарных событий равна единице, как и должно быть. Точные выражения для вероятностей получить нелегко, за исключением следующего, самого важного и лучше всего изученного частного случая. Урновая схема Пойа, характеризующаяся значениями d?=0, с>0. В этом случае после каждого извлечения число шаров цвета выбранного шара увеличивается, тогда как число шаров другого цвета не меняется. Это приводит к тому, что извлечение шара опре- деленного цвета увеличивает вероятность выбора шара того же цвета при следующем извлечении, и мы получаем грубую модель такого явления как заражение, при котором каждое заболевание увеличивает вероятность дальнейших заболеваний. Вероятность того, что при п—П1+/?2 извлечениях в первых nt были черные шары, а в остальных /?2 красные, равна b(b-\-c) (b+2c)\,,r(b + njc—c)-r (r + n2c—c) о\ (6 + г) (Ь + г+с) (&4-г+2с) ... (Ь-^-г + пс—с) * ' ’ ' Рассмотрим далее любой другой порядок выбора черных и п2 красных шаров. Вычисляя вероятность того, что п извлечений приведут к такому порядку цветов, мы получим те же множители, что в (2.3), но расположенные в другом порядке. Отсюда следует, что все возможные последовательности nt черных и пъ красных шаров имеют одинаковые вероятности. Аналитическая простота (и, следовательно, легкость применения) урновой схемы Пойа сле- дует главным образом из этого характеристического свойства. Чтобы
*§2. У р новые модели 139 найти вероятность п того, что при п извлечениях было п± чер- ных и щ красных шаров в произвольном порядке, мы должны умножить (2.3) на а именно на число возможных упорядоче- ний. Использование обобщенных биномиальных коэффициентов позволяет записать эту вероятность в любой из следующих форм: fni—/п2—14-r/c\ /— Ь/с\ f — rjcX n — \ J \ n2 J __ \ "i / \ «2 / /О w / n — 1 + (£> —J-r)/c \ /— (Z?+r)/c\ • \ f k n J \ n J (Обсуждение схемы Пойа продолжается в задачах 18—24; см. также задачи 9 и 10 гл. XVII, 10.) В дополнение к схеме Пойа рассмотрим еще одну урновую мо- дель, представляющую интерес, а именно модель Эренфестов. Модель Эренфестов х) теплообмена между двумя изолированными телами, В первоначальном описании модели, используемом фи- зиками, рассматриваются два сосуда I и II и k находящихся в них частиц. Случайным образом выбирается частица и переносится в другой сосуд. Эта процедура повторяется. Каково распределение частиц после п шагов? Для того чтобы свести эту задачу к урновым моделям, достаточно назвать частицы в сосуде I красными шарами, а в сосуде II — черными шарами. Тогда после каждого извлечения выбранный шар заменяется шаром другого цвета, т. е. мы имеем с——1, d=l. Ясно, что в этом случае процесс может продолжаться сколь угодно долго (если не останется красных шаров, то автомати- чески извлекается черный и заменяется на красный). (Мы обсудим модель Эренфестов с другой точки зрения в примере гл. XV, 2,д).) Частный случай с—0, d>0 был предложен Фридманом в качестве модели службы безопасности. Каждый раз, когда происходит авария (т. е. извлекается красный шар), служба безопасности усиливает контроль; если же аварии не происходит, то контроль ослабевает и вероятность аварии увеличивается. г) Урновые модели для неоднородных совокупностей. Ложное за- ражение. Развивая предыдущий пример, предположим, что каждый человек подвержен несчастным случаям; произойдет или не произой- дет этот несчастный случай, определяется случайным извлечением шара из урны. Однако на этот раз будем предполагать, что нет никакого эффекта последействия, так что содержимое урны остается неизменным в течение всего процесса. Зато вероятность несчастного случая или предрасположенность к нему меняется от человека к человеку или от профессии к профессии, и мы предполагаем, что каждому человеку (или каждой профессии) соответствует своя урна. х) Ehrenfest Р., Ehrenfest Т., Uber zwei bekannte Einwande gegen das Boltz- mannsche //-Theorem, Physikalische Zeitschrift, 8(1907), 311—314. Математическую теорию см. Kac М., Random walk and the theory of Brownian motion Amer. Math, Monthly, 54 (1947), 369—391»
140 Гл. V. Условная вероятность. Стохастическая независимость Для того чтобы не усложнять без необходимости изложение, пред- положим, что имеется всего два типа людей (две профессии) и их числа во всей совокупности относятся как 1 : 5. Рассмотрим теперь урну I, содержащую красных и bi черных шаров, и урну II, содержащую г2 красных и Ь2 черных шаров. Эксперимент «слу- чайным образом выбираем человека и наблюдаем, сколько несчаст- ных случаев произошло с ним в течение п единиц времени» можно интерпретировать следующим образом: бросается игральная кость', если выпадает единица, то выбираем урну I, в противном случае выбираем урну II. В каждом случае производится п случайных изв- лечений с возвращением из выбранной урны. Наш эксперимент опи- сывает ситуацию, возникающую при заключении договора между страховой компанией и новым клиентом. Используя (1.8), находим, что вероятность извлечения первым красного шара равна Р {/С} = (1/6) \г1ЦЬ1 + G)] + (5/6) [г2/(Ь2 + га)], (2.5) а вероятность последовательности «красный, красный» составляет Р {КК\ = (1/6) [rj^ + rx)p + (5/6) [r2/(fr2 + r2)p. (2.6) Наша модель не приводит к новым математическим задачам, однако она имеет интересную особенность, приводящую в приложениях к неожиданным выводам. Предположим, что страховая компания регистрирует, что в течение первого года с новым клиентом произо- шел несчастный случай, и интересуется вероятностью несчастного случая с ним в следующем году. Иначе говоря, какова (условная) вероятность последовательности «красный, красный», если при первом испытании извлечен красный шар. Очевидно, она равна отношению? {КК}/Р {К} и отличается отР {К}. Для иллюстрации предположим, что rj (Ьх+гО—ОД и r2! Вероятность извлечения красного шара в любом испытании равна 0,15, но если при первом испытании был извлечен красный шар, вероятность того, что красный шар будет извлечен при следующем, равна 0,42. Заметим, что наша модель предполагает отсутствие последействия для всей совокупности, однако несчастный случай со случайно выбранным человеком увеличивает вероятность того, что с ним же произойдет второй несчастный случай. Здесь мы имеем просто эффект выбора: несчастный случай не оказывает действитель- ного влияния на будущее, а только указывает, что выбранный че- ловек имеет большую предрасположенность к несчастным случаям. Поэтому продолжающиеся наблюдения позволяют уточнить наши прогнозы, даже если в действительности прошлое вообще не влияет на будущее. В статистической литературе стало привычкой использовать термин заражение вместо эффект последействия. Кажущийся эф-
g 21 Урновые модели 14% фект последействия выбора сначала неправильно интерпретиро- вался как эффект действительного заражения, и поэтому статистики теперь говорят о заражении (или о вероятностных распределениях при заражении) в неясном и вводящем в заблуждение смысле. Возьмем, например, натуралиста, который ловит насекомых в поле. Если после периода неудач он находит насекомое, то вполне ве- роятно, что он находится вблизи выводка, и в этом случае можно ожидать дальнейших успехов. Иначе говоря, на практике каждый успех увеличивает вероятность дальнейших успехов, но отметим еще раз, что это только эффект увеличения информации, обеспечивае- мый выбором. Никакого эффекта последействия здесь нет, и ста- тистики вводят в заблуждение, когда говорят о заражении. д) Следующий пример широко известен и поучителен, но не- сколько искусствен. Представим себе совокупность из Af-Ы урн, в каждой из которых содержится N шаров; урна с номером k содержит k красных и N—k белых шаров (&=0, 1, 2,. . . , N). Случайным образом выбирается урна и из нее п раз извлекаются шары, причем выбранный шар каждый раз возвращается обратно. Предположим, что все п выбранных шаров оказались красными (событие Л). Найдем (условную) вероятность того, что следующим будет извлечен также красный шар (событие В). Если сначала была выбрана урна с номером k, то вероятность того, что из нее были последовательно извлечены п красных шаров, равна (k!N)n. Сле- довательно, в силу (1.8) Р {А} == (1п + 2" + ... 4- N”)/[Nn (N + 1)]. (2.7) Событие АВ означает, что при п+1 извлечениях были красные шары, и поэтому Р {АВ} = Р {В} = (1"+1 + 2n+1 + ... + Nn+^)/[Nn+1 (N + 1)]. (2.8) Искомая вероятность равна Р {В|Л}=Р {В}/Р {Л}. При больших значениях N числитель в (2.7) относительно мало отличается от площади между осью х и графиком хп в интер- вале (О, N). Тогда приближенно имеем N Р И} ?/«(л/ + 1) j хП dx = [лгрт * "п+Т [п+Т ’ о Аналогичные вычисления, примененные к (2.8), показывают, что для больших N приблизительно Р{В|Л}^ (п+1)/(п+2). (2.10) Этот результат можно грубо интерпретировать следующим образом: если все возможные варианты содержимого урны равновероятны и при п испытаниях появлялись красные шары, то вероятность по- явления красного шара при следующем испытании равна (п+1)/ /(п+2). Это так называемый закон следования Лапласа (1812).
142 Гл. V. Условная вероятность, Стохастическая независимость До развития современной теории понятие равновероятности часто использовалось как синоним для «отсутствия предваритель- ных знаний». Сам Лаплас иллюстрировал применение (2.10) вычис- лением вероятности того, что Солнце взойдет на следующий день, если оно всходило ежедневно в течение 5000 лет или п= = 1 826 213 дней. Говорят, что Лаплас был готов поставить 1 826 214 против 1 за то, что Солнце не изменит своего поведения; в наше время следовало бы увеличить ставку, так как регулярное движение Солнца наблюдалось в течение еще одного столетия. Чтобы понять, что имел в виду Лаплас и истолковать его выводы, потребовалось бы целое историческое исследование. Его последователи, однако, использовали аналогичные рассуждения повсеместно и рекомендо- вали физикам и инженерам применять такие методы в случаях, в которых полученные формулы не имеют никакого реального смысла. Мы должны отвергнуть этот метод, даже если допустим, что наша вселенная случайно выбрана из некоторого множества вселенных, в котором все мыслимые возможности равновероятны. Действитель- но, он претендует на оценку шансов восхода Солнца завтра на ос- нове предположения о том, что оно всходило в прошлом. Однако предполагаемый восход Солнца 5 февраля 3123 г. до н. э. ничуть не болеедостоверен, чем восход Солнца завтра. У нас одинаковые ос- нования верить в оба этих события. > Замечание о формуле Бейеса. В (1.9) и (2.2) мы нашли некоторые условные вероятности, исходя непосредственно из определения. Начинающему рекоменду- ется поступать так всегда и не запоминать формулу (2.12), которую мы сейчас выведем. Она воспроизводит в общем виде то, что мы делали в частных случаях, и является просто другой формой записи (1.3). В примерах мы имели группу вза- имно исключающих и исчерпывающих все пространство событий Н±, Н2, . . ., т. е. таких, что каждое элементарное событие принадлежит одному и только одному из Нj, и нас интересовала следующая вероятность: Р{Я*|А}=Р{АЯ*}/Р{А}. (2.11) Если в (2.11) подставить (1.5) и (1.8), то эта формула принимает вид р {Нк I Л} = Р {А I Нк} Р {Нк}12 р {A I Hj} Р {Hj}, (2.12) Если события назвать гипотезами, то (2.12) будет «формулой Бейеса для вероят- ностей гипотез». С математической точки зрения (2.12) представляет собой специ- альный вид записи (1.3) и ничего больше. Эта формула полезна во многих статисти- ческих приложениях, подобных описанным в примерах б) и г), где мы ее и исполь- зовали. К сожалению, формула Бейеса была дискредитирована метафизическими приложениями вроде описанного в примере д). На практике подобные рассужде- ния могут привести к опасным последствиям. Инженер по контролю качества имеет дело с одной конкретной машиной, а не с бесконечным множеством машин, из ко- торого случайно выбрана одна. Между тем ему советуют пользоваться формулой Бейеса на том основании, что она логически приемлема и соответствует нашей ма- нере мышления. Такие доводы использовал Платон для доказательства существо- вания Атландиты, а некоторые философы используют для доказательства нелепо- сти механики Ньютона. В нашем случае эти доводы не учитывают того обстоятель- ства, что инженер желает достичь определенного успеха и что он поступит лучше, оценивая и доводя до минимума источники различного рода ошибок в своих пред-
§3, Стохастическая независимость 143 видениях и догадках. Современные методы статистических проверок и оценок менее наглядны, но более реалистичны. Их можно не только оправдать рассужде-« ниями, но и применять, § 3. СТОХАСТИЧЕСКАЯ НЕЗАВИСИМОСТЬ В примерах, приведенных выше, условная вероятность Р {Л|Я}, как правило, не равнялась безусловной вероятности Р {Л}. Грубо говоря, информация о том, произошло или нет событие Н, меняет наше отношение к возможности наступления события А. Только в том случае, когда Р {А|7/}=Р {Л}, эта информация не позволяет сделать никаких выводов об Л. В этом случае мы будем говорить, что Л стохастически не зависит от Я. Из формулы (1.5) следует, что условие Р {Л|Я}=Р {Л} может быть записано в виде Р {ЛЯ}=Р {Л}-Р {Я}. (3.1) Это равенство симметрично относительно Л и Я и показывает, что если Л стохастически не зависит от Я, то и Я стохастически не зависит от Л. Таким образом, лучше отправляться от следую- щего симметричного определения. Определение 1. Два события А и Я называются стохастически независимыми (или, короче, независимыми), если имеет место ра- венство (3.1). Это определение распространяется и на случай Р {Н}=0, в кото- ром Р {Л |Я} не определена. Термин статистическая независимость является синонимом термина стохастическая независимость. На практике обычно бывает ясно, что некоторые события должны быть независимыми, иначе вероятностная модель будет абсурдной. Однако, как покажут приводимые ниже примеры, существуют ситуа- ции, в которых стохастическая независимость может быть установ- лена только путем вычислений. Примеры, а) Из колоды игральных карт случайным образом извлекается одна карта. Из соображений симметрии мы ожидаем, что события «пика» и «туз» независимы. И действительно, их веро- ятности равны 1/4 и 1/13, а вероятность их одновременного осуществ- ления равна 1/52. б) Бросаются две правильные игральные кости. События «еди- ница на первой кости» и «четное число очков на второй» независимы, так как вероятность их одновременного осуществления 3/36=1/12 равна произведению их вероятностей, а именно 1/6 и 1/2. в) При случайной перестановке четырех букв (a, b, с, d) собы- тия «а предшествует &» и «с предшествует d» независимы. Это интуи- тивно ясно и легко проверяется. г) Распределение по признаку пола. Вернемся к примеру 1,в), но теперь рассмотрим семьи с тремя детьми. Предположим, что каж- дая из восьми возможностей ммм, ммд, . . . , Одд имеет вероят-
Гл, V. Условная вероятность. Стохастическая независимость ность 1/8. Пусть Н — событие «в семье имеются дети обоих полов» и А — событие «имеется не более одной девочки». Тогда Р {Н} — —6/8 и Р {Л }=4/8. Одновременное осуществление Л и Я озна- чает одну из возможностей ммд, мдм, дмм, и, таким образом, Р {АН}=3/8=Р {Л}-Р {Н}. Таким образом, для семей с тремя детьми эти два события независимы. Отметим, что это не так в случае семей с двумя или четырьмя детьми. Это показывает, что не всегда очевидно, имеем мы независимость или нет. ► Если осуществилось событие Н, то противоположное событие Н' не осуществилось, и наоборот. Из стохастической независимости следует, что из осуществления Н нельзя сделать никаких выводов об Л; поэтому стохастическая независимость А и Н будет озна- чать то же самое, что независимость Л и Я' (и в силу симметрии событий Л' и Я, а также А' и Я'). Это утверждение легко прове- рить, используя соотношение Р {Н'}=1—Р {Я}. Действительно, если имеет место (3.1), то (поскольку АН'=А—АН) Р{ЛЯ'} = Р{Л} — Р{ЛЯ} = Р{Л} — Р{Л}.Р{Я} = Р{Л}.Р{Я'}, (3.2) как и ожидалось. Предположим теперь, что три события Л, В и попарно неза- висимы, т. е. Р {ЛВ)=Р {Л}-Р {В}, Р {ЛС}=Р {Л}-Р {С}, (3.3) Р {ВС}=Р {В}.р {С}. Можно подумать, что из этих трех соотношений будет следовать равенство Р {АВС}=Р {Л}Р {В}Р {С}, иначе говоря, что из попарной независимости трех событий следует независимость двух событий АВ и С. Это почти всегда так, однако в принципе возможно, что (3.3) имеет место, но в то же время Р {ЛВС}=0. Фактически такие явления настолько редки, что их возможность не была замечена до тех пор, пока С. Бернштейн не построил соот- ветствующий пример. Этот пример является искусственным, однако его существование побуждает искать естественные примеры. Пример, д) Рассмотрим шесть перестановок букв а, Ь, с, а также три тройки (а, а, а), (Ь, Ь, Ь) и (с, с, с). Возьмем эти девять троек в качестве точек пространства элементарных событий и при- пишем каждой вероятность 1/9. Обозначим через Ak событие, со- стоящее в том, что на k-м месте находится буква а, Очевидно, каж-
§З.Стохасти'4еская независимость 145 дое из этих трех событий имеет вероятность 1/3, в то время как Р {ЛЛ2}=Р МИз}=Р {л2л3}=1/9. Три события являются, таким образом, попарно независимыми, но не взаимно независимыми, потому что Р {AXA 2Л3 }=1/9. (Осу- ществление Ai и Л2 влечет осуществление А3, и, значит, А3 не является независимым от Л1Л2.) Мы получим дополнительные примеры, рассматривая также события Bk и Ск, состоящие соответственно в том, что на k-м месте находятся буквы b и с. Всего имеем теперь девять событий, вероятность каждого из которых равна 1/3. Очевидно, Р {ЛьВ2}= = 1/9, и вообще каждые два события с разными индексами незави- симы. С другой стороны, буквы, стоящие на первых двух местах, однозначно определяют букву, стоящую на третьем месте, и, таким образом, С3 не является независимым от каждого из девяти событий Л1Л2,. . . , CiC2, относящихся к буквам, стоящим на первых двух местах х). Мы вернемся к этому примеру в конце § 1 гл. IX. До- полнительный пример приводится в задаче 26. ► Желательно сохранить термин стохастическая независимость для случая, когда имеет место не только (3.3), но также Р{АВС}=Р{А}Р{В}Р {С}. (3.4) Это равенство обеспечивает независимость событий А и ВС, а также В и АС, и С и АВ. Кроме того, можно доказать, что А и В и С также независимы. Действительно, из основного соотношения (7.4) гл. I имеем Р {(Л и В)С}-Р {ЛС}+Р {ВС}—Р {АВС}. (3.5) Применяя вновь (3.3) и (3.4) к правой части, можем вынести множи- тель Р{С}. Второй множитель есть Р {А }+Р {В}—Р{АВ }=Р {Д U В} и, таким образом, Р {(Л UB)C}=P {(A UB)}P {С}. (3.6) Поэтому представляется правдоподобным предположение, что ус- ловий (3.3) и (3.4) в совокупности достаточно для того, чтобы избежать затруднений: каждое событие, которое можно выразить через А и В, не будет зависеть от С. Определение 2. События Ai, Д2, ... , Ап называются взаимно независимыми, если для любых комбинаций 1^/</<й<. . х) Эти рассуждения обобщаются на совокупности из г символов, г > 3. Пространство элементарных событий в этом случае содержит г\-\- г точек, а именно г\ перестановок символов alf ..., аг и г последовательностей вида (aj, aj,..., aj). Каждой перестановке припишем вероятность 1/[г2 (г — 2)!], а каждой последовательности вида (aj, aj, ..., aj) вероятность 1/г2. Если Событие А/г означает, что tzi находится на k-м месте, то Ak попарно незави- симы, но никакие три из этих событий не являются взаимно независимыми.
И6 Гл, V. Условная вероятность. Стохастическая независимость'' справедливы правила умножения рмлнтрмл р{Л;.ла} = рМ/}Р{^}р{4}> . ................................... (3.7) Р{АЛ2 а‘} = Р{а‘}Р{А,} ..’. Р{Л„}. (п\ ( п\ В первой строке стоят I 0 ) равенств, во второй—( „ 1и т.д. \ / \ о J Следовательно, имеем условий, которые должны быть выполнены. С другой стороны, (t]\ 2 j условий в первой строке достаточно для того, чтобы обеспе- чить попарную независимость. Вся система (3.7) выглядит как сложное множество условий, однако скоро станет ясно, что ее справедливость обычно очевидна и не нуждается в проверке. Приме- няя индукцию, легко увидеть [начиная с п=2 и (3.2)], что в оп- ределении 2 систему (3.7) можно заменить системой из 2п равенств, получаемой из последнего равенства (3.7) заменой произвольного числа событий Aj их дополнениями А]. § 4. ПРОИЗВЕДЕНИЕ ПРОСТРАНСТВ. НЕЗАВИСИМЫЕ ИСПЫТАНИЯ Мы теперь окончательно готовы к тому, чтобы ввести математи- ческий аналог эмпирических процедур, обычно называемых непре- рывным экспериментированием, повторяющимся наблюдением, объе- динением двух выборок, комбинированием двух экспериментов и рассмотрением их как частей единого целого и т. д. Понятие независимых испытаний соответствует интуитивному понятию «эк- спериментов, повторяемых в одинаковых условиях». Это понятие является основным для теории вероятностей и придает большую строгость примерам, рассмотренным выше. Сначала нам понадобится понятие, не являющееся специфичным 1ля теории вероятностей. Прямым произведением двух множеств А 1 В называется множество всех упорядоченных пар (а, Ь) из их элементов. Мы будем обозначать1) его через (А, В). Определение 'ривиально распространяется на тройки (Л, В, С), четверки (Ая 3, С, D) и даже на бесконечные последовательности. х) Другим общеупотребительным обозначением является ЛХ^» Термины прямое произведение» и «декартово произведение» — синонимы.
§4. Произведение пространств. Независимые испытания 147 Понятие прямого произведения настолько естественно, что мы его уже неявно использовали. Например, мыслимый эксперимент, состоящий в трехкратном бросании монеты, описывается простран- ством элементарных событий, содержащим восемь точек, а именно троек, которые могут быть образованы из двух букв Г и Р. Это позволяет говорить, что пространство элементарных событий явля- ется прямым произведением трех пространств, каждое из которых состоит из двух точек (элементов) Г и Р. Вообще, когда мы говорим о двух последовательных испытаниях, мы имеем в виду простран- ство ©, точки которого представляют собой пары возможных исходов, и поэтому © является прямым произведением двух про- странств элементарных событий, соответствующих отдельным испытаниям. Два данных мысленных эксперимента с пространства- ми элементарных событий и S3 можно рассматривать одновре- менно или последовательно. Это позволяет рассматривать пары возможных исходов, т. е. ввести прямое произведение (§1, S3) в качестве нового пространства элементарных событий. Возникает вопрос: как должны быть определены вероятности на новом про- странстве элементарных событий? Ответ зависит от обстоятельств, но до рассмотрения этого вопроса мы обратимся к двум примерам, которые помогут понять основные идеи и объяснят применяемую терминологию. Примеры, а) Декартовы пространства. Когда точки плоскости представлены парами действительных чисел (х, у), плоскость ста- новится прямым произведением двух осей. (Тот факт, что геометрию на плоскости можно изучать без использования координат, показы- вает, что одно и то же пространство можно рассматривать с раз- личных точек зрения.) Трехмерное пространство с точками (%, у, z) можно рассматривать либо как прямое произведение трех осей, либо как прямое произведение плоскости х, у и оси z. На плоскости множество точек, удовлетворяющее двум условиям 0<х<1 и 0<7/<1, является прямым произведением двух единичных интервалов. Заметим, однако, что такое описание невозможно для произвольных множеств, таких, как треугольники и эллипсы. Наконец, заметим, что в пространстве %, //, z множество, опреде- ленное теми же самыми неравенствами, является бесконечным цилиндром с квадратным основанием. Вообще в трехмерном про- странстве каждое множество, в определение которого входят только координаты х и у, можно рассматривать как цилиндр с образую- щими, параллельными оси z. б) Алфавиты и слова. Пусть А состоит из 26 букв английского алфавита. Тогда прямое произведение (Л, Л, Л) является множе- ством всевозможных троек букв или, как мы будем говорить, всех трехбуквенных «слов». Так принято в теории связи и в теории коди- рования, но неестественно рассматривать слова фиксированной длины. Действительно, сообщение произвольной длины может
148 Гл. V. Условная вероятность. Стохастическая независимость рассматриваться как «слово», если к алфавиту добавить новый сим- вол для разделения (пробел). Поэтому нет необходимости вводить какие-либо ограничения на длину слов: любое конечное сообщение может рассматриваться как начало потенциально неограниченного сообщения, так же как написанное слово потенциально является первым в некоторых сериях. Попутно отметим, что в теории связи ис- пользуются произвольные коды и под ее влиянием стало общеупот- ребительным называть произвольные символы буквами некоторого алфавита. В этом смысле исходы п повторных испытаний назы- вают «сообщением» или «словом» длины п. ► Если ©—произвольное пространство элементарных событий с точками Ei? Eg, ...» то /г-кратное прямое произведение (©, ©,... ..., ©) пространства © самого на себя называют пространством элементарных событий для последовательности п испытаний, соот- ветствующих ©. Удобно описывать его точки в общем виде сим- волами, такими, как (хп xj, где каждое означает некото- рую точку из ©. По аналогии с примером a) обычно называют координатами. Термины множество и событие могут использоваться как синонимы. Событие, которое зависит только от исхода пер- вых двух испытаний, обычно называют множеством, зависящим только от первых двух координат1). Как уже было указано выше, все эти понятия и обозначения переносятся на случай бесконечных последовательностей. Формально это не вызывает трудностей; например, десятичная последователь- ность 3,1415... представляет число л как точку в пространстве, являющемся бесконечным произведением, только вместо n-я коор- дината говорят гг-я десятичная цифра. Бесконечные произведения пространств очень естественны для теории вероятностей. Неже- лательно фиксировать число бросаний монеты или продолжитель- ность случайного блуждания. Теория становится более гибкой и простой, если мы допустим потенциально неограниченные последо- вательности испытаний и сосредоточим внимание на событиях, за- висящих только от первых нескольких испытаний. Этот более про- стой и удобный подход, к сожалению, требует применения аппарата теории меры. Задачей настоящего тома является ознакомление с ос- новными идеями теории вероятностей, не осложненное техничес- кими трудностями. По этой причине мы ограничиваемся дискрет- ными пространствами элементарных событий и должны удовлетво- риться изучением конечного числа испытаний. Это означает, что, расплачиваясь за простоту, мы вынуждены иметь дело с неопреде- ленными или изменяющимися пространствами элементарных собы- х) То есть если точка (х±, х2) .«.) принадлежит этому множеству, то ему принадлежат все точки (x'lt х2, ...), у которых х^—Х}, х'2 — х2. По аналогии с примером а) множества, зависящие только от некоторых координат (в любом числе), называют цилиндрическими.
§ 4. Произведение пространств. Независимые испытания 149 тий. Такой вариант теоретически неудовлетворителен, но в изве- стной мере полезен практически. Обратимся теперь к вопросу о задании вероятностей на произве- дении пространств. Различные урновые модели § 2 могут быть описаны при помощи повторных испытаний, и мы видели, что ве- роятности в различных схемах можно определить посредством ус- ловных вероятностей. Могут быть рассмотрены различные виды зависимости между последовательными испытаниями, но наиболее важно понятие независимых испытаний или, более общо, независи- мых экспериментов. Для определенности рассмотрим два пространства элементарных событий 31 и 33 с точками ai? а2, ... и |32, ..., имеющими вероятности р±, р2, .., и qlf q2, ... соответственно. Мы интер- претируем произведение пространств (31, 33) как пространство эле- ментарных событий, описывающих последовательность двух экспе- риментов, соответствующих 51 и 33. Говоря, что эти два экспери- мента независимы, мы имеем в виду, что два события «первый исход есть ар> и «второй исход есть pft» стохастически независимы. Однако дело обстоит так только в том случае, когда вероятности на (31, 33) определены по правилу Р{К М = А%- [(4.1) Такое задание вероятностей правомерно1), потому что в сумме они дают единицу. Действительно, суммирование по всем элементарным событиям приводит к двойной сумме 22 ptqk, которая является произведением сумм 2а- и 2 qk. Условимся теперь, что слова «два независимых эксперимента» означают прямое произведение двух пространств элементарных собы- тий с вероятностями, определенными по правилу умножения (4.1). Это соглашение распространяется на понятие п последовательных .независимых экспериментов. Мы говорим о повторных независимых испытаниях, если прост- ранства элементарных событий, соответствующих каждому испы- танию (и вероятности на них), идентичны. Это соглашение дает нам право, например, для краткости гово- рить т независимых бросаний монеты» вместо «пространство элемен- тарных событий, состоящее из 2п точек, каждой из которых припи- сывается вероятность 2~V Заслуживает упоминания следующее интуитивно очевидное свой- ство независимых экспериментов. Пусть А—событие из 31, содер- жащее элементарные события ..., и [пусть В—событие из 33, содержащее элементарные события |3Л, |3/2, .... Тогда (Л, В) есть событие из (51, 33), которое состоит'из всех пар (as., х) Аналогично определяемые меры встречаются и вне теории вероятностей и называются произведением мер,
150 Гл. V. Условная вероятность. Стохастическая независимость и, очевидно, Р{(Л, B)}=22ps,^=(2ps.)(S^)=P{^P{B}. (4.2) Таким образом, правило умножения распространяется на произ- вольные события в пространствах-сомножителях. Эти рассуждения применимы к п независимым экспериментам и показывают, что если система из п событий Af, . . . , Ап такова, что Ah зависит только от k-го эксперимента, то события Af, ... , Ап взаимно независимы. Теория независимых экспериментов является самой простой аналитически и наиболее изученной частью теории вероятностей. Поэтому желательно, если это возможно, интерпретировать сложные эксперименты как последовательность бо- лее простых независимых экспериментов. Следующие примеры показывают слу- чаи, когда такая процедура возможна. Примеры, в) Перестановки. рассматривали п\ перестановок элементов «1, a2i ..., ап как элементарные события и приписывали каждому из них вероятность 1/п! То же самое пространство элементарных событий можно рассматривать как представляющее п—1 последовательных независимых экспе- риментов следующим образом. Запишем сначала а±. Первый эксперимент состоит в постановке а.2 перед а± или после него. После того как это сделано, имеется три места для а3, и второй эксперимент состоит в его выборе, уста- навливающем относительный порядок alt а2, и а3. Вообще, когда «4, ..., а^ расположены в некотором порядке, производим эксперимент с номером k, который состоит в выборе одного из &-[-1 мест для ak+1. Иначе говоря, мы имеем последовательность из п—1 экспериментов, k-й из которых имеет k-\-1 различных исходов (элементарных событий), имеющих вероятности 1/(&+ О- Эксперименты независимы, т. е. вероятности перемножаются. Каждая пере- становка из п элементов имеет вероятность (1/2) (1/3) .(1/п), что совпадает с первоначальным определением. г) Выбор без возвращения. Пусть «„)— генеральная совокупность. При выборе без возвращения при каждом испытании удаляется один элемент. После k испытаний остается п — k элементов и следующий выбор можно описать заданием номера v места, занимаемого выбранным элементом (v = l, 2,... п—k). Таким образом, выборка объема г без возвращения превращается в последовательность из г экспериментов, первый из которых имеет/г возмож- ных исходов, второй — п—1, третий — п — 2 и т. д. Мы припишем равные вероятности всем исходам отдельного эксперимента и постулируем независи- мость г экспериментов. Это равносильно приписыванию вероятности 1/(п)Л каждому элементарному событию, что соответствует определению случайного выбора. Заметим, что при п=100 и г — 3 выборка («13, п40, «81) означает выбор чисел 13, 39, 79 соответственно: в третьем эксперименте был выбран семьдесят девятый элемент из сокращенной совокупности из п — 2 элементов. (При первоначальной нумерации исходы третьего эксперимента зависели бы от исходов первых двух.) Мы видим, что понятие повторных независимых испытаний позволяет изучать выбор как последовательность независимых операций. ► § 5*). ПРИЛОЖЕНИЯ К ГЕНЕТИКЕ Теория наследственности, ведущая начало от Г. Менделя (1822— 1884), дает поучительную иллюстрацию применимости простых вероятностных моделей. Мы ограничимся рассмотрением наиболее *) Этот параграф посвящен специальным вопросам и может быть опущец прц первом чтении,
§ 5. Приложения ft генетике 151 простых задач. Биологические явления будут по необходимости описываться в весьма упрощенном виде, и мы сосредоточим внимание на таких фактах, которые относятся к построению математической модели. Наследование признаков зависит от специальных носителей, называемых генами. Все клетки тела, исключая половые клетки (гаметы), несут один и тот же набор генов. Надо отметить, что каж- дый ген в клетке представлен парой. Читатель может представить их себе как совокупность огромного числа шариков на коротких кусках нитей-хромосом. Хромосомы также входят в каждую клетку попар- но, и парные гены занимают одинаковое положение в парных хро- мосомах. В простейшем случае каждый ген отдельной пары может находиться в одной из двух форм (аллелей) А или а. Тогда можно образовать три различные пары, и в соответствии с этим организм имеет один из трех генотипов АА, Аа и аа (между парами Аа и аА различия нет). Например, горох несет пару генов, таких, что ген А обусловливает красную окраску цветка, а а — белую окрас- ку. Три генотипа соответствуют в этом случае красному, розовому и белому цветкам. Каждая пара генов определяет один наследственный признак, но большинство наблюдаемых свойств организма зависит от несколь- ких факторов. Для некоторых характеристик (таких, как цвет глаз или свойство быть левшой) преобладающим является влияние одной пары генов, и наблюдаемые в этом случае эффекты подчиня- ются законам Менделя. Другие характеристики, например рост, определяются совместным действием очень большого числа генов (см. пример гл. X, 5,в)). Здесь мы будем рассматривать генотипы и наследование лишь для одной пары генов; в этом случае возможны три генотипа А А, Аа и аа. Часто имеет место случай, когда для каж- дой пары генов существует N различных форм Ai, ... , AN и, следовательно, имеется М(М+1)/2 генотипов AiAi, AiA2, . . . , AnAn. С очевидными изменениями вся теория применима и в этом случае (см. задачу 27). Последующие вычисления применимы также к случаю, когда ген А является доминантным, а ген а — рецессив- ным. Это означает, что особи Аа имеют те же наблюдаемые свойст- ва, что и АА, так что влияние гена а проявляется лишь у особей аа. В природе встречаются все степени частичного доминирования. Типичными примерами частично рецессивных свойств является го- лубой цвет глаз, свойство быть левшой и т. д. Половые клетки (гаметы) образуются в результате расщепления и содержат только по одному гену каждой пары. Поэтому организмы чистых генотипов А А или аа (или гомозиготы) производят гаметы только одного вида, в то время как организмы А а (гибриды или гетерозиготы) производят в равном количестве гаметы А и а. Новый организм развивается из двух родительских гамет, от кото- рых он и получает свои гены. Поэтому в каждой паре генов один ген получен от матери, а другой — от отца; это позволяет устано-
152 Гл, V. Условная вероятность. Стохастическая независимость вить, какому из предков в каждом поколении, даже очень отдален- ном, принадлежит любой ген. Генотип потомка зависит от случайного процесса. При любых обстоятельствах каждый родительский ген может передаться с ве- роятностью 1/2, и последовательные испытания независимы. Иначе говоря, мы представляем генотипы п потомков как результат п независимых испытаний, каждое из которых эквивалентно бросанию пары монет. Например, при скрещивании особей АахАа могут поя- виться генотипы АА, Аа и аа с вероятностями, равными соответ- ственно 1/4, 1/2, 1/4. Скрещивание ААХаа может привести к появ- лению лишь особей Аа и т. п. Рассматривая популяцию в целом, мы представляем образова- ние родительской пары как результат второго случайного процесса. Будем исследовать лишь так называемое случайное скрещивание* которое определяется следующим условием: если случайно выбрать г особей в первом поколении, то их родители образуют случайную выборку с возвращением объема г из множества всех возможных родительских пар. Иначе говоря, каждого потомка можно рассмат- ривать как результат случайного выбора родителей, и все выборы взаимно независимы. Случайное скрещивание является идеализи- рованной моделью условий, которые преобладают во многих встре- чающихся в природе популяциях и в полевых экспериментах. Однако, если один угол поля засеян красным горохом, а другой белым, то пары одного типа будут скрещиваться чаще, чем это допускается гипотезой о случайности. Выбор с предпочтением (на- пример, если блондины предпочитают блондинок) также нарушает условия случайного скрещивания. Самоопыляющиеся растения и искусственное оплодотворение представляют собой полную противо- положность случайному скрещиванию. Некоторые системы со спе- циальными законами скрещивания будут в дальнейшем анализи- роваться математически, но все же основное внимание будет сосре- доточено на модели случайного скрещивания. Генотип потомка есть результат четырех независимых испытаний. Генотипы двух родителей можно выбрать 3-3 способами, их гены — 2-2 способами. К счастью, однако, можно объединить эти два выбора и описать процесс как двойной выбор следующим образом: отцовс- кий и материнский гены выбираются случайно и независимо один от другого из множества всех генов, которые несут мужские или женские особи родительской популяции. Допустим, что три генотипа АА, Аа и аа встречаются среди мужских и женских особей в одной и той же пропорции и : 2v : w. Предположим, что z/+2u+^=l, и назовем и, 2и и w частотами генотипов. Положим p=u-\~v, q=v-\-w. (5.1) Ясно, что число генов А относится к числу генов а как р : q, и, так как р+^=1, мы будем называть р и q частотами генов А и
_______________________________ § 5. При/кужения к генетике 153 При каждом из двух случайных выборов ген А появляется с ве- роятностью р, и в силу независимости этих выборов вероятность того, что потомок имеет генотип АА, равна /?-. Генотип Аа может появиться двумя способами, и вероятность этого события равна 2pq. Таким образом, если выполняется гипотеза о случайном скре- щивании, то потомок имеет один из генотипов АА, Аа или аа с вероятностями Ui=p-, 2vx=2pq, w±=q^ (5.2) соответственно. Примеры, а) Все родители типа Аа (гетерозиготы). В этом случае u=w=§, 2v=l и p=q=\!2. б) Родительские особи А А и аа смеша- ны в равном отношении; тогда u=w=\!2, и=0 и p=q=\/2. в) На- конец, и=ш=1/4, 2и=1/2; снова p=q= 1/2. Во всех трех случаях распределение генотипов потомков одно и то же: 1/4, 2ух=1/2, uii=l/4. ► Для лучшего понимания сущности соотношений (5.2) фикси- руем частоты генов р и q (/7+7=1) и рассмотрим все системы, для которых частоты генотипов и, 2v и w удовлетворяют условиям w+u=/7, v+w==q. Во всех системах распределение генотипов в первом поколении потомков дается той же формулой (5.2). Выделим частную систему, для которой и=р2, 2v=2pq, w=q2. (5.3) Рассмотрим теперь популяцию, в которой — как в примере в) — частоты трех генотипов и, v, w задаются соотношениями (5.3). В силу (5.2) эти частоты остаются неизменными для следующего поколения. Поэтому распределение генотипов вида (5.3) можно назвать стационарным или равновесным. Каждому отношению р : q отвечает стационарное распределение. В больших популяциях действительно наблюдаемые частоты трех генотипов должны быть близки к теоретическим вероятностям, задаваемым соотношениями (5.2) *). Достопримечательно, что это распределение является стационарным при любых отношениях и: 2v: w в родительском поколении. Иначе говоря, если наблюдае- мые частоты в точности совпадают с вычисленными вероятностями, то распределение генотипов уже в первом поколении потомков ста- новится стационарным и повторяется без изменений в последующих поколениях. На практике возможны отклонения, но для больших популяций мы можем сказать: каков бы ни был состав родительской х) Без этого наша вероятностная модель оказалась бы неприменимой. Данное утверждение можно уточнить, опираясь на закон больших чисел и центральную предельную теорему, которые позволяют оценить эффект случайных флуктуаций.
154 Гл. V. Условная вероятность. Стохастическая независимость популяции, при гипотезе о случайном скрещивании уже в первом по- колении получается приблизительно стационарное распределение генотипов с неизменными частотами генов. Начиная со второго по- коления не существует тенденций к систематическим изменениям; система становится генетически устойчивой уже в первом поколении. Этот факт впервые отметил Г. Харди г), который тем самым преодо- лел некоторые трудности, связанные с применением законов Мен- деля. Отсюда, в частности, вытекает, что при случайном скрещи- вании частоты трех генотипов должны установиться в отношении ръ : 2pq : q2. Это обстоятельство в свою очередь может быть исполь- зовано для проверки гипотезы о случайном скрещивании. Харди также отмечал, что следует сделать ударение на слове «приблизительно». Даже для стационарного распределения мы долж- ны ожидать от поколения к поколению небольших изменений, которые приводят к следующей картине. Какова бы ни была роди- тельская популяция, после случайного скрещивания мы уже в пер- вом поколении приходим к стационарному распределению (5.3). В дальнейшем не существует тенденций к систематическим измене- ниям, однако частоты генов р и q подвержены случайным колеба- ниям от поколения к поколению и генетическая структура популя- ций медленно, но меняется. Не существует никаких сил, стремя- щихся восстановить начальные частоты. Наоборот, наша упрощенная модель приводит к заключению (см. пример гл. XV, 2, и)), что в ограниченных популяциях в конечном счете один из двух генов исчезает, так что в конечном счете популяция будет состоять лишь из чистых генотипов А А или аа. В природе этот процесс происхо- дит не всегда, так как мутации, селекция и другие эффекты приводят к образованию новых генов. Часто считают, что из теорем Харди вытекает строгая устойчи- вость в течение неограниченного времени. Обычной ошибкой явля- ется убеждение в том, что закон больших чисел действует как наде- ленная памятью сила, стремящаяся вернуть систему к исходному состоянию; представления такого рода породили много неправиль- ных заключений. Отметим, что закон Харди неприменим к распре- делению двух пар генов (например, обусловливающих голубой цвет глаз и свойство быть левшой) с девятью генотипами ААВВ, ААВЬ, , aabb. Здесь все еще имеется тенденция к установлению ста- ционарного распределения, но это распределение не достигается в первом поколении (см. задачу 31). l) Hardy G. Н., Mendelian proportions in a mixed population, Letter to the Editor, Science, N. S.? 28 (1908), 49—50. Используя терминологию гл. IX и XV, мы можем описать ситуацию следующим образом. Частоты трех генотипов в п-м поколении являются случайными величинами, математические ожидания которых определяются по формуле (5.2) и не зависят от п. Действительные значения частот меняются от поколения к поколению и образуют марковский случайный процесс,
§ 6. Признаки, сцепленные с полом 155 § 6*). ПРИЗНАКИ, СЦЕПЛЕННЫЕ С ПОЛОМ В начале предыдущего параграфа отмечалось, что гены являются составными частями хромосом, которые содержатся в клетках парами и передаются как единое целое, т. е. так, что все гены одной и той же хромосомы постоянно соединены вместе * * х). Таким образом, наша схема генной передачи наследственности применима также к хромосомам, рассматриваемым как единицы наследственности. Пол определяется парой хромосом; для женщин это XX, для муж- чин XY. Материнский организм всегда передает Х-хромосому, и пол потомка определяется хромосомой, полученной от отца. Таким образом, мужские и женские гаметы производятся в равном коли- честве. Разница в частотах рождения мальчиков и девочек объяс- няется тем, что они имеют неодинаковые шансы выжить в предродо- вой период. Мы уже говорили, что как гены, так и хромосомы встречаются парами, однако имеются исключения, связанные с тем, что гены, расположенные в Х-хромосоме, не имеют парных им генов в У-хро- мосоме. Женщины имеют две Х-хромосомы и, следовательно, двой- ной набор генов этих хромосом, но мужчины имеют лишь одинарный набор таких генов. Типичными генами, сцепленными с полом, яв- ляются гены, обусловливающие дальтонизм и гемофилию. По отно- шению к ним женщины могут иметь три генотипа АА, Аа и аа, а мужчины, которые обладают лишь одним геном — два генотипа А и а. Заметим, что сын всегда наследует отцовскую У-хромосому, так что сцепленные с полом признаки не могут передаваться от отца к сыну. Однако они могут передаваться от отца к дочери, а от нее — к внуку. Применим к этой ситуации методы предыдущего параграфа. Вновь предположим, что скрещивание происходит случайным об- разом, и будем считать, что частоты генотипов АА, Аа и аа среди особей женского пола равны соответственно и, 2v и w. Как и ра- нее, положим p=u+v, q=v+w. Частоты мужских генотипов А и а обозначим через р' и qr (р' +qf = 1). Тогда р и р' будут частотами генов А среди особей мужского и женского пола соответственно. Вероятности потомку женского пола иметь генотипы АА, Аа, аа будем обозначать и±, 2v1} щ соответственно; аналогичные вероят- ности для мужских генотипов А и а обозначим р[, q[. Потомок мужского пола получает свою Х-хромосому от матери, и, следова- тельно, Pi=p, q’e=q- (6.1) *) Этот параграф посвящен специальным вопросам и может быть опущен при первом чтении. х) Эта картина несколько осложняется явлениями разрывов и рекомбинаций хромосом (см, задачу 12 гл, II, 10),
156 Гл. V. Условная вероятность. Стохастическая независимость Для трех женских генотипов, повторяя рассуждения § 5, полу- чаем ^i—pp', 2v1=pq'+qp', w^qq', (6.2) откуда pi=Wi+^i=(l/2) (р+р')> q^Vr+w^(1/2) (q+q'). (6.3) Это означает, что среди потомков мужского пола гены А и а встре- чаются приблизительно с теми же частотами р и q, что и в материн- ской популяции; соответствующие частоты для потомков женского пола равны примерно р± и q± или среднему арифметическому частот генов А и а в отцовской и материнской популяции. Мы наблюдаем здесь тенденцию к сближению частот генов. Действительно, из (6.1) и (6.3) следует, что Pl—Pi=(l/2)(p—р'), 91—9!=(1/2)(<7—/), (6.4) и, таким образом, при случайном скрещивании разница в частотах генов А и а среди мужчин и женщин уже в первом поколении сокращается примерно в два раза. Однако эта разница полностью не исчезает, и существует тенденция к дальнейшему сближению. В отличие от ситуации, описываемой законом Харди, распределение генотипов в первом поколении не является стационарным. Однако от поколения к поколению можно проследить за систематической компонентой, пренебрегая случайными флуктуациями и отождеств- ляя теоретические вероятности (6.2) и (6.3) с реальными частотами в первом поколении особей женского пола х). Аналогично для второго поколения получим Рз = (1/2) (Pi + Р1) = (3/4) Р 4- (1/4) р’, 5 ^ = (1/2)^+ 71) = (3/4) 7+(1/4) 9', и, конечно, p2 = Pt и = Продолжая рассуждать подобным образом, получим общие выражения для вероятностей рп и qn, характеризующих распределение генов А и а среди особей жен- ского пола в n-м поколении. Положим <х = (1/3) (2р + //), р = (1/3) (2q + q')\ (6.6) тогда P» = (Pn-i4-Pn-i)/2 = a + (—l)"(p—/?')/(3-2"), 9п = (<7п-1 + ^-1)/2 = ₽4-(-1)п(9-9')/(3-2'!) 1 ' 1 и Рп = Рп-i, q'n = qn-i- Следовательно, Р„^«, Р«—qn~*₽> Яп—(6-8) х) Используя терминологию, введенную в примечании на с. 154, мы можем интерпретировать рп и qn как математические ожидания частот генов в n-м поколении особей женского пола. При такой интерпретации формулы для рп и qn становятся уже не приближенными,, а точными.
§ 7. Селекция 157 Частоты генотипов в популяции особей женского пола, согласно (6.2), равны 4n=Pn-tP'n-i, ^„^p^q^+q^p^, wn=qn.1q'n-1. (6.9) Отсюда следует, что цп-нх2, 2г\->2оф, &>n->P2. (6.10) (Отметим, что а+р = 1). Эти формулы показывают, что вся система от поколения к поко- лению стремится к устойчивому состоянию, в котором мужские ге- нотипы А и а появляются с частотами а и Р, а женские генотипы АА, Аа, аа с частотами а2, 2оф, Р2 соответственно. На практике приближенное равенство может быть использовано уже после тре- тьего или четвертого поколения. Разумеется, на эту зависимость мо- гут накладываться небольшие случайные флуктуации, но в целом она правильно отражает основную тенденцию. Главный вывод из всего сказанного состоит в следующем: мож- но ожидать, что при случайном скрещивании генотипы А и а среди особей мужского пола и генотипы АА, Аа и аа среди особей жен- ского пола должны встречаться приблизительно с частотами а, [3, а2, 2сф, р? соответственно, причем а+Р = 1. Приложение. Многие гены, сцепленные с полом, например ген дальтонизма, являются рецессивными и вызывают дефекты. Пусть а—такой ген. Тогда дефект имеют все мужчины а и женщины аа. Женщины типа Аа дефекта не имеют, но могут передавать его своим потомкам. Поэтому мы можем ожидать, что рецессивный сцепленный с полом дефект, который встречается у мужчин с частотой а, у женщин будет встречаться с частотой а2. Если один мужчина из ста — дальтоник, то женщина с этим недостатком встречается одна на 10 000. § 7*). СЕЛЕКЦИЯ В качестве типичного примера влияния селекции мы иссле- дуем случай, когда особи аа не могут размножаться. Это может случиться, если гены а являются рецессивными летальными, так ®то появившиеся на свет особи аа сразу же умирают. Кроме того, этого можно добиться искусственным изменением условий размно- жения или законом, запрещающим особям аа участвовать в скре- щивании. Предположим, что гипотеза о случайном скрещивании приме- нима к совокупности всех особей АА и Аа, но особи аа не участ- вуют в скрещивании. Пусть частоты генотипов АА, Аа и аа в пол- ной популяции равны и, 2v и w соответственно. Аналогичные час- *) Этот параграф посвящен специальным вопросам и может быть опущен при первом чтении.
158 Гл. V. Условная вербятнбсть. Стохастическая независимость тоты в популяции родителей равны и*—и! —w), 2v* =2v/(1—w), w*=0. (7.1) В дальнейшем можно рассуждать, как в § 5, используя, однако, вместо величин и, 2v, w величины (7.1). Тогда соотношения (5.1) заменяются соотношениями р= (u-\-v)l —w), q=v/(l—w). (7.2) Вероятности трех генотипов в первом поколении снова определя- ются формулами (5.2), т. е. Ui=p?, 2v±-=2pq и wr=q\ Как и ранее, для того чтобы проследить за систематическими изменениями от поколения к поколению, мы должны заменить и, v, w на Vf, и таким образом получим вероятности и$, w2 ге- нотипов во втором поколении потомков и т. д. В общем случае, исхо- дя из (7.2), имеем Pn = (un + v„)/(l—wn), qn = vn/(l—wn) (7.3) и ^n+i = Рп> %Vn+i — 2pnqn, Wn+i — Qn’ (7-4) Сопоставляя (7.3) и (7.4), найдем, что /’„+i = K+i + ^+i)/(1— wn+i) = PnlO— $) = VO+<?„) (7.5) И аналогично <7»+i = у«+1/(1 ~wn+i) = 7Л1 + <?„)• (7-6) Используя (7.6), нетрудно найти qn в явном виде. Действительно, ^1 = 1+^» (7.7) И отсюда последовательно 9Г1 = 1 + <7-1» 7Г1 = 2 + 7"1, /7 ох ^1 = 3 + 9-\ ..., <7п1=» + Г\ 1 ’ или qn = q/(l+nq), wn+i = [q/0+qn)]2. (7.9) Мы видим, что генотип, не способный к воспроизведению (или нежелательный), постепенно исчезает, но процесс этот крайне мед- ленный. При 7=0,1 требуется десять поколений, чтобы наполови- ну сократить частоту генов а; при этом частота особей, имеющих генотип аа, изменяется с 1 до 0,25%. (Если ген а сцеплен с полом, то процесс вымирания происходит значительно быстрее, как пока- зано в задаче 29; обобщенной схеме селекции посвящена задача 30 х)-) х) Дальнейший анализ разнообразных евгенических эффектов (которые часто отличны от того, что думают горячие сторонники законов о стерилизации) можно найти в книге Dahlberg G.2 Mathematical methods for population genetics, New York and Basel, 1948,
$ 8. Задача 159 § 8. ЗАДАЧИ 1. Бросаются три игральные кости. Какова вероятность того, что на одной из них выпадет единица, если на всех трех костях выпали разные грани? 2. Известно, что при бросании десяти игральных костей выпала хотя она единица. Какова вероятность р того, что выпало две или более единиц? 3. Бридж, При сдаче карт для игры в бридж игрок «Запад» не получил ни одного туза. Какова вероятность того, что его партнер а) не имеет тузов, б) имеет не менее двух тузов? Проверить результат, не используя формулу условной ве- роятности. 4. Бридж, Игроки «Север» и «Юг» имеют вместе десять козырей (козыри — карты определенной масти), а) Найти вероятность, что все три остальных козыря находятся у одного игрока (т. е. либо игрок «Восток», либо игрок «Запад» не име- ют козырей), б) Известно, что среди трех оставшихся козырей имеется король» Найти вероятность того, что он «не защищен» (т, е, один игрок имеет короля, а другой — два остальных козыря). 5. Решить задачу о ключах (пример гл. II, 7, б)) при помощи условных веро- ятностей, используя метод примера 2, а). 6. На заводе, изготовляющем болты, на долю машин А, В и С приходится соответственно 25, 35 и 40% всех изделий. В их продукции брак составляет соот- ветственно 5, 4 и 2%. Случайно выбранный из продукции болт оказался дефект- ным. Каковы вероятности того, что он был изготовлен на машине Л? на маши- не В? на машине С? 7. Предположим, что 5 мужин из 100 и 25 женщин из 10 000 являются даль- тониками. Наугад выбранное лицо страдает дальтонизмом. Какова вероятность того, что это мужчина? (Считать, что мужчин и женщин одинаковое число.) 8. Семь шаров случайным образом распределяются по семи ящикам. Известно, что ровно два ящика остались пустыми. Показать, что вероятность (условная) того, что в одном из ящиков окажется три шара, равна 1/4. Проверить это чис- ленно, используя табл. 1 из гл. II, 5. 9. Игральная кость бросается до тех пор, пока не выпадет единица. Предпо- лагая, что при первом испытании единица не выпала, найти вероятность того, что потребуется не менее трех бросаний. 10. Продолжение. Допустим, что число испытаний п четно. Какова вероят- ность того, что п=2? 11. Пусть1) вероятность рп того, что в семье ровно п детей,- равна арп при п^1, и ро = 1—аР (1 +р+р24"• • •)• Предположим, что все комбинации полов п детей равновероятны. Показать, что при /г^1 вероятность того, что в семье ровно k мальчиков, равна —p)k+1, 12. Продолжение. Пусть известно, что в семье есть по меньшей мере один мальчик. Какова вероятность того, что в ней не менее двух мальчиков? 13. Игральная кость А имеет четыре красных и две белых грани, а кость В — две красных и четыре белых. Один раз бросается монета. Если выпал герб, то все время бросается только кость А, если решетка — только кость В. а) Показать, что вероятность получить красную грань в любом испытании равна 1/2. б) Из- вестно, что первые два бросания кости дали красные грани. Найти вероятность того, что третье бросание также даст красную грань, в) Первые п испытаний дали красные грани. Какова вероятность того, что бросалась кость А? г) Какой урно- вой модели эквивалентна эта игра? 14. Пусть в примере 2, а) хп—условная вероятность того, что выиграв- ший n-ю партию выиграет игру в целом при условии, что игра не заканчи- вается /?-й партией; пусть уп и гп—вероятности выиграть игру в целом для проигравшего и свободного в n-й партии игроков соответственно, а) Пока- 1) Согласно Лотка, американская семейная статистика удовлетворяет этой гипотезе с р=0,7358. См. Lotka A. J. Theorie analytique des associations biologi- ques, v, 2, Actualites scientifiques et industrielles, No, 780(1939), Paris, Hermann et Cie,
160 Гл. V. Условная вероятность. Стохастическая независимость зать, что х„= l/2-f-(l/2) yn+i, yn=0-ft)zn+i, z„=(l/2) x„+i. (*) б) Непосредственно рассматривая пространство элементарных событий, пока- зать, что в действительности хп — х, уп~у, zn=z не зависят от п. в) Дока- зать, что вероятность того, что игрок а выиграет в целом, равна 5/14 (в соот- ветствии с задачей 5 гл. I, 8). г) Показать, что хп = 4/7, z/n=l/7, zn = %!7 есть единственное ограниченное решение системы (*). 15. Пусть события Alt А2, ..., Ап независимы и Р {Ak} = pk. Найти вероятность р того, что ни одно из этих событий не осуществится. 16. Продолжение. Показать, что всегда р^ехр(—р^. 17. Продолжение. Из неравенства Бонферрони (5.7) гл. IV вывести, что вероятность одновременного осуществления k или более событий из Alt . *., Ап меньше чем (pi+... 18. К урновой схеме Пойа, пример 2, в). Какова вероятность того, что первый шар был черным, если второй шар оказался черным? 19. К урновой схеме Пойа, пример 2, в). Используя индукцию, показать, что вероятность извлечения черного шара при любом испытании равна Ы (ЬА~г). 20. Продолжение. Доказать по индукции следующее утверждение: для любых m<ji вероятности того, что /n-е и n-е испытания дадут комбинации (черный, чер- ный) или (черный, красный), равны соответственно b (Ь с) ______________Ьг_______ (b-J-r) (Z?4-r+^)9 (^ + г) (& + r+c)* Обобщить на случай более чем двух испытаний. 21. Симметрия по времени в схеме Пойа. Пусть каждая из букв А и В обоз- начает красный или черный цвет (так что АВ можег быть любой из четырех ком- бинаций). Показать, что вероятность цвета А при n-м испытании при условии, что m-е испытание дало цвет В, равна вероятности цвета А при m-м испытании при условии, что n-е испытание дало цвет В. 22. Пусть в схеме Пойа pk(ri)— вероятность извлечения k черных шаров в первых п испытаниях. Доказать рекуррентное соотношение / । г/ ч r+ (n — k) с . . . bA-(k— 1) с Pk (п + О — Pk (п) -тгг—i—~~ -}~Pk- i ;——> i / г/гл / L rR 1\ j ь — гА~ПС Где Р-1(н) принимается равным нулю. Использовать это соотношение для нового доказательства формулы (2.5). 23. Распределение Пойа. В (2.4) положим 6/(&4-г)=р, г/(/>4-г)=9, с/(&+г)=7. (8.1) Показать, что выражение ("Г) П’У* « \ / \ "2 / \ П } имеет смысл для произвольных (не обязательно рациональных) постоянных р > 0, q > 0, у > 0, таких, что p-\-q = 1. Проверить, что рП1П > 0 и что <v = 0 Иначе говоря, (8.2) определяет распределение вероятностей на множестве целых чисел 0, 1, ..., п. Это распределение называется распределением Пойа. 24. Предельная форма распределения Пойа. Если п —> оо, р —у 0, у —0 так, что пр—> пу—>р~х, то при фиксированном nj щ ){~р) 1т+р) ‘
§8. Задачи 161 Проверить это и доказать, что при фиксированных Аир члены в правой части этого соотношения дают в сумме единицу. (Правая часть определяет так называемое отрицательное биномиальное распределение; см. гл. VI, 8 и задачу 37 гл. VI, 9). 25. Записать формулу (11.8) гл. II через условные вероятности. 26. Попарно независимые события, не являющиеся взаимно независимыми. Бросаются две игральные кости. Рассмотрим три события: А — «на первой кости выпало нечетное число очков», В — «на второй кости выпало нечетное число очков» и С — «сумма очков на обеих костях нечетна (на одной кости четное число очков, на другой — нечетное)». Если все 36 элементарных событий равновероят- ны, то любые два из событий А, В и С независимы. Вероятность каждого равна 1/2, Однако все три события не могут осуществиться одновременно. Приложения к биологии 27. Обобщить результаты § 5 на случай, когда каждый ген представлен k формами Alf А2, ..., Akf так что имеются k(k-]-l)/2 генотипов вместо трех (множественные аллели). Братско-сестринское скрещивание. Из некоторой популяции, в которой генотипы А А, Аа, аа встречаются с частотами и, 2v и w соответственно, случай- ным образом выбирается пара родителей. С их потомством повторяется та же про- цедура. Найти вероятности того, что оба родителя в первом, втором, третьем поко- лениях потомков имеют генотип АА (см. примеры гл. XV,2,к) и гл. XVI,4,б)). 29. Селекция. Пусть а — рецессивный сцепленный с полом ген. Предполо- жим, что процесс селекции делает невозможным участие в скрещивании муж- ских особей, обладающих геном а. Показать, что если частоты генотипов АА, Аа, аа среди женских особей начального поколения равны и, 2v, w, то для жен- ских особей в первом поколении потомков 2vy=vA~w, tax=O, и, следо- вательно, Pi=p+(l/2) q, q1=(l/2)q. Короче говоря, частота гена а среди женских особей уменьшается вдвое. 30. Задачу о селекции § 7 можно обобщить, предполагая, что гибнет лишь некоторая часть А (0<А^1) особей аа. Показать, что р— (t/+a)/(l—Ata), (7=[tH- (1—A)ta]/(1—Ata). В этом более общем случае вместо (7.3) можно записать Pn+i — PnK)-—А^п), <7/2+1= (1—А<?„)/(1—А<?п) qn* (Общее решение этих уравнений, по-видимому, неизвестно.) 31. Рассмотрим одновременно две пары генов с возможными формами (А, а) и (В, Ь). Любая особь передает своим прямым потокам один ген из каждой пары, и мы предположим, что каждая из четырех возможных ком- бинаций имеет вероятность 1/4 (это предположение справедливо лишь в том случае, когда разные гены принадлежат разным хромосомам, иначе имеет место строгая зависимость). Существует девять генотипов, и мы обозначим их частоты в популяции родителей через UААВВ, UааВВ, UAAbbt Uaabb, 2UAaBB, 2U Aabb* 2UAABbi aaBb> 4UAaBb- Положим Pa в = UAABB + U A ABb + U AaB В + U AaBb > PAb = U AAbb + U Aabb + U AABb + U AaBb> PaB = UaaBB+ U ааВЬ + U AaB В + U AaBb > Pab = U aabb + U Aabb + U aaBb + U AaBb* Найти частоты, характеризующие распределение генотипов в первом по- колении потомков, Показать, что Рав = Рлв — 6, Рдь~ РАъЛ-^t РаВ = РаВ~]~$) Pat) — Pab где 2b — pABpab—рАЬРаВ‘ Стационарное распределение определяется систе- мой равенств PAB — ^^PAb+^ и т. д. 6 № 221
162 Гл. V. Условная вероятность. Стохастическая независимость (Отметим, что закон Харди неприменим} распределение меняется от поколе* ния к поколению.) 32. Предположим, что частоты генотипов в популяции равны и = р\ 2v = 2pq, w = q* 2. Известно, что некто имеет генотип Аа. Тогда вероятность того, что генотип его брата тоже Аа, равна (1-|-рд)/2. Замечание. Последующие задачи очень близки. Они связаны с понятием степени родства1). Каждая задача продолжает предыдущую. Предположение о случайном скрещивании и обозначения § 5 сохраняются. Мы имеем здесь дело о частным случаем цепей Маркова (см. гл. XV). Использование матриц упрощает запись. 33. Занумеруем генотипы А А, Аа и аа числами 1, 2, 3 соответственно. Пусть pik (i, k=\, 2, 3) — условная вероятность того, что особь имеет гено- тип k при условии, что одна из родительских особей (мужская или женская) имеет генотип i. Найти все девять вероятностей р^, предполагая, что другая родительская особь имеет один из генотипов 1, 2, 3 с вероятностями р2, 2pq и соответственно. 34. Показать, что рц^ является в то же время условной вероятностью того, что родительская особь имеет генотип k при условии, что заданный потомок первого поколения имеет генотип i. 35. Доказать, что условная вероятность того, что внук (дед) имеет гено- тип k при условии, что дед (внук) имеет генотип i, определяется соотношением Pik — PiiPik’\~Pi2p2kJrPi3Pzk' (Матрица (р^) является квадратом матрицы (р/^).) 36 2). Показать, что ри? является также условной вероятностью того, что человек имеет генотип k при условии, что его единокровный (или едино- утробный) брат имеет генотип i. 37. Показать, что условная вероятность того, что некто имеет генотип k при условии, что определенный его прадед (правнук) имеет генотип t, дается формулой РШ = PtiLpik ~Yp(?2P2k -VPtti Pzk — PiiPi^ -\rPi2P2k + PizPzk* (Матрица (p^)—куб матрицы (pik). Это придает точный смысл понятию сте- пени родства.) 38. Рассмотрим более общий случай, а именно определим вероятности ри? того, что потомок в n-м поколении имеет генотип k, если определенный пре- док имеет генотип i. Доказать по индукции, что являются элементами следующей матрицы: Р2 + Р(Я—Р)/2п р2 — p2^2n-l 2pq+q (q—p)/2n~l 2pq + (i—^pq)/2n 2pq + P (p—q)/2n~l q2 — q2l2n~i q2+q (p—q№n q2+pq/^n~1 (Отсюда следует, что влияние предка убывает от поколения к поколению вдвое.) 39. Рассмотреть задачу 36, заменив единокровного (или единоутробного) брата родным братом. Показать, что соответствующая матрица имеет вид (1/4) (1 + р)2 (1/2)9(1+р) (1/4) </2 (1/4) р (1+р) (1/4) (14-р?)] (1/4) q(\-\-q) Ш р (\-\-q) (1/4) (14-9)2 40. Показать, что степень родства между дядей и племянником такая же, как между внуком и дедом, *) Относительно этого понятия см. задачи 33, 35 и 37.— Прим, перев. 2) Первое издание книги содержало ошибку: слово «брат» (два общих роди- теля) использовалось там, где подразумевался единокровный или единоутробный брат (один общий родитель), Это было указано в статье Li Сч Sacks L., Biometry ca, 40 (1954), 347-360,
1ЛАВА VI БИНОМИАЛЬНОЕ РАСПРЕДЕЛЕНИЕ И РАСПРЕДЕЛЕНИЕ ПУАССОНА § 1. ИСПЫТАНИЯ БЕРНУЛЛИ X) Повторные независимые испытания называются испытаниями Бернулли, если каждое испытание имеет только два возможных ис- хода и вероятности исходов остаются неизменными для всех испыта- ний. Обычно эти две вероятности обозначают через р и q, и исход с вероятностью р называют «успехом» У, а второй — «неудачей» Н. Ясно, что р и q должны быть неотрицательными и р+<7=1. (1.1) Пространство элементарных событий каждого отдельного испы- тания состоит из двух точек У нН. Пространство элементарных собы- тий п испытаний Бернулли содержит 2п точек или последовательно- стей из п символов У и Н\ каждая точка представляет собой один возможный исход составного испытания. Поскольку испытания не- зависимы, вероятности перемножаются. Иначе говоря, вероятность любой конкретной последовательности есть произведение, получен- ное при замене символов У и Н на р uq соответственно. Таким обра- зом, Р{(УУНУН . . . HHy)}=ppqpq. . .qqp. Примеры. Наиболее известным примером испытаний Бернулли являются последовательные бросания правильной, или симметрич- ной, монеты; здесь p=q=l/2. Если монета несимметрична, то мы по-прежнему считаем последовательные бросания независимыми и тем самым получаем модель испытаний Бернулли, в которой веро- ятность успеха может быть произвольной. Повторные случайные извлечения из урны с одним и тем же набором шаров представ- ляют собой испытания Бернулли. Испытания Бернулли возникают и при более сложных экспериментах, если мы не будем различать несколько возможных исходов, а опишем каждый результат как А или не-Л. Следовательно, в случае бросаний правильной кости различие между появлением единицы (У) и появлением не еди- ницы (Н) приводит к испытаниям Бернулли с /?=1/6, в то время как различие мёжду выпадением четного и нечетного числа очков приводит к испытаниям Бернулли с /?=1/2. Если кость несимметрич- на, то последовательные бросания все же образуют испытания Бер- х) Яков Бернулли (1654—1705). Его основная работа Ars conjectandi была опубликована в 1713 г, 6*
164 Гл. VI. Биномиальное распределение и распределение Пуассона нулли, но соответствующие вероятности р изменяются. Десятка, валет, дама, король и туз одной масти в покере или две единицы при бросании кости могут представлять собой успех; называя все остальные исходы неудачей, получаем испытания Бернулли с р= = 1/649 740 и р=1/36 соответственно. Упрощения такого типа обыч- но используются в статистических приложениях. Например, при массовом производстве прокладок они могут различаться по тол- щине, однако при проверке классифицируются как годные (У) или бракованные (Н) в зависимости от того, находится их толщина в заданных границах или нет. ► Схема испытаний Бернулли — это теоретическая модель, и толь- ко опыт может показать, подходит ли она для описания конкрет- ных наблюдений. Предположение о том, что последовательные бро- сания монеты соответствуют схеме Бернулли, подтверждается экс- периментально. Философ К. Марбе1) разделяет мнение несведующих людей, считающих, что после семнадцати последовательных выпа- дений герба появление решетки становится более вероятным. Это убеждение возникает не из-за несовершенства реальных монет, а из-за того, что природа наделяется памятью, или — в нашей тер- минологии — отрицается стохастическая независимость последова- тельных испытаний. Теория Марбе не может быть опровергнута ло- гически, но отвергается потому, что она не подтверждается эмпи- рически. При проведении выборок, при промышленном контроле качества и т. д. схема испытаний Бернулли представляет собой идеальную модель, хотя никогда полностью не соответствует действительно- сти. Так, в приведенном выше примере о производстве прокладок существует много причин, по которым выпуск продукции не укла- дывается в схему Бернулли. Машины меняются, поэтому вероят- ности не остаются постоянными; в работе машин есть некоторое по- стоянство и, следовательно, появление длинных серий отклонений похожего типа более вероятно, чем если бы исходы были действи- тельно независимыми. Однако с точки зрения контроля качества желательно, чтобы этот процесс соответствовал схеме Бернулли, и важно то, что в определенных границах этого можно добиться. Тогда цель текущего контроля — обнаружить на ранней стадии значительные отклонения от идеальной схемы, указывающие на предстоящие неприятности. § 2. БИНОМИАЛЬНОЕ РАСПРЕДЕЛЕНИЕ Часто нас интересует не порядок появления успехов в последо- вательности п испытаний Бернулли, а их общее число. Число успе- хов может быть равно 0, 1,. . .п, и первая задача заключается в на- я) МагЬе К., Die Gleichformigkeit in der Welt, Munchen, 1916. Теория Марбе получила широкое распространение; ее наиболее известным противником был Мизес»
§2. Биномиальное распределение 165 хождении соответствующих вероятностей. Событие «п испытаний закончились k успехами и п—k неудачами» содержит столько эле- ментарных событий, сколько существует способов размещения k букв на п местах. Иначе говоря, это событие содержит точек и по определению каждая точка имеет вероятность pkqn~k. Тем са- мым доказана следующая теорема. Теорема. Пусть b (k\ п, р) — вероятность того, что п испытаний Бернулли с вероятностями успеха р и неудачи q=l—р закончились k успехами и п—k неудачами. Тогда b(k\ п, р) = pkqn~k. (2.1) В частности, qn есть вероятность того, что успехов не будет, а вероятность того, что будет хотя бы один успех, равна 1 — qn. |> Будем рассматривать р как постоянную и обозначим число ус- пехов в п испытаниях через Sn; тогда b(k\ п, р)=Р {Sn=&}. Соглас- но общей терминологии, Sn есть случайная величина, а функция (2.1) является «распределением» этой случайной величины; будем называть это распределение биномиальным. Слово биномиальное отражает тот факт, что (2.1) представляет собой &-й член биноми- ального разложения (q+p)n- Из этого замечания вытекает, что 6(0; п, p)+b(l; п, р)+. . .+b(n; п, р) = (q+p)n=l, а это и требуется по определению вероятности. Биномиальное рас- пределение табулировано х). Примеры, а) Данные Уэлдона о бросании костей. Предполо- жим, что эксперимент состоит в бросании 12 костей и под «успе- хом» для каждой кости понимается выпадение шестерки или пятер- ки. Для правильной кости вероятность успеха равна р=1/3 и число успехов должно подчиняться биномиальному распределению b(k\ 12, 1/3). В табл. 1 приведены эти вероятности с соответствующими средними частотами, вычисленными по результатам 26 306 прове- денных экспериментов. Согласование кажется хорошим, но на са- мом деле для столь большого числа опытов оно оказывается очень плохим. Обычно статистики судят о степени согласования с помо- щью критерия %2. Согласно этому критерию, для правильной кости столь большие отклонения, как наблюденные, осуществляются в среднем один раз в 10 000 экспериментах. Следовательно, естест- г) Для п^50 см. Tables of the binomial probability distribution, Applied Mathematics Series National Bureau of Standards, 6 (1950). Для 50^/1^100 смй Romig H. C., 50—100 Binomial tables, New York, John Wiley and Sons, 1953- Для более широкого интервала значений п см. Tables of the cumulative binomial probability distribution, Harvard Computation Laboratory, 1955; Tables of the cumulative binomial probabilities, Ordnance Corps, ORDP 20-11, 1952. [См. также Большей Л. H., Смирнов Н. В, Таблицы математической статистики,— 2-е изд,— М,: Наука2 1983*— Перев,J
166 Гл. VI. Биномиальное распределение и распределение Пуассона венно предположить, что кости были несимметричны. Полученным наблюдениям соответствовала бы асимметрия, при которой веро- ятность успеха равна р=0,3377х). Таблица 1 Данные Уэлдона о бросании костей k b (k; 12 1/3) Наблюденная частота B(k‘, 12, 0,3377) 0 0,007 707 0,007 033 0,007 123 1 0,046 244 0,043 678 0,043 584 2 0,127 171 0,124 116 0,122 225 3 0,211 952 0,208 127 0,207 736 4 0,238 446 0,232 418 0,238 324 5 0,190 757 0,197 445 0,194 429 6 0,111 275 0,116 589 0,115 660 7 0,047 689 0,050 597 0,050 549 8 0,014 903 0,015 320 0,016 109 9 0,003 312 0,003 991 0,003 650 10 0,000 497 0,000 532 0,000 558 11 0,000 045 0,000 152 0,000 052 12 0,000 002 0,000 000 0,000 002 б) В § 4 гл. IV нам встречалось биномиальное распределение в задаче об угадывании карт, и в столбцах Ьт табл. 3 были приведе- ны члены этого распределения для п=3, 4, 5, 6, 10 и р=п~\ В за- даче о размещении (пример гл. II, 4, в)) мы пришли к другому част- ному случаю биномиального распределения с р—п~\ в) Сколько испытаний с р=0,01 нужно провести, чтобы вероят- ность хотя бы одного успеха была не меньше 1/2? Здесь мы ищем наименьшее целое число /г, для которого 1—(0,99)п^1/2, или —п log (0,99)^log 2; следовательно п>70. г) Задача о снабжении энергией. Предположим, что п=10 ра- бочих должны время от времени использовать электрическую энер- гию, и нас интересует ожидаемая общая нагрузка. При грубом приближении считаем, что в течение любого заданного промежутка времени каждому рабочему с одной и той же вероятностью р тре- буется единица энергии. Если рабочие действуют независимо друг от друга, то вероятность того, что одновременно ровно k рабочим потребуется энергия, равна b(k; п, р). Если каждый рабочий ис- пользует электроэнергию в среднем 12 минут в час, то следует по* дожить р=1/5. Тогда вероятность того, что одновременно не менее семи рабочим потребуется электроэнергия, равна 6(7; 10, 0,2)+Л. i *) Fischer R. A., Statistical methods for research workers, Edinburgh — jLon^ don, 1932. [Имеется перевод: Фишер P, Э, Статистические метода для исследовав телей,— М.: Статиздат, 1958.]
§3, Максимальная вероятность и «хвосты* 167 > , .4-6(10; 10, 0,2)=0,0008643584. Иначе говоря, если снабжение рассчитано на шесть единиц энергии, то вероятность перегрузки равна 0,00086, т. е. перегрузка ожидается в среднем в течение одной минуты из 1157 мин., или приблизительно одной минуты из 20 ча- сов. Вероятность того, что не менее восьми рабочим одновременно потребуется энергия, равна всего лишь 0,0000779264, или прибли- зительно в одиннадцать раз меньше. д) Проверка сывороток или вакцин х). Предположим, что нор- мальная частота заболеваний определенной болезнью среди крупно- го рогатого скота составляет 25%. Для проверки новой вакцины п здоровым животным делается прививка. Как оценить результат эксперимента? Для абсолютно недейственной вакцины вероятность иметь ровно k здоровых животных среди п подвергшихся прививке можно считать равной b(k\ п, 0,75). Для &=п=10 эта вероятность составляет приблизителььо 0,056, а для &=п=12 всего лишь 0,032. Таким образом, отсутствие заболеваний среди десяти или двенад- цати испытуемых животных можно рассматривать как подтверж- дение, хотя и не окончательное, эффективности вакцины. Заметим* что вероятность иметь не более одного больного животного из сем- надцати, не получивших прививки, приблизительно равна 0,0501. Следовательно, одно заболевание среди семнадцати животных есть более сильное свидетельство в пользу вакцины, чем отсутствие забо- леваний в партии из десяти животных. Для п=23 вероятность не более двух заболеваний приблизительно равна 0,0492, и поэтому два заболевания среди двадцати трех животных лучше свидетельст- вует в пользу вакцины, чем одно среди семнадцати или отсутствие заболеваний среди десяти. е) Другой статистический критерий. Предположим, что п, человек измеряют свое кровяное давление после приема опреде- ленного лекарства и до него и получают соответственно резуль- таты хп и xrlf ..., х„. Будем говорить, что f-e испытание закончилось успехом, если X; < x't, и неудачей, если xl > (Для простоты можем предположить, что все измерения дали разные результаты.) Если бы лекарство не было эффективным, то наши наблюдения соответствовали бы п испытаниям Бернулли с р= 1/2, и поэтому большее число успехов следует рассматривать как до- казательство эффективности лекарства. ► § 3. МАКСИМАЛЬНАЯ ВЕРОЯТНОСТЬ И «ХВОСТЫ» Из (2.1) видно, что b(k\n1p) __ (п—1 1 (п4-1)р—k ZQ 1Ч Ь — \ \ п, р) ~ kq ~ ХТ kq * V Поэтому вероятность b(k\ и, р) больше предыдущей для &<(п4~1 )Р и меньше для k>(n+\)p> Если (n-Yl)p^m — целое число, то х) Sukhatme Р. V., Panse V. G., Size of experiments for testing sera or vaccines, Indian Journal of Veterinary Science and Animal Husbandry, 13 (1943), 75—82,
168 Гл. VI. Биномиальное распределение и распределение Пуассона Ь(т\ п, р)=Ь(т—1; п, р). Существует только одно целое число т, такое, что (п+1) р—1<пг< (п + 1) р, (3.2) и мы получаем следующую теорему. Теорема. При изменении k от 0 до п члены b(k\ п, р) сначала монотонно возрастают, затем монотонно убывают, достигая наи- большего значения при k=m; если же т= (п+1)р, то наибольшее значение достигается дважды'. Ь(т—1; п, р)=Ь(т', п, р). Будем называть Ь(т; п, р) максимальной вероятностью. Часто т называют «наиболее вероятным числом успехов», но следует иметь в виду, что для больших значений п все члены b (k\ п, р) малы. При 100 бросаниях симметричной монеты наиболее вероятное число по- явлений герба равно 50, но вероятность этого события менее 0,08. В следующей главе мы увидим, что &(т; п, р) приближенно совпа- дает с 1/j/ 2nnpq. Обычно больший интерес представляет не вероятность появле- ния ровно г успехов, а вероятность появления по меньшей мере г успехов, т. е. + п, р). (3.3) (Этот ряд лишь формально является бесконечным, так как при v>n—г члены ряда равны нулю.) Сейчас мы получим верхнюю оценку этой вероятности, которая останется полезной и после того,, как в следующей главе будут найдены более точные оценки. Пред- положим, что г>пр. В силу (3.1) очевидно, что члены ряда (3.3) убывают быстрее членов геометрической прогрессии со знамена- телем 1—(г—np)!rq, и поэтому P{Sn^r }^b(r\ п, p)rql(г—пр). (3.4) С другой стороны, существуют более г—пр целых k, таких, что m^k^Lr. Сумма соответствующих членов биномиального распреде- ления меньше единицы, и каждый из них не меньше Ь(г\ п, р). Следовательно, Ь(г; п, р) не больше (г—пр)"1, и поэтому P{Sn>r}^n?/ (г—пр)2, если г>пр. (3.5) Такие же рассуждения применимы и при оценке левого «хвоста», однако проводить вычисления не нужно. Действительно, событие/ заключающееся в том, что наступило не больше г успехов, эквива- лентно тому, что по меньшей мере п—г испытаний закончились не- удачей. Применяя эквивалент (3.5) для неудач, получаем Р{8пС''}<(п—г)р/(пр—г)2, если г<пр. (3.6) В следующем параграфе мы продемонстрируем пользу этих не- равенств при оценке вероятности больших отклонений от наиболее вероятного значения tn.
§ 4. Закон больших чисел 169 § 4. ЗАКОН БОЛЬШИХ ЧИСЕЛ Мы несколько раз отмечали, что наше интуитивное представле- ние о вероятности основывается на следующем предположении. Если в п одинаковых испытаниях событие А осуществилось v раз и если п очень велико, то отношение v/n должно быть близко к ве- роятности р события Л. Ясно, что формальная математическая тео- рия может никогда не обращаться к действительной жизни, но она должна хотя бы содержать теоретическую модель явления, кото- рое пытается объяснить. В соответствии с этим нам нужно, чтобы неясное вводное замечание стало точной теоремой. С этой целью под «одинаковыми испытаниями» будем понимать «испытания Бернул- ли» с вероятностью успеха р. Если Sn — число успехов в п испыта- ниях, то Sn/n есть средняя доля успехов, которая должна быть близка к р. Теперь легко придать этому утверждению точный смысл. Рассмотрим, например, вероятность того, что Sn!n превос- ходит р+е, где sZ>0 — произвольно малое, но фиксированное чис- ло. Эта вероятность совпадает с P{Sn>n(p+e)}, и в силу (3.5) она не больше чем 1/(п82). Следовательно, при увеличении п имеем P{Sn>n(p+8)'}->0. Аналогично доказывается, что P{Sn<??(p—sJJ-xO, и поэтому P{|S„/n-р|<8}-> 1. (4.1) Словесно это выражается так: вероятность того, что средняя доля успехов отличается от р больше чем на произвольное наперед заданное 8, стремится к нулю при увеличении п. Это одна из форм закона больших чисел, которая служит основой нашего интуитивно- го представления о вероятности как мере относительных частот. Для практических приложений эту формулировку необходимо до- полнить более точной оценкой вероятности в левой части (4.1); такую оценку позволяет получить нормальное приближение для биномиального распределения (см. типичный пример гл. УП,4,з)). В действительности (4.1) является простым следствием этого при- ближения (см. задачу 12 гл. VII,7). Утверждение (4.1) является классическим законом больших чи- сел. Этот закон представляет весьма ограниченный интерес^ и в дальнейшем будет доказан более точный и более полезный усилен- ный закон больших чисел (см. гл. VIII, 4). Предостережение. Стало обычным делать из закона больших чисел выводы, которые определенно из него не следуют. Если Петр и Павел бросают симметричную монету 10 000 раз, то принято счи- тать, что Петр будет впереди приблизительно половину времени. Но это неверно. При большом числе различных игр с бросанием мо- неты есть основания ожидать, что в любой фиксированный момент число появлений герба больше приблизительно в половине всех
170 Гл. VI. Биномиальное распределение и распределение Пуассона случаев. Однако почти наверняка победивший игрок был впереди практически в течение всей игры. Итак, в противоположность широ- ко распространенному мнению временное среднее для любой отдель- но взятой игры никак не связано со средним для совокупности раз- личных игр в любой данный момент. Для более глубокого изучения других неожиданных и парадоксальных свойств случайных флук- туаций отсылаем читателя к гл. III, в частности к обсуждению за- кона арксинуса. § 5. ПУАССОНОВСКОЕ ПРИБЛИЖЕНИЕ1) Во многих приложениях мы имеем дело с испытаниями Бернул- ли, в которых п относительно велико и р относительно мало, а произведение \=пр (5.1) и не мало, и не велико. В таких случаях удобно использовать для b(k\ п, р) предложенное Пуассоном приближение, вывод которого мы начинаем. Для k=0 имеем 6(0; ft, р) = (1—/?)" = (!—к/п)п. (5.2) Переходя к логарифмам и используя разложение Тейлора (8.10) гл. II, находим log &(0; ft, /?)=rzlog (1—к/п) =—X—№/(2п)—. . (5.3) так что при больших п b (0; ft, р) е~к, (5.4) где знак & означает приближенное равенство (в данном случае с точностью до членов порядка п"1). Далее, из (3.1) видно, что для произвольного фиксированного k и достаточно больших п имеем Ь П, р) _ (fe — 1) Р /г b (k-— Г, п, р) kq k 9 \ ) Отсюда последовательно заключаем, что 6(1; ft, p)^Z-6(0; ft, p)^Ze~x, 6(2; ft, р)^(1/2)Х-6(1; ft, р) (1/2) и в общем случае по индукции получаем b(k\ ft, р) (V/£!)e’\ (5.6) Это и есть классическое пуассоновское приближение для биномиаль- ного распределения2). В силу большой важности этого приближе- ► а) Симон Д. Пуассон (1781—1840). Его книга Recherches sur la probabilite des jugements en matiere criminelle et en matiere civile, precedees des regies gene- rales du calcul des probabilites появилась в 1837 г. - ?)' О точности приближения см. задачи 33 и 34.
§ 5. Пуассоновское приближение 171 ния введем обозначение p(k\ %) = e-KKk/kl. (5.7) В этих обозначениях р(й; Z) будет приближением для b(k\ п, h/ri) при достаточно больших п. Примеры, а) В табл. 3 гл. IV,4 приведены пуассоновские веро- ятности (5.7) с Z=1 и для сравнения биномиальные распределения с р=\1п и п=3, 4, 5, 6, 10. Можно видеть, что, несмотря на малые значения п, приближение удивительно хорошее. б) Эмпирическая иллюстрация. Появление пары (7, 7) среди 100 пар случайных цифр должно подчиняться биномиальному рас- пределению с п=100 и /7=0,01. В табл. 2 приведены числа Nk дей- ствительных появлений этой пары в 100 группах по 100 пар слу- чайных цифр в каждой 1). Отношения TV^/100 сравниваются как с теоретическими биномиальными вероятностями, так и с со- ответствующими пуассоновскими приближениями. Полученные ча- стоты хорошо согласуются с теоретическими вероятностями. (По критерию %? случайные флуктуации приблизительно в 75 из 100 аналогичных случаев давали бы большие отклонения наблюдаемых частот от теоретических вероятностей.) Таблица 2 Пример пуассоновского приближения k b (k\ 100, 0,01) P(k-, 1) Kk 0 0,366 032 0,367 879 41 1 0,369 730 0,367 879 34 2 0,184 865 0,183 940 16 3 0,060 999 0,061 313 8 4 0,014 942 0,015 328 0 5 0,002 898 0,003 066 1 6 0,000 463 0,000 511 0 7 0,000 063 0,000 073 0 8 0,000 007 0,000 009 0 9 0,000 001 0,000 001 0 Первые три столбца иллюстрируют пуассоновское при- ближение для биномиального распределения. В последнем столбце приведены числа групп по 100 пар случайных цифр, в которых комбинация (7, 7) встречается ровно k раз. в) Дни рождения. Какова вероятность pk того, что в группе из 500 человек ровно k родились 1 января? Если эти 500 человек вы- браны случайно, то можно применить схему из 500 испытаний Бер- нулли с вероятностью успеха р=1/365. Для пуассоновского при- ближения положим %=500/365=1,3699. . . . I) Kendall М. G., Smith В., Tables of random gaippling numbers, Tracts for Computers, 24, Cambridge, 1940,
172 Гл, VI. Биномиальное распределение и распределение Пуассона Теоретические биномиальные вероятности и их пуассоновские приближения приведены ниже’ k 0 1 2 3 4 5 6 Биномиальные вероятности 0,2537 0,3484 0,2388 0,1089 0,0372 0,0101 0,0023 Пуассоновские вероятности 0,2541 0,3481 0,2385 0,1089 0,0373 0,0102 0,0023 г) Дефектные изделия. Предположим, что при производстве шу- рупов используется статистический контроль качества и поэтому законно применение схемы испытаний Бернулли. Если вероятность того, что шуруп окажется дефектным, равна /7=0,015, то вероят- ность того, что коробка со 100 шурупами не содержит брака, рав- на (0,985)100=0,22061. Соответствующее пуассоновское приближе- ние дает ^"1’!=0,22313. . ., что достаточно точно для большинства практических целей. Теперь поставим вопрос: сколько шурупов должно быть в коробке, чтобы вероятность обнаружить в ней по крайней мере 100 недефектных шурупов была не меньше 0,8? Если 100+х — искомое число шурупов, то х — небольшое целое. Чтобы применить пуассоновское приближение для п=100+л: испытаний, нужно было бы положить но пр приблизительно равно 100/?= *=1,5. Теперь задача свелась к нахождению наименьшего целого числа х, для которого е-1’6 {1 4- 1,5/1 + ... + (1,5)*/х!} > 0,8. (5.8) По таблицам х) находим, что для х=1 левая часть приближенно равна 0,56, а при х=2 она равна 0,809. Итак, согласно пуассонов- скому приближению, необходимо иметь 102 шурупа. В действитель- ности вероятность найти по меньшей мере 100 недефектных шурупов в коробке со 102 шурупами равна 0,8022... . д) Столетние старики. Каждый отдельный человек в момент рождения имеет мало шансов прожить 100 лет, но в большом об- ществе число ежегодных рождений велико. Из-за войн, эпидемий и т. п. продолжительности жизни различных людей не являются стохастически независимыми, однако в первом приближении можно п рождений сравнить с п испытаниями Бернулли, в которых успе- хом является смерть после 100 прожитых лет. В устойчивом обще- стве, где ни его размеры, ни уровень смертности существенно не изменяются, естественно ожидать, что частота тех лет, когда уми- я) Molina Е. С., Poisson’s exponential binomial limit, New York, Van NoS’ trand, 1942. [В этих таблицах даны значения p(k\ X) и p(k\ %)+р(&+!; ^)+. . . при k, меняющемся от 0 до 100.] [См. также книгу Л. Н» Большева и Н. В, Смирнова, указанную в примечании на cs 165.— Перев.1
§6. Распределение Пуассона 173 рают ровно k столетних стариков, приближенно равна p(k\ X), где X зависит от размера общества и от состояния здоровья его чле- нов. Данные по Швейцарии подтверждают этот вывод х). е) Опечатки, изюминки и т. п. Если при наборе книги сущест- вует постоянная вероятность того, что любая буква будет набрана неправильно, и если условия набора остаются неизменными, то мы имеем столько испытаний Бернулли, сколько букв в книге. Тогда частота страниц, содержащих ровно k опечаток, будет при- ближенно равна p(k\ Z), где К— характеристика наборщика. Воз- можная усталость наборщика, трудные места текста и т. п. увели- чивают вероятность ошибки и могут приводить к скоплениям опе- чаток. Таким образом, формулу Пуассона можно использовать для обнаружения существенных отклонений от нормы или от требова- ний статистического контроля. Аналогичные рассуждения приме- нимы во многих случаях. Например, если в тесто кладут много изюма, то после перемешивания следует ожидать, что доля було- чек, содержащих ровно k изюминок, будет приближенно равна p(k\ А), где К — плотность изюма в тесте. § 6. РАСПРЕДЕЛЕНИЕ ПУАССОНА В предыдущем параграфе пуассоновские вероятности (5.7) фи- гурировали лишь как удобные приближения для биномиального рас- пределения в случае больших п и малых р. В связи с задачами о со- впадениях и о размещениях в гл. IV изучались различные вероят- ностные распределения, которые в пределе также приводили к пу- ассоновским выражениям p(k\ ^). Здесь мы сталкиваемся с част- ным случаем того замечательного факта, что существует несколько распределений большой универсальности, которые появляются в самых разнообразных задачах. Тремя основными распределения- ми, встречающимися во многих задачах теории вероятностей, яв- ляются биномиальное распределение, нормальное распределение (которое будет введено в следующей главе) и распределение Пуас- сона p(k\ K) = e^k/kl, (6.1) которое мы рассмотрим теперь более подробно. Заметим сначала, что при сложении равенств (6.1) для k=0, 1, 2,. . . в правой части получается ряд Тейлора для е\ умножен- ный на е~\ Следовательно, для любого фиксированного X сумма p(k; X) равна единице, и поэтому можно представить себе идеаль- ный эксперимент, в котором р X) является вероятностью ровно k успехов. Сейчас мы покажем, почему многие физические опыты и статистические наблюдения действительно приводят к такой интер- *) Gumbel Е, J4 Les centenaires, Aktuarske Vedy, Prague, 7 (1937), 1—8,
174 Гл. VI. Биномиальное распределение и распределение Пуассона претации (6.1). Общность и важность применений распределения (6.1) иллюстрируются примерами следующего параграфа. Истин- ная природа распределения Пуассона станет ясной только в связи с теорией стохастических процессов (см. иные подходы в гл. XII,2 и гл. XVII,2). Рассмотрим последовательность происходящих с течением вре- мени случайных событий, таких, как радиоактивный распад или вызовы на телефонной станции. Каждое событие представляется точкой на оси времени, и нас интересует случайное распределение этих точек. Существует много различных типов таких распределе- ний, но они изучаются с помощью непрерывных распределений вероятностей, исследование которых откладывается до тома 2. Здесь мы лишь покажем, что простейшие физические предположе- ния приводят к р (k\ %) как к вероятности иметь ровно k точек (со- бытий) внутри фиксированного интервала определенной длины. На- ши методы неизбежно будут грубыми, но мы вернемся к этой задаче в гл. XII и XVIII, используя более точные методы. Физические предположения, которые мы хотим выразить мате- матически, заключаются в том, что условия эксперимента остаются неизменными с течением времени и что неперекрывающиеся интер- валы времени стохастически независимы в том смысле, что инфор- мация о числе событий в одном интервале ничего не говорит об их числе в другом. Непрерывные распределения вероятностей дают возможность выразить эти предположения непосредственно, одна- ко, будучи ограничены дискретными вероятностями, мы должны использовать приближенную конечную модель и затем переходить к пределу. Представим себе единичный интервал времени, разделенный на п подынтервалов длиной Мп. Заданную конечную совокупность то- чек в этом интервале можно рассматривать как результат случай- ного процесса, при котором каждый подынтервал имеет одну и ту же вероятность рп того, что в нем содержится одна или несколько то- чек совокупности. Подынтервал является либо занятым, либо пу- стым, и из предположения о независимости неперекрывающихся интервалов времени вытекает, что мы имеем дело с испытаниями Бернулли: вероятность получить ровно k занятых подынтервалов равна b(k\ п, рп). Полагая теперь п->оо, мы делаем эту дискрет- ную модель все более и более точной. При этом вероятность того, что весь интервал вообще не содержит точек совокупности, должна стремиться к конечному пределу. Но весь интервал не содержит точек тогда и только тогда, когда ни один подынтервал не занят, а вероятность последнего события равна (1—рп)п. Переходя к ло- гарифмам, мы видим > что эта величина стремится к пределу одно- временно с прп. Случай прп-^оо невозможен, так как он означал бы, что в сколь угодно малый интервал попадают бесконечно много точек совокупности. Поэтому в нашей модели неизбежно существует число 1, такое, что прп-Мк. В этом случае вероятность иметь ровно
§ 6. Распределение Пуассона 175 k занятых подынтервалов стремится к p(k\ X), и, поскольку мы рас- сматриваем различные точки, число занятых ячеек в пределе соот- ветствует числу точек совокупности, лежащих в нашем единичном интервале времени х). В приложениях единичный интервал времени необходимо заме- нить интервалом произвольной длины t, Если опять разделить его на подынтервалы длины 1//г, то вероятности рп остаются неизменны- ми, но число подынтервалов равно целому числу, ближайшему к nt. Переход к пределу будет таким же, только % заменяется на М. Это приводит нас к интерпретации величины р(й; M)=e-^(M)W (6.2) как вероятности иметь ровно k точек в фиксированном интервале длины t, В частности, вероятность того, что в интервале длины t не будет ни одной точки, равна р(0; М)=е~и, (6.3) и, следовательно, вероятность иметь одну или несколько точек равна 1—e~Kt. Параметр X — физическая постоянная, которая определяет плот- ность точек на оси t. Чем больше %, тем меньше вероятность (6.3) того, что точек нет. Предположим, что некоторый физический экс- перимент повторяется большое число N раз и что каждый раз под- считывается число событий в интервале фиксированной длины Л Пусть Nk— количество экспериментов, в которых наблюдается ровно k событий. Тогда Уо+^1+^2+... = ^ (6.4) Общее число точек, наблюдаемых в N экспериментах, равно ^+2y2+3iVs+...=T, (6.5) и TIN — среднее. При больших N мы ожидаем, что Nk&Np(k-, М) (6.6) (это лежит в основе всех применений понятия вероятности и будет обосновано и уточнено с помощью закона больших чисел в гл. X). Подставляя (6.6) в (6.5), находим T&N{p(\\ М) + 2р(2; W) + 3p(3; М)+...} = = Ne-^M {1 + M/1 + (M)2/2! + ...} = NM, (6.7) *) Можно представить себе и другие возможности. Наша модель может быть полезной при изучении автомобильных катастроф, но она неприменима, если под- считывается не число самих катастроф, а число разбитых автомобилей. Это объяс- няется тем, что в некоторых катастрофах участвует более одного автомобиля, и поэтому необходимо рассматривать случаи, когда все точки различны, когда есть две совпадающие точки, три совпадающие точки и т. д. В пределе мы приходим к обобщенному распределению Пуассона (см. гл. XI 1,2). С точки зрения более об- щих процессов можно сказать^ что мы считаем только число скачков^ но не рас-^ сматриваем их величину,
176 Гл. VIt Биномиальное распределение и распределение Пуассона и поэтому M^TIN. (6.8) Это соотношение дает нам метод оценки X по наблюдениям и способ сравнения выводов теории с результатами опытов. Примеры из следующего параграфа проиллюстрируют этот подход. Пространственные распределения Мы рассмотрели распределение случайных событий или точек на оси /, но те же самые рассуждения применимы к распределениям точек на плоскости или в пространстве. Вместо интервалов длины t будут области площади или объема t. Основное предположение со- стоит в том, что вероятность иметь k точек в любой определенной области зависит не от ее формы, а лишь от ее площади или объема. Кроме того, сохраним те же предположения, что и раньше: 1) при малых t вероятность иметь более одной точки в области объема t мала по сравнению с /; 2) неперекрывающиеся области вза- имно независимы. Для нахождения вероятности того, что в области объема t содержится ровно k случайных точек, разобьем эту об- ласть на п подобластей и в качестве приближения для искомой вероятности возьмем вероятность появления k успехов в п испы- таниях. Это означает, что мы пренебрегаем возможностью найти более одной точки в одной и той же подобласти, однако из нашего предположения 1) вытекает, что допускаемая погреш- ность стремится к нулю при п->оо. В пределе снова получается рас- пределение Пуассона (6.2). Звезды в космосе, изюминки в кексе, семена сорняков среди семян злака, дефекты в материалах, выводки животных в поле распределены согласно закону Пуассона; см. при- меры 7,6) и 7,д). §7. НАБЛЮДЕНИЯ, СООТВЕТСТВУЮЩИЕ РАСПРЕДЕЛЕНИЮ ПУАССОНА1) а) Радиоактивный распад. Радиоактивное вещество испускает а-частицы; число частиц, достигающих заданной части простран- ства в течение времени t, дает хорошо известный пример случай- ных событий, подчиняющихся закону Пуассона. Конечно, вещест- во непрерывно разрушается и через длительный промежуток вре- мени плотность потока а-частиц уменьшается. Однако для радия необходимы годы, прежде чем такое уменьшение станет заметным; для относительно коротких периодов времени условия можно счи- тать неизменными, и мы имеем идеальную реализацию предполо- жений, которые приводят к распределению Пуассона. а) Распределение Пуассона стало известно под названием закона малых чисел или редких событий. Эти неправильные названия затруднили понимание основной роли распределения Пуассона. Следующие примеры покажут сколь обманчивы такие «синонимы» распределения Пуассона»
§7, Наблюдения, соответствующие распределению Пуассона 177 В одном известном эксперименте1) радиоактивное вещество на- блюдали в течение JV=2608 интервалов времени по 7,5 секунд каж- дый; для каждого интервала регистрировалось число частиц, до- стигших счетчика. В табл. 3 приведены числа Nk интервалов, в те- чение которых наблюдались ровно k частиц. Общее число частиц равно T=^kNk== 10094, среднее — TIN=3,870. Теоретические зна- чения Np(k; 3,870) кажутся достаточно близкими к наблюденным числам Nk. Чтобы судить о степени этой близости, нужно оценить возможные величины случайных флуктуаций. Статистики судят о степени соответствия с помощью критерия %2. Согласно этому кри- терию, при идеальных условиях следует ожидать приблизительно в 17 из 100 аналогичных случаев отклонения более значительные, чем в табл. 3. Таблица 3 Пример «а». Радиоактивный распад k Nk 3,870) k Nk 2Vp (&; 3,870) 0 1 2 3 4 57 203 383 525 532 54,399 210,523 407,361 525,496 508,418 5 6 7 8 9 10 408 273 139 45 27 16 393,515 253,817 140,325 67,882 29,189 17,075 Всего 2608 2608,000 б) Падения самолетов-снарядов в Лондоне. В качестве примера распределения случайных точек по поверхности рассмотрим ста- тистику падений самолетов-снарядов в южной части Лондона во время второй мировой войны. Всю область разделим на М=576 небольших участков, каждый площадью £=1/4 кв. км. В табл. 4 приведены числа Nk участков ровно с k падениями 2). Общее число падений равно T=^kNk=331, среднее — М=77Af=0,9323. . . . Совпадение с распределением Пуассона поразительное; согласно критерию %2, при идеальных условиях примерно 88% аналогич- ных наблюдений дали бы худшее соответствие. Интересно отметить, что большинство населения верило в тенденцию точек падения скапливаться в нескольких местах. Если бы это было верно, то х) Rutherford Е., Chadwick J., Ellis C., Radiations from radioactive substam ces, Cambridge, 1920, 172. Табл. 3 и оценка по критерию %2 взяты из книги Kramer Н., Mathematical methods of statistics, Uppsala and Princeton, 1945, p. 436. [Имеется перевод: Крамер Г. Математические методы статистики.— 2-е изд.— М.: Мир, 1975, с. 472.] 2) Данные заимствованы из статьи Clarke R. D., An application of the Poisson distribution, Journal of the Institute of Actuaries, 72 (1946)г 481,
178 Гл, VI. Биномиальное распределение и распределение Пуассона следовало бы ожидать большую долю участков без разрывов либо с большим числом разрывов и меньшую долю участков промежу- точного класса. Табл. 4 показывает, что точки падения были со- вершенно случайными, все участки равноправными; здесь мы име- ем поучительную иллюстрацию того установленного факта, что не- искушенному человеку случайность представляется регулярностью или стремлением к скоплению. Таблица 4 Пример «б». Падения самолетов-снарядов в Лондоне k Nk Np (k\ 0,9323) 0 1 2 3 4 5 и более 229 211 93 35 7 1 226,74 211,39 98,54 30,62 7,14 1,57 в) Перестройка хромосом в клетках. Облучение рентгеновскими лучами вызывает в органических клетках определенные процессы, которые мы называем перестройкой хромосом. Во время облуче- ния вероятность такой перестройки остается постоянной и, соглас- но теории, числа Nk клеток, содержащих ровно k изменений, долж- ны подчиняться распределению Пуассона. Теория способна также предсказать зависимость параметра X от интенсивности облучения, температуры и т. д., но мы не будем вдаваться в эти детали. В табл. 5 приведены результаты одиннадцати различных серий экс- периментов 1). Они сгруппированы по степени их соответствия тео- рии. В последнем столбце указаны примерные проценты случаев, в которых при идеальных условиях (по критерию %2) случайные флуктуации дали бы худшее согласование с распределением Пуас- сона. Согласие между теорией и наблюдениями поразительное. г) Соединения с неправильным номером. В табл. 6 показана ста- тистика телефонных соединений с неправильным номером 2). Всего наблюдалось А^=267 номеров; Nk обозначает, сколько номеров имели ровно k неправильных соединений. Распределение Пуассона p(k\ 8,74) опять подходит удивительно хорошо. (По критерию %2 отклонения близки к среднему значению.) В статье Торндайка чи- татель найдет сведения о других телефонных статистиках, подчи- няющихся закону Пуассона. Иногда (например, в случае группо- вой абонентской линии, вызовов из группы телефонов-автоматов и т. д.) существует очевидная взаимосвязь между событиями, и тог- да распределение Пуассона не подходит. *) Catcheside D. G., Lea D. Е., Thoday J. M., Types of chromosome stru- ctural change induced by the irradiation of Tradescantia microspores, Journal of Genetics, 47 (1945—46), 113—136. Наша таблица совпадает с табл. IX этой статьи, мы лишь подсчитали заново %2-уровни с одной степенью свободы. 2) Данные заимствованы из работы Thorndike F., Applications of Poisson’s probability summation, The Bell System Technical Journal, 5 (1926), 604—624* В этой статье содержится графический анализ 32 различных статистик.
§ 7, Наблюдения, соответствующие распределению Пуассона 179 Таблица 5 Пример «в». Перестройка хромосом, вызванная рентгеновским облучением Номер оп ыта Клетки c k изменениями Общее число N х2-уровни в процентах 0 1 2 3 1 Наблюденное Nu Np(k; 0,35508) 753 752,3 266 267,1 49 47,4 5 6,2 1073 95 2 Наблюденное /Vp(6; 0,45601) 434 432,3 195 197,1 44 44,9 9 7,7 682 85 3 Наблюденное Nk Np(k; 0,27717) 280 278,9 75 77,3 12 10,7 1 1,1 368 65 4 Наблюденное Nk Np(k; 0,11808) 2278 2280,2 273 269,2 15 15,9 0 0,7 2566 65 5 Наблюденное Nk Np(k; 0,25296) 593 589,4 143 149,1 20 18,8 3 1,7 759 45 6 Наблюденное Nk Np(k>} 0,21059) 639 642,4 141 135,3 13 14,2 0 1,1 793 45 7 Наблюденное Np(k-, 0,28631) 359 362,0 109 103,6 13 14,9 1 1,5 482 40 8 Наблюденное Np(k; 0,33572) 493 498,2 176 167,3 26 28,1 2 3,4 697 35 9 Наблюденное Nb Np(k; 0,39867) 793 804,8 339 320,8 62 64,0 5 9,4 1199 20 10 Наблюденное Np(k', 0,40544) 579 588,7 254 238,7 47 48,4 3 7,2 883 20 11 Наблюденное Np(k\ 0,49339) 444 461,6 252 227,7 59 56,2 1 10,5 756 5 Таблица 6 Пример «г». Соединения с неправильным номером k Nk Np(&;8,74) k Nk ^p(A!;8,74) 0—2 1 2,05 11 20 24,34 3 5 4,76 12 18 17,72 4 11 10,39 13 12 11,92 5 14 18,16 14 7 7,44 6 22 26,45 15 6 4,33 7 43 33,03 ^16 2 4,65 8 31 36,09 9 10 40 35 35,04 30,63 267 267,00
180 Гл. VI. Биномиальное распределение и распределение Пуассона д) Подсчет бактерий и клеток крови. На рис. 1 воспроизведена фотография чашки Петри с колониями бактерий, которые под мик- роскопом видны как темные пятнышки. Чашка разделена на ма- ленькие квадраты. В табл. 7 приведены наблюденные в восьми Рис. 1. Бактерии в чашке Петри. Таблица 7 Пример «д». Число бактерий k 0 1 2 3 4 5 6 7 Х2-уро вень Наблюденное Nk Пуассоновское 5 6,1 19 18,0 26 26,7 26 26,4 21 19,6 13 11 ,7 8 9,5 97 Наблюденное N Пуассоновское 26 27,5 40 42,2 38 32,5 17 16,7 7 9,1 66 Наблюдённое Пуассоновское 59 55,6 86 82,2 49 60,8 30 30,0 20 15,4 26 Наблюденное Nk Пуассоновское 83 75,0 134 144,5 135 139,4 101 89,7 40 43,3 16 16,7 7 7,4 63 Наблюденное Н Пуассоновское 8 6,8 16 16,2 18 19,2 15 15,1 9 9,0 7 6,7 97 Наблюденное Affc Пуассоновское 7 3,9 11 10,4 11 13,7 11 12,0 7 7,9 8 7,1 53 Наблюденное N Пуассоновское 3 2,1 7 8,2 14 15,8 21 20,2 20 19,5 19 15 7 9,6 9 9,6 85 Наблюденное Nk Пуассоновское 60 62,6 80 75,8 45 45,8 16 18,5 9 7,3 78 Последнее значение Nв каждой строке учитывает квадраты с большим числом пят- нышек и поэтому в соответствующем столбце следовало бы указать «/? или более»
§ 8. Время ожидания. Отрицательное биномиальное распределение 181 экспериментах с восемью различными видами бактерий числа квад- ратов, содержащих ровно k пятнышек х). Здесь мы имеем пример важного практического применения распределения Пуассона к рас- пределениям случайных точек по поверхности. § 8. ВРЕМЯ ОЖИДАНИЯ. ОТРИЦАТЕЛЬНОЕ БИНОМИАЛЬНОЕ РАСПРЕДЕЛЕНИЕ Рассмотрим последовательность п испытаний Бернулли. Нас ин- тересует, сколько испытаний предшествуют r-му успеху, где г — фиксированное положительное целое. Общее число успехов в п испытаниях может быть, конечно, меньше г, но вероятность того, что r-й успех произойдет при v-м испытании, где очевидно, не зависит от п и зависит только от v, г и р. Поскольку необходи- мо, чтобы v^r, удобно писать v=k+r. Вероятность того, что r-й успех произойдет при (r+k)-M испытании, где k=0, 1, . . ., будем обозначать через f(k; г, р). Она равна вероятности иметь ровно k неудач перед r-м успехом. Такое событие происходит тогда и только тогда, когда среди r-\-k—1 испытаний есть ровно k не- удач, а следующее, или (r+k)-e, испытание заканчивается успехом; (r-\-k—1\ г 7 ь соответствующие вероятности равны ( ) рг чу* и р; следо- вательно, p) = (''\fe-I)pV. (8-1) Переписывая биномиальный коэффициент в соответствии с форму- лой (12.4) гл. II, находим эквивалентную форму записи fik- г, = 6 = 0, 1, 2...... (8.2) Предположим теперь, что испытания Бернулли проводятся до тех пор, пока не наступит г успехов.Типичное элементарное событие представляется в виде последовательности, содержащей случайное число k букв Н и ровно г букв У и заканчивающейся буквой У; вероятность такого события есть, по определению, prqk. Мы должны, однако, поставить вопрос, возможно ли, что испытания никогда не закончатся, т. е. существует ли бесконечная последо- вательность испытаний с числом успехов, меньшим чем г. Так как оо г, р) есть вероятность того, что r-й успех произойдет после k=0 конечного числа испытаний, то возможностью существования беско- нечной последовательности с числом успехов, меньшим чем г, х) Таблица заимствована из книги Neyman J., Lectures and conferences on mathematical statistics (mimeographed), Dept, of Agriculture, Washington, 1938.
182 Гл. VI. Биномиальное распределение и распределение Пуассона можно пренебречь тогда и только тогда, когда 2/(й;г,р) = 1. (8.3) Л=0 Но это так в силу следующего свойства биномиального ряда! 00 Л=0Ч к ' Умножая (8.4) на рг, получаем (8.3). В нашей задаче о времени ожидания г обязательно является по- ложительным целым, но величина, определяемая либо (8.1), либо (8.2), неотрицательна и (8.3) справедливо для любого положитель- ного г. Для произвольных фиксированных г>0 и 0<р<1 последова- тельность {/(&; г, р)} называется отрицательным биномиальным распределением. Оно встречается во многих приложениях (и мы уже сталкивались с ним в задаче 24 гл. V,8 как с предельной фор- мой распределения Пойа). Для положительных целых г последова- тельность {/(ft; г, р)} можно интерпретировать как вероятностное распределение времени ожидания r-го успеха*, в такой форме оно так- же называется распределением Паскаля. При г=1 оно сводится к геометрическому распределению {pqk}. Примеры, а) Задача Банаха о спичечных коробках х). Некий ма- тематик всегда носит в правом и левом карманах по коробке спи- чек. Когда ему нужна спичка, он наугад выбирает один из карма- нов. Последовательные выборы образуют, таким образом, испыта- ния Бернулли с р = 1/2. Предположим, что в начальный момент каждая коробка содержала ровно N спичек, и рассмотрим момент, когда математик впервые вытащит пустую коробку. В этот момент другая коробка может содержать 0, 1, 2,. . ., N спичек; соответст- вующие вероятности обозначим через иг. Договоримся считать «ус- пехом» выбор коробки из левого кармана. Из левого кармана бу- дет вынута пустая коробка, а в правом в это время будет ровно г спичек тогда и только тогда, когда (Д^+1)~му успеху предшест- вуют N—г неудач. Вероятность этого события равна f(N—r\ N+1, 1/2). Точно так же можно рассуждать и о правом кармане и, следо- вательно, искомая вероятность равна /9Д7__г\ ur==2f(N—r\ 2V+1, 1/2) = Q n (8.5) Численные значения в случае N=50 даны в табл. 8. (См. также за- дачи 21 и 22 ниже и задачу 11 гл. IX,9.) х) Этот пример возник из шутливого замечания о привычках Банаха (сде- ланного Г. Штейнгаузом) во врученном ему адресе. Пример стал неожиданно популярным в литературе, и по этой причине его название сохранено, Припи- сывать Банаху авторство этой задачи, конечно^ было бы ошибкой»
§ 8* Время ожидания. Отрицательное биномиальное распределение 183 1 Таблица 8 Вероятности (8.5) в задаче о спичечных коробках Г иг иг Г иг иг 0 0,079 589 0,079 589 15 0,023 171 0,917 941 1 0,079 589 0,159 178 16 0,019 081 0,937 022 2 0,078 785 0,237 963 17 0,015 447 0,952 469 3 0,077 177 0,315 140 18 0,012 283 0,964 752 4 0,074 790 0,389 931 19 0,009 587 0,974 338 5 0,071 674 0,461 605 20 0,007 338 0,981 676 6 0,067 902 0,529 506 21 0,005 504 0,987 180 7 0,063 568 0,593 073 22 0,004 041 0,991 220 8 0,058 783 0,651 855 23 0,002 901 0,994 121 9 0,053 671 0,705 527 24 0,002 034 0,996 155 10 0,048 363 0,753 890 25 0,001 392 0,997 547 И 0,042 989 0,796 879 26 0,000 928 0,998 475 12 0,037 676 0,834 555 27 0,000 602 0,999 077 13 0,032 538 0,867 094 28 0,000 379 0,999 456 14 0,027 676 0,894 770 29 0,000 232 0,999 688 иг есть вероятность того, что в момент, когда впервые одна из коробок окажется пу- стой, другая содержит ровно г спичек (предполагается, что вначале каждая коробка содержала 50 спичек). £/г=«0 + «1 + • • •+wr означает вероятность того, что вторая коробка содержит не более г спичек. б) Обобщение*, настольный теннис. Суть рассмотренной выше за- дачи становится яснее, если разным коробкам приписать разные вероятности. Для разнообразия проиллюстрируем этот вариант ина- че. Предположим, что Петр и Павел играют в игру, которую можно рассматривать как последовательность испытаний Бернулли с ве- роятностями р nq, характеризующими мастерство игроков. В обыч- ном настольном теннисе побеждает игрок, первым’ набравший 21 очко, т. е. победивший при 21 подаче. Для сравнения с предыду- щим примером рассмотрим более общую ситуацию, когда для об- щей победы нужна победа при 2v+l подаче. Тогда в игре будет самое меньшее 2v+l и самое большее 4v-H подач (испытаний). Обозначим через аг вероятность общей победы Петра при 4v+l—г испытаниях. Это событие происходит тогда и только тогда, когда в первых 4v—г испытаниях Петр набрал 2v побед и, следовательно, победил в (2v-H)-m испытании. Таким образом, (4v — г\ 2v )p2v+vv-r. (S6) В нашей игре «0+.. .+«2.v есть вероятность победы Петра. Вероят- ность того, что игра закончится ровно после 4v-j-l—г испытаний,;
184 Гл. VI. Биномиальное распределение и распределение Пуассона равна ar+br, где Ьг определяется формулой (8.6), в которой р и q меняются местами. Если положить 2v=A/ и p=q=\!2, то вероятности ar-Ybr сво- дятся к вероятностям ит из предыдущего примера. ► § 9. ПОЛИНОМИАЛЬНОЕ РАСПРЕДЕЛЕНИЕ Биномиальное распределение нетрудно обобщить на случай по- следовательных независимых испытаний, каждое из которых за- канчивается одним из нескольких возможных исходов. Обозначим возможные исходы каждого испытания через Еъ. . .,ЕГ и предпо- ложим, что вероятность осуществления исхода Et для каждого ис- пытания равна pt (i = l,. . .,г). При г=2 получаем испытания Бер- нулли; в общем случае числа pi должны удовлетворять только сле- дующему условию: Pi+- . .+рг=1, рг>0. (9.1) Результатом п испытаний будет, например, последовательность ви- да Е^Е^Еъ- • • • Вероятность того, что в п испытаниях Е± произой- дет kt раз, Е2 произойдет k2 раз и т. д., равна [n\/(k1lk2l...kr\)]p’i'p^...pkrr, (9.2) где ki — произвольные неотрицательные целые числа, удовлетворяю- щие очевидному условию • -+kr=n. (9.3) При г=2 (9.2) сводится к биномиальному распределению с р^ =р, Pz^q, kr=k, k2=n—k. Доказательство в общем случае опирает- ся на формулу (4.7) гл. II и проводится так же, как и для биноми- ального распределения. Выражение (9.2) задает полиномиальное распределение, полино- миальное потому, что выражение (9.2) совпадает с общим членом разложения полинома (pi+. . . Ч-Рг)72 • Это распределение применя- ется к выбору с возвращением, когда выбираемые объекты разбиты более чем на два класса (например, по профессиям). Примеры, а) Какова вероятность получить каждую грань дваж- ды при бросании двенадцати костей? Здесь Ei,. . ., Е^ соответствуют шести граням, все kt равны 2 и все Pi равны 1/6. Следовательно, ответ будет 12!2“6 6"12=0,0034. . . . б) Выбор. Пусть генеральная совокупность из N элементов раз- бита на классы Е±,. , .,ЕГ объема NPi,. . ., NPr соответственно. Полиномиальное распределение дает вероятности возможных ре- зультатов случайного выбора с возвращением объема п из этой со- вокупности.
§ 10. Задачи 185 в) Сложные г) испытания Бернулли. Две последовательности ис-. пытаний Бернулли с вероятностями успеха и неудачи соответст- венно pi, 71 и р2) q% можно рассматривать как один сложный экс- перимент с четырьмя возможными исходами в каждом испытании, а именно комбинациями (У, У), (У, Н), (Н, У), (Я, Н). Предпо- ложение о независимости двух исходных последовательностей при- водит к тому, что вероятности четырех исходов равны соответст- венно pip2, Piqz, Ц1Ръ> Q1Q2- Если четыре целых числа klf k2, k3, в сумме дают п, то вероятность того, что в п испытаниях УУ по- явится раз, УН появится k2 раз и т. д., равна [n!/(^! kJ kJ А4!)] (9.4) Частный случай рассмотренной схемы возникает при выборочном контроле. Изделие признается стандартным или бракованным с вероятностями соответственно р и q. Оно может быть проверено или не проверено с вероятностями соответственно р' и q'. Решение о проверке изделия принимается без информации о его качестве, так что испытания независимы (см. задачи 25 и 26 ниже и задачу 12 гл. IX, 9). § 10. ЗАДАЧИ 1. Предполагая все комбинации полов детей равновероятными, определить, какую долю семей с шестью детьми будут составлять семьи с тремя мальчиками и тремя девочками. 2. Игрок в бридж при трех последовательных сдачах не получил туза. Есть ли у него основания жаловаться на невезение? 3. Сколько случайных цифр нужно взять, чтобы вероятность появления сре- ди них цифры 7 была не меньше 9/10? 4. Сколько раз нужно сдать колоду карт для игры в бридж (сдачи независи- мы), чтобы вероятность того, что фиксированный игрок по меньшей мере один раз получит четыре туза, была не меньше 1/2? Решить задачу и в том случае, когда игрок заранее не фиксируется. 5. Пусть вероятность попадания в цель равна 1/5 и производится десять не- зависимых выстрелов. Какова вероятность попадания в цель по меньшей мере дважды? 6. Найти в задаче 5 условную вероятность попадания в цель по меньшей мере дважды, если известно, что по крайней мере одно попадание произошло. 7. Найти вероятность того, что среди 13 карт, наугад выбранных из колоды в 52 карты, имеются ровно две карты красной масти. Сравнить ее с соответствую- щей вероятностью для испытаний Бернулли с р=1/2. 8. Какова вероятность того, что дни рождения шести людей приходятся на два месяца, оставляя ровно десять месяцев свободными? Предполагается неза- висимость и равновероятность всех месяцев. 9. Найти вероятность того, что при бросании 6 правильных костей единица выпадает а) по меньшей мере один раз, б) ровно один раз, в) ровно два раза. Срав- нить эти вероятности с их пуассоновскими приближениями. 10. Известно, что левши составляют в среднем 1%. Оценить вероятность того, что среди 200 людей окажется по меньшей мере четверо левшей. 11. Книга в 500 страниц содержит 500 опечаток. Оценить вероятность того, что на заданной странице не менее трех опечаток, *) В оригинале multiple.— Прим, перев,
186 Гл. VI» Биномиальное распределение и распределение Пуассона I 12. Дальтоники составляют 1% лиц в некоторой группе людей. Как велика должна быть случайная выборка (с возвращением), чтобы вероятность иметь в ней одного дальтоника была не меньше 0,95? 13. В предыдущей задаче найти вероятность того, что в выборке из 100 чело- век а) нет дальтоников, б) дальтоников два или больше. 14. Оценить среднее число изюминок, которое должно быть в одной булочке, чтобы не более одной булочки из ста было без изюма. 15. Вероятность иметь на одной руке в покере десятку, валета, даму, короля и туза одной масти равна р= 1/649 740. Сколь велико должно быть п, чтобы веро- ятность того, что ни разу при п сдачах не окажется такого набора карт, меньше 1/е^ 1/3? (Замечание. Решение не требует никаких вычислений.) 16. Книга в п страниц содержит в среднем X опечаток на страницу. Оценить вероятность того, что хотя бы на одной странице будет более k опечаток. 17. Предположим, что существует два типа звезд (или изюминок в кексе, или дефектов материала). Заданный участок содержит / звезд первого типа с ве- роятностью р (/; а) и k звезд второго типа с вероятностью p(k\ b); эти два события предполагаются независимыми. Доказать, что тот же участок содержит всего п звезд с вероятностью р(м; а-[-Ь). (Сформулировать результат и предположения задачи в абстрактных терминах.) 18. Задача об уличном движении. Поток транспорта через пешеходный переход таков, что вероятность проезда машины в течение любой заданной се- кунды постоянна и равна р; известно также, что нет связи между проездом машин в разное время. Рассматривая секунды как неделимые единицы времени, прихо- дим к схеме испытаний Бернулли. Предположим, что пешеход может перейти улицу, если ни одна машина не будет проезжать в течение следующих трех се- кунд. Найти вероятность того, что он должен ждать ровно 6=0, 1, 2, 3, 4 секунд. (Соответствующие общие формулы не очевидны и будут выведены при изложении теории серий успехов в гл. XIII,7.) 19. Двое бросают симметричную монету п раз каждый. Найти вероятность того, что у них выпадет одинаковое число гербов. 20. Для последовательности испытаний Бернулли с вероятностью успеха р найти вероятность того, что а успехов произойдут прежде, чем b неудач. (Замеча- ние. Результат определяется самое большее за а-\-Ь—1 испытаний. Эта задача имеет значение для классической теории игр в связи с вопросом о том, как делить став- ку, если игра прервана в момент, когда одному игроку не хватает до победы а очков, а второму Ь.) 21. В задаче Банаха о спичечных коробках (пример 8,а)) найти вероятность того, что в момент, когда первая коробка оказалась пустой (но не была вынута пустой), во второй содержится ровно г спичек (где г=1, 2, . , N). 22. Продолжение. Используя предыдущий результат, найти вероятность х того, что отсутствие спичек было обнаружено впервые не в той коробке, которая опустела первой. Показать, что полученное выражение сводится к виду х= 2“22V“1’ или приближенно (1/2) (Nл)"1/29 23. Корректуры некоторой книги независимо читали два корректора, кото- рые нашли соответственно и k2 ошибок; k12 ошибок нашли оба. Дать приемле- мую оценку неизвестного числа п ошибок в корректурах. (Предположить, что проверка корректур соответствует схеме испытаний Бернулли, в которой про- веряющие обнаруживают ошибку с вероятностями соответственно pi и р2. Исполь- зовать закон больших чисел.) Замечание. В этой задаче в простых терминах опи- сывается экспериментальный прием, использованный Резерфордом для подсчета сцинтилляций. 24. Чтобы оценить численность популяций животных путем их частичного отлова х), ловушки расставляются последовательно г раз. Пусть каждое животное I х) Moran Р4 A. Р., A mathematical theory of animal trapping, Biometrika» я (1951), 307—311,
§ 10. Задачи 1871 попадает в ловушку с вероятностью q\ предположим, что первоначально было я животных и что изменение ситуации между двумя последовательными отловами заключается в изменении численности популяции (так как пойманные животные исключаются из рассмотрения). Найти вероятность того, что г последовательных отловов дадут соответственно пъ п2, . . пг пойманных животных. 25. Сложные испытания Бернулли. В примере 9,в) найти условную вероят- ности р и q соответственно событий (У, Н) и (Н, У), предполагая, что одна из этих комбинаций осуществилась. Показать, что р>1/2 в случае Pi>p2 ир<1/2 в случае p2>Pi- 26. Продолжение1). Показать, что если в п парах испытаний ровно т пар привели к одной из комбинаций (У, Н) или (//, У), то вероятность появления (У, Н) ровно k раз равна b(k; т, р). 27. Смесь биномиального и пуассоновского распределений. Пусть некоторое на- секомое откладывает г яиц с вероятностью p(r; X), а вероятность развития насе- комого из яйца равна р. Предполагая взаимную независимость развития яиц, показать, что вероятность появления k новых насекомых дается распределением Пуассона с параметром Хр. Замечание. Другой пример аналогичной ситуации: ве- роятность разрыва k хромосом равна p(k\ X), а вероятность воссоединения фраг- ментов равна р (другие примеры такого рода см. пример гл. IX,1,г) и в гл. Х11₽1)* 28. Доказать следующую теорему 2): максимальная вероятность полино- миального распределения (9.2) удовлетворяет неравенствам пр[~ 1 < ki^ (n + r— 1) р^ f=l,2, (Ю-1) Указание. Сначала доказать, что вероятность является максимальной тогда и только тогда, когда (р,£у ру (&/+1) для каждой пары (i, j). Сложить эти неравенства для всех j и для всех i 7= /. 29. Доказать, что вероятности p(k\ X) распределения Пуассона достигают максимума, когда k есть наибольшее целое, не превосходящее %. Замечание. В задачах 30—34 используется пуассоновское приближение для биномиального распределения. Предполагается, что 'к=пр. 30. Показать, что отношение ak~b(k\ п, р,)/р(^;Х) при изменении k от 0 до оо сначала растет, а затем убывает, достигая максимума, когда k есть наи- большее целое, не превосходящее Х+1. 31. Доказать, что при увеличении k вероятности b(k\ п, р) сначала меньше, затем больше и потом опять меньше, чем p(k\ X). 32. Доказать, что если п->со и р->0 так, что величина пр=К остается посто- янной, то b(k-} п, р)-^р (&; равномерно по k. 33. Показать, что kl V п) П’ п) V п) * (10<2) х) Wald A., Sequential tests of statistical hypotheses, Ann. Math. Statist., 16 (1945), 166. Вальд использует приведенные выше результаты, чтобы создать практический метод сравнения двух эмпирически полученных последовательно- стей испытаний (например, результаты работы двух машин) для выбора той, в которой вероятность успеха больше. Он сводит задачу к более простой задаче нахождения того, .будет ли в последовательности испытаний Бернулли частота успеха значительно отличаться от 1/2. 2) В первом издании утверждалось лишь, что — npi\^r. Настоящее уточнение и его изящное доказательство принадлежат П. Морану.
188 Гл. VI. Биномиальное распределение и распределение Пуассона 34. Вывести из (10.2) неравенства р (fe; X) > b (fe; п, р) > р (k\ X) e-*8/(«-*)-W(n-M. (10.3) Указание. Использовать (12.26) из гл. II. Замечание. Хотя неравенства (10.2) являются очень грубыми, соотношения (10.3) дают превосходные оценки погрешности приближения. При помощи вы- числений, аналогичных выполненным в гл. II, 9, неравенства (10.3) нетрудно уточ- нить. Между прочим, из результата задачи 30 очевидно вытекает, что экспоненту в левой части (10.3) можно заменить величиной тМп, не превышающей (р+п”"1)^. Другие предельные теоремы 35. Биномиальное приближение для гипергеометрического распределения. Генеральная совокупность из N элементов состоит из красных и черных элементов, число которых относится как р : q (где р+<?=1). Берется выборка без возвраще- ния объема п. Вероятность того, что она содержит ровно k красных элементов, да- ется гипергеометрическим распределением, введенным в гл. II, 6. Доказать, что эта вероятность стремится к b(k; п, р) при М->оо. 36. Предположим, что в условиях предыдущей задачи р мало, п велико, а К—пр и не’мало, и невелико. Тогда гипергеометрическое распределение можно ап- проксимировать распределением Пуассона p(k\ X). Проверить это непосредствен- но, не используя пуассоновское приближение для биномиального распределения. 37. Пусть в отрицательном биномиальном распределении {f(k\ г, р)} из § 8 7^-0 и г->оо таким образом, что произведение rq—h постоянно. Показать, что f(k; г, р)->-р (й; Л). (Замечание. Тем самым получаем предельную теорему для распределения Пойа; см. задачу 24 гл. V, 8.) 38. Многомерное распределение Пуассона. Доказать, что когда п велико, a npj = 'kj при /= 1, ..., г—1 и не мало, и не велико, полиномиальное рас- пределение (9.2) можно аппроксимировать распределением Доказать также, что члены этого распределения в сумме дают единицу. (Заметим, что в задаче 17 мы имели дело с двумерным распределением Пуассона.) 39. а) Вывести (3.6) непосредственно из (3.5), используя очевидное соотно- шение b(k\ п, р)=Ь(п—k\ п, q)9 б) Вывести биномиальное распределение как с помощью общей формулы суммирования (3.1) гл. IV, так и по индукции. 40. Доказать, что 2 kb (k\ п, р)— пр и 2 k2b (k\ n, р) =n2p2-\~npq9 41. Доказать, что 2 2i)=X2 + X, 42. Проверить тождество k 2* (v; nit р) b (k—v, nz, p) = b (k; ni + »2, p) (10.4) v = 0 и пояснить его вероятностный смысл. Указание* Использовать равенство (6.4) гл. II.
§10. Задачи 189 Замечание. Соотношение (10.4) представляет собой частный случай фор- мулы свертки, которая будет введена в гл. XI; другой пример дает (10.5). 43. Проверить тождество k (v; ^i) р ki+w. <10-5) v=0 44. Пусть k В (k-,n, p)=^b(y;n, р) (10,6) v = 0 есть вероятность появления не более k успехов в п испытаниях. Тогда В (k; «4-1, р)=В (k; п, p)—pb (k; п, р), В (&-|-1; п+1, р)—В (k; n, p)-\-qb (Z?+l; n, р). * Проверить эти равенства, а) исходя из определения, б) аналитически. 45. Доказать, что в тех же обозначениях г) я ) (10.8) ' о II Р 1—В(й; п, р)=п (”70 J ^(\ — t)n-k-idt. (10,9) 7 о Указание. Проинтегрировать по частям или продифференцировать обе части по р. Вывести одну формулу из другой. 46. Доказать, что 00 р (0; %) + ...+/>(«; X) = (l/n!)^e-^«dAj. (10 10) i, В (k\ и, р) = (п—k) х) Интеграл в (10.9) представляет собой неполную бета-функцию. Таблица для 1—B(k\ п, р) с точностью до 7 знаков после запятой для k и п, не превосходящих 50, и р=0,01, 0,0% 0,03, . . . даны в работе Pearson К., Tables of the incomplete beta function, London, Biometrica Office, 1934. [Имеется перевод: Пирсон К. Таблицы неполной бета-функции,— Ms: ВЦ АН СССР4 1974.)
ГЛАВА VII НОРМАЛЬНОЕ ПРИБЛИЖЕНИЕ ДЛЯ БИНОМИАЛЬНОГО РАСПРЕДЕЛЕНИЯ Нормальное приближение для биномиального распределения имеет важное теоретическое и практическое значение. Оно сыграло большую роль в развитии теории вероятностей, так как привело к первой предельной теореме. G современной точки зрения эта теорема является лишь частным случаем центральной предельной теоремы, к которой мы обратимся в гл. X, но полное исследова- ние которой должно быть отложено до тома 2. Частный случай р=1/2 рассматривался в гл. III при выводе предельных теорем о первом достижении, о числе перемен знака и т. д. Этот частный случай особенно прост и отдельно исследуется в § 2. § 1. НОРМАЛЬНОЕ РАСПРЕДЕЛЕНИЕ Во избежание дальнейших перерывов в изложении основных идей сделаем здесь отступление и введем две чрезвычайно важные функции. Определение. Функция, определяемая формулой п(х) = (1У2^)е-^2, (1.1) называется плотностью нормального распределения; ее интеграл 91 (х) == (1//2л) J dy (1.2) — со называется нормальной функцией распределения. График п(х) — симметричная колоколообразная кривая, изобра- женная на рис. 1. Заметим, что вдоль осей х и у мы используем разный масштаб. Максимум п(х) равен 1/)/2л 0,399, так что в обычной декартовой системе график и (%) был бы более пологим. (Обозначения п и нестандартны. В первых двух изданиях были более традиционные обозначения <р и Ф, но в томе 2 для после- довательности изложения необходимо, чтобы эти символы исполь* зовались в других целях.)
§1. Нормальное распределение 191 99,7% площади Рис. 1. Плотность нормального распределения И, Лемма 1. Площадь, ограниченная графиком функции п(х) и осью х, равна 1, т. е. n(x)dx~ 1. (1-3) Доказательство. Имеем оо \ 2 со оо и (х) dx ! = J J п (х) и (у) dx dy = — 00 J — 00 —00 00 оо s=[l/(2n)] J (xi+^l2dxdy. (1-4) — 00 —oo Переходя в этом двойном интеграле к полярным координатам, получаем 2л оо [l/(2n)]J d0$e-'2/2rdr = о о 00 J e-'^rdr = е~^2 о (1.5) что и доказывает лемму. ► Из определения и леммы вытекает, что 31 (х) монотонно воз- растает от 0 до 1. Ее график (рис. 2) представляет собой S-
192 Гл. VII. Нормальное приближение для биномиального распределения образную кривую, причем 91 (— х)=1— 91 (х). (1.6) В табл. 1 приведены значения1) 9i(x) для положительных х; зна- чения 91 (—х) получаются при помощи (1.6). Рис. 2. Нормальная функция распределения Для многих целей удобно иметь простую оценку «хвоста» 1—91 (х) при больших х. Такую оценку дает следующая лемма. Лемма 2* 2 *). При х—► оо 1 —91 (х) ~ х-1и (х); (1.7) точнее, для всех х > 0 справедливо двойное неравенство (х-1—х“?)п(х) < 1—91 (х) < х-1п(х). (1.8) (См. задачу 1.) Доказательство. Очевидно, [1—Зх“4]п(х) <п(х) < [14-х"2] п(х). (1.9) Члены этого неравенства представляют собой производные членов из (1.8), взятые с обратным знаком, поэтому (1.8) вытекает из (1.9) после интегрирования по полупрямой [х, оо). 4) Более подробные таблицы см. в Tables of Probability Functions, v. 2, Nat. Bureau of Standards, New York, 1942. [Имеется перевод: Таблицы веро- ятностных функций, Том II.—М.: ВЦ AHJCCCP, 1959.] Значения функций П (х) и 91 (*) — 91 (—х) приведены, в этих таблицах с 15 знаками после запя- той. При 0 < х < 1 значения х берутся через 0,0001, при х > 1 — через 0,001. 2) Здесь и в дальнейшем знак ~ означает, что отношение величин, сое- диненных этим знаком, стремится к 1,
§ 1. Нормальное распределение 193 Таблица 1 Нормальная функция распределения ЭД (х) 0,00 0,01 0,02 0,03 0,04 0,05 0, 06 0,07 0,08 0,09 0,0 0.5000 0,5040 0,5080 0,5120 0,5159 0,5199 0,5239 0,5279 0,5319 0,5359 0,1 0,5398 0,5438 0,5478 0,5517 0,5557 0,5596 0,5636 0,5675 0,5714 0,5753 0,2 0,5793 0,5832 0,5871 0,5910 0,5948 0,5987 0,6026 0,6064 0,6103 0,6141 о,з 0,6179 0,6217 0,6255 0,6293 0,6331 0,6368 0,6406 0,6443 0,6480 0,6517 0,4 0,6554 0,6591 0,6628 0,6664 0,6700 0,6736 0,6772 0,6808 0,6844 0,6879 0,5 0,6915 0,6950 0,6985 0,7019 0,7054 0,7088 0,7123 0,7157 0,7190 0,7224 0,6 0,7257 0,7291 0,7324 0,7357 0,7389 0,7422 0,7454 0,7486 0,7518 0,7549 0,7 0,7580 0,7612 0,7642 0,7673 0,7704 0,7734 0,7764 0,7794 0,7823 0,7852 0,8 0,7881 0,7910 0,7939 0,7967 0,7995 0,8023 0,8051 0,8078 0,8106 0,8133 0,9 0,8159 0,8186 0,8212 0,8238 0,8264 0,8289 0,8315 0,8340 0,8365 0,8380 1,0 0,8413 0,8438 0,8461 0,8485 0,8508 0,8531 0,8554 0,8577 0,8599 0,8621 1,1 0,8643 0,8665 0,8686 0,8718 0,8729 0,8749 0,8770 0,8790 0,8810 0,8830 1,2 0,8849 0,8869 0,8888 0,8907 0,8925 0,8944 0,8962 0,8980 0,8997 0,9015 1,3 0,9032 0,9049 0,9066 0,9083 0,9099 0,9115 0,9131 0,9147 0,9162 0,9177 1,4 0,9192 0,9207 0,9222 0,9236 0,9251 0,9265 0,9279 0,9292 0,9306 0,9319 1,5 0,9332 0,9345 0,9357 0,9370 0,9382 0,9394 0,9406 0,9418 0,9430 0,9441 1,6 0,9452 0,9463 0,9474 0,9485 0,9495 0,9505 0,9515 0,9525 0,9535 0,9545 1,7 0,9554 0,9564 0,9573 0,9582 0,9591 0,9599 0,9608 0,9616 0,9625 0,9633 1,8 0,9641 0,9649 0,9656 0,9664 0,9671 0,9678 0,9686 0,9693 0,9699 0,9706 1,9 0,9713 0,9719 0,9726 0,9732 0,9738 0,9744 0,9750 0,9758 0,9762 0,9767 2,0 0,9773 0,9778 0,9783 0,9788 О;9793 0,9798 0,9803 0,9808 0,9812 0,9817 2,1 0,9821 0,9826 0,9830 0,9834 0,9838 0,9842 0,9846 0,9850 0,9854 0,9857 2,2 0,9861 0,9865 0,9868 0,9871 0,9875 0,9878 0,9881 0,9884 0,9887 0,9890 2,3 0,9893 0,9896 0,9898 0,9901 0,9904 0,9906 0,9909 0,9911 0,9913 0,9916 2,4 0,9918 0,9920 0,9922 0,9925 0,9927 0,9929 0,9931 0,9932 0,9934 0,9936 2,5 0,9938 0,9940 0,9941 0,9943 0,9945 0,9946 0,9948 0,9949 0,9951 0,9952 2,6 0,9953 0,9955 0,9956 0,9957 0,9959 0,9960 0,9961 0,9962 0,9963 0,9964 2,7 0,9965 0,9966 0,9967 0,9968 0,9969 0,9970 0,9971 0,9972 0,9973 0,9974 2,8 0,9974 0,9975 0,9976 0,9977 0,9977 0,9978 0,9979 0,9980 0,9980 0,9981 2,9 0,9981 0,9982 0,9983 0,9984 0,9984 0,9984 0,9985 0,9985 0,9986 0,9986 з,о 0,9986 0,9987 0,9987 0,9988 0,9988 0,9988 0,9989 0,9989 0,9989 0,9990 3,1 0,9990 0,9991 0,9991 0,9991 0,9992 0,9992 0,9992 0,9992 0,9993 0,9993 3,2 0,9993 0,9993 0,9993 0,9994 0,9994 0,9994 0,9994 0,9994 0,9995 0,9995 При х<0 используется соотношение 9? (— x) = l—9? (х). Замечание о терминологии. Термин функция распределения используется в математической литературе для неубывающих функций от х, стремящихся к О при х-> —оо и к 1 при х—>со. В настоящее время статистики предпочитают тер- мин кумулятивная функция распределения, но прилагательное «кумулятивная» является излишним. Плотность распределения — это неотрицательная функция / (х), интеграл от которой по всей оси г равен единице. Интеграл от — оо до х от 7 № 221
194 Гл. VII. Нормальное приближение для биномиального распределения любой плотности распределения является функцией распределения. Приме- нявшийся ранее термин функция частот (frequency function) представляет со- бой синоним для плотности распределения. Нормальное распределение часто называют гауссовским распределением$ но оно использовалось в теории вероятностей еще Муавром и Лапласом. Если изменить начало отсчета и единицу измерения, то 91 (х) преобразуется в 9? ((х—а^/Ь). Эта функция называется функцией распределения нормального закона со средним значением а и дисперсией Ь2 (или стандартным отклонением |6|). Функцию 29? (х Г 2) — 1 часто называют функцией ошибок. § 2. СИММЕТРИЧНЫЕ РАСПРЕДЕЛЕНИЯ Рассмотрим, как используется нормальное распределение в качестве приближения для биномиального распределения с р = 1/2. Есть две причины, по которым частный случай р = \/2 выделяет- ся особо. Во-первых, вычисления здесь намного проще, и, следо- вательно, легче объяснить, как в этой задаче возникает нормаль- ное распределение. Во-вторых, данный частный случай рассмат- ривался в связи со случайными блужданиями (см. гл. III, 2), и, следовательно, желательно иметь соответствующие выкладки, не отягощенные техническими деталями, необходимыми для несиммет- ричных распределений. Для определенности возьмем n=2v четным и для упрощения по- ложим ak = b(v 4* k\2v, 1/2), (2.1) т. е. ak — члены симметричного биномиального распределения, переномерованные в зависимости от их расстояния до максимальной вероятности, а0—максимальная вероятность и k изменяется от — v до V. Поскольку a^k = ak, рассмотрим только ^^0. (В обозначениях гл. III имеем ak = p2v,2k- Приведенное ниже доказательство могло быть там же и помещено, так как не ис- пользует идеи, развитые после § 2 гл. III.) Чтобы понять, как ведет себя последовательность а0, air az, ..., сравним ее общий член с а0, используя соотношение __ v(v-l)...(v--fe+l) k 0 (v+1) (v + 2)...(v + ^) ’ ’ которое легко получить из определения (2.1). Нас интересует поведение последовательности только при боль- ших значениях v, и поэтому будем рассматривать лишь те зна- чения &, при которых отношение ktv мало, так как при остальных k члены ah пренебрежимо малы. Разделив числитель и знаменатель дроби в (2.2) на vk, получим дробь с членами вида 1 +//v, где / из- меняется от — (k—1) до k. Далее, l + //v = ^7v+.-., (2.3) где многоточие означает члены, сумма которых меньше, чем (/7v)2. Для такого приближения дробь в (2.2)*сводится к экспоненте с по-
§2. Симметричные распределения 195 казателем —(2/v) [1+ ... + (k—l)]—k/v=—k*/v и погрешность приближения меньше, чем ft3/v* 2. Соответственно при v —> оо и k из интервала 0 < k < /Cv, где К>3->0, (2.4) имеем приближение ak~ aoe~k2/\ (2.5) Если выразить биномиальные коэффициенты через факториалы, то, используя формулу Стирлинга (9.1) гл. II1), видим, что £z0=f2v')2-2v---‘ (2.6) 0 \ V у nv v > Подставляя это в (2.5), получаем ak~hn(kK), где ft = j/2/v = 2/j/b« (2.7) Это основное соотношение справедливо при v—> оо и при k, не превосходящих чисел Kv, которые удовлетворяют условию (2.4). Мы будем использовать (2.7) только для значений k порядка V v; в этом случае (2.4) тривиально выполняется. На практике нам обычно требуются приближения для вероят- ностей попадания в различные интервалы, т. е. для сумм вида2) Л (%i, х2) = 2 (2-8) Xi < k < х2 где суммирование проводится по всем целым числам между хг и х2 включительно. Сейчас мы покажем, как можно найти прибли- х) Замечание о постоянной в формуле Стирлинга. Напомним, что при доказательстве формулы Стирлинга в § 9 гл. II не было показано, что по- стоянная в ней равна У2л. Восполним этот пробел следующим образом. Постоянную л в (2.6) мы должны заменить на неизвестную постоянную. В тео- реме об аппроксимации (см. ниже) это приведет лишь к тому, что правую часть (2.10) следует умножить на неизвестную постоянную с, и нужно дока- зать, что с=1. Возьмем в (2.10) zx = 0. Отношение обеих частей (2.10) стре- мится к 1 при п->оо. Но из оценки «хвоста» (3.5) гл. VI вытекает, что левая часть лежит между 1/2 и 1/2 — 4г72, в то время как для правой части из (1.8) следует двойное неравенство с > с [9i (z2) —-1/2] = (1/2) с—с [1 —$1 (г2)] > (1/2) с-сц (г2)/г2. Для достаточно больших г2 обе части (2.10) сколь угодно близки соответ- ственно к 1/2 и с/2, и поэтому с=1, как и утверждалось. 2) Мы не стали обозначать сумму в (2.8) через S„, так как этот символ в гл. III и VI имеет другой смысл. На языке теории случайных блужданий A (Xi, х2) есть вероятность того, что в момент n = 2v частица находится между 2xi и 2х2; в терминологии настоящей главы X(xi,x2) есть вероятность того, что число успехов в n = 2v испытаниях лежит между v-|-Xi и В следующем параграфе это число снова будет обозначаться через SZi. Г
196 Гл. VII. Нормальное приближение для биномиального распределения жение для А (х) через площадь области, лежащей под графиком п(х), а эту площадь, в свою очередь, можно выразить через ин- теграл 91. В силу монотонности п ясно, что площадь области, лежащей под графиком п между kh и (й+1)/г, меньше, чем hn(kh), но больше, чем hn ((£ + 1) h), откуда следует, что x2h + h x2h J It (s) ds < 2 hn (kh) < j n (s) ds. (2.9) xth Xi </г < x2 Xih — h Отсюда вытекает, что средний член в (2.9) есть приближение для Л(хх, ^2)> которое будет хорошим, когда v велико и отношение k2/v не мало и не велико, т. е. когда h мало, a xh не мало и не велико. Два крайних члена в (2.9) равны соответственно 91 (xji+h).—9J (xx/t) и 9i (x2/i)—91 (x±h—h). Их разность стремится к 0 при h—>0, и поэтому их можно заменить на 9i (x2/i)—91 (хх/г). Сформулируем полученный результат в виде предельной тео- ремы, заменив при этом переменную х на z = xh. Теорема об аппроксимации. Для фиксированных гх < ?2 спра- ведливо соотношение _ 2 ад-ад. (2.Ю) (1/2) Zi V п < k < (1/2) z2 V п Вскоре мы увидим, что эта теорема существенно обобщается в определенных случаях, когда z± и г2 могут меняться вместе с/г, не оставаясь ограниченными. Заметим, что предельная теорема (2.7) гл. III содержится в (2.10), которая, в свою очередь, есть лишь част- ный случай общей теоремы из следующего параграфа. Оценки погрешности. Нам не нужно беспокоиться о погрешности, допус- каемой при замене суммы интегралом, поскольку (2.9) содержит верхние и нижние оценки. Чтобы оценить погрешность приближения в (2.7) положим ak^aQe~k2lv+^==hK (kh) eS1~£z, (2*11) так что 8i представляет собой погрешность, допускаемую при опускании членов более высокого порядка в (2.3), а величина 82 определяется-из (2.6). Из наших рассуждений видно, что /?-1 / = 1 Оценки погрешности приближения наиболее интересны для относительно малых v, и для рассмотрения этого случая будем предполагать только, что k < (1/3) v. Сравнивая разложение (8.11) гл. II с суммой геометрической прогрессии со знаменателем 1/3, мы видим, что каждый член ряда (2.12) положителен и меньше, чем (//v)3. Следовательно, сумма ряда положительн^ и меньше, чем &4/(4v)3. Из (8.9) гл. II аналогично выводится, что последнее слагаемое в правой части (2.12) отрицательно и больше, чем —3Z?2/(4v2). Таким образом, —ЗЛ2/п2 < 8i < 2/е4М если k < (1/6) п. (2.13)
§ 3. Предельная теорема Муавра — Лапласа 197 Как правило, в приложениях величины k и п сравнимы, и тогда условие k < п/6 тривиально выполняется. При данных обстоятельствах неравенства (2.13) достаточно точны. Что касается (2.6), то, как следует из уточненной формулы Стирлинга (9.15) гл. II, для aQ получается лучшее приближение, если умножить правую часть (2.6) на е1/<4Л> , и в любом случае 1/(4п) — 1 /(20n3) < е2 < 1 /(4n) +1 /(360/г3). (2.14) Итак, найдены точные оценки погрешностей приближений (2.7) и (2.10). Эти оценки применимы даже для относительно небольших значений п. Основной результат наших исследований заключается в том, что относи- тельная погрешность приближения (2.7) имеет порядок &2/п2 или k*ln3 в зави- симости от того, какая из этих величин больше. На практике эти оценки обычно используются, когда k2/n велико, и в этом случае относительная погрешность имеет порядок k^/n3. Наши оценки указывают также путь, как улучшить приближение с помощью соответствующего изменения членов (см. задачу 14). § 3. ПРЕДЕЛЬНАЯ ТЕОРЕМА МУАВРА — ЛАПЛАСА Сейчас будет показано, как полученные выше приближения можно обобщить на произвольное биномиальное распределение с р #=1/2. Рассуждения те же, но потребуется больше вычисле- ний. Первая сложность возникает в связи с максимальной вероят- ностью распределения. Как следует из (3.2) гл. VI, индекс т максимальной вероятности—это единственное целое число вида т = цр4-6, где —(3.1) Величиной б в конечном счете мы будем пренебрегать, но в вы- числениях она появится. (В случае р=1/2 б не было, так как мы предполагали, что n = 2v четно.) Как и в предыдущем параграфе, перенумеруем члены бино- миального распределения и запишем aft = &(m + £; п, р) = Рт+кдп~т~к. (3.2) Для определенности предположим, что k > 0; для k < 0 рассуж- дения аналогичны. (В случае k < 0 нужно лишь поменять места- ми р и q,) Аналогично (2.2) имеем (п— т) (п— пг— 1)... (п—т — & + 1) рп ak~ao (m-l-l) (m + 2)...(m + 6)g* Это можно записать иначе: п =п (1~^о) к и° (1 +<?/<>) (!+<?/,)... (1 +9^-1) ’ (3.3) (3-4) Где для сокращения записи использовано обозначение ^ = (/ + 6+ <?)/[(«+ 1) W]- (3.5)
198 Гл. VII. Нормальное приближение для биномиального распределения Воспользуемся теперь представлением (3.4) только для тех значе- ний k, для которых tk мало, скажем tk < 1/2. Из разложения Тейлора для логарифма (8.9) гл. II видно, что (1-^7.)/(1+^) = ^+-. (3.6) где опущенный член по абсолютной величине не превосходит t*. Таким образом, ak = aoe~(ta+--'+tk-^+---, (3.7) где многоточие соответствует члену, абсолютная величина кото- рого1) меньше, чем < k9l(npq)\ Далее, JL _1_/ _(l/2)fe(fe-l)+*(6+9) о -t- Ч Ф • • • “Г Ч-i ~ (п+1)р9 (3-8) Для простоты заменим правую часть (3.8) на k2/(2npq). При этом величина допускаемой погрешности меньше, чем 2k!(npq). Итак, если мы запишем ak = a.e-k2/M+\ (3.9) то член pfe, характеризующий погрешность приближения, удовле- творяет неравенству IР* I < k3l(tipqY + ZkHnpq). (3.10) Покажем теперь, что а0 = —й p^qn-™-----1 (3.11) 0 т\(п—т)\И yr2nnpq V ' что обобщает аналогичное соотношение (2.6) для симметричного слу- чая. В идеальном случае, когда р=т!п, оценка (3.11) является немедленным следствием формулы Стирлинга (9.1) гл. II. Непосред- ственное дифференцирование показывает, что средний член (3.11) достигает максимума при р^=т!п. При заданном т нужно рассмот- реть только те значения р, для которых выполнено (3.1), и тогда ми- нимум а0 достигается в одной из крайних точек, а именно для р=^ =т/ (п+1) или р^= (т+1)/ (п+1). Для этих значений р непосредст- венное использование формулы Стирлинга снова приводит к (3.11), только п заменяется на п+1. Следовательно, (3.11) справедливо для всех возможных значений р. Если для сокращения записи поло- жить h=\/^npq, (3.12) то из (3.9) вытекает соотношение ak~tm(kh), (3.13) £) Мы удовлетворимся очень грубыми оценками погрешности приближения
§ 3t Предельная теорема Муавра — Лапласа 199 но при условии, что k изменяется вместе © п таким образом, что -—►(). Итак, доказана следующая теорема. Теорема 1. Если и—> оо и k изменяется в интервале k<Knv причем /Q/n2-—^0, то соотношение (3.13) справедливо1) равномерно по k, т. е. для любого 8 > 0 « достаточно больших п 1—е < ak/[h\\ (kh)] < 1 + 8. (3.14) Пример. Рис. 3 иллюстрирует случай п=10 и /7=1/5, когда пр<7= 1,6. С учетом того, что п очень мало, приближение кажется поразительно хорошим. Для k—О, . . 6 вероятности b (k\ п, р) рав- Рис. 3. Нормальное приближение для биномиального распределения. Ступени чатая функция дает вероятности b(k; 10, 1/5) k успехов в 10 испытаниях Бернул- ли с р—1/5. Непрерывная кривая дает для каждого целого k соответствующее нормальное приближение. ны 0,1074, 0,2684, 0,3020, 0,2013, 0,0880,^ 0,0264, 0,0055. Соот- ветствующие приближения, согласно (3.13), равны 0,0904, 0,2307, 0,3154, 0,2307, 0,0904, 0,0189, 0,0021. ► Теорема 1 используется в основном для вывода приближений для вероятностей вида |3 [3—т P{a<S„<₽}=2 b(y;n,p) = 2 ак. (3.15) v=a k—a~ т х) Если k изменяется вместе с п так, что /г3/п2—>оо, то нормальное прибли- жение заменяется приближением другого вида, см, задачи 13 и 15.
200 Гл. VII. Нормальное приближение для биномиального распределения В области применимости теоремы 1 хорошее приближение получа- ется при замене ak на hn(kh). Последнее произведение можно интерпретировать как площадь прямоугольника высотой n(kh), основанием которого является интервал длиной h с центром в kh (см. рис. 3). Как обыйно, заменим площадь прямоугольника пло- щадью соответствующей области, заключенной между осью х и графиком функции п; известно, что получающаяся при этом по- грешность в пределе пренебрежимо мала при h—>0. Таким обра- зом, для целых а и Р получаем приближение Р {а< S„ 91 ((а—т + 1/2) h)-91 ((₽—т— 1/2) h). (3.16) Нормальное приближение в такой форме целесообразно исполь- зовать, когда h лишь относительно мало и требуется наилучшая воз- можная точность. Однако в окончательной формулировке пред- почтительно заменить аргументы в правой части (3.16) более прос- тыми выражениями (а—пр) h и z2= (Р—пр) h\ погрешность, по- лучающаяся при этом упрощении, очевидно, стремится к нулю при А-^0. Итак, доказана следующая основная теорема. Теорема 2. (Предельная теорема Муавра — Лапласа.) Для фик- сированных г) z-l и z2 при п->оо справедливо соотношение ^{np-\-z1V"npq^S,l^np-\-z2Vnpq} —>91(z2) —91 (zj. (3.17) Помимо большой теоретической важности эта теорема интересна тем, что оправдывает использование правой части (3.17) в качестве приближения для левой части. Из (3.10) легко получить хорошие оценки погрешности приближения, но мы не будем останавливать- ся на этом вопросе. Практические примеры можно найти в следую- щем параграфе. Предельное соотношение (3.17) принимает более приятный вид, если Sn заменить нормированным числом успехов S*, определяемым по формуле S* = (S„-np)/Kw (3.18) Это равносильно выбору Кnpq в качестве единицы измерения отклонения Sn от пр. В терминах случайных величин (гл. IX) пр будет называться математическим ожиданием, a npq диспер- сией случайной величины SA2 (квадратный корень Vnpq есть стан- дартное отклонение). Неравенство в левой части (3.17) эквива- лентно следующему: и поэтому (3.17) можно пе- реписать в виде Р {Z, < s: < z2\ — 91 (z2)-91 (zj. (3.19) 2) Из теоремы 1 видно, что это условие можно ослабить, См, также § 6 и задачи 14 и 16,
§4. Примеры 201 Как правило, мы будем использовать предельную теорему в этом виде. Из (3.19), в частности, следует, что для больших п вероят- ность, стоящая в левой части, практически не зависит от р. Это поз- воляет сравнивать случайные флуктуации в различных последова- тельностях испытаний Бернулли, просто относя их к нашим стан- дартным единицам. Замечание об остановке в произвольный момент времени. Необходимо от- метить, что наши предельные теоремы и приближенные формулы справедливы тогда, когда число п испытаний фиксировано заранее независимо от исхода испытаний. Если игрок имеет право остановить игру в благоприятный для него момент, то его общий выигрыш нельзя оценить при помощи нормаль- ного приближения, так как продолжительность игры теперь случайна. Для любого фиксированного п очень маловероятно, что велико, однако при большом числе испытаний даже самое маловероятное событие обязательно произойдет. Мы увидим, что в длительной игре S/J практически наверняка будет иметь последовательность максимумов порядка величины у 2 log log п (закон повторного логарифма, см. гл. VIII, 5). § 4. ПРИМЕРЫ а) Пусть р=1/2 и /г = 200. Рассмотрим Р {95 Sn 105}, т. е. вероятность того, что при 200 бросаниях моменты число выпаде- ний герба отличается от 100 не более чем на 5. Здесь h= 1/]/ 50= = 0,141421... относительно велико, и нужно быть внимательным при определении границ интервала. Использование (3.16) приво- дит к приближению Р {95 < Sn 105} 91 (5,5/0 —91 (—5,5//) = = 291 (0,7778...) — 1 =0,56331. Истинное значение вероятности равно 0,56325.... Малостью погреш- ности мы в основном обязаны симметричности распределения. б) Пусть /?= 1/10 и п = 500. Здесь h= 1/]/"45 = 0,14907... . Рассуждая, как и выше, получаем Р {50 С S„ < 55} 91 (5,5/i) —91 (- 0,5/0 = = 91 (5,5/0 + 91 (0,5/0 — 1 =0,3235... , ' в то время как истинное значение вероятности равно 0,3176... . Погрешность составляет около 2%. в) Вероятность того, что лежит в пределах пр +2 V'npq, приблизительно равна 91 (2) —91 (—2) = 0,9545; для пр ± 3 Vnpq соответствующая вероятность приближенно равна 0,9973. Удиви- тельно, в сколь узких границах с большой вероятностью лежат случайные флуктуации. Например, вероятность того, что при 106 бросаниях монеты число выпадений герба будет отличаться от среднего значения 500 000 более чем на 1000, меньше 0,0455.
202 Гл* VII» Нормальное приближение для биномиального распределения Таблица 2 Сравнение биномиального распределения при п=100, /7 = 0,3 и нормального приближения Число успехов Вероятность Нормальное приближение Погреш- ность в процентах 9<Sn< 11 0,000006 0,00003 +400 12< 14 0,00015 0,00033 + 100 15 17 0,00201 0,00283 +40 18 < Sn < 20 0,01430 0,01599 + 12 21<S„<23 0,05907 0,05895 0 24 < Sn < 26 0,14887 0,14447 —3 27<S„«c29 0,23794 0,23405 —2 31 < S„ < 33 0,23013 0,23405 +2 34 < Sre < 36 0,14086 0,14447 +з 37<S„<39 0,05889 0,05895 0 40 < S,, s' 42 0,01702 0,01599 —6 43<S„<45 0,00343 0,00283 —18 46«cS„<48 0,00049 0,00033 —33 49<Sn<51 0,00005 0,00003 —40 г) Пусть п~ 100 и /7=0,3. В табл. 2 приведен типичный пример (для относительно небольших п), показывающий, как изменяется точность нормального приближения при удалении интервала (а, (3) от центрального члена. д) Найдем число а, такое, что для больших п неравенство |S|^>a выполняется с вероятностью, близкой к 1/2. Для этого необходимо, чтобы 91 (а)— 9? (—а) = 1/2, или 91 (а) = 3/4. По таблицам для нормального распределения на- ходим а = 0,6745, и поэтому неравенства |S„—п/?| < 0,6745 Vnpq и |S„ — пр | > 0,6745 npq (4.1) приближенно равновероятны. В частности, вероятность того, что при п бросаниях монеты число выпадений герба лежит в преде- лах (1/2) п ± 0,337 Ки, приближенно равна 1/2, как и вероятность того, что при п бросаниях кости число выпадений одного очка лежит в интервале (1/6) п ± 0,251 п. е) Задача о конкуренции. Этот пример иллюстрирует практичес- кие применения формулы (3.17). Две конкурирующие железнодо- рожные компании имеют на участке между Чикаго и Лос-Анджелесом по одному поезду, которые отправляются и прибывают одновремен- но и оборудованы примерно одинаково. Предположим, что п пас-
§ 4. Примеры 203 сажиров выбирают поезд наугад и независимо друг от друга, так что число пассажиров в каждом поезде есть результат п испытаний Бер- нулли с /?=1/2. Если число мест в поезде s<.n, то с положитель- ной вероятностью в нем окажется больше s пассажиров и всем мест не хватит. Используя приближение (3.17), находим ((2s—«)/!/«)• (4-2) Если s столь велико, что f (s)<0,01, то число мест будет достаточным в 99 случаях из 100. Вообще, компания может установить произволь- ный уровень риска а и определить s из условия /(s)<jx. Для этого достаточно положить s>(l/2)(n4-^/n), (4.3) где/а — корень уравнения а=1—91 (^), который можно найти по таблицам. Например, если п = 1000 и а = 0,01, то ~ 2,33 и до- статочно s —537 мест. Если обе компании примут уровень риска а = 0,01, то два поезда будут иметь в общей сложности 1074 места, из которых 74 будут пустыми. Потери из-за конкуренции (или случайных флуктуаций) поразительно малы. Аналогично 514 мест было бы достаточно в 80% всех случаев и 549 мест—в 999 из 1000 случаев. Подобные соображения применимы и в других работах об обслу- живании с конкуренцией. Например, если т кинотеатров сопер- ничают из-за одних и тех же п зрителей, то для вероятности успеха для каждого кинотеатра следует положить р = 1/т и (4.3) нужно заменить неравенством m~1[n-[-ta]/'n (т— 1)]. Общее число пустых мест при такой системе равно ms—п ж ta Кп (т—1). Для а = 0,01, п— 1000 и т = 2, 3, 4, 5 это число соответственно приближенно равно 74, 105, 126 и 147. Потери из-за конкуренции снова малы. ж) Случайные цифры. В примере гл. 11,3,а) мы рассмотрели /2= 1200 испытаний с р = 0,3024 и частотой успехов 0,3142. Откло- нение частоты от вероятности равно е = 0,0118. Далее, р {I S„/«~Р I > е} = р {I Sn—np\> en) ж да Р {| S„ - пр | > 0,880 Vnpq} да 2 (1 —91 (0,88)) да 0,379. Это означает, что приблизительно в 38 из 100 подобных случаев час- тота успехов отклоняется от р больше, чем в нашем примере. з) Выборка. В некотором обществе часть р людей курит. Число р неизвестно, и для его определения производится выборка с возвра- щением. Желательно найти р с погрешностью, не превосходящей 0,005. Каким должен быть объем выборки п? Обозначим долю курящих в выборке через рг. Ясно, что, каким ни был объем выборки, нельзя быть уверенным, что \рг—рКО,005, ибо может случиться, что выборка будет состоять только из куря- щих. Лучшее, чего можно добитьсял это сделать маловероятным со-
204 Гл, VII. Нормальное приближение для биномиального распределения бытие «величина погрешности больше заданного значения 0,005». С этой целью установим произвольный доверительный уровень а, например а=0,95, и выберем п настолько большим, чтобы вероят- ность события \р'—р|<0,005 была не меньше а. Поскольку np,J можно интерпретировать как число успехов в п испытаниях, имеем Р{|р' —р| <0,005} = Р{| S„—пр | < 0,005п}, (4.4) и мы хотим выбрать п столь большим, чтобы эта вероятность была не меньше а. Сначала по таблицам находим число га, для которого 91 (га)—91 (—га) = а. Затем, используя нормальное приближение, необходимо выбрать п столь большим, что 0,005 или п>40 000р^г2а. Правая часть последнего неравенства содержит неизвестную вероятность р, но при любых обстоятельствах 1/4, и поэтому объем выборки п^ 10 000^ будет достаточным. Для доверительного уровня а = 0,95 находим га = 1,960, и по- этому объем выборки п = 40 000 вполне достаточен. Осуществить выборку такого объема достаточно сложно, но требование | р' — р |< < 0,005 является чрезвычайно сильным. Если бы мы потребовали лишь, что \р' — р| < 0,01, то достаточен был бы объем выборки 10 000 (при том же доверительном уровне). Так называемая четы- рехпроцентная точность означает, что \р' — р|< 0,045, и в этом случае объем выборки равен лишь 475: в среднем только 5 из 100 случайных выборок такого объема дадут оценку с большей погреш- ностью. (На практике обычно трудно бывает получить представи- тельную выборку любого объема.) ► § 5. СВЯЗЬ С ПУАССОНОВСКИМ ПРИБЛИЖЕНИЕМ Ошибка нормального приближения мала, если npq велико. С другой стороны, при больших п и малых р вероятности b(k; п, р) будут близки к пуассоновским вероятностям p(k; X) с X—пр. При малых X можно пользоваться только пуассоновским приближением, но при больших X возможно применение как пуассоновского, так и нормального приближений. Отсюда следует, что при больших зна- чениях %, видимо, можно приближать распределение Пуассона нор- мальным распределением, и в примере гл. X, 1, в) мы увидим, что это действительно так (см. также задачу 9). Здесь мы ограничимся иллюстрацией этого утверждения на одном численном и на одном практическом примере. Примеры, а) Распределение Пуассона с Х,= 100 приписывает множеству целых чисел а, а+1, . . b вероятность Р(а, Ъ)=р(а\ 100) + р (а+1; 100)+ ... +р(Ь\ 100). Это распределение Пуассона можно рассматривать как приближение для биномиального распределения с п=100 000 000 и р^= 10~6. Тог- да пр^ЮО, поэтому естественно аппроксимировать это биномиаль-
$ 5, Связь с пуассоновским приближением 205 ное распределение нормальным хотя бы для значений, близких к центральному члену 100. Но это означает, что вероятность Р(а, Ъ) близка к разности 91 ((&—99,5)/10)—91 ((а—100,5)/10). О степени приближения можно судить по следующей таблице. Т очное значение Нормальное приближение Р (85, 90) 0,11384 0,11049 Р (90, 95) 0,18485 0,17950 Р (95, 105) 0,41763 0,41768 Р (90, ПО) 0,70652 0,70628 Р (НО, 115) 0,10738 0,11049 Р (115, 120) 0,05323 0,05335 б) Задача о телефонных линиях. Следующая задача с некоторыми упрощениями взята из практики х). Телефонная станция А должна соединить 2000 абонентов с соседней станцией В, Было бы слишком дорого и бессмысленно проводить 2000 линий из А в В. Достаточно сделать число линий N настолько большим, чтобы при обычных ус- ловиях только на один из каждых ста вызовов не сразу находилась свободная линия. Предположим, что в течение наиболее напряжен- ного часа дня каждому абоненту требуется связь с В в среднем на 2 минуты. Мы можем сравнить положение в любой фиксированный момент этого часа с группой из 2000 испытаний каждое с вероят- ностью р = 1/30 того, что потребуется линия. При обычных условиях можно считать эти испытания независимыми (хотя это перестает быть верным, когда такие события, как неожиданный ливень или землетрясение, заставляют многих людей вызывать такси или зво- нить в местную газету; тогда эта теория неприменима и линии будут перегружены). Итак, имеем 2000 испытаний Бернулли с р = 1/30, и нужно найти такое наименьшее число N, при котором вероятность более N «успехов» меньше 0,01; в наших обозначениях Р {S2ooo^= >Л/}<0,01. При пуассоновском приближении следует взять %=2000/30^ ^66,67. По таблицам находим, что вероятность не менее 87 успехов приближенно равна 0,0097, а вероятность 86 или более успехов — примерно 0,013. Это означает, что было бы достаточно 87 линий. При использовании нормального приближения сначала найдем ко- 9 Molina Е.С., Probability in engineering, Electrical Engineering, 54 (1935), 423—427;-Bell Telephone System Technical Publications Monograph В-854. В этих работах задача решается используемым нами методом Пуассона, более удобным для инженеров»
206 Гл. VII. Нормальное приближение для биномиального распределения рень х уравнения 1 — 5Л(х)=0, 01, который равен х—2,327. Далее, должно выполняться неравенство (^_ 1/2—пр? >2,327. Поскольку /2=2000 и р^=1/30, отсюда получается Af>67,17+ + (2,327) (8,027)^85,8. Таким образом, при использовании нор- мального приближения вытекало бы, что достаточно 86 линий. Результаты двух решений практически совпадают. Кроме того, из них можно извлечь и другую полезную информацию. Например, может показаться, что число линий будет меньше, если 2000 абонен- тов разбить на две группы по 1000 в каждой и уже для этих двух групп раздельно провести линии между Аи В. Однако, пользуясь описанным выше методом, найдем, что в действительности допол- нительно потребуется 10 линий, так что первоначальный подход пр едпочтител ьней. > § 6*). БОЛЬШИЕ ОТКЛОНЕНИЯ Теорема Муавра — Лапласа описывает асимптотическое поведе- ние вероятности P{zi<S>Cz2} при фиксированных и г2. Из ее до- казательства видно, что теорема применима и в случае, когда ?! и г2 могут меняться вместе с /г, причем, возможно, ^->оо при условии, что рост происходит достаточно медленно. В этом случае обе части (3.17) стремятся к нулю и теорема содержательна только тогда, ког- да отношение обеих частей стремится к единице. Следующая теоре- ма показывает, при каких условиях это верно. Для упрощения фор- мулировки двойное неравенство гх<8^<;г2 заменим неравенством S^><2i. Возможность такой замены обосновывается следующей лем- мой, в которой показано, что пригх-->оо верхний предел ?2не играет никакой роли. Лемма. Если хп->оо, то для любого фиксированного1) т] > 0 P{S*>x„ + t]}/P{S*>x„}->0, (6-1) или {pK<s*<^+t]}~p{s;;>u. (6 2) Иначе говоря, если S* превосходит хп, то скорее всего S* очень близко к хп, и в этом предельном соотношении большие значения S* не играют никакой роли. *) Теорема этого параграфа полезна, но в этом томе она применяется лишь в гл. VII,4 и в гл. VIII,5. х) Из доказательства будет видно, что достаточно условия хпх\—> оо. Более сильный и интересный вариант см. в задаче 18.
$ 7. Задачи 207 Доказательство. Используя обозначение (3.2), для биномиаль- ного распределения имеем р {S* > хп} = 2 arn+v, P{S*> 2 aSn+v, (6.3) v=0 v=0 где rn и sn— целые числа, которые отличаются соответственно от хп |/ npq и (%п + ц)И npq не более чем на единицу. Далее, из (3.4) очевидно, что для больших п ak+ilak < 1 —Ptk < 1 —Уп < e~kln> (6Л) и поэтому aSn+vlarn+v < Гп) Гп1п < <?~(1/2) ^Хп Dq- (6-5) По предположению хп—>оо, и, следовательно, члены второго ряда в (6.3) становятся пренебрежимо малыми по сравнению с соответ- ствующими членами первого ряда. ► Теперь мы готовы обобщить предельную теорему следующим образом. Теорема. Если хп—> со так, что х^/У п—>0, то p{s;?>u~i-9i(%j. (6.6) В силу (1.7) асимптотическое соотношение (6.6) полностью эквива- лентно следующему: Р {S‘ > хп\ ~ (1 /]/"2л) (1/х„) (6.7) Доказательство. В силу предыдущей леммы и теоремы 1 § 3 имеем p{s,;>x„}~ 2 hn(kh), (6.8) где rn — целое число, такое, что | rnh—хп | </i. Следовательно, сумма в правой части (6.8) лежит между 1—91 (хп— 2/1) и 1—97 (xn + 2h). Используя (1.7), для разности этих двух величин получаем 97 (хп + 2/0—97 (х^-2/i) < 4/ш (хп — 2h) -> 0, (6.9) так что сумма в (6.8) ~ \—97 (х„), что и утверждалось. & Дальнейшие обобщения см. в задачах 14 и 16. § 7. ЗАДАЧИ 1. Обобщая (1.7), доказать, что 1-31 (х)~ /1—L+H_i±5+_.,.+ У 2л {х х6 х^ х1 (7.1)
208 Гл. VII. Нормальное приближение для биномиального распределения и что при х > 0 правая часть превосходит 1—9? (х), если k четно, и оказы- вается меньше 1—9? (х), если k нечетно. 2. Доказать, что для произвольной постоянной а > 0 при х—> оо спра- ведливо соотношение (1-ЭТ (х + б7/х))/(1-ЭД (х)) —>£-*. (7.2) 3. Найти вероятность того, что среди 10 000 случайных цифр цифра 7 появится не более 968 раз. 4. Найти приближенное значение вероятности того, что число выпадений единицы при 12 000 бросаний кости лежит между 1900 и 2150. 5. Найти число /?, при котором с вероятностью 0,5 число выпадений герба при 1000 бросаниях монеты будет лежать между 490 и k. 6. Для определения доли женщин f в некотором обществе производится вы- борка. Определить объем выборки, при котором с вероятностью, не меньшей 0,99, погрешность составит менее 0,005. 7. При 10 000 бросаниях монеты герб появлялся 5400 раз. Есть ли осно- вания считать, что монета несимметрична? 8. Найти приближение для максимальной вероятности следующего три- номиального распределения: 9. Нормальное приближение для распределения Пуассона. Используя формулу Стирлинга, показать, что для фиксированных а < Р при К—> оо _ 2 _ Р (k> Ь) — эг (0) (а)« (7-3) K + aV К< k< К К 10. Нормальное приближение для гипергеометрического распределения. Пусть п, т, k — положительные целые числа, которые стремятся к бесконечности так, что г J п т 1 ri. л „ лх —i------>/, —j------->р, —:------->q> h[k — rp} —>х, (7.4) n+m n-\-m n-{-m 1 4 где h= l/]/r(n4-m) pqt (1 — t). Доказать, что <7'5> Указание. Лучше использовать нормальное приближение для биномиаль- ного распределения, а не формулу Стирлинга. 11. Нормальное распределение и серии в комбинаторных задачах1). Форму- ла (11.19) гл. II дает вероятность иметь ровно k серий альф при размещении п альф и т бет. Эта вероятность равна (п—1\ /m+п k Д п ) ’ (76) Пусть п—>00, т—>оо так, что соотношения (7.4) выполнены. При фикси- рованных а < р вероятность того, что число серий альф лежит между nq + aq V рп и nq-\-fiq У рп, стремится к 9? (₽)—9? (а)- х) Wald A., Wolfowitz J., On a test whether two samples are from the same po- pulation, Ann. Math. Statist., 11(1940), 147—162. Более общие результаты см. в статье Mood А. М. The distribution theory of runs, там же, 367—392,
$ 7. Задачи 209 12. Новый вывод закона больших чисел. Вывести закон больших чисел, рассмотренный в § 4 гл. VI, из предельной теоремы Муавра — Лапласа. Предельные теоремы для вероятностей больших отклонений 13. Используя обозначения § 3, показать, что если k изменяется вместе е п так, что > 0, то ak=b(k-{-m\ п, р) ~ hft (kh) e~(p~q} k3hi/Q t h—1/У npq. (7.7) Это обобщение теоремы 1 § 3. 14. Используя результат предыдущей задачи и лемму из § 6, доказать, что верна следующая теорема. Теорема. Если хп изменяется вместе с п так, что Хп/п —> 0, но хп —> оо, то Р {S* > х„} ~ [1-9? (x„)J e~{P~q} х%Упр1>, (7.8) 15. Обобщение задачи 13. Положим f (X) = У hv~2xV = x*h x*h* + ’ •' ’ (7-9) v=3 где h=l/y npq. Если k изменяется вместе с п так, что k/п—> 0, то ak~htl (kh)-e-fW». (7.10) {Если ffi/ri2, —>- 0, то этот результат сводится к теореме 3 § 1; если k^/rft —► 0, то получаем (7.7); если Z?5/^4—>0, то получается (7.7) с добавлением в пока- затель члена четвертого порядка, и т. д.] 16. Обобщение задачи 14. Если хп изменяется вместе с п так, что хп—* оо, но Хп/У п —► о, ™ Р {S* > хп} - [1 — SR (x„)] e~f^\ (7.11) Если Хп/п—>0, то этот результат сводится к (7.8). При можно заме- нить f (х„/2) многочленом четвертой степени из правой части (7.9) и т. д. 17. Если р > q, то Р {S„ > х} > Р {Sj <—х} для всех больших х. Ука- зание. Использовать результат задачи 15. 18. Показать, что при хп—> оо и хп/У~п—►() справедливо соотношение Р{хп <$п < хп + а/хп} ~ (1— е~а) P{S* > xj, (7.12) Словесно это выражается так: условная вероятность события {S*2 хп-\-а]хп} при условии, что Sn > хп, стремится к е~а. (Более слабый вариант этой тео- ремы был доказан А. Я. Хинчиным1).) х) Khintchin A. Uber emen Grenzwertsatz der Wahrscbeinlichkeitsrechnung, Math. Annalen, 10(1929), 745—752,— Прим, перев,
ГЛАВА VIII *) НЕОГРАНИЧЕННЫЕ ПОСЛЕДОВАТЕЛЬНОСТИ ИСПЫТАНИЙ БЕРНУЛЛИ В этой главе обсуждаются некоторые свойства случайности и важный закон повторного логарифма для испытаний Бернулли. Различные аспекты теории случайных флуктуаций, связанных о испытаниями Бернулли (по крайней мере для р —1/2), рассмотрены в гл. III. § 1. БЕСКОНЕЧНЫЕ ПОСЛЕДОВАТЕЛЬНОСТИ ИСПЫТАНИЙ В предыдущей главе мы имели дело с вероятностями, связанны- ми с п испытаниями Бернулли, и изучали их асимптотическое пове- дение при п->оо. Обратимся теперь к более общему типу задач, в которых события не могут быть определены в конечном пространстве элементарных событий. Пример. Задача о сериях. Пусть аир — положительные целые числа. Рассмотрим какую-нибудь, вообще говоря, неограниченную последовательность испытаний Бернулли, например последова- тельность бросаний монеты или кости. Предположим, что Павел поспорил с Петром о том, что серия из а последовательных успехов появится раньше, чем серия из р последовательных неудач. Интуи- тивно ясно, что означает событие «Павел выиграл», но нужно пом- нить, что в математической теории событие — это «множество эле- ментарных событий» и оно не имеет смысла, пока не определено со- ответствующее пространство элементарных событий. Модель с ко- нечным числом испытаний для наших целей недостаточна, но эта трудность преодолевается простым переходом к пределу. После п испытаний Петр либо выиграл, либо проиграл, либо игра осталась незаконченной. Пусть соответствующие вероятности будут хп% Уп> ?п (*п+Уп+гп = 1). При увеличении числа испытаний п вероят- ность ничейного результата zn может только убывать, а хп й ynt очевидно, возрастают. Следовательно, существуют пределы х=* = limxn,r/=limz/n иг=Пшгп. Никто не[усомнится в том, что эти пре- делы можно назвать вероятностями того, что в конце концов Петр или выиграет, или проиграет, или игра закончится вничью. Однако *) Эта глава непосредственно не связана с материалом последующих глав и может быть опущена при первом чтении*
£ 1. Бесконечные последовательности испытаний 211 Соответствующие три события определены лишь в пространстве эле- ментарных событий, построенном по бесконечным последовательнос- тям испытаний, и это пространство не является дискретным. Этот пример был приведен только в качестве иллюстрации. Численные вначения хп, уп, zn нас пока не интересуют. Мы вернемся к их вычислению в примере гл. XIII,8,б). Пределы х, у, z можно найти более простым мето- дом, который применим и в более общих случаях. Этот метод мы изложим Здесь из-за его важности и того интереса, который он представляет сам по себе. Пусть А—событие, состоящее в том, что серия из а последовательных успехов появится раньше, чем серия из [3 последовательных неудач. Событие А означает выигрыш Павла и х = Р (Л). Если и и v — условные вероятности собы- тия А при условии, что первое испытание закончилось соответственно успехом или неудачей, то x = pu-{-qv [см. формулу (1.8) гл. V]. Сначала предположим, что первое испытание закончилось успехом. В этом случае событие А может произойти в результате а взаимно исключающихся исходов: 1) следующие а—1 испытаний закончатся успехами; вероятность этого равна ра-1. 2) Пер- вая неудача произойдет в v-м испытании, где 2^v^a. Обозначим это собы- тие через Ну. Тогда Р (Ну} = pv~'2q и Р {Л | Hv} = v. Следовательно (еще раз используя формулу полной вероятности), получаем и = pa-i-\-qv (1 р . + рос-2) = ра-1_|_у (1 —ра-1), (1Д) Если первое испытание закончилось неудачей, то аналогичные рассужде- ния приводят к выражению v — pu (1 +</+ ... + 7,в~2) = « (1 —0-2) Итак, для неизвестных величин и и v имеем два уравнения и для x = pu-\-qv находим х = (l_^)/(pa-i + ^-i__pa-i^-i)t (13) Чтобы получить у, нужно лишь поменять местами р и q, а и р. Итак, y = q$~i (1— ра)/(ра-1 + ^-1—ра-1^1), (1.4) Поскольку х^-у=\, имеем z=0; вероятность ничьей равна нулю. Например, при бросании монеты (р=1/2) вероятность того, что серия из двух гербов появится раньше, чем серия из трех решеток, равна 0,7; два последо- вательных герба появляются раньше четырех последовательных решеток с ве- роятностью 5/6, три последовательных герба появляются раньше четырех последо- вательных решеток с вероятностью 15/22. При бросании кости вероятность того, что два последовательных выпадения единицы произойдут раньше, чем пять по- следовательных ее невыпадений, равна 0,1753, и т. д. В этом томе мы ограничиваемся теорией дискретных пространств элементарных событий, что значительно уменьшает изящество мате- матических рассуждений. В общей теории п испытаний Бернулли рассматриваются лишь как начало бесконечной последовательности испытаний. В этом случае элементарным событием является беско- нечная последовательность букв У и Я и пространство элементарных Событий состоит из всех таких последовательностей. Конечная после- довательность, например УУНУ, означает совокупность всех эле- ментарных событий с таким началом, т. е. составное событие, сос- тоящее в том, что в бесконечной последовательности испытаний пер- вые четыре исхода соответственно дадут У, У, Я, У. В бесконечных пространствах элементарных событий рассмотренную выше игру
212 Гл. VI11. Неограниченные последовательности испытаний Бернулли можно интерпретировать без предельных переходов. Возьмем про- извольное элементарное событие, т. е. любую последовательность вида УУНУНН.... В ней может быть серия из а последовательных успехов У, а может и не быть такой серии. Если такая серия есть, то она может произойти до серии из [3 последовательных неудач или не произойти до нее. Таким образом, мы разбиваем все элементарные события на три класса, представляющие собой события «Петр вы- играл», «Петр проиграл», «нет никакого результата». Их вероятнос- тями являются числа х, у, z, полученные выше. Единственным зат- руднением является то, что это пространство элементарных событий недискретно, а мы еще не определяли вероятности для общих прост- ранств элементарных событий. Заметим, что мы обсуждаем сейчас скорее вопросы терминологии, чем действительные трудности. В нашем примере надлежащее опре- деление или интерпретация числа х не вызывает вопросов. Трудность состоит лишь в том, что, желая быть последовательным, мы должны решить, говорить ли о х как о «пределе вероятностей хп того, что Петр победил после п испытаний», или говорить о событии «Петр победил», которое соответствует недискретному пространству эле- ментарных событий. Мы предлагаем поступать обоими способами. Для упрощения терминологии будем говорить о событиях даже тогда, когда они определены в бесконечных пространствах элемен- тарных событий. Однако для точности теоремы будут формулиро- ваться в терминах конечных пространств элементарных событий и предельных переходов. События, которые изучаются в этой главе, как и предыдущий пример, обладают следующей особенностью. Событие «Петр победил» хотя и определено в бесконечном пространстве, является объедине- нием событий «Петр победил после п испытаний (п=1, 2,...)», каж- дое из которых зависит только от конечного числа испытаний. Ис- комая вероятность х есть предел монотонной последовательности вероятностей хп, которые зависят только от конечного числа испы- таний. Нам не требуется теория, идущая дальше модели п испыта- ний Бернулли, мы лишь берем на себя смелость упрощать неуклю- жие выражения1), называя некоторые числа вероятностями, а не пользуясь термином «пределы вероятностей». § 2. СИСТЕМЫ ИГРЫ Печальный опыт многих игроков учит нас, что никакая система игры не увеличивает шансы игрока на выигрыш. Если теория ве- г) Для читателя, знакомого с общей теорией меры, ситуацию можно описать следующим образом. Мы рассматриваем только те события, которые либо зависят от конечного числа испытаний, либо являются пределами монотонных последова- тельностей таких событий. Мы вычисляем эти простые пределы вероятностей, и для этого нам, очевидно, не нужна теория меры. Но только общая теория меры показывает, что наши пределы не зависят от способа перехода к пределу и яв- ляются вполне аддитивными функциями множеств*
§2. Системы игры 213 роятностей правильно отображает жизнь, то этому опыту должно соответствовать некое доказуемое утверждение. Для определенности рассмотрим, вообще говоря, неограничен- ную последовательность испытаний Бернулли и предположим, что перед каждым испытанием игрок может выбрать, участвует ли он в игре или нет. «Система» представляет собой фиксированные правила, согласно которым выбираются те испытания, при которых игрок делает ставку. Например, игрок может включаться в игру при каж- дом седьмом испытании или после каждого вступления в игру ждать, пока 7 раз не появится герб. Он может вступать в игру толь- ко после появления серии из 13 гербов или первый раз включиться в игру после появления первого герба, второй раз — после первой серии из двух последовательных гербов и вообще k-н раз — сразу после появления k последовательных гербов. В последнем случае он будет делать ставки все реже и реже. Нам не нужно рассматри- вать размеры ставок в отдельных испытаниях, мы хотим показать, Что не существует «системы», изменяющей положение игрока, и что результат будет тот же, как если бы он постоянно участвовал в игре. Подразумевается, что это утверждение можно доказать лишь для систем в обычном смысле, когда игрок не знает результата следую- щего испытания (вопрос о том, существует или нет предвидение, нас не интересует). Необходимо также признать, что правило «уходи домой после трех проигрышей» меняет положение, но мы исключим Такие неинтересные системы. Определим систему как множество ° фиксированных правил, ко- торые для каждого испытания однозначно определяют, вступать в игру или нет. Перед k-м испытанием это решение может зависеть от исхода первых k—1 испытаний, но не зависит от исхода k-го, (&+1)-го, (k+ty-го, ... испытаний. Наконец, правила должны обес- печивать бесконечное продолжение игры. Поскольку множество пра- вил фиксировано, событие «в п испытаниях игрок делал ставки более чем г раз» корректно определено и можно найти его вероятность. Из последнего предположения в определении системы вытекает, что для любого г эта вероятность стремится к 1 при /г->оо. Сформулируем теперь нашу основную теорему о том, что при любой системе последовательные испытания, когда игрок делает став- ку, образуют последовательность испытаний Бернулли с неизменной вероятностью успеха. При соответствующем изменении формули- ровки эта теорема справедлива для всех видов независимых испыта- ний. Последовательность испытаний, когда игрок делает ставку, яв- ляется точной копией первоначальных испытаний, так что никакая система не может повлиять на удачу игрока. Важность это- го утверждения впервые осознал Мизес, который ввел в качестве основной аксиомы невозможность успешной системы игры. Приве- денная здесь формулировка и доказательство принадлежат Дубу х). Для простоты предположим, что р=1/2. х) Doob J. L., Note on probability, Annals of Mathematics, 37 (1936), 363—367,
214 Гл. VIII. Н еограниченные последовательности испытаний Бернулли Пусть Ah — событие «первое вступление в игру происходит при /?-м испытании». Из определения системы вытекает, что при /г->оо вероятность того, что первая ставка была сделана до /г-го испыта* ния, стремится к 1. Это означает, что' Р{Л}+Р{Д2}+ ... + Р{Лп}->1, или 2РМь} = 1. (2.1) Далее, пусть Вк — событие «при &-м испытании выпал герб» и В — событие «при первом вступлении в игру выпал герб». Тогда собы- тие В есть объединение взаимно исключающих друг друга событий А2В2, А3В3) .... Далее, Ak зависит только от исхода первых k—1 испытаний, a Bk зависит только от k-ro испытания. Следова- тельно, Ak и Bk независимы и Р {AkBA = Р {ЛЗ Р {ВЗ = (1/2) PMJ. Итак, Р {В} = 2 Р {ДА} = (1/2) 2 Р {А?} = (1/2)- Отсюда вытекает, что при нашей системе вероятность выпадения герба при первом вступлении в игру равна 1/2 и то же самое верно и для каждого из последующих вступлений в игру. Остается показать, что моменты вступления в игру стохастически независимы. Это означает, что вероятность выпадения герба как при первом, так и при втором вступлении в игру должна равняться 1/4 (и аналогично для всех других комбинаций, а также для после- дующих вступлений в игру). Для .проверки этого утверждения обозначим через A*k событие, состоящее в том, что второе вступле- ние в игру произошло на k-м испытании. Пусть Е—событие «при первых двух вступлениях в игру выпадали гербы»; оно является объединением всех событий AjBjA*kBk, где /<& (если j^k, то Aj и Ак несовместны и Л;-Л^ = 0). Следовательно, Р{£} = 2 2 Р{А}-В^Вк}. (2.2) /=1k=j+1 Как и ранее, видим, что при фиксированных / и k > / события Bh (герб в А-м испытании) и AjBjAk (которое зависит только от резуль- татов первых k—1 испытаний) независимы. Поэтому Р{£}= (1/2)2 2 Р{ядлу = /=1/г=/+1 J J = (i/2) 2рМА-} 2 P{4UW (2-3) /=1 k=j+l (см. формулу (1.8) гл. V). Далее, когда бы ни произошло первое вступление в игру и каков бы ни был его исход, игра, безусловно, продолжается, т. е. рано или поздно произойдет второе вступление в игру. Это означает, что при заданном событии AjBj, таком, что Р{Л7ВД>0, условные вероятности вступления в игру на k-м иб пытании в сумме должны давать единицу. Следовательно, суммй
fi3. Леммы Борем—Кантелли 215 второго ряда в (2.3) равна единице. Раньше мы видели, что £Р{Л jB7-}=l/2. Итак, Р {£}—1/4, что и утверждалось. Аналогич- ные рассуждения применимы для любых комбинаций испытаний. Заметим, что положение будет другим, если игроку разрешено изменять размер ставки. В этом случае существуют выигрышные стратегии и результат игры зависит от выбора стратегии. Мы вер- немся к этому вопросу в гл. XIV, 2. § 3. ЛЕММЫ БОРЕЛЯ — КАНТЕЛЛИ Две простые леммы о бесконечных последовательностях испыта- ний используются столь часто, что заслуживают особого внима- ния. Мы сформулируем их для испытаний Бернулли, но они при- менимы и в более общем случае. Снова рассмотрим бесконечную последовательность испытаний Бернулли. Пусть Af, А2,...— бесконечная последовательность со- бытий, каждое из которых зависит лишь от конечного числа испыта- ний, иначе говоря, мы предполагаем, что существует целое число nk, такое, что Ak является событием из пространства первых nh испытаний Бернулли. Положим (3.1) (Например, Ak может быть событием, состоящим в том, что 2&-е испытание завершает серию из по крайней мере k последовательных успехов. Тогда nh=2k и ah^= pk.) Для каждой бесконечной последовательности букв У и Н можно установить, осуществилось ли 0, 1,2,... или бесконечно много собы- тий {Aft}. Это означает, что имеет смысл говорить о событии (7Г, состоящем в том, что в бесконечной последовательности испытаний осуществилось более г событий {Ak}, а также о событии t/ro, сос- тоящем в том, что произошло бесконечно много событий из совокуп- ности {Afe}. Событие Ur определено только в бесконечном прост- ранстве элементарных событий, и его вероятность есть предел ве- роятности Р{иПчГ} того, что в результате п испытаний среди собы- тий {Afe} произошло более г событий. Наконец, Р s=lim Р этот предел существует, так как Р {Ur} убывает при возрастании г. Лемма Х^Если ряд 2^ сходится, то с вероятностью единица произойдет только конечное число событий Ак. Точнее, утверждается, что P{t/r}<8 для достаточно больших г, или: для любого 8>0 существует целое число г, такое, что вероятность осуществления при п испытаниях одного или более событий Ar+i, Аг+§, ... меньше & для всех п. Доказательство. Выберем г так, что аг+1 + аг+2+ • • • Cs; в силу сходимости ряда 2^ это возможно. Не ограничивая общности,
216 Гл. У11Г Неограниченные последовательности испытаний Бернулли можем предполагать, что Ак упорядочены таким образом, что . Пусть N—наибольший индекс, при котором Тогда Лп .. , AN определены в пространстве п испытаний, и лемма утверждает, что вероятность осуществления одного или нескольких событий Лг+1, Лг+2, ... AN меньше 8. Это верно, так как, согласно основному неравенству (7.6) гл. I, имеем Р Мг+1 U Ar+2 U ... U Ду} аг+1 + аг+2 + ... + #v^8, (3-2) что и утверждалось. ► Удовлетворительное обращение этой леммы известно только в частном случае взаимно независимых Ак. Такое положение возни- кает, когда испытания разбиты на неперекрывающиеся группы и Ак зависит только от испытаний £-й группы (например, Ак может быть событием, состоящим в том, что в £-й тысяче испытаний про- изошло более 600 успехов). Лемма 2. Если события Ак взаимно независимы и ряд ^ак рас- ходится, то с вероятностью единица осуществится бесконечно много событий Ак. Иначе говоря, для любого г вероятность того, что в п испытаниях произойдет более чем г событий Ак, стремится к 1 при /г->оо. Доказат