Текст
                    А.Н.Колмогоров
ОСНОВНЫЕ НОНЯТНЯ ТЕОРИИ ВЕРОЯТНОСТЕЙ
Книга, изданная в 1933 г. на немецком языке и в 1936 г. на русском, несколько
раз переиздавалась в английском переводе. Хотя значительная часть со
содержания включена в учебники, она сохраняет интерес для лиц, занимающихся
обстоятельно теорией вероятностей. Основной текст переиздается лишь с
небольшой редакционной правкой.
СОДЕРЖАНИЕ
Нредисловие к первому изданию	5
Нредисловие ко второму изданию	7
I.	Элементарная теория вероятностей
§1.	Аксиомы	10
§ 2.	Отношение к данным опыта	12
§ 3.	Терминологические замечания	14
§ 4.	Непосредственные следствия из аксиом, условные вероятности, теорема 15
Байеса
§ 5.	Независимость	17
§ 6.	Условные вероятности как случайные величины; цепи Маркова	23
II.	Бесконечные поля вероятностей
§ 1.	Аксиома непрерывности	26
§ 2.	Борелевские поля вероятностей	29
§ 3.	Примеры бесконечных полей вероятностей	31
Ш. Случайные величины
§ 1.	Вероятностные функции	36
§ 2.	Определение случайных величин, функции распределения	38
§ 3.	Многомерные функции распределения	41
§ 4.	Вероятности в бесконечномерных пространствах	44
§ 5.	Эквивалентные случайные величины, разные виды сходимости	52
IV.	Математические ожидания
§ 1.	Абстрактные интегралы Лебега	57
§ 2.	Абсолютные и условные математические ожидания	60
§ 3.	Неравенство Чебышева	63
§ 4.	Некоторые признаки сходимости	65
§ 5.	Дифференцирование и интегрирование математических ожиданий по 66
параметру
V.	Условные вероятности и математические ожидания
§ 1.	Условные вероятности	70
§ 2.	Объяснение одного парадокса Боре ля	75
§ 3.	Условные вероятности относительно случайной величины	76
§ 4.	Условные математические ожидания	78
VI.	Независимость. Закон больших чисел
§ 1.	Независимость	83
§ 2.	Независимые случайные величины	85
§ 3.	Закон больших чисел	88
§ 4.	Замечания к понятию математического ожидания	100
§ 5.	Усиленный закон больших чисел, сходимость рядов	104
Дополнение. Одна замечательная теорема теории вероятностей	116
Литература	418

ПРЕДИСЛОВИЕ К ПЕРВОМУ ИЗДАНИЮ Целью предлагаемой работы является аксиоматиче- ское обоснование теории вероятностей. Ведущей мыслью автора было при этом естественное включение основ теории вероятностей, считавшихся еще недавно совер- шенно своеобразными, в ряд общих понятий современ- ной математики. До возникновения лебеговой теории меры и интеграла эта задача была почти безнадежна. После исследований Лебега стала ясной аналогия между мерой множества и вероятностью события, а также между интегралом от функции и математическим ожиданием случайной величины. Эта аналогия допу- скает и дальнейшее продолжение: так, например, мно- гие свойства независимых случайных величин вполне аналогичны соответствующим свойствам ортогональных функций. Для того чтобы, исходя из этой аналогии, обосновать теорию вероятностей, следовало еще осво- бодить теорию меры и теорию интегрирования от гео- метрических элементов, которые еще имелись у Лебега. Это освобождение было осуществлено Фреше. Попытки построения основ теории вероятностей, исходящие из этой общей точки зрения, уже имеются, и весь круг идей, излагаемых здесь, уже успел приобре- сти известную популярность в узком кругу специали- стов; однако отсутствовало полное и свободное от излишних усложнений изложение всей системы (под- готовляется, впрочем, к печати книга Фреше, см. Frechet [2]). Я хотел бы еще указать здесь на те места в дальней- шем изложении, которые выходят за пределы упомя- нутого выше круга идей, уже достаточно знакомого
6 ПРЕДИСЛОВИЕ К ПЕРВОМУ ИЗДАНИЮ в общих чертах специалистам. Эти места следующие: распределения вероятностей в бесконечномерных про- странствах (глава третья, § 4), дифференцирование и интегрирование математических ожиданий по парамет- ру (глава четвертая, § 5) и особенно теория условных вероятностей и математических ожиданий (глава пятая). Следует при этом отметить, что все эти новые понятия и проблемы с необходимостью возникают при рассмот- рении вполне конкретных физических задач 1). Шестая глава содержит обзор отдельных результа- тов А. Я. Хинчипа и автора, касающихся условий при- менимости простого и усиленного закона больших чи- сел. В списке литературы приведены некоторые но- вые работы, представляющие интерес с точки зрения вопросов обоснования теории вероятностей. Приношу свою сердечную благодарность А. Я. Хин- чину, внимательно прочитавшему всю рукопись п предложившему целый ряд улучшений. Клязьма близ Москвы, А. Колмогоров 1 мая 1933 г. *) Ср., например, цитированную в сноске х) к стр. 69 работу М. А. Леонтовича и автора, а также М. Leonlowitsch, Zur Statistik der kontinuierlichen Systeme und des zeitlichen Ver- sailles der physikalischen Vorgange, Physik Zcitsclir. d. Soviet- union, t. 3, 1933, стр. 35—63.
ПРЕДИСЛОВИЕ КО ВТОРОМУ ИЗДАНИЮ С первого немецкого издания этой книжки прошло сорок лет. Было решено, тем не менее, не подвергать ее существенной переработке. А. Н. Ширяевым и мною внесены небольшие усовершенствования изложения. Модернизированы некоторые обозначения. Для неко- торых теорем § 3 — 5 главы VI даны доказательства, отредактированные А. Н. Ширяевым по моим работам 1925—1930 годов. В современных учебниках эти тео- ремы обычно доказываются с помощью аппарата ха- рактеристических функций. Мои первоначальные до- казательства прямыми, элементарными средствами, мо- жет быть, сохраняют некоторый интерес. Намеченные в § 2 первой главы взгляды на пути обос- нования применимости аксиоматической теории вероят- ностей к реальным задачам были развиты мною под- робно в [1]. Но и здесь оставались невыясненными при- чины того, почему мы так часто встречаемся на практике с устойчивостью частот. Новый подход к этому вопросу был мною намечен в [2] и [3] (см. также [4]): [1] Монография «Математика, ее содержание, ме- тоды и значение», изд. АН СССР 1956, глава XI. [2] А. Н. К о л м о г о р о в, Три подхода к опре- делению понятия «количество информации», Проблемы передачи информации, т. I, вып. 1 (1965). [3| А. Н. Ко лмогоров, К логическим осно- вам теории информации и теории вероятностей, Пробле- мы передачи информации, т. V, вып. 3 (1969). [4] А. К. 3 в о н к и и и Л. А. Л е в и п, Сложность конечных объектов и обоснование теории информации
8 ПРЕДИСЛОВИЕ КО ВТОРОМУ ИЗДАНИЮ и случайности с помощью теории алгоритмов, Успехи математических паук, том 25, вып. 6 (1970). Отмечу специально те вопросы, по которым чита- телю следует особенно настоятельно рекомендовать сопоставление изложения, данного в этой книжке, с более современным. 1. В § 1 главы V дано определение условной веро- ятности Р (А | £), где £ — случайный элемент некото- рого множества X, т. е. отображение Q в X. С этим отображением можно связать алгебру ci $ всех принадлежащих полных прообразов подмножеств множества X. Теперь предпочитают сначала опреде- лять условные вероятности по отношению к любой 0-под- алгебре jT' cz £ и затем считать, что Р(Л||) = Р(Л|^). 2. Результаты § 4 главы III широко употребляются, по не дают непосредственно приемлемых распределений в имеющих реальный интерес функциональных про- странствах (см. об этом на стр. 4б). 17 декабря 1973 г. А. Колмогоров
I. ЭЛЕМЕНТАРНАЯ ТЕОРИЯ ВЕРОЯТНОСТЕЙ Мы называем элементарной теорией вероятностей ту часть теории вероятностей, в которой приходится иметь дело с вероятностями лишь конечного числа со- бытий. Теоремы, которые здесь выводятся, естественно применяются также и к вопросам, связанным с беско- нечным числом случайных событий, однако при изуче- нии этих последних применяются также сущестенно новые принципы. Поэтому единственная аксиома мате- матической теории вероятностей, относящаяся именно к случаю бесконечного числа случайных событий, вво- дится лишь в начале второй главы (аксиома V). Теория вероятностей как математическая дисципли- на может и должна быть аксиоматизирована совершен- но в том же смысле, как геометрия или алгебра. Это оз- начает, что, после того как даны названия изучаемым объектам и их основным отношениям, а также аксиомы, которым эти отношения должны подчиняться, все даль- нейшее изложение должно основываться исключитель- но лишь на этих аксиомах, не опираясь на обычное конкретное значение этих объектов и их отношений. Соответственно этому в § 1 определяется понятие поля вероятностей как системы множеств, удовлетво- ряющей определенным условиям. Что представляют со- бой элементы этих множеств, совершенно безразлично для чисто математического развития теории вероятно- стей (ср. введение основных геометрических понятий в «Основах геометрии» Гильберта или определение групп, колец и тел в абстрактной алгебре). Всякая аксиоматическая (абстрактная) теория до- пускает, как известно, бесконечное число конкретных
to I. ЭЛЕМЕНТАРНАЯ ТЕОРИЯ ВЕРОЯТНОСТЕЙ интерпретаций. Таким образом и математическая тео- рия вероятностей допускает наряду с теми интерпре- тациями, из которых она возникла, также много дру- гих. Так, мы приходим к приложениям математической теории вероятностей к таким областям науки, которые не имеют отношения к понятиям случая и вероятности в собственном смысле этого слова. Аксиоматизация теория вероятностей может быть проведена различными способами как в отношении выбора аксиом, так и выбора основных понятий и основных соотношений. Если преследовать цель воз- можной простоты как самой системы аксиом, так и построения из пее дальнейшей теории, то представляет- ся наиболее целесообразным аксиоматизирование поня- тий случайного события и его вероятности. Существуют также другие системы аксиоматического построения теории вероятностей, а именно такие, в которых поня- тие вероятности не относится к числу основных поня- тий, а само выражается через другие понятия г). При этом стремятся, однако, к другой цели, а именно, по возможности к наиболее тесному смыканию матема- тической теории с эмпирическим возникновением поня- тия вероятности. § 1. Аксиомы* 2) Пусть Q — множество элементов ю, которые мы будем называть элементарными событиями, a jT — мно- жество подмножеств из Й. Элементы множества & будем называть случайными событиями (или просто — собы- тиями), a Q — пространством элементарных событий. I. является алгеброй множеств3). *) Ср., например, R. von М i s е s [1] и [2] и С. Н. Бернш- тейн [1]. 2) Читатель, желающий сразу же придать конкретный смысл нижеследующим аксиомам, должен начать читать § 2. 3) Система & подмножеств множества Q называется алгеб- рой, если £2 (= &, соединение, пересечение и разность двух мно- жеств системы опять принадлежат этой системе. Мы обозначаем пересечение множеств А и В через А В или АВ, их соединение
§ 1. АКСИОМЫ 11 П. Каждому множеству А из К поставлено в соот- ветствие неотрицательное действительное число Р (Л). Это число называется вероятностью события А. III. Р (й) = 1. IV. Если А и В не пересекаются, то Р (Л 0 В) = Р (Л) 0 Р (5). Совокупность объектов (Й, $, Р), удовлетворяющую аксиомам I—IV, будем называть полем вероятно- стей. Наша система аксиом I—IV непротиворечива. Это показывает следующий пример: Q состоит из единствен- ного элемента со, f — из Q и пустого множества 0, мри этом положено Р (й) = 1, Р(0) = 0. Наша система аксиом, однако, не является полной; в разных вопросах теории вероятностей рассматривают- ся различные поля вероятностей. Простейшие поля вероятностей строятся следующим образом. Берутся произвольное конечное множество Q = {&>!, ..., и произвольное множество {р15 ...,Рь} неотрицательных чисел с суммою р1 0. . . 4- ph = 1. За f принимается совокупность всех подмножеств Л из Q и для Л = {со,,, . . ., <ai?J полагается Р (Л) = ри 0 ... • • • 0Z0- В этом случае говорят, что ph суть вероятности элементарных событий «ц, . . ., <ок или просто элементарные вероятности. Так получаются все возможные конечные поля вероятностей, в которых 0 состоит из совокупности всех подмножеств из Й (при этом поле вероятностей называют конечным, если мно- жество Q конечно). По поводу дальнейших примеров см. гл. II, § 3. — через AU-®, разность— через А \ В. Дополнительное множе- ство Q \ А к множеству А обозначаем А. Через 0 обозначается пустое множество. Если множества А и В не пересекаются (АВ — 0), то их соединение A U В будет обозначаться также через А Д- В и называться суммой. Множества из ЦЛ будем в дальней- шем обозначать большими латинскими буквами. Ср. А. Н. Колмогоров, С. В. Фомин, Элементы теории функций и функционального анализа, Изд-во «Наука», М., 1968.
12 I. ЭЛЕМЕНТАРНАЯ ТЕОРИЯ ВЕРОЯТНОСТЕЙ § 2. Отношение к данным опыта г) Применение теории вероятностей к действительному миру опыта происходит по следующей схеме. 1. Предполагают данным некоторый комплекс S ус- ловий, допускающий неограниченное число повторений. 2. Изучают определенный круг событий, которые могут наступать в результате осуществления условий®. В отдельных случаях эти события могут наступать или не наступать в разных комбинациях. В множество (5 включаются все возможные варианты появлений или непоявлений рассматриваемых событий. 3. Если после реализации условий S осуществив- шийся на практике вариант окажется принадлежащим к (определенному какими-либо условиями) множест- ву А, то говорят, что наступило событие А. Пример. Комплекс условий ® заключается в том, что бросают два раза монету. Круг событий, о котором шла речь в п. 2, состоит в том, что при каждом бросании могут появиться решетка или герб. Отсюда следует, что всего возможно четыре различных варианта (элемен- тарных события), именно: решетка — решетка, решет- ка — герб, герб — решетка, герб — герб. В качестве события А рассматривается «повторение». Это событие состоит из суммы первого и четвертого элементарных событий. Таким образом, можно каждое событие рас- сматривать как множество элементарных событий. 4. При известных условиях, в которые мы здесь не будем глубже вдаваться, можно предположить, что не- -1) Читатель, который интересуется лишь чисто математи- ческим развитием теории, может этот параграф не читать — даль- нейшее изложение основывается на аксиомах § 1 и не использует рассуждений этого параграфа. В нем мы ограничимся лишь про- стым указанием на эмпирическое возникновение аксиом теории вероятностей и сознательно оставляем в стороне глубокие фило- софские изыскания о понятии вероятности в мире опыта. В изло- жении необходимых предпосылок для приложимости теории ве- роятностей к миру действительных событий автор в значительной мере следует выводам Мизеса, в частности ср. R. von Mises [11, стр. 21—27, параграф «Das Verlialinis der Theorie zur Erfah- rungswolt».
§ 2. ОТНОШЕНИЕ К ДАННЫМ ОПЫТА 13 которым событиям А, которые могут наступить или же не наступить после осуществления условий ®, по- ставлены в соответствие определенные действительные числа Р (Л), обладающие следующими свойствами: А. Можно практически быть уверенным, что если комплекс условий (5 будет повторен большое число п раз и если при этом через т обозначено число случаев, при которых событие А наступило, то отношение будет мало отличаться от Р (А). В. Если Р (Л) очень мало, то можно практически быть уверенным, что при однократной реализации ус- ловий € событие Л не будет иметь места. Эмпирическая дедукция аксиом. Обычно можно пред- полагать, что система F рассматриваемых событий Л, В, С, . . ., которым приписаны определенные веро- ятности, образует алгебру множеств, содержащую в качестве элемента множество О (аксиома I, а также пер- вая часть аксиомы II — существование вероятностей). Далее ясно, что 0 1, так что вторая часть акси- омы II оказывается вполне естественной. Для события Q всегда т = п, благодаря чему естественно положить Р (й) = 1 (аксиома III). Если, наконец, Л и В несовме- стны между собой (т. е. множества Л и В не пересе- каются), то т = т1 + т2, где т, т2 обозначают соответственно число опытов, в которых происходят события Л 4- В, А, В. Отсюда следует: т ту /иг п п * Следовательно, является уместным положить Р (Л + В) = Р (Л) + Р (5) (аксиома IV). Примечание I. Из практической достоверно- сти двух утверждений следует практическая достовер- ность утверждения об их одновременной правильности, хотя степень достоверности при этом несколько пони- жается. Если, однако, число утверждений очень велико,
14 I. ЭЛЕМЕНТАРНАЯ ТЕОРИЯ ВЕРОЯТНОСТЕЙ то из практической достоверности каждого отдель- ного из этих утверждений вообще нельзя вывести никаких заключений относительно одновременной пра- вильности всех этих утверждений. Поэтому из прин- ципа А никоим образом не следует, что при очень боль- шом числе серий по п испытаний в каждой серии отно- шение будет мало отличаться от Р (А). Примечание II. Невозможному событию (пу- стому множеству 0) соответствует в силу наших акси- ом вероятность Р (0) = 0 1), в то время как, наоборот, из Р (А) = 0 не следует еще невозможность события А; согласно принципу В из обращения вероятности в нуль следует только, что при однократной реализации условий ® событие А практически невозможно. Это, однако, не означает, что при достаточно длинном ряде испытаний событие А также не наступит. Согласно принципу А можно лишь утверждать, что при Р (А) = — О и большом п отношение будет мало. § 3. Терминологические замечания Мы определили объекты нашего дальнейшего изу- чения — случайные события — как множества. Мно- гие теоретико-множественные понятия обозначаются, однако, в теории вероятностей другими именами. Мы приведем здесь краткий указатель таких понятий. В теории множеств Для случайных событий l.An В не пересекают- 1. События А и В не- ся, т. е. АВ — 0. совместны. 2. АВ ... N = 0. 2. События А, В,..., N несовместны. 3. АВ . . . N = X. 3. Событие X заключает- ся в одновременной реали- зации всех событий А, В,... . . N. Ср. § 4, формула (3).
§ 4. НЕПОСРЕДСТВЕННЫЕ СЛЕДСТВИЯ ИЗ АКСИОМ 15 4. A U^U • • • U^=X- 5. Дополнительное мно- жество А. 6. А = 0. 7. А = Q. 8. Система 51 множеств А 2, . . Ап образует разложение множества Q, если A । + А 2 0 . . . . . .+ Ап = й. (Это уже предполагает, что множе- ства Ai попарно не пере- секаются.) 9. В является подмно- жеством А ; В с: А. 4. Событие X заключает- ся в наступлении по край- ней мере одного из собы- тий А, В, . . ., N. 5. Противоположное со- бытие Л, состоящее в не- паступлении события А. 6. А невозможно. 7. А должно необходи- мо наступить. 8. Испытание 51 заклю- чается в том, что устанав- ливают, какое из событий Aj, А2, . . ., Ап происхо- дит; Ai, Л2, . . ., Ап на- зываются при этом воз- можными исходами испы- тания 51. 9. Из осуществления события В с необходи- мостью следует осущест- вление А. § 4. Непосредственные следствия из аксиом, условные вероятности, теорема Байеса Из А + А — й и аксиом III и IV следует, что Р (А) + Р (А) = 1, (1) Р (Л) = 1 - Р (Л). (2) Так как Й = 0, то, в частности, Р (0) = 0. (3) Если А, В, . . ., N несовместны, то из аксиомы IV следует формула Р (Л + В + . . . + N) = Р (Л) + Р (В) + . . . 0 Р (7V) (4) (теорема сложения).
16 Г. ЭЛЕМЕНТАРНАЯ ТЕОРИЯ ВЕРОЯТНОСТЕЙ Если Р (Л) 0, то частное Р(В|Л) = ^1 (5) называют условной вероятностью события В при усло- вии А. Из (5) непосредственно следует, что Р (АВ) = Р (В | Л)-Р (Л). (6) Заключение по индукции дает общую формулу Р (ЛИ2 . . . Лп) == Р (HJ Р (Л2 I Л^ Р (Л3 Iлхл2)... ... РИ^Л^ . . Л„_г) (7) (теорема умножения). Легко доказываются также следующие формулы: Р (В | Л) > 0, (8) Р (£2 | Л) = 1, (9) Р(В + С I Л) = Р(В i Л) + Р(С ! Л). (10) Сравнивая формулы (8) и (10) с аксиомами II—IV, получаем, что система множеств & вместе с функцией множеств Р (В | Л) (при закрепленном множестве Л) об- разует поле вероятностей. Следовательно, все доказан- ные для вероятностей Р (В) общие теоремы справедли- вы для условных вероятностей Р (В | Л) (при фиксиро- ванном событии А). Легко также заметить, что Р(Л |Л) = 1. (11) Из (6) и из аналогичной формулы Р (АВ) = Р(Л |В)Р(В) получаем важную формулу Р(Л|В) = ^И^|Л) , (121 содержащую, собственно, теорему Байеса.
§ 5. НЕЗАВИСИМОСТЬ Теорема (о полной вероятности). Пусть At + + 42+... + An = Q и В — произвольное событие. Т огда Р (Z?) = Р (Л) р (В I А) + Р (л2).р (5 IА2) + ... • - + Р (Лп) р (В I Ап). (13) Доказательство. Поскольку В = AtB+ . . . +АпВ, то, согласно (4), ?(В) = Р(А5) + . . . + Р(ЛЛ): согласно (6) при этом имеет место равенство ? (AtB) = Р(Пг)Р(В |Л). Теорема (Байеса). Пусть А} + А2 + . . . . . . +ЛП = Q, а В — произвольное событие, тогда Р (Л.) Р (В I А.) р (^11 5) _ р (А) Р (В । Л1) +... + рг(Лп) р (В | Ап) . (14) Доказательство. Согласно формуле (12) Р (А.) Р (В | А.) Для получения формулы (14) остается только заме- нить вероятность Р (В) ее выражением (13) по теореме о полной вероятности. (События Alt А2, . . ., Ап часто называют «гипоте- зами» и говорят, что формула (14) дает вероятность Р (At \ В) гипотезы At после наступления события В-, Р(Пг) означает при этом априорную вероятность At.) § 5. Независимость Понятие независимости двух или нескольких опытов занимает в известном смысле центральное место в теории вероятностей. В самом деле, мы уже видели, что теорию вероятностей с математической
8 1. ЭЛЕМЕНТАРНАЯ ТЕОРИЯ ВЕРОЯТНОСТЕЙ точки зрения можно рассматривать как специальное применение общей теории аддитивных функций мно- жеств. Естественно задать вопрос, каким же образом теория вероятностей развилась в большую, обладаю- щую своими собственными методами самостоятельную науку? Для ответа на этот вопрос следует указать на ту специализацию, которую получают в теории вероятно- стей общие проблемы, касающиеся аддитивных функ- ций множеств. То обстоятельство, что наша аддитивна^ функция множеств Р = Р (•) неотрицательна и удовлетворяет условию Р (Й) = 1, не обусловливает еще собой воз- никновения новых глубоких проблем. Случайные вели- чины (ср. третью главу) с математической точки зрения представляют собой не что иное, как измеримые (относи- тельно f) функции, а их математические ожидания яв- ляются абстрактными интегралами Лебега. Эта анало- гия была впервые полностью разъяснена в работах Фреше х). Введение упомянутых понятий не может, следовательно, еще доставить никакого базиса для раз- вития большой оригинальной теории. Исторически независимость испытаний и случай- ных величин явилась тем математическим понятием, которое придало теории вероятностей своеобразный отпечаток. Классические работы Лапласа, Пуассона, Чебышева, Маркова, Ляпунова, Мизеса и Бернштейна действительно посвящены в основном изучению рядов независимых случайных величин. Если в новейших исследованиях (Марков, Бернштейн и др.) часто отка- зываются от предположения полной независимости, то оказываются принужденными для получения доста- точно содержательных результатов ввести аналогич- ные ослабленные предположения (ср. в этой главе § 6, о цепях Маркова). Мы приходим, следовательно, к то- му, чтобы в понятии независимости видеть по крайней мере первый зародыш своеобразной проблематики тео- рии вероятностей — обстоятельство, которое в этой *) Ср. F 1ё с h е t [1] и [2].
§ 5. НЕЗАВИСИМОСТЬ 19 книге будет мало выделяться, так как в ней мы зани- маемся главным образом только логической подготов- кой к собственно теоретико-вероятностным исследова- ниям. Соответственно этому одной из важнейших задач философии естественных наук, после разъяснения пре- словутого вопроса о сущности самого понятия вероят- ности, являются выяснение и уточнение тех предпосы- лок, при которых можно какие-либо данные действи- тельные явления рассматривать как независимые. Этот вопрос выходит, однако, за пределы данной книги. Перейдем к определению независимости. Пусть даны и испытаний , . . ., т. е. п разложений Q = 4° + .. 4- А{% (i =1,2,..., п) основного множества П на сумму (непересекающихся) событий. Тогда можно задать г = . . . гп вероят- ностей вообще произвольно при единственном условии1) 3 А-Л...ЛП = 1- (1) (fci, кп) Определение 1. Испытания 5V1*, ЭД(2>, . . ., будем называть независимыми, если для любых кг, к.г, . . . . . ., кп имеет место равенство р (« • • • <’) = р (<) р (4V) • • • р (<)• (2) Поле вероятностей с произвольными вероятностями, удов- летворяющими только упомянутым условиям, можно построить следующим образом: множество Q составляется из г элементов оу.. I: к > соответствующие элементарные вероятности пусть бу- дут р,. к и 41) определяется как множество всех к , для которых ki — к.
20 1. ЭЛЕМЕНТАРНАЯ ТЕОРИЯ ВЕРОЯТНОСТЕЙ Среди г уравнений (2) имеется только г — (ту + • . . ... 4- rn) + (п — 1) независимых х). Теорема 1. Если испытания ЭД1), 31<2) , . . . . . ., 510') независимы, то из них любые т (т < < п) испытаний ЭД’>), . . ., Ш(’т) также незави- симы 2). В случае независимости имеют, следовательно, место равенства р (4? . а^}) = р (<>) р (4;>)... р (3) (предполагается, что i, различны). Определение II. События Alf А2, . . ., Ап называются независимыми, если разложения (испы- тания) О = A h + А ь (к — 1,2, . . ., п) являются независимыми. *) В самом деле, в случае независимости можно выбрать про- извольно только Г1 + г2 + ••• + вероятностей = Р (/ijy), иритом так, чтобы соблюдались п условий к Следовательно, в общем случае имеем г — 1 степеней свобо- ды, а в случае независимости только rt -(-... -J- ти — п. 2) Для доказательства достаточно установить, что из неза- висимости п разложений следует независимость первых п — 1 из них. Примем, что уравнения (2) удовлетворены. Тогда р =2р = =р (<) р • • • р (<4) 2р (<>) = = р(<)Р(<)---р(4Ц>).
§ 5. НЕЗАВИСИМОСТЬ 21 В этом случае = г2 — . . . = гп = 2, г — 2”, следовательно, из 2п уравнений (2) имеется независимых только 2" — п — 1. Для независимости событий 4,, Аг, . . Ап необходимы и достаточны следующие условия Д: р (4 а • • • AJ = р (А,) р (Л) • • р (4J, (А т = 1, 2,. . ., п; 1 ii г2 <С • • А А п- Все эти уравнения независимы между собой. В случае п = 2 получаем из (4) только одно (2! — — 2 — 1 = 1) условие для независимости двух событий и Аг. Р(4А) = РА)Р(А). (5) Система уравнений (2) состоит в этом случае, кроме (5), еще из трех уравнений: Р (ЛД = Р (4J Р (42), Р (А .А 2) = Р (Ji) Р (42), Р (Л42) = Р (ЯД Р (42), которые, очевидно, следуют из (5) * 2). Следует при этом еще заметить, что из попарной независимости событий 41; 4г, • . ., 4„, т. е. из соот- ношений РИА) = Р(А)Р(А) (;¥=/) в случае п 2 отнюдь не следует независимость этих L) Ср. С. Н. Б е р н ш т о й н [1], стр. 47—57. Впрочем, читатель может это сам проверить без труда (заключение по ин- дукции). 2) Р(Д14г) = Р(41) - P(4,42) = P(4i) - P(4i)P (4г) = = Р (4i) [1 - Р (42)] = Р (4i) Р (Д2) и т. д.
22 1. ЭЛЕМЕНТАРНАЯ TEOl'illl ВЕРОЯТНОСТЕЙ событий J) (для нее необходимо выполнение всех ра- венств (4)). При введении понятия независимости мы не поль- зовались условными вероятностями. Нашей целью было при этом возможно яснее изложить чисто математиче- ски сущность этого понятия. Его приложения опи- раются, однако, главным образом на свойства неко- торых условных вероятностей. Если мы предположим, что все вероятности положительны, то из уравнений (3) следует, что 2) р(4Умй,)4:>...^Г1>) = р(лУ- (в) Обратно, из формул (6) следуют но теореме умноже- ния (формула (7), § 4) формулы (2). Мы имеем, следо- вательно, следующую теорему. Т еорема II. В случае положительных вероятно- стей всех для независимости испытаний ЭД* 1’, ЭД2’, . . ., ЭДП’ необходимо и достаточно следующее условие', условная вероятность исхода при той гипотезе, что некоторые другие испытания ЭД’1’, ЭД’2’,... . . ., SI'1’’ получили определенные исходы А(£\ A^f,... ..., равняется абсолютной вероятности Р (А V?). *) Это доказывается следующим простым примером (С. Н. Бернштейн): множество Й состоит из четырех элементов со,, <о2, <о3, W1, соответствующие элементарные вероятности pit р2, р8, Pi все полагаются равными 1/4 и А = {(щ, <о2}, В = ftOi, c.'J, С = {<0|, ни}. Легко тогда сосчитать, что Р(Л) = Р(В) = Р(С) = у, 1 / 1 \а Р (АВ) = Р (ВС) = Р (-4С) = j = I у} , 1 / Г\3 P(.4BC) = T^lyj . 2) Для доказательства следует вспомнить определение услов- ной вероятности (формула (5), § 4) и заменить вероятности иере- сечений на произведения вероятностей ио формуле (3).
§ G. УСЛОВНЫЕ ВЕРОЯТНОСТИ 23 На основе формул (4) аналогично доказывается сле- дующая теорема. Теорема III. Если все вероятности Р {Ah) по- ложительны, то для независимости событий Alt Л2, . •. . . Ап необходимо и достаточно, чтобы Р(Л1А,, А-р = Р(Л) (7) для любых попарно различных к, /сх, к.2, . . ., kt. В случае п — 2 условия (7) сводятся к двум уравне- ниям: Р(Л2 |4Х) = Р(Л2), Р(ЛХ IЛ2) = Р(А). (8) Легко усмотреть, что уже одно лишь первое урав- нение (8) представляет необходимое и достаточное усло- вие независимости Аг и А2, если только Р (Лх) 0. § 6. Условные вероятности как случайные величины; цепи Маркова Пусть 91 является разложением основного множе- ства й, Й = ЛХ + Л24-... -f-Am, а £ = | (со) — действительная функция элементарного события со, которая на каждом множестве At принимает значение xpt т £(«)== 2 (о), 1—1 где IAl (со)—индикатор множества А,, т. е. 1а, (со) — 1, если оеЛ; и IAl (со) = 0, если со ЕЕ Л г- В этом случае говорят, что | — случайная величина, принимающая конечное число значений ж1,. . .,хт, и 1П м?= 2^Р(А) i=l
24 1. ЭЛЕМЕНТАРНАЯ ТЕОРИЯ ВЕРОЯТНОСТЕЙ называют математическим ожиданием величины g. Теория случайных величин и их математических ожи- даний будет развита в третьей и четвертой главах, не ограничиваясь при этом случайными величинами, кото- рые могут принимать только конечное число различных значений. Определение I. Случайную величину, кото- рая на каждом множестве At принимает значение Р (В | Ai), мы назовем условной вероятностью события В после данного испытания $( и обозначим Р (В | 51) (ы), или просто Р (В | 51): т Р(5|5() = 2 Р(51 Ai) 1А. (о>). Два испытания 51(1) и 51(2) тогда и только тогда независимы, когда Р(Л?)|51(1)) = Р(Л|2’), i = l, 2,..., т2. Если даны какие-либо испытания 51(1), 54(2), . . ., 51<п\ то через 51(1)51(2)... 51<п) мы обозначим испытание, соответствующее разложе- нию множества О на произведения А™ А^' . . . Испытания 51(1), 5((2), . . ., 51<п) тогда и только тогда независимы, когда Р (Л(Л’ | 51(1)51(2)... 5l(/t-1)) = Р (/If0) при любом выборе к и i2). Определение II. Последовательность испы- таний 51(1), 51(2),..., 51(!1),... *) Необходимость этих условий следует из теоремы II § 5, а что они также являются достаточными, можно заключить не- посредственно из теоремы умножения (формула (7) § 4).
5 в. УСЛОВНЫЕ ВЕРОЯТНОСТИ образует цепь Маркова, если при любых к и I Р | Щ(,)31<2)... 5I(/f-1)) = Р (Л)й) I 31(М)). Цепи Маркова образуют естественное обобщение по- следовательностей независимых испытаний. Если по- ложить P'Wn tm’ = Р (Ai^ I т<п, то основная формула теории цепей Маркова будет иметь следующий вид: Pikin (к, п) = ^р-^т {к, т) pimin (т, п). (1) ’гл к т п Обозначив матрицу \\Pimin{m,n) || через р (т,п), можно (1) записать в следующем виде1): р (к, п) — р (к, ni) р (т, п) (2) к < т < п. 1) По поводу дальнейшего развития теории цепей Маркова см. R. von Mises [1], § 16 и В. Н о s t i n s к у, Methodes generales du calcul des probability, Mem. Sci. Math. 52, Paris, 1931.
5 в. УСЛОВНЫЕ ВЕРОЯТНОСТИ образует цепь Маркова, если при любых к и I Р (Л^0 | Щ(,)31<2)... 5I(/f-1)) = Р (Л(/° I 31(М)). Цепи Маркова образуют естественное обобщение по- следовательностей независимых испытаний. Если по- ложить P'Wn tm’ = Р (I т<п, то основная формула теории цепей Маркова будет иметь следующий вид: Р^„ (к, = 2<PVm (к, т) pimin (т, п). (1) г тп к <^т <^п Обозначив матрицу || Ptmtn(т, п) || через р (т,п), можно (1) записать в следующем виде1): р (к, п) — р (к, т) р (т, п) (2) к < т <Z п. 1) По поводу дальнейшего развития теории цепей Маркова см. R. von Mises [1], § 16 и В. Н о s t i n s к у, Methodes generales du calcul des probability, Mem. Sci. Math. 52, Paris, 1931.
П. БЕСКОНЕЧНЫЕ ПОЛЯ ВЕРОЯТНОСТЕЙ § 1. Аксиома непрерывности Мы обозначаем, как обычно, через Ат пересече- ние множеств Ат (в конечном или бесконечном числе) и через (JAm их соединение. В случае непересекаю- щихся множеств А т соединение LMm называем суммой и т обозначаем ^Ат. Следовательно, т и Ат = лилили..., т 2^-т = + Аг + А3 4- .. Ill П = А1-АгА3... т При всех дальнейших рассмотрениях мы предпо- лагаем, что кроме аксиом I—IV (гл. I, § 1) выполняется еще следующая аксиома непрерывности; V. Для убывающей последовательности ^г ~) х4п иэ ... (1) событий из Д такой, что Q л = о, (2) имеет место равенство limP(AJ = 0. (3) п
§ 1. АКСИОМА НЕПРЕРЫВНОСТИ 27 Во всем дальнейшем изложении мы называем полем вероятностей только такое поле вероятностей (О, 0, Р) в смысле главы первой, которое, кроме того, удовлет- воряет аксиоме V. Поля вероятностей в смысле главы первой можно называть полями вероятностей в расши- ренном смысле. Если система множеств & конечна, аксиома V сле- дует из аксиом 1—IV. В самом деле, в этом случае существует только конечное число различных множеств в последовательности (1). Пусть Ah — наименьшее из них, тогда все множества All+l совпадают с Ah, и мы, следовательно, получаем /1, = Ам = П Ап = 0, lim Р (Л„) = Р (0) = 0. Все примеры с конечными полями вероятностей из первой главы удовлетворяют, следовательно, также аксиоме V. Система аксиом I—V является, таким обра- зом, непротиворечивой и неполной. Напротив, для бесконечных полей аксиома непре- рывности V является независимой от аксиом I—IV. Так как новая аксиома существенна лишь для беско- нечных полей вероятностей, то является почти невоз- можным разъяснить ее эмпирическое значение, напри- мер, так, как это было вкратце проделано для аксиом I — IV в § 2 главы первой. При описании какого-либо действительно наблюдаемого случайного процесса можно получать только конечные поля вероятностей. Бесконечные поля вероятностей появляются только как идеализированные схемы действительных случай- ных явлений. Мы произвольно ограничиваемся при этом такими схемами, которые удовлетворяют аксиоме V. Это ограничение оказывается целесообразным в самых различных исследованиях. Теорема I (расширенная теорема сложения). Если А, Л п . . ., А п, . . . принадлежат f и
28 II. БЕСКОНЕЧНЫЕ ПОЛЯ ВЕРОЯТНОСТЕН то Р(Л) = 2Р(Л,(). (5) п Доказательство. Положим Rn = 2 Ат- т>п Тогда, очевидно, П Rn = 0, п и, следовательно, по аксиоме V lim Р (7?п) = 0. (6) п С другой стороны, по теореме сложения Р(Л) = Р(ЛД + . . . + Р(4П) + Р(ЯП). (7) Из (6) и (7) следует непосредственно (5). Итак, мы доказали, что вероятность Р = Р (•) яв- ляется на f счетно-аддитивной функцией множеств. Обратно, аксиомы IV и V имеют место для всякой опре- деленной на какой-либо алгебре множеств f счетно- аддитивной функции множеств1). Можно, следователь- no, понятие поля вероятностей определить следующим образом. Пусть й — произвольное множество, f — алгебра подмножеств Q, а Р = Р () — неотрицательная счет- но-аддитивная функция множеств, определенная на if, подчиненная условию Р (Q) = 1. Тогда система (Q, f, Р) образует поле вероятностей. Теорема II (о покрытиях). Если А, Лп А2, . . . .. ., Ап, ... принадлежат f и A^L)An, (8) п то Р(Л)<2Р(Л). (9) п *) См., например, книгу А. Н. К о л м о г о р о в а и С. В. Ф о м и н а, цитированную на стр. 11.
5 2. БОРЕЛЕВСКИЕ ПОЛЯ ВЕРОЯТНОСТЕЙ 29 Доказательство. Поскольку А = А ([J А п) = А (Л! + А2.4! + Л341А 2 Ч~ • • •), то Р (Л) = Р (ЛЛХ) + Р (ЛЛ2Л!) + ... < < Р (Л!) + Р (Л2) + . . . § 2. Борелевские поля вероятностей Алгебра f подмножеств множества Q называется борелевской алгеброй, если все счетные суммы 23ЛП мно- жеств Ап из & принадлежат Борелевские алгебры называют также а-алгебрами. Из формулы U А п = Л j + Л241 + Л341Л2 + ••• (1) можно заключить, что о-алгебра содержит также все множества |J Л„, составленные из счетного числа мно- п жеств Ап. Из формулы П Ап = Q \ U Л п п п следует то же для пересечений множеств. Поле вероятностей (Q, f, Р) называется борелев- ским полем вероятностей, если соответствующая ал- гебра f является борелевской. При борелевских полях теория вероятностей получа- ет полную свободу действия, не связанную с опасностью прийти к событиям, которые не имеют никакой вероят- ности. Мы теперь покажем, что можно ограничиться рассмотрением только борелевских полей вероятностей. Это будет следовать из так называемой теоремы о про- должении, к которой мы сейчас перейдем.
30 II. БЕСКОНЕЧНЫЕ ПОЛЯ ВЕРОЯТНОСТЕЙ Пусть дано поле вероятностей (О, ^0, Р). Как известно J), существует наименьшая <з-алгебра f = = з (^0), содержащая f0. Теорема (о продолжении). Определенную на (й, $ о) неотрицательную счетно-аддитивную функцию множеств Р = Р (•) всегда можно продолжить с сох- ранением обоих свойств (неотрицательности и счетной аддитивности) на все множества из $ = о (^0) и при- том единственным образом. Борелевская алгебра jT = о (£0) вместе с продол- женной функцией множеств Р = Р (•) образует неко- торое поле вероятностей (й, Р). Это поле назовем борелевским расширением поля (Й, гГ0, Р). Доказательство теоремы о продолжении, которая относится к теории аддитивных функций мно- жеств и которая в основном должна быть известна в различных других трактовках, проводится по следую- щей схеме. Пусть А — некоторое произвольное подмножество Й. Определим Р* (А) как нижнюю границу сумм 2Р(Лп) для всех покрытий Леи 4 п множества А конечным или счетным числом множеств Ап из f0. Легко доказать, что Р* (Л) является внеш- ней мерой в смысле Каратеодори * 2). Согласно теореме о покрытиях (§ 1), Р* (Л) совпадает с Р (Л) для всех множеств из f0. Далее доказывается, что все множества из измеримы в смысле Каратеодори. Так как все из- !) Ф. Хаусдорф, Теория множеств, Гостехиздат, М., 1937; А. Н. Колмогоров, С. Ф. Ф о м и н, Элементы тео- рии функций и функционального анализа, Изд-во «Наука», 1968, стр. 44. 2) С. Carat h eodor у, Vorlesungen liber reele Funklio- nen, Teubner, Berlin und Leipzig, 1918, стр. 237—258; A. H. Колмогоров, С. В. Ф о м и н (цит. выше), гл. V, § 3.
§ 3. ПРИМЕРЫ БЕСКОНЕЧНЫХ ПОЛЕЙ ВЕРОЯТНОСТЕЙ 31 меримые множества образуют о-алгебру, то, следова- тельно, все множества из б(^0) являются измеримыми. Функция множеств Р* (Л) является, следовательно, счетно-аддитивной на <з («Го), 11 на 3 (Fo) мы можем по- ложить Р (Л) = р* (Л). Этим доказано существование продолжения. Един- ственность продолжения следует сразу же из мини- мальных свойств алгебры о (£Г0). Замела п и е. Если множества (события) А из & 0 могут иметь смысл в качестве действительных и на- блюдавшихся (хотя бы приближенно) событий, то от- сюда еще не следует, что множества из расширенной алгебры б (д^0) допускают такое же разумное истол- кование в качестве действительно наблюдавшихся событий. Может случиться, что поле вероятностей (Q, 0, Р) рассматривается в качестве (хотя бы идеа- лизированного) образа реальных случайных событий, в то время как расширенное поле вероятностей (Q, б(^Го), Р) остается чисто математическим постро- ением. Множества из g мы рассматриваем только как «идеальные события», которым ничего не соответствует во внешнем мире. Если, однако, рассуждение, которое использует вероятности таких идеальных событий, приводит к определению вероятностей действительного события из f 0, то это определение, очевидно, автомати- чески будет непротиворечивым и с эмпирической точки зрения. § 3. Примеры бесконечных полей вероятностей I. Еще в первой главе, § 1, мы строили различные ко- нечные поля вероятностей. Пусть теперь й = {©], ©2, . . . } — счетное множество, а & совпадает с совокупностью всех подмножеств множества Q.
32 II. БЕСКОНЕЧНЫЕ ПОЛЯ ВЕРОЯТНОСТЕЙ Все возможные поля вероятностей с таким множе- ством^ получаются следующим образом: берется после- довательность неотрицательных чисел {рп} при условии Pi + Р-2 + • • • = 1 и для каждого множества А полагается п причем суммирование У, распространяется на все те индексы п, для которых соп принадлежит А. Эти поля вероятностей, очевидно, являются борелевскими. II. Теперь предположим, что Q представляет собой действительную числовую прямую R. Сначала пусть ,Т0 образовано из всевозможных конечных сумм полуоткрытых интервалов [а, Ь) = {ю: а со < Ь} (при этом мы рассматриваем наряду с собственными интервалами с конечными а и b также и несобственные [— оо, Ь), [а, + оо) и [— оо, 4- оо)). Легко убедиться, что является алгеброй. По теореме о продолжении мож- но, однако, каждое поле вероятностей (Q, Р) расши- рить в подобное поле (П, о (f'o), Р). Система множеств — 5 (.^о) в нашем случае является ни чем иным, как системой всех борелевских множеств числовой прямой. III. Пусть Q = R — действительная числовая пря- мая, a состоит из всех борелевских множеств этой прямой. Для построения вероятностного пространства с данной борелевской алгеброй & достаточно опреде- лить па множествах A GE любую неотрицательную счетно-аддитивную функцию множеств Р (Л), удовлет- воряющую условию Р (й) = 1. Такая функция, как известно *), однозначно определяется своими значе- ниями Р {[-оо, z)} = F (х) (1) для специальных интервалов [—оо, х). ') См., А. Л е б е г, Интегрирование и отыскание примитив- ных функций, ГТТИ, 1934, стр. 127—132.
§ 3. ПРИМЕРЫ БЕСКОНЕЧНЫХ ПОЛЕЙ ВЕРОЯТНОСТЕЙ 33 Функцию F — F (х) называют функцией распре- деления со. Далее доказывается (третья глава, § 2), что F (х) не убывает, непрерывна слева и имеет следующие предельные значения: lim F (х) = F (— оо) = О, lim F (х) = F (-}- оо) = 1. X—ОС Обратно, если дана функция F — F (х), удовлет- воряющая этим условиям, то она всегда определяет неотрицательную счетно-аддитивную функцию мно- жеств Р (Л) такую, что Р (Q) = 1 '). IV. Пусть теперь за основное множество й прини- мается и-мерное евклидово координатное простран- ство Вп, т. е. множество всех упорядоченных комплек- сов со == {xi, х2, . . ., хп} из п действительных чисел. Система & пусть состоит при этом из всех борелевских множеств 2) пространства Rn. На основании рассужде- ний, аналогичных приведенным в примере II, мы мо- жем отказаться от рассмотрения более узких систем множеств, например системы всех и-мерных интер- валов. За вероятностную функцию Р (Я) здесь, как всегда, можно принять любую неотрицательную и счетно- аддитивную функцию множеств, определенную на % и удовлетворяющую условию Р (й) = 1. Такая функция множеств однозначно определяется, если дапы ее зна- чения Р(АЯ1,.....«„) = F(alt аг, . . ., я(1) (3) для специальных множеств Aa„a!, ...,а , гдеА^гц....Я|1 означает множество всех со, для которых X, < O-i, I — 1, 2, . . ., п. 1) См., например, цитированную выше книгу А. Н. Кол- могорова и С. Ф. Фомина, стр. 262. 2) Определение борелевских множеств в Rn см. Ф, X а у с- д о р ф, Теория множеств, Гостехиздат, М., 1937. 2 А. Н. Колмогоров
34 II. БЕСКОНЕЧНЫЕ ПОЛЯ ВЕРОЯТНОСТЕН Нетрудно подсчитать, что для множества ь,..ъ «)г ^1? • • ч ан а.1г Ьп] вероятность р(л«:; = = F (Ь15 . . Ъп) 2 F(by,. . a,, Ь, ) -к i=-l ;/j F (bj, . . fl;, feJ+i, . . bj-1, ttj, bj^y, . . ., bn) . . . ... + (—1)"fi„). (4) За функцию F (an . . ., an) можно при этом выбрать любую непрерывную слева, неубывающую по всем пе- ременным функцию, для которой выражение в правой части (4) неотрицательно при любых аг- bt, 1=1,... . . ., п, и которая удовлетворяет также следующим условиям: lim F (ах,..an) = F (а1; ..., а;_ь — <х, а-1+1,..., ап) = О, а^->—ОО г = 1, 2, . .., п, (5) lim F (ay, ..., ап) = F (-]- ос, ..., Ц- ос) = 1. >-}-оо,..., а —>4-ос Функцию F (ах, . . ап) называют функцией рас- пределения величин хг, . . хп. Рассмотрение полей вероятностей вышеопределен- ного типа достаточно для всех классических проблем теории вероятностей1). В частности, вероятностная функция в Вп может быть определена следующим обра- зом. Берется любая определенная в Rn неотрицательная ’) Ср., например, R. von Mises [1], стр. 13—19. Здесь тре- буется существование вероятностей для «всех практически воз- можных» множеств zt-мерного пространства.
§ 3. ПРИМЕРЫ БЕСКОНЕЧНЫХ НОЛЕЙ ВЕРОЯТНОСТЕН функция / = / (тд, . . ж„) такая, что со §•••§/<Аъ ^n) d-Ч - dx„ = 1, и полагается Р(/1) = § ... ^/(А, . . r„) dxt. . ,dxn. (6) .4 Функция / (x1; . . хп) является в этом случае плотностью вероятности в точке (х15 х.2, . . хп) (ср. гл. III, § 2). Другой тип вероятностных функций в Rn получает- ся следующим образом. Пусть {<щ} — последователь- ность точек из 1Г' и {рг} — последовательность неотри- цательных действительных чисел такая, что = 1. Тогда, так же как и в примере I, полагаем Р(Л) = 2'А, i причем суммирование 2' распространяется на все то индексы I, для которых сог принадлежит А. Оба упо- мянутых здесь типа вероятностных функций в /?" не исчерпывают всех возможностей, хотя ими обычно до- вольствуются в приложениях теории вероятностей. Можно, однако, себе представить, кроме этой клас- сической области, также и другие, интересные для при- ложений задачи, в которых элементарные события оп- ределяются с помощью бесконечного числа координат. Соответствующие поля вероятностей мы исследуем ближе после введения некоторых необходимых для этого вспомогательных понятий (ср. гл. III, § 3).
Ш. СЛУЧАЙНЫЕ ВЕЛИЧИНЫ § 1. Вероятностные функции Пусть дано отображение множества й в множество X, состоящее из каких-либо элементов, т. е. определен- ная на й однозначная функция | £ (со), значения ко- торой принадлежат множеству X. Каждому подмноже- ству А из X мы ставим в соответствие в качестве его прообраза в Й множество Е,-1 (А) всех элементов из Й, которые отображаются в один из элементов А. Пусть далее — система всех подмножеств А из X, про- образы которых принадлежат к алгебре множеств &. Система тогда также является алгеброй. Если при этом $ — борелевская алгебра, то тоже имеет место и Для f и- Мы полагаем теперь (А) = Р {Г1 (А)}. (1) Эта определенная на функция множеств Р & удовлет- воряет относительно алгебры всем нашим аксиомам J—V и, следовательно, является вероятностной функ- цией на Прежде чем перейти к доказательству всех только что указанных фактов, мы сформулируем уже теперь следующее Определение. Пусть дана однозначная функ- ция | — Е, (со) случайного события со. Тогда функция Р определенная формулой (1), называется вероятно- стной функцией Примечание I. При исследовании поля веро- ятностей (Й, &, Р) функцию Р называют вероятностной функцией или просто вероятностью, а Pi — вероятно-
§ 1. ВЕРОЯТНОСТНЫЕ ФУНКЦИИ 37 стпой функцией В случае g (®) = ю Р g (4) совпа- дает с Р(4). Примечание II. Событие g"1 (4) состоит в том, что S, (ы) принадлежит множеству 4. Следовательно, Pg (4) есть вероятность того, что | (со) GE А. Нам осталось доказать вышеупомянутые свойства f и Р ^. Они следуют, однако, из одного-единствен- ного факта, а именно следующего. Лемма. Сумма, пересечение и разность каких- либо прообразных множеств g-1 (4) являются прообра- зами соответствующих сумм, пересечений, и разностей множеств 4. Доказательство этой леммы предоставляет- ся читателю. Пусть теперь 4 и В — два множества из g, их прообразы 4' и В’ принадлежат тогда £. Так как f — алгебра, то множества А'В', А' + В' и 4'\В' также принадлежат $. Но эти множества являются прообра- зами множеств АВ, А + В и А\В, следовательно, по- следние множества принадлежат к f g. Итак, мы до- казали, что $ Е — алгебра. Так же доказывается, что если Т является борелевской алгеброй, то то же спра- ведливо И ДЛЯ $ g. Далее ясно, что Pg(X) = P{r1(X)}=P(Q) = l. 'iiu Pi всегда неотрицательна, понятно само собой. Следовательно, остается доказать, что Pg счетно-ад- дитивна (ср. конец § 1 гл. II). Итак, пусть множества Ап, а следовательно, и их прообразы £-1 (4П) не пересекаются. Тогда MS-4») = Ф1 (s а>)} = п п = р {2 г1 ш} = 2 р {s-1 (Ап)} = 2 л ш, п п п чем доказана счетная аддитивность Pg.
38 111. СЛУЧАЙНЫЕ ВЕЛИЧИНЫ В заключение заметим еще следующее. Пусть = = (со) — функция, отображающая Q в Xlt а £2 ~ = (^i) — другая функция, отображающая Xi в Х2, Тогда сложная функция £ (со) = [£х (со)! отображает множество Q в Х2. Мы рассмотрим теперь вероятност- ные функции (4,) и Р^(А2) для функций (со) и g (со) = Н2 [|i (со)]. Эти две вероятностные функции связаны, как легко подсчитать, следующим соотноше- нием: Л(А2) = Ре1{^1(Л)}. (2) § 2. Определение случайных величин, функции распределения Определение I. Однозначную действитель- ную функцию £ = £ (со), определенную на основном множестве Q, называют случайной величиной, если при каждом выборе действительного числа х множество < х} всех тех со, для которых справедливо нера- венство £(со) < х, принадлежит к системе множеств ,Т. Эта функция £ (со) отображает основное множество О на множество R всех действительных чисел. Наше определение случайной величины можно теперь сфор- мулировать так: действительная функция £ = £ (со) является случайной величиной тогда и только тогда, когда ^содержит каждый интервал вида (—оо, а). Так как $ s — алгебра, то она содержит наряду с интервалами (—оо, а) также всевозможные конечные суммы полуоткрытых интервалов [а, Ь). Если наше по- ле вероятностей борелевское, то а являются бо- релевскими алгебрами; следовательно, в этом случае f содержит все борелевские множества R. Вероят- ностная функция случайной величины 5 определена для всех множеств А алгебры & В частности, в важ- нейшем случае борелевского поля вероятностей Р । оп- ределена для всех борелевских множеств R. Определение II. Функция (ж) = (—оо, х) = Р {g (со) < х},
§ 2. ОПРЕДЕЛЕНИЕ СЛУЧАЙНЫХ ВЕЛИЧИН 39 где — оо и + оо допускаются в качестве значений х, называется функцией распределения случайной вели- чины Jj. Из определения непосредственно следует, что оо) = 0, F^(+oo) = l. (1) Вероятность выполнения неравенств а 0 £ < Ъ, оче- видно, задается формулой Р(а< g (со) < b) = F^b) - Fz(a). (2) Отсюда следует, что для а < Ъ Fz (a)^Fz(b). Это означает, что F (х) — неубывающая функция. Пусть далее аг < а2 < • • <йп 6, тогда n {®: g (со) е [ап, Ь)} = 0. п Следовательно, согласно аксиоме непрерывности Fz(b)-Fz (ап) = Р {со : g (со) е [ап, Ь)} стремится к нулю при т) -> оо. Отсюда видно, что функ- ция F j (ж) непрерывна слева. Аналогично можно доказать, что lim F? (х) — Fz(— оо) = 0, (3) х->— оо lim Fz (х) = Fz(-\- оо) = i. (4) х—>4-00 Если поле ероятностей (й, Р) — борелевское, то значения вероятностной функции Р g (Л) для всех бо- релевских множеств А из R однозначно определяются знанием функции распределения F-. (х) (ср. гл. II, § 3, III). Так как главным образом интересуются только этими значениями А (Л), то функци t распределения играют во всем дальнейшем изложении существенную роль.
40 Ш. СЛУЧАЙНЫЕ ВЕЛИЧИНЫ Если функция распределения F. (х) дифференци- руема, то ее производную по х dFr (ж) ш называют плотностью вероятности В в точке х. Если для каждого х X Ft, (х) = § k (#) — ОС то для каждого борелевского множества А вероятно- стную функцию В можно выразить через (х) следую- щим образом: Рг(А) = fz(x) dx. (5) А В этом случае говорят, что распределение В абсолют- но непрерывно. В общем случае по аналогии пишут' Рг(А) = \jdFz(x). (6) А Все введенные понятия допускают обобщение па случай условных вероятностей. Функция множеств Р^А \Б) = Р {1^А | В} является условной вероятностной функцией В при ги- потезе В (предполагается, что Р (В) 0). Неубываю- щая функция Ft(x \ В) = Р {В<я |5) есть соответствующая функция распределения, и, на- конец (в случае дифференцируемости F^(x 15)), dl'\ (х I В) — условная плотность вероятности В в точке х при ги- потезе В.
§ 3. МНОГОМЕРНЫЕ ФУНКЦИИ РАСПРЕДЕЛЕНИЯ 41 § 3. Многомерные функции распределения Пусть теперь даны п случайных величин g2, . . . . . £п. Точка g = (gj, . . £п) «-мерного пространства 7?" является функцией элементарного события и. Следо- вательно, по общим правилам § 1 получаем алгебру мно- жеств f g = ^5,...состоящую из подмножеств пространства Rn, и определенную на вероятностную функцию Р^(А) = Р^......Е (Я). Эту вероятностную функцию называют п-мерной вероятно- стной функцией случайных величин £ = (£1; . . £п). Алгебра ......содержит (как это прямо следует из определения случайной величины) при каждом вы- боре I и at, i: — 1, 2, . . п, множество всех точек х — = (zlt . . жп) е Рп, для которых х( < аг-. Следова- тельно, .....^содержит также и пересечение указан- ных множеств, т. е. множество Аа|> аг,ап всех то- чек X = (хъ . . ., хп) GE Rn, для которых выполняются все неравенства xt < «г, г = 1, 2, . . ., п ’). Если назвать «-мерным полуоткрытым интервалом kj, аг, . . ., ап; Ьг, Ьг, . . ., Ьп) множество всех точек Rn, для которых выполняются все неравенства at xt <Z bt, то видно сразу, что каждый такой интервал также принадлежит алгебре n>i Е поскольку [dj, «2» • • •> ^1» ^21 • • ^п) — = ^Ь1, Ь2 Ьп А011 ьг bn Аа„ аг,Ь3„.,, Ьп Ль, ап- Борелевское расширение системы всех n-мерных по- луоткрытых интервалов состоит из всех борелевских множеств Rn. Отсюда следует, что алгебра в случае борелевского поля вероятностей содержит все борелевские множества пространства Rn. 1) Xi могут принимать также бесконечные значения ± оо.
42 Ш. СЛУЧАЙНЫЕ ВЕЛИЧИНЫ Теорема. В случае борелевского поля, вероятно- стей и борелевской функции f (zt, . . хп) функция и (<о) = / (ех (со), . . (<о)) конечного числа случай- ных величин = gj (со), . . (со) тоже яв- ляется случайной величиной. Для доказательства достаточно заметить, что мно- жество всех точек (х1, хг, . . ., хп) в R", для которых f (ж1, х2, . . ., хп) < а, является борелевским. В ча- стности, все конечные суммы и произведения случай- ных величин тоже являются случайными величинами. Определение. Функцию FZ1,., а Со, • • , хп) = ТА , г (A.v, v ) называем п-мерной функцией распределения случайных величин g1? . . ., £п. Как и в одномерном случае доказывается, что п- мерная функция распределения F?,........(xt, . . . . . ., хп) не убывает по всем переменным и непрерывна слева. Аналогично равенствам (3) и (4) из § 2 Ига ТО,,..., 5 Со,..., хп) = -эо = F....(.Гр . . ., оо, X:, . . ., Хп) = 0, (1) = ...Еп(+оо,..., + ОО) = 1. (2) Функция распределения ТО,,....^ (xt, . . ., хп) не- посредственно дает нам значения ........только для специальных множеств Аж,......х . Если, однако, наше поле вероятностей — борелевское, то ТО......? однозначно определяется для борелевских множеств че- рез функцию распределения F?....... (х1; . . ., хп) '). !) Ср. гл. II, § 3, IV.
§ 3. МНОГОМЕРНЫЕ ФУНКЦИИ РАСПРЕДЕЛЕНИЯ 43 Если существует производная дп /El,..., Е (-И, • • •! *п) ~ ~р~ pZ Р'сл,-.-, Z„ (^-l, • • •> ^n), I1 UX , , . О 3 II П то эту производную Д,....zn (ж1, • • > ^п) называют п- мерной плотностью вероятности случайных величин gj, . . £п в точке (хр . . хп). Если для каждой точки (х15 . . хп) (-1’1; • • •) Хп) = п = $ ••• S Лл....1п(Уи • • •, Уп)^У1- • -dyn, — со —оо то распределение £ = (|1, . . gn) называют абсолютно непрерывным. Для каждого борелевского множества 4 cz Rn имеет место равенство ръ,..., е„ М) = $ • • S /?. ё„ (Уъ Уп) dyi... dyn. (3) А В заключение этого параграфа сделаем еще одно за- мечание о соотношениях между различными вероятно- стными функциями и функциями распределения. Пусть дана подстановка /1, 2,...,и S = . . \^1, ^2? • • •? и пусть ps означает преобразование xit = х,., к = 1, 2, . . п. пространства Rn в самого себя. Тогда ясно, что pzh..г, (А) = Р,Л...,n{pf(A)}. (4) 41 1п /4 Пусть теперь х’ = лк (х) — «проекция» простран- ства Rn в пространство 7?fc, к < п, при которой точка
II [. СЛУЧАЙНЫЕ ВЕЛИЧИНЫ ,г — (.Cj, хп) отображается в точку х' = («г1, хй). Тогда вследствие формулы (2) § 1 .....:,.(•!) /Д.(5) Для соответствующих функций распределения из (4) и (5) следуют равенства ...= ...... Ол, . . = Л....Zn (*1, • • •, Тл + ОС, . . . + оо). § 4. Вероятности в бесконечномерных пространствах В § 3 главы второй мы видели, как строятся раз- личные применяющиеся в теории вероятностей поля вероятностей. Можно, однако, представить себе инте- ресные также и для приложений проблемы, в которых элементарные события определяются с помощью бес- конечного числа координат. Итак, пусть выбрано мно- жество индексов v любой мощности 31. Совокупность всех систем и = {rv} действительных чисел xv, где v пробегает все множество назовем пространством (для определения эле- мента ю пространства : следует каждому элементу v множества Ж поставить в соответствие действитель- ное число xv пли, что то же самое, задать определен- ную на Ж однозначную действительную функцию л\. элемента v 1). Если множество Ж состоит из п первых натураль- ных чисел 1,2, . . ., п, то есть обычное и-мсрноо пространство Rn. Если выбрать в качестве множества •Е" множество всех действительных чисел У?1, то соответ- ствующее пространство = /?н‘ состоит из всех у Ср. Ф. X а у с д о р ф, Теория множеств, Гостехиздат, М., 1937.
§ 4. БЕСКОНЕЧНОМЕРНЫЕ ПРОСТРАНСТВА 45 действительных функций ® = {xt} действительного переменного t, — оо t оо. Множество R при произвольном множестве мы примем сейчас за основное множество Q. Пусть (о = {xv} — элемент Q. Через .......будем обо- значать точку (т.Л, х,,2, . . х v ) га-мерного про- странства R'. Подмножество А из (1 назовем цилин- дрическим множеством, если оно представимо в форме А = л^.„, vn(H'), где А' есть подмножество R\ Класс всех цилиндриче- ских множеств совпадает, следовательно, с классом всех таких множеств, которые могут быть определены соотношениями вида /(•Ч„ xV2, . . xVn) = 0. (1) Для того чтобы произвольное цилиндрическое мно- жество лД v2jVn (А') определить таким соотношением, достаточно принять за / функцию, которая на А' равна нулю, а вне А' равна единице. Цилиндрическое множество является борелевским цилиндрическим множеством, если соответствующее множество А’ — борелевское. Все борелевские ци- линдрические множества х) пространства образуют алгебру, которая в дальнейшем будет обозначаться^^. Из вышеприведенных рассуждений следует, что борелев- ские цилиндрические множества — это те, которые могут быть определены борелевскими соотношениями (1). Пусть теперь А и В — два цилиндрических множества, определенных соотноше- ниями / (,rVi, ..., = 0, g (гЛ1, ..., zXm) = 0. Тогда множества А + В, АВ и А \ В можно определить соответственно следующими соотношениями: f-g = О, /2 + g2 = О, /2 + h (g) = о,
46 Ill. СЛУЧАЙНЫЕ ВЕЛИЧИНЫ Борелевское расширение алгебры мы обозначим, как всегда, через <з (^р1'"). Множества из системы о (&•*') мы называем борелевскими множествами пространст- ва Нл'°. Далее будет дан метод для построения и опериро- вания с вероятностными функциями на &л° и, следо- вательно, по теореме о продолжении также и на з(р"4'°). В случае счетности множества Л'‘ получаемые таким образом поля вероятностей достаточны для всех целей. Мы овладеваем, следовательно, всеми вопро- сами, касающимися счетной последовательности слу- чайных величии. Если же Ж несчетно, то тогда многие простые и интересные подмножества R остаются вне системы з (,Р:). Например, множество всех элементов ы, для которых xv при любом выборе индекса v оста- ется меньше какой-либо постоянной величины с, т. е. множество {(os xv <{ с, v £ Л''} не принадлежит к си- стеме б (.р1') в случае несчетности множества Л'”. Следовательно, всегда стоит добиваться, если это возможно, приведения всякой проблемы к такой форме, при которой пространство всех элементарных событий со имеет только счетное множество координат. Пусть на определена вероятностная функция Р. Каждую координату xv элементарного события и можно рассматривать как случайную величину. Сле- довательно, всякая конечная группа (xVl, xV2, . . . . . xVn) этих координат имеет «-мерную вероятност- ную функцию Л>„ vn(A) и соответствующую функ- цию распределения FV1> ...7;1(ап «2, • •> anY Ясно, что для всякого борелевского цилиндрического мно- жества А = я71,7г,..., v?! (А ) где h (х) — 0 для х 4= 0 и h (0) = 1. Если f и g — борелевские функции, то таковыми же являются /•", р + g2 и f + h (с). Следовательно, А -(- В, АВ и А \ В являются борелевскими ци- линдрическими множествами. Этим доказано, что система мно- жеств является алгеброй.,
§ 4. БЕСКОНЕЧНОМЕРНЫЕ ПРОСТРАНСТВА 47 имеет место равенство РИ) = РУ.,.„..%(Л'), причем А' является борелевским множеством в R‘\ Таким образом, вероятностная функция Р однозначно определяется на алгебре 3-л" всех цилиндрических множеств через значения всех конечномерных вероят- ностных функций P4it .,2>V|i для всех боролевских множеств соответствующего пространства Rn. Однако для борелевских множеств значения вероятностной функции Р-л, v2, .... V|l однозначно определяются через соответствующие функции распределения. Следова- тельно, мы доказали следующую теорему. Т е о р е м а. Совокупность всех конечномерных функций распределения — тп однозначно определяет вероятностную функцию Р для всех множеств из Вероятностная функция Р (по теореме о продолжении) определяется однозначно на с (зГ'"’‘) значениями функ- ций распределения ..., vn- Теперь можно поставить вопрос, при каких усло- виях a priori заданная система функций распределения /4.,^..чп определяет вероятность на (и, следова- тельно, на с (у “'' )) Сперва отметим, что всякая функция распределения v„..., v„ должна удовлетворять условиям, данным в гла- ве второй (§ 3, III), что, конечно, содержится в самом понятии функции распределения. Кроме того, вследствие формул (13) и (14) из § 2 имеют место еще следующие соотношения: Ц,’" • ’’ чп (Л"1, Хп), (2) F-H, V;....... (^1, Х-2, . . ., Tft.) — = ^*1, V;.......... -1п ("’'l, З'г, • • •> Х'К1 4“ °°1 • ч 4* °°)f (3) /Т, 2, .. ., п \ где к <3. п и I . . .1 — произвольная подста- \?1, ^2? • • •? in /
48 111. СЛУЧАЙНЫЕ ВЕЛИЧИНЫ новка. Эти необходимые условия, однако, являются также и достаточными, как это явствует из следующей теоремы. ОСНОВНАЯ ТЕОРЕМА. Всякая система функ- ций распределения F„uVz vn, удовлетворяющих условиям (2) и (3), определяет вероятностную функцию Р на которая удовлетворяет всем аксиомам S— V. Эта вероятностная функция Р может быть про- должена (по теореме о продолжении) также и на о (^). Доказательство. Итак, пусть даны функ- ции распределения FV1,42.Vn, удовлетворяющие общим условиям главы второй (§ 3, Ш) и условиям (2) и (3). Всякая функция распределения FVl. .... Vn однозначно определяет соответствующую вероятностную функцию РЛ, vn для всех борелевских множеств из Rn (ср. § 3). В дальнейшем мы будем рассматривать только боре- левские множества Rn и борелевские цилиндрические множества в О. Для всякого цилиндрического множества И — nV(> vn (А ) полагаем Р(Л) = Т\,„2.Vn(A’). (4) Так как одно и то же цилиндрическое множество Л может быть определено через различные множества А', то нужно сначала доказать, что формула (4) дает всегда одинаковое значение для Р (Л). Пусть (xV1, xvt, . . ., xVn) — конечная система слу- чайных величин xv. Исходя из вероятностной функции PV11 ..v этих случайных величин, мы можем, согласно правилам § 2, определить вероятностную функцию Р;, ц ....v, каждой подсистемы (ж7. , х^ ..... хч. ). Ра- ‘1’ 12 »(£ I, i, Ц.' венства (2) и (3) имеют своим следствием, что эта опре- деленная по § 2 вероятностная функция совпадает с a priori заданной функцией Рч^ .Мы теперь пред-
§ 4. БЕСКОНЕЧНОМЕРНЫЕ ПРОСТРАНСТВА 49 положим, что цилиндрическое множество А опреде- ляется через А = л;1, v. v (Л') гг гг’"** ifc v ' и одновременно через .............................ч (Л"), причем все случайные величины и o:v. принадлежат системе (#„,, х?2, . . xVjj), что, очевидно, не является существенным ограничением. Условия (^v- X.j ... \ gzz Л' ' ii {г’ * ifc/ *— И j > ^7 » * A J1 '2 Jm равнозначащи. Следовательно, P*U' Чг’ — Vik ’n %, • • •> X'’ik) = = K^-p ^.2,.........................(Л7), что доказывает наше утверждение относительно одно- значности определения Р (Л). Докажем теперь, что поле вероятностей (Q, Р) удовлетворяет всем аксиомам I—V. Аксиома I утверждает только, что '^л'‘ должна быть алгеброй; это обстоятельство (за исключением требования £2 GE было уже доказано выше. Далее, при любом v G Ж Й = л?1 (Я1), Р(Й) = = 1. что доказывает применимость аксиом I и Ш. Наконец, из определения Р (Л) непосредственно следует, что Р (Л) неотрицательна (аксиома II).
50 Ш.СЛУЧАЙНЫЕ ВЕЛИЧИНЫ Несколько сложнее доказывается применимость аксиомы IV. Для этой цели рассмотрим два цилиндри- ческих множества А = лД V. И') 1Г V •’ lit и В = ..........rn- При этом мы предположим, что все величины х.,. и х^. принадлежат к объемлющей их конечной системе (х,,, х.,„ . . arv ). Если множества А и В пе пере- секаются, то соотношения (x.j., .. xv. ) е А', “ ч (•Tv., • х,. )еВ' Ji несовместны. Следовательно, Р(Л + Б) = = Лн v,,. v {(а\., xv.,. .., х,. ) ge А' или *’ *’ * П ' 11 12 tfc • • •? Б } = = *....хч2 > > d } a~ + P»t, ~>2.v {(^j > , •••> Z'vj ) G В } — P (Л) P (2?). I* • 1 • * • Остается проверить аксиому V. Пусть Ai^A2Z3...^An^... — убывающая последовательность цилиндрических множеств, удовлетворяющая условию lim Р (Дг) = L^>Q. п Мы докажем, что пересечение всех множеств Ап не пусто. Можно без существенного ограничения поста- новки вопроса предположить, что в определение п
§ 4. бесконечномерные пространства 51 первых цилиндрических множеств Ак входят только п первых координат последовательности а\, Х..„, ..., ТЧ|г, . . т. е. что ~ >>>, vn (Вп). Положим для краткости Тогда, очевидно, Р„(5п)==Р(Л„)>Л>0. В каждом множестве Вп можно найти замкнутое огра- ниченное множество Un такое, что /’п(5п\С7п)<-^. Из этого неравенства для множества Ип = nv„ ti<i (Un) следует неравенство P(4V„)<f. (5) Пусть далее wn = v±v2... vn. Из (5) следует, что Р(ЛП\И7П) < е, и так как Лп, то Р (И7,,) > Р (Лп) — е > L — е. Если е достаточно мало, то Р >0п множество Wn не пусто. Мы выберем теперь в каждом множестве
52 III. СЛУЧАЙНЫЕ ВЕЛИЧИНЫ Wn точку со<’1> с координатами Всякая точка оУ|1+р), р = 0, 1, 2, . . принадлежит множеству У;1, следовательно, (<+р), 4?+Л ^р)) = < ,2,GE ип. Так как множества Un ограничены, то из последова- тельности {»(">} можно (диагональный метод) выбрать подпоследовательность со61*', оУ,,2\ со*"2’, («;) для которой соответствующие координаты стре- мятся при любом к к определенному пределу xh. Пусть, наконец, со — точка множества й с координатами == х„ —- 0 (v=y=v;;, к = 1, 2,...). Точка (хр ж2, . . ., xh) как предел последователь- ности х',"1', . . ., ж'"*’), i = 1, 2, . . принадлежит множеству Uh. Следовательно, со принадлежит мно- жеству (ик) при любом к, а следовательно, и к пересечению А = п А- It Теорема доказана. § 5. Эквивалентные случайные величины, разные виды сходимости С этого параграфа мы рассматриваем исключитель- но борелевские поля вероятностей (П, Р). Это не делает, как было уже разъяснено в § 2 главы второй, никакого существенного ограничения для наших ис- следований.
§ 5. ЭКВИВАЛЕНТНЫЕ СЛУЧАЙНЫЕ ВЕЛИЧИНЫ 53 Определение I. Две случайные величины | и т] называются эквивалентными, если вероятность соотношения Е- т] равна нулю. Ясно, что две эквивалентные случайные величины имеют одну и ту же вероятностную функцию: Следовательно, функции распределения Fj и Fn также совпадают. Во многих вопросах теории вероят- ностей можно заменять какую-либо случайную вели- чину любой эквивалентной ей величиной. Пусть теперь U h, • ., • • • (1) — последовательность случайных величин. Рассмот- рим множество А всех элементарных событий со, для которых последовательность (1) сходится. Если через zlLp* обозначить множество всех со, для которых выполняются все неравенства IL+/C — 5п| /« = 1, 2, ..., Р, то непосредственно получаем, что А = n U П 4р>. (2) т и р Согласно § 3 множества Апринадлежат всегда б-алгебре множеств $. Соотношение (2) показывает, что множество А также принадлежит %. Следовательно, всегда имеет вполне определенный смысл говорить о вероятности сходимости последовательности случай- ных величин. Пусть теперь вероятность Р (Л) множества А равна единице. Тогда мы утверждаем, что последова- тельность (1) сходится с вероятностью единица к не- которой случайной величине которая определяется однозначно с точностью до эквивалентности.
54 Ш.СЛУЧАЙНЫЕ ВЕЛИЧИНЫ Для построения этой случайной величины пола- гаем I = lim in Я на А п = 0 вне А. Нам надо доказать, что £ — слу- чайная величина, т. е. что множество А (х) элементов ®, для которых £ < х, принадлежит алгебре Но А (х) = A [J П {со: £П+Р < п р в случае х 0 и ^4 (>т) = A {J Р] {со: Еп+Р <Р #} А п р в противоположном случае, откуда непосредственно следует наше утверждение. Определение II. Если вероятность сходи- мости последовательности &2, . . . к £ равна единице, то мы говорим, что эта последовательность почти на- верное сходится к Однако для теории вероятностей, пожалуй, еще важнее другой вид сходимости. Определение III. Последовательность слу- чайных величин |2, . . . сходится по вероятности к случайной величине £, если для любого е 0 ве- роятность P{lin-i 1>8}->0, при п -> оо *). I. Если последовательность (1) сходится по веро- ятности одновременно к | и к то | и эквивалентны. В самом деле, Это понятие восходит в основном еще к Бернулли, од- нако в волной общности было введено Е. Е. Слуцким (ср. S 1 u t s к у [1]).
§ 5. ЭКВИВАЛЕНТНЫЕ СЛУЧАЙНЫЕ ВЕЛИЧИНЫ Так как последние вероятности при достаточно боль- шом п сколько угодно малы, то отсюда следует, что = О, и, значит, р V} < 2р Ь - S' | >±-} = о. Ill II. Если последовательность (1) почти наверное сходится к то опа сходится к £ также и по вероят- ности. Пусть А — множество сходимости последователь- ности (1). Тогда 1 = Р(Л) < lim P{|Up - £| <е, р = 0, 1, 2, а < lim P{|gn - g | <e}, откуда следует сходимость по вероятности. III. Для сходимости по вероятности последователь- ности (1) необходимо и достаточно следующее условие: для любого е Д> 0 существует такое п, что для каж- дого р 0 имеет место неравенство Р {I 5,,+р — Sn I > 8} < е. Пусть теперь F (х), F\ (х), F2 (х), ... — функции распределения случайных величин g, |2, . . . Если последовательность £2, . . . сходится по вероятности к g, то функция распределения F (х) однозначно опре- деляется знанием функций Fn (х'р так как имеет место Теорема. Если последовательность g2, . . . сходится по вероятности к £, то последователь- ность соответствующих функций распределения Fn (х) сходится к функции распределения F (х) случайной величины g в каждой точке непрерывности F (х). Доказательство. Тот факт, что F (х) действительно определяется через {Еп (ж)}, следует из того, что F (х) как непрерывная слева монотонная функция однозначно определяется ее значениями
56 111. СЛУЧАЙНЫЕ ВЕЛИЧИНЫ в точках непрерывности J). Для доказательства утвер- ждения о сходимости мы предположим, что х является точкой непрерывности F (х). Пусть х' <4 х. Тогда в случае £ х', £п х необходимо |£п — £| > х — х'. Следовательно, lim Р Ж х', х} = О, п F(x') = Р{В<ж'}< Р 4- Р{?<ж', 1п>Х} = = Fn (х) + Р {§ < х', gn > х), F (#') lim inf Fn (,х) + lim Р {g п п % 1 5 F (х') <4 lim inf Fn (ж). (3) Аналогично доказывается, что если х" > ж, то F (ж") lim sup F„ (x). (4) n Так как Fix') и F (x") при x' f x и x" | x стремятся к F (ж), то из (3) и (4) следует, что lim Fn (ж) = F (ж), п Теорема доказана. ') В самом деле, она имеет самое большее лишь счетное мно- жество точек разрыва (ср. Лебег, Интегрирование и отыска- ние примитивных функций, 1934, стр. 70). Поэтому точки непре- рывности лежат всюду плотно, и значение функции F (х) в точке разрыва определяется как предел ее значений в лежащих слева точках непрерывности.
IV. МАТЕМАТИЧЕСКИЕ ОЖИДАНИЯ § 1. Абстрактные интегралы Лебега Пусть % — случайная величина и А — множество из $ ’). Образуем для положительного X сумму +<х> Sx = 2 fcXP[{7A <£<(& + !)X} ГМ]. (1) к=—оо Если этот ряд абсолютно сходится при любом X, то при X -> 0 стремится к определенному пределу, ко- торый по определению есть интеграл $B((o)P(da)). (2) А В этой абстрактной форме понятие интеграла было введено Фреше 2). В частности, оно оказывается не- обходимым для теории вероятностей. (В следующих параграфах читатель увидит, что обычное определе- ние условного математического ожидания величины g при гипотезе А совпадает с точностью до постоянного множителя с определением интеграла (2).) Мы дадим здесь краткий перечень важнейших свойств интегралов формы (2). Читатель найдет их доказательство в каждом учебнике по теории функций действительного переменного, хотя они большей ') Как было упомянуто в § 5 главы третьей, мы рассматри- ваем в этой и во всех последующих главах только борелевские поля вероятностей. г) F г ё с h е I, Sur 1’integrale d’une fonctionnel etendue а и ensemble abstrait, Bull. Soc. Math. France, t. 43 (1915), стр. 248.
58 IV. МАТЕМАТИЧЕСКИЕ ОЖИДАНИЯ частью проведены для случая, когда Р является лебего- вой мерой множеств в Rn. Перенесение этих доказа- тельств на общий случай не представляет никакой новой математической задачи; они остаются большей частью дословно темп же I. Если случайная величина 5 интегрируема иа /1, то она интегрируема на каждом подмножестве А' из А, принадлежащем &. II. Если £ интегрируема па А и А распадается на не более чем счетное число пепересекающихся множеств Ап из то J|(co)P(d(o) = 3 U«)P(dco). А п Ап III. Вместе с £ интегрируем всегда и | £ |. При этом I J I (СО) Р (d<B) | < $|£(co)|P(dco). А А IV. Если для каждого со выполняются неравенства О т] (со) £ (со), то вместе с (со) интегрируема также и величина т] (со) * 2), и при этом У т](со) Р(dco) (со) Р (Ло). А А V. Если т <С £ (®) М, причем и т и М — две постоянные, то т? (А) < Jg (со) Р (dco) < М- Р (А). А VI. Если £ (со) и т} (со) интегрируемы, а К и L — две действительные постоянные, то случайная ве- личина КА, (со) 4- ьт] (со) также интегрируема, и при *) См. цитированную па стр. 11 книгу А. Н. Колмого- рова и С. В. Фомина. 2) При этом предполагается, что д (со) — случайная величи- на, т. е. в терминологии общей теории интегрирования она изме- рима по отношению к рг.
§ 1. АБСТРАКТНЫЕ ИНТЕГРАЛЫ ЛЕБЕГА 59 ЭТОМ [2Ц (со) + Lx\ (со)] Р (&о) = К g (со) Р (<7со) + А А + А р] (со) Р (dco). д VII. Если ряд 3 SI ёп («>) I р (dco) н А сходится, то ряд Ж («) = £(«) п сходится в каждой точке множества А с точностью до некоторого множества В такого, что Р (В) = 0. Если вне множества А \ В положить g (со) = 0, то $g(co)P(dco) = 2$L(®)P(dco). А п А VIII. Если I (со) и т] (со) эквивалентны, Р {g (со) Ф ’1 (w)} = 0, т0 для каждого множества А из f (со) Р (dco) = $ ц (со) Р (dco). (3) А А IX. Если (3) имеет место для каждого множества А из то g (со) и г) (со) эквивалентны. Из вышеупомянутого определения интеграла полу- чается еще следующее свойство, которого нет в обыч- ной теории Лебега. X. Пусть Pj и Р3 — две вероятностные функции, определенные на одной и той же с-алгебре , Р == = ?!-}- Р3 и g = g (оо) интегрируема на множестве А относительно Pj и Ра. Тогда J £ (®) Р (^®) = В (<’>) Р1 + 5 £ (Ю) Р2 Л А А XI. Всякая ограниченная случайная величина ин- тегрируема.
60 IV. МАТЕМАТИЧЕСКИЕ ОЖИДАНИЯ § 2. Абсолютные и условные математические ожидания Пусть g = g (и) — интегрируемая случайная ве- личина. Интеграл Mg = \ g (со) Р (с/со) называют в теории вероятностей математическим ожиданием величины g. Из свойств III, IV, V, VI, VII, VIII, IX следует, что I. I Mg|< М| £|; II. Mi] Mg, если 0 т) (со) g (со); III. inf g (со) Mg sup g (со); IV. М (7sTg + Lii) = XMg + LMiy, V. M(2gn) =SMgn , если ряд 2 M | gn | сходится; n n n VI. Если g и 11 эквивалентны, то Mg = Мт]; VII. Всякая ограниченная случайная величина имеет математическое ожидание. По определению интеграла +°° Mg = lim 2 AAP{/A<g(co)<(* + 1)М == >->0 /Г=-ОО + °° = lim 2 /сМ^Н(М-1)М-Л(^)1- }• =—оо Вторая строка есть не что иное, как обычное опреде- ление интеграла Стилтьеса \ xF^(dx). Поэтому Mg = \ xf\ (dx). (1)
§ 2. АБСОЛЮТНЫЕ И УСЛОВНЫЕ ОЖИДАНИЯ 61 Формула (1) может, следовательно, также служить определением математического ожидания М£. Пусть теперь g = £ (со) — функция элементарного события со, а ц — случайная величина, определенная как однозначная функция от г] = 1] (£). Тогда Р {1А -'С Л <С + 1)М = Р 6 {х : к ’С Л (я) где Р>.— вероятностная функция Отсюда следует по определению интеграла, что ^](g(<B))P(dco)= ix](x)P^(dx) 11 X п, следовательно, Мт] — т| (х) Р; (dx), х (2) |Где X означает множество всех возможных значений В частности, когда | | (со) является случайной величиной, то Мт1 = $ Л (ё (®)) р (da>) = § т] (я) Рг, (dx) = о н = г] (х) (dx). — оо (3) Последний интеграл в формуле (3) является в случае непрерывности функции ц = ц (х) обыкновенным ин- тегралом Стилтьеса. Однако отметим при этом, что интеграл ОС ц (х) (dx) —со может существовать также и в случае отсутствия мате- магического ожидания Мц. Для существования Мц
62 IV. МАТЕМАТИЧЕСКИЕ ОЖИДАНИЯ необходима и достаточна конечность интеграла 1) J | т] (ж) | F? (dx). — со Если | = (|х, £2, . . £п) — случайная точка про- странства Rn, то вследствие (2) Мр = ... т|(.гд, х2,..., xn)PiltZ1.* (d^, dx^~ (4> - вп Мы уже видели, что если Р (В) 0, то условная вероятность Р (- [2?) обладает всеми свойствами веро- ятностной функции (при закрепленном множестве В). Соответствующий интеграл ма|В)= ^(о))Р(йи|5) (5) п мы называем условным математическим ожиданием случайной величины g = t, (со) относительно события В. Так как Р(В)В) = О, j g (со) Р (dco | В) = О, в то из (5) следует равенство М(?|В) = Jg(co)P(dw|B) = и = J g (со) Р (dco I В) + (со) Р (dco I В) = в в = j4(co)P(dco|B). В Вспомнив, что в случае А с;. В и Р (В) О Р (4 | В) = Р (АВ) __ Р(Л) Р(В) ~Р(В)’ *) Ср. V. G 1 i v е n к о, Sur les valeurs probables de fonc- tions, Rend. Accad. Lincei, t. 8 (1928), стр. 480—483.
§ 3. НЕРАВЕНСТВО ЧЕБЫШЕВА 63 мы получаем м£|В) = —$Цсо)Р(<йо), (6) Р(В)-М(ЦВ) = h(co)P(dco)- (7) В Из (6) и из равенства g (со) Р (dco) = $ fe (®) Р (dco) + Ь И Р (а’со) А4-В А В следует, наконец, что + . (8) г V* Т ) В частности, если О Ц Р (А) Ц 1, то имеет место фор- Mg = P(A)M(g | А) + Р(/Т)М(£ И). (9) § 3. Неравенство Чебышева Пусть f ~ f (х) — неотрицательная функция дей- ствительного аргумента ж, которая при х ?,> а остается не меньше Ь 0. Тогда для любой случайной величины I = £ (со) Р (g (со) > а} < (1) (предполагается, что математическое ожидание М/ (|) существует). В самом деле, М/а)= J/(5(co))P(dco)> $ /(Цсо))Р(йсо)> > b? {t, (со) > а}, откуда непосредственно следует (1). Например, для любого положительного с Р^(со)>а}<^. (2)
64 IV. МАТЕМАТИЧЕСКИЕ ОЖИДАНИЯ Пусть теперь / = / (х) — неотрицательная, четная и при положительном х неубывающая функция. Тогда для каждой случайной величины £ = g (to) и при лю- бом выборе постоянной а 4> 0 имеет место неравенство • (3) В частности, (4) / \uf Особо важным является случай / (х) — х\ В этом случае из (3) получаем неравенство Чебышева P{|U4)|>«X^. (5) Из (4) находим также, что Р > а} < —= 2|. . (6) Величину Dg = М (£ - М£)2 называют дисперсией случайной величины Легко подсчитать, что Dg = Mg2 - (М^)2. Если функция / (а) ограничена, i/U) К К, то Р {| | (со) | > а} можно оценить также и снизу. В самом деле, М/©= $/(£(со))Р(с?со) = J / (g (со)) Р (dco) + J /(§(®))W< {ш: Що1)| <а) !<>'. |Ды)|>а) < f (а) Р {| & (<о) | < а) + К? {| g (со) > а] </(а) 4- K-P{RH| >а}
§ 4. НЕКОТОРЫЕ ПРИЗНАКИ СХОДИМОСТИ 65 и, следовательно, P{|g((o)|>a}>^^/(aL (7) Если вместо ограниченности функции / (х) потре- бовать ограниченности самой случайной величины 6 = И®), I И®) К м, то / (to))^/ (М), и вместо (7) мы получаем формулу P(|s(®)|>«}>^^=^. (8) В случае / (ж) = ж2 из (8) находим, что ХА * 2 _ п £ Р {| g ИI > а} > . (9) § <4. Некоторые признаки сходимости Пусть U U •.1п, ... (1) — последовательность случайных величии, и / = = / (х) — неотрицательная четная и при положитель- ном х монотонно возрастающая функция г). Тогда спра- ведливы следующие утверждения. I. Для сходимости последовательности (1) по веро- ятности достаточно следующее условие: для каждого е > 0 существует такое п, что для каждого р Д> О справедливо неравенство М/ Ц-п+р - < е. (2) И. Для сходимости по вероятности последователь- ности (1) к случайной величине | достаточно условие lim M/(?„-g) = 0. (3) n—*-J-oo ') Следовательно, / (x) > О, если х =£ О,
66 IV. МАТЕМАТИЧЕСКИЕ ОЖИДАНИЯ III. Если / (х) ограничена, непрерывна и / (0) — 0, то условия I и II являются также и необходимыми. IV. Если / (х) непрерывна, / (0) = 0 и все случайные величины I, U U ... ограничены в своей совокупности, то условия 1 и II являются также и необходимыми. Из II и IV следует, в частности, V. Для сходимости по вероятности последователь- ности (1) к | достаточным является условие lim М (g„ — а)3 == 0. (4) Если при этом |, |2, . . . ограничены в своей совокупности, то это условие является и необходимым. Доказательство утверждений I—IV см. в работах Slutsky [llnFrechet [1]. Впрочем, эти теоремы следуют почти непосредственно из формул (3) и (8) предшествующего параграфа. § 5. Дифференцирование и интегрирование математических ожиданий по параметру Пусть каждому элементарному событию со постав- лена в соответствие определенная вещественная функ- ция |( (со) действительного переменного t. Определение. Мы говорим, что | = {|( (со), — оо<^4<^ оо} есть случайная функция, если при каждом фиксированном t величина |( (со) является случайной величиной. Возникает тогда вопрос, при каких условиях знак математического ожидания является переместительным со знаками интегрирования и дифференцирования. Две следующие теоремы могут, не исчерпывая всей проблемы, дать во многих простых случаях удовлет- ворительный ответ на этот вопрос. Теорема I. Если для любого t математическое ожидание №,t (со) конечно, |( (со) дифференцируема <£ (ю) (по t для всех со) и производная |г (со) = —— по аб-
« а. ДИФФЕРЕНЦИРОВАНИЕ II ИНТЕГРИРОВАНИЕ 67 солюжно.чу значению всегда меньше некоторой опре- деленной постоянной, то = Mg: и. Теорема II. Если g, (со) по абсолютному зна- чению всегда остается меньше некоторой постоянно 1 К и интегрируема по t в смысле Римана, то Mg, (a) dt = мГЬ( (и) dt\, t' L «> _• a <i если только Mg, (co) интегрируемо в смысле Римана. Д оказательство теоремы I. Прежде всего заметим, что g;' (со) как предел случайных величин pppmipp, h =!, д н ’ ’2 и ’ является случайной величиной. Так как gj (со) огра- ничена, то существует математическое ожидание Mg; (со) (свойство VII математических ожиданий из § 2). Выберем теперь постоянное t и обозначим через А событие (со) - g (со) , __2-------------------g(R Д> 8 Вероятность Р (/1) стремится к нулю при h -г- 0 для любого е > 0. Так как всегда |^м, |g;(®)K'M и, кроме того, в случае со GE А ^Ч/,. (с0) —g/(co) — g,- (со) гД е, h
63 IV. МАТЕМАТИЧЕСКИЕ ОЖИДАНИЯ ТО j^^-^-M^Co) о |^+h(“)-M“) E',.J < м |----------------it (со) | = = Р(Л)м{^...(-ю2г5>(и). _g-f(t0)| л} + + р(J)м (| _g;(ю) | J}< ^2Л/-Р(Л) + е. Поскольку е > 0 можно выбрать произвольно, а вероятность Р (Л) сколь угодно мала при достаточно малом h, то d ... . . ,. ^t+h (®) — мч (®) . — М£( (со) = lim-----------г-------= Mg( (со), al h-o> " что и требовалось доказать. Доказательство теоремы II. Пусть п = h = ~- k=l b Так как Sn сходится к S — § (со) dt, то можно для любого 8 > 0 выбрать такое N, что для всех n > N Р {| Sn - S I > 8} < 8. Если положить А = {|5П — S |>е} и З’п = 4 S М£(+/£Л(со) = М5ш /г=1 ТО I s’n — MS I = I M (Sn - S) I < M |Sn - S I = = P (Л) M {I S„ - S 11Л } + P (Л) M {I Sn - S I IЛ} < <2SP (Л) + 8 < (2K + 1) 8.
§ 5. ДИФФЕРЕНЦИРОВАНИЕ И ИНТЕГРИРОВАНИЕ 69 Следовательно, S,, стремится к Мб1, откуда следует равенство ь ( (со) di = lim S(l = MS. a “ Теорема II может быть без всяких новых затрудне- ний обобщена для двойных и тройных интегралов. Мы дадим применение этой теоремы для одной задачи геометрической теории вероятностей. Пусть G = G (®) — квадрируемая область на пло- скости, вид которой зависит от случая, т. е. пусть каж- дому элементарному событию <о ЕЕ И поставлена в со- ответствие определенная квадрируемая область G (<в) на плоскости. Через SG обозначим площадь области G, а через Р (х, у) — вероятность того, что точка (ж, у) принадлежит области G. Тогда MSG — Р (#, У) dx dy. Для доказательства достаточно заметить, что SG = /g (х, у) dx dy, Р (ж, у) = М /g (х, у), где /с (х, у) — характеристическая функция области G [fc {х, у) = 1 на G и /с (х, у) — 0 вне GI х). ’) Ср. A. Kolmogoroff und М. Leontowitsth, Zur Berechnuiis; der mittleren Brownschen Flache, Physik. Zeitschr. d. Sowjetunion, t. 4 (1933).
V. УСЛОВНЫЕ ВЕРОЯТНОСТИ II МАТЕМАТИЧЕСКИЕ ОЖИДАНИЯ § 1. Условные вероятности В главе первой, § 6 мы определили условную вероят- ность Р (В | 31) события В относительно испытания "а. При этом там было предположено, что 3S допускает лишь конечное число различных возможных исходов.. Можно, однако, определить Р (В | Ш) также и для случая испытания 31 с бесконечным множеством воз- можных исходов, т. е. для разложения множества на бесконечное число пепорзсекающихся подмножеств. В частности, такое разложение получается, если рас- сматривать произвольную функцию | | (со) от со и определить в качестве элементов разложения 51 — = Sis множества {со: £ (®) = const}. Условная вероятность Р (В | 5(^) будет обозна- чаться также через Р(В| £). Любое разложение множества Я можно определить как разложение ЗЬ, которое «индуцируется» функцией 5 = 5(®) от (0> если каждому ® поставлено в соответствие в качестве £ (со) то множество из разложения 31, которое содер- жит со. Две функции £ и ц от со определяют тогда и только тогда одно и то же разложение (31^ = 31Д множества Й, если существует такое взаимно однозначное соот- ветствие у — f (ж) между пх значениями, при которых тождественно г) (со) = / (^ (со)). Читатель может легко показать, что определяемые ниже случайные величины Р (В | £) и Р {В | т|) в этом случае совпадают; следова- тельно, в основном они определяются самим разложе- нием 31= = Э(г,.
§ 1. УСЛОВНЫЕ ВЕРОЯТНОСТИ 71 Для определения Р (В | 1) можно применить сле- дующее равенство: P(Z? Цел) = м[Р(В Це 4]. (1) Легко показать, что в случае конечности множества X возможных значений 1 равенство (1) выполняется при любом выборе множества А (причем Р (В Ц) определяется согласно § 6 главы первой). В общем случае (для которого случайная величина Р (В | Е) еще не определена) мы докажем, что всегда существует одна и, с точностью до эквивалентных величин, только одна случайная величина Р (В | Е), определяемая как (борелевская) функция от 1 и удовлетворяющая при каждом А из для которого (Л) 0, уравнению (1). Определенную таким образом (с точностью до экви- валентности) функцию Р (В |1) от 1 мы называем условной вероятностью В относительно 1 (или при данном 1). Значение Р (В ! 1) при 1 = х мы будем обоз- начать Р (В | 1 = х). Доказательство существования и единственности Р (В Ц). Умножив (1) на Р {1 е 4} — (А), получаем слева р {ё е 4} Р(5 ц е 4) = р св п U е 4}) = = Р(О g'1 (Я)), а справа Р{1е 4}М[Р(В|1)|1еЛ] = = Р(5Ц)Р(<?®) = ^Р(В]1 = Х)Р;(<1Х). (M'.EeAV А Следовательно, Р(5ЛГМ))= Jp(5|1 = ^)P5(^)- (2) А Обратно, из (2) следует формула (1). В случае Р g (4) = 0, при котором (1) не имеет смысла, равенство (2) тривиально. Требование (2), следовательно, эквивалентно (1).
72 V. УСЛОВНЫЕ ВЕРОЯТНОСТИ И ОЖИДАНИЯ По свойству IX интеграла (глава четвертая, § 1) случайные величины 1] = т) (со) с точностью до экви- валентности однозначно определяются по значениям интегралов р (со) Р (dee), fief. в Так как Р (В | | — х) — случайная величина, опре- деленная па поле вероятностей (X, Pg), то отсюда следует, что формула (2) однозначно (с точностью до эквивалентности) определяет эту величину. Нале остается доказать существование Р (В | £). Для этой цели применим следующую теорему Радона — 1 Никодима !). Теорема. Пусть ,7 — борелевская алгебра мно- жеств в Y, Р — определенная на (У, (У) неотрицатель- ная счетно-аддитивная функция множеств, а Р — вторая определенная также на (Y, И), счетно-аддитив- ная функция множеств, причем из Р (Л) — 0 следует равенство Р (Л) = 0. Тогда существует измеримая [по отношению к И) функция ср = ср (у) (в теоретико- вероятностной терминологии — случайная величина), удовлетворяющая для каждого множества А из В равенству Р(Л) = ср (у) P(dy). А Для применения этой теоремы к нашему случаю остается доказать: 1° что Р (А) = Р (В ("] £~’ (Л)) счетно-аддитивна на (X, ^), 2° что из Р (Л) 0 следует неравенство Р5(Л)^>0. Утверждение 2° следует из того, что 0 < Р (В П g-1 (Л)) с Р а-1 (Л)) = Р g (А). *) О. N i ко d у m, Stir uno generalisation des integrates de M. J. Radon, Fund. Math., t. 15 (1930), 168 (theorems III). Cm. также цит. выше книгу A. H. Колмогорова и С. В. Фо- мина.
§ 1. УСЛОВНЫЕ ВЕРОЯТНОСТИ 73 Для доказательства утверждения 1° положим А = S Ап. п Тогда II и 5ПГН) = 2вАГ(4). и Так как Р счетпо-аддитивна, то р^пги» = 2р(^пг(Л)), п что и требовалось доказать. Из равенства (1) следует, в частности (если положить А = X), важная формула: Р(£?) = М [Р(5 | £)]. (3) Теперь мы перейдем к доказательству двух следу- ющих фундаментальных свойств условных вероятно- стей. Теорема I. Почти наверное О < Р (В | g) < 1. (4) Теорема II. Если события В, Bt,... принадле- жат f и в = ^вп, то почти наверное (5) Эти два свойства Р(5 | £,) соответствуют двум ха- рактеристическим свойствам вероятностной функции
V. УСЛОВНЫЕ ВЕРОЯТНОСТИ И ОЖИДАНИЯ Р (В): всегда 0 Р (В) 1 и Р (В) счетно-аддитивна. Они позволяют перенести па условные вероятности Р (• | £) многие дальнейшие существенные свойства абсолютных вероятностей Р(«). Однако при атом не следует забывать, что Р (В | t) при фиксированном множестве В является величиной, определенной лишь с точностью до эквивалентности. Доказательство теоремы!. Если мы предположим — в противоположность доказываемому утверждению,— что на множестве М с Вг (М) О выполняется неравенство Р (В ] |) > 1 -Д е, то по формуле (1) Р (В Не М) = М [Р (В Н) Ц е ЛЛ > 1 + е, что, очевидно, невозможно. Так же доказывается, что почти наверное Р (В | &) > 0. Доказательство теоремы II. Из схо- димости ряда 3M|P(B„|g)| = 3M[P(Bn^)] = SP(Bn)= Р(В) следует по свойству V математических ожиданий (гл. IV, § 2), что ряд 2р (5ПЦ) сходится почти наверное. Так как ряд Зм1Р(В„|&ше=Л] = SP(Bn|ge А) = P(B|g е Л) сходится при каждом выборе множества А такого, что Pg(H)^>0, то из упомянутого свойства V математи- ческих ожиданий следует, что для каждого множества А указанного вида имеет место соотношение M[2P(BJS)^e^l = 2M(P(Bn|c)|ge Л] = = Р(В|£еЛ) = М[Р(В|£)|£еЯ], из которого непосредственно следует равенство (5).
S 2. ОБЪЯСНЕНИИ ОДНОГО ПАРАДОКСА БОРЕЛЯ 7,5 13 заключение этого параграфа укажем на два част- ных случая. Пусть g(<a) = С — постоянная, тогда почти наверное Р (А | С) = Р (Л). Если положить, напротив, £ (со) = со, то получим сразу, что Р (Л | со) почти наверное равна единице на Л и нулю на Л. Сле- довательно, Р(Л | со) является характеристической функцией множества Л. § 2. Объяснение одного пава <окса Бореля Пусть за основное множество Q выбрано множество всех точек сферической поверхности. За мы примем совокупность всех борелевских множеств сферических поверхностей. Наконец, пусть Р(Л) пропорциональна мере множества Л. Выберем теперь две диаметрально противоположные точки в качество полюсов. Тогда каждый меридианный круг однозначно определяется соответствующей географической долготой ф (О ф ф <фл). Так как ф изменяется только от 0 до л, т. е. мы рассматриваем полные меридианные круги (а не полу- окружности), то и широта 0 должна изменяться от —л до л ^а не от —у до yj. Борелем поставлена следующая задача: определить «условное распределение вероят- ностей» для широты 0, —л 0 л, при заданной дол- готе ф. Легко подсчитать, что Р(91<0<02|Ф) = о. и, значит, распределение вероятностей для 0 при за- данном ф неравномерно. Еслп же теперь предположить, что условное рас- пределение вероятностей для 0 «при гипотезе, что и лежит на меридианном круге», должно быть равномер- ным, то получается противоречие. Это обстоятельство показывает, что понятие услов- ной вероятности относительно изолированно заданной гипотезы, вероятность которой равна пулю, является недопустимым: только тогда мы получим на меридиан-
76 V. УСЛОВНЫЕ ВЕРОЯТНОСТИ II ОЖИДАНИЯ ном круге распределение вероятностей для 0, если будем рассматривать этот меридианный круг в качестве элемента разложения всей сферической поверхности па меридианные круги с заданными полюсами. § 3. Условные вероятности относительно случайной величины Если £ = Е, (со) — случайная величина, то услов- ную вероятность Р (5 | |) можно определить также элементарным путём. В случае Р (7?) = 0 полагаем Р (В | |) = 0. Пусть теперь Р (В) 0. Тогда формуле (2) из § 1 можно придать следующий вид: Р(5)Р(£еП|Я) = Р(йЦ = х)/>и^) (1) А ИЛИ Р(Я) PZ(A I В) - А Отсюда получается непосредственно, что Р (В) Р\(а\В) = Р (В 11 = х) Frc (dx). (2) — ос Согласно одной теореме Лебега *) из (2) следует, что F- (х -I- h I В) — F, (х I В) Р(Д|1 = А-Г(В)-Ип; 4^+м-^А) ' ® с точностью до множества Н точек х такого, что Pt (77) =0. Если рассматривать теперь формулу (3) как определение Р (В | g = х), причем в случае несу- ществования предела в правой части (3) положить Р (В | £ = ж) = 0, то эта новая величина удовлетворяет всем требованиям § 1. *) Лебег, Интегрирование и отыскание примитивных функций, 1934, стр. 245—246.
§ 3. УСЛОВНЫЕ ВЕРОЯТНОСТИ 77 Если, кроме того, существуют плотности вероят- ностей (я) и (х | В) и если Д (х) 0, то формула (3) превращается в следующую: (х | В) Р(В= х) = Р(В)—^-^-у-. (4) Из формулы (3) следует также, что существование предела (3) и плотности вероятности (х) имеет своим следствием существование f$(x | В). При этом P(B)f^x |B)</B(z). (5) Если Р (В) 0, то из (4) следует равенство: k {X | В) =---. (6) В случае Д (х) = 0, согласно (5), / (х | В) = 0 и, следовательно, (6) также верно. Если при этом распре- деление абсолютно непрерывно, то Р(В) = АМР(Я|£)] = ^P(B|B)P(dco) = п = § Р (В = х)Fi(dx) = Р (В |В = х) (х) dx. (7) —-оо —-оо Из (6) и (7) следует, что J Р(В|5 = х)/£(х)& —ОО Это равенство дает нам так называемую теорему Байеса для абсолютно непрерывных распределений. Предположения, при которых эта теорема справедлива, следующие: Р (В | £ = х) измерима в смысле Бореля и определена по формуле (3), распределение £ абсо- лютно непрерывно (в точке х существует плотность вероятности /Е (я)).
78 v. УСЛОВНЫЕ ВЕРОЯТНОСТИ и изкьдлкил § 4. Условные математические ожндаппя Пусть £ = g (ю) — произвольная функция от со, а 1] = 1] (со) — случайная величина. Случайная вели- чина М (ц'|), пред ста ви .мая как функция от g и удовлет- воряющая для любого множества А из A s с Р s (Л) у> О условию М (п I I ~ Л) = М [М (ц I £) I g = А\ (1) называется (в случае, если она существует) условным м'ипе.'И'.тичесним ожиданием случайной се.шчины ц уи известном значении g. Умножив (1) на Р? (.4), получаем \ 4(«)Р(Ую)= \ М (Ж |Е) Ржи). (2) ЕЛ Обратно, из (2) следует формула (1). В служа Pt (Л) — 0, при котором (1) нс имеет смысла, (2) триви- ально. Так же как и в случае условных вероятностей (ср. § 1), доказывается, что М (ц | 5) определяется через (2) однозначно (с точностью до эквивалентности). Значение М (ц | £) при g (со) = х мы обозначаем через М (ц | g = т). Заметим еще, что М (ц | g), так же как и Р (В | g), зависит только от разложения и может быть обозначено через М (г| | 5Ц). При определении М (ц | £) уже предположено суще- ствование Мт] (если положить А = X, тогда М (ц | g 'E Eg А) = Мг|). Мы теперь докажем, что существования Мц п достаточно для существования М (ц | g). Для этого достаточно показать, что по теореме Радона — Никодима (ср. § 1) функция множеств 2(Л)= J <iC=A] счетно-аддитивна на f 5 и абсолютно непрерывна отно- сительно Р j (4). Первое обстоятельство доказывается дословно так же, как и в случае условных вероятно- стей (ср. § 1). Второе требование — абсолютной непре- рывности— заключается в том, что пз Q (А) == О
5 4. УСЛОВНЫЕ МАТЕМАТИЧЕСКИЕ ОЖИДАНИЯ 79 должно следовать неравенство Р5(Л)^>0. Если мы предположим, что Р 5 (Л) = Р (t Е .4) О, то ясно, что (?(Л)= Л(<о)Р(</<о) = 0. (E.SAI Таким образом, наше второе требование также вы- полнено. Если в равенстве (1) положить А = X, то полу- чается формула Мр — М [М (р | £)]. (3) Далее доказывается, что почти наверное М [ср + Ы | ?] = а М (р | g) + b М (£ | |), (4) где а и Ъ — две произвольные постоянные, /Л | р | -Д оо, М |£| < сю. (Проведение доказательств предоставляет- ся читателю.) Если | и I — две функции элементарного события <>), то пара I) может также рассматриваться как функ- ция со. Имеет место следующее важное равенство: М 1М(р | О| £] = М(р | I). (5) В самом деле, М (р | t) определяется через соот- ношение М(р ||(=Л) = М[М(р II) |£еЛ1. Следовательно, нужно доказать, что величина М [М (р | £, О | £] удовлетворяет равенству м (р I g е Л) = М {М [М (р Ц, 01 g] I g ЕЕ Л}. (6) Из определения М (р | Е, I) следует, что М(р |^ел)= M[M(p IS, I) |^€ЕЛ]. (7) Из определения М [М (р | £, £) | |] следует далее, что М[М(р II, □ = = М {М[М(р |£Л) (8)
80 V. УСЛОВНЫЕ ВЕРОЯТНОСТИ И ОЖИДАНИЯ Равенство (6) является следствием равенств (7) и (8), чем наше утверждение доказано. Если положить р (со) равным единице на В и нулю вне В, то М (р |£) = Р(5 | g), м (л | L □ = р (В | L В этоле случае из формулы (5) получается формула м (Р (В | L □ | £] = Р (В I £). (9) Условные математические ожидания можно опре- делить также и непосредственно через соответствую- щие условные вероятности. Для этой цели рассматриваются следующие суммы: оо оо 5х(В)= 2 /ЛР[П<П<(А’ + 1)МЫ= S (10) Если Mi] существует, то ряд (10) сходится почти наверное. В самом деле, по формуле (3), § 1 М | Bh | = /А Р {/А < 1] < (/г + 1) А}, а сходимость ряда 2 |/А|Р{/А<1]<(/с+1)л}= f М|ЛД 4' — — оо li = — 00 является необходимым условием существования Mr) (ср. главу четвертую, § 1). Из этой сходимости следует, что ряд (10) сходится почти наверное (ср. главу четвер- тую, § 2, V). Далее доказываем, так же как и в теории интеграла Лебега, что из сходимости (10) при каком- либо А следует сходимость при всяком А и что в случае сходимости ряда (10) S>. (%) стремится к определенному пределу при А —> О1). Можно тогда в порядке определе- *) При этом мы рассматриваем только счетную последова- тельность значений К: в этом случае все вероятности Р {/А < р < <(А; + 1) А | g) определены почти наверное для всех этих значений.
4 4. УСЛОВНЫЕ МАТЕМАТИЧЕСКИЕ ОЖИДАНИЯ 81 НИЯ положить М(Т)|В) = lim Sx(£). (11) Х-ю Для того чтобы доказать, что определенное соотно- шением (11) условное ожидание М (q | g) удовлетворяет поставленным прежде требованиям, нужно только убе- диться в том, что определенная, согласно (И), величи- на М (г] | |) удовлетворяет равенству (1). Это доказатель- ство протекает следующим образом: М[М(п|Ше4] = limM[Sx(£)|£eA] = X—*0 оо •= lim 2 < Л <(*+1)I £ 6^1 = м (Л I 1- Х~*о /£=—сс Перестановка знаков математического ожидания и предела допустима при этой выкладке, так как S\ (£) сходится равномерно к М (г| | J) при % —» 0 (простое следствие свойства у математических ожиданий из § 2). Перестановка знаков математического ожида- ния и суммирования также оправдана, так как ряд 2 M{|*MP(^<r]<(/c + l)X|g)|gGU} = = 2 |^|P{*x<r]<(fc + l)X|g е А} к»*— оо сходящийся (непосредственное применение свойства V математических ожиданий). Вместо (11) можно написать М(т]|В) = n(®)P(da>|g). (12) Не следует, однако, при этом забывать, что (12) не является интегралом в смысле § 1 главы четвертой, так что (12) — только символическое обозначение. Если В — случайная величина, то функцию от £ и у F^y I £) = Р (Л < У I £)
82 V. УСЛОВНЫЕ ВЕРОЯТНОСТИ И ОЖИДАНИЯ мы называем условной функцией распределения л при известном £. Функция (у | В) определена почти на- верное при всяком у. Если i/j у2, то почти наверное Л, (У1 | В)< Л (у2 | I). Из (11) и (10) следует, что почти наверное M(r]|5) = lim 2 Н IF„((A + l)l|g) - Л,(Л1|В)]. Х-*0 оо (13) Это обстоятельство можно символически выразить фор- мулой ео М (л ID = yF* (dy I В). (14) — 00 С помощью нового определения математического ожидания (10), (И) легко доказать, что для действи- тельной функции / (В) с М I / (В) л |< оо справедливо (почти наверное) равенство м [/ (В) ni и =/шм [т]| а
VI. НЕЗАВИСИМОСТЬ. ЗАКОН БОЛЬШИХ ЧИСЕЛ § 1. Независимость Определение I. Две функции £ = £(«) и г] = т] (со) называются независимыми, если для любых двух множеств А из^ЕиВиз^л справедливо следующее равенство: р (В е А, Ц е В) = р (| е А) р (ц е £). (1) Если множества X и У состоят лишь из конечного числа элементов: X = хг + ... + хп, Y — У1 + ••• + Ут, то наше определение независимости £ и ц совпадает, согласно § 5 главы первой, с определением независимо- сти разложений й = 2 : g (ю) = хк}, к=1 т й = 2 {« : Т] (®) = Ук}. к=1 Для независимости и т] необходимо и достаточно следующее условие: при любом выборе множества А из $ j почти наверное выполнено равенство Р(£е А И) = P(U А). (2) В самом деле, в случае, когда (В) = 0, оба ра- венств (1) и (2) удовлетворяются. Следовательно, до-
84 VI. НЕЗАВИСИМОСТЬ. ЗАКОН БОЛЬШИХ ЧИСЕЛ статочно доказать их эквивалентность в случае Р^(й) 0. В этом случае (1) эквивалентно соотношению р (В е а | п е в) = р а е л) (3) и, значит, соотношению м[Р(Нел |т))|лев] = Р(ВеЛ). (4) С другой стороны, видно, что из (2) следует равен- ство (4). Обратно, так как P(gE Л | ц) однозначно определяется из (4) с точностью до множеств вероят- ности нуль, то из (4) почти наверное следует равен- ство (2). Определение II. Пусть S — множество функций В* (<в), где v ЕЕ N. Эти функции называются независимыми в совокупности, если выполняется сле- дующее условие: пусть 2'иЕ" — два непересекающих- ся подмножества из S, Л' (соответственно Л") — множество из определяемое соотношением меж- ду |v (со) из S' (соответственно S"); тогда Р(Л'ПЛ") = Р(Л') Р(Л"). Совокупность всех gv (со) из S' (соответственно из S"), можно рассматривать как координаты некоторой функции |' (соответственно |")- Определение II требует лишь независимости |' и |" в смысле определения I при каждом выборе непересекающихся множеств S' и 2''. Если |lt |2, . . . , |п независимы, то всегда Р (Bi GE Л15 g2 £= А2, . . . , Вп = = Р (Bi е Лх) р (В2 е л2). . . р (Вп е л„), (5) если только множества Л^ принадлежат соответствую- щим^-^ (доказательство посредством индукции). Этого равенства, одпако, в общем случае никоим образом не- достаточно для независимости |lt |2, ..., In- Равенство (5) без затруднений обобщается на слу- чай счетного произведения.
§ 2. НЕЗАВИСИМЫЕ СЛУЧАЙНЫЕ ВЕЛИЧИНЫ 85 Из независимости случайных величин в каждой конечной группе , . . . , ), вообще говоря, еще не следует, что все gv независимы. Наконец, легко заметить, что независимость функций |v, собственно говоря, является свойством соответствующих разложений 91^. Если, далее, — однозначные функции соответствующих £v, то из независимости следует независимость § 2. Независимые случайные величины Если £lf £2,. • • » In — независимые случайные величины, то из равенства (2) предыдущего параграфа следует, в частности, формула ъ..Еп (*i, z2,.. ., xn) = (хх) F., (хг) ...F^n (хп). (1) Теорема 1. Если алгебра множеств состоит только из борелевских множеств пространства Rn, то условие (1) является также достаточным для независимости величин §2, . . . , £п. Доказательство. Пусть Г = (^„ h„ ..., и — две непересекающиеся подсистемы величин gj, |2, . . . , |п. На основании формулы (1) следует доказать, что для любых двух бо релевских множеств А' и А" соответственно из 7?* и Rm выполняется равенство Р(5'еЛ', г ел") = Р(5'еЛ')Р(ГеА'). (2) Для множеств вида А' = {(ач„..xijc): xit <«!,..., xt]! < аД, Л" = {(xjt,..., XjJ : z31 < blt.. ., Xjm < bA это следует непосредственно из (1). Далее доказывается, что это свойство сохраняется для сумм и разностей множеств указанного вида, от- куда равенство (2) следует и для всех борелевских мно- жеств.
86 VI. НЕЗАВИСИМОСТЬ. ЗАКОН БОЛЬШИХ ЧИСЕЛ Теорема II. Пусть £ = {|v} — произвольная (вообще бесконечная) совокупность случайных величин. Если алгебра множеств совпадает с з-алгеброй <з (А^ есть множество всех v) х), то совокупность равенств (xi,...,хп) = Ft- (х±) ...F„ (хп) (3) 1 п 1 п необходима и достаточна для независимости величин U V «А . Доказательство. Необходимость этого ус- ловия следует непосредственно из формулы (1). Мы теперь докажем, что оно также и достаточно. Пусть Ж'и Ж" — два непересекающихся подмноже- ства из множества А1' всех индексов v, А' (соответствен- но А") — множество из о(f^), определенное соотно- шением между с индексами v из А^' (соответственно из Ж"). Следует доказать, что тогда выполнено равен- ство Р(Л' П А") = Р(Л')Р(Л"). (4) Действительно, если А' и А" — цилиндрические множества, то мы имеем дело с соотношениями между конечным числом величин gv, и равенство (4) представ- ляет в этом случае простое следствие предшествующих результатов (формула (2)). А так как соотношение (4) сохраняется для сумм и разностей множеств А’ (соот- ветственно А"), то (4) доказано для всех множеств из 3 (^). Пусть теперь для каждого v из некоторого множест- ва AF задана a priori функция распределения F., = Fv (х). Теорема III. Существует поле вероятностей (й, &, Р) и определенные на нем случайные величины £v, v Е= Ж, которые независимы в совокупности, а каждая из величин имеет в качестве функции распределения a priori данную функцию Fv (х). Доказательство. Примем за основное мно- жество й пространство R^ (множество всех систем (о = {я\} действительных чисел xv, v •#), а в каче- J) См. § 4 гл. 111.
6 2. НЕЗАВИСИМЫЕ СЛУЧАЙНЫЕ ВЕЛИЧИНЫ 87 стве & возьмем з-алгебру *) б Положим далее gv (со) — xv и определим функцию распределения F^..., „ равенством F^.-^n (^1» • • •> Хп) = F-Ч Ы • • F->n М- Тогда, согласно основной теореме (§ 4, гл. III), на (£2, однозначно определена вероятностная функция Р, причем Р {gv < х} = Fv (х) для любого v е Заметим еще, что, как было видно выше, из неза- висимости всякой конечной группы величин (равен- ство (3)) следует независимость всех gv на з(^-4"’)- В объемлющих полях вероятностей это свойство может утеряться. В заключение этого параграфа дадим еще некоторые признаки независимости для двух случайных величин. Если две случайные величины g и ц независимы и если Mg и Мц конечны, то почти наверное М (т] | g) = Мт], (5) M(g |т)) = Mg. Эти формулы представляют непосредственное след- ствие второго определения условных математических ожиданий (формулы (10) и (11) § 4 пятой главы). Сле- довательно, в случае независимости g и ц величины 2 М [г) — М (т| | g)]2 = M[g-M(g|n)p ‘ Dr) ’ в Dg равны нулю (предполагается, что Dg 0 и Dr] 0). Число /2 называется корреляционным отношением ц по g, g2 — корреляционным отношением g по т] (Пирсон). Из (5) далее следует равенство М gr] — М g-M т], (6) для доказательства которого надо воспользоваться фор- мулой (15) из § 4 пятой главы: Mgr] = М [М (gp) | g] = М [gM (т) | g)] = М [g-Мц] = = Mg-Мц. !) См. § 4 гл. III.
88 VI. НЕЗАВИСИМОСТЬ. ЗАКОН БОЛЬШИХ ЧИСЕЛ Следовательно, в случае независимости £ и q вели- чина _ Му] —Mg-Mg Р ~ YbE,.D-ri также равна нулю. Как известно, р — коэффициент корреляции между | и г]. Если две случайные величины J и q удовлетворяют равенству (6), то они называются некоррелированными. Для суммы s = §1 + + • • • + Вп попарно некоррелированных величин glf £п легко сосчитать, что Ds = + D£2 + . . . + DL- (7) В частности, равенство (7) справедливо для неза- висимых величин gx, §2, . . . , |п. § 3. Закон больших чисел Определение. Случайные величины т]п по- следовательности Ли Л«, • • • » Лп> • • • называются устойчивыми, если существует такая чис- ловая последовательность ^1» » dn, . . что для любого положительного в р { I Лп — dn | > в} -> 0, п -+ оо. Если существуют все Мт)ге и если можно положить dn = Мг)„, то говорят, что устойчивость нормальная. Если все г)п равномерно ограничены, то из Р { I Лп — Ъ | > в} -> 0, п -> оо, (1)
§ 3. ЗАКОН БОЛЬШИХ ЧИСЕЛ 89 следует соотношение I М — dn | -> 0, п -> оо, и, следовательно, Р { I Л« — Mi]n | > е) -> 0, оо. (2) Таким образом, устойчивость ограниченной последо- вательности необходимо нормальна. Пусть б* = D ть ( = М (Пп — Мт]п)2). По неравенству Чебышева ап Р{|Пп —мПп|>е}< —. Следовательно, условие Маркова: б„—>0, п—> оо, (3) достаточно для нормальной устойчивости. Если т]п — Мрп равномерно ограничены, I Лп — Мрп | < С, то по неравенству (9) из § 3 четвертой главы з2 — е'г р {| Лп — МЛп | > е} > —тч— • Следовательно, в этом случае условие Маркова (3) является также и необходимым для нормальной устой- чивости рга. Если + & +•••+£„ п„ =------------- и величины попарно некоррелированы, то Dpn = ^|Ds1 + Dl2+--- + Dgn], Следовательно, в этом случае для нормальной ус- тойчивости средних арифметических р„, т. е. для того,
90 VI. НЕЗАВИСИМОСТЬ. ЗАКОН БОЛЬШИХ ЧИСЕЛ чтобы для всякого е 0 [ I Ji 4-1- ? M5i 4--1- me Um р | 2_Z—Z22.----- n U « » > ej = 0, достаточно выполнения следующего условия: п Иш 2 D;- = о (4) п 1=1 (теорема Чебышева). В частности, условие (4) выполне- но, если все величины gn равномерно ограничены. 1. Можно обобщить эту теорему на случай слабо коррелированных величин Если предположить, что коэффициент корреляции Ртп1) между %т и удовлет- воряет неравенству Ртп < с (| т — п I) и что с (к) > 0, то для нормальной устойчивости сред- них арифметических, т. е. для того, чтобы для всякого е 0 >е( 0 „ U » » ’ достаточно выполнения условия2) п (5) " i=i п—1 где Сп = 2 с (*)• 2. В случае независимых слагаемых |п можно дать также необходимое и достаточное условие для устой- чивости средних арифметических т]п. *) Ясно, что всегда рпп — 1. 2) Ср. A. Khintchine, Sur la loi forte des grandes nombres, C. fl. de 1’Acad. Sci,, Paris, t, 186 (1928), 285,
§ 3. ЗАКОН БОЛЬШИХ ЧИСЕЛ 91 Для каждого 1-п существует константа тп (медиана удовлетворяющая следующим условиям: Р (L < тп) < , р (In > тп) < 4" • Положим Е — / еСЛ11 I — т1с\^п1 ( 0, если । gfc — mf{1 > п, . _ Ini Ч н 1ПП Чп п Теорема1). Пусть |х, — последователь- ность взаимно независимых случайных величин. Тогда условия 2 Р{|зд — = 2р=¥=£*}—>о, п->оо, 11—1 S=1 (6) 4-2DU->0. (7) fc=i необходимы и достаточны для устойчивости величин Лп» ^»2, . . . При этом постоянные dn, п = 1,2, . . . j можно принять равными Мт]п, так что в случае М< — мПп п -* 00 (и только в этом случае) устойчивость нормальная. ’) Ср. A. Kolmogorov, Uber die Summen durch den Zufall bestimmter unabhangiger Grossen, Math. Ann., t. 99 (1928), стр. 309—319 (исправления и замечания к этой работе, т. 102 (1929), стр. 484—488), теорема VIII и добавление к ней на стр. 318. 5*
92 VJ, НЕЗАВИСИМОСТЬ. ЗАКОН БОЛЬШИХ ЧИСЕЛ Доказательство. Достаточность условий (6), (7) устанавливается просто. В самом деле, поскольку п Р(Д, =/=<)< S P(U=^)-*0, И —> оо, А'=1 а согласно неравенству Чебышева Р{1С — MTCI>8X-i- S DU-*o, п->оо, то Р { I Пп — I > в} 0, п -> оо. Для доказательства необходимости нам понадобит- ся ряд вспомогательных предложений. Лемма 1. Пусть А„ Аг, . . . , Ап — независи- мые события, Р (Лг) О, i = 1, 2, ... , пи для п некоторого u>0 Р( (J Лг)>и. Если, кроме того, событие U таково, что для каждого I = 1,2, . . ,,п Р (U \At)>u, то тогда Р(П)>-^-и\ (8) Доказательство. Если существует такое г, что Р (Л г) > и, то Р(£7)>Р(У|Л)Р(4-)>4-и2‘ Пусть теперь для всех i — 1, 2 , . , . , п р(Л)<4-«- Тогда найдется такое к, что 4и<р(л1и...илх4м’
§ 3. ЗАКОН БОЛЬШИХ. ЧИСЕЛ 93 и, значит, для всех г к Р(Л2и ....и А-ll Д) = Р(Аи ...и Л-хХ <P(AU ••• U А)<-|-н’ р (и л (Л и ... U | At) > -1- и, Р(С7 п (Л. U • • • (J A-i) П А) > Отсюда Р R > 2 р V п (Л и ... и АА п А) > г—I >4“ S Р(А) >4-uP(AU ... и А) i=l Лемма 2. Пусть &2, . . . , £п — независи- мые, ограниченные, | g, | 'С с, i = 1, . . ., п, случай- ные величины с нулевыми средними. Тогда для всякого а Л 0 и целого т Р {max |gx-t---h | > m (aD + c)}< ~^r, (9) где D2 = 2 D&. i=l Доказательство. Обозначим R = aD + c, s0 = 0, sft == + . . . + gh, = {co : | Sj | < iR, j<k; | sk | > iR}, Bi = 2 Bik. /c=l Замечая, что па множестве Rih I sh I A c,
94 VI. НЕЗАВИСИМОСТЬ. ЗАКОН БОЛЬШИХ ЧИСЕЛ получаем Р (#i+1 ] B.its) = Р { max | sj >(i -f-1) R | Bik} < p P { max I 2 5j I > °-B | #ifc| = = p{ max I 2 I ,=ft+1 I J Из доказываемого далее неравенства (3) теоремы II § 5 следует, что Р 2 % Р| max I 2 Bjl >а£>)—Чтгё— —Sr = “V• U+i<p<n I jJq-j I J a? 1 Поэтому P (2?;+11 jBj-j) при любом к — 1, 2,..., n. Значит, p(si+1i^)<4- и P { max | «й | > mR} = P (Z?m) = Klt<n = P (Bm | 2?m-l) P (Bm-l I -Sm-2) • • . P (Bi I Bq) ~ . Ct Лемма 3. Пусть Bi> 1г» • • •> 5» — независи- мые ограниченные случайные величины, причем ) — М |г | «С С, i = 1, 2, . . . , п. Тогда Р I j 51 + • • • + £n I > в) > 16QQ 1 4а2 4- С8 1 J i=i (10) Доказательство. Обозначим s = + n + • . . + In, В2 = 2 Если С D или 2а D, 1—1 то правая часть в (10) отрицательна и неравенство очевидно.
§ 3. ЗАКОН БОЛЬШИХ ЧИСЕЛ 95 Пусть теперь одновременно С D, 2а D. Тогда достаточно показать, что поскольку, очевидно, Обозначим А = { | s | > Если |Ms | 2D, го D2 > Р (4) М {(s — Ms)2 | 4} > (2D — Р (А) = = 4 D2p и, значит, р(Л)>4- Предположим, теперь, что |М s ] < 2D. Обозначая Ат = |со : 3mD 15 — Ms | <4 3 (т 4- 1) D, | s | > и применяя лемму 2, находим Р Ит) Р {| s — Ms | > 3mD} = Р {| s — Ms | > >m[2P + Z)J}<P{|s-Ms|>m[2P + C]}< ~4г- Отсюда М (s21 Ат) Р (4m) = М [(s — Ms)2 + 2 (s — Ms) Ms -|- + (Ms)21 Am] P (4m) < 2s ' D2. Иа множестве A' — 2 m=0 | s К | s — Ms | + | Ms |< 20-D. Поэтому M (s2 | A') P(4')< 400 D2 P (4).
9f> VI. НЕЗАВИСИМОСТЬ. ЗАКОН БОЛЬШИХ ЧИСЕЛ Ясно также, что М(52|Я)Р(А)<-^-/)2. Следовательно, 2Я < Ms2 = М[52|Л]Р(Л) + M[s2| А'] Р(Л') + оо + 2 м|52|лт|Р(^т)< т==в со < 4“ D2 + 400Р2Р (Л) + 2 •25 ’ Д2> и, значит, > W Доказательство теоремы. Необ- ходимость. Пусть последовательность dn, п — 1, 2, ... , такова, что для любого е О Р (| т]п — dn | > е) ->• 0, п -> оо. Покажем, что тогда 2 Р — тД >«е)-> 0, н-»оо. (И) <<=1 Обозначим для данного п Поскольку mh — медиана то P(U\Bhy>^-.
§ 3. ЗАКОН БОЛЬШИХ ЧИСЕЛ 07 Для достаточно больших п поэтому 4- > Р (^) > Р W I Вк) Р (5,) > 4- Р (5,), т. е. р(ад<4- Далее, если событие A h выполняется, a Bh пет, то выполняется событие U и, значит, ?(Bh \Ah) + P(U \Ak)>l. Но Р(Вк|Лй) = Р(Вл)<-1-. Следовательно, Р(С7| Лк)>1-Р(Вк|Л)>4->4-Р(и А). z z k=i Применим лемму 1, взяв « = 4-р(ил)- z k=i Тогда P(t7)>4-[P(U 4)р. (12) События , Ап независимы, поэтому Р(йл) = 1-П(1-Р(А))- (13) *=’ к=1 Поскольку по условию Р (Z7) -> 0, п -> оо, то из (12) и (13) получаем искомое соотношение (И), Положим теперь _ р», если 1— тк | < п, п* [тк, если | — тк (п,
98 VI. НЕЗАВИСИМОСТЬ, ЗАКОН БОЛЬШИХ ЧИСЕЛ fa, если | — тк | < ел, рпь если |§;г — т(.| _>£?!. Из (11) следует, что еслгС Р {| т)п — dn | е) -> О, п -> ОО, то и Обозначим ^nft(e) = gnft(e) — Mgnft(e). Тогда | Спь(е)|< sgC 2 пе и по лемме 3 р || 2 Ink (е) — d„ I > е| = ч 1-—1 1 = Н| 2 tni(e) — rad,J > — P (| 2 (InS (e) dn) I ew| 1600 ч A-^,1 I ) откуда lim sup 2 Dgn/C (e) < 8s2. n 1C=1 8в2я3 2 °tnk(e) fc=i (14) Для E 1 I Dfn,v (8) — Dgn(t I < 8w2P {| l!s — mk I > ne}. Тогда из (И), (13) и (14) следует, что lim sup 2 D|«* < 8е2, п П к=1
s 8. ЗАКОН БОЛЬШИХ ЧИСЕЛ 99 а значит, в силу произвольности е е(0, 1] п п S =lim-^ 2 = о- n &=1 ” Л—1 3. Дальнейшее обобщение теоремы Чебышева полу- чается, если предположить, что каким-нибудь об- разом зависят от исходов каких-либо п испытаний 94, 94,..., К, так что после каждого определенного исхода всех этих п испытаний 1]п принимает определенное значение. Общая идея всех теорем, известных под названием закона больших чисел, состоит в том, что если зависи- мость величины от каждого отдельного испытания 9lft, к — 1,2, . . . , п, очень мала при больших п, то величины Г)п устойчивы. Если рассматривать = М [М (рп 194, Sl2,... , 9lfc) - М (T]n 1911, ^2.I2 как разумную меру зависимости величины гр, от испы- тания 94, то вышеупомянутая общая идея закона больших чисел может быть конкретизирована следую- щими рассуждениями ’). Пусть £nis == М [1]„ 1911,..., 91J — М [г)п | 94,..., 94-1]. Тогда Лп — Mip, = + £п2 + • • • + £пп, MU = ММ hn 194,..94] - ММ ]т]п 19(1,..., 9С*-!] = = Мрп — М% = О, DU = М&, = Легко, далее, подсчитать, что случайные величины tnfe, к = 1,2, . . . , п, некоррелированы. В самом деле, *) Ср. A. Kolmogoroff, Sur la loi des grandes nom- brcs, Rend. Acad. Lincei, t. 9 (1929), 470—474,
100 VI. НЕЗАВИСИМОСТЬ. ЗАКОН БОЛЬШИХ ЧИСЕЛ пусть i < к, тогдаг) М [UU I 9lj, • . 91,-i| = SniM IU I = = £niM{M(rln|9li,...,9l,)- — M (t],i | 9Ii,..., 91,-i) | Sli, • • •» 91,-i) = = tni [M (i]n I 9I1(..., 91,- M (n„ I 9llt.. ., 91,-JJ = 0 и, следовательно, MUU = 0, i<7;. Итак, n n Dr,™ = 2 Dw = 2 Pnt. i—1 i=l Таким образом, условие У [3ni->0, п -> оо i—1 достаточно для нормальной устойчивости величин рп. § 4. Замечания к понятию математического ожидания Мы определили математическое ожидание величи- ны £ как оо Mg = (со) Р (dco) = \ xF=_ (dx). Q —оо При этом интеграл в правой части понимается в смысле Mg = xF^(dx) = lim \jxF-^(dx'). (1) -оо а—-ОО “ О—*4-00 , Напрашивается мысль о том, чтобы рассматривать вы- ражение М£ = lim § xF^ (dx) (2) а-,4-00 _а 1) Применение формулы (15) § 4 гл. V,
J 4. ЗАМЕЧАНИЯ К ПОНЯТИЮ ОЖИДАНИЯ 101 в качестве обобщенного математического ожидания. Однако при этом теряются некоторые простые свойства математических ожиданий. Например, формула М IS + ill = М| + Ml] не всегда верна. Далее мы увидим, что при некоторых ограничивающих предположениях определение (2) яв- ляется вполне естественным и пригодным. Именно, можно поставить вопрос следующим обра- зом. Пусть Sjl • • • ! Sn! • • — последовательность независимых величин, имею- щих ту же функцию распределения F^(x) — Fin(x), п — 1, 2, . . . , что и Пусть далее Пп = --------------1 • Спрашивается, существует ли постоянная М° £ такая, что при каждом 8 О limP {|т]п— M°g|>e} = 0. (3) п Ответ гласит: если такая постоянная Mcg сущест- вует, то М°£ = М£. Необходимое и достаточное условие для существования М°£ заключается в существовании предела (2) и выполнении соотношения P(|S|>n) = o(4-). (*) Этот результат непосредственно вытекает из сле- дующей теоремы. Теорема. Пусть £2, . . . — последователь- ность независимых одинаково распределенных случай- ных величин с функцией распределения F (х). Для ус- тойчивости средних арифметических Ь 4- ^2 4-... + чп _ п„ = --------------- . п = 1. 2. ...
102 VI. НЕЗАВИСИМОСТЬ. ЗАКОН БОЛЬШИХ. ЧИСЕЛ необходимо и достаточно выполнение условия (4). При этом в случае устойчивости можно положить п dn — § xF (dx). —п Доказательство. Обозначим (^, если | — т | < п, ^п1с ' [0, если | £;с — т | > п, где т — медиана случайной величины £г. Из условия (4) следует, что п Sр ¥= ь) =п? (I Bi — т I >«) -> °, п -> 30 к=1 и lim — x2F (dx) = lim — x2F (dx). (5) n n J ?г 11 e) {x: |x—mj<n} |x|<n Ио n -i- x2F (dx) = 2 |xK« ft=lft-l<|.T|Cc n k=l ft /с n n <4s zp<z -1 <i^i<z)<4szp(i^i>z-1)->0- r=i M поскольку lp {I lil> I- l}->0, /-> oo. Поэтому n n /i=l /.-=1 = x2F(dx)—>0, n—>oo. |s—m|<n
s 4. ЗАМЕЧАНИЯ К ПОНЯТИЮ ОЖИДАНИЯ 103 Таким образом, условия (6), (7) теоремы из § 3 вы- полнены и для всякого 8 0 Р (| — Mr;,, | е) —> 0, п->оо, где ? . 1 । £ р Mpn = М ——------------xF (dx). Jx—-mKn Но в силу условия (4) xF (dx) — \ xF (dx) —> 0, n —> оо, |x— поэтому P(| Т]„ — > е)—>0, п-~> оо, где п dn = xF (dx). —п Обратно, если последовательность pn, п — 1, 2, . . . устойчива, то в силу соотношения (11) из § 3 пР { | — т | )>«}-> О, п -> оо, откуда следует условие (4). Если существует математическое ожидание в преж- нем смысле (формула (1)), то условие (4) всегда выпол- нено *) и М = М°£. Таким образом, М° (£) является законным обобще- нием математического ожидания М (%). Для него со- храняются свойства I—VII (глава четвертая, § 2), од- нако в общем случае из существования М° (£) не сле- дует существование М° | £ |. Для того чтобы доказать, что новое понятие матема- тического ожидания является действительно более об- щим, чем предыдущее, достаточно следующего примера. *) Ср. A. Kolmogoroff, Bemerkungen zu meiner Arbeit, Uber die Summen zui'alliger Grossen, Math. Ann., t- 102 (1930), стр. 484—488, теорема XII,
104 ' VI. НЕЗАВИСИМОСТЬ. ЗАКОН БОЛЬШИХ ЧИСЕЛ Возьмем плотность вероятности ft(x) равной = (| г-1 + 2)2 In (| Ж | + 2) ’ причем постоянная С определяется из условия ОО j^(x)dx = 1. — оо Легко далее подсчитать, что в этом случае выполнено условие (4). Формула (2) дает значение М°£ - О, однако интеграл оо оо | х | (dx) = | х | (х) dx -00 —оо расходится. Если О есть отрезок [0,1] и Р — лебеговская мера, то М° £ есть не что иное, как А-интеграл ‘) 1 (A)^((o)P(d(o). о § 5. Усиленный закон больших чисел, сходимость рядов Определение. Случайные величины г|я по- следовательности По Иг. • • • > Нп> • • • сильно устойчивы, если существует такая числовая по- следовательность dy, d-i, . . . , dn, . . . , 1) См., например, Н. К. Бари, 1 ригономотрпческие ряды, физмап из, 1961.
§ 5. УСИЛЕННЫЙ ЗАКОН БОЛЬШИХ ЧИСЕЛ 105 • что случайные величины Лп dn почти наверное стремятся к нулю при п оо5 Р {lim (ti„ — dn) = 0} = 1. п Из сильной устойчивости следует, очевидно, обыч- ная устойчивость. Если можно выбрать dn = Мт]п, то говорят, что сильная устойчивость нормальна. Теорема I. Пусть £2, . . . — последователь- ность независимых случайных величин. Для сильной нормальной устойчивости средних арифметических ^ + ...+ ^п п = 1, 2,..., (1) достаточно выполнения условия х) (2) Это условие является наилучшим в том смысле, что для любого ряда неотрицательных постоянных Ъи о.,, . . . таких, что 2л ~ — °° > можно построить та- n=i кой ряд из независимых случайных величин glt £2, • • • , что D = Ьп, а соответствующие средние арифме- тические т]п, п — 1,2, . . . , не будут сильно устой- чивы. Для доказательства нам понадобится неравенство (3) из следующей теоремы. Теорема II. Пусть g17 §2, . . . , — незави- симые случайные величины с нулевыми средними. Тогда х) A. Kolmogoroff, bers, С. R. Acad. Sci., Paris, Sur la loi forte des grandes пот- v. 191 (1930), 910-911.
106 VI. НЕЗАВИСИМОСТЬ. ЗАКОН БОЛЬШИХ ЧИСЕЛ для любого а'У 0 Р{ max |?i + ... + л к~1 а2 (3) Если к тому же случайные величины g1}. . . , ог- раничены, 15; ! о, i = d, . . , п, то справедлива так- же оценка снизу Р { max | + ... + | > а} > 1 1<4<т (а + «)3 (4) 2 ^4 4=1 Доказательство теоремы II. Поло- шим s0 = 0, sh = -Н . . . + gfi, А = { max | | > a), Ak = { max | Sj | < а, | sk | > а}, n где ft = 1,2 . п. Тогда Ah — А, и, обозначая 1в — h=l индикатор множества В, находим п п 2 D5k = М4 > М [4/а] = 2 м [4/аД = 4=1 4=1 п п = 2 + («п — «4)]2^Ак} = S + 4=1 4=1 п п + S ^Ак (®п — S4)S + 2 2 М [/A;S/t (sn — S4)] > 4=1 4=1 >^ЗР(А,) = ^Р(Л), (5) где мы использовали то, что м llA.fi (Sn — sk)] = М (sn — sk 15t,..5S)] = 0. Из (5) следует требуемое неравенство (3).
§ 5. УСИЛЕННЫ!! ЗАКОН БОЛЬШИХ ЧИСЕЛ 107 Чтобы установить (4), заметим, что, с одной стороны, М[4/д] = Мв^-м^> п П 2 D|s-a2P(J) = 2 D^-a* + a2P(A). (6) ft=l !i'=l С другой стороны, воспользуемся тем,что на множест- вах Ак | а, и, значит, | sh | а + с. Тогда м [^/д] = 2 м [^41 + 2 м iiAl; (s,t - Sj2i < ?l=l п n n <(« + су 2 p(A) + 2 p(A-) 2 A’=l ft=l J=/c4-l n < Г(«Ч-С)2 + 2 DgJ P(4). (7) L j=i J Из (6) и (7) получаем искомое неравенство 2 D^-«2 P(A)>---------------------= (a + c)’- + 2 D^. - a2 fc=l _ j(a + c)3 > 1 — + • (a4-A2+ 2 2 D54 !.'=1 lc=L Доказательство теоремы I. He огра- ничивая общности, можно считать Mgn = 0, п = 1, 2, . . . Тогда для доказательства того, что средние арифметические нп = ~ сходятся с вероятностью еди- ница к нулю, достаточно доказать, что для любого е 0 вероятность Р lim sup n —I >4=о- n I J
108 VI, НЕЗАВИСИМОСТЬ. ЗАКОН БОЛЬШИХ ЧИСЕЛ В силу неравенства (3) Поэтому Заметим теперь, что вероятность Р не изменится, если ваменить нулем любое конечное число первых членов последовательности £2, . . . Значит, для любого N n=N Vi D5 что в силу сходимости ряда у, доказывает, что п=1 Р = 0. Для доказательства заключительного утверждения теоремы построим последовательность независимых случайных величин g2, . . . следующим образом. Ь Если -т <; 1, то возьмем Sn = Sn = Sn = О с вероятностями Ъп Ьп , _ 2п2 ’ 2п2 ’ 1 п2 соответственно.
§ 5. УСИЛЕННЫЙ ЗАКОН БОЛЬШИХ ЧИСЕЛ 109 Если же то положим га2 ’ L = 1 с вероятностями, равными Тогда М£п = 0, МЙ = Ьп. Если теперь предпо- ложить, что на множестве положительной вероятно- сти 0, тг -> оо, то тогда из равенства _ sn f га — 1 \ Sn-1 га га \ га ] п — 1 будет следовать, что с положительной вероятностью Е 00 I) > 0, п -> оо. Но в силу расходимости ряда У, —£ П=1 РЯД зр{14|>1}=~- п=1 4 1 7 Отсюда в силу леммы Бореля — Каптелли следует, что не может с положительной вероятностью схо- диться к нулю. В случае, когда независимые случайные величины li, ёа> • • • имеют одну и ту же функцию распределе- ния F = F (х), можно дать необходимое и достаточное условие для сильной устойчивости средних арифме- тических. >) Здесь и далее используется следующий вариант леммы Бореля — Кантелли: если A t, Ач,... — последовательность событий таких, что пх индикаторы 1А , 1А ... независимы, то ОО У] < оо с вероятностью единица тогда и только тогда, эо когда 3 рм„х оо. Н=1
110 VI. НЕЗАВИСИМОСТЬ. ЗАКОН БОЛЬШИХ ЧИСЕЛ Теорема III. Если |2, . . . — последователь- ность независимых одинаково распределенных случай- ных величин, то условие М | | < со является необхо- димым и достаточным для сильной нормалъной-устой- S чивости средних арифметических г]п = —, п == 1, 2,... Доказательство. Пусть М |£х | < оо; по- кажем, что тогда с вероятностью единица S — —>Мс15 п —> оо. п ~х’ (8) Наряду с величинами рассмотрим «урезанные» ве- личины . _ [L. если |gn|<ra, " — [ 0, если | > п. Тогда 2р&.=Мп}= 2Р<1М>«}= 2 Р{|^|>«} = = 32 Р{*<1Ы<* + 1} = n=l к^п = 2 пР {га < | К п + 1} < <2 5 |я|(d;EX $ |a:|F(da;) = Mj^Kco. k=0 (к<|х|<»+1> Поэтому по лемме Бореля — Кантелли с вероятностью единица произойдет лишь конечное число событий Лп = {£п =# Ш» п — I, 2, . . . Отсюда вытекает, что достаточно доказать, что с вероятностью единица
§ 5. УСИЛЕННЫЙ ЗАКОН БОЛЬШИХ ЧИСЕЛ 111 Поскольку то отсюда нетрудно заключить, что л< + ... +М5‘ -------------> и, значит, надо установить, что с вероятностью единица ^ + --- + ?п Л ->0, где L = Для доказательства этого достаточно лишь убедить- ся в том, что для последовательности выпол- пепо условие Л оо теоремы I. п=1 Имеем п* П=1 2 п—1 М (С)3 па = 2 тг = П~1 |x|<n оо оо = 2 4-{2 $ п=1 К=1 {fc-l<|x|<(t) ОО П п—1 к—1 (ft—Kpci^fc} = 2* fc=1 {/с—l<|x|<fc) <2 2 J |x|F(^) = 2M|B1|<oo. S=1 {fc-l<[x|<lc>
112 VI. НЕЗАВИСИМОСТЬ. ЗАКОН БОЛЬШИХ ЧИСЕЛ Итак, условие (2) теоремы I выполнено, и, следова- 51 4- ... 4- 5n п тельно, с вероятностью единица-----------► и, п —» оо. Пусть теперь с вероятностью единица —— п —-> оо. Тогда из равенства _ sn _____ Sn~^ п п \ п ) п — 1 следует, что с вероятностью единица > О, п -> оо. Поэтому для всякого е О (I 5 I ] Р 1 — Г> е для бесконечно многих п\ = О, что эквивалентно по лемме Бореля — Кантелли нера- венству 2р П=1 оо. п Но в случае одинаково распределенных величин это условие равносильно, как легко проверить, условию’ м I I < СО. Теорема III доказана. Пусть теперь опять g2, . . . — последователь- ность независимых случайных величин. Тогда вё- ОС роятность сходимости ряда У равна либо нулю, либо единице (ср. с теоремой Дополнения). Теорема IV. Для сходимости с вероятностью единица ряда
УСИЛЕННЫЙ ЗАКОН БОЛЬШИХ ЧИСЕЛ ИЗ достаточно одновременной сходимости двух рядов оо оо 2 M?n, 2 D?n. П=1 п=1 Если к тому же случайные величины £х, £2, . . . равномерно ограничены, | | С, п = 1, 2, . . . , то это условие является и необходимым. к Доказательство. Из сходимости ряда 2 п—1 и неравенства (3) следует, что с вероятностью едини- со ца сходится ряд 2 (Вп — м1п)- Вместе со сходимостью 00 П=1 рада 2 ML отсюда вытекает требуемое утверждение п=1 оо о сходимости с вероятностью единица ряда 2 ?„• п=1 Пусть теперь величины gx, |2,... равномерно огра- ОО ничены и ряд 2 сходится с вероятностью единица. п=1 Построим последовательность независимых случай- ных величин fi, f2,..имеющих те же самые распре- деления, что и |х, |2,... Тогда с вероятностью единица оо оо сходятся также и каждый ИЗ рядов 2 In, 2 (In — In)- П=1 п=1 Поскольку М (Bn — Bn) = 0, то из сходимости с вероят- ОО ностью единица ряда 2 (£п — L) и неравенства (4) с© сю следует, что 2 D(ln — U< А значит, и 2Dln = п=а оо — — 2 D(Bn — Вп)<С°°- Тогда в силу первой части «=1 теоремы с вероятностью единица сходится ряд
114 VI. НЕЗАВИСИМОСТЬ. ЗАКОН БОЛЬШИХ ЧИСЕЛ ОО 00 2 (£п — М£п), что вместе со сходимостью ряда 2 In п=I оо обеспечивает сходимость ряда 2 М^п. п=1 Теорема IV доказана. Пусть . с _ f In в случае |gnС, *п ~ 10 в случае | Вп | > С. Теорема V. Для сходимости ряда ж, П=1 из независимых случайных величин 5ц 5г» • • необхо- дима и достаточна одновременная сходимость при некотором С 0 каждого из трех рядов г) ОО ОО 00 2рШ>о, 2М1«, п=1 п=1 П —1 Доказательство. Достаточность. По- оо скольку 2 Н| In I С} < сю, то по лемме Бореля — п=1 Кантелли почти наверное — 5п для всех п, за исключением, быть может, конечного числа. Тогда по теореме 4 с вероятностью единица сходится ряд оо оо 2 Й, а значит, и ряд 2 In- П=1 п=1 оо Необходимость. Если ряд 2 In сходится с ве- п=1 роятностью единица, то tn—>0 почти наверное, и—> оо. х) Ср. А. К hintchine und A. Kolmogoroff, Uber Konvergenz von Reihen, Матем. сб., т. 32 (1925), 668—677.
S Б, УСИЛЕННЫЙ ЗАКОН БОЛЬШИХ ЧИСЕЛ Ц5 Поэтому для всякого С 0 может произойти самое большее конечное число событий С}, а значит, СО по лемме Бореля — Кантелли 2 р 0 О С} <С°°* Далее1 со из сходимости ряда 2 следует, что сходится также ?г=1 оо оо и ряд 2 & Тогда сходимость рядов У М£п и П—1 П=1 оо 2 вытекает из теоремы IV. П=1
ДОПОЛНЕНИЕ ОДНА ЗАМЕЧАТЕЛЬНАЯ ТЕОРЕМА ТЕОРИИ ВЕРОЯТНОСТЕЙ Наблюдались уже многие случаи, в которых извест- ные предельные вероятности с необходимостью равны нулю или единице. Например, вероятность сходимости, ряда из независимых случайных величин может прини- мать только эти два значения1). Мы докажем теперь общую теорему, обнимающую много таких случаев. Теорема (закон «О или 1»), Пусть |2, . . . — какие-либо случайные величины, a f (х) = / (жп ж2, . . •)— бэровская функция 2) переменных х = (хх, т2, . . .) та- кая, что условная вероятность Р {/(ёх, U • • •) = 0 ||lt U.......... М соотношения f (glt U ...) = о при известных п первых величинах g2, . . . , ос- тается равной абсолютной вероятности РЖ, U...) = 0} (1) 1) Ср. главу шестую, § 5. То же имеет место и для вероят- ности Р (’In - «/,(—» 0. п —• оо) в усиленном законе больших чисел, по крайней мере когда ве- личины Еп взаимно независимы. 2) Под бэровской функцией понимается функция, которая может быть представлена, исходя из полиномов, через после- довательные итерированные предельные переходы.
ОДНА ЗАМЕЧАТЕЛЬНАЯ ТЕОРЕМА 117 для каждого п. При этих условиях вероятность (1) рав- на нулю или единице. В частности, предпосылки этой теоремы выполняют- ся, если случайные величины £2, . . . независимы и значение функции / (х) остается неизменным при из- менении лишь конечного числа величин хп. Доказательство. Обозначим | = (|п |2, . . .), и пусть А = = 0}. Наряду с этим событием мы рассмотрим алгебру 9? всех событий, которые могут быть определены через какие-либо соотношения между конечным числом величин £п. Если событие В принадлежит 91, то по ус- ловиям теоремы Р(Л | В) = Р (Л). (2) В случае Р (Л) = 0 наша теорема уже доказана. Пусть теперь Р (Л) 0. Тогда из (2) следует формула Р(Б|Л) = -^1^р^-=Р(Б). (3) Итак, Р (В) и Р (В |Л) — две счетно-аддитивные функции множеств, совпадающие на 93, следователь- но, они должны оставаться равными друг другу па каждом множестве борелевского расширения а (91) алгебры ЭТ. Поэтому, в частности, Р(Л) = Р(Л | Л) = 1. Теорема доказана. Некоторые другие случаи, в которых можно утвер- ждать об известных вероятностях, что они принимают только значения нуль и единица, были открыты П. Леви *). *) См. по атому поводу Р. L 6 v I, Snr пп ЬЬёогёте de А. Khintchine, Bull, des Sci. Math., т. 55 (1931), 145—160, теорема II.
ЛИТЕРАТУРА [1] Б ернштейя С. Н., Опыт аксиоматического обоснования теории вероятностей, Зап. Харьк. матем. об-ва, 1917, стр. 209—274. (2] — Теория вероятностей, 2-е изд., Москва, ГТТИ, 1934. (1] Borel Е., Les probabilities denombrables et leurs applica- tions arithmetiques, Rend. Circ. mat., Palermo, t. 27, 1909, стр. 247—271. [2] — Principes et formulas classiques, Fasc. 1 du tome I du Traite des Probabilites par E. Borel et divers auteurs, Paris, Gaut- hier-Villars, 1925. (3] — Applications У I’arithmetique et a la theorie des fonctions, Fasc. 1 du tome II du Traite des Probabilites par E. Borel et Idivers auteurs, Paris, Cauthier-Villars, 1926. (1] C a n t e 11 i F. P., Una teoria astratta del Calcolo delle pro- babilita, Giorn. 1st. Ital. Attuari, t. 3, 1932, стр. 257—265. [2]— Sulla legge del grand! . numeri, Mem. Acad. Lincei, t. 11, 1916. [3] — Sulla probability come limite della frequenza, Rend. Accad. Lincei, t. 26, 1917, стр. 39—45. [1] Copeland H., The theory of probability from the point of view of admissible numbers, Ann. Math. Statist., t. 3, 1932, стр. 143—156. [1] D 6 r g e K., Zu der von Mises gegebenen Begriindung der Wahr- scheinlichkeitsrechnung, Math. Z., t. 32, 1930, стр. 232— 258. [1] F rechet M. , Sur la convergence en probability, Metron, t. 8, 1930, стр. 1—48. [2] — Recherches theoriques modernes, sur th4orie des probabilites, Fasc. 3 dn tome I du Traite des probabilites par E. Borel et divers auteurs, Paris, Gauthier-Villars. 11] Kolmogoroff A., Uber die analytischen Methoden in der Wahrscheinlichkeitsrechnung, Math, Ann, t, 104, 1931, стр. 415—458.
ЛИТЕРАТУРА 119 12] Колмогоров А., Общая теория меры и теория вероят- ностей. Сборник трудов секции точных наук Коммунисти- ческой академии, т. 1, 1929, стр. 8—21. (1] L ё v у Р., Calcul des Probability, Paris, Gauthier-Villars, 1925. [1] Lo m nick! A., Nouveaux fondements du calcul des proba- bilites, Fundam. Math., t. 4, 1923, стр. 34—71. [l]von Mises R., Wahrscheinlichkeitsrechnung, Leipzig u. Wien, Fr. Deuticke, 1931. [2] — Grundlagen der Wahrscheinlichkeitsrechnung, Math. Z., t. 5, 1919, стр. 52—99. [3] — Wahrscheinlichkeitsrechnung, Statistik und Wahrheit. Wien, Julius Springer, 1928. 11] Reichenbach H., Axiomatik der Wahrscheinlichkeits- rechnung, Math. Z., t. 34, 1932, стр. 568—619. 11] S 1 u I s k у E., Uber stochastische Asymptoten und Grenz- werte, Metron, t. 5, 1925, стр. 3—89, [2] G л у ц к и й E., К вопросу о логических основах теории ве- роятности, Вестник статистики, т. 12, 1922, стр. 13—21. [1] Steinhans Н., Les probability denombrables et leur rapport a la theorie de la mesure, Fundam.. Math., t. 4, 1923, стр. 286—310. [1] Tornier E., Wahrscheinlichkeitsrechnung und ' Zahlen- theorie, J. reine angew. Math., t. 160,1929, стр. 177—198, [2] — Grundlagen der Wahrscheinlichkeitsrechnung, Acta math, t. 60, 1933, стр. 239—380.
СОДЕРЖАНИЕ Предисловие к первому изданию........................ 5 Предисловие ко второму изданию....................... 7 I. Элементарная теория вероятностей § 1. Аксиомы............................................................... Ю § 2. Отношение к данным опыта............................................. 12 § 3. Терминологические замечания.......................................... 14 § 4. Непосредственные следствия из аксиом, условные ве- роятности, теорема Байеса........................ 15 § 5. Независимость............................................... 17 § 6. Условные вероятности как случайные величины; цепи Маркова....................................... 23 II. Бесконечные поля вероятностей § 1. Аксиома непрерывности................................................... 26 § 2. Борелевские поля вероятностей................................... 29 § 3. Примеры бесконечных полей вероятностей .... 31 III. Случайные величины § 1. Вероятностные функции..... 36 § 2. Определение случайных величин, функции распре- деления 38 § 3. Многомерные функции распределения................. 41 § 4. Вероятности в бесконечномерных пространствах 44 § 5. Эквивалентные случайные величины, разные виды сходимости................................................................................... 52 IV. Математические ожидания § 1. Абстрактные интегралы Лебега.................... 57 § 2. Абсолютные и условные математические ожидания 60 § 3. Неравенство Чебышева........................... 63 § 4. Некоторые признаки сходимости.................. 65 § 5. Дифференцирование и интегрирование математиче- ских ожиданий по параметру . ................... . 66
4 СОДЕРЖАНИЕ V. Условные вероятности и математические ожидания § 1. Условные вероятности............................ 70 § 2. Объяснение одного парадокса Бореля.............. 75 § 3. Условные вероятности относительно случайной ве- личины .............................................. 76 § 4. Условные математические ожидания.......... 78 VI. Независимость. Закон больших чисел § 1. Независимость................................. 83 § 2. Независимые случайные величины............ 85 § 3. Закон больших чисел....................... 88 I 4. Замечания к понятию математического ожидания 160 § 5. Усиленный закон больших чисел, сходимость рядов 104 Дополнение. Одна замечательная теорема теории вероят- ностей . ...................................... 116 Литература ......................................... 118
Андрей Николаевич Колмогоров ОСНОВНЫЕ ПОНЯТИЯ ТЕОРИИ ВЕРОЯТНОСТЕЙ (Серия: «Теория вероятностей и математическая статистика») М., 1974 г., 120 стр.