Текст
                    

A. H. Ширяев ВЕРОЯТНОСТЬ-2 Суммы и последовательности случайных величин — стационарные, мартингалы, марковские цепи Издание третье, переработанное и дополненное Допущено Министерством образования России в качестве учебника для студентов высших учебных заведений по физико-математическим направлениям и специальностям Москва Издательство МЦНМО, 2004
УДК 519.21(075.8) ББК 22.171 Ш64 Ширяев А. Н. Ш64 Вероятность. В 2-х кн. — 3-е изд., перераб. и доп. — М.: МЦНМО, 2004. ISBN 5-94057-036-4 Кн. 2.-408 с.-ISBN 5-94057-106-9 Настоящее издание (в двух книгах «Вероятность — I» и «Вероятность — 2») представляет собой расширенный курс лекций по теории вероятностей. Вторая книга «Вероятность —2» посвящена случайным процессам с дискрет- ным временем (случайным последовательностям). Основное внимание здесь уделя- ется стационарным последовательностям (в узком и широком смысле), мартингалам и марковским цепям. Даны применения к вопросам оценивания и фильтрации в Случайных последовательностях, к стохастической финансовой математике, теории, страхования и задачам об оптимальной остановке. Приведен также очерк истории становления теории вероятностей. В истори- ко-библиографической справке указываются источники приводимых результатов,, даются комментарии и указывается дополнительная литература. В конце каждого параграфа даются задачи. Первая книга «Вероятность — 1» содержит материал, относящийся к элемен- тарной теории вероятностей, математическим основаниям и предельным теоремам. Книги рассчитаны на студентов физико-математических специальностей универ- ситетов. Могут служить учебным пособием для аспирантов и справочным пособием для специалистов. Табл. 9. Ил. 42. Библиогр. 136 назв. ББК 22.171 ISBN 5-94057-106-9 785940 ISBN 5-94057-036-4 ISBN 5-94057-106-9 (кн. 2) © Ширяев А. Н., 2004 © МЦНМО, 2004
ОГЛАВЛЕНИЕ КНИГА ПЕРВАЯ. ВЕРОЯТНОСТЬ - 1 Предисловие к третьему изданию............................... 7 Предисловие ко второму изданию............................... 9 Предисловие к первому изданию .............................. 11 Введение ................................................... 14 Глава I. Элементарная теория вероятностей 20 § 1. Вероятностная модель эксперимента с конечным числом исходов 21 §2. Некоторые классические модели и распределения.......... 36 § 3. Условные вероятности. Независимость.................... 43 §4. Случайные величины и их характеристики................ 53 § 5. Схема Бернулли. I. Закон больших чисел................. 67 § 6. Схема Бернулли. II. Предельные теоремы (локальная, Муавра— Лапласа, Пуассона).......................................... 78 § 7. Оценка вероятности «успеха» в схеме Бернулли........... 94 § 8. Условные вероятности и математические ожидания относитель- но разбиений............................................... 100 § 9. Случайное блуждание. I. Вероятности разорения и средняя про- должительность при игре с бросанием монеты................. 109 § 10. Случайное блуждание. II. Принцип отражения. Закон арксинуса 120 §11. Мартингалы. Некоторые применения к случайному блужданию 128 § 12. Марковские цепи. Эргодическая теорема. Строго марковское свойство................................................... 136 Глава II. Математические основания теории вероятностей 160 § 1. Вероятностная модель эксперимента с бесконечным числом ис- ходов. Аксиоматика Колмогорова............................. 161 §2. Алгебры и а-алгебры. Измеримые пространства........... 171 §3. Способы задания вероятностных мер на измеримых простран- ствах...................................................... 191 §4. Случайные величины. I ................................ 214 §5. Случайные элементы ................................... 221
524 ОГЛАВЛЕНИЕ §6. Интеграл Лебега. Математическое ожидание............... 226 §7. Условные вероятности и условные математические ожидания относительно а-алгебр....................................... 266 §8. Случайные величины. II................................. 300 § 9. Построение процесса с заданными конечномерными распреде- лениями .................................................... 314 § 10. Разные виды сходимости последовательностей случайных ве- личин ...................................................... 324 §11. Гильбертово пространство случайных величин с конечным вто- рым моментом ............................................... 338 § 12. Характеристические функции............................ 352 § 13. Гауссовские системы................................... 380 Глава III. Близость и сходимость вероятностных мер. Централь- ная предельная теорема 396 § 1. Слабая сходимость вероятностных мер и распределений.... 39t § 2. Относительная компактность и плотность семейств вероятност- ных распределений........................................... 407 § 3. Метод характеристических функций в доказательстве предель- ных теорем ................................................. 413 § 4. Центральная предельная теорема для сумм независимых слу- чайных величин. I. Условие Линдеберга ...................... 421 § 5. Центральная предельная теорема для сумм независимых слу- чайных величин. II. Неклассические условия.................. 433 § 6. Безгранично делимые и устойчивые распределения......... 438 § 7. «Метризуемость» слабой сходимости ..................... 447 §8. О связи слабой сходимости мер со сходимостью случайных элементов почти наверное ................................... 452 § 9. Расстояние по вариации между вероятностными мерами. Рас- стояние Какутани—Хеллингера и интегралы Хеллингера. При- менение к абсолютной непрерывности и сингулярности мер ... 460 § 10. Контигуальность (сближаемость) и полная асимптотическая разделимость вероятностных мер.............................. 470 §11.0 скорости сходимости в центральной предельной теореме.... 475 § 12. О скорости сходимости в теореме Пуассона.............. 479 § 13. Фундаментальные теоремы математической статистики..... 481 Библиографическая справка (главы 1—III)..................... 492 Список литературы........................................... 496 Предметный указатель........................................ 502 Указатель обозначений....................................... 516
ОГЛАВЛЕНИЕ 525 КНИГА ВТОРАЯ. ВЕРОЯТНОСТЬ -2 Предисловие................................................ 527 Глава IV. Последовательности и суммы независимых случайных величин 528 §1 . Законы «нуля или единицы»............................ 529 § 2. Сходимость рядов..................................... 534 § 3. Усиленный закон больших чисел........................ 540 §4 . Закон повторного логарифма........................... 551 §5 . О скорости сходимости в усиленном законе больших чисел и о вероятностях больших уклонений............................. 557 Глава V. Стационарные (в узком смысле) случайные последова- тельности и эргодическая теория 562 § 1. Стационарные (в узком смысле) случайные последовательно- сти. Сохраняющие меру преобразования....................... 563 § 2. Эргодичность и перемешивание......................... 567 § 3. Эргодические теоремы................................. 570 Глава VI. Стационарные (в широком смысле) случайные после- довательности. /Л-теория 578 §1. Спектральное представление ковариационной функции.... 579 § 2. Ортогональные стохастические меры и стохастические интегралы 589 § 3. Спектральное представление стационарных (в широком смыс- ле) последовательностей.................................... 595 §4. Статистическое оценивание ковариационной функции и спек- тральной плотности......................................... 607 §5. Разложение Вольда ................................... 614 § 6. Экстраполяция, интерполяция и фильтрация............. 623 § 7. Фильтр Калмана—Бьюси и его обобщения................. 634 Глава VII. Последовательности случайных величин, образующие мартингал 646 § 1. Определения мартингалов и родственных понятий........ 647 §2. О сохранении свойства мартингальности при замене времени на случайный момент........................................... 659 §3. Основные неравенства................................. 671 § 4. Основные теоремы о сходимости субмартингалов и мартингалов 688 §5. О множествах сходимости субмартингалов и мартингалов. 697 § 6. Абсолютная непрерывность и сингулярность вероятностных рас- пределений на измеримом пространстве с фильтрацией......... 706
526 ОГЛАВЛЕНИЕ §7. Об асимптотике вероятности выхода случайного блуждания за криволинейную границу.................................... 721 § 8. Центральная предельная теорема для сумм зависимых случай- ных величин................................................. 726 § 9. Дискретная версия формулы Ито......................... 740 § 10. Вычисление вероятности разорения в страховании. Мартин- гальный метод............................................... 746 §11.0 фундаментальных теоремах стохастической финансовой ма- тематики. Мартингальная характеризация отсутствия арбитража 751 § 12. О расчетах, связанных с хеджированием в безарбитражных мо- делях ...................................................... 767 § 13. Задачи об оптимальной остановке. Мартингальный подход .... 776 Глава VIII. Последовательности случайных величин, образую- щие марковскую цепь 786 § 1. Определения и основные свойства.......................^787 § 2. Обобщенное марковское и строго марковское свойства.... 800 §3. О\ проблематике предельных, эргодических и стационарных распределений вероятностей для марковских цепей............. 809 §4. Классификация состояний марковских цепей по алгебраиче- ским свойствам матриц переходных вероятностей .............. 812 § 5. Классификация состояний марковских цепей по асимптотиче- ским свойствам переходных вероятностей ..................... 819 §6. О предельных, стационарных и эргодических распределениях для счетных марковских цепей................................ 833 §7. О предельных, стационарных и эргодических распределениях для конечных марковских цепей............................... 841 § 8. Простое случайное блуждание как марковская цепь....... 842 § 9. Задачи об оптимальной остановке для марковских цепей.. 856 Очерк истории становления математической теории вероятностей .. 875 Библиографическая справка (главы IV—VIII).................. 899 Список литературы.......................................... 904 Предметный указатель....................................... 910 Указатель обозначений...................................... 924
Предисловие При построении университетского вероятностно-статистического обра- зовательного цикла, как правило, предполагается наличие трех односеме- стровых курсов — «Теория вероятностей», «Теория случайных процессов», «Математическая статистика». Содержание книги «Вероятность — 1» вполне покрывает весь тот ма- териал, который обычно включается в программу курса «Теория вероят- ностей». Представляемая книга «Вероятность — 2» содержит достаточно об- ширный материал для курса «Теория случайных процессов», в той его ча- сти, которая посвящена случайным процессам с дискретным временем — случайным последовательностям. (Читателю, желающему познакомиться с теорией случайных процессов с непрерывным временем, можно пореко- мендовать обратиться к книге [131], во многом примыкающей к настоящим учебникам «Вероятность — 1» и «Вероятность —2».) В главе IV, открывающей эту книгу, основной акцент сделан на свой- ствах с вероятностью единица (закон «нуля или единицы», сходимость рядов, усиленный закон больших чисел, закон повторного логарифма и др.) последовательностей, образованных суммами независимых случайных ве- личин. Главы V и VI относятся к стационарным случайным последователь- ностям, являющимся стационарными в узком и в широком смысле соот- ветственно. В главах VII и VIII рассматриваются случайные последовательности, образующие мартингалы и марковские цепи. Оба эти класса процессов с дискретным временем дают возможность изучать поведение разнообраз- ных стохастических систем в «будущем» в зависимости от их «настоящего» и «прошлого», что определяет исключительную роль таких процессов в со- временной теории вероятностей и ее применениях. Завершает книгу «Очерк истории становления математической теории вероятностей». Москва, 2003 А. Ширяев
Глава IV ПОСЛЕДОВАТЕЛЬНОСТИ И СУММЫ НЕЗАВИСИМЫХ СЛУЧАЙНЫХ ВЕЛИЧИН §1 . Законы «нуля или единицы».................... 529 § 2. Сходимость рядов............................. 534 § 3. Усиленный закон больших чисел................ 540 §4 . Закон повторного логарифма.................. 551 §5 . О скорости сходимости в усиленном законе больших чисел и о вероятностях больших уклонений.................... 557
Понятие независимости двух или нескольких опытов занимает в из- вестном смысле центральное место в теории вероятностей... Исторически неза- висимость испытаний и случайных величин явилась тем математическим поня- тием, которое придало теории вероятностей своеобразный отпечаток. А. Н. Колмогоров. «Основные понятия теории вероятностей» [32] § 1. Законы «нуля или единицы» ОС | ОО | 1. Ряд 52 “ расходится, а ряд 52 (~ 1)л - сходится. Поставим п=\ п п=\ п следующий вопрос. Что можно сказать о сходимости или расходимости О° £ ряда 52 —, где £i, -—последовательность независимых одинако- л=1 П во распределенных бернуллиевских случайных величин с Р{С1 = + !} = = P{£i = —1}= 1/2? Иначе говоря, что можно сказать о сходимости ряда с общим членом ±1/л, где знаки -I- и — «разбросаны» в случайном порядке в соответствии с рассматриваемой последовательностью • ••? Обозначим cv: У7 ~ сходится > Л=1 J ОО £ — множество тех элементарных исходов, где ряд 52 ~ сходится (к ко- л=1 п нечным значениям), и рассмотрим вероятность Р(Л1) этого множества. Заранее не ясно, какие значения может принимать эта вероятность. За- мечательным оказывается, однако, то обстоятельство, что a priori можно утверждать, что эта вероятность может принимать только два значения О или 1. Этот результат является следствием так называемого закона «нуля или единицы» («О или 1») Колмогорова, формулировка и доказательство которого составляют основное содержание данного параграфа. 2. Пусть (П, Р) — вероятностное пространство, ••• — некоторая последовательность случайных величин. Обозначим <^° = = cr(£rt, £л+1, ...) — а-алгебру, порожденную случайными величинами Сп+ь ...» И пусть ^=пл°°- Л=1 Поскольку пересечение а-алгебр есть снова а-алгебра, то «2Г есть а-алге- бра. Эта сг-алгебра будет называться «хвостовой» или «остаточной»,
530 ГЛ. IV. НЕЗАВИСИМЫЕ СЛУЧАЙНЫЕ ВЕЛИЧИНЫ в связи с тем, что всякое событие А Е ЗС не зависит от значений случайных величин при любом конечном числе /г, а определяется лишь «поведением бесконечно далеких значений последовательности , £2» ... »• Поскольку для любого k 1 {оо ) f °° £ ) ~ СХОДИТСЯ > = < — СХОДИТСЯ > е n=l ) J то сП «^° = 3£. Точно так же, если £1, ... — произвольная после- k довательность, то f 00 А2 = < 57 Сп СХОДИТСЯ > € X. л=1 Следующие события также являются «хвостовыми»: Д3 = {С« е/п б. ч.} (=М& €/„}), где /п€^(/?), я>1; Д4 = |Пт £„<оо}; Ле={Егй±_^<4; Л f $п 1 Д7 = < — сходится >; I п J t Д8 = (Пт , 5п =1). I п \/2п In п J С другой стороны, Bi ={С« = 0 для всех 1}, ^2 = {^(£1 +••• + &) существует и меньше являются примерами событий, не принадлежащих «27. Будем теперь предполагать, что рассматриваемые случайные величины являются независимыми. При этом допущении из леммы Бореля—Кан- телли следует, что Р(Дз)=0 52Р{£л6/п}<оо, Р(Д3) = 1 52Р{е„е/„} = оо. J
§ 1. ЗАКОНЫ «НУЛЯ ИЛИ ЕДИНИЦЫ: 531 Таким образом, вероятность события Аз может принимать лишь два значения 0 или 1 в зависимости от сходимости или расходимости ряда £Р{£лЕ/я}. Это утверждение, носящее название закона «О или 1» Бореля, является частным случаем следующего утверждения. Теорема 1 (закон «О или 1» Колмогорова). Пусть 6,^2, • •• — последовательность независимых случайных величин и АеХ. Тогда вероятность Р(Л) может принимать лишь два значения: нуль или единица. Доказательство. Идея доказательства состоит в том, чтобы пока- зать, что каждое «хвостовое» событие А не зависит от самого себя и, значит, Р(Л ПЛ) = Р(Л)-Р(Л), т. е. Р(Л) = Р2(Л), откуда Р(Л) = 0 или 1. Если Ле X, то Л C^i00 = где ... ...» 6J, и можно найти (задача 8 из § 3 гл. II) такие множества Ля и > 1, что Р(Л Д Лл) -* 0, п оо. Отсюда следует, что Р(ЛЯ)-+Р(Л), Р(ЛЯПЛ)-+Р(Л). (1) Но если Л G X, то для каждого п 1 события Ап и Л независимы: Р(ЛПЛЛ) = Р(Л)Р(ЛЯ), откуда в силу (1) следует, что Р(Л) = Р2(Л), и, значит, Р(Л) = О или 1. □ Следствие. Пусть tj — случайная величина, измеримая относи- тельно «хвостовой» сг-алгебры X, т. е. {qeB}eX, B^S8(R). То- гда г] является вырожденной случайной величиной, т. е. существует константа с такая, что Р{т/ = с} = L 3. Приводимая ниже теорема 2 служит иллюстрацией нетривиального применения закона «нуля или единицы» Колмогорова. Пусть £1,^2, ••• -“Последовательность независимых бернуллиевских случайных величин с Р{£п = 1}=р, Р{£я = —1} = <7, p + q = l, п^1, и Sn =& +...+&• Интуитивно понятно, что в симметричном случае (р = 1/2) «типичные» траектории случайного блуждания Sn, п 1, бесконечно много раз проходят через нуль, а в случае р /1/2 «уходят» в бесконечность. Сформулируем теперь точный результат. Теорема 2. а) Если р = \/2, то Р{5Я=О б. ч.} = 1. Ь) Если р /1/2, то P{Srt = 0 б. ч.} = 0. Доказательство. Прежде всего отметим, что событие B = {Srt = O б. ч.} не является «хвостовым», т. е. В = <т{£я, £я+ь •••}• Поэтому в принципе не ясно, что вероятность события В принимает лишь значения 0 или 1. Утверждение Ь) легко доказывается применением (первой части) леммы Бореля—Кантелли. Действительно, если В?п = {Szn = 0}, то по формуле
532 ГЛ. IV. НЕЗАВИСИМЫЕ СЛУЧАЙНЫЕ ВЕЛИЧИНЫ Стирлинга (формула (6) § 2 гл. I) D/D \ __ ПП пПпП Г(Ь2п) = С2пР Я ~ » у7ГЛ и, значит, 52 Р(^2п) < оо- Поэтому P{Srt = 0 6. ч.} = 0. Для доказательства утверждения а) достаточно показать, что событие Л ft---- I- 1 А = < Игл —= = оо, lim —= = —оо > I у/П у/п J имеет вероятность 1, поскольку А СВ. Пусть АС=А'С ПЛ", где Д'= (lim Л" = (|пп -с). Тогда I П у/п J I п у/п ) Ас |Л, с—*оо, при этом как событие Л, так и все события Д', Д'' яв- ляются хвостовыми. Покажем, что для каждого с>0 Р(Д') = Р(Д'') = 1. Поскольку Д' е 9С, А" € «Ж*, то достаточно лишь установить, что Р(Д') > О, Р(Д'') >0. Но, согласно задаче 5 и теореме Муавра—Лапласа (§ 6 гл. I), Wlim -^=<-с) = Р(йт -^>с)>ЙтР(-^=>с)>0. 1“ у/П J I n y/n ) n [y/n ) Итак, для всех с > О Р(ЛС) = 1 и, значит, Р(Л) = lim Р(ЛС) = 1. □ С-+ОО 4. Отметим еще раз, что событие В = {Sn =0 б. ч.} не является «хво- стовым». Тем не менее из теоремы 2 следует, что для схемы Бернулли вероятность этого события, как и в случае «хвостовых» событий, прини- мает лишь два значения 0 или 1. Оказывается, что это обстоятельство неслучайно и является следствием так называемого закона «О или 1>| Хьюитта и Сэвиджа, который обобщает для случая независимых оди- наково распределенных случайных величин результат теоремы 1 на класс так называемых «перестановочных» событий (включающий в себя и класс «хвостовых» событий). Введем необходимые определения. Взаимно однозначное отображение 7г = (тг1,7Г2, ...) множества (1, 2, ...) в себя назовем конечной переста- новкой, если тгп=п для всех п, за исключением, быть может, конечного числа. Если £=(£i, ...) — последовательность случайных величин, то через тг(£) будем обозначать последовательность (£*.,, ^2, ...). Если событие А = {£ G В}, В е «^(/?°°), то через тг(Д) обозначим событие {7г(С)еВ}, BG^(/?°°). Назовем событие А = {£ G В}, В е ^(/?°°), перестановочным, если для любой конечной перестановки тг событие тг(Д) совпадает с А. Примером перестановочного события является событие А = {Sn = = 0 6. ч.), где Sn = Ci + • • • + Сп- Более того, можно показать (задача 4), что
§ 1. ЗАКОНЫ «НУЛЯ ИЛИ ЕДИНИЦЫ 533 каждое событие из «хвостовой» а-алгебры ^(S) = Q <^°(S), <^rtoo(S) = = cr{cu: Srt, Srt+i, ...}, порожденной величинами Si=fi, S2 = £i+&> •••» является перестановочным. Теорема 3 (закон «О или 1» Хьюитта и Сэвиджа). Пусть £ = = (Сь^2» •) — последовательность независимых одинаково рас- пределенных случайных величин и А = {£е В} — перестановочное событие. Тогда Р(Л) = 0 или 1. Доказательство. Пусть А = {£ е В} — перестановочное событие. Вы- берем (см. задачу 8 из § 3 гл. II) множества Вп € £8(Rn) такими, что для Дл = {о;:(е1,...,ел)€Вл} Р(ЛДЛ„)-0, п-+<х>. (2) Поскольку случайные величины • • • независимы и одинаково рас- пределены, то распределения вероятностей /^(В) = Р{£ еВ} и Лгя($)(В) = = Р{ЯЪ(£) € Я}, ГДе 7ГЛ(£) = (£л+1,..., &rt, ,..., &>л+1, &п+2, ...) ДЛЯ вся- кого 1, совпадают. Значит, Р(Л Д Ап) = Р$(В Д Вп) = Р^}(В Д Вп). (3) Раз событие А является перестановочным, то д = {ееВ}=7гя(Д) = {7гя(е)еВ}. Поэтому Р„М(В д вп) = Р({7ГЛ(О 6 в} д {7ГЯЮ е Вп}) = = Р({£ G В} Д {7ГЛ (О € вп}) = Р(Л Д 7ГЯ(ДЛ)). (4) Итак, из (3) и (4) Р(АЛАп) = Р(АДтгп(Ап)). (5) В силу (2) отсюда следует, что Р(А Д (Ап П тг„ (Л „))) -> О, п -> оо. (6) Поэтому из (2), (5) и (6) заключаем, что Р(Лл) - Р (Л), Р(7гя(Лп)) Р(Л), Р(ЛлП7гл(Лл))-.Р(Л). } Далее, в силу независимости случайных величин • •• Р(ЛП О 'Кп(Ап)) = Р{(£i, ..., ^п) 6 Brt, (£/i+i, ...» ^2л) £ Вп} = = Р{(€i, - Л«)евл}‘Р{(£„+1,..., еВп} = Р(Лл)Р(7гп(Лл)),
534 ГЛ. IV. НЕЗАВИСИМЫЕ СЛУЧАЙНЫЕ ВЕЛИЧИНЫ откуда по свойствам (7) Р(Л) = Р2(Л) и, значит, Р(Л) = 0 или 1. □ 5. Задачи. 1. Доказать следствие к теореме 1. 2. Показать, что если — последовательность независимых слу- чайных величин, то случайные величины lim и lim являются выро- жденными. 3. Пусть (Сп)п>1 — последовательность независимых случайных вели- чин, Srt = £1 +.. • + и константы Ьп таковы, что 0 < bn Т оо. Показать, что случайные величины lim —• и lim являются вырожденными. 4. Пусть Srt = 6+...4-^ «И и ^(5) = ПЛ°°(5), Л°°(5) = = а{о>: Srt, Srt+i, ...}. Показать, что каждое событие из <£*(£) является перестановочным. 5. Пусть (Cn)n>i — последовательность случайных величин. Показать, что {Нп^ > с} 2 lim{£rt > с} для всякой константы с, 6. Привести пример «хвостового» события, вероятность которого стро- го больше нуля и меньше единицы. 7. Пусть — независимые случайные величины с E£rt = 0, Е^ = 1, 1, для которых выполняется центральная предельная теорема (Р{5пД/п х} -* Ф(х), х е /?, где Sn = 4-... 4- £rt). Доказать, что тогда lim = 4-оо (Р-п. н.). П-+ОО В частности, это свойство выполнено для последовательности незави- симых одинаково распределенных случайных величин (с Efi =0, Ef2 = 1). 8. Пусть £1, $2, ••• — независимые одинаково распределенные случай- ные величины с EI6I > 0. Показать, что lim П-+ОО п = 4-00 (Р-п. н.). § 2. Сходимость рядов 1. Будем предполагать, что £i, ••• — последовательность независи- мых случайных величин, Srt = 4-... + и А — множество тех элементар- ных исходов iv, где ряд ^2 6г М сходится к конечному пределу. Из закона «О или 1» Колмогорова следует, что вероятность Р(Д) = О или 1, т. е. с вероятностью единица ряд £п сходится или расходится. Цель настоя- щего параграфа — дать критерии, позволяющие определять, сходится или расходится ряд из независимых случайных величин.
§2. СХОДИМОСТЬ РЯДОВ 535 Теорема 1 (Колмогоров и Хинчин). а) Пусть Е£я = 0, 1. Тогда, если ^Е£* 2<оо, (1) то ряд 22 сходится с вероятностью единица. Ь) Если к тому же случайные величины £п. п 1, равномерно огра- ничены (Р{|£л| ^с} = 1 для некоторого с <оо), то верно и обратное, из сходимости ряда 22 6 с вероятностью единица следует условие (1). Доказательство этой теоремы существенно опирается на Неравенства Колмогорова, а) Пусть 6, &, •••, 6г — независимые случайные величины с Е6=0, Е£?<оо, Тогда для всякого е>0 (2) Ь) Если к тому же Р{|$-| ^с} = 1, 1 то <3> Доказательство, а) Обозначим Л* = {|5(|<е, г = 1, 1, |S*|>е}, Тогда А = 52 и ES2^ES2/4=£ES2/4i. Но 1 ES2/4t = Е($* + (&+i + • • • + &))Ч = = ESf/д* + 2ES*(&+1 +... + е„)/л> + Е(&+1 +... + ея)2/д» > ESf/д», поскольку ESft(CA+i + ... + Cn)/4» = ES*/4t-E(eA+i + ...+Cn) = O в силу предположенной независимости и условий Е£, =0, 1 i п. Поэтому ES2 > £ ES*^ > Е Р(ЛЛ) = г2Р(Л), что и доказывает первое неравенство. Для доказательства (3) заметим, что Е$я2/л = ES2 - ES„/j ES2 - е2Р(Л) = ES2 - г2 + г2Р(Л). (4) С другой стороны, на множестве Ak |5/г-1| |S*| |S*_i| + |&| + с
536 ГЛ. IV. НЕЗАВИСИМЫЕ СЛУЧАЙНЫЕ ВЕЛИЧИНЫ и, значит, Е$п2/л=£ Е$*2Ч + £ E(/4t(S„-S*)2K k k <(£+С)2 £ Р(АО+£ Р(Д*) £ е^Ч k *=1 <Р(4) (£ + с)2 + £е?2 /=*+1 = Р(Л)[(е + с)2+ Е52 (5) Из (4) и (5) находим, что рМ>> ES2-£2 =. _ (е + с)2 >, _ (е + с)2 (e + c)2 + ES£-£2 (е + с)2 + ES$ — s2 ES^ Неравенство (3) доказано. □ Доказательство теоремы 1. а) Согласно теореме 4 из § 10 гл. II, последовательность (Sn)n^i сходится с вероятностью единица тогда и только тогда, когда эта последовательность фундаментальна с вероятно- стью единица. По теореме 1 из § 10 гл. II последовательность (Sn)n^\ фундаментальна (Р-п. н.) в том и только том случае, когда Р(sup |Srt+fc - $я| > Д -> 0, я—>оо. J (6) В силу (2) P/sup |$п+*-Зя|>4 = Jim J °° И max |S„+*-S„|>£^ lim /V—>oo oo Поэтому, если 52 Efl < °°» то выполнено условие (6) и, следовательно, /г=1 ряд 52 & сходится с вероятностью единица. Ь) Пусть ряд 52 &г сходится. Тогда в силу (6) для достаточно больших п P(sup |Srt+* - Sn| > 4 < i J z (7) В силу (3) 2 p/sup J Z E£2 k=n
§2. СХОДИМОСТЬ РЯДОВ 537 оо Поэтому, если допустить, что 52 ~ °°» то получим k=\ P|sup |5я+Л-5я|>е| = 1, что противоречит неравенству (7). □ Пример. Если fi, ••• — последовательность независимых бер- нуллиевских случайных величин с Р{^ = 4-1} = Р{^Л = —1}= 1/2, то ряд 52 £яля, где |art|^c, сходится с вероятностью единица тогда и только тогда, когда 22 ап < °°- 2. Теорема 2 (теорема Колмогорова и Хинчина о «двух рядах»). Для сходимости с вероятностью единица ряда 52 £п из независи- мых случайных величин достаточно, чтобы одновременно сходились два ряда 52 Е£л и 12 ^£я. Если к тому же для некоторого с>0 Р{|С«1 ~ Ь п 1, то эпго условие является и необходимым. Доказательство. Если 52 < оо, то по теореме 1 ряд 52 (£л ~ Е£я) сходится (Р-п. н.). Но по предположению ряд 52 Е^я сходится, поэтому сходится (Р-п. н) и ряд 22 £л- Для доказательства необходимости воспользуемся следующим прие- мом «симметризации». Наряду с последовательностью ••• рассмот- рим не зависящую от нее последовательность независимых случайных ве- личин £i, £2, ... таких, что £п имеет то же распределение, что и £я, 1. (Когда исходное пространство элементарных событий предполагается до- статочно «богатым», существование такой последовательности следует из следствия 1 к теореме 1 § 9 гл. II. В свою очередь можно показать, что это предположение не ограничивает общности.) Тогда, если сходится (Р-п. н.) ряд 52 £л, то сходится и ряд 52 £л, а значит, и ряд 22 (Сл ~ U Но E(£rt - (п) = 0 и Р{|£„ - £я| 2с} = 1. Поэтому по утверждению Ь) теоремы 1 52 О(& ~1л) < Далее, ED(^-£«)<“ Значит, по утверждению а) теоремы 1 с вероятностью единица сходится РЯД 12 (£п - E£rt), а значит, сходится и ряд 52 ЕСл- Таким образом, из сходимости (Р-п. н.) ряда 22 £л (в предположении Р{|£я К с} = 1, п 1) вытекает, что оба ряда 22 Е£л и 52 сходятся. □ 3. Следующая теорема дает необходимое и достаточное условие схо- димости ряда 52 £л без предположений об ограниченности случайных ве- личин. Пусть с — некоторая константа и 10, К|>с.
538 ГЛ. IV. НЕЗАВИСИМЫЕ СЛУЧАЙНЫЕ ВЕЛИЧИНЫ Теорема 3 (теорема Колмогорова о «трех рядах»). Пусть $2» ... — последовательность независимых случайных величин. Для сходимости с вероятностью единица ряда 52 Сл необходимо, чтобы для любого с > 0 сходились ряды Е ес е°с Ep{ic><* и достаточно, чтобы эти ряды сходились при некотором с > 0. Доказательство. Достаточность. По теореме о «двух рядах» ряд 52 & сходится с вероятностью единица. Но если 52 Р{|£л| ^с}<оо, то по лемме Бореля—Кантелли с вероятностью единица 52 Л|£л| ^с)<оо, а значит, Сл = для всех 33 исключением, быть может, конечного числа. Поэтому ряд 52 Сл также сходится (Р-п. н.). Необходимость. Если ряд £ £л сходится (Р-п. н.), то —»0 (Р-п. н.) и, значит, для всякого с > 0 может произойти (Р-п. н.) не более конечного числа событий {|£rt|^c}. Поэтому 52 Л1Сл|>^)<оо (Р-п. н.) и по второй части леммы Бореля—Кантелли 53 Р{|£л | >с}<оо. Далее, из сходимости ряда 53 £л следует и сходимость ряда 52 Сл- Поэтому по теореме о «двух рядах» каждый из рядов 52 Е^ и 52 сходится. □ Следствие. Пусть 6, ... — независимые случайные величины с Е£л = 0. Тогда, если то ряд 52 £л сходится с вероятностью единица. Для доказательства заметим, что SEiTfci<0° * 52ЕКЖ1 < 1) + Кл№1>’)1 <оо. Поэтому, если =£,/(|С„| < 1), то Е Е(^)2<оо. Поскольку Е£л = 0, то Е |Е^|=Е |Е6Л1Ш1)| = Е |Е€ЛЫ>1)1^ ^ЕЕ^|/(к«|>,)<оо- Значит, каждый из рядов 52 и 52 сходится. Далее, по неравенству Чебышева Р{|£л | > 1} = Р{|€л |/(|€л I >!)>!}< Е |Сл |/(|€л I > 1).
§2. СХОДИМОСТЬ РЯДОВ 539 Поэтому 52 Р{|£лI > 1} < оо. Тем самым сходимость ряда 52 £п следует из теоремы о «трех рядах». 4. Задачи. 1. Пусть £i, £2, ... — последовательность независимых случайных ве- личин, Sn = £1 +... + £п- Используя теорему о «трех рядах», показать, что: а) если 52 Сп < 00 (Р-п. н.), то ряд 52 сходится с вероятностью единица в том и только том случае, когда сходится ряд Е£//(|£/| 1); Ь) если ряд 52 £п сходится (Р-п. н.), то 52 Сп < оо (Р-п. н.) в том и только том случае, когда £ (Е|бЖл|^ 1))2<оо. 2. Пусть £i, £2, ... — последовательность независимых случайных ве- личин. Показать, что 52 < 00 (Р“п-н.) тогда и только тогда, когда У Е——-о <оо. 1+^ 3. Пусть £1, £2, ... — последовательность независимых случайных ве- личин. Показать, что тогда следующие три условия эквивалентны: а) РЯД 12 сходится с вероятностью единица; Ь) ряд 52 сходится по вероятности; с) ряд 52 £п сходится по распределению. 4. Привести пример, показывающий, что в теоремах 1 и 2 нельзя, вообще говоря, отказаться от условия равномерной ограниченности (Р{|£« | с} = 1 для некоторого с > 0). 5. Пусть £1, ..., ^ — независимые одинаково распределенные случай- ные величины с E£i = 0, E£f < 00 и Sn = £1 +... + £rt. Доказать следующий односторонний аналог (А. В. Маршалл) неравенства Колмогорова (2): Р( max 9 —" 2. J е2+ ES2 6. Пусть £ь£г, ... — последовательность (произвольных) случайных величин. Доказать, что если 52 Е|£л|<оо, то ряд 52 & сходится абсо- лютно с вероятностью единица. 7. Пусть £1, £2, ... — независимые симметрично распределенные слу- чайные величины. Показать, что Е(е2л1). п 8. Пусть £1, £2, ... — независимые случайные величины с конечными вторыми моментами. Показать, что ряд 52 £«• сходится в L2, если и только если сходятся ряды 52 Е£л и 52 D£rt.
540 ГЛ. IV. НЕЗАВИСИМЫЕ СЛУЧАЙНЫЕ ВЕЛИЧИНЫ 9. Пусть ••• — независимые случайные величины и ряд 52 £п сходится п. н. Показать, что п. н. значение этого ряда не зависит от порядка суммирования тогда и только тогда, когда £ |E(£n; |6i| 1)| <оо. 10. Пусть ... — независимые случайные величины с Е£л = 0, п 1, и оо £ ЕКЖ| 1)+1бЖ1 > 1)] <оо. п—1 оо Тогда ряд £ Сп сходится Р-п. н. п=1 11. Пусть Л1,Л2, ... — независимые события с Р(Лл)>0, п>1, и оо Р(Дп) = оо. Показать, что тогда п=\ п п £/(Л)/£ РО4/)-*1 (Р-п.н.) прип-юо. /=1 /=1 12^Пусть fi, £2, ••• — независимые случайные величины со средними Е& и дисперсиями такими, что lim E£rt = с и £ <т~2 = оо. Показать, п П=1 что тогда л е. л 1 £^/£-2-»с (Р-п.н.) при п->оо. /=1 а/ /=1 § 3. Усиленный закон больших чисел 1. Пусть $1, £2, ... — последовательность независимых случайных ве- личин с конечными вторыми моментами, Sn=£i + ...4-£л. Согласно зада- че 2 из § 3 гл. III, если дисперсии D£, равномерно ограничены, то имеет место закон больших чисел: Sn-ESn До, я_+оо (1) Усиленным законом больших чисел называется утверждение, в ко- тором сходимость по вероятности в (1) заменяется сходимостью с веро- ятностью единица. Один из первых общих результатов в этом направлении дается следу- ющей теоремой. Теорема 1 (Кантелли). Пусть £\, ... — независимые случайные величины с конечным четвертым моментом такие, что для неко- торой константы С Е1&-Е&1ЧС,
§3. УСИЛЕННЫЙ ЗАКОН БОЛЬШИХ ЧИСЕЛ 541 Тогда при п—>оо 5'~яЕ5~~>0 (2) Доказательство, Не ограничивая общности, будем считать Е£л = О, 1. По следствию к теореме 1 из § 10 гл. II для сходимости —>0 (Р-п. н.) достаточно, чтобы для любого г > 0 р(| —I < о°- II п I ) В свою очередь, в силу неравенства Чебышева для этого достаточно вы- полнения условия cl$п I4 > Е — <оо. I п I Покажем, что при сделанных предположениях это условие действительно выполнено. Имеем sn4=(ei+-+e»)4=E^+E 2ПИ!^+ 1=1 Ц i^i i<i i^k j<k Учитывая, что E& = 0, k^n, отсюда находим n n n --------- ES4 = £E£4 + 6E ^-Е^лС + бЁ i=l i,J=l i,i=l i<i ^nC + 6n(” ~ ° C = (3n2 - 2n)C < 3n2C. Следовательно, Е^),<зсЕл<„. 2. Привлечение более тонких методов позволяет существенно ослабить предположения, сделанные в теореме 1, для справедливости усиленного закона больших чисел. Теорема 2 (Колмогоров). Пусть £|, ••• ~последовательность независимых случайных величин с конечными вторыми моментами,
542 ГЛ. IV. НЕЗАВИСИМЫЕ СЛУЧАЙНЫЕ ВЕЛИЧИНЫ положительные числа Ьп таковы, что Ьп]оо и о) Тогда Sn~ESn —>0 (Р-п.н.). (4) Оп В частности, если (5) то 0 (Р-п.н.)- (6) Для доказательства этой теоремы, а также нижеследующей теоремы 3 нам понадобятся два вспомогательные утверждения. Лемма! (Теплиц). Пусть (ап)п^\— последовательность неотри- п цательных чисел, bn — ^ at, b\=a\>0 и Ьп]оо, п—^оо. Пусть также 1 /=1 (хп)п^{ — последовательность чисел, сходящаяся к некоторому чис- лу х. Тогда 1 п rnXaixi-^x- /=1 В частности, если ап = \, то Xi+..^.+Xn (8) Доказательство. Пусть е > 0 и по = ио(е) таково, что для всех и > ио )хп —х| ^е/2. Выберем ni >по так, что 1 rt° /=1 Тогда для n>ni п /=Л0+1 of|x(-x|s£ + ^£«e. □
§3. УСИЛЕННЫЙ ЗАКОН БОЛЬШИХ ЧИСЕЛ 543 Лемма 2 (Кронекер). Пусть (Ьп)п>\ — последовательность поло- жительных возрастающих чисел, foo, л —>оо, и (хп)п^\ — последо- вательность чисел таких, что ряд 52 хп сходится. Тогда ! п — Ь;Х; —>0, П-+ОО. /=1 В частности, если Ьп = п, хп = — и ряд 52 — сходится, то п п У\.±^+У1 ^0, (9) п Доказательство. Пусть />о = О, So = O, Srt = 52 */• Тогда («суммиро- /=1 вание по частям») bjxj= ~ ^/—1)= bnSn ~ Mo — \ Sj_\(bj — bj—\) ;=i /=1 /=1 и, значит (мы полагаем aj = bj — fy-i), i Д i A £ bixi=Sn ~b'n^ 5/-1а/ /=1 /=1 так как если Sn —то по лемме Тёплица j п — Sj-iaj -*х. □ /=1 Доказательство теоремы 2. Поскольку Ьп Ьп —* \ / «=1 то в силу леммы Кронекера для выполнения (4) достаточно, чтобы (Р-п. н.) сходился ряд £ этот ряд действительно сходится в силу условия (3) и теоремы 1 из § 2. □ Пример 1. Пусть ••• — последовательность независимых бер- нуллиевских случайных величин с P{£rt = 1} = P{£rt = -!}= 1/2. Тогда по- V- 1 скольку 52 ---9“ < °°> то п In п (Р-П.Н.). (Ю)
544 ГЛ. IV. НЕЗАВИСИМЫЕ СЛУЧАЙНЫЕ ВЕЛИЧИНЫ 3. В том случае, когда величины • • • не только независимы, но и к тому же одинаково распределены, для справедливости усиленного закона больших чисел нет надобности требовать (как в теореме 2) существования второго момента, а достаточно лишь существования первого абсолютного момента. Теорема 3 (Колмогоров). Пусть • • • — последовательность независимых одинаково распределенных величин с E|£i| < оо. Тогда (Р-п.н.1 (11) где т = Е£ь Для доказательства нам понадобится следующая Лемма 3. Пусть $ — неотрицательная случайная величина. Тогда оо оо <12> П=1 /2=1 Дд^азательство дается следующей цепочкой неравенств: оо оо оо YiP{^n} = Yt'£P^^^<k+^ = YtkP^^<k+^ = П=1 /1=1 k^n k=\ оо оо =£Е[*/(*^<*+1)]с£Е[е/(^£<л+1)]=Ее^ k=0 k=Q Е[(*+W^<*+1)]=£ (*+1)Р{*«<*+1} = k=0 k=Q оо оо оо =Е р{£>"}+Е р{*^<*+1}=£р^'г>+1- ° n=l k=0 /1=1 Доказательство теоремы 3. В силу леммы 3 и леммы Бореля— Кантелли (§ 10 гл. II) E|Ci|<oo о £Р{|6|^}<оо о 52 Р{|Сп|>л}<оо о Р{|£1|>Л б.ч.} = 0. Поэтому с вероятностью единица для всех и, за исключением лишь конеч- ного числа, |£л| <п. Обозначим я __ fCn> 16/1 < я, ^п~ [о, |ел|>п,
§3. УСИЛЕННЫЙ ЗАКОН БОЛЬШИХ ЧИСЕЛ 545 и будем считать, что Е£л = 0, п 1. Тогда —*0 (Р-п. н.), если и только если ^ + * * *+^ —>0 (Р-п. н.). Заметим, что, вообще говоря, E£rt /0, но Еёи = Е&/(&I < п) = E^/(|Ci | < п) ECi = 0. Поэтому по лемме Тёплица « k=I и, следовательно, * —>0 (Р-п. н.) в том и только том случае, когда (Р-п.н.) (* ~ Е6)+.г •+ & ~ _> о, п -»оо. (13) Обозначим 4л =4л - Е4„. В силу леммы Кронекера для выполнения (13) достаточно лишь установить, что ряд £ сходится (Р-п. н.). В свою очередь, согласно теореме 1 из § 2, для этого достаточно показать, что предположение E|fi| <оо обеспечивает сходимость ряда “Т-- Следующая цепочка неравенств показывает, что это действительно так: ___ сю _~2 оо . л=1 п=1 ОО ОО П =Е ^[Л|<Я)]=£ 4, 2 Ек?/(*-1 <i*i <А)1= п=1 л=1 /г=1 оо оо оо =22 - u i4> । < л)] 22 i <2 Е -1 < 161 < 6=1 n=k Л=1 оо 2 22 Е [141 \l(k - 1 |4i | < й)] = 2Е |4i | < оо. □ Л=1 Замечание 1. Утверждение теоремы допускает обращение в следу- ющем смысле. Пусть ••• — последовательность независимых оди- наково распределенных случайных величин, для которых с вероятностью единица Ci + ... + & } п ' где С — некоторая (конечная) константа. Тогда E|£i| < оо и С = Е£ь
546 ГЛ. IV. НЕЗАВИСИМЫЕ СЛУЧАЙНЫЕ ВЕЛИЧИНЫ Sn В самом деле, если--> С (Р-п. н.), то п v ' = (р.п.н.) п п \ п )п—1 и, значит, Р{|Си| > п б. ч.} = 0. По лемме Бореля—Кантелли (§ 10 гл. И) 52 Р{|С1|>«}<оо и в силу леммы 3 E|£i|<oo. Тогда из доказанной теоремы следует, что С = Е£Ь Таким образом, для независимых одинаково распределенных слу- чайных величин условие E|£j <оо является необходимым и достаточным для сходимости (с вероятностью единица) отношений Sn/n к конечному пределу. Замечание 2. Если математическое ожидание т — E£i существует, но не обязательно конечно, то утверждение (9) теоремы также остается в силе. В самом деле, пусть, например, Е£[" < оо и Е£* = оо. Для С > 0 поло- жим п /=1 Тогда (Р-п. н.) С qC п п п п Но при С —>00 EW1^Q-E£i=oo, $ поэтому---->4-00 (Р-п. н.). Sn Замечание 3. В теореме 3 утверждается сходимость — —>т (Р-п. н.). Следует отметить, что здесь помимо сходимости с вероятностью единица . л L' \ c|Sn I имеет место также и сходимость в среднем ( —-> т 1, т. е. Е — - т —> —>0, п—>оо. Это следует из эргодической теоремы 3 из § 3 гл. V. Но в рассматриваемом случае независимых одинаково распределенных слу- чайных величин 6, &> • • • и = £ 1 + & + • • • + это может быть доказано (задача 7) и непосредственно без обращения к эргодической теореме. 4. Остановимся на некоторых применениях усиленного закона боль- ших чисел. Пример 2 (применение к теории чисел). Пусть Q = [0, 1), —60- релевская система подмножеств Q и Р — мера Лебега на [О, 1). Рассмотрим
§3. УСИЛЕННЫЙ ЗАКОН БОЛЬШИХ ЧИСЕЛ 547 двоичное разложение cu = 0,cuicu2... чисел cugQ (с бесконечным количе- ством нулей) и определим случайные величины fi(cu), &(^), •••» полагая £rt(cu) = curt. Поскольку для любого п 1 и любых хь ...» хп, принимающих значения 0 или 1, {<*>: CiM = x..., <„(ш) = х„} = ( . Х\ Х2 , . хп . Х| ХП 1 1 ‘ 2 + 22 + + 2я Ш < 2 + ‘’+ 2я + 2я J ’ то P-мера этого множества равна 1/2". Значит, Сь Сг> ••• — последовате- льность независимых одинаково распределенных случайных величин с P{6=o}=P{e1 = i}=i. Отсюда и из усиленного закона больших чисел вытекает следующий ре- зультат Бореля: почти все числа интервала [0, 1) нормальны в том смысле, что с вероятностью единица доля нулей и единиц в их дво- ичном разложении стремится к 1/2, т. е. 1 п 1 Л=1 Пример 3 (применение к «методу Монте-Карло»). Пусть /(%)— непрерывная функция, заданная на интервале [0, 1] и принимающая значе- ния из [0, 1]. Следующие рассуждения лежат в основе статистического ме- 1 тода численного вычисления интегралов § f(x) dx («метод Монте-Карло»), о Пусть £1, т/1, ^2, ... — последовательность независимых случайных величин, равномерно распределенных на [0, 1]. Положим {1, если/($•)> ту/, О, если Ясно, что 1 Epi =P{/(C1)>771} = S /(AT)rfx. о Согласно усиленному закону больших чисел (теорема 3), 1 п 1 - 52 А $ f(x) dx (Р-п. н.). /=1 о
548 ГЛ. IV. НЕЗАВИСИМЫЕ СЛУЧАЙНЫЕ ВЕЛИЧИНЫ 1 Таким образом, численный подсчет интеграла § f(x) dx можно осуще- о ствлять с помощью моделирования пар случайных чисел (&, ц), 1, 1 п с последующим подсчетом величин р, и - 22 Pi- п /=1 Пример 4 (усиленный закон больших чисел для процесса вос- становления). Пусть N = — процесс восстановления, введенный в п. 4 § 9 гл. II: М = 22 /(7^0, = ai + ... + <7rt, где cr2, ... — пос- n=l ледовательность независимых одинаково распределенных положительных случайных величин. Будем сейчас предполагать, что р = Eai < оо. В этом предположении для процесса N выполняется усиленный закон больших чисел: (Р-п.н.), t^oo. (14) Для доказательства заметим прежде всего, что поскольку < 7^+ь t 0,уо в предположении Nt > 0 справедливы неравенства Zk < _L < -kJ-") Nt Nt Nt + l\ Nt)' Ясно, что Nt =Nt(u>)—*oo (Р-п. h.), t —>oo. В то же самое время, со- гласно теореме 3, w = д (Р.П н) п _ (15) п Поэтому также и п ---->Р (Р-п.н.), и —> оо, Nt(w) из (15) заключаем, что (Р-п. н.) существует предел а следовательно, lim -Z-, равный д, что и доказывает усиленный закон больших чисел (14). /—юо Nt 5. Задачи. оо 1. Показать, что Е£2 < оо тогда и только тогда, когда 22 лР{|£| >п}< п=1 2. Предполагая, что ••• независимы и одинаково распределе- ны, показать, что если E|£i|a <оо для некоторого 0<а< 1, то —4—>0 п1'а (Р-п. н.), и если < оо для некоторого 1 /3 < 2, то п —* 0 (Р-п. н.).
§3. УСИЛЕННЫЙ ЗАКОН БОЛЬШИХ ЧИСЕЛ 549 3. Пусть ... — последовательность независимых одинаково рас- пределенных случайных величин с E|£i| = оо. Показать, что для любой последовательности констант {ап} lim I — -art| =оо (Р-п. н.). п I п | 4. Будут ли все рациональные числа из [О, 1) нормальными (в смысле примера 2 в п. 4)? 5. Привести пример последовательности независимых случайных вели- Sn чин £ь ... таких, что предел lim — существует по вероятности, но не Л-+ОО П существует с вероятностью единица. 6. (Н. Этемади.) Показать, что утверждение теоремы 3 остается спра- ведливым, если «независимость» случайных величин Ci, €2» заменить их «попарной независимостью». 7. Показать, что в условиях теоремы 3 имеет место также и сходимость IS I -у - т —>0, и —* оо). 8. Пусть ••• — независимые одинаково распределенные случай- ные величины с Е|€112 < оо. Показать, что П Р{|€1| > eVn}-»О и -^=тах|&|До. 9. Рассмотрим десятичные разложения чисел си = 0,cuicu2... из интер- вала [0, 1). (а) Перенести на этот случай усиленный закон больших чисел, данный в п. 4 для двоичных разложений. (Ь) Показать, что рациональные числа не являются нормальными (по Борелю), т. е. для них в десятичном разложении (&(cu) = cu*, k 1) 1 п 1 - — (Р-п.н.) для любого / = О, 1, ..., 9. k=\ (с) Показать, что число си = 0,12345678910111213..., где подряд вы- писываются все числа, является нормальным (см. пример 2). 10. (а) Пусть £2, ••• — последовательность независимых случайных величин с Р{£п = ±па}= 1/2. Показать, что для этой последовательности закон больших чисел выполняется тогда и только тогда, когда а < 1/2. (Ь) Пусть f = f(x) — ограниченная непрерывная функция на (0, оо). Показать, что для всякого а > 0 и всех х > О ОО Ь lim 52 f(x+-}e~an^-&~ = Кх + аУ п—>оо \ П / к\ /г=1
550 ГЛ. IV. НЕЗАВИСИМЫЕ СЛУЧАЙНЫЕ ВЕЛИЧИНЫ 11. Доказать, что усиленному закону больших чисел Колмогорова (теорема 3) можно придать такой вид: пусть £i, £2, ... — независимые оди- наково распределенные случайные величины, тогда E|£i| <оо n~{Sn->E£i (Р-п. н.), Е|£]| = оо о lim ri~xSn = +оо (Р-п. н.). Доказать, что первое утверждение остается в силе, если независимость заменить попарной независимостью. 12. Пусть £i, £2» — последовательность независимых одинаково рас- пределенных случайных величин. Показать, что Esupl^lcoo 4» Е|£1| 1п+|£1|<оо. 13. Пусть Srt = £i 4-... + £л, 1, где £1, £2, ... — последовательность независимых одинаково распределенных случайных величин с E£i = 0, Eie,i>o. Показать, что (Р-п. н.) lim п ^2Sn = оо. lim п ,/2SZI = -oo. 14. Пусть Srt = £i + ... + £п, /О 1, где £1, £2, ... — последовательность независимых одинаково распределенных случайных величин. Показать, что для всякого ае (0, 1/2] выполнено одно из следующих свойств: (a) n~aSn -»оо (Р-п. н.); (b) n-^Sn —> -00 (Р-п. н.); (с) lim n~aSn = 00, lim n~aSn = —00 (Р-п. н.). 15. Пусть Sn = £1 +... + £rt, и > 1, So = 0, £1, £2, ... — последователь- ность независимых одинаково распределенных случайных величин. Пока- зать, что: (а) для любого е > 0 Р{|$й| ^пе}<оо о Е£1=0, Е£2<оо; П=1 (Ь) если E£i < 0, то для р > 1 EfsupSrtV !<ооф> Е(£+)р<оо; \п>0 / (с) если E£i = 0 и 1 < р 2, то для некоторой константы Ср оо оо £ P{max S* > n} CpE|Ci Г, £ Р{тах |S*| > л} 2СРЕ|6И /1=1 Л=1 (d) если E£i = 0, Е£2 < оо и М(г) = sup(Srt - /ге), е > 0, то lim еМ(е) = <т2/2. £—>ОО
§4. ЗАКОН ПОВТОРНОГО ЛОГАРИФМА 551 § 4. Закон повторного логарифма 1. Пусть £i, ... — последовательность независимых бернуллиевских случайных величин с Р{^л = 1} = Р{^Л = -!}= 1/2, Srt =& 4-... 4-£л. Из доказательства теоремы 2 в § 1 следует, что с вероятностью единица lim =-f-oo, lim-^= = —оо. (1) у/п — у/П С другой стороны, согласно (9) § 3, -^2-^0 (Р-п.н.). (2) у/П 1П П Сравним эти два результата. Из (1) следует, что с вероятностью единица траектории (Srt)rt^i беско- нечное число раз пересекают «кривые» ±€у/п, где е — любое положитель- ное число, но в то же самое время они в силу (2) лишь конечное число раз выходят из внутренности области, ограниченной кривыми ±£у/п In п. Эти два результата дают весьма полезную информацию о характере «размаха» колебаний симметричного случайного блуждания (Srt)rt^i. Приводимый ни- же закон повторного логарифма существенно уточняет эти представления о «размахе» колебаний (Sn)n>\- Введем такое Определение. Функция <р* = <р*(л), и>1, называется верхней (для (5rt)rt^i), если с вероятностью единица Srt^<£*(n) для всех /г, начиная с некоторого п = под- функция и>1, называется нижней (для (5Л)Я>1), если с вероятностью единица Sn > для бесконечно многих и. В соответствии с этим определением и в силу (1) и (2) можно сказать, что каждая из функций <р* =Су/п In и, е > 0, является верхней, а функция = еу/п — нижней, е > 0. Пусть ip = — некоторая функция и = (1 + е) у>, = (1 - е) <р, где е > 0. Тогда нетрудно видеть, что (lim 1) = f lim sup 11 <=> I 4>(п) J ( п [т/п <р(т) J J Г 5 ) <=> < sup —7-7 1 4-е для всякого е > 0 и некоторого п\(е) > <=> о К^(МФ0 для всякого е > 0 и всех т, начиная с некоторого П[(е) (3)
552 ГЛ. IV. НЕЗАВИСИМЫЕ СЛУЧАЙНЫЕ ВЕЛИЧИНЫ Точно так же (lim -^4 > 11 = /lim sup > 11 о I <p(n) J [ п <р(т)\ J {5 1 sup ——- для всякого е > 0 и некоторого П2(е) ? о т>л2(е) J {Sm (1 — г)<р(т) для всякого е>0 и для^ бесконечно многих значений т, начиная с >. (4) некоторого Пз(е) > П2(е) ) Из (3) и (4) вытекает, что для того, чтобы проверить, что каждая из функций <£* = (1 +е)<£, е > 0, является верхней, надо доказать, что р{пж4^^1} = 1- (5) I <р(п) > А для того, чтобы доказать, что функции <р*£ = (1 — е)<р, е>0, являются нижними, надо установить, что ' p(iiS 44>1) = 1- (6) I <р(п) J 2. Теорема 1 (закон повторного логарифма). Пусть • — по- следовательность независимых одинаково распределенных случай- ных величин с Е$ = 0 и Е£2 — а2 > 0. Тогда pflta= = (7) I iMn) J где *ф(п) = V2а2 п In In п. (8) Для случая равномерно ограниченных случайных величин закон по- вторного логарифма был установлен Хинчиным (1924 г.). В 1929 г. Колмо- горов обобщил этот результат на широкий класс независимых случайных величин. В условиях, сформулированных в теореме 1, закон повторного логарифма установлен Хартманом и Винтнером (1941 г.). Поскольку доказательство этой теоремы довольно сложно, ограничим- ся рассмотрением лишь частного случая, когда случайные величины £п являются нормально распределенными, £я~<Ж(0, 1), 1. Начнем с доказательства двух вспомогательных результатов. Лемма 1. Пусть ...» — независимые случайные величины с симметричным распределением (P{&gB} = P{—&GB} для каждого В е «^(/?), k п). Тогда для любого действительного а р( max S*>al ^2Р{5„>а}. (9)
§4. ЗАКОН ПОВТОРНОГО ЛОГАРИФМА 553 Доказательство. Положим Ak = {Si^a, Sk> а}, и пусть А = = I max Sk > а I и В = {Srt > а}. Поскольку на множестве Ak имеем Sn > а ll^6^n J (так как S* Sn), то Р(В П Ak) > Р(Л* П {S„ > S*}) = Р(Л*) P{S„ > Sk} = = Р(Л*)Р{&+1 + ... + £я>0}. В силу симметричности распределений вероятностей случайных вели- чин £i..Сл Р{&+1 + • • • + £л > 0} = Р {&+1 +... + £я < 0}. Поэтому Р{&+1 +... + Сл > 0} > 1/2 и, значит, Р(В)>£ Р(Л*нВ)> 1 £ Р(Л*)=1р(Л), 6=1 6=1 что и доказывает (9). (Ср. с доказательством в п. 3 § 2 гл. VIII.) □ Лемма 2. Пусть Sn^^(0, а2(и)), сг2(п) Т оо и числа а(п), п 1, та- ковы, что —► оо, п —> оо. Тогда <г(п) P{Sn>a(n)}^-^-e~^. (10) у2тга(/г) Доказательство следует из того, что при х —> оо а случайная величина Sn/a(ri)~^(0, 1). Доказательство теоремы 1 (для & ~^Ж(0, 1)). Установим сначала соотношение (5). Пусть е > О, А = 1 + е, п* = А\ где & > а £о выбирается так, чтобы In In ko был определен. Обозначим также Ak = {Srt >Хф(п) для некоторого n€(rik, Лб+i]}, (И) и пусть А = {Ak б. ч.} = {Srt > А^(п) для бесконечно многих п}. В соответствии с (3) для доказательства (5) достаточно доказать, что Р(Л) = 0. Покажем, что 52 Р(Л0<оо. Тогда по лемме Бореля—Кантелли (§ 10 гл. II) будем иметь Р(Л) = 0. 2 - 9728
554 ГЛ. IV. НЕЗАВИСИМЫЕ СЛУЧАЙНЫЕ ВЕЛИЧИНЫ Из (11), (9) и (10) находим, что Р(4*) P{Srt > X^(nk) для некоторого п е (nk, nk+\]} < P{Srt > А^(п^) для некоторого п < 2Р{5л*+1 > А^(п^)}~ -------ттг-тв”^^2) sSCi<?-Alnln х“ ^C2e-x'nk = C2k-x, x^nk) у/Пк ОО где Ci и С2 — некоторые константы. Но ^2 k~x < оо, поэтому ^2 РИл) < k=\ <00. Итак, соотношение (5) доказано. Перейдем к доказательству (6). В соответствии с (4) надо показать, что для А = 1 - е, е > 0, с вероятностью единица Sn X^(n) для бесконечно многих п. Применим доказанное соотношение (5) к последовательности (—Sn)n^\. Тогда получим, что для всех и, за исключением, быть может, ко- нечного числа, (Р-п. н.) —Sn 2^(и). Следовательно, если n,k~Nk, N > 1, то для достаточно больших k Snk^ >-2^(nk-\\ или Snk>Yk-2Wnk_^ (12) где Y= Snk — Snk_x. Поэтому, если доказать, что для бесконечно многих k Yk>X^(nk) + 2^(nk^ (13) то вместе с (12) это даст, что (Р-п. н.) Snk > X^(nk) также для бесконечно многих k. Возьмем некоторое A' G (А, 1). Тогда можно найти такое N > 1, что для всех k X'[2(Nk-Nk~x) In In Nk]'/2>X(2Nk In In Nk)'/2+ 2(2Nk~{ In In Nk~x)i/2 = = X^(Nk) + 2^(Nk~l). Теперь достаточно показать, что для бесконечно многих k Yk>X'[2(Nk -Nk~') In In W*],/2. (14) Очевидно, У^~^К(0, Nk — Nk~i). Поэтому в силу леммы 2 P{Yk>X'[2(Nk-Nk~l) In In Л/*]|/2}~ __________!____________е-(У)г In In N* > C| _(A')2 > C2 а/2^Л'(2 In In Af*)1/2_''(In*)1/2 ^*ln*’
§4. ЗАКОН ПОВТОРНОГО ЛОГАРИФМА 555 Так как £ |п =оо, то, по второй части леммы Бореля—Кантелли, с ве- роятностью единица для бесконечно многих k выполнено (14), что и дока- зывает соотношение (6). □ Замечание 1. Применяя (7) к случайным величинам нахо- дим, что (Р-п. н.) пщ-§4=-1. (15) Из (7) и (15) следует, что закону повторного логарифма можно придать также следующую форму: р(Ы^1 = 1} = 1. (16) Замечание 2. Закон повторного логарифма говорит о том, что для любого е>0 каждая из функций = (1 +e)V> является верхней, а функция = (1 - — нижней. Утверждение (7) закона повторного логарифма эквивалентно также тому, что для всякого е > О P{|Srt|>(l-eW) б.ч.}= 1, P{|Srt|^(l+eW)6.4.} = 0. 3. Задачи. 1. Пусть ••• — последовательность независимых случайных ве- личин, £п~<Ж(0, 1). Показать, что 2. Пусть £i, ••• — последовательность независимых случайных ве- личин, распределенных по закону Пуассона с параметром А > 0. Показать, что (независимо от А) pliim <П.|П 1пп = 1} = 1. I in п J 3. Пусть ... — последовательность независимых одинаково рас- пределенных случайных величин с Ee/Z^ = , 0 < а < 2. Показать, что 2*
556 ГЛ. IV. НЕЗАВИСИМЫЕ СЛУЧАЙНЫЕ ВЕЛИЧИНЫ 4. Установить справедливость следующего обобщения неравенства (9). Пусть £ь ...» £л — независимые случайные величины, So = O, S* = £i + + ... + £*. Тогда для всякого действительного а справедливо неравенство Лева. Р{ max [Sk + p(Sn -S*)] >а} ^2P{Srt >а}, где — медиана случайной величины £, т. е. такая константа, что 5. Пусть £ь ...» £rt — независимые случайные величины и So = O, Sk = Ci + • • • + £*• Доказать, что: (а) (в дополнение к задаче 4) Р( max |S* + p(Sn - Sk)\а] 2Р{|Sn| > а}, где /Д£) есть медиана случайной величины £; (ЭД если £1, ..., £л одинаково распределены и симметричны, то l_e-«P{|6l>x}^p| max |^|>x)^2P{|S„|>x}. 6. Пусть £ь £rt — независимые случайные величины с Е£/=0, 1 I п, и S* = £i +... + £*. Показать, что р/max Sk >а\ ^2P{Srt E|Srt|} дляа>0. J 7. Пусть £i, ..., £rt — независимые одинаково распределенные случай- ные величины, Е£/ =0, <т2 = Е£р <оо, Sn =£i + ... + £„ и |£/|^С (Р-п. н.), i п. Показать, что тогда Ее*5” ^exp{2~!/ix2a2(l +хС)} для всякого 0^х^2С“!. При тех же предположениях установить, что если (ап) — последовате- льность действительных чисел такая, что ап/у/п-*оо, но ап = о(п), то для всякого е > 0 и достаточно больших п 2 P{S„>an}>exp|-^2(H-e)}. 8. Пусть £i, ..., £л — независимые одинаково распределенные случай- п ные величины, Е£, =0, |£/1 С (Р-п. н.), i^n. Пусть Dn = £2 ^£ь Показать, /=1 что для Sn=£i + ... + £я справедливо неравенство (Ю. В. Прохоров) P{S„ >а}^ехр(-£ arcsin aeR.
§ 5. СКОРОСТЬ СХОДИМОСТИ В У. 3. Б. ч. 557 § 5. О скорости сходимости в усиленном законе больших чисел и о вероятностях больших уклонений 1. Обратимся к схеме Бернулли, рассмотренной в § б гл. I. Для этой схемы теорема Муавра—Лапласа дает аппроксимацию для вероятностей стандартных (нормальных) уклонений |Srt — пр\^су/п, т. е. отклонений Sn от центрального значения пр на величину порядка у/п. В то же самое время в том же § 6 гл. I была приведена оценка вероятностей для так называемых больших уклонений |Srt -пр\ ^еп, т. е. отклонений Sn от пр порядка п: р{|^-р|>4^2е-2яе2 (D (см. формулу (42) в § 6 гл. I). Отсюда, конечно, следуют неравенства дающие определенное представление о скорости сходимости с вероятно- Sn стью единица величин — к р. п Рассмотрим теперь вопрос о справедливости формул типа (1), (2) в несколько более общей ситуации, когда Sn =£i +... + £п — сумма незави- симых одинаково распределенных случайных величин. 2. Говорят, что случайная величина £ удовлетворяет условию Краме- ра, если существует такая окрестность нуля, что для любого А из этой окрестности ЕеА^ < оо (3) (можно показать, что это условие равносильно экспоненциальному убы- ванию Р{|£| >х}). Положим <р(Х) = Ее* и 'ф(Х) = In <р(А). (4) На внутренности множества Л = {Ае/?: V>(A)<oo} (5) функция 'ф(Х) является выпуклой (книзу) и бесконечно дифференцируемой. При этом ^(0) = 0, яЛ'(О) = т (= ЕС), ^"(А) 0.
558 ГЛ. IV. НЕЗАВИСИМЫЕ СЛУЧАЙНЫЕ ВЕЛИЧИНЫ Образуем функцию //(a) = sup [аА-V>(A)], aeR, (6) л называемую преобразованием Крамера (функции распределения F = = F(x) случайной величины £). Функция Н(а) также выпукла (книзу), причем ее минимальное значение, равное нулю, достигается в точке а = т. Если а > т, то /Да) = sup [аА-^(А)]. А>0 Поэтому Р{£ > а} inf ЕеА<€-°> = inf = е~Н{а}. (7) А>0 А>0 Точно так же Н(а) = sup [аА — 'ф(Х)] для а < т и А<0 Р{еО}^<?-//(0). (8) Следовательно (ср. с (42) в § б гл. I), Р{|£ _ т\ е} 2e~min{77(m-e),//(m-Fe)} (0) Если f, £i, ..., — независимые одинаково распределенные случай- ные величины, удовлетворяющие условию Крамера (3), Srt =6+••• + &» 'фп(Х) = In ЕеЛ^, *ф(Х) = In Еел^, Нп(а) = sup [аХ-тМХ)], (10) А ТО Нп(а) — пН(а) (=п sup [аА-^(А)]) А и неравенства (7), (8) и (9) принимают следующий вид: а>т, (11) р(^а}^-*>, а<т, (12) 2e-minWm-s}’H(m+s}}n. (13) Замечание 1. Результаты типа (14)
§ 5. СКОРОСТЬ СХОДИМОСТИ В У. 3. Б. ч. 559 где а>0 и Ь>0, говорят об экспоненциальной сходимости, «регулируе- мой» константами а и Ь. В теории больших уклонений часто соответству- ющие результаты формулируют в несколько иной, более «грубой» форме: Tim - In р(|——/п| <0, (15) п п U п I J вытекающей, разумеется, из (14) и говорящей об «экспоненциальной» ско- рости сходимости, но без уточнения значений констант а и Ь. Обратимся теперь к вопросу об оценках сверху вероятностей pfsup^>a|, Р/inf pfsup -т\ >Д, W k J k J । k । j которые могут давать определенное представление о скорости сходимо- сти в усиленном законе больших чисел. Будем предполагать, что независимые одинаково распределенные невырожденные случайные величины £, &, &» ... удовлетворяют условию Крамера (3). Зафиксируем п 1 и положим Sk av. считая х = оо, если a, k п. к Пусть, далее, а и А > 0 таковы, что Аа —In 92(A) 0. (16) Тогда Чтобы сделать заключительный шаг, заметим, что последовательность слу- чайных величин eXSk-k In у>(А), k^\, относительно потока сг-алгебр = ..., £*}, 1, образует мартин- гал. (Подробнее см. гл. VII и, в частности, пример 2 в § 1.)
560 ГЛ. IV. НЕЗАВИСИМЫЕ СЛУЧАЙНЫЕ ВЕЛИЧИНЫ (18) (19) Тогда из неравенства (8) в § 3 гл. VII вытекает, что P/sup eXS*~k ,n > e«(Aa~ln ¥>(Л)Н e~n(Xa-\n <p(A)), \k^n J и, следовательно, (при условии (16)) получаем неравенство Р / sup "7“ > #1 —rt(Aa—In <р(Х)) * J Пусть а > т. Поскольку функция ДА) = аХ — In <р(Х) такова, что ДО) = 0, Д(0) > 0, то найдется А > 0, для которого выполнено (16), и, следовательно, из (18) получаем: если а>т, то ( Sb 1 suPlAa“ln <р<л)1 P<sup^>a>^e *>° =е-пН(а) Аналогично, если а<т, то pfinf k J Из (19) и (20) заключаем, что (20) (21) Р< sup {k^n Замечание 2. Совпадение правых частей в неравенствах (11) и (19) заставляет думать, что это обстоятельство не является случайным. Дей- ствительно, объяснение кроется в том, что последовательности ( \ k /n^k^N при любых n^N образуют обращенные мартингалы (см. задачу 5 в § 1 гл. VII и пример 4 в § 11 гл. I). 3. Задачи. 1. Провести доказательство неравенств (8), (20). 2. Проверить, что на внутренности множества Л (см. (5)) функция V>(A) является выпуклой книзу (и строго выпуклой, если случайная величина £ невырождена) и бесконечно дифференцируемой. 3. В предположении невырожденности случайной величины £ доказать, что функция Н(а) дифференцируема на всей прямой и является выпуклой (книзу). 4. Доказать следующую формулу обращения для преобразования Кра- мера: 'ф(Х) = sup [Аа — Н(а)] а (для всех А, за исключением, быть может, концевых точек множества Л = {А: V’(A) <оо}).
§5. СКОРОСТЬ СХОДИМОСТИ В У.З.Б.Ч. 561 5. Пусть =& + ... + 61, где ...» /г> 1, —независимые одинако- во распределенные простые случайные величины с E£i <0, P{£i >0}>0. Пусть ^(А) = ЕеА^ и inf <р(А) = р (0<р< 1). Показать, что справедлив следующий результат (теорема Чернова): lim i In P{S„ ^0} = In p. (22) 6. Используя (22), показать, что в бернуллиевском случае (P{£i = 1} = = р, Р{£1 =0} = ?) при р<х< 1 lim i In P{Sn^ пх} = —Н(х), (23) n где (ср. с обозначениями в § 6 гл. I) Н(х)=х In ~ 4-(1 -х) In 7. Пусть Srt=£i + ... + 61, 1, где ^1,^2, ... — независимые одинаково распределенные случайные величины с Efi =0, D£i = 1. Пусть (хп)п^\ — Хп л последовательность такая, что хп —> оо и > 0 при п -* оо. Показать, что P{Sn>xnV^} = e-f{l+!)"\ где уп -»0, п —♦оо. 8. Вывести из (23), что в бернуллиевском случае (Р{£] = 1} = р, Р{£,=0} = <7) (а ) при р < х < 1 и хп = п(х — р) P{S„ > пр + хп} = exp{-n// (р + (1 + о( 1))}; (24) Ь) при хп = an\/npq с ап —► оо, -—= —> 0 P{S„>np + xJ = exp{-^(l+o(l))}. (25) Сопоставить (24) и (25) и сравнить их с соответствующими результа- тами из § 6 гл. I.
Глава V СТАЦИОНАРНЫЕ (В УЗКОМ СМЫСЛЕ) СЛУЧАЙНЫЕ ПОСЛЕДОВАТЕЛЬНОСТИ И ЭРГОДИЧЕСКАЯ ТЕОРИЯ § 1. Стационарные (в узком смысле) случайные последовательно- сти. Сохраняющие меру преобразования.................... 563 § 2. Эргодичность и перемешивание........................... 567 § 3. Эргодические теоремы................................... 570
Теория стационарных случайных последовательностей в узком смысле может излагаться вне рамок теории вероятностей как теория однопараметрических групп сохраняющих меру преобразований измеримого пространства с мерой на нем\ она близко соприкасается с общей теорией динамических систем и эргоди- ческой теорией. Математическая энциклопедия, т. 5, стлб. 210 [121] § 1. Стационарные (в узком смысле) случайные последовательности. Сохраняющие меру преобразования 1. Пусть (Q, Р) — вероятностное пространство и £ = (£i, £2, •) — некоторая последовательность случайных величин, или случайная после- довательность. Обозначим последовательность (£*+ь &+2, ...). Определение 1. Случайная последовательность £ называется стаци- онарной (в узком смысле), если для любого 1 распределения вероят- ностей 0*£ и £ совпадают: Р{(£ь£2, ...)еВ} = Р{(£л+ь£л+2, Простейшим примером такой последовательности £ является последо- вательность £ = (£i, £2, ...), состоящая из независимых одинаково рас- пределенных случайных величин. Отправляясь от такой последователь- ности, можно сконструировать широкий класс стационарных последова- тельностей ...), если взять произвольную борелевскую функцию g(*b хп) И ПОЛОЖИТЬ 7]k = g^k, &+ь &+Д Если £ = (£ь£2, ...) —последовательность независимых одинаково распределенных случайных величин с E|£i | < оо и E£i = m, то, согласно усиленному закону больших чисел, с вероятностью единица В 1931 г. Биркгоф получил замечательное обобщение этого результата, сформулировав его как теорему механики, относящуюся к поведению «относительных времен пребывания» динамических систем, описываемых дифференциальными уравнениями, допускающими интегральный инвари- ант («консервативные системы»). Вскоре (1932 г.) А. Я. Хинчин показал, что на самом деле теорема Биркгофа допускает обобщение на более общий случай «стационарных движений многомерного пространства в себе самом, оставляющих меру множества неизменной».
564 ГЛ. V. СТАЦИОНАРНЫЕ СЛУЧАЙНЫЕ ПОСЛЕДОВАТЕЛЬНОСТИ Наше последующее изложение результатов Биркгофа и Хинчина будет вестись одновременно как в рамках теории «динамических систем», так и в рамках теории «стационарных в узком смысле случайных последователь- ностей». При этом основной акцент будет делаться на «эргодические» резуль- таты этих теорий. 2. Пусть (Q, &, Р) — некоторое (полное) вероятностное пространство. Определение 2. Отображение Т пространства Q в себя называется измеримым, если для всякого А е & Т~хА = {и\ Определение 3. Измеримое отображение Т называется сохраняю- щим меру преобразованием (морфизмом), если для всякого А G & Р(7'-|Л) = Р(Л). Пусть Т — сохраняющее меру преобразование, Тп — его n-я степень и =,£1 (щ) — некоторая случайная величина. Положим £я(щ) = С1(7’п"1щ), п^2, и рассмотрим последовательность £ = (£ь •••)• Мы утверждаем, что эта последовательность является стационарной. В самом деле, пусть А = {ш: £еВ}, А{ = {ал: где Bg^(/?°°). Тогда cuG/h в том и только том случае, когда TcvgA, т. е. А\ = Т~~[А. Но Р(7'"’|Л) = Р(А), и поэтому P(Ai) = P(A). Аналогичным образом Р(АЛ) = Р(А) для любого Ak = {о;: G В}, й 2. Итак, введение сохраняющего меру преобразования дает возможность построения стационарных (в узком смысле) случайных последовательно- стей. В определенном смысле верен и обратный результат: для каждой ста- ционарной последовательности £, рассматриваемой на (П, Р), можно указать новое вероятностное пространство (Й, , Р), случайную величину fi(d>) и сохраняющее меру преобразование Т такие, что распределение случайной последовательности f = {£j(£), £i(7u)), ...} совпадает с распре- делением последовательности £ = {fi(a>), •••}• Действительно, возьмем в качестве Й «координатное» пространство /?°° и положим ^ = ^(7?°°), Р = Р^, где Р^(В) = Р{си: ^^В\ В G^(T?°°). Преобразование Г, действующее в Й, определим по формуле Т(х\, *2, ...) = = (*2, *з, ...). Положим также для и = (х\, Х2, ...) 6Р)=хь ^п(й>)=^(Тп-'й), п>2. Пусть теперь A = {w: (Х|,х*)6В}, B&^(Rk) и Т~*А = {ш: (хг, ... ..., x^+i) GB}. Тогда в силу стационарности Р(Д)=:Р{и: Ы&В} = Р{ш: &+1) е В} = Р(7'-,Л),
§ 1. СОХРАНЯЮЩИЕ МЕРУ ПРЕОБРАЗОВАНИЯ 565 т.е. Т — сохраняющее меру преобразование. Поскольку Р{си: (|ь ...,&)€ е В} = Р{си: ({ь •••> 6)€В} для любого й, то отсюда следует, что распре- деления £ и £ совпадают. Приведем примеры сохраняющих меру преобразований. Пример 1. Пусть Q = {cui,..., сил} — множество, состоящее из конечно- го числа точек, п ^2, —все его подмножества, Twi = cui+i, 1 ^п — 1, и Тшп =и>\. Если Р(си/) = 1/п, то Т — сохраняющее меру преобразование. Пример 2. ЕслиП = [0, 1),<^ = ^([0, 1)), Р— мера Лебега, Ас [0, 1), то Тх = (х + A) mod 1 является сохраняющим меру преобразованием. Остановимся на физических предпосылках, приводящих к изучению преобразований, сохраняющих меру. Будем представлять себе Q как фазовое пространство состояний си некоторой системы, эволюционирующей (в дискретном времени) в соот- ветствии с заданным законом движения. Тогда, если си есть состояние в момент п = 1, то Trtcu, где Т — оператор сдвига (индуцируемый данным законом движения), есть то состояние, в которое перейдет система через п шагов. Далее, если А — какое-то множество состояний си, то Т~[А = = {си: ТсиеЛ} есть по своему определению множество тех «начальных» состояний си, которые через один шаг окажутся в множестве А. Поэто- му, если интерпретировать Q как «несжимаемую жидкость», то условие Р(Г"!Л) = Р(Л) можно рассматривать как вполне естественное условие сохранения «объема». (Для классических консервативных гамильтоновых систем известная теорема Лиувилля утверждает, что соответствующее преобразование Т является преобразованием, сохраняющим меру Лебега.) 3. Одним из первых результатов относительно преобразований, сохра- няющих меру, была следующая теорема Пуанкаре (1912 г.) о «возврат- ности». Теорема. Пусть (Q, Р) — некоторое вероятностное прост- ранство, Т — преобразование, сохраняющее меру, и Aef. Тогда ТпыеА для бесконечно многих 1 для почти каждой точки сие Л. Доказательство. Обозначим С = {сиеА: Тпш£А для всех п^\}. Поскольку С П Т~пС = 0 для любого п 1, то Т~тС П Т’-И+'Ос = Т~т(С П riT“rtC) = 0. Таким образом, последовательность {T~rtC} состоит из непересекающихся множеств, P-мера которых одна и та же. Поэтому Р(С)=52 Р(7"“ЛС)^Р(П) = 1 и, следовательно, Р(С) = 0. Таким л=1 П=1 образом, для почти каждой точки cu 6А, по крайней мере для одного п 1, Тлсие Л. Выведем отсюда, что тогда и для бесконечно многих п 1 Т"сиеЛ. Применим предшествующий результат к преобразованиям Tk, k^\. Тогда для каждой точки сие Л \N, где N — множество нулевой вероятно-
566 ГЛ. V. СТАЦИОНАРНЫЕ СЛУЧАЙНЫЕ ПОСЛЕДОВАТЕЛЬНОСТИ сти, являющееся объединением соответствующих множеств, отвечающих разным k, найдется такое я*, что (Tk)nkwe А. Отсюда, разумеется, следует, что TnweA для бесконечно многих п. □ Следствие. Пусть £(си) > 0. Тогда на множестве {а;: £(а>) > 0} оо 52С(Т’М = оо (Р-п.н.). *=о В самом деле, пусть Ап = Тогда, согласно теореме, на п множестве Ап £ £(Tka>) = oo (Р-п. н.), и требуемый результат следует, Лр=О если положить п —> оо. Замечание. Теорема сохраняет свою силу, если вместо вероятностной меры Р рассмотреть любую конечную меру /х, /х(П) < оо. 4. Задачи. 1. Пусть Т — сохраняющее меру преобразование и С=£(о>) — случайная величина такая, что существует математическое ожидание Е£(о>). Пока- зать, что ^£(си) = Е£(7о>). 2. Показать, что в примерах 1 и 2 преобразования Т являются преоб- разованиями, сохраняющими меру. 3. Пусть Q = [0, 1), <^ = «^([0, 1)) и Р — некоторая мера с непрерывной функцией распределения. Показать, что преобразования 7х = Лх, 0<А< 1, и 7х = х2 не являются преобразованиями, сохраняющими меру. 4. Пусть Q — множество всех последовательностей ш = (..., w-i, о>1, ...) действительных чисел, & — а-алгебра, порожденная измеримыми цилиндрами {ш: (о;*, ..., Wk+n-\)eBn}, где п = 1, 2, ..., й = 0, ±1, ±2, ... и множество Bne@(Rn). Пусть Р — вероятностная мера на (Q, <^) и двустороннее преобразование Т определено формулой Г(..., C-U-i, CUo, ...) = (..., CUo> ^1, ^2, Показать, что Т является сохраняющим меру преобразованием в том и только том случае, когда Р{си: (а?о, ...»curt_i)eBrt} = P{cu: (^, ..., щ+п-\) €Вп} для всех п = 1, 2, ..., & = 0, ±1, ±2, ... и Bne&(Rn). 5. Пусть £1, • •• — некоторая стационарная последовательность слу- чайных элементов со значениями в борелевском пространстве S (см. опре- деление 9 в § 7 гл. II). Показать, что можно построить (быть может, на расширении исходного вероятностного пространства) случайные элементы £-1, С-2, ... со значениями в S такие, что двусторонняя последователь- ность ...» С-ь Со» Сь ••• будет стационарной.
§2. ЭРГОДИЧНОСТЬ И ПЕРЕМЕШИВАНИЕ 567 6. Пусть Т — сохраняющее меру преобразование на (Я, &. Р) и S есть тг-система подмножеств П, порождающая & (тг(^) = ^). Доказать, что если равенство Р(Г“1а) = Р(Д) верно для Л то оно верно и для (=тг(Л). 7. Пусть Т — сохраняющее меру преобразование на (Q, Р) и У — под-<т-алгебра &. Показать, что для каждого А € & Р(Л|#)(7’а>) = Р(7’-1Л|7’-1^)(и>) (Р-п.н.). (1) В частности, пусть Q = /?°° — пространство числовых последователь- ностей o; = (cuo, cui, ...) и &(о;)=а^. Пусть Т — преобразование сдвига: Г(а;о, cui ,...) = (cui, а;2, ...) (иначе говоря, если &(о?)=о^, то &(?M=<^+1). Тогда равенство (1) приобретает вид р(л ।=p(r-u |е„+1)м (р-п. н.). 8. Пусть Т — некоторое измеримое преобразование на (Q, J^) и — множество всех вероятностных мер Р, относительно которых Т является сохраняющим P-меру преобразованием. Показать, что: (а) множество выпукло; (b) Т является эргодическим преобразованием относительно меры Р в том и только том случае, когда Р есть крайняя точка множества & (т. е. не может быть представлена в виде Р = Лi Р i + Л2Р2 с Ai > О, Л2 > О, Al + А2 — 1, Р17^ Р2 и Р1, Р2 Е <^). § 2. Эргодичность и перемешивание 1. На протяжении всего данного параграфа будем через Т обозна- чать сохраняющее меру преобразование, действующее на вероятностном пространстве (О, Р). Определение 1. Множество А называется инвариантным, если Т~*А = А. Множество А называется почти инвариантным, если А и Т~ХА отличаются на множество меры нуль, т. е. Р(Д Д = 0. Нетрудно проверить, что класс инвариантных (почти инвариантных) множеств У (соответственно У*) образует а-алгебру. Определение 2. Сохраняющее меру преобразование Т называется эргодическим (или метрически транзитивным), если каждое инвари- антное множество А имеет меру нуль или единица. Определение 3. Случайная величина 77 = 77(0;) называется инвари- антной (почти инвариантной), если 77(0;) = tj(Tw) для всех cvGfi (для почти всех w€fi). Следующая лемма устанавливает связь между инвариантными и почти инвариантными множествами.
568 ГЛ. V. СТАЦИОНАРНЫЕ СЛУЧАЙНЫЕ ПОСЛЕДОВАТЕЛЬНОСТИ Лемма 1. Если А является почти инвариантным множеством, то найдется такое инвариантное множество В, что Р(Д Д В) = 0. Доказательство. ПустьВ = Кт Т~пА. Тогда Г-1В = Нт Г“(п+1)Л = В, оо т. е. В е J. Нетрудно убедиться в том, что А Д В С (J (T~kA Д Г”(*+1М). л=о Но Р(Т“М Д Т-^+1М) = Р(Л Д Г-1 А) = 0. Поэтому Р(Л Д В) = 0. □ Лемма 2. Преобразование Т эргодично тогда и только тогда, когда каждое почти инвариантное множество имеет меру нуль или единица. Доказательство. Пусть A eS*. Тогда по лемме 1 найдется инвари- антное множество В такое, что Р(Л ДВ) = 0. Но Т эргодично и, значит, Р(В) = 0 или 1. Поэтому Р(Л) = 0 или 1. Обратное очевидно, поскольку /с/*. □ Теорема 1. Пусть Т — сохраняющее меру преобразование. Следу- ющие условия эквивалентны*. (1) Г эргодично; (2) каждая почти инвариантная случайная величина есть кон- станта (Р-п. н.); (3) каждая инвариантная случайная величина есть константа (Р-п. н.). Доказательство. (1) => (2). Пусть Т эргодично и £ почти инва- риантна, т. е. (Р-п. н.) £(о>) =£(7а>). Тогда для любого ceR множес- тво Ас = {cu: £(cu)и по лемме 2 Р(Лс) = 0 или 1. Пусть С = = sup{c: Р(ЛС) = 0}. Поскольку Ас Т О при с Т оо и Ас j 0 при с 1 —оо, то |С| <оо. Тогда (оо \ U {ем<с-1} =0 п=1 / и аналогично Р{ал: £(а;)>С} = 0. Тем самым P{cu: £(о;) = С} = 1. (2) => (3). Очевидно. (3) => (1). Пусть А тогда /л — инвариантная случайная величина и, значит, (Р-п. н.) 1а =0 или /л = 1, откуда Р(Л) = 0 или 1. □ Замечание. Утверждение теоремы остается в силе и в том случае, когда рассматриваемые в ней случайные величины ограничены. В качестве иллюстрации применения этой теоремы рассмотрим такой Пример. Пусть Q = [0, 1), & = &([0, 1)), Р — мера Лебега и 7Ъ = = (о, + A) mod 1. Покажем, что Т эргодично в том и только том случае, когда А иррационально. Пусть £ = £(си) — инвариантная случайная величина с Е£2(о>) <оо. Из- °° вестно, что ряд Фурье ^2 спеМпш функции с Е£2(си) < оо сходится в л=—оо
§2. ЭРГОДИЧНОСТЬ И ПЕРЕМЕШИВАНИЕ 569 среднеквадратическом смысле, |ся|2 < оо. Поскольку Т — сохраняющее меру преобразование (пример 2 § 1), то (задача 1 § 1) в силу предполага- емой инвариантности случайной величины £ = £(о;) находим, что сп = = Е£(Ти)е~2™Тш = е-2^1пХЕ^Ть))е~2^пш = = е-2тгтЛЕ^^е-2^ = Cne^inX Поэтому crt(l — е“27ГшЛ) = 0. По предположению А иррационально и, зна- чит, для всех п 0 1 e~27rinX 0 1. Поэтому сп = 0, п ± 1, £ (а;) = Со (Р-п. н.) и по теореме 1 преобразование Т эргодично. С другой стороны, пусть А рационально, т. е. А = k/m, где k и m — целые. Рассмотрим множество 2т-2 Л = Н [u,: I 2m 2m J fe=0 Ясно, что это множество является инвариантным, но Р(Л) = 1/2. Следо- вательно, Т не эргодично. 2. Определение 4. Сохраняющее меру преобразование Т называется перемешиванием (обладающим свойством перемешивания), если для любых Л, В lim Р(Л П Т~пВ) = Р(Л) Р(В). (1) п—*оо Следующая теорема устанавливает связь между эргодичностью и свой- ством перемешивания. Теорема 2. Всякое преобразование Т, обладающее свойством пе- ремешивания, является эргодическим. Доказательство. Пусть А 6 &, В 6 Тогда В = Т~пВ, п 1, и, зна- чит, Р(Л П7'~'1В) = Р(Л ПВ) для всех п> 1. В силу (1) Р(Л ПВ) = Р(Л) Р(В). Поэтому при Л = В находим, что Р(В) = Р2(В), и, следовательно, Р(В) = 0 или 1. □ 3. Задачи. 1. Показать, что случайная величина £ является инвариантной тогда и только тогда, когда она ^-измерима. 2. Показать, что множество Л является почти инвариантным тогда и только тогда, когда Р(Т-1Л \ Л) = 0. 3. Показать, что преобразование Т есть перемешивание в том и только том случае, когда для любых двух случайных величин £ и ?? с Е£2 < оо, Ет?2 <оо Е£(Тпш)т}(ы) —* Е£(о>) Ет}(а;), п —> оо.
570 ГЛ. V. СТАЦИОНАРНЫЕ СЛУЧАЙНЫЕ ПОСЛЕДОВАТЕЛЬНОСТИ 4. Привести пример сохраняющего меру эргодического преобразова- ния, которое не является перемешиванием. 5. Пусть Т — сохраняющее меру преобразование на (Q, &, Р). Пусть si — алгебра подмножеств Q и а(.й/) = &. Предположим, что определе- ние 4 предполагает выполнение свойства lim Р(А П 7”“rtB) = Р(А) Р(В) п—*оо лишь для множеств А и В из si. Показать, что тогда это свойство будет выполнено и для всех А и В из & = (и, следовательно, преобразо- вание Т есть перемешивание). Показать, что утверждение остается справедливым, если si является тг-системой такой, что tt(s/) = 6. Пусть А является почти инвариантным множеством. Показать, что шеА (Р-п.н.), если и только если ТпшеА для всех п = 1, 2, ... (Ср. с те- оремой в § 1.) 7. Привести пример сохраняющих меру преобразований Т на (Я, Р), для которых: (а) из того, что 4 е/, вовсе не следует, что 7L4 е(Ь) из того, чтоМ е & и ТА е вовсе не следует, что Р(Д) = Р(ГЛ). § 3. Эргодические теоремы 1. Теорема 1 (Биркгоф и Хинчин). Пусть Т — сохраняющее меру преобразование и £ = £(си) —- случайная величина с Е|£| < сю. Тогда 1 п~[ нт^ S«7’M=E(ei^) (1) л=о Если к тому же Т эргодично, то lim = (Р-п.н.). (2) Л=0 Приводимое ниже доказательство существенно опирается на следую- щее предложение, простое доказательство которого было найдено А. Гар- сиа (1965 г.). Лемма (максимальная эргодическая теорема). Пусть Т — сохра- няющее меру преобразование, £ — случайная величина с Е|£| <оо и =ем+е<тм+... + Af*M = max{0, SiM> S*M}-
§3. ЭРГОДИЧЕСКИЕ ТЕОРЕМЫ 571 Тогда для любого п 1 ЕКМ/(м„>о}М] >0- Доказательство. Если n>k, то Мп(Тш) Sk(Ta>) и, значит, £(о>) + + Мп(Тш) >^(w) + S*(7w) = S*+i(w). Так как очевидно, что C(w) >Si(w) - -Мп(Тш), то СМ > max{Si М, ..., S„M} - Мп(Тш). Значит, поскольку {МПМ >0} = {max(SiМ, ..., Sn(w)) > 0}, то E[C(w)/{Mn>o|M]>E[(max(Si(w),.... Sn(ia)) -Мп(Тш))/{Мп>0}(ш)]^ > Е{(М„М - М„(Тш))1{Мя(ш)>0}} > Е{ЛШ) - МЙ(7М} = 0, где мы воспользовались тем, что если Т — сохраняющее меру преобразо- вание, то EA4n(w) = ЕМп(Ти>) (задача 1 из § 1). □ Доказательство теоремы. Будем предполагать E(C|J^) = O (в про- тивном случае от С надо перейти к С — Е(£|./)). Пусть fj=lim и 2=lim -А Для доказательства достаточно устано- вить, что (Р-п. н.) 0 2 С ^7 0. Рассмотрим случайную величину 77 = 2(0;). Поскольку 77(0;) = т)(Тш), то fj инвариантна и, следовательно, для каждого е > 0 множество Ае = {fj(w) > е} также является инвариантным. Введем новую случайную величину ГМ = (?М-е)/л<(а;), и пусть 5;М=ГМ + ...+Г(7‘-Ц Л/2М = тах(0, Sf,..., Тогда, согласно лемме, для любого n 1 E[f/w>0}1^0. Но при п —юо {М* >0} = ( max St >ol Т /sup St >01 = <sup >0> = J J U>i k J = <sup ^>е1пЛг=Л£, k J о где последнее равенство следует из того, что sup -т- а Ае = {о>: т)>е}.
572 ГЛ. V. СТАЦИОНАРНЫЕ СЛУЧАЙНЫЕ ПОСЛЕДОВАТЕЛЬНОСТИ Далее, Е|£*| Е|£| + е. Поэтому по теореме о мажорируемой сходимо- O^Efr/w>o)]->E[r/4.]. Итак, О < Е [Г/л J = Е[(С - £)/л. ] = Е К/л , ] - £Р(Ле) = = Е[Е(е|^)/ле] -еР(ЛЕ) = -еР(ДД откуда Р(Ае) = 0 и, значит, P{tj^O} = 1. Аналогично, рассматривая вместо £(о>) величину -СМ» найдем, что lim-------) = - lim — = —77 \ п / — п - и Р{—т? 0} = 1, т. е. Р{?7 0} = 1. Тем самым 0 т? fj0 (Р-п. н.), что и доказывает первое утверждение теоремы. Для доказательства второго утверждения достаточно заметить, что по- скольку Е(С | — инвариантная случайная величина, то в эргодическом случае E(£|J^) = EC (Р-п.н.). □ Следствие. Сохраняющее меру преобразование Т эргодично в том и только том случае, когда для любых А, В 1 Пт 1 £ P<AnT~kB) = P(A)P(B). (3) Для доказательства эргодичности Т положим в (3) А = В е J. Тогда А А7'~*В = В и, значит, Р(В) = Р2(В), т.е. Р(В) = 0 или 1. Обратно, пусть Т эргодично. Тогда, применяя (2) к случайной величине С =/в М» где В е<^, найдем, что (Р-п. н.) 1 Л”1 Пт ± £ /г-»вМ = Р(В), откуда, интегрируя обе части по множеству А € & и используя теорему о мажорируемой сходимости, получаем требуемое соотношение (3). 2. Покажем теперь, что в условиях теоремы 1 в (1) и (2) имеет место сходимость не только почти наверное, но и в среднем, (Этот результат будет использован далее в доказательстве теоремы 3.) Теорема 2. Пусть Т — сохраняющее меру преобразование и С = СМ — случайная величина с Е|£| < оо. Тогда Е п -0, п-оо. (4)
§3. ЭРГОДИЧЕСКИЕ ТЕОРЕМЫ 573 Если к тому же Т эргодично, то Е И—>00. (5) Доказательство. Для всякого е > 0 можно найти такую ограничен- ную случайную величину rj (|т?(а;)| ^М), что Е|£ -т?| Тогда Е i п л-1 *=о । "_| + Е ~ +Е|Е(С|У)-Е(7?|^)|. (6) Л=0 Поскольку М то по теореме о мажорируемой сходимости и в силу (1) находим, что второй член в правой части (6) стремится к нулю при п —> оо. Что же касается первого и третьего членов, то каждый из них меньше или равен г. Поэтому для достаточно больших п левая часть в (6) меньше 2е, что и доказывает (4). Наконец, если Т эргодично, то (5) следует из (4) и того замечания, что Е(£ | У) = Е£ (Р-п. н.). □ 3. Перейдем теперь к вопросу о справедливости эргодической тео- ремы для стационарных (в узком смысле) случайных последовательно- стей £ = (&, Сг, •••)» заданных на некотором вероятностном пространстве (Я, «^, Р). Вообще говоря, на (Q, «^, Р) может и не существовать со- храняющее меру преобразование, так что непосредственное применение теоремы 1 невозможно. Однако в § 1 отмечалось, что можно построить (координатное) вероятностное пространство (Й, Р), случайную после- довательность £ = (£i, £2, ...) и сохраняющее меру преобразование Т такие, 4to<„(w)=<1(7'-1w) и по распределению £ и £ совпадают. Поскольку такие свойства, как сходимость почти наверное и в среднем, определяются лишь Iя- — распределениями вероятностей, то из сходимости - ^2 €i(^-1^) (Р-п. н. п ь=1 1 я и в среднем) к некоторой случайной величине 77 следует, что - &(о>) п k=\ также сходятся (Р-п. н. и в среднем) к некоторой случайной величине т] та- кой, что 77=77. Из теоремы 1 следует, что если Ё|£1| <00, то 77=Ё(£1|«/), где —совокупность инвариантных множеств (Ё — усреднение по мере Р). Опишем структуру величины 77. Определение 1. Множество будем называть инвариантным по отношению к последовательности £, если найдется такое множество
574 ГЛ. V. СТАЦИОНАРНЫЕ СЛУЧАЙНЫЕ ПОСЛЕДОВАТЕЛЬНОСТИ В е ^(/?°°), ЧТО для любого п 1 А—{ш: (£п,£п+ь ...)бВ}. Совокупность таких инвариантных множеств образует сг-алгебру, которую обозначим Определение 2. Стационарная последовательность £ называется эргодической, если мера любого инвариантного множества принимает лишь два значения 0 или 1. Покажем, что случайная величина т], являющаяся пределом (Р-п. н. и в 1 п среднем) величин - 52 &М, л—*оо, может быть взята равной E(£i |У$). п fc=i С этой целью заметим прежде всего, что, конечно, можно полагать ___ j п j?(w) = lim - &М- (7) п k=\ Из определения lim следует, что для определенной таким образом величины т](и>) множества {си: 7/(си) <у}, у eR, являются инвариантными и, значит, т] ^-измерима. Далее, пусть А е . Тогда, поскольку Е то для 7jt определенной формулой (7), 1 п-1 - £ ->0, " 4=1 4=1 А А (8) Пусть В € ^(/?°°) таково, что А = {ш: (&, &.+|, ...) € В} для любого /г > 1. Тогда в силу стационарности £ \^dP = $ МР= $ MP = S$idP- A {<*>:(&»&+!’•••)€#} {<^(fi»f2 »)€#} А Поэтому из (8) следует, что для любого А С выполнено равенство § £1 dP = § rjdP, А А означающее (см. формулу (1) в § 7 гл. II), что (У^-измеримая) величина т/ = Е(£1 |^). При этом Е(£! |^) = E£i, если последовательность £ явля- ется эргодической. Итак, доказана Теорема 3 (эргодическая теорема). /7//сгиь£ = (£1, £2, ...) — стаци- онарная (в узком смысле) случайная последовательность с E|£J <00.
§3. ЭРГОДИЧЕСКИЕ ТЕОРЕМЫ 575 Тогда (Р-п. н. и в среднем) . п Нт п 12 &M = E(6l^)- £=1 Если к тому же — эргодическая последовательность, то (Р-п. н. и в среднем) < п lim - J2 &М = Е£ь k=\ 4. Задачи. 1. Пусть £ = ...) —гауссовская стационарная последователь- ность с Е£л = 0 и ковариационной функцией R(n) = Е&+л&- Показать, что условие R(n) —>0 является достаточным для того, чтобы сохраняющее меру преобразование, соответствующее последовательности £, было перемеши- ванием (и, следовательно, являлось эргодическим). 2. Показать, что для всякой последовательности £ = (£ь£2, •••), со- стоящей из независимых одинаково распределенных случайных величин, соответствующее сохраняющее меру преобразование является перемеши- ванием. 3. Показать, что стационарная последовательность £ эргодична в том и только том случае, когда для любого BeSS(Rk), 6=1,2, ..., 1 п i £/в(£ь...Л+*-1)-Р{(6,- -,60вВ} (Р-п. н.). /=1 4. Пусть на (П, &) заданы две вероятностные меры Р и Р, относитель- но которых сохраняющее меру преобразование Т является эргодическим. Доказать, что тогда или Р = Р, или Р ± Р. 5. Пусть Т — сохраняющее меру преобразование на (Q, Р) и si — алгебра подмножеств П такая, что a(sf) = #’. Пусть П-1 k=Q Доказать, что преобразование Т эргодично в том и только том случае, когда выполнено хотя бы одно из следующих условий: (а) Д Р(Д) для любого Aes/\ 1 п—1 (b) lim 1 £ Р(Л П Т~кВ) = Р(Л) Р(В) для всех А, В е п А=0 (с) /^и) Д- Р(Л) для любого Л €
576 ГЛ. V. СТАЦИОНАРНЫЕ СЛУЧАЙНЫЕ ПОСЛЕДОВАТЕЛЬНОСТИ 6. Пусть Т — сохраняющее меру преобразование на (П, Р). Дока- зать, что это преобразование эргодично (относительно меры Р) тогда и только тогда, когда на (П, &) не существует меры Р / Р такой, что Р <С Р и преобразование Т относительно этой меры Р является сохраняющим меру преобразованием. 7. (Бернуллиевские сдвиги.) Пусть S — некоторое конечное множес- тво (скажем, S = {1, 2,..., N}) и Q = S°° — пространство последовательно- стей си = (ало, ^1, ...) с щ eS. Будем полагать = и определим пре- образование сдвига 7(0,0, ^1, • • •) = (^ь ^2, ...), или, в терминах £о, £1, • • • • если &(<*>) = <*>*, то Предположим, что на элементах i мно- N жества {1,2,..., N} заданы неотрицательные числа pi такие, что ^2 А = 1 /=1 (т. е. набор (pi, ..., рк) образует вероятностное распределение). С помо- щью этого распределения можно задать меру Р на (S°°, ^(S°°)) (см. § 3 гл. II) такую, что P{w: (о>ь ...,wft) = (ut.uk)} = pUi...pUt. Иначе говоря, вероятностная мера вводится по принципу, обеспечивающе- му независимость величин СоМ, б(^), ••• Относительно так построенной меры Р введенное преобразование сдвига Т принято называть бернулли- евским сдвигом или преобразованием Бернулли. Показать, что преобразование Бернулли обладает свойством переме- шивания. 8. Пусть Т — сохраняющее меру преобразование на (П, Р). Будем обозначать Т~п& = {Т~пА: А и говорить, что а-алгебра ^-оо=П Т~п^ /1=1 является тривиальной (Р-тривиальной), если каждое множество из имеет меру 0 или 1 (такие преобразования называют преобра- зованиями Колмогорова). Доказать, что преобразования Колмогорова обладают свойством эргодичности и, более того, свойством перемешива- ния. 9. Пусть 1 р < оо и Т — сохраняющее меру преобразование на ве- роятностном пространстве (Q, Р). Пусть случайная величина $(a>) G €Z/(Q, <^, Р). Доказать справедливость следующей эргодической теоремы (фон Ней- ман) в LP(Q, Р): существует случайная величина 7j(a>) такая, что
§3. ЭРГОДИЧЕСКИЕ ТЕОРЕМЫ 577 10. Теорема Бореля о нормальности утверждает (пример 2 в § 3 гл. IV), что доля единиц и нулей в двоичном разложении чисел си из [0, 1) схо- дится почти наверное (относительно меры Лебега) к 1/2. Доказать этот результат, рассматривая преобразование Т: [0, 1)—>[0, 1), определенное формулой T(cu) = 2cu (mod 1), и применяя эргодическую теорему 1. 11. Как и в задаче 10, пусть си е [0, 1). Рассмотрим преобразование Т : [0, 1) —> [0, 1), определенное формулой 0, если си = 0, 7М = щ к если си 00, I cu J где {х} — дробная часть числа х. Показать, что преобразование Т сохраняет меру Р = Р(-) Гаусса на [0, 1), определяемую формулой ле«([0.1». А 12. Дать пример, показывающй, что теорема Пуанкаре о «возвратно- сти» (п. 3 § 1) не верна, вообще говоря, в случае измеримых пространств с бесконечной мерой.
Глава VI СТАЦИОНАРНЫЕ (В ШИРОКОМ СМЫСЛЕ) СЛУЧАЙНЫЕ ПОСЛЕДОВАТЕЛЬНОСТИ. А2-ТЕОРИЯ §1. Спектральное представление ковариационной функции........ 579 § 2. Ортогональные стохастические меры и стохастические интегралы 589 § 3. Спектральное представление стационарных (в широком смыс- ле) последовательностей................................ 595 §4 . Статистическое оценивание ковариационной функции и спек- тральной плотности.......................................... 607 §5 . Разложение Вольда ................................... 614 § 6. Экстраполяция, интерполяция и фильтрация............. 623 § 7. Фильтр Калмана—Бьюси и его обобщения................. 634
Центральное место в теории стационарных случайных процессов в широком смысле занимают спектральные (представления, дающие основание рассматривать такие процессы) как суперпозицию совокупности некоррелированных друг с дру- гом гармонических колебаний различных частот со случайными амплитудами и фазами... Математическая энциклопедия, т. 5, стлб. 211—212 [121] § 1. Спектральное представление ковариационной функции 1. Согласно определению, данному в предшествующей главе, случай- ная последовательность £ = (£ь £2, •••) называется стационарной в узком смысле, если для любого множества В 6 <^(/?°°) и любого п 1 ркеьб, ...)6B}=p{(e„+i, е„+2, ...)ев}. (о Отсюда, в частности, вытекает, что если Е£2 < оо, то не зависит от п: E£rt = E£i, (2) а ковариация cov(^rt+m, ^) = Е(^+ш-Е^+ш)(^-Е^) зависит лишь от т: cov^+zh, £п) = COV^i^/h, £1). (3) В настоящей главе будут исследоваться так называемые стационарные в широком смысле последовательности (с конечным вторым моментом), для которых условие (1) заменяется условиями (2) и (3). Рассматриваемые случайные величины £п будут предполагаться опре- деленными для neZ = {0, ±1, ...} и к тому же комплекснозначными. По- следнее предположение не только не усложняет теорию, но и наоборот — делает ее более изящной. При этом, разумеется, результаты для действи- тельных случайных величин легко могут быть получены в качестве частного случая из соответствующих результатов для комплексных величин. Пусть Н2 = H2(Q, Р) — пространство (комплекснозначных) слу- чайных величин £ = # + //?, а, /?€/?, с Е|£|2 < оо, где |£|2 = а2 + /32. Если С, Р Е И2, то положим (С, rj) = Е£т/, (4) где — — комплексно-сопряженная величина к т) = а + 1(}, и П€П = (€, €)1/2- (5)
580 ГЛ. VI. СТАЦИОНАРНЫЕ СЛУЧАЙНЫЕ ПОСЛЕДОВАТЕЛЬНОСТИ Как и для действительных случайных величин, пространство Н2 (точ- нее, пространство классов эквивалентных случайных величин; ср. с §§ 10 и 11 из гл. II) со скалярным произведением (£, г?) и нормой ||£|| явля- ется полным. В соответствии с терминологией функционального анализа пространство Н2 называется унитарным (иначе — комплексным) гиль- бертовым пространством (случайных величин, рассматриваемых на ве- роятностном пространстве (П, Р)). Если £, г] с /72, то их ковариацией назовем величину COV(£, 77) = Е(С - ЕС)(Т7-ЕТ7). (6) Из (4) и (6) следует, что если Е£ = Ет? = 0, то cov(e,77)=(e,77). (7) Определение. Последовательность комплекснозначных случайных величин $ = (Cn)nez с Е |2 < 00, п 6 Z, называется стационарной (в ши- роком смысле), если для всех п е Z ' Е«-=Е5"' (8) cov(^+*, &) = cov(e„, £0), k е Z. Для простоты изложения в дальнейшем будем предполагать Е£о = О. Это предположение не умаляет общности, но в то же самое время да- ет возможность (согласно (7)), отождествляя ковариацию со скалярным произведением, более просто применять методы и результаты теории гиль- бертовых пространств. Обозначим /?(n)=cov(ert, Со), neZ, (9) и (в предположении /?(0) = Е|£о|2 /0) р(п)=Ш’ "ez- (10) Функцию R(n) будем называть ковариационной функцией, а р(п) — кор- реляционной функцией (стационарной в широком смысле) последова- тельности £. Непосредственно из определения (9) следует, что ковариационная фун- кция R(n) является неотрицательно определенной, т. е. для любых ком- плексных чисел а\, ..., ат и любых ..., /weZ, 1, £ а.ада-^о. (П)
§ 1. СПЕКТРАЛЬНОЕ ПРЕДСТАВЛЕНИЕ 581 В свою очередь отсюда (или непосредственно из (9)) нетрудно вывести (задача 1) следующие свойства ковариационной функции: /?(0)>0» /?(-п) = Ш |/?(и)|^/?(0), |/?(n)-/?(m)|42/?(0)[/?(0)-Re/?(n-m)]. 2. Приведем некоторые примеры стационарных последовательностей £ = (£„)„€£. (В дальнейшем слова «в широком смысле», а также указание на то, что п е Z, часто будут опускаться.) Пример 1. Пусть £п = £о£(л)> где Е£о = О, Е|£0|2 = 1 и g = g(n) — неко- торая функция. Последовательность $ = (£п) будет стационарной в том и только том случае, когда функция g(k + n)g(k) зависит лишь от /г. Отсюда нетрудно вывести, что найдется такое А, что g(n) = g(0)e'An. Таким образом, последовательность случайных величин еп=еоя(О)е/Ап является стационарной с /?(«) = 1я(0)|2е'Ая. В частности, «случайная во времени константа» frt = £o образует ста- ционарную последовательность. Замечание. В связи с этим примером отметим, что поскольку eiXn = ==еМ(л+27гЛ)> ±1, ^2, то (круговая) частота А определяется лишь с точностью до произвольного слагаемого, кратного 2тг. По традиции в дальнейшем будет считаться всюду, что Ае [—тг, тг). Пример 2. Почти периодическая последовательность. Пусть N neZ, (13) /г=1 где гь ...,2/v — ортогональные (Е2,27=0, i^j) случайные величины с нулевыми средними и E|zjJ2 = > 0; —тг А^ < тг, Л=1,„.,УУ; AZ^A7, i //. Последовательность С = (Сп) является стационарной с w Я(п) = £>1е‘А‘я. (14) Л=1 В обобщение (13) предположим теперь, что £«= £ zke‘^n, (15) k=—оо
582 ГЛ. VI. СТАЦИОНАРНЫЕ СЛУЧАЙНЫЕ ПОСЛЕДОВАТЕЛЬНОСТИ где величины Zk, &GZ, обладают теми же свойствами, что и в (13). Если оо предположить, что £ <т^<оо, то ряд в правой части формулы (15) оо сходится в среднем квадратическом и оо «(«)= 52 ^/А‘П- <16> k=—оо Введем функцию fw= 52 4 (17) Тогда ковариационная функция (16) может быть записана в виде интеграла Лебега—Стилтьеса /?(«)= § eiXndF(X) (= $ eiXndF(X)\. (18) —к ' [—тг.тг) ' \ Стационарные последовательности (15) образованы как суммы «гармо- ник» eiX*n с «частототами» А* и случайными «амплитудами» Zk «интен- сивности» a£ = E|z*|2. Таким образом, значение функции F(A) дает исчер- пывающую информацию о структуре «спектра» последовательности $, т. е. о величине интенсивностей, с которыми те или иные частоты входят в пред- ставление (15). Согласно (18), знание функции F(X) полностью определяет также и структуру ковариационной функции R(n), С точностью до постоянного множителя (невырожденная) функция F(A) является, очевидно, функцией распределения, причем в рассматриваемом примере эта функция кусочно-постоянна. Весьма примечательно, что ко- вариационная функция любой стационарной в широком смысле случайной последовательности может быть представлена (см. теорему в п. 3) в виде (18), где F(A) — некоторая (с точностью до нормировки) функция распреде- ления, носитель которой сосредоточен на множестве [—тг, тг), т. е. F(A) = 0 для А < —тг и F(A) = F(ir—) для А > тг. Результат об интегральном представлении ковариационной функции, сопоставленный с (15) и (16), наводит на мысль, что произвольная стаци- онарная последовательность также допускает «интегральное» представле- ние. Так оно на самом деле и есть, что будет показано в § 3 с помощью так называемых стохастических интегралов по ортогональным стохастическим мерам (§ 2). Пример 3. Белый шум. Пусть е = (еп) — последовательность орто- нормированных случайных величин, Еел = 0, Ее/е, = <5//, где 5/; —символ
§ 1. СПЕКТРАЛЬНОЕ ПРЕДСТАВЛЕНИЕ 583 Кронекера. Понятно, что такая последовательность является стационар- ной и ч [1, п = 0, Я(,1) = 1о. п^О. Отметим, что эта функция R(ri) может быть представлена в виде /?(«) = $ eiXndF(X), (19) — 7Г где F(A)= $ f(u)du, f(X) = ^~, -7г^А<тг. (20) J Z7T —7Г Сравнение «спектральных» функций (17) и (20) показывает, что если в примере 2 «спектр» был дискретным, то в настоящем примере он оказал- ся абсолютно непрерывным с постоянной «спектральной» плотностью ДА) = 1/2тг. В этом смысле можно сказать, что последовательность е = (ел) «составлена из гармоник, интенсивность которых одна и та же». Именно это обстоятельство и послужило поводом называть последовательность е = (еп) «белым шумом» по аналогии с («физическим») белым цветом, составленным из различных цветов одной и той же интенсивности. Пример 4. Последовательности скользящего среднего. Отправ- ляясь от белого шума е = (ея), введенного в примере 3, образуем новую последовательность оо Сп = ^k^n—kt (21) k——оо оо где ak — комплексные числа такие, что ^2 1а*12 < °°- />=—оо Из (21) находим оо cov^+zn, £w) = cov(£rt, £о) = an-\.k^kt k=—oo так что £ = (&) является стационарной последовательностью, которую при- нято называть последовательностью, образованной с помощью (двусто- роннего) скользящего среднего из последовательности e = (ek). В том частном случае, когда все а* с отрицательными индексами равны нулю и, значит, оо Сл == ^k^n—kt k=0
584 ГЛ. VI. СТАЦИОНАРНЫЕ СЛУЧАЙНЫЕ ПОСЛЕДОВАТЕЛЬНОСТИ последовательность £=(£п) называют последовательностью односторон- него скользящего среднего. Если к тому же все а* = 0 при k> р, т. е. если — + 4-...idpCn-p, (22) то £ = (£rt) называется последовательностью скользящего среднего по- рядка р. Можно показать (задача 3), что для последовательности (22) ковари- 7Г ационная функция R(n) имеет вид R(n) = § e'Xnf(X) dX, где спектральная — 7Г плотность равна /(А) = ^-|Р(е-‘л)|2 (23) Z7T С P(z) = a0 + aiz + ... + apzp. Пример 5. Авторегрессионная схема. Пусть снова e = (ert) — белый шум. Будем говорить, что случайная последовательность £ = (£„) подчиня- ется авторегрессионной схеме порядка q, если для п е Z + + (24) При каких условиях на коэффициенты Ь\, ..., bq можно утверждать, что уравнение (24) имеет стационарное решение? Чтобы ответить на этот вопрос, рассмотрим сначала случай q = 1: = 4" (25) где а = -Ь\. Если |а| < 1, то нетрудно проверить, что стационарная пос- ледовательность £ = (£я) с оо & = (26) /=0 является решением уравнения (25). (Ряд в правой части (26) сходится в среднеквадратическом смысле.) Покажем теперь, что в классе стаци- онарных последовательностей £ = (£л) (с конечным вторым моментом) это решение является единственным. В самом деле, из (25) последовательными итерациями находим, что /г-1 €>п = a£rt-i + sn =а[а£п-2 + 1 ] 4- еп =... = ak£n-k + /=о
§ 1. СПЕКТРАЛЬНОЕ ПРЕДСТАВЛЕНИЕ 585 Отсюда следует, что Л-1 12 £n-Sa'£n-/ /=о J Е = Е[аА£п_*]2 = <*2*Е£П2_Л = ^Е^2 - О, k —»оо. Таким образом, при |а| < 1 стационарное решение уравнения (25) суще- ствует и представляется в виде одностороннего скользящего среднего (26). Аналогичный результат имеет место и в случае произвольного q > 1: если все нули полинома Q(z)=l+b{z + ... + bqzq (27) лежат вне единичного круга, то уравнение авторегрессии (24) имеет, и притом единственное, стационарное решение, представимое в виде одно- стороннего скользящего среднего (задача 2). При этом ковариационная функция R(n) представима (задача 3) в виде тг А /?(л)= $ eiXndF(X), F(X) = $ (28) — 7Г — 7Г где «Л>=^-|СТ- <29) В частном случае q = 1 из (25) легко находим, что Е£о = О, 1 rvn Е^12 = ТтЬ’ ^=1^’ (R(ri) = R(—n) для п<0). При этом ^(А) = 2^ ’ |1-ае-' А|2 • Пример 6. Этот пример иллюстрирует возникновение авторегрессион- ных схем при построении вероятностных моделей в гидрологии. Рассмот- рим некоторый водный бассейн (например, Каспийское море) и постараем- ся построить вероятностную модель, описывающую отклонения уровня в этом бассейне от среднего значения, вызванные колебаниями в стоке и испарением с водной поверхности. Если за единицу измерения взять год и обозначить Нп «уровень» в бассейне в n-й год, то получим следующее уравнение баланса: Hn+[=Hn^KS(Hn) + ^n^ (30) где через обозначена величина стока в (п + 1)-й год, S(H) — площадь поверхности водного бассейна на уровне Н К — коэффициент испарения. 3 - 9728
586 ГЛ. VI. СТАЦИОНАРНЫЕ СЛУЧАЙНЫЕ ПОСЛЕДОВАТЕЛЬНОСТИ Обозначим через £п = Нп-Н отклонение от среднего уровня Н (кото- рый находится^ по результатам многолетних наблюдений) и предположим, что S(H) = S(H) + с(Н — Н). Тогда из уравнения баланса следует, что ве- личины подчиняются уравнениям £л+1 =а£п Н-£л+1 (31) с а = 1 —сК, en = ^n — KS(H). Случайные величины еп естественно считать имеющими нулевые средние и в первом приближении некоррелированными и одинаково распределенными. Тогда, как это было показано в примере 5, уравнение (31) (при |а| < 1) имеет единственное стационарное решение, которое следует считать решением, описывающим установившийся (с го- дами) режим колебаний уровня в рассматриваемом бассейне. В качестве тех практических выводов, которые можно сделать из (те- оретической) модели (31), укажем на возможность построения прогно- за отклонений уровня на следующий год по результатам наблюдений за настоящий и предшествующий годы. А именно, оказывается (см. далее пример 2 в § 6), что оптимальной (в среднеквадратическом смысле) ли- нейной оценкой величины по значениям ..., £,п-\, £п служит просто величина о£п. Пример 7. Смешанная модель авторегрессии и скользящего сред- него, Если предположить, что в правой части уравнения (24) вместо еп стоит величина aoen + a\en-i + ... + ap£rt_p, то получим так называемую смешанную модель авторегрессии и скользящего среднего порядка (р, q): + ^i£n-i + ••• + bq£>n-q = Щ)Еп + + • • • + аргп_р. (32) При тех же предположениях относительно нулей полинома Q(z), что и в примере 5, далее показывается (следствие 2 к теореме 3 § 3), что уравнение (32) имеет стационарное решение £ = (£„), для которого ковариационная 7Г А функция равна /?(л) = § e‘XndF(X) с F(A) = § f(v) dv, где — 7Г — 7Г /(А)=^-| Z7T | P(e~iX) I2 3. Теорема (Герглотц). Пусть R(n) — ковариационная функция стационарной (в широком смысле) случайной последовательности с нулевым средним. Тогда на ([—тг, тг), S8([—тг, тг))) найдется такая конечная мера F = F(B), В е тг)), что для любого neZ 7Г /?(л) = 5 eiXnF(dX), (33)
§ 1. СПЕКТРАЛЬНОЕ ПРЕДСТАВЛЕНИЕ 587 тг где интеграл § elXnF(dX) понимается как интеграл Лебега—Стил- —тг тьеса по множеству [-тг, тг). Доказательство. Положим для /V > 1 и Ае [—тг, тг] N N = ~ (34) k=\ /=1 В силу неотрицательной определенности R(n) функция fu(X) неотрица- тельна. Поскольку число тех пар (й, /), для которых k-l = m, есть N - |т|, то |m|<W (35) Пусть FW(B) = $ fN(X)dX, Вб#([-тг, тг)). в Тогда eiXnFN(dX) = 5 eiXnfN(X)dX = — ТГ / (' - уМ о, |п|<М \n\ZN. (36) Меры F/v, N 1, сосредоточены на интервале [—тг, тг] и F/v([—тг, тг]) = = /?(0) < оо для любого /V > 1. Следовательно, семейство мер {F^}, N 1, плотно, и по теореме Прохорова (теорема 1 § 2 гл. III) существуют подпоследовательность {/V*}C{/V} и мера F такие, что Fn^F. (Поня- тия плотности, относительной компактности, слабой сходимости и теорема Прохорова очевидным образом с вероятностных мер переносятся на любые конечные меры.) Тогда из (36) следует, что $ eiXnF(dX) = lim $ eiXnFNk(dX) = R(n). — 7Г ОО — Построенная мера F сосредоточена на интервале [—тг, тг]. Не изменяя ин- 7Г теграла § elXnF(dX)i можно переопределить меру F, перенеся «массу» Л{тг}), сосредоточенную в точке тг, в точку —тг. Так полученная новая мера (обозначим ее снова через F) будет уже сосредоточенной на интервале I—тг). (По поводу целесообразности выбора для значений А именно интервала [—тг, тг), а не, скажем, [—тг, тг], см. замечание к примеру 1 в п.2.) □ з*
588 ГЛ. VI. СТАЦИОНАРНЫЕ СЛУЧАЙНЫЕ ПОСЛЕДОВАТЕЛЬНОСТИ Замечание 1. Меру F = F(B), участвующую в представлении (33), на- зывают спектральной мерой, а функцию F(A) = F([—tt, А]) —* спектраль- ной функцией стационарной последовательности с ковариационной функ- цией /?(и). В рассмотренном выше примере 2 спектральная мера оказалась дис- кретной (сосредоточенной в точках A*, k = 0, ±1, ...). В примерах 3—6 спектральная мера абсолютно непрерывна. Замечание 2. Спектральная мера F однозначно определяется по ковариационной функции. В самом деле, пусть F\ и F^ — две спектральные меры и % 5 eiXnFi(dX)= eiXnF2(dX), neZ. — 7Г —тг Поскольку любая ограниченная непрерывная функция g(X) может быть равномерно приближена на [—тг, тг) тригонометрическими полиномами, то $ g(A)F((dA) = $ g(X)F2(dX), —ТГ —тг откуда (4>. с доказательством теоремы 2 § 12 гл. II) следует, что Fi(B) = = F2(B) для любых В €^([-тг, тг)). Замечание 3. Если £ = (£п) — стационарная последовательность, со- стоящая из действительных случайных величин £п, то R(n) = R(—n) и поэтому п/ \ R(n) + R(-n) г . c/jxx R(n) — х v—~ = \ cos XnF(dX). 2. * —тг 4. Задачи. I. Вывести свойства (12) из (И). 2. Доказать, что если все нули полинома Q(z), определенного в (27), ле- жат вне единичного круга, то уравнение авторегрессии (24) имеет, и притом единственное, стационарное решение, представимое в виде одностороннего скользящего среднего. 3. Показать, что спектральные функции последовательностей (22) и (24) имеют плотности, задаваемые соответственно формулами (23) и (29). +°° 4. Показать, что если 52 \R(n) Г < °°* то спектральная функция F(A) П= —ОО имеет плотность ДА), определяемую формулой f(A) = ^ £ e~iXnR(n), п=—оо где ряд сходится в комплексном L2 = L2([—тг, тг), «^([-тг, тг)), А), А —мера Лебега.
§2. ОРТОГОНАЛЬНЫЕ СТОХАСТИЧЕСКИЕ МЕРЫ 589 § 2. Ортогональные стохастические меры и стохастические интегралы 1. Как уже отмечалось в § 1, интегральное представление ковариаци- онной функции и пример стационарной последовательности оо 6> = Е (1) /г=—оо с попарно ортогональными случайными величинами z*, k 6 Z, наводят на мысль о возможности получения представления произвольной стационар- ной последовательности в виде соответствующего интегрального обобще- ния суммы (1). Если положить Z(A)= Е <2) то (1) запишется в виде оо с«= Е e‘Xkn^z(^ (3) k=—оо где AZ(Aa) = Z(A*) - Z(Aft-) = zk. Правая часть (3) напоминает интегральную сумму для «интеграла ти- 7Г па Римана—Стилтьеса» § eiXndZ(X). Однако в рассматриваемом нами —тг случае функция Z(A) является случайной (зависящей также и от си). При этом выясняется, что для интегрального представления произвольной ста- ционарной последовательности приходится привлекать к рассмотрению и такие функции Z(A), которые при каждом w имеют неограниченную вари- 7Г ацию. Поэтому простое понимание интеграла § etXn dZ(X) как интеграла — 7Г Римана—Стилтьеса для каждого ы становится неприемлемым. 2. По аналогии с общей концепцией интегралов Лебега, Лебега— Стилтьеса и Римана—Стилтьеса (§ 6 гл. II) рассмотрение интересующего нас случая начнем с определения стохастической меры. Пусть (П, «F, Р) — вероятностное пространство, Е — некоторое мно- жество с алгеброй <fo его подмножеств и сг-алгеброй <^ = сг(^о)- Определение 1. Комплекснозначная функция Z(A) = Z(a>; А), опре- деленная для и> 6 Q и А е So, называется конечно-аддитивной стоха- стической мерой, если: 1) Е|Z(А)|2 < оо для любого A е So;
590 ГЛ. VI. СТАЦИОНАРНЫЕ СЛУЧАЙНЫЕ ПОСЛЕДОВАТЕЛЬНОСТИ 2) для любых двух непересекающихся множеств Aj и Д2 из Sq Z(Ai + Д2) = Z(A0 4- Z(A2) (Р-п. н.). (4) Определение 2. Конечно-аддитивная стохастическая мера Z(A) на- зывается элементарной стохастической мерой, если для любых непе- оо ресекающихся множеств Дь Д2, ... из <?о таких, что Д= 52 Дл€<£Ь, £=1 Е п Z(4)-£Z(4t) £=1 2 -»о, п—>оо. (5) Замечание 1. В данном определении элементарной стохастической меры, заданной на множествах из So, предполагается, что ее значения принадлежат гильбертову пространству //2 = //2(П, &, Р), а счетная ад- дитивность выполнена в среднеквадратическом смысле (5). Существуют и другие определения стохастических мер, в которых отсутствует требование существования второго момента, а счетная аддитивность понимается, на- пример, в смысле сходимости по вероятности или с вероятностью единица. Замечание 2. По аналогии с неслучайными мерами можно показать, что для конечно-аддитивных стохастических мер условие (5) счетной ад- дитивности (в среднеквадратическом смысле) эквивалентно непрерывности (в среднеквадратическом смысле) в «нуле»: E|Z(4n)|2—>0, ДД0, 4„€<?о. (6) В классе элементарных стохастических мер особо важны меры, явля- ющиеся ортогональными в смысле следующего определения. Определение 3. Элементарная стохастическая мера Z(A), Де<?о, на- зывается ортогональной (или мерой с ортогональными значениями), если для любых двух непересекающихся множеств Д1 и Д2 из Sq EZ(Aj)Z(A2) = 0, (7) или, что эквивалентно, если для любых Д1 и Д2 из So EZ(41)Z(4^ = E|Z(41n42)|2. (8) Обозначим m(4) = E|Z(4)|2, Дё4 (9) Для элементарных ортогональных стохастических мер функция множеств ди = ги(Д), Де4 является, как легко видеть, конечной мерой, и, следо- вательно, по теореме Каратеодори (§ 3 гл. II) она может быть продолжена на (£, S). Так полученную меру будем снова обозначать через Агг ==т(Д) и
§2. ОРТОГОНАЛЬНЫЕ СТОХАСТИЧЕСКИЕ МЕРЫ 591 называть структурной функцией (элементарной ортогональной стоха- стической меры Z = Z(A), Дб<^Ь). Теперь естественным образом возникает следующий вопрос: раз функ- ция множеств m = m(A), определенная на (Е, <§Ь)» допускает продолжение на (Е, <?), где = то нельзя ли элементарную ортогональную сто- хастическую меру Z = Z(A), Дб<?о, продолжить на множества Д из <?, причем так, чтобы E|Z(A)|2 = /п(Д), Де<?. Ответ на этот вопрос утвердительный, что вытекает из нижеследу- ющих конструкций, приводящих в то же самое время и к построению стохастического интеграла, необходимого для интегрального представле- ния стационарных последовательностей. 3. Итак, пусть Z = Z(A) — элементарная ортогональная стохастиче- ская мера, Д е <?о, со структурной функцией т = zn(A), Д € S, Для каждой функции /(А) = $2 Д/д*(А), о °) принимающей лишь конечное число различных (комплексных) значений, определим случайную величину ^(/)=Е Пусть Е2 = Е2(Е, <?, т) — гильбертово пространство комплекснознач- ных функций со скалярным произведением (/, Я) = $ /(A)g(A)m(dA) Е и нормой ||/|| = (/, /)1/2, a //2 = W2(Q, Jf, Р) — гильбертово пространство комплекснозначных случайных величин со скалярным произведением (С.»?) = ЕС»? и нормой |И|| = (е, £)1/2. Тогда очевидным образом для любых двух функций / и g вида (10) (/мни} и И(/)112 = Н/112 = $ |/(A)|2m(dA). Е Пусть теперь /е£2 и {/„} —функции типа (10) такие, что ||/- /п|| —>0, п ~* оо (см. задачу 2). Тогда И(/л) - ^(fm)\\ = II fn - /mil -0, П, т ОО.
592 ГЛ. VI. СТАЦИОНАРНЫЕ СЛУЧАЙНЫЕ ПОСЛЕДОВАТЕЛЬНОСТИ Следовательно, последовательность {^(fn)} фундаментальна в средне- квадратическом смысле, и в силу теоремы 7 из § 10 гл. II найдет- ся случайная величина (обозначим ее с/(/)) такая, что J(f)^H2 и ||У(/я)-^(/)1Н0,п->оо. Так построенная случайная величина У(/) определяется однозначно (с точностью до стохастической эквивалентности) и не зависит от выбо- ра аппроксимирующей последовательности {fn}. Ее естественно назвать стохастическим интегралом от функции f eL2 по элементарной орто- гональной стохастической мере Z и пользоваться для наглядности (наряду с ./(/)) «интегральной» записью $ /(A) Z(rfA). Е Отметим следующие основные свойства стохастического интеграла У(/), непосредственно вытекающие из его конструкции. Пусть функции g, f, fn € L2. Тогда И(П,^(г)) = (Аг); (Н) \ И(/)И = 11/11; (12) J(af + bg)=aJ(f) + bJ(g) (Р-п.н.), (13) где а и b —- константы; И(/и)-^(/)1Ь0, (14) если \\fn - f|| —>0, n-*oo. 4. Используем определенный выше стохастический интеграл для продолжения элементарной ортогональной стохастической меры Z(A), Де<£Ь, на множества из <? = <т(<£Ь)- Поскольку мера т предполагается конечной, то функция /д = /д(А)е е£2 для всякого Де<?. Обозначим 2(Д) = «Х(/д). Ясно, что для Де<?о 2(Д) = Z(A). Из (13) следует, что если Д1 П Д2 = 0, Дь Д2 6 <?, то 2(Д1+Д2) = 2(Д|) + 2(Д2) (Р-п.н.), а из (12) вытекает, что Е|2(Д)|2 = /п(Д), Де<?. Покажем, что случайная функция множеств 2(Д), Де<^, является счетно-аддитивной в среднеквадратическом смысле. В самом деле, пусть Д* е £ и Д = А*- Тогда 6=1 п 2(Д)-^2(да)=Л(^я), 6=1
§2. ОРТОГОНАЛЬНЫЕ СТОХАСТИЧЕСКИЕ МЕРЫ 593 где п g„(A) = /Д(А) - 2 /дДА) = / оо (А), frf Е. д» Но Е|^Ш|2 = 1Ш12 = т( 22 Дф0’ я —оо, \£=Л+1 / т. е. Е п 2(Д)-£2(Д*) л=1 2 -О, п —>оо. Из (И) следует также, что для Д1 П Аг = 0, A i, Д2 € EZ(A!)Z(A2) = 0. Итак, построенная случайная функция Z(A), определенная на мно- жествах A е S, является счетно-аддитивной в среднеквадратическом смысле и на множествах Дб<?о совпадает с Z(A). Будем называть Z(A), Дб<?, ортогональной стохастической мерой (являющейся продолжением элементарной ортогональной стохастической меры Z(A)) со структурной функцией ги(Д), Де<£, а определенный выше интеграл = $ fWZ(dX) — стохастическим интегралом по этой мере. Е 5. Обратимся теперь к наиболее важному для наших целей случаю (Е, <?) = (/?, ^(/?)). Как известно (теорема 1 § 3 гл. II), всякая конечная мера m = m(A) на (/?, ^(/?)) находится во взаимно однозначном соответ- ствии с некоторой (обобщенной) функцией распределения G = G(x), причем m(a, b] = G(b) - G(a). Оказывается, нечто подобное справедливо и для ортогональных стоха- стических мер. Введем Определение 4. Совокупность (комплекснозначных) случайных вели- чин {ZA}, А е /?, заданных на (П, Р), назовем случайным процессом с ортогональными приращениями, если 1) E|Za|2<oo, Ае/?; 2) для каждого А € R E|Za-Za„|2^0, АДА, XneR; 3) для любых Ai < Аг < A3 < А4 E(Za4-Za3)(Za2-Za,) = 0.
594 ГЛ. VI. СТАЦИОНАРНЫЕ СЛУЧАЙНЫЕ ПОСЛЕДОВАТЕЛЬНОСТИ Условие 3) является условием ортогональности приращений. Усло- вие 1) означает, что Z\ еН2. Наконец, условие 2) носит технический ха- рактер и является требованием непрерывности справа (в среднеквадра- тическом смысле) в каждой точке Ас/?. Пусть Z = Z(A) — ортогональная стохастическая мера со структурной функцией т = дп(Д), являющейся конечной мерой с (обобщенной) функ- цией распределения G(A). Положим Za = Z(—оо, А]. Тогда E|ZA|2 = m(-oo, A] = G(A)<oo, E|ZA - ZA„|2 = m(An, A] |0, АДА, и, очевидно, выполнено также условие 3). Таким образом, построенный процесс {Za} является процессом с ортогональными приращениями. С другой стороны, если G(A) — обобщенная функция распределения с G(—оо) = 0, G(+oo)<oo и {Za} — процесс с ортогональными приращени- ями с Е|Za|2 = G(A), то положим для Д = (а, Ь] Z<A) = Zb-Za. Пусть <Г0 — алгебра, порожденная множествами вида Д=]Г(а£, Ьь], и л=1 2(A) = 53 Ясно, что k=i E|Z(4)|2 = m(4), п где т(Д) = 52 [G(bk) - G(a*)L и для непересекающихся интервалов Д1 = k=\ = (ai, bi] и Д2 = (а2, b2] Ег(Д1)ДД^) = 0. Ввиду непрерывности справа функции G(A), AeR, отсюда вытекает, что Z = Z(A), Де4 является элементарной стохастической мерой с ортого- нальными значениями. Функция множеств т = т(Д), Де4 однозначно продолжается до меры на <? = ^(R), и из предшествующих конструкций следует, что тогда Z = Z(A), Д также можно продолжить на множе- ства Де<?, где <^ = «^(R), при этом E|Z(A)|2 = т(Д), Де<^(/?). Тем самым между процессами {Za}, AeR, с ортогональными при- ращениями и E|Za|2 = G(A), G(-oo) = 0, G(+oo)<oo, и ортогональными стохастическими мерами Z = Z(A), Ae^(R), со структурной функцией т = ги(Д) существует взаимно однозначное соответствие, при котором Za = Z(—оо, A], G(A) = т(—оо, А]
§3. СПЕКТРАЛЬНОЕ ПРЕДСТАВЛЕНИЕ ПОСЛЕДОВАТЕЛЬНОСТЕЙ 595 И Z(a, b] = Zb ~ Za, т(а, b] = G(b) - G(a). По аналогии с обозначениями, принятыми в теории интегрирования по Лебегу—Стилтьесу и Риману—Стилтьесу (гл. II, § 6, пп. 9 и 11), под стохастическим интегралом § f(X)dZx, где {Zx} — некоторый процесс R с ортогональными приращениями, понимается стохастический интеграл f(X)Z(dX) по соответствующей этому процессу ортогональной стохасти- R ческой мере. 6. Задачи. 1. Доказать эквивалентность условий (5) и (6). 2. Пусть функция feL2. Используя результаты гл. II (теорема 1 в § 4, следствие к теореме 3 § 6 и задача 8 в § 3), доказать, что найдется последовательность {fn} функций вида (10) таких, что \\f — fn\\ ~>0, /г—>оо. 3. Установить справедливость следующих свойств ортогональной сто- хастической меры Z(A) со структурной функцией т(Д): Z(A| \ Д2) = Z(A,) - Z(Aj П Д2) (Р-п. н.), Z(A) А Д2) = Z(Ai) + Z(A2) - 2Z(A] П Д2) (Р-п. н.). § 3. Спектральное представление стационарных (в широком смысле) последовательностей 1. Если £ = (£„) — стационарная последовательность с = 0, п е Z, то, согласно теореме из § 1, найдется такая конечная мера /7 = /7(Д) на ([—-тг, тг), «^([—тг, тг))), что ковариационная функция /?(n) = COV(&+rt, &) допускает спектральное представление /?(«)= 5 eiXnF(dX). (1) — 7Г Следующий результат дает соответствующее спектральное пред- ставление самой последовательности £ = (frt), п е Z. Теорема 1. Существует такая ортогональная стохастическая мера Z = Z(A), Д е <^([-тг, тг)), что для каждого n е Z (Р-п. н.) § eiXnZ(dX) (= $ eiXnZ(dX)\. (2) — тг X [ — 7Г,7Г) ' При этом EZ(A) = 0, E|Z(A)|2 = F(A).
596 ГЛ. VI. СТАЦИОНАРНЫЕ СЛУЧАЙНЫЕ ПОСЛЕДОВАТЕЛЬНОСТИ Доказательство проще всего провести, опираясь на некоторые факты теории гильбертовых пространств. Пусть L2(F) = L2(E, £, F) — гильбертово пространство комплексно- значных функций, Е = [“Тг, тг), S = «^([-7г, %)), со скалярным произведе- нием {f,g) = $ /(A)i(A)F(dA).x (3) — 7Г и Lq(F) — линейное многообразие (Lq(F) С L2(F)), порожденное функциями еп = en(A), п е Z, где е„(А) = е‘Хп. Заметим, что поскольку Е = [—тг, тг) и мера F конечна, то замыкание многообразия L2(F) совпадает (задача 1) с L2(F): ^F)=l2(F). Пусть, далее, Lq(£) — линейное многообразие, порожденное случайны- ми величинами ncZ, и L2(£) (=L^(^)) —его замыкание в среднеквад- ратическом смысле (по мере Р). Установим между элементами Lq(F) и £§(0 взаимно однозначное со- ответствие «<-*», полагая еп<-*£п> neZ, (4) и доопределяя для произвольных элементов (точнее —классов эквивалент- ных элементов) по линейности: £ апеп «->• £ а„С„ (5) (здесь предполагается, что только конечное число комплексных чисел ап отлично от нуля). Отметим, что соответствие (5) корректно определено в том смысле, что 52 = 0 почти всюду по мере F тогда и только тогда, когда 52 ап£п = 0 (Р-п. и.). Так определенное соответствие «<->» является изометрическим, т. е. сохраняющим скалярные произведения. В самом деле, в силу (3) {еп,ет)= $ e„(A)^(A)F(dA)= $ е‘^п~т> F(dX) = — R(n — т) = Е£п£,т = (£„, £т) и аналогично £ /и.)- (6)
§3. СПЕКТРАЛЬНОЕ ПРЕДСТАВЛЕНИЕ ПОСЛЕДОВАТЕЛЬНОСТЕЙ 597 Пусть теперь туе L?(£). Поскольку L2(f) = Z^(£), то найдется такая пос- ледовательность (туп), что тул е L2(£) и \\7jn - ту|| —> 0, п -> оо. Следовательно, последовательность (ryrt) фундаментальна и, значит, таковой же является и последовательность функций (/„), где fneL^(F) и fn^r)n. Пространст- во L2(F) полно, и, следовательно, найдется такая функция f eL2(F), что II/.-/IH0. Очевидным образом верно и обратное: если feLz(F) и \\[ - fn\\ —*0, /л eL2^’ то найдется такой элемент туеL2(f), что ||ту — тул|| ->0, г}п е/^(£) и тул /я. До сих пор (изометрическое) соответствие «<-*» было определено лишь между элементами из Lq(£) и Lq(F). Доопределим его по непрерывности, полагая /<->ту, где / и ту — рассмотренные выше элементы. Нетрудно про- верить, что так установленное соответствие является взаимно однозначным (между классами эквивалентных случайных величин и функций), линейным и сохраняющим скалярное произведение. Рассмотрим функцию ДА) = /д(А), где Д е«^([-7г, тг)), Ае[-тг, тг), и пусть Z(A) — элемент из L2(f) такой, что /д(А)<-> Z(A). Ясно, что ||/д(А)||2 = /?(Д) и, значит, E|Z(A)|2 = F(A). Поскольку Efrt = O, neZ, то для каждого элемента Lq(£) (а следовательно, и £2(£)) его математическое ожидание равно нулю. В частности, EZ(A) = 0. Далее, если Aj П Д2 = 0, то EZ(Ai)Z(A2) = 0 и Е п 2 оо Z(A)-£Z(A*) -»0, п-+оо, где Д=£ А*. k=\ k=\ Тем самым совокупность элементов Z(A), Д 6«^([—тг, тг)), образует ортогональную стохастическую меру, по которой (согласно § 2) можно определить стохастический интеграл 5 f(X)Z(dX), feL?(F). —тг Пусть f е L?(F) f. Обозначим элемент rj через Ф(/) (точнее говоря, выберем по одному представителю из соответствующих классов эквива- лентных случайных величин и функций). Покажем, что (Р-п. н.) «>(/) = *(/)♦ (7) Действительно, если ЛА) = 22а*/дДА) (8) есть конечная линейная комбинация функций /дДА), A* = (a*, &*], то по самому определению стохастического интеграла «/'(/) = a^Z(A^), что, очевидно, равно Ф(Д. Таким образом, (7) справедливо для функций вида (8). Но если fe L2(F) и \\fn - f || -»0, где fn — функции вида (8),
598 ГЛ. VI. СТАЦИОНАРНЫЕ СЛУЧАЙНЫЕ ПОСЛЕДОВАТЕЛЬНОСТИ то ||Ф(/П) -Ф(/)|| —* О и ||<) - J^(/)|| -*0 (согласно (14) § 2). Значит, Ф(/) = ^(/) (Р-п.н.). Возьмем функцию f(X) = elXn. Тогда согласно (4) Ф(е1Хп) = £п', с другой 7Г стороны, S(elXn)= § elXnZ(dX). Поэтому в силу (7) (Р-п.н.) — 7Г £> = 5 eiXn Z(dA), neZ. □ — ТГ Следствие 1. Пусть = (£й) — стационарная последовательность, состоящая из действительных случайных величин £п, neZ. Тогда стохастическая мера Z = Z(A), участвующая в спектральном пред- ставлении (2), такова, что для любого Д е&([-тг, тг)) г(Д) = гьд), (9) где множество — Д = {А: - А е Д}. В самом деле, пусть f(A) = ^2 ak£lXk и ту = £} ak£k (суммы конечные). Тогда f ту и, значит, п=£ ~ Е =7FA). (Ю) Поскольку /д(А) <-»Z(A), то из (10) вытекает, что /д(—A)«->Z(A) (или, равносильно, /_д(А)«2(Д)). Но, с другой стороны, /_д(А)«-^(—Д). По- этому Z(A) = Z(—Д) (Р-п. н.). Следствие 2. Пусть снова £ = (£п) — стационарная последова- тельность, где £п — действительные случайные величины, и Z(A) = = Zj(A) + iZ2(A). Тогда для любых Д| и Д2 из &([—тг, тг)) EZi(Ai)Z2(A2) = 0, (11) и если Д| ПД2 = 0 и (-Д|)ПД2 = 0, то EZ1(A1)Z1(A2) = 0, EZ2(Ai)Z2(A2) = 0. (12) Действительно, поскольку Z(A) = Z(—Д), то Z1(-A) = Z1(A), Z2(—Д) = —Z2(A). (13) Далее, так как EZ(A|)Z(A2) = E|Z(Ai ПД2)|2, то Im EZ(A,)Z(A^) = 0, т. е. EZ^AOZz^) - EZ2(Ai)Z1(A2) = 0. (14)
§3. СПЕКТРАЛЬНОЕ ПРЕДСТАВЛЕНИЕ ПОСЛЕДОВАТЕЛЬНОСТЕЙ 599 Взяв вместо Д1 интервал — Дь отсюда находим EZI(-A!)Z2(A2) - Е Z2(—Д i )Z 1 (Д2) = О, что в силу (13) преобразуется к виду EZ1(A1)Z2(A2) + EZ2(Al)Zl(A2) = 0. (15) Из (14) и (15) получаем равенство (11). _____ Если же Д1 ПД2 = 0 и (—ДрП Д2 = 0, то EZ(Ai)Z(A2) = 0, откуда Re EZ(Ai)Z(A2) = 0 и Re EZ(—Ai)Z(A2) = 0, что вместе с (13) очевидным образом доказывает равенства (12). Следствие 3. Пусть С = (Сп) ~~ гауссовская последовательность. Тогда для любого набора Дь ...»Д* вектор (Zj(Д1),..., Zi(Д^), г2(Д0, ..., Z2(A*)) имеет гауссовское (нормальное) распределение. В самом деле, линейное многообразие Lq(£) состоит из (комплексно- значных) гауссовских случайных величин ту, т. е. вектор (Re ту, Im ту) имеет гауссовское распределение. Тогда в соответствии с п. 5 § 13 гл. II замыка- ние Lq(£) также состоит из гауссовских величин. Отсюда и из следствия 2 вытекает, что в случае гауссовской последовательности £ = (£п) действи- тельные и мнимые части Z\ и Z2 независимы в том смысле, что любые наборы случайных величин (Zi(Д1),..., Zi(Д^)) и (Z2(Aj), ..., Z2(A*)) независимы между собой. Из (12) следует, что для множеств Дь ..., Д^, таких, что Д/ПД; = (—Д^П Д7=0, /,/=!,...,£,///, случайные вели- чины Z,(Ai), ..., Z[(^k) независимы в совокупности, i = 1, 2. Следствие 4. Если £ = (£rt) — стационарная последовательность действительных случайных величин, то (Р-п. н.) £п= § cos XnZ\(dX)— § sinAnZ2(dA). (16) — 7Г — 7Г Замечание. Если {Zx}, А 6 [-тг, тг), — процесс с ортогональными приращениями, соответствующий ортогональной стохастической мере Z = Z(A), то спектральное представление (2) можно (в соответствии с § 2) записать также в следующем виде: е„= $ eiXndZx, n&Z. (17) — 7Г 2. Пусть £ = (£п) — стационарная последовательность со спектраль- ным разложением (2), и пусть туб£2(£). Следующая теорема описывает структуру таких случайных величин.
600 ГЛ. VI. СТАЦИОНАРНЫЕ СЛУЧАЙНЫЕ ПОСЛЕДОВАТЕЛЬНОСТИ Теорема 2. Если rjeL2(^)t то найдется такая функция <peL2(F), что (Р-п.«.) Т)= $ ^(A)Z(dA). (18) — 7Г Доказательство, Если 0В 9) то в силу (2) rh=\\YakeiXk\z(dX), (20) \|Л|^п / т. е. (18) выполнено с функцией . ^„(А)=£ akeiXk. (21) В общем случае, если ??еА2(£), то найдутся величины вида (19) такие, что \\ri- 7?п|| ->0, и —> оо. Но тогда ||<р„ - <pm|| = \\г]п - т]т || -> 0, л, т->оо, т. е. последовательность (срп) фундаментальна в L2(F), и, значит, найдется такая функция <р е L2(F), что ||<р — —* 0, п —>оо. В соответствии со свойством (14) § 2 ||«/(<prt) —«Х(<р)|| —>0, и так как ты = то 7] = У (у?) (Р-п. н.). □ Замечание. Пусть /7о(£) и Hq(F) — замкнутые линейные многообразия, порожденные величинами £° = и функциями е° = (en)n^Q соответ- ственно. Тогда, если ту с /7о(0* то найдется такая функция <р€//о(Л> что (Р-п.н.) т/= § ^(A)Z(dA). —тг 3. Формула (18) описывает структуру тех случайных величин, которые получаются из £rt, л 6 Z, с помощью линейных преобразований, т. е. в виде конечных сумм (19) и их пределов в среднеквадратическом смысле. Частный, но важный класс таких линейных преобразований задается с помощью так называемых (линейных) фильтров. Предположим, что в мо- мент времени т на вход некоторой системы (фильтр) подается сигнал хт, при этом реакция системы на этот сигнал такова, что на ее выходе в момент времени п получается сигнал h(n — т)хт, где h = й($), s е Z, — некоторая комплекснозначная функция, называемая импульсной переходной функ- цией (фильтра).
§3. СПЕКТРАЛЬНОЕПРЕДСТАВЛЕНИЕ ПОСЛЕДОВАТЕЛЬНОСТЕЙ 601 Таким образом, суммарный сигнал уп на выходе системы представля- ется в виде №=52 h(n — tn)xm. (22) m=—оо Для физически осуществимых систем значение выходного сигнала в момент времени п определяется лишь «прошлыми» значениями входно- го сигнала, т. е. значениями хт при т^п. Естественно поэтому фильтр с импульсной переходной функцией h = h(s) назвать физически осуще- ствимым, если h(s) = 0 для всех s < 0, иначе говоря, если оо оо №=52 й(п-т)хш = ^2 Л(т)х„_ш. (23) /и=—оо т=0 Важной спектральной характеристикой фильтра с импульсной пе- реходной функцией h является ее преобразование Фурье оо ¥>(А) = J2 (24) т=—оо называемое частотной характеристикой фильтра. Остановимся теперь на условиях сходимости рядов в (22) и (24), о которых до сих пор ничего не говорилось. Предположим, что на вход фильтра подается стационарная случайная последовательность £ = (£л), neZ, с ковариационной функцией R(n) и спектральным разложением (2). Тогда, если h(k)R(l — <оо, (25) &,/=—оо оо то ряд Л(я — т)^т сходится в среднеквадратическом смысле и, еле- т=—о© довательно, определена стационарная последовательность ту = (rjn) с оо оо №=52 л(«-т)с«= 52 л(т)с«-т- (26) т——оо т=—оо В спектральных терминах условие (25), очевидно, эквивалентно тому, что <p(X)eL2(F),T.e. $ |^(A)|2F(dA) < оо. (27)
602 ГЛ. VI. СТАЦИОНАРНЫЕ СЛУЧАЙНЫЕ ПОСЛЕДОВАТЕЛЬНОСТИ При условии (25) или (27) из (26) и (2) находим спектральное пред- ставление последовательности rj: 1)п= § eiXn<p(X) Z(dX), n&Z. (28) — 7Г Следовательно, ковариационная функция R^(п) последовательности ту определяется формулой R„(n)= $ e'Anh(A)|2 F(dX). (29) —ТГ В частности, если на вход фильтра с частотной характеристикой <^ = <^(А) подается белый шум е = (гД то на его выходе будет получаться стацио- нарная последовательность (скользящего среднего) Т)п= 52 (30) m=—оо со спектральной плотностью /,(А) = ^ИА)|2. Следующая теорема показывает, что в определенном смысле всякая стационарная последовательность со спектральной плотностью есть пос- ледовательность, полученная с помощью скользящего среднего. Теорема 3. Пусть г) = (rjn) — стационарная последовательность со спектральной плотностью f^X). Тогда можно найти (быть мо- жет, за счет расширения исходного вероятностного пространст- ва) такую последовательность е = (еп). являющуюся белым шумом, и такой фильтр, что справедливо представление (30). Доказательство, По заданной (неотрицательной) функции Д,(А) най- 1 * дем такую функцию <р(А), что ДДА) = — |<р(А)|2. Поскольку § fr)(X)dX< — 7Г <оо, то <p(X)eL2(dp). где dp — мера Лебега на [—тг, тг). Поэтому функцию <р(Х) можно представить в виде ряда Фурье (24) с h(m) = = $ eimX<p(X)dX. причем сходимость понимается в том смысле, что 2 <р(А)- £2 e~iXmh(m) dX->0. |/n|^n AZ —* ОО. 'tin
§3. СПЕКТРАЛЬНОЕ ПРЕДСТАВЛЕНИЕ ПОСЛЕДОВАТЕЛЬНОСТЕЙ 603 Пусть Т1п= 5 eiXn Z(d А), neZ. — ТГ Наряду с мерой Z = Z(A) введем в рассмотрение не зависящую от нее новую ортогональную стохастическую меру Z = Z(A) с E|Z(a, ft]|2 = Z7T (Возможность построения такой меры предполагает, вообще говоря, что исходное вероятностное пространство является достаточно «богатым».) Положим 2(Д)= § <p®(X)Z(dX) + [1 — <p®(X)<p(X)]Z(dX), д д где если а /0, [0, если а = 0. Стохастическая мера Z = Z(A) является мерой с ортогональными значе- ниями, при этом для всякого А = (a, ft] Е|2(Д)|2 = ^ $ |v®(A)|2|^(A)|2dA+^ $ |1 - р®(АМА)|2</А= д д где | А| = ft — а. Поэтому стационарная последовательность г = (ert), п 6 Z, с е„= $ eiXnZ(dX) — 7Г является белым шумом. Заметим теперь, что § e'AMA)Z(rfA)= § eiXn Z(dX) = i]n (31) — ТГ —тг и, с другой стороны, из определения у>(А) и свойства (14) § 2 (Р-п. н.) ТГ ТГ / О© \ _ $ elXn<p(X)Z(dX) = $ е'Ап e~iXmh(m) \Z(dX) = —it —it \m——<x> / = h(m) 5 e‘X(n~m} Z(dX) = h{m}en_m, m=—oo —it m=—<x> что вместо с (31) доказывает представление (30). □ Замечание. Если /^(Л) >0 (почти всюду по мере Лебега), то введение вспомогательной меры 2 = Z(A) становится излишним (поскольку тогда
604 ГЛ. VI. СТАЦИОНАРНЫЕ СЛУЧАЙНЫЕ ПОСЛЕДОВАТЕЛЬНОСТИ 1 — <Pe(A)<^(A) = 0 почти всюду по мере Лебега) и оговорка относительно необходимости расширения исходного вероятностного пространства может быть опущена. Следствие 1. Пусть спектральная плотность ДДА)>0 {почти всюду по мере Лебега) и АИА) = ^>(А)|2. где ^(А)=12 e~iXkh(k)’ 121л^|2 < °°- £=0 л=о Тогда последовательность т/ допускает представление в виде одно- стороннего скользящего среднего оо Т]п = 12 h(m)en-m. т=0 В частности, пусть P(z) = + a.\z + ... + apzp. Тогда последова- тельность 7] = (т)п) со спектральной плотностью /1,(А) = ^|Р(е-'А)|2 представима в виде Рп + + ••• + Следствие 2. Пусть £ = (frt) — стационарная последовательность с рациональной спектральной Плотностью 1 Р(е~'х\ 2 few =4 ’ <32> где P(z) = ao + aiz + ... + apzp, Q{z) = 1 + b^z + ... + bqzq. Если полином Q{z) не имеет нулей на множестве {z: |z| = 1}, то найдется такой белый шум e = (ert), что {Р-п.н.) + + ... + Ьд£>п-д = а^еп + а\вп_\ +... + ареп_р. (33) Обратно, всякая стационарная последовательность £ = {£п), удовлетворяющая такому уравнению с некоторым белым шумом г = {гп) м полиномом Q{z), не имеющим нулей на множестве {z: |z| = 1}, имеет спектральную плотность (32). Действительно, пусть rin=£n + bi£n_\ + ... + bq£n_q. Тогда ^(А) = = 7г-|/)(е“/Л)|2 и требуемое представление вытекает из следствия 1. Z7T
§3. СПЕКТРАЛЬНОЕ ПРЕДСТАВЛЕНИЕ ПОСЛЕДОВАТЕЛЬНОСТЕЙ 605 С другой стороны, если имеет место представление (33) и F^(X) и Fn(Л) — спектральные функции последовательностей £ и ??, то Л>(А) = $ \Q(e-iv)\2dF^v)^^ $ \P(e~iv)\2du. —тг —тг Поскольку |Q(e“zl/)|2 >0, то отсюда следует, что Л$(А) имеет плотность, определяемую формулой (32). 4. Следующая эргодическая теорема (в среднеквадратическом смысле) может рассматриваться как аналог закона больших чисел для стационарных (в широком смысле) случайных последовательностей. Теорема 4. Пусть $ = (frt), п е Z, — стационарная последователь- ность с Ее„=о, ковариационной функцией (1) и спектральным раз- ложением (2). Тогда 1 L2 -п £&-^Z«0)) k=0 и L^R(k)-^F({0}). k=Q Доказательство. В силу (2) (34) (35) Y^eikxZ{dX)^ $ ^(A)Z(dA), 6=0 Л=0 где i "-1 1, A = 0, V’n(A) = - 12 e‘kX = 1 e‘nX -1 , n (36) *=o U'eiA-r A^u- Очевидно, что |<prt(A)| 1. L2(F) Далее, <prt(A)-----> /<о}(А), поэтому по свойству (14) § 2 71 2 $ <^„(A) Z(dA) —► $ /{Oj(A)Z(dA) = Z({0}), что и доказывает (34). Аналогичным образом доказывается и утверждение (35). □ Следствие. Заметим, что если спектральная функция непре- рывна в нуле, т.е. F({0}) = 0, то Z({0}) = 0 (Р-п.н.). Поэтому в силу
606 ГЛ. VI. СТАЦИОНАРНЫЕ СЛУЧАЙНЫЕ ПОСЛЕДОВАТЕЛЬНОСТИ (34), (35) /1—1 /1—1 *=0 £=0 Поскольку 1 rt“I ; Е ад k=Q то верна и обратная импликация: п-1 п-1 =► ;Еад-»- k=0 k=0 I /1-1 Таким образом, условие - £ /?(^)—>0 является необходимым и до- п л=о статочным для сходимости (в среднеквадратическом смысле) средних । л-1 арифметических - & к нулю. Отсюда следует, что если исходная по- \ П k=Q следовательность £ = (£п) такова, что ее математическое ожидание есть т (E£o = w), то /1—1 М—1 2 (37) /1=0 /1=0 где/?(п) = Е(£л-Е£л)(£о-Е£о). Отметим также, что если Z({0})/0 с положительной вероятностью, а т = 0, то это означает, что последовательность содержит «случайную константу а»: £rt = a + ?7rt, 7Г где a = Z({0}), а в спектральном представлении tyi= § eIXnZ4(dX) мера —ТГ Z^ = Zr?(A) уже такова, что Zr?({0}) = 0 (Р-п. н.). Утверждение (34) означа- ет, что средние арифметические сходятся в среднеквадратическом смысле именно к этой случайной константе а. 5. Задачи. ________ 1. Показать, что Lq(F) = L?(F) (обозначения см. в доказательстве тео- ремы 1). 2. Пусть £ = (£п) — стационарная последовательность, обладающая тем свойством, что для некоторого W и всех п £n+N =£>п- Показать, что спек- тральное представление такой последовательности сводится к представле- нию (13) § 1.
§4. СТАТИСТИЧЕСКОЕ ОЦЕНИВАНИЕ 607 3. Пусть £ = ($я) — стационарная последовательность такая, что E£rt = 0 и N—\ /V-1 k=0 1=0 |£|^/V—1 при некоторых С >0, а>0. Используя лемму Бореля—Кантелли, показать, что тогда 1 N (р-п-н-)- k=0 4. Пусть спектральная плотность /$(А) последовательности £ = (£ш) является рациональной, f (W — 1 А)1 /оо\ гдеPrt-i(z) = ao + a1z-f-... + art_izrt”1 и Qn(z) = 1 + biz + ... + bnzn, причем корни полинома Qn не лежат на единичной окружности. Показать, что найдется такой белый шум e = (em), meZ, что пос- ледовательность (£т) будет компонентой n-мерной последовательности (^, Ст» •••» Cm)» Cm = Ст, удовлетворяющей системе уравнений Cm+l =Cm+l +A€m+1, i = 1, • •., П - 1, (39) Cm+1 = “ У? + 0п€т+\, /=0 /-1 где fa =aQi - 52 fab^k- k=i § 4. Статистическое оценивание ковариационной функции и спектральной плотности 1. Задачи статистического оценивания тех или иных характеристик распределений вероятностей стационарных случайных последовательно- стей возникают в самых разнообразных областях науки (геофизика, ме- дицина, экономика и др.). Материал, излагаемый в настоящем параграфе, дает представление о понятиях и методах оценивания и о тех трудностях, которые здесь возникают.
608 ГЛ. VI. СТАЦИОНАРНЫЕ СЛУЧАЙНЫЕ ПОСЛЕДОВАТЕЛЬНОСТИ Итак, пусть £ = (£я), п G Z, — стационарная в широком смысле (действи- тельная—для простоты) случайная последовательность с математическим 7Г ожиданием E£rt = т и ковариацией R(n) = § elXn F(dX). — 7Г Пусть xo, %i, ..., X/v-i — полученные в ходе наблюдений значения слу- чайных величин £о, 6» •••, &v-i- Как по ним построить «хорошую» оценку (неизвестного) среднего значения т? Положим 1 mN(x) = - xk. (1) k=Q Тогда из элементарных свойств математического ожидания следует, что эта оценка является «хорошей» оценкой величины т в том смысле, что «в среднем по всем реализациям хо,..., Xyv-i» она является несмещенной, т. е. / 1 *-i \ EmM(fl = E =т. (2) ' \ л=о / 1 N Более того, из теоремы 4 § 3 вытекает, что при условии — ^2 Я(^) 0, N *=о /V—>оо, рассматриваемая оценка является также и состоятельной (в среднеквадратическом смысле), т. е. Е|т^(£)-/п|2—>0, N —»оо. (3) Займемся теперь вопросом оценивания ковариационной функции R(n), спектральной функции F(A) = F([—тг, А]) и спектральной плотно- сти f(X), предполагая, что т = 0. Поскольку R(n) = E£rt+*&, то в качестве оценки этой величины по ре- зультатам N наблюдений хо, Xj,..., х/у_1 естественно взять (для 0 п < N) величину I /V-n-1 RN(n-,x) = —- ^2 k=Q Ясно, что оценка является несмещенной в том смысле, что Е^(/г;е) = /?(п), 0^n<N. Рассмотрим теперь вопрос о ее состоятельности. Подставляя в (37) § 3 вместо & величины £n+k£k и предполагая, что для каждого целого числа п последовательность £ = (<^)Ле2, = стационарна
§4. СТАТИСТИЧЕСКОЕ ОЦЕНИВАНИЕ 609, в широком смысле (в частности, отсюда будет следовать существование четвертого момента <оо), находим, что условие Af-l 1 £ Е[е>+и*-/?(л)н^ео-/?(«))-о, /v-oo, (4) k=0 является необходимым и достаточным для того, чтобы E\RN(n;£) — R(ri)\2—>0, N^<x>. (5) Предположим, что исходная последовательность £ = (£п) является гаус- совской (с нулевым средним и ковариацией /?(и)). Тогда в силу (51) § 12 главы 11 Е - R(n) ] [€«€о - R(n) ] = Etn+ktento - R2(n) = = Е£л+*& • Е£я& + Е£л+*£я • Е£*£о + Е£я+*£о • Е&£„ - R2(n) = = R2(k) + R(n + k)R(n-k). Поэтому в гауссовском случае условие (4) эквивалентно условию 1 N~l ± 22 I7?2W + R(n + k)R(n “ *)] 0, N -+ оо. (6) k=0 Поскольку \R(n + k)R(n - k)\ |/?(« + fc)|2 + |₽(л - £)|2, то из условия i N~l /V^oo, (7) /2=0 вытекает и условие (6). В свою очередь, если (6) верно для п = 0, то выполняется условие (7). Таким образом, доказана следующая Теорема. Пусть £ = (£л) — гауссовская стационарная последова- тельностъ с Е£я = 0 и ковариационной функцией R(n). Тогда выпол- нение условия (7) является необходимым и достаточным для того, чтобы при любом п^О оценка RnIjv, х) была состоятельной в сред- неквадратическом смысле (т.е. чтобы было выполнено условие (5)). Замечание. Если воспользоваться спектральным представлением ко- вариационной функции, то получим 1 ТГ ТГ . ТГ ТГ ^£/?2(й)= $ $ F(dX)F(dv) = $ $ fN(X,v}F(dX)F(dv), /2=0 — ТГ -ТГ k=Q -7Г -ТГ
610 ГЛ. VI. СТАЦИОНАРНЫЕ СЛУЧАЙНЫЕ ПОСЛЕДОВАТЕЛЬНОСТИ где (ср. С (36) § 3) Но при N —> ос 1, Av (А, ^) = < A = i/, А /г/. //v(A, 1/)-*ДА, v) = 1, A = i/, ' 0, А/к Поэтому . N тг тг тг $ $ f(X,v)F(dX)F(dv) = $ F({A})F(dA) = £F2({A}), Л=0 ”7Г А где сумма по А не более чем счетна, поскольку мера F конечна. Тем самым, условие (7) эквивалентно условию £f2({A}) = 0, (8) А означающему, что спектральная функция /ДА) = F([—тг, А]) является не- прерывной, 2. Перейдем теперь к вопросу построения оценок для спектральной функции /ДА) и спектральной плотности ДА) (в предположении, что она существует). Естественно напрашивающийся путь построения оценок спектральной плотности следует из проведенного выше доказательства теоремы Герглот- ца. Напомним, что введенная в § 1 функция = ± Е(1-у)*(«)е-,Ая О) \n\<N обладала тем свойством, что построенная по ней функция А FnW= $ fN(v)dv — ТГ сходилась в основном к спектральной функции /ДА). Поэтому, если F(A) имеет плотность ДА), то для каждого А е [-%, тг) $ fN(v)dv^ $ f(v)dv. (10) —тг —тг
§4. СТАТИСТИЧЕСКОЕ ОЦЕНИВАНИЕ 611 Исходя из этих фактов и вспоминая, что в качестве оценки R(n) (по наблюдениям хо, Хь *л/-1) брались величины Ru(n; х), возьмем в ка- честве оценки /(А) функцию /л,(Л; х) = ± $2(1- ^)Рл/(и; х)е-'Ая, (11) |л|<Л< полагая RN(n;x) = RN(\n\; х). Функцию f/v(A; х) принято называть периодограммой, и нетрудно про- верить, что ее можно представить также в следующем несколько более удобном виде: fN(X\ х)- 2^N N-\ 2 $2 xne~iXn п=0 (12) Поскольку ERn(iv, £) = R(ri), |n| <N, то EfN(X-,$ = fN(X). Если спектральная функция F(X) имеет плотность ДА), то, учитывая, что fu(X) может быть записана также в виде (34) § 1, найдем, что К-1 N-1 „ Е Е S el^eiX^f(v)dv = fc=0 /=0 1 2tt/V W-1 ei(v-X)k k=0 2 du. Функция Ф»<А>=Й« • A 2 sin gAf sin A/2 называется ядром Фейера, Из свойств этой функции известно, что для почти всех А (по мере Лебега) $ Ф„(А dv-> /(А). (13) — 7Г Поэтому для почти всех Ае [—тг, тг) E//v(A;£W(A), (14) иначе говоря, оценка Av (А; х) спектральной плотности /(А) по наблюдени- ям хо, хь хд/-1 является асимптотически несмещенной.
612 ГЛ. VI. СТАЦИОНАРНЫЕ СЛУЧАЙНЫЕ ПОСЛЕДОВАТЕЛЬНОСТИ В этом смысле оценку /ИА; х) можно было бы считать достаточно «хорошей». Однако на индивидуальных наблюдениях хо, ...»x^_i значе- ния периодограммы /НА; х) оказываются зачастую далекими от истинных значений ДА). Например, пусть £ = (£rt) — стационарная последователь- ность независимых гауссовских случайных величин, £л~е/К(0, 1). Тогда ДА) = 1/2тг, а N—1 k=0 2 Поэтому 2irfu(0; £) по распределению совпадает с квадратом гауссовской случайной величины 1). Отсюда при любом N Е|М0; <)-/(0)|2 = ^Eh2- 1|2>0. Более того, несложный подсчет показывает, что если ДА) — спектраль- ная плотность стационарной последовательности £ = (£rt), образованной по схеме скользящего среднего: оо £п ~ ^k^n—k (15) £=0 оо оо с 52 1а*1 < °°> 52 1ал|2 < оо» где е = (sn) ~ белый шум с EeJ < оо, то k=Q г El? /\ ex f/4xi2 f2/2(°)» A = 0, ±7Г, hm E|^(A; ^) —/(А)Г = < ' \ (16) N-+OO I / (A), A^O, ±7T. Отсюда становится понятным, что периодограмма не может служить удовлетворительной оценкой спектральной плотности. Чтобы исправить это положение, в качестве оценок для ДА) часто используют оценки вида fJ(A;x) = $ WN(X-u)fN(V-,x)dv, (17) — ТГ которые строятся по периодограмме /НА; х) и некоторым «сглаживаю- щим» функциям U^v(A), называемым спектральными окнами. Естествен- ные требования, предъявляемые к функциям №/ДА), состоят в том, чтобы: a) I^yv(A) имели резко выраженный максимум в окрестности точки А=0; b) § WN(X)dX=l; с) Е| (А; О - ДА)|2 0, А/ —> оо, А € [-тг, %).
§4. СТАТИСТИЧЕСКОЕ ОЦЕНИВАНИЕ 613 В силу (14) и требования Ь) оценки /^(А; £) являются асимптотически несмещенными. Требование с) является условием асимптотической состо- ятельности в среднеквадратическом смысле, что, как было показано вы- ше, нарушается для периодограммы. Наконец, требование а) обеспечивает «вырезание» из периодограммы требуемой частоты А. Приведем некоторые примеры оценок вида (17). Оценка Бартлетта основана на выборе спектрального окна WN(X) = aNB(aNX), где а^ Т оо, ац/N О, /V оо, и . А 2 Z7T А/2 Оценка Парзена использует в качестве спектрального окна функцию WN(X) = aNP(aNX), где а,ы такие же, как и выше, а Р(А)=^ . А 4 sin - 4 “а/Г Оценки Журбенко строятся с помощью спектральных окон вида WN(X) = aNZ(aNX), где Z(A) = { 2а О, 2а ’ где 0 < а 2, а величины а^ подбираются специальным образом. Не останавливаясь подробнее на вопросах оценивания спектральных плотностей, укажем лишь, что имеется обширная статистическая литера- тура, посвященная построению спектральных окон и сравнению свойств соответствующих им оценок /^(А; х). (См., например, [133], [71], [72].) 3. Рассмотрим теперь вопрос оценивания спектральной функции ^(A) = F([—тг, А]). С этой целью положим л А Fn(X)= $ fN(u)du, Fn(X;x)= § fN(v; x) dv, — IT —7Г где x) — периодограмма, построенная no (xq, xj, ..., x^.J.
614 ГЛ. VI. СТАЦИОНАРНЫЕ СЛУЧАЙНЫЕ ПОСЛЕДОВАТЕЛЬНОСТИ Из доказательства теоремы Герглотца (§ 1) следует, что для любого neZ при N-*<х> § eiXndFN(X)^> $ eiXn dF(X). — ТГ — 7Г Отсюда (ср. со следствием к теореме 1 § 3 гл. III) вытекает, что F^ =>F, т. е. Fn(X) сходятся к F(X) в каждой точке непрерывности функции F(A). Заметим, что для всех |/г| < N $ eiXndFN(X-i) = RN(n-,^\-^). — 7Г Поэтому, если предположить, что сходятся с вероятностью еди- ница к /?(п) при N -* оо, то тогда § eiXadPN(X;$)~* § eiXndF(X) (Р-п.н.) —ТГ —тг и, значит^ F/v(A; £)=>F(A) (Р-п.н.). Отсюда легко вывести (переходя в случае необходимости от после- довательностей к подпоследовательностям), что если /?/у(/г; £)—>R(ri) по вероятности, то тогда и F^(X; f) => F(X) по вероятности. 4. Задачи. 1. Пусть в схеме (15) величины еп ~е/К(0, 1). Показать, что для любого п и N —*оо (N - |n|)D^(n; £) 2тг $ (1 + e2,nA)f2(A)dA. —ТГ 2. Установить справедливость формулы (16) и следующего ее обобще- ния: {2/2(0), A = i/ = O, ±7г, /2(А), A = i//O, ±тг, О, А § 5. Разложение Воль да 1. В отличие от представления (2) § 3, дающего разложение стацио- нарной последовательности в частотной области, рассматриваемое ниже разложение Вольда действует во временной области. Суть этого разложе- ния сводится к тому, что стационарная последовательность £ = (£rt), п G Z, представляется в виде суммы двух стационарных последовательностей,
§5. РАЗЛОЖЕНИЕ ВОЛЬДА 615 одна из которых полностью предсказуема (в том смысле, что ее значения полностью восстанавливаются по «прошлому»), а вторая этим свойством не обладает. __ Введем прежде всего некоторые обозначения. Пусть //„(£) =/?(£") и //(£) = L2(£)--замкнутые линейные многообразия, порожденные величи- нами = (..., &-!,&) и £ = (••♦, £n-i,6i, ...) соответственно. Пусть также 5Ю = П НМ), п Для любого элемента ту 6 /7(0 обозначим через тгя(7?) = Ё(»7|/7яЮ) проекцию элемента т? на подпространство //я(£) (см. § 11 гл. II). Будем обозначать также #-oo07) = £frj|S(C)). Каждый элемент т}еН(£) можно представить следующим образом: 77 = 7Г_оо(7?) + (/) - 7Г-оо(»?)). где ту-тг-оо^Хтг-ооО?). Поэтому пространство Н(£) представляется в виде ортогональной суммы //Ю=$ЮфШ где S(£) состоит из элементов тт-оо^у) с туе /7(0, a R(£) — из элементов вида 77 — 77—00(77). Всюду в дальнейшем будем предполагать, что Efrt = 0 и D£„ > 0. Тем самым пространство Н(£) заведомо является нетривиальным (содержит элементы, отличные от нулевого). Определение 1. Стационарная последовательность £ = (frt) называет- ся регулярной, если //(о=т и сингулярной, если /7(О = 5(О- Замечание 1. Сингулярные последовательности называют также де- терминированными, регулярные — чисто или вполне недетерминиро- ванными. Если 5(0 есть собственное подпространство пространства /7(0, то последовательность £ называют недетерминированной.
616 ГЛ. VI. СТАЦИОНАРНЫЕ СЛУЧАЙНЫЕ ПОСЛЕДОВАТЕЛЬНОСТИ Теорема 1. Всякая стационарная в широком смысле случайная последовательность £> допускает разложение (I) где = (£') — регулярная, a £s = ($*) — сингулярная последователь- ность. При этом £г и £s ортогональны (£' ±£sm для всех п и т). Доказательство. По определению положим ^=Ё(е„|5(е)). Поскольку f'±S(£) для любого п, то S(fr)±S(£). С другой стороны, S£r) С S(0, и, значит, S(£r) тривиально (содержит лишь случайные ве- личины, совпадающие почти наверное с нулем). Следовательно, процесс £г является регулярным. Далее, Нп(£)СHn(£s)®H,№) и Нп(?)СНп(£), Нп(^)СНп^). Поэтому Нп(£) = Hn(£s) ®Нп(£г), и, значит, для любого п S(£)Gtfrt(r)e/W). (2) Поскольку $' ± S(£), то из (2) следует, что S(£)C/W), и, значит, S(f)CS(fs)C//(£s). Но GS(£), поэтому /7(fs)CS(f), и, сле- довательно, S($) = S(C) = //(C), что означает сингулярность последовательности £s. Ортогональность последовательностей £s и следует очевидным об- разом из того, что 6 S(f), а £' ± S(£). □ Замечание 2. Разложение (1) на регулярную и сингулярную компо- ненты единственно (задача 4). 2. Определение 2. Пусть £ = (£rt) — невырожденная стационарная по- следовательность. Случайную последовательность e — (ert) назовем обнов- ляющей последовательностью (для £), если: а) е = (еп) состоит из попарно ортогональных случайных величин с Ее„ = 0, Е|е„|2= 1; Ь) Нп(£) = Нп(ё) ДЛЯ любого п 6 Z. Замечание 1. Смысл термина «обновление» обусловлен ассоциацией с тем, что как бы привносит новую «информацию», не содержащуюся в #п(£) (иначе — «обновляет информацию» в Нп(£), которая необходима для образования Нп+\(£)). Следующая важная теорема устанавливает связь между введенными выше (пример 4 в § 1) последовательностями одностороннего скользящего среднего и регулярными последовательностями.
§5. РАЗЛОЖЕНИЕ ВОЛЬДА 617 Теорема 2. Для того, чтобы невырожденная последователь- ность % была регулярной, необходимо и достаточно, чтобы нашлись такие обновляющая последовательность е = (еп) м последователь- но ность комплексных чисел (ап), n^Q, с la«IЕ 2 * 4 < что (Р-п, н.) /1=0 оо = ' O'k^n-k- (3) Л=0 Доказательство. Необходимость. Представим Нп(£) в виде Нп($ = Нп-№®Вп. Поскольку Нп(£) порождается элементами из Нп_\(£) и элементами вида 0£п, где /3 — комплексные числа, то размерность пространства Вп равна нулю или единице. Пространство Нп(£) не может совпадать с Hn_i(£) ни при одном п. В самом деле, если при каком-то п Вп тривиально, то в силу стационарности тривиальными будут пространства Bk при всех k, а, значит, тогда //(£) = £(£), что противоречит предположению о регулярности последовательности £. Итак, пространство Вп имеет размерность 1. Пусть т)п — ненулевой элемент из Вп. Положим Е я-ыг где ||т?п||2 = Е|%|2 >0. Для фиксированных п и k 0 рассмотрим разложения Нп®= Hn—k(£) фBn—k+\ ф... ф Вп. Тогда En-k, --,Еп образуют ортонормированный базис в Bn~k+\® ••• Ф и /г-1 С» = 52 aie»-i + (4) /=0 где a -j = В силу неравенства Бесселя (6) § 11 главы II оо 521а/12^псл112<о0- /=о оо Отсюда следует, что ряд ^2 aj£n-j сходится в среднеквадратическом /=о смысле, и в силу (4) для доказательства (3) осталось лишь доказать, что *»-*(&)-^0, Л->оо. 4 - 9728
618 ГЛ. VI. СТАЦИОНАРНЫЕ СЛУЧАЙНЫЕ ПОСЛЕДОВАТЕЛЬНОСТИ Достаточно рассмотреть случай /г = 0. Обозначим тг/= тг/(Со)- По- скольку k Л-k = 7Г0 + Н-/ - 7Г—/-+-1 ]» /=0 а слагаемые, участвующие в сумме, ортогональны, то для любого k О 52 ii*-/-*-/+iii2= i=0 k 52 (TT-i-TT-i+l) i=0 2 = 1|тг_* - iro II2 4||£о ||2 < ОО. Поэтому существует (в среднеквадратическом смысле) предел lim тг_^. k—юо Для каждого k и, значит, рассматриваемый предел должен принадлежать подпространству Q //_*(£) = S(f). Но по предположению £2 S(£) тривиально, и поэтому тг_а> —► 0, k —> оо. Достаточность. Пусть невырожденная последовательность £ до- пускает представление в виде (3), где e = (ert) — ортонормированная система\(не обязательно удовлетворяющая условию Нп(£) = Нп(е), neZ). Тогда Hn(^)QHn(e) и, значит, S(£) = p| Hk(£)QHn(e) для любого п. Но k ел+1 ±//п(е), поэтому ert+i ±S(£), и в то же самое время e = (srt) является базисом в Н(£). Отсюда следует, что подпространство S(£) является тривиальным, и, значит, последовательность £ регулярна. □ Замечание 2. Из проведенного доказательства следует, что невыро- жденная последовательность £ является регулярной тогда и только тогда, когда она допускает, если следовать определению в примере 4 § 1, пред- ставление в виде одностороннего скользящего среднего оо Си — (5) k=0 где е = (ert) — некоторая ортонормированная система. В этом смысле утвер- ждение теоремы 2 говорит о большем, а именно о том, что для регулярной последовательности £ найдутся такие а = (ап) и ортонормированная си- стема e = (ert), что наряду с (5) будет справедливо представление (3), для которого Нп(£) = Нп(е), neZ. Из теорем 1 и 2 непосредственно вытекает Теорема 3 (разложение Вольда). Если £ = (£п) — невырожденная стационарная последовательность, то ^=£+52 (б) k=0
§5. РАЗЛОЖЕНИЕ ВОЛЬДА 619 где 53 1а*12 < 00 и е = (е«) ~ некоторая обновляющая последователь- л=о ность (для (?). 3. Смысл введенных выше понятий регулярной и сингулярной после- довательностей становится особенно прозрачным при рассмотрении сле- дующей задачи (линейной) экстраполяции, для общего решения которой оказывается весьма полезным использование разложения Вольда (6). Пусть = £2(£°) — замкнутое линейное многообразие, порожденное величинами £° = (..., f_i, &)• Рассмотрим задачу построения оптималь- ной (в среднеквадратическом смысле) линейной оценки величины £п по «прошлым» наблюдениям £° = (..., С-ь Со)- Из § 11 гл. II следует, что £,=g(e„i//o(e)). (7) (В обозначениях п. 1 £п=зго(£л).) Поскольку £г и £s ортогональны и ЯоЮ = = Ho(£r) ® Ho(£s), то с учетом (6) находим е»=£(<«+£« I Яо(0)=I Яо(0)+£& I ЯоФ) = = | //o(f) Ф //о(П) + е I Н0(О Ф Яо(С)) = =£(£ +£(& |Яо(г»=еп+е (Е wo). \/г=0 / В (6) последовательность e = (ert) является обновляющей для £г = (£') и, значит, Но(£г) = Но(е). Поэтому & = + Ё ( Е ah£n-k | #о(е) ) = + 52 ah£n-k (8) \/г=0 / k=n и среднеквадратическая ошибка предсказания по С° = (- • •»С-1» Со) равна л-1 a2 = E|e„-e„|2 = 52|aA|2. (9) k=Q Отсюда вытекают следующие два важных вывода. а) Если последовательность £ сингулярна, то для любого п 1 ошибка (экстраполяции) равна нулю, иначе говоря, возможно безошибочное предсказание £п по «прошлому» £° = (..., С-i» Со)- Ь) Если последовательность £ регулярна, то а* и lim <^ = Е |а*|2. (10) п—►оо k=0 4*
620 ГЛ. VI. СТАЦИОНАРНЫЕ СЛУЧАЙНЫЕ ПОСЛЕДОВАТЕЛЬНОСТИ Поскольку оо £|аА|2 = Е|е„|2, k=0 то из (10) и (9) следует, что * /2 £п —► 0, п —> оо, т. е. с ростом п прогноз величины £п по £° = (..., f-i, £о) становится три- виальным (совпадающим просто с Е£л =0). 4. Будем предполагать, что £ — невырожденная регулярная стацио- нарная последовательность. Согласно теореме 2, всякая такая последова- тельность допускает представление в виде одностороннего скользящего среднего оо ^^aken-k, (11) л=о оо где 52 1рл|2<оо и ортонормированная последовательность s = (ert) обла- k=0 дает тем важным свойством, что Hn(£) = Hn(s), net. (12) Представление (11) означает (см. п. 3 § 3), что £п можно рассматривать как сигнал на выходе физически осуществимого фильтра с импульсной переходной функцией а = (аД k 0, когда на вход подается последовате- льность е = (ея). Как и всякая последовательность двустороннего скользящего среднего, регулярная последовательность имеет спектральную плотность ДА). Но то обстоятельство, что регулярная последовательность допускает представ- ление в виде одностороннего скользящего среднего, позволяет получить дополнительную информацию о свойствах спектральной плотности. Прежде всего ясно, что /(А) = ^(А)|2, где 00 °° е~,хкаь< Eia*i2<o°- 03) k=0 k=0 Положим оо Ф(г) = 52а*г*. (14) *=0
§5. РАЗЛОЖЕНИЕ ВОЛЬДА 621 Эта функция является аналитической в открытой области |z| < 1 ив силу о° условия 52 \ak\ < 00 принадлежит так называемому классу Харди Н, т. е. классу аналитических в области \z| < 1 функций g = g(z), для которых sup § \g(re‘e)\2d0<oo. (15) 0<г<1 27Г Действительно, . 7Г ОО $ |Ф(ге'в)|24/0 = 22 Ы2г2* k=0 и sup V \ak^r2k V \ak|2 < ОО. ос<-<1 В теории функций комплексного переменного доказывается, что гра- ничное значение Ф(е/Л), —тг А < тг, тождественно не равной нулю функции Фе//2 обладает тем свойством, что 5 In |Ф(е”/л)|йА> —оо. (16) —-тг В рассматриваемом нами случае /(А) = ^|Ф(е-‘А)|2, где Ф е Н2. Поэтому In ДА) = - In 2тг + 2 In |Ф(е“‘А)|, и, следовательно, спектральная плотность /(А) регулярного процесса удо- влетворяет условию § In /(A)dA>—оо. (17) —ТГ С другой стороны, пусть спектральная плотность ДА) такова, что вы- полнено условие (17). Опять-таки из теории функций комплексного пере- оо менного следует, что тогда найдется такая функция Ф(з) = 52 akZk, при- л=о надлежащая классу Харди /72, что (почти всюду по мере Лебега) f(A) = |Ф(е“'А)|2. 27Г
622 ГЛ. VI. СТАЦИОНАРНЫЕ СЛУЧАЙНЫЕ ПОСЛЕДОВАТЕЛЬНОСТИ Поэтому, полагая <р(А) = Ф(е |Л), получаем ЛА) = ^к(А)|2, Z7T где <р(А) задается формулой (13). Тогда из следствия 1 к теореме 3 § 3 вытекает, что последовательность £ допускает представление в виде одно- стороннего скользящего среднего (11), где е = (ел) — некоторая ортонор- мированная последовательность. Отсюда и из замечания 2 в п. 2 следует, что последовательность £ регулярна. Итак, имеет место Теорема 4 (Колмогоров). Пусть £> — невырожденная регулярная стационарная последовательность. Тогда существует спектраль- ная плотность ДА) такая, что § In f(X)dX>—со. (18) — 7Г В частности, ДА) >0 (почти всюду по мере Лебега). Обратно, если — некоторая стационарная последователь- ность, имеющая спектральную плотность, удовлетворяющую усло- вию (18), то эта последовательность является регулярной. 5. Задачи. 1. Показать, что стационарная последовательность с дискретным спек- тром (спектральная функция F(X) — кусочно-постоянна) является сингу- лярной. 2. Пустьа2 = Е|£,-&|2,£, = Ё(61|Яо(6)- Показать, что если для неко- торого л > 1 а;* = 0, то последовательность £ является сингулярной; если же при п -* оо сг2 —* R(0), то — регулярной. 3. Показать, что стационарная последовательность £ = (£я), £n = elni/>, где у? —равномерная случайная величина на [0, 2тг], является регулярной. Найти оценку £п, величину и показать, что нелинейная оценка МЙГ дает безошибочный прогноз £п по «прошлому» £° = (..., С-i, Со), т. е. Е|ё«-Сл|2 = 0, л>1. 4. Доказать, что разложение (1) на регулярную и сингулярную компо- ненты единственно.
§6. ЭКСТРАПОЛЯЦИЯ, ИНТЕРПОЛЯЦИЯ и ФИЛЬТРАЦИЯ 623 § 6. Экстраполяция, интерполяция и фильтрация 1. Экстраполяция. В соответствии с результатами предыдущего па- раграфа сингулярные последовательности допускают безошибочный про- гноз (экстраполяцию) величин /г> 1, по «прошлому» £° = (..., £_i, &). Естественно поэтому при рассмотрении задач экстраполяции для произ- вольных стационарных последовательностей изучить сначала случаи ре- гулярных последовательностей. Согласно теореме 2 из § 5, всякая регулярная последовательность £ = (£„) допускает представление в виде одностороннего скользящего сред- него, оо = (1) k=Q оо с 52 1^|2<о° и некоторой обновляющей последовательностью г = (гп). k=0 Представление (1), как следует из § 5, решает задачу нахождения опти- мальной (линейной) оценки = E(frt |7/оЮ), поскольку, согласно (8) § 5, оо Сп = ^k^n—k (2) k=n И Л—1 а„2 = Е|е„-6|2 = 52 |^|2. (3) k=0 Однако это решение можно считать лишь принципиальным решением в силу следующего обстоятельства. Обычно рассматриваемые последовательности задаются не представ- лением (1), а с помощью задания их ковариационной функции R(n) или спектральной плотности /(А) (которая существует для регулярных после- довательностей). Поэтому решение (2) можно признать удовлетворитель- ным, если коэффициенты будут выражены через значения R(n) или ДА), а величины —через значения ..., &-ь Не затрагивая эту проблему в ее общем виде, ограничимся рассмот- рением одного частного (но интересного для приложений) случая, когда спектральная плотность представляется в виде ДА) = ^|Ф(е-гА)|2, (4) ОО где функция Ф(з) = 52 ^kZk имеет радиус сходимости г > 1 и не имеет нулей в области |z| 1.
624 ГЛ. VI. СТАЦИОНАРНЫЕ СЛУЧАЙНЫЕ ПОСЛЕДОВАТЕЛЬНОСТИ Пусть $ eiXn Z(dX) — ТГ (5) —• спектральное представление последовательности £ = (£rt), п е Z. Теорема 1. Если спектральная плотность последовательности С представима в виде (4), то оптимальная (линейная) оценка величины £>п по £° = (..., £0) задается формулой L= $ &(A)Z(dA), (6) — ТГ где л. /\\ -/Ал Фл(£ ' ) /-уч ^(А)-е ф^ТА)- (7) и ^n(z) = ^ bkZk. k=-n Доказательство. Согласно замечанию к теореме 2 § 3, всякая вели- чина е //о(£) допускает представление в виде &= $ vMA)Z(dA), <p„eH0(F), — 7Г (8) где Hq(F) — замкнутое линейное многообразие, порожденное функциями А еп = eiXn с я > О (F(A) = $ f(u) du). — ТГ Поскольку Eie„-e„i2= е тг 2 * $ (е,Ая - фп(Х)) Z(dX) = $ |е,Ая - фп(А)|2ДА) dX, то доказательство оптимальности оценки (6) сводится к доказательству того, что . inf $ |е,Ая - £„(A)|2f(A)dA = $ |e'An-<pn(A)|2/(A)dA. (9) Из теории гильбертовых пространств (§ 11 гл. II) следует, что опти- мальная (в смысле (9)) функция <£rt(A) определяется двумя условиями: \)фп(Х)еН<№, 2)eiXn-<pn(X)LH0(F).
§6. ЭКСТРАПОЛЯЦИЯ. ИНТЕРПОЛЯЦИЯ И ФИЛЬТРАЦИЯ 625 Поскольку е'АяФя(е_/А) = eiXn [bne~iXn + ft„+1e-/A(n+1> + ...]€ H0(F) 1 Ф(е-/А) и аналогичным образом eHo(F), то функция <£л(А), определенная в (7), принадлежит классу Hq(F). Поэтому для доказательства «оптималь- ности» функции фп(Х) достаточно лишь проверить, что для любого m > О е,Ая-<pn(A) ±е“'Ат, т. е. /«.т = $ 1е'Ая - <pn(X)]eiXm /(A) dX = 0, m > 0. — 7Г Следующая цепочка равенств показывает, что это действительно так: = К I [' - 1ф<^‘Л!^А = = ± V е<А(л+т)Гф(е-<А) _ фя(е-<*)] Ф(е-<А) dX = 2тг J — 7Г = 2. $ 5/^)^ = * -я \Л=0 / \/=0 / 7Г /л-l \ / О° \ = 2- $ e,Am( ^bkeiX(n~k} Ua = 0, * -* \jfe=o / \/=0 / где последнее равенство следует из того, что для т 0 и г > 1 5 eiXmeiXr dX = 0. □ —ТГ Замечание 1. Разлагая функцию £л(А) в ряд Фурье ^л(А) = Со + C-ie + + находим, что прогноз величины £я, n 1, по прошлому £° = (..., £-1, &) определяется формулой 6i = Co£o + C-i£_i +С_2^-2+ ... Замечание 2. Типичным примером спектральной плотности, предста- вимой в виде (4), является рациональная функция
626 ГЛ. VI. СТАЦИОНАРНЫЕ СЛУЧАЙНЫЕ ПОСЛЕДОВАТЕЛЬНОСТИ где полиномы P(z) — a$ + aiz + ...4-apzp и Q(z) = 1 + b\z + ... + bqzq не имеют нулей в области {z : |z| 1}. Действительно, в этом случае достаточно положить Ф(з) = P(z)/Q(z). оо Тогда Ф(г) = ^2 CkZk, причем радиус сходимости этого ряда больше еди- k=0 ницы. Приведем два примера, иллюстрирующие теорему 1. Пример 1. Пусть спектральная плотность f(A) = ^-(5 + 4cosA). Z7T Соответствующая ковариационная функция R(n) имеет «треугольный» вид: /?(0) = 5, /?(±1) = 2, R(n) = Q при |и|>2. (11) Поскольку рассматриваемая спектральная плотность может быть пред- ставлена в виде /(А) = ±|2 + е-'А|2, 1 Z7T то возможно применение теоремы 1. Легко находим, что •х е~'х ^i(A) = e &(А) = 0прил>2. (12) Поэтому для всех /г > 2 = 0, т. е. (линейный) прогноз значения £ по £° = (..., £0) является тривиальным, что совсем неудивительно, если заметить, что, согласно (11), корреляция между и любой из величин £о, £-1, ... равна нулю для п > 2. Для п= 1 из (6) и (12) находим, что тг _/д . тг . 6= $ S —hrZ(<iA) = l + — k=0 А=0 Пример 2. Пусть ковариационная функция /?(«) = а", |а|<1. Тогда (см. пример 5 в § 1) /(А) = 1 1 —1а12 2тг |1 -ае“/л|2 ’
§6. ЭКСТРАПОЛЯЦИЯ, ИНТЕРПОЛЯЦИЯ И ФИЛЬТРАЦИЯ 627 т.е. /(А) = ^-|Ф(е-'А)|2, 27Г где Ф(2) = ° T-lz'72 =(1 " |а|2)1/2 £ {az}k' *=о откуда фп(><) = ап и, значит, &= $ anZ(dX) = an^. —ТГ Иначе говоря, для прогнозирования величины £п по наблюдениям £° = = (..., £_ 1, £о) достаточно знания лишь последнего наблюдения £о- Замечание 3. Из разложения Вольда регулярной последовательности е=(ед оо £п = ^k^n—ki (13) k=0 следует, что спектральная плотность ДА) допускает представление ЛА) = ^|Ф(е-/А)|2, (14) где оо ф(г)=52 а*г*- л=о Очевидно, что и обратно, если ДА) допускает представление (14) с функ- цией Ф(г) вида (15), то разложение Вольда для £п имеет вид (13). Таким образом, задача представления спектральной плотности ДА) в виде (14) и задача отыскания коэффициентов dk в разложении Вольда эквивалентны. Сделанные в теореме 1 предположения относительно функции Ф(г) (отсутствие нулей в области |z| 1 и г > 1) на самом деле не нужны для ее справедливости. Иначе говоря, если спектральная плотность регулярной последовательности представлена в виде (14), то оптимальная в средне- квадратическом смысле оценка £п величины £п по £° = (..., £-1, Со) опре- деляется формулами (6) и (7). Замечание 4. Теорема 1 (вместе с предшествующим замечанием 3) дает решение задачи прогноза для регулярной последовательности. По- кажем, что на самом деле тот же ответ остается в силе и для произ- вольной стационарной последовательности. Точнее, пусть
628 ГЛ. VI. СТАЦИОНАРНЫЕ СЛУЧАЙНЫЕ ПОСЛЕДОВАТЕЛЬНОСТИ £„=Л eiXnZ(dX), F(4) = E|Z(4)|2 и /Г(А) = ^|Ф(е-‘А)|2 - спектраль- J 2тг —тг ная плотность регулярной последовательности £Г = (О- Тогда оценка определяется формулами (6) и (7). В самом деле (см. п. 3 § 5), пусть Ьп = $ 0„(А) Z(dX), & = $ &(A) Zr(dX), — ТГ — 7Г где Zr(A) —ортогональная стохастическая мера в представлении регуляр- ной последовательности £г. Тогда Е|ея-е„|2= $ \eiXn -фп(Х)\2 F(dX)> $ ]е‘Хп— фп(Х)\2 fr(X)dX^ —тг —тг |e‘An —^(A)|2/r(A)dA = E|^ —4д|2. (16) —ТГ Но & - 4» =& “ 4£. поэтому Е |<„ - 4„ |2 = Е |£' - £' |2, и из (16) следует, что в качеств^ <£Л(А) можно взять функцию <£„(А). 2. Интерполяция. Будем предполагать, что £ = (frt) — регулярная по- следовательность со спектральной плотностью ДА). Простейшей задачей интерполяции является задача построения оптимальной (в среднеквадра- тическом смысле) линейной оценки по результатам наблюдений {£„, п = ±1, ±2, ...} «пропущенного» значения £о- Обозначим через //°(£) — замкнутое линейное многообразие, поро- жденное величинами и/0. Тогда в соответствии с теоремой 2 § 3 всякая случайная величина т/б//°(^) представима в виде 7)= $ ^(A)Z(rfA), — ТГ где принадлежит H°(F) — замкнутому линейному многообразию, поро- жденному функциями elXn, /100, и оценка 4о= $ ^(A)Z(dA) (17) — ТГ будет оптимальной тогда и только тогда, когда inf Е|£о-т?|2= inf \ |1-9?(А)|2Л(</А) = Ч6И«(€) 1 <рея»(Л = $ |l-^(A)|2F(dA) = E|eo-4o|2.
§6. ЭКСТРАПОЛЯЦИЯ, ИНТЕРПОЛЯЦИЯ И ФИЛЬТРАЦИЯ 629 Из свойств «перпендикуляров» в гильбертовом пространстве HQ(F) вытекает, что функция ф(Х) полностью определяется (ср. с (10)) двумя условиями 1) 2) 1 — 0(A) ±//°(Г). Теорема 2 (Колмогоров). Пусть £ = (£„) — регулярная последова- тельность с г dA 1 fW Тогда ^(А)=1-^, (19) (20) где 2тг а ? dx ' A fW (21) и ошибка интерполяции 52 = Е|£о — £о|2 задается формулой 52 = 2тга. Доказательство проведем лишь при весьма строгих предположениях относительно спектральной плотности, считая, что (22) Из условия 2) в (18) следует, что для любого п /0 $[1-£(Л)1е‘яА/(АМА = 0. (23) В силу предположения (22) функция [1 -0(A)]/(А) принадлежит гильбер- тову пространству L2([—тг, тг], ^([-тг, тг]), dp) с мерой Лебега dp. В этом Г е^п 'I пространстве система функций |-/=, п = 0, ±1, ...| образует ортонор- мированный базис (задача 10 § 12 гл. II). Поэтому из (23) следует, что функция [1 — <£(А)]/(А) есть константа, которую обозначим а. Итак, второе условие в (18) приводит к тому, что Исходя из первого условия в (18), определим теперь константу а, В силу (22) феЬ2 и условие феН°(Р) равносильно условию, что ф при- надлежит замкнутому (в смысле нормы в £2) линейному многообразию, (24)
630 ГЛ. VI. СТАЦИОНАРНЫЕ СЛУЧАЙНЫЕ ПОСЛЕДОВАТЕЛЬНОСТИ порожденному функциями elXn, Отсюда ясно, что нулевой коэффи- циент в разложении функции ф(Х) должен быть равен нулю. Поэтому ТГ ТГ 0= 5 <?(А)</А = 2тг-а § — ТГ — ТГ dX ЛА) и, значит, константа а определяется формулой (21). Наконец, <*2 = Е|£о-£о|2= $ |l-^(A)|2/(A)dA = |a|2 $ /(А) . 4тг2 /2(A)flA~ I ЙА Л гм Теорема (при дополнительном предположении (22)) доказана. □ Следствие. Если £(*)= 52 с*е'АА’ 0<|Л|^ то <о = 52 c* S eiXkZ(dX) = £ с^- 0<|Л|^ 0<|*|^V Пример 3. Пусть /(А) — спектральная плотность из рассмотренного выше примера 2. Тогда нетрудно подсчитать, что «»= 1 ТгЬ |е'Л + e-IA| Z(</A) = ТТЙ5 !«+ «- I- а ошибка интерполяции равна г2 __ 1 - № “ 1+|а|2’ 3. Фильтрация. Пусть (0, f) = ((0rt), (£л)), neZ, — частично наблю- даемая последовательность, где в = (вп) — ненаблюдаемая, а £ = (£п) — наблюдаемая компонента. Последовательности 0 и £ будут предполагаться стационарными (в широком смысле) с нулевыми средними и спектральны- ми представлениями 0п= $ eiXnZe(dX), in= $ eiXnZ^dX) — 7Г —ТГ соответственно. Обозначим Fe(A) = E|Ze(4)|2, F€(4) = E|Ze(4)|2
§6. ЭКСТРАПОЛЯЦИЯ, ИНТЕРПОЛЯЦИЯ И ФИЛЬТРАЦИЯ 631 и /^(A) = EZ,(A)Ze(A). Кроме того, будем считать, что 0 и £ стационарно связаны, т. е. их функция ковариации cov(0rt, £т) = Евп^т зависит лишь от разности п — т. Обозначим /?0$(п) = Е0п£о. Тогда /?0С(п) = $ eiXnFe^dX). Рассматриваемая задача фильтрации состоит в построении оптималь- ной (в среднеквадратическом смысле) линейной оценки вп величины вп по тем или иным наблюдениям последовательности Совсем просто эта задача решается в предположении, что оценка 0п строится по всем значениям £т, m^Z. Действительно, поскольку 0rt = Ё(0П |Я(О)» то найдется такая функция <рп(Х), что 0п = $ <PnWZ^dX). (25) Как и в пп. 1 и 2, условия, которым должна удовлетворять «оптимальная» функция фп(Х), состоят в том, что: !)£я(А)б//(Ге), 2)еп-ёп±н(£). Из последнего условия находим, что для любого т 6 Z $ е‘А<л-т)Л>е(</А)- $ e-'Am<p„(A)^(cfA) = 0. (26) — ТГ — ТГ Поэтому, если предположить, что функции Г^(А) и /^(А) имеют плотности /в$(А) и /е(А), то из (26) получим $ eZA<"-'n> [ (А) - е-'Ал1^(А)/?(A)] dX = 0. Если /е(А) > 0 (почти всюду по мере Лебега), то отсюда сразу находим, что фп(Х) = е1Хпф{Х), (27) где $(X) = fet:(X)ff(X) и f®(A) — «псевдообращение» /{(А), т. е. /Г(А)Л^(А)Г* /€(А)>0, /€(А) = 0.
632 ГЛ. VI. СТАЦИОНАРНЫЕ СЛУЧАЙНЫЕ ПОСЛЕДОВАТЕЛЬНОСТИ ? -------------------------------------------------------------------I При этом ошибка фильтрации | I Е|0„-0П|2= $ [fe(X)-f^(X)ff(X)]dX. (28) * -7Г * Как нетрудно проверить, фпеН(Р^) и, следовательно, оценка (25) с функцией (27) является оптимальной. * Пример 4. Выделение сигнала из смеси с шумом. Пусть £п — вп +уп, где сигнал 0 = (Зп) и шум т/ = (?7л) являются некоррелированными после- довательностями со спектральными плотностями fe(X) и Д,(А). Тогда = $ e'A^(A)Zc(dA), — ТГ где ^(А) = /в(А)[/в(А) + /г7(А)]ф, а ошибка фильтрации Е|0„-0Я|2= 5 [fe(X)fn(X)][fe(X) + fn(X)fdX. \ -» Полученное решение (25) можно теперь использовать для построения оптимальной оценки величины 0п+т по результатам наблюдений &, k и, где т — некоторое заданное число из Z. Предположим, что после- довательность £ = (£п) регулярна со спектральной плотностью /(А) = ^|Ф(е-,л)|2. ОО где Ф(г) = 52 ak?k- Согласно разложению Вольда, k=0 оо Сл = k=Q где £ = (ert) —белый шум со спектральным разложением $ eiXn Z£(dX). — 7Г Поскольку ёп+т = Ё [0п+т | //„(О] = Ё [Ё [0п+т | //(011 //„(01 = Ё [0п+т | //„(01 И оо -Т 6п+т^ $ e^n+m^(X^(e-iX)Z£(dX)= dn+m-kek, | ~7Г k=—оо | 1
§6. ЭКСТРАПОЛЯЦИЯ, ИНТЕРПОЛЯЦИЯ И ФИЛЬТРАЦИЯ 633 где = k S е/А^(Л)Ф(е-'А)йА, Z7T *> —тт (29) @п+т — ^п+т—k^k | ^6i(£) Но Нп(£) = Нп(е), и, значит, @п+т — an+m—k£k k^n jXk Z£(dX) = оо $ eiXn ^&l+me-iXt Ф®(е_‘А) Z^(dA), -*• L/=o где Фе — псевдообращение Ф. Итак, доказана следующая Теорема 3. Если наблюдаемая последовательность £ = (£л) явля- ется регулярной, то оптимальная (в среднеквадратическом смысле) линейная оценка §п+т величины вп+т по k^n, задается формулой §п+т= $ eiXnHm(e~iX)Z^dX), (30) — 7Г где Нт(е~‘х) = £ Й/+оте-,А/Ф®(е-/А) (31) /=0 и коэффициенты а^ определяются в (29). 4. Задачи. 1. Доказать, что утверждение теоремы 1 сохраняет свою силу и без предположений, что Ф(г) имеет радиус сходимости г > 1, а нули Ф(г) лежат только в области |z| > 1. 2. Показать, что для регулярного процесса функция Ф(г), входящая в (4), может быть представлена в виде 1 00 £со + 52 с*2* 6=1 где c* = i S elkx \п f(X) dX. Z7T ° Ф(г) = х/2тг ехр и<1,
634 ГЛ. VI. СТАЦИОНАРНЫЕ СЛУЧАЙНЫЕ ПОСЛЕДОВАТЕЛЬНОСТИ Вывести отсюда, что ошибка прогноза на один шаг <т2 = E|£i -6 |2 задается формулой Сеге—Колмогорова {1 * 2^ § In f(X)dX ► . 3. Дать доказательство теоремы 2 без предположения (22). 4. Пусть некоррелированные сигнал в и шум ту имеют спектральные плотности = 2тг ’ |1+^е-/л|2’ = 2тг ’ |1+62е-/А|2 ’ Опираясь на теорему 3, найти оценку 6п+т величины 0п+т по значени- ям k и, где & = 0* + /?*. Рассмотреть ту же задачу для спектральных плотностей /<,(А) = ^-|2 + е-'А|2, /,(А) = ^-. Z7T Z7T § 7. Фильтр Калмана—Бьюси и его обобщения 1. С вычислительной точки зрения данное выше решение задачи филь- трации ненаблюдаемой компоненты в по наблюдениям £ не является удоб- ным, поскольку, будучи выраженным в спектральных терминах, оно для своей реализации требует обращения к аналоговым устройствам. В схеме, предложенной Калманом и Бьюси, синтезирование оптимального фильтра осуществляется рекуррентным способом, что дает возможность реали- зации с помощью цифровых вычислительных устройств. Есть и другие причины, обусловившие широкое применение фильтра Калмана—Бьюси. Одна из них состоит в том, что он «работает» и без предположения стационарности последовательностей (0, £). Ниже будет рассматриваться не только традиционная схема Калмана— Бьюси, но также и ее обобщения, состоящие в том, что в рекуррентных уравнениях, определяющих (0, £), коэффициенты могут зависеть от всех прошлых наблюдаемых данных. Итак, будем предполагать, что (0, £) = ((0Д (£rt)) есть частично на- блюдаемая последовательность, причем On = (01 (н), ..., 0k(n))> £„ = (6 (п), ..., 6(п)) управляются рекуррентными уравнениями 0л+1 =а0(и, £) + aj(/i, £)0я + Мл, £)ei(fl + 1) + 62(л, £)е2(п+ 1), £л+1 =Ло(п, £) + Л1(п, 6П + В\(п, £)si(n + 1) + В2(л, £)в2(п + 1).
§7. ФИЛЬТР КАЛМАНА—БЬЮСИ И ЕГО ОБОБЩЕНИЯ 635 Здесь б1(п) = (бц(п), ...» £\k(n)), e2(n) = (e2i(n), ...,е2/(и)) — независи- мые гауссовские векторы с независимыми компонентами, каждая из которых имеет нормальное распределение с параметрами 0 и 1; ао(п, £) = = (яо1(л* £)» • О) и А0(п. £) = (Л01(л, Ь, •••, Л0/(л, £)) — вектор- функции, где зависимость от £ = (£0, ...) входит неупреждающим образом, т. е. для фиксированного п ао\(п. $), ..., Ло/(п, зависят лишь от £о, ...» матричные функции bi(n, £) = ||/><*>(п, ОН, Ь2(п, ^) = \\Ьц\п, ОН, В1(», Oil. В2(п, 0 = 1|В?(л, ОН, Мп, О = |М;)(л. ОН, Мп, 0 = IH,?(«. ОН имеют порядок Ш,4х/, / xt,/ x/,4xt, / xi, соответственно, и также неупреждающим образом зависят от £. Предполагается также, что вектор начальных данных (0о, £о) не зависит от последовательностей ei =(ех(п)) и е2 = (е2(и)). Для простоты изложения указание на зависимость коэффициентов от £ в дальнейшем часто будет опускаться. Чтобы система (1) имела решение с конечным вторым моментом, будем предполагать, что Е(||0О||2 + ||£о||2) < 00 ( И2 = ZZ х = (хь ..., хл)), \ /=1 / |аУ(л, 01С с, 01 < с, и если g(n. £) — любая из функций ао/, Л о/, bff. В-V, В®. то E|g(n, f)|2<oo, п = 0, 1, ... В этих допущениях последовательность (0, £) такова, что и Е(||0Л||2 4- ||£л ||2) < оо, п 1. Пусть, далее, •••, 6J — наименьшая а-алгебра, поро- жденная величинами ...» Сп» и тп = Е(0Я |= Е[(0/i ” О1п)(вп — тп) Согласно теореме 1 § 8 гл. II, тп = .... mk(n)) является опти- мальной в среднеквадратическом смысле оценкой вектора Оп = (0{(п). ... • 0*(n)), a E7rt = E[(0rt~тп)(Оп-Мп)*] есть матрица ошибок оценивания. Отыскание этих величин для произвольных последовательностей (0, £), управляемых уравнениями (1), является весьма трудной задачей. Однако при одном дополнительном предположении относительно (0о, $о), состоя- щем в том, что условное распределение Р(0о а|£о) является гауссовским. Р(0о^а|£о) = S —оо 27» dx, (2) е с параметрами /По = /по(£о), 7о=7о(Со), Для тп и уп можно вывести систему
636 ГЛ. VI. СТАЦИОНАРНЫЕ СЛУЧАЙНЫЕ ПОСЛЕДОВАТЕЛЬНОСТИ рекуррентных уравнений, включающих в себя и так называемые уравнения фильтра Калмана—Бъюси. Прежде всего установим один важный вспомогательный результат. Лемма 1. При сделанных выше предположениях относительно коэффициентов системы (1) и условии (2) последовательность (0, £) является условно-гауссовской, т. е. условная функция распределения Р(0оОо......&п<ап\^) есть (Р-п. н.) функция распределения п-мерного гауссовского векто- ра, среднее значение и матрица ковариаций которого зависят от (Со...&). Доказательство. Ограничимся доказательством гауссовости лишь распределения P(0rt что достаточно для вывода уравнений для тп и 7п. Прежде всего заметим, что из (1) следует, что условное распределение Р(^п4-1 |<^, = является Гауссовским с вектором средних значений A _i_ А А ( О'® # 1 \ Ао + А^=^Ло + Л1^ и матрицей ковариаций bob ЬоВ\ D~\(boB)* Вов) ’ где bob = b\b* + b оВ = btB* + Ь2В^, В о В — В[В* +BiB^. Обозначим Сп = (Оп, £„) и / = (/ь /*+/). Тогда E[exp{i/*Cn+,}|^, 0„] = = exp{z/*(Ao(«. О + А((л, <)0„) - | ГВ(п, <)/}. (3) Допустим теперь, что утверждение леммы справедливо для некоторого и > 0. Тогда E[exp{zT*A|(n, С)0л}|^„е] = = exp{/7*Ai(n, e)m„ - 1 /*(А,(п. СЪЖ(п, С))/}. (4) Докажем, что формула (4) останется верной и при замене п на п + 1.
§7. ФИЛЬТР КАЛМАНА—БЬЮСИ И ЕГО ОБОБЩЕНИЯ 637 Из (3) и (4) имеем Е[ехр{/7*Сл+1}|^]=ехр^7*(Ао(п. O + Ai(n, £)тп)~ - 1 ГВ(/1, £)/ - 1 t*(At(n, ^(п, <))/}. Поэтому условные распределения Р(0Я+1О,6,+1О|Л?) (5) являются гауссовскими. Как и при доказательстве теоремы о нормальной корреляция (теорема 2 в § 13 гл. II), проверяется, что существует такая матрица С, что вектор »?= Рл+1 - Е(0п+1 |Ле)] -C[U1 - E(U11Л€)] обладает тем свойством, что (Р-п. н.) Емея+1-Е(ея+1|^))*|лс]=о. Отсюда следует, что условно-гауссовские векторы г) и £rt+i, рассматрива- емые при условии , являются независимыми, т. е. (Р-п. н.) Р(Т) G А, ея+1 G ВI= Р(»? € А|Л€) • P(U1 € ВI для любых A G S8(Rk), В G &(Rl). Поэтому, если s = ($|,..., $*), то E[exp(is*0n+l)|<^, е„+|] = = E{exp(is*[E(0n+1 |^«) + ’7 + СИя+1 -Е«я+11Л*)П)1Л€. U.} = = exp{fc*[E(0„+I |^«) + СКл+i - E(Ui 1Ле)П} E[exp(is*»?) |^«, ея+1] = = exp{zs*[E(0n+1 |JF«) + CK„+i -E(Ui 1Ле)]]}Е(ехр(15‘»7)|Ле)- (6) Согласно (5), условное распределение Р(т? у | <^я) является гаус- совским. Вместе с (6) это доказывает, что условное распределение Р(0п+1^а|<^+1) также является гауссовским. □ Теорема 1. Пусть (9, £) — частично наблюдаемая последовате- льность, удовлетворяющая (1) и (2). Тогда (тп,уп) подчиняются следующим рекуррентным уравнениям-. тп+\ = [a0 + ai/nn] + [6oB + ai7nA|‘] [BoB + Ai7„4*]® х х [£я+1 -Ао-А^п], (7) 7n+i = [aiyna* + bob]-[boB + ai'ynA*] х х[ВоВ + А17аА^ф-1ЬОВ + а17„А;Г. (8)
638 ГЛ. VI. СТАЦИОНАРНЫЕ СЛУЧАЙНЫЕ ПОСЛЕДОВАТЕЛЬНОСТИ Доказательство, Из (1) Е(0я+1 \^) = aQ + aimni Е(£л+1 |^) = Л0 + Д1/пя (9) и 0rt+i - E(0rt+1 |^f) = ai [0п - тп] + biei(/г + 1) + b2e2(n + 1), бж -Е(£л+1 \^) = Ai[On-mn]+Biei(n+ \) + В2е2(п+ 1). Обозначим di 1 = cov(0rt+1, 0я+11 ) = = E{[0„+i - E(0n+1 |^)J [0„+1 - E(0„+1 |^«)f 1Л7 dl2 = COV(6>„+i,^+i|^) = = E{[0„+1 -Е(0я+1 |Л?)] Кл+i -E(&+i |^«)Г IЛ5}. rf22 = COV(£n+|, £n+i | ) = =E{[e„+1 - e(&+i i^f)] &+1 - E(u. IW m Тогда из (10) du = ai7rta* + ft °&, di2 = #i7/^* + boB, d22 = A[,ynA* + BoB. (11) В силу теоремы о нормальной корреляции (см. теорему 2 и задачу 4 в § 13 гл. II) mn+i = Е(0„+1 |^«, е„+1) = Е(0п+1 |^) + d12d2®(Ui -Е«я+11Л€)) И 7/i+I == COV(0rt+i, 0rt_|_ 1 | , £n+l) =^ll ” ^12d^d12. Подставляя сюда выражения для E(0rt+i l^f), E(£rt+i |) из (9) и для du, di2, d22 из (11), получаем искомые рекуррентные уравнения (7) и (8). □ Следствие 1. Если все коэффициенты ао(п, £), ..., В2(п, £) в си- стеме (1) не зависят от £, то соответствующая схема называется схемой Калмана—Бъюси, а уравнения (7) и (8) для тп и ^п — фильтром Калмана—Бьюси. Важно подчеркнуть, что в этом случае условная матрица ошибок совпадает с безусловной, т, е, = Е7„ = E[(0rt - тп)(0п - тп)*]. Следствие 2. Предположим, что частично наблюдаемая после- довательность (0п, £п) такова, что для 0п справедливо первое из
§7. ФИЛЬТР КАЛМАНА—БЬЮСИ И ЕГО ОБОБЩЕНИЯ 639 уравнений в (1), а для ^ — уравнение Ся=до(л-1.е)+^(«-и)0п+ + В,(п - 1, 0<й (я) + В2(п - 1, е)£2(л). (12) Тогда, очевидно, &+1 =Ло(п, С) + А1(п, С)[ао(л, С) + Я1(п, £№п + Ь\{п, С)Е1(я + 1) + + Ь2(п, С)Е2(«+ 1)] + В1(л, £)€t(zi+ 1) + +B2(n, C)e2(n+ 1), и, обозначая Ло = /1о4~Лi<2o> Л1 =Л1О1, В\ = Л\Ь\ 4-В\, В^ = Л2&2"Ьfyz, получаем, что рассматриваемый случай также укладывается в схе- му (\), а тп и уп удовлетворяют уравнениям (7) и (8). 2. Обратимся к линейной схеме (ср. с (1)) #п+1 =^0 + + ЛгСп +Ь\£\(п+ 1) 4-&2^2(^4" 1)» 61+I =Ло + Л10п 4" Л 26 +В[£[(п+ 1) + В2£2(л+ 1)» где все коэффициенты ао,..., В% могут зависеть от п (но не от £), a £ij(n) — независимые гауссовские случайные величины с Ее/;(и) = 0 и Ее? (n)= 1. Пусть система (13) решается при начальных значениях (Оо, &) таких, что условное распределение Р(0о^а|£о) является гауссовским с пара- метрами то = Е(0о|^о) и 7o = cov(0o, 0о|£о) = Е7о- Тогда в силу теоремы о нормальной корреляции и (7), (8) оптимальная оценка тп = Е(0п \&п) является линейной функцией от £о, ...» & Это замечание позволяет доказать следующее важное утверждение о структуре оптимального линейного фильтра при отказе от предположения гауссовости. Теорема 2. Пусть (О, £) = (0п, £п)п^о — частично наблюдаемая пос- ледовательность, удовлетворяющая системе (13), где £ij(ri) — некор- релированные случайные величины с Ее/у(п) = 0, Ее?(/г) = 1, а компо- ненты вектора начальных значений (0о, £о) имеют конечный второй момент. Тогда оптимальная линейная оценка /ftrt = £(0rt|£o, ..., 60 удовлетворяет уравнениям (7) с ао(п, £) = ао(п) + а2(п)£п, Ао(п,£) = = Ло(/г) + Л2(п)^л, а матрица ошибок 7„ = Ё[(0Л- тп)(0п- тп)*\ — Уравнениям (8) с начальными данными tho=cov(0o, Со) cov®(Co, Со) • Со, (14) 7O=COV(0O, 0о) -COV(0Q, Со) COV®(Co, Со) COV*(0o, Со).
640 ГЛ. VI. СТАЦИОНАРНЫЕ СЛУЧАЙНЫЕ ПОСЛЕДОВАТЕЛЬНОСТИ Для доказательства этой теоремы понадобится следующая лемма, рас- крывающая роль гауссовского случая при отыскании оптимальных линей- ных оценок. Лемма 2. Пусть (а, /3) — двумерный случайный вектор, Е(а2 + + /32) <оо, а (d, /3) — двумерный гауссовский вектор с теми же пер- выми и вторыми моментами, что и у (а, /3), т. е. Еа1 = Еа1, Е& = Е(У, / = 1,2, Еа0 = Еа(3. Пусть Х(Ь) — линейная функция от b такая, что X(b) = E(a\0 = b). Тогда Х((3) является оптимальной (в среднеквадратическом смысле) линейной оценкой а по (3, т. е. Ё(а|/?) = А(/?). При этом ЕХ(/3) = Еа. Доказательство. Прежде всего отметим, что существование линей- ной функции Х(Ь), совпадающей с Е(а\ j3 = b), вытекает из теоремы о нор- мальной корреляции. Далее, пусть Х(Ь) — какая-то другая линейная оцен- ка. Тогда E[d —А(Д)]2 > E[d — А(/3)]2 и в силу линейности оценок Х(Ь) и Х(Ь) и условий леммы Е [а - А(/3)]2 = Е [а - А(Д)]2 > Е [а - А(0)]2 = Е [а - А(/3)]2, что и доказывает оптимальность Х(/3) в классе линейных оценок. Наконец, Е А (/?) = Е А(3) = Е [E(d | (3)] = Ed = Еа. □ Доказательство теоремы 2. Наряду с (13) рассмотрим систему Яж = +а\0п + +Ь\ё\\(п + 1) + б2Е12(л+ 1), ~ _ (1 о) &+1 =Ло 4->ll0/1 + В\Е2\(п 4- 1) + В2б22(п + 1), где Sij (п) — независимые гауссовские случайные величины с Ее/7(и) = 0 и Ее2 (я) = 1. Пусть также (0о, £о) — гауссовский вектор, имеющий те же первые моменты и ковариации, что и (0о, $о), и не зависящий от ё/7(и). Тогда в силу линейности системы (15) вектор (0q, €п) яв- ляется гауссовским, и, значит, утверждение теоремы следует из леммы 2 (точнее, из ее очевидного многомерного аналога) и теоремы о нормальной корреляции. □
§7. ФИЛЬТР КАЛМАНА-БЬЮСИ И ЕГО ОБОБЩЕНИЯ 641 3. Рассмотрим несколько примеров, иллюстрирующих теоремы 1 и 2. Пример 1. Пусть 0 = (Оп) и т/ = (т/п) — две стационарные (в широком смысле) некоррелированные случайные последовательности с Е0п = Ет}п = — О и спектральными плотностями = 27 ' ll+^e-'Ap’ ^(А) = 27 ’ |1+Й2е-‘А|2’ где |&1| < 1, |^| < 1- В дальнейшем будем интерпретировать 9 как полезный сигнал, а ту — как шум и предполагать, что наблюдению подлежит последовательность £ = (6i)c 6z = 9п 4- Tjn. Согласно следствию 2 к теореме 3 из § 3, найдутся (некоррелированные между собой) белые шумы ei = (ei(n)) и е2 = (^2(^)) такие, что 0rt+l +Мл=£1('*+ 1), *М+1 + Ь2Т]п=е2(п + 1). Тогда 6i+i = 0/i+i +tyi+i = —b\0n — 4-ei(/i 4- 1) + е2(п + О = = —&2(0/1 +tyi) ~~ 9п(Ь\ — &2) 4-£1(Л 4~ 1) 4-£2(л + 1) = = ~^2бг “ (b\ — &2)0/1 +€1(п + 1) 4-£2(л + 1). Тем самым для в и £ справедливы рекуррентные уравнения 0/i+i — —Ь\9п 4-£i(n 4-1), 6+1 ~—(Ь\ — &2)0/1 ~ Ь2£п +€1(п+ 1)+в2(н+ 1) (16) и, согласно теореме 2, = Ё (0Л16),..., 6) и 7n = Е (0п - тп)2 удовлетво- ряют следующей системе рекуррентных уравнений оптимальной линейной фильтрации: /77п+1 = —Ь\тп 4- 0 Л.1—[61+1 4- (b\ — Ь2)тп 4-626L 2 4-(и ~ &2Г7л 7//+1 =^7/14-1 [1 4-^i(/?i ~&2)7п]2 24- (Ь\ — ^2)27п (17) Найдем начальные значения то и 70, при которых должна решаться эта система. Обозначим =Е0^, di2 = E0/iC/i, ^22 = Е£2- Тогда из (16) du = b2d\\ 4-1, d\2 = b\(b[ — &2)dn 4- b\b2d\2 4-1, d22 = (b\ ~~ b2)2d\ \ 4- ^2^22 4- 2ft2(bi ~ ^2)^12 4- 2,
I 642 ГЛ. VI. СТАЦИОНАРНЫЕ СЛУЧАЙНЫЕ ПОСЛЕДОВАТЕЛЬНОСТИ | откуда | . 1 . 1 . 2 - - bl d" = Т^’ di2 = T^' d22=(l-ftf)(iZ6])’ что в силу (14) приводит к следующим значениям начальных данных: d 19 1 “ Ьл т° = = о а2 ».2&’ ^22 2-Ь]-bl _ , _4__1_________________1-<>22 . 1 11 ^22 l-fcf (1 -bl)(2-bl-bl) 2-bl-bl' Итак, оптимальная (в среднеквадратическом смысле) линейная оценка тп сигнала вп по £о> •••, и среднеквадратическая ошибка уп определя- ются из системы рекуррентных уравнений (17), решаемых при начальных условиях (18). Отметим, что уравнение для уп не содержит случайных со- ставляющих, и, следовательно, величины 7Я, необходимые для отыскания значений тп, могут быть рассчитаны заранее —до решения самой задачи фильтрации. Пример 2. Этот пример поучителен с той точки зрения, что пока- зывает, как результат теоремы 2 может быть применен для отыскания оптимального линейного фильтра в задаче, где последовательности (0, £) подчиняются (нелинейной) системе, не совпадающей с системой (13). Пусть 51 =(в1(/г)) и 52 = (£2 (л)) — Две независимые гауссовские после- довательности, состоящие из независимых случайных величин с Ее/(л) = 0, Ее?(л) = 1, п^1. Рассмотрим пару последовательностей (0, £) = (0rt, £л), п >0, с @п+\ =йвп + (1 +0л)51(/г + 1), &+1 = А0п 4-52^+ О- Будем считать, что 0о не зависит от (ei, 52) и 7о)- Система (19) является нелинейной, и непосредственное применение теоремы 2 невозможно. Однако если положить 51(л+1) = 1 4- 0л \/Е(1+0я)й ei(n+ 1), то замечаем, что Её](/г) = О, Её](п)ё\(пг) = 0, п^пг, Eef(n) = l. Поэтому наряду с (19) исходная последовательность (0, £) подчиняется также ли- нейной системе 0rt+i = а 10Л 4-(л 4-1), £л+1 ='410/2 4-£2(Я 4-1), (20)
§7. ФИЛЬТР КАЛМАНА—БЬЮСИ И ЕГО ОБОБЩЕНИЯ 643 где b\(п) = \/Е(1 + 0П)2, а {ёi (п)} — некоторая последовательность некор- релированных случайных величин. Система (20) является линейной системой типа (13), и, значит, опти- мальная линейная оценка тп = Ё(0Я |&, • • •, 60 и ее ошибка 7rt могут быть определены в соответствии с теоремой 2 из системы (7), (8), принимающей в рассматриваемом случае следующий вид: rhn+i — a.\fiin + ~‘Л‘j"- Ил+1 - 1 +Я|7л 7„+i = (а?7„ + fcf(n))- , где Ь\(п) = -\/Е(1 + 9п)2 должно быть найдено из первого уравнения систе- мы (19). Пример 3. Оценка параметров. Пусть 9 = (01,..., 0k) — гауссовский вектор с Ев = т и cov(0, 0) = 7. Предположим, что (при известных т и 7) ищется оптимальная оценка в по результатам наблюдений за /-мерной последовательностью £ = (£л), п 0, с 6ж =ДоК £) + Л1 (п, С)0 + В1(и, e)ei(n + 1), Со = О, (21) где — те же, что и в системе (1). Тогда из (7), (8) для тп = Е(0|<^|) и 7rt находим, что =mrt+7rt4T(/i, e)[(BiBD(n, + C)7^i(и, £)]ф х х [£л4-1 -Л0(я, £) — Л i(n, £)mrt], (22) 7я+1 =7л-7ллт(и, e)[(BiB?)(n, е)7лд:(и, е)]еЛ1(п, е)7и. Если матрицы BiBf являются невырожденными, то решения систе- мы (22) задаются формулами п тп+1 = £ + 7 A*(i, <) /=0 X X т + 7^ ДТ(/, €)(€/+»-Ло(т, е» , (23) /=0 п 1-1 7»+1 = Е+7^ЛГ(/^)(В1ВГ)-|(/^И1(/,е) 7, i=0 где E — единичная матрица.
644 ГЛ. VI. СТАЦИОНАРНЫЕ СЛУЧАЙНЫЕ ПОСЛЕДОВАТЕЛЬНОСТИ 4. Задачи. J 1. Показать, что для схемы (1) векторы тп и 0п — тп не коррелированье | Ери*(0п-/ип)] = О. 2. Пусть в схеме (1) 70 и все коэффициенты, за исключением, быть | может, коэффициентов ао(и, £), До(л» £), не зависят от «случая» (т. е. от £). f Показать, что тогда условная ковариация уп также не зависит от «случая»: | 7. = Е7.. I 3. Показать, что решения системы (22) задаются формулами (23). | 4. Пусть (0, = (6п, £п) — гауссовская последовательность, удовлетво- | ряющая следующему частному виду схемы (1): | 9п+\ = а0п + be\(n + 1), £л+1 = 4-Ве2(л 4-1). | Показать, что если Д0О, 6 00, В 00, то предельная ошибка фильтра- | ции 7= lim 7rt существует и определяется как положительный корень | уравнения | ' 72+[^-4-^=0. J 5. (Интерполяция-, [41, 13.3].) Пусть (0, О — частично наблюда- емая последовательность, подчиняющаяся рекуррентным соотношени- ям (1) и (2). , Пусть условное распределение тга(т, т) = Р(0т sj а | вектора вт является нормальным. (а) Показать, что условное распределение | 7гв(/п, п) = Р(0т а | | для п^т также является нормальным, тга(т, и)~<Ж(д(ги, /г), 7(ги, л)). ? (Ь) Найти интерполяционную оценку (величин 0т по п) и 5 матрицу 7(ли, и). | 6. (Экстраполяция; [41, 13.4].) Пусть в соотношениях (1) и (2) | ао(п, & = aQ(n) + a2(n)£n, ах(/г, £) = а{(п), ? Ло(/г, С) = А$(п) 4- А2(п)^Пу A i (п, С) = A i (п). (а) Показать, что в этом случае распределение 7га^(ди, п) = Р(вп^а, b | ^т) является (п т) нормальным. | (Ь) Найти экстраполяционные оценки | Е(0„|^«) и Е(е,|^«). I
§7. ФИЛЬТР КАЛМАНА—БЬЮСИ И ЕГО ОБОБЩЕНИЯ 645 7. (Оптимальное управление; [41, 14.3].) Рассматривается «управ- ляемая» частично наблюдаемая система (0Л, где 0^+1 = ип 4-6п 4- Ье\(п 4-1), 6н-1 =0/1 + £2(л 4-1). Здесь «управление» ип - ^-измеримо и таково, что Ем^ <оо для всех O^n^N - 1- Величины ei(п) и п=1,N, такие же, как в (1), (2); £о = О, 0о~<Ж(т, 7). Будем говорить, что «управление» «* = («*,..., и^_{) оптимально, если V(i/*) = sup V(u), где и V(«) = E jv-1 .л=0 Показать, что «: = -[! +Pn+l]+Pn+im*, n = 0,...,N — \, где . fa-1, a/0, a+ = < [0, a = 0, (Pn)o^n^N находятся из рекуррентных соотношений Ря = 1+Ря+1-Ря2+1[1+Ря+1]+, PN = \, a (m*) определяются из соотношений <+1 = «:+?:(! +7я*)+(6.+1 - т*), с т^ = т и 7я+1 =7Я + 1 - (7Я*)2(1 +7Я‘)+, - 1, с7о=7-
Глава VII ПОСЛЕДОВАТЕЛЬНОСТИ СЛУЧАЙНЫХ ВЕЛИЧИН, ОБРАЗУЮЩИЕ МАРТИНГАЛ § 1. Определения мартингалов и родственных понятий......... 647 §2 . О сохранении свойства мартингальности при замене времени на случайный момент............................................ 659 §3 . Основные неравенства.................................. 671 § 4. Основные теоремы о сходимости субмартингалов и мартингалов 688 §5 . О ^ножествах сходимости субмартингалов и мартингалов.. 697 § 6. Абсолютная непрерывность и сингулярность вероятностных рас- пределений на измеримом пространстве с фильтрацией.......... 706 §7 . Об асимптотике вероятности выхода случайного блуждания за криволинейную границу.................................... 721 §8 . Центральная предельная теорема для сумм зависимых случай- ных величин................................................. 726 § 9. Дискретная версия формулы Ито......................... 740 §10 . Вычисление вероятности разорения в страховании. Мартин- гальный метод............................................... 746 §11 .0 фундаментальных теоремах стохастической финансовой ма- тематики. Мартингальная характеризация отсутствия арбитража 751 § 12. О расчетах, связанных с хеджированием в безарбитражных мо- делях ...................................................... 767 § 13. Задачи об оптимальной остановке. Мартингальный подход .... 776
Теория мартингалов хорошо иллюстрирует историю становления матема- тической вероятности — ее основные понятия были навеяны практикой азарт- ных игр, но затем эта теория превратилась в одно из изощренных средств современной абстрактной математики... Дж. Дуб. «Что такое мартингал?» [127] § 1. Определения мартингалов и родственных понятий 1. Исследование зависимости между случайными величинами осуще- ствляется в теории вероятностей разными способами. В теории стационар- ных (в широком смысле) случайных последовательностей основным пока- зателем зависимости является ковариационная функция, и все выводы этой теории полностью определяются свойствами этой функции. В теории марковских цепей (§ 12 гл. I и гл. VIII) основной характеристикой за- висимости служит переходная функция, которая определяет эволюцию случайных величин, связанных марковской зависимостью. В настоящей главе (см. также § 11 гл. I) выделяется достаточно обширный класс последовательностей случайных величин (мартингалы и их обобщения), для которых изучение зависимости проводится методами, основанными на исследовании свойств условных математических ожиданий, 2. Будем считать заданным вероятностное пространство (Q, &, Р) с фильтрацией (потоком), т. е. семейством (&п) а-алгебр &п, п^О, таких, что «^о С С... С & («фильтрованное вероятностное пространство»). Пусть Хо» *1» ... — последовательность случайных величин, заданных на (Q, Р). Если для каждого п>0 величины Хл являются <^п-из- меримыми, то будем говорить, что набор X = (Хп, ^п)п^ь или просто X = (Хп, &п) образует стохастическую последовательность. Если стохастическая последовательность X = (Хп, &п) к тому же тако- ва, что для каждого п^ 1 величины Хп являются &п_\-измеримыми, то будем это записывать в виде X = (Xrt, <Frt-i), считая =<^Ь, и называть X предсказуемой последовательностью. Последовательность (Хл)л>о будет называться возрастающей, если Хо = О и Хп (Р-п. н.). Определение 1. Стохастическая последовательность/ = (Хп, ^п) на- зывается мартингалом (субмартингалом), если для всех /г > 0 Е|Хл|<оо, (1) Е(ХЯ+1|^Я)=ХЛ (Р-п.н.). (2)
648 ГЛ. VII. МАРТИНГАЛЫ Стохастическая последовательность Х — (Хп, &п) называется супер- мартингалом, если последовательность -Х — (—Хп, ^п) есть субмартин- гал. В том частном случае, когда , где = ct{Xq, ..., Хп}у и стоха- стическая последовательность X = (Хп, образует мартингал (субмар- тингал), будем говорить, что сама последовательность (Хп)л>о образует мартингал (субмартингал). Из свойств условных математических ожиданий легко выводится, что условие (2) эквивалентно тому, что для любого п 0 и А е \Xn+idP = \XndP. (3) А ^А Пример 1. Если (Сп)п^о — последовательность независимых случай- ных величин с E|frt|<oo, Efrt = O и Ап=6) + ---+6ь •••» 6J, то стохастическая последовательность X = (Хп, &п) образует мартингал. Пример 2. Если (Сп)п>о — последовательность независимых случай- ных величин с Е£л = 1, то стохастическая последовательность X = (Хп, ^п) с Хп = П 6ь = <т{£о, ...» £п} также образует мартингал. k=Q Пример 3. Пусть £ —случайная величина с Е|£| <оо и С... С &. Тогда последовательность X = (Xrt, <Fn) с Хп = Е(£ |&п) является мартингалом, называемым мартингалом Леви, Пример 4. Если (£л)п^о — последовательность неотрицательных ин- тегрируемых случайных величин, то последовательность (Хп) с Xn=£o + +... + образует субмартингал. Пример 5. Если X = (Хп, #п) — мартингал и g(x) — выпуклая книзу функция такая, что Е|^(ХЯ)| <оо, п^О, то стохастическая последовате- льность (g(Xn), ^п) является субмартингалом (что следует из неравенства Йенсена; гл. II, § 6). Если X = (Хп. &п) — субмартингал, a g(x) — выпуклая книзу неубываю- щая функция с Е |g(Xn)| < оо для всех п >0, то (g(Xn). #п) также является субмартингалом. Сделанное в определении 1 предположение (1) гарантирует существо- вание условных математических ожиданий E(Xrt+i |<^rt), п>0. Однако эти условные математические ожидания могут существовать и без предполо- жения Е|Хй+1| <оо. Напомним, что, согласно § 7 гл. II, Е(Х++1\#п) и Е(^/й-11^) определены всегда, и если (мы пишем А = В (Р-п. н.), когда Р(Л ДВ) = 0) {cv: Е(Х++1|Л,)<оо}и{си: Е(Х~ |^n) <oo} = Q (Р-п.н.),
§ I. ОПРЕДЕЛЕНИЯ МАРТИНГАЛОВ И РОДСТВЕННЫХ ПОНЯТИЙ 649 --------- то говорят, что E(Xrt+i |^я) определено и по определению полагают е(хя+1 т-Е(х++1 т - е(х„-+1 т. Исходя из этого, становится естественным следующее Определение 2. Стохастическая последовательность X = (Хп, &п) на- зывается обобщенным мартингалом (субмартингалом), если Е|Хо|< <оо, E(Xrt+i л>0, определены и выполнено условие (2). Заметим, что из этого определения вытекает, что для обобщенного субмартингала EfX^., \&п)<оо, а для обобщенного мартингала (Р-п. н.) Е(|Хя+1| W <оо. 3. Вводимое в нижеследующем определении понятие марковского мо- мента играет исключительно важную роль во всей рассматриваемой далее теории. Определение 3. Случайная величина т=т(си), принимающая значения в множестве {О, 1, ..., +оо}, называется марковским моментом (отно- сительно системы (&п)) или случайной величиной, не зависящей от будущего, если для каждого и > О {т = п}е^п. (4) В случае Р{т<оо}= 1 марковский момент т будем называть моментом остановки. Пусть X = (Хп, ^п) — некоторая стохастическая последовательность и т —марковский момент (относительно системы (<^я)). Обозначим оо ХТ(Ш) = ^Хп^)1{г=п}(ш) п=0 (тем самым, = 0, т. е. ХТ = 0 на множестве {ш: т = оо}). Тогда для каждого В е &)(R) {w. ХтеВ} = {ш: Х00еВ,т = оо} + ^{ХПеВ,т = п}&^, п=0 и, следовательно, Хт=Хт^(ш) является случайной величиной. Пример 6. Пусть X = (Хп, #п) — некоторая стохастическая последова- тельность и B^SS(R). Тогда момент (первого попадания в множество В) тв = inf{n>0: Хп еВ} (с тв = 4-оо, если {} = 0) является марковским, поскольку для любого {rB=n} = {XQ£B, ...,Хп^^В,ХпеВ}е^п. 5 - 9728
650 ГЛ. VII. МАРТИНГАЛЫ Пример 7. Пусть X = (Хп, &п) — мартингал (субмартингал) иг — мар- ковский момент (относительно системы (&п))- Тогда «остановленная» по- следовательность Хг = (ХпЛт, ^п) также образует мартингал (субмартин- гал). В самом деле, из соотношения п—1 ХпЛТ = У Xml{T—m} + /и=0 следует, что величины Хп^т ^-измеримы, интегрируемы и •^(л+1)Ат Хп/\т —t{r>n}(^n+l Xn)t откуда EpQ«+l)Ar “Х1Ат |«^л] — ^{r>rt}EpGl+l Хп |с^л] £7)0* С каждой системой (J^) и марковским моментом т относительно нее можно'связать совокупность множеств = {А е А П {т = п} е Для всех п 0}. Ясно, что Q Е Л и Л замкнуто относительно взятия счетных объедине- ний. Кроме того, если А е , то А П {т = п} = {т = п} \ (Л О {т = п}) € &п и, значит, А Отсюда следует, что является а-алгеброй. Если трактовать &п как совокупность событий, наблюдаемых до мо- мента времени п (включительно), то тогда можно представлять как совокупность событий, наблюдаемых за «случайное» время т. Нетрудно показать (задача 3), что случайные величины т и Хт являются -измеримыми. 4. Определение 4. Стохастическая последовательность Х = (ХЛ, ^Л) называется локальным мартингалом (субмартингалом), если найдется такая (локализующая) последовательность (т^)^\ конечных марковских моментов, что т^\ (Р-п. н.), т* Т оо (Р-п. н.), k —► оо, и каждая «оста- новленная» последовательность XTk = (XTk^nl{Tk>Q}, &п) является мартин- галом (субмартингалом). Ниже в теореме 1 показывается, что на самом деле класс локаль- ных мартингалов совпадает с классом обобщенных мартингалов. Более того, каждый локальный мартингал может быть получен с помощью так называемого мартингального преобразования из некоторого мартингала и некоторой предсказуемой последовательности. Определение 5. Пусть Y = (Yn> #п)п^о ~ стохастическая последо- вательность и V = (Vrt, <^n-i)/i>o — предсказуемая последовательность
§1. ОПРЕДЕЛЕНИЯ МАРТИНГАЛОВ И РОДСТВЕННЫХ ПОНЯТИЙ 651 1 ==<Я0- Стохастическая последовательность V • У = ((V • Y)n, &п) с (У-У)я = Ц)Го + £ К АГ/, (5) /=1 где ДУ/ = Yi - У/-1, называется преобразованием У с помощью V. Если к тому же У — мартингал (или локальный мартингал), то говорят, что V • У есть мартингалъное преобразование. Теорема 1. Пусть X = (Xrt, — стохастическая последова- тельность с Хо = О (Р-п. н.). Следующие условия являются эквива- лентными: а) X — локальный мартингал; b) X — обобщенный мартингал; с) X — мартингальное преобразование, т. е. существуют пред- сказуемая последовательность V = (УЯ, с Vb = 0 и мартингал у = (Уя, &п) cYq = Q такие, что X = V -У. Доказательство, а) => Ь). Пусть X — локальный мартингал и (г*) — его локализующая последовательность марковских моментов. Тогда для любого ш > О E[|XmArJ ^{r*>0}] < °О, (6) и тем самым Е[|Х(Л+1)ЛТЙ| f{rk>n}] = E[K/i+l I l{rk>n}] <ОО. (7) Случайная величина l{Tk>n} является «^-измеримой. Поэтому из (7) сле- дует, что Е[|^п+1| 1{тк>п} |<^] = ^{т*>п}Е[|ХЛ4-11 |«F„] < ОО (Р-П. Н.). Здесь l{Tk>n} —> 1 (Р-п. н.), k —>оо, и, значит, Е[|Хя+1||^] < оо (Р-п.н.). (8) В силу этого условия Е[Xrt+i |^] определено и осталось лишь показать, что ЕРСж\^п] =Хп (Р-п.н.). С этой целью надо установить, что $Xn+1dP = $XndP А А Для Ае&п. Согласно задаче 7 § 7 гл. II, Е[|Хя+1||<^л] <оо (Р-п. н.) то- гда и только тогда, когда мера § |Xrt+i | dP, является а-конечной. А Покажем, что мера § |Xrt| dP, А также является а-конечной. А 5*
652 ГЛ. VII. МАРТИНГАЛЫ Поскольку ХТк есть мартингал, то |ХТ* | = (|Хт*лпI Ат*>оь &п) — субмар- тингал и, значит ({г* > п} 6 $ H„|rfP= $ |Хплп|/{п>0}</Р< 4П{т*>л} An{r*>/i} < $ |^(л+1)Лт*|/{п>0)^Р= 5 PGi+l|dP. АП{т*>п} An{rk>n} Полагая k -* оо, находим $|X„|dP^$|Xn+1|dP, А А откуда и следует требуемая а-конечность меры § |Хл| dP, A G &п- А Пусть 4 е/я таково, что § |Хя+11dP <оо. Тогда по теореме Лебега о А мажорируемой сходимости можно перейти к пределу в соотношении $ XndP = $ Xn+idP, • Ап{т*>п} Ап{т*>л} справедливом в силу того, что X — локальный мартингал. Таким образом, $X„dP = $X„+tdP А А для всякого Ае^п такого, что § |X„+i I dP < оо. Отсюда уже следует, А что последнее соотношение справедливо и для любого А € &п, а значит, E(Xn+i\Pn) = Xn (Р-п.н.). Ь) => с). ПустьДХя=Хп-Х„_|,Хо = Ои Vo = O, Vn = Е[|ДХЯ| |Л-1], /г > 1. Положим w=v*> С/кг*. к./0\ " я |о, vn=oj’ Yo = 0 и Yn = £ W-, ДХЬ п > 1. Ясно, что /=1 Е[|ДУл||Л-1К1. Е[ДУЯ |Л-1] =0, и, следовательно, У = (ХЯ, Л) есть мартингал. Далее, Хо = Ио-Уо = О и Д(V Y)„ = ДХЯ. Поэтому X = V • Y. с) =4- а). Пусть X = V • У, где V — предсказуемая последовательность, У — мартингал и Vq = Уо = 0. Положим r* = inf{n>0: |Уя+1| >k}.
§1 ОПРЕДЕЛЕНИЯ МАРТИНГАЛОВ И РОДСТВЕННЫХ ПОНЯТИЙ 653 считая т* = оо, если множество { } = 0. Поскольку V^+i являются ^-из- меримыми, то для каждого k 1 величины т* являются марковскими мо- ментами. Рассмотрим последовательности ХТк = ((V • Y)nATftl{Tk>0}t ^п). На множестве {г* > 0} действует неравенство: | KiArJ k. Отсюда сле- дует, что ЕI (V - К)плт*/{п>0}| < 00 для любого и > 1 . Далее, для п 1 Е{[(У • У)(л+1)Лт> — (V” • У)пЛт* ]^{т*>0} | ^п} == = Аг*>0} ^0НИ)Лт*ЩК(л+1)Лт* “ Yn/\Tk п} = 0, поскольку (см. пример 7) Е{У(п+1)Лт* - Улдт* |^} = 0. Итак, для каждого k 1 «остановленные» последовательности Хт* яв- ляются мартингалами, r^foo (Р-п. н.), и, следовательно, X — локальный мартингал. □ 5. Пример 8. Пусть (т)п)п^\ —последовательность независимых одина- ково распределенных бернуллиевских случайных величин с Р{т/Я = 1} = р, P{T)n = -\} = q, p + q = \. Будем интерпретировать событие {^ = 1} как успех (выигрыш), а событие {^ = -1} как неуспех (проигрыш) некоего игрока в n-й партии. Предположим, что его ставка в n-й партии есть Vn. Тогда суммарный выигрыш игрока за п партий равен п Хп = 22 = Х«-' + *0 = °- /=1 Вполне естественно, что величина ставки Vn в n-й партии может зависеть от результатов предшествующих партий, т. е. от Vj,..., Vn_ i и щ., qn-1 • Иначе говоря, если положить в^’о = {0, П} и ^n = a{rj\, ..., т?л}, то Vn бу- дет «Я:-1-измеримой случайной величиной, т. е. последовательность V = = (Vn, определяющая «стратегию» игрока, является предсказуе- мой. Полагая Yn = т]\ +... 4- т)п, находим, что п Хя = 22 Vi^Yi, 1=1 т. е. последовательность Х = (Хп, &п) с Хо = О есть преобразование Y с помощью V. С точки зрения игрока, рассматриваемая игра является справедливой (благоприятной или неблагоприятной), если на каждом шаге величина ожидаемого выигрыша E(Xn+i — ^л|«^л) = 0 (>0 или ^0). Поэтому ясно, что игра справедлива, если р = q = 1/2, благоприятна, если p>q, неблагоприятна, если p<q.
654 ГЛ. VII. МАРТИНГАЛЫ Поскольку последовательность X = (Хп. &п) образует мартингал, если р = q = 1/2, субмартингал, если p>q. супермартингал, если p<q, то можно сказать, что предположение о справедливости (благоприятности или неблагоприятности) игры соответствует предположению о мартингаль- ности (субмартингальности или супермартингальности) последовательно- сти X. Рассмотрим сейчас специальный класс «стратегий» V = (Vn. с V| = 1 и И,= Р""' ....Л>|. (9) 10, в остальных случаях, смысл которых сводится к тому, что игрок, начиная со ставки Vi = l, каждый раз увеличивает ставку вдвое при проигрыше и прекращает игру вовсе после первого выигрыша. Если т/I = -1, ....qn = -\. то суммарные потери игрока за п партий будут ра^ны 2‘~1=2п- 1. /=1 Поэтому, если к тому же = 1, то Хп+1 = Хп + Vn+\ = -(2rt - 1) + 2" = 1. j Обозначим r = inf{n> 1: Xrt= 1}. Если /? = г/= 1/2, т. е. рассматри- ваемая игра является справедливой, то Р{т = п} = (1/2)", Р{т<оо}=1, 1 Р{ХГ = 1}= 1 и ЕХГ = 1. Таким образом, даже в справедливой игре, при- держиваясь «стратегии» (9), игрок за конечное (с вероятностью единица) время может вполне успешно закончить игру, добавив к своему капиталу еще одну единицу (EXr = 1 > Хо = 0). В игровой практике описанная система игры, заключающаяся в удво- ении ставки при проигрыше и прекращении игры при первом выигрыше, ; называется мартингалом. Именно отсюда ведет свое происхождение ма- тематическое понятие «мартингал». Замечание. В случае р = q = 1/2 последовательность X = (Хп. ^п)п^о с Хо = О является мартингалом и, значит, для любого п 1 ЕХл = ЕХо = О. I Можно поэтому ожидать, что это соотношение сохранится, если вместо ; моментов п рассматривать случайные моменты т. Как станет ясно из даль- i нейшего (теорема 1 в § 2), в «типичных» ситуациях ЕХГ = ЕХо- Нарушение |
§ 1. ОПРЕДЕЛЕНИЯ МАРТИНГАЛОВ И РОДСТВЕННЫХ ПОНЯТИЙ 655 же этого равенства (как в рассмотренной выше игре) происходит в тех, так сказать, физически нереализуемых ситуациях, когда или т, или |ХЛ| прини- мают слишком большие значения. (Заметим, что рассмотренная выше игра физически нереализуема, поскольку она предполагает неограниченность времени игры и неограниченность начального капитала игрока.) 6. Определение 6. Стохастическая последовательность £ = (£л, ^п)п^о называется мартингал-разностью, если Е|£л| < оо для всех /г > 0 и E(UiW = 0 (Р-п.н.). (10) Из определений 1 и 6 ясна связь между мартингалами и мартингал- разностями. А именно, если X = (Хп, &п) — мартингал, то £ = (£л, &п) с ^0 = Х0 и £л = ДХЛ, п h является мартингал-разностью. В свою очередь, если £=(6i, &п) есть мартингал-разность, то X = (Хп, &п) с Хп =£о 4- ... 4- 4-£л является мартингалом. В соответствии с этой терминологией всякая последовательность £ = (£п)п^о независимых интегрируемых случайных величин образует мар- тингал-разность (с c^rt=a{^o> •••» Ы), если Е£л = 0, п^О. 7. Следующая теорема проясняет структуру субмартингалов (супер- мартингалов). Теорема 2 (Дуб). Пусть X = (ХЛ, &п) — субмартингал. Тогда най- дутся мартингал т = (тп, &п) и предсказуемая возрастающая пос- ледовательность А — (Ап, <^-1) такие, что для каждого п^О имеет место разложение Дуба\ Хп = тп+Ап (Р-п.н.). (11) Разложение подобного типа является единственным. Доказательство. Положим то = Хо, Ао = О и п-1 тп = /по + £ [Х/+1 - Е(Х/+11 ^)], (12) /=о п—1 Лп = 22[Е(Хж|^)-Х/]. (13) /=0 Очевидно, что так определенные т и А обладают требуемыми свойствами. Далее, пусть также Хп = т'п 4- А'п, где т' = (т'п, ^п) — мартингал, а А' = =*(Ал, ^-i) — предсказуемая возрастающая последовательность. Тогда а;+1 - А' = (Ап+1 - Ал) 4- (тл+1 - тп) - (m'+! - т'п), и» беря от обеих частей условные математические ожидания, получаем, Что (Р-п. н.) А'+1 - А'=Ал+1 -Ал. Но Ао = Ао = О, и, значит, Ал = А' и тп (Р-п. н.) для всех л > 0. □
656 ГЛ. VII. МАРТИНГАЛЫ Из разложения (11) вытекает, что последовательность А = (ЛЯ, ^-i) компенсирует X = (Xrt, &п) до мартингала. Это замечание оправдывает такое Определение 7. Предсказуемая возрастающая последовательность А = (Ап, с^л-i), входящая в разложение Дуба (11), называется компенса- тором (субмартингала X), Разложение Дуба играет ключевую роль при исследовании квадратич- но интегрируемых мартингалов M = (Mnt т. е. мартингалов, для которых ЕМ2п < оо, /г > 0, что основано на том замечании, что стохасти- ческая последовательность М2 = (М2, <^п) является субмартингалом. Со- гласно теореме 2, найдутся такие мартингал т = (тп, &п) и предсказуемая возрастающая последовательность {М) = ^-1), что М2п = та + {М)п. (14) Последовательность (М) называется квадратической характери- стикой мартингала М и во многом определяет его структуру и свойства. Из (13) следует, что \ п <Л1)я = 52Е[(ДЛ1/)2|^_1] (15) /=1 и для всех I k E[(A1A-Alz)2|^] = E[Al2-Af2|^] = E[(Af)A-(M)/|^/]. (16) В частности, если Л)о = О (Р-п. н.), то ЕМ* = Е(Ж (17) Полезно заметить, что если Л4о = 0 и Л4л = f i +... + £л, где (£л) — пос- ледовательность независимых случайных величин с Е& = 0 и Е£р < оо, то квадратическая характеристика (Л))л = ЕЛ42 = D$i +... + D£„ (18) является неслучайной и совпадает с дисперсией. Если X = (Хп, &п) и У = (Ул, &п) — квадратично интегрируемые мар- тингалы, то положим (X, Y)n = ±[{X + Y)n-{X-Y)n]. (19) Нетрудно проверить, что (XnYn-(X, Y)n, &п) есть мартингал и, значит, для l^k Е[(Хй-Х/)(Уа-У/)|Л] = Е[(Х, Y)k-{X, Y)i\^i\. (20)
§ 1, ОПРЕДЕЛЕНИЯ МАРТИНГАЛОВ И РОДСТВЕННЫХ ПОНЯТИЙ 657 в случае, когда Xn=£iYn =ъ + ... + т)п, где (£„) и (??„) — последовательности независимых случайных величин с Е£, = Е ту, = 0 и Eefcoo. Ы < оо, величина (X, Y)n равна п {X, nn = £cov(£/>J7,)- /=1 Последовательность (X, У) = ((Х, Y)n, ^-i) часто называют взаим- ной характеристикой (квадратично интегрируемых) мартингалов X и К. Нетрудно показать, что (ср. с (15)) п {X, У>я = ^Е[ДХ,ДУ/|^_1]. /=1 В теории мартингалов важную роль играют также квадратическая ковариация п [X, У]п = £ ДХ, ДУ, /=1 и квадратическая вариация п [Х]„ = £ (ДХ,)2, 1=1 определяемые для любых случайных последовательностей Х = (ХЛ)Л>1 и Y = (Yn)n>i. 8. В связи с теоремой 1 естественно возникает вопрос о том, когда локальный мартингал (а значит, обобщенный мартингал или мартингальное преобразование) является на самом деле мартингалом. Теорема 3. 1) Пусть стохастическая последовательность X — = ^п)л^о является локальным мартингалом (с Хо = О или, более обще, сЕ|Х0|<оо). Если ЕХ“ < оо, и > 0, или ЕХ+ < оо, п > 0, то последовательность % ^(Хп, ^п)п^о будет мартингалом. 2) Пусть X = (Хп, &n)^n^N — локальный мартингал, N < оо и либо < оо, либо EXyJ" < оо. Тогда X = (Хп, #n)Q^n^N есть мартингал. Доказательство. 1) Покажем, что любое из условий «ЕХ^соо, п^0» и «ЕХ+ < оо, п>0» влечет за собой условие «Е|Хл|<оо, п>0».
658 ГЛ. VII. МАРТИНГАЛЫ В самом деле, пусть, например, EXrt < оо для всех и > 0. Тогда по лемме Фату ЕХ* — Е lirn Xn^Tk lim EXrtATfc == Нш[ЕХлдТл 4- ЕХлЛгл] = k k k = EXo+!im ЕХ„-ЛП < |EX0| + EXA" < oo. k k=Q Следовательно, E|Xrt| < оо, и > 0. Для доказательства свойства мартингальности (E(Xrt+i |&п) =Хп,п^0) заметим, что для всякого марковского момента т* п 4-1 |Х(л+1>лп1<Е М’ /=0 где Е £ |Х, |<00. /=0 Поэтому по теореме Лебега о мажорируемой сходимости в резуль- тате предельного перехода (й—*оо, т^Тоо (Р-п.н.)) в соотношении Е(Х(Л+1)лт*|^)=^лтЛ получаем, что Е(Хл+1 \&п) = Хп (Р-п.н.). 2) Предположим, например, что ЕХ^ < оо. Покажем, что тогда ЕХ“ < <оо для всех n<N. Действительно, поскольку локальный мартингал является обобщенным мартингалом, тоХл = Е(Хл+1 |<^я), где E(|Xrt+i11#п)<оо (Р-п.н.). Тогда по неравенству Йенсена для условных математических ожиданий (см. задачу 5 в § 7 гл. II) Х~ E(Xrt"+I |Л)- Поэтому EX” EXrt“+1 ЕХ^ < оо. Тем самым требуемое свойство мартингальности локального мартинга- ла X = (Хп. ^n)o^n^N следует из утверждения 1). □ 9. Задачи. 1. Показать эквивалентность условий (2) и (3). 2. Пусть а и г —марковские моменты. Показать, что т + а, rVa, тЛа также являются марковскими моментами, и если т, то С &т. 3. Показать, что т и Хт являются ^.-измеримыми. 4. Пусть Y = (Yn, &п) — мартингал (субмартингал), V = (Vn. <^«-i) “ предсказуемая последовательность и (V • Y)n — интегрируемые случайные величины, п>0. Показать, что тогда V • Y есть мартингал (субмартингал). 5. Пусть #1 2 % 2 • • • — невозрастающее семейство а-алгебр и £ — интегрируемая случайная величина. Показать, что последовательность (Хя)п^1 с Хп = Е(£|%) образует обращенный мартингал, т. е. Е(Хл|Хя+1,Хя+2, ...) = Хл+1 (Р-п.н.) для любого п 1.
§2. СОХРАНЕНИЕ СВОЙСТВА МАРТИНГАЛЬНОСТИ 659 6. Пусть ^2» ••• — независимые случайные величины, Р{^=0} = 1 п = Р{6=2}=5 иХ„ = П £/. Показать, что не существует таких интегри- 2 /=1 руемой случайной величины £ и неубывающего семейства а-алгебр (<^я), чт0 Хп = Е(^\^п). (Этот пример показывает, что не каждый мартингал (Хл)я>1 представим в виде (E(f l^))^; ср. с примером 3 § 11 гл. I.) 7. (а) Пусть £i, ••• — независимые случайные величины с Е|£л| <оо, Efrt = 0, и > 1. Показать, что для каждого k 1 последовательность = Е n>k, образует мартингал. (Ь) Пусть £1, ••• — интегрируемые случайные величины такие, что e(Ui I Ci. • • •. е«)=е, + ;+<п (=хп). Доказать, что последовательность ••• образует мартингал. 8. Привести пример мартингала X = (ХЛ, для которого семей- ство {Хп, 1} не является равномерно интегрируемым. 9. Пусть X = (Xrt)rt^o —марковская цепь (§ 1 гл. VIII) со счетным мно- жеством состояний Е = {z, /, ...} и переходными вероятностями рц. Пусть ^ = ^(х), х е Е, — ограниченная функция такая, что Рч'ФИ) ^(0 Для /GE А>0 и 1еЕ. Показать, что последовательность (А“"л^(^п))п>о является супермартингалом. § 2. О сохранении свойства мартингальности при замене времени на случайный момент 1. Если X = (Хп, ^п)п^о — мартингал, то для всякого п 1 ЕХ„ = ЕХ0. (О Сохранится ли это свойство, если вместо момента п взять случайный (ска- жем, марковский) момент т? Приведенный в предыдущем параграфе при- мер 8 показывает, что, вообще говоря, это не так: существуют мартингалы X и марковские моменты т (конечные с вероятностью единица) такие, что ЕХТ/ЕХО. (2) Следующая важная теорема описывает те «типичные» ситуации, для которых, в частности, ЕХТ = ЕХо-
660 ГЛ. VII. МАРТИНГАЛЫ Теорема 1 (Дуб). Пусть X = (Хп, &п) — мартингал (субмартин- гал), т\ и Т2 — моменты остановки, для которых Е|ХГ/|<оо, z = l,2, (3) lim $ |X„|dP = 0. (4) я_>0° Тогда Е(ХТ21 <FT|) = ХТ| ({т2 > Л}; Р-п. н.). (5) Если к тому же P{ri тг} = 1, то ЕХГ2 = ЕХТ1. (6) Доказательство. Достаточно показать, что для всякого А Е $ XT2dP = $ XrxdP. (7) ЛП{т2>Т|} ЛП{т$>Г|} В свою очередь для этого достаточно установить, что для любого л > О $ XT2dP= $ XT,dP, ЛП{т2^Т1}П{Т|=:Л} ЛП{т2^Т|}П{Т|=П} или, что то же, $ X„dP = S *л<*Р, (8) ВП{Т2>Л) '^'вп{т2^л} где В=ЛП{т1 = п}еЛ1- Имеем \ X„dP= XndP+ XndP = Л„йР+ J J J /<3 J ВП{т2^п} ВП{т2=п} ВП{т2>п} ' f ВП{т2=^п} + $ E(X„+1|^„)dP= $ XTidP+ $ Xn+i dP = ВО{т2>п} ВП{т2=п} ВЛ{т2^п+1} = $ XT2dP+ Xn+2dP = ...= (<)Bn{n<7iCn+l) ВП{75>л+2) (<) = $ XT2dP+ $ XmdP. ^ВЛ{и^тг^т} ВГ\{т%>т} Отсюда $ X-^dP = $ XndP- $ xmdP ВЛ{л^т^т} ^ВП{л<т2} Вп{т<тг)
§2. СОХРАНЕНИЕ СВОЙСТВА МАРТИНГАЛЬНОСТИ 661 и в силу (4) и равенства Хт=2Х+ - |ХШ| получаем ? XT2dP= lim Г XndP- XmdP = J (>} ГП—><Х> J J вп{т2^л} |_вП{п<т2} Bn{m<rs} = \ XndP- lim \ XmdP= XndP, J m—^QQ J j fin{rt^r2} ВП{т<т2} Bn(n^} что и доказывает (8), а значит, и (5). Наконец, соотношение (6) следует из (5). □ Следствие 1. Если существует константа N такая, что P{tj ^N}~ 1, P{t2^AZ}= 1, то выполнены условия (3), (4). Поэтому, если к тому же Р{п ^Т2} = 1 и X — мартингал, то EX0 = EXT1=EXr2 = EXyv. Следствие 2. Если семейство случайных величин {Xrt} равномерно интегрируемо (в частности, если с вероятностью единица |ХП|^ С < оо, п 0), то выполнены условия (3) и (4). Действительно, P{rz >n}—>0, и—>оо, поэтому условие (4) следует из леммы 2 § 6 гл. II. Далее, поскольку семейство {Xrt} равномерно интегри- руемо, то (см. (16) § 6 гл. II) sup E|X/v| <оо. (9) N Если т — некоторый момент остановки и X — субмартингал, то, согласно следствию 1, примененному к ограниченному моменту t^—tKN, EXq^EXTn. Поэтому Е|ХТ„| = 2ЕХ+ - ЕХТ„ 2ЕХ+ - ЕХ0- (Ю) Последовательность Х+ = (Х+, &п) является субмартингалом (пример 5 из § 1) и, значит, N $ *fdP + $ X+dP< /=0 {rN=j} {t>N} N <£ S s X+dP = EX+<E|XjV|<supE|Xv|, /=0 {TN=n {r>N} N что вместе с (10) дает неравенство E|XTJ ^3 sup Е|Хл/|, N
662 ГЛ. VII. МАРТИНГАЛЫ откуда по лемме Фату Е|ХТ| ^3 sup E|X/v|. N Поэтому, выбирая т = т/, / = 1, 2, и учитывая (9), получаем, что Е|ХГ/| <оо, / = 1, 2. Замечание. В примере 8, рассмотренном в предыдущем параграфе, 5 |X„|dP = (2" —1)Р{т>я} = (2" —1)-2~"-+1, п-+оо, {г>п} и, следовательно, нарушается условие (4) (для Г2 = т). 2. Для приложений часто оказывается полезным следующее предло- жение, выводимое из теоремы 1. Теорема 2. Пусть X = (Хп) — мартингал (субмартингал) и т — момент остановки (относительно Пред- положим, что Ет<оо и для лкЦбого п^Ои некоторой константы С Е{|Х„+1 -Хп\\^}^С ({г^п}, Р-п.н.). Тогда Е|ХТ| <оо и ЕХТ = ЕХО. (Н) Доказательство. Проверим для Т2 — г выполнение условий (3) и (4) в теореме 1. Пусть Уо = |*о|, Г/ = |Х/ -X/-1I, / > 1. Тогда |Xr| f Yi и /=о (т \ т оо п 7=0 / /=0 n=0 {т=п} j=Q оо п оо оо оо -ЕЕ S мр=Е£ S мр-Е S мр- п=0 7=0 {т=п} j=0 n-J {т=п} j=Q {r^j} Множество {т > /} = П \ {т < /} е <^yLi • Поэтому для j 1 $ YiClP= $ Е[У7|Х0..............X^dP^CP^j},
§2. СОХРАНЕНИЕ СВОЙСТВА МАРТИНГАЛЬНОСТИ 663 и, значит, ЕИг|^н(^ y,Vcf;P{T>/} + E|Xo| = CET + E|Xol<oo. (12) \/=0 / /=1 Далее, если т > п, то п т £Yi^Yb j=0 j=0 и поэтому $ |X„|dP^ $ Y,YidP- {т>п} {т>п} j—Q т Отсюда, учитывая, что (согласно (12)) Е К; <оо и что {т>и}{0, и—>оо, /=о по теореме о мажорируемой сходимости получаем lim $ |X„|rfP^ lim $ £ Мр = 0- rt“>o° {т>п} п—юо {т>п} у=0 Тем самым выполнены условия теоремы 1, из которой следует требуе- мое соотношение (11). □ 3. Остановимся на некоторых применениях доказанных теорем. Теорема 3 (тождества Вальда). Пусть С1»^2> ••• — независимые одинаково распределенные случайные величины с Е|£,| <оо и г — момент остановки (относительно (#п), - с Ет <оо. Тогда Е^+... + ^E^Er. (13) Если к тому же E$f < оо, то Е{(6+... + ег)-тЕ6}2 = 06-Ет. (14) Доказательство. Ясно, что Х = (Хп, &п)п>\ с Хя = (£1 +••• + €«)- -nEfi есть мартингал с Е[|Хя+1 |ХЬ ..., XJ = E[|6h.i -ECill^i,..., &] = = E|e„+I-E6|^2E|6|<oo. Поэтому по теореме 2 ЕХГ = ЕХо = 0, что и доказывает (13). Приведем три доказательства «второго тождества Вальда» (14). Первое доказательство. Пусть = & - Е^, Srt = т/i +... + т?л. Надо показать, что ES2T = Erfi-Er.
664 ГЛ. VII. МАРТИНГАЛЫ Положим т(п) = тА/1 (=min(r, /г)). Поскольку п S2n = ^,T}? + 2 52 ’?'•’?/> /=1 l^Kj^n п то последовательность (S2 — 52 > <^п )л>1 есть мартингал с нулевым сред- /=1 НИМ. ; Из следствия 1 к теореме 1 находим, что j т(п) • ESr(n)=E 52???. /=1 По «первому тождеству Вальда» (13) т(л) е 52 • Ет(л)> ) ,=1 и, значит, Е5г(л) = Ег?1 • Ет(«)- Аналогичным образом получаем, что при т, п —* оо Е(5т(л) - 5т(т))2 = • Е(т(п) - т(т)) -> О, поскольку по предположению Ет<оо. Тем самым, последовательность {Sr(n)}n> 1 является фундаментальной (последовательностью Коши) в L2 (см. п. 5 § 10 гл. II), и, значит, по теореме 7 из § 10 гл. II найдется такая t случайная величина S, что Е(5Г(Л)-S)2—>0, п—>оо. Отсюда вытекает (задача 1 в § 11 гл. II), что ES2(n) —> ES2, п—►оо. Как было показано выше, ES2(rt) = Ет;2 * Ет(п), и, значит, полагая п оо, находим, что ES2 = Ет;2 • Ет. Осталось теперь лишь идентифицировать величину S. Для этого доста- точно заметить, что можно найти такую подпоследовательность {п'} С {л}, что с вероятностью единица одновременно имеют место сходимости 5Г(Л') —► S и т(п') —> т. Но тогда ясно, что с вероятностью единица будет иметь место и сходимость ST(n')—>ST. Следовательно, S и Sr совпадают почти наверное, и, значит, ES2 = Ет;2 • Ет, что и требовалось доказать. Второе доказательство. Из уже установленного равенства Е52(л) = = Ет;2 • Ет(и) и леммы Фату (см. а) в теореме 2 § 6 гл. II) находим, что ES2 = Е lim S2(n) lim ES2(n) = Ет;2 * Ет. Требуемое равенство ES2 = Ет;2 • Ет будет установлено, если показать, что для всякого п 1 справедливо неравенство ES2(n) Е52.
§2. СОХРАНЕНИЕ СВОЙСТВА МАРТИНГАЛЬНОСТИ 665 С этой целью заметим, что в силу «первого тождества Вальда» (13) E|ST| = Е|т?| +... + т;т| Е(|т?11 +... + |т?т|) = E|j?i | Ет < оо, и, значит, Е |S„\1(т > п) = Е|?7i +... + т]п| /(г > п) s? Е(|т?| | +... +1?7„ |) 1(т > п) г? ^Е(|т/|| +••|tyr|)/(T>n)—>0 прип—»оо. Применяя теорему 1 (к т\ =п, т? = т и субмартингалу (|Sn|, ^л)п>1). находим, что на множестве {т^п} (Р-п. н.) E(|ST||^)>|S„|. Отсюда по неравенству Йенсена (для условных математических ожи- даний; задача 5 § 7 гл. II) получаем, что на множестве {т^п} (Р-п. н.) E(S?|^)>SЕ 2=S?(n). На множестве же {т < п} E(S^ ) = S? Тем самым (Р-п. н.) E(S2T\^S2T{n} и, значит, ES? ES^rt), что и требовалось установить. Третье доказательство. Из «первого доказательства» следует, что п (S% - &п)п>\ есть мартингал и для т(п) = тАп /=1 Е$т(п) = Erf • Ет(л). Так как Ет(и) —> Ет, то надо лишь показать, что ES2(rt) —> ES^. Для этого достаточно установить, что Е sup < оо, п поскольку тогда требуемая сходимость будет следовать из теоремы Лебега о мажорируемой сходимости (теорема 3 в § 6 гл. II). Для доказательства неравенства Е sup < оо воспользуемся при- водимым далее в § 3 «максимальным неравенством» (14). Согласно этому неравенству, примененному к мартингалу (Sr^), находим, что Е Г sup S2( J 4ES2(n) < 4 sup Е52(я). J n Отсюда, пользуясь теоремой о монотонной сходимости (теорема 1 в § 6 гл. II), получаем, что Е sup S2WO sup ES2(n). k^l n
666 ГЛ. VII. МАРТИНГАЛЫ Но Е$т(П) = Ет?1 • ЕЛл) Е*71 • Ет < оо. Тем самым Е sup $2(п) 4Е»7? • Ет < оо, п что и требовалось установить. □ Следствие. Пусть ••• — независимые одинаково распреде- ленные случайные величины с Р{& = 1} = Р{£(=-1} = 1/2, Srt = Ci 4-... ... +&i и T = inf{n> 1: Sn = 1}. Тогда Р{т<оо}= 1 (см., например, (20) § 9 гл. I) и, значит, P{Sr = 1}= 1, E5r = 1. Отсюда и из (13) вытекает, что Ет = оо. Теорема 4 (фундаментальное тождество Вальда). Пусть £2, ... — последовательность независимых одинаково распределен- ных случайных величин, Sn =£1 + ...+£„, 1. Пусть <p(t) = Ее*^, teR, причем для некоторого /о 00 <p(to) существует и <p(to) 1. Если г — момент остановки (относительно = а{£1, ..., £л}, 1), такой, что т> 1, |5Я| С ({т^п}', Р-п.н.) и Ет<оо, то Доказательство. Положим yn=ez«s-(¥>(;0))-n. Тогда Y = (Yn, есть мартингал с ЕУ„ = 1 и на множестве {т>п} Е{|Уя+1 - УЯ||УЬ .... у„} = У„е{ £—у - 1 |£ь .... £„} = II Wo) I > = УяЕ|е^'(<рао))-'-1|^В<оо, где В — некоторая константа. Поэтому применима теорема 2, из которой следует (15), поскольку EFj = 1. □ Пример 1. Этот пример служит иллюстрацией применения вышеизло- женных результатов к задачам нахождения вероятностей разорения и средней продолжительности игры (см. § 9 в гл. I). Пусть $1,^2, ... — последовательность независимых бернуллиевских случайных величин с Р{£/ = 1} = р, Р{£/ = -1} = ^, р + q = 1, Sn =£1 4- ... ... +6г И T = inf{n^ 1: Sn = B или Л}, (16) где (—Л) и В — положительные целые числа.
§2. СОХРАНЕНИЕ СВОЙСТВА МАРТИНГАЛЬНОСТИ 667 Из (20) § 9 главы I следует, что Р{т<оо} = 1 и Ет<оо. Тогда, если a = P{ST =Д}, /3 = P{ST = В}, то q 4-/3 = 1, и при р = q= 1/2 из (13) видим, что 0 = ESr = аД+/ЗВ, откуда а=-^- в=-^~ в + ИГ р в + нг Применяя (14), получаем Er = ES2 = aA2 + 0B2 = \AB\. Если же p^q, то, рассматривая мартингал ((<7/p)s")n>i, находим, что и, значит, Вместе с равенством а 4- /3 = 1 это дает о_ (*)'-(*/' (jr-(l)4' Наконец, учитывая, что ESr = (р - <?)Ет, находим Г- ESr OtA+flB Ет =-----=-------, p-q p-q где а и /3 определяются из (17). (17) Пример 2. Пусть в рассмотренном выше примере p = q = 1/2. Пока- жем, что для всякого 0 < А < в + |Л| и момента т, определенного в (16), cos(A^-y^) E(cosA)-= V 2 7 (18) cos(A-^-) С этой целью рассмотрим мартингал X = (Xrt, )rt^o с X„ = (cos A)"" cos(a(s„- (19) и So = 0. Ясно, что EX„ = EX0 = cos(A^). (20)
668 ГЛ. VII. МАРТИНГАЛЫ Покажем, что семейство {Л^дт} является равномерно интегрируемым. Для этого заметим, что в силу следствия 1 к теореме 1 при 0 < Л < 7Г ЕХо = ЕХ„Лт = E(cos А)"(ллг) ^)) cos(A(S„At- >E(cos А)~(пЛт) Поэтому из (20) E(cos А)-(йЛт) В + Я\ cos (А —2~ ) и, значит, по лемме Фату C0S(A~F~) E(cosA) z в + |Я|ч ’ c°s(A^_i) Следовательно, согласно (19), (21) K/iat|^(cos А) т, что вместе с (21) доказывает равномерную интегрируемость семейства Цплт}- Тогда в силу следствия 2 к теореме 1 соз^А^ + Л) =ЕХо = ЕЛт = E(cos A)”r cos^A^ 2 ^), откуда следует требуемое равенство (18). 4. В качестве одного из применений тождества Вальда (13) приведем доказательство так называемой элементарной теоремы теории восста- оо новления: если N = (Nt)t^o — процесс восстановления (Nt = l(Tn t), П=1 Тп=а\ + ... + ап, где <ть аг, ••• — последовательность независимых оди- наково распределенных положительных случайных величин; см. п. 4 § 9 гл. II), р = Есг1 < оо, то функция восстановления m(t) = ENt обладает тем свойством, что (22) t р (Напомним, что для самого процесса Nt = (М)/^о справедлив усиленный закон больших чисел: —* - (Р-п. н.), t —* оо; t р см. пример 4 § 3 гл. IV.)
§2. СОХРАНЕНИЕ СВОЙСТВА МАРТИНГАЛЬНОСТИ 669 Для доказательства (22) достаточно показать, что lim t—>оо m(/) 1 / " р. р— m(t) 1 lim — (23) С этой целью заметим, что 7/^ < Тд^+ь />0. Поскольку для всякого п 1 (24) где &п есть а-алгебра, порожденная величинами сг\,..., сгп, то (при каждом фиксированном t >0) момент Nt + 1 (но не момент Nt) является марков- ским. Тогда из тождества Вальда (13) вытекает, что Е^/+1=д[т(0 + 1], (25) и, значит, из правого неравенства в (24) находим, что t < p[m(t) + 1], т. е. > 1 _ 1 (26) t д t откуда, полагая t —»оо, получаем первое неравенство в (23). Далее, из левого неравенства в (24) следует, что / > Е7/уг Поскольку 7^+1 = TNt +aNt+\, то t ETNi = E(TNl+i - aNl+i) = p,[m(t) + 1] - Ect^+i. (27) Если считать, что величины cr(- все ограничены сверху (<т/ с), то из (27) получим, что t p[m(t) + 1] — с, и, значит, < 1 + 1. (28) t р, t д Тогда отсюда будет следовать второе неравенство в (23). Чтобы снять ограничение 07 i > 1, введем, беря некоторое с >0, ве- личины erf <c) + cl(at >с) и свяжем с ними процесс восстановления Nc = W )/>0 С Nct = 2 l(T‘ ^t),TX=acl+...+<rcn. Поскольку af /1=1 то /Vf > Nt и, значит, mc(t) = ENf ENt = m(t). Тогда из (28) видим, что m(t) mc(t) 11 с-рс t "" t рс + t' рс ’ где рс = Еас1.
670 ГЛ. VII. МАРТИНГАЛЫ Следовательно, Полагая теперь с —> оо и учитывая, что —► д, получаем требуемое второе неравенство в (23). Итак, утверждение (22) установлено. Замечание. По поводу более общих результатов теории восстановле- ния см., например, [7, гл. 9], [69, т. 1, гл. XIII]. 5. Задачи. 1. Показать, что в случае субмартингалов теорема 1 остается справед- ливой, если условие (4) заменить условием lim 4+rfP = 0- П~*°° {Т2>П} 2. Пусть X = (Хл, ~ квадратично интегрируемый мартингал, т — момент остановки, ЕХо = 0, к lim § X2rfP=0. 1 /1-00 {т>п} Показать, что тогда ЕХ2 = Е(Х)Т ( = Е £ (ДХ,)2), \ /=о / где ДХ0 = Хо, ДХ, = X/ - Х/_ t, / > 1. 3. Показать, что для каждого мартингала или неотрицательного суб- мартингала X — (Х„, <^п)л>о и момента остановки т Е|ХТ|< lim Е|Х„|. /1—00 4. Пусть X = (Хл, ^rt)rt>o супермартингал такой, что Хп E(f | &п) (Р-п. н.), и > 0, где Е|£| < оо. Показать, что если п и — моменты оста- новки С Р{Т1 ^Т2}= 1, то ХТ1^Е(ХГ2|^Г1) (Р-п.н.). 5. Пусть fi, $2» ••• — последовательность независимых случайных ве- личин с Р{f/ = 1} = P{f/ = —1}=1/2, а и b — положительные числа, Ь>а, Хя = а £/(& =+!)-&£/(& = -!) k=\ k=\ и т = inf{n > 1: Хп -г}, г > 0.
§3. ОСНОВНЫЕ НЕРАВЕНСТВА 671 Показать, что ЕеЛг < оо при А ао и ЕеЛт = оо при А > ао, где b . 2Ь , а . 2а ао =----г In ---г Ч----г In ---- a + b а + b а + b а + Ь 6. Пусть fi, ••• — последовательность независимых случайных ве- личин с Е&=0, D$=a?, 5Я=£1= ...,£rt}. Доказать справедливость следующих утверждений, обобщающих тождества Вальда (13) и (14): если Е ^2 Е|£7|<оо, то Е5т=0;еслиЕ 52 Е£?<оо, то /=1 /=1 ES? = E£e? = E£4 (29) /=1 /=1 7. Пусть X = (Хп. — квадратично интегрируемый мартингал и т — момент остановки. Показать, что тогда ехтЧе £(дх,)2. /1=1 Показать, что если lim Е(Х„1(т> п)) <оо или Пт Е(|А’л|/(т>и)) = 0, П—>ОО П-+ОО то Е(ДХТ)2 = Е f X2. /1=1 8. Пусть X = (Хп, &п)п^\ есть субмартингал и ri ^Т2^ ... — моменты остановки такие, что ЕХТт определены и lim Е(Х+/(тш>/г))==0, т>1. п—+ОО Доказать, что последовательность (ХТт, является субмартинга- лом. (Как обычно, &Тт = {4 е : А П {тт = /} е «F/, / > 1}.) § 3. Основные неравенства 1. Пусть X = (Хп, ^п)п^о — стохастическая последовательность, Х*= max |Ху|, ||Хя||р = (Е|ХяГ)'/Д, р>0. 0^/^п В нижеследующих теоремах 1—3 приводятся основные «максимальные неравенства для вероятностей» и «максимальные неравенства в Lp» Для субмартингалов, супермартингалов и мартингалов, принадлежащие Дж. Дубу.
672 ГЛ. VII. МАРТИНГАЛЫ Теорема 1. I. Пусть X = (Хп, #п)п^о — субмартингал. Тогда для любого Л > О ЛР(тах Xk> Л| Е к+/ (max Xk > л)] Е/+, (1) I k^n ) L X k^n / J AP/min Xk -л) < E [л„/(min Xk > -a)1 - EX0 < E%+ - EA0, (2) J L Xfc^n /J AP/max |X*| a| ^3 max E|X*|. (3) I k^n J k^n II. Пусть Y = (Yn, ^n)n^o — супермартингал. Тогда для любого А>0 АР/тах У* > а} ЕУо-Е[уя/(тах У^А^ЕУо + ЕУ", (4) I k^.n ) L Xfc^n /J AP(min Yk < -А) -Е [уя/(тт У^-а)1 <ЕУЯ", (5) ) L х/г^п /J АР/тах |У*| > а| ^3 max Е|У*|. (6) Ik^n J k^n III. П^сть Y = (Yn, ^n)n^Q — неотрицательный супермартингал. Тогда для любого А > О АР{тах У^А^ЕУо, I k^n J АР J sup У*>АЫЕУя. (7) (8) Теорема 2. Пусть X = (Хп, &п)п^о — неотрицательный субмар- тингал. Тогда для р 1 справедливы следующие неравенства: если р>1, то ря||д <ЦХя*||р< ^гг РМ,; если р = 1, то ii^iii < та ^^-f{i+iixnin+x„ii1}. (Ю) Теорема 3. Пусть Х = (Хп, <^я)я^о — мартингал, А > 0 u р > 1. Тогда и в случае р > 1 Р{тах |Ха|>а}^ Ik^n J ЛГ та ^та- йп (12)
§3. ОСНОВНЫЕ НЕРАВЕНСТВА 673 В частности, при р = 2 p{max|Xt|>AU^§£ (13) Ik^n ) л* Е Гитах Xfl ОЕ/2. (14) L k^n J Доказательство теоремы 1. Поскольку субмартингал с обратным знаком есть супермартингал, то неравенства (1)—(3) следуют из (4)—(6). Так что будем рассматривать случай супермартингала Y = (Yn, Положим r = inf{^C^« Y^X} с т = л, если max Yk<X. Тогда в силу свойства (6) § 2 ЕУ0^ЕУт = е[уг; max У*>а1 +е|уг; max Yk<x] L k^n J L k^n J >AP(max У*> Aj + E[yrt; max У*<а1, I k^n J L k^n J что и доказывает (4). Положим теперь а = inf{fe п: У^-А}, считая ст=п, если min У*> - А. k^n Тогда снова в силу свойства (6) § 2 ЕУ„ ЕУТ = Е [ут; min Yk < -а] + Е [ут; min У* > -aR I k^n J L k^n J <— APfmin У^^-а1 + е[уя; min У* > — a]. I k^.n ) L k^n J Отсюда АР/min Yk — a} С — е|"ул; min Yk —a] ЕУ”, I k^n ) L k^n J что и доказывает (5). Чтобы доказать неравенство (6), заметим, что У“ = (—У)+— субмар- тингал, и тогда в силу (4) и (1) АР(max |У*| а) APf max Yf а| 4-АР (max УГ а} = 1 1 J Ik^n * J Ife^n J = AP/max Yk a) + AP/max УГ > a) ЕУо + 2ЕУ“ ^3 max Е|У*|. I k^n J I k^n ) k^n Неравенство (7) следует из (4). Для доказательства (8) положим 7 = inf{& > п: У^ > А}, считая 7 = оо, если Yk < А при всех k п. Пусть также n<N <00. Тогда в силу (6) § 2 Е Yn Е Y^n Е [ y7A/v/(7 Ml АР{7 М,
674 ГЛ. VII. МАРТИНГАЛЫ откуда при /V —► оо ЕУП> АР{7<оо} = AP{sup Yk Л|. □ Доказательство теоремы 2. Первые неравенства в (9) и (10) оче- видны. Для доказательства второго неравенства в (9) предположим сначала, что Юр <оо, (15) и воспользуемся тем фактом, что для любой неотрицательной случайной величины ( и г > О е<г=г $ tr-x р{е >t}dt. о Тогда из (1) и теоремы Фубини получаем, что для р > 1 Е(Хя*)р = л tp~xP{X*>t}dt^p tp~2( 5 Xndp\dt = 'о о \{X^t} J rx; 1 оо = p 5 tp~2 ^Xnl{X*^t}dP dt = p\ Xn § tp~2 dt dP = n L 0 = ^E[X„(X„T-1]. о Ln Отсюда по неравенству Гёльдера (16) (17) (18) p Если выполнено (15), то из (18) сразу получаем второе неравенство в (9). Если же условие (15) не выполнено, то следует поступить таким об- разом. Рассмотрим в (17) вместо X* величину (X* А А), где L — некоторая константа. Тогда получим E(X„* bL)p^qE\Xn(X*bL)p~'] ^?||Х„||Р [E(X* A L)/>]1//<?, откуда в силу неравенства Е(Х* A L)p ^Lp < оо следует, что Е(х;а£)^?'ех'=?'||хя||' и, значит, Е(Х„Т= lim E(X„*AL)₽^||Xn||'. L-*oo
§3. ОСНОВНЫЕ НЕРАВЕНСТВА 675 Докажем теперь второе неравенство в (10). Снова применяя (1), находим, что оо ЕХЙ* - 1 < Е(Х* - 1)+ = $ Р{Х„* - 1 > t}dt < о tit dt = EXn J -fa = ЕХ„ In X*. Поскольку для любых а 0 и b > 0 a In b ln+ а + Ье~\ (19) то EX* - 1 < ЕХп In X* ЕХп 1п+ Хп + е~хЕХ*. Если ЕХ* < оо, то отсюда сразу получаем второе неравенство в (10). Если же ЕХ* = оо, то следует поступить, как и выше, перейдя от вели- чин X* к X* Л L. □ Доказательство теоремы 3 следует из того замечания, что |Х|Р, р > 1, является неотрицательным субмартингалом (если Е |ХЛ |р < оо, п 0), и из неравенств (1) и (9). Следствие к теореме 3. Пусть Хп = £о + • • • + п 0, где (&)л>о — последовательность независимых случайных величин с Е& = 0 и Е£|<оо. Тогда неравенство (13) превращается в неравенство Кол- могорова (§ 2 гл. IV). 2. Пусть X = (Хл, ^п) — неотрицательный субмартингал и Хп = Мп + Ап — его разложение Дуба. Тогда, поскольку ЕМп = 0, то из (1) следует, что Нижеследующая теорема 4 показывает, что это неравенство справедли- во не только для субмартингалов, но и для более широкого класса после- довательностей, обладающих свойством доминируемости в следующем смысле. Определение. Пусть X = (Хл, &п) — некоторая неотрицательная сто- хастическая последовательность и А = (Дл, <^я-1) — возрастающая пред- сказуемая последовательность. Будем говорить, что X доминируется по- следовательностью Д, если ЕХТ ЕДГ (20) Для всякого момента остановки г.
676 ГЛ. VII. МАРТИНГАЛЫ Теорема 4. Если Х = (Хп, &п) — неотрицательная стохастическая последовательность, доминируемая возрастающей предсказуемой последовательностью А = (Ап, &n-\Y то для А>0, а>0 и любого момента остановки т Р{ХГ*>АК^, (21) Р{Х;>Ак|ЕИтЛа) + Р{4г>а}, (22) /9 — п\ х1р ||хт*М(^) Ш1р. 0<р<1. (23) Доказательство. Положим ап = min{/‘ г Л п: Л, > А}, считая ап=т/\п, если {•} = 0. Тогда ЕА^ЕА,^ ЕХ,,> $ Хст„</Р^АР{Хт*Лг1>А}, {х;Лл>л} откуда рц;ля>ак±елт, Л и в силу леммы Фату получаем неравенство (21). Для доказательства (22) введем момент 7 = inf{/: Ai+i >а}, полагая 7 = оо, если {•} = 0. Тогда Р{ХТ* > А} = Р{%; > А, Ат < а} + Р{%; > А, Ат > а} Р{1{Ат<а}К > А} + РИг > а} Р{ХТ*Л7 > А} + Р{4Г > а} < | ЕЛтЛ7 + Р{ДТ > а} | Е(ЛТ Л а) + Р{ДТ > а}, Л Л где использовано неравенство (21) и то, что 1{дт<а}Х* ^Х*Лу. Наконец, неравенство (23) следует (с учетом (22)) из следующей цепочки соотноше- ний: l|x;il£ = E(x;)₽ = <§ P{(x;yp^t}dt = ^ P{x^tl/p}dt^ О о t~l/pE[AT/\tl/p]dt + P{Ap>t}dt = о о = Е $ dt + E о л; О° Q _ \(ATt~x/p)dt + EAp = {-?-EApT. □
§3. ОСНОВНЫЕ НЕРАВЕНСТВА 677 Замечание. Предположим, что выполнены условия теоремы 4 за ис- ключением того, что последовательность А = (ДП, #п)п^о является не обя- зательно предсказуемой, но такой, что для некоторой константы с > О P/sup |ДЛ*| = 1, J где kAk^Ak-Ak-\. Тогда (ср. с (22)) справедливо следующее неравен- ство: Р{%; > Л} | Е [Лт Л (а + с)] + Р{ЛТ > а}. (24) А Доказательство проводится по аналогии с доказательством неравен- ства (22). Надо лишь вместо моментов 7 = inf{/: Д/+1 >а} рассматривать моменты 7 = inf{/: А} а} и принять во внимание, что Д7 а + с. Следствие. Пусть Xk = (X*, uAk = (А„, л >0, £> 1, удовле- творяют условиям теоремы 4 или замечания к ней. Пусть также (rk)^\ — последовательность моментов остановки (относительно = (&п )) « °- Тогда °- 3. В этом пункте будет приведен (без доказательства, но с примене- ниями) ряд замечательных неравенств для мартингалов, возникающих как обобщения нижеследующих неравенств Хинчина и неравенств Мар- цинкевича и Зигмунда для сумм независимых случайных величин. Неравенства Хинчина. Пусть £i, £2, ••• — независимые одинако- во распределенные бернуллиевские случайные величины с Р{& = 1} = = Р{£ = —1}= 1/2 и (сп)п^\ — некоторая последовательность чисел. Тогда для любого 0 < р < оо существуют такие универсальные константы Ар и Вр (не зависящие от (сп)), что для любого п 1 (л \ 1/2 Zс/) /=1 / п /=1 (25) Неравенства Марцинкевича и Зигмунда. Если Сь ^2» • •• — после- довательность независимых интегрируемых случайных величин с Е& =0, то для р 1 найдутся такие универсальные константы Ар и Вр (не зависящие от (frt)), что для любого п 1 п В неравенствах (25) и (26) последовательности X = (Хп) с Хя = 22 cj£j п и Хп = образуют мартингалы. Естественно задаться вопросом о том, /=1
678 ГЛ. VII. МАРТИНГАЛЫ нельзя ли обобщить эти неравенства на случай произвольных мартинга- лов. Первый результат в этом направлении был получен Буркхольдером. Неравенства Буркхольдера. Если X = (Хп, &п) — мартингал, то для всякого р > 1 существуют такие универсальные константы Ар и Вр (не зависящие от X), что для любого п 1 Ар || V» Р«||, МИЗД. (27) где [Х]л — квадратическая вариация Хп, [%]„ = £ (ДХ,)2. Хо = О. (28) /=| В качестве констант Ар и Вр можно взять Ар = [18р3/7(р - I)]'1, Вр = 18р3/2/(р - I)'/2. С учетом (12) из (27) следует, что . лр||а/й];||^||х„*||р<в;||а/й;||р. (29) где ' Ар = [18р3/2/(р - I)]"1, В*р = 18р5/2/(Р - 1)3/2- Неравенства Буркхольдера (27) справедливы для р>1, в то время как неравенства Марцинкевича—Зигмунда (26) верны и для р = 1. Что можно сказать о справедливости неравенств (27) для р = 1? Оказывается, их прямое обобщение на случай р = 1 уже несправедливо, что показывает следующий Пример. Пусть ... — независимые бернуллиевские случайные величины с Р{& = 1} = Р{£ =-1}= 1/2 и пАт ^л=52 /=1 ( п 1 где r = inH 1: I /= 1 ) Последовательность X = (Хп, &п) является мартингалом с ||Xn||i =Е|Х„| = 2ЕХ+—>2, п-^оо. Но (тАп \ 1/2 521 =Еа/7л^->оо. /=1 / Следовательно, первое неравенство в (27) несправедливо.
§3. ОСНОВНЫЕ НЕРАВЕНСТВА 679 n в**/»2- /=1 Оказалось, что на случай р=1 обобщаются не неравенства (27), а неравенства (29) (эквивалентные (27), если р > 1). Неравенства Дэвиса. Если X = (Xrt, &п) — мартингал, то суще- ствуют такие универсальные константы А и В,0<А<В < оо, что Д|1х/йЬ111 (зо) т. е. Следствие 1. Пусть £i, £2, ... — независимые одинаково распреде- ленные случайные величины, Srt = fi 4-... + £л. Если E|£j<oo и Efi =0, то, согласно тождеству Вальда (13) § 2, для всякого момента оста- новки г (относительно (^)) с Ет < оо справедливо равенство ESr = 0. (31) Если дополнительно предположить, что E|£i|r <оо, где 1 <г^2, то для справедливости равенства EST = 0 достаточно условия Е.тх/Г < оо. Для доказательства обозначим тл = тДп, K = sup |SrJ, и пусть для п />0 т = [/г] — целая часть числа /г. В силу следствия 1 к теореме 1 § 2 ESTrt=0. Поэтому для справедливости соотношения EST = 0 доста- точно (согласно теореме о мажорируемой сходимости) проверить, что Е sup |ST/I | < оо. п Пользуясь неравенствами (1) и (27), находим Р{У>/} = Р{т>Г, Y^t} + P{r<tr, Y^t}^ ^Р{т>П + Р{ max |ST/|^/}^P{T>n + rrE|STJ^ (Tn \ Г/% Tm /=1 / /=1 Заметим, что (^ = {0, П}) E E ie,r=E 52 /(/<Tm)ie/r=52 EEvu = /=1 /=1 /=1 = E £ /(/•^тт)ЕПегП^1] = Е X ЕИУГ = ^Етт /=1 /=1
680 ГЛ. VII. МАРТИНГАЛЫ где = Е |fi |г. Поэтому {T<t'} и, значит, оо оо о оо § rdP dt — = (1+В;дг)Ет|/< + Вггцг\т 5 t~rdt dP = Q т>/' о Следствие 2. Пусть М = (Мп) — мартингал такой, что E|A4rt|2r< < оо для некоторого г > 1 и Е|ДА4л|2г ... \ ...» 1_ <оо (Мо = О). (32) П=1 Тогда (ср. с теоремой 2 § 3 гл. IV) имеет место усиленный закон больших чисел: (33) — —>0 (Р-п. н.), п —>оо. п В случае г = 1 доказательство проводится по той же схеме, что и до- казательство теоремы 2 § 3 гл. IV. А именно, пусть п . .. т^Е~Г- k=i Тогда п м 1 мп _ k=\ _ j_ П ~ п п 52 k^m* k=\ и, согласно лемме Кронекера (§ 3 гл. IV), для сходимости (Р-п. н.) j п - k^mk -* 0, п —> оо,
§3. ОСНОВНЫЕ НЕРАВЕНСТВА 681 достаточно, чтобы (Р-п. н.) существовал конечный предел lim тп, что в свою очередь (теоремы 1 и 4 из § 10 гл. II) имеет место в том и только том случае, когда P|sup |mn+*-тп\-+0, л—>оо. (34) В силу неравенства (1) ~ Е(ДЛЦ2 Р J sup \mn+k - тп I > < ——5-------. J £ Поэтому требуемый результат следует из (32) и (34). Пусть теперь г > I. Утверждение (33) эквивалентно тому (теорема 1 § 10 гл. II), что для всякого Е>0 e2rp/sup —>0, п—»оо. (35) I ! J В силу неравенства (52) из задачи 1 s2rp{sup = e2r lim р( max >е2г|^ 1 J т-,<х> гг ) С^Е|ЛЦ2'+£ ^Е(|Л1/|2'НЛ1/_1|2'). ;>л+1 Из леммы Кронекера вытекает, что lim 4El^l2f = 0- л-*оо П2г Поэтому для доказательства (35) достаточно лишь показать, что £ ±E(|M/|2f-|M/_1|29<oo. (36) /•>2 1 Имеем N 1 /=2 J <у' Г___!_______LIeim- j2'' I l(j_l)2r j2r J fc Iм/-11 + M2r • 6 - 9728
682 ГЛ. VII. МАРТИНГАЛЫ В силу неравенства Буркхольдера (27) и неравенства Гёльдера Г 1 Е.\М,\^В%Ь £(ДМ;)2 <b22;e£|am,|2'. Поэтому /V — 1 / .9- '» < Y. - (77^]г1 Е s /=2 7 v 7 /=1 /=2 ' i=l /=2 7 (С/ — некоторые константы), что в силу (32) доказывает оценку (36). 4. Последовательность случайных величин (Хп)п^\ имеет с вероятно- стью единица предел lim Хп (конечный или бесконечный) тогда и только тогда, когда число «осцилляций между двумя любыми (рациональными) числами а и Ь, а<Ь» конечно с вероятностью единица. Приводимая ниже теорема дает оценку сверху среднего числа «осцилляций» для суб- мартингалов, которая в следующем параграфе будет использована для доказательства фундаментального результата о их сходимости. Зафиксируем два числа а и Ь, а<Ь, и для последовательности X = = (Xrt)rt^i определим моменты: то = О, т\ =min{n>0: Хп ^а}, Т2 = min{n > т\: Хп Ь}, T2m-\ — min{n > т2т-2’ Хп а}, т2т = min{n > т2ш_1: Хп &}, полагая т^ = оо, если соответствующее множество {•} пусто. Далее, для каждого п 1 определим случайные величины {О, если т2 > /г, max{m: т2т л}, если т2 п. По своему смыслу /?п(а, Ь) есть число пересечений (снизу вверх) ин- тервала [а, Ь] последовательностью Х\, ..., Хп. Теорема 5 (Дуб). Пусть Х = (Хп, ^п)п^\ — субмартингал. Тогда для любого п 1 (37)
§3. ОСНОВНЫЕ НЕРАВЕНСТВА 683 Доказательство. Число пересечений субмартингалом X = (Хп, &п) интервала [a, ft] совпадает с числом пересечений интервала [0, Ь — а] неотрицательным субмартингалом Х+ = ((Хп-а)+, &п). Поэтому, считая рассматриваемый субмартингал X неотрицательным и а=0, надо доказать, что E^n(0,ft)<^. (38) Положим %о = 0, «Fo = {0, И}, и пусть для i = 1, 2, ... _ J 1, если rm < i rm+i для некоторого нечетного т, 0, если тт < i rm+i для некоторого четного т. Нетрудно видеть, что ЫЗп(0, Ь) < £ ^[Xi-%,_,] /=1 и {^ = 1}= |J [{тт</}\{тт+1 <0]бЛ-1. т — нечетно Поэтому ftE/3„(0,ft)^E^^[X$ (X/-X,_1)dP = /=1 /=1 {^=1} /=1 {<Л=1} /=1 {<A = U £ $ [E(X/|^_1)-X/_1]dP = EX„, /=1 что и доказывает неравенство (38). □ 5. В этом пункте будут рассмотрены некоторые простейшие нера- венства для вероятностей больших уклонений в случае квадратично интегрируемых мартингалов. Пусть М = (Мп, ^п)п^о — квадратично интегрируемый мартингал с квадратичной характеристикой {М) = ((М)п, Mq = 0. Если вос- пользоваться неравенством (22) применительно к Хп = М„у Ап = {М)п, то получим, что для а > О, b > О Р|гпах >an} = р|тах > (ал)2} ^^Е[{М)пЛ(Ьп)] + Р{(М}п^ап}. (39) 6*
684 ГЛ. VII. МАРТИНГАЛЫ На самом деле, по крайней мере в том случае, когда |ДЛ4Л | С для всех п и cu е Q, это неравенство можно существенно улучшить, если восполь- зоваться идеями, изложенными в § 5 гл. IV при оценивании вероятностей больших уклонений для сумм независимых одинаково распределенных слу- чайных величин. Напомним, что в § 5 гл. IV при выводе соответствующих неравенств существенный момент состоял в использовании того, что последователь- ность (еА5’/^(Л)]я, Л>)я>ь Л. =а{£ь .... &}, (40) образовывала неотрицательный мартингал, к которому затем при- менялось неравенство (8) настоящего параграфа. Если теперь вместо Sn брать Мп, то аналогом (40) будет неотрицательный мартингал (еАЛ1"/^(А), Л,)я>1, где ^„(А)=]]Е(?^|//_|) (41) * — так называемая стохастическая экспонента (см. также п. 13 в § 6 гл. II). Это выражение довольно сложно. В то же самое время при исполь- зовании неравенства (8) вовсе было не обязательно, чтобы образованная последовательность являлась мартингалом. Достаточно лишь, чтобы она образовывала неотрицательный супермартингал. Именно так здесь мы и поступим, образовав последовательность (Zrt(A), <^п) (см. (43) ниже), которая довольно просто зависит от Мп и {М)п и к которой можно будет затем применить метод, использованный в § 5 гл. IV. Лемма 1. Пусть М = (Мп, <Рп)п^о — квадратично интегрируемый мартингал, Mq = 0, ДМо = 0 и | ДМп (си) | с для всех п и ш. Пусть Л > 0, {еХс - 1 - Хс А -----5---» С>0’ ,2 ' (42) 4. С=О. и 2„(А) = еАЛ,"-*ИА)<А'>". (43) Тогда для каждого с > 0 последовательность Z(A) = (Zn(A), является неотрицательным супермартингалом. Доказательство. Для |х| ^с еАх - 1 - Ах = (Ах)2 52 (Ах)2 12 (Л^! x^cW- ! m>2 1
§3. ОСНОВНЫЕ НЕРАВЕНСТВА 685 Учитывая это неравенство и представление (Zn = Z„(X)) &Zn = Z„_i [(еАЛМ» - + (е-д<л<)я^(А) _ находим, что Е(Д2п|«^п-1) = = Zn_i[E(eAAA1" - 1 |jrn_1)e-A<iM>"^(A) + (e-A<A,>",/’t(A)- 1)] = = Z„_i [Е(еАЛЛ<" - 1 - АДЛ4„ | Л-,) е~^(м^ФЛХ} + (е"д<Л1>»^<А> - 1)] <5Z„_iШХ)Е((ДМп)2\^n.i)гдМ-*‘(А> + (е-д<м)я^(А) _ j)] = = Z„_t [^(А)Д(Л4)яе-д<Л1>”^(А) + _ !)j 0> (44) где использовано также то обстоятельство, что для х О хе~х + (е~х - 1)^0. Из (44) видим, что E(Zrt I ^п— 1) Zrt_ j, т. е. Z(A) = (Zrt(A), &п) — супермартингал. □ Пусть выполнены условия леммы. Тогда всегда найдется А > 0 такое, что (для заданных а > 0, b > 0) аХ - bipc(X) > 0. Учитывая это, находим Р|тах Mk = р(тах еХМк JIk^n ) < pf max eXMk-^cWWk eXan^c(WM)n \ = I k^n J = p(max eXMk-MX)Wk eXan^MW\ {M)n bA + I k^n J + p{max eAA1‘-^(A)W» ехап-фс(М{м)^ > bn} P{max >еАая-^(А)<,п} + Р{(Л1)Й е-Я(ла-ис(А)) + p{(M)n > bn}, (45) где последнее неравенство вытекает из (7). Обозначим (ср. с функцией Н(а) в § 5 гл. IV) Нс(а. &) = sup[aA — Ь'фс(Х)]. д>о Тогда из (45) следует, что P(max Mk ап\ Р{{М)п > Ьп} + е^пНЛа^. (46) I k^n )
686 ГЛ. VII. МАРТИНГАЛЫ Переходя от мартингала М к —М, получаем, что правая часть в (46) оценивает сверху также и вероятность Р< min Mk —ап >. Тем самым I k^n ) P(max \Mk\^an]^2P{(M}n>bn} + 2e~nHcM. (47) I k^n ) Итак, доказана следующая Теорема 6. Пусть М = (Л4Л, &п) — мартингал с равномерно огра- ниченными скачками, т. е. |ДА4П| ^с для некоторой константы с>0 и всех п и w. Тогда для любых а > О, b > 0 имеют место неравенства (46) и (47). Замечание. Функция Нс(а,Ь)='-(а+Ь-Уп(1 + ^)-1. (48) 6. В предположениях теоремы 6 рассмотрим теперь вопрос об оцен- ках вероятностей типа p|sup >а}, характеризующих, в частности, скоростД сходимости в усиленном законе больших чисел для мартингалов (см. далее теорему 4 в § 5). Поступая так же, как и в § 5 гл. IV, находим, что для любого а > О найдется такое А > 0, что а А - ^с(А) > 0. Тогда для всякого b > 0 p/SUp >аЪ р fSUp \k>n Wk J J P/sup > el^-^(A))ftn 1 + p{(M)n < bn} \k^n ) <е-*п|аА-^(А)1-|-Р{(Л1)„<М. (49) откуда P (sup 7^- > a I < Р{(Л))„ < bn} + e-nH^ab-b\ (50) P (supl 7^-1 > a) 2P{(M)„ < bn} + 2e~nH‘{ab-b\ (51) I k^n ' \™)k I J Тем самым доказана Теорема 7. Пусть выполнены предположения предыдущей тео- ремы. Тогда для любых a > 0, b > 0 выполнены неравенства (50), (51). Замечание. Сравнение оценки (51) с оценкой (21) из § 5 гл. IV для случая схемы Бернулли, р = ^,Л4л = 5л~^,& = |,с = ^, показывает, что
§3. ОСНОВНЫЕ НЕРАВЕНСТВА 687 при малом е > 0 они приводят к одному и тому же результату: f S -- p/SUp| >Д = р< sup Д__________1 >-?<2в“4е2я iSwJ>£/ k >4j^Ze 7. Задачи. 1. Пусть X = (Хп, &п) — неотрицательный субмартингал и V = = (1/л, c^n-i) — предсказуемая последовательность с 0^ Vn^C (Р-п. н.), где С — некоторая константа. Показать, что имеет место следующее обобщение неравенства (1): £₽{ max VnXndP Е^-ДХ,-. (52) тах И/Л/<£ /=1 2. Доказать справедливость разложения Крикеберга*. всякий мар- тингал X = (Хп, ^п) с sup E|Xrt| < оо может быть представлен как разность двух неотрицательных мартингалов. 3. Пусть ••• — последовательность независимых случайных ве- п личин, Sn = fi 4-... + и Sm,n = 52 £/♦ Доказать справедливость следу- /=/и+1 ющего неравенства Оттавиани\ Р{ max |S/| >2е| » li^/^л 11 ) mm P{|S.-,„|O} 1^/^n и вывести из него, что Т Р( max |5;|>2/)^^2Е|5л| + 2 Т P{\Sn\>t}dt. (53) О j 2Е|$Я| 4. Пусть £1, ••• — последовательность независимых случайных ве- личин с Е£/ =0. Используя неравенство (53), установить, что для рассмат- риваемого случая имеет место следующее усиление неравенства (10): ES*^8E|Sn|. 5. Доказать справедливость формулы (16). 6. Доказать неравенство (19). 7. Пусть а-алгебры <^Ь» •. •, таковы, что <Fo С С... С и собы- тия e&k, Л= 1,...» п. Используя (22), доказать справедливость следу- ющего неравенства Дворецкого’, для всякого е > 0 р| U лД<е + р| f 1ы J I k=\ J
688 ГЛ. VII. МАРТИНГАЛЫ 8. Пусть Х = (Хп)п^\ — квадратично интегрируемый мартингал и (Ьп)гг£\ — положительная неубывающая последовательность действитель- ных чисел. Доказать следующее неравенство Гаека—Реньил Хо = О. bk\ j а2 bi «=1 9. Пусть Х = (Хп)п^[ — субмартингал и g(x) — неотрицательная воз- растающая выпуклая книзу функция. Тогда для всякого положительного / и действительного х Р / шах Хь > х 1 P\SnXk^ g(tx) • В частности, pf max Xk ^e~tx EetXn. 10. Пусть f2, ••• — независимые случайные величины c Efrt = O, п Е£„ = 1, п 1. Пусть г = inf{n > 1: £ С/ > 0}- Доказать, что Ет1'2 < оо. 4 /=1 11. Пусть f = — мартингал-разность и 1 < р 2. Показать, что Е sup 52 р оо <ср 52 Eie/K, /=1 где Ср — некоторая константа. 12. Пусть X = (Хп)п^ 1 — мартингал с ЕХ„ = 0 и ЕХ% < оо = 1. Показать (в обобщение задачи 5 к § 2 гл. IV), что для всякого и > 1 и е > 0 р( max Xk EXn2 e2 + EX2‘ § 4. Основные теоремы о сходимости субмартингалов и мартингалов 1. Следующий результат, являющийся основным во всей проблемати- ке сходимости субмартингалов, можно рассматривать как вероятностный аналог того известного факта из анализа, что ограниченная монотонная числовая последовательность имеет (конечный) предел. Теорема 1 (Дуб). Пусть X = (Хп, &п)п>\ — субмартингал с supE|Xn|<oo. (1) п Тогда с вероятностью единица существует предел lim Хп = Хх и EIXoo^oo.
§4. ОСНОВНЫЕ ТЕОРЕМЫ О СХОДИМОСТИ 689 Доказательство. Предположим, что P{lim Хп > lim Хп} > 0. (2) Тогда поскольку {lim Хп > lim Хп} = [J {lim Хп > b > а > lim Хп} а<Ь (а, b — рациональные числа), то найдутся такие а и Ь, что P{Iim Xrt>/>>a>lim Хп}>0. (3) Пусть (Зп(а, Ь) — число пересечений снизу вверх последовательностью ..., Хп интервала (а, Ь) и /З^а, fe) = lim /Зп(а, Ь). Согласно (37) § 3, b-а Ь-а и, значит, sup ЕХ^ + |а| Е&о(а, b) = lim ЕД, (а, Ь) sj " • —---------< оо, п и — а что следует из (1) и того замечания, что для субмартингалов supE|X„|<oo 4» supEX+<oo п п (поскольку ЕХ+ Е|Х„| = 2ЕХ+ - ЕХ„ С 2ЕХ+ - EXi). Но условие ЕД» (а, Ь) <оо противоречит допущению (3). Следовательно, с вероят- ностью единица существует lim Хя =ХОО, для которого в силу леммы Фату EIXooKsupEl^^oo. □ п Следствие 1. Если X — неположительный субмартингал, то с вероятностью единица существует конечный предел lim Хп. Следствие 2. Если X — (Хп, <^л)л>1 — неположительный субмар- тингал, то последовательность X = (X„, &п) с 1 С п оо, Хж = lim Х„ « <^оо = a (U &п j образует (неположительный) субмартингал. Действительно, по лемме Фату EXoo = Е lim X„ >Iim ЕХ„ > ЕХ, > -оо и (Р-п. н.) Е(ХТО|Лп) = E(lim Хп\Рт) Е(Х„ |Лл) >Хт. Следствие 3. Если X = (Х„, ^п) — неотрицательный мартингал, то с вероятностью единица существует lim Хп.
690 ГЛ. VII. МАРТИНГАЛЫ В самом деле, тогда sup E|Xrt| = sup EXrt = EXi <оо п п и применима теорема 1. 2. Пусть ••• — последовательность независимых случайных ве- е п личин с Р{£, = 0} = Р{$ = 2} = 1/2. Тогда Х = (Х„, с Хп = П & и = /=1 = а{£1, ..., £я} есть мартингал с EXn = 1 и Хп -^Х^ = 0 (Р-п. н.). В то же время ясно, что Е|ХЛ — Хоо | = 1 и, значит, Хп Таким образом, условие (1) не обеспечивает, вообще говоря, сходимость Хп к Х^ в смысле L1. Приводимая далее теорема 2 показывает, что если предположение (1) усилить до предположения равномерной интегрируемости семейства {Хл} (тогда условие (1) выполнено согласно свойству (16) в п. 5 § 6 гл. II), то наряду со сходимостью почти наверное будет иметь место и сходимость в смысле L1. Теорема 2. Пусть X = (Хя, &п) — субмартингал, для которого се- мейство\слу чайных величин {Хя} равномерно интегрируемо. Тогда существует такая случайная величина Xoq с Е|Хоо|<сю» что при Хп-Хп (Р-п.н.), (4) хп ±Хх. (5) При этом последовательность Х = (Хп, &п), 1 п оо, с = = также образует субмартингал. Доказательство. Утверждение (4) следует из теоремы 1, а утвержде- ние (5) — из (4) и теоремы 4 § 6 гл. II. Далее, если A 6 и т п, то Е1А \Хт - Хоо | -» 0, т оо, и поэтому lim \XmdP = {XoodP. Последовательность [ §XmdP| является неубывающей, и, значит, / пт^п S^dP^X^P^XoodP, А А А откуда Хп Е(Лоо |«^n) (Р-п. н.) для всех n > 1. □
§4. ОСНОВНЫЕ ТЕОРЕМЫ О СХОДИМОСТИ 691 Следствие. Если X = (ХЛ, — субмартингал и для некоторого р>! sup E|Xrt|p < оо, (6) п то существует интегрируемая случайная величина Х^, для кото- рой выполнены (4) и (5). Для доказательства достаточно заметить, что, согласно лемме 3 § 6 гл. II, условие (6) обеспечивает равномерную интегрируемость семей- ства {Хп}. 3. Приведем теперь теорему о свойствах непрерывности условных математических ожиданий, которая была одним из самых первых резуль- татов относительно сходимости мартингалов. Теорема 3 (П. Леви). Пусть (П, Р) — вероятностное прост- ранство, — неубывающее семейство о-алгебр, cFi ... ... СЛ Пусть £ — некоторая случайная величина с Е|£| <оо и = = Тогда Р-п. н. и в смысле L{ E(e|^)-E(e|^oo), П-.ОО. (7) Доказательство. Пусть Хп = Е(£ | &п), и > 1. Тогда для а > О, b > О $ ix„i</pc $ E(Kiijr„)dP= $ iei^p= = $ ieMP+ $ |еир< {|X»l>a. lel^>} 1€1>Ь) ^P{|X„|>a} + $ |C|dP< £e|£|+ $ leidP. Полагая a -»оо, затем b —»оо, получаем что означает равномерную интегрируемость семейства {Хп}. Тогда, со- гласно теореме 2, существует случайная величина Хоо такая, что Хп = = Е(С|^л)-»Хоо (Р-п. н. и в смысле L1). Поэтому надо лишь показать, что Хоо = Е(е|^оо) (Р-п.н.). Пусть т^п и А е^п- Тогда $ ХтdP = $ Хп dP = $ Е(£|Л,)dP = ^dP. AAA А
692 ГЛ. VII. МАРТИНГАЛЫ В силу равномерной интегрируемости семейства {Хп} и теоремы 5 § 6 гл. II Е/л|Хп — Aqo| —>0, m—>ос, и, следовательно, $х0Ойр=$^р. (8) А А Это равенство выполнено для любого А е и, значит, для любо- оо го А е U Лп. Поскольку Е|Хю|<оо, Eiei < оо, то левая и правая части п—1 в (8) представляют а-аддитивные меры, возможно, принимающие и от- оо рицательные значения, но конечные и совпадающие на алгебре U &п. П=1 В силу единственности продолжения а-аддитивной меры с алгебры на наименьшую а-алгебру, ее содержащую (теорема Каратеодори, § 3 гл. II) равенство (9) остается справедливым и для множеств А € Лю = ^(U Итак, $ Хоо dP = $ = $ Е(Сl^oo)rfP, А е Лоо. (9) . А А А Величины Хсо И Е(£|Лю) ЯВЛЯЮТСЯ Лю-измеримыми, поэтому в силу свойства I п. 3 § 6 гл. II из (9) следует, что Хю = Е(£|Лю) (Р-п. н.). □ Следствие. Стохастическая последовательность X = (Лл, Ля) яв- ляется равномерно интегрируемым мартингалом тогда и только тогда, когда существует случайная величина $ с Е|£|<оо такая, что Хп = Е(£ |ЛЯ) для всех п^\ (т. е. X есть мартингал Леви), При этом Хп —>Е(£ |Лю) (Р-п.н. и в смысле ZJ) при п—юо. Действительно, если X = (Хп, &п) — равномерно интегрируемый мар- тингал, то по теореме 2 найдется такая интегрируемая случайная величина Хоо, что Xi—►Хю (Р-п. н. и в смысле L1) и к тому же Хп = Е(Лоо|ЛД Так что в качестве случайной величины £ можно взять (Лю-измеримую) величину Лоо- Обратное утверждение следует из теоремы 3. 4. Остановимся на некоторых применениях доказанных теорем. Пример 1. Закон «нуля или единицы». Пусть & ••• — после- довательность независимых случайных величин, Ля = a{£i, • ••» Сп}, — а-алгебра «хвостовых» событий и А е 3>. Из теоремы 3 Е(/л|Л^)-.Е(/л|Л^) = /д (Р-п.н.). Но /л и (£ь ...,Сп) независимы. Поэтому Е(/л|Л?) = Е/л и, значит, (Р-п. н.) /л = Е/Л, откуда Р(Л) = 0 или Р(Л) = 1. Следующие два примера иллюстрируют возможности применения при- веденных выше теорем о сходимости в математическом анализе.
§4. ОСНОВНЫЕ ТЕОРЕМЫ О СХОДИМОСТИ 693 Пример 2. Если / = f(x) — функция на [0, 1), удовлетворяющая усло- вию Липшица, то она абсолютно непрерывна и, как известно из анализа, найдется такая интегрируемая (по Лебегу) функция g = g(x), что f(x)-f(O) = $g(l/)</«/. (10) о (В этом смысле g(x) есть «производная» Дх).) Покажем, как этот результат может быть получен из теоремы 1. Пусть Q = [0, 1), <^ = «^([0, 1)) и Р — мера Лебега. Положим 2я fc=l •F„ = a{6, •••. 61} = ^{6,}, и пусть Поскольку при заданном значении £п случайная величина принимает лишь два значения £п и + 2“(rt+,) с условными вероятностями, равными 1/2, то Е[Хп+1 \^п] = Е[Хя+11£„] = 2"+lE[/(Ui +2-<я+1>) - /(6.+1) |6>] = = 2я+1 {1 [/(£„ + 2-<я+')) - КЫ] + 5 [/(6. + 2-я) - f^n + 2-<я+1>)]} = = 2я{^„+2-я)-Ле„)} = Хп. Отсюда следует, что Х = (Хп, &п) есть мартингал, причем равномерно инте- грируемый в силу того, что |X„| L, где L — константа в условии Липшица: |/(х) - f(y)\ ^L|x -1/|. Заметим, что ^ = ^([0, l)) = a(U<^n)- Поэтому, согласно следствию к теореме 3, найдется такая ^-измеримая функция ё = g(x), что Хп -> g (Р-п. и.) и Xn = E[gm. (П) Возьмем множество В = [0, &/2я]. Тогда из (11) */2” */2” f(£)-f(°)= $ Xndx = $ g(x)dx, о о и в силу произвольности п и k отсюда получаем требуемое равенство (10). Пример 3. Пусть Q = [0, 1), ^ = ^([0, 1)) и Р —мера Лебега. Рас- смотрим систему функций Хаара {Нп(х)}п^\, определенных в примере 3 § 11 гл. II. Положим ^я = а{//1, ..., Нп} и заметим, что <r(|J ^) = <F. Из
694 ГЛ. VII. МАРТИНГАЛЫ свойств условных математических ожиданий и структуры функций Хаара нетрудно вывести, что для любой борелевской функции f е L п Е[Дх)|^я] = £а*/4(х) (Р-п.н.), (12) k=\ где 1 ah = (f,Hk) = \f(x)Hh(x)dx. О Иначе говоря, условное математическое ожидание Е[/(х) | &п] есть частич- ная сумма Фурье при разложении функции /(х) по системе Хаара. Тогда, применяя теорему 3 к мартингалу (E(/|<^rt), ^л), находим, что при я—>оо £(/,//A)tfA(x)-fW (Р-п.н.) k=l и S п Y,(f^k)Hk(x)-f(x) k=\ dx->0. Пример 4. Пусть (£n)n^i — последовательность случайных величин. Согласно теореме 2 из § 10 гл. II, сходимость Р-п. н. ряда ^2 влечет за собой его сходимость по вероятности и по распределению. Оказывается, что если случайные величины ••• независимы, то верно и обратное: сходимость ряда ^2 €п из независимых случайных величин по распределе- нию влечет его сходимость по вероятности и с вероятностью единица. Доказательство этого свойства может быть получено следующим об- разом. Пусть Srt = £1 +... + 6i, и > 1, и Sn S. Тогда Ее/75я -> Eelts для каждого действительного t. Ясно, что существует такое 8 > 0, что |Eel/s| >0 для всех |/| <6. Возьмем некоторое /о такое, что |/о| <£• Тогда существу- ет также такое ио = ио(/о), что |Ее|/о5я| >0 для всех /г>по, где с — некоторая константа. Образуем для п^по последовательность X = (Xrt, &п) с = .......................... Поскольку величины ••• предполагаются независимыми, то после- довательность X = (Хп, — мартингал с sup E|Xrt| <оо. Тогда из теоремы 1 следует, что с вероятностью единица предел lim Хп существует и конечен. Поэтому предел lim elt°Sn также существует с веро-
§4. ОСНОВНЫЕ ТЕОРЕМЫ О СХОДИМОСТИ 695 ятностью единица. Тем самым можно утверждать, что найдется такое 5 > О, что для каждого t из множества Т = {t: |/| <(5} предел lim eitSn существует с вероятностью единица. Пусть Т х Q = {(/, си): t С 7', ш е П}, ^(7) — а-алгебра лебеговских мно- жеств на Г и А —мера Лебега на (Г, ^(7)). Пусть также С = {(/, cu) G Т х П: lim eltSn^ существует}. Ясно, что С 6 <£?(?) 0 &, Выше было показано, что Р(С/) = 1 для каждого t где Ct = ~{сибП: (/, си) G С} — сечение множества С в точке t. По теореме Фубини (теорема 8 § 6 гл. II) 5 /с(/, ш) d(X X Р) = 5 А /с(/, ш) dp") dX = 5 Р(С/) dX = A(7) = 2<5 > 0. rxfi T \n / T С другой стороны, снова по теореме Фубини А(7) = $ Ic(t,u)d(XxP) = \dP(\lc(t,u)dx'\ = \ X(Cu)dP, TxQ а \Т J Q где Сц, = {/: (/, cu) е С}. Отсюда вытекает, что существует множество Q с P(f2)= 1 такое, что A(CW) = А(7) = 2<5 > 0 для всех си е П. Следовательно, можно утверждать, что для каждого cueQ предел lim eltSn^ существует для всех t 6 Cw; причем мера Лебега множества Сш положительна. Отсюда и из задачи 8 следует, что предел lim Srt(cu) суще- ствует и конечен для cuGfL Поскольку P(f2)= 1, то lim Srt(cu) существует и конечен с вероятностью единица. 5. Задачи. 1. Пусть {%} — невозрастающее семейство а-алгебр, 2 #2 2 .., ^оо = П и *7 — некоторая интегрируемая случайная величина. Доказать справедливость следующего аналога теоремы 3: при п —> оо Е(т/\&п) Efal^oo) (Р-п. н. и в смысле L1). 2. Пусть fi, ••• — последовательность независимых одинаково рас- пределенных случайных величин с E|£i| < оо и E£i=m, Srt =£1 +...+ £rt. Показав (см. задачу 2 § 7 гл. II), что с Е«1 |Srt, Srt+1, ...) = E(ei|Sn) = ^ (Р-п.н.), вывести из результата задачи 1 усиленный закон больших чисел: при п—>оо 5 1 ----->т (Р-п. н. и в смысле L1). п
696 ГЛ. VII. МАРТИНГАЛЫ 3. Доказать справедливость следующего результата, соединяющего в себе теорему Лебега о мажорируемой сходимости и теорему П. Леви. Пусть (£п)п>\ — последовательность случайных величин таких, что (Р-п.н.), |С/»|Ет; <оо и (Лот)т>1 — неубывающее семейство сг-алгебр, Л» = a(j Л»)- ТогДа (Р-п-н ) lim Е(ея|Лт) = Е(е|Лю). /И—ЮО п—+ОО 4. Доказать справедливость формулы (12). 5. Пусть П = [О, 1), Л = Л([0, 1)), Р — мера Лебега и f = f(x)eLl. Положим (*+1)2-л /я(х) = 2" $ f(y)dy, k2~n ^х <(k+\)2~n. k2-n Показать, что /я(х)~► Дх) (Р-п.н.). 6. Пусть Q = [О, 1), ^ = ^([0, 1)), Р — мера Лебега и f = f(x)eLl. Продолжим эту функцию периодически на [0, 2) и положим i 2я Ш = £2-'7(х+й-л). i=l Показать, что /я(х)-»/(х) (Р-п.н.). 7. Доказать, что теорема 1 сохраняет свою силу для обобщенных суб- мартингалов X = (Хп, для которых inf sup E(X+|^m)<oo (Р-п.н.). т п^т 8. Пусть (ап)п^\ — некоторая последовательность чисел такая, что для всех действительных t с |/1 < 6,6 > 0, предел lim еа°п существует. Доказать, что тогда существует и конечен lim ая. 9. Пусть F = F(x), хе/?, есть функция распределения, ае(О, 1). Пред- положим, что существует 0е/? такое, что F(0) = a. Образуем («процедура Робинса—Монро») последовательность Хь %2, • •• так, что Хп+}=Хп-п-\Уп-а), где Уь >2, ... — случайные величины такие, что р/у п I y y • v v \//^(Хя), если у 1, Р('л — RM, ..., Ая, / j, ..., УЯ-1) — < А [1-^(ля), если # = 0. Доказать следующий результат теории «стохастической аппроксима- ции»: Е|ХЯ — 0|2—>0, п —>оо.
§5. О МНОЖЕСТВАХ СХОДИМОСТИ 697 10. Пусть Х = — субмартингал такой, что Е(Хг/(т<оо))/оо для каждого момента остановки т. Показать, что с вероятностью единица существует предел lim Хп. / оо \ 11. Пусть Х = (Хп, ^п)п> 1 есть мартингал, .Роо=а I IJ #„]. Доказать, \Л=1 / что если последовательность (Xn)n^i равномерно интегрируема, то пре- дел Xoo = HmXrt существует (Р-п.н.) и «замкнутая» последовательность X = (Xrt, является мартингалом. 12. Будем предполагать, что X = (Хп, &п)п^1 есть субмартингал, и пусть ( оо \ ^00 = ^1 U ) • Доказать, что если последовательность (Х+)п^\ равно- \п=1 / мерно интегрируема, то предел Xoq = lim Хп существует (Р-п. н.) и «замкну- п тая» последовательность X = (ХЛ, является субмартингалом. § 5. О множествах сходимости субмартингалов и мартингалов 1. Пусть X = (Хп, &п) — стохастическая последовательность. Будем обозначать через {Хп —►} или {—оо < lim Хп < оо} множество тех элементар- ных исходов, для которых lim Хп существует и конечен. Будем говорить также, что А СВ (Р-п. н.), если Р(/д С/в) = 1- Если X — субмартингал и supE|Xrt|<oo (или, что эквивалентно, sup ЕХ+ < оо), то в соответствии с теоремой 1 § 4 {Xrt-} = Q (Р-п.н.) т.е. {Хп^} = 0. Рассмотрим вопрос о структуре множеств сходимости {Хп —>} для суб- мартингалов в случае нарушения условия sup Е|ХЯ| < оо. Пусть а > 0 и та = inf{n 1: Хп > а} с та = оо, если {•} == 0. Определение. Стохастическая последовательность X = (Хп, #п) при- надлежит классу С+ (X е С+), если для любого а > О Е(ДХТо)+/{та < оо} < оо, (1) где ДХ„ =%Я-ХП_Ь Хо = О. Очевидно, что X € С+, если Е sup |AXrt| <оо (2) п или, тем более, если (Р-п. н.) для всех п 1 |ДХя|^С<оо. (3)
698 ГЛ. VII. МАРТИНГАЛЫ Теорема 1. Если субмартингал X еС+, то (Р-п. н.) {sup Хп < оо} = {Хп -*}. (4) Доказательство. Включение {Хп —*} С {sup Хп < оо} очевидно. Для доказательства обратного включения рассмотрим «остановленный» суб- мартингал ХТа = (ХТа/кп, &п)- Тогда в силу (1) SUP Е^лп <а + Е[Х+/{тв < оо}] 2а + Е((ДХТо)+/{та < оо}] < оо, (5) п и, значит, по теореме 1 из § 4 (Р-п. н.) {та = оо}С{Х„->}. Но (J {та=оо}={sup Хп < оо}, поэтому {sup Хп < оо} С {Хп —»} (Р -п. н.). □ а>0 Следствие. Пусть X —мартингал с Е sup |ДХП| <оо. Тогда {Хп —►} U {lim Хп = -оо, lim Хп = +00} = Q (Р-п. и.). (6) В самом деле, применяя теорему 1 к X и —X, находим, что (Р-п. н.) {lim Хп < оо} = {sup Хп < оо} = {Хп -*}, {lim Хп > —оо} = {inf Хп > —оо} = {Хп —*}. Поэтому (Р-п. н.) {lim Хп < оо} U {lim Хп > -оо} = {Хп }, что и доказывает (6). Утверждение (6) означает, что почти все траектории мартингала X, удовлетворяющего условию Е sup |ДХЛ| <оо, таковы, что или для них су- ществует конечный предел, или же они устроены «плохо» в том смысле, что для них lim Хп = -Foo, lim Хп = —оо. 2. Если £i, — последовательность независимых случайных ве- личин с Е£, = 0 и |£z| с < оо, то, согласно теореме 1 § 2 гл. IV, ряд £ 6' сходится (Р-п. н.) тогда и только тогда, когда Е Е?2 <оо. Последовате- льность Х = (Хп,^л) с Хя=6^1 = а{£1,...,£п} п есть квадратично интегрируемый мартингал с (Х)п = и сформули- /=1 рованному утверждению можно придать такую форму: {(Х)оо<оо} = {Хп-»} = П (Р-п.н.), где (X)TO = lim(X)„.
§5. О МНОЖЕСТВАХ СХОДИМОСТИ 699 Приводимые далее утверждения обобщают этот результат на случай более общих мартингалов и субмартингалов. Теорема 2. Пусть X = (Хп, &п) — субмартингал и Хп = тп+Ап — его разложение Дуба. а) Если X — неотрицательный субмартингал, то {Лоо < оо} С {Хп ->} С {sup Хп < оо} (Р-п. н.). (7) Ь) Если X е С+, то {Хп -*} = {sup Хп < оо} С {Лоо < оо} (Р-п. н.). (8) с) Если X — неотрицательный субмартингал и X 6 С+, то {Хп ->} = {sup Хп < оо} = {Лоо < оо} (Р-п. н.). (9) Доказательство, а) Второе включение в (7) очевидно. Для доказа- тельства первого включения введем моменты аа = inf{n > 1: Ля+1 > а}, а > О, полагая afl = +oo, если {} = 0. Тогда Ааа^а и в силу следствия 1 к теореме 1 § 2 ^Хп/\сга = Е.АпЛаа Пусть У" = Хплста, тогда Уа = (У“, ^п) — субмартингал с sup Е У* а < оо и в силу его неотрицательности из теоремы 1 § 4 следует, что (Р-п. н.) {Лоо ^ ^} ~ {&а ~ оо} С {Хп ► }• Поэтому (Р-П. Н.) {Лоо<оо}=С1 я>0 b) Первое равенство следует из теоремы 1. Чтобы доказать второе, заметим, что, согласно (5), ЕЛГоЛя = ЕХТоЛй < ЕХ+ЛП 2а + Е](ДХГл)+/{та < оо}] и, значит, ЕЛТо = Е lim АТаЛп < оо. Поэтому {та = оо} С {Ах < оо} и требуемое утверждение следует из того, что U {та = оо} = {sup Хп < оо}. а>0
700 ГЛ. VII. МАРТИНГАЛЫ с) Это утверждение есть непосредственное следствие утверждений а) и Ь). □ Замечание. Условие неотрицательности X можно заменить условием sup ЕХ7 < оо. п Следствие 1. Пусть Хп =£1 + ... + £«, где & >0, Е$ < ; оо, — .Pi-из- (Ю) меримы и «^о = {0. Тогда (Р-л. н.) < ' оо Е(& 1Л1-1) < оо ./1=1 J и если к тому же Е < sup £>п < оо, то (Р-п п ' оо ' ^2 Е(^п|«^1-1) <оо . п=1 • Н.) (Н) Следствие 2 (лемма Бореля—Кантелли—«Леви). Вп € Л>, то, полагая в (11) = /в„, получаем, что (Р- Если события п. н.) ( оо 1 /1=1 Р(Вя|«^п-1)<ОО 1 = 1/1=1 J (12) 3. Теорема 3. Пусть М = (Мп, &n)n^i — квадратично интегрируе- мый мартингал. Тогда (Р-л. н.) {(Л4)то <оо}С{Л4„ (13) Если к тому же Е sup |ДМп|2 < оо, то (Р-л. н.) {(Л4 )то < оо} = {Л4Л —►}, (14) где Woc = f;E((AM„)2|^_l) (15) п=1 с Мо = 0, <^Ь = {0» Доказательство. Рассмотрим два субмартингала Af2 = (A42, &п) и (М + I)2 = ((Мп + I)2, <^п). Тогда в их разложениях Дуба М2 = т'п+А'п, (Мп + 1)2 = т" + А" величины А'п и А” совпадают, поскольку k=l
§5. О МНОЖЕСТВАХ СХОДИМОСТИ 701 И Д" = £ Е(Д(^ + 1)2|^_1) = ^ Е(Д^|^_,). *=1 Л=1 Поэтому из (7) (Р-п. н.) {(Л!).» < оо} = {А^ < оо} С {М2„ -.} П {(М„ + 1 )2 -+} = {М„ ->}. В силу (9) для доказательства (14) достаточно проверить, что условие Е sup |ДЛ4п|2<оо обеспечивает принадлежность субмартингала М2 клас- Су С+. Пусть та = inf{n 1: М„ > а}, а > 0. Тогда на множестве {та < оо} |Д<| = |< - | < |Л/Го - AfTo-i |2 + 2|AfT._!| • |Л1Тг1 - МГа.{| < ^(ДЛ1Гл)2 + 2а'/2|ДЛ)Го|, откуда Е|ДЛ/2а| /{та < оо} Е(ДЛ4То)2/{та < оо} + 2а’/2УЕ(ДМТо)2/{та <оо} Е sup |ДЛ/П |2 + 2а */2 VE sup |ДЛ4Я|2 < оо. □ В качестве иллюстрации этой теоремы приведем следующий результат, который можно рассматривать как своеобразную форму усиленного за- кона больших чисел для квадратично интегрируемых мартингалов (ср. с теоремой 2 в § 3 гл. IV и со следствием 2 в п. 3 § 3). Теорема 4. Пусть М = (Мп, &п) — квадратично интегрируемый мартингал и А = (Ап, &п-\} — предсказуемая возрастающая после- довательность с Д} 1, Доо = оо (Р-п. я.). Если (Р-п, н.) Е[(Д^)2|Л-|] ---------72-----< °°’ (16) /=1 1 то с вероятностью единица ^-0, п->оо. (17) В частности, если {М) = ({М)п, &п-\) есть квадратическая харак- теристика квадратично интегрируемого мартингала М = (Мп, ^п) и (^)оо = оо (Р-п. н.), то с вероятностью единица ->0 {М)п и' п—*оо. (18)
702 ГЛ. VII. МАРТИНГАЛЫ Доказательство. Рассмотрим квадратично интегрируемый мартингал т = (тп, &п) с Г' ДМ; -' А Тогда п Е[(ДЛ1,)2|^|] (19) Поскольку Мп _ Ап Е AkAmk k=i_______ Ап Мп то, согласно лемме Кронекера (§ 3 гл. IV), -г->0 (Р-п. н.), если с веро- Ап ятностыо единица существует конечный предел lim тп- В силу (13) {(т)оо < оо} С {тп -►}, (20) поэтому из (19) следует, что условие (16) достаточно для выполнения (17). Наконец, если Лл = (Л4)п, то условие (16) выполняется автоматически (задача 6). □ Пример. Рассмотрим последовательность независимых случайных ве- личин ^1,^2, • •• с Ef/=O, Df/ = D/>0, и пусть последовательность Х = = (Хп)п>о определяется из рекуррентных уравнений + (21) где Хо не зависит от ...» а 0 — неизвестный параметр, -оо < в < оо. Будем интерпретировать Хп как результат наблюдения в момент вре- мени п и поставим задачу оценки неизвестного параметра в. Возьмем в качестве оценки 0 по результатам Хо, Хь ..., Хп величину 'у'1 XkXk+\ А л=о ^+1 л?о Dk+\ полагая ее равной нулю, если знаменатель обращается в нуль. (Величина 0п есть оценка, полученная по методу наименьших квадратов.) Из (21) и (22) ясно, что (22) где 0П = 0+^, Ап 6=0 + 6=0 + *=о
§5. О МНОЖЕСТВАХ СХОДИМОСТИ 703 Поэтому, если истинное значение неизвестного параметра есть в, то Р{^0}=1 (23) тогда и только тогда, когда (Р-п. н.) ^-0, п-»оо. (24) Ап Покажем, что условия Л 00 л2 ЕЕ(й(Л1)=“ (25) п=1 достаточны для (24) и, следовательно, достаточны для (23). Имеем Тем самым = ОО > £{^00=00}. По теореме о «трех рядах» (теорема 3 в § 2 гл. IV) расходимость ря- да 52 Е ( 77- Л 1) обеспечивает расходимость (Р-п. н.) ряда 52 ( п Л И • n=l 7 n=lKUn 7 Поэтому Р{(Л1)оо = оо}= 1 и требуемое соотношение (24) следует непо- средственно из последнего утверждения теоремы 4. Оценки вп, 1, обладающие свойством (23), называют сильно со- стоятельными (ср. с понятием состоятельности в § 7 гл. I). В п. 5 следующего параграфа будет продолжено рассмотрение этого примера для случая гауссовской последовательности £i, ••• Теорема 5. Пусть X = (Хп, &п) — субмартингал, Хп — ГПп “I" Ап — его разложение Дуба. Если |ДХл| С, то (Р-п. н.) {(т)оо + Лоо <оо} = {*«-»}, (26) или, что то же, £ Е[ДХ„ + (ДХ„)21Л,-1 ] < оо I = {Хп }. (27) л=1 J
704 ГЛ. VII. МАРТИНГАЛЫ Доказательство. Поскольку Лп = 2^ E(AX*)l«^ft-i)» (28) k=\ тп = ^ 1АХ* “ Е<ДХ* । (29) k=l то в силу предположения |ДХ*| < С мартингал т = (тп, #п) является квад- ратично интегрируемым с |Дгип| ^2С. Тогда из (13) {(^оо + Лоо <оо} С {Хд-} (30) и, согласно (8), {Хд ► } С {Лоо < сю}. Поэтому из (14) и (30) {Xrt >} = {Хд ►} ГТ {Лоо < сю} = {Хд >} П {Лоо < сю} ГТ {тп >} = ~ {Хд >} ГТ {Лоо < сю} ГТ {(/и)оо < сю} — = {Хп > } П {Лоо “Ь (^z)oo < Сю} = {Лоо 4~ (^)оо < СЮ}. Наконец, эквивалентность утверждений (26) и (27) следует из того, что в силу (29) {т)п = $2 {E[(Wl^-d - [E(AXa|^_!)]2} ОО и из сходимости ряда 52 Е(АХ* 1*^-1), состоящего из неотрицательных Л=1 оо членов, следует сходимость ряда £ [Е(ДХ* |^~i)]2. □ k=i 4. Теорема Колмогорова о «трех рядах» (теорема 3 § 2 гл. IV) дает необходимое и достаточное условие сходимости с вероятностью единица ряда 52 состоящего из независимых случайных величин. В нижесле- дующей теореме 6, доказательство которой основано на теоремах 2 и 3, дается описание множества сходимости ряда 52 Сп без предположения о независимости случайных величин ... Теорема 6. Пусть £ = (frt, <^rt)rt>i — стохастическая последова- тельность, = {0, Q} и с — положительная константа. Ряд 52 £п сходится на множестве Л, на котором одновременно сходятся три ряда гдее;=е,/(|&|^с).
§5. О МНОЖЕСТВАХ СХОДИМОСТИ 705 п Доказательство. Пусть Хп = 52 Поскольку (на множестве Я) Л=1 сходится ряд 52 Р(|^п| то по следствию 2 к теореме 2 и в силу сходимости ряда имеем ЛП{Хя^} = Лл{£е*/(|&|^с)-Л = G=1 J ' п ИЛ1^с)-Е(6/(|еА|^с)|Л-1)]-»к (31) .k=l Пусть Tfk=Ck - Е К* I &k-1) И Yn = £ flk • Тогда Y = (Yn, &n) — квадратично k=\ интегрируемый мартингал с |%| ^2с. По теореме 3 0(^|^„_1)<оо}={(У)00<оо} = {Уп-,}. Поэтому из (31) следует, что АС\{Хп—>} = А и, значит, А С {Хп —>}. □ 5. Задачи. 1. Показать, что если субмартингал X = (Хп, &п) удовлетворяет усло- вию Е sup |ХЛ | < оо, то он принадлежит классу С+. п 2. Доказать, что теоремы 1 и 2 остаются справедливыми для обобщен- ных субмартингалов. 3. Показать, что для обобщенных субмартингалов (Р-п. н.) имеет место включение {inf sup E(X„+|«Fm)<oo} С {Х„-Ч. < т п^т > 4. Показать, что следствие к теореме 1 остается верным и для обоб- щенных мартингалов. 5. Показать, что всякий обобщенный субмартингал класса С+ является локальным субмартингалом. и °° а 6. Пусть ап > 0, п 1, и Ьп = 52 ak- Показать, что 52 7? < °°. *=! /1=1 °п 7. Пусть ••• — последовательность равномерно ограничен- ных случайных величин: n^l. Показать, что ряды 52 6* и /1>0 г E(e„iei,.... $>-о сходятся или расходятся (Р-п. н.) одновременно.
706 ГЛ. VII. МАРТИНГАЛЫ § 6. Абсолютная непрерывность и сингулярность вероятностных распределений на измеримом пространстве с фильтрацией 1. Пусть (П, — некоторое измеримое пространство с выделенным на нем семейством таких а-алгебр (<Frt)rt>i, что С С... С & и (оо X U«^ • (!) /1=1 / Будем предполагать, что на (О, заданы две вероятностные меры Р и Р. Обозначим Рп = Р|Ль Prt = P|^rt — сужения этих мер на т. е. пусть Prt и Рп — меры на (Q, причем для В е &п РЯ(В) = Р(В), Р„(В) = Р(В). Наполним, что вероятностная мера Р называется абсолютно непре- рывной относительно Р (обозначение: Р<сР), если Р(Д) = 0 всякий раз, когда Р(Д) = 0, А е В случае Р С Р и Р « Р меры Р и Р называются эквивалентными (обозначение: Р ~ Р). Меры Р и Р называются сингулярными или ортогональными, если существует такое множество Де<^, что Р(Д) = 1 и Р(Д) = 1 (обозначе- ние: Р ±Р). Определение 1. Будем говорить, что мера Р локально абсолютно непрерывна относительно меры Р (обозначение: Р Р), если для любого п^ 1 Ри«Рп. (2) Основные вопросы, рассматриваемые в настоящем параграфе, состоят в выяснении условий, при которых из локальной абсолютной непрерывно- сти ЫРследует выполнение свойств Р <С Р, Р~Р, Р±Р. Как станет ясно из дальнейшего, теория мартингалов является тем математическим аппаратом, который позволяет исчерпывающим образом ответить на эти вопросы. Напомним, что в § 9 гл. III вопрос об абсолютной непрерывности и сингулярности вероятностных мер рассматривался для произвольных ве- роятностных мер. Было показано, что обращение к интегралам Хеллингера позволяет сформулировать соответствующие критерии (теоремы 2 и 3).
§6. АБСОЛЮТНАЯ НЕПРЕРЫВНОСТЬ И СИНГУЛЯРНОСТЬ 707 Приводимые ниже результаты об абсолютной непрерывности и сингуляр- ности для локально абсолютно непрерывных мер можно было бы получать, отправляясь от этих критериев. (Такой подход изложен в монографиях [84], [87].) Здесь же мы предпочитаем несколько иной путь изложения, же- лая более полно проиллюстрировать возможности применения результатов § 5 о множествах сходимости субмартингалов. (Отметим, что все изло- жение в этом параграфе предполагает выполненным свойство локальной абсолютной непрерывности. Сделано это лишь для простоты изложения. Для общего случая мы отсылаем читателя к [84], [87].) ~ 1°с Итак, будем предполагать, что Р<^Р. Обозначим 2 я-</Ря производную Радона—Никодима меры Р„ относительно Ря. Ясно, что гп являются «^„-измеримыми, и если Л € «^„, то $ zn+l dP = $ ^±1 dP = Р„+|(Л) = Р„(Д) = $ dP = $ zn dP. А A dPn+l A dPn А Отсюда следует, что относительно меры Р стохастическая последователь- ность 2 = (zrt, ^п)п^\ является мартингалом. Ключевым моментом во всей проблематике «абсолютная непрерыв- ность и сингулярность» является следующая Теорема 1. Пусть Р<Р. а) С (Р + Р)/2-вероятностью единица существует предел lim обозначаемый Zqq, такой, что P{Zoo = oo} = 0. Ь) Имеет место разложение Лебега Р(А) = § ZooЙР + Р(Л n{Zoo = oo}), Ае^, (3) А причем меры Р(Л n{Zoo = оо}) и Р(4), Д 6^, являются сингулярными. Доказательство. Прежде всего напомним, что, согласно классиче- скому разложению Лебега (формула (29) § 9 гл. III) произвольной ве- роятностной меры Р относительно вероятностной меры Р, имеет место представление Р(4) = § idP + P(4f-){j = 0}), Де^, (4) а 3
708 ГЛ. VII. МАРТИНГАЛЫ где _ dP dP 3 dQ' 3 dQ 1 - и в качестве меры Q можно взять, например, меру Q = -(Р + Р). Таким образом, формулу (3) можно рассматривать как конкретизацию общего разложения (4), связанную с той спецификой рассматриваемого случая, что Р^Р, т. е. Рл <^Prt, 1. ny"bJ» = g.3n = ^,Q. = i(P. + ₽.). Последовательности (зп, &п) и (Jrt, &п) относительно меры Q являются мартингалами, причем такими, что 0^зп ^2, ^2. Поэтому (теорема 2 § 4) существуют пределы Зоо — lim Joo — Нт Зп п п (5) как Q-n. н., так и в смысле сходимости в Ll(Sl, Q). Из сходимости в смысле ZJ(Q, Q), в частности, следует, что для любого Л\б 5 Зоо dQ ~ Нгп з« dQ = J/п dQ ~ Рт(Л) = Р(Л). А пГ°° А А Тогда из теоремы Каратеодори (§ 3 гл. II) вытекает, что для любого Л =.(ул) $э„</а=₽и). А dP . т. е. =3оо. и аналогично $3oodQ = P(Z), А dP т е- dQ-3oo- Таким образом, этим установлен естественно ожидаемый результат: если меры Р и Q заданы на <^ = a(U &п) м Prt, Qrt — сужения этих мер на то Q-n. н. и в смысле сходимости в L*(Q, Q) .. dPn _ dP п dQn~ dQ' Аналогично, .. dPn dP T dQn ~dQ•
§6. АБСОЛЮТНАЯ НЕПРЕРЫВНОСТЬ И СИНГУЛЯРНОСТЬ 709 (6) В рассматриваемом нами специальном случае, когда РЯ<^РЛ, п^1, нетрудно показать, что (Q-n. н.) z П Ъп' при этом Q{3„ = 0, In = 0} | [Р{ъп = 0} + Р{}п = 0}] = 0, так что в (6) не возникает (Q-n. н.) неопределенности вида 2 Выражение вида полагается, как обычно, равным +оо. Полезно отметить, что поскольку (зп, ^п) — неотрицательный мартингал, то из со- отношения (5) § 2 следует, что если зг = 0, тоз„ =0 для всех (Q-n. н.). То же, конечно, верно и для (зп, ^я). Отсюда вытекает, что для последова- тельности (zn)n^\ точки 0 и +оо являются «поглощающими состояниями». Из (5) и (6) вытекает, что Q-n. н. существует предел lim in г Zoo = Ит zn = р----------------------= — п 11ГП Зп Зоо (7) Поскольку Р{3оо = 0} = § Зоо dQ = О, ТО P{Zoo = оо} = 0, что и до- Ьоо=0} казывает утвержение а) теоремы. Для доказательства (3) воспользуемся общим разложением (4). В рас- dP сматриваемои нами ситуации и в силу уже доказанного з = —=3^, 3 = =3оо (Q-n. н.), и, значит, из (4) имеем и U Р(Л) = $ ^</Р + Р(ДП{Эоо = 0}), А 3°° откуда в силу (7) и того, что P{joo = 0} = О, получаем требуемое разложе- ние (3). Отметим, что поскольку P{Zoo <оо}= 1, то меры Р(Д) = Р(ЛП{гоо<оо}) и Р (4 n{Zoo = oo}), Ле<^, являются сингулярными. □ Из разложения Лебега (3) вытекают следующие полезные критерии аб- солютной непрерывности и сингулярности для локально абсолютно непре- рывных вероятностных мер. Теорема 2. Пусть Р < Р, т. е. Ря Рл, п > 1. Тогда ЫР<=> EzTO=l о P{Zoo <оо}=1, (8) Р±Р <=> EZoo = 0 Р{2оо=оо}=1, (9) где Е — усреднение по мере Р.
710 ГЛ. VII. МАРТИНГАЛЫ Доказательство. Полагая в (3) А = Q, находим, что EZoo = l 4* P{ZOC=00} = 0, (]Q) Ezoo = 0 Р{2оо = оо}=1. (Ц) Если P{Zoo = оо} = 0, то снова из (3) следует, что Р С Р. Обратно, пусть Р<^Р. Тогда поскольку P{Zoq = oo} = 0,то Р{г00 = оо}=г = 0. Далее, если Р ± Р, то существует множество В е& с Р(В) = 1 и PfB)^ = 0. Тогда из (3) Р(ВП{2оо = оо}) = 1 и, значит, Р{2оо = оо}= 1. Если же Р{2оо = оо} = 1, ТО СВОЙСТВО Р ± Р ОЧеВИДНО, поскольку Р{2оо = оо} = 0. □ 2. Из теоремы 2 ясно, что критерии абсолютной непрерывности и сингулярности можно выражать или в терминах меры Р (и проверять равенства Ezqo = 1 или Ezoo = 0) или же в терминах меры Р (и тогда проверять, что P{Zoo < оо} = 1 или Р{2оо = оо} = 1). В силу теоремы 5 § 6 гл. II условие Ezqq = 1 равносильно условию рав- номерной интегрируемости (по мере Р) семейства {zrt}rt^i. Это обстоятель- ство позволяет давать простые достаточные условия для абсолютной непрерывности Р«сР. Например, если sup E[zn ln+ zn] < оо (12) n или если sup Ez,}+e < оо, e > 0, (13) п то, согласно лемме 3 § 6 гл. II, семейство случайных величин {zn}n^i будет равномерно интегрируемым и, значит, Р <С Р. Во многих же случаях при проверке свойств абсолютной непрерыв- ности или сингулярности предпочтительнее использовать критерии, выра- женные в терминах меры Р, поскольку тогда дело сводится к исследованию P-вероятности «хвостового» события {Ио© < оо}, а для этого можно ис- пользовать утверждения типа закона «нуля или единицы». В качестве иллюстрации покажем, как из теоремы 2 выводится аль- тернатива Какутани. Пусть (Q, «^, Р) — некоторое вероятностное пространство, (/?°°, &оо) измеримое пространство числовых последовательностей х = (хь хг, • ••)с ^оо=^(/?°°), и пусть SSn = cr{xi,..., хп}. Предположим, что£ = (£ь • ’) и £ = (£ь6ь ...)—две последовательности, состоящие из независимых случайных величин. Обозначим через Р и Р распределения вероятностей на (/?°°, Жо) ДО* $ и £ соответственно, т. е. Р(В) = Р{£ е В}, Р(В) = Р{£ е В}, в е &<*>.
§6. АБСОЛЮТНАЯ НЕПРЕРЫВНОСТЬ И СИНГУЛЯРНОСТЬ 711 Пусть также Рп=Р\^п, Р„ = Р\Яп _сужения мер Р и Р на S3Bn и для А е^(Р‘) Р€.(Л) = Р{е»бЛ}, Р<л(4) = Р{ёя€Д}. Теорема 3 (альтернатива Какутани). Пусть С = (СьС2. •••) « С = = (Сь •••) —последовательности независимых случайных величин, для которых Р^Р^ «>1. (14) Тогда или Р<^Р, или Р ± Р. Доказательство. Условие (14), очевидно, равносильно условию, что Рп^Рп, n'z 1, т. е. Р<£.Р. Ясно, что где <7f(^) = ^-(x<). (15) Следовательно, {х: Zoo < 00} = {х: In Zoo < оо} = < х: ОО У7 I" 4i(xi) < 00 i=l ( °° 'j Событие <x: £ In <7/(x/)<oo> является «хвостовым». Поэтому в силу I *=i J закона «нуля или единицы» Колмогорова (теорема 1 § 1 гл. IV) вероят- ность Р{х : Zoo <оо} принимает только два значения (0 или 1) и, значит, по Гореме 2 или Р ± Р, или Р<^Р. □ 3. Следующая теорема дает критерий абсолютной непрерывности и сингулярности, выраженный в «предсказуемых» терминах. Теорема 4. Пусть Р Р,
712 ГЛ. VII. МАРТИНГАЛЫ с zo = 1. Тогда (<Я) = {0, О}) Р«р ф» р|2 1п=1 [1 - Е(л/5;|^п_1)] < оо > = 1, Доказательство. Поскольку Pn{zn = O}= zndP=O, (z„=0) ТО (Р-п. н.) п ( п у ?п = П а* = ехр< |п *• *=1 1а=1 (16) (17) (18) Полагая в (3) А = {2^=0}, находим, что P{zoo=0} = 0. Поэтому из (18) (Р-п. Н.^ {zTO < оо} = {0 < Zoo < оо} = {0 < 1™ 2п < ОО} = {л Л -оо < lim £ In од < оо I (19) *=1 ) Введем функцию X, |х|^1, sign х, |х|>1. Тогда п 1 Г п ' —оо < lim In од < оо ► = < -оо < lim У^ м(1п а*) < оо ► . л=1 J I *=1 (20) Пусть Ё означает усреднение по мере Рит? — ^-измеримая ин- тегрируемая случайная величина. Из свойств условных математических ожиданий следует (задача 4), что z„_i£(7?|^„-i) = E(j7Zn|^n-i) (Р-и Р-п.н.), (21) Efo|.F„_1)=z®_IEO?z„|.F,I_i) (Р-п.н.). (22) Вспоминая, что ап =^f_lzn, из (22) получаем следующую полезную версию «формулы пересчета условных математических ожиданий» ((44) § 7 гл. II): Ё(т?|<^п-1) = Е(апт?|Лг-i) (Р-п. н.), (23)
§6. АБСОЛЮТНАЯ НЕПРЕРЫВНОСТЬ И СИНГУЛЯРНОСТЬ 713 из которой, в частности, вытекает, что E(an\^n_i)=l (Р-п.н.). (24) Из (23) Ё[м(1п ап) = Е[алм(1п ап)\&п-\] (Р-п.н.). Поскольку хм (In х) х - 1 для всех х > 0, то в силу (24) Ё[м(1п ап) |^i] 0 (Р-п.н.). Отсюда следует, что стохастическая последовательность Х = (Хп, ^п) с = и^п Л=1 относительно меры Р является субмартингалом с |AXrt| = |м(1п ал)| 1. Тогда по теореме 5 из § 5 (Р-п. н.) *=1 U=i ' п < -оо < lim м(1п &k) < оо ► = {оо ’I ^2 Ё[«(1п a*) + u2(ln ak)\#k-i] <оо >. (25) k=i J Тем самым из (19), (20), (22) и (25) находим, что (Р-п.н.) ' оо ' {zTO <оо}= Ё[и(1п a*) + u2(ln а*)|^*_1] <оо ► = {оо У2 Е[а*м(1п ak) + а*и2(1п ak) |^k-\] < оо k=\ и, следовательно, в силу теоремы 2 Р<Р Р<У2 Е[а^м(1п ал) + одм2(1п a*)|^_i] <оо > = 1, U=i J Р±Р <=> Р< У2 E(Q^w(ln QJfe) + a^M2(ln а/г)|^_1]=оо! = 1. U=i J Заметим теперь, что в силу (24) (26) (27) : 7 - 9728 L
714 ГЛ. VII. МАРТИНГАЛЫ и для всех х > О найдутся такие константы А и В (0 < Д < В < оо), что Д(1 -л/х)2^хи(1п х) + хм2(1п х)+ 1 - х^В(1 -л/х)2. (28) Поэтому утверждения (16) и (17) следуют из (26), (27) и (24), (28). □ Следствие 1. Если для любого п 1 о-алгебры а{ап) и &п-\ неза- п д |°с _ висимы по мере Р {или Р) и Р^Р, то имеет место альтернатива: либо Р С Р, либо Р ± Р. При этом ЫРо 5? П -Е^/о^] <оо, л=1 Р±Р о [1 — Е^/о^] = оо. /1=1 В частности, в ситуации Какутани {см, теорему 3) an=qn и ЫР<=> ^2 I1 -ЕУ?п(х„)1<оо, Р±Р 22 [l-EV^)J = oo. /1=1 IOC Следствие 2. Пусть Р«:Р. Тогда ₽< 52 Е(а« 1п </1=1 => р«р. ' оо Для доказательства достаточно заметить, что для любого х О х In х + |(1 -х)> 1 -х1/2, (29) и воспользоваться (16) и (24). оо ___ Следствие 3. Поскольку ряд 52 [1 - E(v/c^|^’„_i)], состоящий из неотрицательных (Р-п, н.) членов, сходится или расходится одно- временно с рядом 22 |ln Е(\Л*/Г|<^п-1)|, то утверждениям (16) и (17) теоремы 4 можно придать следующую форму: р«р elf; 1,п e(7s;i<^-i)|<ooUi, 1/1=1 J Р±Р & р|22|1п £(^1^-1)1 = 00 1 = 1. 1/1=1 J (30) (31)
p{f Е[(1-а^|^]<оо} = 1, I П=1 J р]£ Е[(1-а„)2|^„_1] = оо[> = 1. . Я=1 , достаточно заметить, что для хе[1-Д, 1 + §6. АБСОЛЮТНАЯ НЕПРЕРЫВНОСТЬ И СИНГУЛЯРНОСТЬ 715 ______________________________________________________________ Следствие 4. Пусть существуют константы А и В такие, что < 1. 5>° и Р{1-Л^а„^14-В}=1, п>1. ~ ,0С Тогда если Р « Р, то Р<Р о Р±Р о Для доказательства О < А < 1, В 0, найдутся такие константы с и С (0 < с < С < оо), что с< 1 - х)2 (1 - л/х)2 sg С( 1 — х)2. (32) 4. Предположим, что £ = (£ь&> •••)» £ = (£ь£2> ...)—две гауссов- ские последовательности и (в обозначениях п. 2) Рп ~Рп, п 1. Покажем, как для таких последовательностей из полученных выше «предсказуемых» критериев следует «альтернатива Гаека—Фельдмана»: либо Р~Р> либо PLP. По теореме о нормальной корреляции (теорема 2 § 13 гл. II) условные математические ожидания Е(хп\£8п-\) и Ё(хп |<^л_1), где Е и £ —усред- нения по мерам Р и Р соответственно, являются линейными функциями от хь ..., xrt_b Обозначим эти (линейные) функции через ап_\(х) и art_i(x) соответственно (ао(х) = ао, ао(х) = uq — константы) и положим bn-i = (£[х„ -а„_1(х)]2)|/2, bn-i = (£(xn - a„_i (х)]2)1/2. По той же самой теореме о нормальной корреляции найдутся после- довательности £ = (ei, 52, ...) и f=(fi, в2> •••)» состоящие из независимых гауссовских случайных величин с нулевым средним и единичной диспер- сией, такие, что (Р-п. н.) £п = #п-1(£) + Ьп-\еп, ~ ~ ~ - (оо) = 1 (£) "1” 1£я. Заметим, что в случае Ьп_\ =0 (Ьп-\ =0) для построения величин еп приходится, вообще говоря, расширять вероятностное пространство. Однако если Ьп_\ =0, то распределение вектора (хь..., хп) сосредоточено (^-п. н.) на линейном многообразии xrt = art_i(x), и поскольку по предпо- ложению Рп~Рп, то bn^i =0, art_i(x) = art_i(x) и ай(х)= 1 (Р- и Р-п.н.). 7*
716 ГЛ. VII. МАРТИНГАЛЫ Поэтому без ограничения общности можно считать, что Ь„ > О, Ь„ > 0 при всех 1, поскольку в противном случае вклад соответствующих членов оо в сумму 52(1 -Е(у/а^\^п-1)] (см. (16) и (17)) равен нулю. п=1 Используя предположения о гауссовости, из (33) находим, что для п > 1, exp 2^_( (хп -а„-1(х))2 (хп - ая-1(х))2 2^-! (34)? где dn = lt>n/bnl и ao = £^i, ао = £^ь ^ = D£i, до2 = 0£1- Из (34) an-i(x)-a„^l(x) bn-i )’ i Поскольку In форму: ^0, то утверждение (30) принимает следующую 5|п 1 +dn-l 2da_l + ^л—1 / Дд— 1 (*) Дд— 1 (*) А 2 1 +d2_j ' t>n-\ / (35), оо 1 -|- dz °° Ряды 52 1° ол и 52(^2-i ~ О2 сходятся или расходятся одно- Л=1 Л=1 временно, поэтому из (35) следует, что 21 (36)| где Дл(х) = ал(х)-ал(х). J В силу линейности ап(х) и ап(х) последовательность случайных вели- {Дл(х) 1 образует гауссовскую систему (как по мере Р, так и по Оп ) n^O v мере Р). Как следует из приводимой далее леммы, *{Е(^)г<»}=' w
§ 6. АБСОЛЮТНАЯ НЕПРЕРЫВНОСТЬ И СИНГУЛЯРНОСТЬ 717 Поэтому из (36) находим, что р^р <=> Аналогичным образом Отсюда ясно, что если меры Р и Р не сингулярны, то РсР. Но по предположению Рп~Рп, 1; поэтому в силу симметрии Р<^Р. Тем самым имеет место следующая Теорема 5 (альтернатива Гаека—Фельдмана). Пусть £ = ($i, •••) и £ = (6, &, • • •) — две гауссовские последовательности, конечномер- ные распределения которых эквивалентны. Рп~Рп, п^\. Тогда либо Р~Р, либо Р1.Р. При этом Лемма. Пусть = — гауссовская последовательность, за- данная на (Q, &, Р). Тогда >0 о <=> £ Е^л <0°- /1=1 (39) Доказательство. Импликации (ф=) очевидны. Установим импликации (=>), предположив сначала, что E/3rt = 0, п^ 1. С этой целью достаточно показать, что /1=1 (оо -12 /1=1 (40) поскольку тогда из условия P{J2 < 00} > 0 будет следовать, что правая
718 ГЛ. VII. МАРТИНГАЛЫ оо часть в (40) меньше бесконечности. Значит, ^2 ^Рп < оо и в силу уже /i=i Г ос 'I установленных импликаций Р < 0п<ао( = 1* ln=l J Зафиксируем некоторое /г> 1. Тогда из §§ 11 и 13 гл. II следует, что можно найти такие независимые гауссовские случайные величины k= 1, ..., гс Е/З^п = 0, что п г 12^ = ^201 k=l /г=1 Если обозначить Е/3|п = A^rt, то легко найдем, что fe=l fe=l и Е ехр(- S $«)=П +2А*л)|/2- \ *=1 / *=1 (41) (42) Сравнивая правые части в (41) и (42), получаем п г k=[ k=\ 1 ~2 _ - Е С Ее *=1 п /Г2 _ - Е $ Ее *=| откуда предельным переходом (при п -* оо) получаем требуемое неравен- ство (40). Предположим теперь, что Е(Зп ^0. Рассмотрим новую последовательность /? = (&)«>! с тем же распре- делением, что и у последовательности /3=(/?л)я>ь и не зависящую от нее (в случае необходимости расширяя исходное вероятностное пространст- во). Тогда, если Р< ^2 & < оо I > 0, то р| J2 (/?« - 0п)2 < оо I > 0, и по ln=l J l/i=I ) доказанному 2 § Е(/3„ - Е/3„)2 = £ Е(& - Л)2 < оо. /1=1 /1=1 Так как (Е/3„)2 < 2/?2-+-2(/?„ - Е/?„)2,
§6. АБСОЛЮТНАЯ НЕПРЕРЫВНОСТЬ И СИНГУЛЯРНОСТЬ 719 То £(E/?rt)2 < оо и, значит, л=1 оо сю оо 53 Е/?2 = £ (Е/Зя)2 + £ Е(& - Е^п)2 < оо. П=1 П=1 П=1 □ 5. Продолжим рассмотрение примера из п. 3 предыдущего параграфа, предполагая, что Со» 6» ••• есть последовательность независимых гауссов- ских случайных величин с ЕС/ =0, DC/ = Ц > 0. Пусть снова %п+1 = ^л +Сп4-1» и > 0, где Хо = Со и 0 — неизвестный параметр, подлежащий оцениванию, —оо < <0<оо. Пусть вп — оценка, полученная по методу наименьших квадратов. Теорема 6. Для того чтобы последовательность оценок вп, л > 1, была сильно состоятельной, необходимо и достаточно, чтобы °° Vn V— =0°- „=о Vn+1 (43) Доказательство. Достаточность. Пусть Ре обозначает распре- деление вероятностей на (/?°°, ^оо)» отвечающее последовательности (Хо»Хь ...), когда значение неизвестного параметра есть 0. Пусть Ее — усреднение по мере Ре. Мы уже видели, что где п-1 А=0 Xk£k+\ Vk+l л-1 у 2 *=о Согласно лемме из предыдущего пункта, ^{(^00 = 00}=! о £Н^)ое=оо. Тем самым (Л1)оо = оо (Р^-п. н.) тогда и только тогда, когда оо Е 6=0 м I'fc+l = оо. (44)
720 ГЛ. VII. МАРТИНГАЛЫ k НоЗД2 = £ 02‘Ч_/ и /=о (45) Поэтому (44) следует из (43) и, согласно теореме 4, последовательность оценок 0rt, 1, сильно состоятельна при каждом в. Необходимость. Пусть для всех в Ро(Оп —>0) = 1. Покажем, что если #1 ^02» то меры Рех и Pq2 сингулярны (Pqx ±Р&2). Действительно, посколь- ку последовательность (Хо, Xi, ...) является гауссовской, то по теоре- ме 5 меры Рех и Ро2 или сингулярны, или эквивалентны. Но они не могут быть эквивалентными, поскольку если Рех~Ре2, но Р^(0Л —>0i) = 1, то ^2(0/1“>01)=: 1- Однако же Ре2(0п ->02) = 1 и ^0%. Тем самым Р$х ± Ре2 для в\ 0 02. Согласно (38), Рв,А.Рв2 & (0,_02)2^Ев1Г_^_ =00 л=о *+1 для 01 002. Беря 01 = 0 и 02 00, из (45) находим V- Ро±Ро2 & 52 уТ£“=0°’ /=о /+1 что и доказывает необходимость. □ 6. Задачи. 1. Доказать справедливость равенства (6). 2. Пусть Prt ~ Prt, п 1. Показать, что Р~Р о P{zoo <oo} = P{z00 >0}= 1, Р1Р О P{Zqo = Oo}= 1 ИЛИ P{Zoo=0}= 1. 3. Пусть Prt<cPrt, 1, т —момент остановки (относительно (<Frt)), Pr = Р | и Рт = Р | — сужения мер Р и Р на а-алгебру <^т. Показать, что РТ<РГ, если и только если {r = oo} = {zoo <оо} (Р-п. н.). (В частности, если Р{т<оо}= 1, то Рг сРг.) 4. Доказать «формулы пересчета» (21) и (22). 5. Проверить справедливость неравенств (28), (29), (32). 6. Доказать формулу (34).
§7. ОБ АСИМПТОТИКЕ ВЕРОЯТНОСТИ ВЫХОДА 721 7. Пусть в п. 2 последовательности £ = (£i,£2, ...) и £ = (£i,£2, ...) состоят из независимых одинаково распределенных случайных величин. Показать, что если , то Р < Р в том и только том случае, когда меры Р^ и Р^ совпадают. Если же Р^ < Р^ и / Р^, то Р ± Р. § 7. Об асимптотике вероятности выхода случайного блуждания за криволинейную границу 1. Пусть £i, £2, ... — последовательность независимых одинаково рас- пределенных случайных величин, Sn = £i +... + £я, g = g(n) — некоторая «граница», 1, g(l)<0 и r = inf{n> 1: Sn <g(n)} — тот первый момент, когда случайное блуждание (Sn)n^\ окажется ниже границы g = g(n). (Как обычно, т = оо, если {} = 0.) Отыскание точного вида распределения для момента т является весьма трудной задачей. В настоящем параграфе находится асимптотика веро- ятности Р{т>п} при я—*оо для широкого класса границ g = g(n) и в предположении, что величины £/ нормально распределены. Применяемый метод доказательства основан на идее «абсолютно непрерывной замены меры» и использует ряд изложенных выше свойств мартингалов и мар- ковских моментов. Теорема 1. Пусть £ь £2, ... — независимые одинаково распреде- ленные, £/ ~<Ж(0, 1), случайные величины. Предположим, что грани- ца g= g(n) такова, что g(l)<0 и для п^2 0^Д£(п+1)^Д£(/г), (1) где Ag(ti) = g(n) -g(n-l) и In п = о( y^[Ag(&)]2 j, n—»oo. (2) \Л=2 / Тогда {1 " 1 -к V [Ag(fe)]2(l+o(l)) k n—>co. (3) 2 * I k=2 ) Прежде чем переходить к доказательству, отметим, что условия (1) и (2) выполнены, если, скажем, g(n) = ап" + Ь, 1/2 < и 1, а + b < 0, а > О,
722 ГЛ. VII. МАРТИНГАЛЫ или (при больших п) g(n) = nvL(n), 1/2^1/^ 1, где Цп) — некоторая медленно меняющаяся функция (например, Цп) = = С(1п п)13 с любым /3 при 1 /2 < у < 1 и с /3 > 0 при и = 1/2, С > 0). 2. Следующие два вспомогательных предложения будут использовать- ся при доказательстве теоремы 1. Будем предполагать, что £i, ••• — последовательность независимых одинаково распределенных случайных величин, ^~<Ж(0, 1). Обозначим <^Ь = {0» О}, £я}, и пусть a = (art, &п_\) — предсказуемая последовательность с Р{|ал| С} = 1, и > 1, где С — некоторая константа. Образуем последовательность z = (zrt, ^п) с п . и 2п = exPS52a*&-5 £ ’’ 1. (4) 1Л=1 А=1 Нетрудно проверить, что (относительно меры Р) последовательность z = = (2п» <^л) образует мартингал с Ez« = 1, n > 1. Зафиксируем некоторое л > 1 и введем на измеримом пространстве (Q, (<Frt)n>i) вероятностную меру Рп, полагая Рл(Л) = Е/(Д)2л, (5) Лемма 1 (дискретная версия «теоремы Гирсанова»). Относитель- но меры Рл случайные величины ^k = ^k — ak, являются независимыми и нормально распределенными, &~«Ж(0, 1). Доказательство. Пусть символ Ёл означает усреднение по мере Р„. Тогда для Xk е /?, 1 k п, {п п 'I * 52I=Е ехр v 52 А*& }Zn k=\ I k=\ J Теперь требуемое утверждение вытекает из теоремы 4 § 12 гл. II. □ Лемма 2. Пусть X = (Хп, ^п)п^\ — квадратично интегрируемый мартингал с нулевым средним и а = inf{n > 1: Хп -Ь}у
§7. ОБ АСИМПТОТИКЕ ВЕРОЯТНОСТИ ВЫХОДА 723 где константа Ь>0. Предположим, что P{Xi<-b}>0. Тогда существует константа С > 0 такая, что для всех п 1 Р{а>Л}>Ё^- (6) Доказательство. По следствию 1 к теореме 1 § 2 ЕХ<,Ля = 0, откуда -E/(a^n)X<r = Ef(a>n)Xn. (7) На множестве {ст п} -Ха^Ь>0. Поэтому при п 1 —Е/(ст п)Ха > ЬР{а О) > ЬР{а = 1} = />Р{%1 < -Ь} > 0. (8) С другой стороны, в силу неравенства Коши—Буняковского Е/(ст > п)Хп < [Р{ст > п} ЕХ2] '/2, (9) что вместе с (7) и (8) приводит нас к требуемому неравенству с С = = {6P{X1<-ft}]2. □ Доказательство теоремы 1. Достаточно показать, что lim In P{r>n} / V [Ag(*)]2>-5 (Ю) ' Л=2 И Шй 1пР{т>«} /£ [Д£(*)]ЧЦ. (11) Л->°° ' 4=2 С этой целью рассмотрим (неслучайную) последовательность (ая)я^1 с а|=0, a„ = Ag(n), п >2, и вероятностные меры (Ря)я>ь определенные формулой (5). Тогда в силу неравенства Гёльдера ₽я{т > п} = Е/(т > n)zn (Р{т > n^iEz^/P, (12) гДв р > 1 и q = j. Последний сомножитель легко вычисляется в явном виде: (EzP)l/P = ехр( £ {Д^)]21. (13) I k=2 )
724 ГЛ. VII. МАРТИНГАЛЫ Оценим теперь вероятность Рп{т>п}, входящую в левую часть (12). Имеем Рп{т >п} = P„{S* > g(k), 1 < k < п} = Рп{5к > g(\), u k n}, k _ _ _ • где Sfe = 52 6’, 6 =Ci ~ai- Согласно лемме 1 величины Ci, •••, Си по меРе /=1 Рл являются независимыми и нормально распределенными, §~<Ж(0, 1). Тогда по лемме 2 (примененной к 6 = -g(l), Р = Prt, Хп = Sn) находим, что ₽{т >«}>£, (14) где С — некоторая константа. Тогда из (12)—(14) следует, что для любого р > 1 {п ~2 52 “ 7Z7 1п п - k=2 Р (15) где Ср — некоторая константа. Из условий теоремы и в силу произволь- ности р 1 из (15) получаем оценку снизу (10). Для получения оценки сверху (11) прежде всего заметим, что поскольку zn>0 (Р- и Ря-п.н.), то в силу (5) Р{т > п} = Ёя/(т > n)z~\ (16) где Ё„ — усреднение по мере Рп. В рассматриваемом нами случае cti=O, art = Ag(n), п ^2, поэтому для п^2 {п 1 п - 22 дя(*)&+£ 221д^)12 >• *=2 Л=2 По формуле суммирования по частям (см. доказательство леммы 2 в § 3 гл. IV) 22 де(*) • Са = Ag(«) • - 22 д(д£(*)), k=2 k=2 откуда с учетом того, что по условиям теоремы Ag(&) ^0, A(Ag(&)) ^0, находим, что на множестве {т > п} = {Sk g{k), 1 k п} ^g{k)-^^g(n) g{n)-Y^ g(ft-l)A(A^))-e1Ag(2) = Jfe=2 Л=3 = 22 [Д£(< + £(l)4g(2)-6Д?(2). Л=2
§7. ОБ АСИМПТОТИКЕ ВЕРОЯТНОСТИ ВЫХОДА 725 Итак, из (16) {1 1 ~ ~2 52 [Дг(Л)]2-г(1)Дг(2)>Ёя/(т>п)е-«,лв(2> = k=2 f \ П 1 = exp{-g(l)Ag(2)} ехр< 1Д£<*)12 ]^п1(т>п)е~^^2\ . А=2 J где Ея/(т > д)е_?|Лг<2) Ez„e_?|Ag<2) = Ee_?|Ag(2) < оо. Поэтому {I " 1 ~2 1Д^)12 р *=2 J где С — некоторая положительная константа, что и доказывает оценку сверху (11). □ 3. Идеи абсолютно непрерывной замены меры позволяют исследовать аналогичную задачу и для случая двусторонних границ. Приведем (без доказательства) один из результатов в этом направлении. Теорема 2. Пусть ••• — независимые одинаково распре- деленные, £/~<Ж(0, 1), случайные величины. Предположим, что f = f(n) — положительная функция такая, что f(ri) —* оо, п —> оо, и п / п \ 22 [Aft*)]2 = о I 22 f~2(*)) > п->оо. k=2 \k=[ / Тогда, если а = inf{n > 1: |Srt| f(n)}, то {2 п ) -у 52/-2(Л)(1+о(1)) >, ZI-+OO. (17) *=1 ) 4. Задачи. 1. Показать, что последовательность, определенная в (4), является мар- тингалом. Верно ли это без условия |art| с (Р-п. н.), n > 1? 2. Установить справедливость формулы (13). 3. Доказать формулу (17).
726 ГЛ. VII. МАРТИНГАЛЫ § 8. Центральная предельная теорема для сумм зависимых случайных величин 1. В § 4 гл. III центральная предельная теорема для сумм Sn =£ni + ... • • ‘ +£>пп, случайных величин £Л1,..., С™ доказывалась в предположе- нии их независимости, конечности вторых моментов и предельной пренебрегаемости слагаемых. В настоящем параграфе мы отказываемся как от предположения независимости, так и от предположения конечности даже абсолютных моментов первого порядка. Однако предельная прене- брегаемость слагаемых будет предполагаться. Итак, будем считать, что на вероятностном пространстве (П, &, Р) заданы стохастические последовательности с %nQ = 0, = {0, П}, С ^+1 С & (k -I-1 п). Положим И] \ fe=0 Теорема 1. Пусть для фиксированного 0< / 1 выполнены следу- ющие условия: для всякого ее (0, 1] при п—юо (А) £Р(|еяА|>е|^л-1)^0, А=1 1/1/1 (В) *=i (С) £ D[U/(|U| -af, где >0. *=| Тогда Замечание 1. Условия (А) и (В) обеспечивают возможность пред- р («И ставления величин X/ в виде X/ = Ytn + Z/ с Z/—>0 и Ytn = ^2 ЧпЬ &=о где последовательности rf1 = (т)пь, являются мартингал-разностями, Е(77я*|<^г_1) = О, с равномерно по l^k^n и я>1. Тем са- мым (в рассматриваемых условиях) доказательство теоремы сводится, по существу, к доказательству центральной предельной теоремы для последовательностей, образующих мартингал-разность.
§8. ЦЕНТРАЛЬНАЯ ПРЕДЕЛЬНАЯ ТЕОРЕМА 727 В том случае, когда величины Си,...»являются независимыми, условия (А), (В), (С) при t = 1 превращаются в условия (<т2 = <т2): п (а) £ Р{|^|>£}-0, k=\ п (Ь) £ек„*/(|с*|^)]-о, k=l п (С) fc=i хорошо известные по книге Б. В. Гнеденко и А. Н. Колмогорова [16]. Тем самым из теоремы 1 получаем такое Следствие. Если Cni.---.6wi — независимые случайные величины, 1, то п (а), (Ь), (с) => ХГ = о2). k=l Замечание 2. В условии (С) не исключается случай = Тем са- мым, в частности, теорема 1 дает условия сходимости к вырожденному распределению (X/ Л 0). Замечание 3. Метод доказательства теоремы 1 позволяет сформули- ровать и доказать следующее более общее утверждение. Пусть 0</j < /г < ••• < tj 1, ••• и в], — неза- висимые гауссовские случайные величины с нулевыми средними и Ее| = = СГ?*-"€Г^1- Образуем гауссовский вектор (IF/,, ..., Wt.) с Wtk—e\ + ... ••• +е*. Пусть условия (А), (В), (С) выполнены для t = t\, ..., Тогда сов- местное распределение t. случайных величин слабо сходится к гауссовскому распределению величин (Wtl,..., Wtf): рп ™р Замечание 4. Пусть (crf)o^i — непрерывная неубывающая функция, Оо = 0. Обозначим через W = (IF/)o</^i процесс броуновского движения (винеровский процесс) с EIF, =0 и В § 13 гл. II такой процесс определяется для rf = t. Без этого предположения такой процесс опре- делялся аналогичным образом как гауссовский процесс W = (1F/)o^i с независимыми приращениями, IFo = O и ковариационной функцией r(s, /) = = rnin(of, of). В общей теории случайных процессов показывается, что всегда существует такой процесс с непрерывными траекториями. (В случае = / такой процесс называют стандартным броуновским движением.)
728 ГЛ. VII. МАРТИНГАЛЫ Если обозначать через Рп и Р распределения вероятностей процессов Хп и W в функциональном пространстве (D, S§(D)) (см. п. 7 § 2 гл. II), то можно утверждать, что условия (А), (В) и (С), выполненные при всех 0</^ 1, будут обеспечивать не только отмеченную слабую сходи- мость конечномерных распределений (Р^ t Pti../., t\ < /2 < • • • < tj t, / = 1,2, ...), но и функциональную сходимость, т. е. слабую сходи- мость распределений Рп процессов Хп к распределению процесса W. (Подробности см. в [5], [91], [87]). Этот результат обычно называют функциональной центральной предельной теоремой или принципом инвариантности (Донскера—Прохорова, когда величины ..., £пп независимы, 1). 2. Теорема 2. 1. Условие (А) эквивалентно условию равномерной предельной пренебрегаемости (равномерной асимптотической ма- лости) (А*) .Ж л 2. В предположении (А), или (А*), условие (С) эквивалентно усло- вию HI (С*) £ k=Q (В (А*) и (С*) значение t то же, что в (А) и (С).) Теорема 3. Пусть при каждом п 1 последовательность является квадратично интегрируемой мартингал-разностью, т. е. Е& < 00 “ Е(61* I ^А-1) = °- Пусть выполнено условие Линдеберга*. для е > О (L) £ 6=1 Тогда условие (С) эквивалентно условию (1) где (квадратическая характеристика) HI (2) /г=1
§8. ЦЕНТРАЛЬНАЯ ПРЕДЕЛЬНАЯ ТЕОРЕМА 729 а условие (С*) эквивалентно условию (3) где (квадратическая вариация) («Л [ХЯЬ = Е&. (4) &=1 Из теорем 1—3 вытекает Теорема 4. Пусть для квадратично интегрируемых мартингал- разностей £п = (£nk, п Ь выполнено (для данного 0 < t 1) усло- вие Линдеберга (L). Тогда И] £ Е(&=* Х?±Л(0, <&, (5) л=1 |«Л =* (6) Л=1 3. Доказательство теоремы 1. Представим X" в следующем виде: =Е < n+£ ^(i^i > d= *=1 *=i [«Л («Л =Е E[u/(ie„*i 1 W-j+Е > ’)+ Л=1 *=1 |л/| + £{^/(16^ 1)-ЕКяЛИ«л|< 1)W-|]}- (7) Л=1 Обозначим hd b?=Ee[^/(IUI<1)I^-iL *=< (8) м2(Г)=/«ялеГ), ^(D = P(Uer|^_1), где Г — множество из наименьшей а-алгебры ^о = сг(^)» порожден- ной системой множеств в /?о = Я\{О}, состоящей из конечных сумм непересекающихся интервалов вида (а, 6], не содержащих точку {0}, а P(£nk 6 — регулярное условное распределение относительно ^-алгебры
730 ГЛ. VII. МАРТИНГАЛЫ Тогда представление (7) можно переписать в следующем виде: [П/J п] X? = B? + $2 S + E S (9) Л=1 {|х|>1} ь=1 {|х|^1} Представление (9) называют каноническим разложением последова- тельности (X", ^^])- (Все интегралы понимаются как интегралы Лебега— Стилтьеса, определенные для каждого элементарного исхода.) р Согласно условию (В), В/ —>0. Покажем, что в силу условия (А) И] Е S *=1 {|х|>1) Имеем [nZ] |Я/1 $2 $ и^=22 iui/(i^i>i). *=1 {|х|>1} k=l (Ю) (11) Для вся^эго 6 е (0, 1) М т f |п/] < £&A|/(i^i>i)>4c<E л=\ J U=i /(|UI>1)>4- (12) Ясно, что Ы Н] 52/<1^1>1)=52 S *=1 Л>=| {|х|>1) По условию (А) (л/) и^Е S (13) Ь=1 {|х|>0 причем Vg являются -измеримыми. Тогда в силу следствия к теореме 4 § 3 => Цяп,]-0. (14) Заметим, что в силу того же следствия и неравенства 1 имеет место и обратная импликация ЦЯл^0 => ^]До, (15) которая будет использована при доказательстве теоремы 2. Из формул (И)—(14) получаем требуемое утверждение (10).
§8. ЦЕНТРАЛЬНАЯ ПРЕДЕЛЬНАЯ ТЕОРЕМА 731 Итак, X? = Y“ + Z?, (16) где Yt=X S (17) *=1 {|Х|^1} а [«И г;=в;+52 $ х^До. (18) k=\ {|х|>1} В силу задачи 1 отсюда следует, что для доказательства сходимости Х“ <Ж(0, of) надо лишь доказать, что У«4^(0,^). (19) Представим У/1 в виде (ее (О, 1]) У/я=7Гп/|(е) + Дм(е). где HI ^](£) = Е S (20) k=i {е<и«гп Hl д|л/1(£) = Е S *<*(м2-Ф- (2D *=! {|х|^е} Как и при доказательстве (10), легко устанавливается, что в силу уело- вия (A) 7я„,](е) До, п-»оо. Последовательность Д"(£) = (Д£(е), «F£), 1 k п, является квадра- тично интегрируемым мартингалом с квадратической характеристикой (дя(е))* = Е S x2di^-( xdv?\2 = i=i MM<e) / . /=1 В силу условия (С) (ДП(£))И] Да,2.
732 ГЛ. VII. МАРТИНГАЛЫ Тем самым для любого е е (0, 1 ] max{7fnZ)(e), |<Д”(е)>(п/] -af|}-^0. Согласно задаче 2, тогда найдется последовательность чисел еп 10 та- ких, что 7fnd(^)-0, (Дя(£п))И1Ла2. Поэтому опять-таки в силу утверждения задачи 1 достаточно лишь доказать, что (22) где k = Х $ xd^-v?). (23) i=l {|х|^я} Пусть для Г е д?(П=/(дл«2бР, ^(Г)=Р(Д^€Г|^Я_1) — регулярная условная вероятность, AAfJJ = Mnk — Mnk_x, k 1, Afg = 0. То- гда квадратично интегрируемый мартингал Мп = (A1J, «^), 1 k /г, может быть, очевидно, записан в виде k k Mnk = ^^Mi=H S xd$- i=l i=I {\x\^2em} (Заметим, что в силу (23) |ДЛ1"| 2ел.) Для доказательства (22) надо, согласно теореме 1 из § 3 гл. III, пока- зать, что для всякого действительного А А2<72 е ^24) Обозначим k g?=£ S (eiAx-i)dp; /=1 {|х|^2ея} И k <^(СП) = П(, + Д0")- /=1 Заметим, что 1+Дбг = 1+ $ (е‘Хх-\)а^ = Е(е1Х^\^_1) (|x|^2s„}
§8. ЦЕНТРАЛЬНАЯ ПРЕДЕЛЬНАЯ ТЕОРЕМА 733 и следовательно, k <(0") = П Е(е‘^М" l<^"-i)- /=1 В соответствии с доказываемой в п. 4 леммой для проверки (24) доста- точно показать, что для любого действительного А («Л П 1^» ^ /=1 >с(А)>0 (25) Х2_2 (26) С этой целью представим <£^(Grt) в следующем виде: k ^(Gn) = eal JJ (1+AG;)«?-ag’. /=1 (Ср. с функцией <£}(Д), определенной формулой (76) в § 6 гл. II.) Поскольку хб/Р? = Е(ДЛ/Л^Д.1) = О, {kick} то k G*=S S (eiXx -l-iXxjdv1!. (27) /=1 {|x|^2en} Значит, \2 \2 |AG£|< $ \eiXx-\-iXx\di^±- $ x2di% у (2e„)2-0 (28) и k »2 k \2 ^|ag;i<^-J2 S x2dq = ^{Mn}k. (29) /=1 /=1 Согласно условию (С), (Л/я)|я<1-а2. (30)
734 ГЛ. VII. МАРТИНГАЛЫ Предположим сначала, что (Л4Л)[Л/) (Р-п. н.). Тогда в силу (28), (29) и задачи 3 заведомо [л/] (1 + AG£)e“AG* -^>1, п —> оо, л=1 и, значит, для доказательства (26) достаточно лишь установить, что О \2zr2 <31> или (ввиду (27), (29) и (30)) что [rt/J 2 2 £ $ (е/Аж — 1 —/Л* +-у-) 0. (32) Л=1 {|х|^2ея} Х и I /Ах 1 \ । А2Х2 I |Ах|3 Но е|АХ - 1 - /Ах Н—тг- L-zJ-, и поэтому I 2 I о И) t I \2 2 . 11|3 М 52 J |ezAx —1—/АхЧ—*52 S x2di>£ = Ь=1 {|х|^2ея} k=\ {|х|^2ея} = !ф>(Л1«) п — оо. Тем самым, если (ЛГ)(П/] (Р-п. н.), то (31), а значит, и (26), доказано. (Лх)2 Проверим теперь свойство (25). Поскольку |е/Лх — 1 -/Ах| то в силу (28) находим, что для достаточно больших п k k е': Но (для достаточно больших п) 1п(1-^Д<ЛП/) \2 Л2 1 - уД^»)/ с Д(Мп), (2еп)210, п —► оо. Поэтому найдется такое по = ио(А), что для всех п /го (А) К(СП)1^^Л2<Л1Ъ и, значит, K["/|(G")I >е~х1а.
§8. ЦЕНТРАЛЬНАЯ ПРЕДЕЛЬНАЯ ТЕОРЕМА 735 Тем самым в предположении (Afrt)[rt/j (Р-п. н.) теорема доказана. Чтобы снять это предположение, поступим следующим образом. Положим rn = inf{*CH]: (Mn)k>^ + 1}, считая тп = оо^если {Мn)[n/| < of + 1. Тогда для Мп = М^Лт„ имеем (Мп > (п/| = {Мп > |Я/] Лт„ 1 + + 24 < 1 + aj + 2ef (= а) и по доказанному Л2ет2 EgiAAff,,! е Но lim -е'лЛ|»'|)| 2 lim Р{тп < оо} = 0. п п Поэтому lim Ее,АЛ1И'| = lim Е(е'АЛ*м — е'АЛм) + Пт Ee'A^M = е 2х. п п п Замечание. Чтобы доказать утверждение, сформулированное в заме- чании 2 к теореме 1, надо (в соответствии с приемом Крамера—Уолда [5]) доказать, что для любых действительных Aj,..., А/ Доказательство этого соотношения проводится тем же самым обра- зом, что и доказательство соотношения (24), но вместо (Af^, следует рассматривать квадратично интегрируемые мартингалы (Mnk, с k Mnk=Y< /=1 где ц= Al для i [n/j] и ц- = А* для [ntk-i ] <i 2 j. 4. В этом пункте будет доказана одна простая лемма, позволившая свести проверку (24) к проверке (25) и (26).
736 ГЛ. VII. МАРТИНГАЛЫ Пусть rf = (T)nk, 1 fe и, и 1, — стохастические последователь- ности, Уп = 53 Г)пк, k=l <Г(А) = J] Е(е'А’«‘ А6R, /?=1 Y — случайная величина с <?(X) = EeiXY, XeR. Лемма. Если (для данного A) |<?rt(A)| ^с(А)>0, и; димости t i, то для схо- Eeixyn^EeiXY (33) достаточна сходимость ^п(Х)^^(Х). (34) Доказательство. Пусть р/Ауп тП^=Лу Тогда |т"(А)| с-1 (А) < оо и легко проверяется, что Ет"(А)=1. Поэтому в силу (34) и теоремы Лебега о мажорируемой сходимости |Ее'АГ” - Ее‘х¥| = |Е(е'АГ" - <Г(А))| |Е(тп(А)[£п(А) - ^(А)])| С ^с-|(А)Е|<^"(А)-<?(А)|—>0, п —оо. □ Замечание. Из (33) и предположения |<?Л(А)| ^с(А)>0 вытекает, что <?(А) 0. Утверждение леммы на самом деле сохраняет свою силу и без предположения |<?rt(A)| ^с(А) >0 в следующей формулировке: если р <?rt(A) —><?(А) и <?(А)0О, то имеет место сходимость (33) (задача 5). 5. Доказательство теоремы 2. 1. Пусть е > 0, 5 е (0, е), и для про- стоты пусть t = 1. Поскольку п max И„*|^£ + V |Сл*|ЛИл*|>е) f—' Я=1 И п ( п 52 '(i^i >£) > 4 я 52 >£) >5 k=l J lfe=l
§8. ЦЕНТРАЛЬНАЯ ПРЕДЕЛЬНАЯ ТЕОРЕМА 737 ТО {п ( п Л £/(|6*|>е)>О = Р{£ $ drt>6\. *=1 U=1 {|x|>s} J {Л 1 5 dv£ >6 >—>0, то (ср. с (10)) 4=1 (|х|>е} J и р| Е $ dfi^ ><5 > —>0. Тем самым (А) => (А*). ’•*=1 (|x|>£} -I Обратно, пусть выполнено условие (А*). Положим an = min(fc^n: |£«*| > f }, считая стп = оо, если max |Спй| < х-В силу (A*) lim Р{ая < оо} = 0. \^k^n 2. П Заметим теперь, что для любого 5 е (0, 1) множества max k^n/\<yn * ' ПЛ<7Я и I Л=1 совпадают и по условию (А*) П/\СГп П/\СГп Л=1 л=1 $ ^До. {м>!} Поэтому в силу (15) пЛая ПЛ<7Я § drf^O, k=l {|х|>в} Л=1 {|х|^|} что вместе со свойством lim P{art <оо} = 0 доказывает импликацию (А*) => (А). 2. Снова будем считать t = 1. Зафиксируем некоторое eG (0, 1] и рас- смотрим квадратично интегрируемые мартингалы (см. (21)) Д"(5) = (ДЖЛ"), с 6 е (0, е]. В соответствии с условием (С) для данного е G (0, 1] (Дя(£))„ Да?. Отсюда в силу условия (А) легко выводится, что тогда и для всякого (0, е] (Дя(5))„Да?. (35)
738 ГЛ. VII. МАРТИНГАЛЫ Покажем, что из условий (С*) и (А), или, равносильно, из условий (С*) и (А*), вытекает, что для всякого 6 е (0, е] [Дл(<5)]я Да?, где п г I2 [Д"(<5)]п=^2 W(IUI^)~ $ Xdvnk . *=i L Действительно, легко проверить, что в силу (А) [Дп(<5)]„ — [Д”(1)]я Д 0. (36) (37) Но п 2 п 2 52 $ Xdrf -^2 Сл*/(|€л*|^ 1)- $ Xdi^ k=i L <|х|<п J a=i L <и$п п \ 1)fe + 2l^|- Л=1 5 xd(fink-i£) <|х|<1} п ^5£/(Ы>1)^5 max я=1 п $ ^До. *=1 {|х|>1} (38) Поэтому (36) следует из (37) и (38). Таким образом, чтобы доказать эквивалентность условий (С) и (С*), достаточно установить, что как при выполнении условия (С) (для данного ее (0, 1]), так и при выполнении условия (С*) для всякого а >0 lim Пй Р{|[ДЯ(5)]„ - (Д” (<$))„ | > а} = 0. (39) о—>0 п Пусть mnk(6) = [Дл(5)]k - (Д"(5))л, 1 k п. Последовательность mn(S) = (m^(S), является квадратично интегрируемым мартингалом, при этом (тп(6))2 доминируется (в смысле определения из § 3) последо- вательностями [тл(5)] и (тп(6)). Ясно, что п [тп(6)]п = ^ (^т^2 < 1Дт2(^)1 • {[ДПЖ + <ДЯ(5)М f—' l^k^n I k=\ ^362{[^n(S)]n + WS)}nY (40) Поскольку [Д'1 (5)] и (Дл(5)) доминируют друг друга, то из (40) вытекает, I что (тп(6))2 доминируются последовательностями 662[Дл(5)] и 652(ДЛ(5)). д
§8. ЦЕНТРАЛЬНАЯ ПРЕДЕЛЬНАЯ ТЕОРЕМА 739 Поэтому если выполнено условие (С), то при достаточно малом 6 (например, при 62 < min(e, + 1))) Пт Р{6<52(4я(<?))„ >b} = О п и, значит, в силу следствия к теореме 4 из § 3 имеет место (39). Если же выполнено условие (С*), то при том же 5 iiS Р{652[4я(<$)]„> 6} = 0. (41) п Поскольку |Д[ДЯ(£)]*| (2<J)2, то (39) следует из (41) и опять-таки из следствия к теореме 4 § 3. □ 6. Доказательство теоремы 3. С учетом условия Линдеберга (L) эквивалентность условий (С) и (1), а также (С*) и (3) проверяется прямым подсчетом (задача 6). 7. Доказательство теоремы 4. Условие (А) следует из условия Линдеберга (L). Что же касается выполнения условия (В), то достаточно заметить, что в случае, когда £п образуют мартингал-разность, величи- ны В", входящие в каноническое разложение (9), могут быть представлены в виде Н] = xdvnk. k=\ {|х|>1} Поэтому В" -^>0 в силу условия Линдеберга (L). 8. Основная теорема настоящего параграфа — теорема 1 — дока- зывалась в предположении равномерной асимптотической малости суммируемых слагаемых. Естественен вопрос об условиях справедливости центральной предельной теоремы без этого предположения. Для случая независимых случайных величин примером такой теоремы является тео- рема 1 § 5 гл. III (в предположении конечности вторых моментов). Приведем (без доказательства) аналог этой теоремы, ограничиваясь случаем последовательностей £п = (gnk, l^k^n, образующих квад- ратично интегрируемую мартингал-разность (Е£2л<оо, Е(^ |^_|) = 0). Обозначим Fnk(x) = P(£nk * I^£-1) регулярную функцию распределе- ния ^nk относительно и пусть Д^ = Е(£2^ |^__j). Теорема 5. Если для квадратично интегрируемых мартингал- разностей £п = (&nk, 0 k и, п 1, выполнены следующие усло- вия'. П) 0^<т2<оо, 0^/^1, Л=1
740 ГЛ. VII. МАРТИНГАЛЫ и для всякого е > 0 то 9. Задачи. 1. Пусть & = +Сь О 1, где Т]п а & -^0. Доказать, что Луу. 2. Пусть (£rt(e)), 1, е>0, — семейство случайных величин таких, что р для каждого е>0 £п(е) —>0 при п—>оо. Используя, например, утверждение задачи 11 в § 10 гл. II, доказать, что найдется такая последовательность €„10, ЧТО £„(£„)—>0. 3. Пусть (а£), 1 ^k^n, 1, —такие комплекснозначные случайные величины, что (Р-п. н.) п , £М|С С, |а£|<а„10. ' k=\ Показать, что тогда (Р-п. н.) lim П 0 = 1. п £=1 4. Провести доказательство утверждения, сформулированного в заме- чании 2 к теореме 1. 5. Доказать утверждение, сформулированное в замечании к лемме. 6. Дать доказательство теоремы 3. 7. Доказать теорему 5. § 9. Дискретная версия формулы Ито 1. В стохастическом анализе броуновского движения и родствен- ных ему процессов (мартингалы, локальные мартингалы, семимартинга- лы, ...) исключительная роль принадлежит формуле замены переменных К. Ито. В настоящем параграфе рассматривается дискретная версия | этой формулы и показывается, как из нее предельным переходом можно | было бы получить и формулу К. Ито для броуновского движения. | 2. Пусть X = (Xrt)o^w и Y = (Kn)o^w — две последовательности I случайных величин, заданных на вероятностном пространстве (П, Р), | Хо = Уо = Ои 1 [X, У] = ([Х, Y]n)Q^N,
§9. ДИСКРЕТНАЯ ВЕРСИЯ ФОРМУЛЫ ИТО 741 где и,у]»=Ешп, (о k=\ есть квадратическая ковариация последовательностей X и Y (см. § 1). Будем предполагать, что задана функция F = F(x), являющаяся абсо- лютно непрерывной: F(x) = F(0) + $/(y)^, (2) о где f = f(y) — борелевская функция на R такая, что $ \f(y)\dy<co для всякого с > 0. Формула замены переменных, о которой будет идти речь, дает пред- ставление для последовательности F(X)^(F(Xn))WN (3) в терминах «естественных» функционалов от последовательности X = == • Рассмотрим квадратическую ковариацию [X, ДХ)] последовательно- стей X и ДХ) = (ДХл))о^ту, где / = Дх), хе/?, есть функция из пред- ставления (2). Согласно (1), [X bf(Xk)bXk = £ (/№) - f(Xft_,))(XA - Х*-1). (4) *=1 *=| Если ввести два «дискретных интеграла» (ср. с определением 5 в § 1) /„(X, f(X)) = £ /№_1)ДХЪ 1 С п N, (5) Л=1 и 7„(X, /(X)) = £ f(Xk)^Xk, Kn^N, (6) Л=1 то квадратическую ковариацию можно представить в следующем виде: [X, /(Х)]я = 7„(Х, ДХ)) - /Я(Х, ДХ)). (7) (В случае п = 0 полагаем /о = То = 0.)
742 ГЛ. VII. МАРТИНГАЛЫ Для фиксированного в наших рассмотрениях числа N введем новую («обращенную») последовательность X = (Хг)о^я^, полагая Xrt=Xyv-n- (8) Ясно, что ~IN(X, f(X)) = -IN(X, f(X)) и, аналогично, Jn(X, = f(X))-lN-n(X, f(X))}. Отсюда и из (7) заключаем, что [X, f(X)]N = -{IN(X, f(X)) + lN(X, f(X))} и для 0 < п < N [X, f(X)]n = _{lN(X, f(X))-lN_n(X, f(X))}-/„(X, f(X)) = (k=N-n+l n f(xk.t)^k+22 f(xk-^xk >. k=i (9) Замечание. Полезно отметить разную структуру представлений квад- ратической ковариации [X, /(Х)])я, задаваемых формулами (7) и (9). В (7) п «интеграл» /„(X, /(Х)) = £ f(Xk-\)&Xk образуется так, что на интервале k=\ [&-!,£] значение f(Xk-\) (в «левом» конце) умножается на приращение ^Xk=Xk -Х/г-1 на всем этом интервале. «Интеграл» же 7rt(X, f(X)) обра- зуется по-другому — на приращение ДХ^=Х^ — X*-i умножается значение в «правом» конце интервала [k— 1, k], т. е. значение Xk. Таким образом, можно сказать, что формула (7) содержит как «прямой интеграл 1п(Х, /(X))», так и «обратный интеграл 7Л(Х, f(X))». В формуле же (9) все «интегралы» являются «прямыми» (для последовательностей X иХ). 3. Поскольку для каждой функции g = g(x) gtXk-i) + i te(xA) - г(хА_!)] - i(g(x*)+g(xA_,)]=o, TO ясно, что n 1 F(Xn) = F(X0) + 22 g(XA-i)4X* + I [*. gWb + k=l +Z {-^-i)) - 8(Xk-l)2+8{X^^x.y (10) *=1 k
§9. ДИСКРЕТНАЯ ВЕРСИЯ ФОРМУЛЫ ИТО 743 В частности, если g(x) = /(х), где f = f(x) — функция из представления (2), то F(Xn) = F(X0) + ln(X, f(X)) + 1 [X, f(X)]n + Rn(X, f(X)), (11) ГДв n X Rn(X, f(X)) = £ $ [f(x)~ Z(^-l)2+ Z-(Xft)]rfx. (12) fc=l Из математического анализа хорошо известно, что если функция f"(x) непрерывна, то справедлива «формула трапеции»: a L а = (Ь~2^ S х^х ~ + x(b ~ а»>dx = = f 'W + Х(Ь - а))) $ х(х - 1) dx = - fin), где £ (х), хит; есть некоторые «промежуточные» точки из интервала [а, Ь]. Поэтому в (12) ! п R„(X, f(X)) = -^ 52 f"(%)(A^)3, k=l где Xk-i ^Tfa^Xk. Из этого представления ясно, что < п \R„(X, f(X))| ± sup ГЫ 52 IДХ*I3, (13) k=l где sup берется по всем значениям ту таким, что min(Xo, Xj, •••» ^тах(Х0, Х{, ...,ХЛ). Мы называем формулу (11) дискретной версией формулы К. Ито, Подчеркнем, что правая часть этой формулы состоит из трех слагаемых: «дискретного интеграла» /„(X, /(X)), квадратической ковариации [X, f(X)]n и «остаточного» члена Rn(X, /(X)), название которого объясняется тем, что при соответствующем предельном переходе к случаю непрерывного времени он стремится к нулю (см. более подробно п. 5). 4. Пример 1. Если f(x) = a + bx, то Rn(X> fW) = 0 и формула (11) принимает следующий вид: F(Xn) = F(Xo) + /„(X, /(%)) + j[X, f(X)]„. (14) (Ср. с формулой (19), приводимой ниже.)
744 ГЛ. VII. МАРТИНГАЛЫ Пример 2. Пусть 1, f(x) = sign х = О, -1, х >0, х = 0, х <0, и пусть F(x) = |х|. Пусть = S*, где S* = £i +... + &, £ ^ 1, а £i, &. • • • — последовате- льность независимых бернуллиевских случайных величин, принимающих значения ±1 с вероятностью 1/2. Если положить So = 0, то непосредственно из (11) можно найти, что |$«| = £ (sign Sk-^Sk + Nn, (15) Л=1 где Nn = #{0 k < п, Sfe = 0} — число нулей последовательности So, Si, ... / п \ Входящий в (14) «дискретный интеграл» I ^2 (sign I яв- \ \£=1 / ляется мартингалом. Поэтому из (15) находим, что E\Sn\ = ENn. (16) Поскольку (задача 2) Е|5Я|~Д, п-оо, (17) то из (16) следует, что —оо. (18) Иначе говоря, среднее число «ничьих» в случайном блуждании So, Si, ..., Sn по порядку растет как /п, а не как п, что могло бы с первого взгляда показаться более естественным. Отметим, что свойство (18) самым непосредственным образом связано с законом арксинуса (см. § 10 гл. I) и фактически следует из него. 5. Пусть В = (B/)o^tci ~~ стандартное (Во = 0, ЕВ/ = 0, EBf = /) бро- уновское движение (см. § 13 гл. II) и Xk = Bk/n, 6 = 0, 1, ..., п. Применение формулы (11) приводит к следующему результату: п 1 F(B1) = F(Bo) + 52 /(В(А-1)/л)Д^/й + ^[/(В./я), £./„]„ + k=\ + Rn(B./n, f(B./n)). (19)
§9. ДИСКРЕТНАЯ ВЕРСИЯ ФОРМУЛЫ ИТО 745 Из теории броуновского движения (см., например, [11], [17], [77]) известно, что |)/л| * 0, п ► оо. (20) 6=1 Поэтому, если функция f = f(x) имеет вторую производную и |/"(х)| ^С, xeR, для некоторой константы С>0, то из оценки (13) находим, что Rn(B./n. f(B./n))^O. Опять же из теории броуновского движения известно, что для всякой (борелевской) функции / = /(x)eLf0C (т. е. такой, что § f2(x)dx<oo kl^c для всякого С > 0) существует предел (заведомо в смысле сходимости по п вероятности) «дискретных интегралов» 52 /(В(б-1)/я)ДВб/я, обозначае- 1 6=1 мый f(Bs)dBs и называемый стохастическим интегралом Ито по о броуновскому движению. Тем самым, обращаясь к формуле (19), видим, что в ней «остаточный» р п член Rn(B./n, f(B./n)) —>0, «дискретные интегралы» 52 7(В(б-1)/п)Дбб/л 6=1 1 сходятся (по вероятности) к «стохастическому интегралу» § f(Bs)dBs, о а следовательно, существует и предел по вероятности квадратических ковариаций [В./я, (=[/(В./я),В./я]), который естественно обозначить как [В, /(В)]ь Итак, если функция f = f(x) имеет вторую производную, |/"(х)| С, х е /?, и f е Z^oc, то имеет место следующая формула: F(BI) = F(0) + j /(Bs)dBs + l[B, /(В)]ь (21) о При этом । {B,f(B)]x=\f\Bs)ds (22) о и, следовательно, F(Bi) = F(0) + $ f(Bs) dBs+[A f'(Bs) ds, (23) о 0 8 - 9728
746 ГЛ. VII. МАРТИНГАЛЫ или, в более стандартной записи, F(Bi) = F(0) + $ F'(BS) dBs+'A F"(BS) ds. (24) 0 0 Именно эта формула (для F € С2) носит название формулы замены переменных К. Ито для броуновского движения. 6. Задачи. 1. Доказать формулу (15). 2. Доказать справедливость асимптотики (17). 3. Доказать формулу (22). 4. Формула (24) справедлива для всякой функции F G С2. Попытайтесь это доказать. § 10. Вычисление вероятности разорения в страховании. Мартингальный метод 1. Материал, излагаемый в этом параграфе, является хорошей иллю- страцией того, как мартингальный подход дает простой метод оценива- ния вероятности разорения, скажем, страховой компании. Будем предполагать, что X = (Xt)t^o есть случайных процесс, описыва- ющий эволюцию капитала рассматриваемой страховой компании. Значе- ние Xq = u>0 интерпретируется как начальный капитал компании. Стра- ховые поступления предполагаются накапливающимися на счету компании непрерывным образом с постоянной скоростью с > 0 (т. е. за время Д/ поступление равно сД/). Требования на выплату страховки считаются по- ступающими в случайные моменты времени Т\,Т2> ... (0< 71 < ?2 < ...) с соответствующими выплатами, определяемыми неотрицательными слу- чайными величинами & , Из изложенного вытекает, что капитал компании в момент времени t >0 определяется формулой Xt = u + ct-St> (1) где (2) Пусть Т = inf{/ ^0: Xt 0} есть тот первый момент, когда капитал компании становится нулевым или отрицательным.
§ 10. ВЕРОЯТНОСТИ РАЗОРЕНИЯ В СТРАХОВАНИИ 747 Если Xt > 0 для всех t^O,ToT полагается равным +оо. По вполне по- нятным причинам момент Т естественно называть «моментом разорения» компании. В дальнейшем наш основной интерес будет состоять в нахо- ждении (или оценивании) вероятности разорения Р{Т < оо} или веро- ятностей разорения Р{Т /} до момента времени t для любого t > 0. 2. Отыскание этих вероятностей является довольно-таки непростой задачей. Однако эта задача допускает (частичное) решение для так назы- ваемой модели Крамера—Лундберга, характеризуемой тем, что для нее выполнены следующие условия. А. Моменты а/ = 7} - 7}_|, f > 1 (То = 0), предполагаются независимы- ми случайными величинами, распределенными экспоненциальным обра- зом, Р{а, > /} = Ае“Л/, t ^0, i 1. (См. табл. 3 в § 3 гл. II.) В. Случайные величины ••• являются независимыми и одинаково распределенными с функцией распределения /7(х) = Р{^1 такой, что F(0) = 0 и р = § х dF(x) < оо. о С. Последовательности (Л, ТЬ, ...) и (£ь *••) являются независи- мыми последовательностями (в смысле определения б § 5 гл. II). Пусть Nt=52 /(?;•< 0, t> 0, (3) />1 — процесс, описывающий число требований на выплату «страховки», по- ступивших до момента времени t (включительно), Nq = 0. Поскольку для k 1 {А > t} = {ai +... + &k > 0 = {Nt < k}t то с учетом предположения Айв соответствии с задачей 6 из § 8 гл. II Л—1 P{Nt<k} = P{al + ... + ak>t} = ^e-xl(-^. /=0 Следовательно, P{Nl=k} = e~xt^-, * = 0,1,... (4) Таким образом, случайная величина Nt имеет пуассоновское распре- деление (см. табл. 2 в § 3 гл. II) с параметром А/, совпадающим здесь с математическим ожиданием ENt. Сконструированный по формуле (3) процесс N = (М)/^о, будучи част- ным случаем процессов восстановления (п. 4 § 9 гл. II), носит название процесса Пуассона. У этого процесса траектории (реализации) являют- ся разрывными (точнее, кусочно-постоянными, непрерывными справа и 8*
748 ГЛ. VII. МАРТИНГАЛЫ со скачками, равными единице). Наряду с броуновским движением (§ 13 гл. II), траектории которого являются непрерывными функциями, этот про- цесс играет фундаментальную роль в теории случайных процессов. Именно с помощью этих двух процессов можно построить случайные процессы с довольно сложной вероятностной структурой. (Типичными в этом отно- шении являются процессы с независимыми приращениями; см., например, [13], [11L [76].) 3. Из предположения С находим, что Е(Х< - Jo) = ct - ES, = ct - E £ & W t) = ct - E£/(7) ^t) = i i = ct-^ E^El(Tt ^t) = ct-^ P{7) </} = i i = ct — fi P{Nt 1} = ct — fiENt = t(c — Xfi). i Отсюда ясно, что условие, состоящее в том, что компания работает с положительной прибылью (т. е. с Е(Х/ — Хо) >0), формулируется следу- ющим образом: с > Xfi. (5) В последующем анализе важную роль будет играть функция h(z) = ^(егх - 1) dF(x), z > 0, (6) о равная F(-z) — 1, где £(«)=$> e~sxdF(x) о есть преобразование Лапласа—Стилтьеса ($ —комплексное число). Полагая g(z) = Xh (z) - cz, & = 0, находим, что для всякого г > 0 такого, что Л(г) < оо, оо N‘ Ее-г(Х,-Хо) = Ее-г(Х,-и) = e-rct Е/ S €' = e-rct ^2 Ее S е‘ Р{Л6 = п} = п=0 = е~гс‘ 1 + h^nе~~^~ = e~rctexth(r) = etlXh^-cr} = ew п=0
§ 10. ВЕРОЯТНОСТИ РАЗОРЕНИЯ В СТРАХОВАНИИ 749 Аналогичным образом показывается, что для s <t Ee-r(Xt-Xs) = e(t-s)g(r) Пусть — s /). Поскольку процесс X = (Х/)/^о является про- цессом с независимыми приращениями (задача 2), то (Р-п. н.) E(e“^X/”Xs) |«^/) = Ee”r(X/~Xs) = e(/-s)£(r), и, значит, E(e-rXt-tg(r) ।'pXj = e-rXs-Sg(r) (8) Положим Zt=e^rX^tg(r\ t^O. (9) Из (8) очевидно следует, что E(Z,|^/) = ZS, s^t. (10) По аналогии с определением 1 из § 1 естественно говорить, что про- цесс Z = (Z/)/^o является мартингалом (относительно «потока» сг-ал- гебр («F*)/>o)« Отметим, что в рассматриваемом случае E|ZJ<oo, /^0 (ср. со свойством (1) в § 1). Будем также говорить, по аналогии с определением 3 в § 1, что слу- чайная величина т = т(а>) со значениями в [0, +оо] является марковским моментом, или случайной величиной, не зависящей от будущего (от- носительно «потока» (^*)/>о), если для каждого t ^0 Для рассматриваемого сейчас случая непрерывного времени теоре- ма 1 из § 2 (с очевидными изменениями в обозначениях) также сохраняет свою силу. В частности, EZMt = EZ0 (11) для всякого марковского момента г. Положим т = Т. Тогда из (9) и (11) найдем, что для всякого t >0 е"ги = Ее~г%м7,“(/л7^(г) > Eje-^AT-(/A7)g(r) 17 р{7 ^ /} = = E[e~rXT~Ts(r} 174 /] Р{Г > > Е [е~ W | Т < Р{Г < 0 > min e~sg^ Р{Т /}. Следовательно, Р{7 < 0~ •—ёДй = e~ru max eSg(r}- О2) 1 ' min e-ssW o^s^/
750 ГЛ. VII. МАРТИНГАЛЫ Рассмотрим более подробно функцию g(r) = A/i(r)-cr. Ясно, что g(0) = 0, g'(0) = Хр - с < 0 (в силу (5)) и g"(r) = Xh"(r) >0. Поэтому существует единственное положительное значение r — R такое, что g(R) = 0. Заметим, что для г > 0 erx(\ - F(x)) dx = erx dF(y) dx = 0 Ох оо / У \ | ОО . = $ Не" dx) dF(y) = - $ (^ - 1) dF(y) = -Mr). 0 \0 / 0 Отсюда и из равенства Xh(R) -cR = 0 заключаем, что значение R является корнем (и при этом единственным) уравнения - Г е"(1 -F(x))dx = l. (13) с о Если теперь в (12) положить r = R, то получим, что для каждого t >0 P{T^t}^e~Ru, (14) откуда Р{Т <<x>}^e~Ru. (15) Итак, доказана следующая Теорема. Пусть для модели Крамера—Лундберга выполнены предположения А, В, С и Хр<с. Тогда вероятности разорения Р{Т ^t} и Р{Г <оо} удовлетворя- ют неравенствам (14) и (15), где R — положительный (и притом единственный) корень уравнения (13). 4. В приведенном доказательстве использовалось соотношение (11), справедливость которого, как было отмечено, вытекает из соответствую- щего аналога теоремы 1 § 2 (о сохранении свойства мартингальности при замене времени на случайный марковский момент) для случая непрерыв- ного времени. (Доказательство этого результата см., например, в § 3.2 монографии [41].) Если, однако, вместо экспоненциальности распределе- ния величин а/, / = 1, 2, ..., предположить, что они имеют (дискретное) геометрическое распределение (Р{а, =k} = qk~*р, 1), то тогда доста- точно было бы лишь ссылки на доказанную в § 2 теорему 1.
§11. ФУНДАМЕНТАЛЬНЫЕ ТЕОРЕМЫ 751 Приведенные рассмотрения, требующие обращения к результатам тео- рии случайных процессов с непрерывным временем, представляются по- лезными по крайней мере в том отношении, что они показывают, как в приложениях возникают модели, функционирующие не в дискретном, а в непрерывном времени. 5. Задачи. 1. Доказать, что процесс N = является (в предположении А) процессом с независимыми приращениями. 2. Доказать, что процесс X = также является процессом с неза- висимыми приращениями. 3. Рассмотреть модель Крамера—Лундберга и сформулировать соот- ветствующий аналог приведенной теоремы для того случая, когда величины а/, / = 1, 2, ..., являются независимыми и распределенными по геометри- ческому закону, т. е. Р{а, = k} = qk~[р, & > 1. § 11. О фундаментальных теоремах стохастической финансовой математики. Мартингальная характеризация отсутствия арбитража 1. В предшествующем параграфе было рассмотрено применение тео- рии мартингалов к доказательству одной из основных теорем математиче- ской теории страхования — теоремы Лундберга—Крамера. В настоящем параграфе будет рассмотрено еще одно применение теории мартингалов — к вопросам безарбитражности финансовых рынков, функционирующих в условиях стохастической неопределенности. Приводимые ниже теоремы 1 и 2, которые принято называть «фундаментальными теоремами» теории арбитража в стохастической финансовой математике, интересны тем, что они дают в мартингальных терминах условия, обеспечива- ющие безарбитражность (в объясняемом далее смысле) рассматриваемых финансовых рынков, и также условия, гарантирующие достижение постав- ленной финансовой цели. (Подробнее о финансовой математике см. [100].) 2. Дадим некоторые необходимые определения. Все рассмотрения предполагают заданным некоторое фильтрован- ное вероятностное пространство (Q, (<Я^)л^о» Р), служащее базой Для описания стохастической неопределенности в эволюции цен, фи- нансовых индексов и других показателей финансовых рынков. При этом будем интерпретировать совокупность событий из как «информацию», получаемую к моменту времени п (включительно). Например, может содержать «информацию» о значениях цен определенных финансовых бумаг, финансовых индексов и т. п.
752 ГЛ. VII. МАРТИНГАЛЫ Основным объектом, с которым будут связаны «фундаментальные те- оремы», является понятие (В, 5)-рынка, определяемого следующим об- разом. Пусть В = (Вл)л>о и S = (Srt)rt^o есть положительные случайные после- довательности. При этом считается, что при каждом п^О величины Вп яв- ляются -измеримыми (eF-i =^Ь)> а величины Sn — ^-измеримыми. Для простоты дальнейших рассмотрений предполагается, что начальная сг-алгебра тривиальна, т. е. ^о = {0> (см. § 2 гл. II). Тем самым Во и So суть константы. В соответствии с терминологией § 1 обе по- следовательности В = (Вл)л^о и S = (Sn)n^o являются стохастическими последовательностями, причем последовательность В = (Вя)я^о являет- ся к тому же предсказуемой (поскольку Вп — &п_\-измеримы). По своему финансовому смыслу последовательность В = (Вя)я^о бу- дет интерпретироваться как последовательность, описывающая эволюцию «единицы» банковского счета («bank account», «money account»). При этом ^п-\-измеримость величин Вп означает, что величина банковского счета в момент п (скажем, «сегодня») становится полностью известной уже в момент времени п - 1 (т. е. «вчера»). Если обозначить для п 1 с ДВЯ ~Вп- Bn-i, то, очевидно, для Вп получаем следующее представле- . ние: i Вя = (14-гя)Вя_ь п>1, (2) I $ где величины гп являются -измеримыми и такими, что rn>—\ (по- j скольку Вп > 0 по предположению). В финансовой литературе величины гп носят название (банковской) процентной ставки. Последовательность S = (Sn)n^o отличается от В = (Вя)я^о тем, что ; величины Sn являются -измеримыми, а не &п-\-измеримыми, как Вп. Именно так обстоит дело, например, с ценами акций («stock», «stocks»), для которых истинная цена в момент времени п становится известной только в момент ее объявления (т. е. «сегодня», а не «вчера», как для банковского счета). По аналогии с «банковской» можно ввести так называемую «рыноч- ную» процентную ставку ASn . « 7Q4 ! ->л-1 I для акции S = (5л)я^о-
§11. ФУНДАМЕНТАЛЬНЫЕ ТЕОРЕМЫ 753 Ясно, что тогда $п = (1 "I" Рп)$п— 1» (4) при этом все рп > -1, поскольку все Sn >0 (по предположению). Из (2) и (4) следует, что Вп = ВоП (1+г*), (5) fe=l п S„=S0 П 0+^)- (6) Л=1 В финансовой литературе принято говорить, что эти формулы образо- ваны по типу «простых» процентов. Во многих вопросах полезны также представления, образованные по типу «сложных» процентов: л л Вп = Во е^'f", Sn = So е™ Р", (7) где в соответствии с (5) и (6) ^ = ln(l+r*) = ln(l + ^-), (8) Л = 1п(1+л) = 1п(1 + ^-). (9) Эти величины принято называть «логарифмической прибылью», «возвратом», «отдачей». Введенная описанным выше способом пара процессов В = (Вл)л^о и S = (Sn)n^Q будет образовывать, по определению, финансовый (В, S)-ры- нок, состоящий из двух активов — банковского счета В и акции S. Замечание. Понятно, что такой (В, 5)-рынок является всего лишь простейшей моделью реальных финансовых рынков, состоящих, обыч- но, из большого числа активов разнообразной природы (см., например, [100]). Тем не менее, уже и на этом простом случае можно проследить и проиллюстрировать эффективность методов теории мартингалов при рассмотрении многих вопросов чисто финансово-экономической природы. (К их числу относится, например, вопрос об отсутствии на (В, 5)-рынке арбитражных возможностей, ответ на который дается в приводимой далее «первой фундаментальной теореме».) 3. Дадим теперь определение портфеля ценных бумаг, его капита- ла и введем также важное понятие самофинансируемого портфеля. Пусть (Q, &, Р) ~ рассматриваемое фильтрованное вероят- ностное пространство с = {0» ЭД и пусть тг = (/?, 7) — пара предсказу- емых последовательностей /3 = ((Зп)п^ 7 = (7п)п^о-
754 ГЛ. VII. МАРТИНГАЛЫ Кроме требования «предсказуемости», т. е. ^„^-измеримости = = ^b) величин /?„ и 7Л, п^О, на их возможные значения не налагаются какие-либо другие ограничения. В частности, эти величины могут прини- мать дробные и отрицательные значения. По своему смыслу величина /Зп есть «число единиц» банковского счета, а 7л — «число акций» в момент времени п. Будем говорить, что л* = (/?, 7) образует портфель ценных бумаг на рассматриваемом (В, 5)-рынке. С каждым портфелем тг = (/?, 7) свяжем соответствующий ему капитал Х* = (Х*)п^ полагая Х; = /ЗпВп + ъ5п (10) и интерпретируя /ЗпВп как денежные средства на банковском счете, а 7л5л — как стоимость акций в момент времени п. Смысл «предсказуемо- сти» последовательностей /3 и 7 также ясен — портфель ценных бумаг «на завтра» должен составляться «сегодня». Следующее важное понятие «самофинансируемого» портфеля отра- жает, в частности, идею рассмотрения таких (В, 5)-рынков, на которых нет «ни оттока, ни притока капитала извне». С формальной точки зрения соответствующее определение дается следующим образом. Пользуясь формулой «дискретного дифференцирования» (А(апЬп) = = ankbn + bn_\Aan), находим, что приращение ДХ* (=Х^~Х^_1) капи- тала представляется в виде ах; = [/?лДВл+7«Д5л] + [Вл-I д/?л+Sn-1 Д7л]. (11) Реальное изменение капитала связано лишь с «рыночными» изменени- ями значений банковского счета и цены акции, т. е. с величиной {Зп&Вп + 4-7лДВл. Второе выражение в правой части (11), т. е. Brt-i Д/?л Д7«, является <^л-1-измеримой величиной и в момент времени п никакого ре- ального увеличения или уменьшения величины X*_x дать не может. Тем самым оно должно равняться нулю. В принципе, изменение капитала могло произойти не только за счет «рыночных» изменений процентных ставок (гл и рп, п^ 1), но также и за счет, скажем, притока капитала извне, оттока капитала за операционные издержки и т. п. Такие возможности далее не принимаются во внимание, и все рас- сматриваемые портфели 7г = (/?, 7) будут предполагаться (в соответствии с изложенным) такими, что для них при всех п 1 дх;=/?ядвя+7иА5л. (12) В стохастической финансовой математике такие портфели принято на- зывать самофинансируемыми (self-financing).
§11. ФУНДАМЕНТАЛЬНЫЕ ТЕОРЕМЫ 755 4. Из (12) следует, что для самофинансируемого портфеля тг = (/?, 7) дв* + Д5*> (13) 6=1 и поскольку д@=нк)' <|4> то у-=^+Е^д(й)- <15) Вп Wk' «=1 Зафиксируем некоторое N 1 и рассмотрим эволюцию (В, SJ-рынка в моменты п = 0, 1, ..., N. Определение 1. Самофинансируемый портфель (или самофинансиру- емая стратегия) % = (/?, 7) в момент N реализует арбитраж, или арбит- ражную возможность, если Xfi = 0, Х£ 0 (Р-п. н.) и с положительной P-вероятностью Х% > 0, т. е. Р{Х% > 0} > 0. Определение 2. Говорят, что на (В, 5)-рынке отсутствует (в мо- мент /V) арбитраж, или арбитражная возможность, если для всякого портфеля 7г = (/?, 7) с =0 и Р{%^^0}= 1 на самом деле Р{Х^ = 0} = 1, т. е. лишь с нулевой P-вероятностью возможно то, что Xfi >0. С наглядной точки зрения на безарбитражном рынке не может быть так, чтобы для некоторого портфеля существовала возможность получения безрискового дохода. Понятно, что решение вопроса о том, является ли тот или иной (В, 5)-рынок безарбитражным и, следовательно, в определенном смысле, «справедливым», «рациональным», зависит от вероятностно-статисти- ческих свойств последовательностей В = (Вп)п^ и S = (Sn)n^N и, ра- зумеется, от предположений, заложенных в структуру фильтрованного вероятностного пространства (Q, Р)« Примечательно, что теория мартингалов позволяет весьма эффективно описать условия, гарантирующие отсутствие арбитражных возможностей. Можно утверждать даже больше. Именно, имеет место следующая Теорема 1 («первая фундаментальная теорема»). Будем пред- полагать, что стохастическая неопределенность описывается Фильтрованным вероятностным пространством (Q, &, Р) c^b = {0, Q},^n = ^, Для того чтобы (В, Б)-рынок, определенный на (П, &, (#n)n^N, Р), был безарбитражным, необходимо и достаточно, чтобы нашлась Мера Р на (П, &), эквивалентная мере Р (Р~Р) и такая, что
756 ГЛ. VII. МАРТИНГАЛЫ относительно этой меры дисконтированная последовательность S fSn\ ' * — = j образовывала бы мартингал'. е|^|<оо, n^N, I Dn I U где Ё — усреднение по мере Р. Замечание 1. Утверждение теоремы сохраняет свою силу и для век- торных процессов S = (S!, ...» Sd) с d <оо. (См. § 2Ь гл. V в [100].) Замечание 2. Меру Р, фигурирующую в формулировке теоремы, при- нято называть, по вполне понятным причинам, мартингальной мерой. Будем обозначать М(Р) = {Р~Р: является Р-мартингалом} класс тех мер Р, эквивалентных мере Р, относительно которых последователь- S JSn\ ность тг =¥ — ) является мартингалом. В \Bn/n^N Пусть запись NA означает отсутствие арбитража (No Arbitrage). Тогда утверждение теоремы 1 может быть записано в следующем виде: NA 4» М(Р)00 (16) Доказательство. Достаточность. Пусть Р — мартингальная ме- ра из М(Р) и тг = (/3, 7) — портфель с Xq = (3qBq + 70S0 = 0. Из (15) для п (17) л a S f Sb \ Относительно меры Р последовательность 77 = Hr- является В \Bk/k^N мартингалом и, значит, последовательность G = (G£)o^rt^v с GJ = O и Gn = 52 7*а(бМ, 1 W, является мартингальным преобразовав (Хп \ о< <;v также есть маРтингальное преобразование. При тестировании на арбитраж или отсутствие арбитража надо рас- сматривать те портфели тг, для которых не только Xq =0, но и (Р-п. н.). В силу того, что Р~Р и Вн>0 (Р- и Р-п. н.), находим, что р(^->оУ = 1.
§11. ФУНДАМЕНТАЛЬНЫЕ ТЕОРЕМЫ 757 Тогда, применяя теорему 3 из § 1 к маргинальному преобразованию (, находим, что на самом деле эта последовательность является \Вп по мере Р мартингалом. Следовательно, Ё~^=Ё-—-=О и поскольку pJlA^O =1,тоР ^=0 = 1. r\BN ' ) \BN J ~ Отсюда видим, что AJJ = O (Р- и Р-п. н.) и тем самым для всякого самофинансируемого портфеля тг с Xfi =0 и (Р-п. н.) на самом деле Х% = 0 (Р-п. н.), что и означает, согласно определению 2, отсутствие арбитражных возможностей. Необходимость. Доказательство будет приведено лишь для одно- этапной модели (В, 5)-рынка, т. е. в случае W = 1. Уже на этом простом примере будет хорошо видна идея доказательства, заключающаяся в том, чтобы, воспользовавшись отсутствием арбитража, явно построить хоть какую-нибудь мартингальную меру. Такую меру мы будем строить, основы- ваясь на преобразовании Эшера (см. ниже). (По поводу доказательства в общем случае /V > 1 см. § 2d гл. V в [100].) Без ограничения общности можно считать, что Bo = Bj = l. Предпо- ложение отсутствия арбитражных возможностей сводится здесь к тому (задача 1), что P{ASi>0}>0 и P{ASi<0}>0. (18) (Мы исключаем тривиальный для рассмотрения случай P{ASi=0}=l.) Отсюда надо вывести, что существует эквивалентная мартингальная мера Р, т. е. такая, что Р~Р и Ё|Д51| <оо, EASi =0. Вытекает это непосредственно из следующей леммы, представляющей и общевероятностный интерес. Лемма 1. Пусть (Q, = (/?, и X = Х(си) — координатно за- данная случайная величина (X(a>) =а>). Пусть Р — вероятностная мера на (Q, ^), Р{Х>0}>0 и Р{Х<0}>0. (19) Тогда на (Q, J^) существует вероятностная мера Р ~ Р такая, что для любого действительного а ЁеаХ<оо. (20) В частности, Ё|Х| <оо и имеет место следующее свойство'. ЁХ = 0. (21) Доказательство. Введем меру Q = Q(dx) с Q(dx) = ce~x2P(dx), где нормирующая константа с = (Ее~х )”*.
758 ГЛ. VII. МАРТИНГАЛЫ Для всякого действительного а положим ^(а) = Еоеа\ (22) где Eq — усреднение по мере Q. Пусть Za(x) = 4>(а)' Поскольку Zfl(x)>0 и EQZa(A)=l, то для всякого действительного а мера Ра с Pa(dx) = Za(x)Q(dx) является вероятностной. Понятно, что Pa~Q~P. еах Замечание 3. Преобразование х~» часто называют преобразо- ванием Эшера, Как будет следовать из дальнейшего, при некотором спе- циальном значении а* мера Р = Ра* обладает (мартингальным) свойством (21). Именно эту меру принято называть мерой Эшера (или мартингаль- ной мерой Эшера), Функция <р = <р(а), определенная для всех действительных а, является строго выпуклой вниз, поскольку у>"(а) > 0. Пусть = inf{<p(a): aeR}. Возможны два случая: 1) когда существует такое а*, что <р(а*) = <р*, и 2) когда такого (конечного) а* не существует. В первом случае у?'(а*) = 0. Значит, Хеа,х tp А = CQ —-------г = —------- = и, <р(а*) у?(а*) и в качестве требуемой меры Р можно взять меру Ра*. До сих пор мы еще не использовали предположение «безарбитражно- сти» (19). Как нетрудно показать (задача 2), это предположение исклю- чает возможность 2). Тем самым остается лишь первая возможность, которая уже была рассмотрена. Итак, в случае AZ = 1 «необходимость» (заключающаяся в существо- вании мартингальной меры) установлена. По поводу общего случая N 1 мы отсылаем читателя, как уже было отмечено, к изложению в § 2d гл. V в [100]. □ 5. Приведем некоторые примеры безарбитражных (В, 5)-рынков. Пример 1. Предположим, что (В, 5)-рынок описывается соотноше- ниями (5) и (6) с 1O^N, в которых гл = г (константа) для всех 1^ и р = (pi, р2» ...» Pn) — последовательность независимых одина- ково распределенных (бернуллиевских) случайных величин, принимающих
§11. ФУНДАМЕНТАЛЬНЫЕ ТЕОРЕМЫ 759 два значения а и b (а<Ь) с вероятностями P{pi =a} = q, P{p1=fe} = p, p + q=\,Q<p<\. Пусть при этом -\<a<r<b. (25) Так описанная модель (В, 5)-рынка носит название CRR-модели по именам ее авторов Кокса, Росса и Рубинштейна (J. С. Сох, R. A. Ross, М. Rubinstein; подробнее см. в [100]). Поскольку в этой модели Sn __ / 1 4~ рп \ ^/1—1 Вп \ 1 + г / Вп_ । * то понятно, что мартингальная мера Р должна быть такой, чтобы ёН^ = 1. 1 +г т. е. чтобы Ёрл = г. Если обозначить р = Р{рп = b}, q = Р{рп = а}, то находим, что при лю- бом п 1 p + q = \, bp + aq = r. Отсюда В рассматриваемом случае вся «случайность» определяется бернул- лиевской последовательностью р= (pi, Р2, p/v). Будем считать, что = b}N, т. е. пусть пространство элементарных исходов состоит из последовательностей (хь...,хд/) с xt=a или Ь. (Это предположение о специальной, точнее, «координатной», структуре пространства Q не ограничивает общности рассмотрений; см. в связи с этим также конец доказательства достаточности в теореме 2 п. 6.) В качестве упражнения (задача 3) предлагается показать, что мера Р = Р(Хь Х2, ..., Xjv), определенная так, что ₽(%!, ..., xN) = р^х'..........(27) где иь(х\, х^) = 52 — число тех х,, которые равны 6, является /=1 мартингальной мерой, к тому же единственной. Из (27) ясно, что Р{рп — Ь} = р и P{pn=a} = q. Таким образом, из теоремы 1 выводим, что CRR-моделъ дает пример безарбитражного (В, 5)-рынка.
760 ГЛ. VII. МАРТИНГАЛЫ Пример 2. Будем предполагать, что (В, 5)-рынок имеет следующую структуру: Вп = 1 для всех п = 0, 1, ..., N и Sn=So ek=[ (28) l^n^N. Пусть pk — + где рь и (Jk>0 являются ^k-\-измеримыми, a (ei,...» образуют последовательность независимых стандартных гаус- совских случайных величин, е^~еЖ(0, 1). Будем строить требуемую мартингальную меру Р (на (Q, <^)) с помощью условного преобразования Эйгера, а именно, пусть P(dcu) = = Z/v(cu)P(da>) с Zyv(o>) = [] z^(cu) и (с #q = {0, Q}) **<“>= <29’ где <^,-1-измеримые величины а^ = а^(си) надо сейчас выбрать так, чтобы последовательность (Srt)o^rt^w была относительно меры Р мартингалом. В силу представления (28) мартингальность по мере Р равносильна тому, что ((Относительно исходной меры Р) при всех 1 п N E[e(^+i)Pn |^i] = Е[еа^ (30) Поскольку рп = рп + апеп, то из (30) находим, что величины ап должны быть выбраны так, чтобы 2 , °п 2 Рп Н 2~ — т. е. При таком выборе величин ап, находим, что плотность Z/v(cu) задается формулой (31) Если изначально рп = -у- при всех 1 п N, то Р = Р. Иначе говоря, в этом случае сама исходная мера Р будет мартингальной. Итак, рассматриваемый (В, 5)-рынок с В = (Brt)o^rt<^ такими, что Вп = 1, и S = (S/i)o</i<;v, где Sn описываются представлением (28), являет- ся, как и в примере 1, безарбитражным. В качестве упражнения (задача 4) предлагается исследовать вопрос о том, является ли построенная выше мартингальная мера Р единственной.
§11. ФУНДАМЕНТАЛЬНЫЕ ТЕОРЕМЫ 761 6. Вводимое ниже понятие полноты (В, 5)-рынка представляет для стохастической финансовой математики значительный интерес, поскольку (вне зависимости от того, является рассматриваемый рынок безарбит- ражным или арбитражным) оно связано с естественным вопросом о том, когда для заданного «^-измеримого «платежного поручения» fa можно найти самофинансируемый портфель тг, капитал Х% которого в точности воспроизводит (или по крайней мере не меньше) fa. Определение 3. (В, 5)-рынок называется полным (по отношению к моменту времени /V) или W-полным, если всякое ограниченное «^-из- меримое «платежное поручение» fa является воспроизводимым, т. е. су- ществует такой самофинансируемый портфель тг, что = fa (Р-п. н.). Теорема 2 («вторая фундаментальная теорема»). Как и в теоре- ме 1, пусть (Q, «F, (<^я)о<я<лг> Р) — фильтрованное вероятностное пространство, = {0, Q}, ~^,и заданный на нем (В, S)-рынок является безарбитражным (М(Р) 0 0). Для того чтобы этот рынок был полным, необходимо и доста- точно, чтобы существовала лишь единственная мартингальная мера (|М(Р)| = 1). Доказательство. Необходимость. Пусть рассматриваемый рынок является полным. Это означает, что для всякого «^-измеримого ограни- ченного «платежного поручения» fa найдется самофинансируемый порт- фель 7г = (/3, 7) такой, что Х^ = fa (Р-п. н.). Без ограничения общности можно считать, что Вп = 1, 0 п N. Тем самым из (13) находим, что w fN=X^=XS + Y/'Yk^Sk. (32) 6=1 В силу сделанного предположения безарбитражности множество мар- тингальных мер М(Р) / 0. Покажем, что предположение полноты влечет за собой единственность мартингальной меры (|М(Р)| = 1). Пусть Р1 и Р2 —две мартингальные меры. Тогда относительно каждой / п \ из этих мер последовательность ( 52 TfcAS* I является мартингаль- \А=1 J ным преобразованием. Возьмем некоторое множество и положим f/v(cv) = /д(си). По- скольку (Р-п. н.) для некоторого тг iA^)=x^=xs+Y/^sk, Л=1 / п X то из теоремы 3 § 1 вытекает, что последовательность I 52 7k^Sk ) \Л=1 /
762 ГЛ. VII. МАРТИНГАЛЫ является мартингалом по каждой из мер Р1 и Р2. Следовательно, ЕР,/л(си) = х, / = 1,2, (33) где Ер< — усреднение по мере Р\ а х = Хц, что есть константа, поскольку <^о = {0, О}- Из (33) вытекает, что Р1(Д) = Р2(Л) для любого множества Тем самым единственность мартингальной меры установлена. Доказательство достаточности несколько более сложно и будет проведено в несколько этапов. Пусть рассматривается безарбитражный (5, 5)-рынок (М(Р)/0), к тому же такой, что мартингальная мера является единственной (|М(Р)| = 1). Полезно отметить, что и предположение о единственности мартин- гальной меры, и предположение о полноте являются сильными ограни- чениями. Более того, оказывается, что эти предположения автоматически влекут за собой то, что траектории S = (Srt)o^rt^w имеют структуру «услов- ного двуточия», что будет объяснено ниже. (Примером может служить CRR-модель ASn=prtSrt_i, где рп принимают лишь два значения и, значит, условные вероятности P(ASn е • | &п-1) сосредоточены всего лишь в двух точках, aSn-\ и bSn_i.) Единственность мартингальной меры (|М(Р)| = 1) накладывает также и ограничения на структуру фильтрации Оказывается, что авто- матически сг-алгебры &п должны быть а-алгебрами, порожденными цена- ми So, Si, ..., Sn (предполагается сейчас, что Bk = 1, k и). См. по этому поводу диаграмму на с. 610 в [100] и § 4е в гл. V там же. В качестве одного из промежуточных результатов на пути установ- ления импликации «|М(Р)| = 1 => полнота» докажем следующее полезное утверждение, дающее эквивалентную характеризацию полноты на без- арбитражном рынке. Лемма 2. Для того чтобы безарбитражный (В, 5)-рынок был полным, необходимо и достаточно, чтобы в множестве М(Р) всех мартингальных мер нашлась мера Р, обладающая тем свойством, что всякий ограниченный мартингал т = (тп, P)o<rt<v допускал * S . бы «--представление»: D П = + (34) 6=1 k с некоторыми предсказуемыми величинами \^k^n. Доказательство. Пусть рассматриваемый (В, 5)-рынок является безарбитражным и полным. (Без ограничения общности можно полагать Brt = l, O^n^AZ.)
§11. ФУНДАМЕНТАЛЬНЫЕ ТЕОРЕМЫ 763 Возьмем произвольную меру Р из М(Р), и пусть т=(тп, &п, — некоторый ограниченный O^n^N) мартингал. Положим fa = mu. Тогда в соответствии с определением полноты (см. определение 3) найдется портфель тг* = (/?*, 7*) такой, что Х^* = fa, при этом для всех 0 п N п Xf=x + Y,^Sk (35) 6=1 cx=Xf. Поскольку Xfi* = fa с, то последовательность Л’7Г* = (Х^*, &п, P)o^rt^v будет мартингалом (см. теорему 3 в § 1). Тем самым у нас имеется два мартингала т и X** с одним и тем же терминальным значени- ем fa (Х^ =т,ц = /^). Но по определению мартингального свойства тп = Е(тц\&п) и X** =E(X/f |<^rt), O^n^N. Значит, мартингалы Леви т и совпадают и, следовательно, в силу (35) для мартингала т = (тп, &п, P)o<rt^w справедливо «S-представление»: п mn=x + '^t'Y^Sil, l^n^N, (36) *=i С Х = /Ио. Докажем обратное утверждение («S-представление» => полнота). По предположению существует мера Р е М(Р) такая, что всякий огра- ниченный Р-мартингал допускает «S-представление». Возьмем в качестве такого мартингала X = (Хп, &Пу P)^n^N мартингал с Хп = Ё(Дг l^n), где Ё — усреднение по мере Р и fa есть то «платежное поручение», о котором идет речь в определении 3 и для которого нужно найти самофинансируемый портфель тг такой, что Xfi = fa (Р- и Р-п. н.). Рассмотрим для (ограниченного) мартингала X = (ХПу &Пу P)o^^w его «S-представление» п хп=х0+^^^ <37> 6=1 с некоторыми ^_i-измеримыми величинами 7^. Покажем, что отсюда можно вывести, что существует самофинанси- руемый портфель тг = (3, 7) такой, что Х*=Хп для всех O^n^N и, в частности, fa =Х^—Х^ допускает представление N fN=xs+Y/^sk, (38) Л=1 требуемое в определении 3.
764 ГЛ. VII. МАРТИНГАЛЫ Имея представление (37), положим 7л = Тл и определим 0п — Хп ““ (39) Из (37) следует, что величины /Зп являются &п-\-измеримыми. При этом 5Л_ 1+ ДДг = Sn_ 1Д7П + ДХ« - Д(ynSn) = = Sn- 1 Д7п + 7л ASn - Д(7п5п) = 0. Тем самым в соответствии с п. 3 построенный портфель тг = (3, 7) яв- ляется самофинансируемым и X^ = f/v, т. е. выполнено свойство пол- ноты. □ С учетом этом леммы мы видим, что для полного доказательства теоре- мы надо проверить справедливость импликации {3} в следующей цепочке импликаций S-представление полнота |М(Р)| = 1 |М(Р)| = 1 Г (Импликация {1} была установлена в доказательстве «необходимости», импликация {2} — в предыдущей лемме.) Чтобы сделать более прозрачным доказательство импликации {3}, рас- смотрим частный случай (В, 5)-рынка, описываемого CRR-моделью. Выше было отмечено (пример 1), что для этой модели мартингальная мера Р является единственной (|М(Р)| = 1). Так что надо понять, поче- му здесь имеет место «S-представление» (относительно мартингальной меры Р). Оказывается, и это уже отмечалось выше, ключевым обстоятель- ством является то, что величины рп в (4) принимают только два значения а и b и, как следствие этого, условные распределения Р(Д5П6- |<^rt-i) сосредоточены всего лишь в двух точках («условное двуточие»). Итак, будем рассматривать CRR-модель, изложенную в примере 1, и дополнительно предположим, что &п = a(pi, ..., рп) для 1 п N и = {0, ЭД- Через Р обозначим мартингальную меру на (Q, <^v), определяемую формулой (27). Пусть X = (Хл, P)o^nc/v ограниченный мартингал. Тогда найдут- ся функции gn = gn(xi, ..., хп) такие, что Хп(а>) = gn(pi(&), Р«(^)) и, значит, AXn = gn(pi, ..., рп)- gn-\(p\, ...» Рп-1). Так как Ё(ДХП |^л-1) = 0, то pgn(p\. .... Рп-ь fr) + ^grt(pi, ...» prt-i, a) = gn-i(pi, ...» Pn-l),
§11. ФУНДАМЕНТАЛЬНЫЕ ТЕОРЕМЫ 765 т. е. gn(Pb Рл-Ь Ь) - gn-l(Pb ...» Рп-\) _ __ gn— 1 (Pl > • • • * Рп~ 1) ~ (Р1 > • • • ♦ Рп— 1 > а) (4Q) * г ~~ а Ь —— с i. fw Поскольку р = <7 = то из '40) находим, что gn(Pl, ••• Рл-Ь 6)~ gfl-l(P|. ••• Рл-1) _ b — г _ gn(Pl. Рл-Ь g)-gn-l(Pl. ••• Рл-l) pm а-г ’ ' ’ Положим /zn({a}; ш) = 1(рп(ш) = а), дя({6}; w) = /(pn(a/) = 6), и пусть Wn(u, x) = g„(pi(cc).pn—i(u>), х) - g„-i(Pi(w), ря-1М, х), 1Г„*(о>,х) = Wn^'x\ пv 7 х-г С учетом этих обозначений видим, что ДХлМ = wn(aj, рп(ш)) = 5 Wn(w, х) Pn(dx; о>) = § (х - г) W*(w, х) pn(dx-, ш). В силу (41) функции W*(u, х) не зависят от х. Поэтому, обозначая вы- ражения в левой (равносильно, в правой) части (41) через 7* (а;), находим, что ДХяМ = 7я*М(ряМ-г). (42) Таким образом, ХлМ = w + Е ЬМоО - Г). (43) k=\ Легко видеть, что Д ( $п А_ ^n—l Рп ~ f' Вп_! ’ 1+г • Поэтому и, следовательно, из (43) видим, что ад=ад+£7*МД(^). (44) k=[ k
766 ГЛ. VII. МАРТИНГАЛЫ где 7*м=7;м(1+г)|^-. ГЧ 6 5 fSn\ Относительно меры г последовательность — = ( — является В \Вп/0^п^Н мартингалом. Тем самым вышеприведенное соотношение (44) есть не что 5 ~ иное, как «--представление» для X относительно (базисного) Р-мартин- в S гала -%- В В проведенном доказательстве импликации {3} для CRR-модели (в ко- торой |М(Р)| = 1) ключевым моментом было то, что величины рп принимают лишь два значения. Оказывается, однако, что предположение единствен- ности мартингальной меры Р является столь сильным, что и в общем &Sn случае из него следует «двуточечная» структура величин = : су- ^п-1 шествуют такие предсказуемые ап = ап(ш) и Ьп = Ьп(ш), что Р(рп = ап | ^я_]) 4" Р(ря = Ьп | i) = 1. (45) Если это свойство принять на веру, то тогда данное выше доказа- 5 тельство «-^-представления» в CRR-модели будет «работать» и в общем В случае. Таким образом, все, что остается, — это установить свойство (45). Предлагая самостоятельно убедиться в справедливости этого результата (задача 5), приведем тем не менее некоторые наводящие соображения, показывающие, как наличие единственной мартингальной меры приводит к «условному двуточию». Пусть Q = Q(dx) — некоторое распределение вероятностей на (/?, S8(R)) и £ = £(х) —- координатно заданная случайная величина (£(х) = х). Пусть EQiei <оо, Eq£ = O («мартингальное свойство») и мера Q обладает тем свойством, что если другая мера Q такова, что Е§|£| <оо и Е§£ = 0, то непременно Q = Q («единственность мартингальной меры»). Утверждается, что тогда носитель меры Q сосредоточен не более чем в двух точках (а С О и Ь >0) с возможным их «слипанием» в «нулевую» точку (а = 6 = 0). Те наводящие соображения, о которых было упомянуто выше и которые делают последнее сформулированное утверждение весьма правдоподоб- ным, состоят в следующем. Предположим, что мера Q сосредоточена в трех точках х_, хо, *+> упорядоченных так, что х_ ^хо ^х+, с массами q~, q+ соответственно. Условие Eq£ = 0 означает, что 4-Х_ 4- q^XQ 4- ?+х+ = 0.
§ 12. О РАСЧЕТАХ, СВЯЗАННЫХ С ХЕДЖИРОВАНИЕМ 767 Если Xq = 0, то тогда ^_х_ 4- q+x+ = 0. Положим q- = q-f, Я0=Хг + Ч~2’ = <46> т. е. «перекачаем» части масс q_ и q+ в точках х. и х+ в точку xq. Из (46) видно, что соответствующая мера Q^Q и Е§£ = 0, причем Q/Q. Но это противоречит предположению единственности меры Q со свойством Eq£ = 0. Следовательно, мера Q не может быть сосредоточена в трех точках (х_, хо, х+) с хо = О. Подобным же образом, основываясь на идее «пере- качивания масс», рассматривается и случай хо0О. (Подробнее см. § 4е гл. V в [100].) □ 7. Задачи. 1. Показать, что в случае N = 1 условие отсутствия арбитража равно- сильно выполнению неравенств (18). (Предполагается, что P{ASj =0}< 1.) 2. Показать, что в доказательстве леммы 1 (п. 4) возможность 2) ис- ключается условиями (19). 3. Доказать, что мера Р в примере 1 (п. 5) является мартингальной мерой и при этом единственной в классе М(Р). 4. Исследовать вопрос о единственности мартингальной меры, постро- енной в примере 2 (п. 5). 5. Докажите, что в (В, S)-модели предположение |М(Р)| = 1 влечет Sn 1 кг «условное двуточие» для распределения величин •=-, 1 ^n^N. Dn § 12. О расчетах, связанных с хеджированием в безарбитражных моделях 1. Хеджирование (hedge — забор) является одним из основных мето- дов динамического управления портфелем ценных бумаг. Ниже излагаются некоторые основные положения и результаты этого метода на примере рас- четов так называемых опционных контрактов (попросту — опционов). Будучи производными ценными бумагами, опционы (как инструмен- ты финансовой инженерии) имеют достаточно высокий риск. Но в то же самое время они (в комбинации с другими ценными бумагами, например, с фьючерсами) с успехом используются не только с целью получения дохода за счет «рыночного» изменения цен, но и как средство защиты (хеджирования) при драматическом их изменении. Опцион (option — выбор) — это ценная бумага (контракт), выпускаемая финансовыми институтами и дающая ее покупателю право купить или
768 ГЛ. VII. МАРТИНГАЛЫ продать определенную ценность (скажем, акцию, облигацию, валюту) в оговоренный период времени или момент времени на заранее оговаривае- мых условиях. Отметим, что если опцион дает право на покупку или продажу, то такой, например, финансовый инструмент, как фьючерс (или фьючерсный контракт) — это соглашение, в соответствии с которым покупатель обязан купить или продать определенную ценность в определенный момент вре- мени в будущем по (фьючерсной) цене, фиксируемой в момент заключения соглашения. Один из основных вопросов, относящихся к расчетам опционов, за- ключается в следующем: по какой цене опционы должны продаваться? Понятно, что их продавец желает получить «побольше», покупатель же хочет заплатить «поменьше». Что есть «справедливая», «рациональная» цена, на которую должны соглашаться обе стороны —и продавец, и поку- патель? Естественно, что эта «справедливая» цена должна быть «разумной». А именно, покупатели должны понимать, что покупка опциона по бо- лее низкой цене может не дать гарантии того, что продавец выполнит свои обязательства, оговоренные в соглашении, поскольку полученных им «премиальных» может просто оказаться недостаточно для составления портфеля, гарантирующего выполнение «платежного поручения». В то же самое время величина этих «премиальных» не должна давать продавцу арбитражных возможностей типа «free lunch», т. е. возможностей получения безрискового дохода. Прежде чем дать определение того, что же следует понимать под «спра- ведливой» ценой опционов, остановимся на некоторой общепринятой их классификации. 2. Будем рассматривать (В, 5)-рынок, В = (Bn)Q^n^N, S = (Srt)o$^;v, функционирующий в моменты времени n = 0, 1,...,М и определенный на фильтрованном вероятностном пространстве (П, («Frt)oc/i</v> Р) с ^о = {0, П} и Рассматриваемые далее опционы будут строиться на акциях, стои- мость которых описывается последовательностью S = (Sn)o^n^N- По времени исполнения опционы делятся на два типа: Европейские и Американские, Если опцион может быть предъявлен к исполнению только в фикси- рованный в контракте момент времени W, то говорят, что W — момент исполнения, и такой опцион называется опционом Европейского типа. Если же опцион может быть предъявлен к исполнению в любой мар- ковский момент (или момент остановки; см. определение 3 в § 1) т = т(си), принимающий значения в оговоренном условиями контракта множестве
§ 12. О РАСЧЕТАХ, СВЯЗАННЫХ С ХЕДЖИРОВАНИЕМ 769 {О, 1, ...» N}, то говорят, что рассматриваемый опцион является опционом Американского типа. Согласно общепринятой терминологии, различают следующие два класса опционов: (1 ) опционы покупателя (call option, отсюда происходит название опцион-колл); и (2 ) опционы продавца (put option, опцион-пут). Отличаются эти два класса тем, что опционы-колл дают право покуп- ки, а опционы-пут — право продажи. Для определенности остановимся на примерах стандартных опцио- нов Европейского типа. Такие опционы характеризуются двумя константами: N — время ис- полнения и К — цена покупки (для опциона покупателя) или цена продажи (для опциона продавца). Если вдруг окажется, что в момент времени А «рыночная» цена Sh>K, то по условиям контракта опциона-колл покупатель опциона будет иметь право купить акцию по цене К. Тут же ее продавая по «рыночной» цене Sn, он получит таким образом доход Sn —К. Если же окажется, что Sn < К, то оговоренным контрактом правом покупки по цене А бессмысленно поль- зоваться, поскольку покупатель может купить акцию и по более низкой «рыночной» цене Sn- Таким образом, объединяя оба эти случая, находим, что доход покупа- теля в момент времени N будет определяться величиной fN = (SN-K)+, (1) где а+ = тах(а, 0). «Чистый» же его доход будет равен этой величине за вычетом тех «премиальных», которые он выплатил продавцу опциона. Аналогичным образом, доход покупателя опциона-пут будет опреде- ляться формулой fN = (K-SN)+. (2) 3. При определении «справедливой» стоимости на безарбитражном (В, 5)-рынке следует различать два случая — полного и неполного рынка. Определение 1. Пусть (В, 5)-рынок является безарбитражным и полным. «Справедливой» ценой опциона Европейского типа с платежной ^n-измеримой ограниченной (неотрицательной) функцией Jn называется цена совершенного хеджирования, т. е. величина C(fN; P) = inf{x: 37tcXJ=x = (Р-п.н.)}. (3) В связи с этим определением отметим, что портфель тг называется хе- джем платежного поручения Ду, если с Р-вероятностью единица [n-
770 ГЛ. VII. МАРТИНГАЛЫ Из § 11 следует, что в случае полных безарбитражных рынков суще- ствует совершенное хеджирование тг ограниченных «платежных обяза- тельств», т. е. такое, что Ху = /д/ (Р-п. н.). Именно этим и объясняется, почему в определении (3) рассматривается (непустой) класс портфелей со свойством Ху = [н (Р-п. н.). В случае же неполных безарбитражных рынков естественно следую- щее Определение 2. Пусть (В, 5)-рынок является безарбитражным. «Справедливой» ценой опциона Европейского типа с платежной ^-из- меримой ограниченной (неотрицательной) функцией fn называется цена суперхеджирования, т. е. цена ОД; Р) = inf{x: Зтг с Хо" = х и Х£ > fN (Р-п. н.)}. (4) Заметим, что данное определение корректно — для всякой ограничен- ной функции fn заведомо найдется портфель тг с некоторым начальным капиталом х такой, что Ху > fn (Р-п. н.). 4. Приведем теперь формулу для цены С(/^; Р), дав ее доказательство в случае полных рынков и отсылая к специальной литературе (см., напри- мер, § 1с гл. VI в [100]) в случае неполных рынков. Теорема 1. 1) В случае полных безарбитражных (В, S')-рынков «справедливая» цена опциона Европейского типа с платежной функцией fu определяется формулой C(/a/;P) = BoEp^-, (5) где Ер — математическое ожидание по (единственной) мартин- галъной мере Р. 2) В случае общих неполных безарбитражных (В, 8)-рынков «справедливая» цена опциона Европейского типа с платежной функцией fu определяется формулой С(/„;Р)= sup ВоЕр^-, (6) ₽6М(Р) °N где sup берется по множеству всех мартингальных мер М(Р). Доказательство. 1) Пусть тг — некоторый совершенный хедж с = х и Х% = fn (Р-п. н.). Тогда (см. (15) в § 11) вС = ? = Г+^7*д(?) (7) &Н он Bq \OkJ «=1
§ 12. О РАСЧЕТАХ, СВЯЗАННЫХ С ХЕДЖИРОВАНИЕМ 771 и, значит, в силу теоремы 3 из § 1 Еб — = — ?BN Во' поскольку мартингальное преобразование ково, что в «терминальный» момент N N ^+£7ад(^) = ^о. «=1 (8) (9) Заметим, что левая часть в (8) не зависит от структуры рассматри- ваемого хеджа тг с начальным значением Хц =х. Если же теперь тг'— другой хедж с начальным значением Х£ , то, согласно (8), это значение снова равно ВоЕр-^-. Отсюда ясно, что начальное значение х для всех совершенных хеджей одно и то же, что и доказывает формулу (5). 2) Здесь мы докажем лишь неравенство sup В0Ер^-^С(/л/;Р). РёМ(Р) Вы (Ю) (Доказательство обратного неравенства требует так называемого «опцио- нального» разложения, выходящего за рамки настоящей книги; см. §§ 1с и 2d гл. VI в [100].) Предположим, что хедж тг таков, что Х% = х и Xfi^ (Р-п. н.). Тогда из (7) находим, что Во ' Bn Я=1 и, значит, для любой меры Р 6 М(Р) ДоЕр^Чх (ср. с (8) и (9)). Отсюда, беря супремум в левой части по всем мерам Р G М(Р), приходим к требуемому неравенству (10). □ 5. Остановимся на некоторых определениях и результатах, относя- щихся к опционам Американского типа. Для таких опционов приходится предполагать, что задана не одна платежная функция относящаяся к моменту времени /V, а целый набор функций fa, Д, ..., /д/, смысл кото- рых состоит в том, что если опцион предъявляется покупателем в момент
772 ГЛ. VII. МАРТИНГАЛЫ времени и, то соответствующая выплата (продавцом опциона покупателю) определяется (^-измеримой) функцией fn = fn(w). Если покупатель опциона решил предъявить опцион к исполнению в момент времени т = т(ш), являющийся марковским моментом со значе- ниями из множества {0, 1, ..., /V}, то тогда значение платежной функции будет равно /тм(^)» и, следовательно, продавец опциона при составлении своего портфеля ценных бумаг тг должен всегда предусматривать, чтобы для всякого т было выполнено условие хеджирования в следующем виде: X? fT (Р-п. н.). Это поясняет целесообразность следующего определения. Определение 3. Пусть (В, 5)-рынок является безарбитражным. «Справедливой» ценой опциона Американского типа с системой / — = (/п)о^п^ «^-измеримых неотрицательных платежных функций fn называется верхняя цена суперхеджирования, т. е. цена C(/;P) = inf{x: Э7гс^=хиХ;^/п (Р-п.н.), Q^n^N}. (11) Приведем (без доказательства) аналог теоремы 1 для случая опционов Американского типа. Теорема 2. 1) В случае полных безарбитражных (В, S)-рынков «справедливая» цена опциона Американского типа с системой пла- тежных функций f = (fn)o^n^N определяется формулой C(f;P)= sup В0Е₽Ь (12) теш$ °Т где ЯИц ={т: — класс моментов остановки (относительно («^л)о^лО « Р — единственная мартингальная мера, 2) В случае общих (неполных) безарбитражных (В, 5)-рынков «справедливая» цена опциона Американского типа с системой платежных функций f = (fn)o^n^N определяется формулой С(/;Р) = sup В0ЕрА, (13) теяп", Р€М(Р) Dt где М(Р) — совокупность всех мартингалъных мер Р. Доказательство см. в § 2с гл. VI в [100]. 6. Приведенные выше теоремы отвечают на вопрос о том, как для опционов определяется их «справедливая» цена. Не менее важен и вопрос о том, а как продавцу опциона строить хе- джирующий портфель тг*, получив «премию» C({n\ Р) или С(/; Р). Ограничимся для простоты изложения рассмотрением лишь случая полного (В, 5)-рынка опционов Европейского типа.
§ 12. О РАСЧЕТАХ, СВЯЗАННЫХ С ХЕДЖИРОВАНИЕМ 773 Теорема 3. Пусть (В, S)-рынок является безарбитражным и пол- ным. Существует самофинансируемый портфель п* = ((3*, у*) с на- чальным капиталом Xq * = С(/дг; Р), осуществляющий совершенное хеджирование платежного обязательства fa: X]f = fa (Р-п.н.). Динамика капитала Х^ =/3*Bn+y^Sn^ О^п^П, определяется формулами ХГ=В„ЕР(^|Л). (14) Компонента 7* = (t£)o^i<v хеджа тг* = (/?*, 7*) находится по значе- ниям X** = (Х**)о<л</у аз формулы д(т9=*д(ку <15» а компонента /3* = (/?„ )о<л^м — аз формулы Х„* =(3*Bn + 'Y*Sn. (16) Доказательство теоремы непосредственно следует из доказательства 5 импликации «полнота» «--представление» в лемме 2 из § 11, приме- ненной к мартингалу т = (тл)о^л^д/ с тп = Ер 1 . \ ОД/ / 7. В качестве примера реальных расчетов опционов рассмотрим (В, 5)-рынок, описываемый CPR-моделью: Brt = Brt_i(l +г), Sn = S/i—1 (1 Рл), (17) где рь ..., pN — независимые одинаково распределенные случайные вели- чины, принимающие два значения а и Ь, — \ <а<г <Ь. Этот рынок является безарбитражным и полным (см. задачу 3 в § 11) с мартингальной мерой Р такой, что Р{рл ~b} = р, Р{рп = а) = д, где г— а - Ь-г ? ~ b —a' Q b-а' (18) (См. пример 1 в п. 5 § 11.) Согласно формуле (5) из теоремы 1, для рассматриваемого (В, 5)-рын- ка «справедливая» цена w«;P)=EP(^«- (19)
774 ГЛ. VII. МАРТИНГАЛЫ И, согласно теореме 3, для отыскания совершенного хеджирующего порт- феля тг* = (/?*, 7*) надо прежде всего вычислить *"'=‘ЧоЪ?|А) <20) (с ^*л=сг(р1,...» рп), 1 , и <^Ь = {0> Ф) и затем найти 7* и /3* из формул (15) и (16). Поскольку Xq * =C(f/v; Р), то все сводится к отысканию условных ма- тематических ожиданий, стоящих в правой части (20), для n = 0, 1, ..., AL Будем предполагать, что ^-измеримая функция fa имеет «марков- скую» структуру, т. е. fa = где f = f(x) — некоторая неотрицательная функция от х > 0. Обозначим Fn(x-, р) = ^ /(х(1 +*)‘(1 + а)п~к) Скрк(\ - рУ~к. (21) *=о С учетом того, что [J (1 + рл) = (1 +&)д"-д»(1 +а)(А'-«)-(Дл--Д«)> n<k^N где Д„ = 51 +... + 8п, 6k = Qнаходим: о — а Е₽/(х П (1+Рл))=^-л(х;р) (22) \ n<k^N / г-а с р = т-. b — а Учитывая также, что S^—Sn f] 0+рД из (21) и (20) получаем, n<k^N ЧТО V = Е₽ I #1) = (1 + r)-"FN_„(Sn-, р). (23) В частности, С(/л/; Р) = Xf = (1 + r)-NFN(Sf, р). (24) Наконец, из (15), учитывая (23), находим, что 7* = определяется следующей формулой: 7я=(1+г) -------------'Sn-W-a)-------------• (25)
§ 12. О РАСЧЕТАХ, СВЯЗАННЫХ С ХЕДЖИРОВАНИЕМ 775 Для отыскания /3* заметим, что в силу условия самофинансируемости Вп-1 &0п + Sn-1 ДЧл = 0. Поэтому X„<1=№-i4-7„‘S„_1 (26) и, значит, » х;2|-7п*5я| " Bn_i (27) Отсюда и из представлений (23) и (25) видим, что = р)-^[Fv-ntSn-M+b)-, -р)- -FN-ntSn-iV+ay, р)]}. (28) Наконец, посмотрим, какой вид принимает, например, формула для «справедливой» цены C(Z/vJ Р) в случае стандартного опциона поку- пателя (опциона-колл), т. е. когда функция fa = (S;v - Х)+- Пусть Ко = Ко(а, b, N\ у) есть то наименьшее целое, для которого т. е. пусть 5о(И-а)"(|±|)*°>К, К° = 1 + [1П S0(l+a)N /1П Т+а]’ где [х] — целая часть числа х. Если положить ♦ \+Ь _ Р =ТТ7р’ г — а где р = -г-, и r b-а N B(K0,N; Р)=22 CkNpk(\-p)N-k, k=K0 (29) (30) (31) то из (24) нетрудно вывести следующую формулу (Кокса—Росса—Рубин- штейна) «справедливой» цены (обозначаемой сейчас СдО для стандарт- ного опциона-колл: CN =SoB(Xo, N; Р*) - К(\ +r)~N3(Ko, N; р). (32) Если Ко > N, то Сд/ = 0. Замечание. Поскольку (K-SN)+ = (SN-K)+-SN + K,
776 ГЛ. VII. МАРТИНГАЛЫ то «справедливая» цена стандартного опциона продавца (опциона- пут), обозначаемая (=C(//v; Р) с = -Sn)+), определяется фор- мулой Рл/ = Ё(1 + r)~N(K - 5„)+ = CN - Ё(1 + r)-NS„ + К(1 + r)~N. Поскольку Ё(1 +t)~nSn =So> то, очевидно, имеет место тождество «па- ритета колл-пут»: Рл/ =CN -So + K(l+r)~N. (33) 8. Задачи. 1. Найти цену C(/as Р) для стандартного опциона-колл с Дт = (Sy - К)+ для модели (В, 5)-рынка, рассмотренного в примере 2 п. 5 § 11. 2. Попытайтесь доказать справедливость обратного неравенства в фор- муле (10). 3. Докажите формулу (12) и попытайтесь доказать формулу (13). 4. Дать подробный вывод формулы (23). 5. Доказать формулы (25) и (28). 6. Привести подробный вывод формулы (32). § 13. Задачи об оптимальной остановке. Мартингальный подход 1. С примером задачи, относящейся к теории «оптимальных правил остановки», мы уже сталкивались при описании «справедливой» цены оп- ционов Американского типа. Именно, формула (12) в § 12 показывает, что для отыскания этой цены требуется (в упрощающих предположениях Вл = 1, и Р = Р) найти величину (также называемую «ценой») Vqn= sup EfT, (1) где f = (/o, /ь •••» М есть последовательность &п-измеримых неотри- цательных функций fn и т = т(о>) — марковские моменты (или моменты остановки) из класса 97$, состоящего из случайных величин т = т(ц>), при- нимающих значения в множестве {0, 1, ..., N} и таких, что для каждого п из этого множества {си: т(а;) = п}е&п- (2) (В этом параграфе мы предполагаем заданным некоторое фильтрованное вероятностное пространство (Q, (^п)л>о, Р) с «Fo = {0, И}.)
§ 13. ЗАДАЧИ ОБ ОПТИМАЛЬНОЙ ОСТАНОВКЕ 777 Наряду с задачей (1), где т = т(о>) берутся из множества ОТд, интерес представляет и задача отыскания величины («цены») sup E/r, (3) rewi~ где OTq° = {t: т<оо} и / = (/о, Д, ...) —стохастическая последователь- ность ^-измеримых случайных величин /я, п^О, с Е|Д-| <оо. Как в случае (1), так и в случае (3) требуется, помимо отыскания «цен» V0N и Vo°°, найти также оптимальные моменты (если они существуют), на которых достигается супремум. Во многих задачах целесообразно допускать к рассмотрению также марковские моменты, принимающие значение +оо. В этом случае при рас- смотрении ЕД- следует условиться о том, что понимается под /оо- Один из естественных способов состоит в том, чтобы под Д» понимать значение lim fn. Иной способ состоит в том, чтобы, допуская для г и бесконечные п значения, определять «цену» в виде Ро°° = sup ЕД-/(т<оо), (4) где — класс всех марковских моментов, = {т: т оо}. Очевидно, что Ро°° = sup ЕД-, если считать /оо = 0 (ср. с п. 3 в § 1). В дальнейшем будем рассматривать лишь задачу (1). (По поводу слу- чая N = оо см. § 9 в гл. VIII.) Если не конкретизировать вероятностную структуру последовательности / = (/о, Д, ...» fa), то наиболее эффектив- ным методом решения задач (1) и (3) является описываемый ниже «мар- тингальный» метод. (Не оговаривая этого каждый раз специально, будем всегда предполагать, что Е|/я| < оо при всех п N.) 2. Итак, пусть N < оо. Этот случай может быть рассмотрен методом «индукции назад», реализуемым здесь следующим образом. Наряду с Vq введем «цены» y"=supEM (5) геяи* где ={т:п^т^/У} — класс моментов остановки таких, что п т(ш) /V для всех ш € Я. Введем также индуктивно стохастическую последовательность vN = = (и„ по следующему правилу: V* = ?N, Vn= max( fn. E («л+1 I (6) для n = N — 1, 0. 9 - 9728
778 ГЛ. VII. МАРТИНГАЛЫ Положим для 0 п N =min{n^k^N: fk = v%}. (7) С помощью введенных объектов решение задач об оптимальной оста- новке (1) и (5) полностью описывается в следующем предложении. Теорема 1. Пусть последовательность f = (/о, /ь •••» In) такова, что fn — ^-измеримы. 1) Для каждого п такого, что O^n^N, момент Т% = min{« < k С N: vNk=fk} (8) является оптимальным в классе : E/r«= sup EfT (=VnN). (9) Т&МЦ 2) Моменты r„ , 0 п N, являются оптимальными также в сле- дующем «условном» смысле: (Р-п. н.) E(f * |«Fn) = esssup E(/r|^). (10) «Стохастические цены» ess sup Е(/т \&n) совпадают c : ess sup Е тетц z.(fr№ = vNn (Р-п.н.) (11) V» = EvNn. (12) Если п = 0, то V0N = v^. (13) Если же n-=N, то v% = £f»- (14) 3. Прежде чем переходить к доказательству, напомним определение понятия существенного супремума ess sup £а(о>) семейства ,^-измери- мых случайных величин {$а(о>), се в SI}» использованного в формуле (10). Необходимость введения этого понятия вызвана тем обстоятельством, что рассмотрение просто sup £а(о>) в случае несчетного множества 21 приводит к функциям (от си еП), которые, вообще говоря, могут оказаться не «^-измеримыми. Действительно, для всякого с G R (о/: sup П {ш: £а(ш)^с}.
§ 13. ЗАДАЧИ ОБ ОПТИМАЛЬНОЙ ОСТАНОВКЕ 779 Здесь множества Аа = {ш: fQ(cu) ^с} принадлежат & (т. е. являются событиями). Однако в силу несчетности множества 21 нет гарантии, что П аЕ* Определение. Пусть {£а(cu), a G 21} — семейство случайных величин (т. е. ^-измеримых функций, принимающих значения в (-оо, +оо)). Гово- рят, что расширенная случайная величина £(си) (^-измеримая функция со значениями в (—оо, +оо]) есть существенный супремум семейства случайных величин {£а(си), а е21} (обозначение: f(cu) = esssup £a(cu)), если а) f (си) > Ca(w) (Р-п-н-) лля всех а е 21, Ь) из того, что (расширенная) случайная величина ту(си) такова, что 7/(cu) >£Q(cu) (Р-п. н.) для всех ае21, следует, что f(cu) ^tj(cu) (Р-п. н.). Иначе говоря, f(cu) есть наименьшая (расширенная) случайная вели- чина среди всех (расширенных) случайных величин, мажорирующих вели- чины £а(си) при всех ае21. Конечно, надо прежде всего доказать содержательность данного определения. Вытекает это из следующего предложения. Лемма. Для всякого семейства {£а(си), ае21} случайных величин существует (вообще говоря, расширенная) случайная величина £(ш) (обозначаемая ess sup $Q(cu)) со свойствами а) и Ь) из определения. «еа Найдется счетное подмножество 2lo С 21 с тем свойством, что в качестве такой величины может быть взята величина £(cu) = sup £a(<u). Доказательство. Предположим сначала, что все величины $Q(cu), а е 21, равномерно ограничены (|£а(о?)| с, ш 6 Я, а е 21). Пусть А — конечное множество индексов ае21. Положим 5(Я) = = Е^тах £а(си)). Пусть, далее, S = supS(/4), где супремум берется по всем конечным подмножествам А С 2(. Обозначим для п 1 через Ап конечное множество такое, что Е(тах{<,(ф5-1. Пусть 21о = П Ап- В силу счетности этого множества функция п^1 C((j)= sup £a(w) является ^-измеримой, т. е. является случайной величиной. (Заметим, что |£(си)| с, так что есть обычная, а не расширенная случайная величина.) 9*
780 ГЛ. VII. МАРТИНГАЛЫ Из приведенной конструкции случайной величины £(о>) следует (зада- ча 1), что эта величина удовлетворяет требованиям а) и Ь) из данного выше определения. Тем самым, в случае равномерно ограниченного семейства {£аМ, а е 21} существование существенного супремума установлено. В общем же случае надо от величин £а(си) сначала перейти к ограни- ченным величинам £а(а>) = arctg £а(и>), для которых |£а(а>)| ^тг/2, ае21, tv е Q, затем построить £(си) = ess sup £а(си). Величина £(о>) = tg £(cu) будет удовлетворять требованиям а) и Ь) опре- деления существенного супремума (задача 2). □ 4. Доказательство теоремы 1. Зафиксируем индекс N и для про- стоты записи будем его сейчас опускать. Если n = N, то vn = fN и ту , и свойства (9)—(12), (14) очевидны. Теперь будем рассуждать по индукции. Пусть утверждения теоремы установлены для п = N, N — 1, ..., k. По- кажем, что они тогда верны и для п = k - 1. nycijb (= и Aefy-b Определим момент fG%, по- лагая г = тах(т, k). Поскольку т€и событие {r^k}e#k-\, находим, что Е [/д fT] = ^[lAa{T=k-i}fr] + Е[/дп{г^}/т] = = Е [/лп{т=*-п fr] + Е [/дп{г^л}Е(fT | &k-1)] = = Е[/дП{^--1}/^] + Е[/дГ|{^>л}Е(Е(/^|^)|^_1)] < Е [/дп{т=£-1} fk-1 ] + Е [ 1ап{т^Е(vk | i)] ^ Е [/д Vk-i ]. (15) В силу с^-1 -измеримости множества А отсюда вытекает, что для лю- бого (Р-п.н.) Е(/т|^-1)<ил-1. (16) Покажем теперь, что для момента ть~[ с Р-вероятностью единица E(frfc_J^-i) = ^_b (17) (Если это равенство будет установлено, то в силу (16) получим, что соот- ношения (10) и (11) справедливы и для п = k - 1.) С этой целью достаточно показать, что в (15) для момента t = t^_i на самом деле всюду имеют место равенства. Начиная так же, как в (15), и учитывая затем, что на множестве по определению (5) имеем т = т^ и что (по предположению
§ 13. ЗАДАЧИ ОБ ОПТИМАЛЬНОЙ ОСТАНОВКЕ 781 индукции) E(fTJ<^) = ^ (Р-п.н.), находим: E[/4/t*_J = Е[/лп{тл_1=л-1}7^1] + Е[/лп{т*_1>л}Е(/Гл_11^-1)] = = Е [1Ап{т*_, =k-1} fk-1 ] + Е [/лп{т*_ । >k} Е (frk | &k-1) ] = = Е^ЛПЬ-*-,^-!}/*-!] + Е[/лп{т^,>Л}Е(^ | с^Аг— 1)] = Е[/л^-1], где при написании последнего равенства было учтено, что по определению Vk-\ =1пах(Д_1, E(ua|<^-i)) и отсюда Vk- \ = fk—\ на множестве {r^i = -k - 1} и Vk-\ > fk-i на множестве {r^-i >k- 1} = {ta-i >&} (значит, на этом множестве Vk-i = E(Vk | 1)). Итак, свойство (17) установлено. Как уже было отмечено выше, вместе с (16) это свойство приводит к справедливости требуемых соотношений (Ю) и (11). Из этих соотношений следует, что (Р-п. н.) и„ = Е(/Гя|^)>Е(/г|^) (18) для всякого (=ЯН^). Следовательно, с учетом соглашения и„ =vn находим, что Е^ = Е/Тл> sup Е/т = ^, (19) те^яЦ что доказывает (9) и (12). Свойство (13) есть частный случай (12) (при п = 0) и того свойства, что Vq является константой в силу (11) и тривиальности а-алгебры (={0, Q}). Наконец, равенство (14) есть следствие определения (5) (при n = W). □ 5. С тем чтобы прояснить «мартингальный» аспект рассматриваемой задачи об оптимальной остановке, обратимся к рекуррентным соотношени- ям (6) для последовательности vN = (vq , ..., vX) с «краевым» условием Из (6) видим, что (Р-п. и.) при каждом л = 0, 1, N - 1 v^fn, (20) (21) Первое неравенство здесь говорит о том, что последовательность vN мажорирует последовательность f = (/6, Д,..., Av). Второе неравенство означает, что последовательность vN является супермартингалом с «терминальным» значением = Тем самым можно сказать, что последовательность vN = (Vq , v,..., ) с величинами v„ , определенными из (6) или по формуле (11), является супермартингалъной мажорантой последовательности / = (/о, Д, ..., Av)-
782 ГЛ. VII. МАРТИНГАЛЫ По-другому, это означает, что последовательность принадлежит классу последовательностей 7yv = (7of» 7^» •••» 7$) с 7$ 7/v, удовлетво- ряющих (Р-п. н.) «вариационным неравенствам» ^>max(f„,E(oA+1|^„)) (22) при всех п = 0, 1, ..., N — 1. Но последовательность vN обладает тем дополнительным свойством, что для нее в (22) имеет место не только нестрогое неравенство «^», но и просто равенство «=» (см. (6)). Это свойство позволяет следующим об- разом выделить последовательность vN в классе последовательностей (с 7% > Fn)- Теорема 2. Последовательность vN является наименьшей супер- мартингальной мажорантой последовательности f = (/о. /1, • • • > Av)- Доказательство. Действительно, поскольку = a 7$>Av, то 7$ ^vn- Отсюда и из (22) и (6) видим, что (Р-п. н.) 7*-i^max(Av-i, E(7^|^v_i))>max(//v_i, Е(о^|^у_|)) = о^_1. Аналогичным образом находим, что 7^ v„ (Р-п. н.) для всех осталь- ных п < N - 1. □ Замечание. Результат доказанной теоремы может быть переформу- лирован также в следующем виде: решение vN = (w^, , ..., рекур- рентной системы u^ = max(frt, E(^+1|^)), n<N. c = fu является наименьшим из всевозможных решений yN = = (7^, 7^, ...» 7$) рекуррентных систем неравенств > max(frt, E(7^i |<^)), п < /V, (23) с 7# > Av- 6. Теоремы 1 и 2 не только описывают метод отыскания цены Vq = = sup Е/т, где sup берется по классу марковских моментов OTq , но также и показывают, как найти оптимальный момент rtf, т. е. момент, для которого Согласно (8), 7^ = min{0<^AM = AJ. (24) При решении конкретных задач об оптимальной остановке полезно следующее равносильное описание этого момента остановки Tq . Пусть D% = {ur. vNn(u>) = fn(u>)} (25)
§ 13. ЗАДАЧИ ОБ ОПТИМАЛЬНОЙ ОСТАНОВКЕ 783 И CNn = fi\DNn = {w: <(о>) = E(ttf+I|Л)М}. Ясно, что = П, С$ = 0 и CD* C...CD#=fi, C^DC^D...DC^ = 0. Из (24) и (25) следует, что момент Тц может быть определен также в следующем виде: tq = min{0 k N: cu е D%}. (26) Области естественно называть «множествами остановки», а области — «множествами продолжения наблюдений». Оправды- вается эта терминология следующей аргументацией. Рассмотрим момент п = 0 и разобьем множество Q на два множества Dq и Cq (Q = D* U С* , Dq П Cq = 0). Если оказывается, что ш е Dq, то Tq (си) = 0. Иначе говоря, «остановка» происходит в момент л = 0. Если же cu 6 , то это означает, что для такого си момент т*(си) 1. В том случае, когда оказывается, что рассматриваемое cueD*nC*, момент r*(cu) = 1. Аналогичным образом рассматриваются и последующие этапы. В момент времени W наблюдения заведомо завершаются. 7. Рассмотрим некоторые примеры. Пример 1. Пусть последовательность f = (fo, f\, ..., fa) является мартингалом с /о=1. Тогда, согласно следствию 1 к теореме 1 § 2, Е/т = 1 для всякого марковского момента t&XRq. Тем самым в рассмат- риваемом случае Vq = sup Е fT = 1. При всех 1 п N функции = fn и Vq = 1. Понятно, что тогда Tq = = min{0 k N: fk = v^} = 0 и = п для всякого 1 п /V. Таким образом, задача об оптимальной остановке для мартингальных последовательностей решается, в сущности, тривиальным образом: опти- мальным моментом остановки является момент т*(си) = 0, сибП (так же как, впрочем, и любой другой момент т*(си) = л, си е Я, 1 л /V). Пример 2. Если последовательность / = (/о, /ь fa) — субмар- тингал, то Efa^Efa для любого (теорема 1 в § 2). Тем са- мым оптимальным моментом здесь является момент r* = N. Поскольку = E(//v I^k) fk (Р-п. н.), то вполне возможно, что момент т^(си) для некоторых cu может быть и меньше АЛ Но в любом случае и момент Tq, и момент r* = N являются оба оптимальными. Хотя момент r* = N имеет простую структуру, тем не менее момент Tq обладает определенными преимуществами — он является наименьшим из всех возможных опти-
784 ГЛ. VII. МАРТИНГАЛЫ мальных моментов, т. е. если т есть также оптимальный момент в классе 80$, то Р{т^ ^f}= 1. Пример 3. Пусть последовательность / = (/о,/ь ...» Av) является супермартингалом. Тогда = fn для всех О^я^/V. Следовательно, оптимальным является (как и в мартингальном случае) момент rtf = 0. Приведенные примеры достаточно просты, и вопрос об оптимальности рассмотренных моментов остановки решается, в сущности, без обраще- ния к теории, изложенной в теоремах 1 и 2. Достаточно опираться лишь на известные результаты о сохранении свойств мартингальности, субмар- тингальности и супермартингальности при замене времени на марковский момент (§ 2). Но в общих случаях отыскание цены Vq и оптимального момента остановки т$ может быть весьма трудной задачей. Значительный интерес представляют те случаи, в которых функции fn имеют следующий вид: /Да;) = /(ХЛМ), где X = (Хп)п^о — некоторая марковская цепь. Как будет показано в § 9 гл. VIII, в этом случае решение задач об оптимальной остановке сводится, в сущности, к решению вариационных неравенств, уравнений дина- мического программирования Вальда—Веллмана, Там же будут даны и (нетривиальные) примеры, в которых приводятся полные решения ряда задач об оптимальной остановке для марковских последовательностей. 8. Задачи. 1. Показать, что построенная в доказательстве леммы (п. 3) случайная величина £(о/) = sup £Q(oz) удовлетворяет требованиям а) и Ь) в опреде- лении существенного супремума. (Указание: в случае а 21о рассмотрите Е тах(£(о>), £аМ)0 2. Показать, что величина £(u>) = tg £(о>), (см. конец доказательства леммы п. 3) также удовлетворяет требованиям а) и Ь). 3. Пусть £1, ••• — последовательность независимых одинаково рас- пределенных случайных величин с E|fi| < оо. Рассматривается задача об оптимальной остановке (в классе = {т : 1 т < оо}): V* = sup E(max£-ст). Пусть r* = inf{n^ 1: где Л* — единственный корень уравнения E(£i — Л*) = с. Показать, что если Р{т* <оо}= 1, то момент т* является оптимальным в классе всех конечных моментов остановки т, для которых Е ^тах £ — ст^ существует. Показать также, что V* = Л*.
§ 13. ЗАДАЧИ ОБ ОПТИМАЛЬНОЙ ОСТАНОВКЕ 785 4. Пусть в этой и следующей задаче = {т: п т < оо}, V~= sup Е/т, т€ЙП°° u~ = esssup Е(/т|Л1), тёЯЛ°° т£° = inf{& > л: vn°° = M. Предполагая, что Е sup f~ < оо, показать, что для предельных случайных величин йя = Jim и* N—>oo справедливы следующие утверждения: (а) для всякого т е u„>E(/r|^„); (Ь) если момент т£° eSDIJJ0, то ип = Е(/т®о = (= ess sup Е(/Г|^л)). теяп®° 5. Пусть Вывести из утверждений (а) и (Ь) предыдущей задачи, что этот момент т%° является оптимальным в том смысле, что ess sup Е(/т|<^я) = Е(/гтсо|Л1) (Р-п.н.) тбял°° и sup Е/Т = Е/Тоо, т. е. К°° = Е/Гоо. Л I 1 п
Глава VIII ПОСЛЕДОВАТЕЛЬНОСТИ СЛУЧАЙНЫХ ВЕЛИЧИН, ОБРАЗУЮЩИЕ МАРКОВСКУЮ ЦЕПЬ § 1. Определения и основные свойства...................... 787 § 2. Обобщенное марковское и строго марковское свойства... 800 §3 . О проблематике предельных, эргодических и стационарных распределений вероятностей для марковских цепей............. 809 §4 . Классификация состояний марковских цепей по алгебраиче- ским свойствам матриц переходных вероятностей .............. 812 §5 . Классификация состояний марковских цепей по асимптотиче- ским свойствам переходных вероятностей ..................... 819 §6 . О предельных, стационарных и эргодических распределениях для счетных марковских цепей................................ 833 §7 . О предельных, стационарных и эргодических распределениях для конечных марковских цепей............................... 841 § 8. Простое случайное блуждание как марковская цепь...... 842 § 9. Задачи об оптимальной остановке для марковских цепей. 856
Истоками современной теории марковских процессов являются, с одной сто- роны, работы А. А. Маркова (1906—1917 гг.) о последовательностях испытаний, «связанных в цепь», с другой стороны, попытки математического описания фи- зического явления, известного под названием броуновского движения (Л. Баше- лье, 1900 г:, А. Эйнштейн, 1905 г.). Е. Б. Дынкин. «Марковские процессы» [21] § 1. Определения и основные свойства 1. В § 12 гл. I для случая конечных вероятностных пространств были изложены соображения и принципы, лежащие в основе понятия мар- ковской зависимости (см. свойство (7) в § 12 гл. I) случайных вели- чин, призванной описывать эволюцию систем, обладающих свойством отсутствия последействия. В настоящем параграфе соответствующие рассмотрения проводятся для случая более общих вероятностных про- странств. Один из основных вопросов «марковской теории» состоит в исследо- вании асимптотического поведения (с ростом времени) систем с от- сутствием последействия. Весьма примечательно, что их эволюция ока- зывается, в очень широких предположениях, такой, что система как бы «забывает» свое начальное состояние, поведение этих систем «стабилизи- руется», система входит в «стационарный режим». Детальное рассмотре- ние вопросов асимптотического поведения будет далее проведено для си- стем, эволюция которых описывается «марковскими цепями со счетным множеством состояний». С этой целью нам придется дать классифика- цию состояний «марковских цепей» по алгебраическим и асимптотическим свойствам их переходных вероятностей. 2. Пусть (Я, Р) — фильтрованное вероятностное прост- ранство, т. е. вероятностное пространство (Я, &, Р) с дополнительно вы- деленной на нем структурой — фильтрацией (потоком) (&п)п^о а-алгебр &п, п^О, таких, что С наглядной точки зрения &п “ это «информация», доступная к моменту времени п (включительно). Пусть также (Е, S) — некоторое измеримое пространство, играющее в дальнейшем роль пространства состояний, в котором рассматриваемые системы принимают свои значения. По «техническим» причинам (напри- мер, для того, чтобы для случайного элемента Ло(<*>) и хеЕ множество {cj:/0(а?) = %} принадлежало &) будет предполагаться, что сг-алгебра S содержит все подмножества из Е, состоящие из одной точки. (По поводу этого предположения см. также далее п. 6.)
788 ГЛ. VIII. МАРКОВСКИЕ ЦЕПИ При этом предположении измеримые пространства (Е, <?) принято на- зывать фазовыми пространствами, или пространствами состояний (рассматриваемых систем). Определение 1 (марковская цепь в широком смысле). Пусть (Q, &, (^п)п^о, Р) ~ фильтрованное вероятностное пространство и (Е, <£) — фазовое пространство. Последовательность X = (Хп)п^о случайных элементов Хп=Хп(ш), за- данных на (П, «F, Р), принимающих значения в Е и являющих- ся измеримыми, /г^О, называется последовательностью вели- чин, связанных марковской зависимостью (марковской цепью, цепью Маркова) в широком смысле, если для любых п 0 и В 6 S выполнено марковское свойство в широком смысле: Р(Хл+1 ев \&п) (ш) = Р(Хя+1 ев |ад) (Р-п. н.). (1) Если = а(Хо, Х\, .,.,Хп) есть сг-алгебра, порожденная величинами Хо, Хь ...» Хп, то, поскольку а Хп — «^-измеримы, из (1) по- лучаем марковское свойство в узком смысле (или просто марковское свойство): Р(Хй+1 G В1Л*) М = Р(*п+1 6 в\Хп(Ш)) (Р-п. н.). (2) Для наглядности (ср. с § 12 гл. I) это свойство записывают часто в таком виде: Р(Хя+1 GB|XoM, Хл(и>)) = Р(Хл+1 еВ\Хп(ш)) (Р-п.н.). (3) Выведенное из (1) марковское свойство в узком смысле (2) подсказы- вает целесообразность введения понятия марковской зависимости и в том случае, когда a priori не выделяется поток (t^n)rt>o- Определение 2 (марковская цепь). Пусть (П, &, Р) — вероятност- ное пространство, (Е, S) — фазовое пространство. Последовательность X = (Xn)n^Q случайных элементов Хп=Хп(ш), принимающих значения в Е и являющихся <^7<?-измеримыми, называется последовательностью величин, связанных марковской зависимостью (марковской цепью, цепью Маркова), если для любых п 0 и В е S выполнено марковское свойство в узком смысле (2). Замечание. Введение с самого начала фильтрованного вероятност- ного пространства, на котором определялась марковская цепь в широ- ком смысле, оказывается полезным во многих вопросах, где поведение систем рассматривается в зависимости от того или иного «потока инфор- мации» (&п)п^о- Например, может случиться, что у «двумерного» процесса (X, Y) = (Xn, Yn)n^Q первая компонента X = (Хп)п^о, не будучи марковской
§ 1. ОПРЕДЕЛЕНИЯ И ОСНОВНЫЕ СВОЙСТВА 789 в смысле определения (2), тем не менее является марковской в смысле определения (1) с , п>0. В элементарном же изложении теории марковских цепей, которому и будет посвящена настоящая глава, поток обычно не вводится и за основу принимается определение 2. 3. Свойство марковости характеризует «отсутствие последействия» в эволюции системы, состояния которой описываются последовательностью X — (Xn)n^Q, В случае конечного пространства Q это отмечалось в § 12 гл. I в виде свойства Р(Б|ПН) = Р(Б|Н), (4) где Б — «будущее», П — «прошлое» и Н - «настоящее». Там же отмеча- лось, что для марковских систем выполнено также и свойство Р(ПБ|Н) = Р(П|Н)Р(Б|Н), (5) интерпретируемое как независимость «прошлого» и «будущего» при фик- сированном «настоящем». В общем случае аналогами (4) и (5) являются свойства (6) и (7) из следующей теоремы, дающей разные эквивалентные формулировки мар- ковости (в смысле определения 2) и в которой используются такие обо- значения: <^(л,оо) = 1 > Х?+2> • • •) • Теорема 1. Марковское свойство (2) равносильно выполнению лю- бого из следующих двух свойств: при п^О Р(Б|^л])М = Р(Б|Х„(а,)) (Р-п.н.) (6) дм всякого «будущего» события Б € «^(л1ОО) или при п 1 Р(ПБ|Хя(ш)) = Р(П|Х„М)Р(Б|ХяМ) (Р-л.я.) (7) дм всякого «будущего» события Б е <^1ОО) и «прошлого» события П е^|0,л-1р Доказательство. Докажем прежде всего равносильность свойств (6) и (7).
790 ГЛ. VIII. МАРКОВСКИЕ ЦЕПИ (6) => (7). Имеем (Р-п. н.) Р(П |/„(а>))Р(Б |Х„М) = Е(/п |Х„М) Е(/б |Х„М) = = Е{/пЕ(/б |Х„М) |Х„(о>)} = Е{/п Е(/б |^,„])(w) |X„(u>)} = = Е{Е(/п/б | |X„(w)} = Е{/п/б |Х„М} = Р(ПБ |Х„М). (7) => (6). Надо показать, что для всякого множества С из «^>п] Е(/СР(Б |ХЯ)) = Е(/СР(Б |^|о,л))). (6') С этой целью сначала рассмотрим частный случай такого множества, а именно множество ПН, где Пё^я-ц и Н ё а(Хп), и покажем, что в этом случае (6') следует из (7). Действительно, Е(/пнР(Б|Х„)) = Е(/п/нЕ(Б|Х„)) = Е(/нЕ(/пЕ(/б |Х„) |Х„)) = = Е(/нЕ(/п |Х„) Е(/б |Х„)) = Е(/нР(П |Хя) Р(Б |Х„)) □ Е(/НР(ПБ|Х„)) = ' =Р(ПНБ) = Е(/пнР(Б|^])), (8) т. е. свойство (6х) выполнено для множеств С вида ПН, где П е и Н Ga(Xrt). Отсюда с помощью аргументов о «монотонных классах» (см. § 2 гл. II) выводится справедливость этого свойства (6х) и для любых множеств С из Поскольку функция Р(Б|Хп) является -измеримой, то из (6х) вытекает, что Р(Б|ХЛ) является вариантом условной вероятности Р(Б|«^[0я]), т. е. выполнено свойство (6). Перейдем к доказательству равносильности свойств (2) и (6), а значит, в силу доказанного, и свойств (2) и (7). Импликация (6) => (2) очевид- на. Покажем справедливость импликации (2) =з> (6), опять же привлекая аргументы о «монотонных классах». Множества Б в (6) являются множествами из а-алгебры <^<ОО) = = ^(л+loo), являющейся наименьшей сг-алгеброй, порожденной алгеброй U ^[п+1л+лр где •••>*«+*)• Поэтому естественно 1 начать с доказательства свойства (6) прежде всего для множеств Б из а-алгебр ^+1,й+Л). Доказывать это будем по индукции. Если k = 1, то =а(Хл+1) и (6) есть в точности (2), что предположено выполненным. Пусть теперь (6) выполнено для некоторого 1. Покажем его спра- ведливость для k + 1. С этой целью возьмем множество Бе«^*+1 вида Б = Б1 А Б2, где Б1 €^+1п+Л) и Б2 е а(Ал+fc+i)- Тогда, используя предположение индук-
§ 1. ОПРЕДЕЛЕНИЯ И ОСНОВНЫЕ СВОЙСТВА 791 ции, находим, что (Р-п. н.) Р (Б | ^[0,л]) = Е (/б | ) = Е [/БI пБ2 | ] = Е [^Б1 Е (/б2 I ^[0л+£]) I *^[0,л 1 ] = = Е[/Б,Е(/Б2 |Лй+А) |^0>п)1 = Е[/Б,Е(/Б2 |Хй+*) |Хй] = = Е [/Б1 Е(/Б21 ^|ял+ч) |ХЯ] = Е [Е(/б, /Б21 ^|Й1П+А1) I Хй] = = Е[/б,/Б2|Хй] = Р(Б1ПБ2|Хй) = Р(Б|Хя). (9) Из свойства (9), доказанного для множеств Б из <^_ь1л+л+1] вида Б = Б’п Б2 с и Б2е<т(/л+*+1), вытекает (задача 1а), что это свойство выполнено и для любых множеств Бе<^+1л+л+1р Отсюда заключаем (задача 1b), что свойство (9) выполнено и для множеств Б из оо алгебры (J откуда в свою очередь следует (задача 1с), что оно / ос \ выполнено и для ст-алгебры ст I U «^[й+1я+А] = <оо)- □ \/г=1 / Замечание. Аргументы, приведенные в данном доказательстве, осно- ваны на использовании принципа подходящих множеств (сначала про- водить доказательство для «просто» устроенных множеств) с последую- щим применением результатов о монотонных классах (§ 2 гл. II). В даль- нейшем этот метод доказательства будет также еще не раз применяться (см., например, доказательства теорем 2 и 3, из которых, в частности, мож- но восстановить и те места в доказательстве вышеприведенной теоремы 1, которые были отнесены в задачи la, 1b и 1с). 4. Классическим примером марковской цепи является случайное блу- ждание X = (Xrt)rt^o с Xrt=X0 + Sn, п>1, (10) где Srt=£i +... + £л, а случайные величины заданные на вероятностном пространстве (П, Р), являются независимыми. Теорема 2. Пусть ^Ь = ^(^о), «^л = <т(Хо» Сь • Последо- вательность X = (Xrt)rt^o» рассматриваемая на фильтрованном веро- ятностном пространстве (О, (с^л)л^о, Р), является марковской цепью (как в широком, так и в узком смысле): для п^Ои Be3S(R) Р(Хл+1 €В\^п)(ш) = P(Xn+l е В\Хп(ш)) (Р-п. «.), (11) причем Р(Ля+1е5|Хй(а/)) = Ря+1(В-ХйМ) (Р-п.н.), (12) где Рп+1(А) = Р{£п+1&А} (13)
792 ГЛ. VIII. МАРКОВСКИЕ ЦЕПИ U В-Хп(ш) = {у: у+Хп(ш)еВ}, Be@(R). Доказательство. Будем одновременно убеждаться в справедливости (И) и (12). В случае дискретных вероятностных пространств подобные доказатель- ства проводились в § 12 гл. I, и на первый взгляд может показаться, что и здесь также все просто. На самом же деле, как будет видно из приводимого доказательства, здесь все же «есть что доказывать». Пусть множество А е {Хо 6 Bq, & е Blt £п€Вп}, где Bt е S8(R), i = = 0, 1, ..., п. По определению условной вероятности P(Xrt+i еВ\^п)(ш) (см. § 7 гл. II) $ Р(Хп+1 ев |^„)М P(du) = $ /<Xl+l6fl)MP(du) = А А = Р{Хо € Bq, fl G Bl, ...» Сп € Вп, Хп^[ 6 В} = - $ Pn+i(B-(xo + xi + ... + xn))Po(dxo)...Pn(dxn) = Вох...хВп = $РЛ+1(В~ХЛМ)Р(^). (14) А Итак, для множеств из вида А = {Хо € Bq, Ci 6 В\,..., £п е Вп} справед- ливо равенство $ Р(Х„+1 6В|Л)МР(^) = $ Pn+l(B -ХЯМ)Р(<М- (15) А А Очевидно, что система указанных множеств А является тг-системой (Пб^ и если Л1 eXi и Лгб^, то и А{ АЛгЕ^; см. определение 2 в § 2 гл. II). Далее, пусть JSf обозначает совокупность всех тех множеств Л е для которых формула (15) верна. Покажем, что есть A-система; см. определение 2 в § 2 гл. II. Ясно, что Qe т. е. выполнено свойство (Аа) из этого определения. Из свойства аддитивности интеграла Лебега следует и свойство (А*) из этого же опре- деления. Наконец, третье свойство (Ас) из определения A-систем вытекает из теоремы о монотонной сходимости в интегралах Лебега (см. § 6 гл. II). Итак, <£ есть A-система. Применяя утверждение с) теоремы 2 из § 2 гл. II, находим, что сг(^) С Но сг(^) = <^, и, следовательно, свойство (15) выполнено и для множеств Л из Поэтому, учитывая, что Prt+i(B — Хп(о/)) является (как функция от о?) -измеримой (задача 2), из (15) (по определению условных вероятностей)
§ 1. ОПРЕДЕЛЕНИЯ И ОСНОВНЫЕ СВОЙСТВА 793 получаем, что Pn+i(B есть версия условной вероятности Р(Хл+1 С 6 В | ^п) М- Наконец, по «телескопическому» свойству условных матема- тических ожиданий (см. свойство Н* в § 7 гл. II) находим, что (Р-п. н.) Р(Хл+1 е В\Xn)(w) = E[/{Xn+ieB} = E[E(/{Xw+16B} |^л) = = Е [Рл+1 (В - Хп) |ХпМ] = Рп+[ (В - ХЛМ). (16) Тем самым, оба свойства (11) и (12) доказаны. □ Замечание. Справедливость свойств (11) и (12) можно было бы также непосредственно вывести (задача 3) из утверждения леммы 3 в § 2 гл. II. Мы провели подробное доказательство этих «почти очевидных» свойств с тем, чтобы лишний раз продемонстрировать технику доказательства по- добных утверждений, основанную на принципе подходящих множеств и результатах о монотонных классах. 5. Обратимся к марковскому свойству (1). Поскольку пространство (В, S) является борелевским, то по теореме 5 из § 7 гл. II для каждого п>0 существует регулярное условное распределение Рп+\(х\ В) такое, что (Р-п. н.) Р(Хя+1 еВ\Хп^)) = Рп^(Хп(^ В), (17) где функция Рл+1(х; В), BeS. хеЕ, обладает следующими свойствами (см. определение 7 в § 7 гл. II): (а) для каждого х функция множеств Рл+1(х, •) является мерой на (В, (Ь) для каждого B^S функция Рп+\('\ В) является S-измеримой. Функции Рл = Рл(х; В), л>1, называют переходными функциями (также — марковскими ядрами). Особо для нас будет важен тот случай, когда все эти переходные функ- ции совпадают, Pj =Р2 = • • •» точнее говоря, когда у условных вероятностей Р(Хл+1 € В |Хп(о;)), п > О, существует один и тот же вариант регулярного условного распределения Р(х\ В) такой, что (Р-п. н.) Р(Хл+1 еВ|Хл(о;)) = Р(Хл(и;); В) (18) для всех п 0 и В 6 S. Если такой вариант Р = Р(х; В) существует (и тогда можно считать, что все Рп = Р, и >0), то марковскую цепь называют однородной (по времени) с переходной функцией Р = Р(х; В), х е Е, В е S. Наглядный смысл свойства однородности марковских цепей ясен: дви- жение соответствующей системы происходит однородно в том смысле, что вероятностные механизмы, управляющие переходом системы, остаются од- ними и теми же для всех моментов времени п 0. (В теории динамических систем это свойство отождествляют со свойством консервативности.)
794 ГЛ. VIII. МАРКОВСКИЕ ЦЕПИ Помимо переходных вероятностей Р\, Р%, ...» а в случае однородных цепей — переходной вероятности Р, важной характеристикой марковских цепей является начальное распределение тг = тг(В), В е<?, т. е. распреде- ление вероятностей, определяемое равенством тг(В) = Р{Хо Е В}, В е S. Набор объектов (тг, Р\, ₽2» • • •) полностью определяет вероятностные свойства последовательности X = (Хп)л^о, поскольку все конечномерные распределения этой последовательности определяются формулами: Р{ХоеВ} = тг(В), Ве<?, и для всякого 1 и В (=^rt+1 = (п+ 1) раз) Р{(Хо, хь...,хл)еВ} = = $ 1в(хо, XI, .... xn)Tr(dxo)Pi(xo-, dx\)...Pn(Xn-\,dxn). (19) Ех...хЕ Действительно, рассмотрим сначала множество В вида В = Во х ... ... хВп. Тогда при п = 1 по формуле полной вероятности (см. (5) в § 7 гл. II) Р{Хо е Во, Х1 е В!} = $ /{х.ев.}М Р(*1 е В. |Х0М) Р(<М = Q = $ W«>) Wi! *оМ) Р(<М = Q = $ /во (xo) Pl (Bi; x0) Tr(dx0) = § lBll xb, (xq, xt) P{ (dxt; x0) ir(dx0). £ £x£ Дальше доказательство ведется по индукции: P{XogBo, XieBi,...,XneBn} = = $ /{ло6во,...л_16вя_,}МР(Х„ еВп|ХоМ,Xn-i(^))Р(<М = = $ I{Xq€B0.хя_,€8я_|}М P(Xi Е Вп |1 (ал)) Р(йМ = Q = $ /{Хо€Во....Ля_1€Вя_|}(й;) Рп(ВП\ Xrt-1(^)) P(du>) = Q = Л?охВ| х...хВя_| (•£(), «^1 »•••» «^л—1) х Ех...х£ X Рп(Вп\ хп_i) Р{Xo Е dx\, ..., Хп—1 Е = ~ х...хВя_1 хВя(«^0, ..., Xrt— j, Хп) X Ех...хЕ X Pn(dxn; xn-i) Pn-i (dxn-i; хя_2)... Pi (dxx; х0) 7r(dx0),
§ I. ОПРЕДЕЛЕНИЯ И ОСНОВНЫЕ СВОЙСТВА 795 что совпадает с требуемой формулой (19) в случае множеств В вида В = = BoxBi х...хВл. Переход к общему случаю множеств £е<^(£л+1) осуществляется так же, как и в доказательстве аналогичного места в теореме 2. Из свойства (19), основываясь на результатах о монотонных клас- сах (см. § 2 гл. II) выводится (задача 4), что для всякой ограниченной ^(£л+1)-измеримой функции Л = й(хо, ..., хп) Ей(Х0, ХЬ...,ХЯ) = = 5 h{x0,xl,...,xn)ir(dx0)Pl(dxr,x0)...Pn(dxn-,xn_i). (20) 6. Итак, если у нас имеется марковская цепь (в широком или узком смысле), то по ее начальному распределению тг=тг(5), где тг(В) = Р{Х0 е В}, Ве<?» и переходным вероятностям Рл(х; В), 1, хеЕ, можно полностью восстановить закон распределения Law(Xo, Х\, ..., Хп) любой совокупности случайных величин Хо, Х\, ..., Хя, 1, пользуясь форму- лой (19). Сейчас мы поменяем весь наш взгляд на способы определения мар- ковских цепей, приняв за основу то, что они должны полностью быть заданными, исходя из набора (тг, Pi, Р2, ...), где по своему смыслу ве- роятностное распределение тг должно играть роль распределения вероят- ностей начального состояния системы, а функции Prt+i =Prt+i(x; В), n>0, удовлетворяющие свойствам (а) и (Ь) из п. 5, играют роль переходных ве- роятностей, т. е. вероятностей того, что система, находящаяся в момент времени п в состоянии х, в момент п +1 окажется в множестве В е S. Естественно, что если за исходный объект берется набор (тг, Р\, Р%, ...), то возникает вопрос: а отвечает ли он вообще какой-либо марковской цепи, имеющей своим начальным распределением заданное тг, а своими переходными вероятностями заданные функции Р\, Р%, ...? Ответ (и положительный) на этот вопрос, в сущности, содержится в теореме Колмогорова (теорема 1 и следствие 3 в § 9 гл. II), по крайней мере для случая E = Rd, и в теореме Ионеску Тулчи (теорема 2 в § 9 гл. II) для случая произвольных измеримых пространств (£, <f). Следуя доказательству этих теорем, прежде всего определим измери- мое пространство (Q, <^), полагая (П, = (£°°, ^(£°°)), где £°° = = £ х £ х ..., ^(£°°) = S 0 S 0 ...; иначе говоря, в качестве элементарных исходов будем рассматривать «точки» а> = (хо, хь ...), где х, б£. Поток (^n)n^Q определим, полагая <^ = а(хо, Хь..., xrt). Сами значе- ния Хп = Хя(си) определим «каноническим» образом, полагая Хп(ш)=хп, если cu = (хо, Xi, ...).
796 ГЛ. VIII. МАРКОВСКИЕ ЦЕПИ Теорема Ионеску Тулчи утверждает, что для произвольных измеримых пространств (В, <?) (и, в частности, для рассматриваемых нами фазовых пространств) на (О, &) существует вероятностная мера такая, что РуГ{ХобВ} = тг(В), (21) и для всех п 1 конечномерные распределения Р.{(Х0, Xi, ..., Хп)еВ} = = 5 ir(dxQ) 5 ^1(*о; dx\)... 5 /в(х0,.... хп)Рп(хп—\\dxn). (22) ЕЕ Е Теорема 3. По отношению к введенной (в теореме Ионеску Тул- чи) мере Рл- канонически заданная последовательность Х = (Хп)п^о является марковской (в смысле определения 2). Доказательство. Надо показать, что для п 0 и В G S (Руг-п. н.) РЛХ^! 6 В= РАХп+1 е ВI(си)) (23) И при ЭТОМ (Руг~П. н.) для п О Py^+i G В\Хп(ш)) = Рп(Хп(шУ, В). (24) Будем опять же вести доказательство, основываясь на принципе под- ходящих множеств и результатах о монотонных классах (§ 2 гл. И). В качестве подходящих множеств рассмотрим, как это уже делалось, «просто» устроенные множества А из &п вида Л = {о>: Хо(си) £ BQ, ..., Хп(щ) 6 Вп}, где Bi G S, i = 0, 1, ..., п, и пусть В 6 S. Тогда в силу конструкции меры Р^ (см. (22)) $ Вг(<М = РугЦо € 5о, • • •, Хп € Вп, Х„+1 е В} = А = 5 7r(rfxo) $ Р\(х0; dxt)... 5 Рп(хп-Г, dxn) $ Pn+i(xn; dxn+i) = Bq В\ Bn В = $Prt+1(Xrt(a;);B)Pyr(du;). (25) A Рассуждая теперь так же, как и при доказательстве теоремы 2 (см. доказательство выполнимости свойства (15) для множеств А из <^л), на- ходим, что и здесь свойство (25) будет выполнено для множеств А из т. е. множеств вида А = {о>: (ХоМ, ..., Xrt(cu)) G С}, где С €&(En+l).
§ 1. ОПРЕДЕЛЕНИЯ И ОСНОВНЫЕ СВОЙСТВА 797 Поскольку по определению условных вероятностей (см. § 7 гл. II) $ /{ХЛ+1€В}М РИ<М = 5 ₽„(%„+! € ВI &п) (w) (26) А А а функции Pn+i(Xn(cu); В) являются ^-измеримыми, то из (25) и «те- лескопического» свойства условных математических ожиданий (см. свой- ство Н* в п. 4 § 7 гл. II) получаем требуемые соотношения (23) и (24). □ 7. Итак, с каждой рассматриваемой системой (тг, Р\, Р%, ...) можно связать марковскую цепь (для наглядности обозначаемую X* = (Хп, Ртг)п>о)» имеющую своим начальным распределением тг и переходными веро- ятностями Р\, Р<2, ... (т. е. цепь, для которой выполнены свойства (21) и (23)—(24)). Такая цепь функционирует следующим образом. В начальный момент п = 0 случайным образом «разыгрывается» зна- чение начального состояния в соответствии с распределением тг. Если, скажем, значение Хо оказалось равным х, то из этого состояния система переходит в следующий момент в некоторое состояние Х\ в соответствии с распределением Р[ (•; х) и т. д. Таким образом, роль начального распределения тг сказывается лишь только в момент п = 0, а последующее развитие системы определяется переходными вероятностями Pi, Р2, ... Так что, если для двух начальных распределений ти и тгг в результате соответствующего «розыгрыша» выпа- ло одно и то же состояние х, то развитие системы будет (в вероятностном смысле) одним и тем же, определяясь лишь переходными вероятностями Р\у Р%, ... Можно это выразить также и следующим образом. Пусть Рх обозначает распределение Р„., соответствующее тому слу- чаю, когда распределение тг сосредоточено в точке х: тг(ду) = 6x(dy), т. е. тг({х}) = 1, где {х} — одноточечное множество, принадлежащее а-алгебре S в силу сделанного предположения, что (£, S} — фазовое пространство. Тогда из свойства (22) выводится (задача 4), что для каждого А е €&(Е°°) ихеЕ вероятность РХ(Л) есть (для каждого тг) вариант условной вероятности |%о =х), т. е. Ртг-п. н. P„(A\XQ = x) = Px(A). (27) При каждом хеЕ вероятности Рх() полностью определяются набором переходных вероятностей (Рь Р2, ...). Тем самым, если основной акцент делается на то, как поведение си- стемы зависит от переходных вероятностей (Pi, Р2, •••), то достаточно оперировать лишь с вероятностями Рх(), хеЕ, получая, если надо, веро- ятности Ртг(-) простым интегрированием: Р„(Л) = $ РИЛ) 7T(dx), А е (28) Е
798 ГЛ. VIII. МАРКОВСКИЕ ЦЕПИ Эти соображения привели к тому, что в «общей теории марковских процессов» (см. [21]) основным объектом считается (в рассматривае- мом здесь случае дискретного времени) не та или иная марковская цепь X* = (Хп, Ртг)л^о» а семейство марковских цепей Xх = (Хл, Px)rt>o с х 6 Е. (Тем не менее, вместо слов «семейство марковских цепей» часто говорят просто о «марковских цепях» и вместо обозначения «Хх = (Хп, Px)rt^o с х е Е» пишут «X = (Хп, Рх)».) Подчеркнем, что все эти рассмотрения предполагают «канонический» способ задания цепей: в качестве (Q, *^) берется пространство (Е°°, <?°°), <?°° = ..., все величины Xrt(cj) задаются так, что Xrt(o>) = xrt, если о? = (х0, Х|, ...). Таким образом, в Xх — (Хп, Рх) от х зависит лишь ве- роятность Рх, на сами же значения Хп какие-либо специальные условия зависимости от х не налагаются. При этом автоматически оказывается, что по мере Рх траектории (Хп)п^о «начинаются» в точке х, т. е. Рх{Хо=х} = 1. 8. В случае конечных марковских цепей (§ 12 гл. I) большое внимание было уделено анализу поведения таких цепей с помощью рассмотрения переходных вероятностей p-р = Р(ХП = /|Хо = О, которые, как было по- казано, удовлетворяют уравнению Колмогорова—Чепмена (см. (13) в § 12 гл. I), из которого, в свою очередь, выводились прямые и обратные уравнения Колмогорова ((16) и (15) в § 12 гл. I). Обратимся сейчас к вопросу о справедливости уравнения Колмого- рова—Чепмена и в случае марковских цепей с произвольным фазовым пространством (Е, <?), ограничившись рассмотрением однородных цепей, для которых Р\ = Р? =... = Р. В этом случае, в силу (22) Р.{(Х0, Хь...,Хя)еВ} = = § 7г(</х0) $ Р(х0; dx\)... Ib(xq, хь .... хп)Р(хп_\, dxn). (29) ЕЕ Е В частности, если п = 2, то Р„{Х0 € Во, Х2 е В2} = $ $ Р(хх; В2)Р(х0; dxx )тг(</х0). (30) Во Е Отсюда, по теореме Радона—Никодима (§ 6 гл. II) и в силу определения условных вероятностей находим, что (тг-п. н.) Р,(Х2еВ2\Х0 = х) = $ Р(х- dxx)P(x{- В2). (31) Е Заметим теперь, что в силу (27) Е Вг | Хо=х) = Рх{Хг 6 Вг} Ог-п. н.), где вероятность Рх{Хг G В2} имеет простую интерпретацию — это есть ве-
§ 1. ОПРЕДЕЛЕНИЯ И ОСНОВНЫЕ СВОЙСТВА 799 роятность перехода системы из состояния х в момент п = 0 в множество В<2 в момент п = 2, т. е. это есть вероятность перехода за два шага. Обозначим Р(л)(х; Вл) = Рх{ХлеВл} вероятность перехода за п шагов. Тогда, в силу однородности рассматриваемых цепей, P(I)(x; Bi) = P(x; В\) и, следовательно, из (31) находим, что (тг-п. н.) Р(2)(х; В) = Р(1)(х; dxi)Pw(xi; В), (32) Е где В е S. Аналогичным же образом устанавливается (задача 5), что при любых п^О, 0 (тг-п. н.) р(«+т)(Х; В) = $ dy)P(m\y, В). (33) Е Это соотношение и есть знаменитое уравнение Колмогорова—Чепмена, наглядный смысл которого вполне ясен: для подсчета вероятности рИ+«)(Х; в) перехода за т + п шагов из точки хеЕв множество надо перемножить вероятность Р(л)(х; dy) перехода за п шагов из точки х в «инфинитезимальную» окрестность dy точеку^Ем вероятность перехо- да за т шагов из точки у в множество В (с последующим интегрированием по всевозможным «промежуточным» точкам у). Обращаясь к уравнению Колмогорова—Чепмена (33), связывающему вероятности переходов за разное число шагов, нужно отметить, что оно установлено лишь с точностью до «тг-почти наверное». В частности, отсю- да следует, что (33) не есть соотношение, выполняемое для всех хеЕ. Это не должно показаться странным, поскольку выше нам не раз приходилось обращаться к выбору тех или иных вариантов (версий) условных веро- ятностей и, вообще говоря, нет гарантии, что эти варианты оказываются такими, что рассматриваемые свойства выполнены тождественно (по х), а не лишь тг-почти наверное. Тем не менее, можно явно указать такие версии, для которых уравнение Колмогорова—Чепмена (33) будет уже выполненным для всех х^Е. Вытекает это из следующих утверждений (задача 6). Пусть «переходные вероятности» P(rt)(x; В) определены следующим об- разом: Р(,)(х; В) = Р(х;В) и для п > 1 Р(л)(х; В) = § Р(х\ dy)P<n~i}(y, В). Е
800 ГЛ. VIII. МАРКОВСКИЕ ЦЕПИ Тогда (i) P(rt)(x; В), 1, являются регулярными условными вероятностями на S при заданном х; (ii) Р(л)(х; В) совпадает с Рх{Хп еВ} и, следовательно, является вари- антом (тг-п. н.) условных вероятностей Вг(Хя 6 В |%о = *); (iii) для так определенных функций P<rt)(x; В), /2 > 1, уравнения Колмо- горова-Чепмена (33) выполнены тождественно по х G Е. 9. Задачи. 1. Доказать утверждения, сформулированные при доказательстве тео- ремы 1 в виде задач la, 1b и 1с. 2. Показать, что в теореме 2 функция Pn+i(B -Хп(и)) является «^-из- меримой по 3. Вывести свойства (11) и (12) из утверждения леммы 3 в § 2 гл. II. 4. Доказать свойства (20), (27). 5. Установить справедливость соотношения (33). 6. Доказать утверждения (i), (ii) и (iii), сформулированные в конце п. 8. 7. Вытекает ли из марковского свойства (3) следующее свойство: Р(Хй+1еВ|ХоеВо, XiEBi, ...,ХйеВя) = Р(Хл+1еВ|ХйеВя), где Во» В\,..., Вп и В — множества из S и Р{/о 6 Во, Xi 6 Bi, ..., Хп е Вп} > >0? § 2. Обобщенное марковское и строго марковское свойства 1. В этом параграфе будут рассматриваться, главным образом, се- мейства Xх = (Хй, Рх)я>о, хеЕ, однородных марковских цепей, «канони- чески» заданных на координатном пространстве (П, <^) = (Е°°, <?°°) и определяемых переходной функцией Р = Р(х; В), хе В, В Определим на (П, «^) операторы сдвига вп: Q-+Q (ср. с § 1 в гл. V), полагая для состояния си = (хо, Х\, ...) @п С*>) = (Хп, Хп+ 1, ...). Если Н = является «^-измеримой функцией, то Н о0п будет обо- значать функцию (Н о 0п) (о>), определенную равенством (Но0п)(ш) = Н(0п(ш)). (1) Так что, если о> = (хо, х\, ...) и Н = H(xq, х\, ...), то (Н овп) (хо, Хь ...) = = //(xrt, хл+ь ...).
§2. ОБОБЩЕННОЕ МАРКОВСКОЕ И СТРОГО МАРКОВСКОЕ СВОЙСТВА 801 Следующая теорема, в сущности, есть переформулировка утвержде- ния (6) из § 1 применительно к рассматриваемому сейчас случаю семей- ства однородных марковских цепей. Теорема 1. Пусть Xх = (Хп, Рх)л^о, хб£, есть семейство од- нородных марковских цепей, порождаемых переходной функцией Р — Р{х\ В), хеЕ, В Предполагается, что меры Рх таковы, что значения Рх{(Ло, Х\,..., Хп) еВ} для Ве&(Еп+[) и п>0 определяются по Р формулами (22) из § 1 с ir(dy) = d{x}(dy) и Р\=Р2 = ... = Р. Тогда для всякого начального распределения тг, любого п}0 и всякой ограниченной ^-измеримой функции Н = имеет место следующее обобщенное марковское свойство: О9я\Р*)(ш) = ЬХЛш}Н (Р^-п.н.). (2) Замечание. Хотя использованные обозначения и «говорят сами за се- бя», все же отметим, что Ew — это усреднение по мере Р„.)( •) = § Рх( *) тг(б/х), Е а Ехп(ш)Н надо понимать следующим образом: берется математическое ожидание ЕХН (т. е. усреднение И по мере Рх) и затем в это выражение (обозначим его ф(х)) надо «вставить» вместо х величину Xn(w), т. е. Ехп(и)Н = 'ф(Хп(ш)). (Отметим, что ЕХН является ^-измеримой функ- цией от х (задача 1) и, значит, Ех„(и>)Н является случайной величиной, т. е. ^/^-измеримой функцией.) Доказательство теоремы опять-таки использует принцип подходящих множеств и функций с последующим применением результатов о монотонных классах. Чтобы установить свойство (2), нам надо показать, что для всякого множества А из = а(хо, х\, ..., хп) $ (Н О0„)(w) P„(du) = $ (ЕХяМЯ) p„(du), (3) А А или, в более компактной форме, Е1Г(Новп,А)^Еп(ЕХпН-,А), (4) где £*(£; Я) означает Е^($/д) (см. п. 2 § 6 гл. II). В соответствии с принципом подходящих множеств рассмотрим «просто» устроенные множества А вида А = {cu: хо G Bq, ..., хпе Вп}, Bi^^i, и пусть функция Н = H(xq, Xi, ..., хт) с /и>0 (более точно, пусть Н -^-измеримая функция). Тогда свойство (4) примет следующий вид: Е^Н(Хп, Хя+1, ..., Хп^ту, A)^E^EXnH(XQ, Хх, ..., Хш); Л). (5)
802 ГЛ. VIII. МАРКОВСКИЕ ЦЕПИ Используя представление (22), из § 1, находим, что ..., Xrt+W); Д) = Е7Г(/л(Хо, .... Хп)Н(Хп, ..., Хл+ш)) = = 5 1а(х0, .... хп)Н(хп,.... хп+т) X £ яЧ-я14- I X 7r(dxo)P(xo; dxi)... Р(хп+т-1; dxn+m) = = $ /д(хо.........xn)ir(dxo)P(xo-, dxi)...P(xn_i; dxn) x £я+1 X $ H(xn, • » Xn+m)P(Xib dxn+\)... P(Xn+m-\\ dxn+rn) — = $ I A (XO......xn)it(dxo)P(xQ\ dx\)... P(xn_ 1; dxn) x £Я+! X 5 /7(x0,..., Xm)Px(dXi, .,dxm) =ЕЛЕхяВД,...,Х^);Л), где Px(dxi, ..., dxm) = P(x\ dxi)P(xi; dx2)...P(xm^ dxm\ Таким 1 образом, свойство (5) для множеств А вида Л = {си: xqEBq, Xi е В\, ..., хп е Вп} и функций Н вида Н = Н(х$, х{, ..., хш) установлено. Общий случай множеств А из рассматривается (для фиксированно- го т) так же, как и в доказательстве теоремы 2 в § 1. Осталось лишь показать, что доказанные свойства остаются верными и для всех & (=<^°°)-измеримых ограниченных функций Н =H(xq, хь ...). Достаточно доказать, что если А е <F*, то свойство (5) сохранится для таких функций, т. е. что ЕЛадЛп+i, ...);Д) = Е7Г(ЕхЛ(ХоЛь (6) Имея в виду применение принципа подходящих функций (см. § 2 гл. II), обозначим через Л? совокупность всех тех ограниченных ^-измеримых функций Н = Н(хо, хь ...), для которых свойство (5) имеет место. Пусть также J есть совокупность (цилиндрических) множеств вида 1т = = {си: хобВо,...,хтеВт} с некоторыми В, е<?, / = 0, 1,..., /и, т^О. Ясно, что эта система J является тг-системой множеств из & (=<?°°). Обратимся теперь к условиям теоремы 3 в § 2 гл. II. Условие (hi) выполнено, поскольку если AeJ, то Ia^J? по дока- занному выше (надо взять в (5) H(xq, ..., xm) = /A(XQ, ...,xm)). Условие (Й2) следует из свойства аддитивности интеграла Лебега, а свойство (йз) вытекает из теоремы о монотонной сходимости в интегралах Лебега. Согласно указанной теореме 3 (§ 2 гл. II), тогда содержит все функции, являющиеся измеримыми относительно сг-алгебры <т(/), которая по определению и есть а-алгебра <f°° = ^(ЕО°). (См. пп. 4 и 8 в § 2 гл. II.)
§2. ОБОБЩЕННОЕ МАРКОВСКОЕ И СТРОГО МАРКОВСКОЕ СВОЙСТВА 803 2. Обратимся ко второму обобщению марковского свойства —так на- зываемому строго марковскому свойству, связанному с заменой «вре- мени п» на «случайное время т». (Все исходные предпосылки будут те же, что и в начале этого параграфа: (Q, ^) = (£°°, <^°°), ...) Будем обозначать через т = т(си) конечные случайные величины т(си) такие, что для каждого л > 0 {a;: т(а>) = п}е<^*. В соответствии с терминологией § 1 гл. VII (см. определение 3) такие вели- чины называют (конечными) марковскими моментами или моментами остановки. С потоком и моментом остановки т свяжем а-алгебру ^х = {Л е &х: А П {г = п} е &х для всех п 0}, где =a(U интерпретируемую как сг-алгебру событий, наблюдае- мых на «случайном интервале» [0, т]. Теорема 2. Пусть выполнены все условия, сформулированные в теореме 1, и г = т(о>) — конечный марковский момент. Тогда имеет место следующее строго марковское свойство: Е„(Ноет\#*) = ЕХтН (7) Прежде чем переходить к доказательству, дадим некоторые пояснения по поводу того, как надо понимать ЕхтН и Н овт. Обозначим ф(х)^ЕхН. (В п. 1 уже отмечалось, что ф(х) являет- ся ^-измеримой функцией.) Под ЕхтН понимается значение ^(Хт) = = '0(А,г(а;)М)- Что же касается (Н о0т)(ш), то под этим понимается случайная величина (Н о 0r(w))(u;) = ЖмМ)- Доказательство. Возьмем множество А из &г. Как и в случае тео- ремы 1, для доказательства (7) надо показать, что Ея(//о0г;Л) = Е7Г(ЕЛт//;^ (8) Рассмотрим левую часть. Имеем E^(Wo0T; А) = J Ет(Яо0г; А П{т = п}) = л=0 = £е„(Яо^;4п{т = /1}). (9) л=0
804 ГЛ. VIII. МАРКОВСКИЕ ЦЕПИ Правая же часть в (8) Е„(ЕхЛ; Л) = £ Е.(Ех,//;^{т=я}). (10) л=0 События Дп{т = п}б^*. Поэтому в силу (4) правые части в (9) и (10) совпадают, что и доказывает строго марковское свойство (7). □ Следствие. Беря функцию H(xq, ...) = /д(%о» •)» где А = = {си: (%о, *1, ...)еВ}, Вс^00 = <^(£00), из (7) получаем следующую часто используемую форму строго марковского свойства'. Р^Хт^т+ь ...)бВ|Х0, Хь...,Хг) = = Рхт{(Х0,Хь ...)еВ} (Ъ-п.н.). (11) Замечание 1. Если проанализировать доказательство строго марков- ского свойства (7), то можно заметить, что на самом деле верно и следу- ющее свойство. Пусть для каждого п 0 действительные функции Нп задан- ные на являются ^“-измеримыми (& = <?°°) и равномерно огра- ниченными (т. е. |//rt(cu)| сибП). Тогда для каждого конечного марковского момента т = т(ш) (т(си)<оо, сибП) имеет место (задача 2) следующая форма строго марковского свойства: Е„(Нтовт\^) = ЕХтНт (Р„-п.н.), (12) где под ЕхтНт понимается случайная величина ф(ту Хт) с ф(п, х) = ЕхНп и Нт о 0Т = (Нт о ет) (cu) = HrM (0тММ). Замечание 2. Выше предполагалось, что т = т(ш) является конечным марковским моментом. Если это не так, т. е. т(а>) оо, wG П, то тогда соотношение (12) надо заменить (задача 3) на следующее: Е,(Яго0т|^) = ЕхЛг ({т<оо};Рж-п.н.). (13) Иначе говоря, в этом случае соотношение (12) выполнено Р^-п. н. на мно- жестве {т < оо}. 3. Пример (на «строго марковское свойство»). При рассмотре- нии закона повторного логарифма нам понадобилось одно неравенство (лемма 1 из § 4 гл. IV; см. также (14) ниже), аналогом которого для бро- уновского движения В = (Bt)t^T является равенство р| max Bt > а} = = 2Р{|Вг|>а}; [131, гл. III]. Пусть £i, ••• — последовательность независимых одинаково распре- деленных случайных величин с симметричным (относительно нуля) рас- пределением. Положим Хо = х 6 /?, Хт = Хо 4- (£i 4-... 4- £w), 1 /и. Как это
§2. ОБОБЩЕННОЕ МАРКОВСКОЕ И СТРОГО МАРКОВСКОЕ СВОЙСТВА 805 было принято выше, через Рх обозначаем распределение вероятностей по- следовательности X = (Хт)т^о с Хо = х. (Пространство Q предполагается координатно заданным с а> = (%о, •••) и Хт(ш) = хт.) Согласно (слегка измененному) утверждению (9) из § 4 гл. IV, Ро( шах Хт>а\^2Р0{Хп>а} (14) для всякого а > 0. Введем марковский момент т = т(а>), полагая r(cu) = inf{0^m^/i: Хт(ш)>а}. (15) (Как обычно, полагаем inf 0 = оо.) Покажем, как, используя введенный марковский момент, можно было бы дать «легкое доказательство» нера- венства (14), если допускать, что с такими (случайными) моментами можно действовать так же, как с детерминированными. Имеем (ср. с доказатель- ством леммы 1 в § 4 гл. IV) Po{X? > а} = Ро{(Хп — ХТлп) + Хтлп > а} >Ро{Хл- Хт/\п 0» Хт/\п >а} = Ро{*„ Хт/\п 0} Ро{^тлп > >|Ро{*тлл>а}=кРо{т^п}=|Ро{ max Хш>а}, (16) 2 2 2 J где мы воспользовались казалось бы «почти очевидным» свойством неза- висимости величин Хп — ХтЛп и Хглп, верным, конечно, для детерми- нированных моментов т, но не верным, вообще говоря, для случайных моментов т (задача 4). (Так что это «легкое доказательство» нельзя при- знать корректным.) Приведем теперь действительно «правильное доказательство» нера- венства (14), основанное на применении строго марковского свойства (13). Поскольку {Хп >а}С{т^ п}, то РоЦЛ>а} = Ео(/{хя>а};т^/г). (17) Введем функции Hm = Hm{xo, х\, ...), полагая {1, если m п и хп_т > а, 0 в остальных случаях. Из их определения следует, что на множестве {т п} /и n ч fl, еслихп>а, Q (/7ro0T)(xo, xi, ...) = <n (18) 10 в остальных случаях,
806 ГЛ. VIII. МАРКОВСКИЕ ЦЕПИ и поэтому, с учетом (17) и того, что {Хп > а} С {т п} и {г п} е , находим РО{ХЛ > а} = EQ(HT овт'т^п) = Ео(Ео(//г о вт | ^г); т^п). (19) По строго марковскому свойству (13) на множестве {т^п} ЕО(НТ о 6Т |Рт) = ЕХтНт (Ро-п. н.). (20) Согласно определению, Е%т//Т = ^(т, %г), где х) = ЕхНт, и для х^а = Рх{Хп-т > #} Рх{Хп-т > х} (последнее неравенство следует из симметричности распределений величин Тем самым на множестве {г п} Eo(/7To0r|jrT)>l (Р-п.н.). (21) Отсюда и из (19), (20) получаем требуемое неравенство (14). 4. Ес^и обратиться к уравнению Колмогорова—Чепмена (13) и урав- нению (38) в § 12 гл. I, то можно отметить их большое сходство. Естест- венно поэтому проанализировать те общие моменты и те отличия, которые содержатся в их формулировках и их выводах. (Мы ограничиваемся рас- смотрением лишь однородных марковских цепей с дискретным множеством состояний Е.) Имеем для п 1, 1 k л, I и j из Е, что (с учетом формул (1) и (2)) р,{хп=/}=Е =/’х*==ЕЕ-/^=w*=q)= = £ Е/[Е,(/(ХЯ = i){(Xk = а) 1^)] = а$Е = £ Е,- ВД = а) Е,- (/(Х„ = j) | ^)) Ш а(~Е = Е, [!(Хк = а) Е1(/(Ха-Л = j) О ek I л)] 1 а^Е 52 Е,- [l(Xk = а) ExJ(Xn_k = /)] = = 52 Е,-(/(X* = а) Еа1(Х„_к = /)] = = 52 Е,/(Ха = а) Еа/(Х„_А = /) = 52 Pi{Xk = а} Pa{Xn_k = /}, (22) olGE а^Е
§2. ОБОБЩЕННОЕ МАРКОВСКОЕ И СТРОГО МАРКОВСКОЕ СВОЙСТВА 807 что и есть уравнение Колмогорова—Чепмена (13) из § 12 гл. I, записанное там в виде аЕЕ Если в (22) заменить время k на марковский момент т (со значения- ми 1, 2, ..., п) и воспользоваться вместо марковского свойства (2) строго марковским свойством (7), то получим (задача 5) следующую естественную (обобщенную) форму уравнения Колмогорова—Чепмена: Р,{Х„ = /} = £ Р,-{ХТ = а} РЛХ.-Г = }} (23) И в формуле (22), и в формуле (23) суммирование ведется по фазовой переменной аеЕ. В формуле же (38) из § 12 гл. I суммирование ведется по временной переменной. Заметив это, предположим сейчас, что т — марковский момент со зна- чениями в {1, 2, ...}. Начиная так же, как и при выводе указанной форму- лы (38), находим, что Р/{ХЯ = Л = £ = /> = *} + Р,{Х„ = /, Т > « +1} = /г=1 = 12 Е//(ХП = /)/(т = k) + Р,{ХЯ = j, т > п + 1} = *=1 = £2 Е,- [Е,(/(%„ = /)/(т = k) I ^)] + Р,{ХЯ = /, т > п + 1} = k=\ = 12 Е,[/(г=*)Е,(1(Ха = /)|^)] + Р,{ХЯ = /»« + !} = Л=1 = J2 [/(т = *) Е,(I{Xn-k = j) oek\^k)] + Pi{Xn = /, т > n + 1} = Л=1 = 12 E, [/(r = k) Ex„I(Xn_k = j)] + Pi{Xn = j,r>n+ 1}. (24) k=l В n. 7 § 12 гл. I момент т = т7, где Tj = min{l k n: Xk = /} с условием, что т7=п+1, если множество { } = 0. Тем самым в этом
808 ГЛ. VIII. МАРКОВСКИЕ ЦЕПИ случае (24) естественно упрощается: п Р,{Хп = /} = 52 Е-;^т1 = V I{Xn-k = j)) = Л=1 = £ Е,(/(т/ = k) Е'ЦХп-ь = /)) = £ Е,/(ту = k) Е//(Хп^ = j) = *=i *=i п =22р-^=*}№-*=/}. /?=! превращаясь в уравнение (38) из § 12 гл. I: п ₽?’=£«*’ <25> 6=1 Из (24) можно получить и другие полезные формулы, в которых (в от- личие от уравнения Колмогорова—Чепмена) суммирование ведется по вре- менной временной. Так, например, пусть марковский момент т(а) = min{ 1 k п: Xk = <*(&)}, а (детерминированная) функция a = a(fe), и марковская цепь таковы, что Р/{т(а)^л}=1 (для данных i и п). Тогда из (24) находим, что п Pi{Xn = /} = 52 Е‘ ^rJ{Xn_k = /)] = /г=1 = ^2 E/A'rfc*) = k) Ea{k)/(Xn_k = j), k=i t. e. рдхя=j}=52 рм°)=k> p^{xn-k=j}. k=l (Ср. c (23).) 5. Задачи. 1. Доказать, что функция ^(x) = ExH из замечания в п. 1 является «^-измеримой. 2. Доказать свойство (12). 3. Доказать свойство (13). 4. Верно ли свойство независимости величин Хп —Хт^п и Хт^п в при- мере из п. 3? 5. Доказать формулу (23).
§3. ПРЕДЕЛЬНЫЕ РАСПРЕДЕЛЕНИЯ 809 § 3. О проблематике предельных, эргодических и стационарных распределений вероятностей для марковских цепей 1. В § 1 уже было отмечено, что вопрос асимптотического пове- дения стохастических систем с отсутствием последействия, описы- ваемых марковскими цепями, является одним из центральных вопросов теории марковских случайных процессов. Связано это в известной степе- ни с тем, что при весьма широких условиях марковский характер таких систем приводит к тому, что они как бы «стабилизируются», входят в «стационарный режим». Предельное поведение однородных марковских цепей X = (Хп)п^ь мож- но изучать с разных точек зрения. Например, можно исследовать вопрос о | п-1 сходимости Р^-почти наверное функционалов типа - 52 К^т) ПРИ п~*°о п т=0 для различных функций f = f(x), как это было в эргодической теореме для стационарных в узком смысле случайных последовательностей (теорема 3 в § 3 гл. V). Представляет интерес изучение условий справедливости за- кона больших чисел, как в § 12 гл. I. В дальнейшем изложении основной акцент будет сделан не на подоб- ные вопросы сходимости типа почти наверное или по вероятности, а на вопросы асимптотического поведения вероятностей перехода р(п\х; /4) за п шагов (см. (10) в § 1) при п —»оо и на вопросы существо- вания стационарных (инвариантных) мер q = q(A), т. е. таких, что q(A) = \P(x\A)q(dx), (1) где Р(х\ А) — переходная функция (за один шаг). Подчеркнем, что в определении (1) вовсе не предполагается, вообще говоря, что мера q = q(A) является вероятностной (q(E) = 1). Если эта мера вероятностная, то ее принято называть стационар- ным, или инвариантным, распределением. Смысл этой терминологии вполне понятен: если взять в качестве начального распределения тг рас- пределение q, т. е. считать, что Р^Цо &A} = q(A), то в силу (1) окажется, что и для любого п 1 Pq{XneA} = q(A), т. е. это распределение остается инвариантным по времени. Нетрудно привести пример, когда нет стационарных распределений q = q(A), но есть стационарные меры. Пример. Пусть X = (Хп)п^о — марковская цепь, порожденная схемой Бернулли, т. е. пусть Xrt+i =Хп +£я+1, где £i, *• • — последовательность независимых одинаково распределенных случайных величин с Р{£„ = + !} = = р, P{frt = —1} = </. Пусть Xq—x, где хб{0, ±1, ...}. Ясно, что здесь Ю - 9728
810 ГЛ. VIII. МАРКОВСКИЕ ЦЕПИ переходная функция Р(х; {х + 1 }) = /?, Р(х; {х- 1 }) = <?. Нетрудно проверить, что одно из решений (1) есть мера q(A) такая, что q({x}) = 1 для всякого х е {0, ± 1, ...}. Если р / q > 0, то мера q(A) с q({x}) — (p/q)x есть вторая инвариантная мера. Очевидно, что каждая из этих мер является невероятностной и вероятностных инвариантных мер здесь нет. Этот простой пример показывает, что для существования стационар- ного (инвариантного) распределения требуются определенные предполо- жения о рассматриваемых марковских цепях. Вопрос о предельных значениях переходных вероятностей Р(я)(х; Л) при п —► оо интересен прежде всего с точки зрения существования пре- дела, не зависящего от начального состояния х. При этом надо иметь в виду, что вполне может случиться, что никакого предельного распределе- ния просто не существует, скажем, может быть, что lim Р(я)(х; Л) = 0 для любого а\е$ и всякого начального состояния х е Е. Достаточно, например, взять в предшествующем примере р = 1, т. е. рассматривать детерминиро- ванное движение вправо. (См. также примеры 4 и 5 в § 8.) В случае произвольного фазового пространства (Е, £) отыскание условий существования стационарных (инвариантных) распределений, существования предельных значений переходных вероятностей (с теми или иными их свойствами) представляет собой весьма трудную задачу (см., например, [104]). Однако, в случае счетного пространства состояний («счетных цепей Маркова») здесь получены интересные и довольно-таки прозрачно формулируемые результаты. Они будут изложены в §§ 6 и 7. Но предварительно придется провести детальную классификацию состо- яний счетных марковских цепей по алгебраическим и асимптотическим свойствам переходных вероятностей. Отметим, что рассматриваемые вопросы о стационарных распределе- ниях и существовании пределов lim Р^(х; Л) тесно связаны между собой. В самом деле, если lim P(rt)(x; Л) (=1/(Л)) существует, не зависит от х и является мерой (по Л б<^), то из уравнения Колмогорова—Чепмена Р(л+1)(х; Л) = 5 Р(л)(х; dy)P(y\ А) (формальным) предельным переходом по п оо найдем, что v(A) = ^P(y, A)v(dy). Таким образом, и = и(А) будет стационарной (инвариантной) мерой.
§3. ПРЕДЕЛЬНЫЕ РАСПРЕДЕЛЕНИЯ 811 2. Везде в дальнейшем предполагается, что рассматриваемые марков- ские цепи X = (Хл)л^о принимают значения в счетном фазовом прост- ранстве £ = {1,2, ...}. Для простоты записи переходные функции P(i, {/}) будем обозначать р1} (/, j еЕ). Переходные вероятности (некой блуждаю- щей «частицы»— для наглядности) из состояния i в состояние j обозна- чаются р^. Интересующие нас вопросы будут связаны с выяснением условий, при которых: А. Для всех j е Е существуют пределы 7Г; = ПГП не зависящие от начальных состояний i е Е\ В. Эти предельные значения П=(тг1,7Г2, •••) образуют распределение вероятностей, т. е. тг; > 0 и 52 == /еЕ С. Цепь является эргодической, иначе говоря, предельные значения П=(7Г1,7Г2, ...) таковы, что все ttj >0 и 52 — И /€£ D. Существует и притом единственное стационарное (инвариант- ное) распределение вероятностей Q = (^i, q2, ...), т. е. такое, что q/^0, Е = 1 И ieE ieE для всех j е Е. Замечание. Использованный здесь термин «эргодичность» встречался нам в гл. V (эргодичность как свойство метрической транзитивности, эргодическая теорема Биркгофа и Хинчина). В буквальном смысле эти термины относятся к разным объектам, но у них есть и общее — они отражают то, что речь идет об асимптотическом поведении тех или иных вероятностных характеристик при стремлении временного параметра к бесконечности. 3. Задачи. 1. Приведите примеры марковских цепей, у которых существуют преде- лы 7Гу = lim р$: (а) не зависящие от начальных состояний /; (Ь) зависящие от начальных состояний /. 2. Приведите примеры эргодических и неэргодических цепей. 3. Приведите примеры, когда стационарное распределение не является эргодическим. ю*
812 ГЛ. VIII. МАРКОВСКИЕ ЦЕПИ § 4. Классификация состояний марковских цепей по алгебраическим свойствам матриц переходных вероятностей 1. Будем предполагать, что рассматриваемая марковская цепь имеет счетное множество состояний £ = {1, 2, ...} и переходные вероятности Pij, /, jeE. Матрицу (таблицу), образованную этими переходными веро- ятностями, будем обозначать Р = ||р//|| или, в более развернутой форме, р= Pll Pl2 Pi3 Р21 Р22 Р23 Pil Pl2 Ра (Вместо || ♦ || для матриц часто бывает удобнее писать (•).) Приводимая далее классификация состояний марковских цепей пол- ностью пределяется алгебраическими свойствами матриц переходных вероятностей Р и их степеней P(rt), я > 1. Матрица переходных вероятностей Р полностью определяет одноша- говые переходы из состояния в состояние. Матрицы же Р(л) = || р$ || опре- деляют (в силу марковского свойства) переходы за п шагов. Скажем, матрица /1/2 1/2\ \ 0 1 ) и соответствующий ей граф (см. § 12 гл. I) показывают, что определяемое ими движение «частицы», блуждающей по состояниям 0 и 1, таково, что за один шаг возможен переход 0 —> 1 (с вероятностью 1/2), но переход 1 —* 0 невозможен. Ясно, что переход 1 —> 0 невозможен и за любое число шагов, что видно, конечно, и из структуры матриц р(«) — 2-л }_2-п О 1 показывающей, что р$ = 0 при любом л > 1. В этом примере состояние 1 является таким, что в него можно войти (из состояния 0), но нельзя из него выйти. Рассмотрим граф на рис. 36, по которому легко восстановить и соот- ветствующую матрицу переходов Р. Из вида этого графа ясно, что здесь имеется три состояния (левая часть рисунка), выйдя из которых, обратно вернуться невозможно.
§4. КЛАССИФИКАЦИЯ СОСТОЯНИЙ МАРКОВСКИХ ЦЕПЕЙ 813 С точки зрения «будущего» поведения «частицы», блуждающей в соот- ветствии с данным графом, эти три состояния несущественны (и называ- ются несущественными) по той указанной причине, что из них возможен выход, но в них невозможно возвращение. Несущественные состояния Существенные состояния Рис. 36. Такие «несущественные» состояния, не представляющие интереса, можно сразу отбросить, сосредоточив все внимание на классификации лишь оставшихся «существенных» состояний. (Данному описательному определению «несущественных» и «существенных» состояний можно при- дать и точную формулировку в терминах свойств переходных вероятностей i, j G Е, п 1; задача 1.) 2. Чтобы расклассифицировать существенные состояния или группы таких состояний, нам понадобится ряд определений. Определение 1. Говорят, что состояние / достижимо из состояния i (обозначение: i —* /), если найдется такое п > О, что р-р > 0 (р$ = 1, если I = /, и 0, если i / /). Состояния i и j называются сообщающимися (обозначение: i j), если / —» j и j -*i, т. е. они являются взаимно достижимыми. Лемма 1. Свойство сообщаемости «<-+» (взаимной достижимо- сти) есть отношение эквивалентности состояний (марковской цепи с матрицей переходных вероятностей Р). Доказательство. По определению отношения эквивалентности (в данном случае отношения «<-►») надо проверить его рефлексивность (i^i), симметричность (если i <-> /, то j ++1) и транзитивность (если / <_> д у <_+ k, то i <-> k). Первые два свойства следуют непосредственно из определения сооб- щаемости состояний. Транзитивность вытекает из уравнения Колмогоро- ва-Чепмена: если р^ > 0, р^ > 0, то т. е. i —> k. Аналогично, k —> i. Тем самым, I <-> k. □
814 ГЛ. VIII. МАРКОВСКИЕ ЦЕПИ Будем относить все сообщающиеся между собой состояния /, /, k. ... (/<-*л ...) к одному классу. Тогда любые такие классы состо- яний или совпадают, или же не пересекаются. Следовательно, отношение сообщаемости разбивает все множество (существенных) состояний Е на конечное или счетное число непересекающихся множеств £i, Ег, ••• (E = Ei+E2+...). Эти множества будем называть неразложимыми классами (сущест- венных сообщающихся) состояний. Марковскую цепь, все состояния кото- рой образуют один неразложимый класс, будем называть неразложимой. Для иллюстрации введенных понятий рассмотрим цепь с пространством состояний Е = {1, 2, 3, 4, 5} и матрицей переходных вероятностей О 0 0 \ ООО О 1 О 1/2 0 1/2 0 10/ Граф этой цепи с пятью состояниями имеет следующий вид: Ясно, что у рассматриваемой цепи есть два неразложимых класса Е\ = = {1,2}, Е2 = {3, 4, 5}, и исследование ее свойств сводится к исследо- ванию свойств каждой из двух цепей, множествами состояний которых являются множества Е\ и Рис. 37. Пример марков- ской цепи с периодом d = 2 Е2, а матрицы переходных вероятностей равны соответственно Pj и ?2- Рассмотрим теперь какой-нибудь нераз- ложимый класс Е. Для примера пусть им бу- дет класс, изображенный на рис. 37. Заметим, что здесь возвращение в каждое состояние возможно лишь за четное чис- ло шагов, переход в соседнее состояние — за нечетное число шагов, а матрица переход- ных вероятностей имеет блочную структуру: / 0 0 1/2 1/2 \1/2 1/2 1/2 1/2\ 1/2 1/2 ~0 0" 0 0 /
§4. КЛАССИФИКАЦИЯ СОСТОЯНИЙ МАРКОВСКИХ ЦЕПЕЙ 815 Отсюда видно, что класс Е = {1, 2, 3, 4} разбивается на два подкласса Со = {1» 2} и Ci = {3, 4}, обладающих следующим свойством цикличности: за один шаг из Со «частица» непременно переходит в Cj, а из Ci — в Со. 3. Приведенный пример показывает, что, по-видимому, и в общем слу- чае можно дать соответствующую классификацию неразложимых клас- сов состояний на циклические подклассы, С этой целью нам понадобятся некоторые определения и один факт из теории чисел. Определение 2. Пусть = <р2, ...) —некоторая последователь- ность неотрицательных чисел <рп 0, п 1. Периодом последовательности у (обозначение: d(<p)) называется число ^) = НОД{п>1: ^л>0}, где НОД(Л4у,) есть Наибольший Общий Делитель множества тех ин- дексов и > 1, для которых ipn > 0; если <рп = 0, п > 1, то = 0 и НОД(Л4у,) полагается равным нулю. По-другому можно сказать, что последовательность у? имеет период d(<p), если из того, что <рп >0, следует, что d(ip) делит п (т. е. п должно иметь вид d(ip)k с некоторым 1) и d(<p) является наибольшим среди всех тех чисел d, которые обладают таким свойством (т. е. таких, что n = dl с некоторым целым / > 1). Так, например, последовательность <р = (<рь <Р2> •••) такая, что (^>0 для k= 1, 2, ... и <Рп = 0 для п/4&, имеет период = 4, а не 2, хотя <Р2/ > 0 для / = 2, 4, 8. Определение 3. Говорят, что последовательность = (<Р1, <Р2, • • •) ляе- риодическая, если ее период d(ip) = 1. Следующий элементарный результат из теории чисел будет в дальней- шем полезен при классификации состояний по свойству цикличности. Лемма 2. Пусть — некоторое множество неотрицательных целых чисел (MCE), замкнутое относительно сложения и такое, что НОД(М)=1. Тогда при некотором по все числа п^п$ будут принадлежать М. Применим эту лемму к множеству М = Мберя в качестве последова- тельности = у?2» •••) последовательность (pJ9, р^, ...) или после- довательность (pjp, Pyyrf), •••)» где / — некоторое состояние мар- ковской цепи, имеющей матрицу переходных вероятностей Р=||р//||, а Р^ц — элемент матрицы и > 1, = Р. (При этом будем говорить, что состояние j имеет период d(j), если d(j) есть период последовательности (pjp, pjp, ...).) Тогда получим следующий результат.
816 ГЛ. VIII. МАРКОВСКИЕ ЦЕПИ Теорема 1. Пусть состояние j имеет период d = d(j). Если d — \, то найдется такое no = no(j), что для всех п^по пе- реходные вероятности pff > 0. Если d>\, то найдется такое no = no(j, d), что для всех п^по переходные вероятности р^ > 0. Если d^l и р^ >0 для некоторых i еЕ и т^ 1, то найдется такое по = по(], d, т), что p^+nd^ > 0 для всех п по. Приведем теперь теорему, показывающую, что период состояний неразложимого класса обладает свойством «однотипности». Теорема 2. Пусть Е* = {/, /, ...} — некоторый неразложимый класс (сообщающихся) состояний из множества Е. Все состояния такого класса являются «однотипными» в том смысле, что они имеют один и тот же период (обозначаемый d(E*) и называемый периодом класса Е*). Доказательство. Пусть /, j£E*. Тогда найдутся такие k и I, что р^ > 0 и pjf > 0. Но тогда в силу уравнения Колмогорова—Чепмена *?№><>. аеЕ и, значит, k +1 должно делиться на d(i) — период состояния i^E*. Пусть d(j) — период состояния j еЕ* и п таково, что р^ > 0. Тогда п должно делиться на d(j) и так как рГ‘+о>рМ?р?>>о, то п + k + 1 делится на d(i). Но k + l делится на d(i), а значит, п делится на d(i) и поскольку d(j) = НОД{ п: р{$ > 0}, то d(i) d(j). По симметрии d(j) d(i), и, следовательно, d(i) = d(j). □ 4. Если множество состояний Е* С £ образует неразложимый класс (сообщающихся состояний) и d(E*) = 1, то о таком классе говорят как об апериодическом классе состояний. Рассмотрим теперь случай d(E*) > 1. Переходы из состояния в состояние внутри такого класса могут осу- ществляться весьма причудливым образом (как в рассмотренном выше примере марковской цепи с периодом d(E*) = 2; см. рис. 37). Оказывается, однако, что в этих переходах, из одной группы состояний в другую, имеет место вполне определенная «цикличность»: Теорема 3. Пусть Е* — неразложимый класс состояний, E*QE, с периодом d = d(E*) > 1. Тогда найдутся d групп состояний Со, Сь ..., Q-i, называемых циклическими подклассами (Е* = Со + Ci +... + Cd-i), характеризуе-
§4. КЛАССИФИКАЦИЯ СОСТОЯНИЙ МАРКОВСКИХ ЦЕПЕЙ 817 мые тем, что в моменты времени п — p + kd с р = 0, d — \ и £ = 0, 1, ... «частица» будет находиться в подклассе Ср с переходом в следующий момент в СР+\, затем в СР+2, ..., в Cd~\, из Cd-\ в Со и т. д. Доказательство. Зафиксируем некоторое состояние 6 £* и введем следующие подклассы'. Со = {/ е£*: если р^>0, то n = kd, k = 0, 1, ...}, C\={j еЕ*; если р^>0, то n = kd + 1, £ = 0, 1, ...}, Cd-\ = {/ Gf*: если p^>0, то n = kd + (d - 1), £ = 0,1,...}. Ясно, что £* = Co + Ci +... + Cd-1. Покажем, что движение «частицы» из подкласса в подкласс осуществляется описанным в теореме способом; см. рис. 38. В самом деле, рассмотрим некоторое со- стояние 1еСр, и пусть состояние j е Е* та- ково, что pij > 0. Покажем, что тогда непре- менно j е С(р+\) (mod rf). Пусть п таково, что р^ > 0. Тогда п мо- жет быть представлено в виде и = p + kd с некоторыми р = 0, 1, ..., d — 1 и £ = = 0, 1, ... Значит, п = р (mod d), и поэто- му п 4-1 = (р + 1) (mod d). Отсюда следует, что >0 (по определению периода d = = d(£*)), и, значит, /еС(Р+1) (modd), что и требовалось установить. □ Рис. 38. Движение по цикли- ческим подклассам Заметим, что из приведенных рассуждений следует, что матрица Р пе- реходных вероятностей имеет блочную структуру: Со Cj ... С^_|
ГЛ. VIII. МАРКОВСКИЕЦЕПИ 818 Предположим сейчас, что блуждающая «частица», эволюция котоппй управляется матрицей Р, начинает свое движение из некоторого состояния в подклассе Со. Тогда в каждый из моментов времени п = р + kd эт < стица» будет находиться (в силу определения подклассов Со С ЭТа «ча~ в множестве Ср. > ь • • •, Следовательно, с каждым таким множеством состояний С можно зать новую марковскую цепь с матрицей переходов ||p.(d>||, где / /рГ Эта новая цепь будет неразложимой и апериодической ' ’ 5 р' Циклические подклассы Рис. 39. Классификация состояний марковской цепи по арифметическим свойствам вероятностей р-“}. Таким образом, принимая во внимание проведенную классики™,™ (на несущественные и существенные состояния, неразложимы/™ циклические подклассы; см. сводный рис. 39), можно сделать такой Тывод- При исследовании вопросов предельного поведения пеое ходных вероятностей pY!\ i ;<=р Пппо„л„ Р блуждание «марковской частицы», можно ограничиваться рассмотрением лишь того случая, когда фазовое поост ранство Е ж является единственным неразложимый апериодическим классом состояний. м В этом предположении саму марковскую цепь X = (X 1 фазовым пространством и матрицей переходных вероятностей pV, ТЭКИМ неразложимой и апериодической. называют
§5. КЛАССИФИКАЦИЯ СОСТОЯНИЙ МАРКОВСКИХ ЦЕПЕЙ 819 5. Задачи. 1. Придать рассмотренному в конце п. 1 описательному определению несущественных и существенных состояний точную формулировку в тер- минах свойств переходных вероятностей р^\ /, j еЕ, п^\. 2. Пусть Р — матрица переходных вероятностей неразложимой мар- ковской цепи с конечным числом состояний. Пусть Р2 = Р. Исследовать структуру этой матрицы Р. 3. Пусть Р — матрица переходных вероятностей конечной марковской цепи Х = (Ал)п>о- Пусть <ti,<T2, ... — последовательность независимых, одинаково распределенных, неотрицательных, целочисленных случайных величин, независимых от X, и пусть то = О, тп = +... + ая, 1. По- казать, что последовательность Х = (Хп)п^о с Хп=ХТп является цепью Маркова. Найти матрицу Р переходных вероятностей этой цепи. Показать, что если состояния i и j сообщающиеся для цепи X, то они будут таковыми и для цепи X. 4. Рассматривается марковская цепь с двумя состояниями, Е = {0, 1}, и матрицей переходных вероятностей Р=( “ 1 ’ 0<а<1’ 0</?<1. Опишите структуру матриц P(rt), п > 2. § 5. Классификация состояний марковских цепей по асимптотическим свойствам переходных вероятностей 1. Пусть X = (Хя)я>о — однородная марковская цепь со счетным множеством состояний Е = {1, 2, ...} и переходными вероятностями р,7= = Р/{Х1=/},/,/еЕ. Положим f^ = Pi{Xn = i,Xk^i, l^k^n-1} (1) и (для i / /) ^) = Р/{ХЯ = /,Х.//, (2) Понятно, что f-У есть вероятность первого возвращения в состояние i в точности на n-м шаге, a — вероятность первого попадания в со- стояние j в точности на л-м шаге в предположении, что Х$ = 1. Если положить = inf{ п 1: Хп(ш) = /} (3)
820 ГЛ. VIII. МАРКОВСКИЕ ЦЕПИ с а/(си) = оо, когда стоящее здесь множество {} = 0, то вероятности и можно будет представить также в следующем виде: ZH = p.{a/=n}, f^ = Pi{aj = n} (4) Введем для i, j еЕ величины оо л,=£/?’ (5) /1=1 Из (4) ясно, что А7 = Р;{а7<оо}. (6) Иначе говоря, Д; — это есть вероятность того, что «частица», начинающая блуждать из состояния /, рано или поздно попадет в состояние /. Особо важна в дальнейшем вероятность fa — вероятность того, что «частица», выходящая из состояния z, рано или поздно в него вернется. Именно эти вероятности используются в следующих определениях. Определение 1. Состояние 1еЕ называется возвратным (рекур- рентным — recurrent, persistent), если fa = 1. Определение 2. Состояние i е Е называется невозвратным (транзи- ентным —transient), если fa < 1. Имеют место следующие критерии возвратности и невозвратности. Теорема 1. а) Возвратность состояния ieE равносильна любому из следующих свойств: Р/Цл = / б. ч.} = 1 или 5л Pi?= °°- п Ь) Невозвратность состояния ieE равносильна любому из сле- дующих свойств: Pi{Xn = / б. ч.} = 0 или 5л Р$? < °°- п Таким образом, согласно этой теореме: А, = 1 <=> Р/{Х„=/ б.Ч.}= 1 4Ф 52^ = 00, (7) п fu <1 Pi{Xn = i б.ч.} = 0 (8) п Замечание. Напомним, что, согласно таблице 1 в § 1 гл. II, событие {Хп = 1 б. ч.} — это множество тех исходов о>, для которых Хп(а;) = / для
§5. КЛАССИФИКАЦИЯ СОСТОЯНИЙ МАРКОВСКИХ ЦЕПЕЙ 821 бесконечного числа (б. ч.) индексов п. Если при этом Лл = {о>: Хл(си) = 0, оо то {Хп = 1 б. ч.} = р| U Ak\ см. указанную таблицу. n=l k=rt Доказательство. Можно сразу отметить, что импликация 2 pf < оо Р,{Х„ = i б. ч.} = 0 (9) п является (в силу того, что р-У = Pi{Xn = i}) следствием леммы Бореля— Кантелли (см. утверждение а) в этой лемме, § 10 гл. II). Покажем, что /(< = 1 Ф» 22^ = 00. (10) п, Из однородности и марковского свойства следует, что для любых на- боров (i|..ik) и (/1, /„) Р/ {(Xi....Xk) = (й, • , ik), (Xk+t, ..., Х*+я) = (/!./„)} = = P/{(XI>..„ Х*) = (Й,iA)}Pu{(Xb .... %«) = (/., .... /.)}• Отсюда непосредственно вытекает (ср. с выводом формулы (38) в § 12 гл. I и формулы (25) § 2 этой главы), что п—1 рУ=р, {Хп = /} = £ РМ / А • • • > Xn-k-1 / A Xn-k = i, Хп = j}= k=0 n—1 =22 PM / /, Xn-k = j} P,{Xk = /}= k=0 n—I n 'O’ pii 'П pii k=o k=\ Итак, n k=\ Полагая j = i, находим (c = 1), что oo oo n oo oo oo E a'">=E E ff' p'r”=£ й4 E '’I”’*’ - ip £ "J"’= n=l n=l k=\ k=\ n=k n=Q (oo \ i+£2 4” • (12) n=l /
822 ГЛ. VIII. МАРКОВСКИЕ ЦЕПИ Отсюда ясно, что ОО Е => fn= п=^-—• (13) «=| i + E/>?’ П=1 оо Пусть теперь ^2 Рп ~ °0- Тогда П=1 N N п N N N N Е ₽?’=Е Е йч₽Г*'=Е й*> Е ₽'Г‘’«Е йч Е л=1 П=1 /г=1 fe=l n=k k=l 1=0 и, значит, Е р? -----и. n^. *=i *=1 v п!9 z=o " Итак, f><f> = oo => А, = 1. (14) /1=1 Импликации (13) и (14) немедленно приводят к справедливости следу- ющих взаимных импликаций: £р^<оо & fu<\, (15) п=1 f><f> = oo А, = 1. (16) п=1 Для завершения доказательства теоремы осталось показать, что А/< 1 Pi{Xn = i б. ч.} = 0, (17) fn = \ & Pi{Xn = i б.ч.}=1. (18) С интуитивной точки зрения эти свойства весьма понятны. Так, если fa = 1, то это означает, что P/{az <оо}= 1, т. е. «частица» рано или поздно вернется в то же самое состояние /, откуда она начала свое движение. Но тогда, по строго марковскому свойству, с этого (случайного) момента «жизнь частицы» как бы начинается заново. Продолжая эти рассмотрения, приходим к тому, что события {Хп = 1} будут осуществляться для бесконеч- ного числа индексов л, т. е. Pi{Xn = i б. ч.}= 1.
§5. КЛАССИФИКАЦИЯ СОСТОЯНИЙ МАРКОВСКИХ ЦЕПЕЙ 823 Проведем формальное доказательство свойств (17) и (18). Рассмотрим для данного состояния i е Е вероятность того, что число возвращений в i больше или равно т. Мы утверждаем, что эта вероятность равна (fu)m- Действительно, если m= 1, то это следует из определения [ц. Пусть требуемое утверждение доказано для т — 1. Покажем, что тогда интересу- ющая нас вероятность равна (fn)m. По строго марковскому свойству (см. (8) в § 2) и с учетом того, что событие {ai =k}e находим: Р/{число возвращений в i больше или равно т) = оо = У^ Р/(<7/ = k и число возвращений в i после момента k *=I больше или равно т - 1} = оо = У^ РДа, =£}РДпо крайней мере т- 1 значение из Ха/+ь Ха.+2, ••• Л=1 равно i |<т/ = &) = оо = P/fo = *}P/(no крайней мере т — 1 значение из Xj, %2, *=l равно/) = =Е №(ыт~1=шг-'= k=[ Отсюда вытекает, что P,-{X„ = i б.ч.} = lim = еСЛИ f!i = i’ (19) m->oo 10, если/п=о. Эта формула показывает, что если А = {Ап б. ч.} (=lim Ап), где = = {Xrt = 0, то для вероятности Р/(Л) справедлив «закон 0 или 1», т. е. Р/(Д) принимает лишь два значения 0 или 1. (Отметим, что это свойство не вытекает непосредственно из утверждений а) и Ь) леммы Бореля— Кантелли (§ 10 гл. II), поскольку события Дп, л^1, являются, вообще говоря, зависимыми,) Из (19) и того свойства, что Р/И) принимает лишь значения 0 и 1, получаем требуемые импликации в (17) и (18). □ 2. Из доказанной теоремы вытекает следующее простое, но важное свойство невозвратных состояний.
824 ГЛ. VIII. МАРКОВСКИЕ ЦЕПИ Теорема 2. Если состояние j невозвратно, то для любого i е Е (20) й=1 и, значит, для любого I еЕ п—*<х>. (21) Доказательство. Из (11) (с pf^ 1) оо оо п оо оо оо оо Е р?=Е Е «-*’=£ f? Е р?«Е ₽!”’<=о. п=1 я=1 k=\ k=\ п=0 п=0 п=0 °° (k) где мы учли, что fa = ^2 А/ ’ 1 (как вероятность того, что частица, вы- k=\ шедшая из состояния I, рано или поздно попадет в состояние /). Свойство (21) очевидным образом следует из (20). □ 3. Перейдем теперь к рассмотрению возвратных состояний. Каждое возвратное состояние i е Е можно отнести к одному из двух типов в зависимости от конечности или бесконечности среднего времени первого возвращения (=Е,а() (22) Л=1 в это же состояние. (Напомним, что, согласно (1), есть вероятность первого возвращения в точности через п шагов.) Определение 3. Возвратное состояние ieE называется положи- тельным, если = >0, (23) \л=1 / и нулевым, если = '=0- (24) \п=1 / Таким образом, согласно этому определению, первое возвращение в нулевое (возвратное) состояние происходит (в среднем) за бесконечное время. Среднее же время первого возвращения в положительное (воз- вратное) состояние является конечным.
§5. КЛАССИФИКАЦИЯ СОСТОЯНИЙ МАРКОВСКИХ ЦЕПЕЙ 825 4. Следующий рисунок наглядно иллюстрирует классификацию состо- яний марковской цепи, основанную на понятиях возвратности и невоз- вратности, положительной возвратности и нулевой возвратности. Рис. 40. Классификация состояний марковской цепи по асимптотическим свой- ствам вероятностей р-^. 5. Теорема 3. Пусть состояние j еЕ марковской цепи является возвратным и апериодическим (d(j) = 1). Тогда для любого ieE (25) Если к тому же состояния i и j сообщающиеся (i <-► /), т. е. при- надлежат одному и тому же неразложимому классу, то п^°°- (26) Приводимое ниже доказательство будет существенно опираться на утверждение леммы 1, являющейся одним из ключевых результатов «дискретной теории восстановления». По поводу иного доказательства теоремы 3, основанного на идеях каплинга (coupling, § 8 гл. III), см., например, [104], [105]. Лемма 1 (основная лемма «дискретной теории восстановления»). Пусть ip = (<p\y •••) — апериодическая (d(cp) = \) последователь- ность неотрицательных чисел, по которой строится последовате- льность u = (uq,u\, ...) в соответствии со следующим рекуррентным правилом, uo = 1 и для любого п 1 =<p\Un- \ +<P2Un-2 +... (27)
826 ГЛ. VIII. МАРКОВСКИЕ ЦЕПИ Тогда при п—юо ип->р~1, где ц= £ п<ря. /1=1 По поводу доказательства этой леммы см., например, [69, т. 1, XIII.10]. Доказательство теоремы 3. Пусть сначала i = /. Покажем, что п^°°- (28) А*/ С этой целью перепишем формулу (11) (для i = /) в следующем виде: _(«) _ f(l) п(«-1) . И2) п(л-2) , , f(n) (0) z9qv Pii ~ hi Pii + hi Pii + +hi Pii ’ где полагается pff = 1 и, очевидно, /g’ = pff. Если положить uk = p*V, <pk = ff, (30) то (29) переписывается в виде Un=(p\Un_\ +<^2Wrt-2 + --- + ^nWo, что в точности совпадает с рекуррентной формулой в лемме 1. Требуемый результат (28) будет непосредственно вытекать из утвер- ждения этой леммы, как только убедимся в том, что период df(j) после- довательности (/jp, ...) равен единице, если (как это предположено) период последовательности (pjj\ pff, ...) равен единице. Это в свою очередь вытекает из следующего общего утверждения. Лемма 2. Для всякого j еЕ НОД(л > 1: pg’ > 0) = НОД(л > 1: >0), (31) т. е. периоды df(j) и d(j) совпадают. Доказательство. Пусть Af = {n:pg’>0} и Mf = {n: fJ’>0}. Поскольку Мf С М, то НОД(М) ^НОДОИД т.е. d(j) ^df(j). Обратное же неравенство вытекает из следующего смысла вероятно- стей pff И 1. Если «частица», вышедшая из состояния /, через п шагов оказывается снова в этом состоянии (pff >0), то это означает, что ее движение было
§5. КЛАССИФИКАЦИЯ СОСТОЯНИЙ МАРКОВСКИХ ЦЕПЕЙ 827 таким, что она из j в j впервые вернулась через k\ шагов >0), затем —через &2 шагов >0), ..., через ki шагов (fW >0). Значит, n-k\ +&2+ ... + &/• Число df(j) делит k2i...» kt и поэтому делит п. Но d(j) — наибольшее из тех чисел, которые делят те и, для которых p<ff>0. Тем самым, d(j)^ d f(j). Итак, a(j) = df(j), что, между прочим, говорит о том, что при опре- делении периода d(j) состояния j формулой d(j) = НОД(п 1: pff > 0) можно было бы пользоваться также формулой d(j) = НОД(п 1: fff > 0). Лемма 2 доказана. □ Перейдем теперь к доказательству свойства (25) в случае i 0 /. Запишем формулу (11) в следующем виде: оо <32> *=1 где положено р^ = 0, / < 0. Поскольку здесь р[У —> — и /// < 1, то по теореме о мажорируемой Д/ л=1 сходимости (теорема 3 в § 6 гл. II) оо оо оо »J" £ /«₽;-> .£ /« р<Г‘> _ ± ± (33) k=l k=l ' /г=1 ' Из (32) и (33) получаем, что (34) т. е. справедливо утверждение (25). Наконец, если мы покажем, что при дополнительном предположении i j (т. е. /, j принадлежат одному и тому же неразложимому классу сообщающихся состояний) вероятность = 1, то из (34) будет следовать и свойство (26). Состояние j предположено возвратным. Следовательно, по утвержде- нию а) теоремы 1 Р7{ХЯ = j б. ч.}= 1. Поэтому для всякого т Р<Г) = Р/({ХШ = /}П{Х„ = /6.Ч.})^ : р/{хт=I, Хп+1 • • •, хп—1 /, хп=/}= п>т = Y,pTi'"~"' = pTI‘I' <35> п>т
828 ГЛ. VIII. МАРКОВСКИЕ ЦЕПИ где предпоследнее равенство есть следствие обобщенного марковского свойства (см. (2) в § 2). В силу того, что Е — класс сообщающихся состояний, найдется т такое, что р^ > 0. Поэтому из (35) заключаем, что fa = 1. □ 6. Естественно сформулировать аналог приведенной теоремы 3 и в том случае, когда период d интересующего нас состояния / может быть произвольным (d = d(j) 1). Справедлива следующая Теорема 4. Пусть состояние j еЕ марковской цепи является воз- вратным с периодом d = d(j) 1, и пусть i — некоторое состояние из Е (быть может, и совпадающее с j). а) Предположим, что i и j принадлежат одному и тому же неразложимому классу CQE с (циклическими) подклассами Со, С\,..., Cd-\. занумерованными так, что jeCq, ieCa, гдеае{0,1,..., d - 1}, и движение по ним осуществляется в циклическом порядке: Со —> Cj —* >Са—Cd-\ —*Cq. Тогда при п—>оо (36) k (rtd+a) d_ ' Pii Щ b) В общем случае, когда i и j могут принадлежать разным неразложимым классам, при п—^оо {nd+a) Pii п .6=0 (37) d Д/ для всякого а = 0, 1,..., d — 1. Доказательство, а) Пусть сначала а = 0, т. е. i и j принадлежат одному и тому же неразложимому классу С и, более того, принадлежат одному и тому же циклическому подклассу Со. Рассмотрим переходные вероятности pff, i, j ЕС, и по ним построим (в соответствии с конструкциями § 1) новую марковскую цепь. Для этой новой цепи состояние / будет возвратно и апериодично. Со- стояния z и j для этой новой цепи останутся сообщающимися (I <-> /). Тем самым по свойству (26) из теоремы 3 М) —I— гц 00 Е kf d) k=l " d _ d k=\ " где последнее равенство следует из того, что =0 для всех I, не деля- 00 (А щихся на d, и по определению д/ = £ О}/-
§5. КЛАССИФИКАЦИЯ СОСТОЯНИЙ МАРКОВСКИХ ЦЕПЕЙ 829 Предположим теперь, что формула (36) доказана для а = 0, 1, г (<d-2). По теореме о мажорируемой сходимости (теорема 3 § 6 гл. II) £=1 k=l Тем самым требуемая формула (36) будет верна и для a = r +1 (^d — 1), т. е. по индукции установлена справедливость формулы (36) для всех а = 0, 1..d-1. b) Для любых I и j из Е справедлива следующая формула (см. (11)): nd+a р№+а)=у' М (nd+a-k) а = 0, I,d — \. ГЧ Ц] г ц Ь=1 По предположению период состояния j равен d. Поэтому p№+a~k>> = о, за исключением лишь случаев, когда k — а имеет вид rd. Значит, п (nd+a) = Y' f И+а) n((n-r)d) Pij Zs lij rjj r=0 Отсюда и из установленного свойства (36), применяя снова теорему о мажорируемой сходимости, приходим к требуемому утверждению (37). □ 7. Как было отмечено в конце § 4, при рассмотрении вопроса клас- сификации марковских цепей по асимптотическим свойствам переходных вероятностей можно ограничиваться рассмотрением лишь апериодиче- ских неразложимых цепей. Результаты, изложенные в теоремах 1—3, в сущности, содержат все необходимое для полной классификации таких цепей. Предварительно приведем одно вспомогательное утверждение из числа результатов о том, что для неразложимых цепей все состояния относятся к одному и тому же («возвратному» или «невозвратному») типу. (Ср. со свойством «однотипности» в теореме 2 § 4.) Лемма 3. Пусть Е — неразложимый класс (сообщающихся состо- яний). Тогда все его состояния или только возвратные, или только невозвратные. Доказательство. Пусть у цепи есть хотя бы одно невозвратное со- стояние, скажем, состояние L По теореме 1 ^2 <°°- п Пусть теперь j — какое-то другое состояние. В силу того, что Е — неразложимый класс сообщающихся состояний (I <-> /), найдутся такие k
830 ГЛ. VIII. МАРКОВСКИЕ ЦЕПИ и /, что >0 и pjP >0- Но тогда из очевидного неравенства p!’+w^p!‘> /><"’/>)? следует, что £₽'-+‘+'|^“р'?Е₽Й’- п п По предположению £ р-? <оо и k, I таковы, что >0. Значит, В силу утверждения Ь) теоремы 1 отсюда следует, что состояние j также невозвратно. Иначе говоря, если у неразложимой цепи хотя бы одно состояние является невозвратным, то таким же будет и любое другое состояние. Пусть теперь i — возвратное состояние. Покажем, что тогда и все остальные состояния возвратны. Предположим, что (в дополнение к возвратному состоянию z) есть хотя бы одно невозвратное состояние. Тогда по уже доказанному все другие состояния также должны быть невозвратными, что противоречит предпо- ложению, что z — возвратное состояние. Тем самым наличие хотя бы одного возвратного состояния автомати- чески влечет то, что все остальные состояния (у неразложимой цепи) тоже возвратны. □ Результат этой леммы полностью оправдывает ту (общепринятую) тер- минологию, когда о неразложимых цепях (а не только об отдельных со- стояниях) говорят, что они «возвратные», «невозвратные». Теорема 5. Пусть марковская цепь состоит из одного неразло- жимого класса Е апериодических состояний. Для такой цепи реали- зуется лишь только одна из следующих трех возможностей. (i) Цепь невозвратна. В этом случае для всех i, j еЕ lim р^ = 0, причем сходимость к нулю достаточно «быстрая» в том смысле, что п (ii) Цепь возвратная и нулевая. В этом, случае также для всех I, ! &Е lim pff = 0, п '
§5. КЛАССИФИКАЦИЯ СОСТОЯНИЙ МАРКОВСКИХ ЦЕПЕЙ 831 но сходимость достаточно «медленная» в том смысле, что п и среднее время pj первого возвращения из j в j равно бесконечно- сти. (iii) Цепь возвратная и положительная. В этом случае для всех i, jeE lim р%} = — > О, « 4 Pj где p,j — среднее время возвращения из j в j, которое конечно. Доказательство. Утверждения в (i) доказаны в теореме 1 Ь) и теоре- ме 2. Утверждения в (ii) и (iii) вытекают непосредственно из теоремы 1 а) и теоремы 3. □ 8. Обратимся к случаю конечных марковских цепей, т. е. случаю, когда множество состояний Е состоит из конечного числа элементов. Оказывается, что в этом случае из трех возможностей (i), (ii), (iii) в теореме 5 имеет место только третья. Теорема 6. Пусть конечная марковская цепь является неразло- жимой и апериодической. Тогда такая цепь будет возвратной и положительной. При этом lim р-^ — — > 0. п Pj Доказательство. Предположим, что цепь невозвратна. Тогда если число г состояний цепи конечно (Е = {1, 2, ..., г}), то <38) /=1 /’= 1 «Левая часть, очевидно, равна единице. Но предположение невозвратности влечет за собой (согласно (i) теоремы 5) то, что правая часть равна нулю. Полученное противоречие исключает первую возможность в теореме 5. Пусть теперь состояния цепи возвратные. В силу того, что по утверждению теоремы 5 остались лишь две возмож- ности ((i) и (iii)), надо убедиться в том, что возможность (ii) исключается. Но поскольку в этом случае lim р-р = 0 для всех I, j 6 Е, то так же, как и в случае невозвратных состояний, используя (38), приходим к противоречию. Тем самым остается лишь третья возможность (iii). □ 9. Задачи. 1. Рассмотрим неразложимую цепь с множеством состояний 0, 1,2, ... Для того чтобы она была невозвратной, необходимо и достаточно, чтобы
832 ГЛ. VIII. МАРКОВСКИЕ ЦЕПИ система уравнений uy = 52 uiPib 1=®* U •••» имела ограниченное решение I такое, что щ ф с, i = 0, 1, ... 2. Для того чтобы неразложимая цепь с множеством состояний 0, 1, ... была возвратной, достаточно существования такой последовательности («о, «ь •••) с Ui —юо, i —>оо, что для всех //0 и, ^52 uiPij- i 3. Для того чтобы неразложимая цепь с состояниями 0, 1, ... была возвратной и положительной, необходимо и достаточно, чтобы система уравнений м/ = 52 uiPib Ь .... имела не тождественно равное нулю решение, для которого 52 lwd <°°- i 4. Рассматривается марковская цепь с состояниями 0, 1, ... и пере- ходными вероятностями Роо = го, Pot = Ро > О, Рц = Р< > О, qt > О, О / = z + l, / = ». j = i~ 1. в остальных случаях. Пусть ро= 1, Pm= qx"'q Доказать справедливость следующих утвер- Р\---рт ждений: цепь возвратна У Рт=ОО, цепь невозвратна о У рт < ОО, цепь положительная о У Pm = ОО, 1 Ртрт : оо, цепь нулевая О У Рт = ОО, 1 ртрт :ОО. 5. Показать, что fik fijfjk. sup Pi,"’ = п г ОО Л=1 6. Показать, что для любой марковской цепи со счетным множеством состояний всегда существуют пределы для pff в смысле Чезаро: Пт1 п П Ч U; k=l 7 i
§6. СТАЦИОНАРНЫЕ И ЭРГОДИЧЕСКИЕ РАСПРЕДЕЛЕНИЯ 833 7. Рассматривается марковская цепь &» 6» ••• с &+1=(6)+ + Шь &>0, где /71,7/2» ••• — последовательность независимых одинаково рас- пределенных случайных величин с Р{^ = /} = р,-, / = 0, 1, ... Выпишите матрицу переходных вероятностей и покажите, что если ро>О, ро + Р\ < 1» то цепь возвратна тогда и только тогда, когда 52 kpk 1. k § 6. О предельных, стационарных и эргодических распределениях для счетных марковских цепей 1. Начнем с одного общего результата, хорошо проясняющего преж- де всего связь между предельными значениями П=(7Г1,7Г2, ...), где 7г7=Нгп р)"\ / = 1,2, ..., и стационарными распределениями Q = = (?i, <72, ...)• Теорема 1. Рассматривается марковская цепь со счетным мно- жеством состояний Е = {1, 2, ...} такая, что ее переходные вероят- ности pij, i, j еЕ, таковы, что существуют пределы jeE, не зависящие от начальных состояний i е £. Тогда (а) Е */^.Е щрц = 1гь j&E; i=t <=i ОО (b) имеет место альтернатива: либо 52 тг/ = 0 (и, значит, все оо /=1 тгу = 0, / е Е), либо 52 Kj = 1; оо (с) если 52 — 0» то У марковской цепи отсутствуют стаци- /=1 оо онарные распределения’, если же 52 7r/ = h то вектор предельных /=1 значений П=(7Г1,7Г2, ...) образует для этой цепи стационарное рас- пределение и других стационарных распределений у этой цепи уже не существует. Доказательство. Имеем оо оо оо £ 7^ = 52 Ктр<;ЧПт = 1 (1) /=1 /=1 " /=1 и для любых / &E,ke.E ОО ОО оо 52 =52 'т рнР‘1 52 p^p‘i=1*и 4"+1>=7г/- (2) ., . . п п . , п /=1 f=l i=l
834 ГЛ. VIII. МАРКОВСКИЕ ЦЕПИ Замечание. Полезно отметить, что возникшие здесь неравенства и нижние пределы, конечно же, являются следствиями «леммы Фату», при- меняемой, правда, не к тому случаю, когда интеграл Лебега определяется по вероятностной мере, как в § 6 гл. II, а к тому случаю, когда интегри- рование ведется по a-конечной (неотрицательной) мере. Итак, вектор предельных вероятностей П=(тп, 7Г2, ...) обладает сле- дующими свойствами: оо и 52 7Г,Р,7^7ГЛ /<=£. i=l Покажем, что в последнем неравенстве на самом деле имеет место равен- ство. Пусть для некоторого /о Е Е Тогда оо У? Pi jo <7Г/о* /=1 * оо \ оо оо оо 52 ^рч) =52 52 а/=У27гл /=1 / i=l /=1 / = 1 оо Полученное противоречие показывает, что 22 ^iPij = ^j> Вместе с нера- /=1 оо венством 22 тг/1 это доказывает свойство (а). /=1 оо Для доказательства (Ь) заметим, что из соотношения 22 ^iPij — ^j ите- /=1 рациями получаем, что для любого л 1 и любого j еЕ оо 527г«7’У=тг/- /=1 Отсюда по теореме Лебега о мажорируемой сходимости (теорема 3 § 6 гл. II) ОО оо / оо \ *7=52 =52 ’т р?= (52 i=l 1 = 1 \J=1 / т. е. (оо \ 1 - 527г/) = °> / s £, /=| /
§6. СТАЦИОНАРНЫЕ И ЭРГОДИЧЕСКИЕ РАСПРЕДЕЛЕНИЯ 835 / оо \ / оо \ оо и, значит, ( 52 “ 52 ) =0- Так что а(1 -а) = 0 с а — 52 тг/, и \/=i J \ z=i / i=i поэтому или а= 1, или а = 0, что и доказывает утверждение (Ь). Для доказательства (с) предположим, что Q = (pb р2, ...) —какое-то оо , стационарное распределение. Тогда 52 QiPii=Qi и по теореме о мажори- /=1 / оо \ руемой сходимости ( 52 Qi )7Г/ / ^Е. \/=1 / оо Поэтому, если Q — стационарное распределение, то 52 Qi = 1 и» следо- /=1 вательно, необходимым образом это стационарное распределение должно оо быть таким, что = для всех jeE. Так что если 52 *7 = 0, то не может оо /=1 выполняться свойство 52 Ф = h и» значит, в этом случае стационарного /=1 распределения нет. оо Согласно (Ь), остается еще возможность 52 тг; = 1. В этом случае, /=1 согласно (а), П= (л , тгг, ...) само является стационарным распределением и из изложенного выше следует, что если Q — какое-то другое стацио- нарное распределение, то оно должно совпадать с Ц что и доказывает оо единственность стационарного распределения в случае 52 = □ /=1 2. Теорема 1 дает достаточное условие существования (к тому же единственного) стационарного распределения. Это условие заключается в требовании, чтобы для всех j G Е существовали предельные значения тг,- = lim р^\ не зависящие от i е Е и притом такие, что тг/ > 0 хотя бы для одного состояния j 6 Е. В то же самое время более общий вопрос существования пределов lim р^ довольно детально был изучен в § 5 с привлечением таких «вну- тренних» свойств цепей, как неразложимость, периодичность, возврат- ность и невозвратность, положительная и нулевая возвратность. Поэтому естественно сформулировать условия существования стационарного рас- пределения именно в терминах этих «внутренних» свойств, определяемых структурой матрицы переходных вероятностей р,;, z, j еЕ. Понятно так- же, что если в этих терминах будут указаны условия, при которых все предельные значения ttj >0, / € Е, то в соответствии с определением (см. свойство С в § 3) вектор П= (тл, 7Г2, ...) будет образовывать эргодическое предельное распределение. Ответы на эти вопросы даются в следующих двух теоремах.
836 ГЛ. VIII. МАРКОВСКИЕ ЦЕПИ Теорема 2 («основная теорема о стационарных распределениях»). Рассматривается марковская цепь со счетным множеством состо- яний Е. Для существования единственного стационарного распре- деления необходимо и достаточно, чтобы (а) существовал в точности один неразложимый подкласс и (Ь) все состояния были положительно возвратны. Теорема 3 («основная теорема об эргодических распределени- ях»). Рассматривается марковская цепь со счетным множеством состояний. Для существования эргодического распределения необходимо и достаточно, чтобы цепь являлась (а) неразложимой, (Ь) положительно возвратной и (с) апериодической. 3. Доказательство теоремы 2. Необходимость. Пусть рассмат- риваемая цепь имеет и притом единственное стационарное распределение, которое обозначим Q. Покажем, что тогда в множестве состояний Е дол- жен найтйсь и притом единственный положительно возвратный подкласс. Обозначим через N потенциально возможное число таких подклассов Пусть N=0 и / — некоторое состояние из Е. Поскольку положительно возвратных классов нет, то состояние j может быть или невозвратным, или же нулевым возвратным. В первом случае из теоремы 2 § 5 следует, что для всех i е Е пределы lim р^ существуют и равны нулю. Но и во втором случае эти пределы также существуют и равны нулю, что следует из свойства (37) в § 5 и того, что = оо, поскольку состояние / является нулевым возвратным. Итак, в случае N = 0 пределы тг; = lim р^ существуют для всех i, j^E и равны нулю. Поэтому по утверждению (с) теоремы 1 в этом случае нет стационарных распределений и, следовательно, этот случай N = 0 ис- ключается предположением существования стационарного распределе- ния Q. Пусть теперь AZ = 1. Обозначим единственный положительно воз- вратный класс через С. Если период этого класса d(C) = 1, то, согласно свойству (26) в теоре- ме 3 § 5, Pij’ М/ \ И->оо, для всех /, / € С. Если же / С, то это состояние невозвратно и тогда по
§6. СТАЦИОНАРНЫЕ И ЭРГОДИЧЕСКИЕ РАСПРЕДЕЛЕНИЯ 837 свойству (21) в теореме 2 § 5 Pif 0» п оо, для всех / е Е. Положим [О, если / £ С. Тогда, поскольку множество С 00, то по теореме 1 набор Q = (^b ^2, •••) образует единственное стационарное распределение, и, следователь- но, Q = Q. Предположим теперь, что период d(C) > 1. Пусть Со, Сь ...» Cd-\ — циклические подклассы (положительно воз- вратного) класса С. Относительно матрицы переходных вероятностей р^, i, j еС, каждый из подклассов С*, & = 0, 1, ..., d - 1, является возвратным и апериодиче- ским. Тогда, если /, j е С*, то, согласно формуле (36) из § 5, Л1>0. 4 Pi Поэтому на каждом множестве Ck набор {d/pj, j е Ck} образует (относи- тельно матрицы pff, j е С) единственное стационарное распределение (в силу свойства (Ь) теоремы 1). Отсюда, в частности, следует, что 52 — = 1, т. е. 52 — = 4. ieCu jick V d Положим p7‘. /eC = C0 + ... + Cd_lt 41 (о, цс, и покажем, что для исходной цепи набор Q = (<71, <72, •••) образует един- ственное стационарное распределение. В самом деле, если i е С, то /ес Тогда, как и в (1), находим, что п и, значит, ^Y.±p>- <7> /€С
838 ГЛ. VIII. МАРКОВСКИЕ ЦЕПИ Но (8) Так же, как и в доказательстве теоремы 1 (см. (3) и (4)), из (7) и (8) выводится, что на самом деле в (7) имеет место знак равенства: 1 1 w р,“ (9) Поскольку qi = jzf1 >0, то (9) показывает, что набор Q = (?b <72, •••) образует стационарное распределение, в силу теоремы 1 единственное. Следовательно, Q = Q. Пусть, наконец, 2 А7 < оо или N = оо. Обозначим соответствующие положительно возвратные подклассы через С1, ..., CN, если N <оо, и С1, С2, ..., если ?V = oo. Пусть = ^2* •••) —стационарное распределение для класса Ck, построенное по формуле (ср. с (5), (6)) k /д71>0’ 'Но к / е с*. i*ck. оо Тогда для любых неотрицательных чисел а\, а%, ... таких, что 52 = 1 *=1 (a/v+i =... = 0, если N <оо), набор aiQ1 + ... + Фу<0^ + ... будет, оче- видно, образовывать стационарное распределение. Тем самым допущение 2 N оо приводит к существованию континуума стационарных распре- делений, что противоречит сделанному предположению о единственности стационарного распределения. Итак, проведенное доказательство показывает, что возможен лишь случай М = 1. Иначе говоря, существование (единственного) стаци- онарного распределения влечет наличие у цепи в точности одного неразложимого класса, состоящего из положительно возвратных состояний. Достаточность. Если у цепи существует неразложимый подкласс положительно возвратных состояний, т. е. имеет место случай N = 1, то тогда из предшествующих рассмотрений вытекают (в силу утверждения (с) теоремы 1) и существование, и единственность стационарного распре- деления. Тем самым теорема 2 полностью доказана. □
§6. СТАЦИОНАРНЫЕ И ЭРГОДИЧЕСКИЕ РАСПРЕДЕЛЕНИЯ 839 4. Доказательство теоремы 3. По существу, все необходимое для этого доказательства содержится в теореме 2 и рассмотрениях при ее доказательстве. Достаточность. Если пользоваться обозначениями из доказатель- ства теоремы 2, то по условиям теоремы мы имеем N = 1, С = Е и d(E) = 1 (апериодичность). Тогда из рассмотрений «случая N = 1» в доказательстве теоремы 2 следует, что набор Q = G7i, •••) с j ЕЕ, образует одновременно стационарное и эргодическое распределение, поскольку все < оо, /еЕ. Итак, существование эргодического распределения П=(тг1,тг2, ...) установлено (H=Q). Необходимость. Если существует эргодическое распределение П= = (тгь тг2» •••), то, согласно теореме 1, существует и единственно стаци- онарное распределение Q, совпадающее с HL Из утверждения теоремы 2 (и ее доказательства) следует, что случаи М = 0и2^М^ооне могут реализоваться, и, значит, N = 1 и существует лишь один неразложимый класс С, состоящий из положительно возврат- ных состояний. Все, что осталось сделать, так это показать, что С = Е и </(Е)=1. Если предположить, что С / £ и d(C) = 1, то опять же из рассмотрения «случая N = 1» в доказательстве теоремы 2 вытекало бы, что существует состояние j £ С такое, что р^ —> 0 для всех i е Е. Это, однако, вступает в противоречие с тем, что тг; = lim р^ > 0 для всех i е Е. Таким образом, в случае d(C) — 1 имеем С = Е и d(E) = 1 (апериодич- ность). Наконец, если С / £ и d(C) > 1, то опять же из рассмотрений «случая N = 1» в теореме 2 следует, что тогда имеется стационарное распределение Q = (^b q2, ...), у которого некоторые <7/=0, что противоречит тому, что Q = n, а П=(7Г1,7Г2, ...) —эргодическое распределение, у которого (по определению) все тг7 > 0, / 6 Е. □ 5. По самому определению стационарного (инвариантного) распреде- ления Q = G7i, •••) этот набор подчиняется условиям оо ?/>0, /е£ = {1,2, $>/ = 1 (10) /=1 и при этом должны быть выполнены уравнения = X q‘Pii' ieE- (11) i=l
840 ГЛ. VIII. МАРКОВСКИЕ ЦЕПИ По-другому можно сказать, что стационарное распределение Q = = (#ь #2, •••) есть одно из решений системы уравнений */=52 Х‘Р‘Ь 1&Е' <12) (=1 подчиняющихся условиям неотрицательности (Xj > 0, / е Е) и норми- / оо \ рованности ( 52 х/ = 1 )• \/=1 / Если выполнены условия теоремы 3, то стационарное решение суще- ствует и является в то же самое время эргодическим. Поэтому по свой- ству (с) теоремы 1 можно утверждать, что у системы (12) в классе последо- оо вательностей х = (xi, Х2, ...) сх70, /еЕ, и 52 xj = 1 решение существует /=1 и единственно. На самом деле можно утверждать несколько больше. А именно, здесь также выполнены условия теоремы 3 и, следовательно, существует эрго- дическое распределение П=(7Г1, 7Г2, ...). Рассмотрим в этом предположении вопрос о существовании реше- ния у системы (12) в (более широком) классе последовательностей оо оо х = (%1, *2, •..) таких, что х7- е/?, j^E, 52 |ху|<оо и 52 Х/= 1. Покажем, /=1 /=1 что в этом классе решение единственное и им является эргодическое распределение И. Действительно, если х = (xi, Х2, ...) — решение, то, пользуясь тем, что оо 52 |х/| <оо, получаем следующую цепочку равенств: /=1 оо оо / оо \ х,=52 х‘Рч=52 (52 XkPki) Ру= /=1 /=1 u=l / oo / oo \ oo oo =52 **52 р>“Р‘1) =52 XkpS =-=52 *=1 \i=l / Zt=l k=\ для любого и>1. Переходя к пределу по /г—»оо, отсюда находим (по / оо \ , . теореме о мажорируемой сходимости), что xz= ( 52 ) *7» где = lim Pk \*=i / п оо для любого keE. По предположению 52 xk = 1- Поэтому Ху^тг,, j еЕ, k=i что и требовалось доказать.
§7. СТАЦИОНАРНЫЕ И ЭРГОДИЧЕСКИЕ РАСПРЕДЕЛЕНИЯ 841 6. Задачи. 1. Рассмотреть вопрос о стационарных, предельных, эргодических рас- пределениях для марковской цепи с матрицей переходных вероятностей /1/2 0 1/2 0\ р_ ° ° ° 1 1/4 1/2 1/4 0 ’ \ 0 1/2 1/2 0/ 2. Пусть Р= || ptj || — конечная дважды стохастическая матрица (т. е. т т 22 Pij — 1 Для i = 1, ..., т и Рч~ 1 для / = Ь ..., т). Показать, что /=1 /=1 для соответствующей марковской цепи стационарным распределением яв- ляется вектор Q = (l/m, ..., \/т). 3. Пусть X — марковская цепь с двумя состояниями, Е = {0, 1}, и мат- рицей переходных вероятностей 0<а<1, 0 </?<!. Исследовать вопрос о предельных, эргодических и стационарных распре- делениях для этой цепи. § 7. О предельных, стационарных и эргодических распределениях для конечных марковских цепей 1. Согласно теореме 6 § 5, всякая неразложимая и апериодическая марковская цепь с конечным множеством состояний является положитель- но возвратной. Это обстоятельство дает возможность придать теореме 3 из § 6 следующую формулировку. (Ср. с вопросами А, В, С и D в § 3.) Теорема 1. Рассматривается марковская цепь Х = (Хп)п^о с ко- нечным множеством состояний £ = {1, 2, ..., г}, которая является неразложимой и апериодической. Имеют место следующие утверждения. (а) При всех j е£ существуют предельные значения 717= lim pff, не зависящие от начального состояния ieE. (b) Предельные значения П= (7г>, 7Г2,..., тгг) образуют распределе- г ние вероятностей, т. е. тг7 > 0 м 22 *7 = 1» / € £. /=1 (с) Более того, предельные значения 717 = д”1 > 0 при всех j е Е, где 00 ( п fjj — среднее время до первого возвращения в состояние j /1=1 (т. е. pj — EjT(j) с r(j) = inf{ п 1: Хп ~ /}), и, следовательно, набор П=(7Г|, 7Г2, .... тгг) образует эргодическое распределение. 1/2И- 9728
842 ГЛ. VIII. МАРКОВСКИЕ ЦЕПИ (d) Стационарное распределение Q = 07i, ?2» •••, Qr) существует, является единственным и совпадает с П= (ти, 7Г2, ...»тгг). 2. В дополнение к теореме 1 приведем также следующий результат, проясняющий роль «неразложимости» и «апериодичности». Теорема 2. Рассматривается марковская цепь с конечным мно- жеством состояний Е == {1, 2, ..., г}. Следующие условия равносильны. (а) цепь является неразложимой и апериодической (d = 1); (b) цепь является неразложимой, апериодической (d = 1), положи- тельно возвратной', (с) цепь является эргодической; (d) найдется такое по, что для всех п^п$ min р-^>0. Доказательство. Импликация (d) => (с) была доказана в теореме 1 § 12 гл. I. Обратная импликация (с) => (d) очевидна. Импликация (а) => (Ь) следует из теоремы 6 § 5, импликация (Ь) => (а) очевидна. Наконец, рав- носильность утверждений (Ь) и (с) содержится в теореме 3 § 6. □ § 8. Простое случайное блуждание как марковская цепь 1. Под простым d-мерным случайным блужданием понимают од- нородную марковскую цепь X = (Хп)л^о» описывающую движение «части- цы» по узлам решетки ld = {0, ±1, ±2, ...}**, при котором эта «частица» с некоторой вероятностью остается в каждом состоянии и с некоторой вероятностью может перейти в одно из соседних состояний. Пример 1. Пусть d = 1 и множество состояний цепи E = Z = {0, ±1, ±2, ...}. Пусть матрица переходных вероятностей имеет следующий вид: Р, О Рц = / = * +1, в остальных случаях, причем р q = 1. Этой матрице соответствует граф наглядно иллюстрирующий возможные для этой цепи переходы.
§8. ПРОСТОЕ СЛУЧАЙНОЕ БЛУЖДАНИЕ КАК МАРКОВСКАЯ ЦЕПЬ 843 Если р = 0, то частица детерминированным образом движется влево, если же р = 1, то вправо. Эти «детерминированные» случаи мало интересны, и все состояния здесь являются несущественными. Поэтому будем предполагать, что 0< <р<1. В этом предположении состояния цепи образуют один класс суще- ственных сообщающихся состояний. Иначе говоря, в предположении 0< р < 1 цепь является неразложимой (см. § 4). Для любого j е £ в соответствии с формулами биномиального распре- деления (§ 2 гл. I) P(Hn} = C^(pq)n = ^(pq)n. (1) Согласно формуле Стирлинга (формула (6) § 2 гл. I; см. также задачу 1) /г!~г/2лтг ппе~п. Поэтому из (1) находим, что (2и) (4р?)я рП y/^i ’ (Z) и, значит, Рцп) = <х>, еслир = <?, (3) /1=1 52 Ррп} < оо, если p/q. (4) /1=1 Из этих формул и теоремы 1 из § 5 получаем следующий результат. Простое одномерное случайное блуждание по мно- жеству Е = Z — {0, ± 1, ±2, ...} является возвратным в симметричном случае, т.е. если p = q=l/2, и невоз- вратным, если p^q. В § 10 гл. I было показано, что в случае р = = 1/2 при больших п 2y/*nW W Значит, оо = jeE. (6) /1=1 Следовательно, здесь все состояния возвратные и нулевые. Поэтому по теореме 5 из § 5 находим, что при всех 0 < р < 1 р^ —> 0, /г —»оо, для любых 7г И'
844 ГЛ. VIII. МАРКОВСКИЕ ЦЕПИ i и /. Отсюда получаем (теорема 1 из § 6), что предельные распределения, а также стационарные и эргодические распределения отсутствуют. Пример 2. Пусть d = 2. Будем рассматривать симметричный случай (соответствующий в предыдущем примере случаю р = q = 1/2), когда Рис. 41. Блуждание на плоскости частица может сдвигаться на единицу вправо, влево, вверх или вниз с вероятностью 1/4. Для определенности зафиксируем нулевое состояние 0=(0, 0) и исследуем вопрос о воз- вращении или невозвращении «частицы» в это нулевое состояние, предполагая, что в нем она находилась в начальный момент времени. С этой целью рассмотрим те «траекто- рии» блуждающей частицы, у которых сдела- но i шагов вправо и / шагов влево и j шагов вверх и / шагов вниз. Если 2z +2/ = 2и, то это означает, что «частица», вышедшая из нуле- вого состояния, через 2п шагов непременно в это состояние вернется. Ясно также, что за нечетное число шагов «частица» в нулевое состояние вернуться не сможет. Отсюда следует, что для вероятностей перехода из состояния 0 в то же самое состояние 0 справедливы следующие формулы: Рот+1)=0, я=0, 1,2,..., и (по формуле полной вероятности) _(2л)_ (2«)! (1 \2я Р°° О’!)2(/!)2И; /1=1,2, ... (7) (см. также п. 2 «Мультиномиальное распределение» в § 2 гл. I). Умножая на (л!)2 числитель и знаменатель в выражении под знаком суммы в (7), находим, что = (tf'ci, £ С‘СГ = (|)2Я(С^)2, /=0 где мы воспользовались тем, что п \ ' pi pn—i_рп / , ^2п i=0 (8) (задача 4 в § 2 гл. I).
§8. ПРОСТОЕ СЛУЧАЙНОЕ БЛУЖДАНИЕ КАК МАРКОВСКАЯ ЦЕПЬ 845 По формуле Стирлинга из (8) находим, что Рц0"' ~ —, и, значит, ОО 124ой) = оо- (9) л=0 По симметрии аналогичное утверждение верно, конечно, не только для нулевого состояния, но и для любого состояния (/, /). Как и в случае d = 1, из (9) и теоремы 1 из § 5 получаем следующее утверждение. Простое двумерное симметричное случайное блужда- ние по множеству £ = Z2 = {0, ±1, ±2, ...}2 является возвратным. Пример 3. Оказывается, что для симметричного случайного блужда- ния по состояниям Е = Td = {0, ± 1, ±2, ... }d ситуация в случае d > 3 резко отличается от рассмотренных случаев d = 1 и d = 2. Именно, простое d-мерное симметричное случайное блуждание по множеству Е = Td = {0, ± 1, ±2, ...}d для всякого d^3 является невозвратным. Доказательство основано на том, что для d > 3 вероятности р^ имеют следующую асимптотику: при п —> оо (2n) c(d) НО) РП nd/2' где c(d) — некоторая положительная константа, зависящая от размерно- сти d. Приведем доказательство для случая d = 3, оставляя в качестве задачи случай d > 3. В силу предположения симметричности случайного блуждания «части- ца» с вероятностью 1/6 сдвигается за один шаг на единицу вдоль одного из шести направлений координатных осей: 1/6 1/6 1/6 i/е ! ii/6 Пусть «частица» выходит из состояния 0 = (0,0,0). Тогда, как и в случае d = 2, из формул для мультиномиального распределения (§ 2 гл. I) 11 - 9728
846 ГЛ. VIII. МАРКОВСКИЕ ЦЕПИ находим, что р£'= Е (z,/): 0^z+/^л (2/1)! /1\2п (i!)2(/!)2((n-i-/)!)2U/ =2_2пс" V Г п- 12f1V',< 2" 2L Li!/!(л-i-/)U \37 " (i,/):0<z+/^i ^Cn2-inCnin2,-n £ t!.!(„l-/)! (|)2" = Cn2-2nqn3-n, (11) (z,/): 0^z‘+/X« где n\ (j ~ 111с|л _______________ (/,/): +/ /! /! (fl — z и мы воспользовались тем, что очевидным образом п\ /1\2я z!/! (и — z -/)! \3/ Ниже будет установлено, что С ~ П [(а/3)Ц3 Применяя формулу Стирлинга, из (13) находим, что р су—2прп о—л Зл/3 GrtZ С2л^ 27Г3/2пЗ/2 ‘ Тем самым, из (11) следует, что f>£n,<oo (12) (13) (14) (15) и, следовательно, согласно теореме 1 из § 5, состояние 0 = (0,0,0) является невозвратным. Аналогичное, по симметрии, верно и для любого другого состояния из Е = Z3. Осталось лишь установить формулу (13). Пусть л! тлЦ, /) = тг-ут---:--Т7 и z*o = z‘o(fl), /о = /о(^) — те значения, где max mn(i, j) = mn(io, /0).
§8. ПРОСТОЕ СЛУЧАЙНОЕ БЛУЖДАНИЕ КАК МАРКОВСКАЯ ЦЕПЬ 847 Беря четыре точки (i0 - 1, /о), 0о+ 1, /о), Оо, /о - 1) и Цо, /о + 1) и пользуясь тем, что соответствующие значения mn(io - 1, /о), mn(io+ 1, /о), mn(io, jo~ О и /ИпО'о, /о+ 1) меньше или равны mn(io, /0), приходим к четырем неравенствам: п - io - 1 < 2/0 п - io + 1, п - jo - 1 < 2/0 п - jo + 1. Из этих неравенств можно заключить, что о о откуда и следует требуемая формула (13). Резюмируя разобранные случаи d = 1, 2, 3, сформулируем следующий результат Пойа (G. Polya). Теорема. В случае d — \ или d = 2 простое симметричное слу- чайное блуждание по множеству состояний Е = Zrf = {0, ± 1, ±2, ... }d является возвратным, а в случае d=3 (и d > 3) невозвратным. 2. Предшествующие примеры относились к простому случайному блу- жданию «во всем» пространстве Zd. В настоящем пункте будут рассмат- риваться примеры простых случайных блужданий, у которых фазовое про- странство Е строго меньше Zrf. При этом мы ограничимся случаем d = 1. Пример 4. Рассматривается простое случайное блуждание с фазовым пространством Е = {0, 1, 2, ...}, где «нулевое» состояние 0 является по- глощающим, и со следующим графом переходов: q q q Состояние 0 является здесь единственным положительно возвратным состоянием, образующим единственный неразложимый подкласс. (Все остальные состояния невозвратны.) По теореме 2 из § 6 существует и притом единственное стационарное распределение Q = (^o» •) с </о = 1 и qi-0, i = 1, 2, ... Рассматриваемое блуждание интересно тем, что доставляет пример, когда (при некоторых / и /) пределы lim р-^ существуют, но зависят от начального состояния, что, между прочим, говорит о том, что в этом примере случайного блуждания эргодическое распределение отсутствует. Ясно, что Pqq = 1 и р$ = 0 для j = 1, 2, ..., и простой подсчет пока- зывает, что —»0 для всех /,/ = 1,2, ... И
848 ГЛ. VIII. МАРКОВСКИЕ ЦЕПИ Покажем теперь, что для всех i = 1, 2, ... величины a(i) = lim р-^ су- шествуют и для них справедлива следующая формула: «в-(16) (1. р^<1- Из этой формулы видно, что в случае p>q («наличие тенденции дви- жения вправо») предельная вероятность lim p-Q перехода из состояния i (i = 1, 2, ...) в состояние 0 действительно зависит от /, убывая с ростом I геометрическим образом. Для доказательства формулы (16) прежде всего заметим, что поскольку состояние 0 является поглощающим, то р$ = £ и, следовательно, k^n предел lim р$ (=а(0) существует и равен До» т. е. интересующая нас ве- роятность есть вероятность того, что «частица», выходящая из состояния z, рано или поздно достигнет «нулевого» состояния. Для этих вероятностей тем же методом, что и в § 12 гл. I (см. также § 2 гл. VII), выводятся рекуррентные соотношения a(i) = pa(i + 1) + qa(i - 1), (17) при этом а(0) = 1. Общее решение этого уравнения имеет вид a(i) = a + b(q/p)\ (18) и условие а(0) = 1 дает одно условие на константы а и Ь\ а 4- b = 1. Если предположить, что q> р, то тогда в силу ограниченности a(z) сразу получаем, что й = 0, а значит, a(z)= 1. Этот результат вполне по- нятен, поскольку в случае q> р «частица» имеет тенденцию двигаться по направлению к нулевому состоянию. Если же р >q, то ситуация обратная — имеется тенденция хода вправо, и естественно поэтому ожидать, что тогда а(/)—*0, 4—>оо, (19) а значит, а = 0 и а(1) = (р/рУ. (20) Чтобы доказать это равенство, мы не будем устанавливать (19), а поступим иначе. Наряду с поглощающим экраном в точке 0 введем в рассмотрение поглощающий экран в целочисленной точке N. Вероятность того, что вы- ходящая из точки I «частица» достигнет нулевого состояния раньше, чем
§8. ПРОСТОЕ СЛУЧАЙНОЕ БЛУЖДАНИЕ КАК МАРКОВСКАЯ ЦЕПЬ 849 состояния N, обозначим a/v(/). Для вероятностей справедливы урав- нения (17) с граничными условиями a/v(0)=l, aN(N) = 0, и, как это уже было показано в § 9 гл. I, (21) Отсюда lim a/^(i) = (q/р)1, и, следовательно, для доказательства требуе- л/ мого результата (20) надо лишь показать, что a(0 = lim an(i). (22) N Интуитивно это понятно. Строгое же доказательство можно получить на следующем пути. Будем предполагать, что «частица» выходит из фиксированного состо- яния I. Тогда а(0 = Р/И), (23) где А — событие, состоящее в том, что найдется такое /V, что «частица», выходящая из точки /, достигнет нулевого состояния раньше, чем состоя- ния /V. Если AN — {«частица» достигнет 0 раньше, чем N}, оо тоЛ = U Л/v. Ясно, что An С Ан+\ и (оо X U Л/у 1 = lim Р,(Л/у). / N—»оо W=/+l / (24) Но aN(i) = P/(/4/v), так что (22) сразу следует из (23) и (24). Итак, если р >qt то предельные значения lim рю зависят от /. Если же P^q, то для любого i lim р$ = 1 и lim р^ =0, / > 1. Таким образом, в этом случае существует предельное распределение П= (тго, тл, ...) с 7rz = lirn р^\ не зависящими от /. При этом П= (1, 0, 0, ...). Пример 5. Рассмотрим простое случайное блуждание с фазовым про- странством Е = {0, 1,...,/V}, в котором «граничные» состояния 0 и N являются поглощающими'. р р р Р q q я я 0<р< 1
850 ГЛ. VIII. МАРКОВСКИЕ ЦЕПИ Здесь существуют два неразложимых положительно возвратных класса {0} и {N}. Все остальные состояния 1, 2, ..., А/ — 1 невозвратны. Из доказа- тельства теоремы 2 § 6 следует, что существует континуум стационарных распределений Q = (qo, qN), которые все имеют следующий вид: qi =... = <7д/_| =0 и qo = a, q^—b с а^О, Ь^О и а + b = 1. Согласно результатам п. 2 § 9 гл. I, !im р<"> = < р = <7=1/2, (25) lim р^ = 1 - lim pW и lim р-^ = 0, 1 j N - 1. п l!}/ п 1и п Ч Подчеркнем, что здесь, как и в предшествующем примере, предельные значения lim рФ переходных вероятностей зависят от начального состо- яния. Пример 6. Рассмотрим простое случайное блуждание с фазовым про- странством £* = {0, 1, ...} и отражающим экраном в «нулевом» состоя- нии: q q q 0<р<1 Поведение рассматриваемой цепи существенно зависит от р и q. Если р >q, то блуждающая «частица» имеет тенденцию ухода вправо и наличие отражающего экрана в «нулевом» состоянии этому только спо- собствует, в отличие от блуждания в примере 4, где в «нулевом» состоянии могло произойти «залипание». Все состояния в этом случае невозвратны; pff —> 0, /г —► оо, для всех /, / 6 Е; стационарного и эргодического распре- делений не существует. Если p<q,4Q имеется тенденция движения влево и в этом случае цепь возвратна. Таковой же цепь будет и при p = q. Напишем теперь систему уравнений (ср. с (12) в § 6), которой должно подчиняться стационарное распределение Q = (qo, q\, Цъ — ЦхР + ЦзЦ,
§8. ПРОСТОЕ СЛУЧАЙНОЕ БЛУЖДАНИЕ КАК МАРКОВСКАЯ ЦЕПЬ 851 Отсюда <71 =<7(<71 +<72), <72 = <7(<72 + <7з), и, значит, Если p = q, то тогда qi=q2=... и, следовательно, неотрицательного ОО решения приведенной системы, удовлетворяющего условиям 52 <7/ = 1 и /=о <7о = <71<7» не существует. Значит, в случае p — q — X/l стационарного распределения не суще- ствует. Все состояния цепи в этом случае возвратные. оо Наконец, пусть р <q. Из условия 52 <7/ = I находим, что /=о <71[o1 + f + (f)2+-] = 1- Отсюда q - р q - Р и 4'1 = д-р 2q Пример 7. У рассматриваемого в этом примере простого случайно- го блуждания фазовое пространство Е = {0, 1, ..., N} и состояния 0 и N являются отражающими экранами: q q q Р Р 0<р< 1 Состояния цепи образуют здесь один неразложимый класс. Они яв- ляются положительно возвратными с периодом d = 2. По теореме 2 из § 6, у рассматриваемой цепи существует и единственно стационарное N распределение Q=(<7o, Ц\, •••» 4nY Решая систему уравнений ^,= 52 QiPij /=0
852 ГЛ. VIII. МАРКОВСКИЕ ЦЕПИ N с условием 52 Qi = h Qj > О, / Е £» находим, что /=о и <7о = 41<Л Qn =Qn-\Q‘ Эргодическое распределение отсутствует — это следует из теоремы 3 § 6 и того факта, что у рассматриваемой цепи период d = 2. Можно и непосредственно убедиться в том, что здесь нет эргодического распреде- ления. Пусть, например, N = 2: >о2 0<р<1 Тогда видно, что р^ = 1, но =0. Так что lim не существует. В то же с^мое время стационарное распределение Q = (<7o, <7ь?2) есть, и, как следует из (26), оно имеет вид: ^о=2^ = 2’ q2==2p' 3. Из материала, изложенного в книге, видно, что простое случайное блуждание является классической моделью, на которой «отрабатыва- лась» вероятностная идеология, оттачивалась вероятностная техника и бы- ли открыты многие вероятностно-статистические закономерности. Так, для сумм Хп = £1 +... +£rt, п 1, независимых бернуллиевских случайных ве- личин принимающих всего лишь два значения и, следовательно, приводящих к тому, что X = (Хп)п^[ есть простое случайное блуждание (являющееся марковской цепью), были открыты такие закономерности, как закон больших чисел (гл. I, § 5), теорема Муавра—Лапласа (гл. I, § 6), закон арксинуса (гл. I, § 10) и многое другое. В этом пункте мы рассмотрим две дискретные модели диффузии, являющиеся хорошей иллюстрацией того, как с помощью простого слу- чайного блуждания можно описывать реальные физические процессы. А. Модель Эренфестов. Как и в примере 7, будем рассматривать простое случайное блуждание с фазовым пространством Е = {0, 1, ...N} и отражающими экранами в состояниях 0 и /V.
§8. ПРОСТОЕ СЛУЧАЙНОЕ БЛУЖДАНИЕ КАК МАРКОВСКАЯ ЦЕПЬ 853 Переходные вероятности задаются в этих состояниях формулами poi = = 1, Pn,n-i = 1. В других состояниях i = 1, ...» N — 1 возможны лишь пе- реходы на один шаг влево или вправо с вероятностями В 1907 г. П. и Т. Эренфесты, [124], пришли к марковской цепи с такими переходными вероятностями, рассматривая следующую модель стати- стической механики, описывающую перемещение молекул газа из одной камеры (А или В) в другую (В или А) через малое отверстие в мембране, соединяющей эти камеры. Предполагается, что общее число молекул в рассматриваемых двух ка- мерах равно N и на каждом шаге их перемещение из одной камеры в другую осуществляется следующим образом: случайным образом (с вероятностью \/N) выбирается одна из молекул и переводится в другую камеру. Причем на каждом шаге выбор молекулы для перемещения происходит независимо от предыстории. Пусть Хп — число молекул, скажем, в «первой» камере А в момент вре- мени п. Для описанного механизма перемещения молекул имеем (задача 2) свойство марковости: P(^Gi+i== j |%о ~ *о, ^1 = А, • ♦ •, Хп— \ = in-j, Хп = i) = = P(Xrt+1=/|X„ = 0 (28) и к тому же P(Xn+{=j\Xn = i) = pih (29) где pij были определены в (27). Для этой модели существует стационарное распределение Q = = (<7о, ...,<7w), определяемое (задача 3) следующей биномиальной формулой: . i=oo.......N- (30) Все состояния рассматриваемой цепи являются возвратными (задача 4). Интересно отметить, что максимальное значение вероятностей qj, j — = 0, 1, ..., ?V, скажем, при четном W, достигается на «центральном» зна- чении j = N/2, что соответствует наиболее вероятному состоянию «равно- весия», когда число молекул в каждой камере одно и то же. Разумеется, это устанавливающееся со временем «равновесие» носит вероятностно-статистический характер (описываемый приведенным выше распределением Q).
854 ГЛ. VIII. МАРКОВСКИЕ ЦЕПИ Отметим также, что на интуитивном уровне возможность «стабили- зации» числа молекул по камерам довольно-таки понятна: чем дальше состояние i от «центрального» значения, тем (в соответствии с (27)) боль- ше вероятность того, что движение будет происходить по направлению к этому значению. В. Модель Д. Бернулли—Лапласа. Рассматриваемая модель, сходная в определенном смысле с моделью Эренфестов, была предложена Даниилом Бернулли (1769 г.) и затем про- анализирована Лапласом (1812 г.) в связи с описанием процесса обмена частицами двух несжимаемых жидкостей. Более точно, предполагается, что имеются два контейнера А и В, со- держащие вместе 2N частиц, из которых N частиц «белого» цвета и N частиц «черного» цвета. Будем говорить, что «система» находится в состоянии /, где 1еЕ — = {0, 1, ...» М» если в контейнере А содержится i частиц «белого» цвета и N — I — «черного». Предположение «несжимаемости» означает, что в рассматриваемом состоянии I в контейнере В содержится N - i частиц «белого» цвета и / частиц «черного» цвета. Общее число частиц в каждом контейнере остается постоянным и равным Л/. На каждом шаге п из каждого контейнера случайным образом (т. е. с вероятностью 1/N) выбирается по частице и эти частицы меняются ме- стами. Предполагается, что эти процедуры (случайного) выбора частиц из контейнеров проводятся независимым образом и последующие процедуры, проводимые по той же схеме, не зависят от предшествующих этапов. Пусть Хп — число частиц «белого» цвета в контейнере А. Тогда опи- санный механизм обмена частицами приводит к выполнению марковского свойства (28), при этом в формуле (29) переходные вероятности р^ опре- деляются следующими выражениями (задача 5): I / z \ 2 А' = П|-Х?). /=< + 1. <3|> И pij = о, если |/ - jI > 1, i = 0, 1, ..., /V. Как и в модели Эренфестов, все состояния здесь возвратные. Ста- ционарное распределение Q = (#o, ...» Qn) существует, единственно и задается (задача 5) формулами )2 Z^0’1.....N- (32)
§8. ПРОСТОЕ СЛУЧАЙНОЕ БЛУЖДАНИЕ КАК МАРКОВСКАЯ ЦЕПЬ 855 4. В начале этой главы было сказано, что ее основной интерес свя- зан с вопросами «асимптотического поведения (с ростом п) систем с от- сутствием последействия». Материал предшествующих параграфов пока- зывает, что это поведение исследовалось с точки зрения того, как при больших п ведут себя переходные вероятности pff для цепей Маркова со счетным множеством состояний E = {i, j, ...} и, в частности, для простого случайного блуждания, в котором переходы возможны лишь в соседние состояния. Большой интерес представляет исследование аналогичных вопросов и для цепей Маркова с более сложными пространствами состояний. См. по этому поводу, например, [75], [117]. 5. Рассмотренные выше две модели (Эренфестов и Бернулли—Лапла- са) были названы дискретными моделями диффузии. Дадим некоторое пояснение этому названию, рассматривая предельное поведение простого случайного блуждания в /?. Пусть Srt =£1 +...+ £„, /О 1, So = 0, где £i, £2, — последовательность независимых одинаково распределенных случайных величин с Е£, =0, D£z = 1. Положим Х$ =0 и / 1 м \ y/И \ yfn / V \ V /?=1 / Понятно, что последовательность (0, Хуп, Х%/п,...» Х^) может рассматри- ваться как простое случайное блуждание в моменты времени Д, 2Д, ..., 1 с Д = \/п и скачками порядка \/Д (ДХ£д = = Как уже отмечалось в замечании 4 § 8 гл. VII, это случайное блуждание Хп = (X")o^i таково, что все его конечномерные распределения слабо сходятся к конечномерным распределениям винеровского процесса (бро- уновского движения) W = Но, более того, там же говорилось, что имеет место и функциональная сходимость, т. е. слабая сходимость распределений процессов Хп к распределению процесса W (в том же самом смысле, что и сходимость эмпирических процессов к броуновскому мосту; см. п. 4 § 13 гл. III). Винеровский процесс является типичным (и, более того, основным) примером диффузионных процессов, [69, т. 2], [21], [131]. Это обстоятельство и объясняет, почему процессы типа Хп и те, которые возникают в моделях Эренфестов и Бернулли—Лапласа, естественно называть дискретными моделями диффузии. 6. Задачи. 1. Доказать формулу Стирлинга (п\ ~ х/2тгп/1+|/2е“'1), воспользовав- шись следующими вероятностными соображениями ([106], задача 27.18). Пусть Sn =Х\ +... + ХЛ, л>1, где Х\9 %2» ••• ~ независимые случайные величины, распределенные по закону Пуассона с параметром А= 1. Дока-
856 ГЛ. VIII. МАРКОВСКИЕ ЦЕПИ жите последовательно, что (а) (Ь) Р / Sn - л \ ~ A fn-k\ nk _ n. \ \/n / e \ y/n ) k\ n\ v Zf=O Law[(^) ] “>Law[/V“], где N — нормально распределенная случайная величина; (с) (d) 1 ЕЛГ = -L; 1Л у/п ) J х/2тг п1~у/2тгпп+1/2е"п. 2. Установить свойство марковости (28). 3. Доказать формулу (30). 4. Доказать, что все состояния марковской цепи в модели Эренфестов являются возвратными. 5. Проверить справедливость формул (31) и (32). § 9. Задачи об оптимальной остановке для марковских цепей 1. Рассматриваемый ниже материал тесно примыкает к § 13 гл. VII, где излагался «мартингальный» подход к решению задач об оптимальной остановке произвольных стохастических последовательностей. Основной акцент в настоящем параграфе будет сделан на тот случай, когда сто- хастические последовательности порождаются функциями от состояний марковских цепей, что позволяет общим результатам из § 13 гл. VII придать простую и наглядную форму и интерпретацию. 2. Будем предполагать, что X = (Хп, PJ — однородная марковская цепь с дискретным временем и фазовым пространством (Е, S}. Предполагается также, что пространство (Q, <F), на котором опреде- лены величины Хп = Хп(ш), п^О, является координатным (как в п. 6 § 1) и сами величины Хп(си) заданы координатным образом: если си = (%о» ...)€ eQ, то Хп(ш) = хп. Под & понимается а-алгебра cr(IJ #п), где ^л = = а(хо, ...» хп), п^О, Замечание. В «общей теории оптимальных правил остановки» вовсе нет надобности требовать, чтобы Q являлось координатным пространс- твом. Но тем не менее и в «общей теории» надо все же предполагать, что оно достаточно «богато». (См. подробности в [78].)
§9. ЗАДАЧИ ОБ ОПТИМАЛЬНОЙ ОСТАНОВКЕ 857 Нам же предположение «координатности» облегчит рассмотрения, в частности, в связи с обобщенным марковским свойством (теорема 1 в § 2), которое было приведено именно при этом допущении. Как и в предыдущих параграфах, через Р(х; В) обозначаем переходную функцию рассматриваемой цепи (Р(х; В) = Рх{Х\ GВ}), х еЕ, В Пусть Т — оператор перехода за один шаг, действующий на ^-из- меримые функции f = f(x) со свойством Ех | /(Xi) | < оо, х е Е, по формуле (Г/)(х) = Ех/(Х!) (= $ f(y)P(x\ dy)\ (1) \ Е / (Для простоты записи вместо (Т/)(х) пишут Tf(x). Аналогичные соглаше- ния применяются и в других подобных случаях.) 3. Чтобы сформулировать задачу об оптимальной остановке для мар- ковской цепи X, предположим, что задана некоторая ^-измеримая дей- ствительная функция g = g(x) такая, что Ex|g(Xn)| < оо, хеЕ, для всех л > О (или 0 п V, если a priori существует некоторое «терминальное» значение N, до которого нужно будет принять «оптимальное решение»). Пусть OTq — класс марковских моментов т = т(ш) (относительно филь- трации со значениями в множестве «моментов остановки» {О, ' Следующая теорема является «марковской» версией теорем 1 и 2 из § 13 гл. VII. Теорема 1. Пусть для O^n^N и хеЕ «цены» sn(x)= sup Exg(XT), (2) где Ех — усреднение по мере Рх. Пусть rg = min{0 k п: sn-k(Xk) = £(%*)} (3) и Qg(x) = max(g(x), Tg(x)). (4) Тогда имеют место следующие утверждения. 1) Момент rg является оптимальным моментом остановки в классе 9Jig: Exg(Xrn) = sn(x) (5) для всех хеЕ. 2) Функции sn(x) могут быть найдены по формуле sn(x) = Qng(x), хеЕ, (6) где Q°g(x) — g(x) для п = 0.
858 ГЛ. VIII. МАРКОВСКИЕ ЦЕПИ 3) Функции sn(x), подчиняются рекуррентным соотноше- ниям (sq(x) = g(x)) sn(x) = max(g(x), Tsn~i(x)), x e£, 1 ^n^N. (7) Доказательство. Воспользуемся результатами теорем 1 и 2 из § 13 гл. VII, примененными к функциям fn = g(Xn), O^n^N. С этой целью зафиксируем некоторое «начальное» состояние х е Е и рассмотрим введенные в упомянутом § 13 функции V„ и . При этом, чтобы подчеркнуть зависимость от начального состояния, будем писать V„ = Vn(x). Таким образом, VnN(x)= sup Exg(XT), (8) тСЗДу где — класс всех марковских моментов (относительно фильтрации принимающих значения в множестве «моментов остановки» {п, п 4-1, ..., N}. Функции v„ определены (в соответствии с (6) § 13 гл. VII) рекуррент- ным обрфом: v% = g(XN), v% = max(g(Xn), Ex(u*+11&„)). (9) В силу обобщенного марковского свойства (теорема 1 § 2) (Рх-п. н.) Ex(v# |^-0 = Е,(№) = E^_,g(Xi), (Ю) где E^-.gPCi) понимается (см. § 2) следующим образом: берется функ- ция V’(Jc) = EJtg(Xi), т. е. $(x) = (Tg)(x), и по определению считается, что Е^_, g(*i) = <WGv-i) = (W^). Таким образом, — g(Xu) и =max(g(^_1), (Tg)(XN-i)) = (Qg)(XN-i). (11) Продолжая аналогичным образом, находим, что для всех О^п - 1 u^ = (Qw-ng)(X„) (12) и, в частности, = (QN g)(Xo) = (QN g) (X) (Рх-п. н.). Согласно (13) из § 13 гл. VII, vfl = V^. Поскольку = Vq (x) = Sn(x), то тем самым Sm(x) = (QN g)(x), что и доказывает формулу (6) для n — N (аналогично и для любого п <Л/). Из (6) и определения оператора Q получаем рекуррентные формулы (7). Покажем, что определенный формулой (3) момент (при n = N) является оптимальным в классе 9JIq (аналогично и для n<N в классах ЯЛд).
§9. ЗАДАЧИ ОБ ОПТИМАЛЬНОЙ ОСТАНОВКЕ 859 Согласно теореме 1 § 13 гл. VII, оптимальный момент То = min{0 S? k < N: = g(Xk)}. Из (12) и установленного факта, что sn(x) = (Qng)(x) для любого и>0, находим, что ^ = «?A'"*g)(XA) = syV-A№). (13) Следовательно, = min{0 k N: sN_k(Xk) = g(Xk)}, (14) что и доказывает оптимальность этого момента в классе ЯЛд. □ 4. Обозначим ^ = {хеЕ: sN-k(x) = g(x)}, (15) CNk=E\^ = {xeE-. sN_k(x)>g(x)}. (16) Тогда из (14) заключаем, что т$(ш) = min{0 k N: Xk(w) е D^}, (17) и по аналогии с множествами Dtf и (в П), введенными в п. 6 § 13 гл. VII, множества Е>о СЕ^С...СЕ)^ = Е, (18) C5'oCff2...2C^ = 0 (19) можно называть соответственно областями «остановки» и «продолже- ния» наблюдений (в £). Отметим специфику рассматриваемых задач об оптимальной остановке для марковских цепей. В отличие от общего случая, в марковском случае ответ на вопрос «прекращать наблюдения или продолжать» решается по состояниям самой марковской цепи (tq = min{0^ k ^А/: Xk eD^}), иначе говоря, по тому, где находится блуждающая «частица». При этом с прин- ципиальной точки зрения полное решение задач об оптимальной остановке (т. е. описание «цены» Sn(x) и оптимального момента т^) находится из рекуррентных «уравнений динамического программирования» (7) после- довательным отысканием функций $0(х) = £(х), $i(x), ..., s^(x). 5. Обратимся теперь к задаче об оптимальной остановке в предпо- ложении, что tG2Rq°, где SDlg0 — класс всех конечных марковских мо- ментов. (В случае tGSDIq моменты r^N\ в случае же моменты г = < оо для всех cu G Q.) Итак, пусть «цена» s(x)= sup Exg(Xr). (20)
860 ГЛ. VIII. МАРКОВСКИЕ ЦЕПИ Чтобы здесь не возникали вопросы существования математических ожи- даний Exg(XT), можно предположить, скажем, что Ех(sup £“(%„)} <00, хеЕ. (21) Понятно, что так заведомо будет, если функция g = g(x) ограничена (|g(x)| С, хе£), и, в частности, условие (21) будет выполнено, если пространство Е состояний цепи конечно. Из определений «цен» Эц(х) и $(х) следует, что для всех х е Е sN(x)^sN+\(x)^...^s(x). (22) Естественно, конечно, рассчитывать на то, что lim $jv(x) совпадает с /V—>оо s(x), И если это так, то тогда, совершая предельный переход в (7), найдем, что «цена» s(x) должна удовлетворять уравнению s(x) = max(g(x), 7s(x)), х G Е. (23) Из этого уравнения, между прочим, следует, что для s(x), х е Е, вы- полнены ^вариационные неравенства» $(х) > g(x), (24) s(x) > 7s(x). (25) Неравенство (24) говорит о том, что «цена» $(х) является мажорантой функции g(x). Второе неравенство (25) означает, в соответствии с опреде- лениями общей теории марковских процессов, что функция $(х) является эксцессивной, или супергармонической. Таким образом, если для $(х) можно было бы установить справед- ливость соотношения (23), то мы бы заключили, что «цена» $(х) есть эксцессивная мажоранта функции g(x). Отметим теперь следующее обстоятельство. Если какая-то функция и(х) есть эксцессивная мажоранта функции g(x), то тогда, очевидно, спра- ведливы «вариационные неравенства» у(х) > max(g(x), 7Ъ(х)), хбЕ. (26) Оказывается, однако, если предположить дополнительно, что функция и(х) является наименьшей эксцессивной мажорантой, то тогда в (26) будет выполняться равенство, т. е. и(х) будет удовлетворять уравнению u(x) = max(g(x), 7Ъ(х)), хб£. (27) Лемма 1. Всякая наименьшая эксцессивная мажоранта v(x) функции g(x) удовлетворяет уравнению (27).
§9. ЗАДАЧИ ОБ ОПТИМАЛЬНОЙ ОСТАНОВКЕ 861 Доказательство довольно просто. Ясно, что для и(х) справедливо неравенство (26). Обозначим ui(x) = max(g(x), Tv(x)). Поскольку t/|(x)> g(x) и Oj (х) и(х), х G £, то 7Ъ1 (х) 7Ъ(х) max(g(x), 7b(x)) = v\(х). Следовательно, ui(x) есть эксцессивная мажоранта функции g(x). Но о(х) — наименьшая эксцессивная мажоранта. Значит, v(x)^oi(x), т. е. v(x) max(g(x), Tv(x)), Вместе с (26) это доказывает требуемое равен- ство (27). □ Проведенные предварительные рассмотрения, основанные на предпо- ложении s(x) = lim Sn(x) и приведшие к соотношениям (23), а также А/—»оо утверждение леммы 1 подсказывают путь к характеризации «цены» $(х) — по-видимому, это есть наименьша эксцессивная мажоранта функ- ции g(x). И действительно, справедлива следующая Теорема 2. Пусть функция g = g(x) такова, что Ex [sup g~(Xrt)l < L п J < оо, х е Е, Тогда имеют место следующие утверждения, (а) Цена s =$(х) есть наименьшая эксцессивная мажоранта функ- ции g = g(x). (b) Цена s(x) совпадает с lim s^(x) = lim QN g(x) и удовлетво- N—+oo N—*oo ряет «уравнению динамического программирования Вальда—Велл- мана» s(x) = max(g(x), 7s(x)), х G Е. (с) Если Ех £sup | g(Xn)|j < oo, x G E, то для каждого е > 0 момент г* = inf{zz >0: s(Xn) < g(Xn) + 5} является е-оптимальным в классе SJtg0, т. е. s(x) - е < Ех g(XT*), х G Е, Если Рх{т0* <оо}= 1, хеЕ, то момент Tq будет оптимальным (0-оп- тималъным), т, е, s(x) = Exg(XTS), xgE. (28) (d) Если множество Е конечно, то момент принадлежит OTg° и является оптимальным. Замечание. Вполне может случиться, что момент = inf{n > 0: s(Xn) = = g(Xn)} с положительной вероятностью принимает для некоторых состо- яний xg£ значение +00, Px{tq=oo}>0. (Так бывает даже в случае
862 ГЛ. VIII. МАРКОВСКИЕ ЦЕПИ счетного множества состояний; задача 1.) В этой связи надо было бы условиться о том, что следует понимать под выражением Exg(XT), когда т принимает и значение +оо, поскольку «значение Х^» не было определено. Часто по определению полагают ^(Xoo) = lim g(Xn) (см. п. 1 § 13 гл. VII и [78]). Есть и другая возможность: вместо g(XT) рассматри- вать g(XT) 1(т <оо). Тогда, если обозначить Wig° класс всех марковских моментов, принимающих, быть может, и значение +оо, то «цена» s(x)= sup Exg(XT)/(r<oo) (29) т€®1~ определена и тем самым становится возможным задачу об оптимальной остановке рассматривать и в классе Wig0. Доказательство теоремы 2 приведем здесь лишь для случая ко- нечного множества Е. В этом случае оно сравнительно просто и хорошо проясняет возникновение эксцессивных функций в задачах об оптимальной остановке. По поводу доказательства в общем случае см. [78], [102]. (а) Покажем, что функция $(х) является эксцессивной, т. е. s(x) > 7s(x), хеЕ. Очевидно, что для каждого состояния у еЕ и е > 0 найдется такой (Р^-п. н.) конечный (зависящий, вообще говоря, от е>0) момент ry е Wlg°, что E,g(XrJ >5(^-8. (30) По этим моментам ту, у^Е, построим новый момент т, который определя- ет, образно говоря, следующую «стратегию» выбора момента «остановки». Пусть «частица» находится в начальный момент в состоянии хеЕ. «Остановки» в этом состоянии не происходит, и заведомо совершается одно наблюдение. Пусть в момент п = 1 «частица» оказывается в состоянии у^Е. Тогда «стратегия», характеризуемая моментом т, состоит в том, чтобы считать, что «жизнь частицы» как бы начинается заново, а правило, определяющее ее остановку, управляется моментом ту. Формально же момент т определяется следующим образом. ПустьуеЕ. Рассмотрим событие {си: ту(ш) = п}, п^О. Поскольку ту — марковский момент, то это событие принадлежит &п. Мы предполага- ем, что пространство Q является координатным, порожденным после- довательностями cu = (хо, Xi, ...) с Х[ е Е, и = <т(си: хо, ...» хп). Отсю- да вытекает, что множество {си: ту(ш) = п} может быть записано в ви- де {cu: (Xq(w), ..., Хп(си)) е Еу(п)}, где Ву(п) есть некоторое множество в <£п+[ (п+ 1 раз). (См. также теорему 4 в § 2 гл. II.)
§9. ЗАДАЧИ ОБ ОПТИМАЛЬНОЙ ОСТАНОВКЕ 863 Момент f = f(cu) определяется так, что он принимает значения вида п + 1 с О 0 и при этом т (си) = п 4-1 на множестве = У~^{си: Х\(си) = у, (Х1(о>), Хл+1(си))€Ву(п)}. уеЕ (С наглядной точки зрения момент т может быть охарактеризован следу- ющим образом: в любом состоянии х в момент п = 0 заведомо делается наблюдение; если при этом Х\ = у, то далее используется момент ту.) Поскольку 52 Ап = 0, то момент т = т (си) действительно определен для всех cugQ и является марковским (задача 2). Из данной конструкции, обобщенного марковского свойства (форму- ла (2) из § 2) и (30) находим, что для любого х е Е Exg(Xf) = Е Е Е .................................. *"+> = г> S(z) = п^Ь у$Е zeE = Е Е Е =У> (*о, • • •, хп) е Ву(п), Хп = z} g(z) = л>о yeE zeE = Е Е Е ₽* W...............х„) е Ву(п), Хп = z} g(z) = п^О у ЕЕ zEE = Е Рх!>Е!> S(Xt„) > 12 Р*№Ь ~ £) = 75 W “ £- УЕЕ уЕЕ Тем самым s(x) = Ех g(Xr) > Ts(x) -г, х е £, и, в силу произвольности е > О, s(x) > 7s(x), х G Е, что и доказывает эксцессивность функции s = $(х), х еЕ. Доказанное свойство эксцессивности (супергармоничности) сразу при- водит к следующему важному результату. Следствие 1. Для каждого хеЕ процесс (последовательность) s = (s(Xn))n^ (31) является (относительно Рх-вероятности) супермартингалом. Из теоремы 1 § 2 гл. VII, примененной к этому супермартингалу, заклю- чаем, что для всякого момента остановки г G SHg0 справедливо неравенство s(x) > Exs(XT), xgE, (32)
864 ГЛ. УШ. МАРКОВСКИЕ ЦЕПИ и если а и т — два марковских момента из OTq° такие, что (Рх-п. н., хеЕ), то Exs(Xa)>Exs(Xr), хеЕ. (33) (Заметим, что в рассматриваемом случае все условия упомянутой теоре- мы 1 из § 2 гл. VII выполнены, поскольку пространство Е конечно.) Из (32) получаем Следствие 2. Пусть в задаче об оптимальной остановке (20) функция g = g(x), хеЕ, является эксцессивной (супергармониче- ской). Тогда момент Tq =0 является оптимальным моментом оста- новки. (Ь) Покажем, что s(x) = lim S/v(x), х е Е, N Так как Sh(x) ^S/v+j(x), то предел lim Sn(x) существует. Обозначим его /V s(x). Поскольку Е — конечно и для sn(х), N 0, выполнены рекуррентные соотношения $tf(x) = max(g(x), TsN^(x)), то, переходя в них к пределу (N —> оо), находим, что s(x) = max(g(x), Ts(x)). Отсюда следует, что $(х) есть эксцессивная мажоранта функции g(x). Но s(x) — наименьшая эксцессивная мажоранта. Значит, s(x)^s(x). В то же самое время очевидно, что поскольку Sn(x)^s(x) для любого V^O, то s(x)^s(x). Следовательно, s(x) = s(x), что и доказывает требуемое утверждение (Ь) теоремы. (с, d) Покажем, наконец, что момент 7o* = inf{/0 0: s(X„) = £(%„)}, (34) т. е. момент 7o* = inf{zOO: Хп еЮ>*} (35) первого попадания в множество (остановки) D* = {х е Е: s(x) = g(x)}, (36) является (в случае конечного множества Е) оптимальным в классе 9Jlg°. С этой целью прежде всего заметим, что множество D* не пусто, по- скольку к нему заведомо принадлежат те значения х, где g(x) = max g(x). хеЕ В этих состояниях s(x) = g(x), и понятно, что оптимальная стратегия долж- на состоять в том, чтобы в этих состояниях х сразу «останавливаться». Именно это и предписывает момент остановки rfi.
§9. ЗАДАЧИ ОБ ОПТИМАЛЬНОЙ ОСТАНОВКЕ 865 Рассматривая момент Tq с точки зрения оптимальности в классе DJlg0, нужно прежде всего убедиться в том, что этот момент принадлежит этому классу, т. е. что РДт0*<оо}=1, хе£. (37) Сделанное предположение конечности множества состояний Е действи- тельно позволяет это установить. (В случае счетного множества Е это, вообще говоря, уже не так; задача 1.) Для доказательства заметим, что интересующее нас событие {tq = оо} совпадает с событием А = Q {Хп ^D*}. Так что надо показать, что РХ(Л) = 0 для всех х е Е. Если D* = £, то это, очевидно, так. Пусть D* /£. В силу конечности множества £ найдется такое а>0, что g(y) s(y) — а для всех у е £ \ D*. Тогда для любого т Е SDTg0 оо =22 52 рлт=«• хп=у} g<y)= л=о уеЕ оо оо = 22 52 px{r = n,Xn=y}g(y) + ^ 52 рх{г = п,Хп=у} g(y)^ л=0 //GID* n=0 оо оо ^22 52 px{r = n,Xn=y}s(y) + ^2 22 Px{r = n,Xn = y}(s(y)-a)^ п—о я=о уеЕ\р>* ^Exs(XT)-aPx(A)^s(x)-aPx(A\ (38) где последнее неравенство следует из эксцессивности (супергармонично- сти) функции $(х) и справедливого для нее неравенства (32). Беря в левой части (38) sup по всем refOTg0, приходим к неравенству s(x) s(x) — аРх(Л), х е £. Но |$(х)| <оо, а>0. Поэтому РХ(Л) = О, хе£, что и доказывает конечность момента tq . Докажем теперь оптимальность этого момента в классе OTq°. По определению Tq s(XT*) — g(XT*). (39) Имея в виду это свойство, рассмотрим функцию 7(х) = Exg(Xr*) = = Exs(Xr*). Ниже мы покажем, что эта функция у(х) 1) является эксцессивной; 2) мажорирует функцию g(x): у(х) g(x), х е £. 12 - 9728
866 ГЛ. VIII. МАРКОВСКИЕ ЦЕПИ Очевидным образом имеет место также неравенство 3) 7(Х) s(x). Из 1) и 2) будет следовать, что 7(х) есть эксцессивная мажоранта функции $(х), которая, в свою очередь, является наименьшей эксцес- сивной мажорантой функции g(x). Поэтому в силу 3) 7(x) = s(x), хбЕ, и тогда $(х) = Ех£С¥т-), хеЕ, что и будет доказывать требуемую оптимальность Tq в классе £XHg°. Докажем свойство 1). Обозначим f = inf{n> 1: Хп eD*}. Этот момент является марковским, Tq ^f, т е и поскольку функция s(x) является эксцессивной, то в силу свойства (33) Exs(Xf)^Exs(XT*), хеЕ. (40) Далее, с учетом обобщенного марковского свойства (см. (2) в теореме 1 § 2) имеем оо .... Х„_IT, = </}$(//) = л=1 у ею* = Е £ £ PxzPA^^,...,Xn-i^\Xn_l=y}s(y) = п-\ //ею* zeE = 5>x2Ezs(XTo.). (41) zeE Отсюда в силу (40) находим, что Е^о-)> £ Px2E2s(Xt.), zeE т. е. 7(*)>£a«7(z). хеЕ’ ZEE что и доказывает эксцессивность функции у(х). Осталось лишь показать, что функция у(х) мажорирует g(x). Если х е D*, то Tq = 0 и, очевидно, у(х) = Exg(Xr*) = g(x). Рассмотрим множество Е \D* и положим Eq = {х е Е \D*: 7(х) < g(x)}. Это множество Eq является конечным, и пусть Xq — то значение, на кото- ром достигается максимум функции g(x) — 7(х), рассматриваемой на мно- жестве Eq'. g(Xo) - 7U0) = max(g(x) - 7W). xe£r
§9. ЗАДАЧИ ОБ ОПТИМАЛЬНОЙ ОСТАНОВКЕ 867 Введем новую функцию H*)=7W+[£(*o)-7(*o)L хеЕ- (42) Ясно, что эта функция является эксцессивной (как сумма эксцессивной функции и константы) и 7(х) - g(x) = [g(x$) - 7(дф] - [ g(x) - 7(х)] > О для всех хеЕ. Тем самым 5(х) является эксцессивной мажорантой функ- ции g(x), и, значит, 5(x)>s(x), поскольку функция s(x) есть наименьшая эксцессивная мажоранта функции g(x). Отсюда следует, что T(x0*)>s(x0*). Но, согласно (42), 7(Xq ) = g(x^) и, следовательно, g(xj) >s(x$). Поскольку s(x)>g(x) для всех хеЕ, то ^(xq) = s(Xq), что означает, что точка Xq принадлежит множеству D*. По предположению же х* е Е \D*. Полученное противоречие показывает, что множество E\D* = 0. От- куда вытекает, что 7(х) > g(x) для всех хеЕ. □ 6. Приведем некоторые примеры. Пример 1. Будем рассматривать простое случайное блуждание с дву- мя «поглощающими» состояниями 0 и /V, описанное в примере 5 § 8. При этом будем считать р = ^ = 1/2 (симметричное блуждание). Если функ- ция 7(х), хе£ = {0, 1, ..., N}, является для рассматриваемого случайного блуждания эксцессивной, то для всех х = 1, ..., N — 1 7(х)> £7(*-1)+^7(*+1)- (43) Пусть задана некоторая функция g = g(x), х е {0, 1,..., N}. Поскольку состояния 0 и N являются поглощающими состояниями, то функцию s(x) надо искать среди всех функций 7(х), подчиняющихся условию (43) и граничным условиям 7(0) = g(0), 7(/V) = g(N). Условие (43) означает выпуклость функции 7(х) (на множестве {1,2, ..., /V — 1}). Тем самым можно сделать следующий вывод: в задаче s(x) = = sup Exg(XT) «цена» s(x) есть наименьшая выпуклая функция, подчи- няющаяся граничным условиям s(0) = g(0), s(N) = g(N). С наглядной же точки зрения для определения значений функции $(х) надо поступить сле- дующим образом. «Накинем» на значения функции g(x) «туго натянутую нить». На рис. 42 эта «нить» будет проходить через точки (0, а), (1, Ь), (4, с), (6, d), где состояния 0, 1, 4, 6 образуют множество остановки D*. В этих точках s(x) = g(x). В остальных состояниях х = 2, 3, 5 требуемые 12*
868 ГЛ. VIII. МАРКОВСКИЕ ЦЕПИ значения $(х) определяются линейной интерполяцией. Аналогичным обра- зом значения «выпуклой оболочки» $(х) определяются для всех состояний х 6 Е и в общем случае. Рис. 42. Функция g(x) (пунктиром) и ее выпуклая оболочка s(x), х = 0, 1, ...» 6. Пример 2. Пусть, как и в примере 7 из § 8, рассматривается простое случайное блуждание (с p—q= 1/2, т. е. симметричное) по множеству состояний £ = {0, 1,..., N} с отражающими экранами в 0 и N. Рассматри- ваемое блуждание является положительно возвратным. Отсюда следует, что в задаче об оптимальной остановке s(x) = sup Exg(Xr) оптимальное правило имеет весьма простую и естественную структуру — надо дожи- даться момента, когда будет достигнуто любое из состояний, где функция g(x) достигает максимального значения, и в этот момент прекратить на- блюдения. Пример 3. Предположим, что для простого симметричного случайного блуждания по множеству £ = {0, 1, ..., N} состояние 0 является погло- щающим, а /V — отражающим. Пусть хо — то из состояний, где функция g(x) достигает максимального значения и которое является ближайшим к /V. Тогда оптимальный момент остановки имеет следующий вид: если х0^х ^/V, то остановка блуждания происходит тогда, когда (с Рх-вероят- ностью единица) достигается состояние Хо. Между же состояниями 0 и хо решение об остановке такое же, как и в примере 1, в предположении, что Е = {0, 1, ..., хо}, где 0 и Хо — поглощающие состояния. 7. В заключение рассмотрим получившую широкую известность «за- дачу о выборе наилучшего объекта», называемую также «задачей о раз- борчивой невесте», «задачей о выборе секретаря»,... (см. [59], [78], [102], [106]). Для наглядности изложения выберем вариант «задачи о разборчи- вой невесте». Предположим, что «невеста» желает выбрать наилучшего «жениха» из N возможных кандидатов. Считается, что N известно заранее и a priori все кандидаты упорядочены по «качеству». Для определенности будем считать, что наилучший из них имеет максимальный номер N, второй по качеству — номер N — 1, ..., наихудший имеет минимальный номер 1.
§9. ЗАДАЧИ ОБ ОПТИМАЛЬНОЙ ОСТАНОВКЕ 869 Поступают кандидаты к невесте в «случайном» порядке, что формали- зуется следующим образом. Пусть (аь аъ, ..., ан) — перестановка чисел (1, 2, ..., N). Число таких перестановок равно, очевидно, №, и предполагается, что все они «случай- ные» в том смысле, что имеют вероятность 1/NL В рассматриваемой задаче интерпретация упорядоченности выбор- ки (аь аг, ...» ан) состоит в том, что (при потенциальной возможности просмотра всех кандидатов) первым к «невесте» поступает кандидат с номером а\, затем — с номером наконец, последним — кандидат с номером ац. Ограничения на возможные стратегии «невесты» формулируются ис- ходя из следующих соображений. Абсолютного качества поступающего к ней кандидата «невеста» не знает. Все, что она может относительно качества кандидатов узнать, — это только то, какой из них лучше или хуже в результате их попарного сравнения. Далее, если «невеста» отвергла кандидата в «женихи», то он к ней больше не возвращается (а он мог оказаться и наилучшим). Стратегия невесты должна заключаться в том, чтобы на основании последовательного просмотра кандидатов (с запоминанием результатов их попарного сравнения и учитывая «качество» отклоненных кандидатов) так выбрать момент остановки т*, чтобы P{ar* = N} = sup P{ar = N}, (44) где т принадлежит некоторому классу моментов остановки определя- емому «информацией», получаемой «невестой» в ходе просмотра канди- датов в «женихи». Чтобы дать более точное описание рассматриваемого класса , по- строим по последовательности cu = (ai, а%,...» ад/) «ранговую» последова- тельность Х = (ХЬ %2» •••), естественным образом возникающую в связи с описанным выше способом действий «невесты». Именно, положим Х\ = 1 и пусть Х% — порядковый номер (или, что то же, момент поступления) «жениха», доминирующего всех предшеству- ющих. Так, если %2 = 3, то это означает, что для рассматриваемой по- следовательности щ = (ai, аг, ...» ан) значение а\ >аъ но а$>а\ (>аг). Продолжая определять аналогичным образом Хз, Х4, ..., предположим, что, например, Хз = 5. Это означает, что аз > а4, но а& > аз (> 04). Самое большее может быть W доминантов (в случае (аь аг, а/у) = = (1, 2, ..., N)). Если число доминантов для последовательности си = = (ai, аг, ...» ан) равно т, то полагаем Xm+i = Хт+2 = --- = N + 1.
870 ГЛ. VIII. МАРКОВСКИЕ ЦЕПИ Рассматриваемый класс моментов остановки будет состоять из моментов т = т(а)), которые обладают тем свойством, что {ш: т(ш) = п}е^п, где =<т(Х|, ...,Хп), i^n^N. Рассмотрим более подробно структуру «ранговой» последовательности Х = (ХЬХ2, ...). Нетрудно убедиться (задача 3) в том, что эта последовательность является однородной марковской цепью (с фазовым пространством Е = {1, 2, ..., N + 1}). Переходные вероятности этой цепи определяются формулами: Pii = KFTy р/л+1 = ~, P/V+1.A/+1 = 1- (45) (46) (47) Отсюда видно, что состояние W + 1 является поглощающим и возмож- ные переходы совершаются по множеству Е лишь «вверх», т. е. возможны лишь переходы i —* j и j > i. Замечание. Формула (45) вытекает из следующих простых рассмот- рений с учетом того, что вероятность каждой из последовательностей cu = (at, ..., a/v) равна \/N\. Для 1 i < j N переходная вероятность Рч = P(Xn+l = j |Х„ = 0 = (48) Г \Лп — Событие {Xn = i, Хл+1 = /} означает, что значение а; является домини- рующим среди значений аи при этом а7>а,. Вероятность этого (/-2)!^ 1 /! /(/-!)' события равна Точно так же событие {Хп = 1} означает, что значение а/ является доминирующим значением среди ай, ...,а,, и вероятность такого события есть Из этих рассмотрений и (48) получаем формулу (45). Для доказательства формулы (46) надо лишь заметить, что если Xn = i, то Хя+1 = W + 1 означает, что а, доминирует и значения а/+ь ..., а^, и значения а\9 ..., ai_\. Формула (47) очевидна. Предположим теперь, что «невеста» выбрала некоторый момент оста- новки т (относительно системы сг-алгебр (<^*)) и при этом XT = i. Тогда условная вероятность того, что этот момент оказался успешным (т. е.
§9. ЗАДАЧИ ОБ ОПТИМАЛЬНОЙ ОСТАНОВКЕ 871 aT = /V), равна, согласно (46), Следовательно, Р{ат = М = Е^, и, значит, отыскание оптимального момента остановки т* (т. е. момента, для которого Р{ат* = ^ = sup P{aT = N}) сводится к решению задачи об оптимальной остановке t/‘=s“pEV’ (49) где т — марковский момент относительно системы а-алгебр ). В формуле (49) предполагается, что Х\ = 1. В соответствии с общим методом решения задач об оптимальной остановке для марковских после- довательностей обозначим = sup Eig(XT), где Е/ — математическое ожидание в предположении, что Х\ ~i, и g(0 = |, i^N, g(N+ Г)=0. Как мы уже знаем (теорема 2), функция 1 4-1, является экс- цессивной мажорантой функции g(i), 1 4-1: N v(i)^Tv(i)= £ дтЬ)^/')’ (50) /=i+l ^(0 > g(i), (51) и к тому же наименьшей из таких функций. Из этой же теоремы 2 следует, что функция v(i), 1 i < N 4- 1, удовлетворяет уравнению v(i) = max(g(i), Tv(i)), 1 i N 4-1, (52) при этом, как нетрудно видеть, искомая функция v(i) должна быть такой, что v(W4-l) = 0, v(N) = g(N) = \. Обозначим через D* множество тех состояний i е Е, где производится остановка наблюдений. Согласно теореме 1, это множество описывается следующим образом: D* = {i & Е: и(0 = g(i)}. Соответственно, область продолжения наблюдений С* = {гб£: v(l)>g{i)}.
872 ГЛ. VIII. МАРКОВСКИЕ ЦЕПИ Таким образом, если i gD*, то N . 1 N g(0 = y(0>7’u(i)= 7’7ТТи0’)^52 7‘тту^) = /=Ж 7 ' /=Ж 7 7 /V . 1 . N 1 = S 7’7Z7‘aT = ^W у^г /=/+1 s /=/+i Следовательно, если i eD*, to должно быть выполнено неравенство Далее, если это неравенство выполнено и значения / + 1, ..., N все принадлежат D*, то тогда • 1 N i TvW = 52 7 • 7ТТ S(j} = g(0 52 7TT < S(i) \ j=i+l j=i+l и тем самым состояние I также принадлежит множеству D*. Приведенные рассуждения (с учетом того, что jVgD*, поскольку v(N) = g(/V)) показывают, что множество D* должно иметь следующий вид: D* = {/*,/* +1..../V, ?V + 1}, где /* = i*(N) определяется из неравенств Т + . 1 + •. • 4~ -г,—Г 1 —Г + Т + • ’ • + Т—Г» (53) /* /* + 1 /V — 1 /*-!/* /V — 1 из которых вытекает, что при больших N (54) Действительно, для всякого п 2 ln(n + 1) - In п < < In п - ln(n - 1). Откуда что вместе с (53) приводит к неравенствам . N t . А/-1 in z АЛ < 1 <с In . z. л ~ , i*(N) z*(AO“2 из которых и следует асимптотика (54).
§9. ЗАДАЧИ ОБ ОПТИМАЛЬНОЙ ОСТАНОВКЕ 873 Найдем теперь функцию и = v(i) для i е Е = {1 , 2, ..., N 4- 1}. Если i eD* = {/*, /* 4- 1, ..., N, N 4-1}, то v(i) = g(i) = Пусть / = /* — !. Тогда N „с-- 1) = T.V- -1) = £ S(n = (jj-f +... + ^). /•=/* Пусть теперь i = i* — 2. Тогда »(.• - 2) = - 2) = »(.- - 1) + £ ЛП = j=i* = 1(_1_ + +-4 + ^y-i- = jVVz’-I A/ —17 Al /-1 /=/* = Lzl(_L_ + +-!- По индукции устанавливаем, что для всех 1 i < I* Тем самым для i е {1, 2, N} (v*(N), v(0 = < ... i |£(O = jy. Обращаясь к (55), видим, что поскольку lim f •*7аа—Г +... + -г}—= 1, JV—ооМ*(Л0- 1 то при /V —> оо lim v*(N)= Пт =-^0,0368. ^->oo N-+OO N е (55) (56) (57) (58) Этот результат, на первый взгляд, может показаться несколько удиви- тельным, поскольку из него следует, что если число кандидатов N велико, то у «невесты» существует стратегия выбора наилучшего из них с весь- ма большой вероятностью V* = sup P{ar = N} = v*(N)&0y368. При этом » т оптимальный момент r* = inf{/i: X„eD*}, гдеВ* = {/*, i* + 1, N, N + 1}.
874 ГЛ. VIII. МАРКОВСКИЕ ЦЕПИ Таким образом, оптимальная стратегия «невесты» состоит в том, чтобы просмотреть z* - 1 (где /* у, л—>оо) кандидатов и затем выбрать того первого кандидата, который лучше всех предыдущих. В том случае, когда /V = 10, более детальный анализ (см., например, § 1 гл. III в [102]) показывает, что /*(10) = 4. Иначе говоря, в этом случае надо просмотреть трех кандидатов и затем из последующих выбрать первого кандидата, который доминирует всех предшествующих. Соответствующая вероятность выбора наилучшего «жениха» (т. е. значение у*(10)) равно примерно 0,399. 8. Задачи. 1. Построить пример, показывающий, что для марковских цепей со счетным множеством состояний может не существовать (в классе £Ш§°) оптимального момента остановки. 2. Проверить, что момент ту, введенный при доказательстве теоремы 2, является марковским моментом. 3. Показать, что последовательность X = (Хь •••), введенная в п. 7 при рассмотрении «задачи о разборчивой невесте», образует однородную марковскую цепь. 4. Пусть X = (Xn)n^Q — однородная марковская цепь со значениями в R и с переходной функцией Р = Р(х; В), хе/?, Ве^(/?). Говорят, что /?-значная функция f = Дх), хе/?, является Р-гармонической (или гар- монической по отношению к Р), если ExlZ(X1)| = $|f(z/)|P(x;di/)<oo, xeR, R И /(*) = $ f(y)P(x;dy), x&R. (59) R (Если равенство «=» в (59) заменено на неравенство «>», то говорят, что функция f является супергармонической.) Доказать, что если f — супергармоническая функция, то для всякого хе/? последовательность (/(^п))п>о с Х$ = х является супермартингалом (по отношению к мере Рх). 5. Показать, что момент т, входящий в (38), принадлежит классу 6. По аналогии с примером 1 в п. 6 рассмотреть задачи об оптимальной остановке sN(x)= sup Exg(Xr) и S(x) = sup Exg(XT) для всех простых случайных блужданий из примеров в § 8.
Очерк истории становления математической теории вероятностей При изложении вопросов истории теории вероятностей можно условно выделить (ср. [26] *), [43]) следующие ее этапы: Предыстория Первый период (XVII век —начало XVIII века) Второй период (XVIII век —начало XIX века) Третий период (вторая половина XIX века) Четвертый период (начало и середина XX века) Предыстория. Интуитивные представления о случайности и возник- новение разного рода рассуждений о возможных шансах (в культовой практике, разрешении споров, предсказаниях и т. п.) уходят в глубь веков. В донаучную эпоху к ним относились как к явлениям, не поддающимся человеческому разуму и рациональному объяснению, и только несколько веков назад началось их осмысление и формально-логическое изучение. Археологические сведения говорят о находках первых «случайных ин- струментов» — игральных костей (astragalus), которые в давние времена применялись в примитивных играх **). С определенностью можно утвер- ждать, что такие кости использовались в настольных играх во времена Первой Династии в Египте (около 3500 г. до н. э.), затем в Древней Греции и Древнем Риме. Известно [20], что римские императоры Август (August, 63 г. до н. э. — 14 г. н. э.) и Клавдий (Claudius, 10 г. до н. э. — 54 г. н. э.) были страстными игроками в кости. Помимо игр, в связи с которыми возникали уже тогда простейшие вопросы относительно числа благоприятных и неблагоприятных шансов, сходные вопросы появлялись в страховании и коммерции. Старейшими известными формами страхования являются контракты на морские пе- ревозки, обнаруженные в вавилонских записях, относящихся к периоду 4—3 тысячи лет до н. э. Практика подобных контрактов перешла затем через финикийцев к грекам, римлянам, индусам. Ее следы можно найти в ранних кодексах Римской цивилизации, законах Византийской империи. В связи со страхованием жизни римский юрист CJlpian составил (220 г. до н. э.) первые таблицы смертности. *) Ссылки в настоящем очерке даются на список литературы, помещенный на с. 894-898. **) astragalus — запяточная кость у парнокопытных; она имеет такую форму, что при бросании может упасть лишь на одну из четырех сторон, поскольку две другие имеют закругленную форму.
876 ИСТОРИЯ СТАНОВЛЕНИЯ МАТЕМАТИЧЕСКОЙ ТЕОРИИ ВЕРОЯТНОСТЕЙ В эпоху расцвета итальянских городов-республик (Рим, Венеция, Генуя, Пиза, Флоренция) в связи с практикой страхования появляется необходимость и в простейшей статистике, и в актуарных расчетах. Известно, что первый точно датированный контракт по страхованию жизни был заключен в Генуе в 1347 году. Города-республики дали начало эпохе Возрождения (Renaissance; конец XIV — начало XVII века) — периоду преобразований и обнов- ления в социальной и культурной жизни Западной Европы. Пожалуй, именно в эпоху итальянского Возрождения мы находим следы более или менее серьезных дискуссий, в основном философского характера, относительно «вероятностных» рассуждений у Луки Пачоли (Luca Pacioli, 1445—1517(?)), Ч. Кальканини (Celio Calcagnini, 1479—1541) и Н. Тар- тальи (Nicola Fontana Tartaglea, 1500—1557) (см. [43], [20]). Видимо, одним из первых, кто стал математически анализировать игровые шансы, был Дж. Кардано (Gerolamo Cardano, 1501—1576), широ- ко известный как изобретатель «карданного вала» и решивший уравнение третьей степени. Его манускрипт (около 1525 г.), опубликованный лишь в 1663 г.)род названием Liber de Ludo Aleae («Книга об азартных играх»), явился не только своего рода практическим пособием для игроков. В нем впервые была высказана идея комбинаций, с помощью которых удоб- но описывать множество всех возможных исходов (при бросании костей разного рода и в разном числе). Им было обнаружено также, что для пра- вильных костей «отношение числа благоприятных комбинаций к общему числу возможных комбинаций находится в хорошем согласии с игровой практикой» [20]. 1. Первый период (XVII век — начало XVIII века). Многие, как, например, Лаплас [39] (см. также [61]), связывают рождение и начало «исчисления вероятностей» с перепиской (1654 г.) между Паскалем (Blaise Pascal, 1623—1662) и Ферма (Pierre de Fermat, 1601—1665). Эта переписка возникла в связи с некоторыми вопросами, поставленными перед Паскалем кавалером де Мере (Chevalier de Mere, он же Antoine Gombaud — писатель и моралист, 1607—1684). Один из этих вопросов был связан с тем, как справедливо разде- лить ставку в прерванной игре. Конкретно, речь идет о следующем. Пусть два игрока А и В согласились, что в их игре вся ставка достается тому, кто первый выиграет, скажем, в пяти партиях. Предположим, что игра вынужденным образом остановлена тогда, когда игрок А имел четыре вы- игрыша, а игрок В — три выигрыша. В какой пропорции игроки должны разделить ставку в этой остановленной игре? Один из «естественных», как может показаться, ответов на этот вопрос состоит в том, что разделение ставки должно произойти в отношении 2:1. В самом деле, игра заведомо
ИСТОРИЯ СТАНОВЛЕНИЯ МАТЕМАТИЧЕСКОЙ ТЕОРИИ ВЕРОЯТНОСТЕЙ 877 закончится через два шага, при этом игроку А достаточно выиграть лишь один раз, а игроку В нужно выиграть оба раза. Отсюда и приходим к от- ношению 2:1. Но по числу выигранных игроками партий также «естественным» мож- но было бы считать отношение 4:3. Правильный же ответ, как нашли Паскаль и Ферма, есть не то и не другое: разделение ставки должно производиться в отношении 3:1. Другая задача была связана с вопросом о том, что более правдоподоб- но — иметь по крайней мере одну шестерку в четырех бросаниях правиль- ной кости или иметь по крайней мере пару шестерок, (6, 6), в 24 одновре- менных бросаниях двух правильных костей. И в этой задаче Паскаль и Ферма дали правильный ответ: первая комбинация несколько более правдоподобна, нежели вторая. (Вероятность первой комбинации равна 1 — (5/6)4 =0,516, а второй 1 -(35/36)24 = 0,491.) В решении этих задач и Паскаль, и Ферма широко применяли (как и Кардано) комбинаторные рассуждения, ставшие одним из основных прие- мов «исчисления вероятностей» при подсчетах различных шансов. Нашел здесь свое «прикладное» место и треугольник Паскаля, известный, впро- чем, и раньше. В 1657 году выходит в свет книга X. Гюйгенса (Christianus Huygens, 1629—1695) De Ratiociniis in Ludo Aleee («О расчетах в азартных играх»), считающаяся первым систематическим текстом по «исчислению вероят- ностей». В ней в явной форме формулируются многие фундаментальные понятия и принципы исчисления вероятностей, приводятся правила сло- жения и умножения вероятностей, содержится дискуссия относительно понятия математического ожидания. Долгое время эта книга была основ- ным пособием по «элементарной теории вероятностей». Центральной фигурой рассматриваемого периода в становлении «тео- рии вероятностей» является Яков Бернулли (Jacob (Jakob, James, Jacques) Bernoulli, 1654—1705), которому принадлежит заслуга введения в нау- ку «классического» понятия «вероятность события» как отношения чис- ла возможных исходов, благоприятствующих рассматриваемому событию, к общему числу мыслимых исходов. Основной результат Я. Бернулли, с которым ассоциируется его имя, это, конечно, закон больших чисел, лежащий в основе всех применений теории вероятностей. Датой рождения этого закона, сформулированного в виде предельной теоремы, считается 1713 год —дата выхода в свет трактата книги Я. Бер- нулли Ars Conjectandi («Искусство предположений»), публикация кото- рого была осуществлена при участии его племянника Николая (Nikolaus) Бернулли; см. [3, с. 9, 27, 75, 83]. Как отмечает А. А. Марков в своей речи,
878 ИСТОРИЯ СТАНОВЛЕНИЯ МАТЕМАТИЧЕСКОЙ ТЕОРИИ ВЕРОЯТНОСТЕЙ посвященной 200-летию закона больших чисел (см. [53], [3]), Я. Бернул- ли в письмах (от 3 октября 1703 г. и 20 апреля 1704 г.) к Г. Лейбницу (Gottfried Wilhelm Leibniz, 1646—1716) писал, что эта теорема ему была «известна уже двенадцать лет назад». (Сам термин «закон больших чисел» предложил Пуассон, 1835 г.) Другой представитель семейства Бернулли, Даниил (Daniel Bernoulli, 1667—1748), известен в теории вероятностей в связи с дискуссией по пово- ду так называемого «Петербургского парадокса», для разрешения которого им использовалось понятие «морального ожидания». Первый период становления теории вероятностей совпал с эпохой со- здания математического естествознания. Именно к этому времени отно- сится обращение к концепциям непрерывности, бесконечности и инфини- тезимальной малости. К этому времени относится и создание И. Нью- тоном (Isaac Newton, 1642—1727) и Г. Лейбницем дифференциального и интегрального исчисления. Как отмечает А. Н. Колмогоров [26], задача этой эпохи состояла в том, чтобы «постигнуть необычайную широту и гибкость (а тогда казалось и всемогущество) математического метода изу- чения причинных связей. Идея дифференциального уравнения как закона, определяющего однозначно по состоянию системы в настоящее время ее будущую эволюцию, занимала в математическом естествознании еще бо- лее исключительное положение, чем в наше время. Теория вероятностей нужна в математическом естествознании там, где эта детерминистская схе- ма дифференциальных уравнений перестает действовать. В это же время конкретного естественно-научного материала для расчетного, так сказать делового, применения теории вероятностей еще не было. Тем не менее неизбежность грубой схематизации реальных явлений при подведении их под детерминистические схемы типа систем диффе- ренциальных уравнений была уже достаточно ясна. Было ясно и то, что на почве хаоса огромного количества не поддающихся индивидуальному учету не связанных между собой явлений „в среднем" могут возникать вполне четкие закономерности. Здесь и предвиделась фундаментальная на- турфилософская роль теории вероятностей», раскрываемая с достаточной полнотой предельной теоремой Я. Бернулли — законом больших чисел. Необходимо отметить, что осознание Я. Бернулли важности рассмотре- ния бесконечных последовательностей результатов повторных испытаний, сама постановка вопроса о предельном поведении частот появления тех или иных событий в этих испытаниях —были кардинально новыми («нефи- нитными») идеями в вероятностных рассмотрениях, ограничивавшихся то- гда элементарно-арифметическими и простейшими комбинаторными при- емами. Именно эта постановка вопроса, приведшая к закону больших чисел, выявила как различие между понятиями вероятности события
ИСТОРИЯ СТАНОВЛЕНИЯ МАТЕМАТИЧЕСКОЙ ТЕОРИИ ВЕРОЯТНОСТЕЙ 879 и частоты его появления в конечном числе повторных испытаний, так и возможность определения этой вероятности (с той или иной степенью точности) по значению частоты при большом числе испытаний. 2. Второй период (XVIII век — начало XIX века). Это период связан, главным образом, с такими именами, как Монмор (Pierre-Remond de Montmort, 1678—1719), Муавр (Abraham De Moivre, 1667—1754), Байес (Thomas Bayes, 1702—1761), Лаплас (Pierre Simon de Laplace, 1749—1827), Гаусс (Carl Friedrich Gauss, 1777—1855) и Пуассон (Simeon Denis Poisson, 1781 — 1840). Если первый период носил, по существу, философский характер, то во втором происходит развитие и оттачивание аналитических методов, появляется необходимость в проведении расчетов в разных областях, за- кладываются вероятностно-статистические подходы к теории ошибок на- блюдения, теории стрельбы и др. И Монмор, и Муавр находились под сильным влиянием работ Я. Бер- нулли в «исчислении вероятностей». В своей книге Essai dAnalyse sur les Jeux de Hasard («Опыт анализа случайных игр»; 1708 г.) Монмор уделяет основное внимание именно развитию методов расчетов в разнообразных играх. В своих двух книгах Doctrine of Chances («Доктрина случая»; 1718 г.) и Miscellanea Analytica Suppiementum («Аналитические методы, или Аналитическая смесь»; 1730 г.) Муавр довольно тщательным образом да- ет определения таких понятий, как независимость событий, ожидание, условная вероятность. Наиболее известно имя Муавра в связи с нормальной аппроксимаци- ей биномиального распределения. Если закон больших чисел Я. Бернул- ли выявил, что частоты универсальным образом «в среднем» подчиняют- ся некоторой четкой закономерности (в виде сходимости, в определенном смысле, частот появления событий к их вероятности), то обнаруженная Муавром нормальная аппроксимация выявила другую универсальную за- кономерность в поведении отклонений от среднего значения. Роль это- го результата Муавра и последующих его обобщений столь значительна, что соответствующая «интегральная предельная теорема» называется цен- тральной предельной теоремой теории вероятностей. (Терминология предложена Д. Пойа (George Polya, 1887—1985) в 1920 г., [55].) Монументальной фигурой рассматриваемого периода является, без- условно, Лаплас. Его трактат Theorie Analytique des Probabilites («Ана- литическая теория вероятностей»), опубликованный в 1812 году, был основным пособием по теории вероятностей в XIX веке. Он написал также несколько мемуаров по основаниям, философским вопросам и конкретным проблемам исчисления вероятностей, не считая работ по астрономии и
880 ИСТОРИЯ СТАНОВЛЕНИЯ МАТЕМАТИЧЕСКОЙ ТЕОРИИ ВЕРОЯТНОСТЕЙ математическому анализу. Значителен вклад Лапласа в теорию ошибок. Именно ему и Гауссу принадлежит естественная идея введения нормаль- ного закона в теории ошибок, возникающего как результат суммарного эффекта сложения большого числа независимых элементарных ошибок. Лаплас также не только придал интегральной предельной теореме Му- авра более общую формулировку («теорема Муавра—Лапласа»), но и предложил новые аналитические доказательства. Вслед за Бернулли Лаплас четко придерживался «принципа равновоз- можности», или «принципа безразличия», приводящего к «классическому» определению понятия вероятности (в случае конечного числа возможных исходов). Однако уже в этот период появляются и «неклассические» распреде- ления вероятностей, не укладывающиеся в рамки классической схемы. Та- ковыми, например, являлись нормальный и пуассоновский законы, долгое время рассматривавшиеся лишь как некоторые аппроксимации, а не как распределения вероятностей (в современном понимании этого термина). Другим примером, где также возникали «неклассические» распреде- ления, являлись задачи на «геометрические вероятности» (например, у Ньютона; 1665 г., [52, с. 60]). Сюда же относится и известная «игла Бюф- фона». Неравные вероятности возникали и у Т. Байеса в связи с формулой Байеса, опубликованной в 1763 году в статье An Essay Towards Solving а Problem in the Doctrine of Chances и дающей правило пересчета априор- ных вероятностей (которые Байес считал одинаковыми) в апостериорные по происшествии некоторого события. Эта формула породила целое на- правление в статистике, называемое ныне «байесовским подходом». Из всего сказанного становится ясным, что рамки «классической» (финитной) теории вероятностей существенно сдерживали возможности ее развития и применений, а интерпретация нормального, пуассоновского и др. распределений только лишь как некоторых предельных образований вызывала чувство незавершенности. В рассматриваемый период в теории вероятностей отсутствовали абстрактные математические конструкции и она не рассматривалась иначе как прикладная математика. К тому же ее методы были ограничены рамками конкретных применений (типа азартных игр, теории ошибок, теории стрельбы, страхования, демографии и т. п.). 3. Третий период (вторая половина XIX века). Основным местом, где разрабатывались в это время общие проблемы теории вероятно- стей, стал Петербург — П. Л. Чебышев (1821—1894), А. А. Марков (1856—1922) и А. М. Ляпунов (1857—1918) внесли существенный вклад в расширение и углубление всей системы теории вероятностей. Именно благодаря им произошел отказ от ограничения лишь случаем «клас- сических» вероятностей. П. Л. Чебышев с полной ясностью оценил
ИСТОРИЯ СТАНОВЛЕНИЯ МАТЕМАТИЧЕСКОЙ ТЕОРИИ ВЕРОЯТНОСТЕЙ 881 роль понятия случайной величины, понятия математического ожидания и эффективным образом продемонстрировал удобство обращения с ними, что ныне рассматривается как нечто само собой разумеющееся. Закон больших чисел, теорема Муавра—Лапласа относились к случай- ным величинами, принимающим лишь два значения. П. Л. Чебышевым бы- ла существенно расширена сфера действия этих теорем (для более общих случайных величин). Так, уже первый его результат устанавливал спра- ведливость закона больших чисел для сумм произвольных независимых случайных величин, значения которых ограничены некоторой константой. (Следующий шаг был сделан А. А. Марковым, который для доказательства использовал «неравенство Чебышева—Маркова».) После закона больших чисел П. Л. Чебышев перешел к установлению справедливости теоремы Муавра—Лапласа для сумм независимых случай- ных величин, для чего им был разработан новый прием доказательства — метод моментов, позже усовершенствованный А. А. Марковым. Следующий неожиданный шаг в отыскании общих условий справедли- вости теоремы Муавра—Лапласа был сделан А. М. Ляпуновым, который методом характеристических функций, берущим свое начало у Лапласа, доказал эту теорему в предположении наличия у суммируемых независи- мых случайных величин не всех моментов, а лишь моментов порядка 2 + <5, 6 > 0, удовлетворяющих так называемому «условию Ляпунова». Как одну из принципиальных новых концепций следует отметить вве- дение А. А. Марковым схемы зависимых случайных величин, обладаю- щих свойством «отсутствия последействия» и называемых теперь «цепями Маркова», с установлением для них первой строго доказанной «эргодиче- ской» теоремы. С определенностью можно констатировать, что работы П. Л. Чебыше- ва, А. А. Маркова и А. М. Ляпунова («Петербургская школа») заложили прочный фундамент всего последующего развития теории вероятностей. В Западной Европе интерес к теории вероятностей во второй поло- вине XIX века стал стремительно возрастать благодаря обнаружившимся глубоким ее связям с чистой математикой, статистической физикой и на- чавшей бурно развиваться математической статистикой. В это время становилось все более ясным, что собственное разви- тие теории вероятностей сильно сдерживается рамками ее «классических» предположений (конечное число исходов и их равновозможность) и что соответствующее расширение надо искать в моделях чистой математики. (Уместно напомнить, что в это время теория множеств только создавалась, а теория меры и вовсе находилась лишь на пороге создания.) В то же самое время в чистой математике и, в частности, в теории чи- сел — науке, казалось бы весьма отдаленной от теории вероятностей, стали
882 ИСТОРИЯ СТАНОВЛЕНИЯ МАТЕМАТИЧЕСКОЙ ТЕОРИИ ВЕРОЯТНОСТЕЙ использоваться понятия и появляться результаты чисто «вероятностной» природы, стала привлекаться вероятностная интуиция. Так, в 1890 г. А. Пуанкаре (Jules Henri Poincare, 1854—1912) в своей работе [57], посвященной проблеме трех тел, приводит результат о воз- вратности движения динамической системы, описываемой сохраняющим «объем» преобразованием Г, который говорит о том, что если А — неко- торое множество начальных состояний си, то для «типичных» сие Л тра- ектории Глси будут возвращаться в множество А бесконечное число раз. (Говоря современным языком, возвратность имеет место не для всех, а лишь для почти всех начальных состояний системы.) В рассмотрениях этого времени часто апеллируют к выражениям типа «случайный выбор», «типичный случай», «специальный случай». В учеб- нике Calcul des Probabilites ([56], 1896 г.) А. Пуанкаре задается вопросом о том, «какова вероятность того, что случайно выбранная точка из интер- вала [0, 1] окажется рациональным числом». В 1888 г. астроном X. Полден (Johan August Hugo Gylden, 1841—1896) опубликовал работу [18], истоки которой (как и у А. Пуанкаре [57], 1890 г.) были связаны с вопросами планетарной устойчивости и которую теперь бы отнесли к вероятностной теории чисел. Речь в ней шла о следующем. Выберем «случайным» образом число си е[0, 1), и пустьси = (аь Я2, •••) есть его разложение в непрерывную дробь, где ап = ап(си) — целые числа. (Для рациональных чисел си в этих разложениях только конечное число величин ап отлично от нуля и образованные по разложению (а>, 02, ...) числа cu(^ = (ai, ^2» •••» 0, 0, ...) используются как наилучшие рацио- нальные аппроксимации для си.) Спрашивается, как в «типичных» случаях «ведут» себя при больших значениях п величины art(cu). Хотя и не строго, X. Гюлден устанавливает, что «вероятность» получить в разложении cu = (ai, а%, ...) значение an = k при больших п «более или менее» обратно пропорциональна k2. (Несколько позже Т. Broden [12] и A. Wiman [62] установили, оперируя с геометрическими вероятностями, что если «случайный» выбор сие [0, 1) определять как «равномерную рас- пределенность» си на [0, 1), то вероятность того, что ал(си) = fe, стремится при п оо к значению (|„2ГМП[(1 + 1)/(1 + *±т)]; отсюда видно, что при больших k это выражение обратно пропорционально k2, что, в сущности, и имел в виду X. Полден.) Вероятностные понятия и рассуждения во второй половине XIX ве- ка систематически стали использоваться в классической физике и ста- тистической механике. Достаточно упомянуть, например, распределение
ИСТОРИЯ СТАНОВЛЕНИЯ МАТЕМАТИЧЕСКОЙ ТЕОРИИ ВЕРОЯТНОСТЕЙ 883 Максвелла (James Clerk Maxwell, 1831 — 1879) для молекулярных скоро- стей, см. [44]; временные средние и эргодическую гипотезу Больцмана (Ludwig Boltzmann, 1844—1906), см. [6], [7]. С их именами связано понятие ансамбля, получившее дальнейшее раз- витие в работах Гиббса (Josiah Willard Gibbs, 1839—1903), см. [17]. Для всего последующего развития теории вероятностей и углубления понимания роли вероятностных подходов и концепций важную роль сыграли обнаруженный в 1827 году Р. Брауном (Robert Brown, 1773—1858) феномен, получивший название броуновского движения (описание это- го феномена дано им в памфлете «А Brief Account of Microscopical Observation...», опубликованном в 1828 году [11]), и явление радиоак- тивного распада, обнаруженное в 1896 году А. Беккерелем ((Antoine-) Henri Becquerel, 1852—1908) при исследовании свойств урана. В 1900 г. Л. Башелье (Louis Bachelier, 1870—1946), [2], использовал броуновское движение для математического описания стоимости акций; см. подробнее В [74]. Качественное объяснение и количественное описание броуновского движения были даны впоследствии А. Эйнштейном (Albert Einstein, 1879— 1955), [75], и М. Смолуховским (Marian Smoluchowski, 1872—1917), [59]. Явление радиоактивности нашло свое объяснение в рамках квантовой механики, создание которой относится к двадцатым годам двадцатого сто- летия. Из сказанного выше становится ясно, что появление новых вероят- ностных схем, моделей и использование вероятностной идеологии не укла- дывалось в рамки «классической вероятности» и требовало новых поня- тий, с тем чтобы можно было, например, придать точный математический смысл выражениям типа «случайно выбранная точка из интервала [0, 1)», не говоря уже об объяснении феномена «случайного» броуновского дви- жения. С этой точки зрения весьма ко времени появилась теория мно- жеств и понятие «борелевской меры», введенное Э. Борелем (Emile Borel, 1871—1956) в 1898 году, [8], и теория интегрирования А. Лебега (Henri Lebesgue, 1875—1941), данная им в его книге [40], 1904 г. (Э. Борелем ме- ра вводилась на евклидовом пространстве как обобщение понятия длины. Современное изложение теории меры на абстрактных измеримых про- странствах следует М. Фреше (Maurice Frechet, 1878—1973), [71], 1915 г.; историю теории меры и интегрирования см., например, в [72].) По существу, сразу же было осознано, что борелевская теория меры и лебеговская теория интегрирования образуют ту концептуальную базу, которая может дать обоснование многих вероятностных рассмотрений и придать точный смысл многим интуитивным высказываниям типа «случай- ный выбор точки из интервала [0, 1)». И вскоре (1905 г.) Э. Борель сам
884 ИСТОРИЯ СТАНОВЛЕНИЯ МАТЕМАТИЧЕСКОЙ ТЕОРИИ ВЕРОЯТНОСТЕЙ же дает применение теоретико-множественного подхода к теории веро- ятностей, доказав первую, в сущности, предельную теорему — усиленный закон больших чисел —о выполнении некоторых свойств действительных чисел «с вероятностью единица», или «почти наверное». Суть этой теоремы, дающей определенное представление о том, «много или мало» действительных чисел с «исключительными» (в приводимом ниже смысле) свойствами, состоит в следующем. Пусть действительно число cue [О, 1) и cu = 0, оцаг--- есть его двоич- ное разложение с ап = 0 или 1 (ср. с рассмотренным выше разложением си = (ад, 02, ...) в непрерывную дробь). Тогда если 1/л(щ) — частота появ- ления единиц среди первых п значений ..., ая, то борелевская мера множества тех о; («нормальных», как говорил Э. Борель), для которых ^я(си)—» 1/2, п —*оо, равна единице, а тех («исключительных»), для которых такой сходимости нет, равна нулю. Этот результат («усиленный закон больших чисел Бореля») внешне напоминает теорему Я. Бернулли («закон больших чисел»). Однако между ними есть и формально-математическая, и концептуально-философская разница. Действительно, в законе больших чисел утверждается всего лишь, что^для всякого е>0 вероятность события {си: |1/я(си) — 1/2| стремится при п —*оо к нулю. В усиленном же законе больших чи- сел утверждается больше — к нулю стремится вероятность события Jeu: sup |z/^(cu) — 1/2|>е1. Далее, в первом случае утверждение каса- [ tn п J ется некоторого свойства вероятностей конечных последовательностей (аь <*2» •••» <*«)» я^1, и пределов этих вероятностей. Во втором же случае речь идет о свойствах вероятностей, определяемых бесконечными последовательностями (cq, с^» •••» <*«» ...). (Детальное изложение всего круга затронутых математических и философских проблем, связанных с проникновением вероятностных методов в теорию чисел, а также обшир- ный материал, относящийся к созданию современной теории вероятностей, см. в монографии Яна фон Плато (Jan von Plato) Creating Modern Probability, [54].) 4. Четвертый период (начало и середина XX века). Выявленные к концу XIX века связи теории вероятностей с чистой математикой при- вели к постановке Д. Гильбертом (David Hilbert, 1862—1943) в его про- граммном докладе 8 августа 1900 г. на Втором математическом конгрессе в Париже проблемы математизации теории вероятностей. Среди его известных проблем (первая относилась к континуум-гипотезе) ше- стая формулировалась как проблема аксиоматизации тех физических дис- циплин, в которых математика играет доминирующую роль. К этим дисци- плинам Д. Гильберт отнес теорию вероятностей и механику, указав также
ИСТОРИЯ СТАНОВЛЕНИЯ МАТЕМАТИЧЕСКОЙ ТЕОРИИ ВЕРОЯТНОСТЕЙ 885 на необходимость строгого и удовлетворительного развития метода сред- них в физике и, в частности, в кинетической теории газов. (Д. Гильберт отмечал, что постановка вопроса об аксиоматизации теории вероятностей была инициирована Г. Вольманом (Georg Bohlmann, 1869—1928) — при- ват-доцентом в Гёттингене, который говорил об этой проблематике на актуарном конгрессе, состоявшемся весной того же 1900 г. в Париже, см. [5], [19]. Вводимая Г. Вольманом вероятность определялась как (ко- нечно-аддитивная) функция на событиях, но без достаточно четкого опре- деления «системы событий», что, впрочем, им полностью осознавалось.) Четвертый период в истории становления теории вероятностей — это период логического обоснования теории вероятностей и становления ее математической дисциплиной. Вскоре после доклада Д. Гильберта было предпринято несколько по- пыток построения математической теории вероятностей с привлечением элементов теории множеств и теории меры. Так, в 1904 г. Р. Леммель (R. Lammel, [41 ]Гсм. также [19]) для описания множества исходов обращался к теории множеств, однако само понятие вероятности (выражаемое термином «content» и ассоциируемое с объемом, площадью, длиной, ...) оставалось на интуитивном уровне предшествую- щего периода. Другой автор, У. Брогги (Ugo Broggi, 1880—1965) в своей диссертации (1907 г., [10]; см. также [19]), выполненной под руководством Д. Гильберта, обращался и к теории меры Бореля и Лебега (основываясь на ее представ- лении в книге Лебега [40], 1904 г.), но само понятие (конечно-аддитивной) вероятности требовало для своего определения обращения (в простейших случаях) к «относительным мерам», «относительным частотам» и (в общих случаях) обращения к некоторым искусственным предельным процеду- рам. Среди авторов последовавших затем работ по логическому обоснова- нию теории вероятностей следует в первую очередь назвать С. Н. Берн- штейна (1880—1968) и Р. фон Мизеса (Richard von Mises, 1883—1953). Система аксиом С. Н. Бернштейна ([4], 1917 г.) была основана на понятии качественного сравнения событий по степени их большего или меньшего правдоподобия. Само же численное значение вероятности появ- лялось как некоторое производное понятие. Впоследствии весьма сходный подход, основанный на субъективных качественных суждениях («системе знаний субъекта»), получил широкое развитие в работах Б. де Финетти (Bruno de Finetti, 1906—1985) в конце двадцатых — начале тридцатых годов (см., например, [65]—[70]). Идеи Б. де Финетти нашли большую поддержку у ряда представителей байесовского направления в статистике, например, у Л. Сэвиджа (Leonard
886 ИСТОРИЯ СТАНОВЛЕНИЯ МАТЕМАТИЧЕСКОЙ ТЕОРИИ ВЕРОЯТНОСТЕЙ Jimmie Savage, 1917—1971; см. [60]), а также в теории игр и решений, где «субъективный» элемент играет весьма значительную роль. В 1919 г. Р. Мизес предложил ([49], [50]) так называемый частотный (говорят также — статистаческий или эмпирический) подход к обосно- ванию теории вероятностей, положив в основу ту идею, что вероятностные концепции могут применяться только к так называемым «коллективам», т. е. индивидуальным бесконечным упорядоченным последовательно- стям, обладающим некоторым свойством «случайности» их образования. Общая схема Р. Мизеса может быть обрисована следующим образом. Имеется некоторое выборочное пространство исходов «эксперимента», и предполагается возможность проведения бесконечного числа испытаний, приводящих к последовательности х = (хь Х2, ...), гДе хп — результат ис- хода в п-м «эксперименте». Пусть, далее, А — некоторое подмножество 1 п в множестве исходов «эксперимента» и ип(А;х) = - £ /а(х<) — частота п появления «события» А в первых п испытаниях. Последовательность x = (xi,X2, ...) называется коллективом. если она удовлетворяет следующим двум постулатам (называемым Мизесом альтернативными условиями; см. [49]—[51]): I (существование предела частот у последовательности) — для всех «допустимых» множеств А существует предел частот lim ип(А; х) (= р(А; х)); п II (существование предела частот у подпоследовательностей) — для всех последовательностей х'= (х{, х^ ...), получаемых из последователь- ности x = (xj, Х2, ...) с помощью некоторой заранее оговариваемой систе- мы («допустимых») правил их образования (Мизес их называет «place- selection functions»), пределы частот lim i/n(A; х') должны быть теми же п самыми, что и для самой последовательности x = (xj, Х2, ...), т. е. совпа- дать с lim ип(А; х). п Согласно Мизесу, говорить о «вероятности множества А» можно лишь в связи с конкретным «коллективом» и эта вероятность (Р(Л; х)) опреде- ляется (в соответствии с постулатом I) как предел частот lim vn(A; х). п Важно подчеркнуть, что если этот предел не существует (и, значит, х по определению не является «коллективом»), то соответствующая вероятность не определяется. Второй постулат призван у Мизеса выражать (соответствующую интуиции и лежащую в основе всех «вероятностных» рассмотрений) концепцию «случайности» в формировании «коллектива» x = (xi,X2, ...), отражать идею «нерегулярности» этой последователь- ности и «непредсказуемости» ее «будущих» значений (хл, xrt+i, ...) по
ИСТОРИЯ СТАНОВЛЕНИЯ МАТЕМАТИЧЕСКОЙ ТЕОРИИ ВЕРОЯТНОСТЕЙ 887 «прошлому» (xj, %2,xn_i) для любого 1. (У представителей теории вероятностей, придерживающихся колмогоровской аксиоматики, изло- женной в § 1 гл. II, такие последовательности должны ассоциироваться с «типичными» последовательностями исходов наблюдений над незави- симыми одинаково распределенными случайными величинами; см. п. 4 § 5 гл. I.) Сформулированные постулаты, используемые Мизесом при постро- ении, как он говорил ([51, с. 1]), «а mathematical theory of repetitive events», вызвали (особенно в тридцатые годы) большую дискуссию и критику. Основные возражения сводились к тому, что в реальной практике мы, обычно, имеем дело с конечными, а не бесконечными, последо- вательностями. Тем самым, реально нельзя определить, существует ли предел lim (Л; х), нельзя реально определить и «чувствительность» этого п предела при переходе от последовательности х к последовательности х'. Серьезную критику вызывали также как способ определения Мизесом понятия «допустимых» правил образования подпоследовательностей, так и та расплывчатость в определении множества тех («тестовых») правил, которые допускаются к рассмотрению в альтернативном условии II. Если рассматривать последовательность x = (xi,X2, ...), состоящую и нулей и единиц и такую, что для нее предел lim i/rt(x; {1}) принимает значения в интервале (0, 1), то в этой последовательности должно быть бесконечное число и нулей, и единиц. Поэтому если допускать любые правила образования подпоследовательностей, то всегда можно из х об- разовать подпоследовательность х', состоящую, например, лишь из еди- ниц, для которой предел lim i/rt(x'; Ш)= 1. Отсюда можно заключить, что нетривиальные коллективы, инвариантные относительно всех способов об- разования подпоследовательностей, не существуют. Первый шаг на пути доказательства «непустоты» класса коллекти- вов был сделан А. Вальдом (Abraham Wald, 1902—1950) в работе [13], 1937 г. В его конструкции правила образования подпоследовательностей х' = (х[, х£, ...) из последовательностей х = (xi, Х2, ...) описывались с по- мощью счетного набора функций Д-= fi(x\, ..., xz), />1, принимающих два значения 0 и 1: элемент xz+i включается в последовательность х', если ..., xz)= 1, и не включается, если Д (xi, ..., х,) = 0. В 1940 г. А. Чёрч (Alonzo Church, 1903—1995) предложил, [73], иной подход к об- разованию подпоследовательности, основываясь на той идее, что каждый способ образования должен быть на практике «эффективно вычислимым». Эта идея привела Чёрча к понятию алгоритмически вычислимых (т. е. вычислимых с помощью, скажем, машины Тьюринга) функций, которые и были им предложены для образования подпоследовательностей. (Пусть,
888 ИСТОРИЯ СТАНОВЛЕНИЯ МАТЕМАТИЧЕСКОЙ ТЕОРИИ ВЕРОЯТНОСТЕЙ например, %, принимает два значения, иц =0, щ = 1. Поставим в соответ- ствие последовательности (хь ..., хп) положительное число п X = ^ik2k~\ *=1 где ik определяются так, что Xk=ulk. Если <р = ^(А) — бинарная, {0, 1}- значная функция, определенная на множестве {0, 1,2, ...}, то *п+\ вклю- чается в новую последовательность х', когда <p(An) = 1, и не включается, если <р(Хп) = 0.) В качестве одного из пояснений и оправданий своей концепции «кол- лектива» как последовательности со свойством «случайности», Мизес приводил ту эвристическую аргументацию, что для таких последователь- ностей нельзя построить «выигрышную систему игры». Эти рассуждения были подвергнуты критическому анализу в небольшой монографии Ж. Билля (Jean Ville, 1910—1988) [14], 1939 г., в которой он придал мизесовским рассмотрениям строгую математическую форму. Интересн^ отметить, что именно в этой работе впервые был использован (как математическое понятие) термин «мартингал». Из приведенного выше описания разных подходов к аксиоматике тео- рии вероятностей (..., Бернштейн, де Финетти, Мизес) видно, что на них лежит отпечаток усложненности и излишней перегруженности понятиями, многие из которых определяются желанием построения такой схемы тео- рии вероятностей, которая была бы возможно ближе к приложениям, что, как отмечает А. Н. Колмогоров в «Основных понятиях теории вероятно- стей», [23], не может привести к простой аксиоматизации. Первой публикацией А. Н. Колмогорова, которая говорит о его ин- тересе к вопросам логического обоснования теории вероятностей, была (недостаточно широко известная) статья «Общая теория меры и исчис- ление вероятностей», [27]. И само название статьи, и ее содержание по- казывают, что возможность логического обоснования теории вероятностей А. Н. Колмогоров видел на базе теории множеств и теории меры. Это обстоятельство, как следует из изложенного выше, не было совершен- но новым и к тому же было вполне естественным для московской мате- матической школы, для которой теория множеств и метрическая теория функций были одними из основных областей математических исследо- ваний. В промежутке между этой статьей (1929 г.) и появлением «Основ- ных понятий» ([23], 1933 г.) А. Н. Колмогоров публикует одну из своих знаменитых вероятностных работ «Об аналитических методах в теории ве- роятностей» [29], о которой П. С. Александров и А. Я. Хинчин писали, [1]:
ИСТОРИЯ СТАНОВЛЕНИЯ МАТЕМАТИЧЕСКОЙ ТЕОРИИ ВЕРОЯТНОСТЕЙ 889 «Во всей теории вероятностей XX столетия трудно указать другое иссле- дование, которое оказалось бы столь основополагающим для дальнейшего развития науки...». Фундаментальность этой работы заключалась не только в том, что в ней были заложены основы теории марковских случайных процессов, но и в том, что она показала тесные связи этой теории, да и всей теории вероятностей в целом, с математическим анализом (в частности, с теорией дифференциальных уравнений — с обычными и частными производными), с классической механикой, классической физикой, ... В связи с рассматриваемыми вопросами обоснования математической теории вероятностей отметим, что работа «Аналитические методы», [29], может служить, так сказать, «физической» мотивацией необходимости ло- гического построения основ случайных процессов, что явилось (помимо «аксиоматики») одной из целей «Основных понятий». В основе предложенной А. Н. Колмогоровым (неформальной) аксио- матизации теории вероятностей лежит понятие вероятностного прост- ранства / (П, Р), где (Q, — некоторое (абстрактное) измеримое пространство («элемен- тарных» исходов и «событий») и Р~неотрицательная счетно-аддитивная функция множеств из &, нормированная условием P(Q) = 1 («вероят- ность»); см. § 1 в гл. II). Под случайными величинами понимаются «^-измеримые функции £ = £(си), их математическое ожидание определяется как интеграл Лебега от по мере Р. Новым явилось и понятие условного математического ожидания Е(£|#) относительно cr-подалгебр (см. в этой связи предисловие А. Н. Колмогорова ко второму изданию «Основных понятий», [24]). В «Основных понятиях» есть теорема, которую А. Н. Колмогоров на- зывает основной, подчеркивая тем самым особую важность содержаще- гося в ней утверждения (о существовании процессов с заданными конеч- номерными распределениями). Суть дела здесь в следующем. В «Аналитическим методах» марковские процессы были призва- • ны описывать эволюцию «стохастически определенных систем» и это описание давалось в терминах «дифференциальных» свойств функций P(s, х; t, А), удовлетворяющих «уравнению Колмогорова—Чепмена». Функции P(s, х; t, А) назывались переходными вероятностями, что связано с их интерпретацией как вероятностей того, что, будучи в момент -времени s в состоянии х, «система» окажется в момент времени t в множестве А фазового пространства ее состояний.
890 ИСТОРИЯ СТАНОВЛЕНИЯ МАТЕМАТИЧЕСКОЙ ТЕОРИИ ВЕРОЯТНОСТЕЙ Точно так же и в работах того же времени [30], [31], [66], [67], посвя- щенных «однородным стохастическим процессам с независимыми прира- щениями», все рассмотрения велись в терминах свойств функций Р/(х), удовлетворяющих функциональному уравнению Ps+t (х) = ^Ps(x — y) dPt (у), естественно возникающему при интерпретации Р/(х) как вероятности того, что за время t приращение процесса будет меньше или равно х. Однако с формально-логической точки зрения вопрос о существова- нии объекта, который можно было бы назвать «процессом» с заданными переходными вероятностями Р($, х; /, А) или заданными распределениями Р/(х), оставался открытым. Именно к решению этого вопроса и относится основнйя теорема, утверждающая, что по каждой системе согласованных конечномерных распределений вероятностей Ft},t2./„(xj, х2, ..., xrt), 0^ t\ < < ... < tn, Xi eR, можно построить вероятностное пространство (Q, Р) и систему случайных величин X = Xt =Х/(ш), такую, что P{XZ1 ^xj, Х/2^х2, ..., Xtn ^xrt} = F/M2./rt(xi, х2, ..., хл). В качестве Q берется пространство действительных функций = в качестве & берется сг-алгебра, порожденная цилиндриче- скими множествами, а мера Р определяется с помощью процедуры про- должения меры с алгебры цилиндрических множеств (на которых эта мера строится естественным образом по заданным конечномерным распределе- ниям) на наименьшую а-алгебру, порожденную этой алгеброй множеств. Случайные величины Xt(w) определяются координатным образом: если = то X/(cu)=a>/. (Данная конструкция объясняет, почему часто понятие «случайный процесс» отождествляется с (его) мерой в функцио- нальном пространстве /^0,оо).) В «Основных понятиях» небольшой параграф отводится и вопросам применимости теории вероятностей. Описывая схему условий, по которой идет применение этой теории к «реальному миру экспериментов», А. Н. Колмогоров во многом сле- дует Р. Мизесу, показывая тем самым, что ему был не чужд частотный мизесовский подход в вопросах интерпретации и применимости теории вероятностей. Суть этой схемы условий состоит в следующем. Предполагается, что имеется некоторый комплекс условий, дающий возможность проведения неограниченного числа повторных экспери- ментов. Пусть (хь х2, ..., хп) — результаты п экспериментов со значениями X/, 1 /г, принадлежащими, скажем, множеству X, и пусть А — некоторое интересующее нас подмножество в X.
ИСТОРИЯ СТАНОВЛЕНИЯ МАТЕМАТИЧЕСКОЙ ТЕОРИИ ВЕРОЯТНОСТЕЙ 891 Если Xi G А, то говорят, что в z-м эксперименте произошло событие А, (Отметим, что a priori не делается никаких предположений «вероятност- ного» характера типа, что эксперименты проводятся «случайным и неза- висимым образом», не говорится ничего и о «шансах», приводящих к со- бытию А, и т. п.) Далее, предполагается, что событию А может быть приписано неко- торое число (обозначаем его Р(А)) такое, что практически можно быть уверенным в том, что частота ип(А) появления события А в п эксперимен- тах будет при больших п мало отличаться от Р(А). И если, к тому же, Р(А) мало, то практически можно быть уверенным в том, что в единичном эксперименте событие А не появится. В «Основных понятиях» А. Н. Колмогоров не входит в детальное обсу- ждение условий применимости теории вероятностей к «реальному миру», говоря, что «мы ... сознательно оставляем в стороне глубокие философ- ские изыскания о понятии вероятности в мире опыта», но отмечая во введении к первой главе, что есть области применимости теории веро- ятностей, «которые не имеют отношения к понятиям случая и вероятности в собственном смысле этого слова». Тридцать лет спустя А. Н. Колмогоров вернулся (см. [32]—[37]) к во- просу о применимости теории вероятностей, предложив для его разреше- ния два подхода («первый» и «второй»), в основе которых лежат со- ответственно, концепция «аппроксимативной случайности» и концепция «алгоритмической сложности». При этом он особо подчеркивал [37], что, в отличие от Р. Мизеса и А. Чёрча, оперирующих с бесконечными по- следовательностями (xi,%2, •••), его подходы к понятию «случайности» носят строго финитный характер, т. е. относятся к последовательностям (хь %2, ..., х/у), /V > 1, конечной длины (далее они, следуя [38], называ- ются цепями), что мы и имеем на самом деле в реальных ситуациях. Концепция «аппроксимативной случайности» вводится так. Пусть (xj, Х2> •••, х/у) — некоторая бинарная (х/=0, 1) цепь длины N и n^N. Говорят, что эта цепь является (п, е)-случайной по отношению к (конечному) набору Ф допустимых алгоритмов, если существует чис- ло р (= Р({1})) такое, что для любой цепи (х{, х^, ...» х'т) с n^m^N, полученной из (xi,X2, ...,х/у) с помощью некоторого алгоритма АеФ, частота pm(x'; {1}) появления единицы отличается от р не более чем на е. (Те алгоритмы из Ф, которые приводят к цепям длины т < п, во внимание не принимаются.) А. Н. Колмогоров показывает в [32], что если для заданных п и 0<s< 1 число допустимах алгоритмов не больше, чем ехр{2пе2(1 - г)},
892 ИСТОРИЯ СТАНОВЛЕНИЯ МАТЕМАТИЧЕСКОЙ ТЕОРИИ ВЕРОЯТНОСТЕЙ то для каждого 0 < р < 1 и любого Уу п можно найти цепь (х\, хг,..., х^), обладающую свойством (п, е)-случа^ности («аппроксимативной случай- ности»). В описанном подходе к выделению «случайных» цепей есть (как и в мизесовском случае) определенный произвол, связанный с неопределен- ностью описания и отбора допустимых алгоритмов. Понятно при этом, что этот класс алгоритмов не может быть слишком большим, иначе множество «аппроксимативно случайных» цепей оказалось бы пустым. В то же самое время желательно, чтобы допустимые алгоритмы были бы просто устроены (например, задавались бы таблицей). В теории вероятностей сложилось вполне определенное представле- ние, подкрепленное разного рода вероятностными утверждениями, о том, что «типичные случайные реализации устроены достаточно нерегулярно, достаточно сложно». Поэтому если стремиться к тому, чтобы алгоритмическое определе- ние «случайности» цепей, последовательностей было максимально при- ближено к вероятностному представлению о структуре случайных реа- лизаций,, то алгоритмы из Ф должны (в совокупности) позволять отбрако- вывать «нетипичные, просто устроенные» цепи, объявляя «случайными» те, которые устроены достаточно нерегулярно, достаточно сложно. Эти соображения приводят ко «второму» подходу А. Н. Колмогорова к понятию «случайности», в котором акцент делается не на «простоту» рассматриваемых алгоритмов, а на «сложность» самих цепей и «напря- мую» вводится некоторая числовая характеристика «сложности», призван- ная показывать степень «нерегулярности» в образовании этих цепей. Этой характеристикой является так называемая «алгоритмическая» (или «колмогоровская») сложность /<д(х) индивидуальной цепи х по отношению к алгоритму А, определяемая, образно говоря, как длина той самой короткой бинарной цепи, которая, будучи поданной на «вход» алгоритма (машины, компьютера, ...) А, позволяет на «выходе» эту цепь восстановить. Формальные определения даются следующим образом. Пусть S — совокупность всех конечных бинарных цепей х = (х\, Х2, ... ..., хл), |х| (=/г) —ее длина и Ф —некоторый класс алгоритмов. Слож- ностью цепи х е Е по отношению к алгоритму А е Ф называется число K4(x) = min{|p|: А(р)=х}, т. е. минимальная длина (|р|) той бинарной цепи р на «входе» алгоритма А, которая восстанавливает на «выходе» цепь х (А(р) = х). В [34] А. Н. Колмогоров устанавливает, что (для некоторых важных классов алгоритмов Ф) имеет место следующий результат: существует
ИСТОРИЯ СТАНОВЛЕНИЯ МАТЕМАТИЧЕСКОЙ ТЕОРИИ ВЕРОЯТНОСТЕЙ 893 универсальный алгоритм U е Ф такой, что для любого А 6 Ф найдется константа С(А) такая, что для любой цепи х е S Ки(х)^КА(х) + С(А), а для разных универсальных алгоритмов U' и (/" \Ки' ~~ Кв" | С, х G Е, где С не зависит от хеЕ. (А. Н. Колмогоров отмечает в [34], что одно- временно аналогичный результат был установлен Р. Соломоновым.) Это обстоятельство (с учетом также того, что для «типичных» цепей х значение Ки(х) растет с ростом |х|) оправдывает следующее определе- ние: сложностью цепи хеЕ по отношению к классу алгоритмов Ф называется величина К(х) = ^(х), где U — некоторый универсальный ал- горитм из Ф. Величину К(х) принято называть алгоритмической или колмогоров- ской сложностью «объекта» х. А. Н. Колмогоров рассматривал эту ве- личину как меру количества алгоритмической информации, содержа- щейся в «конечном объекте» х, называя ее энтропией х и полагая, что это понятие является даже более фундаментальным, нежели вероятност- ное понятие количества информации, требующее для своего определения знания вероятностного распределения на «объектах» х. Величину К(х) можно трактовать также как показатель степени сжа- тия «текста» х. Если в класс Ф включать алгоритмы типа простого перечисления элементов, то становится понятным, что (с точностью до константы) сложность К(х) цепи х не превышает ее длины |х|. С другой стороны, простые рассмотрения показывают, что количество (бинарных) цепей х сложности менее К не превышает 2К — 1, что есть число раз- личных «входных» бинарных последовательностей длины, меньшей К (\+2 +... + 2К~[ =2К-1). Далее, простые рассуждения (см., например, [15]) показывают, что су- ществуют цепи х, сложность которых (с точностью до константы) равна их длине |х|, и что не может быть большого числа цепей, допускающих сильное сжатие (доля цепей сложности и — а не превосходит 2“°). Все эти рассмотрения естественным образом приводят к следующему определению: «алгоритмически случайными»(по отношению к классу алгоритмов Ф) на- зываются те цепи х, алгоритмическая сложность К(х) которых близка к |х|. Иначе говоря, алгоритмический подход объявляет «случайными» те цепи х, у которых сложность является максимальной (К(х) ~ |х|). Введенное А. Н. Колмогоровым понятие сложности, алгоритмической случайности породило целое направление, именуемое «колмогоровской сложностью», с многочисленными применениями в самых разнообразных
894 ИСТОРИЯ СТАНОВЛЕНИЯ МАТЕМАТИЧЕСКОЙ ТЕОРИИ ВЕРОЯТНОСТЕЙ областях математики и ее применений (см. подробнее, например, [38], [45]—[48], [22]). / В теории же вероятностей эти новые понятия положили начало боль- шому циклу работ по выяснению того, для каких «алгоритмически случай- ных» цепей и последовательностей справедливы те или иные вероятностно- статистические закономерности (типа усиленного закона больших чисел, закона повторного логарифма; см., например, [16]), открывая, тем самым, возможности применения методов теории вероятностей и ее результатов и в тех областях, которые, как уже отмечалось выше со ссылкой на [24], не имеют прямого «отношения к понятиям случая и вероятности в соб- ственном смысле этого слова». Список литературы к очерку истории становления математической теории вероятностей [1] Александров П. С., X и н ч и н А. Я. Андрей Николаевич Колмого- ров (к пятидесятилетию со дня рождения) Ц Успехи математических наук. — 1953. — Т. 8, № З.-С. 177-200. [2] Б а ш е л ь е (Bachelier L.). Theorie de la speculation // Annales de ГЁсо1е Normale Superieure.— 1900.— V. 17.— P. 21—86. [3] Бернулли Я. О законе больших чисел. Ч. 4: Искусство предположе- ний. — М.: Наука, 1986.— С. 23—59. [4] Бернштейн С. Н. Опыт аксиоматического обоснования теории веро- ятностей Ц Сообщения Харьковского математического общества. Сер. 2. — 1917.-Т. 15.-С. 209-274. [5] Б о л ь м а н (Bohlmann G.). Lebensversicherungsmathematik Ц Encyklopaedie der mathematischen Wissenschaften. — Bd. I, Heft 2. — Artikel ID4b. — Leipzig: Teubner, 1903. [6] Больцман (Boltzmann L.). Wissenschaftliche Abhandlungen. — V. 1—3. — Leipzig: Barth, 1909. [7] Больцман, H а б л (Boltzmann L., Nabl J.). Kinetische Theorie der Materie Ц Encyklopaedie der mathematischen Wissenschaften. — Bd. V, Heft 4. — Leipzig: Teubner, 1907. —S. 493—557. [8] Б о p e л ь (Borel Ё.). Lemons sur la theorie des fonctions. — Paris: Gauthier- Villars, 1898; Ed. 2.— Paris: Gauthier-Villars, 1914. [9] Б о p e л ь (Borel Ё.). Quelques remarques sur les principes de la theorie des ensembles // Mathematische Annalen. — 1905. — V. 60. — P. 194—195. [10] Брогги (Broggi U.). Die Axiome der Wahrscheinlichkeitsrechnung. Disser- tation. Gottingen, 1907. (См. также [19].) [11] Браун (Brown R.). A brief account of microscopical observations made in the months of June, July, and August, 1827, on the particles contained in the
СПИСОК ЛИТЕРАТУРЫ 895 pollen of plants; and on the general existence of active molecules in organic and inorganic bodies. — Philosophical Magazine N.S.— 1828. V. 4. — P. 161 — 173. [12] Б p о д e н (Broden T.). Wahrscheinlichkeitsbestimmungen bei der gewohnlichen Kettenbruchentwicklung reeller Zahlen // Akad. Forh. Stockholm. — 1900.— V. 57. - P. 239-266. [13] Вальд (Wald A.). Die Widerspnjchsfreiheit des Kollektivbegriffes der Wahr- scheinlichkeitsrechnung Ц Ergebnisse eines mathematischen Kolloquiums. — 1937.-V. 8.-P. 38-72. [14] Виль (Ville J. A.). Etude critique de la notion de collectif. — Paris: Gauthier- Villars, 1939. [15] В и т а н ь и П., Ли М. Колмогоровская сложность: двадцать лет спустя // Успехи математических наук. — 1988. — Т. 43, № 6. — С. 129—166. [16] Вовк В. Г. Закон повторного логарифма для случайных по Колмогорову, или хаотических, последовательностей Ц Теория вероятностей и ее примене- ния. - 1987. - Т. 32, № 3. - С. 456-468. [17] Гиббс (Gibbs J. W.). Elementary Principles in Statistical Mechanics. Devel- oped with especial reference to the rational foundation of thermodynamics. — New Haven: Yale Univ. Press, 1902; New York: Dover, 1960. [18] Гюлден (Gylden H.). Quelques remarques relativement a la representation de nombres irrationnels au moyen des fractions continues Ц Comptes Rendus. Paris.-1888.-V. 107.-P. 1584-1587. [19] Die Entwicklung der Wahrscheinlichkeitstheorie von den Anfangen bis 1933 / Ed. I. Schneider. — Berlin: Akademie-Verlag, 1989. [20] Дэвид (David F. N.). Games, Gods and Gambling. The Origin and History of Probability and Statistical Ideas from the Earliest Times to the Newtonian Era. —London: Griffin, 1962. [21] Звон кин А. К., Левин Л. А. Сложность конечных объектов и обос- нование понятий информации и случайности с помощью теории алгоритмов Ц Успехи математических наук. — 1970. — Т. 25, № 6. — С. 85—127. [22] Кирхгер, Ли, Витаньи (Kirchherr W., Li М., Vitanyi Р). The miraculous universal distribution //Mathematical Intelligencer. — 1997. —V. 19, №4.-P. 7-15. [23] Колмогоров (Kolmogoroff A.). Grundbegriffe der Wahrscheinlichkeits- rechnung. — Berlin: Springer, 1933; Berlin—New York: Springer, 1973. [24] Колмогоров A. H. Основные понятия теории вероятностей. — М.—Л.: ОНТИ, 1936; 2-е изд.-М.: Наука, 1974; 3-е изд.-М.: ФАЗИС, 1998. [25] Колмогоров (Kolmogorov A. N.). Foundations of the Theory of Proba- bility.—New York: Chelsea, 1950; 2nd ed. — New York: Chelsea, 1956. [26] Колмогоров A. H. Роль русской науки в развитии теории вероятностей Ц Роль русской науки в развитии мировой науки и культуры.— Т. I, кн. 1.— М.: Изд-во Моск, ун-та, 1947.— С. 53—64. [27] Колмогоров А. Н. Общая теория меры и исчисление вероятностей // Коммунистическая академия. Секция естественных и точных наук. Сборник работ математического раздела. — Т. 1. — М., 1929. — С. 8—21. (См. так- же [28], с. 48-58.)
896 ИСТОРИЯ СТАНОВЛЕНИЯ МАТЕМАТИЧЕСКОЙ ТЕОРИИ ВЕРОЯТНОСТЕЙ [28] Колмогоров А. Н. Теория вероятностей и математическая статистика. М.: Наука, 1986. [29] Колмогоров (Kolmogoroff A.). Ober die analytischen Methoden in der J^ahrscheinlichkeitsrechnung Ц Mathematische Annalen. — 1931. — V. 104.— P. 415-458. (См. также [28], c. 60-105.) [30] Колмогоров (Kolmogoroff A.). Sulla forma generale di un processo sto- chastico omogeneo. (Un problema di Bruno de Finetti.) // Atti della Accademia Nazionale dei Lincei.— 1932.— V. 15.— P. 805—808. (См. также [28].) [31] Колмогоров (Kolmogoroff A.). Ancora sulla forma generale di un processo omogeneo Ц Atti della Accademia Nazionale dei Lincei. — 1932. — V. 15.— P. 866—869. (См. также [28].) [32] Колмогоров (Kolmogorov A. N.). On tables of random numbers Ц Sankhya A. - 1963. - V. 25, № 4. - P. 369-376. [33] Колмогоров A. H. Теория информации и теория алгоритмов. М.: Наука, 1987. [34] Колмогоров А. Н. Три подхода к определению понятия «количество информации» Ц Проблемы передачи информации. — 1965.— Т. 1, № 1.— С. 3-11. (См. также [33], с. 213-223.) [35] Колмогоров (Kolmogorov A. N.). Logical basis for information theory and probability theory Ц IEEE Transactions on Information Theory. — 1968. — V. 14, № 5.-P. 662-664. (См. также [33], c. 232-237.) [36] Колмогоров A. H. Комбинаторные основания теории информации и исчисления вероятностей Ц Успехи математических наук. — 1983.— Т. 38, № 4. - С. 27-36. [37] Колмогоров (Kolmogorov A. N.). On logical foundations of probability theory Ц Probability Theory and Mathematical Statistics (Tbilisi, 1982). Berlin etc.: Springer-Verlag, 1983. — P. 1—5. — (Lecture Notes in Mathematics; V. 1021) (См. также [28], c. 467-471.) [38] Колмогоров A. H., Успенский В. А. Алгоритмы и случайность Ц Теория вероятностей и ее применения. — 1987.— Т. 32, № 3. — С. 425—455. [39] Лаплас (Laplace Р. S., de). A Philosophical Essay on Probabilities. — New York: Dover, 1951; —Первое издание: La Place P. S. Essai philosophique sur les probabilites. — Paris, 1814. [40] Лебег (Lebesgue H.). Lemons sur Tintegration et la recherche des fonctions primitives. — Paris: Gauthier-Villars, 1904. [41] Лем мель (Lammel R.). Untersuchungen Ober die ermittlung der Wahr- scheinlichkeiten. Dissertation. ZGrich, 1904. (См. также [19].) [42] Ли, В и т а н ь и (Li М., Vitanyi Р. М. В.). An Introduction to Kolmogorov Complexity and its Applications. — 2nd ed. — Berlin—New York: Springer- Verlag, 1997. [43] Майстров Л. E. Теория вероятностей. Исторический очерк. — М.: Нау- ка, 1967. [44] Максвелл (Maxwell J. С.). The scientific letters and papers of James Clerk Maxwell.-V. I: 1846-1862.- V. II: 1862-1873.- V. Ill: 1874-1879 / Ed. P. M. Harman. — Cambridge: Cambridge Univ. Press, 1990, 1995, 2002.
СПИСОК ЛИТЕРАТУРЫ 897 [45] Мартин-Лёф П. О понятии случайной последовательности Ц Теория вероятностей и ее применения, — 1966.— Т. 11, № 1. —С. 198—200. [46] Мартин-Лёф (Martin-Ldf Р.). The definition of random sequences // Information and Control. — 1966.— V. 9, № 6. — P. 602—619. [47] Мартин-Лёф (Martin-Lof P.). On the notion of randomness Ц Intuitionism and Proof Theory: Proceedings of the conference at Buffalo, NY, 1968 / Ed. A. Kino et al. Amsterdam: North-Holland, 1970.— P. 73—78. [48] Мартин-Лёф (Martin-Lof P). Complexity oscillations in infinite binary sequences Ц Zeitschrift fGr Wahrscheinlichkeitstheorie und verwandte Gebiete. — 1971.-V. 19.-P. 225-230. [49] фон Мизес (Mises R., von). Fundamentalsatze der Wahrscheinlichkeits- rechnung Ц Mathematische Zeitschrift. — 1919. — V. 4. — P. 1—97. [50] фон Мизес (Mises R., von). Grundlagen der Wahrscheinlichkeits- rechnung Ц Mathematische Zeitschrift. — 1919. — V. 5. — P. 52—99; 1920. — V. 7. - P. 323. [51] фон Мизес (Mises R., von). Mathematical Theory of Probability and Statistics. — New York—London: Academic Press, 1964. [52] Ньютон (Newton I.). The Mathematical Works of Isaac Newton / Ed. D. T. Whiteside. — V. 1. —New York: Johnson, 1967. [53] О теории вероятностей и математической статистике (переписка А. А. Мар- кова и А. А. Чупрова). — М.: Наука, 1977. [54] Плато (Plato J., von). Creating Modem Probability. Its Mathematics, Physics and Philosophy in Historical Perspective. — Cambridge: Cambridge Univ. Press, 1994. [55] П о й я (Polya G.). Uber den zentralen Grenzwertsatz der Wahrscheinlichkeits- rechnung und das Momentenproblem // Mathematische Zeitschrift. — 1920. — V. 8.-P. 171-181. [56] Пуанкаре (Poincare H.). Calcul des probabilites. — Paris: G. Carre, 1896. [57] Пуанкаре (Poincare H.). Sur le probleme des trois corps et les equations de la dynamique. I, II Ц Acta Mathematica. — 1890.— V. 13.— P. 1—270. [58] Сельванатан и др. (Selvanathan A., Selvanathan S., Keller G., War- rack B., Bartel H.). Australian Business Statistics. — Melbourne: Nelson, An International Thomson Publ. Co., 1994. [59] Смолуховский (Smoluchowski M. R., von). Zur kinetischen Theorie der Brownschen Molekularbewegung und der Suspensionen Ц Annalen der Physik. - 1906. - V. 21. - P. 756-780. [60] Сэвидж (Savage L. J.). The Foundations of Statistics. — New York: Wiley; London: Chapman & Hall, 1954. [61] Тодхантер (Todhunter I.). A History of the Mathematical Theory of Probability from the Time of Pascal to That of Laplace. — New York: Chelsea, 1949; —Первое издание: Cambridge: Macmillan, 1865. [62] У и м а н (Wiman A.). Uber eine Wahrscheinlichkeitsaufgabe bei Ketten- bruchentwicklungen // Akad. Forh. Stockholm. — 1900. —V. 57. —P. 829—841. [63] Успенский, Семёнов (Uspensky V. A., Semenov A. L.). What are the gains of the theory of algorithms: basic developments connected with the concept 13 - 9728
898 ИСТОРИЯ СТАНОВЛЕНИЯ МАТЕМАТИЧЕСКОЙ ТЕОРИИ ВЕРОЯТНОСТЕЙ of algorithm and with its application in mathematics Ц Algorithms in Modern Mathematics and Computer Science (Urgench, 1979). — Berlin etc.: Springer- Verlag, 1981. —P. 100—234. — (Lecture Notes in Computer Science; V. 122.) [64] Файн (Fine T. L.). Theories of Probability. An Examination of Foundations. — New York—London: Academic Press, 1973. [65] де Финетти (Finetti В., de). Sulle probability numerabili e geometriche Ц Istituto Lombardo. Accademia di Scienze e Lettere. Rendiconti (2). — 1928. — V. 61.-P. 817—824. [66] де Финетти (Finetti В., de). Sulle funzioni a incremento aleatorio Ц Accademia Nazionaledei Lincei. Rendiconti (6).— 1929. —V. 10. —P. 163—168. [67] де Финетти (Finetti В., de). Integrazione delle funzioni a incremento aleatorio Ц Accademia Nazionale dei Lincei. Rendiconti (6).— 1929.— V. 10.— P. 548-553. [68] де Финетти (Finetti В., de). Probabilismo: saggio critico sulla teoria delle probability e sul valore della scienza. — Napoli: Perrella, 1931; Ц Logos. — 1931. —V. 14. —P. 163—219. —English transl.: // Erkenntnis. The International Journal of Analytic Philosophy. — 1989.— V. 31. —P. 169—223. [69] де Финетти (Finetti В., de). Probability, Induction and Statistics. The Art of Guessing. — New York etc.: Wiley, 1972. [70] де финетти (Finetti В., de). Teoria delle probability: sintesi introduttiva con appendice critica. —V. 1, 2.— Turin: Einaudi, 1970. — English transl.: Theory of Probability: A Critical Introductory Treatment. — V. 1,2. — New York etc.: Wiley, 1974, 1975. [71] Фреше (Frechet M.). Sur 1’integrale d’une fonctionnelle etendue a un ensemble abstrait // Bulletin de la Societe Mathematique de France. — 1915.— V. 43.-P. 248-265. [72] Хокинс (Hawkins T.). Lebesgue’s Theory of Integration. Its Origin and Development.— Madison, Wis. — London: Univ. Wisconsin Press, 1970. [73] Чёрч (Church A.). On the concept of a random sequence Ц American Mathematical Society. Bulletin. - 1940. - V. 46, № 2.-P. 130-135. [74] Ширяев A. H. Основы стохастической финансовой математики: В 2- хт.-М.: ФАЗИС, 1998. [75] Эйнштейн (Einstein A.). Uber die von der molekularkinetischen Theorie der Warme geforderte Bewegung von in ruhenden Flussigkeiten suspendierten Teilchen Ц Annalen der Physik. — 1905. — V. 17. — P. 549—560.
Библиографическая справка (главы IV—VIII) ГЛАВА IV § 1. Закон «нуля или единицы» Колмогорова содержится в его книге [32]. По поводу закона «нуля или единицы» Хьюитта и Сэвиджа см. также А. А. Боровков [7], Л. Брейман [8], Р. Эш [81]. § 2—4. Основные результаты здесь получены А. Н. Колмогоровым и А. Я. Хин- чиным (см. [32] и литературу там). См. также книги В. В. Петрова [53] и В. Стоута [66]. По поводу вероятностных методов в теории чисел см. книгу Й. Кубилюса [36]. Уместно будет здесь напомнить историю вопроса «усиленный закон больших чисел —закон повторного логарифма» для схемы Бернулли. Первой работой, в которой возник усиленный закон больших чисел, была ра- бота Э. Бореля о нормальности чисел из множества [0, 1) (Ё. Borel. Les probabilites denombrables et leurs applications arithmetiques Ц Rendiconti del Circolo Matematico di Palermo. — 1909.— V. 27.— P. 247—271). Если воспользоваться обозначениями из примера 2 § 3, то для величин л 5я=Е(,^=1)-0 Л=1 полученный Э. Борелем результат состоял в том, что для почти всех (по мере Лебега) си € [0, 1) существует такое W = /V(cu), что IWI 1п(л/2) I п । у/2п для всех п ?V(cu). Тем самым, в частности, Sn =о(п) почти наверное. Следующий шаг был сделан Ф. Хаусдорфом (Е Hausdorff. Gnindztige der Mengenlehre. — Leipzig: Veit, 1914), который установил, что почти наверное Sn = о(/г1/2+е) для всякого е > 0. В 1914 году Г. Харди и Дж. Литтлвуд (G. Н. Hardy, J. Е. Littlewood. Some problems of Diophantine approximation Ц Acta Mathematica. — 1914.— V. 37.— P. 155—239) показали, что почти наверное Srt = O((n In /г),/2). В 1922 году Г. Штейнгауз (Н. Steinhaus. Les probabilites denombrables et leur rapport a la theorie de la mesure // Fundamenta Mathematicae. — 1923. — V. 4. — P. 286—310) уточнил результат Харди и Литтлвуда, показав, что почти наверное В 1923 году А. Я. Хинчин (A. Khitchine. Uber dyadische Briiche Ц Mathematische Zeitschrift. — 1923. — V. 18. — P. 109—116) устанавливает, что Sn = O(\/n In In n) почти наверное. 13*
900 БИБЛИОГРАФИЧЕСКАЯ СПРАВКА (ГЛАВЫ IV—VIII) Наконец, через год А. Я. Хинчин (A. Khintchine. Ober einen Satz der Wahr- scheinlichkeitsrechnung Ц Fundamenta Mathematicae. — 1924. — V. 6. — P. 9—20) получает окончательный результат («закон повторного логарифма»): почти навер- ное lim sup —===== = 1. п у/(п/2) In In п (Отметим, что в рассматриваемом случае а2 = Е[/(& = 1) — 1/2]2= 1/4, что объ- ясняет возникновение множителя л/2, а не привычного множителя 2/г; ср. с фор- мулировкой теоремы 1 в § 4.) Как уже упоминалось в § 4, следующий шаг по установлению справедливо- сти закона повторного логарифма для широкого класса независимых случайных величин был сделан в 1922 году А. Н. Колмогоровым (A. Kolmogoroff. Ober das Gesetz des iterierten Logarithmus // Mathematische Annalen. — 1929. — V. 101.— P. 126—135). § 5. См. по этим вопросам книги В. В. Петрова [92], А. А. Боровкова [7], Д. Дакуна-Кастелля и М. Дюфло [86]. ГЛАВА V § 1— При изложении теории стационарных (в узком смысле) случайных последовательностей использованы книги Л. Бреймана [8], Я. Г. Синая [63] и Дж. Ламперти [38]. Простое доказательство максимальной эргодической теоремы дано А. Гарсиа [12]. ГЛАВА VI § 1. Теории стационарных (в широком смысле) случайных последовательностей посвящены книги Ю. А. Розанова [60], И. И. Гихмана и А. В. Скорохода [13], [14]. Пример 6 часто приводился в лекциях А. Н. Колмогорова. § 2. По поводу ортогональных стохастических мер и стохастических интегралов см. также Дж. Дуб [20], И. И. Гихман и А. В. Скороход [14], Ю. А. Розанов [60], Р. Эш и М. Гарднер [82]. ) § 3. Спектральное представление (2) получено Г. Крамером и М. Лоэвом (см., например, [42]). В других терминах такое представление содержится в работе А. Н. Колмогорова [29]. См. также книги Дж. Дуба [20], Ю. А. Розанова [60], Р. Эша и М. Гарднера [82]. § 4. Подробное изложение вопросов статистического оценивания ковариаци- онной функции и спектральной плотности содержится в книгах Э. Хеннана [71] и [72]. § 5—6 . См. также книги Ю. А. Розанова [60], Дж. Ламперти [38], И. И. Гих- мана и А. В. Скорохода [13], [14]. § 7. Изложение здесь следует книге Р. Ш. Липцера и А. Н. Ширяева [41]. ГЛАВА VII § 1. Большинство основных результатов теории мартингалов получено Дж. Дубом [20]. Теорема 1 содержится у П. Мейера [47]. См. также книги П. Мейера
БИБЛИОГРАФИЧЕСКАЯ СПРАВКА (ГЛАВЫ IV—VIII) 901 [48], Р. Ш. Липцера и А. Н. Ширяева [41], И. И. Гихмана и А. В. Скорохода [14], Ж. Жакода и А. Н. Ширяева [87]. § 2. Теорема 1 часто называется теоремой «о преобразовании свободного вы- бора», [20]. По поводу тождеств (13), (14) и фундаментального тождества Вальда см. книгу [9]. § 3. Правое неравенство (25) было установлено А. Я. Хинчиным в работе 1923 года (A. Khintchine. Uber dyadische Bruche Ц Mathematische Zeitschrift. — 1923. — V. 18. — P. 109—116) на пути доказательства закона повторного логарифма. Чтобы пояснить, что же привело А. Я. Хинчина к необходимости получения этого неравенства, напомним схему доказательства усиленного закона больших чисел у Э. Бореля и Ф. Хаусдорфа (см. также данный выше комментарий к § 2—4 главы IV). Пусть £|,£2, ••• — последовательность независимых одинаково распреде- ленных случайных величин с P{£j = 1} = P{£i = -1}= 1/2 (схема Бернулли), •Si =£| +... + £rt. Доказательство Э. Бореля того, что Sn = о(п) почти наверное, состояло, в сущ- ности, в следующем: поскольку для всякого 6 > 0 рЛ£>1 > Я < ES" < 3"2 _ 3 и п Г J nW nW ~ nW’ ТО si-0 л^п k^n k^n £ при п —>оо, и, значит, по лемме Бореля—Кантелли (§ 10 главы II) — —>0 почти наверное. Доказательство Ф. Хаусдорфа того, что для всякого е>0 почти наверное Sn =о(л,/2+с), шло аналогичным образом: поскольку ES2r = O(nr) для всякого целого г > 1 /(2е), то R^n k^n $27 S Е|р7^| {27 52 р+277-*0 k^n k^n при п—>оо, где с — некоторая константа. Отсюда (снова по лемме Бореля—Кантелли) получаем, что почти наверное ____>о Из приведенных рассмотрений видим, что ключевым моментом в доказа- тельствах было получение «хорошей» оценки для вероятностей Р{|5Л| >/(/г)}, где t(n)=п у Бореля и t(n) = п,/2+с у Хаусдорфа (у Харди и Литтлвуда t(n) = (п In /г),/2). Именно для получения «хорошей» оценки вероятностей Р{|Sn| t(n)} А. Я- Хин- чину и понадобились его «неравенства Хинчина» (25) (точнее, правое из этих неравенств).
902 БИБЛИОГРАФИЧЕСКАЯ СПРАВКА (ГЛАВЫ IV—VIII) По поводу вывода неравенств Хинчина (и правого, и левого) для любого р >0 и об оптимальности констант Ар и Вр в (25) см. обзорную статью: Г. Пешкир, А. Н. Ширяев. Неравенства Хинчина и мартингальное расширение сферы их дей- ствия Ц Успехи математических наук. — 1995.— Т. 50, вып. 5.— С. 3—62. Из правого неравенства (25) при р = 2т А. Я. Хинчин получает, что для вся- кого t > 0 Р{|ХЛ| > /к r2mE|X„|2'n г2тщ2т. В силу формулы Стирлинга (2т)! 2тт! где D = у/2. Поэтому, полагая т , находим, что ^DeXp{1-2^l}=DeeXP{_w}=CeXP{_2^2} с с = De = х/2е. Их этой оценки следует неравенство Р{|$я|>0О"^, которое и было использовано А. Я. Хинчиным для доказательства того, что Sn = О(\/п In In п) почти наверное. В книге Ю. Ш. Чао и Г. Тейчера [72] можно найти большой материал по поводу приведенных в этом параграфе неравенств. Теорема 2 принадлежит Э. Ленгля- РУ [39]. \ § 4. См. монографию Дж. Дуба [20]. J § 5. Излагаемый здесь материал следует статьям Ю. М. Кабанова, Р. Ш. Лип- цера и А. Н. Ширяева [26], Г.-Ю. Энгельберта и А. Н. Ширяева [79] и книге Ж. Неве [50]. Теорема 4 и пример даны Р. Ш. Липцером. § 6. Приводимый здесь подход к проблематике «абсолютная непрерывность и сингулярность» и излагаемые результаты содержатся в работе Ю. М. Кабанова, Р. Ш. Липцера и А. Н. Ширяева [26]. § 7. Теоремы 1 и 2 принадлежат А. А. Новикову [52]. Лемма 1 является «дискретным» аналогом известной теоремы Гирсанова (см. [41]). § 8. См. также монографии Р. Ш. Липцера и А. Н. Ширяева [91], Ж. Жакода и А. Н. Ширяева [87], в которых излагается теория предельных теорем для слу- чайных процессов достаточно общей природы (мартингалы, семимартингалы, ...). § 9. Здесь изложение следует [98], [100]. Развитие изложенного подхода к обобщению формулы Ито дано в статье Г. Фёллмера, Ф. Проттера и А. Н. Ши- ряева [101].
БИБЛИОГРАФИЧЕСКАЯ СПРАВКА (ГЛАВЫ IV—VIII) 903 § 10. Мартингальным методам в страховании посвящена книга X. Гербе- ра [123]. Приводимые доказательства близки к тексту из [98]. § 11 — 12. Более детальное изложение вопросов, относящихся к применениям мартингальных методов в финансовой математике и инженерии, см. в [100]. § 13. Основными монографиями по теории и задачам оптимальных правил остановки являются книги Е. Б. Дынкина и А. А. Юшкевича [102], Г. Роббинса, Д. Сигмунда и И. Чао [59], А. Н. Ширяева [78]. ГЛАВА VIII § 1—2 . По поводу определений и основных свойств марковских цепей см. также книги: Е. Б. Дынкин и А. А. Юшкевич [102], Е. Б. Дынкин [21], А. Д. Вентцель [11], Дж. Дуб [20], И. И. Гихман и А. В. Скороход [14], Л. Брейман [8], Кай-Лай Чжун [75], [120], Д. Ревюз [117]. § 3—7 . О проблематике предельных, эргодических и стационарных распреде- лений вероятностей для марковских цепей см. статью А. Н. Колмогорова [28] и книги: В. Феллер [69], А. А. Боровков [7], [104], Р. Эш [80], Кай-Лай Чжун [120], Д. Ревюз [117], Е. Б. Дынкин и А. А. Юшкевич [102]. § 8. Простое случайное блуждание является классическим примером простей- ших марковских цепей, для которых были открыты многие закономерности (как, скажем, свойства возвратности и невозвратности, свойства эргодичности и др.). Эти вопросы рассматриваются во многих книгах —см., например, цитированные выше книги [7], [80], [120], [117]. § 9. Интерес к задачам об оптимальной остановке был обусловлен проблема- тикой статистического последовательного анализа (А. Вальд [9], М. де Гроот [18], Ш. Закс [22], А. Н. Ширяев [78]). Собственно теории оптимальных правил оста- новки для марковских цепей посвящены книги Е. Б. Дынкина и А. А. Юшке- вича [102], А. Н. Ширяева [78], некоторые разделы книги П. Биллингсли [106]. Мартингальный подход к задачам об оптимальной остановке изложен в моногра- фии Г. Роббинса, Д. Сигмунда и И. Чао [59]. ОЧЕРК ИСТОРИИ СТАНОВЛЕНИЯ МАТЕМАТИЧЕСКОЙ ТЕОРИИ ВЕРОЯТНОСТЕЙ Приводимый очерк был написан автором как дополнение к третьему изданию книги А. Н. Колмогорова «Основные понятия теории вероятностей» [32].
Список литературы [1] Александров П. С. Введение в общую теорию множеств и функций. — М.: Гостехиздат, 1948. [2] Александрова Н. В. Математические термины. — М.: Высшая школа, 1978. [3] Бернштейн С. Н. О работах П. Л. Чебышева по теории вероятностей Ц Научное наследие П. Л. Чебышева. Вып. 1: Математика. — 1945. —С. 59—60. [4] Бернштейн С. Н. Теория вероятностей. — 4-е изд. — М.: Гостехиздат, 1946. [5] Биллингсли П. Сходимость вероятностных мер. — М.: Наука, 1977. [6] Большее Л. Н., С м и р н о в Н. В. Таблицы математической статисти- ки.-3-е изд. — М.: Наука, 1983. [7] Боровков А. А. Теория вероятностей. — 3-е изд. — М.: УРСС, 1999. [8] Б р е й м а н (Breiman L.). Probability. — Reading, МА: Addison-Wesley, 1968. [9] Вальд А. Последовательный анализ. — М.: Физматгиз, 1960. [10] Вандер Варден Б. Л. Математическая статистика. — М.: ИЛ, 1960. [11] В е нт* це л ь А. Д. Курс теории случайных процессов. — М.: Наука, 1975. [12] Га р с и a (Garsia А. М.). A simple proof of Е. Hopfs maximal ergodic theorem //Journal of Mathematics and Mechanics. — 1965. —V. 14, № 3. —P. 381—382. [13] Гихман И. И., Скороход А. В. Введение в теорию случайных про- цессов. — М.: Наука, 1977. [14] Гихман И. И., Скороход А. В. Теория случайных процессов: В 3 т.-М.: Наука, 1971-1975. [15] Гнеденко Б. В. Курс теории вероятностей. — 6-е изд. — М.: Наука, 1988. [16] Гнеденко Б. В., Колмогоров А. Н. Предельные распределения для сумм независимых случайных величин.— М.; Л.: Гостехиздат, 1949. [17] Гнеденко Б. В., Хинчин А. Я. Элементарное введение в теорию вероятностей. — 9-е изд. — М.: Наука, 1982. [18] Де Гроот М. Оптимальные статистические решения. — М.: Мир, 1974. [19] Дохерти (Doherty М.). An amusing proof in fluctuation theory Ц Combinatorial Mathematics, III: Proceedings of the Third Australian Conference, Univ. Queensland, St. Lucia, 1974. — Berlin etc.: Springer-Verlag, 1975. — P. 101—104. — (Lecture Notes in Mathematics; V. 452.) [20] Дуб Дж. Л. Вероятностные процессы. — M.: ИЛ, 1956. [21] Дынкин Е. Б. Марковские процессы. — М.: Физматгиз, 1963. [22] Закс Ш. Теория статистических выводов. — М.: Мир, 1975. [23] Ибрагимов И. А., Линник Ю. В. Независимые и стационарно свя- занные величины. — М.: Наука, 1965. Под номерами 85—101 идет литература, добавленная во втором издании к той, которая была приведена в первом издании книги. Под номерами 102—136 идет литература, добав- ленная в настоящем издании.
СПИСОК ЛИТЕРАТУРЫ 905 [24] Ибрагимов И. А., Розанов Ю. А. Гауссовские случайные процес- сы.—М.: Наука, 1970. [25] Исихара А. Статистическая физика. — М.: Мир, 1973. [26] Кабанов Ю. М., Липцер Р. Ш., Ширяев А. Н. К вопросу об абсолютной непрерывности и сингулярности вероятностных мер Ц Матема- тический сборник. — 1977. — Т. 104, № 2-— С. 227—247. [27] К е м е н и Дж., Снелл Дж. Конечные цепи Маркова. — М.: Наука, 1970. [28] Колмогоров А. Н. Цепи Маркова со счетным числом возможных со- стояний Ц Бюллетень МГУ. — 1937.— Т. 1, № 3. — С. 1—16. [29] Колмогоров А. Н. Стационарные последовательности в гильбертов- ском пространстве // Бюллетень МГУ. — 1941. —Т. 2, № 6.— С. 1—40. [30] Колмогоров А. Н. Роль русской науки в развитии теории вероятностей Ц Ученые записки МГУ. — 1947. — Вып. 91. — С. 53—64. [31] Колмогоров А. Н. Теория вероятностей Ц Математика, ее содержание, методы и значение. — М.: Изд-во АН СССР, 1956.— Т. II. —С. 252—284. [32] Колмогоров А. Н. Основные понятия теории вероятностей. — М.; Л.: ОНТИ, 1936; 2-е изд. М.: Наука, 1974; 3-е изд. М.: Фазис, 1998. [33] Колмогоров А. Н., Фомин С. В. Элементы теории функций и функ- ционального анализа. —6-е изд.-М.: Наука, 1989. [34] Колчин В. Ф., Севастьянов Б. А., Чистяков В. П. Случай- ные размещения. — М.: Наука, 1976. [35] Крамер Г. Математические методы статистики. — 2-е изд. — М.: Мир, 1976. [36] Кубилюс Й. Вероятностные методы в теории чисел. — Вильнюс: Гос. изд-во полит, и науч. лит. ЛитССР, 1959. [37] Ламперти Дж. Вероятность. — М.: Наука, 1973. [38] Ламперти (Lamperti J.). Stochastic Processes. — Aarhus Univ., 1974.— (Lecture Notes Series; № 38). [39] Ленгляр (Lenglart E.). Relation de domination entre deux processus Ц Annales de 1’lnstitut H. Poincare Sect. B. (N. S.).— 1977. — V. 13, № 2.— P. 171-179. [40] Леонов В. П., Ширяев А. Н. К технике вычисления семиинвари- антов Ц Теория вероятностей и ее применения. — 1959. — Т. IV, вып. 2. — С. 342-355. [41] Липцер Р. Ш., Ширяев А. Н. Статистика случайных процессов. — М.: Наука, 1974. [42] Л о эв М. Теория вероятностей. — М.: ИЛ, 1962. [43] Марков А. А. Исчисление вероятностей. — 3-е изд. — СПб., 1913. [44] Майстров Д. Е. Теория вероятностей (исторический очерк). — М.: Наука, 1967. ' [45] Математика XIX века / Под ред. А. Н. Колмогорова и А. П. Юшкевича. — М.: Наука, 1978. [46] Мешалкин Л. Д. Сборник задач по теории вероятностей. — М.: Изд-во МГУ, 1963. [47] Мейер (Meyer P.-А.). Martingales and Stochastic Integrals. I. — Berlin etc.:
906 СПИСОК ЛИТЕРАТУРЫ Springer-Verlag, 1972. — (Lecture Notes in Mathematics; V. 284). [48] Мейер П. - А. Вероятность и потенциалы. — M.: Мир, 1973. [49] Неве Ж. Математические основы теории вероятностей. — М.: Мир, 1969. [50] Неве (Neveu J.). Discrete-Parameter Martingales. — Amsterdam etc.: North- Holland, 1975. [51] Нейман Ю. Вводный курс теории вероятностей и математической статистики. — М.: Наука, 1968. [52] Новиков А. А. Об оценках и асимптотическом поведении вероятностей непересечения подвижных границ суммами независимых случайных величин Ц Известия АН СССР. Серия математическая. — 1980. — Т. 40, вып. 4. — С. 868—885. [53] Петров В. В. Суммы независимых случайных величин. — М.: Наука, 1972. [54] Прохоров Ю. В. Асимптотическое поведение биномиального распре- деления Ц Успехи математических наук. — 1953.— Т. VIII, вып. 3 (55). — С. 135-142. [55] Прохоров Ю. В. Сходимость случайных процессов и предельные теоремы теории вероятностей // Теория вероятностей и ее применения. — 1956.-Т. 1, вып. 2.-С. 177-238. [56] П р oV о р о в Ю. В., Розанов Ю. А. Теория вероятностей. — 2-е изд. — М.: Наука, 1973. [57] Рамачандран Б. Теория характеристических функций. — М.: Наука, 1975. [58] Реньи (Renyi A.) Probability Theory. — Amsterdam: North-Holland, 1970. [59] Роббинс Г., Сигмунд Д., Чао И. Теория оптимальных правил остановки. — М.: Наука, 1977. [60] Розанов Ю. А. Стационарные случайные процессы. — М.: Физматгиз, 1963. [61] С а р ы м с а к о в Т. А. Основы теории процессов Маркова. — М.: Гостехиздат, 1954. [62] Севастьянов Б. А. Ветвящиеся процессы. — М.: Наука, 1971. [63] Синай Я. Г. Введение в эргодическую теорию. — Ереван: Изд-во Ереван, ун-та, 1973. [64] Сираждинов С. X. Предельные теоремы для однородных цепей Маркова. — Ташкент: Изд-во АН УзССР, 1955. [65] Справочник по теории вероятностей и математической статистике / Под ред. В. С. Королюка. — Киев: Наукова думка, 1978. [66] Стоут (Stout W. Е). Almost Sure Convergence. — New York etc.: Academic Press, 1974. [67] Teopin имов1’рностей. — Кшв: Вища школа, 1976. [68] Тодхантер (Todhunter I.). A History of the Mathematical Theory of Pro- bability from the Time of Pascal to that of Laplace.— London: Macmillan, 1865. [69] Феллер В. Введение в теорию вероятностей и ее приложения: В 2-х т.— М.: Мир, 1984. [70] Хал мош П. Теория меры. — М.: ИЛ, 1953.
СПИСОК ЛИТЕРАТУРЫ 907 [71] X е н н а н Э. Анализ временных рядов. — М.: Наука, 1964. [72] X е н н а н Э. Многомерные временные ряды. — М.: Мир, 1974. [73] Чао, Тейчер (Chow У. S., Teicher Н.). Probability Theory. Independence, Interchangeability, Martingales. — 3rd ed. — New York: Springer-Verlag, 1997. [74] Чебышев П. Л. Теория вероятностей: Лекции акад. П. Л. Чебышева, читанные в 1879, 1880 гг. / Издано А. Н. Крыловым по записи А. М. Ляпу- нова. — М.; Л., 1936. [75] Чжун Кай-лай. Однородные цепи Маркова. — М.: Мир, 1964. [76] Ширяев А. Н. Случайные процессы. — М.: Изд-во МГУ, 1972. [77] Ширяев А. Н. Вероятность, статистика, случайные процессы: В 2-х т. — М.: Изд-во МГУ, 1973—1974. [78] Ширяев А. Н. Статистический последовательный анализ. — 2-е изд. — М.: Наука, 1976. [79] Энгельберт, Ширяев (Engelbert H.-J., Shiryaev A. N.). On the sets of convergence of generalized submartingales Ц Stochastics. — 1979. — V. 2, №3. — P. 155—166. [80] Э ш (Ash R. B.). Basic Probability Theory.— New York etc.: Wiley, 1970. [81] Эш (Ash R. B.). Real Analysis and Probability. — New York etc.: Academic Press, 1972. [82] Эш, Гарднер (Ash R. B., Gardner M. E). Topics in Stochastic Processes. — New York etc.: Academic Press, 1975. [83] Яглом A. M., Яглом И. M. Вероятность и информация. — 3-е изд.— М.: Наука, 1973. [84] Гринвуд, Ширяев (Greenwood Р. Е., Shiryayev A. N.). Contiguity and the Statistical Invariance Principle. — London: Gordon & Breach, 1985. [85] Дадли (Dudley R. M.) Distances of probability measures and random variables Ц Annals of Mathematical Statistics. — 1968. — V. 39, № 5. — P. 1563—1572. [86] Д а к у н a - К а с те л л ь, Дюфло (Dacunha-Castelle D., Duflo М.). Probabilites et statistiques: 1, 2. — Paris: Masson. — 1: Problemes a temps fixe. — 1982; — 2: Problemes a temps mobile. — 1983. — Перев. на англ, яз.: Probability and Statistics: V. I, II.— Berlin etc.: Springer-Verlag, 1986. [87] Жакод Ж., Ширяев A. H. Предельные теоремы для случайных процессов: В 2-х т. — М.: Физматлит, 1994. [88] Золотарев В. М. Современная теория суммирования независимых случайных величин. — М.: Наука, 1986. [89] Ле Кам (Le Cam L.). Asymptotic Methods in Statistical Decision Theory. — Berlin etc.: Springer-Veriag, 1986. [90] Лизе, Вайда (Liese E, Vajda 1.). Convex Statistical Distances. — Leipzig: Teubner, 1987. [91] Липцер P. LLL, Ширяев A. H. Теория мартингалов. — M.: Наука, 1986. [92] Петров В. В. Предельные теоремы для сумм независимых случайных величин. — М.: Наука, 1987. [93] Поллард (Pollard D.). Convergence of Stochastic Processes. — Berlin etc.: Springer-Verlag, 1984.
908 СПИСОК ЛИТЕРАТУРЫ [94] Пресман Э. Л. О сближении по вариации распределения суммы независимых бернуллиевских величин с пуассоновским законом Ц Теория вероятностей и ее применения. — 1985. — Т. XXX, вып. 2.— С. 391—396. [95] Розанов Ю. А. Теория вероятностей, случайные процессы и матема- тическая статистика. — М.: Наука, 1985. [96] Ротарь В. И. К обобщению теоремы Линдеберга—Феллера Ц Матема- тические заметки. — 1975. — Т. 18, вып. 1. —С. 129—135. [97] Севастьянов Б. А. Курс теории вероятностей и математической статистики. — М.: Наука, 1982. [98] Ширяев (Shiryayev A. N.) Probability. — 2nd ed. — Berlin etc.: Springer- Verlag, 1995. [99] Ширяев (Shirjayev A. N.) Wahrscheinlichkeit — Berlin: VEB Deutscher Verlag der Wissenschaften, 1988. [100] Ширяев A. H. Основы стохастической финансовой математики: В 2- хт.-М.: ФАЗИС, 1998. [101] Фёллмер, Проттер, Ширяев (Follmer Н., Protter Ph., Shiryaev A. N.). Quadratic covariation and an extension of Ito’s formula Ц Bernoulli.— 1995.-V. 1, № 1/2.-P. 149-170. [102] Дынкин E. Б., Юшкевич А. А. Теоремы и задачи о процессах Марйрва. — М.: Наука, 1967. [103] Гнеденко, Колмогоров (Gnedenko В. V, Kolmogorov A. N). Limit Distributions for Sums of Independent Random Variables. — Reading, MA, etc.: Addison-Wesley, 1954. [104] Боровков А. А. Эргодичность и устойчивость случайных процессов. — М.: УРСС, 1999. [105] Гриммет, Стирзакер (Grimmet G. R., Stirzaker D. R.). Probability and Random Processes. — Oxford: Clarendon Press, 1993. [106] Биллингсли (Billingsley P). Probability and Measure. — 3rd ed. — New York: Wiley, 1995. [107] Боровков А. А. Математическая статистика. — M.: Наука, 1984. [108] Да рретт (Durrett R.). Probability: Theory and Examples. — Pacific Grove, CA: Wadsworth & Brooks/Cole, 1991. [109] Д a p p e т т (Durrett R.). Stochastic Calculus. — Boca Raton, FL: CRC Press, 1996. [НО] Дарретт (Durrett R.). Brownian Motion and Martingales in Analysis.— Belmont, CA: Wadsworth International Group, 1984. [Ill] Калленберг (Kallenberg O.). Foundations of Modem Probability. — 2nd ed. — New York: Springer-Verlag, 2002. [112] Карлин, Тейлор (Karlin S., Taylor H. M.). A First Course in Stochastic Processes. — 2nd ed. — New York etc.: Academic Press, 1975. [113] Кашин Б. С., Саакян А. А. Ортогональные ряды. — 2-е изд. — М.: АФЦ, 1999. [114] Жако д, Проттер (Jacod J., Protter Ph.). Probability Essentials. — Berlin etc.: Springer-Verlag, 2000. [115] H ётс (Neuts V. F.) Probability. — Boston, MA: Allyn & Bacon, 1973.
СПИСОК ЛИТЕРАТУРЫ 909 [116] Плато (Plato J.). Creating Modem Probability. — Cambridge: Cambridge Univ. Press, 1998. [117] Ревюз Д. Цепи Маркова. —M.: РФФИ, 1997. [118] Уильямс (Williams D.). Probability with Martingales. — Cambridge: Cambridge Univ. Press, 1991. [119] Холл, Хейде (Hall P, Heyde С. C.). Martingale Limit Theory and Its Applications. — New York etc.: Academic Press, 1980. [120] Чжун Кай-Лай (Chung Kai Lai). Elementary Probability Theory with Stochastic Processes. — 3rd ed. — Berlin etc.: Springer-Verlag, 1979. [121] Математическая энциклопедия: В 5 т. / Гл. ред. И. М. Виноградов. — М.: Советская энциклопедия, 1977—1985. [122] Стиглер (Stigler S. М.). The History of Statistics: The Measurement of Uncertainty Before 1900. —Cambridge: Belknap Press of Harvard Univ. Press, 1986. [123] Ге p б e p X. Математика страхования жизни. — M.: Мир, 1995. [124] Эрен фесты П. и Т. (Ehrenfest Р, Ehrenfest Т.). Uber zwei bekannte Einwande gegen das Boltzmannsche H-Theorem Ц Physikalische Zeitschrift. — 1907.-V. 8.-P. 311-314. [125] Теория вероятностей и математическая статистика: энциклопедия / Гл. ред. Ю. В. Прохоров. — М.: Большая Российская энциклопедия, 1999. [126] Вольфрам (Wolfram S.). The Mathematica® Book. — 4th ed. — Champaign; Cambridge: Wolfram Media; Cambridge Univ. Press, 1999. [127] Дуб (Doob J. L.). What is a martingale? // The American Mathematical Monthly. - 1971. - V. 78. - P. 451 -463. [128] Синай Я. Г. Курс теории вероятностей. — М.: Изд-во МГУ, 1985.-2-е изд., 1986. [129] Синай (SinaT Ya. G.). Topics in Ergodic Theory. — Princeton, NJ: Princeton Univ. Press, 1999.— (Princeton Mathematical Series; V. 44.) [130] Вальтере (Walters P) An Introduction to Ergodic Theory. — New York etc.: Springer-Verlag, 1982. [131] Бул и некий А. В., Ширяев А. Н. Теория случайных процессов.— М.: Физматлит, 2003. [132] Хмаладзе Э. В. Мартингальный подход в теории непараметрических критериев согласия Ц Теория вероятностей и ее применения. — 1981. — Т. XXVI, вып. 2.-С. 246-265. [133] Гамильтон (Hamilton J. В.). Time Series Analysis. — Princeton, NJ: Princeton Univ. Press, 1994. [134] Бернулли Я. О законе больших чисел. — Ч. 4: Искусство предположе- ний. — М.: Наука, 1986. [135] Лукач Е. Характеристические функции. — М.: Наука, 1979. [136] Хренников (Khrennikov A.). Interpretations of Probability. — Utrecht: VSP, 1999.
Предметный указатель Я(С) 188 8(D) 188 (В, 5)-рынок 752 — безарбитражный 755 — полный 761 ^-измеримость 104 d-система Дынкина 175 (В, 221 &/£-измеримая функция 221 А-система 175 тг-А-система 175 тг-система 175 а-алгебра 163, 171, 218 — остаточная 529 —, порожденная разбиением 219 ----случайной величиной 218 — хвостовая 529 S-представление 763 U-образная кривая 127 А абсолютная непрерывность асимптоти- ческая 470 ---- вероятностных распределений 196, 242, 467 ----мер 196, 242, 467, 706 -------, достаточные условия 710 абсолютно непрерывный тип распреде- ления 196 авторегрессионная схема 584 аксиоматика Колмогорова 166 аксиомы теории вероятностей 166 акция 752 алгебра множеств 28, 162 ----порожденная разбиением 29 ---- тривиальная 29 —, порожденная множеством 171 алгебраические свойства матриц 812 альтернатива Гаека—Фельдмана 715, 717 — Какутани 711 арбитраж 755 арбитражная возможность 755, 757 асимптотическая абсолютная непре- рывность 470 — малость 433 — разделимость полная 470 — сингулярность 470 атом 335 — разбиения 29 Б базис ортонормированный счетный 343 Байеса теорема 47 ---обобщенная 286 — формула 47 банахово пространство 334 банковский счет 752 белый шум 582 бернуллневские сдвиги 576 биномиальное распределение 36 близость по вариации 461 большие уклонения 93, 559 борелевская алгебра 180 — функция 214 борелевское множество 180 — пространство 284 броуновский мост 391 броуновское движение 390 ---, конструкция 390 В Вальда тождество 663 — фундаментальное тождество 666 вариационные неравенства 782, 860 вектор средних значений 384 вероятности разорения 747 вероятностная модель 31, 161, 166 ---в расширенном смысле 163
ПРЕДМЕТНЫЙ УКАЗАТЕЛЬ 911 вероятностно-статистическая модель 94, 290 вероятностно-статистический экспери- мент 291 вероятностное пространство 31, 166 ---- каноническое 316 ---- полное 195 ----фильтрованное 787 вероятность 164, 166 — апостериорная 47 — априорная 47 — исхода 30 — ошибок первого и второго рода 461 — первого возвращения 157, 819 ----попадания 157, 819 — разорения 109, 113 ----в страховании 746 вес 30 взаимная характеристика 657 винеровская мера 211 винеровский процесс 390, 727 ----условный 391 выбор без возвращения 23, 25, 40 — с возвращением 22, 25 выборки неупорядоченные 22, 25, 26 — упорядоченные 22, 25, 26 выборочная дисперсия 313 выборочное среднее 313 выигрыш в лотерею 33 выпуклая оболочка 868 Г гауссовская последовательность 390 — система 380, 388 — случайная величина 309 гауссовский вектор 382, 384 ----, критерий независимости компо- нент 384 — процесс 390 гауссовско-марковский процесс 391 геометрические вероятности 279 гильбертово пространство 338 ---- сепарабельное 343 главное значение логарифма 424 граф 140 Д двуточие условное 764 динамическое программирование 861 дискретная мера 195 дискретной теории восстановления основная лемма 825 дисперсия 62, 300 — выборочная 313 доверительный интервал 94, 98 ----, надежность 98 ----, уровень значимости 98 доминируемость 675 достаточная под-а-алгебра 291 ----минимальная 294 — статистика 291 3 задача о разборчивой невесте 868 — о размещении 25 — о разорении 109 — о совпадениях 32 закон «0 или 1» Бореля 531 ----Колмогорова 531, 692 ----Хьюитта и Сэвиджа 533 — арксинуса 120, 127 — больших чисел 67, 417 -------Бернулли 71 -------для марковских цепей 149 -------Пуассона 419 -------усиленный 540 -----------для мартингалов 701 ----------для процесса восстановле- ния 548 ----------Колмогорова 541, 544, 550 ----------, применение к «методу Монте-Карло» 547 ----------, применение к теории чи- сел 546 ----------, скорость сходимости 559 -------Хинчина 407 — повторного логарифма Хартмана и Винтнера 552
912 ПРЕДМЕТНЫЙ УКАЗАТЕЛЬ И игла Бюффона 279 игра благоприятная 653 — неблагоприятная 114, 653 — справедливая 653 Изинга модель 42 измеримая функция 214 измеримое отображение 564 — пространство 163 -----(С, <£(С)) 187 -----(D, ^(D)) 188 -----(/?, ЭД) 180 -----(/?°°, ^(/?°°)) 183 -----(/?я, ^(/?я)) 181 -----(RT, &(RT)) 185 -----(П И # ) 188 \/€Г / измеримость относительно разбиения 104 изометрическое соответствие 596 импульсная переходная функция филь- тра 600 инвариантное множество 567, 573 индикатор множества 54 интеграл верхний 255 — Ито стохастический 745 — Лебега 227-229 — Лебега—Стилтьеса 229, 245 — нижний 255 — Римана 253 ----- верхний 256 -----нижний 256 — Римана—Стилтьеса 253 — стохастический 592 — Хеллингера 464 интегральная теорема Муавра—Лапласа 84 интегрирование с помощью подстанов- ки 262 интервал доверительный 94 -----, надежность 98 -----, уровень значимости 98 интерполяция 628 информация Кульбака 469 — Фишера 96 испытание 51 исход 21 К каноническое вероятностное простран- ство 316 канторова функция 198 капитал 754 каплинг 459 квадратическая ковариация 657, 741 — характеристика 656 квантильная функция 455 класс апериодический 816 — неразложимый 814 — определяющий 404 —, определяющий сходимость 404 — Харди № 621 классификация состояний марковских цепей по асимптотическим свой- ствам 819 ----------марковских цепей по алге- браическим свойствам 812 классические модели 36 — распределения 36 классический способ задания вероят- ностей 32 ковариационная матрица 301 — функция 390, 580 -----, оценивание 609 -----, спектральное представление 586 ковариация 63, 300, 580 — квадратическая 657 комбинаторика 32 компенсатор 656 комплекс условий 21 конгруэнтность по распределению 439, 454 конечно-аддитивная вероятностная ме- ра 163 — вероятность 163 — стохастическая мера 589 конечномерные функции распределе- ния 315
ПРЕДМЕТНЫЙ УКАЗАТЕЛЬ 913 контигуальность последовательностей мер 470 координатный способ построения про- цесса 316 корреляционная функция 580 коэффициент корреляции 63, 301 ---- максимальный 311 кривая регрессии 304 критерий Карлемана единственности проблемы моментов 375 — Коши сходимости в среднем поряд- ка р 1 333 -------по вероятности 331 -------почти наверное 330 — согласия 490 кумулянт 368 Л лемма Бореля—Кантелли 327 — Бореля—Кантелли—Леви 700 — Кронекера 543 — Пратта 263 — Слуцкого 334 — Тёплица 542 — Фату 233 ---- для условных математических ожиданий 299 — Хелли—Брэя 406 линейная зависимость 63 — независимость 341, 342 линейное многообразие 340, 343 ----замкнутое 343 логарифмическая прибыль 753 локальная абсолютная непрерывность мер 706 — предельная теорема 79 М мажоранта супермартингальная 781 ----наименьшая 782 — эксцессивная 860 ----наименьшая 861 максимальная эргодическая теорема 570 максимальные неравенства 671 марковская зависимость 788 — цепь 136, 139, 321, 788 ---- апериодическая 818 ----в широком смысле 788 ---- возвратная 830 --------нулевая 830 --------положительная 831 ---- невозвратная 830 ----неразложимая 814 ----однородная 139, 793 ---- стационарная 148 ----эргодическая 811 марковский момент 649, 749 — процесс 318 марковское свойство 139, 788 ----в узком смысле 788 ----в широком смысле 788 ----обобщенное 801 ----строгое 156, 803, 804 — ядро 793 мартингал 129, 647, 749 — квадратично интегрируемый 656 — Леви 648 — локальный 650 — обобщенный 649 — обращенный 131, 658 мартингал-разность 655 мартингальное преобразование 651 математическая статистика 72, 94 математическое ожидание 58, 227, 228 ----, свойства 59, 230 ----условное 103, 269 --------, свойства 270 матрица ковариаций 301, 384 — неотрицательно определенная 301 — переходных вероятностей 139 — псевдообратная 392 — стохастическая 140 медиана 65 мера а-аддитивная 163 — а-конечная 163 — абсолютно непрерывная 196, 242, 467, 706 — атомическая 335
914 ПРЕДМЕТНЫЙ УКАЗАТЕЛЬ мера вероятностная 164 — винеровская 211 — внешняя 195 — внутренняя 195 — Гаусса 577 — дискретная 195, 463 — доминирующая 463 — инвариантная 809 — конечно-аддитивная 162 ---- стохастическая 589 — Лебега 194, 200, 203 ----л-мерная 202 — Лебега—Стилтьеса 194, 199 — мартингальная 756 — неопределенности 74 — непрерывная в «нуле» 165 — ортогональная 590, 593 — полная 195 — с ортогональными значениями 590 — сингулярная 196, 198 — со знаком 460 — стационарная 809 — стохастическая 589 — счетно-аддитивная 163 — считающая 463 — элементарная стохастическая 590 — Эшера 758 меры ортогональные 467, 706 — сингулярные 467, 706 — эквивалентные 467, 706 метод моментов 413 — Монте-Карло 280, 547 — наименьших квадратов 702 — одного вероятностного пространст- ва 452, 455 — характеристических функций 413 метризуемость слабой сходимости 447 метрика Ки Фан 453 — Леви—Прохорова 448 минимальная достаточная под-сг-алге- бра 294 многомерное гипергеометрическое рас- пределение 40 множество инвариантное 567, 573 — остановки 783 ---наблюдений 859 — почти инвариантное 567 — продолжения наблюдений 783, 859 модель Бернулли—Лапласа 854 — вероятностно-статистическая 94 — диффузии дискретная 852 — Изинга одномерная 42 — испытаний, связанных в цепь Мар- кова 137 — Кокса—Росса—Рубинштейна, CRR 759, 773 — Крамера—Лундберга 747 — смешанная авторегрессии и сколь- зящего среднего 586 — эксперимента с бесконечным чис- лом исходов 161 ---с конечным числом исходов 31 — Эренфестов 852 момент остановки НО, 131, 649 — первого возвращения 120 — разорения 747 моменты 229 — абсолютные 229 — смешанные 368 монотонный класс 172 ---наименьший 172 морфизм 564 мультиномиальное распределение 39 Н наборы неупорядоченные 22 — упорядоченные 22 надежность доверительного интервала 98 наименьшая сг-алгебра 171 — алгебра 171 — супермартингальная мажоранта 782 наименьший монотонный класс 172 начальное распределение 139 независимость 43, 48 — алгебр множеств 48, 49 — линейная 341, 342 — множеств (событий) 48, 177 — попарная 49, 63
ПРЕДМЕТНЫЙ УКАЗАТЕЛЬ 915 независимость приращений 390 — систем множеств 48, 49, 177 — случайных величин 57, 224 ---элементов 224 неклассические условия 433 некоррелированность 63, 300 непрерывность мер абсолютная 242 неравенства Буркхольдера 678 — для вероятностей больших уклоне- ний 683 — Дуба 671 — Дэвиса 679 — Марцинкевича—Зигмунда 677 — Хинчина 677 неравенство Белла 67 — Берри—Эссеена 86, 426, 475 — Бесселя 340 — Бонферрони 35 — Бореля 394 — Буля 169 — Гаека—Реньи 688 — Гёльдера 240 — Гумбела 36 — Дворецкого 687 — для вероятностей больших уклоне- ний 93 — Йенсена 239 ---для условных математических ожиданий 297 — Колмогорова 535 ---, односторонний аналог 539 — Коши—Буняковского 59, 239 — Коши—Шварца 59 — Леви 556 — Ляпунова 239 — Минковского 240 — Оттавиани 687 — Рао—Крамера 97 — Слепяна 394 — Фреше 36 — Чебышева 68, 238 ---, двумерный аналог 77 — Шварца 59 — Эссеена 376 норма 332 нормальные по Борелю числа 547 О область остановки наблюдений 783, 859 — продолжения наблюдений 783, 859 обновляющая последовательность 616 обобщенная теорема Байеса 286 — функция распределения 199 обобщенное марковское свойство 801 обратное уравнение 144 ----, матричная форма 144 объединение множеств 27, 167 определяющий класс 404 оптимальная остановка 776 ----марковских цепей 856 опцион 767 ----колл 769 ----пут 769 — Американского типа 769 — Европейского типа 768 — покупателя 769 — продавца 769 опционный контракт 767 ортогонализация Грама—Шмидта 342 ортогональное разложение 351 ортогональные меры 467 основная лемма дискретной теории восстановления 825 — теорема о стационарных распреде- лениях 836 ----об эргодических распределениях 836 относительная компактность 408, 409 отношение правдоподобия 136 отображение измеримое 564 ----сохраняющее меру 564 оценивание ковариационной функции 609 — спектральной плотности 610 ----функции 610 оценка 95, 303 — асимптотически несмещенная 611 — Бернштейна 78
916 ПРЕДМЕТНЫЙ УКАЗАТЕЛЬ оценка вероятности «успеха» 94 — максимального правдоподобия 43 — несмещенная 95, 296 — оптимальная в среднеквадратиче- ском смысле 64, 303 ---линейная 340, 351 — сильно состоятельная 703 — состоятельная 95, 608 — спектральной плотности Бартлетта 613 --------Журбенко 613 --------Парзена 613 — эффективная 95 ошибка первого и второго рода 461 — среднеквадратическая 303 П паритет колл-пут 776 перемешивание 569 пересечение множеств 28, 167 перестановочная система событий 169 перестановочное событие 532 переходная вероятность 139, 318 — функция 793 период неразложимого класса 816 — последовательности 815 — состояния 815 периодограмма 611 перпендикуляр 341, 351 платежное поручение 761 ---воспроизводимое 761 плотная последовательность случай- ных величин 471 плотность 196, 202, 215, 243 — /г-мерного гауссовского распреде- ления 203 — гауссовская двумерная 302 — условного распределения вероятно- стей 278 подходящее множество функций 179 полиномы Бернштейна 76 — Пуассона —Шарлье 346 --------нормированные 346 — Эрмита 345 ---нормированные 345 полнота 195 — (В, 5)-рынка 761 — пространства Lp, р 1 333, 334 полунорма 332 пополнение 194 портфель ценных бумаг 754 -------самофинансируемый 754 порядковая статистика 313 последовательности вполне детермини- рованные 615 — детерминированные 615 — мер взаимно контигуальные 470 ---полностью асимптотически раз- делимые 470 ---сближаемые 470 — обращенные 742 — предсказуемые 647 — регулярные 615 — сингулярные 615 — скользящего среднего 583 — стационарные в узком смысле 563 ---в широком смысле 580 ----------, спектральное представле- ние 595 — чисто детерминированные 615 — эргодические 574 последовательность обновляющая 616 — почти периодическая 581 — случайных величин плотная 471 — частично наблюдаемая 630 почти всюду 231 — инвариантное множество 567 — наверное 231 предельная пренебрегаемость 433 — теорема интегральная 71, 84 --- локальная 71, 79 предсказуемая последовательность 647 представление Колмогорова—Леви— Хинчина 441 — Леви—Хинчина 446 преобразование Бернулли 576 — Колмогорова 576 — Крамера 558
предметный указатель 917 преобразование Лапласа—Стилтьеса 748 — метрически транзитивное 567 — сохраняющее меру 564 — Фурье 353 — эргодическое 567 — Эшера 758 ----условное 760 прибыль логарифмическая 753 принцип инвариантности 431, 728 ----Донскера—Прохорова 728 — отражения 120 — подходящих множеств 173 проблема моментов 373 ----, критерий единственности 375 продожение меры 192 проекция 341 производная Лебега 467 — Радона—Никодима 243 производящая формула 264 пространство банахово 334 — исходов 21, 166 — состояний марковской цепи 139,788 — фазовое 139, 788 — элементарных событий 21, 166 процедура Робинса—Монро 696 процентная ставка банковская 752 ----рыночная 752 проценты простые 753 — сложные 753 процесс броуновского движения 390, 727 — ветвящийся 142 — винеровский 390 ----условный 391 — восстановления 322 — гауссовский 390 — гауссовско-марковский 391 — марковский 318 — Пуассона 747 — с независимыми приращениями 390 прямое произведение а-алгебр 182 ----мер 51 ----пространств 51, 189 — уравнение 144 ----, матричная форма 144 пустое множество 167 Р равенство Парсеваля 344 равномерная интегрируемость 234 разбиение 29, 371 разделимость последовательностей мер 470 различение гипотез 461 разложение Вольда 614, 618 — Дуба 655 — каноническое последовательности 730 — Крикеберга 687 — Лебега 467, 707 — Хана 460 размещение дробинок по ячейкам 25 размещения без повторений 23 — с повторениями 22 разность множеств 28, 167 распределение 196 — F 197 — t 197,310 — бернуллиевское 55 — бета 197 — биномиальное 37 — Вейбулла 313 — вероятностей процесса 223 ----случайного вектора 56 ----случайной величины 55, 215 — гамма 197 — гауссовское 89, 197 ----л-мерное 203 --------, характеристическая функция 382 ----, семиинварианты 372 ----среднее, дисперсия 300 — геометрическое 196 — гипергеометрическое 41 ----многомерное 40 — двойное экспоненциальное 313 — дискретное 196 ---- равномерное 196
918 ПРЕДМЕТНЫЙ УКАЗАТЕЛЬ распределение инвариантное 147, 809, 811 — Колмогорова 490 — Коши 197 — логарифмически нормальное 306 — многомерное 56, 201 — мультиномиальное 40 — начальное 139 — нормальное 89, 197 — обратно-биномиальное 213 — отрицательно-биномиальное 196 — Паскаля 196 — полиномиальное 40 — Пуассона, пуассоновское 87, 196 — равномерное на [а, д] 197 — сингулярное 198 — стационарное 147, 809, 811 — Стыодента 197, 310 — устойчивое 442 — хи 309 1 — хи-квадрат 197, 309 — экспоненциальное 197 --- двустороннее 197 — эргодическое 145 расстояние Какутани—Хеллингера 463 — Леви 406 — по вариации 460 ---, оценка Прохорова 479 расширенная случайная величина 217 — числовая прямая 191 реализация процесса 223 регулярная функция распределения 283 регулярные условные вероятности 281 ---распределения 282 -------, существование 284 рынок неполный 769 — полный 769 С свертка распределений 307 секвенциальная компактность 410 семейство марковских цепей 798 — мер относительно компактное 408 ---плотное 408 семиинварианты простые 370 — смешанные 368 сигма-аддитивность, а-аддитивность 163 символ Кронекера 345 симметрическая разность множеств 167 сингулярность мер 467 сингулярные меры 196, 467, 706 система лебеговских множеств 194 — ортогональных случайных величин 339 — ортонормированная 339 -----полная 343 -----случайных величин 339 — Радемахера 347 — событий перестановочная 169 — Хаара 347 скалярное произведение 338 скользящее среднее двустороннее 583 ----- одностороннее 584 скорость сходимости в усиленном за- коне больших чисел 557 -----в центральной предельной теоре- ме 475 слабая сходимость 399, 400 -----, метризуемость 447 случайная величина 54, 214 -----абсолютно непрерывная 215 -----безгранично делимая 439 -----биномиальная 55 ----- гауссовская 300 ----- дискретная 214 ----- инвариантная 567 -----комплексная 222 -----, не зависящая от будущего 649, 749 -----непрерывная 215 -----почти инвариантная 567 ----- простая 214 -----расширенная 217 ----- устойчивая 442 — последовательность 223, 390 — функция 223
ПРЕДМЕТНЫЙ УКАЗАТЕЛЬ 919 случайное блуждание 109, 120 ----простое 842 — число случайных величин 142 случайный вектор 56, 222 — процесс с дискретным временем 223 ----с непрерывным временем 223, 390 ----с ортогональными приращения- ми 593 — элемент 221 смешанная модель авторегрессии и скользящего среднего 586 событие 27, 166 — достоверное 28 — невозможное 28 — перестановочное 532 согласованности свойство 204, 208 — условие 209, 315 состояние цепи апериодическое погло- щающее 140 ---- возвратное 820 -------нулевое 824 -------положительное 824 ----достижимое 813 ---- невозвратное 820 ----несущественное 813 ----поглощающее 847 ----существенное 813 состояния цепи взаимно достижимые 813 ----сообщающиеся 813 сочетания без повторений 24 — с повторениями 22 спектральная мера 588 — плотность 583 ----, оценивание 610 — функция 588 — характеристика фильтра 601 спектральное окно 612 — представление ковариационной функции 586 ----стационарной последовательно- сти 595 справедливая цена опциона 769 среднее значение 58 средняя длительность блуждания 115 — продолжительность игры 109 стандартное отклонение 62, 300 статистика Бозе—Эйнштейна 26 — достаточная 291 — Максвелла—Больцмана 26 — Ферми—Дирака 26 статистическая независимость 48 степень разброса 62 стохастическая матрица 140 — мера 589 ---- конечно-аддитивная 589 ----ортогональная 590 ----с ортогональными значениями 590 ----элементраная 590 — последовательность 647 ----возрастающая 647 ----доминируемая 675 ----предсказуемая 647 — экспонента 259, 684 стохастический интеграл 592 ----Ито 745 строго марковское свойство 155, 803, 804 структурная функция 591 субмартингал 647 — локальный 650 — обобщенный 649 сужение меры 207 сумма множеств 167 суммирование по Чезаро 335, 832 суммы верхние 252 — нижние 252 супермартингал 648 супермартингальная мажоранта 781 суперхеджирование 770 —, верхняя цена 772 существенный супремум 334, 778, 779 схема Бернулли 67, 78 — серий 419, 426 сходимость в основном 399, 400, 405
920 ПРЕДМЕТНЫЙ УКАЗАТЕЛЬ сходимость в основном в смысле ко- нечномерных распределений 405 — в смысле Lp 324 — в среднем квадратическом 324 — в среднем порядка р 324 — по вариации 461 — по вероятности 324, 453 ----, метризуемость 447 — по закону 452 — по мере 324 — по распределению 325, 417, 452 — почти всюду 324, 453 — почти наверное 324, 453 — с вероятностью единица 324, 453 --------, неметризуемость 447 — слабая 399, 400 ----, метризуемость 447 счетная аддитивность 163 Т телескопическое свойство 105 ----второе 271 ----первое 270 теорема Байеса 47, 286 — Беппо «Леви 265 — Берри—Эссеена 86, 475 — Биркгофа—Хинчина 570 — Бохнера—Хинчина 365 — Вейерштрасса 76 — Герглотца 586 — Гирсанова, дискретная версия 722 — Гливенко и Кантелли 482 — Дуба 660, 682, 688 ----о максимальных неравенствах 672 ----о разложении субмартингалов 655 ----о случайной замене времени 660 ----о сходимости субмартингалов 688 ----о числе пересечений 682 — Ионеску Тулчи 318 — Кантелли 540 — Каратеодори 192 — Колмогорова и Хинчина 535 -------о «двух рядах» 537 ---о продолжении мер 208 ---о продолжении меры 204 ---о существовании процесса 316 ---о «трех рядах» 538 ---об интерполяции 629 ---об усиленном законе больших чисел 541, 544 — «Лебега о мажорируемой сходимости 234 — Леви 691 — Макмиллана 75 — Манна—Вальда 456 — Марцинкевича 366 — Мерсера 393 — Муавра—Лапласа 84 — непрерывности 414 — о баллотировке 133 — о возвратности Пуанкаре 565 — о «двух рядах» 537 — о замене переменных под знаком интеграла Лебега 244 — о монотонной сходимости 232 — о монотонных классах 173 -------, функциональная версия 179 — о нормальной корреляции 304 -------, векторный случай 387 — о преобразовании свободного выбо- ра 900 — о сходимости под знаком условных математических ожиданий 272 — о «трех рядах» 538 — Пифагора 351 — Пойа для случайных блужданий 847 ---для характеристических функций 365 — Прохорова 409 — Пуанкаре 432 --- о возвратности 565 — Пуассона 87, 419 — Радона—Никодима 243 — Рао и Блэкуэлла 296 — Улама 412
ПРЕДМЕТНЫЙ УКАЗАТЕЛЬ 921 теорема факторизации 292 — Фубини 246 — фундаментальная вторая 761 ---- первая 755 — Хелли 410 — Хелли—Брэя 407 — центральная предельная 413, 418, 421, 427, 434 -------для зависимых величин 726 -------функциональная 728 — Чернова 561 — эргодическая 145, 574, 605 ----максимальная 570 теория восстановления 668 тождество Вальда 132, 663 ----фундаментальное 666 — паритета колл-пут 776 — Пуанкаре 36 — Спицера 264 точки роста 196 траектория процесса 223 ---- типичная 75 треугольник Паскаля 23 У уравнение баланса 585 — Вальда—Веллмана 861 — восстановления 323 — Колмогорова—Чепмена 143, 317, 799 -------обратное 143 -------прямое 144 — обратное, матричная форма 144 — прямое, матричная форма 144 уравнения динамического программи- рования 859 уровень значимости 98 усиленный закон больших чисел 540 ----------для мартингалов 701 ----------для процесса восстановле- ния 548 ----------Колмогорова 541, 544, 550 ----------, скорость сходимости 559 условие асимптотической малости 433 ------- равномерной 728 — Крамера 557 — Линдеберга 421, 426 — Ляпунова 425 — предельной пренебрегаемости 433 -------равномерной 728 — согласованности 209, 315 условная вероятность 44, 266, 269 ----относительно а-алгебр 269 ------- разбиений 266 ------- разбиения 101 -------случайных величин 102, 269 ----регулярная 281 — дисперсия относительно а-алгебры 269 условное двуточие 764 — математическое ожидание 103, 106, 269 -------в широком смысле 340, 351 -------относительно а-алгебр 268 ----------случайных величин 106, 269 ----------событий 267, 275, 276 -------, свойства 270 устойчивая случайная величина 442 Ф фазовое пространство 139, 788 факторизационная теорема 292 фильтр 600 —, импульсная переходная функция 600 — Калмана—Бьюси 634, 638 — физически осуществимый 601 фильтрация 630 —, поток а-алгебр 647 формула Байеса 47 — дискретного дифференцирования 754 — замены переменных Ито 740 — интегрирования по частям 257 — Ито 746 ----, дискретная версия 740, 743 ----для броуновского движения 740 — обращения 361
922 ПРЕДМЕТНЫЙ УКАЗАТЕЛЬ формула пересчета математических ожиданий 243 ---условных математических ожи- даний 289, 712 — полной вероятности 46, 101, 104 — связи моментов и семиинвариантов 369 — Сеге—Колмогорова 634 ___Стирлинга 42 — трапеции 743 — умножения вероятностей 46 фундаментальная теорема теории ар- битража 751 фундаментальность в среднем порядка р 325, 333 ___по вероятности 325, 331 — с вероятностью единица 325, 330 фундаментальные теоремы математи- ческой^статистики 481 ---теории арбитража, вторая 761 __________, первая 755 функции распределения конечномер- ные 315 ___эмпирические 481 функция верхняя 551 ___ восстановления 322 ___гармоническая 874 — Дирихле 262 — измеримая 214 ___ ковариационная 580 ___концентрации 379 ___корреляционная 580 — нижняя 551 — ошибок 90 — полунепрерывная 402 — Радемахера 347 — распределения 55, 56, 191 ___/г-мерная 201 ---безгранично делимая 439 ___обобщенная 199 ___регулярная 283 ___случайного вектора 56 ---случайной величины 55, 215 ___ устойчивая 442 — супергармоническая 860, 874 — Хаара 348 — эксцессивная 860 фьючерс 768 X характеристика взаимная 657 — квадратическая 656 — фильтра спектральная 601 ---- частотная 601 характеристическая функция 353 ----, примеры 377 ----, свойства 356 ----безгранично делимая 439 ----множества 54 ---- устойчивая 442 ----устойчивого распределения 445 характеристических функций метод 413 хеджирование совершенное 769 Ц цена в задачах об оптимальной оста- новке 857 центральная предельная теорема 413, 418, 427, 434 --------для зависимых величин 726 --------функциональная 728 цепь Маркова 137, 321 ----однородная 139 ---- стационарная 148 циклический подкласс 816 цилиндрические множества 184 Ч частота 68 частотная характеристика фильтра 601 число пересечений 682 — размещений 23 — сочетаний 23 Э эквивалентность по распределению 454 эквивалентные меры 467, 706 экран отражающий 850, 851 экспонента стохастическая 259, 684
предметный указатель 923 экспоненциальное семейство 295 эргодическая теорема 145, 574 экстраполяция 623 в среднеквадратическом смысле эксцессивная мажоранта 860 605 -----наименьшая 860 -----максимальная 570 элементарная теорема теории восста- эргодичность 145, 567 новления 668 элементарное событие 21 Я энтропия распределения 73 ядро Фейера 611
Указатель обозначений ^324 324 4 325 4* 324 4 324 F„=>F 399 ЕСл=>Е4 325 F„-^F399 P„=i>P 400, 405 Р„ЛР 400 P„4-P405 М„4м403 Дя => д 403 Г)п -*1) 417 е = »?439 X = Y 454 Л® 392 А 28 А+В 28 ЛГ)В 28 ЛиВ 27 ЛДВ 65 дА 400 Ac(t) 260 Л^ 23 л/ 28, 162 а(Я 29, 171 BL 450 В\А 28 В(Ко, N; Р) 775 SB 181 SB{C) 188 SB(D) 188 SB(R) 180 SB(R) 181 SB(Rn) 181 SB(R°°) 184 SB{RT) 186 £B([0, 1]) 194 SB\ ®SBi 182 C 187 C+ 697 CN 775 C(F) 399 C(fN; P) 769, 770 C(/; P) 772 23 COv(t 7]) 62, 300, 580 D 188 D< 62 D(£\@) 108 D(£|#) 269 dP(X, У) 453 AFe(x) 59 (E, <f) 221 (E, <?, p) 400 <£,(A) 684 <?,(Л)259 <?r(P, P) 461 E£ 58, 227 E(t?...... i]n) 340 E(£; Л) 229 E«|D) 103 E(£|<&) 103 E(£|$?) 268 Ef^jy) 106, 269 E(£h........ %) 106 Ё(£ 1»?. rin) 340 erf 90 (A g) 591 F * G 307 F? 55, 215 /«215 & 163 &/S 221 171 Л. 171 Л 171 218 <^p 194 H Я 189 /er Ф(х) 89 <p(x) 89 H(x) 80 H(P, P) 464 H(a; P, P) 464 $ idP 229 A 5 £dP 227 Я (L— S) $ <(x) G(dx) 229 R (R-S) $ <(x) G(dx) 229 R (L) $ ^(x)dx 229 — OO L2 338 Lp 332 L°° 334 ЦР, P) 448 Le(w) 96 Lk(A) 121 ...,»?») 340 Jf(77i,%. •)343 l.i.m. 325 M(P) 756 (M)n 23 (M) 656 ..368 SDl^ 777 med 407 д 162 М(Д) 162 д(<^) 172 /zi x /Z2 246 N(A) 32 N(^) 30 /V(Q) 21
УКАЗАТЕЛЬ ОБОЗНАЧЕНИЙ 925 N(A) 756 Л(т, а2) 300 Л(т, R) 382 Р 30, 164 Р(Л) 30 Р(А|Я 101 Р(Л|<?) 269 Р(Л |т?) 102 Р(Л|£) 269 Р(В |Л) 44 Р(В 19} 266 P(B|$f) 267 Pi 55, 214 р(и>) 30 ^ = {Ра;а€й}408 Р 143 р(*> 143 P/v 776 (Ря) А (Ря) 470 (Ря) <1 (Ря) 470 (Ря) О (Р") 470 ЦР-РЦ 460 a(£) 218 ||Р-^11^450 Var(P - P) 460 HpU, !011139 X„*=max |X,-| 671 НМ КО 754 П 143 Л**’ 143 {X, Y) 657 R 180 [X, 657 R 181 [X]n 657 R(n) 580 R' 181 697 Z579 RT 185 Z(A) 589 P°° 183 Z(X) 589 Rn 181 X2 309 Rn 347 0ki 563 Rn(x) 347 £±»)339 (R, ^(P)) 180 (П, л/, P) 30, 163 ptf, rf) 63, 301 (Q, л/, PoifleO) 94 p(P, P) 463 #744 p(n) 580 =<: 30 s‘P| v*} 368 [oi,.... an] 22 a(S) 171 (аь ..., an) 22
Некоторые общематематические обозначения /? = (—оо, оо) — множество действительных чисел, действительная прямая, евкли- дово одномерное пространство R+ = [0, оо) R = [—оо, оо] — расширенная действительная прямая: R = R U {—оо} U {оо} Я+ = [0, оо] Q — множество рациональных чисел (?+ = (?П/?+ Rd — евклидово d-мерное пространство N — натуральные числа: или {0, 1, 2, ...}, или {1, 2, ...} Z —множество целых чисел: {0, ±1, ±2, ...} С — множество комплексных чисел (a, b) = {х G R: а < х < д}, [а, &] = {х G R: а х Ь} (a, b] = {x^R: а<х^Ь}, [а, b) = {x GR: а^х <Ь} inf X — нижняя грань множества XQR sup X — верхняя грань множества X С R inf хп — нижняя грань множества X — {хт, xm+t, ...} л>т sup хп — верхняя грань множества X = {хт, хт+\, ...} Если Хп ER, П 1, ТО lim inf хп = lim хп = sup inf хл, lim sup хп = lim хп = inf sup xn, n-*QQ n n^m л—*oo n n^m limxn=x <=> lim xn = lim xn = x <=> lim xn^x^ lim xn. Для действительных чисел: x+ = max(x, 0), x~ = — min(x, 0) [0, x=0 x V у = max(x, у), x Л у = min(x, y) [x] или [xj — наибольшее целое число, не превосходящее х |Y| — наименьшее целое, большее или равное х {1, х > 0, 0, х =* 0, -1, х<0 (иногда sign х определяется как 1, если х 0, и —1, если х < 0)
НЕКОТОРЫЕ ОБЩЕМАТЕМАТИЧЕСКИЕ ОБОЗНАЧЕНИЯ 927 хя ->х, где п е{1, 2, ...}, означает, что lim хп — х п хп Т означает, что х\ х2 ; хп f х означает, что хп | и lim хп = х п Хп 1 означает, что х\ х2 ; хп I х означает, что хп 1 и lim хп = х п Для комплексных чисел z = a + ib, где a, beR и / = — мнимая единица: z = а — ib — число, сопряженное с z \z\ — модуль числа z (= (а2 + Ь2)1/2) Re z, Im z— действительная и мнимая части z: Re z — a, Im z = b Для евклидова d-мерного пространства Rd: |х|— евклидова норма x = (xi, ..., хД т. е. (х2 +... + х|),/2 ху или (х, у) — скалярное произведение х = (xj, ..., Xd) и у = (у\, ...» yd), т. е. х\у\ + ... + xdyd В теории множеств: А п Т означает, что А । С А2 С ...; Ая Т А означает, что Ая Т и (J Ая = А Ап J, означает, что A i D Д2 D ...; Ап 1А означает, что Ап 1 и П Ап = А lim sup Artt или lim Ап, или {An б. ч.} означает Q ( U Ап ) — множество точек, принадлежащих бесконечному числу множеств Ап, п 1 lim inf Ап или lim Ап означает (J ( П ДЛ ) — множество точек, принадлежащих \п^т J всем Ап, п 1, за исключением, быть может, их конечного числа 1а или 1(A) — индикатор множества А {...} — множество Математические символы: — абсолютная непрерывность ~ — эквивалентность j_ _ ортогональность f = =0 / = 0(g) —lim sup (-0 <оо f~£-lim(^) = l — отношение отделено снизу от 0 и сверху от оо fog — композиция f и g f * g — свертка f и g
Альберт Николаевич Ширяев ВЕРОЯТНОСТЬ —2 Редактор Т. Толозова Тех. редактор В. Радионов Лицензия ИД №01335 от 24.03.2000 г. Подписано в печать 15.02.2004 г. Формат 60 х 90 1/16. Бумага офсетная №1. Печать офсетная. Печ. л. 25,5. Заказ № 9728 Санитарно-эпидемиологическое заключение №77.99.02.953.Д.002797.04.03 от 18.04.2003 г. Издательство Московского центра непрерывного математического образования. 121002, Москва, Большой Власьевский пер., 11. Тел. 241—72—85. Отпечатано с готовых диапозитивов в ППП «Типография ,,Наука“». 119009, Москва, Шубинский пер., 6. Книги издательства МЦНМО можно приобрести в магазине «Математическая книга», Большой Власьевский пер., д. 11. Тел. (095) 241—72—85. E-mail: biblioCmccme.ru