Текст
                    В. ФЕЛЛЕР ВВЕДЕНИЕ В ТЕОРИЮ
-%	ВЕРОЯТНОСТЕЙ
Ixj	И ЕЕ ПРИЛОЖЕНИЯ
ВВЕДЕНИЕ
В ТЕОРИЮ
ВЕРОЯТНОСТЕЙ
И ЕЕ
ПРИЛОЖЕНИЯ


AN INTRODUCTION TO PROBABILITY THEORY AND ITS APPLICATIONS WILLIAM FELLER (1906—1970) Eugene Higgins Professor of Mathematics Princeton University VOLUME II Second edition John Wiley & Sons, Inc. New York • London • Sydney • Toronto 1971
В. ФЕЛЛЕР ВВЕДЕНИЕ В ТЕОРИЮ ВЕРОЯТНОСТЕЙ И ЕЕ ПРИЛОЖЕНИЯ В 2-х томах Том 2 Перевод со второго английского издания Ю. В. Прохорова МОСКВА «МИР» 1984 Scan AAW
ББК 22.171 ФЗО УДК 519.24 Феллер В. ФЗО Введение в теорию вероятностей и ее приложения. В 2-х томах. Т. 2. Пер. с англ.— М.: Мир, 1984.— 738 с., ил. Второй том всемирно известного двухтомного курса теории вероятностей, написан- ного выдающимся американским математиком. Классическое учебное руководство, оказавшее значительное влияние на развитие современной теории вероятностей и подготовку специалистов. Перевод заново выполнен со второго переработанного автором издания. Предыдущее^издание выходило в русском переводе (М.: Мир, 1967). Для математиков—от студентов до специалистов по теории вероятностей, для физиков и инженеров, применяющих вероятностные методы. . 1702060000—113 Ф ----------------32—84. ч. 1 041 (01)—84 ’ 41 ББК 22.171 517.8 Редакция литературы по математическим наукам © Перевод на русский языКд «Мир»Д984
ИЗ ПРЕДИСЛОВИЯ К РУССКОМУ ИЗДАНИЮ 1967 г. Второй том книги известного американского математика В. Фет- лера „Введение в теорию вероятностей и ее приложения" вышел в США в 1966 г. Несмотря на большой промежуток времени между выходом первого и второго томов, оба тома имеют общий замысел и составляют единое целое. Книга дает строгое изложение теории вероятностей как самостоятельного раздела математики и в то же время знакомит читателя с опытными основаниями теории и различ- ными применениями. Последнее достигается включением большого числа примеров и задач. Книга очень богата содержанием. Многочисленные отступления от основного текста содержат сведения, интересные и специалистам. Большая работа, проведенная автором при подготовке второго тома, позволила существенно упростить изложение целых разделов (напри- мер, вывод асимптотических формул в теории случайных блужданий и задачах о разорении и многое другое). Изложение тщательно продумано. Оно часто дополняется замеча- ниями, отражающими отношение автора к приводимым фактам (см., например, замечание в гл. VI, 7, о том, что рассмотрение в теории очередей потоков вызовов с независимыми промежутками между вызовами и с законом распределения длины этих промежутков, отлич- ным от вырожденного или показательного, создает лишь иллюзию общности; трудно, говорит автор, найти примеры таких процессов, кроме разве движения автобуса по кольцевому маршруту без распи- сания). Напомню, что в первом томе автор удачно продемонстрировал тот факт, что сравнительно простые модели позволяют, хотя бы в первом приближении, правильно описать широкий круг практичес- ких задач (такими моделями в первом томе являются, например, размещения частиц по ячейкам, урновые схемы и случайные блужда- ния). Во многих случаях, где интуиция не подсказывает правильного порядка соответствующих вероятностей, автор приводил численные результаты. Подчеркивался ряд свойств случайности, идущих враз- рез с интуитивными представлениями (закон арксинуса, пропорцио- нальность времени до n-го возвращения величине ц2 и т. п.). Эти тенденции сохраняются и во втором томе (см., в частности, неодно- кратное обсуждение парадокса инспекции и сходных тем). После того как разобран дискретный случай, элементарная теория непрерывных распределений требует лишь нескольких слов дополнительного объяснения. Поэтому до всякой общей теории, в первых трех главах, автор излагает задачи, связанные с тремя важнейшими распределениями — равномерным, показательным и нормальным. При этом автор затрагивает и ряд глубоких вопросов (случайные разбиения и теоремы о покрытиях, отклонение эмпи-
6 Из предисловия к русскому изданию 1967 г. рического распределения от теоретического, характеризация нор- мального распределения независимостью статистик, структура; некоторых стационарных нормальных последовательностей и т. п.). Необходимые сведения из теории меры сообщаются в четвертой главе. Автор подчеркивает вспомогательный характер этих сведений (что отличает книгу Феллера от ряда других современных руко- водств, где до трети объема уходит на теорию меры и интеграла).. Важную роль играет гл. VI, являющаяся, как замечает автора собранием введений во все последующие главы. В настоящем томе, по-видимому, впервые излагается так обстоя- тельно теория преобразований Лапласа в применении к вероят- ностным проблемам (гл. VII, XIII, XIV). Много места отведена вопросам теории восстановления и случайным блужданиям (гл. VI*. XI, XII, XIV и XVIII). Предельные теоремы для сумм не- зависимых величин излагаются дважды: сначала как иллюстрация- операторных методов (гл. IX), а затем в общей форме в гл. XVII. Можно надеяться, что выход в свет русского издания второго тома книги Феллера окажет заметное воздействие на многие стороны развития теории вероятностей, в частности сильно по- влияет на характер преподавания теории вероятностей, позволив,, наконец, привести его в соответствие с современными требованиями. Профессор Феллер, узнав о подготовке перевода второго тома„ любезно прислал список ряда цеобходимых исправлений, которые были внесены в текст. Я весьма благодарен ему за эту любезность. В работе над переводом существенную помощь мне оказали А. В. Прохоров и В. В. Сазонов. Они внимательно прочли ру- копись перевода и сделали ряд ценных замечаний, которыми я воспользовался. Они также указали на ряд неточностей в ори- гинале. Пользуюсь случаем выразить им свою глубокую благодар- ность. 9 мая 1967 г. Ю. ПрОХОрОв:
ОТ ПЕРЕВОДЧИКА План второго английского издания данного тома (с которого .выполнен перевод) § целом повторяет план его первого издания, и в то же время автором внесено в текст большое число измене- ний. Подробно о них сказано в предисловии автора. При подготовке перевода второго тома неоценимую помощь оказал мне А. Прохоров, а в работе над отдельными частями -текста мне помогали А. Архангельский, А. Бряндинская, В. Матвеев, А. Ушакова, В. Ушаков, Н. Ушаков. Всем им я выражаю свою глубокую благодарность. :20 апреля 1983 г, /О. Прохоров
ПРЕДИСЛОВИЕ К ПЕРВОМУ ИЗДАНИЮ О. Нейгебауэру х) О et praesidium et dulce decus meum* 2) В то время когда писался первый том этой книги (между 1941 и 1948 гг.), интерес к теории вероятностей еще не был столь широким. Преподавание велось очень ограниченно, и такие вопросы, как цепи Маркова, которые теперь интенсивно используются в самых различных дисциплинах, рассматривались лишь как весьма специальные главы чистой математики. Поэтому первый том можно уподобить годному на все случаи жизни путеводителю для чело- века, отправляющегося в чужую страну. Чтобы отразить сущность теории вероятностей, в первом томе нужно было подчеркнуть как математическое содержание этой науки, так и удивительное разно- образие потенциальных применений. Некоторые предсказывали, что неизбежно возникающие из этой задачи колебания степени трудно- сти изложения ограничат полезность книги. На самом деле первым томом книги широко пользуется и сейчас, когда новизна этой книги пропала, а ее материал (включая способ изложения) можно почерпнуть из более новых книг, написанных для специальных целей. Книга, как нам кажется, все еще завоевывает новых друзей. Тот факт, что неспециалисты не застряли в местах, оказавшихся трудными для студентов-математиков, показывает невозможность объективного измерения уровня трудности; этот уровень зависит от типа информации, которую ищет читатель, и от тех деталей, которые он готов пропустить. Так, путешественник часто стоит перед выбором: взбираться ли ему на гору самому или использо- вать подъемник. Ввиду сказанного второй том написан в том же самом стиле, что и первый. Он включает более трудные разделы математики, но значительная часть текста может восприниматься с различной степенью трудности. Поясним это на примере способа изложения теории меры. Гл. IV содержит неформальное введение в основные идеи теории меры, а также дает основные понятия теории вероят- ностей. В этой же главе перечисляются некоторые факты теории меры, применяемые в последующих главах для того, чтобы сфор- мулировать аналитические теоремы в их простейшей форме и избе- жать праздной дискуссии об условиях регулярности. Основное назначение теории меры в этой связи состоит в том, чтобы оправ- х) Отто Нейгебауэр (р. 1899 г., с 1939 г.—в США) — австрийский математик, историк математики и астрономии. На русском языке опубликованы его книги «Лекции по истории античных математических наук. Том. I. Догре- ческад математика».—М.—Л.: ОНТИ, 1937 и «Точные науки древности».— М., 1968: 2) О отрада моя, честь и прибежище! —К Меценату («Славный внук, Меценат»), перевод А. Семенова-Тян-Шанского. — В кн.: Квинт Гораций Флакк, Оды.Эноды. Сатиры. Послания,—Mj Художественная литература, 1970,
Предисловие к первому изданию 9 дать формальные операции и переходы к пределу, чего никогда не потребовал бы нематематик. Поэтому читатели, заинтересован- ные в первую очередь в практических результатах, никогда не почувствуют какой-либо необходимости в теории меры. Чтобы облегчить доступ к отдельным темам, изложение во всех главах сделано столь замкнутым, сколь это было возможно. Иногда частные случаи разбираются отдельно от общей теории. Некоторые темы (такие, как устойчивые законы или теория вос- становления) обсуждаются в нескольких местах с различных по- зиций. Во избежание повторений определения и иллюстративные примеры собраны в гл. VI, которую можно описать как собрание введений к последующим главам. Остов книги образуют гл. V, VIII и XV. Читатель сам решит, сколько подготовительных глав нужно ему прочитать и какие экскурсы произвести. Специалисты найдут в этом томе новые результаты и доказа- тельства, но более важной представляется попытка сделать еди- ной общую методологию. В самом деле, некоторые части теории вероятностей страдают от того, что они недостаточно внутренне согласованы, а также от того, что группировка материала и спо- соб изложения в большой степени определяются случайностями исторического развития. В образующейся путанице тесно связан- ные между собой проблемы выступают разобщенными, а простые вещи затемняются усложненными методами. Значительные упро- щения были достигнуты за счет систематического применения и развития наилучших доступных сейчас методов. Это относится, в частности, к такой беспорядочной области, как предельные теоремы (гл. XVI, XVII). В других местах упрощения были до- стигнуты за счет трактовки задач в их естественном контексте. Например, элементарное исследование специального случайного блуждания привело к обобщению асимптотической оценки, кото- рая ранее была выведена тяжелыми, трудоемкими методами в мате- матической теории страхования (и независимо, при более ограни- чительных условиях, в теории очередей). Я пытался достичь математической строгости, не впадая в пе- дантизм. Например, утверждение, что 1/(1 +£2) является харак- теристической функцией для представляется мне жела- тельным и законным сокращением для логически корректного варианта: функция, которая в точке g принимает значение 1/(1+ £2), является характеристической функцией для функции, которая в точке х принимает значение -I'6’1*1- Боюсь, что краткие исторические замечания и ссылки не от- дают должного многим авторам, внесшим свой вклад в теорию вероятностей. Однако всюду, где было возможно, я старался „ сделать это. Первоначальные работы во многих случаях перек-
10 Предисловие к первому изданию рыты более новыми исследованиями, и, как правило, полные ссылки даются только на статьи, к которым читатель может обра- титься для получения дальнейшей информации. Например, нет ссылок на мои собственные работы по предельным теоремам, в то- же время какая-либо статья, описывающая результаты наблюде- ний или идеи, лежащие в основе примера, цитируется, даже если/ она совсем не содержит математики1). В этих обстоятельствах авторский указатель не дает никаких сведений о важности тех или иных исследований для теории вероятностей. Другая труд- ность состояла в справедливой оценке работ, которым мы обязаны новыми направлениями исследований, новыми подходами, новыми методами. Некоторые теоремы, рассматривавшиеся в свое время как поразительно оригинальные и глубокие, теперь получили простые доказательства и выступают в окружении более тонких результатов. Трудно воспринимать такие теоремы в их истори- ческой перспективе и нелегко понять, что здесь, как и в других, случаях, первый шаг значит очень многое. Я благодарен Исследовательскому бюро армии США за под- держку моей работы по теории вероятностей в Принстонском^ университете, где мне помогали Дж. Голдмэн, Л. Питт, М. Сил- верстейн. Они устранили значительное число неточностей и неяс- ных мест. Все главы переписывались много раз, и первоначальные варианты предшествующих глав распространялись среди моих друзей. Таким образом, благодаря замечаниям Дж. Эллиота». Р. С. Пинхема и Л. Дж. Сэвиджа возник ряд улучшений. Я особенно благодарен Дж. Л. Дубу и Дж. Волфовицу за советы и кри- тику. График случайного блуждания Коши подготовлен Г. Тро- тером. За печатанием наблюдала г-жа X. Мак-Дугл, и внешний? вид книги многим обязан ей. Вильям Феллер* Октябрь 1965 г. х) Эта система была принята, и в первом томе, однако она была непра- вильно понята некоторыми последующими авторами; они теперь приписывают- методы, использованные в книге, работавшим до этого ученым, которые на. могли знать их.
ПРЕДИСЛОВИЕ КО ВТОРОМУ ИЗДАНИЮ Характер и структура книги остались без изменений, но весь 'текст подвергся основательному пересмотру. Многие разделы были переписаны полностью (в частности, гл. XVII) и были добавлены некоторые новые параграфы. В ряде мест изложение упрощено благодаря усовершенствованным (а иногда и новым) рассуждениях^. В текст был также включен новый материал. При подготовке первого издания меня преследовал страх, что объем получится чрезмерно большим. Из-за этого, к сожалению, я провел несколько бесплодных месяцев, сокращая первоначаль- ный текст и выделяя отдельные места в мелкий шрифт. Этот ущерб теперь возмещен, и много усилий было потрачено на то, чтобы облегчить чтение книги. Встречающиеся время от времени повторения упрощают независимое чтение отдельных глав и по- зволяют связать некоторые части этой книги с материалом пер- вого тома. Расположение материала описано в предисловии к первому изданию, воспроизведенному здесь (см. второй абзац и далее). Я благодарен многим читателям за указание ошибок и упу- щений. Особо я благодарю Хаджала (D. A. Hejhal) из Чикаго за весьма полный и впечатляющий список опечаток и за замечания, касающиеся многих мест книги. ^Январь 1970 г.-, Принстон Вильям Феллер К моменту кончины автора работа над рукописью уже была завершена, но корректуры получены не были. Я благодарю изда- телей, выделивших сотрудника для тщательного сличения кор- ректуры с рукописью и за составление указателя. Проверку математического содержания книги произвели сообща Голдмэн (J. Goldman), Грюнбаум (A. Grunbaum), Маккин (Н. McKean), Питт (L. Pitt) и Питтенджер (A. Pittenger). Каждый математик понимает, какой невероятный объем работы стоит за этим. Я вы- ражаю свою глубокую признательность этим ученым и обращаю < ним слова искренней благодарности за их бескорыстный труд. Май 1970 г, Клара Н. Феллер
ОБОЗНАЧЕНИЯ Интервалы обозначаются чертой сверху: а, b—открытый, а, b—замкнутый интервал; полу- —। ।— открытые интервалы обозначаются а,Ь и а, Ь. Эти обозначения применяются также и в многомерном случае. Соответствующие соглашения о векторных обозначениях и упорядочении см. в гл. V, 1 (а также в гл. IV, 2). Символ (а, Ь) резервирован для пар и для точек. обозначают соответственно прямую, плоскость и r-мерное евклидово пространство. 1 означает ссылку на первый том; римские цифры ука- зывают номер главы. Так, 1; гл. XI, (3.6) указывает на отношение к § 3 гл. XI первого тома. ► указывает конец доказательства или серии примеров, и и обозначают соответственно нормальную плотность и нормальное распределение с нулевым математическим ожиданием и единичной дисперсией. О, о и ~ Пусть и и v зависят от параметра %, который стре- ограничено ->1 мится, скажем, к а. Предполагая, что v положи- тельно, мы пишем u = O(v) \ ограничено u = o(v) если ~ I —>0 и ~ v —> 1 если f(x)U{dx} об этом сокращении см. гл. V,3/ Относительно борелевских множеств и бэровских функций см. введение к гл. V.
ГЛАВА I ПОКАЗАТЕЛЬНЫЕ И РАВНОМЕРНЫЕ ПЛОТНОСТИ § 1. ВВЕДЕНИЕ В первом томе мы неоднократно имели дело с вероятностями, определяемыми суммами многих малых слагаемых, и пользовались приближениями вида ъ P{a<X<b}^f(x)dx. (1.1) а Основным примером служит нормальное приближение к биномиаль- ному. распределению1). Приближение этого типа обыкновенно устанавливается в форме предельной теоремы, включающей ряд все более и более «тонких» дискретных вероятностных моделей. Во многих случаях этот переход к пределу приводит, вообще говоря, к новому выборочному пространству, и последнее может быть интуитивно проще, чем первоначальная дискретная модель. Примеры, а) Показательные времена ожидания. Для того чтобы описать времена ожидания дискретной моделью, мы должны сде- лать время дискретным и условиться, что изменения могут осу- ществляться только в моменты времени б, 26, ... . Простейшее время ожидания Т есть время ожидания первого успеха в после- довательности испытаний Бернулли с вероятностью успеха р§. Тогда Р{Т>пб} = (1—р6)п и среднее время ожидания равно Е(Т) = б/рд. Эту модель можно усовершенствовать, если предпо- ложить б убывающим так, что математическое ожидание б/рб = а остается фиксированным. Любому фиксированному интервалу вре- мени t соответствует п & t/S испытаний, и, следовательно, при малом б мы имеем Р{Т>/}«(1 — 1у/б« <?-*/«, (1.2) что доказывается переходом к логарифмам. Эта модель описывает время ожидания как геометрически распределенную дискретную случайную величину, а (1.2) утверждает, что «в пределе» полу- чается показательное распределение. Интуиция подсказывает, что г) Другие примеры из первого тома: распределение арксинуса, гл. III,4; распределение числа возвращений в начальное состояние и времен первого прохождения, гл. III,7; предельные теоремы для случайных блужданий, гл. XIV; равномерное распределение, задача 20 в гл. XI,7.
14 Гл, I. Показательные и равномерные плотности более естественно начать с выборочного пространства, точками которого служат действительные числа, и ввести показательное распределение непосредственно. б) Случайный выбор, «Выбор точки наудачу» в интервале1) 0,1 является воображаемым экспериментом с очевидным интуитивным смыслом. Этот эксперимент может быть описан дискретными при- ближениями, но проще взять в качестве выборочного простран- ства весь интервал и приписать каждому подынтервалу в качестве вероятности его длину. Воображаемый эксперимент, заключаю- щийся в том, что производятся два независимых выбора точки в 0,1, дает пару вещественных чисел, и поэтому естественным выбороч- ным пространством служит единичный квадрат. В этом выбороч- ном пространстве «вероятность» почти инстинктивно приравни- вается «площади». Этого вполне достаточно для некоторых эле- ментарных целей, но рано или поздно возникает вопрос о том, что же в действительности означает слово «площадь». ► Как показывают эти примеры, непрерывное выборочное про- странство может быть проще для восприятия, чем дискретная модель, но определение вероятностей в нем зависит от такого аппарата, как интегрирование и теория меры. В счетных выбороч- ных пространствах можно было приписать вероятности всем вообще событиям, в то время как в пространствах произвольной природы эта простая процедура ведет к логическим противоречиям, и наша интуиция должна приспосабливаться к крайностям формальной логики. Мы вскоре увидим, что наивный подход может привести к затруднениям даже в сравнительно простых задачах. Ради спра- ведливости стоит сказать, что в то же время многие значительные вероятностные задачи не требуют четкого определения понятия вероятности. Иногда они имеют аналитический характер, а вероят- ностное содержание служит лишь опорой для нашей интуиции. Более существен тот факт, что при изучении сложных случайных процессов (и соответственно усложненных выборочных пространств) могут возникнуть важные и понятные задачи, не связанные с теми тонкими средствами, , которые используются при анализе процесса в целом. Типичное рассуждение может иметь следующий вид: если процесс вообще допускает математическое описание, то случайная величина Z должна иметь такие-то и такие-то свойства, а ее рас- пределение должно в силу этого удовлетворять такому-то уравне- нию. Хотя вероятностные соображения могут сильно влиять на ход исследования этого уравнения, последнее в принципе не зависит от аксиом теории вероятностей. Специалисты различных прикладных областей настолько привыкли иметь дело с подобными х) Для обозначения интервалов используется черта. Символ (а, Ь) сохра- няется для координатной записи точек на плоскости, см, обозначения в на- чале книги.
§ 2, Плотности. Свертки 15 проблемами, что они отрицают необходимость теории меры: они не знакомы с задачами другого типа и с ситуациями, где нечет- кие рассуждения приводили к неверным результатам1). Эти замечания постепенно разъясняются на протяжении этой главы, которая предназначена служить неформальным введением в теорию. В ней описываются некоторые аналитические свойства двух важных распределений, которые будут постоянно использо- ваться в этой книге. Специальные темы затрагиваются отчасти по причине важных применений, отчасти для демонстрации новых задач, требующих привлечения новых методов. Нет необходимости изучать их систематически или в том порядке, как они пред- ставлены. Всюду в этой главе вероятности понимаются как элементар- ные интегралы со всеми вытекающими отсюда ограничениями. Использование вероятностного «жаргона» и таких терминов, как случайные величины и математические ожидания, может быть оправдано с двух точек зрения. Можно рассматривать их как техническое вспомогательное средство для нашей интуиции, имею- щее в основе формальную аналогию с изложенным в первом томе. С другой стороны, все сказанное в этой главе может быть фор- мально безупречно обосновано предельным переходом от дискрет- ной модели, описанной в примере 2, а). Последняя процедура, хотя и не является ни необходимой, ни желательной, может быть хорошим упражнением для начинающих. § 2. ПЛОТНОСТИ. СВЕРТКИ Плотностью вероятности функция /, такая, что на прямой (или в «Я1) называется + со f (х) dx = 1. — 00 (2-1) Для начала мы рассмотрим ности (общий случай см. в только кусочно-непрерывные плот- гл. V,3). Каждой плотности f мы г) Роли строгости и интуиции часто понимаются неправильно. Как уже отмечалось в первом томе, природная интуиция и естественный способ мыш- ления дают Чиало, но они становятся сильнее по мере развития математиче- ской теории. Сегодняшняя интуиция и применения опираются на сложные теории вчерашнего дня. Кроме того, строгая теория не роскошь, а способ экономии мышления. В самом деле, наблюдения показывают, что в примене- ниях многие авторы полагаются на длинные вычисления, а не на простые рассуждения, которые им кажутся рискованными [ближайшая иллюстрация — пример 5,а)].
16 Гл. I. Показательные и равномерные плотности поставим в соответствие функцию распределения1) F, определен- ную равенством х I f(y)dy. (2.2) — 00 Это есть монотонная непрерывная функция, возрастающая от О до 1. Мы скажем, что f и F сосредоточены на интервале а^. если f равна нулю вне этого интервала. Плотность f будет рассматриваться как функция, задающая вероятности на интер- валах прямой; интервалу а, 6 = {а<х<&} соответствует вероят- ность ъ F(b)—F(a) = \f(x)dx. (2.3) t. Иногда эта вероятность будет обозначаться Р{а, Ь}. При таком распределении отдельной точке соответствует вероятность О, а замкнутому интервалу а, b—та же вероятность, что и а. Ъ. В простейшей ситуации действительная прямая служит «выбо- рочным пространством», т. е. результат воображаемого экспери- мента представляется числом. (Точно так же, как и в первом томе, это лишь первый шаг в построении выборочных про- странств, представляющих последовательности экспериментов.) Случайные величины являются функциями, определенными на вы- борочном пространстве. Для простоты мы договоримся на неко- торое время считать функцию U случайной величиной, если для каждого t событие состоит из конечного множества интер- валов. Тогда функция G(/) = P{U</} (2.4) может быть определена как интеграл от f по объединению этих интервалов. Функция G, заданная равенством (2.4), называется функцией распределения величины U. Если G является интегра- лом от некоторой функции g, то g называется плотностью рас- пределения G или (что равнозначно) плотностью величины U. Основная случайная величина—это, конечно, координатная величина2) X сама по себе, а все другие случайные величины 2) Мы напоминаем, что под «функцией распределения» понимается непре- рывная справа неубывающая функция с пределами 0 и 1 на — оо п +00- В первом томе мы преимущественно имели дело со ступенчатыми функциями. Теперь сосредоточим наше внимание на функциях распределения, задаваемых интегралами. Более подробно мы будем изучать функции распределения в гл. V. 2) Всюду, где это возможно, мы будем обозначать случайные величины (т. е. функции на выборочном пространстве) заглавными полужирными бук- вами, оставляя малые буквы для обозначения чисел или масштабных пара- метров. Это справедливо, в частности, для координатной величины X, а именно функции, определенной равенством X (х)=х.
§ 2. Плотности. Свертки 17 являются функциями X. Функция распределения X тождественна функции F, посредством которой задаются вероятности. Необхо- димо сказать, что любая случайная величина Y=g’(X) может рассматриваться как координатная величина на новой прямой. Как сказано выше, употребление этих терминов может быть оправдано аналогией с рассмотренным в первом томе. Следующий пример показывает, что наша модель может быть получена из дискретных моделей предельным переходом. Примеры, а) Группировка данных. Пусть F—заданная функ- ция распределения. Выберем фиксированное 6 > 0 и рассмот-* рим дискретную случайную величину Хб, которая в интервале (п— 1)б<х^пб принимает постоянное значение пб. Здесь п = 0, =ЬК ±2, .... В первом томе мы использовали совокупность чисел, кратных б, как выборочное пространство и описывали распределение вероятностей Х;; равенством р {Хд = пб} = F (nty—F ((n— 1) б). (2.5) Теперь Х6—случайная величина в расширенном выборочном про- странстве, и ее функция распределения—это функция, которая в интервале пд^х < (n-j- 1) б равна F (п$). В непрерывной мо- дели Хб служит приближением к X, получаемым отождествлением наших интервалов с их концами (процедура, известная статисти- кам как группировка данных). В духе первого тома мы будем рассматривать Х5 как основную случайную величину, и б—как свободный параметр. Полагая б—>0, мы получим предельные теоремы, устанавливающие, например, что F служит предельным распределением для Х;.. б) При х>0 событие {Х2^х} равносильно событию {— <Х<Ух}; случайная величина X2 имеет распределение, сосре- доточенное на 0, оо с функцией распределения F (Кх)—F (—Кх). После дифференцирования видно, что плотность g величины X2 равна g (х) = [/ (/х) + /(—Vrx)]fyrх при х > 0 и g (х) = 0 при х<0. Аналогично функция распределения X3 равна F (f/х) и имеет плотность у Н х2. >. Математическое ожидание X определяется формулой + 00 Е (X) = $ xf (х) dx (2.6) — 00 при условии, что интеграл сходится абсолютно. Математические ожидания аппроксимирующих дискретных величин Х3 из при- мера а) совпадают с римановыми суммами этого интеграла, и поэтому Е(Хб)—^Е(Х). Если и есть ограниченная непрерывная функция, то те же самые рассуждения применимы к случайной величине
18 Гл. I. Показательные и равномерные плотности ы(Х), и соотношение Е (и (Х6)) —> Е (и (X)) влечет за собой Е (и (X)) = и (x)f (х) dx. (2.7) — 00 Здесь следует отметить, что в этой формуле явно не используется распределение w(X). Таким образом, для вычисления математи- ческого ожидания функций от X достаточно знать распределение случайной величины X. Второй момент X определяется равенством Е(Х2) = $ x*f(x)dx (2.8) — 00 при условии, что интеграл сходится. Обозначим р, = Е(Х). Тогда дисперсия X определяется как Var (X) = Е ((X —и)2) = Е (X2)—jx2. (2.9) Замечание. Если величина X положительна (т. е. если плот- ность f сосредоточена на 0, оо) и если интеграл в выражении (2.6) расходится, то удобно говорить, что X имеет бесконечное ма- тематическое ожидание, и писать Е(Х) = оо. Точно так же гово- рят, что X имеет бесконечную дисперсию, когда интеграл в (2.8) расходится. Для величин, принимающих положительные и отри- цательные значения, математическое ожидание остается неопре- деленным, когда интеграл (2.6) расходится. Типичный пример доставляет плотность л-1 (1-(-х2)”1. Понятие плотности переносится на размерности более высо- ких порядков, но общее обсуждение мы отложим до гл. III. Пока же мы будем рассматривать только аналог произведения вероятностей, введенного определением 2 в 1, гл. V, 4, для описания комбинаций независимых экспериментов. Другими сло- вами, в этой главе мы будем иметь дело только с плотностями, представляемыми произведениями вида f(x}g(y), f (х) g(y)h(z) ит. д., где /, g, ...—плотности на прямой. Задание плотности вида f(x)g(y) на плоскости 512 означает отождествление «веро- ятностей» с интегралами P{A} = ^f(x)g(y)dxdy. (2.10) А Когда мы говорим о «двух независимых случайных величинах X и Y с плотностями f и £», то это есть сокращение высказыва- ния о том, что вероятности на (X, У)-плоскости определяются в соответствии с формулой (2.10). Отсюда следует правило умно- жения для интервалов, например Р {X > a, Y > b} = Р {X > а\ х xP{Y>^}« Аналогия с дискретным случаем настолько очевидна, что дальнейшие разъяснения не требуются.
§ 2. Плотности» Свертки 19 Можно ввести много новых случайных величин, рассматривая функции X и Y, но наиболее важную роль играет сумма S = = X + Y. Событие А = {S s} изображается полуплоскостью точек (%, у), таких, что x-\-y^.s. Обозначим функцию распре- деления Y через G, так что g(y) = G' (у). Чтобы найти функцию распределения X-j-Y, мы интегрируем в (2.10) по области у^. —X. В результате получаем + 00 P{X + Y^s}= $ G(s—x)f(x)dx. (2.11) — 00 Ввиду симметрии можно поменять F и G ролями без влияния на результат. После дифференцирования видно, что плотность X-f- Y равна любому из двух интегралов + оо +оо $ f(s—y)g(y)dy = J f(y)g(s—y)dy. (2.12) — ОС — 00 Операция, определенная формулой (2.12), является частным случаем свертки, которая будет введена в гл. V, 4. До этого времени мы будем использовать термин «свертка» только для плотностей: свертка двух плотностей fug есть функция, опре- деленная в (2.12). Свертка будет обозначаться f * g. Повсюду в первом томе мы имели дело со свертками дискрет- ных распределений. Соответствующие правила справедливы и здесь. В силу (2.12) мы имеем f X g = g# f. Если задана третья плот- ность h, мы можем составить свертку (/ -к g) * h. Это есть плот- ность суммы X + Y+Z трех независимых величин с плотностями Д g, h. Тот факт, что суммирование коммутативно и ассоциа- тивно, влёчет те же свойства для сверток, и поэтому результат f*gxh не зависит от порядка операций. Положительные случайные величины играют важнейшую роль, и потому полезно отметить, что если плотности fug сосредото- чены на 0, оо, то свертка f X g равна S S f*g(s) = \f(s—y)g(y)dy=lf(x)g(s—x)dx. (2.13) ► о О Пример, в) Пусть fag сосредоточены на 0, оо и определены здесь равенствами f (х) = ае~ах и g (х) = Ре~зх. Тогда f^.g(x) = ape х>°- (2-14)>- (Продолжение в задаче 12.) Замечание о понятии случайной величины. Использование прямой линии или евклидовых пространств $1п как выборочных пространств иногда затемняет различие между случайными вели-
’20 Гл. 1. Показательные и равномерные плотности чинами и «обычными» функциями одной или большего числа пере- менных. В первом томе случайная величина X могла принимать лишь счетное множество значений, и в этом случае было ясно, говорили ли мы о функции, например квадрате или экспоненте, определенной на прямой, или о случайной величине X2 или ех, определенной на выборочном пространстве. Даже по внешнему виду эти функции совершенно различны, поскольку «обычная» показательная функция принимает все положительные значения, тогда как ех имеет счетную область значений. Для того чтобы увидеть изменение в этой ситуации, рассмотрим теперь «две неза- висимые случайные величины X и Y с одинаковой плотностью /». Другими словами, выборочным пространством служит плоскость и вероятности определяются как интегралы от /(х)/(у). Теперь любая функция двух переменных может быть определена на выборочном пространстве, и тогда она становится случайной величиной, однако следует иметь в виду, что функция двух пере- менных может быть также определена независимо от нашего выборочного пространства. Например, некоторые статистические задачи требуют введения случайной величины / (X) f (Y) [см. при- мер 12, г) гл. VI]. С другой стороны, вводя наше выборочное пространство 5i2, мы очевидным образом упоминали «обычную» функцию /, определенную независимо от выборочного простран- ства. Эта «обычная» функция задает множество случайных вели- чин, например /(X), /(Y), f(X±Y) и т. д. Таким образом, одна и та же функция f может служить или случайной величиной, или «обычной» функцией. Как правило (и в каждом отдельном случае), будет ясно; имеем ли мы дело со случайной величиной или нет. Тем не ме- нее в общей теории возникают ситуации, при которых функции (такие, как условные вероятности и условные математические ожидания) могут рассматриваться как «свободные» функции или как случайные величины, и это отчасти приводит к путанице, если свобода выбора не понимается должным образом. Замечание о терминологии и обозначениях. Чтобы избежать громоздких формулировок, условимся называть Е (X) математическим ожиданием вели- чины X, или плотности или распределения F. Подобные вольности будут введены и для других терминов. Например, «свертка» фактически означает операцию, но этот термин применяют и к результату операции, и функция f g называется «сверткой». В старой литературе термины «распределение» и «функция частот» при- менялись к тому, что мы теперь называем плотностями; наши функции рас- пределения описывались как «кумулятивные», а сокращение c.d.f. х) употре- бительно до сих пор. х) Cumulative distribution function — кумулятивная функция распределе- ния,— Прим» перев»
§ 3, Показательная, плотность 21 ,§. 3. ПОКАЗАТЕЛЬНАЯ ПЛОТНОСТЬ Для произвольного, но фиксированного а > 0 положим f (х) = ае~ах, F(x) = l—е~ах при х^О (3.1) и F (х) = /(%) = 0 при х < 0. Тогда /—показательная плотность, F—ее функция распределения. Простые вычисления показывают, что математическое ожидание равно а”1, дисперсия—а-2. В примере 1, а) показательное распределение было выведено как предел геометрических распределений. Метод примера 2, а) приводит’ к тому же результату. Напомним, что в случайных про- цессах геометрическое распределение часто имеют времена ожида- ния или продолжительность жизни и что это обусловлено «отсут- ствием последействия», описанным в 1, гл. XIII, 9: каков бы ни был настоящий возраст, оставшееся время жизни не зависит от прошлого и имеет то же самое распределение, что и само время жизни. Теперь будет показано/что это свойство переносится на показательное распределение и только на показательное рас- пределение. Пусть Т—произвольная положительная величина, которую мы будем интерпретировать как время жизни или как время ожида- ния. Удобно заменить функцию распределения Т «хвостом рас- пределения» (/(/) = Р{Т>/}. (3.2) С наглядной точки зрения U (/) есть «вероятность того, что время жизни (от момента рождения) превзойдет t». При данном возра- сте s событие, состоящее в том, что оставшееся время жизни превосходит t, записывается как {Т> $ + /}, и условная вероят- ность этого события (при данном возрасте s) равна отношению U (s 4- t)/U (s). Это есть распределение оставшегося времени жизни. Оно совпадает с распределением общего времени жизни тогда и только тогда, когда U (s + t) = U (s)U (t), s, />0. (3.3) В 1; гл. XVII, 6 было показано, что положительное решение этого уравнения должно иметь вид U = и, следовательно, отсутствие последействия, выделенное выше, имеет место тогда и только тогда, когда распределение времени жизни пока- зательно. Мы будем называть это свойство отсутствия последействия (lack of memory) марковским свойством показательного распреде- ления. Аналитически марковское свойство сводится к утвержде- нию, что только для показательного распределения F хвосты U= = 1—F удовлетворяют равенству (3.3). Этим объясняется посто- янное присутствие показательного распределения в марковских процессах. (Усиленный вариант марковского свойства будет описан
22 Гл. I. Показательные и равномерные плотности в § 6.) Наше описание относится к временным процессам, но наши рассуждения имеют общий характер, и марковское свойство остается осмысленным, когда время заменяется каким-нибудь дру- гим параметром. Примеры, а) Прочность на разрыв. Чтобы получить непре- рывный аналог общеизвестной конечной цепи, прочность которой равна прочности ее самого слабого звена, обозначим U (t) веро- ятность того, что нить длины t (данного материала) может вы- держать некоторый фиксированный груз. Нить длины s-H не раз- рывается, если два отрезка по отдельности выдерживают данный груз. В предположении, что взаимодействие отсутствует, эти два события должны рассматриваться как независимые и U должно удовлетворять (3.3). Здесь длина нити выполняет роль временного параметра, а длина, при которой нить порвется, является пока- зательно распределенной случайной величиной. б) Случайные ансамбли точек в пространстве существенны во многих отношениях, поэтому важно иметь подходящее определение этого понятия. Интуиция подсказывает, что первым свойством, характеризующим «чистую случайность», должно быть отсутствие взаимодействия между различными областями: если области и А2 не перекрываются, то наблюдения за положением в области Лх не позволяют сделать вывод о положении в области Л2. Конк- ретно, вероятность р того, что области Л£ и Л2 одновременйо не содержат точек ансамбля, должна быть равна произведению веро- ятностей и р2 того, что каждая область Лх- и Л2 соответственно пуста. Правдоподобно, что это правило произведения справед- ливо не для всех разбиений на области, но в том случае, когда, вероятность р зависит лишь от объема области Л, а не от ее формы. Предполагая, что последнее выполнено, обозначим через U (t) вероятность того, что область, имеющая объем t, является пустой. Тогда вероятности U (t) удовлетворяют равенству (3.3) и поэтому U(t') = e~at\ постоянная а зависит от плотности точек ансамбля, или, что то же самое, от единицы измерения. В сле- дующем разделе будет показано, что знание U позволяет вычис- лять вероятности pn(t) того, что область объема t содержит ровно п точек ансамбля; эти вероятности определяются распре- делением Пуассона: рп (/) = e~at (at)n/nl. В этом случае мы гово- рим о пуассоновских ансамблях точек, и этот термин является более определенным, нежели термин случайный ансамбль, кото- рый может иметь и другие значения. в) Ансамбли кругов и шаров. Случайные ансамбли частиц ставят перед нами более сложную задачу. Предположим для простоты, что частицы имеют круговую или сферическую форму фиксирован- ного радиуса р. Тогда положение частиц полностью определяется их центрами и заманчиво считать, что эти центры образуют пуассоновский ансамбль. При строгом подходе, однако, это не- верно, поскольку взаимные расстояния между центрами необходима
§ 3. Показательная плотность 23 превосходят 2р. Кажется тем не менее правдоподобным, что при малом радиусе р пренебрежение размерами рассматриваемых фигур незначительно сказывается на практике и поэтому модель пуассоновского ансамбля центров можно считать приемлемой в качестве разумного приближения. В соответствующей математической модели мы постулируем, что центры образуют пуассоновский ансамбль, и допускаем в связи с этим возможность того, что круги или шары пересекаются. Эта идеализация не должна иметь практических последствий, если радиусы р малы, так как вероятность пересечений незначительно мала. Астрономы обращаются со звездными системами как с пуас- соновскими ансамблями, и достигаемое при этом приближение к действительности оказывается превосходным. Следующие два при- мера демонстрируют использование этой модели на практике. г) Ближайшие соседи. Рассмотрим пуассоновский ансамбль шаров (звезд) с плотностью а. Вероятность того, что область объема t не содержит центров, равна e~at. Высказывание о том, что расстояние до ближайшего к началу координат соседа боль- ше г, сводится к высказыванию, что внутренность шара радиуса г не содержит ни одного центра из ансамбля. Объем такого шара равен -улг3> и поэтому для пуассоновского ансамбля звезд веро- ятность того, что ближайший сосед находится на расстоянии, —лаг3 большем г, равна е 3 .Тот факт, что полученное выражение не зависит от радиусов р звезд, указывает на приближенный харак- тер модели и ее ограниченность. На плоскости шары заменяются кругами, а распределение рас- стояний между ближайшими соседями задается функцией 1— д) Продолжение', задача свободного пробега. Для упрощения описания мы начнем с двумерной модели. Представим себе слу- чайный ансамбль-крупов (круговых дисков) как поперечные сече- ния деревьев (круговых цилиндров) в достаточно редком лесу. Я стою в начале координат, которое не содержится ни в одном из дисков, и смотрю в положительном направлении оси х. Длина самого длинного интервала 0, /, не пересекающего ни одного диска, характеризует свободный пробег, или видимость, в х-нап- равлении. Эту случайную величину обозначим L. Обозначим через А область, образованную множеством точек, расстояния которых от точех интервала 0, t на оси х не пре- восходят р. Граница области А состоит из двух сегментов 0^ ^х*^/ на прямых у= ±*р и двух полуокружностей радиуса р с центрами в точках 0 и t на оси х. Таким образом, площадь А равна 2р/-|-лр2. Событие {L>/} происходит тогда и только тогда, когда внутри области ,Л нет ни одного центра диска, но уже известно заране^, что круг радиуса р с центром в начале координат не содержит центров диска. Оставшаяся область имеет
.24 Гл. 1. Показательные и равномерные плотности площадь 2р/, и можно сделать вывод, что распределение случай- ной величины L (видимости в х-направлении) является показа- тельным: P{L> = Проведенные нами рассуждения остаются верными и в прост- ранстве а соответствующая этому случаю область образу- ется вращением А около оси х. Прямоугольник 0 < х < /, |у|< < р заменяется цилиндром объема яр2/. Мы получаем, что для пуассоновского ансамбля шаровых звезд величина L свободного пробега в любом направлении имеет показательное распределение: P{L>0 = е-лар2/ Средняя величина свободного пробега равна Е (L) = 1/(лар2). > Следующая теорема будет использоваться неоднократно. Теорема. Если Хп ..., Хп—взаимно независимые случайные величины с показательным распределением (3.1), то сумма X* +... ... + х„ имеет плотность gn и функцию распределения Gn% задаваемые формулами £п(х)=«((Т-7яе~а*’ х>0, <3-4) G„(x) = l-e— (1+^+ х>0. (3.5) Доказательство. При п = 1 утверждение сводится к опреде- лению (3.1). Плотность gn+1 определяется сверткой t gn+i(t)^^gn(i—x)g1(x)dx, (3:6) О и в предположении справедливости (3.4) это сводится к •' ' gn+id) = (ПЗЛ)1е"а* j = (3.7) О Таким образом, (3.4) выполняется по индукции для всех п. Спра- ведливость равенства (3.5) доказывается дифференцированием. Плотности gn входят в семейство гамма-плотностей, которое будет введено в гл. 11,2. Они представляют собой непрерывный аналог отрицательного биномиального распределения, определен- ного в 1, гл. VI, 8, как распределение суммы /г случайных вели- чин с одинаковым геометрическим распределением. (См. задачу 6.)г § 4. ПАРАДОКСЫ. СВЯЗАННЫЕ С ВРЕМЕНЕМ ОЖИДАНИЯ. ПУАССОНОВСКИЙ ПРОЦЕСС Обозначим Хх, Х2, ... взаимно независимые случайные велит чины с одинаковым показательным распределением (3.1). Пусть
§ 4. Парадоксы, связанные с временем ожидания 25 se = o, Sn = X1+...+Х„, п = 1, 2............... (4.1) Мы вводим семейство новых случайных величин N (/) следующим образом: N (/) есть число индексов таких, что Sk^t. Со- бытие (N (/) = «} происходит тогда и только тогда, когда Sns^t, а $«+1 > t- Так как S„ имеет распределение G„, то вероятность этого события равна Gn(f)—Gn+i(t) или P{N(0 = n}=e-“'-^p-. (4.2) Иначе говоря, случайная величина N (/) имеет пуассоновское рас- пределение с математическим ожиданием at. Эта аргументация выглядит как новый вывод пуассоновского распределения, но на самом деле это только перефразировка пер- воначального вывода из 1, гл. VI, 6, в терминах случайных вели- чин. Для наглядного описания рассмотрим случайно наступаю- щие события (такие, как вспышки космических лучей или теле- фонные вызовы), которые мы называем «поступлениями». Допус- тим, что последействие отсутствует, т. е. прошлое не дает воз- можности сделать заключение в отношении будущего. Как мы видели, это условие требует, чтобы время ожидания Хг первого по- ступления было распределено показательно. Но при каждом поступ- лении процесс начинается снова как вероятностная копия всего процесса: времена ожидания Xk между последовательными поступле- ниями должны быть независимыми и должны иметь одно и то же рас- пределение. Сумма Sn изображает момент n-го поступления, a N (/)— число поступлений в интервале 0, t. В такой форме доводы отли- чаются от первоначального вывода пуассоновского распределения лишь использованием лучших специальных терминов. (По терминологии случайных процессов последовательность есть процесс восстановления с показательными временами Xk между поступлениями} общее понятие процесса восстановления см. в гл. VI, 6.) Даже эта простая ситуация приводит к кажущимся противоре- чиям, которые иллюстрируют необходимость более сложного под- хода. Мы начнем с несколько наивной формулировки. Пример. Парадокс времени ожидания. Автобусы прибывают в согласии с пуассоновским процессом, причем среднее время между последовательными автобусами равно а”1. Я прихожу в момент t. Каково математическое ожидание E(Wt) времени Wf, в течение которого я жду следующий автобус? (Понятно, что мо- мент t моего прибытия не зависит от автобусов—скажем, я при- хожу ровно в полдень.) Очевидно, имеются два противоречивых ответа. а) Отсутствие последействия, свойственное пуассоновскому процессу, влечет за собой независимость времени ожидания авто-
26 Гл. I. Показательные и равномерные плотности буса от момента моего прибытия. В этом случае E(Wf) = E(W0) = a-1. б) момент моего прибытия «выбран наудачу» в интервале между двумя последовательными автобусами, и по соображениям симмет- рии мое среднее время ожидания должно быть равно половине среднего промежутка времени между двумя последовательными автобусами, т. е. E(Wf)=-la-\ Оба рассуждения кажутся приемлемыми, и оба использовались на практике. Что же делать с противоречиями? Легчайший выход у формалиста, который отказывается рассматривать задачу, если она не сформулирована строго. Но задачи не решаются их игно- рированием. Теперь мы покажем, что оба рассуждения по существу, если не формально, корректны. Ошибка лежит в непредвиденном пункте, и мы приступаем теперь к ее объяснению1). Мы рассмотрим последовательность времен между прибытиями X1 = S1, X2 = S2-Sn .... По предположению Xk имеют одинаковое показательное распре- деление с математическим ожиданием а"1. Выбирая «любое» от- дельное Xfe, мы получаем случайную величину, и интуитивно ожидается, что ее математическое ожидание будет равно от1 при условии, что выбор сделан , без знания последовательности Х£, Х2, .... Однако это неверно’ В нашем примере мы взяли тот элемент Хь для которого где t фиксированно. Этот выбор сделан без учета действительного процесса, но оказывается, что так выбранное Хк имеет двойное математическое ожидание 2a-1. С учетом этого факта противоречие исчезает, так как в пункте б) нашего примера постулируется, что среднее время ожидания равно а"1. Это разрешение парадокса вызвало шок у опытных работников, однако оно становится интуитивно ясным, когда должным образом подбирается способ рассуждения. Грубо говоря, длинный интервал имеет больше шансов накрыть точку t, нежели короткий. Это приблизительное утверждение подтверждается следующим пред- ложением. Предложение. Пусть Хй Х2 ... взаимно независимы и одина- ково показательно распределены с математическим ожиданием ос1. г) Вариант парадокса см. в примере VI, 7, а) Этот парадокс известен в общей теории восстановления, где он вызвал серьезные затруднения и про- хиворечияа прежде чем был правильно понят (см. по этому поводу Х1Л4).
§ 4. Парадоксы, связанные с бременем ожидания 27 Пусть / > О фиксированно, но произвольно. Элемент Хл, удовлет- воряющий условию имеет плотность , \ ( а2хе~ах для О < х < t, vt \х) — I a(i _|_а^е-ах для (4.3) Здесь главное в том, что плотность (4.3) не является общей плотностью для Xk. Явный вид этой плотности представляет второстепенный интерес. [Аналог произвольного распределения времени ожидания содержится в XI, (4.16).] Доказательство. Пусть k—такой (зависящий от случая) индекс, что и пусть L, равно —Sft_r Мы должны дока- зать, что Lf имеет плотность (4.3). Допустим сначала, чтох<Л Событие происходит, если и только если8„ = г/и/—у < при некоторой комбинации м, у. Отсюда следует не- равенство t—x^y<t. Суммируя по всем возможным п и у, получаем 00 P{L,<x}=£ \ gn{y)-[e-^^-e-^]dy. (4.4) п~1I-X Но gi (y) + g2 (у) + . •. =<х тождественно, и поэтому P{L/^x} = 1—е~ах—ахе~ах. (4.5) Дифференцируя, мы получим (4.3) для х < t. Для х > t применимо это же доказательство с той разницей, что у меняется от 0 до х, и мы должны прибавить к правой части равенства (4.4) вероят- ность e~at—е~ах того, что 0 < t < Sx < х. Этим доказательство завершается. Скачок функции (4.3) при х = t обусловлен специальной ролью начала как исходной точки процесса. Очевидно, lim vt (х) = а2хе~ах, (4.6) откуда видно, что со временем роль начала исчезает и для «ста- рого» процесса распределение почти не зависит от t. Удобнее выразить это, сказав, что правая часть (4.6) задает «стационар- ную» плотность L*. В обозначениях, принятых в доказательстве, время ожидания Wb рассмотренное в примере, есть случайная величина W^ = S^—t Из доказательства теоремы следует также, что Р {Wt < %} = е~ <х+/>+ 00 t + Х \ 8ЛУ)\.е"аЛ*~,л—е~ах. (4.7) п=1 О Таким образом, Wf имеет то же самое показательное распреде- ление, что и ХА, в согласии с доводами пункта а). (См. задачу 7.)
28 Гл. I. Показательные и равномерные плотности Наконец, несколько слов о пуассоновском процессе. Пуассонов-', ские величины N (/) были введены как функции, определенные, на выборочном пространстве бесконечной последовательности случайных величин Хх, Х2, ... . Эта процедура удовлетворительна для многих целей, но более естественно другое выборочное про- странство. Мысленный эксперимент «регистрации числа поступив- ших вызовов вплоть до момента /» дает при каждом положитель- ном t целое число, и результатом поэтому является ступенчатая функция с единичными скачками. Эти ступенчатые функции служат точками выборочного пространства; выбррочное пространство является функциональным пространством—пространством всех возможных «траекторий». В этом пространстве N (t) определяется как значение ординаты в момент /, a Sn—как координата /г-го скачка и т. д. Теперь могут быть рассмотрены события, которые невыразимы в терминах первоначальных случайных величин. Ти- пичный пример, имеющий практический интерес (см. задачу о ра- зорении в гл. VI, 5), доставляет событие, заключающееся в том, что N (/)>« + &/ при некотором /. Отдельная траектория (точно так же, как отдельная бесконечная последовательность из ± 1 в биномиальных испытаниях) представляет собой естественный и неизбежный объект вероятностного исследования. Стоит только привыкнуть к новой терминологии, как пространство всех траекто- рий становится наиболее наглядным выборочным пространством. К сожалению, введение вероятностей в пространстве выбороч- ных траекторий—дело далеко не простое. Для сравнения заме- тим, что переход от дискретных выборочных пространств к пря- мой, плоскости и т. д. и даже к бесконечным последовательно- стям случайных величин ни мысленно, ни технически не труден. В связи с функциональными пространствами возникают проблемы нового типа, и мы предупреждаем читателя, что не будем иметь с ними дела в этом томе. Мы удовлетворимся частным рассмотре- нием выборочных пространств последовательностей (счетного мно- жества координатных величин). Упоминание о случайных процес- сах вообще и о пуассоновском процессе в частности мы будем делать свободно, но только для того, чтобы подготовить интуи- тивную основу или привлечь интерес к нашим проблемам. Пуассоновские ансамбли точек Как показано в 1; гл. VI, 6, пуассоновский закон управляет не только «точками, распределенными случайно на оси времени», но также ансамблями точек (такими, как дефекты в изделиях или изюминки в булках), распределенных случайно на плоскости или в пространстве при условии, что t интерпретируется как площадь или объем. Основное предположение состоит в том, что вероят- ность нахождения k точек в заданной области зависит только от
§ 5. Устойчивость неудач 29 площади или объема области, но не от ее формы и что явления в неперекрывающихся областях независимы. При этом же самом предположении в примере 3, б) было по- казано, что вероятность отсутствия точек в области объема t равна e~at. Это соответствует показательному распределению времени ожидания первого события, и мы теперь видим, что распределение Пуассона для числа событий является простым следствием этого. Те же доводы применимы к случайным ансамблям точек в про- странстве, и мы приходим к возможности нового доказательства того, что число точек ансамбля, содержащихся в данной области, есть случайная величина, распределенная по закону Пуассона. Путем несложных формальных выкладок можно прийти к ин- тересным результатам, касающимся таких случайных ансамблей точек, но замечания относительно пуассоновского процесса оди- наково применимы и к пуассоновским ансамблям; полное вероят- ностное описание сложно и лежит вне рамок настоящего тома. § 5. УСТОЙЧИВОСТЬ НЕУДАЧ Общеизвестно, что тот, кто встает в очередь, случается, вы- нужден ждать неопределенно долгое время. Подобные неудачи преследуют нас во многих положениях. Как может способство- вать объяснению этого теория вероятностей? Для ответа на этот вопрос мы рассмотрим три примера, типичные для множества ситуаций. Они иллюстрируют неожиданные общие свойства слу- чайных флуктуаций. Примеры, а) Рекордные значения. Обозначим Хо мое время ожидания (или размер финансовых потерь) некоторого случайного события. Предположим, что мои друзья подвергли себя опыту того же типа. Обозначим их результаты Хх, Х2, ... . Чтобы отразить «беспристрастность», предположим, что Хо, Хх. ..— взаимно независимые случайные величины с одним и тем же рас- пределением. Природа последнего в действительности не имеет значения, но, так как показательное распределение служит мо- делью случайности, мы предположим, что Ху- показательно распре- делены в соответствии с (3.1). Для простоты описания мы пред- полагаем последовательность {Xyj неограниченной. Чтобы оценить размер моей неудачи, я спрашиваю, как много времени должно пройти, прежде чем один из моих друзей испы- тает большую неудачу (мы пренебрегаем событием ХА, = Х0, вероят- ность которого равна нулю)? Более формально, мы вводим время ожидания N как значение первого индекса п, такого, что Хп > Хо. Событие'{N > п—1} происходит, если и только если максималь- ный член строки Хо, Хх, ..., Х„_х является начальным; по со- ображениям симметрии вероятность этого события равна п"1. Со- бытие {N?=n}—это то же,, что {N>n—1} — {N>n}, и, следо-
30 Гл. I. Показательные и равномерные плотности вательно, при п =1, 2, ... P{N=n}=l--------* =_!. (5.1) х 1 1 п n-j-1 п(п-±-1) v 1 Этот результат полностью подтверждает, что мне действительно ужасно не везет: случайная величина N имеет бесконечное мате- матическое ожидание'. Было бы достаточно плохо, если нужно было бы провести в среднем 1000 испытаний, чтобы побить «рекорд» моих неудач, но действительное время ожидания имеет бесконечное математическое ожидание. Отметим, что наше рассуждение не зависит от условия, что Xfc показательно распределены. В действительности всякий раз, когда величины Ху независимы и имеют одну и ту же непрерыв- ную функцию распределения F, первое «рекордное» значение имеет распределение (5.1). Тот факт, что это распределение не зависит от F, используется статистиками для проверки независимости. (См. также задачи 8—11.) Замечательный и общий характер результата (5.1) в сочетании с простотой доказательства способен внушить подозрение. На са- мом деле доказательство безупречно (за исключением неформаль- ных рассуждений), но те, кто предпочитает полагаться на надеж- ные вычисления, могут легко проверить правильность (5.1), используя непосредственное определение рассматриваемой вероят- ности как (п+1)-кратного интеграла от ап+1е~а (x»+ по об- ласти, определенной неравенствами 0 < х0 < хп и 0 < xf < х0 при j = 1, ..., п—1. Дадим другой вывод формулы (5.1), представляющий собой поучительное упражнение с условными вероятностями; он менее прост, но приводит к до- полнительным результатам (задача 8). При условии, что Х0 = х, вероятность большого значения в более поздних испытаниях равна р = е~ах, и мы имеем дело с временем ожидания первого «успеха» в испытаниях Бернулли с вероят- ностью успеха р. Условная вероятность, что N = n при условии Х0 = х, равна поэтому р (1—р)"-1. Чтобы получить P{N = n}, мы должны умножить это на плотность ае~ах и проинтегрировать пох. Подстановка 1—e~ax~t сводит подынтегральную функцию к функции /п"1(1— /), интеграл от которой равен /г-1—(/i-f-l)"1, что соответствует (5.1). б) Отношения. Если X и Y—две независимые случайные ве- личины с одинаковым показательным распределением, то отноше- ние Y/Х является новой случайной величиной. Ее функция рас- пределения получается интегрированием выражения а2е“аи+^ по области 0 < z/ <tx, 0 < х < оо. Интегрирование по у приводит к результату e~a<x)dx==T^T- (5-2) п Соответствующая плотность равна О + О"2» Заслуживает внима-
§ 6. Времена ожидания и порядковые статистики 31 ния то, что величина Y/Х имеет бесконечное математическое ожи- дание. Мы находим здесь новое подтверждение устойчивости неудач. Конечно, Петр имеет основание для недовольства, если ему приш- лось ждать в три раза больше, чем ждал Павел. Однако распре- деление (5.2) приписывает этому событию вероятность V4. Отсюда следует, что в среднем в одном из двух случаев или Павел, или Петр имеют основания для недовольства. Наблюденная частота практически возрастает, так как очень короткие времена ожида- ния, естественно, проходят незамеченными. в) Параллельные очереди. Я приезжаю в своем автомобиле на автомобильную инспекционную станцию (или ко въезду в туннель, или на автомобильный паром и т. д.). Имеются на выбор две очереди, но раз уж я встал в одну очередь, я должен стоять в ней. Мистер Смит, который приехал вслед за мной, занимает место в другой очереди, которое я мог бы выбрать, и я теперь слежу за тем, продвигается ли он быстрее или медленнее меня. Большее время мы стоим неподвижно, но время от времени то одна, то другая очередь передвигается на один автомобиль вперед. Чтобы увеличить влияние чистого случая, мы предположим две очереди ртохастически независимыми; интервалы времени между последо- вательными продвижениями также являются независимыми ве- личинами с одинаковым показательным распределением. При данных обстоятельствах последовательные продвижения представляют со- бой испытания Бернулли, где «успех»—это то, что продвинулся вперед я, «неудача»—что продвинулся мистер Смит. Так как вероятности успеха равны х/2, мы в сущности имеем дело с сим- метричным случайным блужданием, и любопытные свойства флук- туаций при случайных блужданиях находят неожиданную интер- претацию. (Для простоты описания мы отвлечемся от того, что имеется только ограниченное число автомобилей.) Смогу ли я когда-нибудь обогнать мистера Смита? В переводе на язык слу- чайных блужданий этот вопрос звучит так: будет ли когда-нибудь иметь место первое прохождение через +1? Как известно, это событие имеет вероятность, равную единице. Однако среднее время ожидания для него бесконечно. Такое ожидание дает достаточные возможности для оплакивания моих неудач, причем раздражение мое только возрастает от того, что мистер Смит приводит те же самые доводы. § 6. ВРЕМЕНА ОЖИДАНИЯ И ПОРЯДКОВЫЕ СТАТИСТИКИ Пусть дана упорядоченная строка (хп ..., х„) из п действи- тельных чисел. Переставляя их в порядке возрастания величины, получим новую строку (-^(d > х(2), • • •, где Хм х(2) Х(п).
32 Гл. 1. Показательные и равномерные плотности Эта операция, примененная ко всем точкам пространства 81п, дает нам п вполне определенных функций, которые будут обозна- чаться Х(1), .... Х(п). Если в 31п определены вероятности, то эти функции становятся случайными величинами. Мы говорим, что (Х(1), ..., Х(и)) получается перестановкой из Хп ..., Хп в соот- ветствии с возрастанием величины. Величина Х(Л) называется й-й порядковой статистикой1) данной выборки Хп Хп, в част- ности, Х(1) и Х(л)—это выборочные экстремумы} если п = 2v + 1 нечетно, то X(v+1) есть выборочная медиана. Мы применим эти понятия к частному случаю независимых случайных величин Xv . ..,Х„ с одинаковым показательным рас- пределением с плотностью ае~ ах. Пример, а) Параллельные очереди. Будем интерпретировать Х1? .Хп как длительности п времен обслуживания, начинаю- щегося с момента 0 в почтовом отделении с п окошками. Поряд- ковые статистики изображают последовательные моменты окончания обслуживаний, или, как говорится, моменты последовательных разгрузок («выходной процесс»). В частности, Х(1) представляет собой время ожидания первой разгрузки. Теперь если предполо- жение об отсутствии последействия осмысленно, то время ожида- ния Х(1) должно обладать марковским свойством, т. е. Х(1) должно быть распределено показательно. Фактически событие {X(1)>Z} есть одновременная реализация п событий {Хл > t}, каждое из которых имеет вероятность е~а/; ввиду предположения о незави- симости вероятности перемножаются, и мы имеем Р{Хш>0 = е-^. . (6.1) Сделаем теперь следующий шаг и рассмотрим положение в мо- мент Х(1). Предположение об отсутствии памяти, по-видимому, подразумевает, что восстанавливается первоначальное положение с той разницей, что теперь в операциях участвует п— 1 окошек; продолжение процесса не должно зависеть от Х(1) и должно быть копией всего процесса. В частности, время ожидания следующей разгрузки, а именно Х(2) — Х(1), должно иметь распределение Р{Х(2)-Х(1) > t} = (6.2) аналогичное (6.1). Это рассуждение приводит к следующей общей теореме, касающейся порядковых статистик для независимых вели- чин с одинаковым показательным распределением: г) Строго говоря, термин «выборочная статистика» является синонимом термина «функция от выборочных величин», т. е. термина «случайная вели- чина». Он используется для лингвистического выделения разницы в ролях, играемых в данном контексте первоначальными величинами (выборкой) и не- которыми полученными из них величинами. Например, «выборочное среднее» (Xx-j-• • • + Хп)/п называется статистикой. Порядковые статистики часто встречаются в статистической литературе. Мы придерживаемся стандартной терминологии, за исключением того, что экстремумы обычно называются экстремальными «значениями».
§ 6. Времена ожидания и порядковые статистики 33 Предложение1). Случайные величины Х(1), Х(2)—Х(1), ... ..., Х(Л)—Х(п_п являются независимыми, и плотность Х(А+1)—Х(Л> равна (п—k)ae~(n~k} at. Прежде чем проверить это утверждение формально, рассмот- рим его следствия. Если п = 2, то разность Х(2) — Х(1) означает «остаточное время ожидания» после истечения более короткого из двух времен. Теорема утверждает, что это «остаточное время ожидания» имеет то же самое показательное распределение, что и первоначальное время ожидания, и не зависит от Х(1). Это есть расширение марковского свойства, сформулированного для фи- ксированных моментов t, на зависящее от случая время остановки Х(1). Это свойство называется строго марковским свойством. (Так как мы имеем дело лишь с конечным множеством величин, мы в состоянии вывести строго марковское свойство из обычного, но в более сложных случайных процессах различие существенно.) Доказательство теоремы служит примером формальных дейст- вий с интегралами. Для упрощения типографского набора формул рассмотрим п = 3. Так же как и в других подобных ситуациях, мы используем соображения симметрии. С вероятностью 1 никакие две из величин Ху- не равны. Пренебрегая событием вероятности нуль, делаем вывод, что шесть возможных упорядоченных распо- ложений Хп Х2, Х3 представляют собой шесть взаимно исключаю- щих равновероятных событий. Поэтому для того, чтобы найти распределение порядковых статистик, достаточно рассмотреть случай Xj < Х2 < Х3. Таким образом, Р{Х(1)>/1, х(2)-х(1)>/2, х(3)—х(2) > /3} = = 6Р{Х1>/1, Х2-Х1>/2, Х3-Х2>Ц. (6.3) (Аналитически, пространство S13 разбивается на шесть частей,, конгруэнтных области, определенной неравенствами %1<х2<х3. Каждая из них вносит одну и ту же величину в соответствующий интеграл. Границы, где две или более координат равны, имеют вероятность нуль и не играют роли.) Чтобы получить правую часть в (6.3), мы должны проинтегрировать а3в"а Ui+^+^з) по об- ласти, определенной неравенствами Х^^> t}, Х2—-%! /2, Х3 —Х2 fg. Интегрирование по х.3 приводит к 00 00 6е~ а/3 ае~ ах> dxt J ae~2ax^dx2 = tl Xi + t2 00 = 3g-a^3-2otG (6.4) ______ x) Эту теорему неоднократно открывали в связи с задачами статистиче- ского оценивания, но обычные ее доказательства сводились к вычислениям вместо обращения к марковскому свойству, См, также задачу 13# 2 № 249
34 Гл. I, Показательные и равномерные плотности Таким образом, совместное распределение трех величин Х(1), Х(2)— — Х(1), Х(3)—Х(2) есть произведение трех показательных распре- делений, и это доказывает наше утверждение. Отсюда, в частности, следует, что Е (X(fe+1) — X(fe)) = 1/(м—й)а. Суммируя по й = 0, 1, ..., v—1, мы получаем E(X(v))=lf-H------Ц+...Н-------U-rV (6.5) v a \ n 1 n—1 1 ‘ n—v+1 J v 7 Отметим, что это математическое ожидание было вычислено без знания распределения X(V). Итак, мы имеем еще один пример преимущества представления случайной величины как суммы дру- гих величин. (См. 1, гл. IX, 3.) б) Использование строго марковского свойства. В качестве образного примера рассмотрим следующую ситуацию: в момент О три лица Л, В и С прибывают в почтовое отделение и находят два окна свободными. Три времени обслуживания представляют собой независимые случайные величины X, Y, Z с одинаковым показательным распределением. Обслуживание А и В начинается сразу же, а обслуживание С начинается в момент Х(1), когда или Л, или В уходит. Мы покажем, что марковское свойство приводит к простым ответам на различные вопросы. (i) Какова вероятность, что С не последним уйдет из почто- вого отделения? Ответ: х/2, так как момент Х(1) первого ухода устанавливает симметрию между С и другим обслуживаемым лицом. (И) Каково распределение времени Т, проведенного лицом С в почтовом отделении? Ясно, что величина Т == Х(1) + Z есть сумма двух независимых величин, которые распределены показательно с параметрами 2а и а. Свертка любых двух показательных распределений найдена в (2.14), и мы получаем, что Т имеет плотность и (/) = 2а (е~ at—е~2а/) и что Е (Т) = . (iii) Каково распределение момента последнего ухода? Обозна- чим моменты последовательных уходов Х(1), Х(2), Х(3). Разность Х(3)—Х(1) представляет собой сумму двух величин Х(3)—Х(2) и Х(2)—Х(1). Мы видели в предыдущем примере, что эти величины независимы и имеют показательные распределения с параметрами 2а и а. Отсюда следует, что Х(3)—Х(1) имеет ту же плотность и, что и величина Т. Теперь Х(1) не зависит от Х(3)—Х(1) и имеет плотность 2ае~2а/. Формула свертки, использованная в (И), пока- зывает, что Х(3) имеет плотность 4а[в“а/——ate ~2aZ] и что Е(Х(3)) = 2/а. Преимущества этого метода становятся очевидными при срав- нении с непосредственным вычислением, но последнее применима и для других распределений времени обслуживания (задача 19). в) Распределение порядковых статистик. В качестве заключи- тельного упражнения мы выведем распределение Хш. Событие {XU) ф означает, что по крайней мере k из п величин Ху не
§ 7. Равномерное распределение 35 превосходят t. Это равносильно наступлению по крайней мере k «успехов» в п независимых испытаниях, и поэтому п . Р |Х(А) < « 5 ( " ) (1 —е-“')/«-«»-/> (6.6) После дифференцирования видно, что плотность Х(Л) равна nQ~!) (1— е~“')*-* е~ <”-*>“<•ае~а/. (6.7) Этот результат может быть получен непосредственно следующими нестрогими рассуждениями. Мы разыскиваем (вплоть до членов пренебрежимо малых в пределе при h—>-0) вероятность события, заключающегося в том, что одна из величин Ху лежит между t и t+h, a k—1 величин из оставшихся я—1 величин не превосхо- дят/, в то время как другие п—k величин строго больше /4-й. Пере- множая число наборов и соответствующие вероятности, приходим к (6.7). Начинающим рекомендуется формализовать это рассужде- ние, а также вывести формулу (6.7) из дискретной модели. (Про- должение в задачах 13, 17). § 7. РАВНОМЕРНОЕ РАСПРЕДЕЛЕНИЕ Случайная величина X распределена равномерно в интервале а, й, если ее плотность постоянна—равна (й—а)-1 при а < х < b и равна 0 вне этого интервала. В этом случае величина (X—а) (й—а)-* распределена равномерно в 0,1, и мы будем обычно использовать этот интервал как стандартный. Из-за внешнего вида графи- ков плотности равномерные распределения называются «прямо- угольными». При равномерном распределении интервал 0, 1 становится выборочным пространством, в котором вероятности интервалов тождественны их длинам. Выборочное пространство, соответствую- щее двум независимым величинам X и Y, которые равномерно ' распределены на 0,1, представляет собой единичный квадрат в Ж2, а вероятности в нем определяются как площади. Те же идеи применимы к трем и большему числу величин. Про равномерно распределенную случайную величину часто говорят: «точка X выбрана наудачу». Результат мысленного эк- сперимента «п независимых случайных выборов точки в 0,1» тре- бует для своего вероятностного описания n-мерного гиперкуба, но эксперимент сам по себе дает п точек Ху, ..Х„ в том же самом интервале. С вероятностью единица никакие две из этих точек не совпадают, и, следовательно, они разбивают интервал 0, 1 на п4-1 подынтервалов. Переставляя п точек Ху, ..., Хп в их естественном порядке слева направо, мы получаем п новых 2*
36 Гл. I. Показательные и равномерные плотности случайных величин, которые обозначим Х(1), XU). Это и есть порядковые статистики, определенные в предыдущем параграфе. Подынтервалы разбиения теперь имеют вид О, Х(1), Х(1), Х(2) и т. д. • Понятие точки, выбранной наудачу на окружности, говорит само за себя. Чтобы отчетливо представить себе исход п незави- симых выборов точки на окружности, мы вообразим окружность, ориентированную против часовой стрелки, так что интервалы имеют левый и правый концы и могут быть изображены в форме а, Ь. Две точки Хх и Х2, выбранные независимо и наудачу, делят окружность на два интервала Хх, Х2 и Х2, Хх. (Мы снова прене- брегаем событием Хх = Х2, имеющим вероятность нуль.) Примеры, а) Опытные интерпретации. Колесо рулетки обычно приводится как средство осуществления «случайного выбора» на окружности. Ошибка округления при вычислениях с шестью де- сятичными знаками обычно рассматривается как случайная вели- чина, распределенная равномерно в интервале длиной 10“6. (Для ошибок, совершенных при отбрасывании двух последних десятич- ных знаков, дискретная модель со 100 возможными значениями более уместна, хотя менее практична.) Время ожидания пассажира, прибывшего на автобусную станцию без учета расписания, может рассматриваться как случайная величина, равномерно распреде- ленная в интервале между последовательными отъездами автобусов. Большой теоретический интерес представляют применения к слу- чайным разбиениям, обсуждаемым в § 8. Во многих задачах ма- тематической статистики (таких, как непараметрические критерии) равномерное распределение входит косвенным образом: при усло- вии, что произвольная случайная величина X имеет непрерывную функцию распределения F, случайная величина F (X) распределена равномерно на 0, 1 (см. § 12). б) Индуцированное разбиение. Мы докажем следующее утверж- дение: п независимо и случайно выбранных на 0, 1 точек Хх, ..., Хп разбивают 0, 1 на п +1 интервалов, длины которых имеют одно и то же распределение P{L>O = (1—0</<1. (7.1) Это .неожиданно, так как интуитивно можно было бы ожидать, что по крайней мере два концевых интервала должны иметь дру- гое распределение. То, что все интервалы будут иметь одинако- вое распределение, становится ясным при рассмотрении эквива- лентной ситуации на (ориентированной) окружности единичной длины1). Здесь п+1 точек Хх, . Хп+1, выбранных независимо г) При численной проверке следует иметь в виду, что вероятность собы- тия {Х(£+1) — X(fe) > t} равна интегралу от постоянной 1 по объединению п\ конгруэнтных областей, определенных или цепью неравенств хА < ... < лд,< < < xk+i < < хп> или аналогичными цепями, полученными пере-
§ 7. Равномерное распределение 37 и наудачу, разбивают окружность на п+1 интервалов, и по со- ображениям симметрии эти интервалы должны иметь одинаковое распределение. Представим теперь, что окружность разрезана в точке Хи+1 для того, чтобы получить интервал, в котором Х1Г . Хи выбраны независимо и наудачу. Длины всех п + 1 интервалов индуцированного разбиения имеют одно и то же рас- пределение. Рассматривая самый левый интервал О, Х(1), можно видеть, что это распределение задается формулой (7.1). Длина этого интервала превосходит t тогда и только тогда, когда все п точек хп .... х„ лежат в /, 1. Вероятность этого равна (1—t)n- Хорошим упражнением является проверка утверждения в част" ном случае п = 2 путем рассмотрения трех событий в единичном квадрате, изображающем выборочное пространство. (Продолжение см. в задачах 22—26.) в) Парадокс (связанный с парадоксом времени ожидания из § 4). Пусть две точки Хх и Х2 выбраны независимо и наудачу на окруж- ности единичной длины. Тогда длины двух интервалов Хх, Х2 и Х2, Хх распределены равномерно, а длина X интервала, содержащего про- извольную точку Р, имеет другое распределение (с плотностью 2х). В частности, средняя длина каждого из двух интервалов равна V2» а средняя длина интервала, содержащего Р, равна 2/3. Точка Р бе- рется фиксированной, но произвольной. Поэтому можно ожидать, что интервал, покрывающий Р, выбран (заимствуя фразу у философов теории вероятности) «без предварительного знания его свойств». Наивная интуиция не подготовлена, конечно, воспринять большое различие между покрытием и непокрытием произвольной точки, но после должного размышления это различие становится «интуитивно очевидным». На самом деле, однако, даже довольно опытные авторы попадали в ловушку. Для доказательства представим себе, что окружность разъеди- нена в точке Р. Нам остаются две точки, выбранные независимо и наудачу в 0, 1. Используя те же обозначения, что и раньше, мы находим, что событие {X < происходит тогда и только тогда, когда Х(2) — Х(1) > 1 — /.По формуле (7.1) вероятность этого равна /2. Величина % имеет поэтому плотность 2t, как утверждалось. (Начинаю- щим рекомендуется провести непосредственную вычислительную проверку.) г) Распределение порядковых статистик. Если Xf, ..., Х„ независимы и распределены равномерно в интервале 0, 1, то число величин, удовлетворяющих неравенству 0 < Ху<1 t < 1, имеет бино- миальное распределение с вероятностью «успеха», равной /. Теперь событие {X(ft) происходит, если и только если по крайней становкой индексов. Другой способ вычисления, приводящий к более сильному результату, содержится в примере III, 3, в).
38 Гл. 1. Показательные и равномерные плотности мере k из величин Xf не превосходят t, и, следовательно, п P(X(ft) V(l-/)»-< (7-2) /=* ’' Это дает нам функцию распределения Л-й порядковой статистики. После дифференцирования находим, что плотность Х(А) равна (7.3) Это можно увидеть непосредственно из следующего: вероятность того, что одна из величин Xz лежит между t и /4- Л и что k—1 из оставшихся величин меньше t, в то время как п—k величин больше t+h, равна n — t—h)n~*h. Деля последнее выражение на ft и устремляя h к 0, получим (7.3). д) Предельные теоремы. Чтобы понять характер распределения Х(1), когда п велико, лучше ввести Е (Х(1)) = (п-Ь I)-1 как новую единицу измерения. Тогда при п—> оо мы получим для хвоста функ- ции распределения Р{пХ<п>0 = (1-4У- е-К (7.4) Словами это соотношение обычно описывают так: в пределе Х(1) показательно распределена с математическим ожиданием п-1. Аналогично Р (пХ(2) > 0 = (1 -4)"+ ( ;) 4 (1 -4)”"1 — + te-<, (7.5) и в правой части мы узнаем хвост гамма-распределения б2 из фор- мулы (3.5). Подобным способом легко проверить, что при каждом фиксированном k при п —» оо распределение nX(ft) стремится к гамма- распределению Gk (см. задачу 33). Теперь Gk есть распределение суммы k независимых показательно распределенных величин, тогда как X(ft) есть сумма первых k ин- тервалов, рассмотренных в примере б). Мы можем поэтому сказать, что длины последовательных интервалов нашего разбиения ведут себя в пределе так, как если бы они были взаимно независимыми показательно распределенными величинами. Ввиду очевидной связи (7.2) с биномиальным распределением для получения приближений к распределению Х(Л), когда и п, и k велики, может быть использована центральная предельная теорема. (См. задачу 34.) е) Отношения. Пусть X выбрано наудачу в 0, 1. Обозначим через U длину более короткого из интервалов О, X и X, 1 и через
§ 8. Случайные разбиения 39 V = 1 — U длину более длинного. Случайная величина U равномерно распределена между 0 и так как событие {U < t < 1/2} про- исходит тогда и только тогда, когда или X < t, или 1—X < t, и потому имеет вероятность 2t. По соображениям симметрии вели- чина V распределена равномерно между % и 1, и отсюда E(U) = 1/4, E(V) = 3/4. Что мы можем сказать об отношении V/U? Оно необходимо превосходит 1 и лежит между 1 и t тогда и только тогда, когда или или 4-^ . При />1 отсюда сле- 1 -f-Г 2 Z 1 -f-Г 1 дует, что р{т<(}=-^Г' (7-6) и плотность этого распределения равна 2(/-{-1)"2. Мы видим, что отношение V/U имеет бесконечное математическое ожидание. Этот пример показывает, сколь малая информация содержится в наблю- дении E(V)/E(U) = 3. ► § 8. СЛУЧАЙНЫЕ РАЗБИЕНИЯ Задача этого параграфа завершает предыдущий ряд примеров и выделена из них отчасти ввиду ее важности в физике, отчасти ввиду того, что она дает прототип обычных марковских цепей. Формально мы будем иметь дело с произведениями вида Z„ = s=XxX2.. .Хл, где Хх, ..., Х„—взаимно независимые величины, равномерно распределенные в интервале 0, 1. Примеры для применений. В некоторых процессах со столкнове- ниями физическая частица расщепляется на две и ее масса т делится между ними. Различным процессам могут соответствовать различные законы разбиения, но чаще всего предполагается, что полученная каждой дочерней частицей часть исходной массы распределена рав- номерно в 0, 1. Если одна из двух частиц выбрана наудачу и под- вергается новому столкновению, то (в предположении отсутствия взаимодействия, т. е. независимости столкновений) массы двух частиц второго поколения задаются произведениями тХхХ2 и т. д. (см. задачу 21). С небольшими терминологическими изменениями эта модель применима также к разбиениям зерен минералов или галек и т. п. Вместо масс можно рассматривать потери энергии при столкновениях, и описание несколько упрощается, если заниматься изменениями энергии одной и той же частицы при последовательных столкновениях. В качестве последнего примера рассмотрим изме- нения в интенсивности света, проходящего через вещество. При- мер. 10, а) показывает, что когда световой луч проходит через сферу радиуса 7? «в случайном направлении», расстояние, пробегаемое лучом в сфере, распределено равномерно между 0 и 2R. При нали- чии равномерного поглощения такое прохождение будет уменьшать
40 Гл. I. Показательные и равномерные плотности интенсивность случайного луча на величину, которая распределена равномерно в интервале 0, а (где а < 1 зависит от степени погло- щения). Масштабный параметр не влияет серьезно на нашу модель, и видно, что п независимых прохождений будут уменьшать интен- сивность света на величину вида Z„. ► Для того чтобы найти распределение Z„, мы можем действовать двумя способами. (i) Редукция к показательным распределениям. Так как суммы обычно предпочтительнее произведений, мы перейдем к логарифмам, полагая YA = —IogXA. Величины YA взаимно независимы, и при t>0 = = (8.1) Функция распределения G„ суммы S„ = Yx + ... + Y„ п независимых показательно распределенных величин была получена в формуле (3.5), и тогда функция распределения величины Z„ = e~s» задается выра- жением 1—Gn(logZ-1), где 0</<1. Плотность этого распреде- ления равна (log t~l) или МО=(г4ф(1°е4)”‘. «<'<' <8.2) Наша задача решается в явном виде. Этот метод показывает преимущества вывода с помощью соответствующего преобразования, однако успех зависит от случайного совпадения нашей задачи и задачи, предварительно решенной. (ii) Рекуррентная процедура имеет то преимущество, что она применима к родственным задачам. Пусть Fn (t) = Р {Zn /} и 0</<1. По определению F1(t) = t. Допустим, что Fn^ из- вестно, и рассмотрим — как произведение двух незави- симых величин. При условии ХЛ = х событие {Zn^Z} происходит тогда и только тогда, когда Z^^t/x, и имеет вероятность Рп_г (t/x). Суммируя по всем возможным х, мы получаем при 0 t 1 1 1 Fn (') = У F„_t (4) dx = j (-J-) dx +1. (8.3) о t Эта формула в принципе позволяет нам вычислить последовательно F2, Fs, .... На практике удобнее иметь дело с соответствующими плотностями fn. По предположению существует. Предположим по индукции существование fn^1. Вспоминая, что fn-i(s) — Q при s> 1, мы получаем после дифференцирования (8.3) 1 /»(0 = ри-1(4)т» 0</<1, (8.4) и элементарные вычисления показывают, что /„ действительно-за- дается формулой (8.2).
§ 9. Свертки и теоремы о покрытии 4j § 9. СВЕРТКИ И ТЕОРЕМЫ О ПОКРЫТИИ Результаты этого параграфа в какой-то мере занятны и сами по себе, и в связи с некоторыми очевидными приложениями. Кроме того, они несколько неожиданно возникают в совсем, казалось бы, не связанных разделах, таких, как, например, критерии значимости в гармоническом анализе [пример 3, е) гл. III], пуассоновские процессы [гл. XIV, 2, а)] и случайные сдвиги [пример 10, д)]. Поэтому не удивительно, что все формулы, так же как и их ва- рианты, выводились несколько раз различными способами. Способ, используемый в последующем, выделяется простотой и примени- мостью к близким задачам. Пусть а > 0 фиксировано, и пусть Xf, Х2, ... —взаимно независимые случайные величины, равномерно распределенные на 0, а. Пусть 8П = ХГ + ... +Х„. Наша первая задача заключается в нахождении распределения Uп суммы и ее плотности un=^U'n. По определению иг (х) = а"1 при 0 < х < а и (%) = 0 в других точках (прямоугольная плотность). Для п > 1 плотности ип опре- деляются формулой свертки (2.13), которая в данном случае имеет вид а «„+i(*) = yj u„(x—y)dy = ^[Un(x)—U„(x—a)]. (9.1) о Легко видеть, что [ хя“2, 0 х$С а, и2(х) = \ /о \ -о (9-2) 7 1 (2а— х) а 2, а^х^2а, и, конечно, и2 (х) = 0 для всех других х. График и2 представляет собой равнобедренный треугольник с основанием 0, 2а, и поэтому и2 называется треугольной плотностью. Аналогично, и3 сосредо- точена на 0, За и определяется тремя квадратными полиномами соответственно в интервалах 0, а, а, 2а и 2а, За. Чтобы найти общую формулу, мы введем следующее Обозначение. Мы записываем положительную часть действи- тельного числа х в виде В последующем мы используем символ хп+ для (х+)", т. е. для функции, которая равна 0 при х^Ои равна хп при х^О. Заметим, что (х—а)+ есть нуль при х < а и линейная функция, когда х > а. С помощью этого обозначения равномерное распределение можно записать в форме (%) = (х+ —(х—а)+) а"1. (9.4) Теорема 1. Пусть Sn—сумма п независимых случайных величин.
42 Гл. 1. Показательные и равномерные плотности распределенных равномерно на 0, а. Пусть t/„(x) = Р и пусть un~U'n—плотность этого распределения. Тогда при п = 1, 2, ... и для всех х^О v=O 7 п + 1 «n+iW = ^Ti^ va)+- v=O ' (9-5) (9-6) (Эти формулы остаются верными для х < 0 и п = 0 при условии, что х° равно (\ если х<0, и 1, если х>0.) Заметим, что если точка х расположена между (k — 1)а и ka, то только k членов в формулах отличны от 0. Для удобства прак- тических вычислений можно, игнорируя пределы суммирования в (9.5), (9.6), считать, что v меняется от — со до оо. Это возможно в силу того, что по соглашению биномиальные коэффициенты в (9.5) равны 0 при v<0 и v > п (см. 1; II, 8). Доказательство. При п=1 справедливость (9.5) очевидна, так как (9.5) сводится к (9.4). Докажем оба утверждения теоремы вместе методом индукции. Допустим, что формула (9.5) верна при некотором Подставляя (9.5) в (9.1), получаем ип+1 в виде разности двух известных сумм. Заменяя индекс суммирования v во второй сумме на v—1, получаем W=srk S <- »’ [ (:) + ( что совпадает с правой частью (9.6). Интегрирование доказывает справедливость (9.5) для п + 1, и этим завершается доказательство. ► (Другое доказательство, использующее переход к пределу в ди- скретной модели, содержится в 1; гл. XI, 7, задача 20.) Если а = 2Ь, то случайные величины Xft—b равномерно рас- пределены на симметричном (относительно нуля) интервале — b,b и поэтому сумма п таких величин имеет то же распределение, что и величина S„—nb. Последнее распределение задается функцией [/„(x + nb). Поэтому наша теорема может быть сформулирована в следующей эквивалентной форме. Теорема 1а. Плотность суммы п независимых случайных вели- чин, равномерно распределенных на —Ь, Ь, задается равенством п un(x + nb) = (26)n(n_l)|X(-1)v ) (x+(n-2v)b)r- (9.7) Мы переходим теперь к теореме, которая допускает две экви- валентные формулировки, одинаково полезные для многих частных задач, возникающих в приложениях. Отыскиваемая в этих теоремах вероятность по счастливому совпадению очень просто выражается
§ 9. Свертки и теоремы о покрытии 43 в терминах плотности ип. Мы докажем это аналитическим спосо- бом, который имеет широкую применимость. Доказательство, осно- ванное на геометрических соображениях, см. в задаче 23. Теорема 2. На окружности длины t заданы п 2 дуг длины а, центры которых выбраны независимо и наудачу. Вероятность ф„ (О того, что эти п дуг покрывают всю окружность, равна (9.8) или, что то же самое, п (9.9) Прежде чем доказывать это, придадим теореме форму, в кото- рой она будет использована позже. Выберем один из п центров в качестве начала и развернем окружность в интервал длины t. Оставшиеся п—1 центров случайно распределяются в интервале 0, I, и тогда теорема 2 выражает то же самое, что и Теорема 3. Пусть интервал 0, t разбит на п подынтервалов посредством независимого и случайного выбора п—1 точек деления Х1( ..., XB_i. Вероятность <р„ (/) того, что ни один из этих интервалов не превосходит а, равна (9.9). Отметим, что ф„(/), рассматриваемая при фиксированном t как функция а, представляет собой функцию распределения максималь- ной из длин п интервалов, на которые разбит интервал 0, t. В связи с этим см. задачи 22—27. Доказательство. Достаточно доказать теорему 3. Мы докажем рекуррентную формулу а Ф„(0 = (п-1) J (9.10) о Ее справедливость прямо следует из определения <рл как (п—1)- кратного интеграла, но предпочтительнее толковать (9.10) вероят- ностно следующим образом. Наименьшее значение среди X*, ..., X„_f должно быть меньше чем а, причем существует п—1 возможностей выбрать это значение. При условии, что Х1 = х, вероятность того, [I________________________________п"“2 ; тогда Х2, ..., Хп„х рас- пределены равномерно в интервале х, t и условная вероятность того, что они удовлетворяют условиям теоремы, равна —х). Суммируя все возможности, мы получаем (9.10)1). г) Читатели, которых беспокоит вопрос вычисления условных вероятно- стей по плотностям, могут заменить условие Ху = х условием х—h < Ху < х, которое имеет положительную вероятность, а затем перейти к пределу при Ь—>0.
44 Гл. 1. Показательные и равномерные плотности Если предположить, что <рл из (9.8) удовлетворяет равенству (9.10), то для ип, входящих в (9.8), равенство (9.10) сведется к цл(/) = а“1 (t—x)dx, (9.11) о что есть в точности рекуррентная формула (9.1), которая служит для определения ип. Поэтому достаточно доказать теорему для случая п = 2. Но и так ясно, что ср2 (/) = 1 при 0 < t < а и <р2 (t) = = (2а— t)/t при а < t < 2а в полном согласии с (9.8). ► § 10. СЛУЧАЙНЫЕ НАПРАВЛЕНИЯ Выбор случайного направления на плоскости 5J2—это то же самое, что выбор наудачу точки на окружности. Если желательно задать направление углом, который оно составляет с правой частью х-оси, то на окружности следует ввести координату 0, 0^0 < 2л. Для случайных направлений в пространстве 5^3 в качестве выбо- рочного пространства служит единичная сфера; каждая область имеет вероятность, равную ее площади, деленной на 4л. Выбор случайного направления в «Я3 эквивалентен выбору наудачу точки на этой единичной сфере. Так как это включает пару случайных величин (долготу и широту), то следовало бы отложить обсуждение трехмерного случая до гл. III, но в данном контексте он появ- ляется более естественно. Предложения, (i) Обозначим через L длину проекции единичного вектора со случайным направлением в Я? на фиксированную пря- мую, скажем х-ось. Тогда величина L распределена равномерно на О и Е(Ъ) = Ч2. (ii) Пусть U—длина проекции того же вектора на фиксиро- ванную плоскость, скажем (х, у)-плоскость. Тогда LJ имеет плот- ность tfV1—/2 при 0 < t < 1, и Е(и) = л/4. Важно то, что две проекции имеют различные распределения. Тот факт, что первое распределение равномерно, не есть свойство случайности, а есть свойство, присущее пространству трех изме- рений. Аналогом теоремы (i) в 912 служит Предложение, (iii) Пусть L—длина проекции случайного еди- ничного вектора в Я2 на х-ось. Тогда L имеет плотность 2/(лК 1 —х2) и Е(Ь) = 2/л. Доказательства, (iii) Если 0 —угол между нашим случайным направлением и //-осью, то L = | sin 01 и, следовательно, при 0 < х < 1 в силу симметрии P{L<x} = P{0 < 0 < arcsinх} = ~arcsinх. (10.1) Предложение (iii) теперь доказывается дифференцированием. (i), (ii) Вспомним элементарную теорему о том, что площадь
§ 10. Случайные направления 45 сферического пояса между двумя параллельными плоскостями пропорциональна высоте пояса. При 0</<1 событие представляется поясом |х1| t высоты 2/, тогда как событие соответствует поясам | хх | К1 — t2 общей высоты 2—2 J/1 —t2- Этим обе функции распределения определяются с точностью до числовых множителей. Их значения просто находятся из условия, что обе функции распределения равны 1 при / = 1. ► Примеры, а) Прохождение через сферу. Пусть 2 —сфера ра- диуса г и N—точка на ней. Линия, проведенная через N в слу- чайном направлении, пересекает 2 в точке Р. Тогда длина сег- мента NP является случайной величиной, равномерно распределенной между 0 и 2г. Чтобы увидеть это, рассмотрим ось NS сферы и треуголь- ник NPS, который имеет прямой угол в точке Р и угол 0 в точке N. Длина NP равна тогда 2rcos0. Но cos© является в то же время проекцией единичного вектора прямой NP на диа- метр NS, и поэтому величина cos© равномерно распределена на О, 1. В физике эта модель употребляется для описания прохожде- ния света через «случайно распределенные сферы». Возникающее при этом поглощение света' использовалось в качестве одного из примеров процессов случайных разбиений в предыдущем параграфе (см. задачу 28). б) Круговые объекты под микроскопом. Через микроскоп наблю- дается проекция клетки на (х1? х2)-плоскость, а не ее действи- тельная форма. В некоторых биологических экспериментах клетки имеют линзообразную форму и могут рассматриваться как круговые диски. Один лишь горизонтальный диаметр проектируется в свою натуральную величину, а весь диск проектируется в эллипс, малая ось которого является проекцией наиболее круто наклоненного радиуса. Обычно предполагается, что ориентация диска случайна; это означает, что направление его нормали выбрано наудачу. В этом случае проекция единичной нормали на х3-ось распределена равномерно в 0, 1. Но угол между этой нормалью и х3-осью равен углу между наиболее круто наклоненным радиусом и (хх, ^-пло- скостью. Следовательно, отношение малой и большой осей рас- пределено равномерно в 0, 1. Иногда обработка экспериментов основывалась на ошибочном мнении, что угол между наиболее круто наклоненным радиусом и (хх, х2)-плоскостью должен быть распре- делен равномерно. в) Почему две скрипки звучат вдвое громче, чем одна? (Вопрос серьезен, так как громкость пропорциональна квадрату амплитуды колебаний.) Поступающие волны могут быть изображены случай- ными единичными векторами, и эффект наложения звука двух скрипок соответствует сложению двух независимых случайных
46 Гл. I. Показательные и равномерные плотности векторов. По теореме косинусов квадрат длины результирующего вектора равен 2 +2cos©. Здесь 0—угол между двумя случайными векторами, и, следовательно, cos© распределен равномерно в —1,1 и имеет нулевое математическое ожидание. Математическое ожи- дание квадрата длины суммарного вектора поэтому действительно равно 2. На плоскости cos© уже не является равномерно распределенной случайной величиной, но по соображениям симметрии по-прежнему имеет нулевое математическое ожидание. Таким образом, наш ре- зультат справедлив при любом числе измерений. См. также при- мер V, 4, д). ► Под случайным вектором в 9L* понимается вектор, проведенный в случайном направлении, длина которого L является случайной величиной, не зависящей от его направления. Вероятностные свой- ства случайного вектора полностью определяются свойствами его проекции на х-ось, и, используя последнюю, можно избежать анализа в трех измерениях. Для этого важно знать связь между функцией распределения V истинной длины L и распределением F длины Lx проекции на х-ось. Имеем Lx = XL, где X—длина про- екции единичного вектора с данным направлением. Соответственно величина X равномерно распределена на 0, 1 и не зависит от L. При условии Х = х событие происходит тогда и только тогда, когда L^t/x, и поэтому1) о t > 0. (10.2) Соответствующие плотности мы получаем дифференцированием с/ \ Л / Л J у о t Повторное дифференцирование приводит к у(/) = —//'(/), # />0. (10.4) Мы нашли таким образом аналитическую связь между плотно- стью v длины случайного вектора в и плотностью f длины его проекции на фиксированное направление. Соотношение (10.3) используется для отыскания f, когда v известно, а соотношение (10.4)—в противоположном случае. (Асимметрия между двумя формулами обусловлена тем фактом, что направление не является независимым от длины проекции.) Примеры, г) Распределение Максвелла для скоростей. Рассмот- рим случайные векторы в пространстве, проекции которых на Это рассуждение повторяет доказательство формулы (8.3)*
§ 10. Случайные направления 47 х-ось имеют нормальную плотность с нулевым математическим ожиданием и единичной дисперсией. Длина проекции равна её абсолютному значению, и поэтому f(0 = 2n(/)= />0. (10.5) Тогда из (10.4) выводим v(/)= />0 (Ю ,6) Это есть плотность Максвелла для скоростей в статистической механике. Обычный вывод объединяет предыдущее рассуждение с доказательством того, что плотность / должна иметь вид (10.5). (Другой вывод см. в гл. III,4.) д) Случайные сдвиги в 5£3 (Рэлей). Рассмотрим п единичных векторов, направления которых выбираются независимо друг от друга и наудачу. Мы разыскиваем распределение длины Ln их суммы. Вместо непосредственного изучения этой суммы мы рас- смотрим ее проекцию на х-ось. Эта проекция, очевидно, равна сумме п независимых случайных величин, распределенных равно- мерно на —1, 1. Плотность этой суммы дается формулой (9.7) при 6=1. Длина этой проекции равна ее абсолютному значению, и, используя (Ю.4), мы получаем плотность длины L^1): п ✓ М*) = (-l)v(U(^-2v)V, х>0. (10.7) ' ' v=0 4 ' Эта задача возникает в физике и химии (векторы изображают, например, плоские волны или молекулярные связи). Сведение к одному измерению, по-видимому, делает эту известную задачу тривиальной. Тот же метод применим к случайным векторам произвольной длины, и таким образом (10.4) позволяет нам свести задачи слу- чайного блуждания в 3L3 к более простым задачам в ЗР. Даже если трудно получить точное решение, ценную информацию дает центральная предельная теорема [см. пример 4,6) гл. VIII]. ► Случайные векторы в 3L3 определяются тем же способом. Аналогом (10.2) служит соотношение, связывающее распределение V истинной длины и рас- пределение F длины проекции: л/2 <и1'8) __________ о *) Обычно ссылаются на статью С? Чандрасекара, который вычислил v4, v6 и преобразование Фурье для vn. Так как он использовал полярные координаты, его Wn(x) нужно умножить на 4лх2, чтобы получить нашу плот- ность vn. Статья Чандрасекара перепечатана в книге У экса (1954)*
48 Гл, I. Показательные и равномерные плотности Однако обратное соотношение (10.4) не имеет простого аналога, и, чтобы выразить V через F, мы должны опираться на относительно глубокую теорию интегрального уравнения Абеля х). Мы констатируем здесь без доказательства, что если F имеет непрерывную плотность ft то л/2 о (См. задачи 29, 30.) е) Двойные орбиты. При наблюдении спектрально-двойных орбит астро- номы могут измерить только проекции векторов на плоскость, перпендику- лярную к линии зрения. Эллипс в пространстве проектируется в эллипс в этой плоскости. Большая ось исходного эллипса лежит в плоскости, определяемой лучом зрения и проекцией этой оси, и поэтому разумно предположить, что угол между большой осью и ее проекцией равномерно распределен. Распре- деление проекции определяется (в принципе) измерениями. Распределение исходной большой оси дается тогда решением (10.9) интегрального урав- нения Абеля. ► § 11. ИСПОЛЬЗОВАНИЕ МЕРЫ ЛЕБЕГА Если множество А в 0, 1 представляет собой объединение конечного множества непересекающихся интервалов /х, /2 ... с дли- нами Хх, Х2, то равномерное распределение приписывает ему вероятность Р{А} = Х1 + Х2+... . (11.1) Следующие примеры покажут, что некоторые простые, но важные задачи приводят к объединениям бесконечного числа непересекаю- щихся интервалов. Определение (11.1) по-прежнему применимо и отождествляет Р{А} с лебеговой мерой А. Это согласуется с нашей программой отождествления вероятностей с интегралом от плот- ности /(х) = 1, зз исключением того, что мы используем интеграл Лебега, а не интеграл Римана (который может не существовать). Из теории Лебега нам требуется только тот факт, что если А представляет собой объединение (возможно, пересекающихся) ин- тервалов /х, /2, ..., то мера Р{А} существует и не превосходит суммы Хх +Х2-|- ... их длин. Для непересекающихся интервалов вы- полняется равенство (11.1). Использование меры Лебега соответ- ствует свободной интуиции и упрощает дело, так как обосновы- J) Преобразование в интегральное уравнение Абеля достигается посред- ством замены переменных Fi(x) = f(-АА х / Vi (х) = V ( и xsin20=z/» \ V х / Тогда (10,8) принимает вид I С У1(у) dy.
§ 11. Использование меры Лебега 49 ваются все формальные переходы к пределу. Множество N назы- вается нулевым множеством, если оно содержится в множествах произвольно малой меры, т. е. если .для каждого е существует множество Az)N, такое, что Р{А}<е. В этом случае P{Af}=0. В дальнейшем X обозначает случайную величину, распреде- ленную равномерно в 0, 1. Примеры, а) Какова вероятность того, что величина X ра- циональна? Последовательность т» Т» Т» Т» Т» ••• с°ДеР~ жит все рациональные числа интервала 0, 1 (расположенные в по- рядке возрастания знаменателей). Выберем 8<-у и обозначим через Jk интервал длины 8*+1 с центром в й-й точке последова- тельности. Сумма длин интервалов Jk равна е2е3. < 8, и их объединение покрывает рациональные числа. Поэтому по нашему определению множество всех рациональных чисел имеет вероят- ность нуль, и, следовательно, X иррационально с вероятностью единица. Здесь уместно спросить: зачем такие множества рассматри- ваются в теории вероятностей? Один из ответов состоит в том, что их исключением ничего нельзя достичь и что использование тео- рии Лебега действительно упрощает дело, не требуя новых мето- дов. Второй ответ может быть более убедителен для начинающих и для нематематиков; нижеследующие варианты приводят к зада- чам, несомненно, вероятностной природы. б) С какой вероятностью цифра 7 встречается в десятичном разложении величины X? В десятичном разложении каждой точ- ки х из открытого интервала между 0,7 и 0,8 цифра 7 появляется на первом месте. Для каждого п существуют 9"”1 интервалов длины 10"/г, содержащих только такие числа, что цифра 7 появ- ляется на n-м месте, но не раньше (при п = 2 их концами слу- жат 0,07 и 0,08, затем 0,17 и 0,18 и т. д.). Эти интервалы не пересекаются, и их общая длина равна Tofl + nj + ^y + ---) = l- Таким образом, наше событие имеет вероятность 1. Заметим, что некоторые числа имеют два представления, напри- мер, 0,7 = 0,6999... . Чтобы сделать обсуждаемый нами вопрос определенным, мы должны точно установить, должна или может цифра 7 появиться в представлении, но наше рассуждение не за- висит от этого различия. Причина в том, что только рациональ- ные числа могут иметь два представления, а множество всех ра- циональных чисел имеет вероятность нуль. в) Бросание монеты и случайный выбор. Посмотрим теперь, как «случайный выбор точки X между 0 и 1» может быть описан в терминах дискретных случайных величин. Обозначим через Xk (х) k-w десятичный знак х (чтобы избежать двусмысленностей, мы будем использовать, когда это возможно, обрывающиеся разложе-
50 Гл. I. Показательные и равномерные плотности ния). Случайная величина ХЛ принимает значения 0, 1, . ..,9, каждое с вероятностью ~, и величины Хй взаимно независимы. Кроме того, мы имеем тождество Х=У-ЬхА. (11.2) Эта формула сводит случайный выбор точки X к последователь- ным выборам ее десятичных знаков. В последующих рассуждениях мы перейдем от десятичного разложения к двоичному, т. е. мы заменим основание 10 на осно- вание 2. Вместо (11.2) мы теперь имеем со X=E^Xft> (11.3) k-1 z где Xfe—взаимно независимые случайные величины, принимающие значения 0 и 1 с вероятностью 1/2. Эти величины определены на интервале 0, 1, для которого вероятность отождествляется с мерой Лебега (длиной). Эта постановка задачи напоминает игру с броса- нием монеты из первого тома, в которой выборочное простран- ство состоит из бесконечных последовательностей гербов и реше- ток или нулей и единиц. В этом выборочном пространстве можно теперь заново интерпретировать (11.3). В этом пространстве суть координатные величины, а X есть случайная величина, ими определяемая; ее функция распределения, конечно, равномерна. Заметим, что второе выборочное пространство содержит две раз- личные выборочные точки 0111111... и 1000000..., хотя соответ- ствующие двоичные разложения изображают одну и ту же точку 1/2. Однако понятие нулевой вероятности дает нам возможность отож- дествить два выборочных пространства. Другими словами, при пренебрежении событием нулевой вероятности случайный выбор точки X между 0 и 1 может быть осуществлен последователь- ностью бросаний монеты и, наоборот, результат бесконечных бросаний монеты может быть изображен точкой х из интервала 0, 1. Каждая случайная величина, связанная с игрой в монету, может быть представлена функцией на 0, 1 и т. д. Этот удобный и наглядный прием использовался в теории вероятностей издавна, но он связан с пренебрежением событиями, имеющими нулевую вероятность. г) Распределения канторовского типа. Если мы будем рассмат- ривать в (Н.З) сумму слагаемых с четными номерами, или, что то же самое, рассматривать случайную величину 00 Y-3£^XV1 (11.4) V 1
§ 12. Эмпирические распределения 5t то мы придем к распределению с неожиданными свойствами. (Мно- житель 3 введен для упрощения рассуждений. Сумма слагаемых с нечетными номерами распределена так же, как | Y.) Функция распределения F(x) = P{Y ^.х] служит примером так называемых сингулярных распределений. При подсчете мы рассматриваем Y как выигрыш игрока, ко- торый получает величину 3-4~А, когда &-е бросание симметрич- ной монеты дает в результате решетку. Полный выигрыш лежит между 0 и 3 (4“14-4“2-|-.. .) = 1. Если первое испытание приво- дит к 1, то выигрыш а/4, тогда как в противоположном случае Y ^3 (4~24-4“а4-... )==4-1. Таким образом, неравенство Ч, <Y < < а/4 не может быть осуществлено ни при каких обстоятельствах, и поэтому F (х) = 1/а в этом интервале длины 1/2. Отсюда следует, что F не может иметь скачка, превышающего 1/г. Отметим теперь, что с точностью до множителя */4 испытания с номерами 2, 3, .. представляют собой точную копию всей последовательности, и поэтому график F (х) в интервале 0, отличается от всего графика только преобразованием подобия f(*)=y^(4x), 0<х<»/4. (Н.5) Отсюда следует, что f (x) = V4 всюду в интервале длины х/8 с центром в точке Ve- По соображениям симметрии F (х) = 3/4 всюду в интервале длины */8 с центром в 7/8. Мы нашли сейчас три ин- тервала общей длины х/2 4-2/8 = 3/4> на каждом из которых F при- нимает постоянное значение, а именно 1/^ V2 или 3/4. Следова- тельно, F не может иметь скачка, превышающего J/4- Остаются четыре интервала длиной 1/i& каждый, и в каждом из них гра- фик Fотличается от всего графика только преобразованием подобия. Каждый из четырех интервалов поэтому содержит подынтервал половины его длины, на котором F принимает постоянное значе- ние (а именно 1/8, 3/8, ?/8, ?/8 соответственно). Продолжая в том же духе, мы найдем за п шагов 1 +2-|-224- ... -f-2""1 интервалов общей длины 2‘1 + 2“24-2"3+... 4-2”"= 1—2"«, в каждом из которых F принимает постоянное значение. Таким образом, F представляет собой непрерывную функцию, возрастающую от F (0) = 0 до F (1) = 1 так, что сумма длин интервалов постоянно равна 1. Грубо говоря, все возрастание F происходит на множестве меры 0. Мы имеем здесь непрерывную функцию распределения F без плотности [. ► § 12. ЭМПИРИЧЕСКИЕ РАСПРЕДЕЛЕНИЯ «Эмпирическая функция распределения». Fn для п точек аь ... .ап на прямой есть ступенчатая функция со скачками \]tt в точках аи ап. Другими словами, tiFn(x) равно числу точек
52 Гл. 1. Показательные и равномерные плотности ак в —оо, %, и Fn—функция распределения. Если даны п слу- чайных величин Xn . ..,ХП, то их значения в некоторой точке выборочного пространства образуют строку из п чисел и ее эмпи- рическая функция распределения называется эмпирическим рас- пределением выборки. При каждом х значение Frt (х) эмпириче- ского распределения выборки определяет новую случайную вели- чину, а эмпирическое распределение (Хх, ..., Хп)—это целое семейство случайных величин, зависящих от параметра х (фор- мально мы имеем дело со случайным процессом, где х—временной параметр). Мы не будем пытаться развить здесь теорию эмпири- ческих распределений, но это понятие можно использовать для иллюстрации возникновения сложных случайных величин в прос- тых приложениях. Сверх того мы в новом свете увидим равно- мерное распределение. Пусть Хп ...» Хп обозначают взаимно независимые случайные величины с одинаковым непрерывным распределением F. Вероят- ность того, что любые две величины принимают одно и то же значение, равна нулю, и поэтому мы можем ограничить наше вни- мание выборками из п различных значений. При фиксированном х число величин Xk, таких, что Xk^.x, имеет биномиальное рас- пределение с вероятностью «успеха» p = F(x), и поэтому случай- ная величина Frt (х) имеет биномиальное распределение с возмож- ными значениями 0, 1/и, . .,1. Следовательно, при большом п и фиксированном х значение Fw (х) с большой вероятностью будет довольно близким к F (х), и центральная предельная теорема ин- формирует нас о возможных отклонениях. Более интересен (зави- сящий от случая) график Fw в целом и то, насколько он близок к F. Мерой этой близости может быть максимум расхождения, т. е. D„= sup |F„(x)-F« (12.1) — ао< х <ао Эта новая случайная величина представляет большой интерес для статистиков в силу следующего свойства. Распределение ве- роятностей случайной величины Drt не зависит от F (конечно, при условии, что F непрерывна). Для доказательства этого свойства достаточно проверить, что распределение Dw остается неизменным, когда F заменяется равно- мерным распределением. Мы сначала покажем, что величины \k = F(Xk) распределены равномерно в 0, 1. Для этой цели мы ограничим t интервалом 0, 1, ив этом интервале мы определим v как функцию, обратную F. Событие {F(Xk)^t} равносильно тогда событию {ХЛ v (/)}, которое имеет вероятность F (и (/)) = /. Таким образом, = как и утверждалось. Величины Yj, ..., Yrt взаимно независимы, и мы обозначим их эмпирическое распределение через Gn. Только что приведенные рассуждения показывают также, что при фиксированном I слу- чайная величина G„ (/) тождественна с Fw (v (/)), Так как t=F (v (£))>
§ 12. Эмпирические распределения 53 то отсюда следует, что в каждой точке выборочного пространства sup I G„ (О—И = sup I F„ (v (0)-F (u (0)1 = D„. Этим доказательство завершается. Тот факт, что распределение Dn не зависит от исходного рас- пределения F, дает статистикам возможность построить критерии и процедуры оценивания, применимые в ситуации, когда исходное распределение неизвестно. В этой связи другие величины, свя- занные с D„, находят даже большее практическое использование. Пусть Хп ..., ХЛ, X*, ..., X* — 2п взаимно независимых слу- чайных величин с одинаковым непрерывным распределением F. Обозначим эмпирические распределения (Хп Х„) и (X#, ... ..., Х„) через F„ и F* соответственно. Положим Drt,^sup|F^x)-F*(x)|. (12.2) X Это есть максимальное расхождение между двумя эмпирическими распределениями. Оно обладает тем же свойством, что и D„, а именно не зависит от распределения F. По этой причине Ьп,п используется при построении статистического критерия проверки «гипотезы о том, что Хп ..., Хп и X*, X* являются слу- чайными выборками из одной и той же совокупности». Распределение D„j72 было найдено с помощью громоздких вы- числений и исследований, но в 1951 г. Гнеденко и Королюк по- казали, что вся проблема сводится к задаче случайного блуждания с хорошо известным решением. Их доказательство отличается изяществом, и мы приведем его для иллюстрации возможностей простых комбинаторных методов. Теорема. Вероятность Р < г/п\ равна вероятности того, что в симметричном случайном блуждании траектория длины 2п, начинающаяся и заканчивающаяся в нуле, не достигнет то- чек ±г. Доказательство. Достаточно рассмотреть целые г. Располо- жим 2п величин Хх, ..., X* в порядке возрастания величины и положим efe = l или sk =—1 в зависимости от того, какая вели- чина занимает й-е место, Xz или X?. Окончательная запись содер- /2п\ жит п «4-1» и п «—1», и все ( п ) расположений равновероятны. Поэтому возникающие при этом строки (ех, находятся во взаимно однозначном соответствии с траекториями длины 2п, начинающимися и заканчивающимися в начале. Если теперь 8-^ . • • . ..4-8/ = ^, то первые / мест заняты (/4~&)/2 неотмеченными и (/—k)/2 отмеченными величинами, и поэтому существует точка х, такая, что F„(x) = (/ + &)/2n и F# (х)==(/—k)[2n. Но тогда
54 Гл. I. Показательные и равномерные плотности |F„(x)—F*(x)| = |&|/п и, следовательно, D„in^p|/n. То же рас- суждение, проведенное в обратном порядке, завершает доказа- тельство. Точное выражение для рассматриваемой вероятности содержится в lj гл. XIV, (9.1), В самом деле, выражение ( я } есть вероятность того, что частица, выходящая из начала отсчета, вернется в момент 2п в начало, не касаясь ir, Последнее условие можно реализо- вать, если установить в точках поглощающие экраны, и поэтому шГэй •есть вероятность возвращения в начало координат в момент 2п, когда точки являются поглощающими экранами. [В 1; гл, XIV, (9.1) рассматривается интервал 0, а, а не —г, г. Наша вероятность wr п тождественна иг>2п(г)Л В 1; гл. XIV было показано, что предельный ’переход приводит от слу- чайных блужданий к диффузионным процессам, и, таким образом, легко видеть, что распределение пОПгП стремится к пределу. Фактически этот предел •был найден Смирновым еще в 1939 г., а аналогичный предел для У п D„— Колмогоровым в 1933 г. Эти вычисления очень сложны и не объясняют связи с диффузионными процессами в противоположность подходу Гнеденко—Коро- люка. С другой стороны, они стимулировали плодотворную работу по сходи- мости стохастических процессов (Биллингсли, Донскер, Прохоров, Скороход и другие). Можно упомянуть, что теоремы Смирнова в равной степени применимы и к расхождениям Dmn между эмпирическими распределениями выборок, имеющих различные объемы тип. Подход, связанный со случайным блуж- данием, применим к этой проблеме, но он во многом теряет свою изящность и простоту (Гнеденко, Рвачева), Статистиками было исследовано множество вариантов Птп (см, задачу 36), $ 13. ЗАДАЧИ Во всех задачах предполагается, что заданные величины взаимно неза- висимы. 1. Пусть X и Y имеют плотности ае~ах, сосредоточенные на 0, оо. Най- дите плотности величин (i) X3 (ii) 3 + 2Х (iii) X—Y (iv) | X —Y| (v) Наименьшей из величин (vi) Наибольшей из величин X и Y3 X и Y3 ___2. Решите ту же задачу, если плотности X и Y равны х/2 в интервале —1, 1 и 0 вне его, 3. Найдите плотности для X-f-Y и X — Y, если X имеет плотность > о). а плотность Y равна й"*1 при 0 < х < Л. 4. Найдите вероятность того, что X2—2аХ+& имеет комплексные корни, если коэффициенты а и b являются одинаково распределенными случайными величинами, плотность которых (i) равномерна, т, е. равна /i*"1 при 0 < х < h; (ii) показательна, т, е, равна ае~ах при х > 0. - uX+Y X+Y 5. Найдите функции распределения величин —— и —— , если вели- X Lt чины X, Y и Z имеют одинаковое показательное распределение. 6, Выведите формулу свертки (3,6) для показательного распределения
§ 13. Задачи 55 прямым переходом к пределу из формулы свертки для «отрицательного бино- миального» распределения из 1; гл. VI, (8.1). 7. Для пуассоновского процесса § 4 обозначим через Z время между мо- ментом t и последним предшествующим прибытием или 0 («возраст» текущего времени между прибытиями). Найдите распределение Z и покажите, что оно- стремится к показательному распределению при t—>оо. 8. В примере 5, а) покажите, что вероятность появления первого рекорд- ного значения на n-м месте и при этом не превосходящего х равна мЯПГ(1 Докажите, что распределение вероятностей первого рекордного значения есть 1 — (1 +ах) е~ах. [Вообще, если величины Xу положительны и подчинены произвольному непрерывному распределению F, то первая вероятность равна [п («+1)]'"1Х XFn+1(x)t а распределение первого рекорда равно F—(1—F)log(l — F)”1.} 9. Нисходящие серии. Случайная величина N определена как единствен- ный индекс, такой, что Хх Х2 Xn-i < Xn . Если Ху имеют одина- ковое распределение с непрерывной функцией распределения, то докажите,, что P(N = n) = (n—1)/п! и E(N) = e. Указание. Используйте метод примера 5, а), относящийся к рекордным значениям. 10. Образование колонн на транспорте1). Автомобили отправляются друг за другом из начала координат и двигаются с различными, но постоянными скоростями по бесконечной дороге, на которой запрещены остановки. Если автомобиль догоняет другой, медленнее едущий автомобиль, то ему самому приходится тащиться с той же скоростью. Таким образом будет сформирована колонна. Предельный размер колонны будет зависеть от скоростей автомо- билей, но не от времен между последовательными отправлениями из началь- ной точки. Рассмотрим скорости автомобилей как независимые случайные величины с одинаковым непрерывным распределением. Выберем наудачу любой авто- мобиль, например первый из отправляющихся после данного момента. Исполь- зуя комбинаторные методы примера 5, а), покажите, что а) вероятность того, что данный автомобиль не будет тащиться за каким- либо другим автомобилем, стремится к 1/2\ б) вероятность того, что данный автомобиль ведет за собой колонну общим размером п (т. е. ровно п—1 автомобилей тащатся за ним), стремится к 1/(п+1) («4-2); в) вероятность того, что данный автомобиль является последним в ко- лонне размера п (т. е. тащится за п—1 автомобилями), стремится к тому же пределу, что и предыдущая вероятность. 11. Обобщение2) примера 5,а) о рекордном значении. Вместо того чтобы рассматривать одно предварительное наблюдение Хо, мы начинаем с выборки (Хх, ..., Х,Л) с порядковыми статистиками (Х(1), ..., X(W)). (Общее для всех величин распределение F не играет роли, коль скоро оно непрерывно.) а) Пусть N — первый индекс и, такой, что Xw+„^X(w). Покажите, что Р {N > n} — ml(tn-\-n). [В примере 5,а) мы имели т—1.] б) Пусть N — первый индекс п, такой, что Хт +п^ Х(от-г+1); покажи- те, что X) Newell G. F., Opns Res. 7 (1959), 589—598. а) Willks S. S., J. Austr. Math. Soc„ 1 (1959), 106-112.
56 Гл. I. Показательные и равномерные плотности При г 2 мы имеем Е (N) = <оо и P{N</nx}—> 1 — т~*°°- в) Пусть N — первый индекс, такой, что Хт + П находится вне интервала между Х(1) и Х(/и). Тогда P{N > п}=~—;———-—тт и Е (N) < оо. 1 J (т + п) (т + п— 1) 12. (Свертки показательных распределений.) Пусть X/ при / = 0, ..., п —X х J имеет плоъ юсть Хув i для х > 0. Здесь Ху Ф если только j не равно k. Положим Фа?, п= [fto Фа?) ••• ••• (^« ^а?)] Покажите, что Х0+... + Хп имеет плотность Рп (/) =Х0 . • K-i ко, пе~Кх+ +%, пе~КпХ]- (*) Указание. Используйте индукцию, симметрию и (2.14). Вычислений можно избежать. 13. Продолжение. Если Y,- имеет плотность je~Jx, то плотность суммы Yi + ... + ¥„ равна п х>°' fe= 1 v ' Используя утверждение примера 6,6), выведите, что fn-\ есть плотность размаха Х(/г) —Х(1) выборки Хг, ..., Х„, где все Ху имеют одинаковую плот- ность е~х. 14. Процессы чистого размножения. В процессе чистого размножения из 1; гл. XVII, 3 система проходит через последовательность состояний £0—► —> Е\—>..., причем время пребывания в состоянии Ek имеет плотность Х&е kX. Таким образом, Sre = Хо+ ... + Х„ есть момент перехода Еп —> En+i' Обозначьте через Рп (/) вероятность Еп в момент t. Покажите, что Pw (0 = == Р {Srt > > О и> следовательно, Р„ (/) определяется формулой (*) задачи 12. Дифференциальные уравнения процесса: Ро (О =—Х0Ро (О, Рп (О =- КРп (О+^-Л-1 (0, 1, можно вывести (а) из (1) и (б) из свойств сумм Sn. Указание. По соображениям симметрии достаточно рассмотреть коэффи- циент при e~^ot. 15. В примере 6,а), где рассматриваются параллельные очереди, мы ска- жем, что система находится в состоянии &, если k окошек свободны. Пока- жите, что здесь применима модель процесса чистого размножения (задача 14) с hk = (n — k) а. Докажите, что Pk (О e~at \k e-(n-k) at. Выведите отсюда распределение X(ft). 16. Рассмотрите две независимые очереди из т и п > т лиц соответст- венно, предполагая, что времена обслуживания имеют одно и то же показа- тельное распределение. Покажите, что вероятность более длинной очереди окончиться первой равна вероятности получить п гербов раньше, чем т ре- шеток, при бросаниях симметричной монеты. Найдите ту же вероятность,
§ 13. Задачи 57 рассматривая отношение Х/Y двух величин с гамма-распределениями Gm и Gn, заданными формулой (3.5). 17. Пример статистического оценивания. Предполагается, что продолжи- тельности существования электрических ламп имеют показательное распреде- ление с неизвестным математическим ожиданием а-1. Чтобы оценить а, бе- рется выборка из п ламп и наблюдаются продолжительности существования Х(1) < Х(2) < • • • < Х(и первых г портящихся ламп. «Наилучшая несмещенная оценка» а”1 дается линейной комбинацией U = ХхХ(1) + ... + А,гХ(г), такой, что E(U) = a-1 и Var (U) имеет наименьшее возможное значение. Покажите, что и = (Х(1)+ ... Х(и) 1 + Х(г) (п—г) 1, и тогда Var (U) = -~a“2. Указание. Проделайте вычисления в терминах независимых величин Х(Л)—X(ft-D (см. пример 6, б)). ____ 18. Пусть величины Хъ Хп распределены равномерно на 0, 1. Пока- жите, что размах Х(п)—Х(1) имеет плотность п (п—l)xw“2(l—х) и матема- тическое ожидание (п—l)/(n+ 1). Какова вероятность, что все п точек лежат внутри некоторого интервала длины /? 19. Ответьте на вопросы примера 6, б), когда три времени ожидания равномерно распределены в интервале 0, 1. (Задача включает «скучные» вы- числения, однако это может оказаться полезным упражнением по части тех- нических приемов.) 20. На окружности независимо и наудачу выбраны четыре точки. Най- дите вероятность того, что хорды ХхХ2 и Х3Х4 пересекаются а) без вычисле- ний, используя лишь соображения симметрии; б) из определения череа интеграл. 21. В процессе случайного разбиения из § 8 обозначьте через Хи, Х12, Х21, Х22 массы четырех осколков второго поколения, индекс 1 относится к наименьшей, а 2—к наибольшей части. Найдите плотности и математи- ческие ожидания этих величин. Замечание. Следующие несколько задач содержат новые теоремы, касаю- щиеся случайных разбиений интервала на части (см. пример 7, б)). Предпо- лагается, что случайные величины Хъ Х„ независимы и равномерно распределены на 0, t. Эти случайные величины индуцируют разбиение интер- вала 0, t на п+1 подынтервалов. Длины этих интервалов, взятые в надле- жащем порядке, мы обозначим Ln ..., Lw+1. В терминах порядковых ста- тистик Li = X(1), L2 = X(2)—Х(1), ..., L„+1 = /—X(„). 22. Обозначим через pn(t) вероятность того, что длины всех п+1 подын- тервалов разбиения больше чем h (иными словами, рп (/) = Р {min > Л}, что представляет собой хвост функции распределения самого короткого из интервалов). Докажите рекуррентное соотношение /-ft Рп (0 =-^ J хп~1рп.1 (х) dx. (*) о Выведите отсюда, что рп (/) = /-«(/—(п+1)Л)+. 23. Используя рекуррентное соотношение, аналогичное (*), докажите без вычислений, что для произвольных + Р {Li > Xi, • * •, > Xn-t 11“ — f и хпi)• (**)
58 Гл. /. Показательные и равномерные плотности (Этот изящный результат был получен Б. де Финетти г) из геометриче- ских соображений. Он включает множество интересных частных случаев. Если xj = h при всех /, то мы получаем предыдущую задачу. Пример 7, б) соответствует частному случаю, когда ровно одна из величин ху отлична от нуля. Теорема о покрытиях (теорема 3 § 9) следует из (**) и формулы 1; IV, (1.5) для появления по крайней мере одного из (п+1) событий.) 24. Пусть qn (/) — вероятность того, что все взаимные расстояния между Xfc превышают h. (Отличие от задачи 22 в том, что здесь не накладываются ограничения на концевые интервалы Lx и Ln+1.) Найдите соотношение, ана- логичное (*), и выведите оттуда qn(t). 25. Продолжение. Не используя решение предыдущих задач, найдите, что (/) = а—2П)" t~”qn 26. Сформулируйте аналог задачи 24 для окружности и покажите, что задача 23 дает ее решение. 27. Равнобедренный треугольник образован единичным вектором в х-на- правлении и единичным вектором в случайном направлении. Найдите распре- деление длины третьей стороны (i) в 3&2 и (ii) в 3J3. 28. Единичный круг (шар) с центром в 0 имеет на положительной х-оси северный полюс. Из полюса выходит луч, и его угол с х-осью распределен равномерно на —1/2л, 1/2л. Найдите распределение длины хорды внутри круга (шара). Замечание. В луч имеет случайное направление, и мы имеем дело с аналогом примера 10, а). В же задача другая. 29. Отношение средних длин случайного вектора и его проекции на х-ось равно 2 в ,Я3 и л/2 в ^£2. Указание. Используйте (10.2) и (10.8). 30. Длина случайного вектора распределена равномерно на 0, 1. Найдите плотность длины его проекции на х-ось а) в 5J3 и б) в Указание. Используйте (10.4) и (10.9). 31. Найдите функцию распределения угла между х-осью и случайно выбранным направлением в 3&4. 32. Найдите в аналог соотношения (10.2) между распределением длины случайного вектора и распределением длины его проекции на х-ось. Про- верьте результат задачи 31, ограничившись единичным вектором. 33. Предельная теорема для порядковых статистик, а) Пусть Xj, ..., Хп распределены равномерно в 0, 1. Докажите, что при фиксированном k и п —► оо j} —Gfe-1 W. *>0. где 6^ есть гамма-распределение (3.5) [см. пример 7, д)]. б) Если Хл имеют произвольную непрерывную функцию распределения Г, то тот же предел существует и для Р {Х(£)«С Ф (х/n)}, где Ф есть функ- ция, обратная к F (Смирнов). 34. Предельная теорема для выборочной медианы. Порядковая статистика Х(п) выборки (Хь ..., X2rt-i) называется выборочной медианой. Если Ху независимы и равномерно распределены на 0, 1, то покажите, что р|х(п)-1<//К8^—>91(0. где 91 обозначает функцию распределения стандартного нормального рас- пределения. 35. Продолжение. Пусть случайные величины Ху имеют одинаковое рас- пределение F с непрерывной плотностью f. Пусть т—медиана распределе- х) Giornale 1st, Ital. degli Attuari, 27 (1964), 151—173,
§ 13. Задачи 59» ния F9 т. е. F (т)~ 1/2. Покажите, что X Р{Х(я) < х}=(2п-1) j F”-1 (У) [1 —F (У)]»-1 / (У) dy, — 00 откуда в силу предыдущей задачи Р 1х(в)-т <------> 3? (О- 36. Докажите следующий вариант теоремы Гнеденко—Королюка в § 121 / 2п \ Р |sup[F„ (x)-F* (*)>Д • k « ] где r=l, 2, ..., n. [В отличие от первоначальной формулировки знаки абсолютных величин слева опущены, и поэтому в соответствующем случай- ном блуждании появляется только один поглощающий барьер в точке г.) 37. Образование показательно распределенных случайных величин из равно- мерно распределенных величин1). Пусть Xlt Х2, ...—независимые величины с равномерным распределением в 0, 1. Определим случайную величину, N как такой индекс, что Xf^X2^ ... ^Xn-i < Xn (см. задачу 9). Докажите, что- vn — 1 уИ откуда P{Xi«C*, N четно} =1—е~х. Определим Y следующим образом: «испытанием» служит последователь- ность Xi, ...» Xn ; мы говорим о «неудаче», если N нечетно. Мы повторяем независимые испытания до появления первого «успеха». Пусть Y равно числу неудач плюс первая величина в успешном испытании. Докажите, что P{Y < х}=1-е-*. х) Von Neumann J., National Bureau of Standarts, Apji. Math. Serries, 12 (1951), 36—38.
ГЛАВА II СПЕЦИАЛЬНЫЕ ПЛОТНОСТИ. РАН ДОМИЗАЦИЯ Основная задача этой главы состоит в том, чтобы перечислить для облегчения ссылок те плотности, которые чаще всего будут появляться в дальнейшем. Рандомизация, описанная во второй части, полезна для многих целей. В качестве иллюстрации дается вывод формул для некоторых распределений, связанных с функ- циями Бесселя и встречающихся в различных переменных. Мы увидим, что этот простой вероятностный прием заменяет сложные вычисления и трудоемкий анализ. § 1. ОБОЗНАЧЕНИЯ И ОПРЕДЕЛЕНИЯ Мы говорим, что плотность f и соответствующее ей распреде- ление F сосредоточены (или сконцентрированы) на интервале 1 = а, Ь1), если /(х) = 0 для всех х, не принадлежащих /. Тогда F(x) = 0 для х<а и Г(х) = 1 для х>&. Говорят, что два рас- пределения F и G, а также их плотности f и g принадлежат одному и тому же типу, если они связаны соотношениями G (x) = F (ax + b), g(x) = af (ax-\-b), (1.1) где а > 0. Мы будем часто называть b центрирующим параметром и а—масштабным параметром. Эти термины становятся хорошо понятными после следующего разъяснения: если F служит функ- цией распределения случайной величины X, то G есть функция распределения величины Y=~. (1.2) Во многих ситуациях в действительности важен только тип рас- пределения. Математическое ожидание т и дисперсия о2, соответствующие х) В соответствии с обычной терминологией наименьший замкнутый интер- вал / с таким свойством следовало бы называть носителем f. Новый термин введен в связи с тем, что мы будем употреблять его в более общем смысле: так, распределение может быть сосредоточено на множестве всех целых или всех рациональных чисел.
§ 1. Обозначения и определения 61 плотности f (или F), определяются равенствами . >• 4- оо 4-00 4-оо т = ^xf(x)dx, а2 = J (х—m)2f(x)dx — ^x2f(x)dx—т2, (1.3) — 00 — 00 — 00 если только интегралы сходятся абсолютно. Из формулы (1.2) следует, что плотности g в этом случае соответствует математи- ческое ожидание (т—Ь)/а и дисперсия с2/а2. Отсюда ясно, что для каждого типа существует самое большее одна плотность с нулевым математическим ожиданием и единичной дисперсией. Вспомним [см. гл. I, (2.12)], что свертка [ = двух плот- ностей f\ и есть плотность вероятности, определяемая формулой 4- оо f W = 5 /1 (х—у) (у) dy. (1.4) Если /1 и f2 сосредоточены на 0, оо, эта формула сводится к X f(x)~^fi(x—y)f2(y)dy, х>0. (1.5) О Функция f представляет собой плотность суммы двух независи- мых случайных величин с плотностями и /2. Заметим, что для ё[ (*) = ft (* + &/) свертка g = gr* g2 дается равенством g (х) = = /(х + &! + &2)» как это видно из (1.2). Мы заканчиваем этот параграф введ нием обозначений для плотности и функции распределения нормального распределения: * * " 1 х 1 1 _— Х2 1 р _ — “w"Fg' ' • ’,w=FSp ’ (L6’ — 00 Давно знакомая нам нормальная плотность с математическим ожиданием т и дисперсией о2 определяется как В центральной предельной теореме неявно содержится существен- ный факт, что семейство нормальных плотностей замкнуто отно- сительно операции свертки*, другими словами, свертка двух нор- мальных плотностей с математическими ожиданиями т2 и дисперсиями о?, о2 есть нормальная плотность с математическим ожиданием т1-\-т2 и дисперсией о? + о2. Ввиду ранее сказанного достаточно доказать это для m1 = m2 = 0. Утверждается, что 7§^ехР [~2^] 1 2nOia2 (х—у)2 2а2 Z(J2 J
62 Гл. II. Специальные плотности. Рандомизация Справедливость этого утверждения становится очевидной, если произвести замену переменных г — у-^Х— где х фиксиро- вано. (См. задачу 1.) $ 2. ГАММА-РАСПРЕДЕЛЕНИЯ Гамма-функция Г определяется как Г(/) = Z>0. (2.1) о [См. 1; гл. II, (12.22).] Гамма-функция интерполирует факториалы в том смысле, что Г(п-|-1) = и! для n = 0, 1, ... . Интегрирование по частям показывает, что Г(/) = (/ — 1)Г(/ — 1) при всех t > 0 (задача 2). Гамма-плотности, сосредоточенные на 0, оо, определяются формулой Za.v(x)=r^yavx'’-1e-«S х>0. (2.2) Здесь а> 0—тривиальный масштабный параметр, hov>0—су- щественный параметр. В частном случае мы имеем дело с показательной плотностью, а плотности fa,п (п=1, 2, ...) совпадают с плотностями gn из гл. I, (3.4). Простые вычисления показывают, что математическое ожидание fa, v равно v/a, а дис- персия равна v/a2. Семейство гамма-плотностей замкнуто относительно опера- ции свертки fa, ц* fa, v = fa, H4-V, р 0,V 0. (2-3) Это важное свойство обобщает теорему из гл. I, 3 и будет по- стоянно использоваться; доказательство чрезвычайно просто. Согласно (1.5), левая часть равна С (%—f/P'1 yv~xdy. (2.4) Г (р) Г (v) J ' о После подстановки у — xt это выражение будет отличаться от fa, u+v только численным множителем, а он равен единице, так как fa, i^v и (2.4) являются плотностями вероятности. Последний интеграл при х=1—это так называемая бета- функция В (р, v), и как побочный результат доказательства мы получаем, что B(J*, v) = j(l~^-ir-x# = rrwr(v) (2 б)
§ 3. Распределения, связанные с гамма-распределением 63 для всех р > 0, v > О. [С целыми pi и v эта формула исполь- зуется в 1; гл. VI, (10.8) и (10.9). См. также задачу 3 этой главы.] Что касается графика v, то он, очевидно, монотонен, если v^'l, и неограничен вблизи нуля, когда v < 1. При v > 1 график /i, v колоколообразен, fltV достигает при x = v—1 максимума, равного (v — l)v-*1e~^~1)/f (v), что близко к [2л (v—I)]-1/2 [фор- мула Стирлинга, 1; гл. II, 12, задача 12]. Из центральной пре- дельной теоремы следует, что Qfa.vl i + v—+оо. (2.6) kA \ kA kA / § 3* РАСПРЕДЕЛЕНИЯ МАТЕМАТИЧЕСКОЙ СТАТИСТИКИ, СВЯЗАННЫЕ С ГАММА-РАСПРЕДЕЛЕНИЕМ Гамма-плотности играют значительную, хотя не всегда явную роль в математической статистике. Прежде всего они фигурируют как'«тип III» в классической (теперь до некоторой степени уста- ревшей) системе плотностей, введенной К. Пирсоном (1894 г.). Более часто они встречаются благодаря тому, что для случайной вели- чины X с нормальной плотностью п квадрат X2 имеет плотность x"1/2n(x1/2) = /1/2,1/2 (х). Ввиду свойства свертки (2.3) отсюда сле- дует, что Если Хп ..., Х„ — взаимно независимые нормально распреде- ленные величины с математическим ожиданием 0 и дисперсией о2, то величина х?+...+х* имеет плотность fi^o2, п/ъ- Для статистиков величина %2 = X? + ... Х£ совпадает с «вы- борочной дисперсией для нормальной совокупности», и ее рас- пределение постоянно используется. В этой связи /\/2, i/2rt по традиции (восходящей к К. Пирсону) называется хи-квадрат плотностью с п степенями свободы. В статистической механике величина Xi + X^ + Xi появляется как квадрат скорости частиц. Сама скорость поэтому имеет плотность у (х) = 2х/1/2, 3/2(х2). Это не что иное, как плотность Максвелла, найденная другим способом в гл. I, (10.6). (См. также пример в гл. Ш,4.) В теории очередей гамма-распределение иногда называют рас- пределением Эрланга. Некоторые случайные величины (или «статистики»), важные для статистиков, имеют форму T = X/Y, где X и Y—независимые случайные величины, Y > 0. Обозначим их функции распределе- ния через F и G, а их плотности через f и g соответственно. Так как величина Y предполагается положительной, то g сосре- ~ ♦) Этот параграф затрагивает специальные вопросы и не используется в дальнейшем.
64 Гл. Л. Специальные плотности. Рандомизация доточено на 0, оо, и поэтому 00 Р{Т < 0 = Р {X < ZY} = $ F (ty) g (у) dy. О (3.1) Дифференцируя, находим, что отношение T = X/Y обладает плот- ностью 00 w(t) = \f(ty)yg(y)dy. О (3-2) Примеры, а) Если X и Y имеют плотности fi/2t т/2 и fi/2t п/2, то Х/Y имеет плотность r(v(m+n)) /2 w (0 =------i, t > 0. (3.3) / 1 \ /1 \ —(m + n) г(ттЛ (t'J(1+/)S Действительно, интеграл (3.2) равен 1 ОС — т-1 г _________tj________________ ( 4~(т+п)г (_L т\ г f _Lп\ J 22_______\ 2 J к 2 J О — (m + n)-l (1 + Ojf У е 1 dy, (3.4) а подстановкой у(1+0// = $ он сводится к (3.3). В дисперсионном анализе рассматривают частный случай Х = Х2+ ... +Х*г и Y = Yj + ... 4-Y„, где Хп Хш, Yr, • • •, Yп—взаимно независимые нормально распределенные вели- чины с плотностью п. Случайная величина F называется статистикой Снедекора, а ее плотность — w ( — х ) — плотностью Снедекора или F-плотностью. Величина Z есть Z-стати- стика Фишера, а ее плотность в свою очередь—Z-плотность Фишера. Обе статистики являются, конечно, вариантами записи одной и той же величины. б) 1-плотность Стьюдента. Пусть X, Yn ..., Yw независимы и одинаково распределены с нормальной плотностью и. Случай- ная величина ,35’ называется в математической статистике 1-статистикой Стью- дента. Покажем, что распределение случайной величины Т задается
§ 4. Некоторые распространенные плотности 65 ПЛОТНОСТЬЮ w(t)=----------^4------- — (п+1) (1-Ь Z2/n)2 где С п = 1_ф+1>) г(4п) (3.6) В самом деле, числитель в (3.5) имеет нормальную плотность с нулевым математическим ожиданием и дисперсией п, тогда как плотность знаменателя равна 2xfl/2, п/г (х2). Таким образом, исполь- зуя формулу (3.2), получаем плотность вида 1 Г + - \ е “ firn 2<«-1)/2Г(п/2) J о yndy. (3.7) Подстановка s=-~ (1 + t2/ri) у2 сводит интеграл (3.7) к гамма-функ- ции, и мы получаем (3.6). § 4. НЕКОТОРЫЕ РАСПРОСТРАНЕННЫЕ ПЛОТНОСТИ а) Двусторонняя показательная плотность определяется выра- жением А|» где а—масштабный параметр. Ей соответствует нулевое математическое ожидание и дисперсия 2а"а. Эта плотность представляет собой свертку показательной плотности ае~ах (х > 0) со своим зеркальным отображением аеах (х < 0). Иными словами, двусторонняя показательная плотность является плотностью вели- чины Xi—Х2, где Xf и Х2 независимы и обладают одной и той же показательной плотностью ае~ах (х > 0). Во французской лите- ратуре это распределение обычно называют «вторым законом рас- пределения Лапласа» (первым считается нормальное распреде- ление). б) Равномерная (или прямоугольная) плотность ра и треуголь- ная плотность тл, сосредоточенные на —а, а, определяются соот- ветственно выражениями PeW = ^. ТЛ*)=^(1 — -V-) , И <а- (4.1) Легко видеть, что ра*ра==т2а, или словами! сумма двух равно- мерно распределенных на —а, а величин имеет треугольную плот- ность распределения на —2а, 2а. [Повторные свертки ра * ... * ра были описаны в гл. I, (9.7).] в) Бета-плотности на 0, 1 определяются как 0<х<1, (4.2) где |х>0 и v>0—свободные параметры. То, что (4.2) действи- тельно определяет плотность вероятности, следует из (2.5). Из той 3 д. 249
66 Гл. 11. Специальные плотности* Рандомизация же самой формулы видно, что рц> v имеет математическое ожида- ние v/(p + v) и дисперсию pv/[(pi + v)2 (р + v + 1)]. Еслир<1, v<l, то график v является U-образным, уходящим в беско- нечность при х, стремящемся к 0 или 1. При р> 1, v> 1 гра- фик колоколообразен. При p = v = l получаем как частный случай равномерную плотность. Простой вариант бета-плотности определяется формулой (l + o2 v (Гн) = г (м)Г>) (1-HFV ’ 0 <z < °°- <4-3) Если случайная величина X имеет плотность (4.2), то величина Y = X-1 — 1 имеет плотность (4.3). В системе распределений Пирсона плотности (4.2) и (4.3) именуются плот- ностями типа I и VI соответственно. Плотность Снедекора (3.3) есть не что иное, как частный случай плотности (4.3). Плотности (4.3) иногда называются плотностями Парето (в честь экономиста Парето). Считалось (несколько наивно с современной статистической точки зрения), что распределения дохода должны иметь хвост с плотностью ~ Ах~а при х—>оо, а (4.3) удовлетворяет этому требованию. г) Так, называемая «арксинусчглотностьъ 1 Л X (1 —х) * 0<х< 1, (4.4) есть фактически то же самое, что и бета-плотность Pi/2,1/2, однако эта плотность заслуживает специального упоминания вследствие ее частого появления в теории флуктуаций. (Мы ввели ее в 1, гл. III, 4, в связи с неожиданным поведением «времени пребыва- ния».) Вводящее в заблуждение название, к сожалению, обще- употребительно; фактически функция распределения равна 2л"1 arc sin Кх. (Бета-плотности с ц -}- v — 1 иногда называются «обобщенными арксинус-плотностями».) д) Плотность Коши с центром в начале координат опреде- ляется как Tt W = • 727^-2 > —оо<х<оо, (4.5) где />0—масштабный параметр. Соответствующая функция рас- пределения равна y + rc^aretg (x/Z). Графику напоминает график нормальной плотности, но приближается к оси х столь медленно, что математическое ожидание не существует. Важность плотностей Коши обусловлена формулой свертки Ъ*Т< = Ъ+р (4-6) Этим утверждается, что семейство плотностей Коши (4.5) замк- нуто относительно свертки. Формула (4.6) может быть доказана
§ 4. Некоторые распространенные плотности 67 элементарным (но скучным) способом с помощью обычного разло- жения подынтегральной функции на элементарные дроби. Более простое доказательство опирается на анализ Фурье. Формула свертки (4.6) имеет весьма интересное следствие, а именно: для независимых случайных величин Хх, ..., ХЛ, имею- щих одинаковую плотность распределения (4.5), среднее значение (Xj + ... + Х„)/п распределено с той же самой плотностью, что и Ху. Пример. Рассмотрим лабораторный опыт, заключающийся в том, что вертикальное зеркало проецирует горизонтальный световой луч на стену. Зеркало может свободно вращаться относительно вертикальной оси, проходящей через А. Мы предполагаем, что направление отраженного луча выбирается «случайно», т. е. угол ср между этим лучом и перпендикуляром АО к стене распределен равномерно между —и 2-л. Световой луч пересекает стену в точке, которая лежит от точки О на расстоянии X = Mgcp (t равно расстоянию АО центра зеркала А от стены). Теперь оче- видно, что случайная величина X имеет плотность (4.5)г). Если эксперимент повторен п раз, то среднее (Хх + ... + ХЛ)/п имеет ту же самую плотность распределения и, таким образом, средние не накапливаются вокруг нуля, как можно было бы предположить по аналогии с законом больших чисел. > Плотность распределения Коши обладает любопытным свойством: если X имеет плотность у*, то 2Х имеет плотность y2t = yt * ТЬ Таким образом, вели- чина 2Х = Х + Х является суммой двух зависимых величин, однако ее плотность задается формулой свертки. Более того, если U и V—две независимые вели- чины с одинаковой плотностью yt и X=tfU + Z>V, Y = cU4-dV, то величина X + Y имеет плотность y^a + b + c + cDtt чт0 представляет собой свертку плотно- стей y<a + b)t величины X и y(C + d)t величины Y; однако X и Y не являются независимыми. (Схожий пример см. в задаче 1 в гл. III, 9.) [Плотность Коши соответствует частному случаю п=1 семейства (3.5) 7-плотностей Стьюдента. Иными словами, если X и Y — независимые случай- ные величины с нормальной плотностью п, то величина Х/| Y | имеет тот- ность распределения Коши (4.5) с /=1. Некоторые другие родственные плот- ности см. в задачах 5, 6.] Свойство свертки гамма-плотностей, выраженное формулой (2.3), выглядит точным подобием свойства (4.6), однако существует важ- ное различие, состоящее в том, что для гамма-плотностей параметр v является существенным, в то время как формула (4.6) содержит х) Простая переформулировка этого эксперимента приводит к физической интерпретации формулы свертки (4.6). Наше рассуждение показывает, что если единичный источник света находится в начале отсчета, то yt пред- ставляет распределение интенсивности света вдоль линии y = t на (х, ^-пло- скости. Тогда (4.6) выражает принцип Гюйгенса, согласно которому интенсив- ность света вдоль направления y~s-\-t такая же, как если бы источник был распределен вдоль линии у — t с плотностью у^ (Я обязан этим замечанием Дж, Bs Уолшу.) 3*
68 Гл. 11. Специальные плотности. Рандомизация только масштабный параметр. Тип распределений Коши является устойчивым типом. Эта устойчивость относительно операции свертки свойственна плотностям Коши и нормальным плотностям; различие заключается в том, что масштабные параметры опре- деляются согласно правилам / = + и а2 = о^_|_а2 соответст- венно. Имеются другие устойчивые плотности с подобными свой- ствами, и после систематизации терминологии мы будем называть нормальные плотности и плотности Коши «симметричными, устой- чивыми с показателями 2 и 1» (см. гл. VI, 1). е) Одностороннее устойчивое распределение с показателем 1/2. Если —нормальное распределение, заданное формулой (1.6), то равенство х > О, (4-7) определяет функцию распределения с плотностью /а(х) = -Д=« “7^=-е 2 х>0. (4.8) 1аХ 7 К2л /х3 v 7 Очевидно, что математическое ожидание не существует. Это рас- пределение было найдено в 1; гл. III, (7,7), и снова в 1; гл. X, 1, как предел распределения времен возвращения. Отсюда легко вы- вести правило свертки где у = а + р. (4.9) (Возможна проверка элементарным, но несколько громоздким спо’ собом интегрирования. Доказательство, основанное на анализе Фурье, проще.) Если Хй Хл—независимые случайные вели- чины с распределением (4.7), то из равенства (4.9) следует, что величина (Хх+...-f-XJn"2 имеет то же самое распределение, и поэтому средние (Хх+ ... -J-XJ /г’1, вероятно, должны быть порядка п; вместо того чтобы сходиться, они безгранично воз- растают (см. задачи 7 и 8). ж) Распределения вида е~х а (х > 0, а > 0) появляются в связи с поряд- ковыми статистиками (см. задачу 8), Вместе с разновидностью 1—е~ха они появляются (несколько таинственно) под именем распределений Вейбула в ста- тистической теории надежности. в) Логистическая функция распределения = 1+g-a—. «>°. ИЛО) может служить предостережением. Существует невероятно большая литера- тура, где делаются попытки доказать трансцендентный «закон логистического развития». Предполагалось возможным представить практически все процессы развития (измеренные в соответствующих единицах) функцией типа (4.10) с/, изображающим время. Весьма длинные таблицы с хи-квадрат критериями под- тверждали это положение для человеческих популяций, бактериальных коло- ний, развития железных дорог и т, д> Было обнаружено, что как высота,
§ 5. Рандомизация и смеси 69 так и вес растений и животных подчиняются логическому закону, хотя из теоретических соображений ясно, что эти две величины не могут подчиняться одному и тому же распределению. Лабораторные эксперименты на бактериях показали, что даже систематические нарушения не могут привести к другим результатам. Теория популяций была основана на логистических экстраполяциях (даже если они оказывались очевидным образом ненадежными). Единственное затруднение «логистической» теории заключается в том, что не только логи- стическое распределение, но также нормальное, Коши и другие распределе- ния могут быть подогнаны под тот же самый материал в тем же или лучшим согласием1). В этой конкуренции логистическое распределение не играет никакой выдающейся роли: самые противоречивые теоретические модели могут быть подтверждены на том же материале наблюдений. Теории этого рода недолговечны, так как они не открывают новые пути, а новые подтверждения одних и тех же старых вещей очень скоро становятся надоедливыми. Однако наивное рассуждение само по себе не было заменено здравым смыслом, и поэтому может быть полезно иметь очевидное доказатель- ство того, как могут вводить в заблуждение взятые сами по себе критерии согласия. § 5. РАНДОМИЗАЦИЯ И СМЕСИ Пусть F—функция распределения, зависящая от параметра 0, и и—некоторая плотность вероятности. Тогда + 00 W(x) = $ F (х, в) и (в) de (5.1) — 00 есть монотонная функция х, возрастающая от 0 до 1, и, следо- вательно, функция распределения. Если F имеет непрерывную плотность f, то и W имеет плотность равную + 00 w(x) = J [ (х, 0) и (0) de. (5.2) — со Вместо интегрирования относительно плотности и мы можем сум- мировать по отношению к дискретному распределению вероятно- стей- если 0О 02, ... выбраны произвольно и если pk^0t = то равенство - W(x) = ^f (x, ek)pk (5.3) k определяет новую плотность вероятности. Процесс может быть описан вероятностно как рандомизация; параметр 0 рассматри- вается как случайная величина, и новое распределение вероятно- стей определяется в (%, 0)-плоскости, которая служит выборочным пространством. Плотности вида (5.3) называются смесями, и это выражение здесь используется вообще для распределений и плот- ностей вида (5.1) и (5.2). х) Feller W., On the logistic law of growth and its empirical verifications jn biology, Acta Biotheoretica, 5 (1940), 51—66,
70 Гл. II. Специальные плотности. Рандомизация Мы не предполагаем на этом этапе развивать общую теорию. Наша цель скорее в том, чтобы проиллюстрировать на нескольких примерах возможности этого метода и его вероятностное содержа- ние. Примеры служат также подготовительным материалом к поня- тию условных вероятностей. Следующий параграф содержит при- меры дискретных распределений, полученных посредством рандо- мизации непрерывного параметра. Наконец, § 7 иллюстрирует построение непрерывных процессов на основе случайных блужда- ний; попутно мы получим распределения, встречающиеся во мно- гих приложениях и требующие при другом подходе громоздких вычислений. Примеры, а) Отношения. Если X—случайная величина с плот- ностью /, то при фиксированном у > 0 величина Х/у имеет плот- ность f (ху) у. Рассматривая параметр у как случайную величину с плотностью g*, мы получаем новую плотность + оо да(х)= J f(xy)yg(y)dy. (5.4) — 00 Это то же самое, что и формула (3.2), которая была основой для обсуждений в § 3. На вероятностном языке рандомизация знаменателя у в Х/у означает рассмотрение случайной величины Х/Y, и мы можем просто повторить вывод формулы (3.2) для плотности величи- ны Х/Y. В этом частном случае терминология есть дело вкуса. б) Суммы случайного числа слагаемых. Пусть Хь Х2, ...— взаимно независимые случайные величины с одинаковой плотностью f. Сумма S„ = Хх + ... + Хп имеет плотность а именно п-кратную свертку f с собой (см. гл. I, 2). Число слагаемых п является параметром, который мы теперь рандомизируем с' помощью рас- пределения вероятностей P{N=n}=prt. Плотность результирую- щей суммы Sn со случайным числом слагаемых N равна = (5.5) 1 Возьмем, например, в качестве геометрическое распределение pn = qpn~\ а в качестве f—показательную плотность. Тогда fn*=gn дается формулой (2.2) и 00 w (х) = qae~ax У, рп = qae~aQX. (5.6) П=1 ) в) Применение к теории очередей. Рассмотрим один обслужи- вающий прибор с показательным распределением времени обслужи- вания (плотность /(/) = це~ц/) и предположим, что поступающая нагрузка—это нагрузка пуассоновского типа, т, е. что интервалы
з9 5. Рандомизация и сноси 71 времени между вызовами независимы и имеют плотность распре- деления Ке~к\ X < [х. Данная модель описана в 1; гл. XVII, 7, б). Поступающие вызовы становятся в (возможно, пустую) «очередь» и обслуживаются в порядке поступления без перерывов. Рассмотрим вызов, к моменту поступления которого в системе обслуживания уже имеется очередь из 0 других вызовов. Пол- ное время, которое этот вызов проводит в системе обслуживания, равно сумме времен обслуживания п вызовов, стоящих в очереди, и времени обслуживания самого этого вызова. Полное время есть случайная величина с плотностью f(n+1}X, Мы видели в 1; XVII, (7.10), что в стационарном состоянии вероятность наличия в оче- реди ровно п вызовов равна qpn, где p = K/[i. Если имеет место стационарное состояние, то полное время, которое вызов проведет в системе обслуживания, есть случайная величина с плотностью распределения 2 qpnf{H+L} * (t)==q\\>e~vt 5 (р\^)п1п\ = (р— п = 0 п=0 Поэтому Е (Г) = 1/(р—X). (См. также задачу 10.) г) Очереди на автобус. Предполагается, что автобус появляется каждый час (в час, в два часа... и т. д.), но может запаздывать. Мы рассмотрим последовательные запаздывания Xfe как независи- мые случайные величины с одним и тем же распределением F и плотностью f. Для простоты мы предполагаем, что0^Хй^1. Обозначим через Т* время ожидания для человека, прибывшего в момент х < 1 после полудня. Вероятность, что автобус, назна- ченный на полдень, уже ушел, равна F (х). Ясно видно, что J F(/ + *)—F (х) при 0</<1— х, 1—F (х) 4- F (х) F (t 4- х—1) при 1—х</<2—х, и, конечно, Р{Т^/} = 1 для всех больших t. Соответствующая плотность равна /(/4-х) при 0</<1— х, ,58 F(x)f{t-^x—1) при 1—х</<2—х. ' Здесь момент х прибытия является свободным параметром, и его естественно рандомизировать. Например, для человека, прибы- вающего «наугад», момент прибытия представляет собой случайную величину, распределенную равномерно на 0, 1. Среднее время ожидания равно в данном случае ^-(-о2, где о2 есть дисперсия времени запаздывания. Другими словами, среднее время ожидания является наименьшим тогда, когда автобусы идут точно по расписанию, и возрастает вместе с дисперсией запаздывания. (См. задачи 11, 12.) ►
72 Гл. 11. Специальные плотности. Рандомизация § 6. ДИСКРЕТНЫЕ РАСПРЕДЕЛЕНИЯ Этот параграф посвящен беглому обзору некоторых результатов применения рандомизации к биномиальному и пуассоновскому распределениям. Число Sn успехов в испытаниях Бернулли подчиняется рас- пределению, зависящему от вероятности успеха р. Рассматривая р как случайную величину с плотностью ц, мы приходим к новому распределению 1 Р (S„ = k} = (j) J р* (1 -р)»-* и (р) dp, А = 0, ..., п. (6.1) О Пример, а) Если н(р)=1, то интегрированием по частям можно показать, что распределение, заданное формулой (6.1), не зависит от k и сводится к дискретному равномерному распреде- лению вероятностей Р = k} = (п 4-l)”1. Более разъясняющей является аргументация Байеса. Рассмотрим n-f-l независимых величин Хо, ..., Хп, распределенных равномерно между 0 и 1. Интеграл в выражении (6.1) (при п=1) равен вероятности того, что ровно k величин из Хь ..., Х„ будет меньше Хо, или, дру- гими словами, что при перечислении точек Хо, ..., Хп в порядке возрастания величина Хо появляется на (й+1)-м месте. Но ввиду симметрии все положения равновероятны, и поэтому интеграл равен (п+1)"1. ► На языке азартных игр (6.1) соответствует ситуации, когда несимметричная монета выбирается посредством случайного меха- низма, после чего с этой монетой (неизвестной структуры) произ- водятся испытания. Игроку испытания не кажутся независимыми; действительно, если наблюдается длинная последовательность гербов, то правдоподобно, что для нашей монеты р близко к 1, и поэтому безопасно делать ставку на дальнейшее появление гербов. Два формальных примера иллюстрируют оценивание и предсказание в задачах такого рода. Примеры, б) Дано, что п испытаний закончились k успехами (гипотеза Н). Какова вероятность того, что р<а? По определе- нию условных вероятностей а pk (1 — р)п~Ь и (р) dp ----------------- (6-2) J pk (1 —р)п~& и (p) dp o Этот способ оценивания использовался Байесом [при н(р) = 1]. В рамках нашей модели (т. е. если мы действительно занимаемся смешанной популяцией монет с известной плотностью и) не воз-
§ 6. Дискретные распределения 73 никнет возражений против этого способа. Опасность в том, что этот способ постоянно использовался без оснований применительно к суждениям о «вероятностях причин», когда о рандомизации не было и речи; эта точка зрения широко обсуждалась в примере 2, д) в 1; гл. V, в связи с вычислением пресловутой вероятности того, что завтра солнце взойдет. в) Вариант предыдущей задачи можно сформулировать следую- щим образом. Дано, что п испытаний закончились k успехами; какова вероятность того, что следующие tn испытаний закончатся / успехами? То же самое рассуждение приводит к ответу 1 (7) S pJ + k (l—p)m+n~J-k и (р) dp —------------------------------. (6.3) рЛ (1 — p)n~k и (р) dp о (См. задачу 13.) ► Обращаясь к пуассоновскому распределению, мы будем интер- претировать его как распределение числа «прибытий» за интервал времени длительностью t. Математическое ожидание числа при- бытий равно at. Мы проиллюстрируем две существенно различные процедуры рандомизации. Примеры, г) Рандомизированное время. Если длительность интервала времени является случайной величиной с плотностью и, то вероятность pk ровно k прибытий равна 00 = (6.4) О Например, если интервал времени распределен показательно, то вероятность fe = O, 1, ... новых прибытий равна п — С (а+Р) t ftdt—.......— • (...V (6 5) о что представляет собой геометрическое распределение. д) Расслоение, Допустим, что имеется несколько независимых источников для случайных прибытий, каждый источник имеет пуассоновский выход, но параметры различны. Например, аварии в какой-либо установке в продолжение фиксированного промежутка времени t могут быть представлены пуассоновскими величинами, но параметр будет меняться от установки к установке. Аналогично телефонные вызовы от отдельных абонентов могут быть пуассонов- скими с математическим ожиданием числа вызовов, меняющимся от абонента к абоненту. В таких процессах параметр а появ-
74 Гл. Л. Специальные плотнб'Ми. Рандомизация, , ляется как случайная величина с плотностью и, а вероятность ровно п вызовов за время t равна 00 P„(O=j (a) da. (6.6) о В частном случае гамма-плотности u — f^v+1 мы получим Р m = f«+vV_₽_V+1f_J_\n (67) П J\^ + t) W + t)' ' 1 что является предельной формой распределения Пойа, данного в 1; гл. V, 8, задача 24, и 1; гл. XVII, (Ю.2) (если Р = а-1, ч = а~1—1). ► Замечание о ложном заражении. Курьезная и поучительная история при- писывается распределению (6.7) и его двойственной природе. Урновая модель Пойа и процесс Пойа, которые приводят к (6.7), яв- ляются моделями истинного заражения, где каждый случай эффективно уве- личивает вероятность будущих случаев. Эта модель пользовалась большой популярностью. Для множества явлений эмпирически проверялось согласие с (6.7). При этом хороший результат воспринимался как признак истинного заражения. По случайному совпадению то же самое распределение (6.7) было полу- чено еще ранее (1920) М. Гринвудом и Дж. Юлом с тем замыслом, что хоро- шее согласие с ним опровергает наличие заражения. Их вывод приблизительно соответствует нашей модели расслоения, для которой начальным является предположение о том, что в основе лежит пуассоновский процесс, т. е. что полностью отсутствует последействие. Таким образом, мы имеем курьезный факт, что хорошее согласие наблюдений с одним и тем же распределением может быть истолковано двумя различными способами, диаметрально противо- положными как по своей природе, так и по своим практическим последствиям. Это послужит предостережением против слишком поспешной интерпретации статистических данных. Объяснение этому лежит в явлении ложного заражения, описанного в 1; гл. V, 2, г) и выше в связи с (6.1). В данной ситуации, получив за интервал времени длины s т прибытий, можно оценить вероятность п прибытий за следующий интервал времени t по формуле, аналогичной (6.3). Результат будет зависеть от т, и эта зависимость обусловлена способом выбора, а не природой данных; информация, относящаяся к прошлому, дает нам возмож- ность делать лучшие предсказания относительно будущего поведения нашей выборки, но это не следует смешивать с будущим всей популяции, § 7. БЕССЕЛЕВЫ ФУНКЦИИ И СЛУЧАЙНЫЕ БЛУЖДАНИЯ Удивительно много явных решений задач теории диффузии, теории очередей и других приложений содержат бесселевы функ- ции. Обычно далеко не очевидно, что решения представляют собой распределения вероятностей, а аналитическая теория, ко- торая требуется для получения их преобразований Лапласа и других характеристик, довольно сложна. К счастью, рассматри- ваемые распределения (и многие другие) могут быть получены простой процедурой рандомизации. На этом пути многие соотно-,
§ 7. Бесселевы функции и случайные блуждания 75 тени я теряют свой случайный характер, и можно избежать весьма трудного анализа. Под бесселевой функцией порядка р > —1 мы будем понимать функцию /р; 1р = А|Г (й+р+Ч W ’ <7' определенную для всех вещественных х1). Мы приступаем к описанию трех процедур, ведущих к трем различным типам распределений, содержащих бесселевы функции. а) Рандомизированные гамма-плотности Пусть мы имеем при фиксированном р>—1 гамма-плотность Л,р+/г+1, заданную формулой (2.2). Рассматривая параметр k как целочисленную случайную величину, подчиненную пуассоновскому распределению, мы получаем в соответствии с (5.3) новую плот- ность шр(х) = е p+fe+i (х) — е * х S й!г (р4-*-Ь 1) • Сравнив выражения (7.1) и (7.2), мы можем записать wp (х) = е~'~* YWf /р Х > °- (7,3) Если р>—1, то является плотностью вероятности, сосре- доточенной на 0, оо (при р = — 1 правая часть не интегрируема по х). Заметим, что t не масштабный параметр, так что эти плот- ности принадлежат различным типам. Между прочим, из этого построения и формулы свертки (2.3) для гамма-плотностей следует, что ^p*fi,v = ^p+v. (7.4) б) Рандомизированные случайные блуждания При анализе случайных блужданий обычно считают, что после- довательные переходы совершаются в моменты времени 1, 2, ... . Должно быть, однако, ясно, что это соглашение просто придает гармоничность описанию и что модель полностью независима от х) Согласно обычному словоупотреблению, 7Р — это «модифицированная» бесселева функция или бесселева функция «с мнимым аргументом». «Обыкно- венная» бесселева функция, всегда обозначаемая Jp , определяется добавле- нием множителя (—1)^ в правую часть (7.1). Наше использование названия бесселевой функции должно рассматриваться как сокращение, а не как ново- введение,
76 Гл, 1L Специальные плотности» Рандомизация времени. Настоящие случайные процессы с непрерывным временем получаются из обычных случайных блужданий в предположении, что интервалы времени между последовательными скачками яв- ляются независимыми случайными величинами с одной и той же плотностью е~*. Другими словами, моменты скачков регулируются пуассоновским процессом, а скачки сами по себе являются случай- ными величинами, принимающими значения 4-1 и —1 с вероят- ностями р и 9, независимо друг от друга и от пуассоновского процесса. Каждому распределению, связанному со случайным блужданием, соответствует некоторое распределение для процесса с непрерыв- ным временем, которое формально получается рандомизацией числа скачков. Чтобы увидеть процедуру в деталях, рассмотрим состояние процесса в заданный момент t. В исходном случайном блуждании п-й шаг приводит к состоянию тогда и только тогда, когда среди первых п скачков 4"(п + г) положительны и -|-(п—г) отрицательны. Это возможно, если только п—r — 2v четно. В этом случае вероятность состояния г точно после п-го скачка равна п 4 (п+г) r+2vV+V. r-|-v J (7-5) р 2 2 Для нашего пуассоновского процесса вероятность того, что вплоть до момента t произойдет ровно n = 2v4-r скачков, равна е~Чп1п\, и поэтому для нашего процесса с непрерывным временем вероят- ность состояния г>0 в момент t равна 0-Ё + /(Яг->Л(2/ЙО. (7.6) и мы приходим к двум заключениям. (i) Если мы определим I~r~Ir при г = 1, 2, 3, ..., тогда при фиксированных / > 0, р, q выражение М0 = Vr = 0, ±1, ±2, ... (7.7) представляет распределение вероятностей (т. е. аг^0, ^аг—\). (ii) В нашем случайном блуждании с непрерывным временем ar(t) равно вероятности состояния г в момент t. Две известные формулы для бесселевых функций являются непосредст- венными следствиями этого результата. Во-первых, если изменить обозначе- ния, полагая 2 Y pq t — x и р/д = и\ то тождество 2 аг (0 = 1 превращается в е2 =ф'/г(х), (7.8)
,5 7. Бесселевы функции и случайные блуждания 77 Это так называемая производящая функция для бесселевых функций (формула Шлемильха, которая иногда служит в качестве определения для /г). Во-вторых, из природы нашего процесса ясно, что вероятности аг (/) должны удовлетворять уравнению Колмогорова — Чепмена 00 аг (t + т) = У ak (/) ar. k (т), (7.9) k = — 00 которое отражает тот факт, что в момент t частица должна быть в некотором состоянии k и что переход из k в г эквивалентен переходу из 0 в г—k. Мы возвратимся к этому соотношению в гл. XVII, 3, [Его легко проверить не- посредственно, используя представление (7.6) и аналогичную формулу для вероятностей в случайном блуждании.] Уравнение Колмогорова—Чепмена (7.9) эквивалентно формуле Л-(Н-т)= 2 (7.10) k— — 00 которая известна как тождество К. Неймана. в) Первые прохождения Для простоты сосредоточим наше внимание на симметричных случайных блужданиях p^q — 1/^ Согласно 1, гл. III, (7.5), вероятность того, что первое прохождение через точку г > 0 про- изойдет во время скачка с номером 2п—г, равна г /2п—г\ 1 ] О-2« + Г 2п—Г\ п I п^г. (7.П) Случайное блуждание возвратно. Поэтому первое прохождение происходит с вероятностью единица, т. е. при фиксированном г величины (7.11) дают в сумме единицу. В нашем процессе момент &-го скачка имеет гамма-плотность заданную формулой (2.2). Отсюда следует, что момент первого прохождения через г > О распределен с плотностью 2u2n-r^ п [УМ • Р.12) (2п— г— 1) ! \ 2л— г J п! (п — г)! t r v v 7 Таким образом, (i) при фиксированном г = 1,2, ... выражение j vr(t) = e~l-j-Ir(t) (7.13)' определяет плотность вероятности, сосредоточенную на 0, оо. (ii) Момент первого прохождения через г > 0 имеет плот- ность vr. (См. задачу 15.) Этот результат позволяет сделать другие интересные заклю- чения. Первое прохождение через г + р в момент t предполагает предварительное первое прохождение через г в некоторый момент
78 Гл. II. Специальные плотности. Рандомизация s <t. Вследствие независимости скачков в интервалах времени О, s и s, t и свойства отсутствия последействия у показательного времени ожидания мы должны иметь vr*vp = yr+p. (7.14) [Проверка этого соотношения по формуле (7.12) .будет легкой, если использовать соответствующее свойство свертки для вероят- ностей (7.11).] Фактически утверждение (i) и соотношение (7.14) справедливы для всех положительных значений параметров г и р1). § 8. РАСПРЕДЕЛЕНИЯ НА ОКРУЖНОСТИ Полуоткрытый интервал 0, 1 можно рассматривать как изобра- жение окружности единичной длины, но предпочтительнее обер- нуть всю прямую вокруг окружности. Окружность тогда приоб- ретает ориентацию, а длина дуги изменяется от —оо до оо, но х, х±1, х±2, ... интерпретируются как одна и та же точка. Сложение происходит по модулю 1 (так же как сложение углов по модулю 2л). Плотность распределения вероятностей на окруж- ности есть периодическая функция <р^0 такая, что ' 1 J (p(x)dx=l. (8.1) о Пример, а) Задача Бюффона об игле (1777). Традиционная формулировка такова. Плоскость разбивается на параллельные полосы единичной ширины. Произвольным образом бросается на плоскость игла единичной длины. Какова вероятность, что игла ляжет на плоскости так, что заденет две полосы? Чтобы поставить задачу формально, рассмотрим сначала центр иглы. Его положение определяется двумя координатами, но у мы пренебрегаем, а х приводим по модулю 1. Таким образом, «центр иглы» превра- щается в случайную величину X, равномерно распределенную на окружности. Направление иглы может быть описано углом (изме- ренным по часовой стрелке) между иглой и х-осью. Поворот на угол л возвращает иглу в то же самое положение, и поэтому угол определяется с точностью до умножения на л. Обозначим рассматриваемый угол через 7л. В задаче Бюффона подразуме- вается, что X и Z — независимые равномерно распределенные на окружности единичной длины величины2). Если мы выбираем значения X между 0 и 1, а значения Z х) Feller W., Infinitely divisible distributions and Bessel functions asso- ciated with random walks. J. Soc. Indust. Appl. Math. (1966), 864—875. 2) Выборочное пространство пары (X, Z) есть тор,
§ 8. Распределения на окружности 79 между —г/2 и */2, то игла пересекает границу тогда и только тогда, когда у cos Zji >Х или ~cosZn>l—X. При данном значении z, —у < г < 4-, вероятность того, что X < — cos гл, равна вероятности того, что 1 — Х< ~ cos гл, а именно равна у cos гл. Поэтому искомая вероятность равна 1/2 J £озгл-б!г = у. (8.2) ► -1/2 Случайная величина X на прямой может быть преобразована по модулю 1 в величину °Х на окружности. Случайными величи- нами такого рода являются ошибки округления при численных подсчетах. Если X имеет плотность /, то плотность величины °Х равна *) ф(х)= 2/(*+«)• (8-3) — со Любая плотность на прямой, таким образом, индуцирует плот- ность вероятности на окружности. [В гл. XIX, 5, мы увидим, что та же самая функция ср допускает совершенно иное представ- ление в виде рядов Фурье. Частный случай нормальных плот- ностей см. в примере 5, д) гл. XIX.] Примеры, б) Задача Пуанкаре о рулетке. Рассмотрим число по- воротов колеса рулетки как случайную величину X с плотностью /, сосредоточенной на положительной полуоси. Наблюденный^ ре- зультат,' а именно точка °Х, против которой колесо останавли- вается, является величиной X, приведенной по модулю 1. Ее плотность дается формулой (8.3). Естественно ожидать, что «при обычных обстоятельствах» плотность °Х должна быть приблизительно равномерной. В 1912 г. А. Пуанкаре придал этой расплывчатой мысли форму предельной теоремы. Мы не будем повторять здесь его анализ, так как по- добный результат легко следует из (8.3). Подразумевается, конечно, что данная плотность, по существу, «расплывается» на длинный интервал, так что ее максимум т мал. Предположим для про- стоты, что f возрастает вплоть до точки а, где она достигает своего максимума m = f(a), и что f убывает при х>а. Тогда х) Читателям, которых беспокоит вопрос сходимости, следует рассмат- ривать только плотности /, сосредоточенные на конечном интервале. Если f монотонна при достаточно больших х и —х, но, очевидно, имеет место рав- номерная сходимость. Если не накладывать на / никаких ограничений, то ряд может расходиться в некоторых точках, то ф всегда представляет собой плотность, так как частные суммы в (8.3) образуют монотонную последова- тельность функций, интегралы которых стремятся к 1 (см, гл. IV, 2).
80 Гл. 1J. Специальные плотности. Рандомизация для плотности ф случайной величины °Х верно равенство + оо Ф(х)— 1 = 2/(х + п)— $ f(s)ds. (8.4) — 00 При фиксированном х обозначим через xk единственную точку вида х + п, такую, что a-\-k^xk + & + 1 Тогда формула (8.4) может быть переписана в виде оо xk+i ф(х) — 1= 2 J ff(xk)—f(s)]ds. (8.5) *=-" Хк При k — 1 подынтегральная функция «СО, и поэтому Ф (х) — 1 < f (а) 4- 2 [/ (xk) - f (xft+1)] С 2/ (а) = 2т. k=o Аналогичные аргументы доказывают, что ф(х) — 1^> — т. Таким образом, |ф(х) — 11 < 2m, и, следовательно, ф действительно при- ближенно постоянна. Условия монотонности были наложены на плотность только ради простоты изложения и могут быть ослаблены многими спо- собами. [Хорошие достаточные условия могут быть получены при- менением формулы суммирования Пуассона, гл. XIX, (5.2).] в) Распределение первых значащих цифр. Известный ученый, прикладной математик, имел громадный успех в заключаемых им пари на то, что число, выбранное наугад в Farmer’s Almanac или Census Report или в подобном компендиуме, будет иметь первую значащую цифру меньше 5. Наивно предполагается, что все де- вять цифр равновероятны; в этом случае вероятность того, что цифра не превосходит 4, будет равна 4/9. Практически1) она близка к 0,7. Рассмотрим дискретное распределение вероятностей, приписы- вающее цифре k вероятность pk = Log (k + 1) — Log k (где Log обо- значает логарифм по основанию 10 и k = l, . ..,9). Эти вероят- ности равны приближенно Р1 = 0,3010 р 2 = 0,1761 р3 = 0,1249 р4 = 0,0969 рб = 0,0792 р6 = 0,0669 Р1 = 0,0580 р8 = 0,0512 р9 = 0,0458 Распределение заметно отличается от равномерного распре- деления с весами -1 = 0,111... . х) Эмпирические данные см. в статье: Benford F., The law of anomalous numbers, Proc. Amer. Philos. Soc., 78 (1938), 551—572.
$ 9. Задачи 81 Мы теперь покажем (следуя Р. С. Пинкхэму), что распреде- ление {рк} правдоподобно как эмпирическое распределение пер- вой значащей цифры числа, выбранного наугад из большой сово- купности физических или наблюденных данных. Действительно, такое число может быть рассмотрено как случайная величина Y > 0 с некоторым неизвестным распределением. Первая значащая цифра Y равна k тогда и только тогда, когда 10"£ Y < 10й (k 4-1) при некотором п. Для случайной величины X = Log Y это озна- чает, что n-f-Logfes^X <n + Log(6-|-l). (8.6) Если размах Y очень велик, то распределение случайной вели- чины °Х, которая есть X, приведенная по модулю, является при- ближенно равномерным. Тогда вероятность неравенства (8.6) близка к Log(/s4-l) — Logk = pk. > Формула свертки (1.5) и умозаключения, приводящие к ней, остаются справедливыми в случае, когда сложение производится по модулю 1. Таким образом, свертка двух плотностей на ок- ружности длины 1 есть плотность, определяемая формулой 1 “>(*) = $ fl (х—у) f2 (у) dy. (8.7) о Если Xj и Х2 —независимые величины с плотностями Д и /2, то Xi-f-Xg имеет плотность w. Так как эти плотности —периодические функции, свертка равномерной плотности с любой другой плот- ностью является равномерной. (См. задачу 16.) § 9. ЗАДАЧИ 1. Покажите, что нормальное приближение для биномиального распреде- ления, выведенное в 1, гл. VI , позволяет обосновать формулу свертки (1.7) для нормальных плотностей. 2. Используя подстановку х— г/2, докажите, что г(4)==я1/2- 3. Формула удвоения Лежандра. Из формулы (2.5) при p = vвывести, что Г (2^ = -^22V-1 г (V) Г ( v+4) . К л \ z / Указание. Используйте подстановку 4 (у—y2)=s в интервале 0 < у < 1/2. 4. Пусть g (х) s=s — х I. Найдите свертки g # g и g а также g4 * * 5. Пусть X и Y — одинаково распределенные независимые случайные ве- личины с плотностью Коши Yi(x), определенной по (4.5). Докажител что про- V х? П О In I х I изведение XY имеет плотность 2jx~2——J-,
82 Гл. 11. Специальные плотности. Рандомизация Указание. Для вычисления не требуется ничего, кроме соотношения а—1 _ 1________1 (1+ s) s) 1+ s а + s 6. Пусть Н > 2 1 * Х л ех^-е~х' Докажите тогда, что двумя способами: а) рассматривая величины In | X | и In | Y | в обстановке пре- дыдущей задачи; б) непосредственно при помощи подстановки e2y = t и раз- ложения на элементарные дроби. (См. задачу 8 в гл. XV, 9.) 7. Если X имеет нормальную плотность п, то очевидно, что X”2 имеет устойчивую плотность (4.8). Используя это, покажите, что если X и Y — не- вависимые нормально распределенные величины с нулевым математическим ожиданием и дисперсиями of и of, то величина Z = XY/}^X2 +Y2 нормально распределена с дисперсией о2, такой, что 1/о3= 1/о±+ 1/о2 (Л. Шепп). 8. Пусть величины Xi, ..., Хп независимы и X(W) — наибольшая среди них. Покажите, что если Ху имеют а) плотность Коши (4.5), то ' Р {п-'Х^^х} > х > 0; б) устойчивую плотность (4.8), то Р{п-2Х(„)<х}->е-“Г2/(ях) , х > 0. 9. Пусть величины X и Y независимы с плотностями f и g, сосредото- ченными на 0, оо. Если Е(Х) < оо, то отношение Х/Y имеет конечное мате- матическое ожидание тогда и только тогда, когда 1 + §(//) < «>• о 10. В примере 5, в) найдите плотность распределения времени ожидания следующей разгрузки'. а) если в момент 0 система обслуживания свободна; б) в условиях стационарного состояния. 11. В условиях примера 5, г) покажите, что 1 -х Е(Тх)=Е(х) (и+1—Х)+ J tf(t+x)dt, о где есть математическое ожидание F. Используя это, проверьте утвержде- ние относительно Е (Т), когда х распределено равномерно. 12. В примере 5, г) найдите распределение времени ожидания, когда f (f) = 1 для 0 < t < 1. 13. В примере 6, в) предположим, что и есть бета-плотность, определен- ная в (4.2). Выразите условную вероятность (6.3) через биномиальные коэф- фициенты. 14. Пусть X и Y независимы и подчинены распределению Пуассона с од-J
§ 9. Задачи 83 ним и тем же параметром: Р {X = п} = e~ttn/fil. Покажите, что P{X-Y = r} = e-2V|r|(20, г = 0, ±1, ±2, * [См. задачу 9 гл. V, 11.] 15. Результаты § 7, в) остаются справедливыми для несимметричных случай- ных блужданий при условии, что вероятность первого прохождения через г > 0 равна единице, т. е. при условии p^q. Покажите, что единственное изменение в (7.11) состоит тогда в том, что 2~2п+г заменяется на pnqn~rt а вывод таков: при p^q и г=1, 2, ... определяет плотность вероятности, сосредоточенную на 0, оо. 16. Пусть X и Y — независимые случайные величины, а °Х и °Y те же величины, приведенные по модулю 1. Покажите, что величина X + Y при- водится по модулю 1 к °X-|-0Y. Непосредственным вычислением проверьте соответствующую формулу для сверток.
ГЛАВА m МНОГОМЕРНЫЕ ПЛОТНОСТИ. НОРМАЛЬНЫЕ ПЛОТНОСТИ И ПРОЦЕССЫ По понятным причинам многомерные распределения встре- чаются реже, чем одномерные распределения, и материал этой главы почти не будет играть роли в последующих главах. С дру- гой стороны, глава содержит важный материал, например извест- ную характеризацию нормального распределения и методы, при- меняемые в теории случайных процессов. Истинная природа этих методов становится более понятной, если отделить их от услож- ненных задач, с которыми они иногда связываются. § 1. ПЛОТНОСТИ В ходе дальнейшего изложения будет очевидно, что число из- мерений несущественно, и лишь ради типографских удобств мы будем иметь дело с декартовой плоскостью 5Z2. Мы связываем с плоскостью фиксированную систему координат с координатными величинами Xv Х2 (более удобное однобуквенное обозначение бу- дет введено в § 5). Неотрицательная интегрируемая функция /, заданная в «й2 и такая, что ее интеграл равен единице, называется плотностью вероятности или просто плотностью. (Все плотности, встречаю- щиеся в этой главе, кусочно-непрерывны, и поэтому их интегри- руемость не требует разъяснений.) Плотность f приписывает об- ласти Q вероятность Р (й) = f (Xj, х2) dxxdx2 (1.1) при условии, конечно, что область Q достаточно регулярна для того, чтобы интеграл существовал. Все такие вероятности одно- значно определяются через вероятности, соответствующие прямо- угольникам, параллельным осям, т. е. ь2 Р {^1 < -^1 » ^2 < 2 ^2 } = f (-^1» ^2) 1 * 2) при всех комбинациях Полагая а1 = а2 ——оо, мы полу- чим функцию распределения F, а именно F (х1У x^PjX^x,, Х2^х2}. (1.3)
§ 1. Плотности 85 Очевидно, что F (Ь1У х2) — F (а^ х2) представляет собой вероят- ность, соответствующую полубесконечной полосе шириной Ь±—ait и так как прямоугольник в (1.2) выражается разностью двух та- ких полос, то вероятность (1.2) равна так называемой смешан- ной разности F(blt b2) — F(a1, bJ — Ffh, a2) + F(ait a2). Отсюда следует, что по функции распределения F однозначно определяются все вероятности (1.1). Несмотря на формальную аналогию с прямой линией, понятие функции распределения на плоскости гораздо менее полезно, поэтому лучше сосредоточиться на задании вероятностей (1.1) в терминах плотности. Это зада- ние отличается от совместного распределения вероятностей двух дискретных случайных величин (1, гл. IX, 1) в двух отношениях. Во-первых, суммирование заменено интегрированием, и, во-вторых, вероятности теперь приписываются лишь «достаточно регулярным областям», тогда как в дискретных выборочных пространствах всем множествам соответствовали вероятности. Так как в настоящей главе рассматриваются простые примеры, в которых это различие едва уловимо, понятия и термины дискретной теории переносятся на новый случай в понятной форме. Так же как и в предыдущих главах, мы используем поэтому вероятностный язык без всякой попытки привлечения общей теории (которая будет изложена в гл. V). L. Из (1.3) очевидно, что1) P{X1^x1}^F(xlf оо). (1.4) Таким образом, F1(x)^ - F (х, оо) определяет функцию распределе- ния величины Хх, а ее плотность равна + <» А(*) = $ Н*. y)dy. (1.5) — оо Если желательно подчеркнуть связь между Xf и парой (Хх-, Х2), мы говорим об У7! как о маргинальном (частном) распределении2) и об /j как о маргинальной (частной) плотности. Математическое ожидание и дисперсия а? величины Х1? если они существуют, даются следующими формулами: + ао+оо fi1 = E(Xi)= J J xj (%j, х2) dx±dx2 (1.6) х) Здесь и в дальнейшем U (oo) = lim U (х) при х—> оо, и использование символа U (оо) подразумевает существование пределав 2) Другой принятый термин: проекция на ось.
86 Гл. 111. Многомерные плотности. Нормальные плотности и процессы и + оо + со oJ = Var(X1)= $ J (*i—Hi)2/(*1» xJdXjdx^ (1.7) — 8 - со По симметрии эти определения применимы также и к Х2. Нако- нец, ковариация Xt и Х2 равна + 00 + со Cov (Хх, Х2)== (хх Hi) (х2 На) f (*^1» х^) dx^dx2. — СО — 00 Нормированные величины Х/j?1 безразмерны, и их ковариация, а именно р = Cov (Xi, Х2)огЧ-\ есть коэффициент корреляции Хх и Х2 (см. 1, гл. IX, 8). Случайная величина U—это функция координатных величин Хх и X 2; здесь мы снова рассматриваем только такие функции, что вероятности P{U^Z} могут быть выражены интегралами вида (1.1). Таким образом, каждая случайная величина будет иметь единственную функцию распределения, каждая пара будет иметь совместное распределение и т. д. Во многих ситуациях выгодно переменить координатные вели- чины, т. е. приписать величинам Yx, У2 роль, ранее предназна- ченную для Хх, Х2. В простейшем случае величины Yy опреде- ляются линейным преобразованием Хх — аи Yx a12Y2 Х2 = a2i Yx -f- a22 Y2 0*9) с детерминантом Л = б71Х«22—я12<721->0. Обычно преобразование вида (1.9) можно описать или как отображение одной плоскости на другую, или как изменение координат в той же самой пло- скости. Производя замену переменных (1.9) в интеграле (1.1), мы получаем Р f (РцУ1 "Та-^Уъ* ^21У1 “J" ^22%) ’^dy-jdy2t (1.10) где область содержит все точки (yi9 у2\ образ которых (хх, х2) принадлежит Q. Так как события (Хх, X2,)gQ и (Yx, Y2)£^* идентичны, ясно, что совместная плотность (YXY2) равна g(yi. Уг) = НаиУ1 + а12У2, а2,у±-]-аму2)-\. (1.11) Все это в равной степени справедливо и при большем числе из- мерений. Подобные аргументы применимы к более общим преобразова- ниям с той лишь разницей, что детерминант Д заменяется яко- бианом. Мы будем использовать явно только переход к полярным координатам Хх == R cos 0, Х2 = R sin 0, (1,12}
§ 1. Плотности 87 Где пара случайных величин (R, 0) ограничена условиями R О, л<0^л. Плотность пары (R, 0) равна g(r, 0)=/(rcos0, г sin 0) г. (1.13) В пространстве трех измерений используются географические дол- гота ср и широта 0(—л<ф^л и Тогда координатные величины выражаются в полярной системе следую- щим образом: Хх — R cos Ф cos0, Х2 = R sin Ф cos 0, X3 = Rsin0. (1.14) Их совместная плотность записывается как g*(r, ф, 0) — f (г cos ф cos 0, г sin ф cos 0, г sin 0) г2 cos 0. (1.15) При преобразовании (1.14) «плоскости» О= —и 0=-|-л со- ответствуют полуосям оси х3, но эта вырожденность не играет роли, так как эти полуоси имеют нулевую вероятность. Анало- гичное замечание можно сделать и в отношении начала коорди- нат для полярной системы на плоскости. Примеры, а) Независимые случайные величины, В предыдущих главах мы рассматривали независимые случайные величины Хх и Х2 с плотностями Д и /2. Это равносильно определению двумер- ной плотности равенством /(л\, х2) = (xj f2 (*2), где // — марги- нальные плотности. б) «Случайный выбор». Пусть Г — ограниченная область; пред- положим для простоты, что Г —выпуклая область. Обозначим Площадь Г через у. Пусть теперь функция / равна у""г внутри Г й 0 вне Г. Тогда / является плотностью, и вероятность, соот- ветствующая любой области НсГ, равна отношению площадей Q й Г. По очевидной аналогии с одномерным случаем мы будем го- ворить, что пара (X*, Х2) распределена равномерно в Г. Марги- нальная плотность Х£ в точке с абсциссой равна ширине об- ласти Г в этой точке в очевидном смысле этого слова. (См. за- Дачу 1.) в) Равномерное распределение на сфере. Единичная сфера S в пространстве трех измерений может быть описана при помощи Географических долготы ф и широты 0 равенствами = COS ф COS 0, Х2 = sin ф COS 0, *3 = sin0. (1.16) Каждой паре (ф, 0), такой, что —л<ф^л, —7^<0<уЯ, Соответствует здесь ровно одна точка на сфере, и каждую точку S, исключая полюса, можно получить таким путем. Исключи- тельность полюсов не должна нас беспокоить, так как им соот- ветствует нулевая вероятность. Область Q на сфере определяется своим образом на (ф, 0)-плоскости, и, следовательно, площадь Q £авна интегралу от соз0йфй0 по этому образу [см. (1.15)]. Для
88 Гл. 7П, Многомерные плотности. Нормальные плотности и процессы описания мысленного эксперимента, заключающегося в «случайном выборе точки на 2», мы должны положить 4лР (Q) == площадь Q. Это эквивалентно определению в (ср, 0)-плоскости плотности g(q>. 0) = -^-COS0 при —ЗТ<ф^Л, О при других ф и 9. 101<2Я’ (1Д7) При таком определении координатные величины независимы и дол- ----------------------------------1 гота распределена равномерно на —л, л. Идея перехода от сферы 2 к (ф, 0)-плоскости хорошо знакома нам по географическим картам и полезна для теории вероят- ностей. Заметим, однако, что координатные величины в значи- тельной степени произвольны и их математические ожидания и дисперсии ничего не значат для первоначального мысленного экс- перимента. г) Двумерная нормальная плотность. Многомерные нормаль- ные плотности будут введены более систематично в § 6. Оправ- дание преждевременному появлению двумерного случая в том, что тем самым обеспечивается более легкий подход к нему в даль- нейшем. По очевидной аналогии с нормальной плотностью и из П, (1.6), можно записать плотность вида ce~<i где q(xt, х2)= == агХ1 + 2bxrx2 -j- а2х%. Нетрудно видеть, что функция будет интегрируемой тогда и только тогда, когда ага2—Ь2>0 и «1, а2 > 0. Для целей теории вероятностей предпочтительнее вы- разить коэффициенты ai и b в терминах дисперсий и определить двумерную нормальную плотность, центрированную в начале координат как ф(Х1’ %2)==2ЯО1О2^ 1-р2еХр ~2(1-р*)(д_2Р7Й+-^ ’ (1.18) где Qj > 0, а2>0 и —1 <р<1. Интегрирование по х2 легко выполняется с помощью подстановки /=——р~~ (дополнение а2 ai до полного квадрата). Видно, что ф действительно представляет плотность в ий2. Кроме того, становится очевидным то, что мар- гинальные распределения Xf и Х2 снова нормальных) и что E(Xz) = 0, Var(Xz) = Qf, Соу(Х£, Х2) = ра1а2- Иными словами, р есть коэффициент корреляции Xf и Х2. Заменяя xt на Xt—Ci х) Вопреки широко распространенному мнению существуют не являю- щиеся нормальными двумерные плотности с нормальными маргинальными плот- ностями (два типа описаны в задачах 25 3, еще два — в задачах 5 и 7 из гл. V, 12). Для того чтобы иметь дело с нормальными плотностями, ста- тистики иногда вводят новые координатные величины Yi = gi (Xj), Y2 = g2(X2), которые распределены нормально. При этом, увы, совместное распределение (Yi, YJ не является нормальным.
§ 1. Плотности 89 в (1.18), мы приходим к нормальной плотности, центрированной в точке (Ci, с2). Важно то, что линейное преобразование (1.9) переводит нор- мальное распределение в другое нормальное распределение. Это оче- видно из определения и формулы (1.11). [Продолжение см. в при- мере 2, а).] д) Симметричное распределение Коши в Положим и (хг, х2) == 2^ * /• 2—2— • (1’19) V (1+^+х2)3 Чтобы удостовериться, что это есть плотность, заметим1), что + СО f и (Х,, у) dy — ---—2 • —f — +“ =— . J—у . (1.20) А 2« 1+4 К1+4+^ я 1+^ Отсюда следует., что и является плотностью и что маргинальная плотность X, не что иное, как плотность Коши у, из гл. II, (4.5). Очевидно, что величина X, не имеет математического ожидания. При переходе к полярным координатам [как в (1.12)] видим, что плотность R не зависит от 0, и поэтому величины R и 0 стохастически независимы. Следуя терминологии гл. I, 10, мы можем тогда сказать, что имеющая симметричное распределение Коши пара (Х„ Х2) изображает вектор со случайно выбранным направлением длины R, плотность которой равна откуда Р {R С г} — 1 —И(1+ г2)-1. [Продолжение в примере 2, в).] е) Симметричное распределение Коши в 91\ Положим / ч 1 1 О (хп х2, Хо) = -V . --з--5---т- . я (l+xj+4+хз)8 Легко видеть2), что маргинальная плотность (Xi9 Х2) является симметричной плотностью Коши и из (1.19). Маргинальная плот- ность Хх есть поэтому плотность Коши (Продолжение в за- даче 5.) > Хотя это и не используется явно в последующем, но мы должны отметить, что свертки можно определить так же, как и в одномерном случае. Рассмотрим две пары (Хъ Х2) и (Yt, Y2) с совместными плотностями f и g соответственно. Утверждение о том, что две пары независимы^ означает, что мы берем четырех- мерное пространство с четырьмя координатными величинами Х£1 Х2, Yn Y2 в качестве выборочного пространства и определяем в нем плотность произведением f(x1T x2,)g(yir у2). Так же как *) Подстановка y~V l+*i tg t облегчает вычисление* 2) Используя подстановку z = K l+xi+^atg/.
90 Гл. 111. Многомерные плотности. Нормальные плотности и процессы в тогда легко видеть, что совместная плотность v суммы (X1 + Y1, X2 + Y2) задается формулой свертки + со + со v(zn Z2)= $ $ — z2 — x2)g(xt, xJdXtdXtf (1.22) — oo — co которая является очевидным аналогом формулы гл. I, (2.12). (См. задачи 15—17.) § 2. УСЛОВНЫЕ РАСПРЕДЕЛЕНИЯ Предположим, что пара (Xf, Х2) имеет' непрерывную плот- ность f и что маргинальная плотность величины X* строго положительна. Рассмотрим условную вероятность события Х2^ц при условии, что ё<Х1^£+/г, а именно £+ h ч dx f (х, у) dy Р{Х2<П|^<Х1-<ё + /1} = -1_^-------------. (2.1) j fl W dx В Деля числитель и знаменатель на й, устанавливаем, что при А—> —>0 правая часть стремится к ч ^(п)=О) J Z(g’ y}dy- (2 2) При фиксированном | это функция распределения по т] с плот- ностью = П). (2.3) Мы называем щ. условной плотностью величины Х2 при условии, что Xi — Z- Условное математическое ожидание Х2 при условии, что Х1 = £, определяется как + 00 Е (Х21 Xj = g) = J yf (£, у) dy (2.4) в предположении, что интеграл сходится абсолютно. Если рас- сматривать % как переменную величину, то правая часть есть функция от В частности, отождествляя % с координатной вели- чиной Хп получим случайную величину, называемую регрессией Х2 на Xj и обозначаемую Е (Х21 Хх). Присутствие Х2 не должно затемнять тот факт, что эта случайная величина является функ- цией одной переменной Xf [ее значения даются формулой (2.4)]. До сих пор мы предполагали, что (g) > 0 для всех Выра-
J 2. Условные распределения 91 жение (2.4) не имеет смысла при /*(£) = (), но множество таких точек имеет вероятность нуль, и мы условимся интерпретировать (2.4) как нуль во всех точках, где обращается в нуль. Тогда Е (Х21XJ определено всякий раз, когда плотность непрерывна. (В гл. V,9 —11, условные вероятности будут введены для про- извольных распределений.) Излишне говорить, что регрессия E(XJX2) величины Xj на Х2 определяется подобным же образом. Кроме того, условная дис- персия Var(X2|X1) определяется по очевидной аналогии с (2.4). Эти определения переносятся на случаи большего числа изме- рений, за тем исключением, что плотность в 5i3 порождает три двумерные и три одномерные условные плотности. (См. задачу 6.) Примеры, а) Нормальная плотность. Для плотности (1.18), очевидно, имеем г ( Ос> "1 иг. (у) = —^==== exp------------1—4— , (2.5) ' И2л(1- р2)о22 L 2(1—р2)о| J ’ что представляет собой нормальную плотность с математическим ожиданием р|^ £ и дисперсией (1—р2) о2. Таким образом, Е(Х2|Х1) = р^Х1, Var (Х21 XJ = (1 —р2) (2.6) Одним из приятных свойств нормального распределения является то, что регрессии—линейные функции. Возможно, самым ранним применением этих соотношений мы обязаны Гальтону, и одним из его примеров можно проиллюстри- ровать их эмпирическое значение. Предположим, что Хх и Х2 характеризуют рост (измеренный по отклонению от среднего в дюймах) соответственно отцов и сыновей в некоторой популяции. Рост случайно выбранного сына есть тогда нормальная случайная величина с математическим ожиданием 0 и с дисперсией о2. Од- нако в подпопуляции сыновей, отцы которых имеют фиксирован- ный рост рост сыновей представляется нормальной величиной с математическим ожиданием р —? и дисперсией а|(1—р2) < о2. Таким образом, регрессия Х2 на Xf показывает, как много ста- тистической информации относительно Х2 содержится в наблю- дении над Xv б) Пусть случайные величины Xf и Х2 независимы и равно- мерно распределены на 0, 1. Обозначим через Х(1) и Х(2) соот- ветственно наименьшую и наибольшую среди этих величин. Пара (Х(1), Х(2)) имеет плотность, которая тождественно равна 2 внутри треугольной области 0 х2 1 и равна 0 во всех других точках плоскости. Интегрируя по переменной х2, выводим, что маргинальная плотность Х(1) есть 2(1—xj. Плотность условного
92 Гл. HI. Многомерные плотности. Нормальные плотно'ЫНи, и процессы распределения Х(2) при условии, что X(i) = Xi, равна, следова- тельно, постоянной 1/(1—xj внутри интервала xif 1 и равна нулю вне этого интервала. Иными словами, при условии, что X(f) при- нимает значение xi9 случайная величина Х(2) равномерно распре- делена на xi9 1. в) Распределение Коши в 91*. Для двумерной плотности (1.19) маргинальная плотность Xi задается формулой (1.20), и поэтому условная плотность Х2 при данном Х£ равна (у) = ±. r 1 + g2 =. (2.7) Заметим, что «g отличается от плотности ы0 (у) только масштаб- ным множителем Ki ~t*£2> и поэтому все плотности «g принадлежат одному и тому же типу. Условных математических ожиданий в этом примере не существует. (См. задачу 6.) > В терминах условных плотностей (2.3) функция распределения величины Х2 принимает вид у +QO P(X2<t/}=j $ (2.8) — ОО —00 Иными словами, распределение Х2 получается посредством ран- домизации параметра g в условных плотностях и^9 и поэтому каждое1) распределение может быть представлено в виде смеси. Несмотря на эту теоретическую универсальность, имеется боль- шое различие в положении «ударения». В некоторых ситуациях, таких, как в примере а), начальным является двумерное распре- деление для (Xj, Х2), а затем выводятся условные распределения, тогда как при истинной рандомизации условные вероятности их являются исходным понятием и плотность /(х, у) фактически определяется как t^G/) А (х). (Эта процедура определения веро- ятностей в терминах условных вероятностей объяснялась элемен- тарным путем в 1; гл. V, 2.) § 3. ВОЗВРАЩЕНИЕ К ПОКАЗАТЕЛЬНОМУ И РАВНОМЕРНОМУ РАСПРЕДЕЛЕНИЯМ Задача этого параграфа в том, чтобы дать примеры-иллюстра- ции к предыдущим параграфам и в то же время дополнить теорию первой главы. Примеры, а) Характеристическое свойство показательного распределения. Пусть Xf и Х2—две независимые случайные вели- чины с плотностями /х и /2. Обозначим плотность их суммы S == *) Мы рассматривали до сих пор непрерывные плотности. Общий случай будет разобран в гл. V,9. Понятие рандомизации обсуждалось в гл4 IIа 5,
$ 3. Показательное и равномерное распределение 93 = ХТ + Х2 через g. Пары (Xf, S) и (Xf, Х2) свЯзаны лилейным преобразованием Х1 = Х1, X2 = S—X* с детерминантом 1, и сов- местная плотность пары (Xf, S) по формуле (1.11) равна Х(х)х Xf2(s—Интегрируя по всем х, мы получаем маргинальную плотность g суммы S. Условная плотность us величины Хх при условии, что S = s, удовлетворяет соотношению (3.1) Для частного случая показательных плотностей Д (х) = /2 (х) =* = (х > 0) мы получаем us (х) = s’"1 при 0 < х < s. Иными словами, при условии, что Xx + X2 = s, случайная величина Xf распределена равномерно на интервале 0, s. Образно говоря, знание того, что S = s, не дает нам никакой информации о возможном положении случайной точки Хх внутри интервала 0, s. Этот ре- зультат согласуется с представлением о полной случайности, свой- ственной показательному распределению. (Более сильный вариант содержится в примере г). См. также задачу 12.) б) Случайные разбиения интервала. Пусть Хх, Х„— п точек выбранных независимо и наудачу в (одномерном) интер- вале 0, 1. Как и прежде, мы обозначим через Х(1), Х(2), ..., Хи) случаные точки Хх, ..., Хи, расположенные в возрастающем порядке. Эти точки делят интервал 0, 1 на п 4-1 подынтервалов, которые мы обозначим /х, /2, ...» /п+х, пронумеровав их слева направо, так что Х(/) является правым концом интервала /у. В первую очередь мы вычислим совместную плотность (Х(1), ... .... Х(в)). Выборочное пространство, соответствующее (Хх, ..., XJ, пред- ставляет n-мерный гиперкуб Г? 0<хл<1, а вероятности равны (n-мерному) объему. Естественное выборочное пространство, где где Хш—координатные величины, есть подмножество QczT, со- стоящее из всех точек, таких, что 0 < хх хп < 1. Объем Q равен 1/и! Очевидно, что гиперкуб Г содержит п\ конгруэнтных «копий» множества Q, и в каждой из них упорядоченная строка (Х(х), .Х(п) совпадаете фиксированной перестановкой вели- чин Хх, ..., Хп. (Внутри Г, в частности, X(ft, = XA.) Вер оят- ность того, что Ху==ХА: для некоторой пары /=#£, равна нулю, а только это событие вызывает перекрытия между различными «копиями». Отсюда следует, что для любого подмножества XczQ вероятность того, что (Х(1), .Х(72)) принадлежит А, равна вероятности того, что (Хх, ..., XJ принадлежит одной из п! «копий» А, а эта вероятность в свою очередь равна умножен- ному на п\ объему А. Таким образом, вероятность Р{(Х(1), ... ..., Х(п))£Л} равна отношению объемов А и Q, а это означает, что строка (Х(1), Х(л)) распределена равномерно на мно-
94 Гл. III. Многомерные плотности. Нормальные плот ноет и и про цессы жестве Q. Совместная плотность величин этой строки равна п\ внутри Q и нулю вне Q. Из совместной плотности (Х(1), .. , Х(/2)), предполагая xk фиксированным и интегрируя по всем оставшимся переменным, можно вычислить плотность Х^. Легко видеть, что этот резуль- тат согласуется с формулой для плотности, вычисленной дру- гими методами в гл. I, (7.3). Этот пример был рассмотрен детально в качестве упражнения в обращении с многомерными плотностями. в) Распределение длин. В обстановке предыдущего примера обозначим длину &-го интервала Ik через U^,. Тогда Ui = X(i)> иА = Хш-Х(А_п £ = 2,3, (3.2) Это не что иное, как линейное преобразование типа (1.9) с де- терминантом 1. Множество Q точек 0 < хг хп < 1 отобра- жается в множество Q* таких точек, что uf 0, t/x + ... + ип < < 1, и, следовательно, строка (Ux, ..., U„) распределена равно- мерно в этой области. Этот результат сильнее ранее установлен- ного факта, что величины одинаково распределены [пример 7,6) из гл. I и задача 13 из гл. I]. г) Еще раз о случайности показательного распределения. Пусть Хх, ..., Хд+х независимы и одинаково распределены с плотностью ПрИ х>0. Положим Sy = Хх+ ... +Ху. Тогда строка (Sx, S2, ..., S„+1) получается из (Хх, ...» Хп+1) линейным преобра- зованием типа (1.9) с детерминантом 1. Обозначим через Q «октант», состоящий из точек %у>0 (/ = 1, ..., п + 1). Плотность (Хх, ... ..., Хл+1) сосредоточена на й и равна (Х1+...+хп+1), если %у>0. Величины Sf, ..., Sn+i отображают Q на область Q*, определяемую неравенствами 0 < sx $2 ^... ^ s„+f < оо, и [см. (1.11)] внутри Q* плотность (Sx, .. • * Stt+1) равна a,z+1e~asn+i. Маргинальная плотность S„+f есть не что иное, как гамма-плот- ность an+1sne-asln\, и, следовательно, условная плотность строки (Sx, ..., SJ при условии, что Sn+1 = s, равна п\ s~n при 0< <sx <...<$„ <s (и нулю в других случаях). Иными словами, при условии, что S„+1 = s, величины (Sx, ..., SJ равномерно распределены в области их возможных значений. Сравнивая это с примером б), мы можем сказать, что при условии Sn+1 = s вели- чины (Sx, ..., Sn) изображают п точек, выбранных независимо и наудачу в интервале 0, s и занумерованных в их естественном порядке слева направо. д) Другое распределение, связанное с показательным. Имея в виду последующее неожиданное применение, мы дадим еще один пример преобразования. Пусть снова Хх, ..., X—незави- симые величины, имеющие одинаковое показательное распреде- ление и Sn = Хх + ... + Хп. Определим величины Ux, ...» U„
§ 3. Показательное и равномерное распределения 95 следующим образом: = при k = \, .n—1, U„ = S„, (3.3) или, что равносильно, Х^ = и,еи„ при /г = 1, /г—1, . Xn = U„ (1 —Uj—... — ’ Якобиан преобразования (3.4) равен U^-1. Совместная плотность (Хь .... Х„) сосредоточена в области Q, определяемой неравен- ствами > О, и внутри ее эта плотность равна апе~а^ + -+х^. Отсюда следует, что совместная плотность (ип ..., UJ равна в области Q*, определенной неравенствами .. + un_i < 1, ик > 0, А —1, ..., п, и равна нулю вне Q*. Интегрирование относительно ип показы- вает, что совместная плотность (ип ..., равна (п—1)! в Q* и нулю в других случаях. Сравнивая с примером в), мы видим, что (Vi, .... U„_J имеет такое же распределение, как если бы величина была длиной k-го интервала при случайном разбиении интервала 0, 1 набором п—1 точек. е) Критерий значимости в анализе периодограмм и теорема о покрытии. Практически любая непрерывная функция времени t может быть приближена тригонометрическим полиномом. Если эта функция представляет собой выборочную функцию случайного процесса, то коэффициенты становятся случайными величинами и аппроксимирующий полином может быть записан в виде п п S (Xvcoscov t + Yvsin(ovZ) = 5 Rvcos(cov/—(pv), (3.5) V=1 V=1 где Ry = Xv+Y^ и tg <pv = Yv/Xv. Обратно, разумные предполо- жения относительно случайных величин Xv, Yv приводят к слу- чайному процессу с выборочной функцией, задаваемой (3.5). В свое время было модным вводить модели такого рода и открывать «скрытую периодичность» для солнечных пятен, цен на пшеницу, поэтического творчества и т. д. Подобные скрытые периодичности отыскивали с такой же легкостью, как ведьм в средневековье. Но даже сильная вера должна быть подкреплена статистическим критерием. Грубо говоря, метод заключается в следующем. Три- гонометрический полином вида (3.5) с как-то выбранными часто- тами (оп ..., (о„ сравнивается с некоторыми результатами наблю- дений. Допустим, что при этом обнаруживается особенно большая амплитуда Rv. Желательно доказать, что это не может быть слу- чайным и, следовательно, что <ov — истинный период. Для про- верки этого предположения выясним, правдоподобно ли совме- стить большое наблюденное значение Rv с гипотезой, что все п
96 Гл. IIМногомерные плотности. Нормальные плотности и процессы компонент играют одинаковую роль. В соответствии с этим пред- полагается, что коэффициенты Хь ..., У„ взаимно независимы и имеют одинаковое нормальное распределение с нулевым мате- матическим ожиданием и дисперсией а2. В этом случае (см. II, 3) величины Rv взаимно независимы и имеют одно и то же показа- тельное распределение с математическим ожиданием 2о2. Если наблюденное значение «значимо» отклонилось от ожидаемого, то мы приходим к заключению, что гипотеза об одинаковой роли компонент была несостоятельна и R2 отражает «скрытую перио- дичность» . Ошибочность этих соображений была раскрыта Р. А. Фишером (1929). Он отметил, что максимальный из результатов п незави- симых наблюдений не подчиняется тому же самому распреде- лению вероятностей, которое имеет каждый из них в отдельности. Ошибка в такой статистической трактовке худшего случая, как будто он выбирался случайно, до сих пор распространена в меди- цинской статистике, но причиной обсуждения этого вопроса здесь является неожиданная и занятная звязь критерия значимости Фишера с теоремами о покрытии. Так как важны только отношения компонент, то мы норми- руем коэффициенты, полагая 1 R1+.-. + R» ’ (3.6) / — С • • •» я. Поскольку R; имеют одно и то же показательное распределение, мы можем использовать предыдущий пример g X? = R-. Тогда Vx-Ut, .... V^iXsU^f, но Vn=xl —и,——U„_t. Соответ- ственно строка (Vj, Vп) распределена так, как если бы Vt были длинами п интервалов, на которые разбивается интервал О, 1 при случайном расположении в нем п—1 точек. Вероят- ность того, что все Vу будут меньше а, задается формулой гл. I, (9.9) теоремы о покрытии. Этот результат иллюстрирует факт неожиданных отношений между на первый взгляд не свя- занными задачамих), ► § 4* *). ХАРАКТЕРИЗАЦИЯ НОРМАЛЬНОГО РАСПРЕДЕЛЕНИЯ Рассмотрим невырожденное линейное преобразование коорди- натных величин Y J Y 2 !== $21^4 ^22^2 (4*1) 1) Фишер получил распределение максимальной из величин Vy^B 1929 г, без знания теоремы о покрытии, а в 1940 г. объяснил связь с теоремой о покры- тии, после того как Стивенс доказал последнюю. [См. Fisher, Contributions to Mathematical Statistics, John Wiley, N. Y (1950), статьи 16и 37.] Другой вывод, использующий анализ Фурье, см.: Grenander U., RosenblattМ., (1957), *) Этот параграф затрагивает специальную тему и не используется в даль- нейшем.
§ 4. Характеризация нормального распределения 97 и допустим (не ограничивая общности), что детерминант Д=1. Если Хх и Х2—независимые нормально распределенные величины с дисперсиями ох и то распределение пары (Yx, Y2) нормально с ковариацией a11a21o[ + a12a22(J22 [см. пример 1, г)]. В этом случае существуют нетривиальные наборы коэффициентов ajk, такие, что Yx и Y2 независимы. Следующая теорема показывает, что это свойство одномерного нормального распределения не разделяется никаким другим распределением. Мы докажем это только для распределений с непрерывными плотностями, в случае которых наше утверждение сводится к лемме относительно функциональ- ного уравнения (4.3). Более общий случай сводится (с использо- ванием характеристических функций) к тому же самому урав- нению. Поэтому наше доказательство фактически устанавливает теорему в ее наибольшей общности (см. гл. XV,8). Элементарное рассмотрение плотностей лучше раскрывает основную суть тео- ремы. Преобразование (4.1) имеет смысл лишь в том случае, когда коэффициенты aJk не обращаются в нуль. В самом деле, поло- жим, например, czxx = O. Без ограничения общности мы можем выбрать масштабные параметры так, чтобы а12 = 1. Тогда Yx = X2 и, заглядывая вперед, из (4.4) получаем, что в этом случае Y2 должно иметь ту же плотность распределения, что и Хг Иными словами, такое преобразование равнозначно простому переимено- ванию случайных величин и потому не представляет никакого интереса. Теорема. Допустим, что Хх и Х2 независимы и что величины Yx и Y2 также не зависят одна от другой. Если ни один из коэффициентов aJk не равен нулю, то все четыре величины явля- ются нормальными. Наиболее интересный частный случай (4.1) доставляется вра- щениями, т. е. преобразованиями вида Yx = Хх cos со + Х2 sin со, 9 Y2 = —Хх sin со + Х2 cos со, ' ' ' где со не кратно Применяя теорему к подобным вращениям, мы получаем Следствие. Если Хх и Х2—независимые случайные величины и существует вращение (4.2), такое, что Yx и Y2 также незави- симы, то Хх и Х2 имеют нормальные распределения с одинаковой дисперсией. В этом случае Yx и Y2 независимы при каждом со. Пример. Распределение Максвелла для скоростей. При изуче- нии распределений скоростей молекул в <%3 Максвелл предпо- лагал, что в любой декартовой системе координат три компоненты скорости являются независимыми случайными величинами с нуле- вым математическим ожиданием. Примененное к вращениям, ос- тавляющим одну ось фиксированной, наше следствие непосредст- 4 Х8 249
98 Гл. III. Многомерные плотности. Нормальные плотности и процессы венно показывает, что три компоненты нормально распределены с одинаковой дисперсией. Как мы видели в гл. 11,3, это влечет распределение Максвелла для скоростей. Эта теорема имеет длинную историю, восходящую к исследованиям Макс- велла. Чисто вероятностное изучение было предпринято М. Кацем (1940) и С. Бернштейном (1941), который доказал наше следствие в предположении конечности дисперсий. Многие авторы вносили улучшения и исследовали варианты, иногда при помощи более сильных методов. Кульминации это раз- витие достигло в результате, доказанном В. П. Скитовичем1). Перейдем к доказательству для случая непрерывных плотно- стей. Обозначим плотности Ху через а плотности Yy через Положим для краткости У1 == ^11^1 ^12^2» Уг = ^21^1 “Ь ^22^2* (4*3) По условию теоремы имеем f 1 (У1) f 2 (У2)= C^i) и2 (я2). (4« 4) Покажем, что из соотношения (4.4) следует, что f j (у) = ± е?j, ^у(х) = ±Л (х), (4.5) где <pz(z/) и (Оу (%)—полиномы не выше w второй степени. Единст- венными распределениями с плотностью такого вида являются нормальные распределения. Поэтому для распределений с непре- рывными плотностями теорема содержится в следующей лемме. Лемма. Предположим, что четыре непрерывные функции fj, и Uj, / = 1, 2, связаны функциональным уравнением (4.4) и что ни один из коэффициентов ajk не равен нулю. Тогда эти функции имеют вид (4.5), где показателями являются полиномы, степень которых не выше 2. (Предполагается, конечно, что ни одна из функций не равна тождественно нулю.) Доказательство. Вначале отметим, что ни одна из наших функ- ций не имеет нулей. Действительно, в противном случае должна существовать на (х1? л2)-плоскости область Q, внутри которой обе части равенства (4.4) не имеют нулей и на границе которой они обращаются в нуль. Приравнивая обе части равенства (4.4) нулю, выводим, с одной стороны, что граница состоит из отрезков пря- мых, параллельных осям, с другой стороны, из отрезков, парал- лельных прямым z/y = const. Это противоречие показывает, что такая граница не существует. Мы можем таким образом считать наши функции строго поло- ' х) Изв. АН СССР, т. 18 (1954), стр. 185—200. Теорема. Пусть Хх, ... ..., Хл взаимно независимы, Y1 = ^\zz-X/ и Y2=5]'bfXf, где ни один коэффи- циент не равен нулю. Если Yx и Y2 независимы, то величины X/ распреде- лены нормально,
§ 5. Матричные обозначения. Ковариационная матрица 99 жительными. Переходя к логарифмам, перепишем (4.4) в виде Ф1 (У1) + ф2 (z/2) =- fa)+®2 (х2). (4.6) Определим при любых фиксированных ht и h2 смешанный разностный оператор Д равенством Ду (хх, х2) = v (хх х2 4” ^2) ^(хх+йх, “*“^2) —v(xt—hi9 x2+h2) + v(x1—hi, x2—h2). (4.7) Так как каждая функция соу зависит только от одной переменной Ху, то отсюда следует, что Дсоу = 0. Имеем ДФ1 Q/i) = Ф1 + Ф1 (У1 + *2)—Фх G/i—Q + Фх (У1~ *1), (4-8) где для краткости введены ~ ^11A1 “И ^12^2> ^2 “ ^11Л1 ^12^2* (4*9) Таким образом, имеем Дфх + Дф2==0, где фу зависит только от переменной z/y. При фиксированном у2 очевидно, что Дфх (z/x) есть постоянная, зависящая только от 1г1 и h2. Выберем теперь Ах и h2 так, что tr = t и /2—О, где t произвольно, но фиксированно. Тогда соотношение Дфх = const примет вид Ф1 G/i+0+Ф1 (Уг—О—2Ф1 (У1)=МО- (4.Ю) Вблизи точки у1У где функция фх принимает минимальное значе- ние, левая часть (4.10) не меньше нуля. Следовательно, такая точка уг существует только в том случае, если Я(/)^0 при всех t из некоторой окрестности нуля. Но в таком случае фх не может иметь максимальное значение. Далее, непрерывная функция, обращающаяся в нуль в трех точках, принимает как максималь- ное, так и минимальное значение. Мы выводим, что если непре- рывное решение соотношения (4.10) равно нулю в трех различных точках, то оно равно нулю тождественно. Каждый квадратный полином q (z/x) = ау{ + Pz/X + у удовлетворяет уравнению вида (4.10) (с другой правой частью), и, следовательно, то же справедливо для разности Фх(ух)—(?(z/x). Но (/ можно выбрать так, что эта разность будет равна нулю в трех точках и тогда фх (ух) совпадает с q. Те же рассуждения применимы к ф2, и этим доказывается утверждение относительно /1 и /2. Так как случайные величины Ху и Yу играют одинаковую роль, то те же аргументы применимы к плотностям Uj. >> § 5. МАТРИЧНЫЕ ОБОЗНАЧЕНИЯ. КОВАРИАЦИОННАЯ МАТРИЦА Обозначения, использованные в § 1, громоздки и становятся еще более громоздкими в случае большего числа измерений. Изяще- ства и экономии можно достичь при использовании матричной системы обозначений. 4*
100 Гл. III. Многомерные плотности. Нормальные плотности и процессы Чтобы облегчить ссылки, мы кратко изложим немногие факты из теорий матриц и матричных обозначений, нужные в дальнейшем. Основное правило таково: сначала строки, затем столбцы. Таким образом, (ахР)-матрица А имеет а строк и |3 столбцов; ее элементы обозначаются aj^, при этом первый индекс указывает строку. Если В есть (Рху)-матрица с элементами bjk, то произведение АВ представляет собой (аХу)-матрицу с элементами а^Ь^-}- + ^/2^2/г+ • • • Если число столбцов матрицы А не совпадает с числом строк матрицы В, то произведение не определено. Выполняется ассоциативный закон (АВ)С=А(ВС), хотя, вообще говоря, АВ^ВА. Транспонированная матрица^^Д^ есть (|ЗХа)-матрица с элементами a]k = ^kj- Очевидно, что (1Xос)-матрица с единственной строкой называется вектор-строкой, а матрица с единственным столбцом—векпгор-столбцом1}. Вектор-строка г = = (гг, ...» га) легко изображается при печати, а вектор-столбец лучше определять результатом его транспонирования сг = (с1} ..., са). Заметим, что сг есть (ахос)-матрица (типа «таблицы умножения»), в то время как гс есть (1X1)-матрица, или скаляр. В случае а = 2 /С1/1 С!Г2\ сг = ( ) , гс = (г1с1 + г2с2). \02Г1 С2Г2/ Нулевой вектор имеет нулевые компоненты. Матрицы с одинаковым числом строк и столбцов называются квадратными матрицами. Для каждой квадратной матрицы А определяется ее детерминант (определитель), который будет обозначаться через | А |. Для наших целей достаточно знать, что детерминанты обладают свойством мультипликативности: если А и В — две квадратные матрицы и С = АВ, то ] С | = ] Д|-|В|. Матрица А и транспонированная матрица АТ имеют один и тот же детерминант. Под единичной матрицей подразумевается квадратная матрица с едини- цами по главной диагонали и с нулями на всех остальных местах. Если / — единичная матрица с г строками и г столбцами и А—любая (гхг)-матрица,^ то очевидно, что 1 A — AI — А. Матрицей, обратной для Д, называется мат- рица А-1, такая, что АА~г = А-1А = I. [Только квадратные матрицы могут иметь обратные. Обратная матрица единственна: так, если В—любая обратная матрица для Д, то AB — I и по ассоциативному закону Д”1 = (Д“1Д)В=В.] Квадратная матрица, не имеющая обратной, называется вырожденной. Из мультипликативного свойства детерминантов следует, что матрица, имеющая нулевой детерминант, вырождена. Справедливо также и обратное: если | А | 0, то матрица А невырождена. Иными словами, матрица А является вырожден- ной тогда и только тогда, когда существует ненулевая вектор-строка х, та- кая, что хА = 0. Квадратная матрица А симметрична, если ajk — akj, т. е. если ДГ = Д. Квадратичная форма, соответствующая симметричной (гХг)-матрице А, определяется как г хАхТ= 5 ajkXjXn, i, k=i где xlt ...,хг являются переменными.'Матрица называется положительно определенной, если хАхТ > 0 для всех ненулевых векторов х. Из последнего критерия следует, что положительно определенная матрица невырождена. Вращения в 51а- Для полноты мы кратко коснемся одного геометрического приложения матричного анализа, хотя это и не будет использовано в даль- нейшем. 1) На самом деле это—злоупотребление языком. В конкретном случае х^ может означать количество фунтов, а х2—число коров; тогда (xlt х2) не является «вектором» в строгом смысле.
$ 5. Матричные обозначения. Ковариационная матрица 101 I Скалярным (внутренним) произведением двух векторов-строк x = (xi, . ха) и у~(z/i, .уа) называется величина хуТ = ухТ = ^ Xjyj. i=i Длина L вектора х определяется из равенства Л2 = ххг. Для векторов х и у единичной длины угол 6 между ними определяется величиной cos 6 = хут. Любая (аха)-матрица А индуцирует преобразование, переводящее х в £ = для транспонированной матрицы х преобразуется в %,т=Атхт. Матрица А называется ортогональной, если индуцированное ею преобразование сохра- няет длины и углы, иначе говоря, если любые два вектора-строки имеют то же самое скалярное произведение, что и их образы при преобразовании. Таким образом, матрица А ортогональна тогда и только тогда, когда для лю- бой пары векторов-строк х, у хААтут = хут. Отсюда следует, что ААТ есть единичная матрица I (в этом можно убедиться, выбирая в качестве х и у векторы с а—1 компонентами, равными нулю). Таким образом, мы пришли к заключению, что А ортогональна тогда и только тогда, когда ААТ — 1. Поскольку А и Ат имеют один и тот же детерминант, то этот детерминант равен +1 или —1. Ортогональная матрица с детерми- нантом 1 называется матрицей вращения, а индуцируемое ею преобразование — вращением. Отныне мы будем обозначать точку n-мерного пространства 91г одной буквой, интерпретируя ее как вектор-строку. Таким образом, x = (xlf ..., хг) и f(x) = f(x19 ..., хг) и т. д. Неравен- ства должны интерпретироваться покоординатно: х < у тогда и только тогда, когда xk<yk для &=1, ..., г; аналогично и для других неравенств. На плоскости «й2 соотношение х <у может быть прочитано как «х лежит юго-западнее у». Новая особен- ность этого обозначения в том, что две точки не обязаны состоять в одном из двух соотношений: либо х^у, либо у < х, т. е в многомерном случае знак < определяет только частичное упо- рядочение. Мы вводим обозначение X = (Xf, ..., Хг) для вектор а-стр ок и из координатных величин и будем использовать это обозначение для случайных величин вообще (в основном для нормально рас- пределенных величин). Если величины Xf, ..., Хг имеют математические ожидания E(XZ), то мы обозначим через Е (X) вектор-строку с компонентами. Е(ХУ). Вектор X —Е(Х) имеет нулевое математическое ожидание. Вообще, если М—матрица, элементы которой являются случайными величинами, мы обозначаем через Е(М) матрицу эле- ментов Е(Мд) в предположении, что она существует. Определение. Если Е(Х) = 0, то ковариационная матрица Var (X) для X есть симметричная (гхг)-матрица с элементами Е(ХуХй) (при условии, что все они существуют). Иными словами, Var (X) = Е (ХГХ). (5.1) В случае произвольного X мы onредели^ VarX как Var Е(Х)).
102 Гл. III. Многомерные плотности. Нормальные плотности и процессы Использование векторов-строк неизбежно влечет за собой за- пись линейного преобразования Slr в 31т в виде Y-ХД, (5.2) т. е. Уь = S aJhxJt k=l, т, (5.3) /=1 где А — (г хт)-матрица. Очевидно, что E(Y) = E(X)4 всякий раз, когда Е (X) существует. Для того, чтобы найти дисперсии, мы положим, не ограничивая общности, что Е(Х) = 0. Тогда E(Y) = 0 и Е (YrY) = Е (ДГХГХЛ) = ДГЕ (ХГХ) А. (5.4) Мы получаем, таким образом, важный результат: Var(Y)-^Var(X) А. (5.5) Особый интерес представляет частный случай т = 1, когда Y =а1Х1 + ...+^ГХГ (5.6) есть обыкновенная случайная величина. Здесь Var(Y) — (скалярная) квадратичная форма: Var(Y)= S E(X/Xft)aA. (5.7) j, k-1 Линейная форма (5.6) равна нулю с вероятностью единица, если Var(Y) = 0, и в этом случае любая область за пределами гипер- плоскости = Q имеет вероятность нуль. Распределение вероятностей сосредоточено тогда на (г—1)-мерном многообразии и вырождено, если его рассматривать в г измерениях. Мы дока- зали, что ковариационная матрица любого невырожденного рас- пределения вероятностей положительно определена. Обратно, ка- ждая такая матрица может служить ковариационной матрицей нормальной плотности (см. теорему 4 следующего параграфа). § 6. НОРМАЛЬНЫЕ ПЛОТНОСТИ И РАСПРЕДЕЛЕНИЯ Всюду в этом параграфе Q обозначает симметричную (гхг)- матрицу, a q(x)—соответствующую ей квадратичную форму q(x)= S qjkxfy=xQxT. (6.1) /, А=1 где х = (х1, хг) есть вектор-строка. Плотности в 91г, опре- деленные как показательные функции с квадратичной формой $ показателе, являются естественным обобщением нормальной плот- ности на прямой, и мы начнем поэтому с того, что введем сле- дующее
§ 6. Нормальные плотности и распределения 103 Определение. Плотность ср в пространстве г измерений на- зывается нормальной (с центром в начале координат), если она представляется в виде ф(%) = у“1-е (6.2) где у—некоторая постоянная. Нормальная плотность с центром в точке а = (а1У а2, ..., аг) определяется как ср (%—а). Частный случай двух измерений обсуждался в примерах 1, г) и 2, а). Возьмем в качестве выборочного пространство 91г с вероятно- стным распределением (6.2) и обозначим через Х = (Хх, Хг) вектор-строку, образованную координатными случайными величи- нами. Соответствующую ковариационную матрицу обозначим через М: M = Var(X) = E(XrX). (6.3) Наша задача состоит в исследовании матриц Q и М, а также связи между ними. Вначале заметим, что диагональные элементы Q не могут быть нулями. В самом деле, если бы мы имели qrr = 0, то при фикси- рованных значениях х19 ..., плотность (6.2) имела бы вид y-ie~axr+b и интеграл от плотности по хг расходился бы. Введем теперь подстановку у = хА, определенную равенствами У1 ~ ^1» • • * » У г-1 “ Уг~ У1ГХ1 “Ь • • • Ч* УгГХГ* (6*4) Проверка показывает, что q(x)—y*lqrr есть квадратичная форма от величин х19 ..., xr_if но не от хг. Таким образом, <7 (*)=7-*/г2+?(*/). (б-5) Чгг где q(y)—квадратичная форма от уг, ..., yr-f. Отсюда следует, что вектор Y = ХА имеет нормальную плотность, которая является произведением двух нормальных плотностей для случайных вели- чин Yr и (Yp .... Yr.x) соответственно. Первый полученный результат содержится в простой, но важной теореме. Теорема 1. Все маргинальные плотности нормальной плотности снова нормальны. Более неожиданный результат содержит Теорема 2. Существует матрица С с положительным детер- минантом, такая, что Z = XC есть вектор-строка, чьи компо- ненты Zj суть взаимно независимые нормально распределенные случайные величины. Матрица С не единственна; в действительности теорема может 1} «Вырожденные» нормальные распределения будут введены в конце этого параграфа»
104 Гл. 111. Многомерные плотности. Нормальные плотности и процессы быть усилена до утверждения, что в качестве С можно выбрать матрицу вращения (см. задачу 19). Доказательство. Используем индукцию. При г = 2 утверждение теоремы выводится непосредственно из представления (6.5). Если теорема справедлива в г—1 измерениях, то случайные величины являются линейными комбинациями независимых нормальных величин Zx, ..., Zr_x, тогда как случайная величина Yr сама распределена нормально и независимо от остальных величин. Поскольку Х = УЛ-1, отсюда следует также, что величины Ху являются линейными комбинациями Zn Zr_x и Yг. Детерми- нант матрицы А равен qrr и, как следует из (6.5), положителен. Детерминант преобразования X—>Z равен произведению детер- минанта А и детерминанта преобразования Y —> Z и, следовательно, положителен. Теорема 3. Матрицы Q и М взаимно обратны и у2 = (2л)г-1М |, (6.6) где I Al | = | Q|"“1 есть детерминант М. Доказательство. В обозначениях предыдущей теоремы положим D = E(ZrZ) = CrMC. (6.7) Диагональные элементы этой матрицы равны E(Z^) = Oy, а осталь- ные элементы равны нулю. Плотность Z равна произведению нормальных плотностей и (хоу1) of1 и, следовательно, порождается матрицей D-1 с диагональными элементами оу2. Далее, плотность величины Z получается из плотности (6.2) величины X путем подстановки x = zC~l и умножения на детерминант IC”1). Таким образом zD^1zT = xQxT (6.8) и (2л)г [ D | = у2.| С |2. (6.9) Из (6.8) видно, что Q = CD^CT, (6.10) и отсюда с учетом (6.7) следует, что Q==M“1. Из (6.7) вытекает также, что | D | = | М | • | С |2 и, следовательно, (6.9) равносильно (6.6). > Из теоремы следует, в частности, что разложение для матрицы М соответствует аналогичному разложению для Q, и поэтому имеет место Следствие. Если (Xi. X 2) имеет нормальное распределение, то Xf и Х2 независимы в том и только в том случае, когда Cov(Xi, Х2) = 0, т. е. когда Xf и Х2 некоррелированы. Вообще, если (Xj,Хг) имеет нормальную плотность, то
§ 6. Нормальные плотности и распределения 105 (Х1( .... х„) и (Хп+1, .... X,) независимы тогда и только тогда, когда Cov(Xz, Х^) = 0 при j^n, k>n. Предостережение. Для справедливости следствия существенно то, что совместная плотность пары (Хп Х2) нормальна. Следствие неприменимо, если известно только то, что маргинальные плот- ности Хх и Х2 являются нормальными. В последнем случае плот- ность (Хх, Х2) не обязана быть нормальной и в действительности даже не обязана существовать. Этот факт часто понимается не- правильно (см. задачи 2’, 3). Теорема 4. Матрица М представляет собой ковариационную матрицу нормальной плотности тогда и только тогда, когда она положительно определена. Поскольку плотность порождается матрицей Q = можно сформулировать эквивалентное утверждение: матрица Q порождает нормальную плотность (6.2) тогда и только тогда, когда она положительно определена. Доказательство. Мы видели в конце § 5, что всякая ковари- ационная матрица нормальной плотности положительно определена. Обратное тривиально в случае г=1. К большим г мы перейдем по индукции. Предположим, что матрица Q положительно опре- деленная. При х1 = 0, ..., хг_1 = 0 мы получаем q(x) = qrrx2r и, следовательно, qrr > 0. При этом предположении, как мы видели, q можно привести к виду (6.5). Выбирая хг так, что уг = 0, мы видим, что положительная определенность Q влечет q (х) > 0 при всех наборах х±, ..., хг_г. Поэтому по предположению индукции q соответствует нормальной плотности в пространстве г—1 из- мерений. Из (6.5) теперь очевидным образом следует, что q соот- ветствует нормальной плотности в пространстве г измерений, и этим завершается доказательство. Мы закончим эту общую теорию интерпретацией (6.5) в терми- нах условных плотностей, которая приводит к общим формули- ровкам теории регрессии, разобранной для двумерного случая в примере 2, а). Положим ДЛЯ краткости ак = — QkrlQrr^ так» что У г= Qrr С11Х1 . . . ar-iXr_i)> (6.11) Для вероятностной интерпретации коэффициентов ak мы вспомним, что Yr по построению не зависит от Xf, ..Хг_1. Иными словами, ak—такие числа, что Т = Хг—^Х,—... — ar_iXr__i (6.12) не зависит от (Хь ..Хг_1), и это свойство однозначно характери- зует коэффициенты ak. j Чтобы найти условную плотность Хг для данных Xf = xi9 . r?* мы должны разделить плотность (Хй . .Хг) на
106 Гл. III. Многомерные плотности. Нормальные плотности и процессы маргинальную плотность (Хх, . Х^). Ввиду (6.5) мы получим показательную функцию с показателем —^уУЯгг- Отсюда следует, что условная плотность Хг при данных Хх = х19 ..., Хг_± = хг_± есть нормальная плотность с математическим ожиданием .. ...+^ и дисперсией \lqrr. Соответственно Е(ХГ|.Х1, ..., (6.13) Таким образом, мы доказали следующее обобщение двумерной задачи регрессии, выражение которой было дано в (2.6). Теорема 5. Если (хй .... Хг) имеет нормальную плотность, то условная плотность Хг при данных (Хх, Хг_х) снова нор- мальна. Кроме того, условное математическое ожидание (6.13) есть единственная линейная функция от Хх, .. ./Xr_f, делаю- щая величину Т не зависящей от (хп .... хг_о. Условная дис- персия равна Var (?) = <?;/. Пример. Выборочное среднее значение и дисперсия. В статис- тике случайные величины г X = i(X1+...+Xr),^ = l£ (Xfc—X)2 (6.14) k = 1 называются выборочным средним значением и выборочной дис- персией для Х = (Хх, ..., Хг). Весьма любопытен лот факт, что если величины Хх, ..., Хг независимы и нормальны с E(Xfe) = 0, E(Xfc) = o2, то случайные величины X и о2 являются независи- мыми1). Доказательство демонстрирует применимость предыдущих ре- зультатов. Мы положим Nk = Xk—X при [k=l, ..., г—1, но Yr = X. Преобразование X в Y=(YX, Yr) линейно и невы- рождено. Поэтому Y имеет нормальную плотность. Далее E(Y^Yr) = 0 при &==!, ..., г — 1, и поэтому Yr не зависит от (Yx, ..., 4r~i)- Однако ra2 = Y*+ ... + Y2r_1 + (Yi+ ... + Y^O2 (6.15) зависит только от Yi......Y,_b и, таким образом, о2 действи- тельно не зависит от Yr = X. ► Нормальные распределения общего вида Из предыдущего следует, что если X = (Xf, ..., Хг) имеет нормальную плотность, то каждая ненулевая линейная комбина- ция Yi = a1X1+ •.. Ч-агХг также имеет нормальную плотность. » х) То, что этот факт характеризует нормальное распределение в было показано Гири и Лукачем,
§ 7. Стационарные нормальные процессы 107 То же самое верно для каждой пары (Yf, Y2) при условии, что не выполняется линейное соотношение типа cxY1 + c2Y2 = 0. В этом исключительном случае распределение вероятностей пары (Yn Y 2) сосредоточено на прямой с уравнением ^1у1 + ^2//2 = 0, и, следовательно, оно вырожденно, если его рассматривать как, двумерное распределение. Для многих целей желательно сохранить термин нормального распределения также и для вырожденных распределений, сосредоточенных на многообразиях низшей раз- мерности, скажем на какой-либо прямой. Простейшее общее определение выглядит следующим образом: распределение Y== = (YX, ..., Yp) является нормальным, если существует вектор Х = (Хх, ..Хг) с нормальной г-мерной плотностью, такой, что Y = а + ХЛ, где А — (постоянная), (гхр)-матрица и a = (alt.. .,ар). Если р > г, то распределение Y вырождено в р измерениях. При р^г это распределение невырождено тогда и только тогда, когда р форм, определяющих Nk, линейно независимы. § 7*). СТАЦИОНАРНЫЕ НОРМАЛЬНЫЕ ПРОЦЕССЫ Цель этого параграфа состоит отчасти в том, чтобы дать при- меры нормальных распределений, и отчасти в том, чтобы уста- новить некоторые соотношения, имеющие важное применение в теории дискретных случайных процессов и временных рядов. Они носят аналитический характер и легко отделимы от более глубо- кого стохастического анализа. Фактически мы будем иметь дело только с конечномерными нормальными плотностями, или, что' равносильно, с их ковариационными матрицами. Ссылки на слу- чайные величины существенны для вероятностной интуиции и как подготовка к применениям, но на данном этапе мы касаемся только их совместных распределений; случайные величины сами используются единственно как удобный способ описания всех маргинальных плотностей посредством указания соответствующих совокупностей (Ха1, ..., Xafe). Кроме того, ссылка на бесконеч- ную последовательность {Х^} влечет за собой лишь то, что число элементов в (Хх, ..., Хп) может быть взято сколько угодно большим. ! Мы будем фактически рассматривать бесконечную в обе сто- роны последовательность {..., Х_2, Х_х, ...}. Под этим мы просто подразумеваем, что для каждой конечной совокупности (Х^, ..., Хпг) задана нормальная плотность с очевидными уело-; виями согласованности. Последовательность называется стацио^ нарной, если эти распределения инвариантны относительно сдви-, гов во времени, т. е. если все строки вида (ХП1+и, •••, ХДг+т) с фиксированными (пъ пг) имеют одно и то же распределен *) Не используется в последующем. В частности § 8 может быть цро- читан независимо (см, также гл, XIX,8).
108 Гл. III. Многомерные плотности. Нормальные плотности и процессы ние, не зависящее от v. При г=1 отсюда следует, что матема- тические ожидания и дисперсии постоянны и, следовательно, можно предположить, не ограничивая общности, что Е(Хл) = 0. Совместные распределения полностью определяются через кова- риации pjk = Е (ХуХ^), а свойство стационарности требует, чтобы рд зависели только от разности |&—Поэтому мы положим ру .+п^=гп. Таким образом, r„ = E(XftXft+n) = E(Xft_„, Xft), (7.1) откуда rn — r_n. Мы будем иметь дело только с последователь- ностями чисел гп, которые могут служить ковариациями случай- ного процесса. Всюду в этом параграфе {ZJ изображает бесконечную в обе стороны последовательность взаимно независимых нормально рас- пределенных случайных величин, нормированных так, что E(Z„) = 0, E(Z*) = 1. (7.2) Будут описаны три метода построения стационарных последова- тельностей в терминах данной последовательности {Zn}. Эти ме- тоды постоянно используются в анализе временных рядов и мо- гут служить упражнением в стандартных рассуждениях. Пример, а) 'Обобщенные процессы скользящего среднего. При произвольных постоянных b0, Ь±, bN положим Xn = frozn + ^izn-i+ • • • + (7.3) В частном случае равных коэффициентов bk=\/(N +1) случайная величина Х„ является средним арифметическим того типа, кото- рое применяется в анализе временных рядов для «сглаживания данных» (т. е. для устранения локальных иррегулярностей). В общем случае (7.3) представляет собой линейный оператор, переводящий стационарную последовательность {Zn} в новую стационарную последовательность {Хп}. Такие операции модно называть «фильтрами». Последовательность {Xw} имеет ковариации rfc = r_ft = E(X„X„+ft) = S/?v&v+ft (fe>0), (7.4) V где сумма справа содержит ряды, имеющие лишь конечное число членов. Так как 2 | bvbv+k | by + b2v+k, то выражение (7.4) имеет смысл также и для бесконечных последовательностей, для которых 2^v<oo. Легко видеть, что предел последовательности ковариа- ционных матриц есть снова ковариационная матрица. Полагая М—>оо, мы заключаем, что для любой последовательности Ьо, Ь^ Ь2, ..., такой, что 2^<°°, числа rk, определенные в (7.4), могут служить ковариациями стационарного процесса {Xrt}4
§ 7. Стационарные нормальные процессы 109 Формально мы получаем для нового процесса Xn=5&ftZ„_fc. (7.5) /г=0 Можно без затруднений показать, что любой стационарный про- цесс с ковариациями (7.4) представим в такой форме, но выра- жение (7.5) включает бесконечно много членов, и мы не можем сделать это в настоящий момент (см. гл. XIX,8). б) Процесс авторегрессии. С тех пор как родился анализ вре- менных рядов, предлагались многие теоретические модели для объяснения эмпирических явлений, например, таких, как поведе- ние экономических временных рядов, солнечных пятен и наблю- денные (или воображаемые) периодичности. Наиболее распро- страненная модель предполагает, что величины Хп исследуемого процесса связаны с нашей последовательностью Z„ независимых нормальных величин (7.2) посредством уравнения авторегрессии вида a^n + ai^n-i+ • • • (7.6) Эта модель основывается на эмпирическом предположении, что значение величины Хп в момент п (цена, содержание или интен- сивность) зависит от ее прошлого развития и наложенного на него «случайного возмущения» Zn, которое не связано с прошлым. Как часто бывает, предположение о линейной зависимости упро- щает (или делает возможным) теоретический анализ. Более общие модели получаются, если положить N—>оо или выбрать в каче- стве Zn величины другого стационарного процесса. Если =7^= 0, то можно произвольным образом выбрать (Хо, ..., X^.J и затем последовательно вычислить XzV, Хд^,... и Х_п Х_§,.... В этом смысле (7.6) определяет некоторый про- цесс, но нас интересует, существует ли стационарное решение. Для ответа на этот вопрос мы перепишем (7.6) в форме, не включающей элементов, непосредственно, предшествующих ХЛ. Рассмотрим (7.6), заменяя п последовательно на п — 1, п—2, ... ..., п—v. Умножим эти равенства на Ь2, ..., bv соответст- венно и прибавим к (7.6). Величины Х^.^ ..., X„_v не появятся в новом уравнении в том и только в том случае, если bj та- ковы, что ао&1 + а1Ьо = О, ..., aQbv + a1bv_1+ ... 4-avbo = O, (7.7) где b0 = l. В конце концов приходим к выражению вида а^п — Ь<2п + ^^n-i + • • • + bvZn_v 4- Yn> v, (7.8) где Yn> v представляет собой линейную комбинацию Xrt_v_n ... ..., Xn.jv-v (с коэффициентами, которые нас не интересуют). (7.8) мы представим величину Хй как сумму случайных возму-
ПО Гл. III. Многомерные плотности. Нормальные плотности и процессы щений в моменты п, п—1, п—v и величины Yn> v, изо? бражающей влияние «прошлого» до момента п—v. При v—>оо это время становится «бесконечно далеким прошлым», и в боль- шинстве ситуаций оно не будет иметь влияния. При переходе к пределу мы (по крайней мере временно) предположим именно этот случай, т. е. мы разыскиваем процесс, удовлетворяющий предельному соотношению вида a0X„=S&ftZ„-ft- (7-9) k— о (Грубо говоря, мы предполагаем, что остаточные величины Yn> v стремятся к нулю. Другие возможные пределы изучены в сле- дующем примере.) Процессы вида (7.9) рассматривались в примере а), и мы ви- дели, что всякий раз, когда существует стационарное решение (если ряд расходится, то даже выражение для ковариа- ций теряет смысл). Для решения уравнений (7.7) относительно Ьк мы используем формальные производящие функции A(s) = 2^, B(s) = 2&^- (7-Ю) Уравнения (7.7) выполняются тогда и только тогда, когда A (s) В (s) = aobo. Так как А—полином, то В—рациональная функция. Поэтому мы можем использовать теорию разложения на простые дроби, развитую в 1, гл. XI,4. Если полином Д(з) имеет различные корни s^, мы получаем В (s) = -A_+.. .+-^- (7.11) v / Si —S ‘ 1 S V 1 и, следовательно, Ьп = + ... + Л^-1. (7.12) Очевидно, что 2^<°° тогда и только тогда, когда все корни удовлетворяют неравенству | s7-1 > 1. Легко проверить, что это остается справедливым также в случае кратных корней. Мы таким образом сейчас показали, что стационарное решение авторегрес- сионной модели (7.6) существует всегда, когда все корни полинома Л(£) лежат вне единичного круга. Ковариации нашего процесса задаются формулой (7.4), и «бесконечно далекое прошлое» не играет в процессе никакой роли. Полученное решение {Х„} уравнения авторегрессии (7.6) единственно. В самом деле, разность двух решений должна удов- летворять однородному уравнению (7.13), и теперь мы покажем, что условие | sf | > 1 исключает появление имеющего вероятност- ный смысл решения этого уравнения. в) Вырожденные процессы. Обратимся к стационарным после- довательностям {У„}, удовлетворяющим стохастическому раз-.
§ 7. Стационарные нормальные процессы 111 ностному уравнению м + n-i+ • • • +^Yn-jV=0. (7.13) Эти процессы интересны своей противоположностью процессам авторегрессии, определяемым уравнением (7.6). Типичными явля- ются примеры = к (Z1 cos /ио + Z-i sin neo), (7.14) + (7.15) где коэффициенты и величина <о постоянны, a Zx и Z_2 являются независимыми нормальными случайными величинами, нормирован- ными условиями (7.2). Эти процессы удовлетворяют уравнению (7.13), первый с а0 = а2=1 и at = —2 cos со, второй с а0= =—а2 = 1 и (7х = 0. Эти процессы вырождены в том смысле, что весь процесс полностью определяется двумя наблюдениями, ска- жем Ч и Чк. Эти два наблюдения можно взять как угодно далеко в прошлом, и в этом смысле процесс полностью опреде- ляется своим «бесконечно далеким прошлым». Аналогичные рас- суждения применимы к любому процессу, удовлетворяющему разностному уравнению вида (7.13), и, следовательно, эти про- цессы составляют противоположность примеру б), где «беско- нечно далекое прошлое» совсем не имеет влияния. ► Эти примеры объясняют тот широкий интерес, который про- является по отношению к стохастическому разностному уравнению (7.13). Прежде чем перейти к соответствующей теории, заметим, что любой процесс {Yw}, удовлетворяющий (7.13), удовлетворяет также различным разностным уравнениям более высокого порядка, например ^Y„ -f- (а1 $0) Yn_1 4“ • < • 4“ (^jv Y„_;v а^Чп-n-i* Для того чтобы придать задаче смысл, мы должны предположить, что (7.13) представляет собой разностное уравнение наинизшего порядка, которому удовлетворяет {Yw}. Это равносильно тому, что строка (Y:, ..., Y„) имеет невырожденное нормальное рас- пределение в N измерениях. Отсюда следует, чтоа04^0 и адг =#=(). Теперь можно показать, что теория стационарных решений разностного уравнения (7.13) тесно связана с «характеристиче- ским уравнением» ^ + а1^-14-...4-«л=0- (7.16) Каждому квадратному множителю полинома, стоящего слева, здесь соответствует стохастическое разностное уравнение второго по- рядка и вследствие этого процесс вида (7.14) или (7.15). В соот- ветствии с разложением на множители характеристического поли- нома мы представим, таким образом, общее решение уравнения (7.13) как сумму компонент вида (7.14) и (7.15).
112 Гл. III. Многомерные плотности. Нормальные плопшости, и процессы Как и раньше, мы предполагаем E(Y„) = 0. Вся теория строится на следующей лемме. Лемма 1. Стационарная последовательность с E(YnYn+f^ = rk удовлетворяет стохастическому разностному уравнению (7.13) в том и только том случае, когда a()rn + a1rn_1+...+aNrn_N = Q. (7.17) Доказательство. Умножив (7.13) на Yo и взяв математиче- ские ожидания, придем к (7.17). Возводя в квадрат левую часть равенства (7.13) и вновь вычисляя математические ожидания, получаем в результате 2#/(Х^Л-Д и поэтому из (7.17) сле- дует, что левая часть в (7.13) имеет нулевую дисперсию. Это доказывает лемму. Мы приступаем к выводу канонической формы для гп. Эти величины, конечно, действительны, но так как в формулу входят корни характеристического уравнения (7.16), мы должны при- бегнуть к временному использованию комплексных чисел. Лемма 2. Если {Y„} удовлетворяет уравнению (7.13), но не удовлетворяет никакому разностному уравнению низшего поряд- ка, то характеристическое уравнение (7.16) обладает N различ- ными корнями ..., %N, по модулю равными единице. В этом случае Гп—СЛ1 + • • • (7-18) где Cj > 0 при j = 1, ..., N. Доказательство. Предположим вначале, что характеристиче- ское уравнение (7.16) имеет N различных корней Найдем решение уравнения (7.17) методом частных решений, ко- торый применялся для подобных целей в первом томе. Проверка устанавливает, что (7.18) изображает формальное решение (7.17), зависящее or N свободных параметров ..., cN. Теперь гп полностью определяются N значениями гх, ..., rN. Поэтому для того, чтобы показать, что каждое решение (7.17) имеет вид (7.18), достаточно показать, что Cj могут быть выбраны так, что соот- ношения (7.18) приводят к предписанным значениям г19 ..., rN. Это означает, чтосу. должны удовлетворять N линейным уравне: ниям с матрицей А, элементами которой служат aJk^=^k (j, k=l, . N). Детерминант А не равен нулю1), и, следова- тельно, искомое решение существует. х) Этот детерминант обычно называется в честь Вандермонда. Чтобы показать, что детерминант не равен нулю, заменим £ некоторой свободной переменной х. Проверка показывает, что детерминант имеет при этом вид хР(х), где Р есть полином степени N — 1. Далее Р(х)=0 при x = g2, .потому что при этих значениях х два столбца детерминанта становятся одинаковыми. Поэтому детерминант не обращается в нуль ни при каком другом значении х, и в частности при x=£i.
§ Z. Стационарные нормальные процессы 113 Таким образом, мы установили, что (в случае различных кор- ней) гп действительно имеет вид (7.18). Теперь мы покажем, что фактически в (7.18) присутствуют только корни, равные по модулю единице. Мы знаем ,что Оу=/=0 и поэтому 0 не может быть корнем характеристического уравнения. Далее отметим, что ковариации гп ограничены общим значением г0 дисперсии Yп. Однако если не равны по модулю единице, го >оо при п—>оо или при п—>—оо. Отсюда следует, что при любом / либо |(= 1, либо же cf = 0. Предположим теперь, что и £2 представляют собой пару сопряженных корней и что ^=^0. Тогда равен по модулю единице и, следовательно, = В силу симметрии гп = г_п> поэтому с2 = с1. С другой стороны, ^1 + ^2 действительно, и по- этому значение сг должно быть действительным. Таким образом комплексные корни присутствуют в (7.18) в сопряженных парах с действительными коэффициентами, и если некоторый коэффи- циент Cj равен нулю, то гп будет удовлетворять разностному уравнению порядка меньшего, чем N. Таким образом, все корни равны по модулю единице, все Cj действительны и cf =^=0. Для того чтобы убедиться в том, что Cj положительны, рас- смотрим ковариационную матрицу R для случайных величин (Yn ..., NnY Элементами матрицы R являются и легко вывести из (7.18), что R = ACAT. (7.19) где С—диагональная матрица с элементами матрица А вве- дена выше, а матрица А сопряжена с А (т. е. получается из А заменой на ^f1). Далее, R является действительной и положи- тельно определенной матрицей и поэтому для любой комплексной TV-мерной ненулевой вектор-строки х = имеет место соот- ношение xRxr = uRur + vRvr > 0. (7.20) Полагая у = хА, получаем вместо (7.20) уСу?^ ^\У/\*>0. (7.21) Поскольку детерминант А не равен нулю, последнее неравенство выполняется для произвольного у и, таким образом, Cj > 0, как и утверждалось. Для завершения доказательства нам осталось показать, что характеристическое уравнение не имеет кратных корней. Предпо- ложим*, что ^ = ^2, а другие корни различны. Мы снова получим представление в форме (7.18) с той разницей, что член за- менится членом . Ограниченность гп снова с необходимостью приводит к тому* что q==0, Следовательно* в случае одного
114 Гл. III. Многомерные плотности. Нормальные плотности и процессы двойного корня мы получим представление вида (7.18) с числом отличных от нуля членов, меньшим N, а, как мы уже видели,, это невозможно. Те же аргументы применимы и в более общей ситуации и показывают, что кратные корни невозможны. Сформулируем теперь окончательный результат для случая,3 когда N—нечетное целое число. Изменения, необходимые для перехода к четному N, должны быть очевидны. Теорема. Предположим, что стационарная последовательность -{¥„} удовлетворяет разностному уравнению (7.13) с Ar = 2v+l,j но не удовлетворяет никакому разностному уравнению низшего порядка. Тогда характеристическое уравнение (7.16) обладает v парами комплексных корней = cos coy ± i sin coy (где со,- вещест- венны) и одним вещественным корнем <о0 = ± 1. Последователь- ность {Y„} имеет вид Y„ = XoZoco; + J Xy[Z .cosntoy + Z-ySinnco ], (7.22) /= i где Lf—взаимно независимые нормальные величины с нулевыми математическими ожиданиями и единичными дисперсиями, а*к}- — постоянные. Для этой последовательности гп = 2 X/ cos исоу. (7.23) Обратно, выберем произвольные действительные Kv=^=0 и со0= ±1. Пусть (±4, ...» <ov— различные действительные числа, такие, что О < соу < л. Тогда (7.22) определяет стационарный процесс с ко- вариациями (7.23), удовлетворяющий разностному уравнению порядка 2v-)-1 (ноне удовлетворяющий никакому разностному уравнению низшего порядка). Доказательство. Пусть Ху и (Оу и нормальные случайные вели- чины Zy удовлетворяют условиям теоремы. Определим величины Уп формулой (7.22). Простые вычисления показывают, что кова- риации гп величин {YJ задаются равенством (7.23). Существует алгебраическое уравнение с действительными коэффициентами вида (7.16) с корнями, описанными в теореме. Тогда ковариации удо- влетворяют разностному уравнению (7.17) и в силу леммы 1 отсюда следует, что Yn удовлетворяет стохастическому разностному урав- нению (7.13). По построению это есть разностное уравнение наи- низшего порядка, которому удовлетворяет Y„. Обратно, пусть {YJ обозначает решение данного разностного уравнения (7.13). Ковариации гп величин {YJ определяют числа Ху и (Оу, присутствующие в (7.22). Рассмотрим эти уравнения при п — О, 1, ..., 2v как линейное преобразование произвольной строки из нормальных величин (Z_v> Zv) в (Yo, YJ. Это преоб-,
§ 8. Марковские нормальные плотности 115 разование невырождено, и поэтому ковариационные матрицы для (Z_v, Zv) и (Yo, ..., YAr) определяют одна другую единст- венным образом. Мы только что показали, что если ковариацион- ная матрица величин Zy- сводима к единичной матрице, то вели- чины Yft имеют своими ковариациями гп. Поэтому обратное также справедливо, и тогда существуют нормальные величины Zy, удов- летворяющие условиям теоремы и такие, что (7.22) выполняется при п = 0, ..., N. Однако обе части каждого из этих уравнений представляют собой решения стохастического разностного урав- нения (7.13), и поскольку они совпадают при п = 0, М, то они с необходимостью тождественны. § 8. МАРКОВСКИЕ НОРМАЛЬНЫЕ ПЛОТНОСТИ Мы перейдем к обсуждению одного класса нормальных плот- ностей, встречающихся в марковских процессах. Не ограничивая общности, мы рассмотрим только плотности, центрированные в начале координат. Тогда E(XJ = 0, и мы используем обычные сокращения E(Xi) = al, E(X^)=W/fc. (8.1) Величины суть коэффициенты корреляции, и р^=1. •_ Определение. Нормальная r-мерная плотность (xf, хг) является марковской, если при г условная плотность Xk при данных- Xi, ..., X^-i тождественна с условной плотностью Xk при данной Грубо говоря, если мы знаем Х^_т («настоящее»), то дополни- тельное знание «прошлого» Xf, ..., Xk_2 не привносит никакой полезной информации относительно «будущего», т. е. относительно любой из величин Ху с j^k. Как обычно в подобных случаях, мы применяем термин «мар- ковский» и к последовательности (Xi, ...» Хг), и к ее плотности. Теорема 1. Для того чтобы последовательность (Хй .... Хг) была марковской, каждое из следующих двух условий является необходимым и достаточным*. (i) для k^r E(XJXi, .... Xft-I) = Е(Xft|Xfe.j); (8.2) (ii) для / v < & r Р/Л = РММ« (8-3) Для выполнения (8.3) достаточно, чтобы P/* = P/.»-iP*-i,ft. i<k. (8.4) Доказательство. Совпадение плотностей влечет равенство ма- тематических ожиданий, и поэтому необходимость (8.2) тривиальна.
116 Гл. IJ J. Многомерные плотности. Нормальные плотности и процессы С другой стороны, если (8.2) справедливо, то теорема 5 из § 6 показывает, что условная плотность Xfe при данных Хх, ..., Х^ зависит только от Х^_х, но не от предшествующих величин. Ус- ловная плотность Xft при данном Х^__х получается интегрирова- нием относительно величин Хх, ..., Х^_2, и, следовательно, две условные плотности совпадают. Таким образом, (8.2) необходимо и достаточно. Обращаясь снова к теореме 5 из § 6, заключаем, что величина T = Xft-E(Xft|Xft_1) (8.5) совпадает с величиной поскольку это есть единственная случайная величина вида Xk—cXk_ly не коррелированная с Х^. В силу той же теоремы равенство (8.2-) выполняется тогда и только тогда, когда вели- чина Т не коррелирована также с Хь Xft_2, т. е. тогда и только тогда, когда выполняется (8.4). Таким образом, (8.4) необ- ходимо и достаточно. Поскольку (8.4) есть частный случай (8.3), то последнее условие является достаточным. Оно также и необ- ходимо, так как повторное применение (8.4) показывает, что при j < v < k г Pj-k _ n. /Q 74 Pvk Pv,k-1 Pv.k-2 ” Pw P/V‘ ' ' Поэтому из (8.4) следует (8.3). ► Следствие. Если последовательность (Хх, ..., Хг) марковская, то каждая подпоследовательность ...,Xav) с < а2 <... ... <avг является марковской. Это очевидно, так как (8.3) автоматически распространяется на все подпоследовательности. ► Примеры, а) Независимые приращения. Говорят, что последова- тельность (конечная или бесконечная) <{Xft} нормальных случайных величин с E(Xft) = 0 образует процесс с независимыми прираще- ниями, если при /<£ приращение Xk—Xj не зависит от (Хх, ..., Ху). Отсюда следует, в частности, что Е(Ху(Х*—Ху)) = 0 или i<k' <8-8) Сравнивая это с (8.3), видим, что нормальный процесс с незави- симыми приращениями автоматически оказывается марковским. Его структура чрезвычайно проста: Хй есть сумма k взаимно не- зависимых нормальных величин хп х2-хь ..xft-x»_It
§ 8. Марковские нормальные плотности 117 б) Модели авторегрессии. Рассмотрим нормальную марковскую последовательность Хп Х2, ... с E(Xft) = 0. Существует единст- венная постоянная ak, такая, что Xft—не зависит от X^-i и, следовательно, от Хх, ..., Xft-1. Положим ^ = Var(X,-aftX^1) и, следовательно, Xi = X1Zj, /Л Q\ Xk = akXk^ + KkZk & = 2, 3, ... . Легко видеть, что определенные таким образом величины Zk не- зависимы и E(Zz?) = 0, E(Z|) = 1. (8.10) Верно и обратное. Если Zk нормальны и удовлетворяют (8.10), то (8.9) определяет последовательность {Хи[, и сама по себе струк- тура соотношений (8.9) показывает, что последовательность {XJ марковская. В качестве упражнения мы проверим это утвержде- ние вычислением. Умножим (8.9) на X, и возьмем математические ожидания. Так как Zk не зависит от Хх, ..., Xk_lt мы получаем при j < k Теперь (8.4) есть простое следствие (8.11), а мы знаем, что вы- полнение (8.4) влечет за собой марковский характер Xft. Таким образом, (Хх, ..., Хг) является марковской тогда и только тогда, когда выполняются соотношения вида (8.9), где Zj—независимые нормальные величины, удовлетворяющие (8.10). [Это есть част- ный случай примера 7, б).] < > До сих пор мы рассматривали только конечные последователь- ности (Хх, ..., Хг), но число г не играет никакой роли, и мы можем также говорить о бесконечных последовательностях {Xw[. Это не затрагивает пространств бесконечных последовательностей или какую-либо новую теорию, это просто указание на то, что распределение для (Хх, ..., Хг) определяется при всех г, Анало-, гично мы говорим о марковском семействе {Х(/)[, когда любая конечная совокупность Х1==Х(/1), ..., Xr = X(tr) является мар- ковской. Ее описание зависит от функций . Е (X2 (/)) = о2 (0, Е (X (s) X (0) = a(s) а(0 р (s, t). (8.12) В. силу критерия (8.3) очевидно, что семейство является маркое- ским тогда и только тогда, когда при s <t p(s, T) = p(s, т). (8.13)
118 Гл. 111. Многомерные плотности. Нормальные плотности и процессы Терминология не должна затемнять то, что фактически мы будем иметь дело только с семействами конечномерных нормальных рас- пределений с ковариациями, которые удовлетворяют (8.13). Как обстоятельно объяснялось в начале § 7, последователь- ность {Хи} называют стационарной, если для каждого фиксиро- ванного набора ах, ..., ап распределение (Xai+V, ..., Xa„+V) не зависит от V. Конечный отрезок такой последовательности может быть продолжен в обе стороны, и, следовательно, естественно рассматривать только бесконечные в обе стороны последователь- ности {..., Х_2, Х_п Хо, Хх...}. Эти понятия тривиальным об- разом переносятся на семейства {Х(/)}. Для стационарной последовательности {ХД дисперсия о* не зависит от п и в марковском случае (8.3) влечет равенство p//r = p^-/i. Таким образом, для стационарной марковской после- довательности Е(Х7Х*>о2р1*-Л (8.И) где о2 и р—постоянные, |р| < 1. Обратно, последовательность с нормальными распределениями, удовлетворяющая (8.14), яв- ляется марковской и стационарной. В случае стационарного семейства {Х(/)} корреляция р (s, t) зависит только от разности \ t—s| и (8.13) приобретает вид р(Ор(т)==р(^+т) Аля т> 0. Очевидно, из равенства р(т) = 0 должно следовать р(/) = 0 при всех t > т и также р (у т) =0. Поэтому р не может иметь нулей, за исключением случая р(/) = 0 при всех t > 0. Следовательно, р(/) = е~л/ (здесь используется результат из 1, гл. XVII, 6). Соот- ветственно для стационарного марковского семейства Е (X (s) X (s + 0) = ог2е-л/, t > 0, (8.15) за исключением случая, когда X(s) и Х(/) не коррелированы при всех s^= t. Пример, в) Стационарные последовательности могут быть по- строены по схеме последнего примера. Вследствие (8.11) мы должны иметь X^pX^+aKl-p8^. (8.16) При каждом k можно выразить Xft как .линейную комбинацию Zfe, Zk_ly ..Zk-v и Xk-v-i- Формальный переход к пределу при- водит к представлению (8.17) /=0 т. е. к представлению {XJ через бесконечную в обе стороны по- следовательность независимых нормальных величин Z7, нормиро-
g 8. Марковские нормальные плотности 119 ванных условием (8.10). Так как |р| < 1, то правдоподобно, что ряд сходится, однако формула по существу связана с простран- ством бесконечных последовательностей. [См. замечания, касаю- щиеся формулы (7.5), частным случаем которой является (8.17).] ► Полезно, быть может, обсудить связь теоремы 1 с непосред- ственным описанием марковских последовательностей в терминах плотностей. Обозначим через g{ плотность Xz и через gik (х, у) — значение в точке у условной плотности при условии Xz = %. (В теории случайных процессов, gik называется переходной плот- ностью от Xz к Xfc.) Для нормальных марковских последователь- ностей gt представляет собой нормальную плотность с нулевым математическим ожиданием и дисперсией о?. Что касается услов- ных вероятностей, то в примере 2, а) было показано, что 1 / У—°1 rPik°kX 1—pzfe \ /1 —ptk gik (*. У)— (8.18) где и обозначает стандартную нормальную плотность. Мы не будем, однако, использовать этот результат и проведем анализ свойств gik независимым способом. Как обычно, мы интерпрети- руем индексы как временные параметры. Совместная плотность (Xz, Ху) задается как g{ (х) gif (х, у). Совместная плотность (Xz, Ху, XJ равна произведению предыду- щей плотности на условную плотность Xk при данных Ху и Xz, но ввиду марковского характера индекс i может быть опущен, если i < j < &, и плотность (Xz, Ху, Xk) становится равной gi (х) gif (х, у) g]k (у, г). (8.19) В. марковском случае плотность каждой строки (Ха1, Ха„) задается произведением вида (8.19), однако плотности gik не могут быть выбраны произвольно. В самом деле, интегрирование (8.19) относительно у дает маргинальную плотность для (Xz, Xft). Поэтому мы получаем условие согласованности + со gik(x, z)= J gij(x, y)gjk(y, z)dy — 00 (8.20) при всех i < j < k. Это есть частный случай уравнения Колмого- рова— Чепмена для марковских процессов1). Говоря очень при- близительно, это уравнение означает, что переход из х в момент i в z в момент k происходит через все промежуточные состояния yt причем переход от у к z не зависит от прошлого. Очевидно, что при любой системе переходных вероятностей gik, удовлетворяю- щих уравнению Колмогорова—Чепмена, схема умножения (8.19) *) Другие частные случаи встречались в 1, гл. XV, (13.3), и гл. XVII, (9.1). Заметим, что формула (8.19) представляет собой аналог определения (1.1) в 1, гл. XV, вероятностей для марковских цепей, за исключением того, что здесь суммирование заменено интегрированием и что были рассмотрены только стационарные переходные вероятности»
120 Гл. III. Многомерные плотности. Нормальные плотности и проц>ссы приводит к согласованной системе плотностей для (Хх, Х2, ..., Хг), и эта последовательность является марковской. Таким образом, мы пришли к следующему аналитическому дополнению теоремы 1. Теорема 2. Плотности семейства {gz-J тогда и только тогда могут служить переходными плотностями в нормальном марков- ском процессе, когда они удовлетворяют уравнению Колмогорова — Чепмена и когда gik (х, у) при каждом фиксированном х является нормальной плотностью относительно у. Обе теоремы содержат необходимые и достаточные условия, и поэтому они в некотором смысле эквивалентны. Тем не менее они имеют различную природу. Вторая из них на самом деле не ограничивается нормальными процессами; примененная к семей- ствам {Х(/)[, она приводит к дифференциальным и интегральным уравнениям для переходных вероятностей и на этом пути способ- ствует введению новых классов марковских процессов. С другой стороны, из теоремы 2 трудно угадать, что gik необходимо имеет вид (8.18)—результат, содержащийся в более специальной тео- реме 1. Для последующих ссылок и сравнений мы приводим здесь два наиболее важных марковских семейства {Х(/)}. Примеры, г) Броуновское движение или процесс Винера — Ба- шелье. Процесс определяется тем условием, что Х(0) = 0 и что при / >s величина Х(/) — X(s) не зависит от X(s) и имеет дис- персию, зависящую только от t—s. Иными словами, процесс имеет независимые приращения [пример а)] и стационарные пере- ходные вероятности [но он не стационарный, поскольку X (0) = 0]. Очевидно, что Е (X2 (/)) = о2/ и Е (X (s) X (/)) = cr2s при s<t. При т > t переходные плотности, характеризующие переход из (t, х) в (т, у), нормальны с математическим ожиданием х и дисперсией о2(т—t). Они зависят только от (у—х)/(т—t), и уравнения Кол- могорова—Чепмена сводятся к свертке. д) Процесс Орнстейна—Уленбека. Под этим понимается наи- более общий нормальный стационарный марковский процесс с ну- левыми математическими ожиданиями. Его ковариации опреде- ляются формулой (8.15). Иными словами, при т>£ переходные плотности, характеризующие переход из (/, х) в (т, у), нормальны с математическим ожиданием е-^-^х и дисперсией а2(1 — При т—>оо математическое ожидание стремится к нулю, а дис- персия к о2. Этот процесс был рассмотрен Орнстейном и Улен- беком с совершенно другой точки зрения. Его связь с диффу- зией будет обсуждена в гл. Х,4. ► § 9. ЗАДАЧИ 1. Рассмотрим Q—область на плоскости (площадью %), ограниченную четырехугольником с вершинами (0, 0), (1, 1), (0, У2), (%, 1) и треугольнич- ком с вершинами (У2, 0), (1, 0), (1, У2). (Единичный квадрат представляете^
§ 9. Задачи 121 объединением Q и области, симметричной Q относительно биссектрисы.) Пусть пара (X, Y) распределена равномерно на Q. Докажите, что частные распре- деления являются равномерными и что X-|-Y имеет такую же плотность, как если бы X и Y были независимыми1). Указание. Рисунок делает вычисления излишними. 2. Плотности с маргинальными нормальными плотностями. Пусть и — нечетная непрерывная функция на прямой, равная нулю вне интервала —1, 1. Если |ц| < (2ле)~1у/2, то выражение nWn(t/) + «(x)«(i/) изображает двумерную плотность, которая не является нормальной, но мар- гинальные плотности которой нормальны (Э. Нелсон). 3. Второй пример. Пусть фх и ф2—Две двумерные нормальные плотности с единичными дисперсиями, но с различными коэффициентами корреляции. Смесь -|"(ф1+ф2) не является нормальной плотностью, но две ее маргиналь- ные плотности совпадают с п. Замечание. В последующем все случайные величины рассматриваются в Векторные величины обозначаются парами (Хх, Х2) и т. д. 4. Пусть Хх, ...» Хп — независимые случайные величины с одинаковой плотностью f и функцией распределения F. Если X и Y являются соответст- венно наименьшей и наибольшей из них, то совместная плотность пары (X, Y) равна п (n-1) f (х) f (у) [F (y) — F (х)]”-2, у > х. 5. Покажите, что симметричное распределение Коши в 5J3 [определенное в (1.21)] соответствует случайному вектору, длина которого распределена с плотностью v (г) = 4л~1 г2 (14-г2)“2 при г > 0. Указание. Используйте полярные координаты и либо (1.15), либо же об- щее соотношение (10.4) гл. I для проекций. 6. Для распределения Коши (1.21) условная плотность Х3 при данных Хх, Х2 равна v. » (г) =2. . 0 + £1 + Вг)3 л (1 + ^ + ^+г2)2 ’ а двумерная условная плотность Х2, Х3 при условии, что Хх = ^1 равна V (и Ч-1 !+^2 ’(У' ’ л О+^+^+г2)2’ 7. Пусть 0 < а < 1 и f (х, #) = [(1-|-ах) (1 +«у)— а] е~х~У~ахУ ПрИ х > 0, у > 0 и f (х, у) = 0 в других случаях. а) Докажите, что f есть плотность пары (X, Y). Найдите маргинальные плотности и функцию распределения. б) Найдите условную плотность их (у) и Е (Y | X), Var (Y | X). 8. Пусть f—плотность, сосредоточенная на 0, оо. Положим и (х, у) = ==/ (*+у)1(х+у) пРи х > 0, у > 0 и и (х, у)=0 в других случаях. Докажите, что и есть плотность в ^i2, и найдите ее ковариационную матрицу. ____9. Пусть Хх, Х2, Х3 взаимно независимы и равномерно распределены на 0, 1. Пусть Х(х), Х(2>, Х(3) — соответствующие порядковые статистики. Найдите плотность пары Х(2)\ \Х(2) ’ Х(3)/ х) Иными словами, распределение суммы может быть задано сверткой, даже если величины зависимы. Этот интуитивно понятный пример предложен Гв Роббинсом, Другой парадокс такого же типа см, в гл, II, 4,д),
122 Гл. HI. Многомерные плбШбШй. НорМШьныё плбШРбсти и процессы и покажите, что эти два отношения независимы. Обобщите на п измерений. 10. Пусть Xf, Х2, Х3 независимы и одинаково показательно распределены. Найдите плотность (Х2—Xf, Х3 — Хх). 11. Частица единичной массы расщепляется на два осколка с массами X и 1 — X. Плотность f случайной величины X сосредоточена на 0, 1, и по со- ображениям симметрии f (%) — f (1—х). Обозначим наименьший осколок через Хх, а наибольший осколок через Х2. Предположим, что эти два осколка незави- симо друг от друга расщепляются таким же образом и дают в результате четыре осколка с массами Ххх, Х12, X2f, Х22. Найдите (а) плотность Хп, (б) совместную плотность Ххх и Х22. Используйте (б) для проверки (а). 12. Пусть Xi, Х2, ... независимы и имеют одну и ту же нормальную плотность п. Обозначим Sfe = Xi+...+ Х£. При т<п найдите совместную плотность (SOT, S„) и условную плотность для при условии, 4TOSW=/. 13. В предыдущей задаче найдите условную плотность Xx+.., + Xz2n при данном значении Хх+... + Хп. 14. Пусть (X, Y) имеет двумерную нормальную плотность, центрирован- ную в начале координат, с Е (Х2) = Е (Y2) = 1 и Е (XY) = p. При переходе к полярным координатам (X, Y) превращается в (R, Ф), где R2 = X2-|-Y2. До- кажите, что Ф имеет плотность, равную 2л (1 —2р sin ф cos ср) т и распределена равномерно тогда и только тогда, когда р = 0. Выведите, что P{XY > 0} = -i—|-л"1 arcsin р и P{XY < 0} = л-1 arccos р. 15. Пусть f—равномерная плотность в треугольнике с вершинами (0, 0), (0, 1), (1,0) и g—равномерная плотность в симметричном треугольнике в третьем квадранте. Найдите f*f и f^g. Предостережение. Требуется утомительное раздельное рассмотрение от- дельных интервалов. 16. Пусть f—равномерное распределение в единичном круге. Найдите f*f в полярных координатах. 17. Пусть и и v—плотности в 312 вида «(х, у) =f tfx2+y2), V (х, у) = g (Vx2-\-y2'). Найдите u^v в полярных координатах. 18. Пусть X = (Xi, ..., Хг) имеет r-мерную нормальную плотность. Су- ществует такой единичный вектор a = (ai, ..., аг), что Var (ахХх + ... -|-arXr) Var (cxXx + ... -\-crXr) для всех единичных векторов с = (сх, . сг). Если а=(1, 0, 0) — такой вектор, то Xf не зависит от остальных величин Ху. 19. Докажите теорему. Теорема. Пусть дана нормальная плотность в . Тогда оси координат могут быть повернуты таким образом, что новые координатные величины будут взаимно независимыми нормальными величинами. Иными словами, в теореме 2 из § 6 в качестве матрицы С может быть взята матрица вращения. Указание. Пусть Y = XC и матрица С выбрана так, что Yr = axXx+,.s+arXr, где a=(at, »*., аг) есть вектор из задачи 18. Остальное несложно. 20, Найдите общий нормальный стационарный процесс удовлетворяющий.
§ 9. Задачи 123 соотношениям: а) Хп+2 + Х„ = 0; б) Хп+2 —Хй = 0; В) ^72+3 ^П+2"Ь^72 + 1 Х„---О* 21. Сервостохастический процесс (Г. Д. Миллс). Сервомеханизм подвергается случайным толчкам, но в любое время могут быть введены поправки. Таким образом, ошибка Y72 в момент п имеет (в подходящих единицах) вид Yn+1 = = Y„+C„4-Xn+i, где Сй— поправка, а Хй— независимые нормально распре- деленные величины с Е(ХП)=О, Е(ХЙ) = 1. Величины Сй в принципе явля- ются произвольными функциями прошлых наблюдений, т. е. Y# и Х^ при k^n. Желательно выбрать их так, чтобы минимизировать дисперсию Var(Yn), которая представляет собой меру того, сколь хорошо работает механизм, и дисперсию Var(CJ, которая указывает, сколь тяжелы условия его работы. а) Рассмотрите ковариационную функцию {Yw} и покажите, что Var(Yn) 1. б) В предположении, что Var (Сй)—> a2, Var (Y„)—>о2 (тенденция к стационарности), покажите, что о > -|- (афсг1). в) Рассмотрите, в частности, линейную схему Сп = а—р (Yn—b), 0<р^1. Найдите ковариационную функцию и представление вида (7.8) для Yn. 22. Продолжение. Если существует запаздывание во времени в поступлении информации или корректировке, то модель остается, по существу, той же са- мой, за исключением того, что Сй следует заменить на Обсудите эту ситуацию.
ГЛАВА IV ВЕРОЯТНОСТНЫЕ МЕРЫ И ПРОСТРАНСТВА Как уже говорилось во введении, технический аппарат теории меры используется в этой книге лишь в небольшой степени, и для понимания большей ее части настоящая глава не нужна1). Тем не менее желательно дать краткий обзор важнейших понятий, обра- зующих теоретический фундамент книги, а также привести основ- ные теоремы для удобства ссылок. Лежащие в основе идеи и факты нетрудны, однако доказательства в теории меры включают в себя нагромождение технических деталей. Для начинающего и неспециа- листа подступ затрудняется многогранностью теории меры, а так- же разнообразием ее применений. Существуют превосходно напи- санные вводные курсы, однако материал в них в силу необходи- мости дается в слишком общей форме, и, кроме того, в них изла- гаются различные аспекты теории меры, не являющиеся существенными для настоящей книги. Даваемый ниже обзор содержит главным образом лишь то, что нужно для дальнейшего; многие доказатель- ства и технические детали опускаются2). (Следует отметить, что простота теории обманчива: значительно более трудные задачи тео- рии меры возникают в связи со случайными процессами, завися- щими от непрерывного временного параметра. Изложение условных математических ожиданий откладывается до гл. V, 10, 11; теорема Радона—Никодима содержится в гл. V, 3.) Формулы, относящиеся к евклидовым пространствам <йг, не за- висят от числа измерений, и х в них нужно понимать как сокра- щенную запись для (хх, ..., хг). х) Это относится к читателям, знакомым с основами теории меры, а также к тем читателям, которые интересуются главным образом результатами и фак- тами. Для удобства последних определение интеграла повторяется в гл. V, 1. За пределами этого материала они могут полагаться на свою интуицию, по- скольку, по существу, теория меры дает обоснование простым формальным действиям. 2) Бэровские функции и интегрирование по Лебегу — Стильтьесу превос- ходно изложены в книге Макшейна и Боттса, Е. J. McShane and Т. A Botts Real analysis, D. Van Nostrand, Princeton, 1959. Результаты общей теории меры широко используются в изложении Халмоша, см.: Халмош П. Р., Тео- рия меры, ИЛ, М., 1953, и Бурбаки, см.: N. Bourbaki, Elements de mathe- matiques [Livre VI, chapitres 3—5], Herman, Paris, 1952, 1956. Изложение общей теории меры с целью применения в теории вероятностей содержится в книгах Дуба, Крикеберга, Лоэва, Невё, Анникяна и Тортра. См. также Пар- тасарати К. Введение в теорию вероятностей и теорию мерьц—M»j Мир, 1983,
§ 1. Бэровские функции 125 § 1. БЭРОВСКИЕ ФУНКЦИИ Нам нужно указать класс множеств, для которых определены вероятности, а также класс функций, являющихся случайными величинами. Эти две задачи связаны между собой, и, более того, их изложение объединяется применением современных обозначений. Введем сначала эти обозначения и напомним определение сходимости в терминах монотонных пределов. Индикатором1') множества А называется функция, равная единице во всех точках А и равная нулю во всех точках множе- ства А', дополнительного к А. Индикатор А обозначается 1Л, так что 1А (х) = 1 при х£ А и 1 л (х) = 0 в противном случае. Каждому множеству отвечает его индикатор, и каждая функция, принимаю- щая лишь значения 0 и 1, является индикатором некоторого мно- жества. Если f—произвольная функция, то произведение \Af есть функция, равная / на А и нулю в остальных точках. Рассмотрим теперь пересечение С = АпВ двух множеств. Его индикатор 1С равен нулю, когда либо 1Л, либо 1а обращается в нуль, так что lc = inf (1Л, 1я), т. е. значение 1с равно наимень- шему из значений 1Л, 1В. Этот параллелизм отражается в обозна- чении f A g, которое используется вместо inf (/, g) для функции, равной в каждой точке х наименьшему из значений f (х) и g (x). Аналогично f U g=sup(/, g) обозначает наибольшее из двух значений2). Операторы Пии применимы к любому множеству функций. Обычно пользуются сокращенными обозначениями п п fxO...n/„= n fk, Au ...U/n=U fk. (1.1) k=l 6=1 По определению в каждой точке х эти функции равны соответст- венно минимуму и максимуму среди п значений /Х(х), • Если fk есть индикатор множества А*, то функции (1.1) являются индикаторами соответственно пересечения Ах А ..• А Ап и объедине- ния Ах и ... U Ап. Рассмотрим теперь бесконечную последовательность {/„}. Функ- ции, определяемые формулой (1.1), монотонны по п, так что пре- до до делы П fk и U/д, вполне определены, хотя, возможно, и беско- k=i k=i нечны. Для фиксированного / функция (1-2) . k-i х) Этот термин был введен Лоэвом. Более старый термин «характеристи- ческая функция» неудачен в теории вероятностей, поскольку его принято от- носить к другому объекту. 2) Многие авторы предпочитают символы А и V для функций, оставляя символы Пии для множеств. В нашем изложении двойные обозначения не дают никаких преимуществ,
126 Гл. IV. Вероятностные меры и пространства есть предел монотонной последовательности функций fj А ... А/у+д; сама последовательность {ауД тоже монотонна, именно wn = w1u ... со ... и wn. В наших обозначениях wn —> U wk. По определению wn(x) 1г=1 есть нижняя грань (инфимум) числовой последовательности fn (%), /и+1(%)» • • • • Следовательно, предел последовательности wn совпадает с нижним пределом lim inf так что lira inf f„= U n fk. (1-3) /=1 k=j При таком подходе нижний предел lim inf получается двумя по- следовательными переходами к пределу в монотонных последова- тельностях. Аналогичное справедливо и для верхнего предела lim sup fn, равенство (1.3) сохранится, если в левой его части lim inf заменить на lim sup, а в правой части значки А и и по- менять местами. Все сказанное переносится на множества. Так, например, по определению А = Нт Ап тогда и только тогда, когда 1л = Нт Un. Это означает, что последовательность множеств сходится к множеству А тогда и только тогда, когда каждая точка А при- надлежит всем Ап, за исключением не более чем конечного числа, и каждая точка дополнения А' принадлежит не более чем конеч- ному числу множеств А'п. Пример, а) Множество {Ап б. ч.}1). В качестве важного с ве- роятностной точки зрения примера предельных операций над мно- жествами рассмотрим событие Л, состоящее в «реализации беско- нечного числа событий из данной последовательности событий ЛП Л2, ...». [Частные случаи были рассмотрены в 1; гл. VIII, 3 (леммы Бореля—Кантелли), и в 1; гл. XIII (рекуррентные собы- тия).] На более формальном языке это означает, что точка х при- надлежит множеству А тогда и только тогда, когда она принад- лежит бесконечному числу множеств последовательности Поскольку индикаторы могут принимать лишь два значения 0 и 1, то данноб определение равносильно следующему: 1Л = lim sup 1дп. В обычных обозначениях это записывается как A=limsup Л„, однако обозначение {Ллб.ч.} (читается Ап «бесконечно часто») более при- ятно и наглядно. Оно было введено Чжуном и теперь общепринято в вероятностной литературе. ► х) В подлиннике «Ап i. о» (infinitely often).— Прим, перев. *) В принципе мы интересуемся лишь конечнозначными функциями, од- нако иногда удобно допустить также в качестве возможных значений ± оо. На- пример, простая теорема, утверждающая сходимость всякой монотонной последо- вательности, неверна для конечнозначных функций, а без нее многие формули- ровки становятся тяжеловесными. По этой причине мы следуем обычному соглашению^ по которому все функции прщу^упот. значения из расширенной
§ 1. Бэровские функции 127 Наша следующая задача—ограничить класс функций1) на с которыми мы предполагаем иметь дело. Понятие произвольной функции слишком общо, чтобы быть полезным для наших целей. Более подходящим является модернизированный вариант эйлеро- вого определения функции. Если считать, что непрерывные функ- ции заданы, то единственный эффективный способ конструирования новых функций состоит в предельных переходах. Оказывается, все наши потребности будут удовлетворены, если мы будем знать, как обращаться с функциями, являющимися пределами последователь- ностей {fn\ непрерывных функций или пределами последователь- ностей, в которых каждая fn является таким пределом и т. д. Иными словами, нам интересен класс 23 функций, обладающий следующими свойствами: 1) каждая непрерывная функция принад- лежит 23 и 2) если функции Д, /2, ... принадлежат 23 и предел f (%) = lim fn (%) существует при всех %, то f тоже принадлежит 23. Такой класс называется замкнутым относительно поточечных пре- делов. Ясно, что такие классы существуют, например класс всех функций. Пересечение всех таких классов является замкнутым се- мейством и образует, очевидно, наименьший такой класс. Разумно ограничить наши рассмотрения этим наименьшим классом. Наименьший замкнутый класс функций, содержащий все не- прерывные функции, называется классом Бэра и будет обозначаться 23. Функции из 23 называются бэровскими функциями2). Понятие бэровской функции будет использоваться не только по отношению к функциям, заданным на всем пространстве, но и по отношению к функциям, определенным лишь на некотором подмножестве (например, Ух и logx в случае пространства 541). Из данного определения ясно, что сумма и произведение двух бэровских функций тоже являются бэровскими функциями. Более того, если до—непрерывная функция от г переменных и /х, . .. , fr — бэровские функции, то функция w (/х, ..., fr) тоже бэровекая. Заменяя w на wn и переходя к пределу, можно показать, что вообще всякая бэровекая функция от бэровских функций есть бэровекая функция. Фиксация значений одной или нескольких переменных приводит опять к бэровской функции и т. д. Короче говоря, никакая из обычных операций над бэровскими функциями не выходит за пределы класса 23, и, следовательно, класс 23 пред- ставляет собой естественный объект для изучения. Оказывается^ что никакого упрощения не достигается^ если ограничиться мень- шими классами. вещественной прямой, т. е. их значения суть числа или ±оо. На практике значения ±оо не будут играть роли. Чтобы сумма и произведение двух функций были определены, вводят следующие соглашения: оо + оо = оо, со — оо = 0, оо«оо = оо, 0- оо = 0 и т. д. 2) Это определение основано лишь на понятии непрерывности и не зави- сит от других свойств евклидовых пространств. Его, следовательно, можно перенести на любое топологическое пространство.
128 Гл. IV. Вероятностные меры и пространства § 2. ФУНКЦИИ ИНТЕРВАЛОВ И ИНТЕГРАЛЫ В Интервалом мы будем называть множество точек, удовлетво- ряющих двойному неравенству одного из следующих четырех типов (попутно вводятся очевидные обозначения): ____ —। а, Ь: а х <_Ь а, Ь: I---1 I- а, Ь: а^х^Ь а,Ь: а^х<Ь. В одномерном случае выписанные неравенства исчерпывают все возможные интервалы, включая вырожденный интервал нулевой длины. В двумерном случае эти неравенства понимаются в поко- ординатном смысле, и интервалы представляют собой (возможно,3 вырожденные) прямоугольники со сторонами, параллельными осям координат. При числе измерений, большем или равном двум,; возможны и другие типы интервалов, однако мы их исключаем из рассмотрения. Допускается предельный случай, когда одна или более координат а или b равны ±оо. В частности, все простран- ство есть интервал —оо, оо. Функция точек f сопоставляет значения f (х) отдельным точ- кам. Функция множеств F сопоставляет значения отдельным мно- жествам или областям пространства. Объем в <й3, площадь в <й2 или длина в «%1 являются типичными примерами функций мно- жеств. Помимо этих есть много других функций множеств, и среди них вероятности представляют собой наиболее интересный для нас частный случай. Мы будем интересоваться лишь функциями множеств, обладающими следующим свойством: если множество А разбито на две части и Л2, то Г{Л} = /7{Л1} + /7{Л2}. Такие функции называются аддитивными1). Как мы видели, вероятности F {/} часто определены для всех интервалов r-мерного пространства 91\ и их желательно до- определить на более общих множествах. Та же самая задача воз- никает в элементарном анализе, где площадь первоначально опре- делена только для прямоугольников, и желательно определить ее для общей области А. Простейший подход состоит в том, что сначала определяется интеграл от функции двух переменных и затем «площадь А» приравнивается к интегралу от индикатора 1л (т. е. к функции, равной 1 на Л и обращающейся в нуль вне Л). Аналогично мы определим интеграл Е(и) = $ u(x)F{dx\ (2.1) !) Вот несколько примеров аддитивных функций из практики: масса и коли- чество тепла в области, цена земли, площадь под пшеницей и число жителей в географическом районе, ежегодная добыча угля, расстояние, которое проле- тел пассажир, или число израсходованных киловатт-часов в течение некото- рого периода., число телефонных вызовов и т. д,
§ 2. Функции интервалов и интегралы в Slr 129 от функции точек и по отношению к функции интервалов F. Вероятность А определяется затем как Е(1Л). При построении интеграла (2.1) неважно, как интерпретируется функция F, и мы, по существу, дадим общее понятие интеграла Лебега—Стильтьеса. Приступим теперь к аккуратному выполнению намеченной про- граммы. Пусть F—функция, сопоставляющая каждому интервалу / конечное значение F {/}. Такая функция называется (конечно) аддитивной, если для каждого разбиения интервала I на конеч- ное число непересекающихся интервалов 1п = (2.2) Примеры, а) Распределения в 311. В первом томе мы рассмат- ривали дискретные вероятностные распределения, сопоставляю- щие вероятности pt, р2, ... точкам аь а2, ... . Здесь F {/} есть сумма масс рп во всех точках ап, содержащихся в I, и Е (и) = = S «(«„) Рп- б) Если G—какая-либо непрерывная монотонная функция, возрастающая от 0 на —оо до 1 на оо, то можно положить F{aTb} = G(b) —G(a). в) Случайные векторы в М2. Вектор единичной длины выходит из начала координат в случайном направлении. Вероятность того, что его конечная точка лежит в двумерном интервале I, пропор- циональна длине дуги, по которой I пересекается с единичной окружностью. Определяемое здесь непрерывное распределение вероятностей не имеет плотности. Оно сингулярно в том смысле, что вся вероятность сосредоточена на окружности. Можно думать, что такие распределения искусственны и что в рассматриваемом случае скорее окружность, а не плоскость должна быть естест- венным выборочным пространством. Это возражение неоснова- тельно, поскольку сумма двух таких независимых случайных век- торов может принять любое значение между 0 и 2, и имеет положительную плотность в круге радиуса 2 (см. V, пример 4, д)). Следовательно, в некоторых задачах, связанных с единичными случайными векторами, плоскость является естественным выбороч- ным пространством. Во всяком случае, нашей целью было только показать на простом примере, что может происходить в более сложных ситуациях. г) В заключение приведем пример, иллюстрирующий одно обстоятельство, которое будет исключено в дальнейшем. В про- странстве положим F{I} = 0 для любого интервала I = b с &<оо и F{/}==1, когда 1~а, оо. Так определенная функция интервалов, будучи аддитивной, является патологической в том смысле, что она не удовлетворяет естественному требованию не- прерывности, согласно которому F {а, Ь\ должно стремиться к F {а, оо} при Ь —>оо4 > S Ns 24Э
130 Гл. IV. Вероятностные меры и пространства Последний пример показывает, что желательно усилить требо- вание (2.2) конечной аддитивности. Мы скажем, что функция ин- тервалов F счетно- или ^-аддитивна* если для каждого разбиения интервала I на счетное число интервалов /х, /2, ... (2.3) «Счетное число» обозначает либо конечное число, либо бесконеч- ное счетное число. Термины «вполне аддитивная» и «счетно-адди- тивная» означают одно и то же. Условие (2.3) явно нарушено в последнем примере. В дальнейшем мы будем рассматривать только счетно-аддитив- ные функции множеств. Это ограничение, с одной стороны, позво- ляет успешно развить теорию, а с другой—может быть оправдано a priori на эвристической и прагматической основе. В самом деле, если Ап^1г и ... U 1п есть объединение первых п интервалов, то Ап—>/. Можно считать, что «при достаточно большом/i Ап пра- ктически неотличимо от /». Если значения функции F могут быть найдены ив экспериментов, то должно быть «практически неотличимо» от F {I}* т. е. F должно стремиться к F {Z}1). Счетная аддитивность (2.3) и есть точное выражение этого тре- бования. Поскольку нас интересуют в первую очередь вероятности, мы ограничимся рассмотрением лишь неотрицательных функций ин- тервалов F* нормированных условием F\—оо, оо}==1. Требова- ние нормированности не накладывает никаких серьезных ограни- чений, когда F{—оо, оо}<оо, однако исключает такие функции интервалов, как длина в Я1 или площадь в $12. Чтобы использо- вать излагаемую ниже теорию в подобных случаях, достаточно разбить прямую или плоскость на единичные интервалы и рас- сматривать их по отдельности. Этот прием так очевиден и настолько хорошо известен, что не требует никаких дальнейших пояснений. Функция на ЗУ называется ступенчатой функцией* если она принимает лишь конечное число значений, причем каждое значе- ние на некотором интервале. Пусть ступенчатая функция и при- нимает значения а±* ..., ап на интервалах ..., 1п (т. е. с вероятностями F{/J, .Р{1п\) соответственно. По аналогии с определением математического ожидания дискретных случайных величин положим E{u)^a1F{I1\^...^anF{In}. (2.4) [Конечно, разбиение пространства на интервалы, на которых функция и постоянна, не единственно, однако, как и в дискрет- ном случае, легко видеть, что определение (2.4) не зависит от разбиения.] Математическое ожидание Е (а) обладает следующими свойствами: х) См. Колмогоров А.Н. Основные понятия теории вероятностей, изд, 2, 1975, стр4 27,— npUMt перев^
5 2. Функции интервалов и интегралы в 131 а) Аддитивностью относительно линейных комбинаций: Е (аг«, + а2н2) = о^Е (mJ + а3Е (м2). (2.5) б) Положительностью} если и 0, то Е (и) 0. (2.6) в) Нормированностью\ для функции, равной во всех точках 1, Е(1) = 1. (2.7) Последние два свойства эквивалентны теореме о среднем зна- чении] если то а^Е(ц)^р, так что функция Е(и) представляет собой один из видов среднего значения1}. Теперь задача состоит в том, чтобы продолжить определение Е (и) на более широкий класс функций с сохранением свойств (а) — (в). В классическом интегрировании по Риману используется тот факт, что для каждой непрерывной функции и на 0, 1 су- ществует последовательность ступенчатых функций ип, для кото- рой ип—>и равномерно на 0, 1. По определению полагают Е(и)= ==limE (£/„). Оказывается, что требование равномерной сходимости необязательно, и то же самое определение Е (и) можно использо- вать, когда сходимость ип —+и лишь поточечная. Таким способом Е (ц) можно продолжить на все ограниченные бэровские функции, и это продолжение единственно. При распространении Е(ц) на неограниченные функции неизбежно появляются расходящиеся интегралы, однако, по крайней мере для положительных бэровских функций, можно определить Е (и) либо как число, либо как сим- вол оо (указывающий расходимость). Никаких неприятностей в связи с этим не возникает, поскольку в лебеговской теории интегрирования рассматривается лишь абсолютная интегрируемость. Грубо говоря, исходя из определения (2.4) математического ожи- дания для простых функций, можно доопределить Е(ц) для про- извольных бэровских функций, используя очевидные приближения и переходы к пределу. Так определенное число Е (и) есть инте- х) Когда функция F задает вероятности, среднее Е (и) можно интерпре- тировать как ожидаемый выигрыш игрока, возможные выигрыши которого суть а/, а2> . Чтобы интуитивно осознать смысл среднего в других ситуа- циях, рассмотрим три примера, в которых и (х) является соответственно тем- пературой во время х, числом телефонных разговоров во время х, расстоя- нием материальной точки от начала координат, a F представляет собой соот- ветственно длительность временного интервала, цену временного интервала (цену разговора) и механическую массу. В каждом случае интегрирование производится лишь по конечному интервалу и Е (и) есть соответственно средняя температура, накопленный доход и статический момент. Эти примеры пока- зывают, что определенное нами интегрирование по отношению к произвольной функции множеств проще и нагляднее, чем интегрирование по Риману, в ко- тором независимая переменная играет несколько ролей и интерпретация как «площадь под кривой» ничуть не помогает начинающему. Следует иметь в виду, что понятие среднего (математического ожидания) встречается не только в теории вероятностей. 5*
132 Гл. IV. Вероятностные меры и пространства грал Лебега—Стильтьеса от функции и по отношению к F. (Когда функция F фиксирована, более предпочтителен термин «матема- тическое ожидание» — никаких двусмысленностей при этом не воз- никает.) Ниже приводится без доказательства1) основной факт лебеговской теории; его природа и значение будут проанализиро- ваны в следующих параграфах. [Конструктивное определение Е (ц) дается в § 4.] Основная теорема. Пусть F—счетно-аддитивная функция ин- тервалов в 31г и F\—оо, оо} = 1. Существует единственный ин- теграл Лебега—Стильтьеса Е(ц) на классе бэровских функций, обладающий следующими свойствами'. Если и^ 0, то Е (и) равно либо неотрицательному числу, либооо. В случае произвольного и Е(и) существует тогда и только тогда, когда либо Е (и+), либо Е (ц“) конечно', при этом Е(и) = Е(ц+) — Е(и~). Функция и называется интегрируемой, если Е(и) конечно. Далее (i) если и—ступенчатая функция, то Е (и) дается формулой(2А); (ii) условия (2.5)—(2.7) выполняются для всех интегрируемых функций', (iii) (принцип монотонной сходимости) если и ип интегпируемы, то Е (и^ —> Е (и). Сделав замену переменных vn = un+1—ип, можно переформу- лировать принцип монотонной сходимости в терминах рядов: Если vn интегрируемы и vn^0, то £E(v„) = E(£vn), (2.8) причем обе стороны равенства конечны или бесконечны одновре- менно. Отсюда, в частности, следует, что если v и 0 и Е (и)= оо, то также Е (у) = оо. Что будет, если в (iii) условие монотонности отбросить? Ответ на этот вопрос содержится в следующей важной лемме, имеющей широкую область применений. Лемма Фату. Если ип^0 и ип интегрируемы, то Е (lim inf и^ С lim inf Е (и^. (2.9) В частности, если ип—>и, то lim inf Е (и^ Е (и). Доказательство. Положим vn = unnun+i А .... Тогда ип^и„ и, следовательно, E(vn)^E(un). Но (как мы видели в § 1) vn монотонно стремится к lim inf ип, так что E(t/J стремится к левой части в (2.9) и лемма доказана. [Отметим, что обе стороны неравенства (2.9) могут быть равны оо.] ► *•) Метод доказательства намечен в § 5. Как обычно и+ и обозначают положительную и отрицательную части и, т. ев ^+=w|jO и —^“’ = ^П0. Очевидно5 u=w+—
$ 2. Функции интервалов и интегралы в 133 Приводимый ниже пример д) показывает, что условие поло- жительности не может быть отброшено, однако его можно заме- нить на формально более слабое условие, состоящее в том, что существует интегрируемая функция U, для которой unZ^U (до- статочно заменить ип на ип—U). Заменяя ип на —ип, устанав- ливаем следующий результат: если un<U и E(t/)<oo, то lim sup Е (w„) Е (lim sup и^. (2,10) Для сходящихся последовательностей левая часть неравенства (2.9) совпадает с правой частью неравенства (2.10), и мы получаем следующий важный Принцип мажорированной сходимости. Пусть ип интегрируемы и ип—>и поточечно. Если существует интегрируемая функция U9 такая, что | ип | <1 U при всехп, то и интегрируема и Е (ип) —> Е (и). Эта теорема относится к единственному месту в лебеговской теории интегрирования, где наивные формальные действия могут привести к неверному результату. Необходимость условия | ип | ^(7 иллюстрируется нижеследующим примером. ।--1 Пример, д) Рассмотрим 0, 1 в качестве исходного интервала и определим математическое ожидание с помощью одномерного интеграла (по отношению к длине). Положим ип (х) == (п + 1) (п + 2) х хх"(1—х). Эти функции стремятся к нулю в каждой точке, но 1 = Е(^„)—>1. Заменяя ип на —ип, видим, что неравенство Фату (2.9) может не выполняться для неположительных функций. ► Отметим без доказательства одно правило обычного интеграль- ного исчисления, применимое и в более общей ситуации. Теорема Фубини о повторных интегралах. Если и^О — бэров- ская функция и F, G—вероятностные распределения, то с оче- видной интерпретацией в случае расходящихся интегралов имеет место равенство ОО ОО 00 00 J F {dx\ J и(х, y)G{dy} = J G {dy} J и (х, y)F\dx}. — 00 — 00 — 00 — 00 (2.П) Здесь х и у можно понимать как точки в 9im и 3U1, и теорема содержит в себе утверждение, что оба внутренних интеграла суть бэровские функции. (Эта теорема применима к произведению произвольных пространств, и более общий ее вариант приводится В § 6.) , > Теорема об аппроксимации в среднем. Для всякой интегрируе- мой функции и и любого е > 0 можно найти ступенчатую функ- цию v, такую, что Е (| и—v j) < &.
134 Гл. IV. Вероятностные меры и пространства Вместо ступенчатых функций можно использовать аппроксима- цию посредством непрерывных функций или посредством функций, бесконечное число раз дифференцируемых и равных нулю вне не- которого конечного интервала. [Сравните с теоремой об аппрок- симации из примера VIII, 3, а).] Замечание об обозначениях. Обозначение Е(и) подчеркивает зависимость от и и хорошо применимо в тех случаях, когда функция интервалов Р фиксирована. Если F меняется или нужно подчеркнуть зависимость от F, то предпочтительнее интегральное обозначение (2.1). То же самое относится к интегралам по под- множеству Л, поскольку интеграл от и по подмножеству А есть (по определению) интеграл от произведения \Аи по всему про- странству J и(х) F \dx}==E(\Au) А (при этом предполагается, конечно, что индикатор 1л есть бэров- ская функция). Обе части выписанного равенства означают в точ- ности одно и то же, причем выражение, стоящее в левой части, подчеркивает зависимость от F. Когда A —a, b есть интервал, ь иногда предпочитают обозначение , однако чтобы сделать его а точным, необходимо указать, включаются ли в интервал его ко- нечные точки. Это можно сделать, используя запись а+ или а—. > В соответствии с намеченной в начале этого параграфа про- граммой вероятность множества А полагается теперь, по опреде- лению, равной Е(1л) для всех множеств, для которых 1А есть бэровская функция. Для множеств, нё обладающих этим свойством, вероятности не определяются Теперь мы обсудим следствия из данного определения в более общей ситуации произвольного вы- борочного пространства. § 3. n-АЛГЕБРЫ. ИЗМЕРИМОСТЬ В дискретном случае можно было определить вероятности для всех подмножеств выборочного пространства <5, однако в общем случае это или невозможно, или нежелательно. В предыдущих главах мы рассматривали специальный случай евклидовых про- странств W и начинали с того, что приписывали вероятности всем интервалам. В § 2 было показано, что такое определение вероятностей может быть естественным образом распространено на более широкий класс множеств 21. Основные свойства этого класса таковы.’
§ 3. о-алгебры. Измеримость 135 (i) Если множество А принадлежит 31, то 31 принадлежит также его дополнение Д' = @—А. (ii) Для произвольной счетной системы {ДД множеств из 31 объединение и Ап и пересечение А Ап множеств Ап также при- надлежит 3L Короче говоря, класс 31 замкнут относительно образования счетных объединений и пересечений, а также дополнений. Как было показано в § 1, отсюда также следует, что верхний и ниж- ний пределы любой последовательности {ДД множеств из 31 снова принадлежат 31. Иными словами, ни одна из известных операций, производимых над множествами из 31, не приведет нас к множе- ствам, лежащим за пределами 31, и поэтому не возникает необхо- димости рассматривать какие-либо другие множества. Эта ситуация типична настолько, что вообще вероятности будут приписываться только классу множеств со свойствами (i) и (ii). Введем поэтому следующее определение, которое применимо к произвольным ве- роятностным пространствам. Определение 1. о-алгеброй1) называется семейство 31 подмно- жеств данного множества ©, обладающее свойствами (i) и (ii). Для любого заданного семейства $ подмножеств наимень- шая а-алгебра, содержащая все множества из $, называется а-алгеброй, порожденной В частности, множества, порожденные интервалами из называются борелевскими множествами в Э1Т. В том, что наименьшая а-алгебра, содержащая $, существует, можно убедиться с помощью рассуждений, используемых при определении бэровских функций в § 1. Заметим, что любая а-ал- гебра содержит пространство поскольку ® представимо в виде объединения любого множества А и его дополнения. Примеры. Наибольшая а-алгебра содержит все подмножества Эта алгебра была нам очень полезна в дискретных пространствах, однако в общем случае она слишком обширна, чтобы ее можно было использовать. Другим крайним случаем является тривиаль- ная алгебра, состоящая только из всего пространства и из пустого множества. В качестве нетривиального примера рассмотрим мно- жества на действительной прямой, обладающие тем свойством, что если х£А, то все точки х±1, х±2, ... тоже принадле- жат А (периодические множества). Очевидно^ семейство таких множеств образует а-алгебру. ► х) Алгебра множеств определяется аналогичным образом, но с заменой слова «счетный» в (ii) на слово «конечный», а-алгебру иногда называют «бо- релевской алгеброй», но это ведет к противоречию с последней частью дан- ного определения. (Интервалы в этом определении можно заменить на откры- тые множества, и тогда это определение применимо к произвольным тополо- гическим пространствам.)
136 Гл. IV. Вероятностные меры и пространства Наш опыт подсказывает нам, что главный объект теории вероят- ностей—это случайные величины, т. е.- некоторые функции, опре- деленные на выборочном пространстве. Мы хотим связать с каждой случайной величиной ее функцию распределения, и для этого нам нужно, чтобы событие {Х^/} имело бы определенную вероятность. Это рассуждение приводит -нас к следующему определению. Определение 2. Пусть 31—произвольная о-алгебра подмножеств <&. Действительная функция и, определенная на называется ^.-измеримой1), если для любого действительного t множество всех точек х, для которых u(x)^.t, принадлежит 31. Множество точек х, для которых ы(х)</, представляет со- бой объединение счетной совокупности множеств с тем свойством, что u(x)^t—п~г, и поэтому оно принадлежит §1. Так как 31 замкнуто относительно взятия дополнения, то отсюда следует^ что в определении 2 знак может быть заменен на <, > или Из определения следуем что Э1-измеримые функции образуют замкнутое семейство в том смысле, который указан в § 1. Следующая простая лемма часто оказывается полезной. Лемма 1. Функция и ^-измерима тогда и только тогда, ко- гда она является равномерным пределом последовательности про- стых функций., т. е. таких функций, которые принимают только счетное число значений, причем каждое на множестве из SI. Доказательство. По определению любая простая функция 31 измерима. Вследствие замкнутости класса 31-измеримых функций любой предел последовательности простых функций снова является ^[-измеримой функцией. Обратно, пусть и—31-измеримая функция. При фиксированном е > 0 определим множество А„ как множество всех точек х, для которых (п—1) 8 < и (х) пе. Здесь целое п меняется от —оо до оо. Множества Ап взаимно исключают друг друга, а их объе- динение составляет все пространство ©. На множестве Л„ опре- делены ое(х) = (п—1)е и o£(x) = ns. Этим путем мы получим две функции ое и а£, определенные на ® и такие, что а8<и<а8, о£—ое=е (3.1) во всех точках х. Очевидно, что и есть равномерный предел сте и о£ при 8—>-0. Лемма 2. В 91г класс бэровских функций тождествен классу функций, измеримых относительно о-алгебры 31 борелевских мно- жеств. ') Использование этого термина, по существу, преждевременно, поскольку мера еще не введена.
§ 3. о-алгебры. Измеримость 137 Доказательство, (а) Очевидно, что любая непрерывная функ- ция измерима по Борелю. Далее, эти функции образуют замкну- тый класс, тогда как бэровские функции образуют наименьший класс, содержащий все непрерывные функции. Таким образом,; всякая бэровекая функция измерима по Борелю. (б) Предыдущая лемма показывает, что для обратного утверж- дения достаточно показать, что любая простая измеримая по Борелю функция является бэровской функцией. Это равносильно утверждению, что для всякого борелевского множества А инди- катор 1Л является бэровской функцией. Таким образом, борелев- ские множества могут быть определены следующим образом! мно- жество А является борелевским тогда и только тогда,, когда его индикатор 1Л принадлежит наименьшему замкнутому классу, со- держащему все индикаторы интервалов. Поскольку бэровские функции образуют замкнутый класс, содержащий все индикаторы интервалов1), то отсюда вытекает, что 1Л есть бэровекая функция для любого борелевского множества А. Применим этот результат в частном случае евклидова прост- ранства 91г. В § 2 мы начинали с вполне аддитивных функций интервалов и определяли Р {Л} = Е (1Л) для каждого множества Л, индикатор 1А которого есть бэровекая функция. Из предыдущего видно, что при такой процедуре вероятность Р{Л} определена тогда и только тогда, когда А есть борелевское множество. Аппроксимация борелевских множеств интервалами. Ввиду последнего замечания вероятности в , как правило, определяются на о-алгебре боре- левских множеств. Поэтому важно то, что любое борелевское множество А может быть аппроксимировано множеством В, состоящим из конечной сово- купности интервалов. Точнее, для любого е > О существует множество С, такое, что Р {С} < в и вне С множества А и В совпадают (т. е. точка из дополнения С' либо принадлежит А и В одновременно, либо не принадлежит ни тому, ни другому множеству. В качестве С можно взять объединение Л —АВ и В — АВ). Доказательство. В силу теоремы об аппроксимации в среднем из § 2 существует ступенчатая функция для которой Е (| 1Л—v |) < 8/2. Возьмем в качестве В множество таких точек х, в которых v (х) > 1/2. По- скольку и—ступенчатая функция, то В состоит из конечного числа интерва- лов. Легко проверить, что ' Е I U W-h W / <2Е | 1 л (х)-о(х) | < 8 при всех х. Но | 1л—1д| есть индикатор множества С; состоящего из всех точек, которые принадлежат либо А, либо В, но не обоим этим множествам одновременно. Из последнего неравенства следует, что Р {С} < 8, и на этом доказательство завершается. х) Чтобы убедиться в этом для открытого интервала /, определим v как непрерывную функцию, равную нулю вне / и такую, что 0 < о (х) <11 при х$Д9 Тогда v —> 1 /.
138 Гл. IV. Вероятностные меры и пространства § 4. ВЕРОЯТНОСТНЫЕ ПРОСТРАНСТВА. СЛУЧАЙНЫЕ ВЕЛИЧИНЫ Мы теперь в состоянии описать общую конструкцию, исполь- зуемую в теории вероятностей. Каково бы ни было выборочное пространство ©, вероятности будут приписываться только мно- жествам соответствующей сг-алгебры 31. Поэтому начнем со следу- ющего определения. Определение 1. Вероятностной мерой Р на в-алгебре 31 под- множеств © называется функция, наделяющая каждое множество числом Р{Д}>0, таким, что Р^{©}==1, и для любого счет- ного семейства взаимно непересекающихся множеств Ап из 31 вы- полняется равенство Р{ил„Н2рМлЬ С4-1) Это свойство называется вполне аддитивностью, и вероятностная мера может быть описана как вполне аддитивная неотрицательная функция множества на 31, подвергнутая нормировке1) Р {©}=*!. В отдельных случаях можно выбрать подходящую а-алгебру и построить на ней вероятностную меру. Эти процедуры меняются от случая к случаю, и невозможно отыскать общий метод. Иногда можно приспособить подход, используемый в § 2, для построения вероятностной меры на борелевских множествах пространства Ж. Типичный пример дает последовательность независимых случайных величин (§ 6). Исходным пунктом любой вероятностной задачи служит выборочное пространство, в котором выбрана а-алгебра с соответствующей вероятностной мерой. Это приводит к следую- щему определению. Определение 2. Вероятностным пространством называется тройка (©, 31, Р), состоящая из выборочного пространства ©, о-алгебры 3t подмножеств © и вероятностной меры Р на 31. Конечно, не любое вообразимое вероятностное пространство представляет собой интересный объект, однако данное определение включает в себя все, что требуется для формального развития теории, следуя схеме первого тома, и было бы бесплодным обсуж- дать заранее типы вероятностных пространств, которые могут встретиться на практике. Случайные величины суть функции, определенные на выбороч- х) Условие Р{©}=1 вводится лишь для нормировки, и никаких сущест- венных изменений не произойдет, если его заменить на Р {©} < оо. В этом случае мы получаем пространство с конечной мерой. В теории вероятностей в связи с различными обстоятельствами возникают ситуации, когда Р{©} < 1. В этом случае Р называют несобственной вероятностной мерой. Даже условие Р {©} < оо может быть ослаблено: можно потребовать лишь, чтобы © было объединением счетного числа подмножеств для которых Р {©„} < оо. (Ти- пичными примерами являются длина н площадь.) Такие меры называют о-ко- печными.
§ 4. Вероятностные пространства. Случайные величины 139 ном пространстве, но в теории вероятностей используются только те функции, для которых можно определить функцию распреде- ления. Определение 2 в § 3 было введено и как раз применительно к этой ситуации и приводит к определению 3. Определение 3. Случайной величиной X называется действитель- ная функция, которая измерима относительно исходной а-алгебры §1. Функция F, определенная равенством F = Р {Х^т}, называется функцией распределения случайной величины X. Исключение из рассмотрения функций, не являющихся случай- ными величинами, возможно в силу того, что, как мы сейчас увидим, все обычные операции, такие, как вычисление сумм или других функций, переходы к пределу и т. д., могут быть произведены внутри класса случайных величин без выхода за его границы. Прежде чем выразить это более точно, заметим, что случайная величина X отображает выборочное пространство @ в действитель- ную прямую 91х таким образом, что множество из ©, для кото- —| рого а<Х^Ь, отображается в интервал а, b с соответствующей вероятностью F (Ь)—F(a). Следовательно, каждый интервал / из Si1 получает вероятность FВместо интервала / можно взять произвольное борелевское множество Г в и рассмотреть мно- жество А таких точек из для которых значение X принадлежит Г. Символически 4 = {Х£Г}. Ясно, что система всех таких множеств образует о-алгебру которая может совпадать с 31, но обычно меньше. Будем называть о-алгеброй, порожденной случайной величиной X. Ее можно описать как наименьшую о-алгебру в относительно которой X измерима. Случайная величина X отобра- жает всякое множество из 311 в борелевское множество Г на пря- мой и, следовательно, соотношение = определяет единственную вероятностную меру на о-алгебре борелевских мно- жеств 91х. Для интервала / = а, b имеем Л(/) = /7(&)— F (а), и потому F совпадает с единственной вероятностной мерой в 911, которая связана g функцией распределения F так, как описано в § 2. Эти рассуждения показывают, что, пока мы имеем делос какой- либо отдельной случайной величиной X, мы можем забыть о перво- начальном выборочном пространстве и делать вид, что вероятностное пространство есть прямая 9F со-алгеброй борелевских множеств на нем и с мерой, индуцированной посредством функции распре- деления F. Мы видим, что в класс бэровских функций совпа- дает с функциями, измеримыми по Борелю. Выбор в качестве выборочного пространства означает, что класс случайных величин совпадает с классом функций, измеримых по Борелю. По отноше- нию к исходному выборочному пространству это означает, что семейство бэровских функций от случайной величины X совпадает с семейством всех функций, которые измеримы относительно
140 Гл. IV. Вероятностные меры и пространства o'-алгебры порожденной X. Поскольку Э(1с=3(,то отсюда сле- дует, что любая бэровекая функция X снова является случайной величиной. Эти доводы переносятся без изменения на конечные совокуп- ности случайных величин. Таким образом, вектор (Хп Хг) отображает в W так, что открытому интервалу в соответ- ствует множество в ©, для которого имеют место г соотношений вида ak < Xk < bk. Это множество 31-измеримо, так как оно яв- ляется пересечением г таких множеств. Как и в случае одиночной случайной величины, можно определить в-алгебру порожденную Xi, ..., Хг, как наименьшую о-алгебру множеств из S, относи- тельно которой г случайных величин измеримы. Получаем основ- ную теорему. Теорема. Любая бэровекая функция от конечного числа случай- ных величин тоже есть случайная величина. Случайная величина U является бэровской функцией переменных Хп Хг, если она измерима относительно а-алгебры, порожден- ной Х£, ..., Хг. Примеры, а) На прямой 5J1 с X как координатной случайной величиной функция X2 порождает о-алгебру борелевских множеств, которые являются симметричными относительно начала координат (в том смысле, что если х^А, то и —х£Д). б) Рассмотрим 513 с координатными случайными величинами Xi, Х2, Х3 и о-алгеброй борелевских множеств. Пара (Хх, Х2) порождает семейство всех цилиндрических множеств с образующими, параллельными третьей оси, и основаниями, которыми служат борелевские множества на (Хх, Х2)-плоскости. ► Математические ожидания В § 2 мы начинали с функции интервалов вЖи использовали ее для построения вероятностного пространства. Там мы считали, что удобно сначала определить математические ожидания (интег- ралы) и затем определить вероятности борелевского множества А как математическое ожидание Е (1Л) его индикатора. Если начинать с вероятностного пространства, то процедура должна быть обратной: вероятности заданы ,и нужно определить математические ожидания случайных величин в терминах данных вероятностей. К счастью, эта процедура крайне проста. Как и в предыдущем параграфе, мы будем говорить, что слу- чайная величина U является простой, если она принимает только счетное число значений а1У а2, ... , каждое на множестве Ду, принадлежащем основной о-алгебре 31. К таким случайным вели- чинам применима дискретная теория первого тома, и мы определим
§ 4. Вероятностные пространства. Случайные величины 141 математическое ожидание U равенством E(U) = 2afcP{4} (4.2) при условии, что ряд сходится абсолютно, в противном случае мы скажем, что U не имеет математического ожидания. Для любой случайной величины U и произвольного числа & > О мы определили в (3.1) две простые случайные величины а8 и а8, такие, что сг8 = о84-е и <j8^U^oe. При любом разумном опре- делении Е (U) E(£8)<E(U)<E(o8), (4.3) всякий раз когда величины ое и о8 имеют математические ожида- ния. Так как эти функции отличаются не более чем на в, то либо это же справедливо для их математических ожиданий, либо эти математические ожидания не существуют. В последнем случае мы говорим, что U не имеет математического ожидания, тогда как. в первом случае E(U) определяется однозначно из (4.3) переходом к пределу при 8—>0. Короче, поскольку любая случайная вели- чина U представляется равномерным пределом последовательности простых случайных величин (гл, то математическое ожидание U может быть определено как предел Е (cQ. Например, в терминах а8 имеем E(U)= lim SneP{(n—l)8<U<ne} (4.4) 8 -> 0 - 00 при условии/что ряд сходится абсолютно (при некотором, а потому и при всех 8 > 0). Далее, вероятности, входящие в (4.4), совпа- дают с вероятностями, которые приписываются интервалам ---------1 (п—1)8> с помощью функции распределения F случайной вели- чины U. Отсюда следует, что при таком изменении обозначений наше определение Е (U) сводится к определению, данному в § 2: E(U) = $ tF{dt\. (4.5) — 00 Таким образом, Е (U) можно корректно определить либо непо- средственно в исходном вероятностном пространстве, либо в тер- минах функции распределения. (То же замечание было сделано в 1; гл. IX, для дискретных случайных величин.) По этой причине излишне говорить, что в произвольных вероятностных простран- ствах математические ожидания обладают основными свойствами математических ожиданий в введенных в § 2.
142 Гл. IV. Вероятностные меры и пространства § 5. ТЕОРЕМА О ПРОДОЛЖЕНИИ При построении вероятностных пространств вероятности обычно определены a priori на не очень богатом классе множеств, и тре- буется подходящим образом расширить их область определения. Например, при рассмотрении в первом томе бесконечных последо- вательностей испытаний и рекуррентных событий были заданы вероятности всех событий, зависящих от конечного числа испыта- ний, и эту область определения вероятностей требовалось расши- рить так, чтобы включить такие события, как разорение, возвращение и полное вырождение. Аналогично при построении в § 2 мер в 91г сначала наделялись вероятностями F {1\ интервалы, а затем область определения продолжалась до класса всех борелевских множеств. Такое продолжение возможно благодаря теореме, имеющей зна- чительно более широкую область применения и на которой осно- вываются многие конструкции вероятностных пространств. Схема рассуждения состоит в следующем. Аддитивность F позволяет однозначно определить (5.1) для любого множества Л, являющегося объединением конечного числа непересекающихся интервалов Ik. Эти множества образуют алгебру 310 (т. е. объединения и пересечения конечного числа мно- жеств из 310, а также дополнения множеств из 310 тоже принад- лежат 310). Начиная с этого пункта, природа пространства 31г не играет никакой роли и можно рассматривать произвольную ал- гебру 310 множеств в произвольном пространстве Всегда суще- ствует наименьшая алгебра 31 множеств, содержащая 310 и замкну- тая относительно счетных объединений и пересечений. Иными словами, существует наименьшая о-алгебра 31, содержащая 510 (см. определение 1 из § 3). При построении мер в &1Г о-алгебра 31 совпадала с о-алгеброй всех борелевских множеств. Расширение области определения вероятностей 310 до 31 основывается на сле- дующей общей теореме. Теорема о продолжении. Пусть 310—произвольная алгебра мно- жеств в некотором пространстве ©. Пусть F—определенная на 310 функция множеств, такая, что F{A}^0 при всех Л£31о, F {©} =а 1, и, кроме того, соотношение (5.1) выполняется для любого разбиения А на счетное число непересекающихся множеств 4£310. Тогда существует единственное продолжение F до счетно-адди- тивной функции множеств (т. е. до вероятностной меры) на наи- меньшей в-алгебре 31, содержащей 310. В следующем параграфе будет приведен типичный пример применения этой теоремы. Теперь мы обратимся к более общему и гибкому варианту теоремы о продолжении, ближе примыкающему к рассмотрениям § 2 и 3. Мы исходили из математического ожи- дания (2.4) для ступенчатых функций (т. е. функций, принимающих
$ 5. Теорема о продолжении 143 лишь конечное число значений, причем каждое из значений—на некотором интервале). Область определения этого математического ожидания была затем продолжена с довольно бедного класса сту- пенчатых функций на более широкий класс, включающий все ограниченные бэровские функции. Указанное продолжение непо- средственно приводит к интегралу Лебега—Стильтьеса, и мера множества А получается как математическое ожидание его инди- катора 1л. Наметим соответствующую абстрактную схему. Рассмотрим вместо алгебры множеств 310 класс.функций 33О, замкнутый относительно линейных комбинаций и операций П и U - Иными словами, предполагается, что если функции ut и и2 при- надлежат 33О, то функции щ Г) u2i u1Uu2 (5.2) тоже принадлежат 33ОХ). Отсюда, в частности, следует, что всякая функция и из Э30 может быть записана как разность двух неотри- цательных функций, именно и = и + — и~, где = r/(jO и и~ = = (—и) П 0. Под линейным функционалом Е на 33О понимается сопоставление значений Е (и) всем функциям из 33О с выполнением условия Е (a1w1 + a2w2) = atE (wj Д- a2E (u2). (5.3) Функционал E называется положительным, если E(rz)^O при Нормой E называется верхняя грань значений Е (| и |) по всем функциям £/£ 330, удовлетворяющим условию Если функция, равная всюду 1, принадлежит 33О, то норма Е равна Е(1). Наконец, скажем, что Е счетно-аддитивен на ®0, если е(3«*) = £е(«а) (5.4) всякий раз, когда ^uk принадлежит 33О* 2). Условие счетной адди- тивности эквивалентно следующему: если — последовательность функций из 33О, сходящаяся монотонно к нулю, то3) ЕМ- 0. (5.5) - Для каждого заданного класса функций 33О существует наимень- ший класс 33, содержащий 33О и замкнутый относительно переходов к пределу в смысле поточечной сходимости. [Класс 33 автоматически х) Наши предположения равносильны требованию, чтобы класс был линейной структурой. 2) Здесь следует добавить требование иначе последующее утверж- дение неверно.— Прим, перев. 3) Для доказательства эквивалентности (5.4) и (5.5) достаточно рассмот- реть случай Тогда (5,4) следует из (5.5), если положить ^ = /^+1 + «„+2+..., и (5.5) вытекает из (5.4), если положить uk = vk-—vk+ (при этом
144 Гл. IV. Вероятностные меры и пространства замкнут относительно операций (5.2),] Дадим теперь другую фор- мулировку теоремы о продолжении* 1). Каждый положительный счетно-аддитивный линейный функционал нормы 1 на 93О может быть единственным образом продолжен до положительного счетно- аддитивного линейного функционала нормы 1 на всех ограниченных (и многих неограниченных) функциях из 93. В качестве примера применения этой теоремы докажем следу- ющий важный результат. Теорема Ф. Рисса о представлении2). Пусть Е—положительный линейный функционал нормы 1 на классе всех непрерывных функций на 91г, обращающихся в нуль на бесконечности3). Существует мера Р на в-алгебре борелевских множеств, для которой P{5ir} = 1 и такая, что Е(и) совпадает с интегралом от и по Р. Иными словами, определенные нами интегралы дают представ- ление наиболее общих положительных линейных функционалов. Доказательство. В основе доказательства лежит тот факт,: что если последовательность обращающихся в нуль на бесконеч- ности непрерывных функций монотонно сходится к нулю, то схо- димость эта автоматически равномерна. Пусть оп 0, и обозначим || оп || = max vn (х). Тогда Е (v„) ^|| и„||, и поэтому для Е выполнено условие счетной аддитивности (5.5). В силу теоремы о продолже- нии Е можно продолжить на все ограниченные бэровские функ- ции. Положив Р{ Л}= Е(1 л),; получаем меру на о-алгебре борелевских множеств. Как мы видели, по заданной мере Р{Л} интеграл Ле- бега—Стильтьеса однозначно определяется с помощью двойного х) Основная идея доказательства (восходящая к Лебегу) проста и остро- умна. Нетрудно видеть, что если две последовательности {«„} и функций из 53О сходятся монотонно к одному и тому же пределу и, то последователь- ности Е (w„) и Е («п) тоже сходятся к одному и тому же пределу. Для таких монотонных пределов и можно, следовательно, определить Е (и) =lim Е (ип). Рассмотрим теперь класс 531 функций ut для которых при любом 8 > 0 сущест- вуют две функции и и и, либо принадлежащие 9%, либо являющиеся моно- тонными пределами последовательностей из 93о и такие, что и < и < и, Е (w) —Е (и) < 8. Класс 53f замкнут относительно переходов к пределам, и для функций из iBf значение Е (и) определяется очевидным образомпоскольку должно быть Е («) «С Е (и) Е (и). Замечательной особенностью этого рассуждения является следующее об- стоятельство: обычно класс 531 больше класса 53 и простое доказательство оказывается возможным благодаря тому, что доказывается больше, чем тре- буется. (Относительно сравнения классов 53 и 53i см. § 7.) 2) Эта теорема справедлива для произвольных локально компактных про- странств. См. другое доказательство в V, 1. 3) и обращается в нуль на бесконечности, если для любого 8 > 0 сущест- вует шар (компактное множество), вне которого |«(х)| < 8f
§ 6. Произведения пространств 145 неравенства (4.3). Следовательно, интеграл Лебега—Стильтьеса по Р от обращающейся в нуль на бесконечности непрерывной функции и совпадает со значением на и заданного функционала В (и). ► § 6. ПРОИЗВЕДЕНИЯ ПРОСТРАНСТВ. ПОСЛЕДОВАТЕЛЬНОСТИ НЕЗАВИСИМЫХ СЛУЧАЙНЫХ ВЕЛИЧИН Понятие прямого произведения пространств (1; гл. V, 4) яв- ляется весьма важным в теории вероятностей и используется всякий разг когда речь идет о повторных испытаниях. Представление точки плоскости 5£2 посредством двух координат означает, что 5i2 рассматривается как прямое произведение двух своих осей. Обозначим две координатные переменные через X и Y. Рассмат- риваемые как функции на плоскости они представляют собой бэровские функции, и если на о-алгебре борелевских множеств в 5£3 определена вероятностная мера Р, то существуют две функции рас- пределения Р{Xи P{Y <у}. Эти две функции распределения индуцируют вероятностные меры на обеих осях, называемые част- ными (маргинальными) распределениями (или проекциями). Здесь у нас в качестве первичного понятия появляется плоскость, однако часто более естественной является противоположная ситуация. Например, когда говорят о двух независимых случайных величи- нах с заданными распределениями, два частных распределения являются первичным понятием и вероятности на плоскости полу- чаются из них с помощью «правила умножения». Общий случай ничуть не сложнее случая плоскости. Рассмотрим теперь два произвольных вероятностных простран- ства. Иными словами, нам заданы два выборочных пространства @(1) и @(2\ две о-алгебры 31(1) и §1(2) подмножеств ®(1) и ©(2) соот- ветственно и определенные на ?Х(1) и ?1(2) вероятностные меры Р(1) и Р(2). Прямое произведение (©(1\ @(2)) есть множество всех упо- рядоченных пар (х(1), х(2)),;где x{i)—точка пространства ®U). Рас- смотрим в этом произведении множества, являющиеся «прямо- угольниками», т. е. прямые произведения (А(1)ж А(2)) множеств 4(1) Множества такого вида мы наделяем вероятностями согласно правилу умножения- Р{А% А(2>} = Р(1){А^}Р<2>{А<2>}. (6.1) Далее множества, представляющие собой конечные объединения непересекающихся прямоугольников, образуют алгебру 510, на кото- рой с помощью (6.1) единственным образом определяется счетно- аддитивная функция. Таким образом по теореме о продолжении на наименьшей в-алгебре, содержащей все прямоугольники, суще- ствует единственная вероятностная мера Р, такая, что вероят- ности прямоугольников задаются правилом умножения (6.1). Эта наименьшая! содержащая все прямоугольники в-алгебра обозначается
146 Гл. IV. Вероятностные меры и пространства §1(1)Х§1(2\ а определенная мера на ней называется произведением мер. Конечно, на произведении пространств можно определить и дру- гие вероятности, например, в терминах условных вероятностей. Рассматриваемая а-алгебра множеств §1 всегда будет не меньше 3l(1) X?Х(2), и в то же время за пределы ?1(1) х ЗХ(2) приходится вы- ходить весьма редко. Ниже в рассуждении о случайных величинах предполагается, что?Х = 31(1)х§1(2). Понятие случайной величины (измеримой функции) связано с соответствующей cr-алгеброй, и при рассмотрении произведений пространств мы должны различать случайные величины на про- изведении и на пространствах @(1) и @(2). К счастью, отношение между этими тремя классами случайных величин весьма простое. Пусть и и v—случайные величины на ®(1) и @(2), и рассмотрим на произведении пространств функцию w, которая в точке (х(1), х(2)) принимает значение х(2)) = ц (х(1)) г(х(2)). (6.2) Покажем, что класс случайных величин на произведении пространств (@(1), @(2)) совпадает с минимальным классом конечнозначных функ- ций, замкнутым относительно поточечных переходов к пределу и содержащим все линейные комбинации функций вида (6.2). Ясно, во-первых, что каждый множитель в правой части (6.2) является случайной величиной и в том случае, когда он рассмат- ривается как функция на произведении пространств. Следовательно, w есть случайная величина, и поэтому класс случайных величин на (®(1), @(2)) не меньше минимального класса, о котором гово- рилось выше. С другой стороны, случайные величины образуют наименьший класс, замкнутый относительно переходов к пределу и содержащий все линейные комбинации индикаторов прямоуголь- ников. Эти индикаторы имеют вид (6.2), и, следовательно, класс случайных величин не больше минимального класса, о котором говорилось выше. Частный случай произведения двух пространств 51т и Э1п с веро- ятностными мерами F и G неявно встречался в связи с теоремой Фубини (2.11) о повторных интегралах. Теперь мы можем утверж- дать справедливость более общей теоремы, относящейся не только к Э1Г. Теорема Фубини для произведений мер. Интеграл от любой неотрицательной бэровской функции и по произведению мер равен повторным интегралам из формулы (2.11). (При этом имеется в виду, что интегралы могут расходиться. Теорема очевидна для простых функций, а в общем случае полу- чается с помощью повторной аппроксимации.) Обобщение на случай произведения трех и большего числа пространств вполне очевидно и не требует специальных пояснений. Обратимся теперь к проблеме бесконечных последовательностей
§ 6. Произведения пространств 147 случайных величин, с которой мы уже встречались в первом томе в связи с бесконечными последовательностями испытаний Бер- нулли, случайными блужданиями, рекуррентными событиями и т. д., а также в гл. 111 в связи с нормальными случайными процессами. Проблемы не возникает, когда имеется бесконечное множество случайных величин, определенных на заданном вероят- ностном пространстве. Например, действительная прямая с нор- мальным распределением есть вероятностное пространство и {sinnx} есть бесконечная последовательность определенных на нем слу- чайных величин. Нас интересует только та ситуация, когда вероят- ности должны быть определены в терминах заданных случайных величин. Более точно проблема состоит в следующем. Пусть М°° — пространство, точками которого являются беско- нечные последовательности действительных чисел (хх, х2, ...) (т. е. есть счетное прямое произведение действительных пря- мых). Обозначим n-ю координатную величину через Хя (Хя есть функция на Si00, принимающая в точке х = (хр х2, ...) значе- ние хп). Предположим, что нам заданы вероятностные распреде- ления для Хь (Хп Х2), (Хп Х2, Х3), .. и требуется определить соответствующие вероятности в Конечно, заданные вероятно- сти должны быть взаимно согласованы в том смысле, что распре- деления (Xf, Хп) являются частными распределениями для (Хр Хи+1) и т. д. Формализуем теперь интуитивное понятие «события, опреде- ляемого исходом конечного множества испытаний». Скажем, что множество А в зависит лишь от первых г координат, если существует борелевское множество Агв91г, такое, что x=(xt, х2,,..) принадлежит А тогда и только тогда, когда (хь ..., хг) при- надлежит Аг. В теории вероятностей часто встречается ситуация, когда вероятности таких множеств заданы, и задача состоит в рас- ширении этой области определения. Приведем без доказательства принадлежащую А. Н. Колмогорову фундаментальную теорему (доказанную им в несколько большей общности), впервые появив- шуюся в его ставшем теперь классическим аксиоматическом обо- сновании теории вероятностей (1933). Эта работа предвосхитила и стимулировала развитие современной теории меры. Теорема 1. Согласованную систему вероятностных распределе- ний величин Xf. (Хь Ха), (Х„ Х„ X.), ... можно единственным способом продолжить до вероятностной меры на наименьшей о-алгебре 31 множеств в ЗС, содержащей все множества, завися- щие лишь от конечного числа координат А). Весьма важным является то обстоятельство, что все вероят- ности определяются последовательными переходами к пределам, исходя из конечномерных множеств. Каждое множество А из 31 1) Эта теорема справедлива и в более общем случае произведения локально компактных пространств. Например, она справедлива, когда переменные Хй являются векторными переменными (т, е. значения их — точки в
148 Гл. IV. Вероятностные меры и пространства можно аппроксимировать конечномерными множествами в следую- щем смысле. Для любого е > 0 существует п и зависящее лишь от первых п координат множество Ап, такое, что Р{Л-ЛПЛ„}<8, РК-ДГ|ЛЛ<8. , (6.3) Иными словами, множество тех точек, которые принадлежат либо Л, либо Ап, но не принадлежат обоим множествам А и Ап, имеют вероятность, меньшую 28. Отсюда следует, что можно так выбрать множества Ап, чтобы Р{ЛлНР{Л}. (6.4) Теорема 1 позволяет говорить о бесконечной последовательности взаимно независимых случайных величин с произвольными задан- ными распределениями. Такие последовательности уже встречались в первом томе, однако нам приходилось определять интересую- щие нас вероятности с помощью специальных переходов к пре- делу, в то время как теорема 1 является общим результатом, охватывающим все случаи. Это обстоятельство хорошо иллюстри- руется следующими двумя важными теоремами, первая из которых принадлежит А. Колмогорову (1933), а вторая—Э. Хьюиту и Л. Дж. Сэвиджу (1955). Обе они являются типичными вероятност- ными предложениями и играют центральную роль во многих рас- суждениях. Теорема 2. (Закон нуля или единицы для остаточных событий.) Предположим, что случайные величины Xk взаимно независимы и что при каждом п событие А не зависит1) от Хх, ...» Х„2). Тогда или Р{Л} = 0, или Р{Л} = 1. Доказательство. Вообще говоря, случайные величины Xk могут быть определены на произвольном вероятностном пространстве, однако они отображают это пространство в произведение прямых 5Г°, в котором они играют роль координатных переменных. Следова- тельно, не уменьшая общности, можно ограничиться рассмотрением ситуации, описанной в настоящем параграфе. В обозначениях, использованных в (6.3), множества Л и Ап независимы, и поэтому из первого неравенства в (6.3) вытекает, что Р{Л}—Р{Л}Р{Л„} <8. Следовательно , Р {Л} = Р2 {Л}. ► Пример, а) Ряд сходится с вероятностью единица или нуль. Точно так же множество точек, в которых limsupXn = oo, имеет вероятность либо единица, либо нуль. ► Теорема 3. (Закон нуля или единицы для симметричных собы- х) Более точно, А не зависит от любого события, определяемого в терми- нах Xf, ..., Хп. Иными словами, индикатор А есть случайная величина, независимая от Хх, ..., Хп. 2) Предполагается, конечно^ что А определяется последовательностью Xi, Ха, ,»» >—Прим. перев.
§ 7. Нулевые множества. Пополнение 149 пгий.) Предположим, что случайные величины Xk взаимно незави- симы и одинаково распределены. Если множество А инвариантно относительно конечных перестановок координат*), то либо Р {Л}=0, либо Р {Л} = 1. Доказательство. Как и в доказательстве теоремы 2, мы рас- сматриваем Xk как координатные величины и под множествами Ап понимаем то же, что и в (6.3). Пусть Вп—множество, получен- ное из Ап обращением порядка первых 2п координат, в то время как остальные координаты остаются без изменения. В силу сде- ланных предположений соотношения (6.3) остаются справедливыми при замене Ап на Вп. Отсюда вытекает, что множество точек, принадлежащих либо А, либо Ап [\Вп, но не принадлежащих обоим множествам А и Ап[\Вп, имеет вероятность, меньшую 4в. Следо- вательно, . Р{Л„лВ„}->Р{Л}. (6.5) Далее Ап зависит лишь от первых п координат, и поэтому Вп зависит лишь от координат с номерами n-f-1, ..., 2п. Таким образом, Ап и Вп независимы, что вместе с (6.5) приводит к равен- ству Р (Л) = Р2{ А}. ► Пример, б) Положим Sn = Xx+.. . 4-Хп, и пусть X={S„C 16. ч.}, где / — произвольный интервал на прямой. Событие А инвариантно относительно конечных перестановок. [По поводу обозначений см. пример 1, а).] ► § 7. НУЛЕВЫЕ МНОЖЕСТВА. ПОПОЛНЕНИЕ Множеством вероятности нуль обычно можно пренебрегать, и две случайные величины, различающиеся лишь на таком нуле- вом множестве, «практически совпадают». Выражаясь более фор- мально, их называют эквивалентными. Это означает, что если изменить определение случайной величины на нулевом множестве, то все вероятностные соотношения сохраняются без изменения и, следовательно, случайную величину можно считать неопределен- ной на нулевом множестве. Типичным примером является время осуществления первого рекуррентного события: с вероятностью единица оно есть некоторое число, а с вероятностью нуль—не определено (или считается равным оо). Таким образом, мы чаще имеем дело с классами эквивалентных случайных величин, а не с самими случайными величинами. Тем не менее обычно проще выбрать подходящие представители классов и оперировать с ними, а не с классами. С нулевыми множествами связано единственное место в теории т) Более точно, предполагается, что если а=(ах, а2, ...)—точка из А и /ii, п2—два произвольных натуральных числа, то А содержит также точку, у которой /1Гя координата есть аПг, п2-я координата равна ani, а остальные координаты те же, что и у а. Это условие автоматически распространяется на перестановки, включающие k координат# ,
150 Гл. IV. Вероятностные меры и пространства вероятностей, которое идет вразрез с пашей интуицией. Ситуация одна и та же во всех вероятностных пространствах и достаточно описать ее для случая вероятностной прямой. В рамках нашей конструкции вероятности определены лишь на борелевских мно- жествах, но каждое борелевское множество, вообще говоря, содер- жит много неборелевских подмножеств. Следовательно, нулевое множество может содержать подмножества, на которых вероятно- сти не определены, в то время как естественно ожидать, что каждое подмножество нулевого множества само должно быть нулевым множеством. Это несоответствие не является серьезным и легко может быть устранено. В самом деле, введем такой посту- лата если АаВ и P{S} = 0, то Р^Д} = 0. При этом мы должны расширить а-алгебру §1 борелевских множеств до (по крайней мере) наименьшей о-алгебры З^, содержащей все множества из 31 и все подмножества нулевых множеств. Можно дать прямое описание о-алгебры 3XV Именно, множество А принадлежит 3(г тогда и только тогда, когда оно отличается от некоторого борелевского множе- ства А° лишь на нулевое множество1). Область определения вероят- ности можно продолжить с 31 на 31х, просто положив Р{4} = = Р{Д0}. Без труда показывается, что это продолжение единст- венно и дает вполне аддитивную меру на 31г Таким образом, мы построили вероятностное пространство,- которое удовлетворяет введенному постулату и в котором сохранились вероятности боре- левских множеств. Описанная конструкция называется лебеговым пополнением (заданного вероятностного пространства). Использование пополне- ния естественно в задачах, связанных с единственным вероятност- ным распределением. По этой причине длину интервалов в обычно продолжают до лебеговой меры, которая определена не только на борелевских множествах. Однако, когда рассматриваются семейства распределений (например, бесконечные последователь- ности испытаний Бернулли с различными вероятностями р), по- полнение обычно приводит к неприятностям. Именно 3Q зависит от. рассматриваемого распределения, и поэтому случайная вели- чина по отношению к Э1х может не быть таковой, если перейти к другому распределению. Пример. Пусть ai9 а29 ...— последовательность точек в 5J1, имеющих вероятности pi9 р29 ... соответственно, причем 2 Р/г 1- Дополнение к {аД имеет вероятность нуль, и поэтому ЗХх содер- жит все подмножества ЗГ. Каждая ограниченная функция и является при этом случайной величиной с математическим ожи- данием однако, когда рассматриваемое распределение не дискретно, оперировать с «произвольными функциями» стано- вится опасно. ► б Более точно, требуется, чтобы оба множества А— Af| А() а содержались в некотором нулевом множестве.
ГЛАВА V ВЕРОЯТНОСТНЫЕ РАСПРЕДЕЛЕНИЯ В Яг В этой главе изучаются вероятностные распределения в г-мер- ном пространстве Яг. В идейном отношении понятие вероятност- ного распределения основывается на. изложенной в предыдущей главе теории интегрирования, однако, по существу, никаких слож- ных размышлений для понимания настоящей главы не требуется, поскольку вводимые понятия и формулы интуитивно близки к поня- тиям и формулам, уже известным из первого тома и первых трех глав. Новая черта рассматриваемой теории состоит в том, что (в про- тивоположность случаю дискретного .выборочного пространства) не каждое множество имеет вероятность и не каждая функция является случайной величиной. К счастью, эта теоретическая сложность не очень заметна на практике, поскольку можно исхо- дить из интервалов и непрерывных функций и ограничиться соот- ветственно рассмотрением множеств и функций, которые могут быть получены из них посредством элементарных операций и (воз- можно, бесконечно многих) предельных переходов. Этим выде- ляются классы борелевских множеств и бэровских функций. Чита- тели, которых интересуют больше факты, нежели логические связи, могут не беспокоиться по поводу точных определений (приводимых в гл. IV). Им разумнее полагаться на собственную интуицию и считать, что все рассматриваемые множества и функции являются «хорошими». Приводимые теоремы настолько просты1), что для их понимания достаточно знакомства с элементарным анализом. Изло- жение является строгим, если условиться, что слова «множество» и «функция» сокращенно означают «борелевское множество» и «бэров- ская функция» соответственно. х) Следует понимать, что этой простоты нельзя достичь ни в какой тео- рии, использующей лишь непрерывные функции или какой-либо другой класс «хороших» функций. Например, в гл. II, (8.3), мы определили плотность ф бесконечным рядом. Скучно и бессмысленно устанавливать условия, при кото- рых ф является хорошей функцией, однако в простых случаях формула оче- видна, и она всегда имеет смысл, если ограничиваться бэровскими функциями, что и можно считать точным смыслом неопределенного выражения «формула всегда справедлива». Между прочим, будут указаны несколько случаев, где ограничение бэровскими функциями нетривиально [примером такого рода яв- ляется теория выпуклых функций, см. 8, б)],
152 Гл. V. Вероятностные распределения в ГАГ При первоначальном чтении можно ограничиться § 1—4 и 9. Параграфы 5—8 содержат результаты и неравенства, собранные для удобства ссылок. В последних параграфах, посвященных теории условных распределений и математических ожиданий, изложение ведется более полно, чем это необходимо для настоящего тома. В дальнейшем результаты этой теории будут использованы лишь от случая к случаю при рассмотрении мартингалов в гл. VI, 11, и гл. VII, 9. § 1. РАСПРЕДЕЛЕНИЯ И МАТЕМАТИЧЕСКИЕ ОЖИДАНИЯ Даже совсем безобидное использование термина «случайная величина» может содержать косвенную ссылку на весьма непростое вероятностное пространство или на сложный умозрительный экспе- римент. Например, теоретическая модель может включать в себя положения и скорости 1028 частиц, в то время как нам интересны лишь температура и энергия. Эти две случайные величины ото- бражают исходное выборочное пространство в плоскость 5i2, поро- ждая в ней вероятностное распределение. По существу, мы имеем дело с двумерной задачей, и первоначальное выборочное простран- ство утрачивает ясные очертания и превращается в фон. Конечно- мерные евклидовы пространства 31/ представляют собой, следова- тельно, наиболее важные выборочные пространства, и мы переходим к систематическому изучению соответствующих вероятностных распределений. Рассмотрим сначала случай прямой «Я1. Интервалы, определяе- мые неравенствами а<х<& и обозначим через а, b ।---1 и а, b соответственно. (Мы не исключаем предельный случай замк- нутого интервала, сводящегося к одной точке.) Полуоткрытые ---------------------------1 ।-- интервалы обозначаются а, Ь и а, Ь. В одномерном случае все случайные величины являются функциями координатной перемен- ной X (иными словами, функции, которая в точке х принимает значение х). Все вероятности можно, следовательно, выразить в терминах функции распределения F(x) ——оо<х<оо. (1.1) ——। В частности, интервал I = a, b имеет вероятность Р {1} — F (b)—F (а). Гибкое стандартное обозначение Р{ } становится неудобным, когда рассматриваются различные распределения. Применение новой буквы было бы неэкономичным, а использование обозначения Pf{ } для указания зависимости от F слишком неуклюже. Намного проще использовать одну и ту же букву F как для функции точ- ки (1.1), так и для функции интервала, и в дальнейшем вместо
§ 1. Распределения и математические ожидания 153 Р {/} мы будем писать F {/}. Иными словами, использование фигур- ных скобок { } будет означать, что аргумент в есть интер- - вал или множество и что F представляет собой функцию интер- валов (или меру). Когда используются круглые скобки, аргумент в F (а) есть точка. Соотношение между функцией точки F( ) и функцией интервала F { } выражается равенствами F (х) = F {—оо, 4, F = F(b) — F (а). (1.2) В действительности понятие функции точки F (х) излишне и слу- жит лишь для удобства обозначения и записи. Основным и пер- вичным является наделение вероятностями интервалов. Функция точки F( ) называется функцией распределения функции интерва- лов F\ }. Символы F( ) и F{ } -представляют собой различное выражение одного и того же, и никакой двусмысленности не появляется, когда говорят о «вероятностном распределении F». Следует привыкнуть думать в терминах функций интервалов и мер и использовать функцию распределения только как обозначение* 1). Определение. Определенная на прямой функция точки F есть функция распределения, если она (i) неубывающая, т. е. F(a)^F(b) при а<Ь9 (ii) непрерывна справа*), т. е. F (a)^=F (а+), (ш) удовлетворяет условиям F(—оо) = 0, F(oo)<oo. Функция распределения F, для которой F(oo) = l, называется вероятностной функцией распределения. Функция распределения называется дефектной (или несобственной), если F(oo)<l. Покажем, что каждая функция распределения задает (соответст- вующие ей) вероятности всех множеств на прямой. Первым шагом является наделение вероятностями интервалов. Поскольку F моно- тонна, предел слева F (а—) существует в каждой точке а. Опре- делим функцию интервалов F{I\, положив F (a~"b} — F (b)—F (a), F \~b} = F(b-)-F (а), (1 3) F {a, b\ — F(b)—F (а—), F \а, Ь\ == F (Ь—)—F (а—). I—-I ' Для интервала а, а, сводящегося к единственной точке а, имеем ~ F {a, a} = F (а)—F (а —), 1) Для вводных курсов представляется разумной педантичная тщатель- ность в использовании обозначений, однако автор надеется, что читатели не будут требовать такого рода «состоятельности» и найдут в себе смелость писать без различия F {/} и F (х). Это не повлечет никакой двусмысленности. В лучшей математической литературе стало привычным, к счастью, использо- вать один и тот же символ (в частности, 1 и =) на одной и той же странице в нескольких смыслах. 2) Как обычно, f (а-\-) обозначает предел (если он существует) значе- ний f(x), когда х—>а при условии х > а. Под f (оо) понимается предел f (х) при х —> оо. Аналогично определяются f (а —-) и / (— оо), Эти обозначения рас- пространяются и на многомерный случай.
154 Гл. V. Вероятностные распределения что представляет собой скачок F в точке а. (Вскоре мы увидим, что F непрерывна «почти всюду».) Чтобы показать, что определяемые формулами (1.3) значения вероятностей для интервалов удовлетворяют требованиям теории вероятностей, докажем следующую простую лемму (читатели могут принять ее как интуитивно очевидную). Лемма 1. (Счетная аддитивность.) Если интервал I представ- ляет собой объединение счетного числа непересекающихся интерва- лов , /2, то F{I}~%F{Ik}. (1.4) ---1 ---1 Доказательство. В частном случае, когда I-=a, Ьи /2 = a1; а2, /„ = «„_!, Ь, утверждение леммы тривиально. Про- извольное конечное разбиение / = а, b получается из этого разбие- ния перераспределением> конечных точек ak подынтервалов, так что правило сложения (1.4) для конечных разбиений выполняется. При рассмотрении случая бесконечного множества интерва- лов Ik, не ограничивая общности, можно допустить, что интер- вал I замкнут. В силу непрерывности справа функции распреде- ления F для любого заданного 8>0 можно найти содержащий Ik открытый интервал /*, такой, что Q^F{lt} — F{Ik}^&2~k. Поскольку существует конечная совокупность интервалов покрывающая /, то + + + (1.6) откуда p{i\<£p{ik}- О-6) Обратное неравенство тоже справедливо, так как для каждого п существует конечное разбиение /, содержащее в качестве подын- тервалов интервалы /1? ..., 1п. Тем самым лемма доказана. ► Как уже говорилось в гл. IV, 2, теперь можно определить для любого множества Л, представляющего собой конечное или счетное объединение непересекающихся интервалов Ак. Интуитивно можно ожидать, что любое множество допускает аппроксимацию такими объединениями интервалов, и теория меры это подтверж- дает1). Используя естественные приближения и переходы к пре- х) Следует иметь в виду принятое нами соглашение, согласно которому слова «множество» и «функция» сокращенно означают соответственно «боре- левское множество» и «бэровекая функция».
$ 1. Распределения и математические ожидания 155 делу, можно продолжить определение F на все множества так, чтобы свойство счетной аддитивности (1.7) сохранялось. Это про- должение единственно, и получающаяся в результате функция множеств называется вероятностным распределением или мерой. Замечание о терминологии. Термин «распределение» свободно используется в литературе в различных смыслах, и поэтому здесь уместно точно оговорить, что понимается под распределением в настоящей книге. Вероятностное распределение, или вероятностная мера, есть функция, ставящая в соответствие множествам числа и удовлетворяющая условию счетной аддитивности (1.7) и условию нормировки F{—оо, оо} = 1. Отбрасывая условие нормировки, получаем определение более общей меры (распределения массы). Весьма важным примером такой меры является мера Лебега (или обычная длина). Иногда приходится иметь делос мерами, тэтносительно которых масса всей прямой p = F {—оо, оо} меньше 1 (достаточно вспом- нить теорию рекуррентных событий из первого тома). Меру с та- ким свойством мы называем вероятностной несобственной или дефектной мерой с дефектом, равным 1—р. Иногда с целью стилистической ясности или желая подчеркнуть, что рассматри- вается не мера вообще и не дефектная вероятностная мера, а именно вероятностная мера, мы будем^ называть ее собственной вероят- ностной мерой, хотя прилагательное собственная и излишне. Аргументом меры является множество; при письме буква, обозначающая это множество, заключается в фигурные скобки. Каждой ограниченной мере т соответствует функция распределения, т. е. функция точки, определяемая равенством ----------------1 m(x)=m{— оо, х}. Функция распределения обозначается той же буквой, что и соответствующая ей мера, только аргумент ее заключается в круглые скобки. Двоякое использование одной и той же буквы не вызывает никаких недоразумений, и, более того, термин «распределение» может сокращенно обозначать как вероятностное распределение, так и его функцию распреде- ления. ► В 1, гл. IX, случайная величина была определена как вещест- венная функция на выборочном пространстве. Мы сохраняем здесь это определение. В случае когда выборочным пространством яв- ляется прямая, каждая вещественная функция есть случайная величина. Координатная случайная величина X является основ- ной, и все остальные случайные величины можно рассматривать как функции от нее. Функция распределения случайной вели- чины и. по определению равная P{w(X)C^}, может быть выра- жена в терминах функции распределения координатной случайной
156 Гл. V. Вероятностные распределения в ЗУ величины JX. Например, функция распределения величины X3 есть F (р/х). Функция и называется простой, если она принимает лишь счетное множество значений а±. а2, ... . Пусть и—простая функ- ция и Ап—то множество, на котором и равна ап. Скажем, что математическое ожидание функции и существует и равно E{u)^ahF{Ak\, (1.8) если ряд в правой части (1.8) абсолютно сходится. В противном случае и называется неинтегрируемой по отношению к F. Таким образом, и имеет математическое ожидание тогда и только тогда, когда существует E(|w|). Исходя из (1.8), можно следующим образом определить математическое ожидание произвольной огра- ниченной функции и. Возьмем 8>0 и обозначим через Ап мно- жество тех точек х, в которых (п—1)8 < и(х)^пъ. При любом разумном определении Е(и) должно быть 2 (п- V)fF{AJ < Е («) < £ mF {Ап\. (1.9) (Суммы в (1.9) представляют собой математические ожидания двух аппроксимирующих простых функций ст и о, таких, что и а—сг = 8.) Поскольку функция и, согласно предположению, ограничена, то суммы в (1.9) содержат лишь конечное число отличных от нуля членов. Разность этих сумм равна 8 J] F При замене 8 на 8/2 левая сумма, очевидно, увеличивается, а пра- вая—уменьшается. Отсюда легко вывести, что при 8—>0 обе суммы в (1.9) стремятся к одному и тому же пределу, который и полагается равным Е(и). Для неограниченной функции приме- нимо то же самое рассуждение, если оба ряда в (1.9) абсолютно сходятся; в противном случае Е (и) не определяется. Определенное таким простым способом математическое ожида- ние представляет собой интеграл Лебега—Стильтьеса от функ- ции и по отношению к распределению F. Когда желают под- черкнуть зависимость математического ожидания от F. предпочти- тельно использовать интегральное обозначение Е(и)= $ u(x)F{dx}. (1.10) — 00 За исключением редких случаев, мы будем иметь дело лишь с мо- нотонными функциями и или с кусочно-непрерывными функциями, такими, что для них множества Ап сводятся к объединению конечного числа интервалов. При этом суммы в (1.9) представ- ляют собой, с точностью до порядка суммирования, верхние и нижние суммы, используемые при элементарном определении обычных интегралов. Общий интеграл Лебега—Стильтьеса, обладая основными свойствами обычного интеграла, имеет дополнительное
§ 1. Распределения и математические ожидания 157 преимущество—при обращении с ним меньше приходится забо- титься о законности формальных операций и переходов к пределу. Мы будем использовать математические ожидания лишь в очень простых ситуациях, и никакой общей теории не потребуется для того, чтобы следить за отдельными этапами рассуждений. Чита- тель, интересующийся теоретическим фундаментом и основными фактами, может обратиться к гл. IV. Примеры, а) Пусть F—дискретное распределение, наделяющее точки alf а2, ... массами pif р2, ... . Ясно, что в этом случае математическое ожидание Е (и) функции и, если оно существует, ровно 2 и (ak) Pk, и условием существования Е (и) является абсо- лютная сходимость ряда ^u(a^pk. Это согласуется с определе- нием, данным в 1, гл. IX. б) Для распределений, задаваемых непрерывной плотностью, математическое ожидание и представляет собой интеграл 00 Е(ы)= и (х) f (x)dx, (1.11) — со если только этот интеграл сходится абсолютно. По поводу общего понятия плотности см. § 3. ► Обобщение вышеизложенного на многомерные пространства можно описать в нескольких словах. Точка в 5£2 представляет собой пару действительных чисел x = (xt, х2). Неравенства сле- дует понимать в покоординатном смысле1); так a<Zb означает, что и а2 < Ь2 (или, иными словами, «а лежит юго-запад- нее &»). Это отношение порядка является лишь частичным упо- - рядочением, т. е. две точки а и b не обязаны находиться в одном из двух отношений а < й, а Ь. Интервалами мы называем множества, определяемые четырьмя возможными типами двойных неравенств а < х < b и т. д. Интервалы представляют собой пря- моугольники со сторонами, параллельными осям координат, и могут также вырождаться в отрезки или точки. Единственно новым является то обстоятельство, что если —I —I а, с—двумерный интервал и а < b < с, то а, с не есть объедине- ——I------------1 ние а, b и Ь, с. Каждой функции интервала F {1} можно поста- вить в соответствие отвечающую ей функцию распределения, которая, как и в одномерном случае, определяется равенством ---------------1 ----1 F(x) = F{—оо, х}. Теперь, однако, в выражение F {а, Ь\ в тер- минах функции распределения входят все четыре вершины интер- вала. В самом деле, из рассмотрения дву/ бесконечных полос, параллельных х2—оси и имеющих основания—стороны прямо- 1) Это соглашение было введено в гл. Ill, 5,
158 Гл. V. Вероятностные распределения в *№ — -4 ----1 угольника а, Ь, непосредственно следует, что F {а, Ь} выражается через так называемую «смешанную разность» F {a, = F (&n &2)—F(au b2)—F (bi9 a2)+F(ab a2). (1.12) Для функции распределения F(x) = F(xi, х2) правая часть (1.12) неотрицательна. Отсюда следует монотонность F (хъ х2) по и х2, однако обратное неверно: монотонность F не обеспечи- вает положительности (1.12). (См. задачу 4.) Ясно, что в многомерном случае функции распределения яв- ляются не очень подходящим аппаратом: если бы не соображение аналогии со случаем пространства Si1, все рассмотрения, возможно, велись бы в терминах функций интервалов. Формально определе- ние функции распределения в SZ1 распространяется на Si2, если условие монотонности (1) заменить на условие неотрицательности смешанных разностей (1.12) при а^Ь. Так определенная функция распределения индуцирует функцию интервалов (соотношения подобны (1.3), в случае Si1 нужно лишь обычные разности заме- нить на смешанные). Лемма 1 сохраняется вместе с доказа- тельством х). Одно простое, но существенно важное свойство математических ожиданий принимается иногда как само собой разумеющееся. Любая функция и (X) = == и (Хх, Х2) от координатных переменных является случайной величиной и как таковая имеет функцию распределения G, Математическое ожидание Е (и (X)) можно определить двумя способами—как интеграл от и (х15 г2) по отношению к заданной вероятностной мере на плоскости, а также в терминах функции распределения величины и: со Е(п)= yG {dy}. (1.13) — 00 Оба определения эквивалентны в силу самого определения первого из этих интегралов с помощью аппроксимирующих сумм гл. IV, (4.3) 2). Существен- ным здесь является то обстоятельство, что математическое ожидание случай- ной величины Z (если оно существует) имеет внутренний смысл и не зависит от того, рассматривается ли Z как функция на исходном вероятностном про- странстве S3 или на пространстве, полученном при соответствующем отобра- жении ®; в частности, Z сама отображает 33 на прямую и превращается на ней в координатную величину. и В доказательстве используется тот факт, что при конечном разбиении одномерного интервала подынтервалы имеют естественный порядок слева направо. Столь же хорошее упорядочение имеет место при шахматных раз- биениях двумерного интервала а, 6, т. е. разбиениях на тп подынтервалов, —-Ч получаемых разбиениями отдельно обеих сторон а, b и проведением прямых, параллельных осям, через все точки подразбиений. Доказательство конечной аддитивности для таких шахматных разбиений не меняется, и каждому раз- биению соответствует его шахматное подразбиение. Переход от конечных разбиений к счетным одинаков при любом числе измерений. 2) Специальный случай содержится в теореме 1, гл. IX, 2Д.
§ 1. Распределения и математические ожидания 159 Начиная с этого места, не будет никакой разницы между слу- чаями пространства «%1 и пространства В частности, опре- деление математического ожидания не зависит от числа измерений. Резюмируя, можно сказать, что любая функция распределения индуцирует вероятностную меру на о-алгебре борелевских мно- жеств в Э1Г и тем самым определяет вероятностное пространство. Иначе говоря, мы показали, что вероятностная конструкция дискретных выборочных пространств, а также пространств с рас- пределениями, задаваемыми плотностями, распространяется без формальных изменений на общий случай. Тем самым оправдана вероятностная терминология, использовавшаяся в первых трех главах. Когда мы говорим об г случайных величинах Хх, ..., Хг, то подразумеваем, что все они определены на одном и том же вероят- ностном пространстве, и поэтому существует их совместное веро- ятностное распределение. При этом мы можем, если пожелаем,, рассматривать ХА как координатные величины в выборочном пространстве Э1Г. Вряд ли необходимо объяснять способ распространения таких понятий, как маргинальное (частное) распределение (см. гл. III, 1„ и 1, гл. IX, 1) или независимость случайных величин. Основные утверждения о независимых случайных величинах переносятся с дискретного на общий случай без изменений. (i) Независимость случайных величин X и Y с (одномерными) распределениями F и G означает, что функция совместного распределения (X, Y) задается произведениями F(x1)G(x2). Это может относиться к двум случайным величинам, определенным на заданном вероятностном пространстве, но может также пони- маться и как сокращенное выражение того, что мы вводим пло- скость с X и Y в качестве координатных переменных и определяем вероятности по правилу произведения. Сказанное в равной сте- пени применимо к парам, тройкам и вообще к любому числу случайных величин. (ii) Если совокупность т случайных величин (Хп . Х/л) не зависит от совокупности п случайных величин (Ylf .YJ, то случайные величины и(Х19 ..., XJ и v (Ylt .. .^ YJ независимы^, каковы бы ни были функции и и v. (iii) Для независимых X и Y справедливо равенство Е (XY) — ««Е (X) Е (Y), если только математические ожидания X и Y существуют (т. е. если соответствующие интегралы сходятся аб- солютно). Следующий простой результат часто приходится использовать. Лемма 2. Вероятностное распределение однозначно определяется значениями Е (и) для всех непрерывных функций и, обращающихся в нуль1 вне некоторого конечного интервала. Доказательство. Пусть / — конечный открытый интервал n’v— непрерывная функция^ которая положительна на / и равна нулю
160 Гл. V. Вероятностные распределения в вне /. Тогда r[/v(x)—^l при всех х£1 иА следовательно, Е (]/и) —> F {/}. Таким, образом, значения математических ожи- даний непрерывных функций, обращающихся в нуль вне некото- рого интервала, однозначно определяют значения F для всех открытых интервалов, которые в свою очередь однозначно опре- деляют F. ► Замечание Iг). Теорема Рисса о представлении. В последней лемме мате- матические ожидания определялись в терминах заданного вероятностного распределения. Часто (например, в проблеме моментов, см. гл. VII, 3) нам приходится отправляться от заданного функционала, назначая значения Е (и) некоторым известным функциям и. Вопрос в том, существует ли вероятно- стное распределение F, для которого + со E(u)== J и (х) F {dx}. (1Д4) — а> Оказывается, что следующие явно необходимые^ условия являются также и достаточными. Теорема. Допустим, что каждой непрерывной функции и обращающейся в нуль вне конечного интервала, соответствует число Е (и) со следующими свойствами-. (i) Функционал Е (и) является линейным, т. в. для всех линейных комби- наций выполняется Е (сгщ + с^ — с^ (щ) + с2Е (а2)* (ii) Функционал Е (и) положителен, т. е. E(w)^0 при и^О. (iii) Функционал Е (и) имеет норму 1, т. е. если 1, то Е (и) с 1, но при всяком 8 > 0 существует такая функция и, что и Е (и) > 1—е. Тогда существует единственное вероятностное распределение F, для кото- рого выполняется (1.14). Доказательство. Для произвольных t и h > 0 обозначим через г/, h непре- рывную функцию переменного х, которая равна 1 при x^t, равна 0 при x^t-\-h и линейна на промежуточном интервале t^x^t-\-h. Эта функция не обращается в нуль на бесконечности, но мы можем определить Е (г/, ^) посредством простой аппроксимации. Возьмем функцию ип, |цл|^1, такую, что Е (w„) определено и ип (х) = г/, (х) при ]х|<п. При т > п разность ит — ип внутри интервала —п, п равна тождественно нулю. Поэтому из условия, что Е имеет норму 1, можно легко вывести, что Е (ип—ит)—>0. Отсюда следует, что Е (ц„) сходится к конечному пределу и этот предел оче- видным образом не зависит от конкретного выбора аппроксимирующих функ- ций ип. Таким образом можно законным способом определить Е (г^ /Д = lim Е (ц„). Легко видеть, что даже в пределах расширенной области определения функ- ционал Е обладает тремя свойствами, постулируемыми теоремой. Положим далее F^ (t) = Е (ztt h). При фиксированном h эта функция монотонно меняется от 0 до 1. Она непрерывна, так как при 0 < 6 < h раз- ность Z/+6, ь—имеет треугольный график с высотой д/h и, следовательно, отношение приращений для F^ ограничено величиной \/h. При h—>0 функ- ции Fh монотонно убывают к пределу, который мы обозначим через F. Покажем, что F представляет собой, вероятностное распределение. Очевидно, что F монотонна и F (—оо) = 0. Кроме того, /7(/)^/7л(/—h), откуда следует, 4ToF(oo) = l. Остается показать, что F непрерывна справа. При г) Это замечание относится к вопросу, имеющему принципиальный инте- рес> и не будет использоваться в дальнейшем, Другрй подход см. в гд, IVa 5.
§ 1. Распределения и математические ожидания 161 заданных t и 8 > 0 выберем значение h столь малым, чтобы F (/) > (/)—8. Вследствие непрерывности мы имеем для достаточно малых 6 F (0 > Fh (0-е > Fh (/ + 6)—2s^F (/4-6) — 28, откуда следует непрерывность справа. Пусть и — непрерывная функция, обращающаяся в нуль вне конечного интервала а, Ь. Выберем а = aQ < а± < ... < ап = Ь такими, что внутри каж- дого подынтервала ak_lf а^ колебания значений функции и меньше, чем 8, Если h меньше длины наименьшего среди этих интервалов, то п и (ап) д 2ак~~1,Д1] 0’15) k— 1 * есть кусочно-линейная функция с вершинами в точках ak и a^-\-h. Поскольку и (ak) = uh (ak)> то \и — г/д|=с28 и, следовательно, |Е (zz)—Е (uh) | 28, Однако при h —> 0 п------------------1 Е («л) —> 2 и (ак) F {afe_!, ак}, (1,16) fc=l причем сумма справа в (1.16) отличается от интеграла в (1.14) меньше чем на 8. Таким образом, левая и правая части в (1.14) отличаются меньше чем на 3s, и, следовательно, (1.14) справедливо. Замечание II. О независимости и корреляции. Теория статистической кор- реляции восходит к тому времени, когда формализация теории была еще невозможна и понятие стохастической независимости по необходимости носило мистический характер. Уже тогда понимали, что независимость двух ограни- ченных случайных величин с нулевыми математическими ожиданиями влечет равенство Е (XY) = 0, однако сначала .думали, что это равенство должно быть и достаточным для независимости X и Y. После того как была обнаружена ложность этого заключения, долгое время искали условия, при которых обра- щение в нуль корреляции влечет стохастическую независимость. Как часто случается, история задачи и красота частных результатов затемнили тот факт, что современные методы позволяют дать чрезвычайно простое ее реше- ние. Следующая теорема содержит различные результаты, доказанные ранее трудоемкими методами. Теорема. Случайные величины X zz Y независимы тогда и только тогда, когда Е (и (X) v (Y)) = Е (и (X)) Е v ((Y) (1.17) для всех непрерывных функций и и v, обращающихся в нуль вне конечного ин- тервала. Доказательство. Необходимость условия очевидна. Достаточность его будет доказана, если показать, что для всякой непрерывной функции w (X, Y), равной нулю вне некоторого конечного интервала, математическое ожидание Е (w) совпадает с математическим ожиданием w относительно пары независимых случайных величин, распределенных как X и Y. Но, согласно (1.17), это верно для функций вида ш (X, Y) = zz(X)y (Y). Так как каждую непрерывную функцию wt обращающуюся в нуль вне некоторого конечного интервала, можно равномерно приблизитьJ) линейными комбинациями вида ^скик (X) Oft(Y), то, переходя к пределу, убеждаемся в справедливости нашего утверждения. I) См. задачу 10 в гл. VIII, 10, 6 № 249
162 Гл. V. Вероятностные распределения в $1Г § 2. ПРЕДВАРИТЕЛЬНЫЕ СВЕДЕНИЯ Настоящий параграф посвящен в основном известным или очевидным понятиям и фактам, связанным с функциями распре- деления в «%1. Как и в дискретном случае, &-й момент случайной величины X по определению полагается равным Е(ХЙ). При этом предпола- гается, что интеграл Е(Х*) = $ xkF{dx} (2.1) — 00 сходится абсолютно. Таким образом, Е (Xй) существует тогда и только тогда, когда Е (| X |й) < оо. Величина Е (| X |й) называется абсолютным моментом X порядка k. Она определена и для не- целых k > 0. Так как при 0<а<& имеет место неравенство | х |а | х + 1, то из существования абсолютного момента по- рядка b вытекает существование абсолютных моментов всех порядков а < Ь. Второй момент случайной величины X—т, где т—математи- ческое ожидание X, называется дисперсией X и обозначается VarX: Var (X) = Е ((X—m)2) = Е (X2)—m2. (2.2) В рассматриваемом общем случае дисперсия обладает теми же свойствами и играет ту же роль, что и в дискретном случае. В частности, если X и Y независимы и дисперсии VarX и VarY существуют, то Var (X + Y) - Var X + Var Y. (2.3) [Две случайные величины, удовлетворяющие равенству (2.3),} называются некоррелированными. В 1, гл. IX, 8, было показано^ что существуют зависимые некоррелированные случайные ве- личины.] Вспомним, что мы часто заменяли случайную величину на «нормированную величину» Х* = (Х—mj/a, где т = Е(Х) и о2 = = Var(X). Выражаясь физическим языком, можно сказать, что X* есть запись X в «безразмерных единицах». Вообще переход от X к (X—Р)/а при сс>0 есть изменение начала отсчета и еди- ницы измерения. Функция распределения новой случайной вели- чины равна F(ax + P), и нередко мы имеем дело по существу со всем классом функций распределения этого вида, а не с от- дельным представителем класса. Введем для удобства следующее Определение 1. Два распределения и F2 в 3F называются распределениями одного и того же типа1), если F2(x) == F^ax-j-fi), х) Это понятие было введено Хинчиным, который использовал немецкий термин «Klasse» (класс), однако в английской литературе «класс функций» имеет установившееся значение,
§ 2. Предварительные сведения 163 а > 0. Параметр а называют масштабным множителем, а па* раметр р—центрирующей постоянной (или параметром распо- ложения). Данное определение позволяет использовать выражения вида «F центрировано к нулевому математическому! ожиданию» или «центрирование не меняет дисперсии». Медианой распределения F называется число В, удовлетворяю- щее условиям F (В) > 1 /2 и F(B—) 1/2. Медиана может быть определена неоднозначно; если F(x) = 1/2 при всех х из некото- рого интервала а, Ь, то каждое х из этого интервала есть медиана. Распределение можно центрировать так, чтобы его медиана стала равной нулю. За исключением медианы, все рассмотренные понятия пере- носятся на случай любого конечного числа измерений, или, иными словами, на векторные случайные величины вида Х = (Х15 ..., Хл). Соответствующие векторные обозначения были введены в гл. III, 5, и не требуют никаких изменений. Математическое ожидание X представляет собой в этом случае вектор, а дисперсия X—матрицу. Первое, на что обращается внимание при рассмотрении графика функции распределения,— это разрывы и интервалы постоянства. Нередко приходится оговаривать, что точка не принадлежит интервалу постоянства. Введем следующую удобную терминологию, относящуюся к любому конечному числу измерений. Определение 2. Точка х является атомом, если она имеет положительную массу. Точка х, для которой F{/}>0, каков бы ни был открытый интервал I, содержащий х, называется точкой роста. Распределение F сосредоточено на множестве А, если дополнение А' имеет вероятность = 0. Распределение F называется атомическим, если оно сосредото- чено на множестве своих атомов. Пример. Расположим рациональные числа из отрезка 0, 1 в последовательность г19 г2,... так, чтобы с ростом номера числа рос и его знаменатель. Определим распределение F, положив вероятность каждой точки rk равной 2"^. Распределение F атомичес- I--1 кое, однако все точки замкнутого интервала 0, 1 являются точками роста F. В силу условия счетной аддитивности (1.7) сумма масс атомов не превосходит единицы, так что имеется не больше одного атома с массой > 1/2, не больше двух атомов с массой > 1/3 и т. д. Все атомы, следовательно, можно расположить в простую после- довательность alf а2,. .. так, чтобы соответствующие им массы не возрастали: pi^ р2^.. • . Иными словами, число атомов не более чем счетно. 6*
164 Гл, У. Вероятностные распределения в Распределение, не имеющее атомов, называется непрерывным. Предположим, что распределение имеет атомы с массами р2, ..., и обозначим p — ^Pk- Положим (2-4) ak<x где суммирование распространяется на все атомы из интервала -------1 — оо, %. Функция Еа(х), представляющая собой, очевидно, функ- цию распределения, называется атомической компонентой F. Если р=1, то распределение F является атомическим. При р <1 по- ложим q=l—р. Легко видеть, что [F—pFa]/q = Fc есть непре- рывная функция распределения. Таким образом, имеем F = pFa + qFc, (2.5) т. е. F является линейной комбинацией двух функций распреде- ления Fa и Fc, из которых Fa—атомическая, a Fc—непрерывная. Если F есть атомическая функция распределения, то (2.5) по- прежнему имеет место ср-1, причем в качестве Fc можно взять произвольную непрерывную функцию распределения. При отсут- ствии атомов в (2.5) будет р = 0. Нами доказана, таким образом, Теорема Жордана о разложении. Всякое вероятностное распре- деление является смесью атомического и непрерывного распределений вида (2.5) с р>0, ^>0, р + q = 1. Имеется один класс атомических распределений, из-за которых приходится иногда загромождать простые формулировки перечи- слением тривиальных исключений. Распределения этого класса лишь произвольным масштабным множителем отличаются от распределений, сосредоточенных в целочисленных точках, однако встречаются они весьма часто и поэтому заслуживают специаль- ного названия для удобства ссылок. Определение 3. Распределение F на ЗР называется арифмети- ческим х), если оно сосредоточено на множестве точек вида 0, ± ± 2%, .... Наибольшее число %, обладающее этим свойством, называется шагом F. § 3. плотности Первые две главы были посвящены изучению вероятностных распределений в 5J1, для которых вероятность произвольного Пожалуй, более общепринятым является термин «решетчатое распреде- ление», однако его употребляют в разных смыслах: некоторые авторы под решетчатым распределением понимают распределение, сосредоточенное на множестве а. а ± X, a ± 2А,, ..., где а—произвольно. (Биномиальное рас- пределение с атомами в точках i 1 в нашей терминологии является ариф- метическим распределением с шагом 1, в то время как в упомянутой другой терминологии оно—решетчатое распределения с шагом 2.)
§ 3. Плотности 165 интервала (а, следовательно, и вообще произвольного множества) задается интегралом F{4} = <p(x)dx. (3.1) А Распределения, рассматривавшиеся в гл. III, имеют такой же вид с той лишь разницей, что интегрирование происходит по лебего- вой мере (площади или объему) в 3$г. Если плотность ф в (3.1) сосредоточена на интервале 0, 1, то (3.1) можно переписать в виде F{A}=t ^q>(x)U{dx}, (3.2) А где U обозначает равномерное распределение на 0, 1. Последняя формула имеет смысл для произвольного вероятностного распре- деления U, и, когда F{—оо, оо} = 1, она определяет новое ве- роятностное распределение F. В этом случае мы говорим, что ф есть плотность F по отношению к U. В формуле (3.1) мера U бесконечна, в то время как в формуле (3.2) имеем U {—оо, оо} = 1. Это различие несущественно, поскольку интеграл в (3.1) может быть разбит на интегралы вида (3.2), распространенные на конечные интервалы. Хотя мы будем ис- пользовать (3.2) лишь в случаях, когда U есть либо вероятност- ное распределение, либо мера Лебега, как в (3.1), дадим, однако, следующее общее определение. Определение. Распределение F называется абсолютно непрерыв- ным по отношению к мере U, если для некоторой функции ф имеет место соотношение (3.2). При этом ф называется плот- ностью х) F по отношению к U. Наиболее важным частным случаем является, конечно, тот случай, когда имеет место (3.1), т. е. когда U есть мера Лебега. Функция ф в этом случае называется «обычной» плотностью. Введем теперь следующую сокращенную запись: F {dx} = ф (х) U {dx}. (3.3) Эта запись имеет лишь тот смысл, что для всех множеств вы- полняется равенство (3.2), и никакого специального смысла символу dx придавать не следует. Пользуясь этой сокращенной записью, мы будем записывать (3.1) в виде F {dx} = q(x)dx> и если U имеет обычную плотность и, то (3.2) принимает вид F {dx} = ф (х) и:(х) dx. Примеры, а) Пусть U—вероятностное распределение на со вторым моментом, равным т2. Тогда F{dx} = — x4J {dx} х) В теории меры функция ф называется производной Радона — Никодима распределения F по отношению к U*
166 Гл, V. Вероятностные распределения в 91г есть новое вероятностное распределение. В частности, если U — равномерное распределение на 0, 1, то Г(х)==х3 при 0 < х < 1, а если U имеет плотность £~*(х>0), то F есть гамма-распреде- ление с обычной плотностью -±-х* 2е~х. б) Пусть U — атомическое распределение, наделяющее атомы alt a2i .. . массами plf р2, ... (здесь ^Рь = 0- Распределение F имеет плотность ср по отношению к U тогда и только тогда, когда оно атомическое и все его атомы являются также атомами распределения U. Если F имеет в массу q}-, то плотность ср задается посредством равенства Ч (ak} = qk/pk. Значение ср в точках, отличных от точек а}-, не играет никакой роли, и лучше всего считать <р в этих точках неопределенной. Теоретически подынтегральная функция ср в (3.2) определена неоднозначно. В самом деле, если N—такое множество, что U{N} = 0, то ср можно как угодно изменить на N и при этом (3.2) останется в силе. К этому, однако, и сводится вся неодно- значность в определении ср: плотность определена однозначно с точностью до значений на нулевом множестве х). На практике условиями непрерывности диктуется обычно однозначный выбор плотности, и поэтому, как правило, говорят о некоторой опре- деленной плотности, хотя, конечно, более правильно говорить о некоторой из плотностей. Из (3.3), очевидно, следует, что для любой ограниченной функции v 2). v(x) F {dx\ = v(x) (р (%) U \dx\, (3.4) В частности, если все значения функции ср больше (или меньше) нуля на некоторое число, то, взяв у = получим формулу х) В самом деле, пусть <р и (рг—две плотности F по отношению к U. Рассмотрим множество А всех точек х, для которых ср (х) >(pi(x)4~s. Из равенств F {Л} = J <р (х) U {dx} <рх (х) U {dx} А А следует, что £7 {Л} = 0, и поскольку это верно для любого 8 > 0, то ср (х) = == фх (х) всюду, за исключением множества N, такого, что Е {А/} = 0. 2) Читателям, которых смущает справедливость соотношения (3.4), сле- дует обратить внимание на то, что для непрерывных плотностей (3.4) сво- дится к правилу подстановки для интегралов. Следующее доказательство (3.4) в общем случае использует стандартное рассуждение, применимое и в более общих ситуациях. Формула (3.4) тривиальна, когда v есть простая функция, принимающая лишь конечное число различных значений. Для любой ограниченной ^функции v существуют две простые функции с конечным числом значений р и v, такие, что v < v и v — v < 8, и поэтому из справедливости формулы (3.4) для всех простых функций вытекает ее справедливость в об- щем случае.
§ 3. Плотности 167 обращения для (3.2): t/W=^/7W- (3-5) Полезный критерий абсолютной непрерывности содержится в одной из основных теорем теории меры,, которую мы приведем здесь без доказательства. Теорема Радона—Никодима х). Распределение F абсолютно непрерывно по отношению к мере U тогда и только тогда, когда U {А\ = 0 влечет F{A\ = Q. (3.6) Условие (3.5) можно перефразировать следующим образом: U-нулевые множества являются также F-нулевыми множествами. Приведем одно важное следствие теоремы Радона—Никодима,, которое, однако, нигде в дальнейшем непосредственно исполь- зоваться не будет. Критерий. Распределение F абсолютно непрерывно по отно- шению к мере U тогда и только тогда, когда каждому е > О соответствует б > 0, такое, что для любой совокупности непе- ресекающихся интервалов ..., 1п {Ik\ < б влечет J] F {Ik\ < е. (3.7) 4 1 1 Весьма важным частным случаем выполнения (3.7) является тот случай, когда для всех интервалов F{I}^aU{I\. (3.8) При этом (3.7) выполняется с б = е/а, и, как легко видеть,j плотность F по отношению к U не превосходит а. За. Сингулярные распределения * 2) Условие (3.6) теоремы Радона—Никодима наводит на рас- смотрение случая, прямо противоположного случаю абсолютно непрерывных распределений. Определение. Вероятностное распределение F сингулярно по отношению к U, если оно сосредоточено на множестве N, таком, что U {N\ = 0. Особую роль здесь играет мера Лебега U \dx\ = dx, и когда говорят, что распределение «сингулярно», и не делают при этом дополнительных пояснений, имеют в виду, что оно сингулярно по отношению к мере Лебега. Каждое атомическое распределе- ние сингулярно по отношению к dx, но имеются и непрерывные распределения в ЭР, сингулярные относительно dx: таковым яв- х) Эту теорему нередко называют теоремой Лебега — Никодима. Соотно- шение (3.6) может быть принято в качестве определения абсолютной непре- рывности, и в этом случае теорема будет утверждать существование плотности. 2) Хотя принципиально сингулярные распределения очень важны, они появляются в этой книге лишь между прочим,
168 Гл. V. Вероятностные распределения в Г& ляется канторовское распределение, рассмотренное в примере 11, г) гл. I. Сингулярные распределения не поддаются аналитическому изучению, и их явное представление практически невозможно. Чтобы иметь возможность применять аналитические методы, при- ходится, следовательно, накладывать ограничения, которые обес- печивают либо абсолютную непрерывность, либо атомичность рас- сматриваемых распределений. Сингулярные распределения, однако, играют важную принципиальную роль, и многие статистические критерии основываются на их существовании. Это обстоятельство затемняется бытующим мнением, что «в практике» сингулярные распределения не встречаются. Примеры, в) Испытания Бернулли. В примере 11, в) гл. I было показано, что выборочное пространство последовательностей УУ...Н... (успехов «У» и неудач «Н») можно отобразить на единичный интервал, пользуясь простым приемом замены символов «У» и «Н» на 1 и 0 соответственно. Выборочным пространством становится тогда единичный интервал, и результат бесконечной последовательности испытаний представляется случайной величи- ной Y гДе X*—независимые случайные величины, при- нимающие значения 1 и 0 с вероятностями р и q. Обозначим распределение Y через Fp. Если испытания симметричны, то Fp^F^/z есть равномерное распределение, и модель принимает привлекательный простой вид. По существу эквивалентность сим- метричных испытаний Бернулли со «случайным выбором точки из О, 1» использовалась с самого возникновения теории вероятностей. Далее в силу закона больших чисел распределение Fp сосредо- точено на множестве Np тех точек, в двоичном разложении которых частота цифры 1 стремится к р. При р^=а множе- ство Na имеет вероятность нуль и, следовательно, распре- деления Fp сингулярны по отношению друг к другу. В частности,] при р^= 1/2 распределение Fp сингулярно по отношению к равно- мерному распределению dx. Точного представления для Fp прак- тически не существует,, и поэтому описанная конструкция редко используется при рУ=1/2. Два обстоятельства заслуживают осо- бого внимания. Во-первых, посмотрим, что было бы, если бы частный случай р=1/3 представлял особый интерес или часто встречался в при- ложениях. Мы заменили бы тогда двоичное разложение чисел троичным и ввели бы новый масштаб так, чтобы F1/3 представляло собой равномерное распределение. «Практически» мы по-прежнему имели бы дело лишь с абсолютно непрерывными распределениями,] однако в основе этого лежит скорее выбор подхода, чем истинная природа вещей. Во-вторых, симметричность или несимметричность монеты можно проверить статистическими методами и можно достичь практически определенного решения после конечного числа испы-
§ 4. Свертки 169 таний. Это оказывается возможным лишь благодаря тому, что события, являющиеся правдоподобными при гипотезе р = 1/2,; весьма неправдоподобны при гипотезе р = 1/3. Небольшое размыш- ление показывает, что возможность принять решение после ко- нечного числа испытаний^ основана на сингулярности Fp при р=# 1/2 по отношению к F1/2. Таким образом, существование сингулярных распределений является существенным для статистической практики. г) Случайные направления. В гл. I,, 10, было введено понятие единичного вектора в 5£2 со случайным направлением. Распреде- ление такого вектора сосредоточено на единичной окружности и, следовательно, является сингулярным по отношению к мере Ле- бега (площади) в плоскости. Можно было бы думать, что в этом случае в качестве выборочного пространства следует взять окруж- ность, однако в некоторых практических задачах такой вариант выборочного пространства невозможен [см. пример 4, д)]. Теорема Лебега о разложении. Каждое вероятностное распре- деление F является смесью вида F = pFs + qFac, (3.9) где р^О, р + q = 1, двух вероятностных распределений Fs и Fac, из которых Fs сингулярно, a Fac абсолютно непрерывно по отношению к заданной мере U. Применяя к Fs жорданово разложение (2.5), получаем, что F можно представить в виде смеси трех вероятностных распределений, из которых первое—атомическое, второе—абсолютно непрерывное по отношению к U {dx}, а третье непрерывно, но сингулярно. Доказательство. Множество У, для которого {/{У}=0, бу- дем называть для краткости нулевым множеством. Пусть р есть верхняя грань значений F {Л/} по всем нулевым множествам N. Для каждого п существует нулевое множество Nn, такое, что F{Nn\>p—l/п. При этом F{A}^l/n для всякого нулевого множества Л, лежащего в дополнении У„. Для множества N — = UNn имеем (7{У} = 0 и F{N\ = p, так что никакое нулевое множество, лежащее в дополнении У', не может иметь положи- тельной вероятности. Если р=1, то F сингулярно, тогда как равенство /7 = 0 озна- чает, что F абсолютно непрерывно. При 0 < р < 1 утверждение теоремы выполняется для двух вероятностных распределений, определенных формулами pFs{A} = F{AN\, q-Fac{A\ = F{AN'}. (3.10) § 4. СВЕРТКИ Трудно переоценить важность операции свертки во многих областях математики. Нам придется иметь дело со сверткой с двух точек зрения: и как с операцией, применяемой к распределе-
170 Гл. V. Вероятностные распределения в 91г ниям, и как с операцией, применяемой к распределению и непре- рывной функции. Для определенности мы будем рассматривать распределения в /%1, однако при использовании векторных обозначений § 1 все формулы остаются в силе и для распределений в пространстве любой размерности. Определение свертки на окружности следует схеме, описанной в гл. II, 8, и не требует дополнительных пояс- нений. (Более общие свертки можно определить на произвольных группах.) Пусть F—вероятностное распределение и ср—ограниченная функция точек. (В рассматриваемых нами приложениях ср будет либо непрерывной функцией, либо функцией распределения.) Опре- делим новую функцию и, полагая 00 м(х) = J <р(х—y)F{dy}. (4.1) — 00 Если F имеет плотность f (по отношению к dx), то 00 U(x)= J ф(х—y)f(y) dy. (4.2) — 00 Определение 1. Функция и в (ДА) называется сверткой функции Ф с вероятностным распределением F. Для такой свертки будет использоваться обозначение u = F*q). Если F имеет плотность f, то мы будем писать u = fx-q>. Отметим, что порядок компонент в свертке (4.1) существен: символ ср ★ F, вообще говоря, смысла не имеет. С другой стороны, интеграл в формуле (4.2) имеет смысл для любых интегрируе- мых функций f и ср (даже если f принимает значения разных знаков) и символ * используется в этом обобщенном смысле. Огра- ниченность функции ф была введена конечно, ради простоты и вовсе не является необходимой. Примеры, а) Если F—равномерное распределение на 0, а, то X W(X) = V S <p(s)ds. (4.3) х-а Ясно, что в этом случае функция и непрерывна; если предположить еще, что функция <р непрерывна, то и будет обладать непрерывной производной и т. д. Вообще говоря, и ведет себя лучше, чем <р, так что свертка служит сглаживающим оператором. б) Формулы свертки для экспоненциальных и равномерных распределений [гл. 1, (3.6), и гл. I, (9.1)] являются частными случаями общей формулы. Примеры сверток распределений в 5?2 имеются в гл. Ш, (1.22), и в задачах 15—17 гл. III. >
§ 4. Свертки 171 Теорема 1. Если функция <р ограничена и непрерывна, то свертка u = F ★ ф тоже ограничена и непрерывна. Если ф—веро- ятностное распределение, то и тоже является вероятностным распределением. Доказательство. Если ф—ограниченная непрерывная функция, то, согласно принципу мажорированной сходимости, и (%+/i) —> и (%). По тем же соображениям из непрерывности справа функции ф следует непрерывность справа и. Наконец, поскольку ф монотонно меняется от 0 до 1, то же самое справедливо для и. > Следующая теорема дает вероятностную интерпретацию свертки F Ф, когда ф есть функция распределения. Теорема 2. Пусть X и Y—независимые случайные величины с распределениями F и G. Тогда P{X+Y<4= J G(i — x)F{dx\. (4.4) — 00 Доказательство х). Возьмем 8 > 0 и обозначим через 1п интервал п& < х^(п+ 1)8, /1 = 0, ±1, ... . Появление при некотором /г события {X б Y t—п&} влечет появление события {Х+ Y /}>. Следовательно, поскольку события {X£/W_f, Y /—п&} взаимно исключают друг друга и случайные величины X, Y независимы, имеем P(X + YCO>SG(/-«e)F{/„_ib (4.5) Справа в этой формуле стоит интеграл от ступенчатой функции Ge, которая на /n_j равна G (t—пе). Поскольку Ge (у) G (t—е—у), то P{X + Y</}> J G(t—8—x\F{dx). (4.6) — 00 Аналогичное рассуждение приводит к противоположному нера- венству с 8, замененным на —8. Устремляя 8 к нулю, получаем (4.4). к Пример, в) Пусть распределения F и G сосредоточены на мно- жестве целых неотрицательных чисел 0, 1, 2/ ... , причем соот- ветствующие точке k Массы равны рк и qk. В этом случае интеграл в формуле (4.4) сводится к сумме —£)р&. Функ- ция, представляемая этой суммой, обращается в нуль при /<0 и постоянна на каждом интервале п—1 < t < п. Скачок ее при х) Формула (4.4) представляет собой частный случай теоремы Фубини [гл. IV, (2.11)]. Утверждение, обратное теореме 2, неверно: мы видели в гл. II, 4, д), и в задаче 1 из гл. III, 9, что в исключительных случаях фор- мула (4.4) может иметь место и для пары зависимых случайных величин X и Y
172 Гл. V. Вероятностные распределения в S{r t = n равен S Яп-kPk = ЯпРо + Qn-iPi + • • • + QoPn, (4-7) k=0 что согласуется с формулой свертки [1, гл. XI, (2.1)] для неот- рицательных целочисленных случайных величин. Обе предыдущие теоремы показывают, что свертка двух функ- ций распределения F*G снова приводит к функции распреде- ления U. Из коммутативности сложения X+Y вытекает, что F ★ G^G* F. При совершенной системе обозначений можно было бы ввести новый символ для свертки функций распределе- ния, однако это вряд ли было бы полезнымJ). Конечно, U следует рассматривать как функцию интервалов или меру- для любого интервала 1 = а, b имеем, очевидно, О0 £/{/}=$ G{I—y\F{dy}, (4.8) — 00 где, как обычно, /—у обозначает интервал а—у, b—у. (Эта фор- мула автоматически переносится на произвольные множества.) В силу коммутативности F и G в формуле (4.8) можно поменять местами. Рассмотрим теперь три распределения F2, F3. Из ассоци- ативности сложения случайных величин следует, что (Fj^F2)^F3 = = F± F3). Следовательно, при обозначении свертки трех распределений можно не пользоваться скобками и писать просто Ft ★ F2 ★ F3. Резюмируем сказанное выше в следующих теоремах. Теорема 3. В классе распределений операция свертки комму- тативна и ассоциативна. Теорема 4. Если распределение G непрерывно (т. е. не имеет атомов), то свертка U = F G тоже непрерывна. Если G имеет г) Иными словами, символ А*В используется, когда интегрирование происходит по мере А. Свертка А^В является функцией точки или мерой в соответствии с тем, является ли В функцией точки [как в (4.1)] или мерой [как в (4.8)]. Звездочка * используется для операции между двумя функ- циями, когда интегрирование происходит по лебеговой мере. Мы применяем этот тип свертки почти исключительно к вероятностным плотностям. Можно дать более общее определение свертки двух функций, положив 00 = р (X—у) g (у) т {dy}, — 00 где т — произвольная мера. Суммы вида (4.7) представляют собой частный случай этой формулы, а именно когда т сосредоточена на множестве неот- рицательных целых чисел и каждому такому числу сопоставлена единичная масса. В этом смысле наше теперешнее использование звездочки согласуется с ее использованием для сверток последовательностей в 1, гл. XI, 2,
§ 4. Свертки 173 обычную плотность <р, то U имеет обычную плотность и, зада- ваемую формулой (4.1). Доказательство. Первое утверждение содержится в теореме 1. Если есть плотность распределения G, то, интегрируя (4.1) по интервалу /, справа получим правую часть (4.8), так что и дей- ствительно является плотностью распределения U, определяемого формулой (4.8). Из теоремы, в частности, следует, что если F и G имеют плотности f и g, то свертка F^G имеет плотность h = f *g: + 00 h(x) = $ f (х—у) g(y)dy. (4.9) — оо Вообще говоря, функция h обладает большей гладкостью, чем любая из функций f и g. (См. задачу 14.) Суммы Sn = X1 + ... +ХП " взаимно независимых случайных величин с общей функцией распределения F встречаются очень часто, и поэтому для их распределения удобно ввести специаль- ное обозначение. Распределение суммы Sn есть п-кратная свертка распределения F с собой и обозначается Р2*. Имеем, таким образом, /71 =р9 p(n + D* * F. (4.10) Сумму без слагаемых условно считают равной нулю. В соответ- ствии с этим мы определим Р* как атомическое распределение, сосредоточенное в нуле. Тогда (4.10) будет выполняться и при И?=0. Если F имеет плотность /, то Р2* имеет плотность f * ... (п раз), которую мы обозначим fn*. Эти обозначения согласуются с обозначениями, введенными в гл. I, 2. Замечание. Следующие примеры показывают, что свертка двух сингулярных распределений может иметь непрерывную плотность. Из этих примеров видно также, что можно эффективно вычислять свертки, не используя определяю- щую их формулу. Примеры, г) Равномерное распределение на 0, 1 является сверткой двух сингулярных распределений канторовского типа. В самом деле, пусть Xf, Х2, «<•—взаимно независимые случайные величины, принимающие значения О и 1 с вероятностью 1/2. В примере 11, в) гл. I мы видели, что случайная величина X = 2~“^Xfc имеет равномерное распределение. Обозначим сумму членов ряда с четными и нечетными номерами через U и V соответственно. Очевидно, U и V независимы и X = U-f-V. Следовательно, равномерное распределение есть свертка распределений величин U и V. Ясно далее, что величины U и 2V имеют одинаковые распределения, а величина V лишь обозначением отличается от величины х/з¥ примера 11, г) гл. I. Иными словами, распределения величин U и V лишь масштабными множителями отличаются от рассмотренного в этом примере канторовского распределения. д) Случайные величины в ffi2. Распределение единичного вектора со слу- чайным направлением (см. гл. I, 10) сосредоточено на единичной окружности и, следовательно, сингулярно относительно лебеговой меры на плоскости.
174 Гл. V. Вероятностные распределения в 3jr Тем не менее длина L суммы двух таких независимых векторов имеет распре- _ 2 1 ---- деление с плотностью-----г , сосредоточенное на 0, 2. В самом деле, по- л у 4— г2 закону косинусов L = yr2—2 cos со = 12 sin — со | , где со—угол между двумя векторами. Так как -у со имеет равномерное распределение на 0, л, то Р {L г} = Р Л 2 sin Л=—- arcsin г, 0 < г < 2, (4.11) I I j I Л что и требовалось доказать. (См. задачу 12.) ► 4а. О точках роста Здесь необходимо прервать изложение, чтобы зафиксировать некоторые элементарные факты относительно точек ростка свертки F ★ G. Первая лемма интуитивно понятна, вторая имеет технический характер. Этот материал будет использован лишь в теории восстановления, и потому косвенно в теории слу- чайных блужданий. Лемма 1. Если а и b—точки роста распределений F и G, то а-\-Ь есть точка роста свертки F*G. Если а и b — атомы F и G, то а-[-Ь есть атом F ★ G и каждый атом F it G может быть так получен. Доказательство, Для независимых X и Y имеем P{|X + Y— a — b\ < s/s? || X—а| < 1 е}-р|| Y — М < 4 е}’- Если а и b суть точки роста, то правая часть этого неравенства положительна при любом 8 > 0, и поэтому а-\-Ь тоже является точкой роста F it G. Обозначим Fa и Ga атомические компоненты F и G в жордановом разложении (2.5). Очевидно, атомическая компонента композиции F it G равна FaitGa, и поэтому все атомы F i? G имеют вид «+&, где а и b суть атомы F и G соответственно. ► Внутренняя простота следующей леммы немало теряет из-за той специаль- ной роли, которую играют в ней, с одной стороны, арифметические распре- деления, а с другой — распределения положительных случайных величин. Лемма 2. Пусть F — распределение в и S — множество, образованное точками роста распределений F, Z72*, F3*, .... а) Предположим, что F не сосредоточено на полуоси. Тогда если F не является арифметическим распределением, то S плотно в —оо, оо, а если F—арифметическое распределение о шагом X, то S = {0, ± X, ± 2Х, I---- б) Пусть F сосредоточено на 0, оо, но не сосредоточено в нуле. Если F не является арифметическим распределением, то S «асимптотически плотно на оо» в том смысле, что для любого заданного 8 > 0 при всех достаточно больших х интервал х, х-{-8 содержит точки из S. Если F—арифметическое распределение с шагом к, то S содержит все точки вида пк при достаточно больших п. Доказательство. Пусть а, Ь, 0 < а < Ь,—две точки множества 2, и пусть h — b—а. Будем различать два случая: (i) При каждом 8 > 0 можно выбрать а, b такие, что h < 8. (ii) Существует д > 0 такое, что h д при всех возможных выборах точек а, Ь. Обозначим через 1п интервал na<x^nb. Если п (Ь—а) > а, то этот интервал содержит па, (п-{-\)а в качестве подынтервала и, следовательно, любая точка х > х0 = а2ДЬ—а) принадлежит по крайней мере одному из ин-
§ 5. Симметризация 175 тервалов 11у /2, ••• • По лемме 1 (п+1) точек na-\-kh, k = Q, ... , п, при- надлежат 2, и эти точки разбивают 1п на я подынтервалов длины h. Таким образом, всякая точка х > х0 находится на расстоянии, не превосходящем Zi/2, от точки множества 2. В случае (i) отсюда вытекает, что множество 2 асимптотически плотно I-------------------------------------- на +оо. Если при этом F сосредоточено на 0, оо, то ничего не надо дока- зывать. В ином случае пусть —с < 0 — точка роста F. Для произвольного у и достаточно большого п интервал пс-\-у < х < пс+//+8 содержит точку s множества 2. Поскольку s—пс снова принадлежит 2, то отсюда вытекает, что любой интервал длины 8 содержит какие-либо точки множества 2 и, таким образом, 2 всюду плотно В случае (ii) можно допустить, что а и b были выбраны так, что h < 26. Тогда точками вида na-\-kh исчерпываются все точки множества 2, лежащие внутри 1п. Так как точка (п+1)а находится среди этих точек, это означает, что все точки 2 внутри 1п являются кратными h. Пусть теперь с—произ- вольная (положительная или отрицательная) точка роста F. При достаточно большом п интервал 1п содержит точку вида kh-\-c, а так как она принадле- жит 2, то отсюда вытекает, что с кратно h. Таким образом, в случае (ii) распределение F является арифметическим. ► Один частный случай этой теоремы представляет особый интерес. Каждое число х > 0 можно представить единственным образом в виде х = т + £, где т—целое и 1. Число | в этом представлении называется дробной долей х. Рассмотрим теперь распределение F, сосредоточенное в двух точках —1 и а > 0. Соответствующее множество 2, включая в себя все точки вида па—т1), содержит дробные доли всех чисел а, 2а, ... . Если a = p/q, где р и q — взаимно простые натуральные числа, то F — арифметическое распре- деление с шагом l/q. Мъ\ приходим, таким образом, к следующему результату (в гл. VIII, 6, будет доказана теорема 3 о равномерном распределении, уточ- няющая этот результат). Следствие. Для любого иррационального а > 0 дробные доли чисел а, 2а, За, ... образуют множество, плотное в 0, 1. § 5. СИММЕТРИЗАЦИЯ Пусть X—случайная величина с распределением F. Распреде- ление случайной величины — X мы будем обозначать ~F. В точ- ках непрерывности имеем -F(x)=l—F(—х), (5.1) и это соотношение однозначно определяет "F. Распределение F называется симметричным, если ~F = F. [В случае когда суще- ствует плотность /, симметричность означает, что f(—х) =/(%).] Пусть Хп Х2—независимые случайные величины с одним и тем же распределением F. Случайная величина Хг—Х2 имеет симметричное распределение °F, равное oF = F*-F. (5.2) Из свойства симметрии °F(x) = l—°F (—х) непосредственно сле- х) Множество 2 здесь в точности совпадает с множеством точек па—т, т, п — 0, 1, i8. .— Прим, перев,
176 Гл. V, Вероятностные распределения в дует, что 00 »F(x)= J F(x + y)F{dy}. (5.3) — 00 О распределении °F говорят, что оно получено в результате сим- метризации F. Примеры, а) Симметризация показательного распределения приводит к двустороннему показательному распределению [гл. II, 4, а)]; результатом симметризации равномерного на 0, 1 распреде- ления является треугольное распределение т2 [см. гл. II, (4.1)]. б) Симметричное распределение, имеющее атомы массы 1/2 в точках ±1, не является результатом симметризации никакого распределения. в) Пусть F—атомическое распределение, наделяющее точки О, 1, ... массами р0, pf, .... Тогда симметризованное распре- деление °F тоже является атомическим, имеющим в точках ± я массу <7п=2аЛ+п, = (5.4) /г = 0 В частности, для пуассоновского распределения F при п О имеем 00 , = ^¥ж=е’2“;'г(2а)’ (5’б) где 1п—функция Бесселя, определенная в гл. II, (7.1) (см. за- дачу 9). fc- Применение симметризации позволяет значительно упростить многие рассуждения. В связи с этим весьма важным является то обстоятельство, что хвосты распределений F и °F имеют сравни- мую величину. Более точно это выражено в нижеследующих нера- венствах. Смысл этих неравенств представляется более ясным, когда они выражены в терминах случайных величин, а не в тер- минах самих функций распределения. Лемма 1. Неравенства симметризации. Если Xf, Х2—незави- симые и одинаково распределенные случайные величины, то при t>0 РЦХ,-х2| > 4<2Р^|Х1|>17}. (5.6) Если а^О таково, что Р{Х(-^а}^р и Р{Хг-3>—то Р {| Хх—Х21 > 0 > рР {| Хх I > t + а}. (5.7)
§ 5. Симметризация 177 В частности, когда медиана Ху- равна нулю, имеем (5.8) Доказательство. Неравенство (5.6) является следствием того очевидного обстоятельства, что событие |Х£—Х2|>^ осуществ- ляется лишь тогда, когда осуществляется хотя бы одно из собы- тий | Xf | > -i-t, | Х2 | > -i-1. Для доказательства (5.7) достаточно заметить, что каждое из непересекающихся событий Х3: > t + а, Х2<яи Xf < — t—а, Х2^ — а влечет событие | Xf — Х2|^Л > Симметризация часто используется при оценке сумм независи- мых случайных величин. В этой связи особенно полезно следую- щее неравенство. Лемма 2. Если Xf, ..., Хп—независимые случайные величины с симметричными распределениями, то сумма Sn = Xf + ... + ХИ тоже имеет симметричное распределение и P{|X1+...+X„[>0>yP{max|X/|>0. (5.9) Если Ху. имеют одинаковое распределение F, то P{| xt+ ... +х„ I > (5.10) Доказательство. Пусть М—случайная величина, равная первой из величин среди Xf, ... , Хп, имеющих наибольшее значение по абсолютной величине. Положим T = S„—М. Двумерная случай- ная величина (М, Т) имеет симметричное распределение в том смысле, что все четыре случайные величины (± М, ± Т) имеют одинаковое распределение. Имеем, очевидно, Р{М> 0<P{M> t, Т>0} + Р{М>£, Т<0}. (5.11) Слагаемые справа в (5.11) равны по величине, и поэтому P{S„> Z} = P{M + T> Z}>P{M> t, T>o}>y P{M> 0, (5.12) что равносильно (5.9). Чтобы доказать (5.10), заметим, что во всех точках непре- рывности Р {шах | X,. К t} = (F (/)—F (— OF < w+F<-01, (5.13) в силу того, что 1—х < е~х при 0<х<1. Отсюда сле- дует (5.10).
178 Гл. V. Вероятностные распределения в § 6. ИНТЕГРИРОВАНИЕ ПО ЧАСТЯМ. СУЩЕСТВОВАНИЕ МОМЕНТОВ Известную формулу интегрирования по частям можно приме- нять также к интегралам по распределениям в 511. Если функ- ция и ограничена, имеет непрерывную производную и', то ь+ ь J и(х) F {dx} = и {b) F {Ь)— u(a)F(a) — и' (х) F (x)dx. (6.1) а а Доказательство. Простым преобразованием (6.1) сводится к виду b+ ь [и(Ь)—u(a)]F{dx}— ^u'(x)[F'{x) — F (a)]dx = 0. (6.2) a a Предположим, что |и'|^Л4, и рассмотрим разбиение а, b на конгруэнтные интервалы Ik длины h. Легко убедиться в том, что вклад Ik в левую часть (6.2) по абсолютной величине меньше чем 2MhF {Ik}. Суммируя по всем k, находим, что левая часть в (6.2) по модулю меньше 2Mh, что в свою очередь может быть сделано таким малым, как мы пожелаем. Таким образом, левая часть (6.2) в самом деле равна нулю. В качестве приложения выведем одну часто используемую фор- мулу [обобщающую 1; гл. XI, (1.8)]. Лемма 1. Для любого а > О 00 00 § xaF {dx} = a х^"1 [1 — F (%)] dx, (6.3) о о причем из сходимости одного из этих интегралов следует сходи- мость другого. Доказательство. Поскольку интегрирование в (6.3) происходит по бесконечному интервалу, мы не можем применять (6.1) непо- средственно, однако после тривиальных преобразований при b <оо из (6.1) следует, что ь+ ь 5 xaF {dx} = — ba [1 —F (Ь)] + а xa-1 [1 —F (x)]dx. (6.4) о о Предположим сначала, что интеграл слева сходится при b—>оо. Вклад в предельный интеграл по бесконечному промежутку от интегрирования по Ь, оо не меньше Ьа[1—F (&)], так что первое слагаемое в правой части (6.4) стремится к нулю. Переходя теперь в (6.4) к пределу при Ь—>оо, получаем (6.3). С другой стороны, в (6.4) интеграл слева не превосходит интеграла справа, и, сле- довательно, из сходимости правого интеграла вытекает сходимость левого, что, как мы видели выше, приводит к (6.3).
§ 7. Неравенство Чебышева 179 Для левой полуоси имеет место соотношение, аналогичное (6.3). Комбинируя обе формулы, получаем следующий результат. Лемма 2. Распределение F обладает абсолютным моментом порядка а>0 тогда и только тогда, когда функция |х|а"1Х Х[1—F(x) + F(—х)] интегрируема на 0, оо . В качестве приложения покажем, что имеет место Лемма 3. Пусть X, Y—независимые случайные величины и S = X -f- Y. Математическое ожидание Е = (| S |а) существует тогда и только тогда, когда существуют Е (| X |а) и Е (| Y |а). Доказательство. Поскольку случайные величины X и X —с обладают обсолютными моментами одних и тех же порядков, то, не ограничивая общности, можно предположить, что медианы ве- личин X и Y равны нулю. Но тогда Р {| S | > t} ^4“ {I I > О* и поэтому в силу предыдущей леммы Е (| S |а) < оо влечет за со- бой Е(|Х|а)<оо. Тем самым доказана необходимость. Доста- точность следует из неравенства | S |а С 2а (| X |а +1 Y |а), справед- ливость которого вытекает из того очевидного факта, что во всех точках |S| не превосходит наибольшего из чисел 2|Х| и 21 Y |. § 7. НЕРАВЕНСТВО ЧЕБЫШЕВА Неравенство Чебышева является одним из наиболее часто ис- пользуемых инструментов теории вероятностей. Как само нера- венство, так и его доказательство не отличаются от их дискрет- ного варианта (1; гл. IX, 6) и повторяются здесь главным обра- зом для удобства ссылок. Интересные приложения неравенства будут даны в гл. VII, 1. Неравенство Чебышева. Если существует Е (X2), то Р{|Х|>0<А.Е(№), / > 0. (7.1) В частности, если Е(Х) = т и Var(X) = a2, то Р{|Х-т|>/}<-^<А (7.2) Доказательство. Обозначим распределение величины X через F. Тогда Е(Х2)> $ x2F\dx\^t2 $ F\dx\. Поделив эти неравенства на t2, получаем (7.1). Полезность неравенства Чебышева определяется не его точностью (она неве- лика) , а простотой и тем, что оно особенно удобно в применении к суммам случай- ных величин. Среди многих возможных обобщений неравенства Чебышева ни
180 Гл. V. Вероятностные распределения в Fhr одно не обладает этими ценными его качествами. (Большинство из обобще- ний весьма просты и их лучше выводить по мере надобности. Например, по- лезная комбинация неравенства Чебышева и урезания распределений описана в гл. VII, 7.) Приведем один довольно общий метод получения нетривиальных нера- венств. Если и^Она всей прямой и и (х) > а > 0 при всех х из некоторого интервала I, то (7.3) С другой стороны, если вне I и и^1 на /, то мы получаем обратное неравенство F {1} Е (и (X)). Беря в качестве и многочлены, приходим к не- равенствам, зависящим лишь от моментов F. Примеры, а) Пусть и (х) = (х-|-с)2, где с > 0. Тогда и (х) 0 при всех х и и (х) (^+с)2 при х^ t > 0. Следовательно, р{Х > 0<(7^Е((Х+С)2). (7.4) При Е (Х) = 0 и Е(Х2) = о2 правая часть в (7.4) достигает минимума, когда c = G2!t, и, следовательно, о2 ОО. (7.5) Это важное неравенство было обнаружено независимо многими авторами. б) Пусть X — положительная случайная величина (т. е. F(0) = 0) и Е(Х) = 1, Е(Х2) = 6. Многочлен w(xj=/i~2(x—a) (a-]-2h—х) положителен лишь для а < х < a-\-2h и и (х) 1 при всех х. Если 0 < а < 1, то, как легко видеть, Е (и (X)) [2h (1—а) — b\h~*. Беря h — 6(1—я)”1 и используя замечание, предшествовавшее примерам, получаем Р{Х > а}^(1—(7.6) в) Пусть Е(Х2) = 1 и Е(Х4) = Л4. Применяя последнее неравенство к X2, находим, что при 0 < t < 1 Р {| X | > /}^(1 —^2)2 М-1. (7.7) По поводу обобщения неравенства Чебышева, принадлежащего Колмогорову, (см. пример 8, д). § 8. ДАЛЬНЕЙШИЕ НЕРАВЕНСТВА. ВЫПУКЛЫЕ ФУНКЦИИ Собранные в этом параграфе неравенства широко используются в математике и ни в коей мере не являются специфическими для теории вероятностей. Наиболее общее из них—неравенство Швар- ца. Другие неравенства приведены по причине их применений в теории случайных процессов и математической статистике. (На- стоящий параграф предназначается более для ссылок, чем для чтения.) а) Неравенство Шварца В вероятностной интерпретации это неравенство означает, что для всяких двух случайных величин ср и ф, определенных на од- ном и том же выборочном пространстве, (Е (ф1р))2 Е (<ра) Е №), (8.1)
§ 8. Дальнейшие неравенства. Выпуклые функции 181 если только входящие в неравенство математические ожидания существуют. Равенство в (8.1) осуществляется только тогда, когда некоторая линейная комбинация + величин ф и ф равна нулю с вероятностью единица. Более общим образом, если F — произвольная мера на множестве А, (Ф (*) Ф (*) Г {^}Y $ Ф2 (х) Г {dx} ^ф2 (х) F {dx}, (8.2) ул у л л каковы бы ни были функции ср и ф,- для которых интегралы справа существуют. Беря в качестве F атомическую меру, наде- ляющую единичными массами целочисленные точки, получаем не- равенство Шварца для сумм (2 ш)2 < 2 ф? 2^- (8 -3> Принимая во внимание важность неравенства (8.1), мы дадим два его доказательства, намечающие различные обобщения. Анало- гичные доказательства можно дать для (8.2) и (8.3). Первое доказательство. Можно предположить, что Е (ф2) > 0. Тогда математическое ожидание Е (ф + /ф)2 = Е (ф2) + 2t Е (фф) + /2Е (ф2) (8.4) является квадратным многочленом по t. Этот многочлен^ будучи неотрицательным, имеет либо два комплексных корня, либо двой- ной действительный корень А. Из формулы для решения квадрат- ного уравнения следует, что в первом случае (8.1) выполняется как строгое неравенство. Во втором случае (8.1) является равен- ством и Е (ф-J-Аф)2 = 0д так что ф + Аф = 0, за исключением мно- жества вероятности нуль. Второе доказательство. Поскольку при замене функций ф и гр в (8.1) на их кратные аср и 6ф, где а, b—некоторые числа, получается равносильное неравенство, то достаточно доказать (8.1) в случае, когда Е(ф2) = Е(ф2) = 1. Для получения (8.1) в этом случае достаточно взять математические ожидания от обеих частей неравенства 21 фф | ф2 + ф2. б) Выпуклые функции. Неравенство Йенсена Пусть и — функция, определенная на открытом интервале /, и P = (t, u(Q)—точка ее графика. Проходящая через Р прямая L называется опорной прямой функции и в точке g, если график и целиком лежит над L или на L. (Это условие исключает вертикаль- ные прямые.) На аналитическом языке это означает, что при всех х из / ^W>^(g) + A(x~g), (8.5) где А—тангенс угла наклона L. Функция и называется выпуклой
182 Гл. V. Вероятностные распределения в в интервале /, если в каждой точке х из I существует ее опор- ная прямая, (Функция и называется вогнутой, если выпукла функция —и.) Покажем сначала, что из этого определения вытекают различ- ные свойства выпуклых функций, которые интуитивно ассоции- руются нами с выпуклостью (исходя из примера выпуклых ломан- ных линий). Пусть X —случайная величина с распределением F, сосредо- точенным на /, и с математическим ожиданием Е(Х). Положив 1 = Е(Х) и взяв математическое ожидание от обеих частей нера- венства (8.5), получим Е(ю)>ю(Е(Х)), (8.6) если только математическое ожидание слева существует. Неравен- ство (8.6) известно как неравенство Йенсена. Наиболее важным является тот случай, когда F сосредоточено в двух точках xt и х2 и имеет в них массы 1—Z и t. При этом (8.6) принимает вид (1 — t) и (xj) + tu (х2) и ((1 — t) хг + tx2). (8.7) Это неравенство допускает простую геометрическую интерпрета- цию, которую мы сформулируем в виде следующей теоремы. Теорема 1. Функция и выпукла тогда и только тогда, когда все хорды ее графика лежат не ниже самого графика. Доказательство, (i) Необходимость. Пусть и — выпуклая функ- ция, и рассмотрим хорду под произвольным интервалом xit х2. Когда t меняется от 0 до 1 точка (1—t) -f-tx$ пробегает интер- вал х2, а левая часть (8.7) представляет собой ординату хорды в точке (1 — t)xA+tx2. Таким образом, (8.7) означает, что точки хорды лежат не ниже графика и. (ii) Достаточность. Пусть и обладает указанным в формули- ровке теоремы свойством, и рассмотрим треугольник, образован- ный тремя точками Ръ Р2, Р3 на графике и с абсциссами Xi<x2<x3. Точка Р2 лежит ниже хорды РгР3, и из трех сторон треугольника хорда РгР2 имеет наименьший наклон, а хорда Р2Р3— наибольший. Следовательно, вне интервала х2, х3 график и лежит над прямой Р2Р3. Будем считать теперь, что х3 — переменная точка и пусть х3~*x2-p0. Наклон хорды Р2Р3 при этом моно- тонно убывает, оставаясь ограниченным снизу наклоном хорды РХР2. Таким образом, прямые Р2Р3 стремятся к предельной пря- мой L, проходящей через Р2. Поскольку вне х2х3 график и лежит над прямой Р2Р3, то весь график и лежит не ниже L. Следова- тельно, L является опорной прямой для и в точке х2, и, по- скольку точка х2 произвольна, выпуклостью тем самым доказана.
§ 8. Дальнейшие неравенства. Выпуклые функции 183 Как предел хорд, прямая L является правой касательной. В рассмотренном предельном процессе абсцисса х3 точки Р3 стре- мится к х2, а сама точка Р3 — к некоторой точке на прямой L. Следовательно, Р3—Аналогичное рассуждение применима при приближении^ х2 слева, и поэтому график и непрерывен и обладает правой и левой касательной в каждой точке. Далее эти касательные являются опорными прямыми, и их наклоны меня- ются монотонно. Поскольку монотонная функция имеет не более счетного множества точек разрыва, то нами доказана Теорема 2. Выпуклая функция имеет правую и левую произ- водные в каждой точке. Эти производные являются монотонна не убывающими функциями, совпадающими друг с другом всюду, за исключением, быть может, счетного множества точек. Свойства выпуклых функций, указанные в теореме 2, явля- ются также и достаточными для выпуклости. В частности, если и обладает второй производной, то она выпукла тогда и только тогда, когда ц"^0. Обычно в качестве определения выпуклости функции берется (8.7). При /==1/2 из (8.7) получаем (88> Геометрически (8.8) означает, что середина хорды лежит не ниже соответствующей точки графика и. Если функция и непрерывна, то отсюда вытекает, что график не может пересечь хорду и, сле- довательно, и выпукла. Можно показать, что вообще любая бэ- ровская функция х), обладающая свойством (8.8), выпукла. в) Неравенства для моментов Покажем, что для любой случайной величины X функция ц (/) = log Е (| X |z), />0, (8.9) выпукла по t в каждом интервале, где она конечна. В самом деле, согласно неравенству Шварца (8.1), Е2 (I X |9< Е (I X |'+Л) Е (I X |*~Л), 0 < h < t, (8.10) если только математические ожидания существуют. Положив в (8.10) = /—h, x2 = t-t-h и перейдя к логарифмам, видим, что функция и удовлетворяет условию (8.8) и поэтому выпукла. Поскольку и (0)^0, то тангенс угла наклона t^u^t) пря- мой, соединяющей начало координат с точкой (t, u(t)), меняется монотонно и, следовательно, (E(|X|f))1/z является неубывающей функцией от / > 0. 0 Каждая функция и, удовлетворяющая условию (8.8), либо выпукла, либо она колеблется на каждом интервале от —оо до оо. См.: Харди Г. Г.е ЛиттльвудДж. Е. и Полна Г., Неравенства. — ИЛ, М.г 1948* особенное. 114<
184 Гл. V. Вероятностные распределения в г) Неравенство Гёльдера Пусть р>1, <?>1 и = Тогда для неотрица- тельных функций ф и ф имеет место неравенство Е (Фгр) <(Е (фИ)1/р (Е (гН)1/*, (8.11) если только математические ожидания существуют. (Неравенство (8.1) является частным случаем этого неравен- ства, получающимся из него при р = = Для неравенств (8.2) и (8.3) имеются обобщения, аналогичные (8.11).) Доказательство. При х>0 функция и = log х вогнута, т. е. она удовлетворяет неравенству, обратному (8.7). Потенцируя это неравенство, приходим к соотношению х}"^2 (1 — О + tx2, (8.12) справедливому при х2 > 0. Как при доказательстве неравен- ства Шварца (второе доказательство), чтобы установить (8.11), достаточно ограничиться случаем, когда/ Е (ф^) = Е (ф^) = 1. По- ложим t = q~1 и 1—Z = Подставив в (8.12) х1 = ^р, х2 = ф^ и взяв математические ожидания, получаем Е(фф)^1, что и тре- бовалось доказать. д) Неравенство Колмогорова Пусть Хх, ...,ХП—независимые случайные величины с конеч- ными дисперсиями и с Е(Х^) = 0. Тогда для любого х>0 PjmaxUSd, ..., |SJ]>x}<x-2E(S*). (8.13) Это важнейшее усиление неравенства Чебышева было выведено нами в 1; IX, 7 для дискретных случайных величин. Доказа- тельство сохраняется без изменений, но мы перефразируем его так, чтобы сделалось очевидным, что неравенство Колмогорова применимо и в более общей обстановке к субмартингалам. Мы вернемся к этому вопросу в гл. VII, 9. Доказательство. Положим x2 = i. При фиксированном значе- нии t и / = 1, 2, . ..,п обозначим через событие, заключаю- щееся в том, что S/ > /, но t для всех индексов v < /. Сло- вами можно сказать, что событие Aj состоит в том, что / есть наименьший среди индексов £, для которых S| > t. Конечно, та- кой индекс / не обязательно существует. Объединение событий Aj—это в точности событие, заключенное в левой части неравен- ства Колмогорова. Так как события Aj взаимно исключают друг друга, то неравенство может быть переписано в форме 2 Р{ЖГЕ(8‘). <8.14) / = 1
§ 9. Простые условные распределения. Смеси 185 Обозначим через 1Л индикатор события Лу-, иначе, 1Л есть случайная величина, которая равна 1 на Aj и равна 0 на до- полнении к Aj. Тогда 2 1л1, и поэтому E(S*)> 2 E(S*Uy). (8.15) Покажем, что E(S^by)>E(SJb.). (8.16) Поскольку S; > t всякий раз, когда происходит Лу, то правая часть (8.16) /Р(Л7). Таким образом (8.15) приводит к неравен- ству (8.14). Для доказательства (8.16) заметим, что Sw = S7- + (Sn—Sy), и, следовательно, Е (S* 1Л/) > Е (S}Uy) + 2Е ((S„-Sy) S7.l А.), (8.17) Второе слагаемое в правой части (8.17) обращается в нуль, так как величины Sn — S7. = X/+1 + ... +Х„ и 87.1Л/ независимы, и - поэтому к их математическим ожиданиям применимо правило ум- ножения. Таким образом, (8.17) доказывает утверждение (8.16). ► § 9. ПРОСТЫЕ УСЛОВНЫЕ РАСПРЕДЕЛЕНИЯ. СМЕСИ В гл. Ш, 2, мы определили «условную плотность случайной величины Y при фиксированном значении другой случайной ве- личины X» в том случае, когда совместное распределение X и Y имеет непрерывную плотность. Не претендуя на общность, мы введем теперь аналогичное понятие для более широкого класса распределений. (Систематически теория условных распределений и математических ожиданий развивается в § 10 и 11.) Для произвольной пары интервалов Л, В на прямой положим 0(Л, В) = Р(Х6Л Y6B}- (9.1) При этом обозначении для частного распределения X имеем и{Л}=0(Д ^). (9.2) Если > 0, то условная вероятность события {Y£B} при условии {X С Л) равна P{YGB|X(M} = ^^. (9.3) (Если р{Л} = 0, то эта условная вероятность не определена.) Воспользуемся формулой (9.3), когда А есть интервал Лл — = х, x-f-h. Пусть h —> 0 +. При выполнении соответствующих
186 Гл. V. Вероятностные распределения в условий регулярности предел <9'4> существует для всех х и В. В этом случае по аналогии с гл. III, 2, мы обозначаем q(x, B) = P{Y6B|X = 4 (9.5) и называем q «условной вероятностью события {YgB} при ус- ловии Х = х». Рассмотренная конструкция распространяет понятие условных вероятностей на случаи, когда «гипотезы» имеют нуле- вую вероятность. Никаких дальнейших трудностей не возникает, если функция q достаточно регулярна, однако мы не будем зани- маться изучением соответствующих условий регулярности, по- скольку в следующем параграфе рассматривается более общая схема. В частных случаях обычно оказывается достаточным про- стой наивный подход, и вид условного распределения нередко можно найти с помощью интуиции. Примеры, а) Предположим, что пара случайных величин X, Y имеет совместную плотность /(х, у). Для упрощения предпо- ложим, что f непрерывна и строго положительна. Тогда ' в где (х) = q (%, — оо, оо) есть частная плотность X. Другими словами, при фиксированном значении х функция множества q имеет плотность, равную /(х, у)/Л(х). б) Пусть X и Y—независимые случайные величины с распре- делениями F и G соответственно. Предположим для простоты, что X > 0 [т. е. F (0) = 0]. Рассмотрим произведение Z = XY. Имеем, очевидно, p{z<qx = 4 = G(|). (9.6) Интегрируя (9.6) по F, получим функцию распределения U вели- чины Z [см. гл. II, (3.1). Это утверждение представляет собой частный случай формулы (9.8), см. ниже]. В частности, когда ве- личина X распределена равномерно на интервале 0, 1, получаем 1 = (9.7) о Формула (9.7) может быть использована как удобный исходный пункт в теории одновершинных распределений х). 1) Функция распределения U называется одновершинной (унимодальной) с модой в нуле, если на интервале —оо, Оона выпукла, а на интервале 0, оо
§ 9. Простые условные распределения. Смеси 187 Дальнейшие примеры содержатся в задачах 18, 19. ► Следующая теорема, принадлежащая Л. Шеппу, является допускающим простую вероятностную интерпретацию вариантом формального критерия, открытого А. Хинчиным. Теорема. Функция распределения U одновершинна тогда и только тогда, когда ее можно представить в виде (9.7). Иными словами, U одновершинна тогда и только, тогда, когда она является функцией распределения произведе- ния Z=XY двух независимых случайных величин, из которых одна величина* скажем X, распределена равномерно на 0, 1. Доказательство. Возьмем h > 0 и обозначим функцию распределения, график которой является кусочно-линейной функцией, совпадающей с U в точках 0, ± h, ... [т. е. V h (nh) = U (nh) и функция (Уд линейна в интерва- лах между nh и (п+1) h]. Из определения одновершинности непосредственно вытекает, что функция U одновершинна тогда и только тогда, когда одно- вершинны функции Далее, имеет плотность uh, являющуюся ступен- чатой функцией, и каждую ступенчатую функцию с разрывами в точках nh можно записать в виде где f (х) = 1 при 0 < х < 1 и f(x) = O в остальных точках. Функция (*) моно- тонна в интервалах —оо, 0 и 0, оо тогда и только тогда, когда рп^0 при- всех п, и является плотностью, если ^рп = 1 • Но когда и (*) представляет собой плотность распределения произведения Z^=XY^—двух независимых случайных величин X и Yh, из которых X распределена равно- мерно на 0, 1, a Nh имеет арифметическое распределение Р{4h~nh} — pn. Мы, доказали, таким образом, что функция одновершинна тогда и только тогда, когда ее можно представить в виде (9.7) с функцией G, замененной на функцию Gh, сосредоточенную в точках 0, ... . Устремляя теперь h к нулю и используя теорему о монотонной сходимости, получаем нужный резуль- тат. (См. задачи 25, 26 и задачу 10 из гл. XV, 9.) ► При выполнении соответствующих условий регулярности функ- ция q(x, В) при фиксированном х является вероятностным рас- пределением по В и при фиксированном В представляет собой непрерывную функцию по х. При этом Q (Д В) = J q (х,г В) ц \dx}. (9.8) л В самом деле, стоящий справа интеграл задает вероятностное распределение на плоскости, и, дифференцируя его по типу (9.4), получаем q (х, В). Формула (9.8) показывает, как заданное рас- пределение на плоскости можно представить в терминах условного и частного распределений. Пользуясь терминологией гл. 11,5, можно сказать, что формула (9.8) дает представление заданного распределения в виде смеси зависящего от параметра х семейства вогнута [см. 8, б)]. Нуль может быть точкой разрыва U, но вне нуля одно- рершинность предполагает существование у U плотности и, которая монотонна и в —оо, 0, и в 0г оо. (Интервалы постоянства не исключаются).
188 Гл. V. Вероятностные распределения в 31г распределений q(x,B) и распределения р,, играющего роль рас- пределения рандомизированного параметра. На практике описанный процесс нередко обращается. В каче- стве исходного берут «вероятностное (стохастическое) ядро» q, т. е. функцию q(x, В) точки х и множества ВА- такую, что при фиксированном х она является вероятностным распределением, а при фиксированном В—бэровской функцией. При любом задан- ном вероятностном распределении р, интеграл в (9.8) определяет вероятности подмножеств плоскости вида (Л, В) и тем самым определяет некоторое вероятностное распределение на плоскости. Обычно формулу (9.8) выражают в терминах функций точек. Рас- смотрим семейство функций распределения G(0, у), зависящих от параметра 0, и некоторое вероятностное распределение р,. Опре- делим новую функцию распределения с помощью следующей фор- му лы: 00 и (у)= [ G (х, у) ц {dx}. (9.9) — 00 [Эта формула представляет собой частный случай формулы (9.8); ---------------------------------------------------1 она получается из нее при А = —оо, оои(/(х,—оо, у) = G (х, г/).] Смеси подобного рода встречались нам уже в 1, гл. V, и обсуж- дались в гл. 11,5. В следующем параграфе будет показано, что q всегда можно интерпретировать как условное распределение вероятностей. Примеры, в) Для всяких двух распределений Ft и В2 распре- деление pFi + (l—р)Р2 (0 < Р < 1) является их смесью и пред- ставляется формулой (9.9) с распределением р, сосредоточенным в двух точках. г) Случайные суммы. Пусть Xf, Х2, ... —независимые случай- ные величины с одинаковым распределением F, Пусть далее N— независимая от Ху случайная величина, принимающая значения О, 1, ... с положительными вероятностями р0, plf ... Рассмот- рим случайную величину SN = Xj + ... + XN . Условное распреде- ление SN при условии N = ft есть F'1*, и поэтому распределение SN дается формулой и=%рпГп*. (9.10) /1 = 0 представляющей собой частный случай (9.9). В рассматриваемом случае каждое условие N = п имеет положительную вероятность рп, и поэтому мы имеем здесь дело с условными вероятностными рас- пределениями в строгом смысле. Другие примеры имеются в гл. 11,5—7. (См. задачи 21 и 24.)
§ 10. Условные распределения 189 § 10*). УСЛОВНЫЕ РАСПРЕДЕЛЕНИЯ Вряд ли было разумным исследовать точные условия, при которых условные вероятности q могут быть получены с помощью процесса дифференцирования типа (9.4). Основные свойства услов- ных вероятностей выражены в соотношении (9.8), представляющем вероятности множеств в терминах условных вероятностей, и проще всего использовать (9.8) в качестве определения условных веро- ятностей. Соотношение (9.8) не определяет q однозначно, так как, если для каждого множества В с точностью до множества р,-меры нуль q (х, В) = q (х, В), то (9.8) по-прежнему остается справедли- вым при замене q на q. Однако указанная неопределенность не- избежна. Например, когда ц сосредоточено на интервале Z, невоз- можно никакое естественное определение q для х, не лежащих в /. В силу самой природы вещей мы имеем дело со всем классом эквивалентных условных вероятностей и должны говорить скорее о каком-то, а не об определенном условном распределении веро- ятностей q. В конкретных же случаях требования регулярности диктуют обычно некоторый определенный выбор условного рас- пределения вероятностей. Для определенности мы будем рассматривать лишь события, задаваемые условиями типа Х^А и N ^В, где X и Y—фиксиро- ванные случайные величины и А, В—борелевские множества на- прямой. Посмотрим сначала, как можно понимать фразу «условная вероятность события {YgB} относительно X». Значение X может быть либо фиксированным числом, либо быть неопределенным. При второй из этих интерпретаций мы имеем функцию от X, т. е. слу- чайную величину, которую будем обозначать Р{В|Х} или q (X, В) и т. д. Когда имеется в виду фиксированное значение X, скажем xg будет, использоваться обозначение P{Y€B|X = x} или q(x,B). Определение 1. Пусть В—фиксированное множество. «Услов- ной вероятностью P{Y(=B|X} события {Yg в} относительно X» называется функция (?(Х, В), такая, что для любого подмноже- ства А прямой Р{Х£Л, Y£B} = J<?(x, В)рМ (10.1) А где ц—частное распределение X. Когда х является атомом распределения р,, условие Х = х имеет положительную вероятность и условная вероятность Р {Y £ В | Х=х} была в этом случае определена нами раньше формулой (9.3), в ко- торой под А следует понимать множество, состоящее из единст- венной точки х. При этом формула (10.1) сводится к (9.3), так что наши прежние и настоящие определения и обозначения со- гласуются друг с другом. *) Этот параграф можно опустить при первом чтении.
190 Гл. V. Вероятностные распределения в 91г Мы видим, что условная вероятность P{Y £ 231X} всегда су- ществует. В самом деле, ясно, что Р]Х£Л, (10.2) Левая часть (10.2), рассматриваемая при фиксированном В как функция множества А, определяет конечную меру, и из (10.2) следует, что эта мера абсолютно непрерывна по отношению к ц (см. теорему Радона—Никодима в § 3). Это означает, что опре- деленная нами мера обладает плотностью q и поэтому (10.1) спра- ведливо. До сих пор множество В было у нас фиксированным, но обо- значение q (х, В) было выбрано с тем расчетом, чтобы впоследствии сделать В переменным. Иными словами, мы хотим теперь рас- сматривать q как функцию от двух переменных—точки х и под- множества В прямой. При этом желательно, чтобы при фиксиро- ванном х функция q была вероятностной мерой. Это означает, что q (х, = 1 и что для любой последовательности непересекаю- щихся множеств Вх, В2, ..., в объединении дающих В, имеет место равенство ^(х, В) = 29(х,В,). (10.3) Если стоящие справа члены представляют собой условные веро- ятности Вк, то их сумма является некоторой условной вероят- ностью множества В, однако у нас имеется дополнительное тре- бование согласованности, состоящее в том, чтобы (10.3) выполня- лось при нашем выборе q при всех х. [Отметим, что определение 1 не исключает абсурдных значений функции q(x, В) в некоторых точках х типа q(x, В) =17.] Как нетрудно видеть, функцию q (х, В) действительно можно выбрать так, чтобы выполнялись все эти требования х). Это означает, что существует условное вероят- х) Проще всего построить такую функцию q, определяя непосредственно значения q (х,В) лишь для множеств В, являющихся интервалами в диадичес- -------------------------------------------------------------1 ком подразбиении 911. Пусть, например, Вх = 0, оо, В2 =— оо, 0. Возьмем в качестве q (х, Вх) любую условную вероятность Вь подчиненную очевидному требованию 0 q (х, Вх) «С 1. Теперь автоматически следует положить q(x, В2)— = 1—q (х, Вх). Разобьем далее Вх на Вхх и В12 и выберем q (х,Вхх) так, чтобы выполнялись неравенства 0 «С q (х, Вхх) «С q (х, Вх). Положим q (х, В12) = = q (•*, Bi)—У (х, £ц)« Процесс измельчения подразбиений продолжается далее неограниченно. Требование аддитивности (10.3) позволяет затем определить q (х, В) для всех открытых множеств В и, следовательно, для всех борелев- ских множеств. Описанная конструкция основывается лишь на существовании так назы- ваемой сети, т. е. разбиении пространства на конечное число непересекаю- щихся множеств, каждое из которых в свою очередь разбивается на конеч- ное число непересекающихся множеств, причем процесс продолжается таким образом, что каждая точка пространства является единственным пределом стягивающейся последовательности множеств, входящих в последовательные разбиения. Рассматриваемое утверждение имеет место, следовательно, в 34 2 и во многих других пространствах.
§11. Условные математические ожидания 191 ностное распределение Y относительно X в смысле следующего определения. Определение 2. Условным вероятностным распределением Y относительно X называется функция q, зависящая от двух пере- менных—точки х и множества В, такая, что (i) при фиксированном множестве В q(X, B) = P{Y£ В|Х} (10.4) является условной вероятностью события {Y £ В} относительно X, (ii) при каждом фиксированном х q есть вероятностное рас- пределение. В действительности условное вероятностное распределение пред- ставляет собой семейство обычных вероятностных распределений, и поэтому вся теория переносится на них без изменений. Так, если q заданох), следующее определение вводит скорее новое обозначение, чем новое понятие. Определение 3. Условное математическое ожидание Е (Y | X) есть функция от X, принимающая в точке х значение оо E(Y|x) = J yq(x, dy). (10.5) — оо При этом предполагается, что интеграл сходится (за исключе- нием, возможно, множества точек х, имеющего вероятность ну ль). Условное математическое ожидание Е (Y | X) является функ- цией от X и, следовательно, представляет собой случайную вели- чину. Для большей ясности значение его в фиксированной точ- ке х иногда предпочитают обозначать E(Y | Х = х). Из определения E(Y|X) непосредственно вытекает, что 00 E(Y)= $E(Y|x)ji{dx) «ли Е (Y) = Е (Е (Y | X)). (10.6) — 00 § 11* *). УСЛОВНЫЕ МАТЕМАТИЧЕСКИЕ ОЖИДАНИЯ Мы определили условные математические ожидания Е (Y | X) в терминах условных вероятностных распределений. Этот подход вполне удовлетворителен, когда имеют дело лишь с одной парой слу- чайных величин X, Y. Однако когда приходится иметь дело с целыми семействами случайных величин, то неединственность ус- ловных распределений приводит к серьезным трудностям. Поэтому замечательно то, что на практике можно обойтись без этой гро- моздкой теории. Действительно, оказывается, что можно постро- ить на удивление простую и гибкую теорию условных матема- тических ожиданий без всякого обращения к условным распреде- *) Более гибкое общее определение приводится в § 11. *) Содержание этого параграфа будет использоваться лишь в связи с мар- тингалами в гл, VI, 12, и гл, VII, 9,
192 Гл. V. Вероятностные распределения в Э1Г лениям. Для понимания этой теории лучше всего начать с более внимательного рассмотрения равенства (10.5). Пусть А—борелевское множество на прямой и 1Л(Х)—слу- чайная величина, равная 1 при X С А и нулю в остальных слу- чаях. Мы интегрируем обе части равенства (10.5) относительно частного распределения р случайной величины X, взяв в качестве области интегрирования множество А. Результат можно записать в следующем виде: + сю Е(У1Л(Х)) = $E(Y|x)|i{dx} = $ 1Дх)Е(У |x)p(dx). (11.1) А — сю Случайная величина X отображает выборочное пространство 6 на действительную прямую, и последний интеграл имеет отношение только к функциям и мерам на прямой. Случайная величина У1Л(Х), однако, определена в исходном выборочном пространстве, и поэтому необходима более подходящая система обозначений. Очевидно, что 1Л(Х) есть индикатор множества В всех таких точек из (£, в которых X принимает значения из множества А. Как мы знаем из гл. IV, 3, множества 5, которые таким образом соответствуют произвольному борелевскому множеству А на пря- мой, образуют о*-алгебру множеств в 6, которая называется ал- геброй. порожденной X. Таким образом, (11.1) утверждает, что U = Е (Y | X) есть функция от X, которая удовлетворяет тождеству E(Y1B) = E(U1B) (11.2) для любого множества В из о-алгебры, порожденной X. Мы уви- дим, что это равенство может быть использовано как определение условных математических ожиданий и поэтому очень важно уметь истолковывать его надлежащим образом. Поясним природу этого равенства на простом примере. Примеры, а) Рассмотрим плоскость с координатными величи- нами X и Y как выборочное пространство и предположим для простоты, что вероятности задаются посредством строго положи- тельной непрерывной плотности f (х, у). Случайная величина X принимает постоянное значение вдоль любой прямой, параллель- ной //-оси. Если А есть множество на х-оси, то соответствующее плоское множество В состоит из всех таких прямых, проходящих через точки множества А. Левая часть (11.2) представляет собой обычный интеграл от yf(x, у) по этому множеству, и он может быть записан как повторный интеграл. Таким образом + 00 E(YlB) = $dx $ yf(x, y)dy. (11.3) А — <л Правая часть (11.2) представляет собой обычный интеграл от функ- ции и(х)Д(х), где —частная плотность X. В таком случае
§ 11. Условные математические ожидания 193 (11.2) утверждает, что + 00 и(x)=7^- J yf(*> у^у (И-4) — 00 в соответствии с определением (10.5) условного математического ожидания и в соответствии с интуицией., б) Продолжение. Покажем теперь, что равенство (11.2) опре- деляет условное математическое ожидание U даже в том случае, когда плотности не существуют и вероятностное распределение на плоскости произвольно. При заданном борелевском множестве А на х-оси левая часть в (11.2) определяет число Очевидно, что есть мера на борелевских множествах х-оси. Другая мера задается посредством частного распределения р слу- чайной величины X, которое определено как р {Л} = Е (1В). Поэтому очевидно, что если р{Л}=0, то и р1{Л} = 0. Иными словами, рх абсолютно непрерывна относительно р, и по теореме Радона— Никодима из § 3 существует функция U, такая, что рх{Л}=^ U(x)p(dx). (11-5) А Это равенство отличается только обозначениями от (11.2). Конеч- но, (И.5) остается справедливым, если U изменить на множестве р-меры 0, но эта неединственность присуща понятию условного математического ожидания. ► Приведенный пример демонстрирует, что (11.2) может быть использовано для определения условного математического ожида- ния U (X) = Е (Y | X) для произвольной пары случайных величин X, У в произвольном вероятностном пространстве [при условии, конечно, что Е (У) существует]. Однако этот подход ведет много дальше. Например, для определения условного математического ожидания Е(У|Хх, Х2) относительно случайных величин Хх, Х2 можно использовать (11.2) без изменений, за тем исключением, что В должно теперь быть произвольным множеством из о-алгеб- ры 53, порожденной Хх и Х2 (см. гл. IV,3). Конечно, U должна быть функцией Хх, Х2, но мы видели в гл. IV, 4, что класс бэровских функций от пары (Хх, Х2) совпадает с классом всех 53-измеримых функций. Таким образом, мы можем охватить все мыслимые случаи с помощью следующего определения, предложенного впервые Дубом. Определение. Пусть (6, §1, Р)—вероятностное пространство, и пусть 53—G-алгебра множеств из 81 (иначе 53cz3Q. ПустьЧ— случайная величина с математическим ожиданием EY. Случайная величина U называется условным математическим ожиданием У относительно 53, если U ^-измерима и (11.2) выполняется для всех множеств B&Q. В этом сличав мы пишем U = E(Y|53). 7 №249
194 Гл. V. Вероятностные распределения в ГАГ В том случае, когда 23 есть о-алгебра, порожденная случай- ными величинами Хп . ..,ХГ, величина U сводится к бэровской функции от Хп . .., Хг и будет обозначаться E(Y |Хп .. Хг). Существование Е (Y | 23) устанавливается способом, указанным в примере б), который использует теорему Радона — Никодима. Укажем основные свойства условного математического ожида- ния U = E(Y |23). Отметим, что соотношение (11.2) выполняется, если 1В заменить линейной комбинацией индикаторов множеств Bj, принадлежащих 23. Но в гл. IV, 3, мы видели, что любая 23-из- меримая функция может быть равномерно приближена с помощью таких линейных комбинаций. Переходя к пределу, убеждаемся, что из (И.2) следует, что для любой 23-измеримой функции Z выполняется Е (YZ) = Е (UZ). Заменяя Z на Z1B и сравнивая с определением (Н.2), мы видим, что для любой ^-измеримой функ- ции I E(YZ |23) = ZE(Y |23). (11.6) Это соотношение чрезвычайно важно. Наконец, рассмотрим о-алгебру 230cz23 и пусть UO = E(Y|23O). При В£23О мы можем толковать (11.2) относительно 23О так же, как и относительно 23, и поэтому мы находим, что Е (Y1B) = Е (U1B) = Е (UO1B). Таким образом, в силу определения Uo = Е (U 123О), и поэтому если 230cz23, то Е (Y 123О) = Е(E(Y 123)2Э0). (11.7) К примеру, 23 может быть алгеброй, порожденной двумя случай- ными величинами Хп Х2, а 23О — алгеброй, порожденной только величиной ХР Тогда (11.7) переписывается как E(Y|XJ = = E(E(Y|X1, X2)|XJ. Наконец, мы отметим, что из (11.2) следует, что для функции, тождественно равной 1, условное математическое ожидание равно 1 независимо от того, как выбрана алгебра 23. Таким образом, из (11.6)' вытекает, что Е (Z 123) = Z для всех ^-измеримых случайных величин Z. Едва ли нужно говорить, что основные свойства математических ожиданий распространяются на условные математические ожидания. § 12. ЗАДАЧИ 1. Пусть X и Y—независимые случайные величины с функциями распре- деления F и G. Найдите функции распределения следующих величин х): а) X (J Y, б) Xf]Y, в) 2XUY, г) X3(J Y. х) Для двух чисел а и b aU& = max(a, b) обозначает наибольшее из них, a «n^ = min(tz, b) — наименьшее. Для функций /(Jg обозначает функцию, ко- торая в точке х принимает значение f (x)UgW (см. гл. IV, 1). Таким обра- зом, X(JY и XПY являются случайными величинами.
§ 12. Задачи 195 2. Смеси. Пусть X, Y, Z — независимые случайные величины, X и Y имеют распределения F и G, а Р {Z — 1} = р, Р {Z —0} = q (p-[-q — 1), Найдите функции распределения следующих величин: a) ZX + (1—Z) Y, б) ZX+(1—Z) (XII Y) в) ZX + (1-Z)(XAY). 3. Показать, что для непрерывной функции распределения F 00 ' 1 F (х) F {dx} = J ydy=^ , — оо О а) используя само определение первого интеграла (разбиение —оо, оо на под- ынтервалы) и б; интерпретируя первый интеграл, как Е(Е(Х)), и пользуясь тем, что F (X) имеет равномерное ^распределение. Показать также, что имеет место общая формула со С Fk (х) G {dx} — , где G (х) ~ Fn (х). J Al-f-Z? — оо 4. Пусть F (х, у) обозначает вероятностное распределение на плоскости. Положим U (х, z/) = 0 при х<0и //<0 и G (х, y)=F (х, у) во всех других точках. Покажите, что U — монотонная функция каждой переменной, но U не является функцией распределения. Указание', рассмотрите смешанные разности. 5. Двумерное распределение с заданными частными распределениями Х). Пусть F и G—функции распределения в F/11 и U (х, у} = F (х) G (у) [1 +а (1-F (х)) (1-G (у})], где | оо | < 1. Доказать, что U есть функция распределения в 5J2 с частными распределениями F и G и что U имеет плотность тогда и только тогда, когда F и G имеют плотности. Указание. Смешанные разности функции w(x, у) = и (х) v (у) [определенные в (1.12)] имеют вид Д&Ду. Отметим также, что Д (Т72) 2ДЛ. 6. Внутри единичного квадрата положим U (х, у) — х при х^у hU (х,у)—у при х^у. Покажите, что U есть функция и что соответствующее ей рас- пределение сосредоточено на биссектрисе (и, следовательно, сингулярно). 7. Максимальное распределение Фреше с заданными частными распределе- ниями. Пусть F и G—функции распределения в 5&1 и U (х, y) = F {x)[\ G (у). Доказать, что a) U есть функция распределения с частными распределениями F и G, б) если V — любая другая функция распределения с частными рас- пределениями F и G, то V [7, в) распределение, отвечающее С, сосредоточено на множестве {(х, у): F (x—)(JG (y—)^F (x)f}G (у)} и, следовательно, син- гулярно. (Задача 6 является частным случаем этой задачи.) 8. Пусть U — равномерное распределение на —h, 0 и Т — треугольное распределение на —h,h [см. гл. II, 4 (б)]. Показать, что плотности распре- делений F ★ U и F равны соответственно h /г-1 [F (x+/i)~Т7 (х)] и h~2 [F (x+y)—F (x—y)]dy. о 9. Если независимые случайные величины X и Y имеют пуассоновские распределения с математическими ожиданиями pt и qt, p-}-q~\, то P{X-Y=£} = е-« j/”(Z)ft/|fe((2Z /w). х> Эта задача содержит новый пример не нормального распределения с нормальными частными распределениями (см. задачи 2 и 3 в гл. III, 9), принадлежащий Е. Дж. Гумбелу»
196 Гл. V. Вероятностные распределения в Л где Ik—функция Бесселя, определенная в гл. II, (7.1). 10. Каждому распределению F, для которого интеграл со ср (а) — eaxF {dx} — оо существует при —а < а < а, сопоставим новое распределение F# посредством формулы ср (a) F# {dx} = eaxF {dx}. Пусть Ft и F2—два распределения, обла- дающие указанным выше свойством, и F = /71^ F2. Доказать, что (исполь- зуются очевидные обозначения) ср (а) = (а) ср2 (а) и F# = F# itFf- 11. Пусть F — атомическое распределение с массами р±, р2, ... в точках «i, а2, ... . Обозначим через р максимальное среди чисел ри р2, ... . Ис- пользуя лемму 1 § 4а, показать, что а) массы всех атомов распределения F ★ F строго меньше р, за исключе- нием того случая, когда F сосредоточено на конечном числе атомов одина- ковой массы; б) для симметризованного распределения °F нуль является атомом с массой = массы остальных атомов QF строго меньше р'. 12. Случайные векторы в Пусть L—длина суммы двух независимых единичных векторов со случайными направлениями (т. е. их концевые точки распределены равномерно на единичной сфере). Покажите, что P{L=c/}=f2/2 при 0 < t < 2 [См. пример 4, д).] 13. Пусть случайные величины взаимно независимы и принимают значения 0 и 1 с вероятностью 1/2 каждое. В примере 4, г) было показано, что случайная величина Х=^2“^Хд, равномерно распределена на 0, 1. По- кажите, что имеет сингулярное распределение. 14. а) Если F имеет плотность f и /2 — интегрируемая функция, то плот- ность f2 свертки F ★ F ограничена. б) Используя теорему об аппроксимации в среднем из гл. IV, 2, покажите, что если f ограничена, то f2 непрерывна. [Если f неограничена в окрестности некоторой точки, то может оказаться, что неограничена при каждом п. См. пример XI, 3, а).] 15. Используя неравенство Шварца, покажите, что если X есть положи- тельная случайная величина, то Е (Х~Д (Е (Х^)) ~1 при всех р > 0. 16. Пусть X и Y — случайные величины с плотностями f и g, такими, что f (х) g (х) при х < а и / (х) g (х) при х > а. Доказать, что Е (X) Е (Y). Далее, если f (х) — g (х) = 0 при х < 0, то Е (Х/г)^ Е (Y*) для всех k. 17. Пусть Xi, Х2, •••—взаимно независимые случайные величины с одинаковой функцией распределения F. Пусть N — положительная случайная величина, принимающая целые значения и имеющая производящую функцию Р (s). Если N не зависит от Ху, то случайная величина max [Хг, ..., XN ] имеет распределение Р (F). 18. Пусть Хг, ..., Хп — взаимно независимые случайные величины с не- прерывным распределением/7. Положим Х= max [Хь ..., Хк] и Y = min [Х1}... Х„]. Тогда р {X <х, Y > г/}= (F (х) — F (у))п при у < х Р {Y > у | Х=х} = [1—F (y)/F(x)]"-i. 19. При каждом фиксированном k^nfb обозначениях предыдущей задачи) f п— \ F (х) n (V I v Л I-----------ПРИ х < P{Xft<x |Х = /}=| п F (I) г V 1 при X Г.
§ 12. Задачи 197 Доказать это а) с помощью эвристического рассуждения, рассматривая событие {Х^ = Х}, и б) формально, используя (9.4). 20. Продолжение. Доказать, что t — 00 21. Случайные суммы. В примере 9, в) случайную величину Хд. положим равной 1 и —1с вероятностями р и q—1—р. Если N имеет пуассоновское распределение с математическим ожиданием t, то распределение SN совпадает с распределением, указанным в задаче 9. 22. Смеси. Пусть распределение G в (9.9) имеет математическое ожидание т (х) и дисперсию о2 (х). Показать, что математическое ожидание и дисперсия смеси U равны СО 00 00 а— т (х) р {dx}, b~ о2 (х) pi {dx} + - (m2 (х)—а2) р. (dx). ' — СО — 00 — оо 23. Применяя очевидные обозначения, имеем Е (Е (Y|X)) = E(Y), но Var (Y) = E (Var (Y | X)) + Var (E (Y | X)). Задача 22 является частным случаем этой задачи. 24. Случайные суммы. В обозначениях примера 9, в) Е (SN) — Е (N) Е (X) и Var (SN) = Е (N) Var (X) + (Е (X))2Var (N). Доказать эти соотношения непо- средственно и показать, что они вытекают из результатов двух предыдущих задач. Замечание. Следующие задачи относятся к сверткам одновершинных рас- пределений, определенных в сноске на с. 186. Была выдвинута гипотеза? что свертка двух одновершинных распределений одновершинна. Противореча- щий этой гипотезе пример был построен К. Л. Чжуном. Задача 25 содержит другой такой пример. Задача 26 показывает, что гипотеза верна для сим- метричных х) распределений (этот результат принадлежит А. Винтнеру). 25. Пусть и (х) = 1 при 0 <х< 1 им(х)=0в остальных точках. Положим / \ 8 / X \ । 1 —8 ( X \ V (х) = — и — Н--г— « т » 7 а \ а ) 1 b \ ь ) где 0 < а < Ь. Если 8 и а малы, а b велико, то плотность v одновершинна? но плотность w=v*v не одновершинна. Указание как избежать вычислений. В результате свертки двух равно- мерных плотностей получается треугольная плотность. Следовательно, w (а) > &2а~\ w (Ь) > &2Ь~1 и интеграл от w в пределах от b до 2Ь больше (1—е)2/2. Отсюда вытекает, что плотность w должна иметь минимум между а и Ь. 26. Пусть F—равномерное, a G — одновершинное распределения. С помощью простого дифференцирования показать, что если F и G симметричны, то свертка F ^G одновершинна. Вывести отсюда (без дальнейших вычислений), что тот же результат получается, когда F есть произвольная смесь симмет- ричных равномерных распределений и что, следовательно, свертка симметри- чных одновершинных распределений одновершинна. х) С трудностями, возникающими в несимметричном случае, можно по- знакомиться в работе И. А. Ибрагимова, Теория вероятностей и ее примене- ния, т. I (1956), с. 283 — 288,
ГЛАВА VI НЕКОТОРЫЕ ВАЖНЫЕ РАСПРЕДЕЛЕНИЯ И ПРОЦЕССЫ Настоящая глава включена в книгу из-за прискорбной необ- ходимости избегать повторений и взаимных ссылок в главах, предназначенных для независимого чтения. Например, теория устойчивых распределений будет изложена независимо на основе полугрупповых методов (гл. IX), анализа Фурье (гл. XVII) и, по крайней мере частично, на основе преобразований Лапласа (гл. XIII). Вынесение определений и примеров в отдельное место дает некоторую экономию и делает возможным тщательное иссле- дование некоторых основных соотношений, не стесненное чистотой используемых методов. Разнообразные темы, которым посвящена настоящая глава, не всегда логически связаны: теория очередей имеет мало общего с мартингалами или с устойчивыми распределениями. Материал главы не предназначен для последовательного чтения; лучше читать тот или иной параграф по мере появления необходимости. Параграфы 6—8 в известной степени связаны между собой, но не зависят от остальной части главы. В них излагается важный ма- териал, не затрагиваемый в других местах книги. § 1. УСТОЙЧИВЫЕ РАСПРЕДЕЛЕНИЯ В Устойчивые распределения играют все возрастающую роль в качестве естественного обобщения нормального распределения. Для их описания удобно ввести следующее сокращенное обозна- чение- если распределения двух случайных величин U и V сов- падают, то мы будем писать d U = V. (1.1) d В частности, соотношение U — aV + b означает, что распределения величин U и V отличаются лишь параметрами расположения и масштабными параметрами [см. определение 1 в гл. V, 2]. Всюду в этом параграфе символы X, Хх, Х2, ... обозначают взаимно независимые случайные величины с одним и тем же распределе- нием /?, a S„ = X1+. +Х„.‘ Определение 1, Распределение Р называется устойчивым
§ 1. Устойчивые распределения в ffi1 199 (в широком смысле), если оно не сосредоточено в нулей для каж- дого п существуют постоянные иуп, такие, что1) S„ = cnX + yn. (1.2) R устойчиво в узком смысле (строго устойчиво), если оно удов- летворяет соотношению (1.2) с уп = 0. Примеры будут приведены в § 2. Весьма поучителен элемен- тарный вывод некоторых основных свойств устойчивых распреде- лений, и мы дадим его здесь несмотря на то, что дальше будут даны другие доказательства этих свойств. Систематическое изло- жение теории устойчивых распределений в гл. IX и XVII не опирается на нижеследующий материал. Теорема 1. Нормирующие постоянные имеют вид сп = пх^с 0<а^2. Постоянная а будет называться характеристическим показателем распределения R. Доказательство. Доказательство значительно упрощается при использовании симметризации. Если распределение R устойчиво, то распределение °/? величины X! — Х2 тоже устойчиво, причем с теми же самыми нормирующими постоянными сп. Достаточно, следовательно, ограничиться случаем симметричного устойчивого распределения R. Заметим сначала, что SOT+n есть сумма независимых случайных величин Sm и —Sw, распределения которых совпадают соот- ветственно с распределениями величин стХ и спХ. Таким обра- зом, для симметричных устойчивых распределений имеем d Ст + п^ = + С\Л2. (1.3) Сумму Srfe можно аналогичным образом разбить на г независимых частей по k членов в каждой, и поэтому crk = crck при всех г и k. Отсюда по индукции заключаем, что если n~rv, то сп = с?. (1.4) Далее положим v = m + n и заметим, что в силу симметрии ве- личин из (1.3) при />0 Р(Х> 0>l{X2>/Cv/C„}. (1.5) Отсюда следует, что при v > п отношения cn/cv остаются огра- ниченными. Для любого целого числа г существует единственное а, такое, что сг = г^а. Для того чтобы доказать равенство сп = пх/а,-доста- точно показать, что из с0 = р1/р вытекает Р = а. В силу (1.4) если n~rJ, то с„ = п1/а, если v = p*, то cv — vx/$. х) В другой форме это определение см. в задаче 1,
200 Гл. VI. Некоторые важные распределения и процессы Но для любого v = р* существует п = Д, такое, что п ^.гп. В таком случае Cv--=V1^^. (т)1^ = г[^С%/®. Так как отношения cn/cv ограничены, то отсюда следует, что Р^а. Меняя г и р ролями, мы аналогичным образом показы- ваем, что ₽>аи, следовательно, [3 = сх. Докажем, что а ^2. Для этого вспомним, что нормальное распределение устойчиво с характеристическим показателем а = 2. В этом случае (1.3) сводится к правилу сложения дисперсий, откуда следует, что любое устойчивое распределение с конечными дисперсиями необходимо соответствует значению а = 2 Для за- вершения доказательства достаточно поэтому показать, что любое устойчивое распределение с а > 2 должно иметь конечную дис- персию. Для симметричных распределений соотношение (1.2) выпол- няется с у„ = 0, и, следовательно, мы можем выбрать t так, что Р {| Sn | > tcn\ < 1/4 для всех п. В силу симметрии отсюда сле- дует, что п[1 — R(tcn)] остается ограниченным [см. V, (5.10)]. Тогда для всех х > t и подходящей постоянной М выполняется ха[1 — /?(х)]</И. Таким образом, вклад интервала 2k~l<Zx^2k в интеграл, определяющий Е(Х2), ограничен величиной /И2<2-а)\ а при а > 2 это является общим членом сходящегося ряда. Значительному упрощению теории устойчивых распределений способствует то приятное обстоятельство, что на практике цен- трирующими постоянными уп можно пренебречь. Это так, потому что мы вольны центрировать произвольным образом распределе- ние /?, т. е. мы можем заменить /?(%) на /?(% + &). Следующая теорема показывает, что, исключая случай а=1, мы можем употребить эту свободу на устранение уп из соотношения (1.2). Теорема 2. Для всякого устойчивого распределения R с харак- теристическим показателем a^l можно выбрать центрирую- щую постоянную Ъ так, чтобы R(x-\-b) было бы строго устой- чиво. Доказательство. Sm, п есть сумма т независимых случайных величин, каждая из которых распределена одинаково с величи- ной спХ-\-уп. Соответственно d d Sm, п = Сп$т + тУп = СпСт X + Спут + Шуп. (1.6) Поскольку т и п играют одну и ту же роль, это означает, что имеет место равенство (с» — «)Тт = (^—(1.7)
$ 1. Устойчивые распределения в Э11 201 При а=1 это утверждение не имеет смысла1), но при а=/=1 отсюда следует, что уп = Ь(сп — п) при всех п. Наконец, из (1.2) видно, 41 о сумма S' п случайных величин, распределенных как d X' —&, удовлетворяет условию S^=cwX'. > Соотношение (1.3) было получено из (1.2) при единственном предположении, что у72 = О, и поэтому оно справедливо для всех строго устойчивых распределений. Это влечет, что d sl/aXi + /1 /ос Х2 = (S + 01/<ХХ (1.8) всякий раз, когда отношение s/t рационально. Простое использо- вание свойства непрерывности2) приводит к следующей теореме. Теорема 3. Для строго устойчивых распределений R с харак- теристическим показателем а соотношение (1.8) выполняется при всех s > 0 и t > 0. Для нормального распределения соотношение (1.8) просто устанавливает правило сложения для дисперсий. Вообще из (1.8) следует, что все линейные комбинации а1Х1-{-а2Х2 принадлежат одному типу. Та важная роль, которую играет нормальное распределение ЭД в теории вероятностей, в значительной мере основана на цент- ральной предельной теореме. Пусть Хх, Хп — взаимно неза- висимые величины с общим распределением F, нулевым матема- тическим ожиданием и единичной дисперсией. Положим Sn = = Х1+...+Х„. Центральная предельная теорема3) утверждает, что распределения случайных величин SZ2/i"1/2 сходятся к ЭД. Если распределения не имеют дисперсий, то можно сформулировать аналогичные предельные теоремы, однако нормирующие постоян- ные должны быть выбраны другими. Весьма интересным является тот факт, что в качестве предельных распределений могут быть получены все устойчивые законы и только они. Введем следую- щую терминологию, которая облегчит дальнейшее обсуждение рассматриваемого вопроса. Определение 2. Скажем, что распределение F независимых случайных величин Xk принадлежит области притяжения распре- деления R, если существуют нормирующие постоянные ani>Q, bn‘, такие, что распределение величины а~г (Sn — bn) сходится к R. Приведенное выше утверждение можно теперь переформули- ровать следующим образом: распределение R имеет область при- х) Случай а=1 см. в задаче 4. 2) По поводу непрерывности устойчивых распределений см. задачу 2. 3) Центральная предельная теорема показывает, что нормальное распре- деление— это единственное устойчивое распределение, обладающее диспер- сией,
202 Гл. VI. Некоторые важные распределения и процессы тяжения тогда и только тогда, когда оно устойчиво. Действи- тельно, из определения устойчивости непосредственно вытекает, что устойчивое распределение R принадлежит своей области притяжения. Тот факт, что никакое неустойчивое распределение не выступает в качестве предельного, можно обосновать с по- мощью рассуждения, использованного при доказательстве тео- ремы 1. Полученные результаты имеют важные и неожиданные след- ствия. Рассмотрим, например, устойчивое распределение, удов- летворяющее соотношению (1.8) с а < 1. Среднее (Хх + . .. + XJ//2 имеет одинаковое распределение с величиной Xi/i-14-1/06. Обратим внимание на то, что множитель /г~1 + 1/а стремится к бесконечно- сти с ростом п. Выражаясь нестрого, можно сказать, что среднее п величин Xk оказывается значительно больше любого фиксиро- ванного слагаемого Xk. Это возможно лишь тогда, когда макси- мальный член М„ = max [Хп растет исключительно быстро и играет основную роль в сумме Sn. Более длительный анализ подтверждает это заключение. В случае положительных случай- ных величин математическое ожидание отношения Sn/Mn стре- мится к (1—а)”1, и это верно также для любой последователь- ности {Хи} с распределением, принадлежащим области притяже- ния рассматриваемого устойчивого закона (см. задачу 26 из гл. XIII,11). Исторические замечания. Основы общей теории устойчивых распределе- ний были заложены П. Леви1) (1924), который нашел преобразования Фурье всех строго устойчивых распределений. (Устойчивые распределения в ши- роком смысле первоначально назывались квазиустойчивыми. Как мы видели, они существенно отличаются от строго устойчивых распределений лишь при а=1. Случай а=1 был исследован совместно Леви и Хинчиным.) Более простой новый подход к теории устойчивых распределений стал возможным после открытия безгранично делимых распределений. Этот новый подход (тоже основанный на анализе Фурье) также принадлежит П Леви (1937). Интерес к теории был стимулирован замечательным исследованием А. Дёб- лина (1939), посвященным областям притяжения. В предложенных им крите- риях впервые появились правильно меняющиеся функции. Современная теория по-прежнему носит отпечаток этой основополагающей работы, несмотря на то что некоторыми авторами были внесены различные усовершенствования и получены новые результаты. Гл. XVII содержит изложение теории устой- чивых распределений на основе методов Фурье, ставших теперь уже клас- сическими. В гл. IX эта теория развивается с помощью прямого подхода, более близкого к современным методам теории марковских процессов. Зна- чительные упрощения и объединение многих критериев оказались возмож- ными благодаря систематическому использованию развитой Карамата теории правильно меняющихся функций. Усовершенствованный вариант этой теории излагается в гл. VIII, 8, 9. г) Преобразования Фурье симметричных, устойчивых распределений были указаны Коши, однако оставалось неясным, действительно ли они отвечают вероятностным распределениям. При а < 1 этот вопрос был решен Пойа. Распределение Хольцмарка из примера 2, в) было известно астрономам, но не известно математикам.
§ 2. Примеры 203 § 2. ПРИМЕРЫ а) Нормальное распределение с нулевым математическим ожи- данием строго устойчивое сп==-]/~ п. б) Распределение Коши с произвольными параметрами распо- ложения, имеющее плотность 1 с л —у)2’ устойчиво с а=1. Это следует из свойства свертки для распре- деления Коши, см. гл. II, (4.6). в) Устойчивое распределение с а =1/2. Распределение F(x) = 2 имеющее плотность f (х) = -^= е 2 х , х > 0 1 V 7 К 2лх3 (2.1) (2.2) [f(x) = O при х < 0], строго устойчиво с нормирующими постоян- ными сп = п2. Это утверждение доказывается посредством элементарного интегрирования, однако предпочтительнее получить его как след- ствие того, что F имеет область притяжения. Действительно, пусть в симметричном случайном блуждании Sr обозначает момент r-го возвращения в начало координат. Очевидно, что Sr есть сумма г независимых одинаково распределенных случайных вели- чин (времен ожидания между последовательными возвращениями). В конце 1, III, (7.7) было показано, что Р {Sr гЧ\ -> F (0, г —> оо. (2.3) Таким образом, F имеет область притяжения и потому устойчиво (продолжение в примере д)). г) Гравитационное поле звезд (распределение Хольцмарка). На языке астрономии задача формулируется так: вычислить х-компо- ненту гравитационной силы, создаваемой звездной системой в случайно выбранной точке О. В основе такой постановки задачи лежит предположение, что звездная система представляет собой «случайное скопление» точек со «случайно распределенными мас- сами». Это предположение можно было бы выразить строго мате- матически в терминах распределения Пуассона и т. п., однако, к счастью, для рассматриваемой задачи подобных тонкостей не требуется. Будем рассматривать плотность звездной системы как свобод- ный параметр; пусть ХЛ обозначает х-компоненту гравитационной силы звездной системы с плотностью %. Нас интересуют возмож- ные типы распределений Х^. Интуитивное понятие «случайное
204 Гл. VI. Некоторые важные распределения и процессы скопление звезд» предполагает, что два независимых скопления с плотностями s и t могут быть объединены в одно скопление с плотностью s-H. С вероятностной точки зрения это приводит к требованию, чтобы сумма двух независимых случайных величин, распределенных как Xt и Х5, была распределена как Х5+/. Иначе это можно выразить равенством d Xs + Xt = Xi+f. (2.4) Считая, что замена единичной плотности плотностью X приводит к изменению единичной длины на длину 1/р/К и что гравита- ционная сила обратно пропорциональна квадрату расстояния, приходим к выводу, что величины X, и /2/3Хх должны иметь одинаковое распределение. Это означает, что распределения ве- личин Xf различаются лишь масштабным множителем и (2.4) сводится к (1.8) с а = 3/2. Иными словами, Х^ имеет симмет- ричное устойчивое распределение с характеристическим показа- телем а = 3/2. В дальнейшем мы увидим, что (с точностью до тривиальнсго масштабного множителя) имеется в точности одно такое распределение. Таким образом, мы решили нашу задачу, не прибегая к более глубокой теории. Астроном Хольцмарк по- лучил равносильный ответ, применяя другие методы (см. задачу 7), причем, что весьма замечательно, до появления работы П. Леви. д) Моменты первого прохождения в броуновском движении. Введем сначала понятие одномерного диффузионного процесса. Диффузионный процесс—это такой процесс Х(/), приращения которого X(s-H)—X(s) за непересекающиеся промежутки вре- мени независимы и имеют симметричное нормальное распределе- ние с дисперсией t. Будем предполагать известным, что траек- тории одномерного диффузионного процесса непрерывно зависят от времени. При Х(0) = 0 существует момент Та, в который частица впервые достигает уровня а > 0. Для нахождения функ- ции распределения Fa (t) = Р (Тд t) заметим, что понятие адди- тивного процесса заключает в себе полное отсутствие последействия (строго марковское свойство). Это означает, что приращение абсциссы —а между моментами времени Тд и Та + / не зависит от течения процесса до момента Та. Далее, чтобы до- стигнуть уровня a-\-b>at частица должна сначала достигнуть уровня а, и поэтому время ожидания Та+Ь—Та до достижения уровня после достижения а не зависит от Та и имеет рас- пределение, одинаковое с распределением Т&. Иными словами, Рак?ъ~?а+Ь' Так как вероятности перехода зависят лишь от отношения x2/t, то Тд имеет то же распределение, что и а2Тх. Это означает, что распределения Fa различаются лишь масштаб- ным множителем и, следовательно, устойчивы с характеристи- ческим показателем а =1/2. Проведенное рассуждение, основанное на соображениях раз-
§ 2. Примеры 205 мерности, доказывает устойчивость распределения момента пер- вого прохождения уровня, но не дает его точной формы. Чтобы доказать совпадение F с распределением примера в), мы восполь- зуемся рассуждением, основанным на соббражениях симметрии (так называемом принципе отражения). В силу непрерывности траек- торий событие {X (Z) > а} может произойти лишь в том случае, когда уровень а был пересечен в некоторый момент Тд < t. Если Та = т</, то Х(т) = а, и из симметрии ясно, что вероятность события X (/) — Х(т)>0 равна 1/2. Следовательно, P{T,</}=2P(X(i)>0}_2 (2-5) что и требовалось доказать (ср. (2.1)). е) Точки достижения в двумерном броуновском движении. Двумерное броуновское движение образуется парой (Х(/), Y (/)) независимых одномерных броуновских движений. Нас интересует точка (a, ZJ, в которой траектория впервые достигает прямой х = а>0. Отметим, что подобно тому, как это было в предыду- щем примере, траектория может достичь прямой х = а-\-Ь>а лишь после пересечения прямой х = а. Если взять в качестве нового начала координат точку (a, ZJ, то станет ясно, что вели- чина Za+b распределена так же, как сумма двух независимых случайных величин, распределенных одинаково с величинами Za и Zb. Далее, очевидные соображения подобия приводят к заклю- чению, что величина Za распределена так же, как величина aZiy и поэтому Za имеет симметричное устойчивое распределение с характеристическим показателем а=1. Единственным таким рас- пределением является распределение Коши, так что точка дос- тижения Za имеет распределение Коши. Приведенное поучительное рассуждение, основанное на сооб- ражениях размерности, не определяет масштабного множителя. Для его вычисления заметим, что Za = Y(TJ, где Тд—момент первого достижения прямой х — а. Распределение величины Та дается формулой (2.5), a Y (/) имеет нормальное распределение с дисперсией t. Следовательно, величина Za имеет плотность, равнуюг) С____!___а dt =_____(2 6) [Здесь мы имеем пример подчиненности процессов, к которому мы еще вернемся в гл. Х,7.] ж) Устойчивые распределения в экономике. Примененные в двух последних примерах и основанные на соображениях размерности г) Подстановка r/ = ~ (x2 + «2)/Z ^сводит подынтегральную функцию к функции
206 Гл. VI. Некоторые важные распределения и процессы рассуждения были использованы Б. Мандельбротом для доказа- тельства того, что различные экономические процессы (в частно- сти, распределения дохода) подчинены устойчивым (или «Леви — Парето») распределениям. До настоящего времени сила и ценность этой интересной теории, привлекшей внимание экономистов, про- явились скорее в теоретической сфере, чем в прикладном аспекте. [По поводу кажущегося согласия хвостов распределения с мно- гими эмпирическими явлениями, начиная от размера городов до частоты слов, см. гл. 11,4, з).] з) Произведения. Существует много любопытных соотношений между устойчивыми распределениями с различными характери- стическими показателями. Наиболее интересное из. них можно сформулировать в виде следующего предложения. Пусть X и Y— независимые строго устойчивые случайные величины с характери- стическими показателями аир соответственно. Предположим, что величина Y положительна (при этом В < 1). Тогда произве- дение XY1/a имеет устойчивое распределение с характеристиче- ским показателем ар. В частности, произведение нормальной случайной величины и квадратного корня из случайной величины с устойчивым распределением примера в) имеет распределение Коши. Это утверждение вытекает как простое следствие из теоремы о подчиненных процессах1) [пример 7, в) гл. X]. Кроме того, его легко проверить с помощью анализа Фурье [задача 9 из гл. XVII, 12] и для положительных случайных величин с по- мощью преобразований Лапласа [гл. XIII, 7, д) и задача 10 из гл. XIII, 11]. § 3. БЕЗГРАНИЧНО ДЕЛИМЫЕ РАСПРЕДЕЛЕНИЯ В Я1 Определение 1. Распределение F безгранично делимо, если для каждого п существует распределение Fn, такое, что F = F%*. Иными словами2), F безгранично делимо, если при каждом п х) Для непосредственной проверки с минимальными вычислениями можно поступить следующим образом. Найдем распределение величины Z = о: / (X / ~~~~ — Хх у Yi+X2 у Y2 , вычислив сначала условное распределение Z при условии Yx = z/3, Y2 = r/2. Это условное распределение есть функция суммы Z/1 + //2, и замена переменных w = //i + y2, и = У1— Уъ показывает, что распре- деление Z отличается от распределения Xip^ Yx лишь масштабным множи- телем. Аналогичные вычисления можно проделать в случае п таких сла- гаемых. 2) Следует иметь в виду, что случайные величины Х^, п вводятся только для простоты и наглядности. При фиксированном п случайные величины Xi, п, ..., Х„, п предполагаются взаимно независимыми, но при т Ф п вели- чины Х7-? т и Xfc?„ не обязаны даже быть определенными на одном и том же вероятностном пространстве (иначе говоря, совместное распределение величин Xfe> т и п может не существовать), Это замечание относится к схеме серий вообще.
<S 3. Безгранично делимые распределения в 311 207 его можно представить как распределение суммы Sn = X1 п + ... п п независимых случайных величин с одним и тем же распределением Fn. Это определение относится к распределениям в любом конеч- номерном пространстве, однако здесь мы ограничимся рассмотре- нием лишь одномерных распределений. Следует отметить, ^что безграничная делимость является свойством типа, т. е. вместе с F все распределения, отличающиеся от F лишь параметрами расположения, безгранично делимы. Устойчивые распределения безгранично делимы и выделяются среди безгранично, делимых тем, что для них Fn отличаются от F лишь параметрами распо- ложения. Примеры, а) Все гшош-распределения (включая показатель- ные) в силу свойства свертки из (2.3) гл. II безгранично делимы- Безграничная делимость дискретного варианта гамма-распределе. ний—«отрицательных биномиальных» распределений (включая геометрические распределения) была доказана в 1; гл. XII, 2, д). б) Пуассоновское и обобщенное пуассоновское распределения безгранично делимы. Будет показано, что все безгранично дели- мые распределения являются пределами обобщенных пуассонов- ских распределений. в) Связанное с бесселевыми функциями распределение (7.13) из гл. II безгранично делимо, однако это вовсе не очевидно; см. пример 7, г) гл. XIII. г) Безгранично делимое распределение не может быть сосре- доточено на конечном интервале, если оно не сосредоточено в одной точке. В самом деле, пусть F безгранично делимо. Если | Sn | < а с вероятностью единица, то |Х^ „ |< ап"1 и поэтому Var (ХЛ1 „) < а2п~2. Следовательно, дисперсия F, будучи меньше а2^1, должна быть равна нулю. Возвращаясь к определению 1, посмотрим, что произойдет, если опустить требование одинаковой распределенности величин Х^ п и потребовать лишь, чтобы при каждом п существовало п распределений Flt п, ..., Fn,n, для которых F = F1\n*...+Fn,H. (3.1) Такая общность приводит к новому явлению, которое лучше всего проиллюстрировать на примерах. Примеры, д) Если F — безгранично делимое распределение, а U — произвольное распределение, то распределение G=^U ^F можно представить в виде (3.1) сбЬп = (/ и Gk^ n = Fn_1 при п > 1. Роль первой компоненты здесь совершенно отлична от роли остальных компонент. е) Рассмотрим сходящийся ряд Х = ^Х& взаимно независимых случайных величин. Распределение F величины X, являясь сверт-
208 Гл. VI. Некоторые важные распределения и процессы кой распределений величин Х15 Х2, Х,^ и распределения остаточного члена (Хп + Хи+1 + • • •), представлено в виде (3.1). Распределения такого рода называются бесконечными свертками и будут изучаться в дальнейшем. Пример гл. I, 11, в) показывает, что равномерное распределение является бесконечной сверткой. Отличительной чертой этих примеров является то обстоятель- ство, что вклад отдельной компоненты Х1э п в сумму Sn сущест- вен, в то время как в случае одинаково распределенных компо- нент вклад каждой отдельной компоненты стремится к нулю. Мы хотим теперь связать безгранично делимые распределения с ти- пичными предельными теоремами для сумм «большого числа ма- лых компонент». Для этого необходимо дополнить нашу схему требованием, чтобы отдельные компоненты Xky п были асимпто- тически пренебрегаемыми в том смысле, что для любого 8 > 0 при достаточно больших п выполнялись бы неравенства P{|Xft,„|>e}<e (6 = 1, (3.2) В терминологии гл. VIII, 2, это означает, что величины Х^и стремятся по вероятности к нулю равномерно по k=l, ..., п. Системы случайных величин такого типа встречаются довольно часто, и поэтому удобно дать им специальное название. Определение 2. Двойная последовательность случайных величин Xky п (k = l, 2, .... /г; п = 1, 2, ...), в которой образующие п-ю строку (серию) случайные величины Х11П, ..., Хп,п взаимно не- зависимы, называется схемой серий1). Если выполняется (3.2), то схема серий называется нулевой (или схемой серий с асимптотически пренебрегаемыми компо- нентами ). Более общим образом можно было бы рассматривать схемы серий с гп величинами в n-й серии, где гп—>оо, однако в дей- ствительности общность при этом не увеличивается. (См. задачу 10.) Пример, ж) Пусть {Ху} — последовательность одинаково рас- пределенных независимых случайных величин и Sn = Xx+ .. . 4-Хи. Нормированная сумма ^па~г есть сумма величин n-й серии в схеме серий, в которой Xft>n = X^a”1. Эта последовательность серий является нулевой, если ап—>оо. Иного типа схема серий была рассмотрена при выводе пуассоновского распределения в 1, гл. VI, 6. > В главах IX и XVII будет доказан следующий замечательный факт: предельное распределение для сумм 8п величин, образующих п-ю серию в нулевой схеме серий, (если оно существует) безгра- нично делимо. Если выполнено условие асимптотической пренебре- гаемое™ (3.2), то неважно, одинаково или неодинаково распре- В подлиннике triangular array— треугольная схема. — Прим, перев.
§ 3. Безгранично делимые распределения в ffi,1 209 делены компоненты Xfei п1 и в (3.1) знак равенства можно заменить пределом: класс безгранично делимых распределений совпадает с классом предельных распределений для сумм величин, образую- щих п-ю серию в нулевых схемах серий. Примеры прикладного характера, з) Дробовой эффект в вакуум- ных трубках. Различные варианты и обобщения рассматриваемого ниже случайного процесса встречаются в физике и технике связи. Рассмотрим флуктуации электрического тока, возникающие из-за случайных флуктуаций числа попадающих на анод электро- нов. Предполагается, что моменты попадания электронов на анод образуют пуассоновский процесс и чт;о попавший электрон возбуж- дает ток, сила которого % единиц времени спустя равна /(х). Сила тока в момент t изображается случайной величиной Х(0= 5 /(Z-ТД (3.3) где —предшествующие t моменты попадания электронов. (Иными словами, величины t—Тп Т2 — Тп Т3 — Т2, . .. взаимно незави- симы и имеют одинаковое показательное распределение.) Нетрудно проанализировать сумму (3.3) непосредственно мето- дами теории случайных процессов, однако простой подход с по- мощью схемы серий может помочь лучшему пониманию сути вещей. Разобьем интервал — оо, t на маленькие подынтервалы с концами в точках tk — t—kh (й = 0, 1, ...). В силу самого определения пуассоновского процесса вклад интервала tk, в сумму (3.3) можно приблизительно считать случайной величиной, принимаю- щей значение 0 с вероятностью 1—ah и значение I (t — tk) с ве- роятностью ah. Математическое ожидание и дисперсия этой слу- чайной величины равны соответственно ahi (kh) и ah (1 —ah) I2 (kh). Положим h=l)Vn и построим схему серий, в которой Х^ п есть вклад й-го интервала. Сумма величин, образующих отдельную серию, имеет математическое ожидание ah 2 I (kh) и дисперсию оЛ(1—аЬ)У\ I2 (kh). Если ряду (3.3) можно придать какой-либо смысл, то распределения сумм по сериям должны будут сходиться к распределению X (/) и мы приходим к следующим соотношениям! СО 00 Е (X (/)) = а $ / (s) ds, Var(X(0) = a J I2(s)ds. (3.4) О о Эти выводы легко подтвердить с помощью предельных теорем для схемы серий. Соотношения (3.4) хорошо известны как теорема Кэмпбелла. С современной точки зрения это неглубокий резуль- тат, однако он был получен в 1909 г. за десятилетия до того, как была развита систематическая теория. В свое время этот резуль- тат казался замечательным и его передоказывали многими разными способами,
210 Гл. VI. Некоторые важные распределения и процессы и) Загруженность линий связи. Приведем еще один сходный с предыдущим пример, иллюстрирующий характер возможных обобщений. Рассмотрим телефонную станцию с бесконечным числом линий. Предположим, что приходящие вызовы образуют пуассо- новский процесс и что каждый приходящий вызов направляется на свободную линию. Времена обслуживания имеют одинаковое распределение F и, как обычно, предполагаются независимыми друг от друга и от процесса поступления вызовов. Число занятых линий в момент t является случайной величиной X(Z), распреде- ление которой можно нацти, применяя метод, основанный на схеме серий. Как и в предыдущем примере, разобьем 0, t на п интер- валов длины h= t/n и обозначим через Х^ п число разговоров, которые начинаются между п—kh и п—(£— l)h и все еще про- должаются в момент t. Если п велико, то величина ХЛ, п прак- тически принимает только значения 0 и 1, причем последнее с вероятностью a/i[l — F (kh)]. Поэтому математическое ожидание Sn представляет собой сумму этих вероятностей, и, переходя к пределу, мы выводим, что число занятых линий имеет мате- матическое ожидание 00 Е(Х(/)) = а J[l-F(s)]ds. (3.5) о Отметим, что интеграл в (3.5) равен математическому ожиданию времени обслуживания. Исторические замечания. Понятие безграничной делимости восходит к Б. де Финетти (1929). Преобразования Фурье безгранично делимых распределений с конечными дисперсиями были найдены А. Колмогоровым (1932). В 1934 г. П. Леви нашел преобразования Фурье произвольных безгранично делимых распределений. Им же безгранично делимые распределения изучались с точки зрения случайных процессов. Все последующие исследования происходили под сильным влиянием фундаментальной работы П. Леви. Первые чисто аналити- ческие выводы общей формулы были даны в 1937 г. независимо Феллером и Хинчиным. Этими авторами было также доказано, что предельные распреде- ления для нулевых схем серий безгранично делимы. § 4. ПРОЦЕССЫ С НЕЗАВИСИМЫМИ ПРИРАЩЕНИЯМИ Безгранично делимые распределения тесно связаны со случай- ными процессами с независимыми приращениями. Под процессом с независимыми приращениями мы понимаем зависящее от непре- рывного параметра t семейство случайных величин X(Z), такое, что для любого конечного множества значений параметра < < t2 <... < tn приращения X (^+1)—X (tk) взаимно независимы. На данном этапе нам не потребуется теория случайных процес- сов; мы просто допускаем, что если некоторое явление может быть описано вероятностным образом, то это описание приведет к безгранично делимым распределениям. Именно так мы уже рас-
§ 4. Процессы с независимыми приращениями 211 сматривали некоторые процессы с независимыми приращениями в 1, гл. XVII, 1, и в примере гл. III, 8, а). Ограничимся для простоты рассмотрением числовых случайных величин X (/), хотя теория переносится и на векторные величины. Процесс имеет стационарные приращения, если распределение величины X(s + Z)—X(s) зависит лишь от длины t интервала и не зависит от s. Разобьем интервал s, s-{-t посредством п-f-l равноотстоящих точек s = /0 = s + Z и положим X^W = X(^)— — X Приращение X (s + t)—X (s) процесса co стационар- ными независимыми приращениями равно сумме п независимых одинаково распределенных случайных величин Xfti п и, следова- тельно, имеет безгранично делимое распределение. Мы увидим, что верно и обратное. Именно, однопараметрическое семейство вероятностных распределений определенное при t > 0, может служить распределением приращений Х($-|-/) — X (s) процесса со стационарными независимыми приращениями тогда и только тогда, когда Qs+t = Qs*Qt, s, t>Q. (4.1) Семейство распределений, удовлетворяющее соотношению (4.1), называется полугруппой распределений (см. гл. IX,2). Каждое безгранично делимое распределение может быть взято в качестве элемента Qt (t > 0 произвольно) такой полугруппы. Прежде чем переходить к нестационарному случаю, рассмот- рим несколько типичных примеров. Примеры, а) Обобщенный пуассоновский процесс. Пусть F — произвольное вероятностное распределение иа>0. Обобщенное пуассоновское распределение задается формулой (а/)* = (4.2) /г=0 Нетрудно убедиться, что соотношение (4.1) здесь действительно выполняется. Пусть Х(/)—случайный процесс со стационарными независимыми приращениями и приращения X (/)—X (0) имеют распределения Qt. Когда распределение F сосредоточено в точке 1, этот процесс сводится к обычному пуассоновскому процессу и (4.2) можно записать в виде Р{Х (0-X (0) = = e~ai . (4.3) Общая модель (4.2) допускает следующую интерпретацию в тер- минах обычного пуассоновского процесса. Пусть Yn Y2, ... — независимые случайные величины с одинаковым распределением F, и пусть N (?)— обычный пуассоновский процесс: P{N(/) = n} = ~ e~at (at)n/nl, не зависящий от YA. Распределение (4.2) совпадает
212 Гл. VI. Некоторые важные распределения и процессы с распределением случайной суммы Yj + ... + Ynw Иными сло- вами, с n-скачком пуассоновского процесса связывается эффект Yn, и приращение Х(^) — Х(0) представляет собой сумму эффектов, соответствующих интервалу времени 0, t. Рандомизированное слу- чайное блуждание, изучавшееся в гл. II, 7, является обобщенным пуассоновским процессом, отвечающим тому случаю, когда вели- чины Yfe принимают лишь значения ±1. Практические приложе- ния будут проиллюстрированы в конце параграфа. б) Броуновское движение или процесс Винера—Башелье. Так называется начинающийся в начале координат процесс (т. е. X (0)=0), приращения которого X(s + 0— X(s) за непересекающиеся про- межутки времени независимы и имеют нормальное распределение с нулевым математическим ожиданием и дисперсией t. Винером и Леви было показано, что траектории такого процесса с вероят- ностью 1 непрерывны1) и что это свойство выделяет нормальное распределение среди всех безгранично делимых распределений. в) Устойчивые процессы. Соотношение (1.8) для строго устой- чивых процессов равносильно соотношению (4.1) с Qt(x) = = Р Таким образом, распределение R(t~1/ax) определяет переходные вероятности процесса со стационарными независимыми приращениями; при а = 2 получаем броуновское движение. Основная теорема теории безгранично делимых распределений утверждает (см. гл. IX и XVII), что самое общее решение урав- нения (4.1) и, следовательно, самое общее безгранично делимое рас- пределение можно представить как предел подходящей последова- тельности обобщенных пуассоновских распределений. Результат этот довольно удивителен, если принять во внимание большую формальную разницу между примерами а) и б). Распределение величины X(Z-f-s) — Х(/) в случае процесса с нестационарными независимыми приращениями тоже представимо как распределение сумм по строкам в схеме серий Xk, п, однако теперь для выполнения (3.2) нужно потребовать выполнения не- которых условий непрерывности. Пример д) объясняет необхо- димость этого требования. Если наложить некоторые слабые ограничения,4 то распределения величин X (^ + $)—X(Z) будут необходимо безгранично делимы. Примеры, г) Операционное время. Простая замена времени нередко сводит общий процесс к более доступному для изучения процессу со стационарными приращениями. Если <р—произволь- ная возрастающая непрерывная функция, то замена t—>cp(Z) пере- водит процесс Х(/) в процесс Y (Z) = X (ср (£)). Свойство незави- симости приращений, очевидно, сохраняется, и при подходящем выборе ср приращения нового процесса могут оказаться стационар- х) Как всюду в этом томе, автор отвлекается от ограничений типа сепа- рабельности и т, пг-Прим> перев>
§ 5. Обобщенные пуассоновские процессы 213 ними. На практике выбор функции ср обычно подсказывается при- родой рассматриваемого процесса. Например, на телефонной стан- ции вряд ли кто стал бы сравнивать ночной час с загруженным дневным часом—естественно измерять -время в, переменных едини- цах, таких, что ожидаемое число вызовов за единицу времени оставалось бы постоянным. Аналогично при растущем страховом бизнесе претензии будут поступать с возрастающей частотой, однако это отклонение от стационарности устраняется просто введением операционного времени для измерения частоты поступления пре- тензий. д) Практические приложения. Огромное количество практи- ческих задач можно свести к обобщенным пуассоновским процес- сам. Приведем несколько типичных примеров, (i) Накопленный убыток за счет автомобильных катастроф, пожаров, молний и т. п. По поводу применений к теории страхования см. пример 5, а), (ii) Общий улов рыболовецкого судна при поиске косяков рыбы (Дж. Нейман), (iii) Количество воды в водохранилище в зависи- мости от дождей и потребления воды. Аналогично рассматри- ваются другие задачи хранения запасов, (iv) Камень, лежащий на дне реки, находится без движения в течение столь долгих промежутков времени, что последовательные смещения допустимо считать практически мгновенными. Общее смещение камня за время 0, t можно рассматривать как обобщенный пуассоновский процесс. (Впервые этот вопрос изучался другими методами Аль- бертом Эйнштейном-младшим и Д. Пойа.) (v) Телефонные вызовы, или прибытия клиентов на пункт обслуживания. При соответ- ствующих условиях общее время, необходимое для обслуживания требований, поступивших в интервале времени О, I, описывается обобщенным пуассоновским процессом. Замечательной особенностью этого процесса является тот факт, что значение X (/) не наблюдаемо в момент t, поскольку оно определяется временами обслуживания, относящимися к будущему, (vi) Изменения энергии физических частиц при столкновениях рассмотрены в примере X, 1, б). § 5*). ОБОБЩЕННЫЕ ПУАССОНОВСКИЕ ПРОЦЕССЫ И ЗАДАЧИ О РАЗОРЕНИИ Пусть X (£)— обобщенный пуассоновский процесс. Это значит, что приращение X (t + §)—X (s) за любой интервал времени длины t имеет распределение Qt, задаваемое формулой (4.2). Пусть с>0 и z > 0 фиксированы. Разорением мы называем событие {X(t)>z + ct}. (5.1) *) Этот параграф посвящен специальной теме. Он имеет большой прак- тический интерес, но материал его нигде не будет использоваться в дальней- шем, за исключением примеров, где эта тема изучается другими методами.
214 Гл. VI. Некоторые важные распределения и процессы В дальнейшем с будет рассматриваться как постоянная, а г > О как свободный параметр. Обозначим через R (г) вероятность того, что разорение никогда не произойдет. Предполагая, что вся задача имеет смысл, мы выведем формально, что вероятность R (г) должна быть неубывающим решением функционального уравнения (5.2). Приведем сначала несколько примеров, показывающих степень раз- нообразия практических ситуаций, приводящих к рассматри- ваемой задаче. Примеры, а) Теория страхования1'). Значением Х(/) здесь является накопленное количество претензий, предъявленных стра- ховой компании за интервал времени 0, t. Предполагается, что поступление претензий описывается пуассоновским процессом и что отдельные претензии имеют распределение F. В принципе «претензии» могут быть как положительными, так и отрицатель- ными (например, смерть клиента может освободить компанию от обязательства и увеличить ее резервы). На практике растущая развивающаяся нормально компания естественно измеряет время в операционных единицах, пропорционально полной сумме полу- ченных страховых премий [см. пример 4, г)]. Поэтому можно предположить, что при отсутствии претензий резервы компании возрастают с постоянной скоростью с. Если z—начальный резерв компании в момент 0, то общий резерв компании в момент t представляется случайной величиной z-\-ct — Х(/), а «разорение» (крах компании) происходит, как только резерв становится отри- цательным. б) Хранение запасов. Идеальное водохранилище наполняется реками и дождями с постоянной скоростью с. В случайные мо- менты времени расходуется часть воды в количествах Хр Х2, ... . Рассматриваемая модель описывается обобщенным пуассоновским процессом, и если исходное количество воды в момент времени О равно г, то в момент t количество воды будет равно z + ct—X (t) при условии, что водохранилище не осушится до этого времени. Задачам подобного рода посвящена огромная литература (см. мо- нографии, указанные в конце книги). в) Обслуживание больных2). Будем рассматривать промежутки времени, которые врач тратит на обслуживание* пациентов, как независимые случайные величины с показательным распределением х) Этой теории (основанной Лундбергом) посвящена огромная литература. Обзор ее имеется в относительно недавней работе Г. Крамера (см.: Cramer Н., On some questions connected with mathematical risk, Univ. Calif. Publications in Statistics, vol. 2, № 5 (1954), 99—125). Асимптотические оценки Крамера (полученные с помощью глубоких методов Винера — Хопфа) доказаны элемен- тарными методами в примерах гл. XI, 7, а), и гл. XII, 5, г). 2) Pyke R., The supremum and infimum of the Poisson process, Ann. Math. Statist., 30 (1959), 568—576. Пайк рассматривает лишь чисто пуассоновский процесс, но зато получает более точные результаты (иными методами),
§ 6. Процессы восстановления 215 и средней длительностью а”"1. Когда обслуживание происходит без перерывов, уход обслуженных пациентов подчинен обычному пуассоновскому процессу. Пусть Х(/) — число уходов пациентов за время 0, t. Предположим, что в момент 0 (начало работы) врача ожидают z пациентов и что последующие пациенты приходят в моменты времени с~х, 2с”1, Зс-1, .... Врач не будет без дела, пока X (/) z 4-с/. > Следующее формальное рассуждение приводит к уравнению, определяющему вероятность разорения 1—R. Пусть первый ска- чок траектории происходит в момент т и имеет величину х. Чтобы разорение никогда не произошло, необходимо, чтобы х z + ст и чтобы при всех t > т приращения X (/)—х не превосходили z—x + ct. Поскольку приращения независимы, последнее из этих событий имеет вероятность, равную R(z—х + ст)- Интегрируя по всем возможным значениям тих, получаем R (z) = ае~атйт R(z + cx—x)F\dx\. (5.2) О - оо Это и есть нужное нам уравнение, однако его можно упростить. Производя замену s = ?4-ct, имеем К(2) = уJe-^/<=)(s-^ds j R(s—x)F{dx}. (5.3) Z — 00 Из (5.3) следует, что функция R дифференцируема. Дифференци- руя (5.3), получаем окончательное интегро-дифференциальное уравнение Z 4 7?'(г) = 7^ (г)-у R(z-x} F {dx}. (5.4) — 00 Отметим, что по определению R (s) = 0 при s < 0, и поэтому инте- грал справа в (5.4) есть свертка F * R. Мы вернемся к уравне- нию (5.4) в примерах 9, г); гл. XI, 7, а) и гл. XII, 5, г). § 6. ПРОЦЕССЫ ВОССТАНОВЛЕНИЯ Основные понятия теории восстановления были введены в 1, гл. XIII в связи с рекуррентными событиями. Мы увидим, что введение непрерывного времени связано скорее с изменениями в обозначениях, чем с изменениями по существу. Важнейшее свой- ство рекуррентных событий состоит в том, что последовательные времена ожидания Tk являются взаимно независимыми случайными величинами с общим распределением Л; момент п-го осуществле-
216 Гл. VI. Некоторые важные распределения и процессы ния события равен Srt = Tx+... +Т„. (6.1) Принимается также соглашение, что Sw = 0, и 0 считается мо- ментом осуществления номер нуль. Даже в вероятностных процессах, зависящих от непрерывного времени, нередко можно обнаружить одну или более последова- тельностей моментов времени, для которых имеет место (6.1). В таких случаях простыми методами удается получить удиви- тельно точные результаты. Аналитически мы имеем дело просто с суммами независимых положительных случайных величин, и единственным оправданием введения термина «процесс восстанов- ления» является его частое использование в связи с другими процессами, а также то обстоятельство, что при применении этого термина молчаливо подразумевается использование мощного сред- ства— уравнения восстановления1). Определение 1. Последовательность случайных величин {Sn} образует процесс восстановления, если величины Sn имеют вид (6.1), где Т&—взаимно независимые случайные величины с общим распре- делением F, удовлетворяющим условию2) F(0) = 0. Поскольку рассматриваемые случайные величины положительны, то математическое ожидание ц = Е(1\) имеет смысл, даже если соответствующий интеграл расходится (в этом случае ц=оо). Математическое ожидание р называется средним временем возвра- щения. Как обычно в подобных обстоятельствах, для нашего иссле- дования неважно, появляются ли величины в некотором вероят- ностном процессе или последовательность {Ту-| сама определяет вероятностное пространство. Во многих (но не во всех) приложениях величину Ту можно интерпретировать как «время ожидания», а суммы Sn являются тогда моментами восстановления (или регенерации). Представляется интуитивно очевидным, что для любого конеч- I—। ного интервала 1 = а,Ь число попадающих в 1 моментов восста- новления конечно с вероятностью единица и, следовательно, представляет собой вполне определенную величину N. Если собы- тие £ 1} называть «успехом», то N есть общее число успехов в бесконечной последовательности испытаний с математическим ожиданием, равным 00 оо U{I} = X P{S„G/}= X Fn*n\- (6-2) n = 0 n = 0 x) Более сложное обобщение рекуррентных событий имеется в работе: Kingman J. F. С., The stochastic theory of regenerative events, Zeit. Wahr- scheinlichkeitstheorie, 2, (1964), 180—224. Русский перевод см. сб. Матема- тика, 11:2 (1967), стр. 106—152. 2) Существование атома с массой р < 1 в нуле не должно иметь серьез- ных последствий.
§ 6. Процессы восстановления 217 Для изучения этой меры мы введем, как обычно, соответствую- щую ей функцию распределения: 1/(х)=2>*(х). (6.3) /2=0 Понятно, что при х <0 £7 (%) = 0, но в нуле мера U имеет атом единичной массы. , В дискретном случае, который был рассмотрен в 1, XIII, мера U была сосредоточена на множестве целых чисел: uk обозначало вероятность того, что одна из сумм Sw равна k. Так как это со- бытие могло появиться только один раз, то uk можно было также интерпретировать как ожидаемое число сумм S„, равных k. В рас- сматриваемой ситуации U {/} должно интерпретироваться как математическое ожидание, а не как вероятность, так как собы- тие 1} может произойти при многих п. Докажем, что U (я) < оо Из определения сверток распреде- лений, сосредоточенных на 0, оо, следует, что Fn* (%) Fn (%) и поэтому ряд в (6.3) сходится со скоростью геометрической про- грессии при всех х, при которых F (х) < 1. Остается случай рас- пределений, сосредоточенных на конечном интервале, но в этом случае существует целое число г, такое, что Fr* (%) < 1. Члены ряда с номерами я = г, 2г, Зг, ... образуют сами ряд, который сходится, и так как члены ряда (6.3) монотонно зависят от п, то отсюда следует сходимость всего ряда (6.3). Как и в дискретном случае, мера U тесно связана с уравне- нием восстановления Z = z + F*Z. (6.4) Это уравнение является сокращенной записью следующего урав- нения: X Z(x) = z (%)+ 5 Z(x—y)F{dy\, х>0, (6.5) о где интервал интегрирования замкнут. На самом деле пределы интегрирования можно заменить на — оо и оо при условии, ко- нечно, что z (x) — Z (х) = § при х < 0. Мы будем придерживаться этого соглашения. Следующая теорема содержит самый существенный факт, ка- сающийся уравнения восстановления. Теорема 1. Если функция z ограничена и обращается в нуль при х < 0, то свертка Z = U^z, определяемая равенством X Z(x) = ^z(x—y)U {dy\, (6.6) о является решением уравнения восстановления (6.5). Это решение
218 Гл. VI. Некоторые важные распределения и процессы единственно в классе функций, обращающихся в нуль на —оо, О и ограниченных на конечных интервалах. Доказательство. Мы уже знаем, что определяющий U ряд (6.3) сходится при всех х. Вычисляя свертки обеих частей равенства (6.3) с г, убеждаемся в том, что Z ограничена на конечных интервалах и удовлетворяет уравнению восстановления. Разность V двух таких решений должна удовлетворять уравнению V = F^V и, следовательно, уравнениям V = Fn* при всех п. Но Fn* (х)—>0 при всех х, и если V ограничена, то отсюда выте- кает, что !/(%) = 0 при всех х. > Мы возвратимся к уравнению восстановления в гл. XI, где будут изучены асимптотические свойства U и Z. (Обобщенный вариант уравнения восстановления см. в § 10.) Нужно отметить, что функция U сама удовлетворяет урав- нению х U (%) = 1 -f- и (%—y)F{dy}, х>0, (6.7) о которое представляет собой частный случай при г=1 уравнения восстановления (6.5). Это можно показать непосредственно с по- мощью вероятностного рассуждения, которое часто используется в теории восстановления1). Поскольку 0 считается моментом вос- становления, ожидаемое число моментов восстановления в замкну- ।-----------------1 том интервале 0, х равно единице плюс ожидаемое число таких —I —I моментов в полуоткрытом интервале 0, х. Интервал 0, х содер- жит моменты восстановления, лишь когда при условии, что г^1 = у ^х, ожидаемое число моментов восстановления в интер- —I вале 0, х равно U (х—у). Интегрируя по у, получаем уравне- ние (6.7). Полезны два простых обобщения процесса восстановления. Сначала по аналогии с недостоверными рекуррентными событиями мы можем рассмотреть несобственные распределения. Дефект q=\—F (оо) интерпретируется при этом как вероятность обрыва. Выражаясь абстрактно, можно сказать, что к действительной пря- мой добавляется одна точка Q, называемая «смертью», и равно либо положительному числу, либо Q. Для удобства ссылок вве- дем теперь следующее неформальное Определение 2 2). Процесс, отличающийся от обычного процесса восстановления лишь тем, что функция распределения F несоб- х) Автор называет это рассуждение «renewal argument».— Прим, перев. 2) В примере 7, е) имеется иллюстрация это г о^о пределения, а в задаче 4 — его обобщение»
§ 7. Примеры и задачи 219 ственная, называется обрывающимся или невозвратным процессом восстановления. Дефект q—\—F (оо) интерпретируется как ве- роятность обрыва. Ради согласованности 0 считается моментом восстановления номер нуль. Вероятность того, что процесс переживает n-й мо- мент восстановления, равна (1—q)n и стремится к 0 при п—>оо. Таким образом, с вероятностью единица обрывающийся процесс обрывается за конечное время. Полная масса распределения Fn* есть (1—7)Л\ и поэтому математическое ожидание числа момен- тов возвращения равно U (оо) = q"1 < оо. Число U (оо) можно назвать, таким образом, ожидаемым числом возобновлений про- цесса. Вероятность того, что Sn^Zx и процесс обрывается на п-м моменте восстановления, равна qFn* (х). Нами доказана, таким образом, Теорема 2. Для обрывающегося процесса восстановления функция qU является собственным вероятностным распределением длитель- ности жизни процесса (возраста в момент смерти). Второе обобщение соответствует рекуррентным событиям с за- паздыванием и состоит в том, что исходному времени ожидания разрешается иметь другое распределение. В этом случае добав- ляется величина Ту с / = 0 и So = To=^=O. Определение 3. Процессом восстановл ния с запаздыванием называется последовательность So, Sn ... вида (6.1), где Tk—• взаимно независимые строго положительные (собственные или не- собственные) случайные величины, причем Тх, Т2,... (но не То) имеют одинаковое распределение. § 7. ПРИМЕРЫ И ЗАДАЧИ От дискретного случая легко перейти к изучению примеров процессов восстановления, связанных с самовосстанавливающи- мися агрегатами, счетчиками элементарных частиц, ростом попу- ляций и т. д. Ниже рассматривается одна специальная задача, приводящая, однако, к интересным общим выводам. Пример, а) Парадокс инспекции. При теоретическом рассмот- рении самовосстанавливающихся агрегатов предполагают, что какая-либо часть оборудования, например электрическая батарея, работает после установки до момента выхода из строя. После этого она мгновенно заменяется другой подобной батареей и таким образом процесс продолжается без перерыва. Моменты замены образуют процесс восстановления, в котором Т\— продолжитель- ность службы (lifetime) £-й батареи. Допустим теперь, что с помощью выборочного обследования необходимо оценить истинное распределение времени службы батарей. Мы берем выборку из совокупности батарей, рабо- тающих в какой-либо данный момент времени t > 0 и наблю-
220 Гл. VI. Некоторые важные распределения и процессы даем выбранные батареи до конца их службы. Пусть F—общее распределение вероятностей времени службы каждой из батарей. Можно было бы ожидать, что это же распределение имеет и (остающееся) время службы выбранных нами батарей. Но это не так. Если F — показательное распределение, то описываемая ситуация лишь словесно отличается от рассмотренной в гл. I, 4 (парадокс времени ожидания). Соответственно время службы обсле- дуемых единиц имеет распределение, отличающееся от F. Тот факт, что исследуемая часть оборудования начинает наблюдаться с момента t, изменяет распределение срока ее службы по сравне- нию с «безусловным (в частности, удваивает среднюю продолжи- тельность службы). Мы увидим в гл. XI, (4.6), что это обстоя- тельство типично для всех процессов восстановления. Из ска- занного вытекают серьезные для приложений следствия. Беспри- страстный на первый взгляд план контроля может вести к ложным заключениям, поскольку то, что в действительности наблюдается, может не быть типичным для всей популяции. Будучи замечен- ным, этот феномен легко получил свое объяснение (см. гл. I, 4), но он тем не менее указывает на возможные опасности при выве- дении следствий и? наблюдений и на необходимость взаимосвязи теории с практикой. Отметим, что никаких трудностей не возник- нет, если наблюдения производить над прибором, заменяющим первый вышедший из строя после момента t. >> Введем три случайные величины, важные для теории восста- новления. В рассмотренном выше примере все эти три величины относятся к сроку службы участвующего в процессе прибора в момент ^>0 и могут быть описаны следующими, ,не нуждаю- щимися в объяснении терминами: остающееся время службы, про- шедшее время службы и полное время службы. Дадим теперь формальное определение. Каждому t > 0 поставим в соответствие однозначно опреде- ляемый (случайный) индекс Nt, такой, что <SNf+i- Тогда а) остающееся время ожидания по определению равно SN/+i — t, т. е. равно времени, протекающему от t до следующего за t момента восстановления; б) прошедшее время ожидания по определению равно t — SN/, т. е. равно времени, протекающему до t от первого момента восста- новления, предшествующего t\ в) сумма остающегося и прошедшего времен ожидания, равная SN/+1—SN/=Tn/+i, есть длина интервала возвращения, накры- вающего t. Введенную терминологию нельзя считать установившейся — она меняется в зависимости от контекста. Например, в теории слу- чайных блужданий остающееся воемя ожидания называют точкой первого достижения интервала /, оо. В рассмотренном выше при-
§ 7. Примеры и задачи 221 мере время ожидания называлось сроком службы. Все три введен- ные случайные величины будут изучаться в гл. XI, 4, и гл. XIV, 3. Пуассоновский процесс был определен как процесс восстанов- ления с показательным распределением промежутков времени ожидания Ту. Во многих задачах массового обслуживания есте- ственно считать, что входящий поток образует пуассоновский про- цесс. В некоторых других процессах промежутки времени между поступлениями постоянны. Для объединения этих двух случаев в теории массового обслуживания стало модным рассматривать общий процесс восстановления с произвольными промежутками времени между поступлениями1). Перейдем теперь к некоторым задачам довольно общего харак- тера, связанным с процессами восстановления. Соответствующее процессу распределение вероятностей по-прежнему будем обозна- чать буквой F. Начнем с того, что можно грубо описать как «время ожидания W до большого пропуска'». Процесс восстановления с временами ожидания Ту будем останавливать при первом появлении интер- вала времени длины в течение которого не происходит восста- новлений. Выведем уравнение восстановления для функции рас- пределения V времени ожидания W. Так как время ожидания W превышает то !/(/) = О при t < g. При рассмотрим две взаимно исключающие возможности: либо > I, либо Тх = у^|. В первом случае W = Во втором случае процесс начинается сначала, и условная вероятность того, что {W^/} при условии T2 = z/, равна V (t—у). Суммируя по всем имеющимся возмож- ностям, получаем V(0 = l-F©+ \V(t-y)F{dy}, (7.1) О как было отмечено выше, V(^) = 0 при / < £. Это уравнение сво- дится к обычному уравнению восстановления V = z + G*V (7.2) с несобственной функцией распределения G и функцией г, опре- деляемыми равенствами 1 F(x) при x^ G w=i P® при xj H;. (7-3) 0 при X < Zl, z(x) = <j При *1. (7-4) х) Общность эта в известной степени обманчива, поскольку трудно найти соответствующие практические примеры, за исключением примера автобуса, идущего без расписания по круговому маршруту. Иллюзия общности несколько умаляется тем печальным фактом, что непуассоновский вход обычно не является также и марковским.
222 Гл. VI. Некоторые важные распределения и процессы Наиболее важным частным случаем является случай пропусков в пуассоновском процессе, т. е. случай, когда F (/) = 1—e~ct- Функция V здесь связана с теоремами о покрытии из гл. I, 9 [см. задачу 15 и пример гл. XIV, 2, а). О другом подходе см. в задаче 16.] Примеры прикладного характера, б) Пересечение потока авто- мобилей1'). Пусть автомобили движутся в один ряд с постоянной скоростью, причем последовательные пересечения автомобилями перехода (или переезда) образуют выборку из пуассоновского про- цесса (или из какого-либо другого процесса восстановления). Пешеход, появившийся на тротуаре (или автомобиль, подъехавший к перекрестку), начинает переход (переезд) после того, как убеж- дается, что в течение следующих g секунд времени, необходимых- для перехода (переезда), не пройдет ни одного автомобиля. Обо- значим через W время, необходимое для перехода (переезда), т. е. время ожидания на тротуаре (перекрестке) плюс g. Функция распределения V величины W удовлетворяет уравнению (7.1) с F(t) = l—e~ct [продолжение см. в примерах гл. XI, 7,6) и XIV, 2, а)]. в) Счетчики Гейгера типа II. Частицы попадают в счетчик в моменты, образующие пуассоновский процесс, и каждая из этих частиц (зарегистрированная или нет) делает счетчик нечувстви- тельным на фиксированное время g. Если частица зарегистриро- вана, то он остается нечувствительным (блокированным) и его чувствительность восстанавливается только тогда, когда промежу- ток времени между какими-либо следующими друг за другом час- тицами впервые превзойдет g. Наша теория применима к распре- делению V длительности периода «нечувствительности» [см. I, XIII,11, задача 14]. г) Максимальный промежуток между возвращениями. Рассмот- рим процесс восстановления; пусть Tt обозначает максимальную длину промежутков времени Ту, наблюденных2) до момента t. Событие {Z/^g} происходит тогда и только тогда, когда до момента t каждый интервал времени длины g содержит момент восстановления, и поэтому в наших обозначениях Р > g} = = V(t). ► Значительное число встречающихся в приложениях процессов восстановления могут быть охарактеризованы как альтернирующие процессы или процессы с двумя фазами. В зависимости от кон- текста эти две фазы могут быть названы фазами «активности» и т) С относительно старой литературой и другими вариантами этой задачи (изучаемыми иными методами) можно познакомиться по работе Tanner J. С., The delay to pedestrians crossing a road, Biometrica, 38 (1951), 383—392. 2) Более точно, пусть n—(случайный) индекс, такой, что <Sn. Тогда Z^ = max[Tn ..., Т„_7, g]. Случайные величины этого типа система- тически изучались А, Ламперти,
§ 7. Примеры и задачи 223 «пассивности», «чувствительности» и «нечувствительности», «воз- буждения» и «покоя». Активные и пассивные фазы процесса чере- дуются; их продолжительности предполагаются независимыми слу- чайными величинами с общим распределением для каждой фазы. Примеры, д) Поломки с последующими простоями. В качестве простейшего примера рассмотрим последовательные замены выхо- дящей из строя детали в предположении, что каждая поломка сопровождается некоторым простоем (его можно интерпретиро- вать как время, необходимое для обнаружения поломки, или же как время, нужное для ремонта). Последовательные периоды ра- боты Тх, Т2, ... чередуются с последовательными «мертвыми» пе- риодами Yx, Y2, ..., и мы получаем собственный обычный про- цесс восстановления с временами возвращения Ty+Yy. Этот про- цесс можно также рассматривать как процесс восстановления с запаздыванием с моментом первого восстановления, равным Тх, и временами возвращения Yy + T/+1. е) Потерянные вызовы. Рассмотрим одну телефонную линию; пусть поступающие на нее вызовы образуют пуассоновский про- цесс с распределением времен между вызовами, равным G (/) = = 1—e~ct. Предположим, что длительности следующих за вызо- вами разговоров являются независимыми случайными величинами с общим распределением F. Линия может быть свободной или занятой, и вызовы, поступающие в течение периодов занятости теряются и не влияют на процесс. Мы имеем здесь процесс с двумя фазами с распределением времени возвращения, равным F*G. (См. задачу 17, а также задачи 3, 4 из гл. XIV, 10.) ж) Прибывший последним обслуживается первым. Иногда рас- пределения различных времен ожидания априори неизвестны, но могут быть вычислены по другим данным. В качестве примера рассмотрим устройство для обработки информации, в которое новая информация поступает в соответствии с пуассоновским про- цессом, так что свободные периоды имеют показательное распре- деление. Время, которое требуется для обработки новой инфор- мации, поступающей в любой момент, имеет распределение G. Периоды занятости и свободные периоды чередуются, но дли- тельность периодов занятости зависит от того, как обрабатывается информация, поступающая в течение периода занятости. Бывают ситуации, когда лишь последняя информация представляет инте- рес. В таких случаях вновь поступившая информация сразу же начинает обрабатываться, а вся предыдущая информация отбра- сывается. Распределение V продолжительности периодов занятости можно вычислить по уравнению восстановления (см. задачу 18). и) Счетчики Гейгера. В счетчиках типа I за каждой регист- рацией следует период нечувствительности фиксированной длины Попадания частиц в этот период никак не отмечаются. Процесс
224 Гл. VI. Некоторые важные распределения и процессы здесь тот же, что и в примере д), причем величины Ту имеют показательное распределение, а величины У у равны В счетчи- ках типа II не регистрируемые частицы тоже приводят к блоки- ровке и ситуация аналогична предыдущей, с тем исключением, что распределения величин У у зависят от исходного процесса и должны вычисляться по уравнению восстановления (7.1) [при- мер в)]. ► § 8. СЛУЧАЙНЫЕ БЛУЖДАНИЯ Пусть Хп Х2,...—взаимно независимые случайные величины с одинаковым распределением F. Обозначим, как обычно, So = O,. S„ = Xj4-...-|-Хп. (8.1) Будем говорить, что Szz есть положение в момент п частицы, совершающей случайное блуждание общего вида. Никаких новых теоретических идей в этом параграфе не появляется1) — просто будет введена терминология для краткого и наглядного описания процесса {S„}. Например, для всякого интервала / (или какого- либо другого множества) событие называется попаданием в /, и изучение последовательных попаданий в заданный интер- вал / выявляет важные характеристики флуктуаций последова- тельности Sp S2, ... . Индекс п интерпретируется как временной параметр, и мы будем говорить о «моменте и». В этом параграфе некоторые удивительные особенности случайных блужданий описы- ваются в терминах последовательных рекордных значений. Полез- ность полученных результатов будет видна из их применений в § 9. Другой (независимый) подход будет рассмотрен в § 10. «Вложенные» процессы восстановления Скажем, что в момент п > 0 достигается рекордное значе- ние, если S„>Sy, / = 0, 1, ..., ц-1. (8.2) Такие индексы п могут существовать не для всех траекторий; если они существуют, то образуют конечную или бесконечную упорядоченную последовательность. Поэтому можно говорить о первом, втором и т. д. осуществлении (8.2). Моменты этих осуществлений являются (возможно, несобственными) случайными величинами. Теперь мы в состоянии ввести важные случайные величины, на использовании которых будет основываться значи- тельная часть исследования случайных блужданий. х) Выборочные пространства бесконечных случайных блужданий уже рас- сматривались в первом томе, однако там нам приходилось определять такие понятия, как «вероятность разорения», с помощью очевидных предельных пе- реходов. Теперь эти очевидные переходы к пределу обоснованы теорией меры (см. гл. IV, 6),
§ 8. Случайные блуждания 225 Определение. Назовем k-м (верхним) лестничным индексом момент k-го осуществления неравенств (8.2). Значение Sn в k-й лестничный момент будем называть k-й лестничной высотой. (Обе введенные случайные величины, возможно, являются несобст- венными. ) Нижние лестничные случайные величины определяются анало- гично с помощью неравенств, обратных неравенствам (8.2)х). Термин «верхний» обычно будет излишним и будет использо- ваться лишь при желании особо это подчеркнуть или достигнуть большей ясности. Лестничные точки на графике траектории (So, Sx,...)—это те точки, в которых график доходит до не достигавшейся ранее вы- соты (рекордное значение). На рис. 1 изображена траектория уходящего к минус бесконечности случайного блуждания с последним положительным положением при п = 31. Здесь 5 верхних и 18 нижних лестничных точек этой траектории обозна- чены • и о соответственно. Случайное блуждание с распределе- нием Коши изображено на рис. 2 (см. стр. 227). Пример, а) В «обычном» случайном блуждании F имеет атомы 1 и —1 с массами р и q. Верхние лестничные величины при д> р будут несобственными, причем дефект равен 1—р/q [см. 1; гл. XI, (3.9)]. Здесь &-я лестничная высота равна k и потому не упоминалась в первом томе; &-й лестничный индекс равен моменту первого достижения точки k. Распределение £-го лест- ничного индекса было найдено в 1; гл. XI, 4, е), а для частного случая р= 1/2—в теореме 2 в 1; гл. III, 4. Первый лестничный индекс S\ равен моменту первого попа- дания в интервал 0, оо, а первая лестничная высота равна S^. Продолжение случайного блуждания после момента S\ является вероятностной копией всего случайного блуждания. При условии, что = появление второго лестничного индекса а в момент k > п зависит только от Хл+1, ..., Х^, и поэтому число испытаний между первым и вторым лестничными индексами пред- ставляет собой случайную величину S\, не зависящую от S\ и имеющую одинаковое с S\ распределение. Аналогичное рассуж- дение приводит к следующему общему результату: k-й лестничный индекс и k-ю лестничную высоту можно представить в виде где STj и j — взаимно независимые одинаково распределенные слу- х) Заменяя в (8.2) строгие неравенства на неравенства и «С, получаем слабые лестничные индексы. Это вызывающее некоторые осложнения различие несущественно, когда распределение F непрерывно, На рис» 1 слабые лест- ничные точки 'отмечены буквой w, *8 № 24Э
226 Гл. VI. Некоторые важные распределения и процессы Рис. 1. Случайное блуждание и связанный с ним процесс ожидания. Случайные величины Хп в случайном блуждании {Sn} имеют математическое ожидание — 1 и дисперсию 16. Верхние и нижние лестничные точки обозначены • и о соответ- ственно. Пятая лестничная точка, имеющая координаты (26, 16), с большой вероятностью представляет максимум всего случайного блуждания. [Буква w указывает те точки, где рекордные значения достигаются вто- рой или третий раз; эти точки являются слабыми лестничными точками, определяемыми соотношениями (8.2) с заменой строгих неравенств на нестро- гие .] Всюду на графике'Sn превосходит свое математическое ожидание, равное — п. В действительности первым индексом, для которого Sn^—п, является п=135 (при этом S135==—137). Отмеченное обстоятельство согласуется с тем фактом, что математическое ожидание такого п равно бесконечности. Случайные величины Хп имеют вид Хп = ^?п—<Дп, где 33п и <Дп—взаимно независимые случайные величины, распределенные равномерно на множествах 1, 3, 5, 7, 9 и 2, 4, 6, 8, 10 соответственно. В примере 9,а) величины W„ представляют собой полное время ожидания n-го клиента, когда время между поступлениями требований принимает с одинаковой вероятностью значения 2, 4, 6, 8, 10, а время обслуживания равно каждому из чисел 1,3, 5, 7 или 9 с вероятностью 1/5. Распределение величины Хп имеет массы (5 — &)/25 в точках ± 2&— 1, где & = 0, 1, 2, 3, 4. чайные величины. Иными словами, лестничные индексы и высоты образуют (возможно, обрывающийся) процесс восстановления. Интуитивно представляется очевидным, что в случае обрываю- щихся процессов суммы Sn уходят к —оо и с вероятностью еди- ница достигается максимум последовательности {Sn}. В следующем параграфе будет обнаружено, что лестничные случайные величины
§ 8. Случайные блуждания 227 являются мощным аппаратом при исследовании одного класса процессов, имеющего значительный практический интерес. Пример, б) Точные выражения. Пусть F имеет плотность аЬ пх. —7-7е » а-\- b аЬ С-Ьх a “j- b * Такое случайное блуждание обладает f(x) = х < 0, х > 0. (8.3) тем редким свойством, что b । । । । I । । । । I । । । । I I I .’I Г I i I I | Рис. 2. Случайное блуждание, порожденное распределением Коши. (Распреде- ление было урезано, чтобы исключить большие скачки.) все связанные с ним распределения могут быть точно вычислены. Это блуждание играет большую роль в теории массового обслу- живания, поскольку функция f есть свертка двух экспоненциаль- ных плотностей, сосредоточенных на 0, оо и —оо, 0 соответст- венно. Иными Словами, величины Ху могут быть представлены в виде разностей Ху = $?у—Л; двух независимых положительных 8*
228 Гл. VI. Некоторые важные распределения и процессы показательно распределенных случайных величин. Не ограничивая общности, можем считать, что а^Ь. Верхняя лестничная высота имеет плотность ае~Ьх\ вели- чина будет несобственной, и дефект ее равен (Ь—dyb. Верх- ний лестничный момент имеет производящую функцию b~lp (s), где 2p(s) = a + &—К (я + 02—^abs. (8.4) Дефект этой случайной величины тоже равен (Ь—а)/Ь. Нижняя лестничная высота при х < 0 имеет плотность аеах, и производящая функция нижнего лестничного момента f равна a~xp(s). Эта производящая функция в частном случае а=-Ь сво- дится к производящей функции 1—К1—s, которая известна из теории обычного случайного блуждания (или бросания монеты). [Доказательства и другие результаты см. в гл. XII, 4, 5, и XVIII, 3. См. также пример 4, д).] £9. ПРОЦЕССЫ МАССОВОГО ОБСЛУЖИВАНИЯ Имеется чрезвычайно обширная литература1), посвященная раз- личным вопросам, связанным с обслуживанием, управлением запа- сами, временем ожидания и т. п. Немало уже сделано для по- строения общей теории, однако наличие очень большого числа мало отличающихся друг от друга вариантов задач затемняет ситуа- цию, так что трудно разглядеть лес за деревьями. Мощь новых общих методов до сих пор недооценивается. Начнем с формаль- ного введения случайного процесса, определяемого с помощью г) Литературные ссылки можно найти в соответствующих монографиях, указанных в библиографии. Было бы трудно дать короткий очерк развития теории массового обслуживания со справедливым указанием авторства. Наибо- лее выдающиеся работы, в которых были заложены новые методы, считаются теперь устаревшими в силу того прогресса, который они стимулировали^ [Примером может служить интегральное уравнение Линдли в теории массо- вого обслуживания (1952).] Другие работы заслуживают внимания благодаря исследованным в них (иногда очень сложным) частным задачам, однако нет возможности включить их в систематический обзор общей теории. В целом обширная литература в нескольких областях посвящена изучению различных вариантов и примеров,' в то время как единой теории нет. Установление авторства затруднено также тем, что многие результаты были получены не- зависимо разными авторами. Например, решение некоторого интегрального уравнения появилось в 1939 году в одной диссертации в Стокгольме со ссыл- кой на неопубликованные лекции, читанные Феллером в 1934 году. Это реше- ние теперь известно в сочетании со многими именами. По истории развития теории см. обзорные статьи Д. Г. Кендалла, которые представляют и само- стоятельный интерес: Some problems in the theory of queues; Some problems in the theory of dams, J. Roy. Statist. Soc., Series B, 13 (1951), 151—185, 19 (1957), 207—233; Some recent work and further problems in the theory of queues. Теория вероятностей и ее применения. IX, 1, 1964, 3—15. Внимание к общим методам отличает монографии А, А, Боровкова по теории массового обслуживания,
§ 9. Процессы массового обслуживания 229 рекуррентной схемы, которая представляется на первый взгляд довольно искусственной. Дальнейшие примеры иллюстрируют широкую применимость этой схемы; впоследствии мы увидим, что весьма точные результаты можно получить, используя удивительно простые методы (см. гл. XII, 5). Определение 1. Пусть Х^, Х2, ...—взаимно независимые слу- чайные величины с одинаковым (собственным') распределением F, Процессом ожидания, индуцированным последовательностью {XJ, назовем последовательность случайных величин Wo, Wn ..., опре- деляемую рекуррентно следующим образом', положим Wo = O и _J w„ + x„+1 при W„ + Xn+1>0, n+1 I о при W„ + X„+I<o. ( - ' В сокращенной записи (9.1) означает, что Wn+1=(Wn+XZ2+1) и 0. Рис. 1 иллюстрирует это определение (См. стр. 226). Примеры, а) Система с одним прибором. Пусть на «прибор» поступают «требования», причем поступления требований образуют собственный процесс восстановления с промежутками времени между поступлениями1), равными Л19 Л29 ... (требования нуме- руются числами 0, 1, 2, ... и поступают в моменты 0, Л19 Лг + Л2, ...). Предположим, что на n-е требование тратится время обслуживания 33 п. Будем считать, что случайные вели- чины 33п не зависят от моментов поступлений требований и друг ют друга и имеют одинаковое распределение. Прибор может быть либо «свободным», либо «занятым», причем в начальный момент 0 юн свободен. Схема обслуживания требований такова. Если тре- бование поступает в момент, когда прибор свободен, то оно сразу же начинает обслуживаться. В противном случае оно становится в очередь, и прибор непрерывно обслуживает требования в по- рядке их поступления2) до тех пор, пока очередь не исчезнет и прибор не станет «свободным». Под длиной очереди мы понимаем число поступивших необслуженных требований (включая требова- ние, которое обслуживается в данный момент). Временем обслужи- вания Wrt n-го требования называется промежуток времени от его х) Как правило, мы будем считать, что промежутки времени между по- ступлениями требований либо постоянны, либо имеют показательное распре- деление, однако, следуя современной моде, можно рассмотреть и произвольный процесс восстановления; см. сноску на стр. 221. 2) Этот «порядок очереди» совершенно несуществен для длины очереди, длительности периодов занятости и аналогичных характеристик. Тот или иной порядок очереди имеет значение лишь с точки зрения обслуживания отдельных требований. Порядки очереди могут быть различными; «крайними случаями» являются следующие-: требования обслуживаются в порядке их поступления, первым обслуживается последнее поступившее требование, обслуживается слу- чайно выбранное из очереди требование, Вся картина меняется, если допу- стить возможность отказов.
230 Гл. VI. Некоторые важные распределения и процессы поступления до начала его обслуживания. Общее время, затра- ченное на обслуживание n-го требования, равно Wn + $„ (напри- мер, если первые времена обслуживания суть 4, 4, 1, 3, ...г а времена между поступлениями требований суть 2, 3, 2, 3, то требования с номерами 1, 2, ... становятся в очередь длины 1, 1, 2, 1 соответственно и отвечающие им номера ожидания равны 2, 3, 2, 2, .. .). Чтобы избежать тривиальных сложностей типа поступления одного требования в момент окончания обслуживания другого,, мы предположим, что распределения А и В случайных величин Лп и Sin непрерывны. В этом случае длина очереди в любой момент вполне определена. Построим схему последовательного вычисления времен ожи- дания Wп. По определению нулевое требование поступает в мо- мент 0 на свободный прибор, и поэтому его время ожидания Wa равно нулю. Предположим теперь, что n-е требование поступает в момент t и что время его ожидания Wп известно. Обслужива- ние n-го требования начинается в момент / + Wn и завершается в момент / + Следующее (n-j-l)-e требование поступает в момент / + Лп+1-. В этот момент прибор свободен, если Wn + ^ < Л„+1, а в противном случае время ожидания (н4-1)-го требования равно W„+1 = Wn + Sn—Лп+1. Таким образом, после- довательность времен ожидания jWj совпадает с процессом ожи- дания, индуцированным независимыми случайными величинами *п==®п-1—Лп, /2=1,2,... . (9.2> б) Управление запасами. Для наглядности мы рассмотрим: водохранилище, однако используемая модель применима и в дру- гих ситуациях, связанных с управлением запасами. Количество воды в водохранилище зависит от ее притока и от ее использо- вания. Приток происходит за счет рек и дождей, а использова- ние определяется поступлением требований (требования, конечно, удовлетворяются лишь в том случае, когда водохранилище не пусто). Рассмотрим теперь количество воды1) 0, Wn W2, ... в водо- хранилище в моменты 0, тп т2, ... . Пусть Хп есть разность между величиной действительного притока и величиной теорети- ческого (идеального) требования, поступившего в интервал вре- мени тп-1, т„. Будем считать, что все изменения происходят мгновенно и возможны лишь в моменты времени т2, .... В момент 0 имеем Wo = O. В общем случае изменение Wn+1 — содержимого бассейна равно Xn+i, если только требование не превышает возможности. Следовательно, последовательность {Wn} должна удовлетворять соотношениям (9.1), т. е. последовательные х) Для простоты мы начинаем с пустого водохранилища. Переход к про- извольным начальным условиям не вызывает затруднений [см* пример в)К
§ 9. Процессы массового обслуживания 231 количества воды в бассейне образуют процесс ожидания, индуци- рованный последовательностью {XJ, при условии, конечно, что случайные величины Хп независимы и одинаково распределены. Задача (если не для прикладника, то во всяком случае для математика) состоит в том, чтобы найти условия, при выполнении которых величины Xft независимы и имеют одинаковое распре- деление F, а также найти возможные формы F. Обычно вели- чины %k либо находятся на одинаковом расстоянии друг от друга, либо представляют собой моменты последовательных скачков пуассоновского процесса, но для наших целей достаточно пред- положить, что %k образуют- процесс восстановления, индуцирован- ный, скажем, последовательностью Лг, Л^ .... Наиболее часто используемые модели принадлежат одному из следующих двух классов: (i) Приток поступает с постоянной скоростью с, требования 53п произвольны. При этОхМ Хп = сЛп—53п, и мы должны предполо- жить независимость Х„ от «прошлого» Хх, ..., Xw_t (обычное требование независимости Лп и 53п здесь излишне: нет оснований предполагать некоррелированность требования 53п с длитель- ностью Лл). (ii) Использование запаса происходит с постоянной скоростью, приток произволен. Этот класс схож с предыдущим: отличие, по существу, лишь в том, что Лп и 53п поменялись ролями. в) Очереди на пригородные поезда1). Пригородный поезд, име- ющий г пассажирских мест, отправляется от станции каждый час. Будущие пассажиры появляются на станции и становятся в очередь. На каждый отходящий поезд садятся первые г человек, а остальные остаются в очереди. Предположим, что количество пассажиров, появляющихся на станции между последовательными отходами поездов, являются независимыми случайными величи- нами Лг, Л2. ... с одинаковым распределением. Пусть число пассажиров, стоящих в очереди сразу же после n-го отправления, равно Wrt и допустим для простоты, что Wo = O. Тогда Wn+1 = = Х¥„ + Лп+1—г, если УЫп-\-Лп+1 — г > 0, и Wn+1 = 0 в противном случае. Таким образом, последовательность есть процесс ожидания, индуцированный величинами Хп = Лп—г. ► Поставим теперь задачу описать процесс ожидания {W„} в терминах порожденного величинами Xk случайного блуждания. Как в § 8, положим So = O, S„ ^Х^ ... +Х„ и будем придер- живаться введенных там обозначений для лестничных величин. Для облегчения описания воспользуемся моделью примера а). г) Boudreau Р. Е., Griffin J. S., Кас М., On elementary queuing problem, Amer. Math. Monthly, 69 (1962), 713—724. Эта статья имеет дидактический характер — она написана для неспециалистов, не знакомых с предметом. В ней используется другой подход, но приведенные там вычисления перекрываются вычислениями примера гл. XII, 4, в).
232 Гл. VI. Некоторые важные распределения и процессы Пусть v—такой индекс, что SjT^O, S2^0, Sv_,^0, но Sv<0. При этом требования с номерами 1, 2, v—1 имеют положительные времена ожидания W^S^ ..Wy-x^Sy^, a v-e требование является первым требованием (с положительным ин- дексом), поступающим на свободный прибор (первое удачливое требование). С момента прибытия v-ro требования процесс идет как вероятностная копия всего процесса. С другой стороны, v есть просто индекс первой отрицательной суммы, т. е. v является пер- вым нижним лестничным индексом. Обозначим его в соответствии с предыдущим через Мы приходим, таким образом, к первому выводу’, нижние лестничные индексы соответствуют удачливым требованиям, находящим прибор свободным. Отсюда вытекает, что моменты поступлений удачливых требований образуют процесс восстановления, у которого времена возвращений распределены одинаково с cFf. В практических случаях величина S’ £ должна быть собствен- ной. В самом деле, в противном случае с вероятностью, равной дефекту S’ г, требование никогда не застанет прибор свободным (исключая нулевое требование), и с вероятностью единица будет последнее удачливое требование, за которым будет следовать неоканчивающаяся очередь. Мы увидим, что S' Г есть собственная случайная величина, если E(^ft) <Е(^). Предположим теперь, что (у—1)-е требование поступает в мо- мент т. Ему приходится ждать время Wv_1 = Sy^1, и обслужива- ние его завершается к моменту т +Wv_x+ Ж-1- Первое удачливое требование (с номером v) поступает в момент т + Лу, и до этого момента прибор оставался свободным в течение времени e/Zy-Wy_^~ ^у_] = -- Sy_ ] -Ху = - Sy. Согласно определению v, величина Sv есть первая нижняя лест- ничная высота ^г. Поскольку с момента поступления v-ro тре- бования процесс начинается сначала, то мы приходим ко второму выводу*, длительности свободных периодов являются независимыми случайными величинами, распределенными так же, как — (т. е. как время возвращения для нижних лестничных высот).. Таким образом, требование с номером . .+0Г7 является r-м требованием, застающим прибор свободным. В момент его прибытия прибор уже свободен в течение времени — Теперь должно быть ясно, что между последовательными лестничными моментами сегменты графика траектории процесса массового обслуживания {W„} конгруэнтны сегментам графика траектории случайного блуждания {Sn}, причем они сдвинуты вертикально так, /чтобы начинаться с точки на временной оси (рис. 1). Для аналитического описания этого факта обозначим: временно через [п] последний нижний лестничный индекс иными словами, [п] есть (случайный) индекс, такой, что и stnj<s/> j = 0, 1, (9.3)
§ 9. Процессы массового обслуживания 233 Индекс [п] определен однозначно с вероятностью 1 (напомним, что распределение величин Ху непрерывно). Имеем, очевидно, W„ = S„-Stn]. (9.4) Соотношение (9.4) приводит к очень важному выводу, если величины Xlt ..., Х„ рассмотреть в обратном порядке. Положим для краткости XJ = X„, ..., Х'п = И1. Частные суммы последова- тельности {X k} суть S* = X;+ ... +Xfe = S„—Sn_k. Из (9.4) выте- кает, что максимальный член последовательности О, S^, ..., имеет индекс п—[п] и равен W„. Поскольку векторы (XJ, ..., Х'п) и (Х£, ..., Хп) одинаково распределены, нами доказана важная Теорема1). Случайные величины Wn и M„ = max[0, Sx, ..., SJ (9.5) распределены одинаково. Следствия*из этой теоремы будут обсуждаться в гл. XII. Здесь мы покажем, что теорема позволяет сводить некоторые задачи о разорении к задачам теории массового обслуживания (несмотря на внешнее несходство этих задач). Примеры, г) Задачи о разорении. В § 5 «разорение» было определено как событие, состоящее в том, что Х(/)>г + с/ при некотором где X(t)—обобщенный пуассоновский процесс с рас- пределением (4.2). Обозначим Tf, т2, ... моменты последователь- ных скачков процесса X(f). Если разорение вообще происходит, то оно происходит также в некоторый момент т^, и поэтому достаточно рассматривать вероятность осуществления события Sw = X(t„)—схп > г при некотором п. Но по определению обоб- щенного пуассоновского процесса величина X (т„) есть сумма п не- зависимых случайных величин Nk с одним и тем же распределе- нием F, в то время как тп есть сумма п независимых показа- тельно распределенных величин Лк. Таким образом, по существу мы имеем дело со случайным блужданием, порожденным случай- ными величинами X* = Yft—сЛк, плотность распределения кото- рых дается формулой у J е<а/е) (х-у)р {dy\. (9.6) X Разорение происходит тогда и только тогда, когда в этом слу- чайном блуждании при некотором п происходит событие \Sn^z}. Нахождение вероятности разорения сводится, следовательно, х) Впервые этот результат был обнаружен ? по-видимому, Полачеком в 1952 г. и использован (в ином контексте) Спицером: The Wiener — Hopf ^equation whose kernel is a probability, Duke Math. J., 24 (1947)s 327—344» По доводу доказательства Спикера см» задачу 21»
234 Гл. VI. Некоторые важные распределения и процессы к отысканию распределений величин W„, образующих индуциро- ванный величинами Xk процесс ожидания. д) Численная иллюстрация. Наиболее важным процессом мас- сового обслуживания является процесс, в котором времена междр поступлениями требований и времена обслуживания имеют пока- зательные распределения с математическими ожиданиями \/а и 1/fr соответственно, причем а < &. Характеристики этого процесса описаны в примере 8,6) и можно сделать вывод, что время ожи- дания п-го требования имеет предельное распределение W с атомом массы 1—а/b в начале координат и плотностью ^^ае~{Ь~а)х при: х > 0. Математическое ожидание этого распределения равно Ь ф—а) ‘ Плотность распределения свободных периодов прибора совпадает с плотностью первой нижней лестничной высоты и равна ae~at. В рассматриваемом случае свободные периоды и вре- мена между поступлениями требований распределены одинаково (это, однако, не является общим фактом для процессов массового обслуживания). Номер N первого требования, застающего прибор свободным*, имеет производящую функцию p(s)/a, где р($)—функция, зада- ваемая формулой (8.4). Рассмотрим теперь период занятости*, начинающийся в момент 0, т. е. время до первого момента, когда прибор оказывается свободным. Поскольку этот период начинается с поступления требования номер 0, то случайная величина N равна числу требований, поступивших в течение первого периода заня- тости. Простой подсчет показывает, что случайная величина N имеет' математическое ожидание b/(b—а) и дисперсию ab(a-}-b)l(b—я)3. Пусть, наконец, Т есть длительность периода занятости. Точ- ное выражение плотности Т дается формулой (6.16) гл. XIV* с ср = а и cq = b. Это выражение содержит бесселеву функцию^ и не поддается простым вычислениям. Тем не менер моменты величины Т могут быть найдены с помощью ее преобразования Лапласа, полученного иными методами в примерах гл. XIV, 4, а) и XIV, 6,6). Они равны Е(Т)--^ и В рассматриваемом процессе ожидания периоды занятости чередуются со свободными периодами, и их математические ожи- дания равны соответственно 1/(Ь—а) и 1/а. Следовательно, отно- шение (Ь—а)/а есть мера доли времени, в течение которого прибор остается свободным. Более точно: если за время t прибор не был. занят общее время U (/), то EU (/)//—>(&—а) а. В таблице 1 математическое ожидание времени обслуживания принято за единицу, так что а представляет собой математи- ческое ожидание числа требований, поступающих в течение в ре-
§ 10. Возвратные а невозвратные случайные блуждания 235 Таблица 1 6 = 1 0 = 0,5 0 = 0,6 я = 0,7 а = 0,8 0 = 0,9 0 = 0,95 В ремя ожи- Математиче- 1 1,5 2,3 4 9 19 дания (ста- ционарный режим) ское ожида- ние Дисперсия 3 5,3 10 24 99 399 Период заня- Математиче- 2 2,5 3,3 5 10 20 тости ское ожида- ние Дисперсия 12 25 63 225 1900 15 600 Число требо- Математиче- z2 2,5 3,3 5 10 20 ваний в тече- ние периода занятости ское ожида- ние Дисперсия 6 15 44 180 1710 14 820 .мени обслуживания одного требования. Как видно из таблицы, дисперсии периодов занятости очень велики. Следовательно, нужно ожидать очень больших флуктуаций периодов занятости. Таким образом, обычная доверчивость к математическим ожиданиям весьма опасна в практических приложениях. Для периода заня- тости с дисперсией 225 тот факт, что математическое ожидание ого равно 5, мало о чем говорит. Многомерный аналог рассмотренного нами процесса массового обслужи- вания гораздо более сложен. Основы его теории были заложены в фундамен- тальной работе Дж. Кифера и Дж. Вольфовица [On the theory of queues with many servers, Trans. Amer. Math, Soc., 78 (1955), 1—18]. § 10. ВОЗВРАТНЫЕ И НЕВОЗВРАТНЫЕ СЛУЧАЙНЫЕ БЛУЖДАНИЯ В настоящем параграфе дается классификация случайных блуж- даний. Эта классификация не зависит от материала § 8 и тесно связана с теорией восстановления, изложенной в § 6. Каждой функции распределения F на прямой поставим формально в соот- ветствие функцию интервалов £/{/}= S я* {/}. (Ю.1) k = 0 Ряд в (10.1) тот же, что и в (6.2), но если распределение F не сосредоточено на полупрямой, он может расходиться даже, когда I есть конечный интервал. Ниже будет показано, что сходимость или расходимость ряда (10.1) имеет глубокий смысл. Основные результаты настоящего параграфа просты, однако их формули-
236 Гл. VI. Некоторые важные распределения и процессы ровки, к сожалению, усложняются необходимостью отдельного рассмотрения арифметических распределений1). Обозначим для краткости Ih и + / интервалы —h < х < и t—h < х< / 4-/1 соответственно. Теорема 1. (i) Если распределение F неарифметическое, то либо U{I}<oo для всех конечных интервалов, либо U {/} = оо для всех интервалов. (ii) Если F—арифметическое распределение с шагом %, то либо £/{/}<оо для всех конечных интервалов, либо U {7} = оо для всякого интервала, содержащего точку вида rik. (iii) Если U {Ih} < 00, то + (10.2> при всех t и й > 0. Для облегчения ссылок на два возможных случая введем сле- дующее определение (в этом определении F наделяется прилага- тельными, которые в действительности относятся к соответству- ющему блужданию). Определение. Распределение F называется невозвратным, если U {/} < оо для всех конечных интервалов, и возвратным в против- ном случае. Имея чисто вероятностное значение, теорема 1 связана также с интегральным уравнением Z = z + F*Z, (10.3} аналогичным уравнению восстановления (6.4). Мы используем интегральное уравнение (10.3) как исходный пункт и докажем, теорему 1 одновременно со следующим предложением. Теорема 2. Пусть z—непрерывная функция, такая, что 0 z (х) р0 при | х | < h и z (х) = 0 вне интервала lh. Если F — невозвратное распределение, то функция со Z(x)= $ г (х-у) U\dy} (10.4} — оо z является равномерно непрерывным решением уравнения (Ю.З)^ удовлетворяющим условию О</(х)<Ио(/(/2й}. (40.5> Максимум функции Z достигается в некоторой точке интервала /Л. Доказательство теорем 1 и 2. (i) Предположим, что U {7а} < оо х) Распределение F арифметическое, если все его точки роста принадлежат множеству вида 0, £ X, ±2Х,... . Наибольшее число X, обладающее этим, свойством, называется шагом F (см, гл, V, 2),
§ 10. Возвратные и невозвратные случайные блуждания 237 при некотором а > 0. Возьмем и пусть функция г равна нулю вне 1Л, но не обращается в нуль тождественно. Будем ре- шать уравнение (10.3) методом последовательных приближений, положив ZG = z и 00 7„(х) = г(х) + y)F\dy}. — 00 (10.6) Обозначив = {/} + ...+^*{7}, (10.7) имеем, очевидно, 00 Z„(x)= $ г(х—y)Un{dy} — QO (10.8) (интегрирование в действительности распространяется на интервал длины ^2/i). Так определенная функция Zn непрерывна. Пока- жем, пользуясь индукцией, что она достигает своего максимума в точке такой, что z(£J>0. Для функции Z0==z это верно тривиальным образом. Для перехода от п—1 к п достаточно заметить, что г(х) = 0 влечет за собой Zn (х) Hzz—i, в то время как 2^ Zn (^«j) — Hrt-i* Следовательно, интервал Ih + ln содержится в интервале /2Л> и поэтому в силу (10.8) (10.9) Тем самым доказано, что функции Z„ равномерно ограничены. Поскольку Zo Zj <;..., то отсюда вытекает, что Zn—>Z, при- чем функция Z удовлетворяет неравенствам (10.5). В силу монотонной сходимости из (10.6) и (10.8) следует, что* предел Z удовлетворяет интегральному уравнению (10.3) и имеет вид (10.4). Неравенство (10.5) выполняется вследствие (10.9). Верхняя граница зависит только от максимума функции z, и мы можем свободно положить z(x) = ja0 для всех х внутри подходящего подынтервала /л интервала Ih. В этом случае мы имеем из (10.8) Zn(x)^pQUn {/. + %}. (10.10) Неравенство (10.10) справедливо при всех ц < А и, следовательно, также при ц = Л (так как интервал Ih замкнут). Два последних неравенства вместе доказывают, что (10.2) справедливо. Отсюда вытекает, что £/{/}<оо для всех интервалов, длина которых не превышает h. Но каждый конечный интервал может быть разбит на конечное число интервалов, у которых длина < /г, и поэтому {7^7}<оо для всех конечных /. Наконец, беря разности значе- ний в (10.4), получаем |Z (х4-6)—Z (х) К и {/2Д} sup |z (х + 6)—г (х) |.
238 Гл. VI. Некоторые важные распределения и процессы Следовательно, функция Z равномерно непрерывна, и, таким об- разом, все утверждения, касающиеся невозвратного распреде- ления F, доказаны. (ii) Предположим теперь, что (7{/а} = оо при всех а>0. Из (10.10) следует, что Zn(x)—> оо при всех х из некоторой ок- рестности нуля. Отсюда и из (10.6) вытекает, что если t—точка роста F, то Zn(x)—> оо для всех х из некоторой окрестности t. Пользуясь индукцией, легко вывести, что то же самое верно для всех точек роста любой из функций распределения F2*, F3*, .... Предположим, что распределение F не арифметическое. Оно не может быть сосредоточенным на полупрямой, так как тогда мы имели бы U {1а\ < оо (§ 6). В силу леммы 2 из гл. V, 4 а, точки роста функций F2*, F3*, ... образуют плотное множе- ство на прямой и поэтому Zn(x) —> оо при всех х. Отсюда выте- кает, что Un{I\—> оо для всех интервалов. С очевидными из- менениями это же рассуждение применимо к арифметическим распределениям. Теоремы доказаны. ► Мы еще вернемся к уравнению восстановления (10.3) в гл. XI, а сейчас выведем из теоремы 1 ряд следствий для случайных блужданий. Пусть Хх, Х2, • • • — независимые случайные величины с общим распределением F. Положим S„ = Хх 4-...-|-Х„. «Попа- данием в I в момент п» мы называем событие Sn^I. Теорема 3 х). Если распределение F невозвратно, то число попаданий в каждый конечный интервал конечно с вероятностью единица, а математическое ожидание числа таких попаданий равно U {/}. Если F — возвратное неарифметическое распределение, то число попаданий в каждый конечный интервал бесконечно с вероят- ностью единица. Если F—возвратное арифметическое распреде- ление с шагом X, то число попаданий в каждую точку вида пК бесконечно с вероятностью единица. Доказательство. Пусть распределение F невозвратно. Вероят- ность попадания в I после момента п не превосходит n-го ос- таточного члена ряда в (10.1), и поэтому для любого 8>0 при достаточно больших п вероятность более чем п попаданий не превосходит 8. Тем самым первое утверждение теоремы доказано. Предположим теперь, что F—возвратное неарифметическое распределение. Обозначим через рд (t) вероятность хотя бы одного попадания в + Достаточно показать, что рЛ(/) = 1 при всех Л>0 и t, поскольку отсюда с очевидностью следует, что любое х) Эта теорема вытекает из второго закона нуля и единицы (см. гл. IV, 6). Если ср (/ + 0 есть вероятность бесконечного числа попаданий в интервал / +/, то при фиксированном / функция ф может принимать лишь два значения: Ои 1. С другой стороны, рассматривая первый шаг случайного блуждания, видим, что = откуда ф = const (см, гл. XI, 9),
§ 10. Возвратные и невозвратные случайные блуждания 239 число попаданий в произвольный интервал имеет вероятность 1. Прежде чем продолжить, отметим, что если S„ = x, то можно перенести начало координат в точку х с тем, чтобы сделать вывод, что вероятность последующего попадания в Ih равна рл( — х). В частности, если х принадлежит lh + t, то вероятность последую- щего попадания в Ih не превосходит р2Л (— t). Докажем сначала, что рл (0) = 1. Для произвольного, но фик- сированного Л>0 обозначим через рг вероятность по меньшей мере г попаданий в Ih. Тогда р3+р2 + • • • есть ожидаемое число попаданий в /л, и оно бесконечно в силу определения возврат- ности. С другой стороны, из сделанного нами предварительного замечания следует, что рг+1^р/.-р2Л(0). Вследствие расходимости ряда 2 Рг имеем p2h (0) = 1. Переходя к произвольным интервалам /л + ^, предположим сначала, что F — неарифметическое распределение. По лемме 2 из гл. V, 4 а, каждый интервал содержит при некотором k точку роста распределения Fk* и поэтому вероятность рл (/) попадания в Ih + t положительна при всех h > 0 и всех t. №ь\ уже видели, однако, что после попадания в Ih + t возвращение в //2 досто- верно, и в силу предыдущего замечания отсюда следует, что р2л(”“0 = 1- Так как h и t произвольны, то на этом доказа- тельство для неарифметических распределений завершается. Для арифметических распределений применимы те же рассужде- ния. ► При проверке сходимости или расходимости ряда (10.1), оп- ределяющего U {/}, обычно обращаются к предельным теоремам, которые дают информацию только для очень больших интервалов. В такой ситуации задачу облегчает следующий Критерий. Если распределение F невозвратно, то вели- чина х~ги остается ограниченной при х—►оо. Утверждение является очевидным следствием (10.2), так как любой интервал Inh можно разбить на п интервалов вида /л + /. В качестве иллюстрации указанного метода будет доказана Теорема 4. Распределение с математическим ожиданием |х является возвратным, если р = 0, и невозвратным, если р,=Н=0. Доказательство. Пусть р = 0. В силу закона больших чисел существует такое целое число пе, что Р {| S„ | < &п} > 1/2 для всех. п > пе. В соответствии с этим F"* \1а} > 1/2 для п& < п< а/г. Если а > 2&пЁ, то существуют более чем а/ (2s) целых чисел п, удовлетворяющих этому условию, и, следовательно, U {1а}> а/(Дь). Поскольку 8 произвольно, то отсюда следует, что отношение a~HJ неограничено и, следовательно, F не может быть не- возвратным. Если |л > 0, то из усиленного закона больших чисел вытекает,
240 Гл. VI. Некоторые важные распределения и процессы что с вероятностью, сколь угодно близкой к единице, сумма Sn будет положительной для всех достаточно больших п. Поэтому вероятность бесконечного числа попаданий на отрицательную по- лупрямую — оо, 0 равна 0, и, таким образом, распределение F невозвратно. ► При возвратном случайном блуждании последователь- ность {SJ меняет знак бесконечно часто, и поэтому соответствую- щие такому блужданию верхние и нижние лестничные процессы возвратны. Можно считать удивительным, что обратное утвержде- ние неверно. Даже при невозвратном случайном блуждании последовательность {S„} может менять знак бесконечно часто (с вероятностью единица). В действительности это имеет место в случае, когда F симметрично. Так как при невозвратном блуж- дании число попаданий в конечный интервал —а, а конечно,; то это означает (очень грубо говоря), что перемены знаков про- исходят из-за отдельных скачков весьма большой величины: величина | Sn | перерастает все границы, но поразительное нера- венство Хл+1<—S„—а осуществляется бесконечно часто, как бы велика ни была постоянная а. Рис. 2 (стр. 227) показывает, как происходят большие скачки, однако он не дает полного представления о рассматриваемом явлении, поскольку распределение пришлось урезать, чтобы полу- чить конечный график. § 11. ОБЩИЕ МАРКОВСКИЕ ЦЕПИ Дискретные марковские цепи (1; гл. XV) довольно просто обобщаются на случай декартовых (и более общих) пространств состояний. В дискретном случае вероятности перехода задавались стохастической матрицей с элементами pl7, строки которой обра- зовывали вероятностные распределения. Теперь мы рассматриваем переходы из точки х в некоторый интервал или множество Г в SF1. Вероятность такого перехода мы обозначаем /С(х, Г). Чтобы обосновать существование необходимых нам интеграловf мы должны наложить на /С некоторые условия регулярности. Требования непрерывности хватило бы для большинства практи- ческих целей, однако, накладывая это требование, мы ничего не выигрываем по сравнению с более общим случаем. Определение 1. Стохастическим ядром К называется функция от двух переменных—точки и множества, такая, что (i) при любом фиксированном х К (х,_ Г) является вероятностным распре- делением по Г, и (ii) для любого фиксированного интервала Г К (х, Г) есть бэровская функция по х. Это определение относится к любому числу измерений (и даже к более общим пространствам).
§ 11. Общие марковские цепи 241 Мы не требуем, чтобы ядро К было определено на всем про- странстве. Если х и Г являются подмножествами множества Й, то мы говорим, что К сосредоточено на й. Иногда необходимо допустить несобственные (дефектные) распределения, и в этом случае ядро К называют субстохастическим. Нередко К можно представить в виде К (%, Г)=$6(х, y)dy. (11.1) г Функция k в (Н.1) называется плотностью стохастического ядра. В соответствии с соглашением гл. V, (3.3), соотноше- ние (11.1) кратко записывается в виде К (х, dy) = k (х, у) dy. [Строго говоря, k есть плотность по отношению к мере Лебега или длине; в случае произвольной меры т мы бы использовали запись К(х, dy) = k(x, y)m\dy}.] Прежде чем давать формальное определение марковской цепи,, подготовим соответствующий аналитический аппарат по аналогии со случаем дискретных цепей. Вероятность перехода из х в Г за два шага положим по определению равной 7С2>(х,Г)=$ К(%, dy)K(y, Г). (11.2) Q Множество й в (11.2) либо есть все пространство, либо совпа- дает с тем множеством, на котором сосредоточено ядро К. Соотношение (11.2) утверждает, что первый шаг ведет из точки к в некоторую точку уг а второй шаг — из точки у в множество Г. Основное допущение состоит в том, что при заданной промежу- точной точке у прошлая история не влияет на дальнейшие пере- ходы. Аналогичное можно сказать о —вероятности перехода за п шагов. Если положить К)1* = то для произвольных целых положительных тип должно быть К{т+п) (х, Г) = J К{т} (х, dy) (у, Г). (11.3) й Когда т = п = 11 эта формула сводится к (П.2). При m—1 и n = 1., 2, ... формула (11.3) последовательно определяет вероят- ности перехода Юп}. Обозначим для согласованности символом К(о> вероятностное распределение, сосредоточенное в точке х (кроне- керовское ядро). Тогда формула (11.3) будет справедлива при всех т^О, п^О. Операция (11.3) над ядрами, нередко встре- чающаяся и вне теории вероятностей,, называется сверткой ядер. Она во всех отношениях схожа с перемножением матриц. Вряд ли стоит специально отмечать, что ядра К(п} являются стохастическими. Если К имеет плотностьхто все ядра/Си) имеют
242 Гл. VI. Некоторые важные распределения и процессы плотности, причем эти плотности связаны формулами свертки т /г(/й+л) (х, z) = k{m} (х, у) k{n) (у, z)dy. (11.4) й Примеры, а) Свертки. Если k(x, y)~f(x—у), где f — плот- ность вероятности, то свертки (11.4) сводятся к обычным сверт- кам. Аналогичное справедливо и в общем случае, если ядро К однородно в том смысле, что А(х, Г) 7С (х —s, Г + s),. где Г -|- s получено сдвигом множества Г на s; по поводу сверток на окружности см. теорему 3 в гл. VIII, 7. б) Потери энергии при столкновениях. В физике последова- тельные столкновения частицы обычно рассматриваются как слу- чайный процесс. Считают, что если энергия (масса) частицы до столкновения равна х > 0, то после столкновения она представ- ляется случайной величиной Y, для которой Р {Y Г} (х, Г),; где К—стохастическое ядро. Обычно предполагается, что воз- можны лишь потери и что отношение Y/x имеет функцию рас- пределения G, не зависящую от х. При этом Р {Y у} = G (у/х), и функция G(y!x) определяет стохастическое ядро. В аналогичной задаче о звездной радиации [пример гл. X, 2, в)] Амбарцумян рассматривал частный случай, когда G(y) = yK при O^z/^Cl, где X—положительная постоянная. Плотность соот- ветствующего ядра сосредоточена на множестве 0 < у < х и равна Xz/A ”1х“ \ Нетрудно проверить, что плотность вероятности пере- хода за п шагов выражается в рассматриваемом случае формулой t/)=(y4'l)! (bgy)""1, 0<у<х. (11.5) Значение Х=1 соответствует равномерному распределению (уте- рянная доля «распределена случайно»), и (11.5) сводится при этом к гл.1, (8.2) [продолжение в примере гл. X, 1, а)]. в) Случайные цепи. Рассмотрим цепь (или ломаную линию) в 3i3 со звеньями длины единица и со случайными углами между соседними звеньями. Многие варианты подобной схемы (часто довольно сложные) встречаются в химии полимеров. Мы ограни- чимся рассмотрением случая, когда последовательные углы явля- ются независимыми случайными величинами. Под длиной L цепи с концевыми точками А и В мы понимаем расстояние между А и В. В результате добавления одного звена к цепи длины х получается цепь длины j/\'2-f-l—2xcos0, где 0—случайный угол между новым звеном и прямой, проходящей через точки А и В. Рассмотрим два распределения 0, особенно интересных в химии. - (i) Пусть 0 принимает значения 60° и 120° с вероятностью 1/2
§11. Общие марковские цепи 243 каждое. Тогда cos 0 = ±1/2 и длина продолженной цепи опреде-* ляется стохастическим ядром /С (х, Г), наделяющим каждую из двух точек V х* ± х± 1 вероятностью 1/2. При фиксированном х распределение сосредоточено в 2п точках. (ii) Пусть направление нового звена выбирается «случайно», т. е. предположим, что величина cos0 распределена равномерно на интервале — 1, 1 [см. гл. I, 10]. Длина продолженной цепи L лежит между |х—1| и х±1. Внутри этого промежутка по тео- реме косинусов Р (L < у} — Р {2xcos 0 > х2 + 1 4-z/2} = ~—[х2 + 1 ±z/2]/4x. Таким образом, длина продолженной цепи определяется стохасти- ческим ядром с плотностью /? (х, у) = у/2х, | х— 1 | < у < х ± 1. Длина Ln+1 цепи с звеньями имеет плотность у) (см. задачу 23). г) Дискретные цепи Маркова. Стохастическую матрицу (pt7) можно рассматривать как плотность k(i, j) = pif определенного на множестве Q целых положительных чисел стохастического ядра, по отношению к мере т, наделяющей каждую точку множества Q единичной массой. Абсолютные и стационарные вероятности Последовательность случайных величин Хо, Х£, ... подчинена вероятностям перехода если (х, Г) является условной вероятностью события при условии Хот = х. Вероятност- ное распределение величины Хп при заданном распределении у0 величины Хо выражается формулой Тв{П=$Уо{^И(л,(^ Г). (11.6) Q Определение 2. Распределение у0 называется стационарным распределением ядра К, если = пРи всех т- е- если МП = $То^К(ж,Г). (11.7> Основные свойства стационарных распределений те же, что и в случае дискретных марковских цепей. При выполнении нежест- ких требований регулярности относительно /С существует един- ственное стационарное распределение; оно является асимптоти- ческим распределением величин Хп при любом исходном распреде- лении. Иными словами, влияние начального состояния исчезает и система стремится к устойчивому состоянию, определяемому
244 Гл. VI. Некоторые важные распределения и процессы стационарным решением. Этот результат является одной из форм эргодической теоремы (см. гл. VIII, 7). Примеры, д) Процесс ожидания <|WJ, определенный в (9.1), является марковским процессом, сосредоточенным на замкнутой 1--------------- полупрямой 0, оо. Вероятности перехода определены здесь лишь 1-------------------------- для х, и при Г = 0, у имеем /С (х, Г) = Р(у—х). Существо- вание стационарной меры будет доказано в гл. VIII, 7. е) Пусть Xn X 2, ... —взаимно независимые положительные случайные величины с распределением F и с непрерывной плот- ностью /, сосредоточенной на 0, оо. Определим случайные вели- чины YA последовательно посредством формул Y^X,. YB+1 = |Y„-Xn+1|. (11.8) Последовательность образует сосредоточенный на 0, оо мар- ковский процесс с плотностями вероятностей перехода . I f(x—у) + [(х + у) при 0 <у< X, у) = { л (П.9) 1 1(х+у) при у>х> 0. Стационарная плотность g определяется уравнением g(y) = ^g(* + y)f (x)dx+\ g(x)f (x + y)dx. (11.10) 0 0 Если F имеет математическое ожидание р, го функция g(y) = p-*[l-FG/)] (11.11) является стационарной плотностью вероятности. В самом деле, с помощью простого интегрирования по частям можно убедиться, что g удовлетворяет уравнению (10.10)1). С другой стороны, из гл. V, (6.3), следует, что g есть плотность вероятности (см. за- дачу 22). ж) Одно техническое приложение2). Длинная линия передачи состоит из отдельных кусков кабеля, характеристики которых подвержены статистическим флуктуациям. Будем считать отклоне- ния от идеального значения независимыми случайными величи- нами Yx, Y2, ... и предположим, что эффект их аддитивен. Перемена направления кабеля меняет знак его взноса в суммар- х) Как обнаружить такого рода результат? Предположив, что функции f и g имеют производные, можно формально продифференцировать (10.10). Ин- тегрируя далее по частям, приходим к уравнению g' (y) = —g (0) f (у), из кото- рого вытекает, что функция g должна иметь вид (11.11). Непосредственная проверка показывает теперь, что (11.11) является решением (11.10) без пред- положений о дифференцируемости f и g. 2) Обобщение дискретной модели, использовавшейся фон Шеллингом* Elektrische Nachr. — Technik, 20 (1943), рр. 251 — 259.
§ 12. Мартингалы 245 ный эффект. Предположим, что отклонения Nk симметричны, и обозначим ХЛ = | YJ. Эффективную конструкцию длинной линии передачи можно осуществить по следующему индуктивному пра- вилу: (и-]-1)-й кусок кабеля подсоединяется так, что соответ- ствующая ему ошибка имеет знак, противоположный знаку накоп- ленной ошибки предыдущих и кусков. Накопленные ошибки под- чиняются тогда правилу (11.8), и (Н.П) является не только стационарной плотностью, но и предельным распределением: рас- пределение ошибки линии, состоящей из п кусков кабеля, близко (при больших п) к распределению с плотностью (11.11). С^дру- гой стороны, если бы отдельные куски кабеля подсоединялись независимо, то была бы применима центральная предельная тео- рема и дисперсия ошибки росла бы линейно по п, т. е. линейно относительно длины кабеля. Таким образом, указанная простая процедура учета знака отдельных ошибок не дает разрастаться суммарной ошибке. ► В приведенных примерах марковская последовательность Хо, Хп ... определялась в терминах начального распределения и вероятностей перехода Л. Совместное распределение величин (Хо, Хь ..., Х„) имеет вид у о {dx о} К (х0, dxt).К, (хп_-£, dxn). Распределения такого вида уже обсуждались в гл. III, 8, и 1, XV, 1. Мы имеем здесь типичный пример, показывающий преиму- щество определения абсолютных вероятностей в терминах услов- ных вероятностей. Более систематичным был бы подход, исполь- зующий в качестве определения соотношение €Г|Х0 = х0, ..., Хй = х>/((хп, Г). (11.12) Марковское свойство выражено здесь тем обстоятельством, что правая часть не зависит от х0, xit ..., и поэтому «предыс- тория» не влияет на будущее. Недостаток этого определения со- стоит в том, что оно вовлекло бы нас в рассмотрение вопросов существования условных вероятностей, их единственности и т. п. (Марковские процессы с непрерывным параметром изучаются в гл. X.) § 12 *). МАРТИНГАЛЫ Для первой ориентировки можно рассмотреть случайный про- цесс {Хп}, обладающий тем свойством, что совместное распреде- ление величин (Хй ..., XJ имеет строго положительную непре- рывную плотность рп. При этом элементарный метод гл. III, 2, позволяет всюду определить условные плотности и условные ма- *) Мартингалы очень важны, и поэтому им посвящен отдельный параграф, Однако нигде в этой книге мартингалы не используются в качестве аппарата,
246 Гл. VI. Некоторые важные распределения и процессы тематические ожидания. Предположим также, что рассматривае- мые величины Xw и Y„ имеют математические ожидания. Последовательность {Хя} назовем абсолютно беспристрастной (безобидной), если при п=1, 2, ... Е(Х1) = 0, Е (X„+f|Xf, ..., Х„) = 0. (12.1) Последовательность {Yn} является мартингалом, если Е (Y„+11 Y1? ..., Y7<) = Y„, n=l,2......... (12.2) (Ниже будет дано более гибкое определение.) Между этими двумя типами последовательностей имеется про- стая' связь. Пусть {Xrt}—абсолютно беспристрастная последова- тельность. Положим Y^Xi+.-.+X^ + c, (12.3) где с—постоянная. Тогда E(Y„+i|Xi......X„) = Y„. (12.4) Задающие условие величины Ху в (12.4) могут быть заменены на Yft, и поэтому (12.4) эквивалентно (12.2). С другой стороны, если последовательность {Y„}—мартингал, то положим Хх = = Yj — Е (YJ и Xn+1 = Y„+1 — Y„. Так, построенная последователь- ность {Х„} абсолютно беспристрастна и, кроме того, для рассмат- риваемых величин выполняется (12.3) с с = Е (YJ. Таким образом'^ последовательность {Y„} образует мартингал тогда и только тогда, когда она имеет вид (12.3), где {Х„} — абсолютно беспри- страстная последовательность. Понятие мартингала было введено П. Леви. Затем Дж. Л. Дуб обнаружил неожиданные возможности аппарата мартингалов и раз- вил их теорию. В гл. VII, 9, будет показано, что при выполне- нии нежестких условий ограниченности образующие мартингал величины Nk сходятся к пределу. Этот факт имеет важное значе- ние в современной теории вероятностных процессов. Примеры, а) В классических играх случайные величины Х^ независимы и имеют нулевое математическое ожидание: Е(Х^) = 0. Такая игра абсолютно безобидна г), и частные суммы S„ = = Xj + ... + Хп образуют мартингал. Рассмотрим теперь обыч- ную игру в орлянку, в которой игрок выбирает ставку по неко- торому правилу, учитывающему его успехи в предыдущих турах. Последовательные выигрыши не являются уже независимыми, но игра по-прежнему абсолютно безобидна. Смысл безобидной игры состоит в том, что знание прошлой истории игры не должно да- вать игроку возможности увеличить свой капитал. Наглядно это х) О практической ограниченности этого понятия говорилось в 1, X, 3. Напомним, что существуют «безобидные» игры, в которых с вероятностью, большей 1 — е, выигрыш игрока в n-й игре превосходит, скажем, n/log пЛ
§ 12. Мартингалы 247 означает, что абсолютно безобидная игра должна оставаться тако- вой при любой системе игры, т. е. при любых правилах про- пуска отдельных туров. Мы увидим, что это именно так и есть. б) Урновая схема Пойа [1, V, 2, в)]. Из урны, содержащей b черных и г красных шаров, выбирается наудачу один шар. Затем этот шар возвращается и, кроме того, в урну добавляется с ша- ров того же цвета, что и выбранный шар. Пусть Yo = b/(b-\- r\ и пусть Yп есть доля черных шаров, оказавшихся в урне в ре- зультате n-го извлечения. Последовательность {YJ является мартингалом. Теорема о сходимости обеспечивает здесь существо- вание предельного распределения [см. примеры гл. VII, 4, а), и гл. VII, 9, а)]. . в) Конкордантные1) функции. Пусть -{XJ — марковский процесс с вероятностями перехода, задаваемыми стохастическим ядром Л. Существование математических ожиданий величин Хп не предпола- гается. Функция и называется конкордантной по отношению к К, если и(х) = ^К(х, dy)u(y). - (12.5) Рассмотрим случайные величины Yft = zi(Xfe) и предположим, что все моменты Yk существуют (так будет, например, если функция и ограничена). Соотношение (12.5) означает, что Е (Yfe+1| Xk=x)=u (х), откуда E(Yft+1|Xft) = Yft. Следовательно, поскольку последователь- ность {XJ — марковская, имеет место (12.4), а так как величи- ны Nk являются функциями от Xfe, то (12.4) влечет за собой (12.2) [см. гл. V, 10, а)]. Таким образом, последовательность {Y„} яв- ляется мартингалом. Этот результат имеет большое значение в граничной теории марковских процессов, поскольку существо- вание предела последовательности {Y^} обычно влечет существо- вание предела исходной последовательности {Хл} [см. примеры е) и гл. VII, 9, в)]. г) Отношения правдоподобия. Пусть Хх, Х2, ...—последова- тельность случайных величин, и пусть известно, что совместное распределение величин (Хх, ..., XJ имеет либо плотность рп. либо плотность qn, однако неизвестно, какую именно. Чтобы прийти к какому-то решению, в статистике вводятся новые, случайные величины Ясно, что если выполнены достаточно сильные условия регуляр- ности и если истинными плотностями являются рп, то наблю- денные значения величин Хй ..., Хп в среднем будут группиро- ваться вокруг тех точек, где рп относительно велико. Когда дело обстоит именно так, величина Y„, вероятно, будет малой или боль- Этот термин был введен Г, Хантом.
248 Гл. VL Некоторые важные распределения и процессы шой, смотря по тому, является ли истинной плотностью рп или qd. Таким образом, асимптотическое поведение величин {Yn} представ- ляет интерес в теории статистических решений. Предположим для простоты, что плотности рп строго положи- тельны и непрерывны. Если истинными плотностями являются рп> то условная плотность распределения величины Х„+1 при задан- ных Х£, ..., Хп равна отношению рп+11рп к, следовательно, .....Х„ = О = = С ?n+i (^i. -у». У) Pn+i(.xi.Хп'У>> du (12 7) J P«+i(xi, у) ‘ pn(xi.........х„) у‘ ' ’ 7 — 00 В подынтегральном выражении функции сокращаются, а зна- менатель второй дроби не зависит от у. Интегрирование qn+i дает в результате частную плотность qn. Таким образом, интеграл в (12.7) равен qnlрп, и поэтому выполняется (12.4). Следовательно, при сделанных предположениях отношения правдоподобия Y„ образуют мартингал. ► Условия, относительно которых берутся условные математи- ческие ожидания в (12.2), не являются вполне удачными, поскольку нередко приходится заменять задающие условия величины Nl9...,Nn некоторыми функциями от них [примером этого является (12.4)]. Еще больший дефект такого задания условий обнаруживается в при- мере а). Рассматриваемый процесс (скажем, игра в орлянку или рулетку) описывается последовательностью случайных величин Z„, и выигрыш игрока в (/?4-1)-м туре есть функция от Zx, ..., Zn+1, а также, возможно, от некоторых других величин. Наблюдаемое прошлое представляется величинами (Z1? ..., ZJ, которые могут содержать в себе больше информации, чем предыдущие выигрыши. Например, если игрок не участвует в турах с номерами 1,3,5, ..., то знание его выигрышей до момента 2п в лучшем случае экви- валентно знанию величин Z2, Z4, ..., Z2rt. При этом дополни- тельное знание величин Zx, Z3, ... в принципе может давать некоторое преимущество, и абсолютная безобидность в таком слу- чае должна иметь в качестве условий величины Zt, ..., Zn. Таким образом, может оказаться необходимым рассматривать условные ожидания по отношению к нескольким множествам случайных величин, и, чтобы охватить все возможные ситуации, лучше всего использовать условные ожидания по отношению к произвольным а-алгебрам событий. Рассмотрим последовательность {YJ случайных величин на произвольном вероятностном пространстве и обозначим сгалгебру событий, порожденную величинами (Yv ..., Y„) [см. гл. V, 10, а)]. Определяющее мартингалы соотношение (12.2) можно записать в виде Е (Y^+j 1= Чп, Мы хотим дать более общее определе- ние мартингалов в форме последнего соотношения с той разницей,
§ 12. Мартингалы 249 что о-алгебра заменяется более богатой событиями о-алгеброй 53п. В большинстве случаев о-алгебра 23„ будет порождаться величи- нами Yn У„ и некоторыми другими величинами, зависящими от прошлого. Идея состоит в том, чтобы любая зависящая от прошлого случайная величина была измерима относительно 23п, и в этом смысле о-алгебра 53„ представляет ту информацию, которая содержится в прошлой истории процесса. Поскольку информация о прошлом растет со временем, то мы предположим, что о-алгебры 33„ возрастают: 33х (=332с= ... . (12.8) Определение 1. Пусть У1? У2, ...—случайные величины, мате- матические ожидания которых существуют, и пусть 331? 332, .. . суть о-алгебры событий, удовлетворяющие условию (12.8). Последовательность {У„} образует мартингал по отношению к {53я} тогда и только тогда, когда E(Yn+1|>Bn) = Y„. (12.9) [В силу неединственности условных математических ожиданий равенство (12.9) следует понимать так: «Существует вариант услов- ного математического ожидания, для которого выполняется (12.9)». Это замечание относится и к дальнейшему.] Отметим, что из (12.9) вытекает ^-измеримость величины Ул, и этот факт имеет два важных следствия. Поскольку zd33^__1У то из основного тождества (11.7) гл. V для повторных математи- ческих ожиданий следует, что E(Yn+1|33„_1) = Y„_1. Индукция показывает, что определение (12.9) влечет за собой более сильные соотношения • E(Y„+1|83a) = Ya, k=\, 2,..., п. (12.10) Отсюда, в частности, следует, что каждая подпоследовательность YV1, YVa, ... мартингала {У„} снова является мартингалом. Далее отметим, что 5Э„ содержит о-алгебру, порожденную вели- чинами Ух, ..., Уп, и аналогичное рассуждение показывает, что последовательность {У„} также является мартингалом по отноше- нию к последовательности о-алгебр Таким образом. (12.9) влечет (12.2). Пример, д) Пусть о-алгебры 23д удовлетворяют условию (12.8), и пусть У —случайная величина, математическое ожидание которой существует. Положим YW = E(Y 153J. Величины Nn 53„-измеримы и поэтому удовлетворяют соотношению (12.9). Следовательно, последовательность {Уп} есть мартингал относительно {53„}. ► Возвратимся теперь к. примеру а) и покажем невозможность систем игры довольно общего типа. Пусть ]У„}.—мартингал по
250 Гл. VI. Некоторые важные распределения и процессы отношению к Для описания возможности пропускать n-й тур введем решающую функцию ьп\ &п есть ^измеримаях) случай- ная величина, принимающая лишь значения 0 и 1. Если е„ = 0, то игрок пропускает п-й тур; при еп = I он делает ставку, и в этом случае его выигрыш в п-м туре равен Y„ — Y„_r Обозначив на- копленный выигрыш вплоть до fi-ro тура включительно через Zn, имеем Z^Z^ + eJY,,-^]. (12.11) Из соображений индукции ясно, что величины Z„ имеют матема- тические ожидания. Кроме того, величины Z„_n ъп и Y„_f 23„_1-измеримы, и поэтому [см. гл. V, (11.6)] Е (Z„ | = Z„_x + е„ [Е (Y„ | Y^J. (12.12) Так как последовательность {Y„[—мартингал, то выражение в квадратных скобках обращается в нуль, и, следовательно, после- довательность {Zn\ тоже является мартингалом. Тем самым мы доказали теорему Халмоша, утверждающую Невозможность систем игры. Мартингал {Y„} переводится вся- кой последовательностью решающих функций е2, ... снова в мар- тингал {Zn[. Наиболее важным частным случаем этого результата является случай так называемой произвольной остановки. Система игры с произвольной остановкой—это такая система, когда в первых N турах игрок принимает участие, а от всех последующих укло- няется; N-й тур является последним. Случайная величина N (момент остановки) удовлетворяет условию (в °бо- значениях теоремы eft=l при N > k — 1 и = 0 при —1). Мы имеем, стало быть, такое Следствие. Произвольная остановка переводит мартингал в мартингал. Примеры, е) Простое случайное блуждание на прямой начи- нается в начале координат. Частица переходит вправо на один шаг с вероятностью р и влево на один шаг с вероятностью 7=1 — р. Если Srt — положение частицы в момент п, то, как легко видеть, величины Yп = (<7/p)Sn образуют мартингал, причем Е (Yw) = 1 и E(Yo) = L [частный случай примера в)]. В задаче о разорении случайное блуждание останавливается в тот момент, когда оно впервые достигает одну из точек —а или b (at b—целые положительные числа). В таком модифици- рованном процессе—a^.Sn^.b, и с вероятностью единица S„ х) Это условие обеспечивает принятие решения на основе предшествующих наблюдений. Никакая математическая теория не может опровергнуть возмож- ности предвидения будущего, однако, из наших моделей мы обязаны эту воз- можность исключить.
§ 12. Мартингалы 251 становится равной и продолжает оставаться равной ft, либо —а. Обозначим соответствующие вероятности х и 1 — х. Поскольку вели- чины Sw ограничены, Е(Уя)=х(|У + (1-х)(|)"в. Но E(Y„)=I, так как математические ожидания образующих мартингал величин совпадают. Следовательно, х (q/p)b + (1—*)Х X (<7/р)“а= 1, и тем самым мы получили линейное уравнение для определения вероятности х остановки процесса в точке Ь, которая иными методами была вычислена в 1, XIV, 2. Использованный метод не работает при р = ^=1/2, однако в этом случае последо- вательность S„ образует мартингал, и аналогичное рассуждение показывает, что х — а/(а-}-Ь). Хотя результат, к которому мы пришли, известен и весьма элементарен, использованный метод иллюстрирует возможные применения теории мартингалов. ж) О системах игры. Пусть — последовательность неза- висимых случайных величин, такая, что Хп принимает значения ±2n с вероятностью — каждое. Чтобы решить, участвовать ли ему в n-м туре, игрок бросает монету. Вероятность того, что впервые он начнет участвовать в игре в n-м туре, равна 2“п, и в этом случае его выигрыш равен ±2". При этом выигрыш игрока при его первом вступлении в игру является случайной величиной без математического ожидания. Теорема о системах игры связана, следовательно, с тем обстоятельством, что мы не меняем времен- ного параметра. ► Нередко приходится иметь дело с абсолютными величинами и неравенствами, и в этих случаях удобно иметь название для процесса, удовлетворяющего условию (12.9) с заменой равенства неравенством. Определение 2. Последовательность называется субмар- тингалом1), если она удовлетворяет определению (12.9) с заменой знака равенства на знак Отсюда незамедлительно вытекает, что каждый субмартингал удовлетворяет более сильным условиям: E(Y„+I|Sft)>Yft, k = l, .... п. (12.13) Лемма. Пусть и—выпуклая функция и последовательность {Y„} является мартингалом. Тогда если математические ожидания вели- чин и(Уп) существуют, то последовательность \и(Уп)} является субмартингалом. В частности, последовательность j|YJ} есть субмартингал. Утверждение леммы непосредственно вытекает из неравенства Йенсена [гл. V, (8.6)], которое применимо к условным математи- J) Более старый термин «нижний полумартингал» вышел изу потребления*
252 Гл. VI. Некоторые важные распределения и процессы ческим ожиданиям так же, как и к обычным. Согласно этому неравенству, имеем Е (и (Y„+1) | ®„) > и (Е (Y„+11 »„)). (12-14) Остается заметить, что правая часть в (12.14) равна u(Yrt). Аналогично устанавливается, что если {Y„}—субмартингал и и—выпуклая неубывающая функция, то последовательность {u(Yw)} тоже является субмартингалом, если только математи- ческие ожидания величин и (Yn) существуют. § 13. ЗАДАЧИ 1. Определение (1.2) устойчивого распределения эквивалентно следую- щему: распределение R устойчиво тогда и только тогда, когда для произ- вольных постоянных Cit с2 найдутся такие постоянные сиу, что d CiXi + с2Х2 = сХ -f- у. 2. Всякое устойчивое распределение непрерывно. Достаточно доказать это утверждение для симметричного распределения R. Из (1.3) выведите: если И имеет атом массы р в точке s > 0, то R должно иметь атом с массой р* в каждой точке вида s (ст + сп)/ст + п (см. гл. V, 4а). Кроме того, единствен- ный атом массы р < 1 в начале координат индуцирует атом массы р2 в на* чале координат для свертки R > R, тогда как устойчивость требует атом массы р. 3. Для устойчивости распределения F достаточно выполнения (1.2) при п = 2 и 3 (П. Леви). Указание. Произведения вида с/сз, где/,& = 0, £ 1, £2, либо плотны в интервале 0, оо, либо представляют собой степени некоторого фиксирован- ного числа с. Нужно показать, что вторая возможность в рассматриваемом случае исключена. Замечание. Весьма любопытно, что выполнения (1.2) только при п = 2 еще недостаточно для устойчивости F; см. пример гл. XVII, 3, е) и задачу 10 из гл. IX, 10. 4. Для устойчивого распределения с характеристическим показателем <х=1 центрирующие постоянные в определении (1.2) удовлетворяют соотно- шению утп — тУп~УпУгп [см. (1.6)]. Аналогом (1.8) служит s(X1 + ylogs) + /(X2+ylogO = (s + 0 (X + ylog (s+0). 5. Если F и G—устойчивые распределения с одним и тем же характе- ристическим показателем а, то F * G — тоже устойчивое распределение с характеристическим показателем а. Найти центрирующие постоянные у„ для F ★ G, выразив их через соответствующие постоянные для F и G. 6. Из неравенства симметризации гл, V, (5.11), вытекает, что выражение п [1 — R (Спх)1> где —симметричное устойчивое распределение, ограничено. Вывести отсюда, что И имеет все абсолютные моменты порядков меньше а (использовать гл. V, (6.3)]. С помощью симметризации последнее утверждение переносится на несимметричное j?, 7. Иной вывод распределения Хольцмарка. Рассмотрим шар радиуса г с центром в начале координат и п звезд (точек), расположенных в нем наудачу и независимо друг от друга. Пусть каждая звезда имеет единичную массу. Обозначим через Хъ Х„ х-компоненты гравитационных сил, соответствую- щие отдельным звездам,, и положим Srt=Xi-[-**. + Xft, Устремим г и «к бес-
$ 13. Задачи 253 конечности так, чтобыnr3n-1—ьХ. Показать, что распределение величи- ны Sn стремится к симметричному устойчивому распределению с характе- ристическим показателем 3/2. 8. Показать, что предыдущая задача, по существу, не изменится, если массу каждой звезды считать случайной величиной с единичным математи- ческим ожиданием и массы различных звезд предполагать взаимно независи- мыми и не зависящими также от их расположения. 9. Распределение Хольцмарка в случае четырех измерений. Четырехмерным аналогом распределения Хольцмарка является симметричное устойчивое рас- пределение с характеристическим показателем 4/3 (в четырехмерном прост- ранстве гравитационная сила меняется обратно пропорционально кубу рас- стояния). 10. Схема серий {Xfe? с гп членами в n-й серии может быть преобразо- вана в эквивалентную ей схему с п членами в n-й серии путем добавления фиктивных величин, принимающих лишь значение нуль, и повторения неко- торых серий определенное число раз. 11. Пусть {Х/е „} — нулевая схема серий, причем величины Xlt „, ..., XWj имеют одинаковое распределение Fn. Стремится ли к нулю вероятность Р {max (| Xlt„|, ..., |Х„,„|)>е}? 12. Найти плотность определяемой формулой (6.3) функции восстановле- ния Ut когда F имеет плотность a) f(x)=e~* и б) f (х)—хе~х. 13. Рассматривается обрывающийся процесс восстановления с функцией распределения А, имеющей плотность p=ce~ct. Найти распределения длитель- ности жизни процесса и числа моментов восстановления. 14. Обобщенный обрывающийся процесс восстановления. Вместо того чтобы обрывать процесс мгновенно с вероятностью q, позволим ему (тоже с вероят- ностью q) продолжаться в течение случайного времени с собственным распре- делением Fo и затем остановим. Иными словами, моменты восстановления имеют вид Ti+...+T„ + Y, где величина Y имеет отличное от величин Т распределение. Показать, что распределение V длительности процесса удовле- творяет уравнению восстановления V — qF0 + F ★ V (F («>) = 1 -q). (*) 15. Показать, что процесс в задаче о «времени ожидания до больших про- пусков» сводится к частному случаю процесса, рассмотренного в предыдущей задаче. Привести (7.1) к виду (*). 16. Процесс Пуассона и теоремы о покрытии. Напомним, что, согласно примеру гл. III, 3, г), в случае пуассоновского процесса условное распреде- ление моментов восстановления на интервале 0, t при условии, что их ровно п, равномерно. Отсюда в силу теоремы о покрытиях (теорема 3 из гл. I, 9) сле- дует, что вероятность 1 — V (t) того, что все пропуски по длине меньше представима в виде <ю 1-7(0=е-с*^ МГ1ф„(0. (**) 1 а) Проверить, что формула (* *) действительно определяет решение урав- нения (7.1) при F (х) = 1—е~сх. б) Вывести теорему о покрытиях, считая известным, что определяемое формулой (**) решение уравнения (9.1) единственно. [Такое доказательств® является примером доказательства с помощью рандомизации, см. задачу 5в1, XII, 6.] 17. Время ожидания первого потерянного вызова в примере 7, е) можно интерпретировать как полное время жизни обрывающегося процесса, который получается при остановке исходного процесса в момент первого вызова, посту-
254 Гл. VI. Некоторые важные распределения и процессы лившего в течение периода занятости1). Покажите, что распределение// про- должительности периода занятости обрывающегося процесса определяется равенством Н {dt} = e~at F {dt}, а времена возвращения имеют распределения б^Н, (См. также задачи 3, 4 из гл. XIV, 10.) 18. Пусть V — распределение периода занятости из примера 7, ж) («при- бывший последним обслуживается первым»). Показать, что V удовлетворяет уравнению восстановления V (/) = А (/)+# ★ V (/), где А иВ— несобственные распределения, определяемые формулами A {dx} = e~cx G {dx} и В {dx} = = [1 — G (х)] се~** dx (показать, что здесь мы имеем дело с обобщенным обры- вающимся процессом в смысле задачи 14: процесс восстановления, порожден- ный распределением В, сопровождается ненарушаемым мертвым периодом, распределение которого пропорционально распределению Л). 19. Малые пропуски в пуассоновском процессе2 3). Скажем, что в момент Sn происходит «совпадение», если два момента восстановления Sn_i и Sn оказы- ваются на расстоянии %. Выразить распределение времени ожидания до первого совпадения в терминах распределения V из предыдущего примера. 20. Обобщение предыдущей задачи о малых пропусках*). Рассмотрим стан- дартный процесс восстановления S1 = T1+««.+Tn с временем ожидания Ту. Написать уравнение восстановления для распределения времени ожидания до первого осуществления события {Т„ <:¥„}, где величины Y„ не зависят от процесса и друг от друга и имеют общее распределение G. 21. Пусть ах, ,ап — конечная числовая последовательность и = = а± + .., + а^—ее частные суммы. Определим последовательно vi = an (J 0, v2 = (^l + ^n-i) U 0, »•»> ^n=(v„-i+ai) U 0. Пользуясь индукцией, доказать, что уп = тах[0, Si, ..., s„]. Вывести отсюда теорему § 9. 22. Положим в примере 11, е) /(х) = 1 при 0<х< 1. Доказать, что функция g (у)=2 (1 —у) является стационарной плотностью и что &(72) (х, y)—g (у) при п ^2. Если f (х) = ае~ах, то g (x) = f (х). 23. Определим плотность стохастического ядра на 0, 1, положив & (х> у)= (1—х)~1 при 0 < х < у < 1, £ (*> У) = у при ° < У < * < 1. Найти стационарную плотность (она удовлетворяет простому дифференциаль- ному уравнению). Дать вероятностную интерпретацию. 24. Марковский процесс сосредоточен на 0Г"1, и при Х„=х величина Xn+i равномерно распределена на 1—х, 1. Показать, что функция 2х является ста- ционарной плотностью (Т. Угахери). 25. Марковский процесс, сосредоточенный на 0, оо, определяется следую- щим образом. Если Хп = х, то Хп+1 равномерно распределена на 0, 2х, n = 0, 1, ... . Показать, используя индукцию, что плотность стохастического ядра, соответствующего переходам за п Шагов, равна 1 / 2пх \ п ~1 fe(n>(x, у)=2» ’ если ° < у < 2"х> и k{n} (х, t/) = 0 в ином случае. х) Этот элементарный подход заменяет сложные процедуры, которые описаны в литературе, и приводит к простым точным результатам. Решения и оценки в явном виде см. гл. XI, 6. 2) По поводу других вариантов этой задачи (исследуемых иным методом) см: Gilbert Е. N., Pollak Н. О., Coincidences in Poisson patterns, Bell System Tech. J., 36 (1957), 1005- 1033. 3) Подобно этому можно обобщить задачу о «больших пропусках». Ответ получается аналогичным. 1 '
ГЛАВА VII ЗАКОНЫ БОЛЬШИХ ЧИСЕЛ. ПРИМЕНЕНИЯ В АНАЛИЗЕ В первой части этой главы показано, что некоторые известные глубокие теоремы анализа можно удивительно легко получить путем вероятностных рассуждений. В § 7 и 8 обсуждаются варианты закона больших чисел, а § 9 содержит частный случай теоремы о сходимости мартингалов и стоит в стороне от основного содержания. § 1. ОСНОВНАЯ ЛЕММА. ОБОЗНАЧЕНИЯ Рассмотрим сначала одномерное распределение G с математи- ческим ожиданием 0 и дисперсией о2. Если Хп . .., Хп—незави- симые случайные величины с распределением G, то их арифмети- ческое среднее Мп = (Хх+ ... + Хп) и”1 имеет математическое ожи- дание 0 и дисперсию а2п"х. При больших п эта дисперсия мала и Мп, как правило, близко к 0. Отсюда следует, что для любой непрерывной функции и значение и (MJ будет как правило, близко к w(0). Это замечание объясняет суть (слабого) закона больших чисел. Оно несколько обобщается в приводимой ниже лемме, кото- рая, несмотря на свою простоту, станет источником ценной инфор- мации. Рассмотрим при п=1, 2, ... семейство распределений Fnt в с математическим ожиданием, равным 0, и дисперсией о2 (0). Здесь 0—параметр, изменяющийся в конечном или бесконечном интер- вале. Для математических ожиданий введем обозначение Е„, 0(ы)= J u(x)F„, 9{dx}. (1.1) — 00 Лемма 1. Допустим, что функция и ограничена и непрерывна и что о„(0)—>-0 при любом 0. Тогда Е„, 9 (и) —► «(0). (1.2) Эта 'сходимость равномерна в любом замкнутом интервале,, где о$(0) —>0 равномерно и функция и равномерно непрерывна. Доказательство. Очевидно, что + оо I Е„, е («)-«(0) J < $ |«(х)-и (6) | Fn, 9 {dx}. (1.3)
256 Гл. VII. Законы больших чисел. Применения в анализе Существуют 6, зависящее от 0, и е, такие, что при —0| < 6 подынтегральное выражение меньше 8. Вне этой окрестности подын- тегральное выражение меньше некоторой постоянной М, и по неравенству Чебышева [гл. V, неравенство (7.2)] вероятность по- падания в область |х—0| > б меньше чем о2(0)б“2. Таким обра- зом, правая часть не превосходит 2s, если п столь велико, что o„(0) < еб2/Л4. Эта граница не зависит от 0, если о2 (0)—> 0 равно- мерно и если и равномерно непрерывна. Примеры, а) Если е—биномиальное распределение, сосредо- точенное в точках k/n (k = 0, ...,п), то о*(0) = 0 (1—д) п~х —>0и п — (1.4) равномерно при 0^0^ 1. Следствия этого соотношения обсуж- даются в § 2. б) Если Fn> е—распределение Пуассона, приписывающее вероят- ность e~nQ (nS)k/k\ точке k/n, то о2(0) = 0/п и *-л0Е«(4)-^->«(«) (1-5) k = о * равномерно в каждом конечном интервале значений 0. Эта формула верна и для п, отличных от целых чисел (продолжение см. в § 5 и 6). в) Взяв в качестве Fn е гамма-распределение с математическим ожиданием 0 и дисперсией 0/п, получаем, что -(^Т)Г s и w (v)”'1 е~пх'в ^г-и(в) о -6) о равномерно в каждом конечном интервале. Эта формула [с заме- ной (п— 1)! на Г (и)] также верна для нецелых значений и. В §6 будет показано, что формула (1.6) представляет собой формулу обращения для преобразований Лапласа. г) Статистики часто сталкиваются с положением, описанным в начале этого параграфа, но рассматривают математическое ожи- дание 0 как неизвестный параметр, который цужно оценить по результатам наблюдений. На языке статистики соотношение (1.2) означает, что и (Ми) является асимптотически несмещенной оценкой для неизвестного параметра и(0) [оценка была бы несмещенной, если бы правая и левая части в (1.2) совпадали]. ► Мы увидим, что каждый из этих примеров приводит к важным результатам, имеющим самостоятельный интерес, но для дальней- шего развития теории необходимы некоторые приготовления.
§ 1. Основная лемма. Обозначения 257 Обозначения для разностей В нескольких следующих параграфах мы будем применять удоб- ные обозначения, принятые в исчислении конечных разностей. Пусть дана конечная или бесконечная числовая последовательность а01 а1У ... Разностный оператор Л определяется равенством Aaz = ai+1—аР Это равенство порождает новую последовательность {Aaz}. Применяя оператор А еще раз, мы получим последователь- ность с элементами A2az = Aaz+1—Aaz = ai+2—2ai+1 + a^ Продолжая подобным образом, мы можем определить r-ю степень Аг рекуррентной формулой А/, = ААГ~1. Легко проверить, что г ДЧ= Е( • )(-1Г'а/+/. (1.7) / = О V / Для завершенности мы определим А0 как тождественный оператор: A°az = az. Тогда равенство (1.7) справедливо при всех г 0 (ра- зумеется, если я0, ..., ап—конечная последовательность, то изме- нение г ограничено). Можно избежать многих утомительных вычислений, если один раз вывести одно любопытное соотношение, справедливое для двух произвольных последовательностей {az} и {cz}. Это соотношение позволяет выразить разности Artfz через разности Arcz и наоборот. Для его вывода умножим (1.7) на jcr и просуммируем пог — = 0, ..., v. Коэффициент при ai+j равен r=i \ J V / V J k = о \ к J (в правой части введен новый индекс суммирования k = r — j). Последняя сумма равна Av~4?y, и таким образом нами получена формула взаимности v / \ v / \ £с,.(Пдч = Е«,-+д П(-1г/ду-ч- О-8) i=0 V / 7 = 0 V / Примеры, а) (Формула обращения.) Рассмотрим последователь- ность {az} с az=l при всех i. Тогда A°az=l, а все другие разно- сти равны нулю, так что (1.8) сводится к равенству ^0= 0-9> i = о м / Если вместо {сД рассмотреть последовательность {^+у-}, то видно, что (1.9) остается справедливым, если cQ и Cj заменить соответст* 9 № 249
258 Гл. VI1. Законы больших чисел. Применения в анализе венно на ck и ck+f. Таким образом, (1.9) представляет собой фор- мулу обращения, выражающую члены последовательности через их разности. Величина v выбирается здесь произвольным образом. б) Фиксируем О<0< 1 и положим сг = 0г. Тогда Д^г = 0г(1_е)й (— I)* и формула (1.8) принимает вид (1.10) ► Мы будем часто иметь дело с последовательностями видаяЛ = = и (х + kh). которые получаются с помощью какой-либо функции и при фиксированных х и шаге h > 0. В этих случаях удобно заме- нить разностный оператор Л на разностное отношение \ = с л Тогда Д и (х) = [и (х 4- h)—u(x)]/h (1-11) & и вообще г . Lru(x) = h~r У ( Т. )(—ly->u(x + ih). (1.12) » i = о V J В частности, Д° и (х) = и (х). § 2. ПОЛИНОМЫ БЕРНШТЕЙНА. АБСОЛЮТНО МОНОТОННЫЕ ФУНКЦИИ Мы возвращаемся к предельному соотношению (1.4). В левой части стоит полином, который называется полиномом Бернштейна степени п, соответствующим данной функции и. Чтобы подчеркнуть эту связь с функцией и, будем обозначать полином Вп< а. Таким образом, S»,«(0)= Е «(/Л)^О/(1-0)"-/, (2.1) где для удобства мы ввели й = п-1. Сравнивая (2.1) с (1.10), видим, что ВПу и можно записать в другой форме: п Вп, в (0) = Е ( " ) (°), * = 1. (2.2) , = о V/ h Поразительно много глубоких выводов может быть получено из наблюдения, что представления (2.1) и (2.2) для полиномов Берн-
§ 2. Полиномы Бернштейна. Абсолютно монотонные функции 259 штейна эквивалентны. Однако, прежде чем двигаться в этом направ- лении, мы переформулируем для порядка результат, полученный в примере 1, а). Теорема 1. Если функция и непрерывна в замкнутом интер- 1---1 вале 0, 1, то полиномы Бернштейна Ви,д(0) равномерно сходятся к и (6). Иными словами, для любого заданного 8 > 0 и всех достаточно больших п |Вп,в(0)-ц(0)|<е, О<0<1. (2.3) Знаменитая теорема Вейерштрасса об аппроксимации утверждает возможность равномерной аппроксимации некоторыми полиномами. Приведенная выше теорема сильнее, так как в ней явно ука- заны аппроксимирующие полиномы. Доказательство принадлежит С. Н. Бернштейну. В качестве первого применения двойственного представления полиномов Бернштейна мы получим характеризацию функций, кото- рые могут быть представлены степенными рядами с положитель- ными коэффициентами: и(х) = /?(1 + р1х + р2л-2+..., р7>0, 0<х<1. (2.4) Очевидно, что такая функция обладает производными любого порядка и ^>(х)>0, 0<х<1. (2.5) Для многих проблем в анализе важен тот факт, что и обратное утверждение справедливо, т. е. любая функция, обладающая свой- ством (2.5), допускает представление (2.4) в виде степенного ряда. Это было впервые обнаружено С. Н. Бернштейном, но обычные доказательства не отличаются простотой и не основаны на интуи- ции. Мы покажем, что представление (2.2) для полиномов Берн- штейна приводит к простому доказательству и полезному резуль- тату, состоящему в том, что свойства (2.4) и (2.5) эквивалентны третьему свойству, а именно Д*и(0)>0, й = 0, ..., п—1, h = -. (2.6) h п Все это представляет интерес для теории вероятностей, по- скольку если {рД— распределение вероятностей на множестве целых чисел, то формула (2.4) определяет соответствующую производя- щую функцию (см. 1; гл. XI). Именно поэтому мы рассматриваем задачу характеризации производящих функций. Среди всех наших функций и они выделяются очевидным условием нормировки и (1) =? = 1. Однако пример ц(х) = (1—х)”1 показывает, что функции, представимые рядом (2.4), не обязаны быть ограниченными. 9*
260 Гл. VII. Законы больших чисел. Применения в анализе Теорема 2. Для непрерывной функции и, определенной для 0^ <х<1, свойства (2.4), (2.5) и (2.6) равносильны. Функции с этим свойством называются абсолютно монотон- ными функциями на 0, 1. Доказательство. Мы проведем доказательство в два этапа и рассмотрим сначала только вероятностные производящие функции. Иными словами, мы предположим сейчас, что и непрерывна в замк- ।------------------1 нутом интервале 0, 1 и что и(1) = 1. Очевидно, что (2.4) влечет (2.5). Если (2.5) справедливо, то и и все ее производные являются монотонными функциями. Из моно- тонности и следует, что Л и (%)^0, а из монотонности и' следует, h что Ди(х) монотонно зависит от х и поэтому Л2ц(%)^0. Исполь- h h зуя индукцию, заключаем, что (2.5) влечет (2.6), а также \пи (0)^0. h Предположим, что (2.6) выполнено при £ = 0, ..., п. Ввиду представления (2.2) полином Вп, и имеет неотрицательные коэффи- циенты, а из (2.1) следует, что Вп, и (1) == 1. Таким образом, Вп, и— вероятностная производящая функция, а по теореме непрерывности из 1; гл. XI, 6 (или из гл. VIII, 6 ниже) предел и = limВп, а сам по себе является вероятностной производящей функцией. (Пред- положение и (1) = 1 гарантирует, что сумма коэффициентов равна единице.) На этом завершается доказательство для ограниченных функций. Если функция и не ограничена вблизи 1, то положим <(х) = и(’2^х)/“(!2^)’ OsCxsCl, . (2.7) где т—произвольное целое число. К функции v применимо пре- дыдущее доказательство. Поэтому каждое из свойств (2.5) и (2.6) влечет за собой справедливость разложения (2.4) в степенной ряд по крайней мере при 0<%^(т—1)/т. Вследствие единственно- сти представления в виде степенного ряда и произвольности т отсюда вытекает, что (2.4) выполняется при 0^х<1. ► § 3. ПРОБЛЕМА МОМЕНТОВ В последней теореме мы столкнулись с последовательностями {ak}, у которых все разности Arak были положительными. В дан- ном параграфе мы будем иметь дело с классом последовательно- стей, в некотором смысле родственных предыдущим,— разности членов этих последовательностей чередуются по знаку, т. е. речь идет о таких последовательностях что (—1)'Д^>0, г = 0, 1, .... (3.1) Такие последовательности называются вполне монотонными.
§ 3. Проблема моментов 261 Пусть F—вероятностное распределение на 0, 1. Обозначим через Е (и) интеграл от и по отношению к F. Момент порядка k распределения F определяется равенством 1 ^ = Е(Х*) = \xkF {dx} (3.2) о (здесь подразумевается, что интервал интегрирования замкнут). Вычисляя последовательные разности, находим, что (—l)rArcft = E(X*(l—ХУ"**), (3.3) и поэтому последовательность моментов является вполне моно- тонной. Пусть теперь и—произвольная непрерывная функция на I---1 О, 1. Вычислим интеграл от выражения (2.1) для полинома Берн- штейна Вп, и по отношению к F. В силу (3.3) получим / п . п Е (В„, и) = Е и (/W" )(-1)"-'А«-/С/ = Е и (jh) p(in\ (3.4) 7 = 0 V J 7 = 0 где h—\/n и где для сокращения мы обозначили (3‘5) Если выбрать и (х) = 1, то 'получим 5„1И(х) = 1 при всех х и, следовательно, сумма равна единице. Это означает, что при каждом значении п числа задают распределение вероятностей, приписывающее массу р}п) точке jh = j/n (здесь всюду / = 0, ..., п). Мы обозначим это вероятностное распределение через Fn, а вычис- ленное относительно Fn математическое ожидание—через Еп. Тогда (3.4) сводится к равенству Ert(w) = E (Вп, а). В силу равномерной сходимости ВПл и—+и отсюда следует, что ' E„(u)->E(u). (3.6) До сих пор мы понимали под {сД последовательность моментов, 'Соответствующих данному распределению F. Можно, однако, счи- тать произвольной вполне монотонной последовательностью и снова определить /?/п) по формуле (3.5). Величины р}п} по опреде- лению неотрицательны, и мы покажем, что их сумма равна с0. Действительно, в силу основной формулы (1.8) Е = Е сг( "УГЛГ«(О). (3.7) i = o г=о \г / h Для функции и, тождественно равной единице, правая часть (3.7) •сводится к с0, что доказывает наше утверждение.
262 Гл. VII. Законы больших чисел. Применения в анализе Таким образом, мы видим, что любая вполне монотонная после- довательность {cj, удовлетворяющая простейшему условию норми- ровки с0 = 1, определяет распределение вероятностей причем математическое ожидание Еп (и) относительно этого распределения задается формулой (3.7). Интересно посмотреть, что произойдет при п—>оо. Пусть для простоты и будет полиномом степени N. Так как й==1/п, то несложно обнаружить, что Дги(0)—>ц(г)(0). h Кроме того, п(п— 1)...(п—r-f-l)/ir—>1. Ряд в правой части формулы (3.7) содержит по меньшей мере AZ-f- 1 слагаемых, и теперь можно сделать вывод, что для каждого полинома степени N при п—> оо N Ея(«)->ЕтГ«‘г,(0). (3.8) г = О В частности, если u(x) = xr, то Е„(Х')-^,. (3.9) Другими словами, момент порядка г распределения вероятностей Fn стремится к сг. Поэтому весьма правдоподобно, что должно существовать вероятностное распределение F, r-й момент которого совпадает с сг. Сформулируем это в виде теоремы. Теорема 1. Моменты сг распределения вероятностей F образуют вполне монотонную последовательность с с0 = 1. Обратно, произ- вольная вполне монотонная последовательность {сг}, подвергнутая нормировке с0 = 1, совпадает с последовательностью моментов един- ственного распределения вероятностей. Этот результат, принадлежащий Хаусдорфу, по праву считается глубоким и мощным. Систематическое использование функциональ- ного анализа постепенно приводило к упрощению доказательств, однако даже самые лучшие чисто аналитические доказательства остаются относительно сложными. Настоящий подход является новым и служит хорошей иллюстрацией того, как вероятностные рассуждения могут упрощать и обнажать интуитивный смысл слож- ных аналитических построений. Мы не только докажем сформули- рованную теорему, но и дадим явную формулу для F. Соотношение (3.8) указывает нам, что для любого полинома и математические ожидания Е„ (и) сходятся к конечному пределу. Как следует из теоремы (2.3) о равномерной аппроксимации, то же ।--1 самое справедливо для любой непрерывной на 0, 1 функции и. Обозначим через E(w) предел Ert(w). Таким образом, соотношение (3.6) справедливо при любых условиях, однако если в предполо- жения теоремы входит произвольная вполне монотонная последо-
§ 3. Проблема моментов 263 вательность {cj, то мы должны доказать1), что существует рас- пределение вероятностей F, такое, что предел Е (м) совпадает •с математическим ожиданием и, вычисленным относительно рас- пределения F. Для данных 0 1 и е>0 обозначим через щ, е непрерыв- I--1 ную функцию на 0, 1, которая обращается в нуль при х^/-|-8, равна 1 при х^ t и линейна при х между t и Пусть Ue (/) = = Е8 (utt е). Если t < т, то, очевидно, utt 8 8 и максимум разности uXt е—utt е не превосходит (т—/)/8. Отсюда при фиксиро- ванном е > 0 следует, что Ue (/) есть непрерывная неубывающая функция t. С другой стороны, при фиксированном t величина U при 8—>0 может только убывать. Следовательно, Ue(t) стремится к пределу, который мы обозначим через F (t). Функция F (/) не убывает при изменении от 0 до 1. Она автоматически непрерывна справа2), хотя это не так важно, поскольку этого можно достичь всегда, изменяя значение функции F в точках ее скачков. Для функции распределения F распределения (3.5) мы полу- чаем тривиальным образом из определения utt 8 при 6 > s: E„(«t_e.e)CFe(0CE„(M/, j. (3.10) При п—► оо два крайних члена неравенства (3.10) стремятся к Ue(t—6) и Ue(t) соответственно. Если t и t—б суть точки непрерывности F, мы, полагая в—>-0, делаем вывод о том, что все предельные точки последовательности {Fn (/)} лежат между F (t—6) и F(t). Наконец, устремляя 6—»-0, заключаем, что F„(t)—>F(0 в каждой точке I непрерывности F. Соотношение Fn(t)—>-F(/) •означает, что (зап Интегрируя по частям выражение для момента порядка г распре- деления Fn при г^1, получаем 1 Ел (X') = 1 — г $ xr^Fn (х) dx. (3.12) о -Левая часть здесь стремится, как показано в (3.9), к crt а так как -Fn—► F, то отсюда следует, что r-й момент F совпадает с сг. Это завершает доказательство теоремы 1. ► г) Здесь мы могли бы закончить доказательство, так как утверждение содержится в любом из двух результатов, доказанных в других местах этой книги: а) в теореме Рисса о представлении из гл. V, 1, поскольку Е (и) очевидным образом представляет собой положительный линейный функционал с нормой 1; б) в основной теореме о сходимости из гл. VIII, 1. Доказательство здесь (частично совпадающее с доказательством в гл. V, 1) дано для того, чтобы сделать эту главу независимой от других и чтобы прийти к формуле обращения. 2) Для проверки см, доказательство теоремы о представлении Рисса в гл, V, 1,
264 Гл. VII. Законы больших чисел. Применения в анализе Отметим, что для произвольной функции распределения, соот- ।-------------------------------------------------1 ветствующей распределению вероятностей на 0, 1, соотношение (3.11) представляет собой формулу обращения, выражающую F в терминах своих моментов. Сформулируем соответствующее утверж- дение. Теорема 2. Для вероятностного распределения F из теоремы 1 предельная формула (3.11) выполняется в каждой точке непрерыв- ности. Чтобы избежать неправильных представлений, следует подчеркнуть, что положение существенно меняется при переходе к распределениям, не сосредо- точенным ни на каком конечном интервале. В общем случае распределение не определяется однозначно своими моментами. Пример. Логарифмически нормальное распределение не определяется своими моментами. Про положительную случайную величину X говорят, что она имеет логарифмически нормальное распределение, если величина log X нор- мально распределена. При стандартном нормальном распределении плотность случайной величины X равна 1 -—-(log*)2 /(x)==F^x"le >х>0’ и /(х) = 0, х^О. Введем при — fa (*) —f (*) [1 sin (2л log*)]. (3.13> Мы утверждаем, что плотность вероятности fa имеет в точности те же самые моменты, что и f. Поскольку достаточно показать, что 00 xkf (х) sin (2л log х) dx = O, k — 0, 1, ... , о Подстановки logx = /=#+& сводят этот интеграл к интегралам __ - I е 2 sin (2л/) dt——у=е2 I е 2 sm(2ny)dy, V 2л J К 2л J — 00 — 00 а последний интеграл здесь равен нулю, так как подынтегральное выражение представляет собой четную функцию. (Этот интересный пример предложен К. Хейди.) ► Полученный отрицательный результат не должен порождать необосно- ванного пессимизма, так как источник беспокойства легко устраняется вве- дением подходящих условий регулярности. Наилучший результат содержится в теореме Карлемана, утверждающей, что распределение F на —оо, оо одно- вначно определяется своими моментами, если ^2п/<2п) = (3-14) т. е. если ряд расходится. В этой книге мы докажем более слабее утверждение, а именно, что F однозначно определяется своими моментами^ если степенной ряд 2 Н-2и^/(2ц)1 сходится в некотором интервале (см. § 6 и гл. XV, 4). Оба критерия ограничивают скорость роста р2п- Знание конеч- ного числа моментов р0, pi, ,,,, рл даже в самой общей ситуации приводит
§ 4. Симметрично зависимые случайные величины 265 к полезным неравенствам для F, аналогичным выведенным в гл, V, 7, для п=1х). § 4*). ПРИМЕНЕНИЕ К СИММЕТРИЧНО ЗАВИСИМЫМ СЛУЧАЙНЫМ ВЕЛИЧИНАМ Мы выведем здесь один красивый результат, принадлежащий Б. де Финетти. Он может служить типичным примером того, сколь легко теорема 1 из § 3 приводит к удивительным резуль- татам. Определение. Случайные величины Хо ..., Хп называются симметрично зависимыми, если все п\ перестановок (Х^, ..., Х^п) имеют одно и то же п-мерное распределение. Случайные вели- чины, образующие бесконечную последовательность {Х„}, называ- ются симметрично зависимыми, если Хх, ..., Х„ симметрично зависимы при любом п. Как мы увидим из примеров, конечные и бесконечные после- довательности существенно отличаются друг от друга. Мы рас- смотрим здесь частный случай бесконечной последовательности {XJ симметрично зависимых величин, принимающих только зна- чения 0 и 1. В следующей ниже теореме утверждается, что рас- пределение такого процесса {Хп} получается рандомизацией бино- миального распределения. Как обычно, мы положим Sn = Xi+»«« . ..4-Хп и будем называть событие {ХА. = 1} «успехом». Теорема. Даждой бесконечной последовательности симметрично зависимых случайных величин, принимающих только значения О и 1, соответствует такое сосредоточенное на 0, 1 распределение F, что Р{Х1==1, ..., Х* = 1, Xft+1 = 0, ..., Хя = 0} = 1 = 9)"-*F{d9} (4.1) о и 1 P{S„ = Z>} = (j) — (4.2) О Доказательство. Для краткости обозначим левую часть (4.1) х) Первые сильные результаты были получены Марковым и Стилтьесом около 1884 г. Современная литература на эту тему неисчерпаема. См., напри- мер, Wald A., Trans. Amer. Math. Soc., 46 (1939), 280—306; Royden H. L., Ann. Math. Statist., 24 (1953), 361—376 [приведены границы для F (x)—F (—*)]. Общий обзор см. в монографии: Shohat J. A., TamarkinJ. D., The problem of moments, New York, 1943 (Math. Surveys № 1). См, также Karlin S’., Studden W. (1966). *) Материал не используется в дальнейшем,
266 Гл. VII. Законы больших чисел. Применения в анализе через Рк'П, Положим г0=1, и при и=1, 2, ... сп = рп,п = Р{^\, Х„ = 1}. (4.3> Тогда из вероятностных соображений Рп-1, п = Рп-1, п — 1 Рп, п = (4«4)s и поэтому Рп-2, п Рп — 2, п-1 Рп-1, п^ ^п-2* (4.5)- Продолжая этот процесс, получаем при k^n Рь. n = Pk, п-1—Pk+u n = (—l)n"ftA”-4- (4-6> Все эти величины неотрицательны, и поэтому последовательность вполне монотонна. Отсюда следует, что сг есть момент по- рядка г некоторого вероятностного распределения F и поэтому (4.1) представляет собой просто расшифровку соотношения (4 6). Утверждение (4.2) вытекает отсюда, так как имеется ровно Q способов появления k успехов в п испытаниях. Обобщения. Нетрудно применить то же самое рассуждение к случайным величинам, допускающим три значения, однако в этом случае мы будем иметь два свободных параметра и вместо (4.2) получим смесь триномиальных распределений, a F будет двумер- ным распределением. Вообще теорема и ее доказательство легко могут быть приспособлены к случайным величинам, принимающим, только конечное число значений. Этот факт, естественно, позво- ляет высказать предположение, что в наиболее общем случае последовательность симметрично зависимых случайных величин получается из последовательности независимых случайных величин7 рандомизацией по некоторому параметру. В специальных случаях, трудностей не возникает, однако общая задача трудна тем, что «параметры» не определены отчетливо и могут выбираться непо- стижимым образом. Несмотря на это, были доказаны весьма общие- варианты этой теоремы х). Эта теорема позволяет получить условие применимости закона больших чисел и центральной предельной теоремы к симметрично зависимым случайным величинам (см. задачу 21 в гл. VIII, 10). Первый из приводимых ниже примеров показывает, что в от- дельных случаях теорема может приводить к удивительным ре- зультатам. Примеры б) и в) показывают, что теорема неверна для конечных последовательностей. г) Hewitt ,Е., Savage L. J., Symmetric measures on Cartesian products,» Trans. Amer. Math. Soc., 80 (1956), 470—501. Изучение с применением мар- тингалов см. Loeve (1963). См. также: Bublmann Н., Austauschbare stocha- stische Variabeln und ihre Grenzwertsatze, Univ, of California Publications in* Statistics, 3. № 1 (I960), 1-36.
§ 5. Обобщенная формула Тейлора и полугруппы 267 Примеры, а) В схеме Пойа (см. 1 гл, V, 2) урна содержит первоначально b черных и г красных шаров. После каждого извлечения выбранный шар возвращается и в урну добавляется с шаров того же цвета. Таким образом, вероятность получить черный шар в каждом из п первых испытаний равна Г (—4-/2^ г f _ &(6+ф--(6+(ц-1)0 U z1 U ; /47ч " (& + r).. .(b + r+(n-1) с) г (b+r_ \ г ( AV k ' 7 \ С ' ) \ С ) Положим Хп = 1 или 0 в зависимости от того, появился при n-м испытании черный или красный шар. Легко вычислить (см. 1, гл. V, 2), что эти случайные величины симметрично зависимы и потому значение сп равно гг-му моменту некоторого распределе- ния F. По виду формула (4.7) напоминает бета-интеграл (2.5) из гл. И. Анализ показывает, что F есть бета-распределение {4.2) из гл. II с параметрами р.-=Ь/с и v = r/c. Можно устано- вить, используя снова бета-интеграл, что (4.1) согласуется с (2.3) из 1, гл. V, а (4.2) с (2.4) из той же главы первого тома. б) Рассмотрим 6 размещений двух различимых шаров в трех клетках. Припишем каждому вероятность х/в. Пусть Xz равно 1 или 0 в зависимости от того, занята, Z-я клетка или пуста. Вели- чины Xz симметрично зависимы, но теорема к ним неприменима. В самом деле, из (4.3) получаем с0 = 1, с1=^1/2, = с3 = 0, и на этом последовательность обрывается. Если бы она была на- чальным отрезком вполне монотонной последовательности мы должны были бы иметь с4=с5 = ... =0. Но тогда было бы = = — 1/в<0, что невозможно. в) Пусть случайные величины Хх, ..., Х„ независимы, имеют одно и то же распределение вероятностей и S„ = X1 + ... +Х„. Положим Yk = Xk—n~LSn для А = 1, ..., п—1. Случайные вели- чины (Yit ..., Yn_i) симметрично зависимы, но их совместное рас- пределение нельзя представить в форме, соответствующей теореме де Финетти. § 5*) ОБОБЩЕННАЯ ФОРМУЛА ТЕЙЛОРА И ПОЛУГРУППЫ Предыдущие три параграфа посвящены следствиям из предель- ного соотношения в примере 1, а), содержащего биномиальное распределение. Мы перейдем теперь к примеру 1, б), включающему распределение Пуассона. Так как последнее представляет собой предельную форму биномиального распределения, то можно наде- яться, что наш подход допускает распространение на настоящую ситуацию. Исходным пунктом этого подхода было тождество (1.10), в котором биномиальное распределение появляется справа. Если положить 0 = x/v и устремить v к бесконечности, то биномиаль- *) Этот параграф при первом чтении можно пропустить.
268 Гл. VII. Законы больших чисел. Применения в анализе ное распределение будет стремиться к распределению Пуассона с математическим ожиданием х и (1.10) перейдет в1) Е 7Г ^'ai = Е 7Г <5-1 > г=0 /=0 Мы используем это тождество при / = 0 и aj = u(jh), где и есть произвольная ограниченная непрерывная функция, опреде- ленная на 0, оо, a ft есть положительная постоянная. При х == = hQ соотношение (5.1) превращается в Е тР Д' «(0) =е~^ £ и (jh) . (5.2} г= 0 h /=0 В правой части мы узнаем математическое ожидание и, вычислен- ное относительно распределения Пуассона, а, как мы знаем из- примера 1,6), это математическое ожидание стремится к ц(0). Чтобы записать этот результат в более естественной форме, мы заменим и(&) на ц(0-Н), где t >0 произвольно. Таким образом,, нами доказана Теорема. Для любой ограниченной непрерывной функции и на 0, оо Е (5.з> г= О * где2 *) 0 > 0 и ft —> 0 +. Эта привлекательная теорема была впервые доказана Э. Хилле с помощью значительно более глубоких методов. Левая часть (5.3) представляет собой разложение Тейлора для и с той лишь разницей, что производные заменяются разностными отношениями. Для аналитических функций левая часть приближается к ряду Тейлора, но теорема применима к недифференцируемым функциям. В этом смысле (5.3) представляет собой обобщение разложения в ряд Тейлора и открывает нам его новые черты. Существует другое истолкование формулы (5.3), приводящее к так называемой экспоненциальной формуле теории полугрупп (см. теорему 2 в гл. Х,9). Левая часть в (5.3) содержит фор- мальный экспоненциальный ряд, который естественно использо- вать для того, чтобы определить оператор ехр 0Д. Соотношение h г) Для непосредственного доказательства тождества (5.1) ‘достаточна заменить Дга/ определяющим его выражением (1.7). Левая часть тогда ста- новится двойной суммой, а правая часть получается с помощью очевидной перестановки членов ряда. 2) Нужно отметить, что рассуждение остается справедливым, если и и 7? отрицательны при условии, что и определена на всей прямой,
§ 5. Обобщенная формула Тейлора и полугруппы 269 (5.3) принимает при этом сокращенную форму ехр 0Au (/)—>«(/4-0). (5.4) h Чтобы записать эту формулу в более удобном виде, введем опе- ратор сдвига1) Т (0), переводящий функцию и в функцию «в, определяемую равенством и0 (/) = «(/ + 0). Тогда 71(0) = 1, т. е. это единичный оператор и \ = h~1[T(h) — 1]. (5.5) h На операторном языке формула (5.3) принимает вид eQh-4T (/i)-i]__>7(9). (5.6) Основная информация, доставляемая этой формулой, состоит в том, что все семейство операторов Т (0) определяется поведе- нием Т (h) при малых h. Оглядываясь назад, мы видим, что наш вывод формулы (5.6) применим к значительно более широкому классу операторов. Правая часть в (5.2) представляет собой просто линейную ком- бинацию значений и и может быть интерпретирована как интер- поляционная формула для и. Аналогичное интерполяционное выражение имеет смысл для любого семейства операторов {Т (0)}, определенных при 0 > 0. В самом деле, при фиксированных 0 и h > 0 оператор 00 ^(0)=^-’ '' м k = Q 4 является линейной комбинацией операторов Т (kh). Коэффици- енты (веса) определяются в соответствии с распределением Пуас- сона и обладают тем свойством, что при /i—>0 преобладающую роль играют окрестности точки 0, а дополнительные множества имеют веса, стремящиеся к нулю. Это делает правдоподобным предположение, что при разумных определениях сходимости и непрерывности мы будем иметь АЛ(0)—>Т (0) для любого непре- рывного семейства операторов T(Q). В частности, если операторы 7(0) образуют полугруппу, то Т (kh) = (Т (h))k и интерполяцион- ный оператор АЛ(0) имеет вид левой части в (5.6). Неудиви- х) Это доказательство, принадлежащее М. Риссу, имеется (при несколько более общих условиях) в книге: Хилле Э., Филлипс Р., Функциональный анализ и полугруппы, ИЛ, М., 1962. Как можно понять, авторы не учли, что ссылка на линейную интерполяционную формулу (5.7) как на пуассонов- скую рандомизацию параметра полугруппы и ссылка на неравенство Чебы- шева упрощают изложение. Вероятностные соображения отмечались Д. Кен- даллом и были в полной мере использованы в статье: Chung К. L., On the exponential formulas of semi group theory, Maths Scandinavica, 10 (1962)». 153—162.
270 Гл. VII. Законы больших чисел. Применения в анализе тельно поэтому, что «экспоненциальная формула» (5.6) верна вообще для непрерывных полугрупп ограниченных операторов. Мы вернемся к доказательству этого в гл. X, 9. §6. ФОРМУЛЫ ОБРАЩЕНИЯ ДЛЯ ПРЕОБРАЗОВАНИЯ ЛАПЛАСА Предыдущий параграф и пример 1,6) основаны на следующей частной форме закона больших чисел. Пусть X—случайная вели- чина, распределенная по закону Пуассона с параметром Х0. Тогда при больших X вероятность события |Х—Х01 > Хе мала. Поэтому для Р{Х^Ах} при Z—> оо е-ле £ ^-Л°’ если 0>х’ (6.1) * 11, если 0 <х. Выражение в левой части получается из (5.2) при условии, что и принимает только значения 0 и 1. Поэтому утверждение (6.1) содержится в теореме § 5. Использование этой формулы в ана- лизе мы проиллюстрируем сейчас на примере преобразований Лапласа (систематически они изучаются в гл. XIII). Пусть F—распределение вероятностей, сосредоточенное на 0, оо. Преобразованием Лапласа функции F называется функ- ция <р, определенная для X > 0 формулой <р(1) = (6.2) о Производные фш (Z) существуют и их можно вычислить формаль- ным дифференцированием: (%) = J e-™Q*F {dO}. (6.3) о - Из этих равенств и из формулы (6.1) видно, что в каждой точке непрерывности распределения F Е — F(x). (6.4) k < Хх Это очень полезная формула обращения. Она показывает, в част- ности, что распределение F однозначно определяется своим пре- образованием Лапласа. Такими же рассуждениями получается множество близких формул обращения, применимых при различных обстоятельствах. Например, (1.6) представляет собой формулу обращения для ин- тегралов Лапласа типа w (X) = е~Кх и (х) dx. (6.5) о
§ 7. Законы больших чисел 271 Проведем формальное дифференцирование, как в (6.3). Тогда (1.6) означает, что для ограниченной и непрерывной функции и 1«'6> равномерно в каждом конечном интервале, [Эти формулы обращения справедливы при значительно более общих условиях. Однако сейчас представляется нежелательным затемнять простоту рассуждений балластом новой терминологии. Абстрактный аналог соотношения (6.6) появится в гл. XIII, 9.] Если распределение F обладает моментами ..., р2п> то преобразование Лапласа удовлетворяет неравенствам 2л-1 2п (6.7) k=0 k=Q Эти неравенства часто используются. Чтобы доказать их, мы будем исходить из хорошо известных неравенств 2л—1 2п L . L <=^<=^i, 1>0. м 7?= 0 k= О Заменяя i на kt и интегрируя относительно F, получим (6.7). Отсюда следует, в частности, что /г=0 в любом интервале 0^1 <Х,0, в котором сходится ряд, стоящий справа. Если такой интервал существует, то, согласно теории аналитических функций, ряд в (6.9) однозначно определяет (р (А,) при всех к > 0. Следовательно, по- следовательность моментов р0, ... однозначно определяет распределение F, если ряд в (6.9) сходится в некотором интервале | X | < Хо. Этот полезный критерий справедлив и для распределений, не сосредоточенных на 0, оо. На в общем случае доказательство основано на применении характеристических функций (см. гл. XV, 4). § 7*). ЗАКОНЫ БОЛЬШИХ ЧИСЕЛ ДЛЯ ОДИНАКОВО РАСПРЕДЕЛЕННЫХ СЛУЧАЙНЫХ ВЕЛИЧИН Всюду в этом параграфе мы используем обозначение Srt == = Хх + ... +ХП. Самый старый вариант закона больших чисел состоит в утверждении, что для независимых случайных величин X* с одним и тем же распределением, математическим ожида- 9 Простое дифференцирование и индукция показывают, что разность между любыми двумя членами в (6,8) является монотонной функцией от t. ♦) Тема этого параграфа имеет отношение к первому периоду развития теории вероятностей, но никакой особой важности для остального содержания книги она не представляет. Мы останавливаемся на ней по причине ее исто- рического и методологического интереса, а также потому, что имеется много работ, посвященных обращению закона больших чисел.
272 Гл. VII. Законы больших чисел. Применения в анализе нием [л и конечной дисперсией 1) р{ т-н|>е}~° р-1) при п—> оо и любом фиксированном е>0. В начале этой главы отмечалось, что (7.1) вытекает из неравенства Чебышева. Чтобы получить более сильный результат, мы выведем неравенство (раз- новидность неравенства Чебышева), применимое в случае, когда не существует математических ожиданий. Определим новые слу- чайные величины XJ,, получаемые «урезанием» Xk на произволь- ном, но фиксированном уровне ±s„, равенствами _ ( Xfe, когда | X* | к • ( 0, когда | Xft | s„- (7.2) Положим s;<=x;+...+x;, m;=E(s;)=nE(x;). (7.3) Тогда очевидно, что Р{ |S„-т'п\> t} < Р{ is;-т'п I > o+P{s„=#s;}, (7.4) так как из наступления события, написанного слева, вытекает наступление хотя бы одного из событий, стоящих справа. Это неравенство справедливо также для зависимых случайных величин с различными распределениями, но здесь мы рассматри- ваем только одинаково распределенные и независимые случайные величины. Полагая t = nx и применяя неравенство Чебышева к оценке первого члена в правой части (7.4), мы получаем сле- дующий результат. Лемма. Пусть Xft независимы и имеют одинаковое распределе- ние F. Тогда при х>0 р {11 S„- Е (ХО | > х} < Е (Х'О+иР {I Хх I > s„}. (7.5) Используя это неравенство, можно доказать закон больших чисел в форме Хинчина, который состоит в утверждении, что (7.1) выполняется при всех е > 0, если Хк имеют конечное математи- ческое ожидание р. Доказательство этого факта было бы, по су- ществу, повторением доказательства, приведенного в 1, гл. X, 2, для дискретного случая. Поэтому мы перейдем сразу к более сильному утверждению, указывающему необходимые и достаточ- ные условия. Для формулировки теоремы введем при t > О т(0 = [1— F(0 + F(- о? (7-6) г) Соотношение (7.1) эквивалентно (см. гл. VIII, 2) n“1Sn—р-Д-О, где Р знак —> означает сходимость по вероятности®
§ 7. Законы больших чисел 273 И t t а (/) = у у х2 F {dx} = —т (0 + у У хт (х) dx (7.7) -t о (равенство двух выражений в (7.7) проверяется путем интегриро- вания по частям). Теорема 1. (Обобщенный слабый закон больших чисел.) Пусть случайные величины Xk независимы и имеют одно и то же распре- деление F. Для того чтобы существовали такие постоянные что при любом е > О р{|^-Ип|>е}->°, (7.8) необходимо и достаточно, чтобы1) x(t)—>0 при t—>оо. При вы- полнении (7.8) можно взять п рп = J xF\dx}. (7.9) — п Доказательство, а) Достаточность. Определим равенством (7.9). Мы используем урезание (7.2), положив внем$„ = я. Тогда рп = Е(Х0 и по предыдущей лемме левая часть соотношения (7.8) будет меньше чем 8“"2сг(гг) + т(гг), а это последнее выражение стремится к 0 при т(/)—>0. Таким образом, достаточность доказана. б) Необходимость. Предположим, что (7.8) выполняется. Рас- смотрим, так же как в гл. V, 5, величины °Xft, полученные не- посредственно симметризацией Xk. Сумма этих величин °S„ может быть получена путем симметризации Sn—цц. Пусть а—медиана случайных величин Xk. Используя неравенства (5.6), (5.10) и (5.7) из гл. V в указанном порядке, мы получим 2Р {| S„-nH | > ne} > Р {| °Sn ( > 2пе} > > у [1—ехр (— пР {| «X, | > 2пе})] > ерх (_-1-пР{|Хх[ >2пе-НаЦ)] . В силу (7.8) самая левая часть неравенства стремится к 0. От- сюда следует, что выражение в показателе экспоненциальной функции в самой правой части стремится к 0, а это явно невоз- можно без того, чтобы т(/)—>0. Условие т(/)—>0 будет выполнено, когда F имеет математи- ческое ожидание ц. «Урезанные» моменты будут в этом случае х) Из (7.7) следует, что т (/)—>0 влечет о (/)—> 0. Обратное также справедливо, см. задачу 11. Другое доказательство теоремы 1 см. в гл, XVII, 2, а),
274 Гл. VII. Законы больших чисел. Применения в анализе стремиться к р, и поэтому (7.8) будет равносильно классическому закону больших чисел (7.1). Однако классический закон больших чисел в форме (7.1) выполняется и для некоторых случайных вели- чин, не имеющих математического ожидания. Например, если F такое симметричное распределение, что /[1—F(f)]—*0, то Р {| n^1Sn | > е} —> 0. А математическое ожидание существует только в том случае, когда функция 1 — F (t) интегрируема для значе- ний t между 0 и оо, что представляет собой более сильное условие. (Интересно отметить, что усиленный закон больших чисел вы- полняется только для величин, имеющих математические ожида- ния. См. теорему 4 из § 8.) Практический смысл закона больших чисел обсуждался bJ; X. Особое внимание было уделено при этом классической теории «безобидных игр». Мы могли видеть, в частности, что даже в том случае, когда математические ожи- дания существуют, участник «безобидной игры» может прочно занимать про- игрышное положение. С другой стороны, анализ петербургской игры показал, что классическая теория применима также к некоторым играм с бесконечным математическим ожиданием, за тем исключением, когда '«безобидный вступи- тельный взнос» зависит от номера испытания. Следующая теорема выражает этот факт более точно. Рассмотрим независимые положительные случайные величины X# с оди- наковым распределением F [таким, что F(0) = 0]. Величины можно интер- претировать как возможные выигрыши, а ап—как полный вступительный взнос за п испытаний. Положим S ц (s) = j х F {dx}, р (s) = s р <7-10) о Теорема 2. Для того чтобы существовали такие постоянные ап, что P{KlS„-l | > е}^0, (7.11) необходимо и достаточно, чтобы г) р ($)—> оо при s—> оо. В этом случае существуют числа sn, такие, что np(sn) = sn (7.12) и 7.11) выполняется при ап — пр (sn). Доказательство, а) Достаточность. Предположим, что р (s)—> оо. Если п велико, то функция пр (s)/s принимает значения > 1, но она стремится к 0 при s—> оо. Эта функция непрерывна справа, и предел слева не превосходит предела справа. Если sn есть нижняя граница всех таких s, что пр (s) s”1 1, то отсюда следует справедливость (7.12). Положим рл = р (sn) = Е (X'). Применяя неравенство (7.5) леммы при х = ер„, получаем fl S I ) 1 ₽ihr-1 > 4 Е (х;2>+"11-/7 (s”)]- 11 /ти I J Ь n x) Мы увидим в гл. VIII, 9 (теорема 2), что р (s)—> оо тогда и только тогда, когда ц (s) медленно меняется на бесконечности. Соотношение (7.11) р означает, что а-^п —> 1 (См. VIII, 2),
§ 8. Усиленный закон больших чисел 275 Интегрируя по частям, сведем Е (X'2) к интегралу от функции х (1—F (х))]. По предположению эта функция есть о(р(х)), и поэтому Е (Х^2) — о (s^pQ. Это означает ввиду (7.12), что первый член в правой части неравенства (7.13) стремится к 0. Аналогично из (7.12) и определения р ($) в (7.10) следует, что п [1—F (sn)]—>0. Таким образом, из неравенства (7.13) получаем соотноше- ние (7.11), где an — niin. б) Необходимость. Предположим теперь, что (7.11) выполняется, и исполь- зуем «урезание» (7.2) с sn — 2an. Поскольку E(X'2)^s„pn, то из основного неравенства (7.5) при х = ъап1п мы получаем P{S„>nni+8a„}<A.^>+„[i_F(2a„)]. (7.14) е ип Поскольку мы имеем дело с положительными величинами, то Р {S„ < 2л„}^ Р J max Х& 2ап\ —Fn (2ап). (7.15) \k < п / По предположению левая часть (7.15) стремится к 1 и отсюда следует, что л[1— / (2ап)]—>0 (так как х^е-^-*» при х<;1). Если бы стреми- лось к нулю, то же самое должно было быть верным и для правой части неравенства (7.14), но тогда это явно противоречило бы предположению (7.11). Такое рассуждение годится также и для подпоследовательностей и показывает, что прп/ап не стремится к нулю, а это в свою очередь означает, что р (2ап) —> оо. Выбирая ап так, чтобы 2ап < х «С %an+i> получаем, что р (х)—> оо при х—>оо. Тогда р (х) (2ап) an/an+li и очевидно, что из (7.11) с необходи- мостью вытекает ограниченность отношений ап+1[ап. ►> § 8*). УСИЛЕННЫЙ ЗАКОН БОЛЬШИХ ЧИСЕЛ Пусть Хп Х2,...—взаимно независимые случайные величины с одинаковым распределением F, и пусть E(Xft) = 0. Как обычно, обозначим S„ = X1+ • • ’ + ХП. Слабый закон больших чисел утвер- ждает, что для любого е > О P{n-1|SJ>e}-*0. (8.1) Этот факт не исключает возможности, что значения могут оказаться произвольно большими для бесконечно многих п. На- пример, в симметричном случайном блуждании вероятность того, что частица возвратится в начало координат на гг-м шаге, стре- мится к нулю, а в то же время несомненно, что осуществится бесконечное число таких возвращений. На практике мало инте- ресуются вероятностью в (8.1) для отдельных больших значений п. Гораздо более интересен вопрос о том, сделается ли величина гг1 |Sn| в конце концов малой и будет оставаться такой в даль- нейшем, иначе говоря, будет ли л"11 S„ | < & одновременно для всех nZ^N. В соответствии с этим мы найдем вероятность собы- тия, которое заключается в том, что —>0 1). *) Этот параграф может быть опущен при первом чтении. х) Из закона нуля-единицы (см. гл. IV, 6) следует, что эта вероятность равна 0 или 1, но мы не будем этим пользоваться,
276 Гл. VIJ. Законы больших чисел. Применения в анализе Если это событие имеет вероятность единица, то мы говорим, что последовательность подчиняется усиленному закону больших чисел. Следующая теорема показывает, что этот закон имеет место, когда Е(Х1) = 0. [То, что утверждение гораздо сильнее слабого закона больших чисел, следует из того факта, что соотношение (8.1) выполняется, как мы видели, для некоторых последова- тельностей {XJ, не имеющих математического ожидания. В про- тивоположность этому существование математического ожидания является необходимым условием для усиленного закона больших чисел. Действительно, обсуждаемая в конце этого параграфа теорема, обратная усиленному закону, показывает, что при от- сутствии математического ожидания средние n”11 S„ | обречены бесконечно часто превышать любую заданную границу а.] 1 Теорема 1. (Усиленный закон больших чисел.) Пусть Хп Х2, ... —независимые, одинаково распределенные случайные величины с Е(Х) = 0. Тогда с вероятностью единица n^1Sn—>0. Доказательство этой теоремы основывается на методе урезания и в действительности проходит для последовательностей случай- ных величин с различными распределениями. Чтобы избежать повторений, мы отложим на время доказательство теоремы 1 и подготовимся к нему с помощью другой теоремы, которая имеет широкий круг применений. Теорема 2. Пусть Хр Х2, ... —независимые случайные величины с произвольными распределениями. Предположим, что Е(Хй) = 0 при всех k и что SE(S£<oo. (8.2) /2=1 Тогда последовательность сходится с вероятностью единица к конечному пределу S. Доказательство. Обратимся к бесконечномерному выборочному пространству, определенному величинами Xk. Пусть А(е) обозна- чает событие, которое заключается в том, что неравенство | Sn —| > 8 выполняется для некоторых произвольно больших значений п, т. Событие, состоящее в том, что {Sn} не сходится, является монотонным пределом событий А(е) при е—>0, и поэтому достаточно доказать, что Р{А(е)}==0. Пусть событие Агл(е) озна- чает, что | Sn—Sm | > е при некотором п > т. Тогда А (е) является пределом при т —> оо невозрастающей последовательности собы- тий Ат(&), и поэтому достаточно доказать, что Р{А/Л(с)}—>0. Наконец, пусть А^1П(8) при п > т будет событием, заключа- ющимся в том, что |S* — | > е для некоторого m < й </г.
§ 8. Усиленный закон больших чисел 277 В-силу неравенства Колмогорова P{^.n(s)}<e-War(SB-SBJ) = 6^ S Е(Х|). (8.3) k= т +1 При п —> оо мы приходим к заключению, что Р{Ли(е)}<е^ S Е(Х1), (8.4) k= т +1 где правая часть стремится к нулю при т—>оо. ► Доказанная теорема имеет множество приложений. Следующий ее вариант будет использован для доказательства усиленного за- кона больших чисел. Теорема 3. Пусть Xf, Х2, ...—независимые случайные вели- чины с произвольными распределениями. Предположим, что E(XJ = 0 для всех k. Если Ь± < Ь2 < ... —> оо и если S^2E(Xl)<oo, (8.5) то. ряд 2 faХХЛ сходится с вероятностью единица и Ь~Ъп-+0. (8.6) Доказательство. Первое утверждение теоремы есть прямое следствие теоремы 2, отнесенной к случайным величинам ^хХ/г. Следующая лемма, содержащая широко известный результат, показывает, что соотношение (8.6) имеет место в каждой точке, в которой сходится ряд 2 На этом Доказательство заканчивается. ' ► Лемма 1. («Лемма Кронекера».) Пусть —произвольная числовая последовательность и 0 < ^ < fe2 < ... —> оо. Если ряд 00 5 Ь^хк сходится, то k=i *i+ * • + *» Доказательство. Обозначим остаточный член нашего сходяще- гося ряда через рп. Тогда при /г=1,2, ... xn = bn (p„_f— рд) и, следовательно, п—1 X1+b"+Xn--pn+^-E pk(bk+l-bk)+-^. (8.8) ип Un k—1 Un Предположим, что |pj <e при k^r. Так как bn—>oo, то вклад первых г слагаемых в сумму стремится к нулю, тогда как оставшиеся’ слагаемые в сумме не превышают е(6„—br)/bn < е. Таким образом, (8.7) справедливо. ►
278 Гл. VII. Законы больших чисел. Применения в анализе Прежде чем вернуться к усиленному закону больших чисел, мы докажем еще одну лемму, которая имеет чисто аналитический характер. Лемма 2. Пусть величины Xk имеют одинаковое распределе- ние F. Тогда при любом а > О £P{]XJ>^}<oo (8.9) в том и только том случае, когда существует E(XJ. Доказательство. В соответствии с леммой 2 из гл. V, 6, мате- матическое ожидание Е(Х£) существует тогда и только тогда, когда J[l — F(x) + F(— x)]dx< оо. (8.10) о Ряд в (8.9) можно рассматривать как риманову интегральную сумму, а так как подынтегральная функция монотонна, то каждое из соотношений (8.9) и (8.10) следует одно из другого. ► Наконец, мы в состоянии доказать усиленный закон больших чиселх). Доказательство теоремы 1. Используем метод урезаний и оп- ределим новые случайные величины следующим образом: Xfe = Xft, Х£ = 0, если |Xft|<6, Х* = 0, Xfe = Xfe. если \Xk\> k. 1 ' Так как математические ожидания конечны, то из леммы 2 можно вывести при а — 1, что 2Р(Х;#=0}<оо. (8.12) Отсюда следует, что с вероятностью единица только конечное число величин Х£ будет отлично от 0. Таким образом, с вероят- ностью единица S"/n—*-0, где 8„ = 5]Х£. k Далее мы покажем, что £Zr8E(X*)<oo. (8.13) Тогда в силу теоремы 3 с вероятностью единица n"1[S;-E(S;)]->0. (8.14) Но E(Xfe)—>0, и поэтому очевидно, что п-‘Е(ЗД = п-12Е(Х^0. (8.15) Для завершения доказательства нам остается только проверка 4) О доказательстве усиленного закона прямыми методами см, в задаче 12.
§ 8. Усиленный ваксн больших чисел 279 утверждения (8.13). Имеем k Е(Х;’)=£ J xsF(dx}. , =| У-1 <1*1 <i Отсюда следует, что 2Л-*Е(Х/)= 2 $ x*F{dx} S k~*. Л= 1 i' -1 j-1 < | x | < / i (8.16) (8.17) Внутренняя сумма меньше чем 2//, и поэтому правая часть меньше чем 2 J \x\F {dx} = J 7 =1 /- 1 < I Л) < / -co (8.18) На этом доказательство закончено. ► Мы видели, что слабый закон больших чисел в форме (7.8) применим и к некоторым последовательностям случайных величин, не имеющих матема- тического ожидания. В противоположность этому для усиленного закона существование математического ожидания Е (Хг) необходимо. В подтверждение этого следующая теорема показывает, что при отсутствии конечного математического ожидания последовательность арифметических средних Sn/n не ограничена с вероятностью единица. Теорема 4. (Обращение усиленного закона больших чисел.) Пусть случай- ные величины Хь Х2, ... независимы и одинаково распределены. Если Е (| X 11) = оо, то для любой числовой последовательности {си} с вероятностью единица lim sup | n~^Sn—cn| = co. (8.19) Доказательство.. Пусть событие Ak состоит в том, что |Х^| > ak. Собы- тия А^ взаимно независимы, и по лемме 2 отсутствие математических ожи- даний имеет следствием расходимость ряда 2 Р ® силу второй леммы Бореля — Кантелли [см. 1, VIII, 3] это означает, что с вероятностью единица осуществится бесконечно много событий А^ и поэтому последовательность ) Хд \/k не ограничена с вероятностью единица. Но так как X^ = S^ — то ограниченность | S„ |/п должна была бы влечь ограниченность |Х#|/^ и поэтому мы заключаем, что последовательность арифметических средних Sn/n не ограничена с вероятностью единица. Все это доказывает утверждение (8.19) в частном случае ^ = 0, а общий случай может быть сведен к разобранному с помощью симметризации. Так же мак в гл. V, 5, обозначим через °Х^ симметризованные величины Х^. Из нера- венства симметризации (5.1) гл. V следует, что Е(|°Х^|) = оо, и поэтому последовательность арифметических средних °Sn/n не ограничена с вероят- ностью единица. Однако величины °S„ можно получить путем симметризации —сп, и, следовательно, вероятность того, что (S„—сп)/п остается ограни- ченной, равна нулю, ►
280 Гл. VII. Законы больших чисел. Применения в анализе § 9*) ОБОБЩЕНИЕ ДЛЯ МАРТИНГАЛОВ Неравенство Колмогорова из гл. V, 8, является основным инструментом в доказательствах § 8. Детальный анализ этих до- казательств показывает, что предположение о независимости случайных величин было использовано только при выводе неко- торых неравенств для математических ожиданий, и поэтому основные результаты могут быть перенесены на мартингалы и субмартингалы. Такое обобщение имеет важное значение для многих приложений, оно проливает свет на природу наших теорем. Напомним (см. гл. VI, 12), что конечная или бесконечная последовательность случайных величин Ur составляет субмар- тингал, если для всех г при 6=1, 2, ..., г— 1, (9.1) где 33± с S2 cz ... есть возрастающая последовательность сг-алгебр событий. Если все неравенства в (9.1) заменить на равенства, то последовательность {Ur} называется мартингалом. [При любом значении г автоматически выполняются все г—1 условий (9.1), если эти условия справедливы для значения k — r— 1.] Напомним также, что если {Х^}- есть последовательность независимых слу- чайных величин с Е(Х fe) = 0, то частные суммы S„ образуют мартингал; более того, если существуют дисперсии, то последо- вательность {S^} образует субмартингал. Теорема 1. (Неравенство . Колмогорова для положительных субмартингалов.) Пусть Uj, ..., Un — положительные случайные величины. Предположим, что соотношение (9.1) выполнено при г п. Тогда при / > 0 PJmaxU,>^CriE(Uw). . (9.2) Если {UJ есть произвольный мартингал, то величины | UJ образуют субмартингал (см. лемму в гл. VI, 12). Отсюда выте- кает, что теорема 1 имеет важное следствие. Следствие. (Неравенство Колмогорова для мартингалов.) Если случайные величины Ux, ...» Un составляют мартингал, то при />0 P(max|UJ>/}<r4’(|U„|). (9.3) Доказательство теоремы 1. Мы повторим дословно доказа- тельство неравенства Колмогорова из . гл. V, 8, д), полагая Sfe = Uft. Предположение о том, что Sk представляет собой суммы независимых случайных величин, было использовано только при установлении неравенства V, (8.16), которое теперь может быть записано как Е(и„1л.)>Е(иу1Л/). . (9.4) ♦) Содержание этого параграфа нигде в дальнейшем не используется9
' § 9. Обобщение для мартингалов -281 Далее, случайная величина ^-измерима и поэтому Е(и„1Л/|^/) = 1л/Е(и„|^/)>и/1л/ (9.5) [см. V, (10,9)]. Вычисляя в (9.5) математические ожидания левой и правой частей, получаем (9.4). ► Мы обратимся к обобщению теоремы 2 о бесконечных свертках из § 8, хотя на этом пути мы получим только частный случай общей теоремы о сходимости мартингалов. Действительно, Дуб показал, что приводимая ниже теорема остается справедливой, если условие E(S*)’<oo заменить более слабым требованием, чтобы Е (| S/z |) оставалось ограниченным. Доказательство этой более общей теоремы, однако, сложно, и мы приводим здесь наш ва- риант ввиду большой важности теоремы и простоты доказательства. [Обобщение см. в задаче 13.] Теорема 2. (Теорема о сходимости мартингалов.) Пусть — бесконечная последовательность,-образующая мартингал с E(S^) < < С < оо при всех п. Тогда существует такая случайная вели- чина S, что с вероятностью единица Sn—>S. Кроме того,. E(S„) = E(S) при всех п. Доказательство. Мы повторим доказательство теоремы 2 из § 8. Предположение о том, что являются суммами независимых, случайных величин, использовалось только в (8.3) для доказа- тельства Е ((S„—Sm)2) —0, n, т->оо. (9.6) Далее, из гл. VI, 12, мы знаем, что по свойству мартингалов E(S„|Se,) = SOT при п>т. В силу основного свойства V, (10.9) условных математических ожиданий получаем . E(S„SOT|Sm) = S^, п>т. (9.7) Вычисляя математические ожидания и воскрешая в памяти фор- мулу V, (10.10) для повторных математических ожиданий, мы заключаем, что E(SnSw) = E(S^), и, следовательно, Е (S*-S^) = Е (S*) - Е (S^), п > т. Но по лемме из гл. VI, 12, величины S* образуют субмартингал,, и поэтому последовательность ]E(S^)} является монотонно возра- стающей. По предположению теоремы она ограничена и, следо- вательно, имеет конечный предел. Это влечет справедливость (9.6). Из свойства мартингала вытекает, что E(SJ не зависит от п* а из ограниченности последовательности ]E(S^)} следует равенства E(S) = E(S„) [пример VIII, 1, д)]. Как прямое следствие мы получаем аналог теоремы 3 из § 8. Теорема 3. Пусть {Хп} —такая последовательность случай*
282 Гл. VII. Законы больших чисел. Применения & анализе ных величин, что при всех п Е(Х„|^„_1) = О. (9.8) Если bi<Zbi<Z . • • —► оо и £^2Е(Х£)<оо, (9.9) то с вероятностью единица Xt+ . + ХП (9Ю) Доказательство. Легко видеть, что случайные величины п U„=S&ft-‘Xft (9.11) fe=l образуют мартингал и что математическое ожидание Е(1Д) огра- ничено сверху суммой ряда (9.9). Поэтому в силу предыдущей теоремы обеспечена сходимость {UJ с вероятностью единица, и по лемме Кронекера отсюда вытекает утверждение (9.10). ► Примеры, а) Урновая схема Пойа уже рассматривалась в при- мере 12, б) из гл. VI и в примере 4, а) этой главы. Обозначим через Y„ долю черных шаров при n-м испытании. Уже было показано, что {Y„}—мартингал. Теперь мы видим, что с вероят- ностью единица существует предел Y = lim Y„. С другой стороны, вероятность извлечь при п-м испытании черный шар получается рандомизацией биномиального распределения. Таким образом, если —общее число черных шаров, извлеченных при первых п испы- таниях, то распределение величины n-1Srt сходится к бета-рас- пределению F, найденному в примере 4, а). Поэтому предельная случайная величина Y имеет бета-распределение F. б) Ветвящиеся процессы. В ветвящемся процессе, описанном в 1; гл. XII, 5, число Хл индивидуумов n-го поколения имеет математическое ожидание Е(Хл) = р" [см. 1; гл. XII, формула (4.9)]. При условии, что (п—1)-е поколение содержит v индиви- дуумов, (условное) математическое ожидание величины Хл равно pv и не зависит от размера предшествующих поколений. Таким об- разом, последовательность {S„}, где Sn = X„/p", образует мартин- гал. Нетрудно установить, что если Е(Х|) < оо, то Е (S„) остается ограниченным в предположении р >1 (см. задачу 7 из 1; гл. XII, 6.) Мы получаем удивительный результат, что S„ с вероятностью единица сходится к пределу S^. Отсюда следует, в частности, что распределение величины S„ сходится к распределению вели- чины STO. Эти результаты принадлежат Т. Харрису. в) Гармонические функции. Для ясности мы рассмотрим специ- альный пример, хотя последующие рассуждения применимы к более общим марковским цепям и координатным функциям (пример 12, в) из гл. VI).
§ 10. Задачи 283 Пусть D обозначает единичный круг, т. е. совокупность таких точек х = (х1, х2), что + Для любой точки x£D обозна- чим через Сх наибольшую окружность с центром в %, содержа- щуюся в D. Рассмотрим марковский процесс {Yn} в D, опреде- ленный следующим образом. При данном Чп = х случайная вели- чина Yn+1 распределена равномерно на Сх\ начальное положение Yo = у считается известным. Переходные вероятности определяются стохастическим ядром Л, которое при фиксированном х сосредо- точено на Сх и сводится там к равномерному распределению. Функция ц, заданная на D, будет конкордантной, если значе- ние и (х) равно среднему значению и на Сх. Рассмотрим теперь гармоническую функцию и, непрерывную в замкнутом круге D. Тогда {u(Y„)}—ограниченный мартингал и потому Z = limw(Y„) существует с вероятностью единица. Так как координатные пере- менные Xj являются гармоническими функциями, то из сказанного следует, что с вероятностью единица Y„ сходится к пределу Y С D. Легко видеть, что процесс не может сходиться к внутрен- ней точке круга D. Поэтому с вероятностью единица Уп сходится к точке Y на границе круга D. В обобщенном виде рассуждения подобного типа используются при изучении асимптотических свойств марковских процессов и при доказательстве общих теорем о гармонических функциях, таких, так теорема Фату (теорема о существовании радикальных граничных значений почти всюду)1). ► S ЭД. ЗАДАЧИ 1. Если функция и ограничена и непрерывна на 0, со, то при п—> со E(n-\~k\ tk ( k \ _Д k ) равномерно в каждом конечном интервале. Указание. Вспомните отрицательное биномиальное распределение (1, гл. VI, 8). Не нужно никаких вычислений. 2. Если и имеет непрерывную производную и', то производные В'п> и поли- номов Вп,и равномерно сходятся к и'. 3. Полиномы Бернштейна в ^2. Если и (х, у) непрерывна в треугольнике х^О, z/^О, то имеет место равномерная сходимость Ей ( ~ —xlyk (1—X—y)n~J~k—>и(х, у). \п nJ pkl (п —J~k)l у к Ь—I 4. Функцию и, непрерывную на 0, 1, можно равномерно аппроксимиро- х) Brelot М., Doob J. L„ Ann. Inst. Fourier, 13 (1963), 395-415. [Русский перевод см. сб. Математика, 11:3 (1967), 101—116.]
284 Гл. VII. Законы больших чисел. Применения в анализе вать полиномами четной степени. Если и (0) = 0, то же самое верно для поли- номов нечетной степени1). I--- 5. Если и непрерывна в интервале 0, оо и и (оо) существует, то и может быть равномерно аппроксимирована линейными комбинациями функций 6. Ниже указаны три последовательности моментов. Найдите вероят- ности р<ь \ входящие в (3.5). Используя предельное соотношение (3.11), най- мите соответствующее распределение вероятностей (a) 0 < р < 1, (Ь' (Хп=?+Т ’ 2 (С) п+2 ‘ 72). Пусть р — полином степени v. Покажите, что при п > v разность \пр тождественно равна нулю. Покажите, что Вп,р— полином степени не h более v (несмотря на то что в записи он выглядит как полином степени п > v). 8. Покажите, что если F имеет плотность, то соотношение (6.4) можно получить интегрированием соотношения (6.6) 9. Закон больших чисел для стационарных последовательностей. Пусть {X/J (6 = 0, ±1, ±2, ...) — стационарная последовательность. Определим Х& урезанием, таким же, как в (7.2). Если Е(Х^) = 0 и Е (ХоХА)—>0 при п —> оо, то P{n-i|X1+... + X„| > s} —> 0. 10. Пусть случайные величины Х& независимы, а случайные величины Х& заданы формулой (7.2). Предположим, что ап—>0 и Докажите, что п 2 5 Е(Хй )—>0. /г= 1 > &ап > —± 0. 11. (К теореме 1 § 7.) Покажите, что из о (/)—>0 следует x.(t)—> 0. Указание. Докажите, что т (%)—т(2х)/2 < 8 для достаточно больших х. При- менив это неравенство последовательно для значений x=t, 2t, kt, ..., полу- чите т (/) < 28. 12. (Прямое доказательство усиленного закона больших чисел.) Используя обозначения, принятые в доказательстве теоремы 1 в § 8, положим Zr = = шах | Sfe | при 2r < k 2r+1. С помощью неравенства Колмогорова пока- жите, что S Р (Zr > 829 < 00, откуда будет следовать усиленный закон больших чисел. (Это доказательство обходится без обращения к теоремам 2 и 3 § 8.) 13. (Теорема сходимости для субмартингалов.) Докажите, что теорема 2 § 8 применима к субмартингалам {Щ}, если > 0 для всех k. 14. Распространите вариант неравенства Чебышева из примера 7, а) гл. V на мартингалы3). х) По известной теореме Мюнца равномерная аппроксимация линейными комбинациями степеней 1, xnt, хпг, ... возможна в том и только том случае, когда ряд %п^ расходится. 2) Использование этого результата значительно упрощает классическое решение проблемы моментов (см. книгу Шохата и Тамаркина). 3) Marshall A. W., A one-sided analog of Kolmogorov’s inequality, Ann. Math. Statist., 31 (1960), 483—487. -
ГЛАВА VIII ОСНОВНЫЕ ПРЕДЕЛЬНЫЕ ТЕОРЕМЫ Основные результаты этой главы содержатся в § 1, 3 и 6. Параграфы 4, 5 и 7 можно рассматривать как источники инте- ресных примеров. Выбор примеров объясняется их важностью для тех или иных целей. Два последних параграфа посвящены правильно меняющимся функциям (в смысле Карамата). Эта интересная тема приобретает все большее значение. Однако она не освещена в учебниках и ее изложение не было приспособлено к случаю функций распреде- ления. Огромное количество разрозненных вычислений в теории вероятностей можно упразднить при использовании асимптоти- ческих соотношений § 9. Последние по сравнению с простым § 8- имеют более «технический» характер. § 1. СХОДИМОСТЬ МЕР Излагаемая ниже теория не зависит от размерности простран- ства. Формулировки в тексте для удобства даны для одномерного случая. Однако с учетом соглашений гл. III, 5, они без изменений переносятся на многомерный случай. Два из приводимых ниже примеров типичны для явлений, с которыми нам придется иметь дело. Примеры, а) Возьмем произвольное распределение вероятно- стей F и положим Fn(x) = F (х—п~1). В точках х, в которых F непрерывна, имеем Fn(x)—>F(x). В то же время в точках разрыва Fn(x)—>F(x—). Тем не менее мы будем говорить, что \Fn\ сходится к F. б) Положим на этот раз Fn (%) = F(x + ri), где F—непрерывная функция распределения. Теперь Fn (х) —> 1 при всех х; предел существует, но не является вероятностной функцией распределения. Здесь Fn{I}—>0 для любого ограниченного интервала /, но только не тогда, когда I совпадает со всей прямой. в) Пусть Fn(x) = F(x + (—1)"п). Тогда F2n(x)—>1, но ^2«+iW“*0« Таким образом, функции распределения Fn(x) не сходятся ни к какой функции, и тем не менее Fn{I}—>0 для каждого ограниченного интервала.
286 Гл. VIII. Основные предельные теоремы Основные понятия и обозначения Нам будет нужно выделить три класса непрерывных функций. В одномерном случае1) С(—оо, оо) обозначает класс все огра- ниченных непрерывных функций, С[—оо, оо] обозначает подкласс функций, имеющих конечные пределы и(—оо) и ц(оо), наконец, Со(—оо, оо) обозначает подкласс функций, «исчезающих на бес- конечности», т. е. функций с и (±2 оо) = 0. Мы скажем, что / есть интервал непрерывности для распре- деления вероятностей F, если I—открытый интервал, концы которого не являются атомами F2 3 * * * *). Вся прямая рассматривается как интервал непрерывности. В этом параграфе мы используем сокращенные обозначения Ел(ц)= и(х) Fn{dx}, Е(ц)= u(x)F{dx}. (1.1) - 00 - 00 Всюду в этом параграфе Fn обозначает собственное распреде- ление вероятностей, но распределению F будет позволено быть и несобственным (т. е. его полная масса может быть меньше 1; см. определение в гл. V, 1). ► Определение8). Последовательность \Fn} сходится к (возможно, несобственному) распределению F, если (1.2) для каждого ограниченного интервала непрерывности F. Это обозначается Fn —> F или F = lim Fn. Сходимость называется собственной, если F — собственное рас- пределение. Для ясности мы будем иногда говорить о несобственной схо- г) По поводу перехода к многомерному случаю заметим, что водномерном случае С [— оо, оо]—это класс непрерывных функций на прямой, «компакти- фицированной» добавлением точек ± оо. Для определения С[—оо, оо] в др «расширяются» обе координатные оси, так что требуется существование при каждом х пределов и (х, ± ос/ и и (i оо, х). Сам по себе этот класс не очень интересен, но в него входят функции распределения. В определении Со (— оо, оо) требуется, чтобы и (х, ± оо) = и (± оо, х) = 0. 2) В многомерном случае требуется, чтобы граница I имела вероят- ность нуль. 3) Для читателей, интересующихся общей теорией меры, мы сделаем следующее замечание. Определения и теоремы этого параграфа переносятся без изменений на ограниченные меры в произвольных локально компактных пространствах, если заменить «интервалы непрерывности» на «открытые множества с границей меры нуль». Ограниченным интервалам соответствуют подмножества компактных множеств. Наконец, Со — класс всех непрерывных функций, исчезающих на бесконечности, т. е. и £ Со тогда и только тогда, когда и непрерывна и |^| < & вне некоторого'компактного множества. Дру- гие классы не играют особой роли в этом параграфе,
§ 1. Сходимость мер 287 димости, желая подчеркнуть, что предельное распределение F несобственное. Для облегчения ссылок сформулируем два простых критерия собственной сходимости. Критерий 1. Сходимость Fn—>F является собственной тогда и только тогда, когда каждому е > О соответствуют такие числа а и N, что Fn — а, а} > 1 —е при п> N. Доказательство. Без ограничения общности можно предполо- жить, что интервал —а, а является интервалом непрерывности для предельного распределения F. Из условия теоремы вытекает, что —а, а\ > 1—8 и, следовательно, F не может быть несоб- ственным. Поэтому условие достаточно. Обратно, если F есть рас- пределение вероятностей, то можно выбрать а столь большим, что F\—а, а} > 1—8/2. Поэтому для достаточно больших п Fn\—а, а} > 1—8, и, следовательно, условие необходимо. ► Критерий 2. Последовательность {Fn\ распределений сходится к собственному вероятностному распределению F тогда и только тогда, когда (1.2) выполняется для каждого ограниченного или неограниченного интервала /, который является интервалом не- прерывности распределения F. (Отсюда вытекает, что в случае собственной сходимости Fn—+F имеет место сходимость Fn(x)—+F(x) в каждой точке непрерыв- ности функции F.) Доказательство. Можно предположить, что Fn сходится (к, возможно, несобственному) распределению F. Очевидно, что F является собственным тогда и только тогда, когда (1.2) выпол- няется для / =—00,00. Следовательно, условие критерия доста- точно. Предположим теперь, что F—собственное распределение вероятностей. При х>—а интервал —оо, х есть объединение ---------------------1 —। полуинтервалов —оо, а и а, х. Используя предыдущий критерий, можно поэтому заключить, что для достаточно больших а и п Fn\—°°, отличается от F{—оо, %} меньше чем на Зе. Анало- гичное рассуждениеЪрименимо и к интервалу х, оо, и можно сделать вывод, что (1.2) выполняется для всех полупрямых. ► Мы определяли сходимость посредством соотношения (1.2), но следующая теорема показывает, что мы могли бы использовать в качестве определяющего соотношение (1.3).
288 Гл. VI11. Основные предельные теоремы Теорема 1. (i) Для сходимости Fn—>F необходимо и доста- точно, чтобы1) Е„ (и) —> Е (и) для всех и£С0(—оо, оо). (1.3) (ii) Если сходимость собственная, то Е„ (и) —> Е (и) для всех ограниченных непрерывных функций. Доказательство, а) Нам удобно начать с утверждения относи- тельно собственной сходимости. Итак, предположим, что F есть распределение вероятностей и Fn—>F. Пусть этакая непрерывная функция, что |w(x)|<M для всех х. Пусть интервал непрерыв- ности А распределения F столь велик, что F(^)>1—8. Для дополнения Л' мы получаем в таком случае, что Fn{A'} <2е для всех достаточно больших п. Так как и равномерно непрерывна на конечных интервалах, то можно разбить А на интервалы /х, ..., 1п, предполагая их столь малыми, что колебание и на каждом из них меньше 8. Эти Ik можно выбрать так, что они будут интервалами непре- рывности для F. Внутри А мы можем аппроксимировать функцию и ступенчатой функцией о, которая принимает постоянное значение на каждом из интервалов Ik, и при этом | и (%)—а(х)|<8 для всех х^А. На дополнении А' полагаем ог(х) = 0. Тогда |и(х) — — ог(х)|<М ПРИ x(zA' и | е (w)—Е (or) К zF {Д} +MF {A'} +Me. (1.4) Аналогично при достаточно большом п | Еп (и)-Е„ (о) | <sFn{A} + MFn {Д'} < е + 2Ме. (1.5) Теперь Еп(ог)—это конечная линейная комбинация значений f „{/*}, стремящихся к F\Ik\. Следовательно, Еп(ог)—>Е(а) и по- этому при достаточно больших п | Е (ст)—Е„ (а) | < е. (1.6) Комбинируя три последних неравенства, получаем |Е(и)-Еп(и)|<|Е(ц)-Е(а)| + |Е(а)-ЕДа)| + + | Е„(а)-Еп (и) | < 3(М + 1)8, (1.7) а поскольку 8 произвольно, то отсюда вытекает, что Е„(ц)—>Е(ц). Это рассуждение не проходит в случае несобственной сходи- мости, потому что тогда значение Fn{A'} не обязано быть малым. Однако в этом случае мы рассмотрим только функции и £ Со(—оо, оо), а интервал А может быть выбран столь большим, что | и (х) | < е х) Если Е„ (и)—> Е (и) для всех и из некоторого класса функций, то •говорят, что Fn сходится к F «слабо по отношению к этому классу». Таким образом, сходимость в смысле определения 1 эквивалентна слабой сходимости Во отношению к Со(— оо, оо).
§ 1. Сходимость мер 289 при х£А'. Тогда |и(х)—сг (%) | < & при всех х, а в формулах (1.4), (1.5) выполняются строгие неравенства с в в их правой части. Таким образом, (1.2) влечет (1.3). б) Докажемх), что из сходимости Ед (и) —> Е (и) вытекает Fn—+F. Пусть I—интервал непрерывности F длины L. Обозна- чим через «концентрически расположенный относительно /» интервал длины TL-J-б, где б выбрано столь малым, что F{/6}< < F {/}+е. Пусть и—непрерывная функция, которая внутри I принимает постоянное значение 1, которая равна 0 вне Ц и та- кая, что всюду 0 < и (%)< 1. Тогда Еп (и) ^Fn\I} и Е (и)< F {/} -|-8. Но при достаточно большом п имеет место неравенство Е„ (u) < Е (и) + 8 и поэтому FJZ}<EJU)<E(M) + e<F{/6} + e<F{Z} + 28. Используя те же рассуждения для интервала длины L—б, мы получим противоположное неравенство Fn {/} > F {/}—2г. Отсюда Fn—>F, что и утверждалось. ► Желательно иметь критерий для сходимости, который не пред- полагал бы знания предельного распределения. Этот пробел уст- раняется следующей теоремой. Теорема 2. Для того чтобы последовательность (Fn} вероят- ностных распределений сходилась к (возможно, несобственному) предельному распределению, необходимо и достаточно, чтобы для любой функции и£С0(—оо, оо) последовательность математи- ческих ожиданий Ъп(и) сходилась к конечному пределу. Доказательство* 2). Необходимость покрывается теоремой 1. Для доказательства достаточности мы должны, забегая вперед, сослаться на теорему о выборе—теорему 1 из § 6. (Она элемен- тарна, однако лучше рассматривать ее вместе со всем кругом свя- занных с ней вопросов.) В соответствии с этой теоремой всегда можно найти подпосле- довательность {F }, которая сходится к (возможно, несобствен- ному) предельному распределению Ф. Обозначим через Е*(и) математическое ожидание и относительно Ф. Пусть и С Со (— оо, оо). Тогда по теореме 1 E^(u)—> Е*(и). Но с таким же успехом Е^ (w) ~(w)- Следовательно, E* (и) = lim E„ (и), где и—про- извольная функция из Со(—оо, оо). Еще одно применение тео- ремы 1 приводит к результату Fn—>Ф, который требовалось доказать. ► х) Было бы проще использовать доказательство теоремы 2, но приводимое здесь доказательство больше соответствует интуиции. 2) Теорема тривиальна, если принять во внимание теорему Рисса о пред- ставлении (см. замечание 1 в гл. V, 1). В самом деле, lim Ezz (и) определяет линейный функционал, а согласно этой теореме, предел есть математическое ожидание и относительно некоторого распределения F» 10 № 249
290 Гл. VIII. Основные предельные теоремы Примеры, г) Сходимость моментов. Если распределения Fn сосредоточены на 0, 1, то способ определения и вне этого интер- вала несуществен. Поэтому в формулировке теоремы достаточно ।-----------------------------------------------1 предполагать функцию и непрерывной на 0, 1. Каждая такая функция может быть равномерно аппроксимирована полиномами (см. гл. VII, 2). Поэтому теорема может быть сформулирована по-новому следующим образом. ।---1 Последовательность распределений Fn, сосредоточенных на 0, 1, сходится к пределу F тогда и только тогда, когда при каждом k последовательность моментов Е„ (Xй) сходится к некоторому чис- лу jifc. В этом случае p,fe = E(X*), т. е. будет k-м моментом распределения F, и сходимость будет собственной, так как = (См. VII, 3.) д) Сходимость моментов (продолжение). В общем случае мате- матические ожидания Fn не обязаны сходиться, даже если Fn-^F в собственном смысле. Например, если Fn приписывает массу ft“J точке ft2 и массу 1—ft-1 точке 0, то Fn сходится к распределе- нию, сосредоточенному в нуле, но Е„(Х)—>оо. Однако имеется следующий полезный критерий. Если Fn—и при некотором р > 0 математические ожидания Е„ (| X |р) ограничены, то F яв- ляется собственным. распределением вероятностей. В самом деле, часть Еп (| X | р), соответствующая области | х | а, больше ар (1—Fn {—а, а}). Последняя величина будет меньше М, если 1—F{—а, а} ^а~рМ. Так как а можно взять произвольно боль- шим, то F будет собственным распределением. Слегка усиливая проведенные рассуждения, можно показать, что абсолютные мо- менты Еп (| X |а) порядка а<р сходятся к Е (| X |а). е) Сходимость плотностей. Если распределения вероятностей Fn имеют плотности fn, то последние не обязаны сходиться, даже если Fn—^F и F имеет непрерывную плотность. Пусть, напри- мер, fn(x) = 1— cos2nftx при 0<х< 1 и fn(x) = 0 в других слу- чаях. Тогда распределения Fn сходятся к равномерному распре- делению с плотностью f(x) = l для 0<х< 1, но fn не сходятся к f. С другой стороны, если fn—+f к f—плотность вероятности, то Fn—^F, где F—собс1венное распределение с плотностью /. В самом деле, лемма Фату [(2.9) гл. IV] влечет за собой неравен- ство lim inf Fn {/} F {/} для каждого интервала непрерывности I. Если для некоторого I выполняется строгое неравенство, то оно выполняется для каждого более широкого интервала непрерывно- сти, в частности для —оо, оо. Так как это невозможно, то (1,2) выполняется. ► Пусть мы имеем дело с функциями ut, зависящими от неко- торого параметра t [такими, как sin tx или с»(/-|-х)]. Тогда часто бывает полезно знать, что при достаточно больших п соотноше-
§ 2. Специальные свойства 291 ние |E„(ut)—E(wf)|<e выполняется одновременно для всех t. Мы докажем, что это свойство выполняется, если семейство функ- ций ut равностепенно непрерывно, т. е. если каждому е > 0 соот- ветствует 6, не зависящее от t и такое, что |м<(х2)—Wf(*i)|<e при |х2—X, | < 6. Следствие. Предположим, что Fn-^F в собственном смысле. Пусть {ut}—семейство равностепенно непрерывных функций^ завися- щих от параметра t. Пусть при всех t | ut | < М < оо, где М—не- которая постоянная. Тогда Е„ (ut) —► Е (н;) равномерно по t. Доказательство. В теореме 2 при доказательстве того, что Е„ («) —► Е (ц), было использовано разбиение интервала А на интер- валы, на каждом из которых колебание и меньше е. В настоящих условиях это разбиение может быть выбрано одним и тем же для всех t, после чего утверждение становится очевидным. ► Пример, ж) Пусть щ (х) = и (tx), где и дифференцируема и | и' (х) | 1. По теореме о среднем I (*2) — «/(А) К РI • I *2— так что при t, лежащем в конечном интервале —а, а, рассматри- ваемое семейство равностепенно непрерывно. Следовательно, Е„ (м<) ~* Е («/) равномерно в каждом конечном интервале изме- нения t. ► § 2. СПЕЦИАЛЬНЫЕ СВОЙСТВА В соответствии с определением 1 из гл. V, 2—два распреде- ления U и V принадлежат одному и тому же типу, если одно от другого отличается только параметрами расположения и мас- штаба, т. е. если V (x) = U (Ах + В), Л>0. (2.1) Мы покажем теперь, что сходимость распределений сохраняет типы в том смысле, что изменения параметров расположения допредельных распределений не меняют типа предельного распре- деления. Именно этот факт дает возможность говорить об «асимпто- тических нормальных последовательностях» без точного указания соответствующих параметров. Более точно, имеет место Лемма 1. Пусть U и V—два распределения, ни одно из кото- рых не сосредоточено в единственной точке. Пусть последователь- ность {77га} вероятностных распределений такова, что при некото- рых постоянных ап>0 и ап > О Fn(anx + bn)-+U (х), F„ (а„х + 0„) -> V (х) (2.2) во всех точках непрерывности. Тогда -2«—>Л>0, Ьп—+В (2.3) ап а„ 10»
292 Гл. VIII. Основные предельные теоремы и выполняется (2.1). Обратно, если верно (2.3), то каждое из соотношений (2.2) влечет за собой другое и соотношение (2.1). Доказательство. Основываясь на соображениях симметрии, предположим, что выполняется, например, первое из соотноше- ний (2.2). Положим для упрощения обозначений Gn (x) = Fn (anx+bn), рп = ап/ап и оп = фп—Ьп)/ап. Итак, пусть Gn-+U. Если Рп —А вп—+В, (2.4) то очевидно, что Gn(pnx + on)-.V(x), " (2.5) где V (x) — U (Ах + В). Мы должны доказать, что без предположе- ния (2.4) соотношение (2.5) может быть неверным. Поскольку V не сосредоточено в единственной точке, сущест- вуют по меньшей мере два значения х' и х", такие, что последо- вательности {PzX + tfJ и + остаются ограниченными. Отсюда вытекает ограниченность последовательностей {рп} и {<ти}, и, следовательно, можно найти последовательность целых чисел пк, такую, что рп/, —>Л и (rn/,Но тогда V (x) = U (Ах А-В) и, сле- довательно, А > 0, иначе V не будет вероятностным распределе- нием. Отсюда вытекает, что пределы А и В одни и те же для всех подпоследовательностей и поэтому (2.4) справедливо. ► Пример. Лемма не применима, если V сосредоточено в одной точке. Так, например, если ри—> оо и $п = (—1)", то условие (2.4) не выполняется, однако соотношение (2.5) справедливо для рас- пределения V, сосредоточенного в нуле. ► Два типа последовательностей {Fn} распределений вероятно- стей встречаются так часто, что заслуживают специального назва- ния. Для большей ясности обозначений мы дадим формальные определения в терминах случайных величин Х„. Однако, по суще- ству, эти понятия связаны только с соответствующими распреде- лениями Fn. Стало быть, определения имеют смысл без всякого упоминания а каком бы то ни было вероятностном пространстве. Определение 1. Хп сходится по вероятности к нулю, если Р(|Х„|>е}—>0 (2.6) р при любом 8>0. Будем обозначать это символом Хп —> 0. р р По определению Хп —> X означает то же самое, что х„-х-+о. Заметим, что (2.6) выполняется тогда и только тогда, когда распределения Fn сходятся к распределению, сосредоточенному в нуле. В общем случае, однако, сходимость Fn —> F не позволяет сделать никаких заключений относительно сходимости последова- тельности Хп Х2, ... . Например, если величины Ху взаимно независимы и имеют одно и то же распределение F, то Fn^Ft но последовательность {Хл} не сходится по вероятности.
§ 3, Распределения как, операторы 293 Приводимая ниже простая лемма часто используется, хотя это и не всегда отмечается явно. (Так, метод «урезания» из 1; гл. X, неявно опирается на эту лемму.) Лемма 2. Обозначим распределения Х„ и Yw через Fn и Gn р соответственно. Допустим, что Хп—Nn—и что Gn—^G. Тогда uFn—>G. р В частности, если Х„—>Х, то7\—где/7 — распределениеX. Доказательство. Если Хп^.х, то или Yn^%4-s, или Х„— Y/z<—8. Вероятность последнего события стремится к нулю. Следовательно, при всех достаточно больших п Fn(x)^Gn (х-]-8)4-8. Точно так же устанавливается аналогичная оценка для Fn снизу. ► Определение 2. Последовательность {Хп} называется стохасти- чески ограниченной^ если для каждого 8 > О найдется такое а, что Р{|Х„|>а}<е (2.7) для всех достаточно больших п. Это определение применимо и к случайным векторам Хп, и к соответствующим им многомерным распределениям. Последовательность, сходящаяся в собственном смысле, оче- видно, будет стохастически ограниченной. В то же время несобст- венная сходимость исключает стохастическую ограниченность. Мы получаем, следовательно, простой, но полезный критерий', если распределения Fn сходятся, то предел F будет собственным распределением тогда и только тогда, когда последовательность {FJ стохастически ограничена. Вместе с {Х„} и {Y„} стохастически ограничена и последова- тельность {Х„ + Yn}. В самом деле, событие | Хп + Nп | > 2а влечет событие: или | Хп | > а, или | Yn | > а. Поэтому P{|Xn + Y„|>2a}<P{|X„|>a} + P(|Y„|>a}. (2.8) § 3. РАСПРЕДЕЛЕНИЯ КАК ОПЕРАТОРЫ Свертка U = F^u функции точки и и распределения F была определена в гл. V, 4. Вводя семейство функций ut формулой ut(x) = u(t—х), мы можем выразить значение U (t) как математи- ческое ожидание: + 00 U (0= $ u(t—y)F{dy} = E(ut). — СО (3.1) Мы используем эту запись для того, чтобы вывести критерий собственной сходимости. В этом критерии рассматривается класс С[—оо, оо] непрерывных функций, имеющих пределы и(±оо). Эти функции равномерно непрерывны.
294 Гл. VIII. Основные предельные теоремы Теорема 1. Последовательность распределений вероятностей Fп сходится к распределению F в собственном смысле тогда и только тогда, когда для каждой функции и £ С [— оо, оо] свертки Un=Fn^u равномерно сходятся к некоторому пределу U. В случае сходимо- сти U = F ★ и. Доказательство. Условие необходимо, так как равномерная непрерывность и влечет равностепенную непрерывность семейст- ва \ut} и по следствию из § 1 Un равномерно сходится к F^u. Обратно, условие теоремы влечет за собой сходимость математи- ческих ожиданий Ед(и). Мы видели в § 1, что отсюда вытекает сходимость Fn —> F, нужно только доказать, что распределение F собственное. Используем для этой цели критерий 1 из § 1. Если и монотонно возрастает от 0 до 1, то же самое можно сказать и о каждой из Uп. В силу равномерной сходимости сущест- вует такое /V, что | Un (х)— UN (х) | < & при п > N и всех х. Выбе- рем а столь большим, что UN(—я) < 8. Функция UN опреде- ляется формулой свертки (3.1); заменяя область интегрирования в (3.1) на —оо < z/^—2а, мы видим, что при n> N 2е > Un (— а) ^и. (a) Fn (—2а). Так как и(х) с ростом х стремится к единице, то при достаточно больших п и a Fn (—а) может стать сколь угодно малым. По сооб- ражениям симметрии то же самое рассуждение применимо к 1—F (а). Следовательно, распределение F является собственным в силу критерия 1. Для демонстрации силы нашего последнего результата мы выве- дем одну важную теорему анализа, доказательство которой стано- вится особенно простым при данном вероятностном подходе. (Типичное применение см. в задаче 10.) Пример, а) Общие теоремы об аппроксимации. Свяжем с про- извольным распределением вероятностей G семейство распределе- ний Gh, отличающихся от G только масштабным параметром: СЛ(х) = 0(/схх). При h—>0 распределение Gh стремится к рас- пределению, сосредоточенному в нуле, и потому по предыдущей теореме для каждой функции и£С[— оо, оо] имеет место равно- мерная сходимость Gh^ и—> и1}. *) Для непосредственной проверки заметим, что + 00 Gft*«(0-«(0= J [U(t-y)-u (01 G{dt/lh}. — сю По данному 8 > 0 выберем 6 так, чтобы колебания и на каждом интервале длины 26 были меньше 8. Часть интеграла, взятая по множеству | у | с 6, меньше 8, а часть интеграла по множеству | у | 6 стремится к 0, так как распределение Gh приписывает множеству [ у | 6 массу, которая стремится к нулю при h —> 0. - -' '’ - " - - -
§ 3. Распределения как операторы 295 Если G имеет плотность g, то свертка Gh^ и задается фор- мулой + 00 G* ★«(() = j (3-2) — 00 Если g имеет ограниченную производную, то этим же свойством обладает и Gh и можно дифференцировать (3.2) под знаком интег- рала. Беря в качестве g нормальную плотность, мы получим сле- дующую лемму об аппроксимации. ► Лемма об аппроксимации. Для каждой функции и £ С [— оо, оо] найдется бесконечно дифференцируемая функция v С С [—оо, оо], такая, что |и(х) — у(х)|<е для всех х. ► В настоящем контексте желательно заменить символ свертки более простым обозначением, которое подчеркивало бы, чтоб (3.1) распределение F играет роль оператора, переводящего и в U. Этот оператор мы будем обозначать готической буквой Мы усло- вимся, что равенство U = $и имеет тот же смысл, что и U=F * и. Истинное преимущество этого кажущегося педантичным подхода станет видимым только тогда, когда в том же контексте будут рассматриваться другие типы операторов. Тогда будет удобно видеть сразу, играет ли то или иное распределение свою перво- начальную вероятностную роль или же оно служит только ана- литическим оператором. После этого объяснения мы вводим Соглашение об обозначениях. С каждым распределением F мы связываем оператор отображающий С[—оо, оо] на себя. Этот оператор ставит в соответствие функции и ее преобразование $и = F и. Всюду, где это возможно, распределения и связанные с ними операторы будут обозначаться соответствующими латин- скими и готическими буквами. Как обычно, обозначает результат применения $ к ®и, так что обозначает оператор, соответствующий свертке F G двух распределений вероятностей. В частности, %п обозначает оператор* связанный с Fn*, т. е. с n-кратной сверткой F с собой. Пример, б) Пусть На—атомическое распределение, сосредото- ченное в точке а. Тогда обозначает оператор сдвига &аи(х) = = и(х—а). В частности, —тождественный оператор: Sqqu = u. Определим далее норму || и || ограниченной функции и равенством |«11 = sup | и(х) |. (3.3) При этом обозначении утверждение «и„ равномерно сходится к и» превращается в простое соотношение || ип—«||—>-0. Заметим, что норма удовлетворяет легко проверяемому неравенству треуголь- ника: II и + VII < II и II + IIV ||. Оператор Т называют ограниченным, если существует такая
296 Гл. УШ. Основные предельные теоремы постоянная а, что || 77/[| Наименьшее число с этим свойст- вом называют нормой Т и обозначают ||Т||. В этих обозначениях основные свойства линейных операторов, связанных с функциями распределения, формулируются следующим образом. Они положительны, т. е. из и^О вытекает %и ^0. Они имеют норму 1, откуда следует 1Ж14 (3-4) Наконец, они перестановочны, т. е. = Определение1). Пусть и $—операторы, связанные с рас- пределениями вероятностей Fn и F. Мы пишем в том и только том случае, когда —О (3.5) для каждого и£С[—оо, оо]. Иными словами, $п—>$, если Fn-^u—+ F "к « равномерно. Теорему 1 можно теперь сформулировать иначе. Теорема la. Fn—+F в собственном смысле тогда и только тогда, когда Нижеследующая лемма является основной. Она содержит не- которое неравенство и показывает целесообразность новой тер- минологии. Лемма 1. Для операторов, связанных с распределениями вероят- ностей, имеем (з.б) Доказательство. Оператор в левой части равен —®i)$2+ + ($2—®2)®i- Поэтому (3.6) вытекает из неравенства треуголь- ника и того факта, что и имеют нормы не больше 1. Отме- тим, что доказательство применимо и к несобственным распреде- лениям вероятностей. ► Из (3.6) непосредственно следует Теорема 2. Пусть последовательности и {Gn} распределе- ний вероятностей сходятся в собственном смысле к F и G соот- ветственно. Тогда Fn*Gn-+F*G. (3.7) (Сходимость является собственной в силу определения свертки F ★ G. Теорема неверна в случае несобственной сходимости. См. задачу 9.) х) В терминологии банаховых пространств (3.5) называется сильной схо- димостью. Заметим, что отсюда не вытекает сходимость в смысле || %п—|| —> 0. Например, если Fn сосредоточено в точке 1/п и § — тождественный оператор, то %пи (х) — $и (х) — и (х —п~х) — и (х) и (3.5) верно. Однако ||gn—g‘|] = 2, так как существует функция v с | v | 1м такаЯд что v (0) = 1 и v (— п-1) = — 1.
§ 4. Центральная предельная теорема 297 В качестве второго применения докажем, что теорема 1 остается справедливой, если сузить рассматриваемый класс функ- ций и до класса особенно «хороших» функций, имеющих произ- водные всех порядков. На этом пути мы получим более гибкий Критерий 1. Пусть Fn—распределение вероятностей. Если для каждой бесконечно дифференцируемой*} функции —оо, оо] последовательность {$„£>} равномерно сходится, то существует такое собственное распределение вероятностей F, что Fn— Доказательство. Как было показано в примере а), для любой и£С[—оо, оо] и любого е>0 найдется бесконечно дифференци- руемая функция v, такая, что \\и—у|| < 8. По неравенству тре- угольника II %пи—%ти || II %пи—%nv II + II %nv—%mv II + II %mu ||. (3.8) Первый и последний члены в правой части меньше 8, а средний член меньше 8 при всех достаточно больших п и т. Таким обра- зом, последовательность сходится равномерно и по теоре- ме 1 Fn—+F. ► Точно такие же рассуждения с участием Е„ и Е, опреде- ленных в (1.1), дает Критерий 2. Пусть Fn и F—собственные распределения вероят- ностей. Если для всех бесконечно дифференцируемых и обращаю- щихся в нуль на бесконечности функций v Е„ (у) > Е (у), то Fn —> F. Основное неравенство (3.6) по индукции распространяется на свертки более чем двух распределений. Для облегчения ссылок мы выделим этот очевидный результат в виде леммы. Лемма 2. Пусть 51 == ^ ... и 53 = ... где и — операторы, соответствующие распределениям вероятностей. Тогда ||5U— 53и||< (3.9) / = 1 В частности, ||$"ц—||^—(3.10) (Применения см. в задачах 14 и 15.) § 4. ЦЕНТРАЛЬНАЯ ПРЕДЕЛЬНАЯ ТЕОРЕМА Центральная предельная теорема устанавливает условия, при которых суммы независимых случайных величин распределены асимптотически нормально. Ее роль и значение частично объясня- лись в 1; гл. X, 1. В нескольких случаях мы применяли ее [последний раз в примере 11, ж) гл. VI]. Она занимает почетное х) Под этим подразумевается, что все производные v существуют и при- надлежат С [— оо, оо].
298 Гл. VIII. Основные предельные теоремы место в теории вероятностей благодаря своему «возрасту» и той роли, которую она играла в развитии теории вероятностей и все еще играет в применениях. Естественно поэтому использовать централь- ную предельную теорему для опробования различных методов, имею- щихся в нашем распоряжении. По этой причине мы дадим несколько доказательств. Более систематическое изучение (включая необхо- димые и достаточные условия) будет проведено в гл. IX, XV и XVI. Теперешнее обсуждение отвлекает нас от развития основ- ной темы. Его цель—показать преимущества операторной терми- нологии на ярком и значительном примере. Кроме того, многим читателям понравится легкий путь к доказательству центральной предельной теоремы в простейшей ситуации. Мы начнем с част- ного случая, хотя это и приведет к некоторым повторениям. Теорема 1. (Одинаковые распределения в 3L1.) Пусть Хь Х2,...— взаимно независимые случайные величины с одним и тем же рас- пределением F. Допустим, что E(Xft) = 0, Var(Xft) = l. (4.1) При п—> оо распределение нормированных сумм s:=-1+p;_+Xn (4.2) стремится к нормальному распределению 97 с плотностью п(х)= = (1/К2^)е-^2. В чисто аналитических терминах это означает, что для рас- пределения F с нулевым математическим ожиданием и единичной дисперсией г* *(*/«)—ад. (4.3) Для доказательства теоремы нам потребуется следующая Лемма. Если —оператор, соответствующий Fn (х)=Е (хКп), то для каждой функции и£С[—оо, оо], имеющей три ограни- ченные производные, п[&пи—и]—» у и" (4.4) равномерно на всей прямой. Доказательство. Поскольку Е(Х2) = 1, можно определить соб- ственное распределение F* равенством Fn {dy} = ny2F„ {dy} = ny2F {{/"ii dy}. (4.5) Замена переменных Vny = s показывает, что F* сходится к рас- пределению, сосредоточенному в нуле. Ввиду (4.1) мы можем
§ 4. Центральная предельная теорема 299 представить разность левой и правой частей (4.4) в виде п [%пи w—«оо]—4и" (*)= = у и„ (х)] {dy} (4 6) — оо Из формулы Тейлора, примененной к числителю дроби под ин- тегралом, видно, что при | у | < в подынтегральное выражение не превосходит |r/|-||u'" || < в|| иш1], а при всех у не превосходит \\и"\\. Так как F* сходится к распределению, сосредоточенному в нуле, то при всех достаточно больших п абсолютная величина интеграла не превосходит е(||и"|Ц-||и,"||). Таким образом, левая часть (4.7) равномерно стремится к нулю. > Доказательство теоремы 1. Пусть ® и — операторы, свя- занные соответственно с нормальными распределениями 91 и Тогда по основному неравенству (3.10) II %ппи-®и II = В II с «II Л II < <п||^„и—ы|| + /г||®„и—ы||. (4.7) По предыдущей лемме правая часть стремится к нулю, и, следо- вательно, по критерию 1 §3 >®. Пример, а) Центральная предельная теорема для случая бес* конечной дисперсии. С методологической точки зрения интересно отметить, что доказательство теоремы 1 применимо без изменений к некоторым распределениям с бесконечной дисперсией (в пред- положении, что нормирующие константы выбраны надлежащим образом). Например, если случайные величины Xft имеют плот- ность /(х), такую, что /(х) = 2| x|“3log|xj при |х|^= 1 и /(х)=0 при | х К 1, то суммы (Xf + ... + XJ/(Kп log п) имеют в пределе нормальное распределение (доказательство требует лишь очевид- ных видоизменений). Необходимые и достаточные условия сходи- мости к нормальному распределению указаны в гл. IX, 7, и XVII, 5. > Приведенный выше метод доказательства получил широкое распространение. Хорошее упражнение предлагается в задаче 16. Здесь мы используем этот метод доказательства центральной пре- дельной теоремы в более общем случае. Сформулированная ниже теорема касается двумерного случая, но ее можно распростра- нить и на 31Т. Теорема 2. (Многомерный случай.) Пусть {Хп}—последова- тельность взаимно независимых двумерных случайных величин с одним и тем же распределением F. Допустим, что математи-
goo Гл. УШ. Основные предельные теоремы ческие ожидания равны нулю и что матрица ковариаций равна С = ( (4-8) \paxa2 aj J При n —> оо распределение (Хх + ... -ф Х„)/Кя сходится к двумер- ному нормальному распределению с нулевым математическим ожи- данием и матрицей ковариаций С. Доказательство. Если использовать матричные обозначения гл. III, 5, то почти без изменений применимо предыдущее дока- зательство. Так как нижние индексы уже заняты, то мы будем обозначать точки плоскости с помощью векторов-строк х=(х(1), х(2)). В этих обозначениях и(х)—функция двух переменных. Ее част- ные производные будут помечаться нижними индексами. Так, и' = (и1У и2)—вектор-строка и и" = (и/к)—симметричная (2х2)-мат- рица. Формула Тейлора принимает вид и(х—у) = и (х)—уи' (х)+^уи" (х)ут+ ..., (4.9) где ут получается транспонированием у, т. е. ут—вектор-столбец с компонентами yw и г/(2). Определим по аналогии с (4.5) соб- ственное распределение вероятностей формулой F* {dy} = nq(y) F{]Mndy}, где 2q (у) = -^ + -^-. Oj 02 Так же как и в предыдущем доказательстве, F* сходится к рас- пределению, сосредоточенному в начале координат. Соотноше- ние (4.6) заменяется на п [%„и (х) — и (х)]—у m (х) = С и(х—у)—и(х)+уи'(х) — уи"(х) ут # - J-------------^)--------------F* {dy}, (4.10) Si2 гдех) m (х) = Е (уи" (х) ут) = ип (х) о2 + 2ui2 (х) ро^ + и22 (х) а|. . (4.11) (Здесь Е обозначает математическое ожидание по отношению к F). В силу (4.9) подынтегральное выражение стремится к нулю, и, так же как и в предыдущей лемме, мы заключаем, что п [%пи—и]—> —>т/2 равномерно. Доказательство теоремы не требует измене- ний. Примеры, б) Случайное блуждание в d-мерном пространстве. Пусть Хх, Х2, ...—независимые случайные векторы с одним и тем же распределением, которое может быть описано следующим г) Очевидно, что т(х) — след матрицы Си" т. е, сумма ее диагональных элементов), В одномерном случае т (х) = о2и" (х),
§ 4. Центральная предельная теорема 301 образом. Вектор Xk имеет случайное направление (см. I, 10), и длина L—случайная величина с E(L* 2) = 1. По причинам симмет- рии матрица ковариаций С диагональна, с диагональными элемен- тами o2 = l/d. Распределение нормированной суммы SnlV п схо- дится к нормальному распределению с матрицей ковариаций С. Распределение длины вектора Sn/Kп сходится поэтому к распре- делению квадратного корня из суммы квадратов независимых нор- мальных величин. Как было сказано в гл. 11,3, последнее распре- деление имеет плотность — а 1 j 2 ___ dr2 wd(r) = —------------е 2 rd~1. (4.12) 22 rbd) Этот результат показывает влияние числа измерений; он приме- ним, в частности, к примеру 10, д) гл. I. в) Случайное рассеивание популяций. В качестве практического применения предыдущего примера рассмотрим распространение популяции дубов в доисторическое время. Если бы новые расте- ния возникали только из семян, упавших с материнского дерева, то сеянцы были бы расположены около него. Тогда расстояние дерева n-го поколения от исходного было бы распределено при- близительно нормально. При этих условиях площадь, покрытая потомками некоторого дерева, была бы, грубо говоря, пропор- циональна возрасту дерева. Наблюдения показывают, что дейст- вительное положение вещей несовместимо с этой гипотезой. Био- логи приходят к выводу, что наблюдаемое рассеивание в боль- шой степени определяется птицами, переносящими семена на большие расстояния1). >> Обобщим теперь теорему 1 на случай по-разному распределен- ных величин. Может возникнуть впечатление, что условия вве- дены искусственно с единственной целью сохранить путь доказа- тельства. В действительности оказывается, что эти условия необ- ходимы и для центральной предельной теоремы с классической нормировкой, использованной в (4.17) (см. гл. XV,6). Теорема 3. (Линдеберг.)2) Пусть Xf, Х2, ...—взаимно неза* х) Skellam J. G., Biometrika, 38 (1951), 196—218. 2) Lindeberg J. W., Math. Zeit., 15 (1922), 211—235. Частные случаи были известны ранее, но Линдеберг дал первую общую формулировку, содер- жащую теорему 1. Необходимость условия Линдеберга при классической нор- мировке была доказана Феллером (там же, 40 (1935), см. гл. XV, 6). Метод Линдеберга казался сложным и был практически заменен методом характеристических функций, развитыми. Леви. Троттер (Archiv der Math., 9 (1959), 226—234) показал, что современные методы позволяют изложить доказательство Линдеберга простым и интуитивно понятным способом, В до- казательствах этого параграфа использованы идеи Троттера*
302 Гл. VIII. Основные предельные теоремы висимые одномерные случайные величины с распределениями Fif F2, ... . Пусть E(Xft) = 0, Var(Xft)=afe (4.13) (4-14) Предположим, что при каждом />0 f (4.15) п *=1 I у| >{sn или, что то же самое, J y*Fk{dy}-*l. (4.16) " k= 1 I у I < tsn Тогда распределение нормированной суммы S* = xi+-" + Xn (4.17) сходится к нормальному распределению 91 с нулевым математи- ческим ожиданием и единичной дисперсией. Условие Линдеберга (4.15) гарантирует, что дисперсии от- дельных слагаемых малы по сравнению с суммой s„ в том смысле, что при любом е > 0 и всех достаточно больших п k=l.......п. (4.18) sn В самом деле, очевидно, что <зЦв2п меньше, чем t2 плюс левая часть (4.15). Положив / = е/2, видим, что (4.15) влечет за собой (4.18). Теорема 3 обобщается на многомерный случай способом, ука- занным в теореме 2. См. также задачи 17—20. Доказательство. Поставим в соответствие каждому распреде- лению Fk нормальное распределение Gk с нулевым математическим ожиданием и той же самой дисперсией о|. Распределение Fk (xsn) случайной величины Xk/sn зависит и от k, и от п. Соответствую- щий оператор обозначим через Аналогично оператор соответствует нормальному распределению В силу (3.9) нам достаточно доказать, что п 2 (419) /?= 1 для каждой функции и£С[—оо, оо] с тремя ограниченными про- изводными. Мы поступим так же, как при доказательстве теоремы 1.
§ 4. Центральная предельная теорема 303 Однако теперь (4.6) заменится п соотношениями 2 +С° пи (х)-и (х) -4 и"/и _ С Г+ 2s« У2 -±u"(x)]y*Fk{Sndy}. (4.20) Разбивая область интегрирования на части | у | е и | у | > 8 и используя те же самые оценки, что и в (4.6), получаем 2 «—Ли' ^5/2 2 фч?и4+И11- j y2Fk{sndy}. I «/I > 8 (4.21) Условие Линдеберга (4.15) с / = 8 гарантирует теперь, что при всех достаточно больших п ZL пи—и и" k=l zsn (4.22) Для нормальных распределений Gk условие Линдеберга (4.15) является простым следствием (4.18). Поэтому неравенство (4.22) остается верным, если в нем %ку п заменить на п. Соеди- няя оба этих неравенства, получаем (4.19). Доказательство закон- чено. >> Примеры, г) Равномерные распределения. Пусть Хй распределено равномерно, с плотностью 1/(2^), в промежутке между —ак и ак. 4Q№Gl = al/3. Легко видеть, что условия теоремы выполнены, если числа ак ограничены, а • • • + #*—> оо. В самом деле, в этом случае сумма (4.15) равна нулю при всех достаточно больших п. С другой стороны, если 2<4< °°, то sn остаются ограниченными и (4.15) не может выполняться. В этом случае центральная пре- дельная теорема не применима (вместо этого мы приходим к бес- конечным сверткам, которые будут изучены в § 5). Менее очевидный случай, где центральная предельная теорема не применима,— это случай а$ = 2*. Тогда 3$£ = 2п+1—2 < 2а% и, очевидно, левая часть (4.15) больше % для t < 1/100. Эти при- меры показывают, что назначение условия (4.15) — обеспечить асимптотическую пренебрегаемость отдельных Хк: вероятность того, что какое-нибудь из слагаемых Хй будет того же порядка, что и сумма Sn, должна стремиться к нулю. д) Ограниченные величины. Допустим, что.Х^ равномерно огра- ничены, т. е. все распределения Ек сосредоточены на неко- тором конечном интервале —а, а. Условие Линдеберга (4.15) выполняется тогда и только тогда, когда sn —>оо. > е) Пусть F—распределение вероятностей с нулевым матема- тическим ожиданием и единичной дисперсией. Выберем последо-
304 Гл. VIII. Основные предельные теоремы вательность положительных чисел ok и положим Fn (х) = F (х/вп) (так что дисперсия Fk равна о|). Условие Линдеберга удовлетво- ряется тогда и только тогда, когда sn—+oou enlsn—+0, В самом деле, мы знаем, что эти условия являются необходимыми. С дру- гой стороны, левая часть (4.15) сводится к выражению п s«2Xai $ x2F{dx}. k=l \x\<tsn/6k При сформулированных условиях sn/vk стремится к бесконечности равномерно по 6=1, ..., п. Поэтому при достаточно большом п все интегралы, входящие в сумму, будут меньше &. Таким обра- зом, сумма будет меньше es^, и поэтому соотношение (4.15) будет справедливо. Методологически интересно заметить, что изложенный метод доказательства применим и к некоторым последовательностям случайных величин, не имеющих математических ожиданий. Конечно, нормирующие константы должны быть другими. Мы вер- немся к этим вопросам в гл. XV,6, где мы также подвергнем дальнейшему изучению природу условия Линдеберга. (См. зада- чи 19, 20.) Мы закончим настоящий экскурс вариантом центральной пре- дельной теоремы для случайных сумм. Идея состоит в следую- щем. Если в теореме 1 заменить фиксированное число п слагае- мых пуассоновской случайной величиной N с математическим ожиданием п, то кажется правдоподобным, что распределение SN будет асимптотически нормально. Сходные ситуации возникают в статистике и физике, когда число наблюдений не фиксируется заранее. Мы рассмотрим только суммы вида Sn = Хг +••• 4"где Ху и N—взаимно независимые случайные величины. Мы предпо- ложим, что Ху имеют одно и то же распределение F с нулевым математическим ожиданием и дисперсией 1. Используя обозначе- ние § 2, мы покажем, что верна Теорема 41). (Случайные суммы.) Пусть Nf, N2,...— положи- тельные целочисленные случайные величины, такие, что ^-Л1. (4.23) Тогда распределение Sn„/Kп сходится к 91. х) Обобщение на зависимые Ху см. у Биллингсли: Billingsley Р., Limit theorems for randomly selected partial sums, Ann. Math. Statist., 33 (1963), 85—92. Если отбросить (4.23), то получаются предельные теоремы новой формы, см.: Robbins Н. Е., The asymptotic distribution of the sum of a random number of random variables, Bull. Amer. Math. Soc., 54 (1948), 1151—1161 Обобщения центральной предельной теоремы на другие типы зависимых величин читатель может найти в книге М. Лоэва (о симметрично зависимых величинах см, задачу 21),
§ 5. Бесконечные свертки 305 Интересно отметить, что величина не обязана иметь единичную дисперсию. Действительно, теорема применима к случаям, где E(Nn) = oo, и, даже если математическое ожидание существует, из (4.23) не следует схо- димость — Е (N„) —> 1. Нормировка, приводящая к единичной дисперсии, мо- жет быть невозможна, а если она и возможна, то усложняет доказательство. Доказательство. Чтобы избежать двойных индексов, положим P{Nn = £} = afe, подразумевая, что ak зависит от п. Оператор, связанный с SNn, задается формальным степенным рядом Пусть как и в доказательстве теоремы 1,— оператор, соот- ветствующий F(xjZn). Так как то достаточно дока- зать, что 2 a$knii—>-0 k=\ (4.24) равномерно для каждой функции —оо, оо] с тремя огра- ниченными производными. Используя очевидное разложение на множители и основное неравенство (3.9), видим, что <II IIС \k—n I -II%пи-и ||. (4.25) В силу (4.23) сумма коэффициентов ак с \k—п|>ега меньше е при всех достаточно больших п. Для этих п норма левой части (4.24) не превосходит S ак || ||< 2е • || и || + 2е • п || %nii—и ||. k= 1 (4.26) Из доказательства леммы видно, что правая часть не превосхо- дит 2е || и || + Зе || и" |] при всех достаточно больших п, так что (4.24) выполняется в смысле равномерной сходимости. > §5*) БЕСКОНЕЧНЫЕ СВЕРТКИ Нижеследующие теоремы даны как по причине их внутреннего интереса, так и потому, что они хорошо иллюстрируют примене- ние наших критериев. Более сильные варианты можно найти в гл. VII, 8, XI, 9, и XVII, 10. Мы обозначаем через Хх, Х2, ... взаимно независимые слу- чайные величины с распределениями Fb F2, .... Предполагается, что Е (Ху) = 0 и что == Е (Х|) существует. Теорема. Если о2 = 2°'1<00, то распределения1) Gn частных сумм Хх + ... + ХЛ сходятся к распределению вероятностей G с нулевым математическим ожиданием и дисперсией о2. *) Этот параграф не используется в дальнейшем. т) В гл. VII, 8, было показано, что и сами случайные величины Sn схо- дятся к пределу,
306 Гл. VIII. Основные предельные теоремы Доказательство. Чтобы установить существование собственного предела G, достаточно (по теореме 1 § 3) показать, что для лю- бой бесконечно дифференцируемой функции и£С[—оо, оо] после- довательность функций . %пи сходится равномерно при п —>оо. Теперь при п > т очевидное разложение на множители дает II&... %пи—& ... %ти IK II %т+1... ы||- (5.1) Так как Е(ХА,) = 0, то верно тождество + 00 %ku(x) — u(x) = ^[u(x—y)—u(x) + yu'(x)]Fk{dy}. (5.2) - со Из формулы Тейлора видим, что подынтегральное выражение не превосходит \\и" ||у2. Поэтому —и || аЦ| и" ||. По основному неравенству (3.9) величина (5.1) не превосходит (аД^+ • • • + <72)х Х||и"||. Следовательно, существует собственное распределение G, такое, что Gn —> G. Так как Gn имеет дисперсию ог2 + ... + о^ то второй момент G существует и не больше о2. По критерию примера 1, д) отсюда вытекает, что распределение G имеет мате- матическое ожидание, равное нулю. Наконец, G есть свертка Gn и предельного распределения для суммы + • • • +x„+fc. Сле- довательно, дисперсия G не может, быть меньше дисперсии Gn. Этим заканчивается доказательство. Примеры, а) В примере I, 11, в) случайный выбор точки между О и 1 осуществляется посредством последовательных бросаний монеты. В терминологии настоящего параграфа это означает пред- ставление равномерного распределения в виде бесконечной сверт- ки. Пример I, 11, г) показывает, что бесконечная свертка соот- ветствующих распределений с четными номерами есть сингулярное распределение. (См. XVII, 10.) б) Пусть Nk—независимые случайные величины с E(Yfe) = 0 и Е(У|) = 1. Тогда распределения частных сумм ряда ^bkNk схо- дятся, если Этот факт был использован при обсуж- дении свойств нормальных случайных процессов в гл. III, 7. в) Применение к процессам размножения. Пусть Хп—положи-' тельная случайная величина с плотностью Kne~Knt. Тогда Е (Х„)= = [Var(Х„)]1/2 = %/Д и в случае, когда m — наша теорема применима к центрированным случайным величинам Хп—Это замечание приводит к вероятностной интерпретации расходящегося процесса чистого размножения (описанного в 1, гл. XVII, 3, 4). «Частица» движется последовательными скачками. Времена пребывания в отдельных состояниях Хх, Х2, ...— независимые случайные величины, распределенные по показатель- ному закону. Сумма Sn = Хх + ... + Хп представляет собой момент n-го скачка. Если lim Е (SJ = т < оо, то распределение Sn схо- дится к собственному пределу G. Тогда величина G(t) равна
§ 6, Теоремы о выборе 307 вероятности того, что до момента t произойдет бесконечно много скачков. г) Применение к флуктуационным шумам, телефонным вызо- вам и тому подобному см. в задаче 22. > § 6. ТЕОРЕМЫ О ВЫБОРЕ Один из стандартных методов доказательства сходимости чи- словой последовательности состоит в том, что сначала устанав- ливается существование хотя бы одной предельной точки, а за- тем—ее единственность. Аналогичный способ применим и к рас- пределениям. Аналог утверждения о существовании предельной точки дается следующей важной теоремой, приписываемой обычно Хелли. Как и все теоремы этого параграфа, она верна в прост- ранстве любого числа измерений (специальный случай был исполь- зован в 1; гл. XI,6). Теорема 1. (i) Каждая последовательность {Fk} распределений вероятностей в Э1Г содержит подпоследовательность Fni, Fn2, ..., сходящуюся (в собственном или несобственном смысле) к некото- рому пределу F. (ii) Для того чтобы все такие пределы были собственными, не- обходимо и достаточно, чтобы последовательность {Fn} была сто- хастически ограниченной (см. определение 2 в § 2). (iii) Для того чтобы Fn—>F, необходимо и достаточно, чтобы предел любой сходящейся подпоследовательности был равен F. Доказательство основано на следующей лемме. Лемм а. Пусть а±, а2, ... —произвольная последовательность точек. Каждая последовательность {ип} числовых функций содер- жит подпоследовательность иП1, иП2, ..., сходящуюся во всех точ- ках й] (может быть, к ±оо). Доказательство. Мы используем «диагональный метод» Кан- тора. Найдется последовательность номеров vf, v2, ..., такая, что последовательность значений uv (а^) сходится. Чтобы избежать сложных индексов, положим Uk} = uVk, так что {и^} — подпосле- довательность {ип}, сходящаяся в точке at. Из этой подпоследо- вательности выделим другую и(2), и{2\ ..., сходящуюся в точке а2. Продолжая по индукции, мы построим при каждом п последо- вательность и™, u(F\ ..сходящуюся в точке ап и содержащуюся в предыдущей последовательности. Рассмотрим теперь «диагональ- ную» последовательность и(Д, и(2\ и^}, .... Эта последователь- ность, за исключением ее п — 1 первых членов, содержится в и-й последовательности и^, и(2\ ... и потому сходится в ап. Так как это верно при каждом п, то диагональная последовательность {и™} сходится во всех точках ах, а21 . Лемма доказана.
308 Гл. VI11. Основные предельные теоремы Доказательство теоремы L (i) Выберем в качестве {ау} какую- либо всюду плотную последовательность и выберем подпоследо- вательность {Fnk}, которая сходится в каждой точке af. Обозна- чим пределы через G(a;). Для любой точки х, не принадлежащей множеству {аД, определим G (х) как точную нижнюю грань всех значений G (aj) для а}- > х. Таким образом определенная функ- ция G возрастает от 0 до 1, но не обязана быть непрерывной справа: можно лишь утверждать, что значение G (х) лежит между пределами G (х+) и G(x—). Однако можно переопределить G в точках разрыва, так чтобы получить непрерывную справа функ- цию F, которая совпадает с G во всех точках непрерывности. Пусть х—такая точка. Существуют такие две точки ai < х < а^ что G(ay)—G(az) <8, G(a^F (x)<G(ay). (G.l) В силу монотонности Fn имеем Fnk (сц) Fnk (х) Fnk (aj)> Устрем- ляя k—>оо, мы выводим из (6.1), что предельное значение после- довательности {Fn (х)\ не может отличаться от F (х) более чем на 8, и поэтому Fnk (х) —> F (х) во всех точках непрерывности. (ii ) Напомним теперь, что сходящаяся последовательность рас- пределений сходится собственно в том и только том случае, когда она стохастически ограничена. Коль скоро (i) установлено, дру- гие утверждения почти очевидны. ► Теорема о выборе является крайне важной. Приводимая ниже известная теорема теории чисел может дать представление о ее удивительной силе. Она также служит напоминанием о том, что вероятностная терминология не должна затемнять более широкий характер развиваемой теории. Примеры, а) Теоретико-числовая теорема о равномерном рас- пределении дробных долей1). Пусть а--иррациональное число и аа—дробная часть па. Обозначим через Nn(x) число членов среди ах, а2, ..., ап, не превосходящих х. Тогда n~1N„(х)—>х при всех 0<х< 1. Доказательство. Мы будем рассматривать распределения и функции, заданные на окружности единичной длины. Иными сло- вами, координаты складываются по mod 1. (Эта идея уже была объяснена в гл. 11,8. Заметим, что такое удобное понятие, как функция распределения, теряет на окружности смысл, однако понятие распределения как меры сохраняется). Пусть Fn—ато- мическое распределение, сосредоточенное в п точках а, 2а, ..., па х) Эту теорему обычно приписывают Г. Вейлю, хотя она открыта неза- висимо друг от друга Болем (Bohl) и Серпинским (Sierpinski). Из книги Hardy G. Н., Wright Е.М., Theory of numbers, Oxford, 1945, 378—381, можно понять трудности доказательства при вероятностном подходе к теореме,
§ 6. Теоремы о выборе 309 и приписывающее каждой из них вероятность 1/п. По теореме о выборе существует, последовательность номеров п19 п2, ..., такая, что Fnk—где F—собственное распределение вероятностей (так как окружность—ограниченное множество). Беря свертку Fnk с про- извольной непрерывной функцией и, получим — [и(х—а)-\-и(х—2а)-|- ... + и(х—nfta)]—► v(x). (6.2) nk Ясно, что замена х на х—а не меняет асимптотического поведе- ния левой части. Следовательно, v(x) = v(x—а) для всех х. Отсюда вытекает в свою очередь, что v(x) = v(x—ka) для 6 = 1, 2, .... По следствию леммы 2 гл. V,4, точки а, 2а, ... обра- зуют всюду плотное множество. Поэтому v = const. Мы показали, таким образом, что для любой непрерывной функции и свертка F*u является константой. Отсюда следует, что распределение F должно приписывать одну и ту же вероятность интервалам рав- ной длины, т. е. F (/) должно быть равно длине интервала I. Так как никакие другие предельные распределения существовать не могут, то вся последовательность {Fn\ сходится к этому распре- делению, что доказывает теорему. Мы назовем распределение F равномерным распределением на окружности. б) Сходимость моментов. Пусть Fn и F—распределения, имею- щие конечные моменты всех порядков, которые мы обозначим и соответственно. Как мы знаем из гл. VI 1,3, различные функции распределения могут иметь одну и ту же последователь- ность моментов. Поэтому мы не всегда можем сделать по пове- дению вывод, что Fn—>F. Однако если F—единственное рас- пределение, имеющее моменты р,2, ..., и если ~пРи 6 = 1, 2, ..., то Fn—>F. В самом деле, результат примера 1, д) показывает, что всякая сходящаяся подпоследовательность {Fn\ имеет предел F. в) Сепарабельность. Назовем для краткости распределение рациональным, если оно сосредоточено в конечном числе рацио- нальных точек и приписывает каждой из них рациональный вес. Любое распределение F можно представить в виде предела по- следовательности рациональных распределений. Мы можем считать, что математическое ожидание Fn равно нулю, так как этого всегда можно добиться, добавляя новый атом и сколь угодно мало изменяя остальные веса. Но множество всех рациональных распределений счетно и его можно записать в форме последова- тельности Gx, G2, .... Таким образом, существует последователь- ность {GJ распределений с нулевыми математическими ожида- ниями и конечными дисперсиями, такая, что каждое распределе- ние F является пределом некоторой подпоследовательности {Gnfe}. ► Теореме 1 была придана форма, наиболее полезная для теории вероятностей. Но эта форма излишне ограничительна. Доказа-
310 Гл. VIII. Основные предельные теоремы тельство опиралось на тот факт, что последовательность {7^} монотонных функций с Fn{—оо) —0, Fn (оо) = 1 содержит сходя- щуюся подпоследовательность. Но это утверждение остается вер- ным, если условие Fn (оо) = 1 заменить менее жестким условием, а именно, что при любом х числовая последовательность {Fn(x)} ограничена. Предел F будет при этом конечным, но он не обязан быть ограниченным. Индуцированная функцией F мера будет при- - —1 нимать конечные значения на интервалах —оо, х, но может быть бесконечна на —оо, оо. Аналогично можно изменить условия на —оо. В результате мы приходим к следующему обобщению тео- ремы 1, в котором символ ->ц употребляется в том смысле, что это соотношение верно для всех конечных интервалов. Теорема 2. Пусть {pj—такая последовательность мер, что при каждом х числовая последовательность рл {—х, х} ограничена. Тогда существует мера р и последовательность п±, п2, ..., такие, что Рил— Аналоги теоремы о выборе имеют место для многих классов функций. Особенно полезна следующая теорема, называемая обычно или теоремой Асколи, или теоремой Арцела. Теорема 3. Пусть {ип}—последовательность равностепенно непрерывных функцийх) и | ип | 1. Тогда найдется подпоследова- тельность {Unk}, сходящаяся к непрерывному пределу и. Эта схо- димость равномерна в каждом конечном интервале. Доказательство. Выберем снова всюду плотную последователь- ность точек aj и подпоследовательность {u„k}, сходящуюся в точ- ках fli, а2, .... Обозначим ее предел в точке af через и (а]). Тогда | Unr(х) — uns(x)I < I unr (х)—иПг (az) 1 + +1 нпДх)—+1 «„Да,)—«„Дау)|. (6.3) По предположению последний член справа стремится к 0. Вслед- ствие равностепенной непрерывности для любой точки х найдется такая точка а^ что l«„W—«»(«/)I <8 (6.4) для всех п, и для любого конечного интервала / можно найти надлежащее конечное множество таких точек aj. Отсюда выте- кает, что правая часть в (6.3) будет меньше Зе для всех доста- точно больших г и s равномерно относительно х£1. Таким об- разом, существует предел и (х) = lim ипДх), и вследствие (6.4) имеет место неравенство |и(х)—и(а^\^&, откуда вытекает непрерыв- ность и. ► х) Для каждого 8 > 0 найдется такое 6 > 0, что из |х'— х" \ < 5 выте- кает | ип (х') — ип (х")[ < е для всех п.
§ 7. Эргодические теоремы для цепей Маркова 311 § 7*). ЭРГОДИЧЕСКИЕ ТЕОРЕМЫ ДЛЯ ЦЕПЕЙ МАРКОВА Пусть К—стохастическое ядро, сосредоточенное на конечном или бесконечном интервале Q (в соответствии с определением 1 гл. VI,11, это означает, что К есть функция двух переменных, точки х и множества Г; при фиксированном Г К—бэровекая функ- ция х, а при фиксированном xgQ—распределение вероятностей на Q). В многомерных пространствах интервал Q может быть заменен областью более общего вида; при этом теория не требует никаких изменений. В гл. VI, 11, было показано, что существует марковская цепь (Хо, Хь ...) с переходными вероятностями, определяемыми /С Распределение у0 начальной величины Хо может быть выбрано произвольно. После этого распределения Xf, Х2, ... определяются последовательно по формуле Г). (7.1) Я В частности, если у0 сконцентрировано в точке х0, то уп (Г) — «= К{п} (х0> Г) совпадает с вероятностью перехода из х0 в Г. Определение 1. Назовем меру а строго положительной на Q, если а(/)>0 для любого открытого интервала /czQ. Назовем ядро К строго положительным, если К (х, /) > 0 для каждого х и каждого открытого интервала, входящего в Q. Определение 2. Назовем ядро эргодическим, если существует строго положительное распределение вероятностей а, такое, что уп—> а при любом начальном распределении у0. Это равносильно требованию сходимости К(п}(х, /)-^а(/)>0 (7.2) для каждого интервала непрерывности распределения а. Приве- денное определение такое же, как и для дискретного случая (1; гл. XV). Его смысл был объяснен в примерах гл. VI,11. Так как с наиболее общими стохастическими ядрами могут быть связаны различные патологии, то мы ограничимся рассмот- рением ядер, непрерывно зависящих от х. Простейший способ выразить это свойство связан с преобразованиями множества не- прерывных функций, порождаемыми /С. Пусть и—функция, огра- ниченная и непрерывная на рассматриваемом интервале Q. Поло- жим и0 = и и определим по индукции W = $ к (х, dy) и„_1 (у). (7.3) Я •) Этот материал рассматривается как по причине его важности, так и Потому, что он дает яркую иллюстрацию применения теоремы о выборе. Явным образом он в дальнейшем не используется,
312 Гл. VIII. Основные предельные теоремы Это преобразование функций двойственно с преобразованием мер (7.1). Отметим, что в обоих случаях индексы (всюду в этом параграфе) указывают на преобразование, индуцированное К. Свойство регулярности, которое мы собираемся потребовать от Д, состоит, грубо говоря, в том, что функция должна быть не хуже, чем и0. Нижеследующее определение дает точное выра- жение нашему требованию, но выглядит довольно формальным. Примеры покажут, однако, что это определение применимо в ти- пичных ситуациях. Определение 3. Назовем ядро К регулярным, если семейство преобразований uk равностепенно непрерывно1') при равномерно непрерывной на Q функции и0. Примеры, а) Свертки. Если F есть распределение вероятностей, то свертка + со «»И = 5 «п-1 (х—у) F {dy} — 00 представляет собой частный случай преобразования (7.3). (Само собой понятно, что здесь Д(х, I) = F{I—х}.) Это преобразование регулярно, поскольку в силу равномерной непрерывности uQ су- ществует такое 6, что из | х'—х"| < 6 следует | uQ (х')—и0 (х")| < 8 и по индукции получаем \ип(х')—un(x")|<s Для всех п- б) Пусть Q—единичный интервал, и пусть К имеет плотность k, непрерывную в замкнутом единичном квадрате. Тогда Д регу- лярно. Действительно, 1 |и„(х')—u„(Z)|<$|£(x', у)—k(x", y)\-\un_i(y)\dy. (7.4) О По индукции заключаем, что если | и01 < М, то и | ип [ < М при всех п. В силу равномерной непрерывности k найдется такое 6, что |&(х', У)—k(x", у)\<&/М при |х'—х"| < б. Поэтому при всех п \ип(х')—un(x")|<8. ► Условие строгой положительности в приводимой ниже теореме излишне ограничительно. Его основное назначение состоит в том, чтобы устранить осложнения, связанные с разложимостью и пе- риодичностью цепей (с ними мы сталкивались в 1; гл. XV). Теорема 1. Каждое строго положительное регулярное ядро К на ограниченном замкнутом интервале Q является эргодическим. Теорема неверна для неограниченных Q, так как в этом слу- ’) См. сноску на стр. 310. Наша «регулярность» аналогична «полной непрерывности» в теории операторов в гильбертовом пространстве»
§ 7. Эргодические теоремы для цепей Маркова 313 чае предел в (7.2) может быть тождественно равен нулю. Общий результат может быть сформулирован в терминах стационарных мер. Напомним, что мера а называется стационарной относи- тельно /С, если at = a2 = ... = а, т. е. если все ее преобразова- ния (7.1) одинаковы. Теорема 2. Строго положительное регулярное ядро К будет эргодическим тогда и только тогда, когда оно обладает строго положительным стационарным распределением вероятностей а. Доказательство теоремы 1. Пусть — непрерывная функция и v-l—ее преобразование (7.3). Доказательство использует тот оче- видный факт, что для строго положительного ядра К максимум о± строго меньше максимума v0 (исключая только случай постоян- ной и0). Рассмотрим теперь последовательность преобразований ип какой-либо непрерывной функции п0. Так как Q замкнуто, то функция uQ равномерно непрерывна на Q, и, следовательно, после- довательность {ип} равностепенно непрерывна. Таким образом, по теореме 3 § 6 существует подпоследовательность {и^} равномерно сходящаяся к непрерывной функции v0. Тогда Unk+1 сходится к преобразованию функции ^0. Числовая последовательность мак- симумов тп функций ип монотонна, и потому тп—+т. Так как сходимость к и Uj равномерна, то и v0, и имеют один и тот же максимум т. Следовательно, у0(х) = т при всех х. Так как этот предел не зависит от выбора подпоследовательности {unJ, мы приходим к заключению, что ип —равномерно. Пусть теперь у0—произвольное распределение вероятностей на Q. Обозначим через Еп математическое ожидание, взятое по отношению к уп [преобразование уп определяется по (7.1)]. Срав- нение (7.1) и (7.3) показывает, что Е„ (м0) = Ео («„) Е„ (т)=т. Из сходимости Еп(и0) для любой непрерывной функции и0 выте- кает существование вероятностной меры а, такой, что > а (см. теорему 2 § 1; сходимость будет собственной, так как все рас- пределения уп сосредоточены на конечном интервале). Из (7.1) следует, что а—стационарное распределение относительно К. Строгая положительность а непосредственно вытекает из строгой положительности К. ► Доказательство теоремы 2. Обозначим через Е математичес- кое ожидание, взятое по отношению к данному стационарному распределению вероятностей а. Пусть и0—произвольная функция из С[—оо, оо] и ик—ее преобразование. В силу стационарности имеем Е (н0) = Е (мх)
314 Гл. VIII. Основные предельные теоремы Далее, Е(|нЛ|) убывает с ростом k, так что lim Е(| иА |) = т суще- ствует. Так же как в предыдущем доказательстве, выберем такую под- последовательность, что unk—^vQ. Тогда Unk+i-^-vx, где —пре- образование v0. По теореме об ограниченной сходимости отсюда следует, что Е —> Е (к0) и Е (| |) —► Е (| v01). Таким образом, Е (Vi) = Е (и0) = Е (и0) и Е (|t>x |) = Е (| v0|) = m. Из свойства строгой положительности К и последнего неравенства вытекает, что непрерывная функция v0 не меняет знака. Когда Е(ио) = О, то уо(х) = О тождественно. Из сказанного следует, что при любой начальной функции и0 мы имеем v0(x) = E(u0) при всех х. Этим доказано, что ип (х) —> Е (w0), а последнее соотноше- ние равносильно сходимости К^п} (%, Г)—>а(Г) на всех интерва- лах непрерывности. ► Применим теперь изложенную теорию к сверткам на окруж- ности длины 1. т. е. к преобразованиям вида 1 «л+1 (*) = $ un(x—y)F{dy\, (7.5) О где F—распределение вероятностей на окружности и сложение производится по modi [см. гл. 11,3, и пример (6.а)]. Это преоб- н—I разование можно записать в форме (7.3) сЙ = 0, 1 и К{п} (х, Г) = = Fn* {%—Г|. Если F строго положительно, то применима тео- рема 1. Однако мы докажем следующий более общий аналог цент- ральной предельной теоремы. Теорема З1). Пусть F—распределение вероятностей на окруж- ности. Допустим, что оно не сосредоточено в вершинах правиль- ного многоугольника. Тогда F™ сходится к распределению с по- стоянной плотностью. Доказательство. Достаточно показать, что для произвольной непрерывной функции uQ преобразования ип сходятся к постоянной т (зависящей от и0). В самом деле, как показывает вторая часть доказательства теоремы 1, из этого вытекает, что сходятся к некоторому распределению вероятностей а на окружности. Так как равно постоянной для любой непрерывной функции и0, то отсюда следует, что а совпадает с равномерным распределением. Чтобы показать, что ип—>т, мы используем первую часть доказательства теоремы 1. Мы только заново должны доказать, х) Аналог этой теоремы для числовой прямой указан в задачах 23 и 24, Обобщение на случай различных распределений см. Levy Р., Bull. Soc. Math. France, 67 (1939), 1 — 41; Dvoretzky A. and Wolfowitz J.. Duke Math. J., 18 (1951), 501—507.
§ 8. Правильно меняющиеся функции 315 что максимум преобразования Uj любой непрерывной функции v0 строго меньше, чем максимум у0 (за исключением случая, когда vQ равно константе). Поэтому для доказательства теоремы доста- точно установить справедливость следующего утверждения. Если v0—непрерывная функция, такая, что vQ^m и для всех х в интервале I длины К > 0, то существует такое г, что vr (х) < т при всех х. Так как вращения не изменяют величины максимума, то мы можем без ограничения общности предположить, что 0 есть точка роста F. Если b—другая точка роста, то 0, b, 2Ь, ..., rb суть точки роста Ег*. Поэтому можно выбрать b и г таким образом, что каждый интервал длины Z содержит по крайней мере одну из этих точек (см. лемму 1 и следствие в гл. V,4a). По опре- делению 1 vr (х) = $ v0 (х—у) Fr* {dy}. (7.6) О Каждой точке х возможно поставить в соответствие такую точку роста функции (скажем, у), что х—у входит в I. Тогда ц0(*—у)<т и потому vr(x)<m. Так как х произвольно, то требуемое утверждение доказано. ► Замечание. Доказательство легко видоизменить так, чтобы уста- новить следующее предложение: если F сконцентрировано в вер- шинах правильного многоугольника, одна из вершин которого рас- положена в точке 0, то Fn* сходится к атомическому распреде- лению, атомам которого приписан один и тот же вес. Сходи- мость не обязана иметь места, если 0 не находится в числе атомов. Пример, в) Пусть F сосредоточено в двух иррациональных точках а и а-\- %. Тогда F"* сосредоточено в точках па и па+ Уг и сходимость невозможна. § 8. ПРАВИЛЬНО МЕНЯЮЩИЕСЯ ФУНКЦИИ Понятие правильного изменения функций (введенное Карамата в 1930 г.) оказалось во многих отношениях плодотворным и на- ходит все возрастающее число применений в теории вероятностей. Причины этого отчасти объяснены в приводимой ниже лемме, которая, несмотря на свою простоту, играет здесь основную роль. Примеры этого параграфа демонстрируют интересные вероятност- ные результаты, а задачи 29, 30 содержат известный результат, касающийся устойчивых распределений. Он элементарным путем выводится из леммы. (См. также задачу 31). Мы часто сталкиваемся с монотонными функциями U, полу- чающимися из некоторого распределения вероятностей F инте- грированием функции y?F {dy} на б, х или х, оо [см., например, (15), (4.15), (4,16)]. Обычной заменой параметров можно перейти
316 Гл. VIII. Основные предельные теоремы от функции U к семейству функций вида atU (tx). ТАъ\ должны изучить их поведение при >оо. Если предел ф(х) существует, то достаточно брать нормирующие множители at вида at=ty(l)/U(t) (при условии ф(1) > 0). Следующая лемма является поэтому более общей, чем это может показаться с первого взгляда. Она показы- вает, что класс возможных пределов удивительно мал. Лемма 1. Пусть U—положительная монотонная функция на 0, оо, такая, что при t—+oo (8Д) на всюду плотном множестве А точек х. Тогда ф(х) = хр, (8.2) где — оо р оо. «Бессмысленный» символ х°° вводится только для того, чтобы избежать исключений. Его следует интерпретировать, конечно, как оо при х>1 и как 0 при х< 1. Аналогично х“°° равно оо или 0 в зависимости от того, будет х < 1 или х > 1 (см. задачу 25). Доказательство. Тождество U (tx-^x^ ___ U (tx^z) U (1х2) /п ох и (t) и (tx2) и (/) } показывает, что если конечный положительный предел в (8.1) существует при х = хг и при х = х2, то он существует и при х = xtx2 и Ф (%) = Ф (*1) Ф (*2) • ‘ (8 • 4) Допустим сначала, что для некоторой точки xf ф(хх) = оо. Тогда по индукции заключаем, что ф(х?) = оо и ф(хгп) = 0 ПРИ всех Так как ф монотонна, то отсюда следует, что или ф(х) = х°°, или ф (х) = х~°°. Остается доказать лемму для случая конечных ф (см. задачу 25). В силу монотонности ф мы можем доопределить ее всюду по непрерывности справа. Тогда (8.4) выполняется при всех xt и х2. Но это уравнение лишь обозначениями отличается от многократно использовавшегося нами характеристического уравнения для показательной функции. В самом деле, полагая х = е% и ф(^) = ц(£), мы преобразуем (8.4) к виду w(^1 + ^2)r= = ц(51)^(^2)« Из 1; гл. XVII, 6, мы знаем, что все решения этого уравнения, ограниченные на каждом конечном интервале, имеют вид и(1) = е№. Это, однако, то же самое, что ф(х) = хр.^ Функция U, удовлетворяющая условиям леммы 1 с конечным р, будет называться правильно меняющейся на бесконечности. Это определение может быть распространено на немонотонные функции. Положим U (х) » xpL (х). (8.5)
§ 8. Правильно меняющиеся функции 317 Отношение U (tx)lU (f) будет стремиться к x(J тогда и только тогда, когда Мй—L *->«>. (8-6) для любого х > 0. Функции с этим свойством называются медлен- но меняющимися. Таким образом, преобразование (8.5) сводит по- нятие правильного изменения функции к понятию медленного изменения. Удобно использовать это обстоятельство для формаль- ного определения правильно меняющейся функции. Определение. Положительная (но не обязательно монотонная) функция L, определенная на 0, со, называется медленно меняю- щейся на бесконечности в том и только том случае, когда она удовлетворяет условию (8.6). Функция U называется правильно меняющейся с показателем р (—оо < р < оо) тогдя и только тогда, когда она имеет вид (8.5) при том, что L является медленно меняющейся функцией. Это определение используется для введения понятия правиль- ного изменения в нуле'. U называется правильно меняющейся в нуле в том и только том случае, когда U (Г1) правильно меняется на бесконечности. Таким образом, новой теории в этом случае не возникает. Свойство функции быть правильно меняющейся зависит только от поведения на бесконечности, и поэтому не обязательно, чтобы функция L(x) была положительной (или даже вообще определен- ной) для всех х > 0. Пример, а) Все степени | log х | медленно меняются и в нуле, и на бесконечности. Аналогично функция, которая стремится к положительному пределу, является медленно меняющейся. Функция (1+х2Х правильно меняется на бесконечности с по- казателем 2р. Функция е* не является правильно меняющейся на бесконечности, но она удовлетворяет условиям леммы 1 с пока- зателем р = оо. Наконец, функция 2 +sin % не удовлетворяет (8.1). ► Для облегчения ссылок мы перефразируем лемму 1, придав ей форму теоремы. Теорема. Монотонная функция U правильно меняется на беско- нечности тогда и только тогда, когда (8.1) выполняется на всюду плотном множестве точек и предел ф конечен и положителен в некотором интервале1). х) Понятие правильно меняющихся функций можно обобщить следующим образом. Предложение о существовании предела в (8.1) мы заменяем требо- ванием, что каждая последовательность {/„}, стремящаяся к бесконечности, содержит подпоследовательность, такую, что U (tnkx)/U (tnk) стремится к конечному положительному пределу. Мы говорим при этом, что функция I/ изменяется «доминируемо^ См, конец § 10,
318 Гл. VIII. Основные предельные теоремы Эта теорема переносится на немонотонные функции, но лишь при том предположении, что сходимость имеет место во всех точках. Следующая лемма служит для развития представлений о пра- вильном изменении функций. Эта лемма оказывается прямым следствием общего вида (9.9) медленно меняющихся функций. Лемма 2. Если L медленно меняется на бесконечности, то лг8 < L (х) < %8 (8.7) при любом фиксированном 8>0 и всех достаточно больших х. Предельный переход в (8.6) равномерен на конечных интер- валах 0 < а <х <Ь. Мы заключаем это обозрение следующим часто используемым критерием. Лемма 3. Пусть Если U—монотонная функция, такая^ что предел lim KnU (апх) = %(х)< оо (8.8) существует на всюду плотном множестве и функция % конечна и положительна в некотором интервале^ то U правильно меняется и уДх)~схР, где —оо<р<оо. Доказательство. Мы можем предположить, что %(1) = 1 и что (8.8) выполняется при х=1 (этого можно добиться тривиальным изменением масштаба). Для каждого данного t определим п как наименьшее целое число, для которого > t. Тогда ап t <an+i и для неубывающей функции U U (С1пх) U (tx) U (CLnjr’\X) /q л\ U(an+1)^ U (t) U(an) ’ Для невозрастающей функции U верны обратные неравенства. Так как 1, то крайние члены стремятся к /(%) в каж- дой точке, где выполняется (8.8). Поэтому утверждение леммы вытекает из последней теоремы. В качестве типичных примеров применений мы дадим извест- ную теорему Р. А. Фишера—Б. В. Гнеденко и один новый ре- зультат. Примеры, б) Распределение максимума. Пусть случайные ве- личины Xk взаимно независимы и имеют одно и то же распреде- ление F. Положим Х; = шах[Хй .... Х„]. Выясним, существуют ли нормирующие множители ап, такие,
§ 8. Правильно меняющиеся функции 319 что случайные величины Х*п/ап имеют предельное распределение G. Мы исключим при этом два тривиальных случая. Если F имеет наибольшую точку роста то распределение тривиальным образом сходится к распределению, сосредоточенному в £. С дру- гой стороны, всегда можно выбрать нормирующие множители ап столь быстро возрастающими, что величины сходятся по вероятности к нулю. Остальные случаи охватываются следующим утверждением. ► Пусть F (х) < 1 при всех х. Для того, чтобы при некотором выборе нормирующих постоянных ап распределения Gn случайных величин Х*п/ап сходились к распределению G, не сосредоточенному в 0, необходимо и достаточно, чтобы функция 1—F была пра- вильно меняющейся с показателем р < 0. В этом случае G(x) = e~cxP (8.10) при х>0 и G(x) = 0 при х<0 (очевидно, с>0). Доказательство. Если предельное распределение G сущест- вует, то FnM~^ G(x) (8.11) во всех точках непрерывности. Переходя к логарифмам и вспо- миная, что log (1—z)~—z при z—>0, получаем /г[1—F(a„x)]—>— logG(x). (8.12) Так как в некотором интервале 0<G(x)<l, то последняя лемма гарантирует правильное изменение 1—F. Обратно, если 1—F меняется правильно, то возможно определить постоянные ап так, что /1[1—F (aj] —1. В этом случае левая часть (8.12) стремится к хр (см. задачу 26). Пример, в) Свертки. Из определения (8.6) очевидным образом следует, что сумма двух медленно меняющихся функций есть снова функция, медленно меняющаяся. Мы докажем следующее Утверждение. Пусть Ft и F2—две функции распределения, такие, что l—Fi(x) = -^pLi(x'), (8.13) где Li—медленно меняющиеся функции. Тогда свертка G^F^F^ имеет правильно меняющийся «хвост», так что l-G(x)-----L(L1(x) + L8(x)). (8.14) х, Доказательство. Пусть Xj и Х2—независимые случайные ве- личины с распределениями Fx и Р2. Пусть /' = (1+6)/>/. Со- бытие Хх + Х2 > t осуществляется всякий раз, когда одна из ве-
320 Гл. VI11. Основные предельные теоремы личин Xz больше t', а другая больше —8t. При Л—> оо вероят- ность последнего события стремится к 1 и, следовательно, при любом 8 > 0 и достаточно большом I 1-О(0>[(1-^(Г)) + (1-^(Г))](1-8). (8.15) С другой стороны, если положить Г = (1 — 6) t при 0 < 6 < %, то из события Хх + Х2>/ вытекает, что или хотя бы одна из величин Xz превышает t\ или обе больше 8t. Ввиду соотноше- ния (8.13) становится ясно, что вероятность последнего события (асимптотически) пренебрежимо мала по сравнению с вероятностью того, что Xz > Г. Отсюда следует, что для достаточно больших t l_G(/)<[(l_FiO + (l-F2O](l+e). (8.16) Поскольку 6 и 8 могут быть выбраны произвольно малыми, то неравенства (8.15) и (8.16) вместе дают утверждение (8.14). Индукцией по г получаем интересное Следствие. Если 1—F(x)~x~QL (х), то 1—Fr* (x)~rx~pL (%). Это утверждениег) в тех случаях, где оно применимо, допол- няет центральную предельную теорему, давая информацию о «хвостах» распределений. (О применениях к устойчивым распре- делениям см. задачи 29 и 30. Аналогичную теорему для обобщен- ного распределения Пуассона см. в задаче 31.) § 9*). АСИМПТОТИЧЕСКИЕ СВОЙСТВА ПРАВИЛЬНО МЕНЯЮЩИХСЯ ФУНКЦИЙ Цель этого параграфа—изучить связь между «хвостами» и урезанными моментами распределений с правильно меняющимися «хвостами». Основной результат состоит в том, что если 1—F (х) и F(—х) меняются правильно, то тем же свойством обладают урезанные моменты. Это утверждение содержится в теореме 2, которая дает большие сведения, чем то, что нам нужно для тео- рии устойчивых распределений. Эту теорему можно доказать не- посредственно, а можно рассматривать как следствие теоремы 1, которая включает в себя замечательную характеризацию правильно меняющихся функций, данную Карамата* 2). Э Частные случаи были отмечены С. Портом. *) Материал этого параграфа используется только в теории устойчивых распределений. Однако применение теоремы 2 устранило бы многочисленные длинные вычисления, встречающиеся в литературе. 2) Karamata J., Sur un mode decrolissance reguliere, Mathematica (Cluj), 4 (1930), 38—53. Несмотря на частые ссылки на эту работу, более нового изложения ее результатов, по-видимому, не существует. Последние обобщения и применения к тауберовым теоремам см. в статье W. Feller, One-sided ana* logues of Karamata’s regular variation, в мемориальном томе L’Enseignement Mathematique. (1968), щкщященном Карамата,
§ 9. Асимптотические свойства 321 Лучше всего, как нам кажется, дать полное изложение теории, в частности, потому, что тогда многие рассуждения могут быть значительно упрощены1). Введем следующие сокращения: X 00 Zp(x) = \yPZ(y)dy, Zp(x) — yPZ (у) dy. (9.1) О х Мы покажем теперь, что в случае правильно меняющейся функ- ции Z эти функции асимптотически ведут себя по отношению к Z так же, как в простом случае Z(x) = xa. Асимптотическое поведение Zp на бесконечности не зависит от поведения Z вблизи нуля. Поэтому мы можем, не ограничивая общности, допустить, что Z обращается в нуль всюду в некоторой окрестности нуля, так что интеграл, определяющий Zp, имеет смысл при всех р. Лемма. Пусть Z>0—медленно меняющаяся функция. Тогда интегралы в (9.1) сходятся на бесконечности при р <— 1 и рас- ходятся при р>— 1. Если р^—1, то Zp правильно меняется с показателем рЧ-1. Если р < — 1, то Zp правильно меняется с показателем р 1. Последнее верно и для р-|-1=0, если только Z\ существует. Доказательство. При заданных положительных х и е выберем т) таким, что при (1 -е) Z (у) < Z (ху) < (1 4- 8) Z (у). (9.2) Предположим, что интегралы в (9.1) сходятся. Из 00 Z*p(tx) = x?+^yPZ(xy)dy (9.3) i следует при i > ц, что (1 -8) ХР+' zp (о < z; (tx) <(1+8) ХР+* z; (t). Поскольку e произвольно, то мы делаем вывод, что при t —> оо (9.4) (О Это доказывает правильное изменение функции Zp. Более того, так как Zp—убывающая функция, то р-}-1<0. Таким образом, интегралы в (9.1) расходятся при невыполнении условия р<—1. Предположим теперь, что указанные интегралы расходятся. х) Наше доказательство теоремы 1, будучи новым, использует тем не менее идеи Карамата, J1 № 249
322 Гл, VIII, Основные предельные теоремы Тогда при t > г| t Zp (tx) = Zp (t]x) 4- x?+1 J yPZ (x,^ dy •n и, следовательно, (1 _8) xP+iZp (t) < Zp (tx)—Zp M < (1 + 8) x?+1Zp (0. Разделив на Zp(t) и устремив t—->oo, мы получаем, как и выше, что Zp (tx}lZp (t) стремится к Поэтому в случае расходимо- сти интегралов Zp правильно изменяется, а расходимость возможна лишь тогда, когда — 1. Следующая теорема показывает, что из факта правильного изменения Z вытекает правильное изменение Zp и Z*; обратное также верно, исключая тот случай, когда Zp или Z*—медленно меняющиеся функции. Кроме того, мы получаем полезный крите- рий правильного изменения этих функций. Части а) и б) теоремы посвящены функциям Z* и Zp соответственно. Они существуют во всех отношениях в параллель друг другу, но лишь часть а) широко используется в теории вероятностей. Теорема 1. а) Если Z правильно [меняется с показателем у и Zp существует^ то где % = — (р + у+О^О. Обратно, если (9.5) выполняется с 0, то Z и Zp изменяются правильно с показателями у = — %—р—1 и —^соответственно. Если (9.5) выполняется с % —0, то функция Z*p меняется медленно (а о Z ничего нельзя сказать). б) Если Z меняется правильно с показателем у и если р^ — у— 1# то (9.6) V/ с = р 4- у 1. Обратно, если (9.6) выполняется с % > 0, то Z и Zp меняются правильно с показателями X—р—1 и К соответственно. Если (9.6) выполняется с % = 0, то Zp меняется медленно. Доказательство. Доказательство для двух частей одно и то же, и мы проведем его для части а). Положим ур Z (у) _ ч (У) zg уч Zp (у) у ’ Числитель в левой части равен производной знаменателя, взятой
§ 9. Асимптотические свойства 323 со знаком минус. Поэтому при х> 1 мы получаем * tx X = Р-8) Предположим теперь, что/ правильно меняется с показателем у. По предыдущей лемме Z* меняется правильно с показателем 2i = y4-p4-l, и поэтому обе части (9.7) правильно меняются с показателем —1. Таким образом, т] есть медленно меняющаяся функция. Поэтому при t —> оо подынтегральное выражение послед- него интеграла в (9.8) стремится к 1/$. К сожалению, нам неиз- вестно, ограничена ли функция т), и поэтому мы можем лишь утверждать, что нижний предел интеграла log % в силу леммы Фату [см. (2.9) в гл. IV]. Вследствие правильного изменения Z* левая часть (9.8) стремится к Zlogx и поэтому lim sup т] (/) К. Но отсюда вытекает ограниченность т], и, следовательно, мы мо- жем выбрать последовательность tn—> оо так, что t] (tn)—>с<оо. Отсюда вследствие того, что т| медленно меняется, вытекает г| (tns)—для всех s, и эта сходимость является ограниченной. Таким образом, правая часть в (9.8) приближается к clogx и, следовательно, с = К. Отсюда следует, что предел с не зависит от последовательности {/„} и поэтому т](0—Это доказывает, что (9.5) справедливо. Обратное доказывается легче. Предположим, что т] (/)— Тогда обе части в (9.8) стремятся к 2ilogx и, следовательно, отношение Z* (t)/Zp (tx) сходится к лЛ, как и утверждалось. Отсюда и из (9.5) при А>0 следует, что Z правильно меняется с пока- зателем — X—р—1. , Отметим (хотя мы и не будем его использовать) интересное 1 Следствие. Функция Z является медленно меняющейся тогда и только тогда, когда она может быть представлена в виде Z(x) = a (х) exp ( J dy\, (9.9) \i / где 8 (%) —> О и а (х) —>с < оо при х —> оо. Доказательство. Легко проверить, что правая часть (9.9) пред- ставляет собой медленно меняющуюся функцию. Обратно, пред- положим, что Z меняется медленно. Используя (9.6) при р = у = 0, получаем Z(t) l + s(Q Zo (t) t где в (/)—> 0, Числитель в левой части является производной
324 Гл. VIII. Основные предельные теоремы знаменателя, и, производя интегрирование, мы получаем Zo (x) = Z0(l)-x.expfj^dZ Y \1 / что равносильно (9.9), поскольку в силу (9.6) Z (х) ~ ZQ (х) х”1. ► Займемся применением теоремы 1 к урезанным моментам ве- роятностного распределения F. Мы можем рассмотреть каждый хвост в отдельности или же объединить их, перейдя от F kF(x)—F(—х). Поэтому достаточно изучить распределения F, ।----------------------1 сосредоточенные на 0, оо. Для таких распределений F определим урезанные моменты и Уп равенствами X 00 <7с(х) = \ylF{dy}, V„(x) = J y'F {dy}. (9.10) О х Должно быть понятно, что когда второй интеграл сходится, то первый интеграл стремится к оо при х—>-оо. Потребуем, чтобы £ > О и — 00 < В < £• В частности, Vo — 1 —F есть хвост распре- деления F. Мы докажем обобщение части (а) теоремы 1; часть (б) обоб- щается подобным же образом. Теорема 21). Предположим, что Ui(oo) = oo. (i) Пусть или U^, или правильно меняются. Тогда суще- ствует предел fi-V у 1[\ lim —г-.—2—— с, О^с^оо. (9.11) <->« ut(i) Этот предел представляется единственным образом в форме (9-12) где а = т], если с—оо. (ii) Обратно, если (9.11) выполняется с 0<е<оо, то авто- матически и существует медленно меняющаяся функция L, такая, что (х) - (а—п) L (х), (х) - (С—а) х^'а L (х), (9.13) где символ ~ указывает на то, что отношение двух частей стремится к 1. (iii) Утверждение остается справедливым, когда с = 0 или с=оо, при условии, что символ ~ интерпретируется очевидным образом. х) Обобщение см, в задачах 34 и 35,
§ 9. Асимптотические свойства 325 Например, если (9.11) выполняется сс = 0, то а = ^ и функ- ция Щ медленно меняется, но относительно 1АТ мы знаем только то, что Vt)(x) = o(x1i_SL(x)). В этом случае не обязана быть правильно меняющейся функцией (см. задачу 31). Однако медлен- ное изменение—это как раз тот единственный случай, при кото- ром правильное изменение одной из функций t/g или не вле- чет за собой правильного изменения другой. Доказательство, (i) Запишем в виде 00 ^п(х) = $^-^Ш- (9-14) X Интегрируя по частям в пределах от х до t > х, получаем t (О = - (X) + (0 + (£-п) $ у^~ Щ (у) dy. X Два последних члена в правой части равенства положительны, и поэтому интеграл должен сходиться при t—>оо. Отсюда вслед- ствие монотонности вытекает, что (/)—>0 и, следова- тельно, 00 V„(x) = -x^-W£ (х) + С-ц) $ y^-'Uay)dy (9.15) X ИЛИ = ! + g-n С 1 и ( ) d (9.16) X Предположим теперь, что правильно меняется. Так как t/^(oo) = oo, то ее показатель необходимо и мы обозначим его £—а. (Поскольку интеграл в (9.16) сходится, то необходимо Из соотношения (9.5) с Z = и р = л — £—1 следует, что правая часть в (9.16) стремится к —1 + (С—п)/(а—п)=(?—а)/(«—п). если Х=^=0, и стремится к оо, если Х = 0. Таким образом, мы показали, что если правильно меняется с показателем £—а, то (9.11) выполняется с с>0, которое задается равенством (9.12). Предположим теперь, что правильно меняется. Ее пока- затель не превосходит т], и мы обозначим его г|—а. Используем то же самое рассуждение, заменив только (9.15) аналогичным соотношением х Щ (х) = - xZ-(х) 4- G-n) 5 У^~n-(У) dy. (9.17) О
326 Гл, VIII. Основные предельные теоремы Используя (9.6) с Z — V^ и р — 1,—ц — 1, получаем, что (9.11) выполняется с с, которое задано равенством (9.12), где а^О. (ii) Для доказательства обратного утверждения предположим справедливость (9.11) и представим с в виде (9.12). Предполо- жим сначала, что 0<с<оо. Тогда из (9.16) мы видим, что -----------------^=а_Т1, (9.18) СО 1 ‘ х 7 г/П-S-i (у) dy X Из теоремы 1, а) прямо вытекает, что правильно меняется с показателем £—а>0, и тогда из (9.11) следует, что пра- вильно меняется с показателем т]—а. Следовательно, и могут быть представлены в форме (9.13), где а^О. Если с = 0, то те же доводы показывают, что медленно меняется, но соотношение (9.11) не дает оснований для вывода о том, что меняется правильно. Наконец, если (9.11) выполняется с с=оо, то мы выводим из (9.18), что —..---------------> о, (9.19) J dy о и по теореме 1,6) отсюда следует, что медленно меняется. ► § 10. ЗАДАЧИ 1. Альтернативное определение сходимости. Пусть Fn и F — некоторые распределения вероятностей. Покажите, что Fn-+ F (в собственном смысле) тогда и только тогда, когда для любых данных 8 > 0, /г >0 и t существует N (8, Л, /), такое, что при п > N (8, А, /) <F(t + h) + z. (10.1) 2. Несобственная сходимость. Если F — несобственное распределение, то из (10.1) вытекает, что Fn-+F в несобственном смысле. Обратное неверно» Покажите, что собственная сходимость может быть определена требованием, что (10.1) выполняется для п^ N (8, h) независимо от t. 3. Пусть {Fn} сходится в собственном смысле к распределению, не сосре- доточенному в одной точке. Тогда последовательность {Fn (апх-\-Ьп)} сходится к распределению, сосредоточенному в нуле в том и только том случае, когда оо и Ьп = о (ап . 4. Пусть Xf, Х2, ...—независимые случайные величины с одинаковым рас* пределением F, и пусть Sn = Xi+ .., +Х„. Предположим, что предельное рас* пределение величин — bn является собственным и не сосредоточено в одной точке. Если ап > 0, то an/an-i-+l. Указание. Используя теорему 2 из § 3, покажите, что а2п1ап стремится к ко- нечному пределу. Достаточно рассмотреть симметричные распределения. (Пре- дельное распределение устойчиво, см» гл, VI, I.)
§ 10. Задачи 327 5. Пусть {ип}— последовательность ограниченных монотонных функций, сходящаяся поточечно к ограниченной и непрерывной предельной функции (которая автоматически монотонна). Докажите, что сходимость равномерна на всех конечных интервалах. Указание. Разбейте ось абсцисс на интервалы^ на каждом из которых колебание и меньше 8. 6. Пусть Fn сосредоточено в точке п"1 и и (x)=sin (х2). Тогда Fn^u-^ поточечно, но неравномерно. 7. а) Если совместное распределение (Х„, Y„) сходится к совместному распределению (X, Y), то распределение Х„+^п сходится к распределению Х+ Y. б) Покажите, что теорема 2 из § 3 — частный случай этого утверждения. в) Сделанное утверждение, вообще говоря, неверно, если известна только сходимость частных распределений Хп и Y„. 8. Пусть Fn-+F, где F — несобственное распределение. Если w£C0(—°0, °0), то Fn ★ и F ★ и равномерно в каждом конечном интервале (это—обобщение теоремы 1 из §3). 9. Если сходимость Fn-*F несобственная, то отсюда не следует с необ- ходимостью, что Fni^Fn->F^F. Пример. Пусть Fn имеет атомы веса х/$ в точках —п, 0 и п. 10. На плоскости каждая непрерывная исчезающая на бесконечности функция может быть равномерно аппроксимирована конечными линейными комбинациями вида 2 ckqk (х) ф^ (у), где и —бесконечно дифференци- руемые функции. Указание. Используйте пример 3, а), полагая Gk (х, у) = = ЭД/г (*) ЭД& (#)> гДе ЭД — нормальное распределение. Метрики. Функция р называется расстоянием между распределениями вероятностей, если р (F, G) определено для любой пары распределений F, G и обладает следующими тремя свойствами: р (F, G) 0 и р (F, G)=0 тогда и только тогда, когда F = G; далее, p(F, <7) = р (G, F); наконец, р удовлет- воряет неравенству треугольника: Р(^1, ^2)<Р(Л, G)+p(G, f2). 11. Метрика П. Леви. Пусть F и G — два собственных распределения вероятностей. Определим р (F, G) как точную нижнюю грань всех h > 0, для которых при всех х F (х —h) —h^G(x)^F (x+/i) +h. (10.2) Проверьте, что р является расстоянием. Докажите, что Fn F в собствен- ном смысле тогда и только тогда, когда р (Fn, F) 0. 12. Расстояние «по вариации». Положим р (F, G) — sup ||$и— ®ц||, где и || и ||=1. Покажите, что р—расстояние1). Если F и G — атомические распределения, приписывающие точке а^ веса р^ и соответственно, то Р(Л G)=SlPfe-<?fcl- <10-3) Если F и G имеют плотности f и gf то + 00 р(Л 0- J l/(x)-g(x)|dx. (104) — 00 Указание. Достаточно доказать (10.4) для непрерывных fag. Общий случай изучается с помощью надлежащей аппроксимации. J) Это определение можег быть распространено на разности любых конеч- ных мер и определяет для мер «топологию, порождаемую нормой». Задача 13 показывает, что соответствующее понятие сходимости оказывается Heecieci- венным с точки зрения теории вероятностей.
328 Гл. VIII. Основные предельные теоремы 13. Продолжение. Покажите, что из p(Fn, G)0 вытекает собственная сходимость Fn G. Обратное неверно (рассмотрите нормальные функции рас- пределения ЭД (пх) и распределения Fn, сосредоточенные в п"1). 14. Продолжение. Если U — Fп и V = (?i (?я, то Р(^ S Р(^ ^). (10.5) £ = 1 Последнее неравенство обобщает основное неравенство (3.9). Указание. Исполь- зуйте (3.9) и функцию и, такую, что Ц^и — АВи || близко к p(Ut V). 15. Аппроксимация пуассоновским распределением1). Пусть F приписывает вес р точке 1 и вес q — 1—р точке 0. Если G — распределение Пуассона с математическим ожиданием р, то покажите, что р (F, С)^9/4р2 *, где р—• расстояние, определенное в (10.3). Выведите отсюда утверждение: если F — распределение числа успехов в п испытаниях Бернулли с вероятностями успеха Р1> Ра, • ••’ Рп и если G— распределение Пуассона с математическим ожида- яием pi+...-Ьл» то р(Л С) <®/4(Р1+•••+/>«)• 16. Закон больших чисел, установленный в гл. VII, 7, утверждает, что для независимых одинаково распределенных величин с Е (Х/е) = 0, (x^.x+x^Xo. Докажите это методом, использованным в теореме 1 § 4. 17. Условие «Линдеберга (4.15) выполняется, если при некотором 6 > 0 существуют а/г==Е (| Х&+б|) и <Xj+ ... -}-ап = о (s2+e) (условие «Ляпунова). 18. Пусть Fk — симметричное распределение и 1—F\ (х) =х“2“1уЛ/2 для х > 1. Покажите, что условие Линдеберга (4.15) не выполняется. 19. Пусть Xfe=±l с вероятностью х/2 (1—^”2) и с_вероят- ностью 1/2^~2. Покажите с помощью урезания, что величина 8п/У п ведет себя асимптотически так, как если бы Х^=± 1 с вероятностью 1/а. Таким образом, распределение 8п1У п сходится к ЭД, но Var (Sn/]/" п) 2. 20. Видоизмените условие предыдущей задачи так, чтобы Е(Х|) = оо, но распределение 8п!У п сходилось к ЭД. 21 2). Центральная предельная теорема для симметрично зависимых величин* Пусть каждому значению 0 соответствует распределение Fq с нулевым мате- матическим ожиданием и дисперсией о2 (9). Значение 0 выбирается в соответ- ствии с распределением вероятностей G. Затем рассматриваются взаимно независимые случайные величины Хп с одним и тем же распределением Fq* Пусть а2—математическое ожидание о2, взятое по отношению к (/.Покажите, что распределение Sn/(a У п) сходится к распределению J 91 Us))0»' — 00 Это распределение будет нормальным только в случае, когда G сосредоточено в одной точке. 22. Шумы в электронных лампах и подобные процессы. Рассмотрим стоха- стический процесс из примера 3, з) гл. VI с «дискретизированным» временем. Предполагая, что вероятность появления электрона в момент kh равна a/i, покажите, что сила тока в дискретной модели определяется бесконечной сверт- х) Задача подсказана неравенствами работы Le Cam L.? An approxima- tion theorem for the Poisson binomial distribution, Pacific J. Math., 10 (1960), 1181—1197. 2) Blum J. R., Chernoff ЕЦ Rosenblatt M., and Teicher H.^ Central limit theorems for interchangeable processes, Canadian J. Math,, 10 (1958), 222—229.
§ 10» Задачи 329 кой. Переход к пределу при h 0 приводит к теореме Кемпбелла [(3.5) гл. VI]* Проделайте то же самое в примере с занятыми линиями [см. пример 3, и) гл. VI]. Обобщите модель на случай, когда последействие (after-effect) в мо- мент kh есть случайная величина, принимающая значения 1,2, ... с вероят- ностями р2, ... . 23. Последовательность случайных величин с распределениями {Р2*} никогда не бывает стохастически ограниченной. Указание. Достаточно рас- смотреть симметричные распределения. Кроме того, можно допустить, что F имеет бесконечные хвосты, в ином случае /7Л*->0 по центральной предельной теореме. Используйте (5.10) гл. V. 24. Продолжение. Тем не менее.возможно, что при каждому lim sup Fn* (х) = 1 j lim inf Fn* (x) =0< П -> 00 n 00 В самом деле, можно выбрать две крайне быстро растущие последователь- ности целых чисел а^ и п^ так, что 2ka^ —* 1' Указание. Возьмите распределение Р{Х = (—ak} — pk. При подходящем выборе констант с большой вероятностью почти 2k членов последова- тельности Xi, .Xnk будут равны (—1)Ля&, и ни один не превзойдет по абсолютной величине ak. Тогда для четного k > ak — Покажите, что для этой цели пригодны значения zift= (2£)l, pk~~ «й~(Пй)л. 25. В доказательстве леммы 8.1 достаточно предположить, что множе- ство А плотно в некотором открытом интервале. 26. Распределение максимума. Пусть Хь ..., Х„ — независимые случайные величины с одним и тем же распределением F и Х* = тах(Х!, ...-, Х„)в Пусть Gn—распределение величины я^Х*. а) Если Г(х) = 1—е~х и ап — п, то Gn сходится к распределению, сосре- доточенному в точке 0. Покажите прямым подсчетом, что пи при каком выборе ап не может получиться распределение, имеющее более одной точки роста. б) Если F —распределение Коши с плотностью • и ап = и/л, «ГС (1 j X ) то Gn (х) е~х 1 при х > 0. 27. Если X и Y имеют одно и то же распределение F, такое, что 1 — F (x) — x~PL (х), где L—медленно меняющаяся функция, то P{x>qx+Y>o-1 при t оо. Грубо говоря, большие значения суммы, как правило, возникают за счет больших значений одного из двух слагаемых1). 28. Пусть (/>0иа>0на0, оо. Допустим, что предел lim [а (/) v (tx)-\-b (1) x] = z (х) t -> 00 существует и непрерывно зависит от х. Докажите, что при фиксированном п ж v (хох) М \ х0 > 0 функция - ----— правильно меняется. Установите, что или z (x)=s XqX X J) Это явление было впервые подмечено, кажется, Б8 Мандельбротом»
330 Гл. V11I. Основные предельные теоремы = сха, или z (х) = сх + щх log х при том только условии, что сама функция о не является правильно меняющейся [в этом случае г (х) = схаС1Х1 • 29. Пусть G — симметричное устойчивое распределение, т. е. (сгх) == = G (х) (см. гл. VI, 1). Выведите из последнего следствия § 8, что 1 — G (х) ~ — x-aL(x), где a < 2. При этом исключается случай г [1—б(сгх)]-»0, при- водящий к нормальному распределению. Указание. Неравенства симметризации гл. Vj (5.10) показывают, что последовательность г [1 — G (сгх)] ограничена. Дальнейшие рассуждения просты^ 30. Обобщите эти утверждения на случай несимметричных устойчивых законов. 31. Пусть {Хп} — последовательность взаимно независимых положительных случайных величин с одинаковым распределением F, которое сосредоточено на 0, оо. Пусть N—пуассоновская случайная величина. Случайная сумма == X] +... + XN имеет обобщенное распределение Пуассона U=e-cyc^Fn* , и! Пусть функция L медленно изменяется на бесконечности, Докажите, что если 1 —F (х) ~ х~Р L (х), то 1 — U (х) — сх~Р L (х). Указание. Совершенно очевидно, что вероятность Р {SN > х} превышает веро- ятность того, что ровно одна из компонент Ху больше х, иначе 1 — U (х) с [1 — F (/)] e-е С другой стороны, для достаточно больших х из события SN > х вытекает, что или какая-либо одна из величин Ху больше (1—s) х, или по крайней мере две превышают х2у3, или, наконец, N > х1/6. Вероятность второго по счету события есть о (1—F (х)), тогда как вероятность того, что N > logx, стре- мится к 0 быстрее, чем любая степень х. 32. Пусть F — атомическое распределение, приписывающее точке 2п вес, пропорциональный /г~12~2/2, Покажите, что функция U2 [см. (9.10)] медленно меняется и (У2(оо) = оо, но 1—F не является правильно меняющейся функ- цией. Указание. Для доказательства последнего утверждения достаточно рассмотреть величину скачков. Замечание. Оставшиеся задачи имеют отношение к обобщению понятия правильного изменения функций1). Удобную исходную точку зрения задает следующее Определение. Монотонная функция и называется изменяющейся домини- руемо (varies dominatedly) на бесконечности, если отношения и (2х)/и (х) лежат между двумя конечными положительными постоянными. 33. Покажите, что неубывающая функция и изменяется доминируемо тогда и только тогда, когда существуют такие постоянные А, р и /0, что ^<Ax?t i>tOi х>1. (10.5) Для невозрастающей функции и тот же критерий применим с х < 1 вместо х) О последующих результатах и деталях см.: Feller W., One-sided ana- logues of Karamata’s regular variation, в мемориальном томе, посвященном Карамата, 1’Enseignement Mathematique, vol. 15 (1969), 107—121. См. также: Feller W., On regular variation and local limit theorems, Proc. Fifth. Berne- ley Simposium Math. Stat, and Probability, vol. 2, part 1, 373—388 (1965—66)*
§ 10. Задачи 331 х > 1. 34. Обобщение теоремы 2 «э § 9< Определим Ur и Уц также, как в (9.10) (где —оо < т) < Q. Положим R (/) = (f)/U% (t)9 Покажите, что U% меняется доминируемо в том и только том случае^ когда lim sup R (/) <оо/ Аналогично меняется доминируемо в том и только том случае, когда lim inf R (/) > 0s 35, Продолжение^ Более точно: если R при t > tQi то 5Ж<(Л1+1)^ *>is t>t„ (ю.б) (О где p = (g—rj) 1)* Обратно, из (10,6) при р < т] следуем что R (f) < (10,7) ' £—ч— р Эти утверждения остаются справедливыми, если R заменить обратной величиной R"1 и в то же время отношение Ur {tx)[Ur (Z) заменить отноше* нием (Z)/Vn (Zx)4 36. Докажите следующий критерий. Если существует число s > 1, такое? что lim inf U^ (st^U^ (/) > 1, то меняется доминируемо. Аналогично если lim inf Кт) (Z/s)/Vn (/) >1, то U^ меняется доминируемо,
ГЛАВА IX БЕЗГРАНИЧНО ДЕЛИМЫЕ РАСПРЕДЕЛЕНИЯ И ПОЛУГРУППЫ Цель этой главы — показать, что основные теоремы, касаю- щиеся безгранично делимых распределений, процессов с незави- симыми приращениями, устойчивых распределений и их областей притяжения, могут быть получены с помощью естественного обоб- щения рассуждений, использованных при доказательстве централь- ной предельной теоремы. Заметим, что излагаемая теория будет развита заново (и в большем объеме) на основе анализа Фурье. По этой причине здесь мы ограничимся лишь основными фактами. Настоящая глава представляет в значительной степени методоло- гический интерес, связывая разбираемые вопросы с общей теорией марковских процессов. Метод Фурье, там, где он применим, приводит к более сильным результатам. Чтобы облегчить понима- ние важных фактов, некоторые теоремы доказываются дважды. Так, общая теорема о строении рассматриваемых полугрупп рас- пределений доказывается сначала для случая конечных дисперсий и т. п. В этом смысле § 1—4 дают замкнутое изложение основ- ных фактов. Полугрупповая операция, изучаемая в этой главе,—свертка. Другие полугруппы будут изучены независимо новыми методами в следующей главе. § 1. ОБЩЕЕ ЗНАКОМСТВО С ТЕМОЙ Предельные теоремы этой главы служат естественным обобще- нием центральной предельной теоремы, а безгранично делимые распределения тесно связаны с нормальным распределением. Чтобы понять это, стоит повторить доказательство теоремы 1, гл. VIII, 4 в несколько иной обстановке. Мы рассмотрим на этот раз схему серий {Х^„}, где при каж- дом п случайные величины1) Xit„, ХД1П взаимно независимы J) Схема серий была определена в гл. VI$ 3. Следует помнить,- что в действительности мы имеем дело с функциями распределения п; случайные величины используются лишь для того, чтобы упростить ’обозначения. Соответственно случайные величины из различных строк не обязаны нахо- диться в каких бы то ни было отношениях друг к другу (в частности, они могут быть заданы на разных вероятностных пространствах).
§ 1. Общее знакомство с темой 333 и имеют одно и то же распределение Fn. Обозначим суммы по строкам через S„ = Xli п+ ... +Х„, п. В гл. VIII мы имели дело с частным случаем Xftin = Xfta^1 й Fn(x) = F (апх). Суммы по строкам обозначались S£. Всюду в этой главе мы будем использовать операторные обозначения гл. VIII, 3. Так означает оператор, связанный с К„, а %п—оператор, связанный с распределением S„. Наконец, || и|| обозначает максимум непрерывной функции | и]. Пример, а) Центральная предельная теорема. Допустим, что существуют такие числа е„—*0, что |Х11П|<е„, Е(Х11П) = 0, пЕ(Х?.„)->1. (1.1) Для любой функции w, имеющей три ограниченные производ- ные, справедливо тождество п\$пи(х)—и(х)\ = $ и . ny*Fn{dy}. (1.2) Конечные меры ny*Fn {dy} сходятся по предположению к распре- делению вероятностей, сосредоточенному в нуле. Дробь под знаком интеграла непрерывно зависит от у и отличается от -—«"(х) не более чем на u'-'-'jj. Таким образом, равномерно по х п[$пи-и]->±-и". (1.3) Допустим теперь, что {©„}—другая последовательность опе- раторов и что —и] равномерно сходится к и"ft. Тогда п@„ц-®„И)-^0 (1.4) равномерно. По основному неравенству (3.10) гл. VIII (оно будет постоянно использоваться в дальнейшем) (1-5) и правая часть стремится к нулю, как это следует из (1.4). Как мы уже видели при доказательстве теоремы 1 в гл. VIII, 4, в качестве ®п можно выбрать оператор, связанный с симметрич- ным нормальным распределением, имеющим дисперсию 1/л. Тогда = и потому Мы доказали, таким образом, что распределение сумм Sn сходится к нормальному распределению 91. Анализируя внимательно структуру доказательства, мы видим, что форма правой части (1.3) не играет никакой роли. Допустим, что мы имеем такую схему серий, что (в равномерном смысле) п[^пи—«]—(1-6) где 31—произвольный, но фиксированный оператор. Наши рас- суждения позволяют нам сравнить любые две схемы серий,
334 Гл. IX. БеэгрйШию делимые распределения и полугруппы удовлетворяющих (1.6), и прийти к заключению, что их суммы по строкам ведут себя асимптотически одинаково. Если для одной из этих схем распределения Sn сходятся к пределу G, то это же будет верно и для всех других наших схем. Мы докажем это позже. Пример, б) Распределение Пуассона. Допустим, что Х1э п равно единице с вероятностью рп и нулю с вероятностью 1—рп. Если прп—то л \$пи(х)— и (х)] = прп[и (х—1) — л(х)] —>а[л(х—1)—л(х)]. (1.7) На этот раз мы выберем в качестве оператор, связанный с рас- пределением Пуассона с математическим ожиданием а/п. Простой подсчет показывает, что п[&пи—и] также сходится к правой части (1.7). Отсюда выводим, как и раньше, что Таким обра- зом, распределение Sn сходится к распределению Пуассона с ма- тематическим ожиданием а. [Правая часть (1.7) дает нам один из возможных примеров оператора 81 в (1.6). Другой пример простой схемы серий см. в задаче 2.] В двух указанных выше примерах нам посчастливилось знать форму предельного распределения заранее. В общем случае схема серий может служить для определения предельного распределе- ния, и таким путем мы можем получить новые функции распре- деления. Эта процедура была использована в 1; гл. VI, для определения распределения Пуассона как предела биномиальных распределений. Напомним, что предельные распределения для сумм Sn были названы (см. гл. VI, 3) безгранично делимыми. Мы покажем, что такое предельное распределение существует всякий раз, когда выполняется соотношение типа (1.6), а также покажем, что это условие необходимо. Другой подход к рассматриваемой задаче основан на изучении мер ny2Fn{dy\. В обоих примерах существо- вала предельная мера; в примере а) она была сосредоточена в нуле, в примере б) — в точке единица. В общем случае соотно- шение (1.6) тесно связано с существованием такой меры Q, что ny2Fn{dy\—>&{dy}. При этом безгранично делимые распределения могут быть описаны либо с помощью оператора 31, либо с по- мощью меры Й (которая может быть неограниченной). Третий подход к разбираемой задаче использует уравнение свертки 0-8) в котором Qt—распределение вероятностей, зависящее от пара- метра t > 0. Пример, в) Нормальное распределение и распределение Пуас- сона удовлетворяют (1.8) с t, пропорциональным дисперсии. Вы- раженное формулой (2.3) гл. II свойство сверток гамма-распре-.
§ 2. Полугруппы со сверткой 335 делений из (2.2) гл. II представляет собой частный случай (1.8). То же самое справедливо и для аналогичных свойств сверток, выведенных для распределения Коши (см. (4,5) гл. II) и одно- сторонних устойчивых распределений (см. (4.7) гл. II). > В схеме серий с Fn = Q1/n соотношение (1.6) выражает свой- ство (1.8) при t, пробегающем последовательность х/2, 7з» • •• • Можно ожидать, что (1.6) будет выполняться при произвольном стремлении t —>0 + . Отметим, что (1.8) есть не что иное, как основное уравнение для процессов со стационарными независимыми приращениями (гл. VI, 4). Оно тесно связано с теорией полугрупп. В этом кон- тексте 31 выступает в роли «производящего оператора». Оказы- вается, что именно эта теория обеспечивает самый легкий подход к предельным теоремам и безгранично делимым распределениям. Поэтому мы с нее и начнем. § 2. ПОЛУГРУППЫ СО СВЕРТКОЙ Пусть при t > 0—семейство распределений в 3J1, удовлет- воряющих (1.8), и £!(/)—соответствующие операторы, т. е. + 00 £1(0 «(*)== $ и(х—y)Qt {dy}. (2.1) — 00 Тогда (1.8) эквивалентно D(s +/) = £>($)£>(/). (2.2) Семейство операторов, удовлетворяющих (2.2), называется полу- группой. [Оно не будет, как правило, группой, так как оператор Й(0 в общем случае не имеет обратного.] Операторы полугруппы могут иметь произвольную природу, и поэтому удобно ввести термин, подчеркивающий наше допущение о связи £1 (/) и вероят- ностных распределений. Определение 1. Полугруппа со сверткой {£>(/)} (где t > 0) — это семейство операторов, связанных с распределениями вероят- ностей и удовлетворяющих (2.2). В качестве области определения операторов мы возьмем Со[—оо, оо]. Операторы £!(/) являются операторами перехода, т. е. из O^u^l вытекает O^D(/)^^1 и, кроме того, С (0 1 = 1. Нам придется также иметь дело и с операторами [подобными a2!dx2 в (1.3)], которые определены не для всех непрерывных функ- ций. Наши теперешние цели позволяют, к счастью, избежать утомительного обсуждения точной области определения этих опе- раторов, так как нам достаточно рассмотреть только класс таких функций щ что и£С[—оо, оо] н и имеет производные всех поряд-
536 Гл. IX. Безгранично делимые распределения и полугруппы ков, также принадлежащие С[—оо, оо]. Эти функции будут на- зываться бесконечно дифференцируемыми1), и их совокупность будет обозначаться С”. Пока мы ограничимся только операторами 31, определенными для всех ugC” и такими, что 31и£С“, так что все встречающиеся операторы можно рассматривать как операторы, отображающие С°° в С°°. Как мы видели в гл. VIII, 3, для опе- раторов, связанных с распределениями вероятностей, сходимость равносильна сходимости для всех пСС”. Мы распространим теперь это определение сходимости на произволь- ные операторы. Определение 2. Пусть и 91—операторы, отображающие С°° в С°°. Мы скажем, что 91„ сходится к $1, в обозначениях 81,;—>31, если при каждом и£С°° 31м||->0. (2.3) Соотношение (2.3) показывает, что 31„и—равномерно. Обратно, если для каждого и С С” последовательность ]ЗХпм} схо- дится равномерно к пределу v£C°°, то равенство 3Xw = v опреде- ляет некоторый оператор 51 и, очевидно, 3(„—>ЗХ. Определение 3. Полугруппа со сверткой {£>(/)} называется непрерывной, если D(/i)^l, h->0+, (2.4) где 1—тождественный оператор. В этом случае мы полагаем О(0) = 1. Из неравенства Ц£1(/)ы||^||м[| и изопределения (2.2) получаем при h> О J£}(/4-ft)«—D(0m|K||Q(/i)«—и||. (2.5) При достаточно малом h левая часть будет < е, каково бы ни было t. В этом смысле полугруппа со сверткой является равно- мерно непрерывной. Определение 4. Говорят, что оператор ЗХ, отображающий С°° в С°°, порождает полугруппу со сверткой (£}(/)}, если npuh—>0-f- ->5Х. (2.6) Оператор 31 будет называться производящим оператором2). *) Класс С°° введен только для того, чтобы избежать появления нового термина. Он мог бы быть заменен, скажем, классом функций с четырьмя ог- раниченными производными или (что еще проще) классом всех линейных комбинаций нормальных функций распределения с произвольными математи- ческими ожиданиями и дисперсиями. 2) Мы ограничили область определения 51 классом С°°, Поэтому наша терминология слегка отличается от общепринятой^ ср., например, книгу Хилле и Филлипса (1962),
§ 2. Полугруппы со сверткой 337 Более определено, всякий раз, когда предел существует, опе- ратор SI определяется соотношением t~l [«(*—У)—u(x)]Qt{dy}—>-$lu(x). (2.7) — 00 Очевидно, что полугруппа, обладающая производящим опера- тором, автоматически непрерывна. Мы покажем в дальнейшем, что любая непрерывная полугруппа со сверткой имеет произво- дящий оператор, но это утверждение ни в коей мере не очевидно. Формально (2.6) определяет 31 как производную £}(0 при t^O. Существование 31 влечет дифференцируемость и при t > О, так как В (/+/3-Q (О = а (/0-1 & (28) при h—>0+ и аналогично при h—>-0—. Приводимые ниже примеры будут использованы в дальнейшем. Примеры, а) Обобщенная пуассоновская полугруппа. Пусть (2.9) k=Q — обобщенное пуассоновское распределение. Здесь £l(h)u—u = (e~ah— l)u + ahe-ah ...] . (2.10) Деля обе части на h, видим, что (2.6) выполняется с §1 = а(3—1). Таким образом, обобщенная пуассоновская полугруппа (2.9) порож- дается оператором а($—1) и ее элементы мы будем записывать сокращенно в виде £>(Z) = ea(^”1) f. б) Сдвиги. Обозначим через Та распределение, сосредоточен- ное в точке а, и через —соответствующий оператор. При фиксированном р > 0 выполняется полугрупповое свойство = . Кроме того, £(p/)u(x) = u(x—р/). График функции $ (р/) и получается сдвигом графика и. Поэтому мы будем говорить о полугруппе сдвигов. Производящий оператор равен — р j-. Заметим, что он может быть представлен как предел при /г—>0 производящих операторов а($—1), где a = p//i nF сосре- доточено в h. Оператор — 1) — разностный оператор, и пере- ход к пределу рассматривался в гл. VII, 5. Разумно обозначить эту полугруппу как % (/) == ехр •
338 Гл. IX» Безгранично делимые распределения а полугруппы в) Сложение производящих операторов. Пусть и 312 порож- дают полугруппы со сверткой (/)} и {^2(0}- Тогда оператор порождает полугруппу операторов со сверткой £}(/)=; £4 (0 ©2 (0- [Такая полугруппа связана со сверткой распреде- лений, соответствующих £^(/) и £)2(£);см. теорему 2 гл. VIII, 3.] Высказанное утверждение очевидным образом следует из формулы с,WC,(>.)- = сл|)^.+а[(й) е,и-1 . (211) г) Сдвинутые полугруппы. Как частный случай предыдущего примера, отметим правило: если §1 порождает полугруппу опе- раторов £1 (/), связанных с распределениями то оператор —pd/dx порождает полугруппу {£}#(/)}, такую, что Q* (х) =; д) Нормальные полугруппы. Пусть Qt—нормальное распреде- ление с нулевым математическим ожиданием и дисперсией ct. Как уже говорилось, это распределение определяет полугруппу, и мы воспользуемся для отыскания соответствующего производя- щего оператора определением (2.7). По формуле Тейлора и(х—у) — и (х) = — у и' (х) + у у2 и" (x)—~y^u,,,(x—GyY (2.12) Третий абсолютный момент распределения Qt пропорционален /3/2, и потому для функций и с тремя ограниченными производ- ными предел в (2.7) существует и равен ±-си"(х). Таким обра- зом, производящий оператор есть ► (Дальнейшие примеры см. в задачах 3 — 5.) Замечание об уравнении Фоккера—Планка. Рассмотрим семейство функ- ций, определенных формулой v(t, х) = & (t) f (х). Соотношение (2.8) показы- вает, что для гладких / (2.13) Это—уравнение Фоккера—Планка для рассматриваемого процесса, иу — его единственное решение, удовлетворяющее начальному условию v (0, x)=f (%), Уравнение (2.13) описывает процесс. Заметим, что традиционные попытки за- менить (2.13) уравнением для самих переходных вероятностей Qt приводят к ненужным усложнениям. Возьмем, например, сдвинутую обобщенную пуассо- новскую полугруппу, порожденную оператором —1) — Уравне- ние Фоккера—Планка (2.13) выполняется при любой начальной функции f (x) = v (О, х), имеющей непрерывную производную. Его формальный аналог для переходных вероятностей имеет вид (2Л4) Это уравнение имеет смысл, только если Q имеет плотность, и потому не- применимо к дискретным процессам* Обычные ссылки на (2.14) вместо (2*13) порождают лишь затруднения,
£ 3. Подготовительные леммы 339 § 3, ПОДГОТОВИТЕЛЬНЫЕ ЛЕММЫ В этом параграфе собрано вместе несколько простых лемм, на которые опирается вся теория. Несмотря на всю свою про- стоту, основную роль играет следующее неравенство. Лемма 1. Если операторы 31 и 31# порождают полугруппы со сверткой {£}(/)} и {□#(/)} соответственно, то при ecext>0 ||£)(0«—^#г4 (3.1) Доказательство. Из полугруппового свойства и основного не- равенства (1.5) при г=1, 2, ... получаем ПОД а—О* (<) uj <''|Q (у) к—П«(у)и| = При г—► оо правая часть стремится к правой части (3.1), так что это неравенство верно. Следствие. Различные полугруппы со сверткой не могут иметь один и тот же производящий оператор. Лемма 2. (Сходимость.) Пусть при каждом п оператор 31„ порождает полугруппу со сверткой (/)}. Если то 51 порождает полугруппу со сверткой {£>(/)} и £>„(/)—>£}(/) при каждом t>0. Доказательство. При каждом t > 0 последовательность {£}„(/)«} сходится равномерно, так как по (3.1) (о и-Д1т (t) «к (з-з) По критерию 1 гл. VIII, 3, существует оператор D(/), связанный с некоторым распределением вероятностей, такой, что £>п (/) —* —*£>(/). Тогда D„(s + 0 = Gn(s)^n(0->Q(s)a(0 (3.4) (см. теорему 2 гл. VIII, 3). Поэтому {£}(/)}—полугруппа со сверткой. Покажем, что она порождается оператором 31. Отметим с этой целью, что |„_я„| “t* t Первое слагаемое в правой части стремится к —91«|| при /—>0. Полагая в (3.3) т—>оо, видим, что второе слагаемое меньше ||3U—2l„u||. Следовательно, при фиксированном п верхний предел левой части меньше величины 2||3lu—которая может быть сде- лана произвольно малой при достаточно больших п»
340 Гл. IX. Безгранично делимые распределения и полугруппы Последующая лемма делает по крайней мере правдоподобным то, что каждая непрерывная полугруппа имеет производящий оператор. Лемма 3. Пусть {&(/)}—непрерывная полугруппа со сверткой. Если для некоторой последовательности tlt t2, ...—>0 (3.5) mo S( порождает эту полугруппу. Доказательство. Обозначим левую часть 3lft. Как было пока- зано в примере 2, а), оператор порождает обобщенную пуас- соновскую полугруппу и по последней лемме существует полу- группа (/)}, порождаемая 31. Докажем, что D* (t) = D (t). Поступая, как в (3.2), получим И Q (r/ft) и—£1# (rtk) и || ^rtkи|. (3.6) Пусть k—->оо и г—>оотак, что rtk—+t. Правая часть стремится к нулю, а левая в силу (2.5)—к || D (/) и—D#(Z)w||. ► Эти леммы мы используем немедленно. Следующая лемма приведена здесь потому, что она представляет собой вариант леммы 2 и доказательство ее почти такое же. Мы воспользуемся лишь частным случаем = n и / = 1, который будет служить свя- зующим звеном между схемами серий и полугруппами со сверткой. Лемма 4. Пусть при каждом п определен оператор соот- ветствующий распределению вероятностей Fn. Если —SI. (3-7) то 31 порождает полугруппу со сверткой {£)(/)}. Если п—>оо и ^—>1, то (0. (3.8) В частности, —>£} (1). Лемма остается верной, если п пробе- гает подпоследовательность nit п2, ... . Доказательство. Левая часть (3.7) порождает обобщенную пуассоновскую полугруппу [пример 2, а)], так что по лемме 2 будет производящим оператором. По основному неравенству (1.5) имеем U|^||n$„u-«]-п [о (±) и-«] |. (3.9) Если и £ С°°, то каждый из членов разности, стоящей под знаком нормы справа в (3.9), равномерно сходится к ty,u. ►
§ 4. Случай конечных дисперсий 341 § 4. СЛУЧАЙ КОНЕЧНЫХ ДИСПЕРСИЙ Полугруппы распределений с конечными дисперсиями особенно важны, а их теория столь проста, что заслуживает отдельного изложения. Многим читателям не будут интересны более общие полугруппы, а другим этот параграф даст полезный предваритель* ный пример. Рассмотрим полугруппу со сверткой {£}(/)} и обозначим соот- ветствующие распределения вероятностей через Qt. Допустим, что Qt имеет конечную дисперсию о2 (/). В силу полугруппового свой- ства o2(s + /) = o2(s) + a2(Z). Единственное решение этого уравне- ния1) имеет вид o2(/)=id. Предположим, что Qt имеет нулевое математическое ожидание. Тогда второй момент Qt индуцирует распределение вероятностей определенное равенством £it{dy} = ±-y*Qt{dy}. (4.1) По теореме о выборе существует последовательность {/„}, стре- мящаяся к 0 и такая, что если t пробегает ее, то й( стремится к (возможно, несобственному) распределению вероятностей й. Поскольку Qt имеет нулевое математическое ожидание, то имеет место тождество ^4=1 и (x) = cj u(x-!')-uJx)+!'u'^Qi{dy}, (4.2) — со где подынтегральное выражение при фиксированном х есть непре- рывная функция от у, принимающая в нуле значение (я). На бесконечности эта функция и ее производная обращаются в нуль. Отсюда вытекает, что если t пробегает последовательность и как следствие —>Q, то интеграл в (4.2) равномерно схо- дится к аналогичному интегралу относительно распределения Q. В силу леммы 3 из § 3 это означает, что наша полугруппа имеет производящий оператор §1, определяемый равенством (X) = с У »(?~У)-«(*)+?«'(*) й{dy). (4.3) — 00 Это представление §1 единственно, поскольку для функций вида 1-2 “W = l+r^f(-x) (4.4) -1) Уравнение ср (s-f-О^Ф (5)+ф (0 называют уравнением Гамеля. Полагая и (/) —еч получаем и = и (s) и (t). В этой форме уравнение встречалось нам несколько раз и изучалось в 1; гл. XVII, 6. Математическое ожидание Qt также удовлетворяет уравнению Гамеля; следов а тел ьног или оно имеет вид mt, или крайне причудливо; см, § 5а,
342 Гл. IX. Безгранично делимые распределения и полугруппы имеем ^(0) = с j MflW. (4.5) — 00 Поэтому знание 31и для всех и£С°° определяет однозначно меру (1 а вместе с тем и меру й. Как следствие доказанной единственности представления, по- лучаем, что предельное распределение й не зависит от выбора последовательности {^}, т. е. й4 {dy}—>ЙфЛ/} при любом стрем- лении (—>-0. Мы покажем, что й—собственное распределение вероятностей и что каждый оператор вида (4.3) является производящим опе- ратором. Доказательство использует анализ двух частных случаев, которые содержатся в следующих примерах. Примеры, а) Нормальные полугруппы. Если распределение вероятностей й сосредоточено в нуле, то (4.3) сводится к ЗХи(х) =s = -у си" (х). В примере 2, д) мы видели, что такой 'оператор 31 порождает полугруппу нормальных распределений с нулевыми математическими ожиданиями и дисперсиями ct. Легко проверить, что распределения й4 стремятся к распределению вероятностей, сосредоточенному в нуле. б) Обобщенные пуассоновские полугруппы. Пусть распределение вероятностей F сосредоточено на интервалах | х | > л и имеет мате- матическое ожидание mt и дисперсию т2. Распределения Qt обоб- щенной пуассоновской полугруппы из примера 2, а) имеют мате- матические ожидания оипЛ1 и дисперсии arn^t. Полугруппа порож- дается оператором а($ — 1). Согласно примеру 2, г), те же распределения й<, но с нулевыми математическими ожиданиями образуют полугруппу, порождаемую оператором вида а[$—1—mfd/dx] или 5l«(x)== J [и(х—у)—и (х) — yul (х)] F {dy}. (4.6) \у I > п С точностью до обозначений Q{dy}=?y2F {dy}lmt и ат2 — с это сводится к (4.3). Обратно, если распределение вероятностей й сосредоточено на |у|>0, то (4.3) можно переписать в виде (4.6) и, следовательно, оператор 31 такого вида порождает обобщенную пуассоновскую полугруппу, распределения Qt которой имеют нулевые математические ожидания и дисперсии m2t=zct. Теперь мы в состоянии сформулировать основную теорему. Теорема. Пусть Qt имеет нулевое математическое ожидание и дисперсию ct. Полугруппа со сверткой {£} (/)} имеет производящий оператор 31 вида (4.3), где й—собственное распределение ее роят.
§ 5. Основные теоремы 343 ностей. Представление (4.3) единственно. Обратно, каждый опе- ратор такого вида порождает полугруппу распределений со сверткой, причем эти распределения имеют нулевое математическое ожидание и дисперсию ct. Доказательство. Мы установили существование производящего оператора вида (4.3), но относительно Q знаем лишь, что соот- ветствующая полная масса со 1. Остается доказать, что если Q имеет полную массу со, то оператор 31 из (4.3) порождает такую полугруппу, что Qt имеет нулевое математическое ожидание и дис- персию ^ссо/. Пусть ЗЦ—оператор, получаемый из (4.3) исключением интер- валов 0 < | у | г| из области интегрирования. Обозначим через т и сол массы, которые распределение Q приписывает соответственно точке нуль и интервалам | у | > тр Как следует из вышеприведен- ных примеров, оператор ЗЦ представляет собой сумму двух опе- раторов, из которых один порождает нормальную полугруппу с дисперсиями cmt, а второй порождает обобщенную пуассонов- скую полугруппу с дисперсиями ссоп/. По правилу сложения про- изводящих операторов из примера 2, в) оператор 3(п сам порождает полугруппу с дисперсиями с (т + con) t. Оператор 31 как предел 31п при 1] —> 0 сам служит порождающим оператором некоторой полу- группы. Дисперсии соответствующих этой полугруппе распреде- лений лежат между дисперсиями c(m + con)Z распределений, соот- ветствующих 31т), и их предельными значениями cert. Это доказывает, что оператор 31 действительно порождает полугруппу с дисперсиями cert. > § 5. ОСНОВНЫЕ ТЕОРЕМЫ В этом параграфе {D (/)} обозначает произвольную непрерывную полугруппу со сверткой. Соответствующие функции распределения будут снова обозначаться через Qt. По аналогии с (4.1) определим новую меру равенством ^t{dy} = t-^Qt{dy}. (5.1) Новая особенность состоит, однако, в том, что при отсутствии второго момента у распределения Qt мера не обязана быть конечной на всей прямой. Но Qt принимает конечные значения Qf{/} на любом конечном интервале I. Кроме того, поскольку Qt {dy} = ty~2Qt {dy}, то r/“2 интегрируема относительно в любой области, содержащей некоторую окрестность нуля. Мы увидим, что при t —> 0 меры Qt будут сходиться к мере Q с аналогичными свойствами. Эта мера Q будет определять производящий генератор некоторой полугруппы. Удобно поэтому ввести следующее Определение. Мера Q на действительной прямой называется канонической, если й{/}<оо для всех конечных интервалов I
344 Гл, IX. Безгранично делимые распределения и полугруппы и если интегралы = ф"(-х) = $ y~Kl{dy} (5.2) X -00 сходятся при. каждом х > 0. (Для определенности будем считать интервалы интегрирования замкнутыми.) Мы собираемся показать, что здесь применима теория предыду- щего параграфа, с тем лишь исключением, что мы должны иметь дело не с распределениями вероятностей, а с каноническими мерами и что при отсутствии математических ожиданий мы должны выбрать способ центрирования. Определим урезающую функцию xs как такую непрерывную монотонную функцию, что xs{x) = x при |х|s, тДх) = ±з при \x\^s, (5.3) где s > 0 произвольно, но фиксировано. По аналогии с (4.2) мы теперь имеем тождество Dы (х) = j “ {dy} + btu' (х), (5.4) — 00 где + 00 +оо bt= $ ^(i/)«/-2Qf{dt/} = r1 $ xs(y) Qt{dy}. (5.5) Подынтегральное выражение в (5.4) снова является (при фикси- рованном х) ограниченной непрерывной функцией у, принимающей в нуле значение -^-ы"(х). Следует отметить, что наш выбор (5.3) в качестве урезающей функции не имеет исключительного значе- ния: мы могли бы выбрать в качестве т любую ограниченную непрерывную функцию, которая вблизи нуля дважды непрерывно дифференцируема, при этом т(0) = т"(0) = 0 и т'(0)=1. Мы имеем теперь ситуацию, аналогичную той, с которой мы встретились в предыдущем параграфе. Докажем поэтому аналогич- ную теорему. Интеграл в (5.4) сохраняет смысл, когда мера й* заменена любой канонической мерой. Определим оператор равенством №и(х) = j и{х у) — 00 (5.6) Индекс т служит для указания на зависимость от урезающей функ- ции т. Изменение [или точки s в определении (5.3)] сводится к добавлению слагаемого bd/dx к и поэтому семейство one-
§ 5. Основные теоремы 845 раторов ^, = ^ + bd/dx (5.7) не зависит от выбора т,. Теорема 1. Непрерывная полугруппа со сверткой {£)(/)} обла- дает производящим оператором 31, причем Ж имеет вид, опреде- ляемый формулами (5.6)—(5.7), где Q—каноническая мера. Обратно, каждый оператор Ж указанного вида порождает непре- рывную полугруппу со сверткой (D (/)}. Мера Q единственна. При t—+Q (5.8) для конечных интервалов1) I и /-^1-а4(х)]->^+(х), /-^(-лО-^-Н*) (5.9) при х > 0. Доказательство. Мы вернемся на время к системе обозначений § 1. При каждом п рассмотрим сумму S„ = Xii „ + ... 4-X„t п п вза- имно независимых случайных величин с одинаковым распределе- нием Qi/n. Тогда S„ имеет распределение и, следовательно, S„ стохастически ограничена (см. определение 2 из гл. VIII, 2). Мы теперь опередим события и воспользуемся леммой из § 7. Из этой леммы следует, что на каждом конечном интервале I меры Й1/я{/} ограничены и что каждому 8 > 0 соответствует число а > 0, такое, что и[1 — Qi/n(a)+ Q1/n(— а)] <8 (5.10) при всех п. [Эта лемма очень проста, но ее доказательство мы откладываем, чтобы не нарушать порядок изложения.] По теореме о выборе существует мера Q и последовательность целых чисел {г^}, такие, что если Z’1 пробегает эту последова- тельность, то Q/{/}—для конечных интервалов /. Вклад интервала / в интеграл (5.4) стремится тогда к соответствующему вкладу интервала I в интеграл (5.6), который определяет Вспоминая, что y~2&t{dy}= Qt{dy}, мы выводим из (5.10), что вклад области | у\ > а в эти интегралы равномерно мал, если только а выбрано достаточно большим. Мы заключаем, что Q—канониче- ская мера и что интеграл в (5.4) равномерно сходится к интегралу в (5.6), когда t"1 пробегает последовательность \nk}. Кроме того, в условиях теоремы величина bt из (5.5) ограничена и поэтому без нарушения общности можно предположить, что последователь- ность {nk} выбрана так, что bt сходится к числу Ь, когда Z"1 пробегает эту последовательность. Следовательно, если t~x про* х) Здесь и в дальнейшем подразумевается, что сходимость требуется только для интервалов и точек непрерывности»
Р46 Гл. IX. Безгранично делимые распределения и полугруппы бегает так выбранную последовательность {пк}, то t-1 [£} (0 -1 ] и (х) SIи (х), (5.11) причем сходимость здесь равномерная. В силу леммы 3 из § 3 это означает, что полугруппа {£1(0} порождается оператором 31 и поэтому (5.11) выполняется при любом стремлении >0. Таким образом, мы доказали, что производящий оператор ЗХ существует и может быть представлен в форме (5.6)—(5.7) в тер- минах канонической меры Q. Как и в предыдущем параграфе, единственность меры Q в этом представлении следует из того факта, что для функций вида (4.4) величина 3lu(0) задается фор- мулой (4.5) [где с включено в Q], Из единственности Q следует, что (5.8) выполняется при любом стремлении t—>0. Более того, (5.10) гарантирует, что величины в (5.9) равномерно малы при достаточно больших х. Эти величины были определены равенствами (5.2) и аналогичными соотношениями с вместо Q. Отсюда вытекает, что (5.9) есть следствие (5.8). Остается показать, что мера Q может быть выбрана произволь- ным образом. Доказательство проводится так же, как в случае конечных дисперсий. Следуя примеру 4, б), можно убедиться в том, что если мера Q сосредоточена на множестве | у | > ц > 0, то опе- ратор ЗХ, определенный в (5.6)—(5.7), порождает обобщенную пуас- соновскую полугруппу, распределения которой центрированы теперь иначе в отсутствие конечных математических ожиданий. Таким образом, оператор ЗХ снова может быть представлен как предел производящих операторов и поэтому сам является производящим оператором. ► Пример. Полугруппы Коши. Распределения Qt с плотностью ы~Ч (^Н-х2)’1 образуют полугруппу. Легко проверить, что пре- делы в соотношениях (5.9) равны ф+(х) = ф“(—х) = лх~1 и мера лЙ совпадает с мерой Лебега или обычной длиной. Следующая ниже теорема заключает в себе различные важней- шие характеристические свойства безгранично делимых распреде- лений. Доказательство части (v) откладывается до § 7 (иное дока- зательство—непосредственное—см. в задаче 11). Эта часть допускает дальнейшее обобщение на схемы серий с различными распределе- ниями (см. § 9; общая теория будет развита в гл. XVII). Исто- рические замечания по поводу этой теории см. гл. VI, 3. Теорема 2. Следующие классы вероятностных распределений совпадают: (i) Безгранично делимые распределения. (ii) Распределения, соответствующие непрерывным полугруппам со сверткой (т. е. распределения приращений в процессах со ста- ционарными независимыми приращениями). (iii) Пределы последовательностей обобщенных пуассоновских^ распределений.
§ 5. Основные теоремы 347 (iv) Пределы последовательностей безгранично делимых распре- делений. (v) Предельные распределения для сумм в схемах серий {Xki п}, где случайные величины ХЛ1 п п-й серии имеют одинаковое распре- деление. Доказательство. Пусть {£>(£)}—непрерывная полугруппа со сверткой. Как было показано в примере 2, а), оператор -21Л = = [© (h) — 1 ]/h при фиксированном /г>0 порождает обобщенную пуассоновскую полугруппу операторов (/). При h—>0 произ- водящие операторы сходятся к производящему оператору и, следовательно, по лемме 2 из § 3 ©Л (/) —•> © (/). Таким образом, Qt является пределом обобщенных пуассоновских распределений, и поэтому класс (ii) содержится в классе (iii). Очевидно, что класс (iii) содержится в (iv). Пусть при каждом п распределение ®и) безгранично делимо. По определению GU) есть распределение суммы п независимых одинаково распределенных случайных величин, и таким образом последовательность {GU)} приводит к описанной в п. (v) схеме серий. Следовательно, класс (iv) содержится в классе (v). В § 7 будет показано, что класс (v) содержится в (ii), и поэтому классы (ii)—(v) совпадают. Наконец, класс всех безгранично делимых распределений (i) является подклассом класса (iv) и содержит класс (ii). > Согласно теореме 2, каждое безгранично делимое распределение оказывается распределением Qt из соответствующей полугруппы со сверткой. Значение параметра t может быть зафиксировано произвольным образом посредством изменения масштаба на /-оси. Однако существует только одна полугруппа {©(/)}, к которой принадлежит данное безграничное делимое распределение F. Это означает, что представление F = распределения F в виде п-крат- ной свертки единственно. Это утверждение правдоподобно, но требует доказательства. На самом деле единственность становится очевидной при использовании соответствующего анализа Фурье, тогда как в настоящем контексте доказательство увело бы нас в сторону от основного содержания и в то же время было бы лишено поучительности. По этой причине мы отказываемся на этот раз от доказательства указанного утверждения в рамках того и другого подходов. Применение к случайным процессам. Пусть случайные величины X (/) описывают случайный процесс со стационарными независимыми приращениями (гл. VI, 4). Условимся интерпретировать Qt как распределение приращения X(/4-s) — X(s). Рассмотрим временной интервал s, s+1 единичной длины. Разделим его точками s = s0 < <$i < ... <srt = s+1 на подынтервалы длины п"1. Тогда P{X(s^)—> — X ($л-1) > х}== так что п[1 — Qi/n (х)] равно мате^
?48 Гл. IX. Безгранично делимые распределения и полугруппы магическому ожиданию числа интервалов sk_1, sk, приращения на которых > х. При п —> оо это математическое ожидание сходится к 'ф+ (%). Чтобы упростить дальнейшее обсуждение, предположим, что пределы X (t +) и X (t—) существуют при всех t и что X (/) лежит между ними. Пусть sk—тот интервал нашего разбиения, который содержит точку Л Для достаточно больших п приращение X(sJ—X(sA,_i) будет близко к скачку Х(/+) —Х(/—) и интуи- тивно ясно, что предел гр4* (х) представляет собой математическое ожидание числа моментов t (в единицу времени), для которых X G +)—X (t —) > х. Это рассуждение можно сделать строгим, но мы не будем входить в детали. Из сказанного следует, что математическое ожидание числа разрывов будет нулем, только если г|)+(х) = 0 и ф~ (—х) = 0 для всех х>0. В последнем слу- чае Q сосредоточено в нуле, т. е. приращения X(Z + $)—X(s) будут нормально распределены. Для такого процесса траектории непре- рывны с вероятностью единица (теорема П. Леви и Н. Винера). Итак, траектории непрерывны с вероятностью единица тогда и только тогда, когда процесс нормален. В качестве второй иллюстрации мы рассмотрим обобщенный пуассоновский процесс (2.8). Математическое ожидание числа скач- ков за единицу времени равно а, а вероятность получить скачок, Превосходящий х > 0, равна 1 — F (х). Таким образом, а[1 — F (х)] есть математическое ожидание числа скачков, которые больше х, в полном согласии с нашими интуитивными доводами. 5а. Разрывные полугруппы Естественно поставить вопрос о том, существуют ли разрывные полу- группы. Задача не имеет никакой практической ценности, но ответ до неко- торой степени любопытен: каждая полугруппа со сверткой {£} (0} лишь цент- рированием отличается от некоторой непрерывной полугруппы (/)}. В частности, если распределения Qt симметричны, то полугруппа обязательно непрерывна. В общем случае существует такая функция ср, что распределения Qf, определенные как Qt (* + <p (/)), связаны с некоторой непрерывной полу- группой. Функция (р необходимо должна удовлетворять уравнению <p(^-|-s) = <p(/)+<jp(s). (5.12) Это—известное уравнение Гамеля, непрерывными решениями которого могут быть только функции вида ct (см. сноску на стр. 341). Более того, единствен- ная бэровекая функция, которая удовлетворяет (5.12),—это линейная функция. Другие решения слишком причудливы. Например, нелинейное решение прини- мает в любом интервале сколь угодно большие и сколь угодно малые значе- ния. Его невозможно получить аналитически последовательными предельными переходами. Короче говоря, уместно спросить, что в точности означает его «существование». Вернемся на землю и рассмотрим произвольную полугруппу со сверткой {£1(0} и схему серий {Х^п}, связанную с распределениями Q^ Суммы по строкам имеют одно и то же распределение Qj. Поэтому мы можем воспользо- ваться последней леммой и извлечь такую подпоследовательность nt, п2 •.., что когда п пробегает ее, п [£} (1/п) — 1]—где —производящий one-
§ 6. Пример: устойчивые полугруппы 349 ратор некоторой непрерывной полугруппы {D# (/)}» Мы можем выбрать п^ вида 2V. Неравенство (3.2) тогда показывает, что £}(/) = D# (/) при всех t, которые при каком-либо k кратны 1/п^, т. е. при всех t вида t = a2~v, где а и v—целые. Таким образом, всегда существует непрерывная полугруппа {a* (oh такая, что = (t) при всех t из некоторого всюду плотного множества 2. Мы можем теперь доказать исходное утверждение. Выберем еп > 0 так, что лежит в 2. Тогда а#(/ + 8„) = а(/ + 8и) = Г1(/)П(8;г). (5.13) При sn—>0 левая часть сходится к (/) и потому достаточно доказать,’ что если (8П)—>5, то распределение F сосредоточено в одной точке. Выберем точки hn в 2 так, что 0 < &п < hn и hn—> 0. Тогда £l# (Л,г) == — (hn—8n) D (s/z). Левая часть сходится к тождественному оператору, так что F в самом деле может иметь только одну точку роста. § 6. ПРИМЕР: УСТОЙЧИВЫЕ ПОЛУГРУППЫ Полугруппа {£1(0} называется устойчивой, если соответствую- щие распределения имеют вид Qt(x) = G(^(x-pf)), (6.1) где %f>0 и pt—постоянные, непрерывно зависящие от t, a G — фиксированное распределение. Очевидно, что G является устой- чивым распределением в смысле гл. VI, 1. Теория устойчивых полугрупп излагается здесь главным образом как иллюстрация результатов предыдущего параграфа. Кроме того, мы выпишем их производящие операторы. Результаты этого параграфа независимо выводятся (обходным путем) в § 8. В силу предположенной непрерывности Kt и Р^ полугруппа (если она существует) будет непрерывна. При t—>0 распределе- ние Qi стремится к распределению, сосредоточенному в нуле, и, следовательно, Kt—>оо и Р*—*0. Первое из соотношений (5.14) принимает форму ->ф+(х), х>0. (6.2) Так как функция 0t—>0 и G монотонна, то это соотношение ос- тается верным, даже если выбросить и тогда (6.2) можно пере- писать в виде (Здесь мы предполагаем, что 1 является точкой непрерывности для ф+; этого можно достигнуть изменением масштаба.) Теперь (6.3) является частным случаем соотношения (8.1) из гл. VIII, в котором определяется понятие правильного изменения. Заклю- чаем, что либо ф+ тождественно равно нулю, либо хвост 1—G правильно меняется на бесконечности и ф+(х) = с+х~а, х>0, с+> 0. (6.4)
350 Гл. 7Х. Безгранично делимые распределения и полугруппы Следовательно, на положительной полуоси мера й имеет плот- ность ас+х~а~1. Приходим к заключению, что 0 < а < 2, потому что Й приписывает конечные массы конечным окрестностям нуля и ф+ (х)—> 0 при х—> оо. В силу подобных же причин либо тождественно равно нулю, либо (х) = с“ |х|~“ при х<0. Пока- затель а одинаков для обоих хвостов, потому что сумма правого и левого хвостов 1—G(x)-)-G(—х) также правильно меняется. Функции ф+ и определяют меру й с точностью до атома в нуле. Мы увидим, что такой атом может существовать, только если обе функции ф+ и тождественно равны нулю, а мера й сосредоточена в нуле. Производящий оператор §1 задан формулой (5.7). В нашем случае удобно записать его в виде % = c+%+ + c-%- + bd/dx, (6.5) где операторы 31+ и соответствуют вкладам обеих полуосей и определяются следующим образом: если 0 < а < 1, то SX+ы (х) = J [и (х—у)—и (х)] y-a~1dy; (6.6) о если 1 < а < 2, то со (х) = 5 [«(*—у) — и(х)—уи' (х)] у-а-' dy, (6.7) о и, наконец, если а=1, то 00 STf и (х) = J [и (х—у) — и(х)—(у) и' (%)] y~2dy, (6.8) о Оператор 31» определяется аналогичными интегралами на —оо, О, причем у-а-1 заменяется на | у [-а-1. Центрирование в (6.6) и (6.7) отличается от центрирования в (5.6), но эта разница поглощается членом bd/dx в общей записи производящего оператора (6.5). Атом меры Q в нуле добавил бы член yd2/dx2 к производящему опера- тору 31. В примере 4, а) показано, что этот член сам порождает полугруппу нормальных распределений. Теорема, а) При Ь — 0 и 0<а<1 или 1<а<2 оператор (6.5) порождает строго устойчивую полугруппу распределений вида Q^ = G(xt-v*)- (6.9) при а = 1 и Ь = 0 он порождает устойчивую полугруппу распре- делений вида Qt(x)==G (xt^ — (c+—c~') log /). (6.10)
§ 6. Пример: устойчивые полугруппы 351 I б) Устойчивая полугруппа либо порождается оператором (6.5), либо является полугруппой нормальных распределений. [В примере 2, б) мы видели, что bd/dx порождает полугруппу операторов сдвига, и для получения полугруппы, порожденной оператором (6.5), при 6=^=0 достаточно заменить в (6.9) и (6.10) х на x-\-bt.\ Доказательство, а) Изменяя масштаб, можно заменить распре- деление Qt полугруппы на распределения, определенные равенст- вом Qt (x) = Qt(x/p). Они образуют новую полугруппу {£>*(/)}. Если положить v (х) == и (рх), то из определения свертки видно, что (/) и (x) = Q,(t) v(x/p). Это означает для производящих опе- раторов, что для нахождения (х) достаточно просто вычислить §Iv(x) и заменить х на х/р. Подстановка y = z/p в (6.7) и (6.8) показывает, что для соответствующих производящих операторов g(* = pag(a. Оператор ра31а, очевидно, порождает полугруппу {D(pa/)j-, и, таким образом, из единственности производящих операторов мы заключаем, что Q* (x/p) = QZpa(x). Если положить G = Q± И px^Z-Va, ТО получим (6.9). Подобные же рассуждения можно применить в случае а=1 стой разницей, что при использовании подстановки у —zip в (6.8) центрирующая функция дает дополнительный член вида (с+—с“)х X(plogp) и' (х), и это приводит к (6.10). б) Мере Q, сосредоточенной в нуле, соответствует нормальная полугруппа. Мы видели, что производящий оператор любой дру- гой устойчивой полугруппы имеет вид $a + yd2/dx2. Как показано в примере 2, в), распределения соответствующей полугруппы будут свертками нашего устойчивого распределения Qt и нормальных распределений с дисперсией 2у/, и ясно, что такая полугруппа не может быть устойчивой. ► В доказанной теореме утверждается, что функция в опре- делении устойчивой полугруппы имеет вид = Рассматривая (6.2) и его аналог для отрицательной полуоси, получаем Следствие. Если 0 < a < 2, с+ 0, с" 0 (но с+ 4-я*" > 0), то существует ровно одна устойчивая функция распределения Gt такая, что при х—>оо ха[1— G(x)]—xaG(—х)—(6.11) За пределами этого остается единственное устойчивое распреде- ление—нормальное распределение [оно удовлетворяет условию (6.11) при а = 2 и с+=£- = 0]. Утверждение в квадратных скобках будет доказано в § 8.
352 Гл. IX. Безгранично делимые распределения и полугруппы § 7. СХЕМЫ СЕРИЙ С ОДИНАКОВЫМИ РАСПРЕДЕЛЕНИЯМИ Пусть при каждом п величины Xit„, ХЯ1„ взаимно неза- висимы и имеют одно и то же распределение Fn. Нас интере- суют возможные предельные распределения суммы S„ = Xj- „ + -+Х„,ге) но полезно начать с анализа необходимого условия существования предельного распределения, которое состоит в том, что последовательность стохастически ограничена. Напомним определение гл. VI 11,2 по которому последовательность на- зывается стохастически ограниченной, если каждому 8 > 0 соот- ветствует такое а, что Р {| Sn | > а} <8 при всех п. Грубо говоря, это означает, что никакая вероятностная масса не «утекает» в бес- конечность. Очевидно, это условие является необходимым для существования собственного предельного распределения. Обратимся за помощью к операции урезания. Очень удобно еще раз использовать урезающую функцию т5, введенную в (5.3), чтобы избежать разрывов; ts—непрерывная монотонная функция, равная т5 (%) =* х при | х | s и т5 (я) = ± s при | х | s. Положим при таком урезании 1 ^k,n=^s(^k.n\ (7.1) Эти новые величины зависят от параметра s, хотя в наших обо- значениях это не подчеркивается. Суммы по строкам в каждой из схем серий {Х^>л} и {Х£>п} обозначим через и S" соответст- венно, так что Sn = S'n + S"n. Величины Х^п ограничены; их мате- матическое ожидание обозначим Р^Е(Х^) (7.2) (разумеется, ₽„ не зависит от k). Наконец, введем, как аналог мер из § 5, меру Фп, определенную формулой Фп^.х} = пх2Рп{с1х}. ' (7.3) Значения Ф„ (/) конечны на конечных интервалах /, значение Фя на всей числовой прямой может быть бесконечно. Весьма правдоподобно, что {S„} не может оставаться стоха- стически ограниченной без того, чтобы отдельные компоненты Sn были малы в том смысле, что для всякого 8 > О P{|Xft.J>8}->0, п—оо (7.4) (левая часть не зависит от k). Схемы серий, обладающие свой- ством (7.4), называются нулевыми схемами. Мы увидим, что только в нулевых схемах суммы по строкам стохастически ограничены, но пока что введем (7.4) как исходное предположение. «Необходимость» условия следующей леммы используется в доказательстве теоремы 1 § 5: условие (7.4) выполняется, так как рассматриваемая там полугруппа непрерывна.
§ 7. Схемы серий с одинаковыми распределениями 353 Лемма. (Компактность). Для того чтобы суммы по строкам Sn нулевой схемы серий {ХЙ5„} оставались стохастически ограничен- Ными, необходимо и достаточно, чтобы (i) Ф„ (/) было ограничено для каждого конечного интервала I и (ii) для больших х хвосты Тп (х) = п [1 —Fn (х) + Fn (—х)] (7.5) были равномерно малы. Другими словами, требуется, чтобы каждому е > 0 соответст- вовало такое /, что Тп (%) < е при х>/. (Заметим, что Tv—убы- вающая функция.) Доказательство. В частном случае симметричных распределе- ний Fn необходимость условия (ii) вытекает из неравенства р {I S J > а} > 1 (1 —ехр (-Т„ (а))) (7.6) (см. (5.10) гл. V). Для произвольного распределения Fn приме- ним уже знакомую нам симметризацию. Вместе с S„ симметризо- ванные величины °SW будут стохастически ограниченными, и, таким образом, условие (ii) применимо к хвостам ьТп симметри- зованных распределений. Но в случае нулевой схемы ясно, что для каждого б>0 в конечном счете "Тп (а) > ~ ?n (а + и» сле’ довательно, условие (ii) необходимо во всех случаях. В предположении, что условие (ii) выполнено, можно выбрать точку урезания s такой большой, что Тп (s) < 1 при всех п. Тогда число отличных от нуля членов среди , Х^ п является биномиально распределенной случайной величиной с математиче- ским ожиданием и дисперсией, меньшими 1. Следовательно, можно так подобрать числа N и с, что с вероятностью, сколь угодно близкой к единице, среди величин Х'^п менее чем N будут от- личны от 0, и все они будут Это означает, что суммы S„ остаются стохастически ограниченными, и при этих обстоятель- ствах стохастически ограничена тогда и только тогда, когда стохастически ограничена {S^}. Остается доказать, что условие (i) необходимо и достаточно для стохастической ограниченности последовательности Положим 0*2 = Var(SJ. Если оп—>оо, то применение к вели- чинам {X'ktn—₽„)/<?„ центральной предельной теоремы из примера 1, а) показывает, что для большого п распределение сумм будет приближенно нормальным с дисперсией —> оо и, следовательно, P{S^C Z}—>0 для любого конечного интервала I. Те же самые доводы применимы к последовательностям и доказывают, что Стохастически ограничена, если только Var(S^) остается стохасти- чески ограниченной. Но в этом случае с помощью неравенства Чебышева можно показать, что {S'—nfin} стохастически ограни- L 249
354 Гл. IX. Безгранично делимые распределения и полугруппы чепа и что для S'n то же самое верно в том и только том случае, когда {/гРД ограничено. Так как является нулевой схемой серий, то —>0 и, таким образом, ’из ограниченности nfin сле- дует, что Var(S;2)~E(S;2). 2 Таким образом, мы показали, что ограниченность, Е (S„ ) яв- ляется необходимым условием стохастической ограниченности а в силу неравенства Чебышева это условие является и доста- точным. Но Е (S;2) = Ф„ {+ s2T„ (s), (7.7) и, следовательно, при этих обстоятельствах условие (i) эквива- лентно тому, что Е (S„2) ограничено. ► Предположение о том, что является нулевой схемой серий, использовалось лишь в связи с симметризацией и может быть опущено для схем серий с симметричными распределениями F . /2 Однако из ограниченности Фп(7) следует, что Е (Хь,п) = О и легко заключить из леммы, что схема серий со стохастически ограниченными суммами по строкам и симметричными распреде- лениями необходимо является нулевой схемой серий. В силу сим- метризации отсюда следует, что в общем случае существуют такие числа (например, медианы случайных величин Xk ге), что является нулевой схемой. Другими словами, при под- ходящем центрировании получается нулевая схема серий, и в этом смысле только нулевые схемы представляют интерес. Пример. Пусть Xktn имеют нормальное распределение с мате- матическим ожиданием р„ и дисперсией Тогда S„—п$п имеет стандартное нормальное распределение, но, поскольку Рп произ- вольны, не обязательно стохастически ограничена. Это ил- люстрирует важность центрирования. ► Теоретически возможно такое центрирование схемы серий, что Р„ = 0 для всех ft, но соответствующий такому центрированию критерий было бы трудно применять в конкретных ситуациях. При произвольном центрировании критерии включают нелинейные члены и становятся громоздкими. Мы изучим этот случай во всей его общности в гл. XVII,7. А здесь мы примем компромиссное решение! потребуем только, чтобы ₽2=;о(Е(Х^)), п—>оо. (7.8) По-видимому, это условие выполняется во всех ситуациях, встре- чающихся на практике. Во всяком случае, оно настолько умеренно, что его легко удовлетворить с помощью подходящего центриро- вания, в то время как более ограничительное условие потребовало бы сложных вычислений.
§ 7. Схемы серий с одинаковыми распределениями 355 X. Теорема. Пусть —нулевая схема серий, удовлетворяющая условию (7.8). Для существования постоянных Ьп, таких, что распределение S„—bn сходится к собственному предельному распределению, не- обходимо и достаточно, чтобы существовала такая каноническая мера Q, что Ф„ (7.9) для каждого конечного интервала и при х > О «Е1—Fn (%)]-> гр+(х), nFn(—x)->i|r(—х). (7.10) Если эти условия выполнены, то распределение Sn—п$п схо* дится к распределению соответствующему полугруппе со сверт- кой, порожденной оператором 31, который определяется равенством $и(х)= j Гц <4+Ь (У) и’ (X) Q(7др — 00 Доказательство. Прежде всего заметим, что при произволь- ном Ьп условия (i) и (ii) леммы необходимы для того, чтобы по- следовательность {Sn—bn\ была стохастически ограниченной. Дока- зательство сохраняется с тем упрощением, что соотношение Е (S/)~ /^Var (S^) теперь является следствием (7.8), тогда как раньше нам приходилось его выводить из ограниченности S„. Теперь предположим, что условия леммы удовлетворены. В силу теоремы о выборе существует такая последовательность {nk\, что когда п пробегает ее, то (7.9) выполняется для конечных интер- валов. Для конечного интервала имеем п\Рп (6)-Г„(а)]= $ у-*Фп {dy}, (7.12) а а из (7.9) следует, что величина (7.12) тоже стремится к пределу. Условие (ii) утверждает, что п[1—Fn(b)] будет меньше произ- вольного числа 8 > 0, если только b достаточно велико. Отсюда следует, что при 0<а<&^оо интегралы в (7.12) сходятся к аналогичным интегралам относительно Q. Таким образом, Q яв- ляется канонической мерой и (7.10) справедливо, когда п пробегает последовательность {nk}. Нам известно, что оператор 31 из (7.11) определяет полугруппу операторов со сверткой {£>(/)}. Пусть Оп—оператор, индуциро- ванный распределением Gn величин Х^п—|3И, т. е. G„(x)^=F„(x+₽n)- Как известно из § 1, для того чтобы доказать, что распределе- ние разности Sn—n$nk стремится к распределению Qf, связан- ному с оператором 0(1), достаточно показать, что (7.1?) .и»
356 Гл. IX. Безгранично делимые распределения а полугруппы когда п пробегает последовательность {пк\. Теперь + со «[£>„—1]«(лг) = п J [м(х + р„—у}—и(х—y)~\Fn{dy}. (7.14) — со Мы выражаем ы(х+р„—у), используя формулу Тейлора вплоть до члена второй степени. Поскольку Р„—>0, из (7.8) и ограни- ченности Ф„{/} следует, что nfj„—>0. Так как к тому же и" огра- ничено, то + 00 п[&„— Чи(х)= $ [и(х—y)—u(x) + rs(y)u'(x)]nF„{dy} + en(x), — со (7.15) где е„ равномерно стремится к нулю. Интеграл можно переписать в виде (7.11), но с той разницей, что интегрирование будет про- изводиться относительно Ф„ (вместо Q). Как мы неоднократно доказывали, из предельных соотношений (7.9) и (7.10) следует, что интеграл в (7.15) сходится к интегралу в (7.11) и, таким об- разом, (7.13) выполняется, когда п пробегает последовательность Наконец, из единственности полугруппы, содержащей Qj, сле- дует, что наши предельные соотношения должны выполняться при произвольном стремлении п—>оо, что завершает доказательство. ► § 8. ОБЛАСТИ ПРИТЯЖЕНИЯ В этом параграфе Xit Х2, ... предполагаются независимыми случайными величинами с одним и тем же распределением F. В соответствии с определением 2 гл. VI, 1, распределение F при- надлежит области притяжения G, если существуют постоянные а„>0 и Ьп, такие, что распределение ^(Xf +Х„)—^схо- дится к G, где G—собственное распределение, не сосредоточенное е одной точке. Несмотря на уже известные предварительные ре- зультаты гл. VI,1 и § 6, мы будем строить здесь теорию с самого начала. (В гл. XVII,5 эта теория будет изложена независимым образом и с большими деталями.) Всюду в этом параграфе мы будем использовать обозначение X l/(x)=$ y*F{dy}, х>0. (8.1) -X Напомним, что в соответствии с теорией правильного изменения функций из гл. VI 11,8, определенная на 0, оо положительная функция L называется медленно меняющейся (на оо), если при
$ 8. Области притяжения 357 всех х > О <8-2> Теорема 1. Распределение F принадлежит области притяже- ния некоторого распределения G тогда и только тогда, когда существует медленно меняющаяся функция L, такая, что U(x)~x* 2 *~aL (х), х—> оо, (8 3) где 0 < а 2, и при а < 2 , F (-х) /о 4ч 1— F(x) + F(—х) 1— F(x)-\-F(—x) Ч' ' При а = 2 достаточно одного условия (8.3), если только F не со- средоточена в одной точке1'). Мы увидим, что (8.3) при а = 2 приводит к сходимости к нор- мальному распределению. Этот случай охватывает распределения с конечной дисперсией, а также многие распределения с неогра- ниченной медленно меняющейся функцией U [см. пример 4, а) из гл. VIII]. По теореме 2 гл. VIII,9, при £ = 2 и т) = 0 соотношение (8.3) эквивалентно2) U (х) а в том смысле, что каждое из этих соотношений влечет за собой Другое. При 0<а<2 мы можем переписать (8.5) в виде 1—F(x) + F(—x)~^x-“L(x), (8.6) и из (8.6) в свою очередь следуют (8.3) и (8.5). Мы приходим к новой формулировке теоремы, интуитивно более понятной, так как она описывает поведение отдельных хвостов (другие варианты см. в задаче 17). х) Для распределений с конечной дисперсией U является медленно ме- няющейся функцией, кроме того случая, когда F сосредоточено в нуле. Во всех других случаях (8.3) и (8.4) остаются неизменными, если F (х) заменить на F (х-рб). 2) Условие (8:4) налагает аналогичные ограничения на каждый хвост по отдельности: х2[1—F (х)] 2—a x2F (—х) 2—а - -Щх)' — Р— • <*> При а=2 эти соотношения вытекают из (8.5) ? чем и объясняется отсутствие второго условия при а = 2. Теорема 1 могла бы быть сформулирована более сжато (но более искусственно) следующим образом: F принадлежит некото* рой области притяжения тогда и только moedat когда выполняется (*) о О < а<2, <7^0, =
358 Гл. IX. Безгранично делимые распределения и полугруппы । Теорема 1а. (Другая форма.) (i) Распределение F принадлежит области притяжения нормального распределения тогда и только тогда, когда U медленно меняется. (ii) Оно принадлеокит области притяжения, отличной от нор- мальной, тогда и только тогда, когда для некоторого 0 < а < 2 выполняются (8.4) и (8.6). Доказательство. Мы применим теорему § 7 к схеме серий, образованной величинами Х^ п = \к/ап с распределениями Fn(x)=a = F (апх). Суммы по строкам для схемы {ХЛ1 п} равны с ^Хг+.-.+Хц а ип С очевидностью ап—> оо, и, следовательно, {ХЛ% Д является нулевой схемой серий. Чтобы показать, что условие (7.8) выпол- нено, положим х у (х) = J z/F (dz/) (8.7) — X и заметим, что (7.8) наверняка выполняется, если у2(^)^о(^(%)). (8.8) Тогда, если U (%)—> оо при х —>оо, ясно, что v(х) = о (xU (х)) и U (%) = о(х~* 2), и, следовательно, (8.8) выполнено. Случай ограни- ченной функции U не представляет интереса, поскольку мы знаем, что центральная предельная теорема применима к величинам с конечными дисперсиями. Однако соотношение (8.8) выполняется, даже если функция U ограничена, при условии, что распределе- ние F имеет нулевое математическое ожидание. Условие (i) последней теоремы требует1), чтобы при х > 0 ’ na~2U (апх) —>Q{— х, х}, п—+со, (8.9) в то время как условие (ii) сводится к п [1 — F (я^х)] —> ф+ (х), nF (— апх) —> ф“ (— х) (8.10) [обозначения см. в (5.2)]. Легко видеть2), что ап+1/ап—>1. Таким образом, в соответствии с леммой 3 из гл. VIII,8. из (8.9) следует, что U правильно меняется, и предел справа в (8.9) пропорционален степени х. Следуя обычаю, установленному П. Леви, обозначим показатель степени 2—а. Таким образом, Q{— х, х} = Сх2-а, х>0. (8.11) х) Как обычно,- -.молчаливо предполагается^ что сходимость нужна лишь в точках непрерывности. 2) Для симметричных распределений это следует из того факта, что (Х14- * * • + Х„)/а„ и (Хх+. • • + Xn)/a„+i имеют одно и то же предельное распределение, Для Произвольных Г утверждение станогится верным после симметризаций, ~
$ 8. Области притяжения 359 Поскольку левая часть является неубывающей функцией от х и ограничена в окрестности нуля, то 0<а^2. Отсюда следует, что U в самом деле имеет вид, указанный в формуле (8.3). Кроме того, та же лемма 3 из гл. VIII, 8, утверждает, что пределы в (8.10) либо тождественно равны нулю, либо пропор- циональны степени х. Тогда из (8.5) видно, что единственно воз- можной степенью является действительно, при а = 2 оба предела—тождественные нули в то время, как при а < 2 пре- делы обязательно имеют вид Ах~а и Вх~а, где А > 0 и В 0, но Л-|-В>0. Отсюда следует, что условия теоремы являются необходимыми. Если предположить, что (8.3) выполняется, то возможно по- строить такую последовательность {а„}, что па-2<7(а„)->1. (8.12) Например, в качестве ап можно взять нижнюю грань всех t, для которых nt~zU (t) 1. Тогда (8.3) гарантирует, что при х>0 ncr^U (апх) —> х2~а. (8.13) Таким образом, условие (7.9) удовлетворяется для интервалов вида / = {—х, х\. В случае а = 2 предельная мера й сосредото- чена в нуле и, следовательно, (7.9) автоматически удовлетворяется для всех конечных интервалов; в этом случае из (8.5) следует, что выполняется также и условие (7.10) при тождественно равных нулю ф+ и ф~. Если а <2, то из соотношений (8.3)—(8.5) вы- текает, что при х—>-оо 1-Е(х)~Р^Х-“ВД, F(-x)^q2-^X-L(x), если только р>0и?>0(в противном случае символ ~ надо заменить «о» малым, а это—несущественное изменение). Следо- вательно, условие (7.10) выполнено, а отсюда в свою очередь вытекает, что (7.9) применимо к произвольным интервалам, на- ходящимся на положительном расстоянии от нуля. Замечательно, что все результаты § 7 содержатся в настоящей теореме и ее доказательстве. Это доказательство дает также дру- гую важную информацию. Прежде всего имеет место очевидное Следствие. Если а = 2, то предельное распределение является нормальным, а в противном случае оно является устойчивым распре- делением, удовлетворяюиулм условию (6.11). В любом случае оно определено с точностью до произвольных масштабных параметров. Мы видели также, что (8.12) приводит к возможной последо- вательности нормирующих постоянных ап. Легко видеть, что другую последовательность {а^ можно взять в том и только том случае, если отношения а'а[ап стремятся к положительному пределу.
360 Гл. IX. Безгранично делимые распределения и полугруппы В условиях теоремы 1 мы установили существование предель- ного распределения для S„—п0„, где [у определено в (8.7)] = Е (ХА, „) = a^v (sa„)+s [ 1 — F (san)—F(—san)]. (8.15) Теперь мы приступаем к доказательству того приятного факта, что центрирующие постоянные несущественны, за исключением того случая, когда а=1. Если а< 1, то мы применяем теорему 2 из гл. VIII, 9, при £ = 1 и т] = 0 отдельно к каждой из двух полуосей и находим, что при х—>ОО ~ 41 -*)]• (8-16) Отсюда и из (8.10) следует, что п$п стремится к конечному пре- делу и, следовательно, играет несущественную роль. При а> 1 та же самая теорема 2 из гл. VIII, 9, с £ = 2 и т] = 1 показывает, что F имеет математическое ожидание, и мы естественно считаем математическое ожидание нулевым. |Тогда область интегрирования в интеграле (8.7) можно заменить на |#|>х, и можно установить, что (8.16) остается без изменения. Таким об- разом, распределения сумм Sn стремятся к пределу, который снова имеет нулевое математическое ожидание. Аналогично, если а< 1, то предельное распределение центрируется так, чтобы быть строго устойчивым. Таким образом, мы доказали теорему Теорема 2. Предположим, что F удовлетворяет условиям тео- ремы 1. Если а<1, то Fn* (anx)—>G(x), где G—строго устой- чивое распределение, удовлетворяющее (6.11). Если а>1, то же самое верно при условии, что F имеет нулевое математическое ожидание. [О центрировании при а=1 см. гл. XVIII, 5. Относительно моментов F см. задачу 16.] § 9. РАЗЛИЧНЫЕ РАСПРЕДЕЛЕНИЯ. ТЕОРЕМА О ТРЕХ РЯДАХ На короткое время мы перейдем к общим схемам серий {Х^ п}, в которых случайные величины1) Хп> входящие в n-ю строку, взаимно независимы, но могут иметь произвольные распределения Fky п. Для того чтобы сохранить характер наших предельных теорем, мы рассмотрим только нулевые серии: по- требуем, чтобы для любых т| > 0 и 8 > 0 и всех достаточно боль- ших п P{|Xft,„|>r]}<8, k=i,...,n. (9.1) Теория, развитая в § 7, переносится на этот случай с единствен- ным изменением, что выражения типа nVar(X]>n) заменяются соответствующими суммами. В частности, в качестве предельных *) Относительно числа слагаемых в n-й строке см, задачу 10 в гл, VII, 13.
§ 9. Различные распределения. Теорема о трех рядах 361 распределений сумм по строкам нулевых схем серий появляются только безгранично делимые распределения. Проверка требует стандартных приемов и может быть предоставлена читателю. Обсудим несколько интересных частных случаев. Мы сохраним обозначения § 7, но в дальнейшем не имеет значения, какой тип урезания мы использовали; быть может, проще всего определить урезанные величины так: Х*>П = Х^„ при | ХЛ1 п | < s и Х^„==0 в противном случае. Уровень урезания s здесь произвольный. Первая теорема является вариантом леммы о компактности и эквивалентна ей. Теорема 1. (Закон больших чисел.) Пусть Sn обозначает сумму по строкам нулевой схемы серий. Для того чтобы существовали такие постоянные Ьп, что1) Sn—bn—>0, необходимо и достаточ- но, чтобы для каждого т] > 0 и каждого уровня урезания s выпол- нялись соотношения П п. S Р{|ХА1„|>Г1}-*О, S Var(Х^„) —► 0. (9.2) k=i k=i В этом случае можно взять Ьп = "^Е (Х^ п). k В качестве приложения докажем следующую теорему, которая уже обсуждалась в гл. VIII, 5. Теорема 2. (Бесконечные свертки.) Пусть Yj, Y2, ...—неза- висимые случайные величины с распределениями Gr, G2, ... . Для того чтобы распределения Gf * G2 "fc• • Спсумм Tn= Yj+ • • • 4-Yn сходились к собственному предельному распределению G, необхо- димо и достаточно, чтобы при каждом s > 0 2₽{|YJ>s}< оо, 2Var(Y9<oo (9.3) и п SE(Y0-^m. Л=1 (9Л) Доказательство. Для данной возрастающей последовательности Vj, v2, ... целых чисел и k'—\, п положим XAi„ = YVn+ft. Распределения G£ Gn сходятся тогда и только тогда, когда все полученные таким образом схемы серий подчиняются закону больших чисел с центрирующими постоянными Ьп = 0. Из теоремы 1 ясно видно, что для этого необходимы и достаточны условия (9.3) и (9.4) ► Теореме 2 можно придать следующую более яркую формули- ровку. х) Напомним из гл. VIII, 2, что последовательность Z„ сходится по веро- ятности к 0, если Р {| Z„ | > е) —> 0 для всякого е > 0,
362 Гл. IX. Безгранично делимые распределения и полугруппы Теорема 3. (Теорема Колмогорова о трех рядах.) Ряд 2^ сходится с вероятностью единица, если выполняются соотношения (9.3) и (9.4), и сходится с вероятностью нуль в противном случае. Доказательство. Допустим, что имеют место (9.3) и (9.4). По теореме 2 гл. VII, 8, второе из условий (9.3) гарантирует сходимость с вероятностью единица ряда 2[Yfe—E(Y^)], и тогда из (9.4) следует то же самое для ряда 2^- По лемме Бореля — Кантелли (см. 1; гл. VIII, 3) из первого условия (9.3) следует, что с вероятностью единица лишь конечное число среди величин Nk отличается от N'k. Поэтому ряд 2^* сходится с вероятностью единица. Для доказательства необходимости наших условий напомним (см. гл. IV, 6), что вероятность сходимости равна или нулю, или единице. В противном случае распределения частных сумм должны сходиться, и поэтому будут выполнены (9.3) и (9.4). ► Процессы с нестационарными приращениями Развитая в этой главе теория полугрупп представляет собой орудие, осо- бенно пригодное для изучения процессов со стационарными независимыми при- ращениями. При отказе от условия стационарности распределения приращений X (/)— X (т) будут зависеть от двух параметров t и т, и нам приходится иметь дело с двупараметрическим семейством операторов (т, /), 0 < т < /, удов- летворяющих уравнению свертки а (т, s) a (s, о=а (?, о, ? < s < t. (9.5) Будут ли распределения, связанные с такими операторами, безгранично дели- мы? Мы можем разбить т, t на п интервалов и рассмотреть случайные величины X (^) — X Однако для применения теории, развитой для схем серий,мы должны принять ограничение (9.1), сводящееся к требованию равномер- ной непрерывности рассматриваемых распределений по двум временным парамет- рам. Но а (т, t) не обязано зависеть от t непрерывно. В самом деле, частные суммы последовательности Xj, Х2, ... независимых случайных величин обра- зуют процесс с независимыми приращениями, в котором все изменения про- исходят только в целочисленные моменты времени. Этот процесс разрывен. Однако в некотором смысле это есть единственный тип существенно разрыв- ного процесса. Термин «существенно» необходим. В самом деле, мы показали в § 5а, что даже в обычных полугруппах искусственное центрирование может породить беспорядок. Он не имеет особенных последствий, но требует осто- рожности в формулировках. Для простоты мы ограничимся симметричными распределениями и докажем следующую лемму, Лемма. Если распределения, связанные с (т, /), симметричны, то при каждом t существует односторонний предел (т, t—), Доказательство. Пусть т < tf < t2 <..» и tn—> t. Последовательность распределений,- связанных с D (т, /п), стохастически ограничена, так что она содержит сходящуюся подпоследовательность. Чтобы избежать двойных ин- дексов, допустим, что £1 (т, /„) —> 31, где 3( соответствует собственному рас- пределению U. Легко установить, что £}(/„, tn+d—>1 и потому £}(/„, зп)—>1 для любой последовательности моментов времени, такой, что tn<sn< < tn + i. В силу (9.5) это означает, что © (т, sn)—>31, поэтому предел 31 не зависит от выбора последовательности {/„}• Лемма доказана, ►
§ 10. Задачи 363 Следуя П, Леви, мы назовем момент t фиксированным разрывом, если пределы D (т, /+) и D (т, t—) различны, Из теоремы 2 сразу следует,^ что множество фиксированных разрывов счетно. Используя симметризацию, можно показать, что в общем случае разрывы обусловлены только центрированием (исключая не более чем счетное множество моментов времени) и что их можно устранить подходящим центрированием. Вклад Da (т, /) всех фиксированных разрывов в D (т, I) представляет собой бесконечную свертку. Поэтому про* цесс можно разложить на дискретную и непрерывную части. Для схемсерий? возникающих из непрерывных процессов, нетрудно показать (используя тео- рему 2), что условие равномерной малости (9.1) автоматически выполнено* Мы приходим к заключению, что распределения, связанные с непрерывными процессами, безгранично делимы. П. Леви показал,, что выборочные функции таких процессов «достаточно хороши» в том смысле, что с вероятностью единица они имеют при каждом t правые и левые предельные значения, § 10. ЗАДАЧИ 1. Покажите, что в примере 1, а) при п—>оо* Указание* Используйте дисперсии. 2. Пусть Т — момент первого прохождения через точку +1 в обычном симметричном случайном блуждании. Другими словами, Т — такая случайная величина, что Р{Т = 2г— 1} = Д-г ( 2r-1^ 1 J 2r — 1 \ г ) Рассмотрите схему серий, в которой п распределено как Ч1п?Л Используя элементарные методы § 1,- покажите прямым вычислением, что со гст /м 1 С и (х—у)—и(х) , п $„« (X) — и (х)] —> \ р—— dy, (*) F 2л J V у3 Установите, что распределения сумм по строкам сходятся к устойчивому распределению Ff, определенному в гл. II, (4.7), и обладающему свойст- вом (4.9) гл. II. Дайте интерпретацию полученного результата в терминах случайного блуждания, в котором скачки равны ±1//?, а промежутки между последовательными скачками равны 1/Л Указание'. Ряд, определяющий 8и«(х), можно приблизить интегралом. 3. Рассмотрим гамма-распределения (2.2) из гл. II при сс=1, Покажите, что из свойства свертки (2,3) гл. II следует, что они образуют полугруппу с производящим оператором вида 00 ay / ч С и (х—у) — и(х) „ , (х) = \ i---—-----— е~У dyt о Обсудите отсутствие центрирующего члена, 4. Односторонние устойчивые распределения (4,7) из гл, II удовлетво- ряют свойству свертки (4.9) из гл. II щ следовательно, образуют полугруппу, Покажите, что производящий оператор задается правой частью соотноше- ния (*) из задачи 2, 5. Пусть распределения Qt некоторой полугруппы сосредоточены на мно- жестве целых чисел. Обозначим вес k через (/)* Покажите, что %и (х) (0) и (х)+ 2 4k (0) и (x—k), Сравните с канонической'формой (5,9), Рассмотрите в связи с этим произво- дящие функции безгранично делимых распределений, найденные в 1; гл* XI 1,3*
364 Гл. IX. Безгранично делимые распределения а полугруппы 6. Распространите понятия § 2 па полугруппы с несобственными распре* делениями. Покажите, что если 31 порождает {£1 (/)}, то 31—cl порождает (/)}• 7. Обозначение х) для обобщенной пуассоновской полугруппы натал- кивает на мысль написать в общем случае Для нормальной полу- группы это приводит к формальному операторному соотношению I 1 ,d2 \ . . V 1 I z .2^ / X expU^2)“W=^^u) “ (х)’ Покажите,- что оно верно, если ряд Тейлора для и сходится при всех х и ряд в правой части сходится при t > 0. Указание. Начните с ряда Тейлора для свертки и и нормального распределения. Используйте моменты нормаль- ного распределения. 8. Распределения полугруппы имеют конечные математические ожидания тогда и только тогда,- когда функция х интегрируема относительно ме- ры Q, входящей в формулу для производящего оператора. 9. Покажите непосредственно, что если п[^п— 1]—>31, то оператор 31 обязательно имеет форму производящего оператора. Указание. Используйте метод § 4, рассматривая функции вида (4.4), но не привлекайте теорию полу- групп. Ваша цель—вывести общий вид производящего оператора, не дока- зывая заранее его существование. 10. Пусть приписывает вероятности у двум точкам ± рА Тогда S 2;*®*-1) k = — 00 порождает полугруппу, такую, что Q2f W = Qf (хц), но Qt не являются устой- чивыми распределениями. (П. Леви.) 11. Прямое доказательство того, что предельные распределения сумм по строкам схем серий безгранично делимы. Пусть {Х#? п} — схема серий, состав- ленная одинаково распределенными величинами. Стохастическая ограничен- ность Sn влечет то же самое для частных сумм .. + X/ZZ> где т обозначает наибольшее целое число ^п/г. Используя теорему о выборе, покажите, что отсюда следует, что предельное распределение G сумм S„ есть г-кратная свертка распределения Gr. 12. Для любого распределения F и гладкой функции и + оо ||®-1) U ||<ioo-(]|«||+h"l[) J iq^fW+h'll- — 00 13. Схеме серий {Х^„} с распределениями Fn соответствует другая схема серий {X# с обобщенными пуассоновскими распределениями Покажите, что если {Sn} стохастически ограничена, то п S*1—>0. От- сюда видно, что суммы по строкам Sn и S* асимптотически эквивалентны* Так как распределение S# связано с мы получаем второй метод? пригодный для вывода основных теорем § 7. Этот метод применим и к схемам серий с различно распределенными величинами. Указание, Используйте задачу 12« 14. Положим в обозначениях § 5 М„ = тах [Х^ „? ..., Хп. Если Sn имеет предельное распределение, то ф+ (х) = —lim log Р{М„ < х}> ' 15. Если Sn имеет предельное распределение, то этим же свойством об* ладают суммы по строкам в схеме серий, образоранцой квадратами
§ 10. Задачи 365 16. Области притяжения. Пусть F принадлежит области притяжения устойчивого распределения с показателем а. Используя теорему 2 из гл. VIII, 9, покажите, что F обладает абсолютными моментами всех порядков < а. Если а < 2, то не существует моментов порядка > а. Последнее утверждение неверно при а=2, 17. Продолжение. Теория § 8 основана на урезанных вторых моментах (функция U). Причина этого—традиция. Теорема 2 гл. VIII, 9, позволяет нам заменить у2 в (8.1) на |z/|P с другим показателем р и при каждом р — заменить (8.3) и (8.5) равносильными соотношениями. 18. Пусть Xf, Х2, ,,,—независимые случайные величины с одним и тем же распределением F. Пусть 1—F (x)-\-F (—х) медленно меняется. Выведите из леммы о компактности, что в этом случае последовательность (S„^/a^) + ^ не может иметь собственное предельное распределение, не сосредоточенное в одной точке. (Это можно выразить также, говоря, что F не принадлежит никакой области частичного притяжения, См. гл, XVII, 9.) Указание*, Ис- пользуйте симметризацию.
ГЛАВА X МАРКОВСКИЕ ПРОЦЕССЫ И ПОЛУГРУППЫ Эта глава открывается элементарным обзором наиболее рас- пространенных типов марковских процессов, или, точнее, основ- ных уравнений, которым подчиняются их переходные вероятности. Затем мы перейдем к введенному Бохнером понятию подчинен- ности процессов и к полугрупповой трактовке марковских Процессов. Связующим звеном между этими вопросами служит так называемая показательная формула теории полугрупп. Сущест- вование производящих операторов будет доказано только в гл. XIII методом, использующим теорию резольвент. Теоретически настоя- щее изложение могло бы охватывать в качестве частных случаев процессы и полугруппы предыдущей главы. Однако методы и применения столь различны, что последующая теория излагается замкнуто и независимо от гл. IX. Результаты будут усилены в гл. XIII, но теория марковских процессов не используется в оставшейся части книги. Эта глава по своему характеру—обзор, в котором не делается попытки достичь общности или полноты1). В частности, мы не будем обсуждать свойства выборочных функций, и всюду в этой главе существование рассматриваемых процессов считается заранее данным фактом. Наши интересы полностью концентрируются вокруг аналитических свойств переходных вероятностей и опера- торов. Теория индуцированных полугрупп будет с достаточной сте- пенью общности рассмотрена в § 8—9. В предшествующих им параграфах основное пространство есть интервал на прямой или вся прямая, хотя часть теории годится и в более общей обста- новке. Чтобы избежать введения специальных. обозначений, мы условимся считать, что если пределы не указаны, то интеграл берется по фиксированному множеству Q, служащему основным пространством. х) Более детально полугрупповой подход к марковским процессам описан в книгах Е, Дынкина (1965) и М. Лоэва (1963), Книга К, Иосиды (1967) дает сжатое и ясное введение в аналитическую теорию полугрупп и ее применение к теории диффузии и эргодической теории.
§ 1. Псевдопуассоновский тип 367 § 1. ПСЕВДОПУАССОНОВСКИЙ ТИП Всюду в этой главе мы ограничиваемся марковскими процес- сами со стационарными переходными вероятностями Qt, опреде- ляемыми формулой Г) = Р{Х(/ + т)бГ|Х(т) = х} (1.1) в предположении, что правая часть не зависит от т (см. гл. VI, И). Простое расширение понятия обобщенного пуассоновского процесса приводит к некоторому важному классу процессов, из которых все другие можно получить с помощью аппроксимации. Теория полугрупп опирается на аналитический аналог этого факта (§ 10). Пусть N (/) обозначает величины, образующие пуассоновский процесс. Обобщенный пуассоновский процесс был введен в гл. VI, 4, посредством случайных сумм Sn(q, где So, Sn ... —частные суммы последовательности независимых и одинаково распределенных случайных величин. Псевдопуассоновский процесс определяется тем же способом,, но теперь случайные величины So, Sf, ,.. образуют марковскую цепь, переходные вероятности которой за- даются стохастическим ядром К (см. гл. VI, И). Случайные величины X(/) = Sn(o образуют новый случайный процесс, кото- рый формально можно описать следующим образом. В промежутке между скачками пуассоновского процесса ти- пичная выборочная функция остается постоянной. Переход из х в Г может произойти за 0, 1, 2, ... шагов, и, следовательно, Qt(x, Г) = е~“']£ Г), />0. (1.2) /2 = 0 Обобщенное пуассоновское распределение гл. VI, (4.2), получается из этой формулы как частный случай, когда Q совпадает со всей прямой и Sn представляет собой сумму независимых случайных величин с одним и тем же распределением F. Правило композиции Ql+X(x, Г)= ^Qt(x, dy)Qx(y, Г) (1.3) (/, т > 0), аналогичное гл. VI, (4.1), легко проверить аналитиче- ски х). Оно называется уравнением Чепмена—Колмогорова и утверждает, что переход от состояния х в момент 0 во множество Г в момент /-ф-т происходит через некоторую точку у в момент т и что последующее движение не зависит от прошлого* 2) [см. 1; гл. XVII, 9, а также гл. VI, (11.3)]. х) Аппроксимация Q/ и <?тих частными суммами с п членами показывает, что правая часть в (1.3) клевой части, но ^n-й частной суммы Qt+% < I 2) Иногда объявляют (1.3) либо законом природы, либо формулой полной вероятности. Но (1.3) не выровняется для немарковских процессор; см» гл, XV, 13, -
368 Гл. X* Марковские процессы и полугруппы Примеры, а) Частицы, движущиеся со столкновениями. Рас- смотрим частицу, движущуюся с постоянной скоростью в одно- родной среде и время от времени подвергающуюся случайным соударениям. Каждое из них приводит к изменению энергии, описываемому стохастическим ядром К. Если число соударений образует пуассоновский процесс, то переходные вероятности для энергии X(Z) имеют вид (1.2). Этот случай имеет место при хо- рошо знакомых нам предположениях пространственной однород- ности и отсутствия последействия. Обычно предполагают, что доля энергии, теряемая при каж- дом соударении, не зависит от ее начальной величины. Это озна- чает, что К(х, dy) = V {dy/x}, где V—распределение вероятностей, сосредоточенное на 0, 1. Имея в виду последующие применения, рассмотрим частный случай V(x) = xK. Тогда Д' имеет плотность k{x, у) = Кх'‘хук^1, 0<^<х. (1.4) При X—1 наше предположение означает, что доля теряемой энергии распределена равномерно1). Итерированные ядра Д(я) были вычислены в гл. VI, (11.5). Подставляя их значение в (1.2), ви- дим, что Qt имеет атом веса e~ai в нуле (соответствующий отсут- ствию соударений), а при 0 < у < х имеет плотность у) = e~at Л (2 * * atK log М’ (15) где Д—функция Бесселя^ введенная в гл. II, (7.1) [см. при- меры 2, а) и 2, б)]. б) Потеря энергии быстрыми частицами при ионизации2). Поучительный вариант предыдущего примера получается в пре- дельном случае, когда энергию частицы предполагают бесконечно большой. Потери энергии при последовательных соударениях будут представлять собой независимые случайные величины с одним и тем же распределением V, сосредоточенным на 0, оо. Пусть X (t) обозначает полную величину потерянной за время О, t энергии. Тогда случайные величины Х(/) образуют обобщен- ный пуассоновский процесс. Переходные вероятности для него определяются по (1.2) с заменой Д(я) на свертку Vя*. в) Изменение направления. Вместо энергии частицы мы можем рассмотреть направление ее движения и построить модель, по- 3) Это предположение использовано Гейтлером и Яноши (Heitler W., Janossy L., Absorption of meson producing nucleons, Proc. Phys. Soc., Ser. A, 62 (1949)i 374—385. В этой статье введено (но не решено) уравнение Фоккера—Планка (1.8). 2) См. статью: Ландау Л. Д., J. Phys., USSR, 8 (1944), 201—205. Ландау использует другую терминологию, но его предположения равносильны нашим, Ландау вывел прямое уравнение (1,6)*
§ 2» Вариант линейные приращения 369 добную приведенной в примере а). Основное различие будет в том, что направление в 513 определяется двумя величинами, так что плотность ядра k будет зависеть от четырех вещественных пе- ременных. г) Рандомизированное случайное блуждание примера гл, II, 7, в) представляет собой псевдопуассоновский процесс, состояниями которого служат целые числа. При фиксированном х ядро К приписывает вес 1/2 каждой из двух точек х± 1. Из (1.2) легко получаем г) ^_aQt(X| D + ajQJx, dz)K(z, Г). (1.6) Это—прямое уравнение Колмогорова1), которое (в более общей постановке) будет обсуждаться в § 3. Там будет показано, что (1.2) является единственным решением, удовлетворяющим естест- венным вероятностным требованиям. Если К имеет плотность k, то уравнение (1.6) принимает более привычную форму. В точке х распределение Qt имеет атом веса равный вероятности отсутствия изменений. Если исключить этот атом, то Qt будет иметь плотность qt, удовлетворяющую уравнению — a<?f(x, g)4-ay<7f(x, z)k(z, Qdz. (1.6а) Если ц0—распределение вероятностей в момент 0, то распре- деление в момент t определяется по формуле {г} = $ Но {dx} Qt (х, Г) (1.7) и в силу (1.6) = -a|if {Г} + a j {dz} к (г, Г). (1.8) Этот вариант (1.6) известен физикам под названием уравнения Фоккера—Планка (или уравнения неразрывности). Это уравнение будет проанализировано в § 3. В случае когда К и начальное распределение р,0 имеют плотности, также имеет плотность mt и уравнение Фоккера—Планка принимает вид = —ocmf (%) + a j mt (г) k (г, Qdz. (1.8а) § 2. ВАРИАНТ: ЛИНЕЙНЫЕ ПРИРАЩЕНИЯ В физике, теории очередей и других применениях встречается один вариант рассмотренного нами процесса. Предположения, касающиеся скачков, остаются теми же самыми, но между скач* >х) Относительно терминологии см, сноску в конце 1; гл, XVII, Ъ'—Прим. серев.
370 Гл. X. Марковские процессы и полугруппы ками X (/) изменяется линейно со скоростью с. Это означает, что величины Х(/)—ct образуют уже описанный псевдопуассоновский процесс; обозначим переходные вероятности нового процесса через Qt. Тогда вероятности Qt (х. Г-|-с/) должны удовлетворять (1.6). Получающееся отсюда уравнение для Qt имеет необычную форму, однако если существуют дифференцируемые плотности, то они удовлетворяют привычным уравнениям. Так, для mt мы должны заменить | в (1.8а) на % + ct. После замены y = % + ct получим уравнение Фоккера—Планка г) -= —с дт*д^—amt (</) + « j mt (г) k (z—ct, y—ct)dz. (2.1) Уравнение, аналогичное (1.6а), получается простым добавлением члена —cdqt/dy в правой части. В связи с теорией полугрупп мы придадим уравнению Фок- кера—Планка более гибкую форму, не зависящую от неестествен- ных условий дифференцируемости [см. пример 10, б)]. Примеры, а) Частицы, испытывающие соударения. Пример 1,а) встречается в физической литературе обычно в другой поста- новке. Предполагается, что между соударениями энергия рас- сеивается с постоянной скоростью благодаря поглощению или трению. Модель (2.1) подходит к этой ситуации, если потеря энергии пропорциональна плотности вероятности mt энергия в момент t. В других ситуациях физики предполагают, что между соударениями энергия рассеивается со скоростью, пропорциональ- ной ее мгновенному значению. В этом случае логарифм энергии убывает с постоянной скоростью. б) Звездное излучение2). В этой модели переменная t обозна- чает расстояние, а X (/)— интенсивность светового луча, прохо- дящего в пространстве. Предполагается, что (в экваториальной плоскости) каждый элемент объема порождает излучение постоян- х) Многие частные случаи уравнения Фоккера — Планка (1.8) были откры- ты независимо друг от друга. Много энергии было затрачено на обобщение (2.1). Общая теория уравнений Фоккера — Планка была развита Колмогоровым в его известной работе «Об аналитических методах в теории вероятностей» (Math. Ann., 104 (1931), 415 — 458, перевод в Успехах Матем. Наук, 5(1938), 5—41). В этой работе Колмогоров отмечает возможность добавить к правой части произвольный «диффузионный член» •V d2mt г dmt 7 ду2 ду ’ Формула (2.1) представляет собой лишь частный случай этой более общей формулы. Уже первые теоремы существования охватывали случай нестацио-г парного общего уравнения [Feller W., Math. Ann., 113 (1936)]. 2) Физические предпосылки взяты из статьи: В. А. Амбарцумян. О флукт туациях яркости Млечного пути, ДАН СССР, 44 (1944), 223—226. В этой статье косвенным путем получен один вариант (2,1),
§ 3. Скачкообразные процессы 371 ной интенсивности и, следовательно, Х(/) возрастает линейно. Но в пространстве также размещены поглощающие черные обла- ка, которые мы будем представлять себе в виде пуассоновского множества точек. Встречая облако, каждый луч теряет (случай- ную) часть ^интенсивности, так что мы оказываемся в точности в тех условиях, которые привели нас к (2.1). Кажется правдо- подобным (и на самом деле это может быть доказано), что плот- ность mt величины X (Z) приближается к стационарной плотности т, которая не зависит от t и удовлетворяет (2.1) с левой частью, замененной нулем. Амбарцумян предполагает, в частности, что потеря интенсив- ности при прохождении отдельного облака регулируется переход- ным ядром (1.4). В этом случае явный вид решения содержится в (1.5), но он представляет вторичный интерес. Более важен (и легко проверяется) тот факт, что (2.1) имеет не зависящее от времени (или стационарное) решение, задаваемое гамма-плотностью т(^) = (тУ+1Т(Хттгу>'е"(и/с,у’ y>Q' (2>2) Этот результат показывает, что относящаяся к делу информация может быть получена из (2.1), даже минуя отыскание явного ре- шения. Например, легко найти прямым интегрированием, что стационарное решение имеет математическое ожидание с[а(1—р)]’1, где р—математическое ожидание для распределения поглощаемой энергии V. в) Задача о разорении из гл. VI, 5, представляет собой част- ный случай, в котором ядро k зависит от разности аргументов. Значения этого процесса получаются добавлением —ct к значе- ниям некоторого обобщенного пуассоновского процесса. Аналогич- ные «задачи о разорении» могут быть сформулированы для лю- бого псевдопуассоновского процесса. Они приводят к уравнению (2-1). § 3. СКАЧКООБРАЗНЫЕ ПРОЦЕССЫ В псевдопуассоновском процессе время ожидания следующего скачка имеет фиксированное показательное распределение с ма- тематическим ожиданием 1/а. Мы приходим к естественному обобщению, допуская, что это распределение может зависеть от значения Х(/) (в данный момент (в примере 1, а) это сводится к предположению, что вероятность столкновения зависит от энергии частицы). Марковский характер процесса требует, чтобы распре- деление времени до следующего скачка было показательным, но его математическое ожидание может зависеть от значения Х(^) в данный момент. В соответствии со сказанным мы введем сле- дующие
372 Гл. X. Марковские процессы и полугруппы Основные постулаты. При условии X(t) = x время ожидания следующего скачка имеет показательное распределение с матема- тическим ожиданием 1/а(х) и не зависит от прошлого. Вероят- ность того, что следующий скачок приводит к значению из не- которого множества Г, равна 7<(х, Г). В аналитических терминах эти постулаты сводятся к инте- гральным уравнениям для вероятностей перехода Qf(x, Г) рас- сматриваемого процесса (в предположении, что такой процесс на самом деле существует). Рассмотрим фиксированную точку х и фиксированное множество Г, не содержащее х. Событие {Х(/)£Г} может произойти только при условии, что первый скачок из х произошел в некоторый момент s < t. При этом условии услов- ная вероятность события {X (/) £Г} получается интегрированием 7<(х, dy)Qt_s(y, Г) по множеству Q всех возможных значений у. Теперь момент первого скачка—это случайная величина с пока- зательной плотностью а(х)е“а <*)s. Интегрируя по отношению к этой плотности, мы получаем вероятность события {Х(0€Г} в форме t Qt(x, Г) = а(х) $e-a<*>sc's ^К(х, dy)Qt_s{y, Г). (3.1а) о Q Для множества Г, содержащего х, мы должны добавить вероят- ность того, что до момента t не произойдет ни одного скачка. Мы получим t Qt(x, Г) = е-а w^a(x) ^e-“Wsds J K(x, dy) Qt_s(y, Г). (3.16) о £ Эти два уравнения, справедливые при х£Г и х£Г соответствен- но, являются аналитическими эквивалентами основных постула- тов. Они упрощаются при переходе к новой переменной интегри- рования т = /—s. Дифференцирование по t приводит оба уравнения к одинаковому виду, и тогда пара уравнений заменяется одним интегро-дифференциальным уравнением dQt (Хд; Г)- ~ -а (X) Qt (х, Г)+а (X) J Д’ (х, dy) Qt (у, Г). (3.2) О Это не что иное, как обратное уравнение Колмогорова, которое служит отправной точкой для аналитического подхода к задаче, так как позволяет избежать раздражающего различия между двумя указанными случаями. Обратное уравнение (3.2) допускает простую интуитивную интерпретацию, которая позволяет представить основные посту, латы в более близких к практике термина^ В терминах разно».
§ 3. Скачкообразный процессы 373 стных отношений (3.2) равносильно соотношению Qt+ь (X, Г) = [1 -а (X) h] Qt (х, Г) + + a(x)/i ^К(х, dy)Qt(y, T)-|-o(/i). (3.3) Q Для интуитивной интерпретации последнего рассмотрим измене- ние состояния на временном интервале 0, t + h как результат изменения за короткий интервал 0, h и последующего изменения в интервале h, t-\-h длины t. Тогда, очевидно, (3.3) утверждает, что если Х(0) = л;, то вероятность одного скачка в интервале О, h равна a(x)h-\-o(h), а вероятность большего числа скачков равна o(h). Наконец, если на 0, h скачок происходит, то услов- ные вероятности тех или иных переходов определяются мерой К (х, dy). Эти три постулата приводят к (3.3), а тем самым и к (3.2). По существу, они повторяют основные постулаты1). С вероятностной точки зрения обратное уравнение представ- ляется несколько искусственным, так как в нем окончательное состояние Г играет роль параметра и (3.2) описывает зависимость Qt(x, Г) от начального положения х. Казалось бы более естест- венным получить уравнение для Qt+h, разбивая интервал 0, t-\-h на длинный начальный интервал 0, t и короткий конечный интер- вал /, Вместо (3.3) мы получим формально Qt+h(x, Г)= j Qt(x, dz)[l—a(z)ft]-f* Г + j Qt (x, dz) a (z) hK (г, Г) о (ft), (3.4) и, следовательно, —= - j Qt (X, dz) a (z) + J Qt (x, dz) a (z) К (z, Г). (3.5) Г Й Это—прямое уравнение Колмогорова (в частном случае извест- ное физикам, как уравнение неразрывности или уравнение Фок- кера—Планка). Оно сводится к (1.6), когда а не зависит от г. Формальный характер приведенного вывода мы подчеркнули потому, что на самом деле прямое уравнение не вытекает из наших основных постулатов. Это объясняется тем, что величина о (h) в (3.3) зависит от г, и так как z служит в (3.4) переменной интегрирования, то эта величина должна была бы стоять под J) Дифференцируемость по отношению к t и тот факт, что вероятность более чем одного скачка равна о (Я), теперь принимаются в качестве новых постулатов; в то же время они вытекают из прежней более сложной форму* лировки.
374 Гл. X. Марковские процессы и полугруппы знаком интеграла. Но тогда возникает вопрос о том, сходятся ли интегралы в (3.5) и законен ли предельный переход при h—>0. [Ни одно из этих затруднений не возникает в связи с обратным уравнением, так как начальное состояние х при этом фиксировано и интеграл в (3.2) существует в силу ограничен- ности Qf.] Прямое уравнение можно обосновать, добавляя к нашим ос- новным постулатам необходимое ограничение на остаточный член в (3.3), но такой вывод перестал бы быть интуитивно привлека- тельным. Кроме того, кажется невозможным сформулировать условия, которые охватывали бы все типичные случаи, встречаю- щиеся на практике. Если допустить, что функция а может быть неограниченной, то существование интегралов в (3.5) сомнительно и уравнение нельзя обосновать априори. С другой стороны, об- ратное уравнение есть необходимое следствие основных предпо- ложений. Поэтому в качестве отправной точки лучше использо- вать его, а затем исследовать, в каких условиях из него может быть выведено прямое уравнение. Решение обратного уравнения легко построить, используя последовательные приближения, имеющие простой вероятностный смысл. Обозначим через Q{tn) (х, Г) вероятность перехода из Х(0) = х в Х(0бГ с не более чем п скачками. Переход без скач- ков возможен, только если х£Г, и, так как время пребывания в х имеет показательное распределение, мы имеем Q(/> (х, Г) = е~а w * ZC(0) (х, Г) (3.6) (где К(о) (х, Г) равно 1 или 0 в зависимости от того, входит х в Г или нет). Предположим затем, что первый скачок происходит в момент s < t и приводит из х в у. Суммируя по всем возмож- ным s и г/, мы получаем [как и в (3.1)] рекуррентную формулу t Q<"+1)(X> r) = Q(0) n+J^w^afxJdspCCx, dr/)Q£>s(^, Г), 0 (3-7) верную при n=0, 1, ... . Очевидно, что QT QT, и по индук- ции Q?’ QT <= • • • • Мы видим, что при каждых х и Г существует предел QT>(x, Г)=я lim QT(x, Г), (3.8) Д->00 но он может быть в принципе бесконечным. Мы покажем, что QT'(x, Q)<1, (3.9) откуда будет вытекать (х, Г) < 1 для всех множеств из Й. Для этого достаточно доказать, что при всех п QT(x, Q)CL (3.10)
§ 3. Скачкообразные процессы 375 При п = 0 неравенство тривиально, и мы используем индукцию. Предполагая (3.10) справедливым при некотором фиксированном п, мы получим из (3.7) [вспоминая, что 7<—стохастическое ядро] t Q(tn+1)^ &)< Je-“Wsa(x)ds = l. (3.11) О Следовательно, (3.10) выполняется при всех п. Из (3.7) в силу монотонной сходимости следует, что Q]"’ удов- летворяет обратному уравнению в исходной интегральной форме (3.1) [и, следовательно, в интегро-дифференциальной форме (3.2)]. Очевидно, что для любого другого положительного решения Qt уравнения (3.1) справедливо Qt^Q)0); сравнивая (3.1) с (3.7), заключаем, что Qt Q(tm при всех п и поэтому Qf Q(f \ По этой причине Q]"* называется минимальным решением обратного урав- нения; из (3.9) следует, что QJ”’ является стохастическим или субстохастическим ядром. Из (3.8) вытекает, что Q]“’ (х, Г) есть вероятность перехода из х в Г с конечным числом скачков. Соответственно для суб- стохастического решения Q)00’ дефект 1—(х, й) представляет собой вероятность того, что при переходе из х как начальной точки за время t может произойти бесконечно много скачков. Из 1; XVII.4, и примера 5, в) гл. VIII нам известно, что это свойственно некоторым процессам чистого размножения, и, следо- вательно, субстохастические ядра существуют, но они являются скорее исключением, чем правилом. В частности, если коэффи- циент а(х) ограничен,, то минимальное решение—строго стохас- тическое, т. е. СЦГ(х, й) = 1, 2>0. (3.12) Действительно, если а (х) < а < оо при всех х, то мы покажем, используя индукцию, что Q(tm(x, Й)> 1— (1— e~at)n (3.13) при всех пи t > 0. При п = 0 это неравенство тривиально. Пред- положим, что оно справедливо при некотором п. Заметим, что правая часть (3.12) есть убывающая функция, которую мы обо- значим f(t), и рассмотрим (3.7) с Г = Й. В силу (3.13) внутрен- ний интеграл в (3.7) ^/(/). Так как f(t) не зависит от перемен- ной интегрирования, то, интегрируя a(x)e_“Ws, приходим к вы- воду, что (3.13) выполняется и при замене п на п-|-1. 1 Наконец, отметим, что в строго стохастическом случае (3.12) минимальное решение единственно. В самом деле, в силу мини- мальности Qp°’ любое другое приемлемое решение должно удов- летворять цепочке соотношений ; J > Qt (х, Й) = Qf (х, Г) + Qf (х, Й-Г) > > Qt”’ (*, Г) + Q]“> (х, Й-Г) = (х, й) 1, (3.14)
376 Гл. X. Марковские процессы и полугруппы что невозможно, если только знаки неравенства в двух местах не заменить равенствами. Таким образом, мы доказали теорему. Теорема. Обратное уравнение допускает минимальное реше- ние определяемое формулой (3.8) и соответствующее процес- су, в котором переходы из х в Г происходят только с конечным числом скачков. Ядро Q(/oo) является стохастическим или субсто- хастическим. В субстохастическом случае дефект 1 — (х, Q) представля- ет вероятность того, что за конечное время t произойдет беско- нечно много скачков, и в этом случае минимальный процесс обры- вается. В строго стохастическом случае (3.12) минимальное решение есть единственное вероятностное решение обратного уравнения. Эта ситуация возникает, когда коэффициент а (%) ограничен. Обнаружение несобственных решений произвело шок на ранней стадии развития теории в 1930-х годах, но и стимулировало ис- следования, приведшие к цельной теории марковских процессов. Процессы, в которых переходы из х в Г возможны после беско- нечного числа скачков, допускают аналогию с диффузионными процессами с граничными условиями и потому не так патологичны, какими казались вначале. Возможность появления бесконечного числа скачков объясняет также трудности, возникающие при не- посредственном 2) выводе прямых уравнений. Обратные уравнения были выведены на основе предположения о том, что при данном положении х в настоящий момент время ожидания следующего скачка имеет показательное распределение с математическим ожи- данием 1/а(х). Прямые уравнения зависят от положения именно до момента t и поэтому зависят от пространства Q в целом. В частности, нелегко непосредственно выразить условие существо- вания последнего скачка до момента t. Однако в приложении в конце этого параграфа будет показано, что минимальное решение QJ00) обратного уравнения автоматичес- ки удовлетворяет прямому уравнению и является минимальным также и для него. Отсюда, в частности, следует, что если а ог- раничено, то Q^0O) представляет собой единственное решение пря- мого уравнения. Если QJ0O)—субстохастическое ядро, то сущест- вуют различные процессы, включающие переходы с бесконечным числом скачков и удовлетворяющие обратным уравнениям. Пере- ходные вероятности таких процессов могут, но не обязаны удовлетворять прямым уравнениям. Этот неожиданный факт пока- зывает, что прямые уравнения могут удовлетворяться в ситуациях, когда вывод уравнения из (3.4) терпит неудачу. В заключение снова отметим, что (по контрасту с процессами § 2 и диффузионными процессами, в которых используется диф- *) Ср, с аналогичным рассуждением в 1; XVII ,9*
§ 3. Скачкообразные процессы 377 ференцирование по х) чисто скачкообразные процессы никоим образом не зависят от природы пространства состояний и наши формулы применимы для любого множества Q, на котором опре- делено стохастическое ядро К. Пример. Счетные пространства состояний. Если случайные величины X (I) положительны и целочисленны, то основное выбо- рочное пространство (пространство состояний) состоит из чисел 1,2, ... . Теперь достаточно знать вероятности Pik(t) перехода от одного целого числа к другому. Все прочие переходные веро- ятности получаются суммированием по k. Теория подобных мар- ковских процессов была намечена в 1; гл. XVII, 9, где рассмат- ривались и нестационарные переходные вероятности. Чтобы выделить внутри этой теории стационарный случай, следует считать коэф- фициенты q и вероятности pik постоянными (не зависящими от /). Тогда прежние предположения становятся равносильными приня- тым здесь и, как легко видеть, две системы уравнений Колмо- горова, полученные в 1; гл. XVI 1,9, становятся частными слу- чаями уравнений (3.2) и (3.5) [с заменой ex (Z) на ct и Д'(г, /) на pif\. Расходящийся процесс размножения из 1; гл. XVII. 4, служит примером процесса с бесконечным числом скачков за конечный промежуток времени. Мы вернемся к этому процессу в гл. XIV, 8, чтобы продемонстрировать возможность перехода из состояния i в состояние /, включающего бесконечное число скачков. Приложение1). Минимальное решение прямого уравнения. Конструкция минимального решения Q/00> обратного уравнения может быть приспособлена для прямого уравнения. Мы в краткой форме укажем, как это может быть сделано и каким образом можно проверить, что оба решения в действитель- ности идентичны. Детали доказательства предоставляются читателю, Пусть Kf (x,V)=^e~My'ltK(x,dy). (3,15) Г Для построения решения прямого уравнения определим Q/0) равенством (3,6) и положим t QT+V Г) -- сГ (X, Г) + J J Qt- S (X, dy) а (у) К* (у, Г). ’ (3,16) О Это равенство задает вероятности перехода за не более чем л-f-l шагов в терминах последнего скачка точно так же, как (3.7) имеет отношение к первому 2) Та же теория, использующая преобразования Лапласа, дана в гл. XIV, 7, (Только для упрощения рассматриваются счетные пространства, хотя рас- суждения применимы и в общем случае без существенных изменений.) Непо- средственный метод, данный в тексте, менее элегантен, но обладает тем пре- имуществом, что он применим и к нестационарным процессам, переходные вероятности которых зависят от временного параметра. Общая теория была развита Феллером, см.: Feller W., Trans. Amer, Math. SocfJ vol, 48 (1940)j 488—515 (поправка vol, 58, 474),
378 Гл. X. Марковские процессы и полугруппы скачку. Повторяя доказательство последней теоремы, выводим, что = s=- lim есть минимальное решение прямого уравнения» Хотя мы и использовали те же самые буквы, но обе рекуррентные фор- мулы (3.7) и (3.16) получены независимо одна от другой, и пока ниоткуда не следует, что полученные ядра идентичны. Чтобы показать, что это на самом деле так, положим P/n, = Q(^) — , что соответствует переходам ровно за п шагов. Тогда (3,16) сводится к t Pin+1) (х, Г) = J J P£’s (x, dy) а (у) К* (у, Г). (3,17) 0 Мы запишем (3.17) с помощью сокращенного обозначения: Р(”+1> = Р/П)?ГФ Рекуррентную формулу (3,7) мы запишем подобным образом; P{tn+1)^ Величина одна и та же в любом случае и определена в (3.6). Докажем теперь, что обе рекуррентные формулы приводят к одному результату. Более точно, мы докажем, что Pfn\ определенные соотношением Р/л+1) = Р/'г>3(, удовлетворяют соотношению Р(/г+1)==^Р(/г). Доказательство проведем по индук- ции, Предположим, что утверждение справедливо при всех Тогда р(гг+1)==р(г)Щ = (^р(г-1)) и таким образом предположение индукции справедливо и при л = г+1. Мы доказали, следовательно, что минимальное решение является общим для обратного и прямого уравнений* § 4. ДИФФУЗИОННЫЕ ПРОЦЕССЫ В Я® Покончив с процессами, в которых все изменения происходят скачками, мы обратимся к другому крайнему случаю.,, к процес- сам, у которых (с вероятностью единица) выборочные функции непрерывны. Их теория похожа на развитую в предыдущем пара- графе, однако основные уравнения требуют более сложного ана- лиза. Мы удовлетворимся поэтому выводом обратного уравнения и кратким резюме результатов, относящихся к минимальным решениям и другим проблемам. Прототипом диффузионных про- цессов служит броуновское движение (или винеровский процесс). Это процесс с независимыми нормально распределенными прира- щениями. Его переходные вероятности имеют плотности ^(%,//), которые нормальны с математическим ожиданием х и дисперсией at, где а>0—некоторая постоянная. Эти плотности удовлетво- ряют обычному уравнению диффузии у) ___ 1 „ d*qt(x,y) dt 2а дх2 • V*-1' Мы покажем теперь, что и другие переходные вероятности удов- летворяют соответствующим уравнениям в частных производных. Цель этого вывода—дать представление о типах процессов и о возникающих задачах, т. е0 он должен служить начальным шагом. Вследствие этого мы не будем тратить усилий на достижение общности и полноты изложения.
§ 4. Диффузионные процессы в др 37$ Из предположенной нормальности распределений очевидно, что в броуновском движении приращения за короткий промежу- ток времени длины t обладают следующими свойствами: (i) при фиксированном б > 0 вероятность смещения, превосходящего б, равна о (t)\ (ii) математическое ожидание смещения равно нулю; (iii) его дисперсия равна at. Мы сохраним первое требование, а два других приспособим к условиям неоднородной среды. Иначе говоря, мы допустим, что а зависит от х, и допустим ненулевое среднее смещение. В этой обстановке математическое ожидание и дисперсия смещения уже не будут в точности пропорциональны t, и мы можем лишь постулировать, что при данном Х(т) = х сме- щение Х(/ + т)—X (т) имеет математическое ожидание и дисперсию а (%) t + о (/). Моменты не обязаны существовать, но, имея в виду первое требование, естественно рассмотреть урезан- ные моменты. Мы приходим к следующим постулатам. Постулаты *) относительно переходных вероятностей Qt. При каждом б > 0 при t —> О | j Qt(x,dy)-^, (4.2) \У~Х |^б 4 j (.У—x)Qt(x, dy)—> b(x), (4.3) 1 у-Х I < 6 4 j (У—х)* Qt(x, dy)—>а(х). (4.4) I У-х\<6 Заметим^ что если (4.2) верно при всех б > 0, то асимптотичес- кое поведение величин в левой части (4.3) и (4.4) не зависит о? 6, Возможно поэтому в последних двух соотношениях заменить о на 1. Первое условие делает мало вероятными большие смещения и было введено в 1936 г. в надежде, что оно необходимо и доста- точно для непрерывности выборочных функций* 2). Оно было на- звано именем Линдеберга ввиду сходства с его условием приме- нимости центральной предельной теоремы. Можно показать, что при довольно слабых предположениях о регулярности переходных вероятностей существование пределов в (4.3) и (4.4) на самом деле вытекает из условия Линдеберга (4.2). Мы не будем обсуж- дать подобные детали, так как сейчас мы не интересуемся си^те-' х) Первый вывод (4.1) из вероятностных предположений принадлежит Эйнштейну. Первый вывод обратного уравнения (4.6) и прямого уравнения (5.2) был дан в известной работе А. Н, Колмогорова 1931 г, (см. § 2). Усо- вершенствованный вариант постулатов^ данный здесь, принадлежит Феллеру (1936). Феллер же доказал первые теоремы существования и исследовал связь между двумя уравнениями. 2) Это предположение было подтверждено Д, Рэем (D. Ray),
j38O Гл. X. Марковские процессы и полугруппы матическим развитием теории1). Наша цель очень умеренна—, объяснить природу и эмпирический смысл диффузионных уравне- ний в простейшей ситуации. На пути к ней мы покажем формально, как из (4.2)—(4.4) можно вывести некоторые дифференциальные уравнения. Мы, однако, не будем обсуждать, когда существует решение этих уравнений2). Поэтому мы допустим, что коэффици- енты а и b суть ограниченные непрерывные функции и а (х) > 0. В качестве пространства состояний мы возьмем конечный или бесконечный интервал I на прямой и, как и ранее, будем при- держиваться следующего соглашения: если пределы не указаны, то интегрирование производится по всем I. Для упрощения записи и в качестве подготовительного шага для применения тео- рии полугрупп мы введем преобразования «(Л х)= J Qt(x, dy)u9(y), (4.5) переводящие (при фиксированном t) ограниченную непрерывную «начальную функцию» н0 в функцию3) со значениями u(t, х). Ясно, что, зная правую часть (4.5) для всех начальных функ- ций ы0, мы можем однозначно определить Qf. Теперь мы покажем, что при очень слабых условиях регулярности функция и должна удовлетворять обратному уравнению ди_______________________ 1 д2и .<ди di~~2a дх? + обобщающему стандартное уравнение диффузии (4.1). Мы ищем функцию и, удовлетворяющую (4.6) и такую, что u(t, х)—>ы0(х) при t—*0. В случае единственности это решение необходимо имеет вид (4.5) и Qt называется функцией Грина данного уравне- ния. Случаи, когда единственности нет, будут рассмотрены в сле- дующем параграфе. Чтобы получить обратное уравнение (4.6), мы отправимся от тождества u(s-\-t, х)= J QJx, dy)u(t, у), s,t>0, (4.7) которое очевидным образом следует из уравнения Чепмена—Кол- (4.6) з-) Современная теория полугрупп позволила автору получить наиболее общую форму обратного уравнения (или производящего оператора) для мар- ковских процессов, удовлетворяющих требованию типа условия Линдеберга. Классические дифференциальные операторы заменяются при этом их модер- низированными вариантами: роль коэффициента b играет «естественный масш- таб» (natural scale), а роль а играет «мера скорости» (speed measure). Такие процессы были объектом плодотворных исследований Дынкипа и его школы,- . с одной стороны, и К» Ито и Г, Маккина—с другой, Теория изложена в книгах авторов. 2) Исследование диффузионных уравнений о помощью преобразования ’ Лапласа в гл. XIV, 5. ?) В терминах теории случайных процессов и (t-y х) есть условное мате- матическое ожидание (X (£)) при гипотезе X(ty^x>
§ 4. Диффузионные процессы в др 381 - могорова (1.3). При /i>0 из (4,7) выводим П< UJt + h,X)-U (Z, j (х, dy) [» (/, у)_и (/, х)]. (4.8) Допустим теперь, что вероятности перехода Qt достаточно регу- лярны, во всяком случае, что функция и в (4.5) имеет две огра- ниченные непрерывные производные по х (хотя бы для бесконечно дифференцируемой и0). При фиксированных х и 8 > 0 найдется в силу формулы Тейлора такое б > О, что | и (t, у)—и (t, x)-(y-x)^^i^-l(//-x)^^^|<e|//-x|^ (4.9) при всех \у—х|^б. Выбрав таким образом б, рассмотрим в (4.8) отдельно интегралы по области | у—х | > б и области \у—х|<Д Первый интеграл стремится к нулю в силу условия Линдеберга (4.2) и ограниченности и. Благодаря условиям (4.3) и (4.4) ясно, что при достаточно малых h второй интеграл отличается от правой части (4.6) менее чем на 8-а(х). Так как 8 произвольно, это означает, что при /г—>0 правая часть (4.8) сходится к правой части (4.6). В соответствии с этим существует по крайней мере правая производная и она удовлетворяет (4.6). Главный вывод изложенной теории состоит, грубо говоря, в следующем. Если переходные вероятности марковского процесса удовлетворяют усло- вию непрерывности (4.2), то процесс определяется коэффициен- тами Ь и а. Это утверждение звучит как чисто теоретическое, но в практических ситуациях именно коэффициенты b и а зада- ются априори, исходя из их эмпирического смысла и характера процесса. Для объяснения смысла b и а рассмотрим приращение Х(£4-т)— — X (т) за короткий промежуток времени, предполагая, что Х(т)=х. Если бы моменты в (4.3) и (4.4) не были урезаны, это прира- щение имело бы условное математическое ожидание b (х)/ + о (/) и условную дисперсию a(x)t—b2(x)t2+o(t)==a(x)t+o(t). Таким образом, Ь(х) служит мерой локальной средней скорости смещения (которая может быть нулем по причинам симметрии), а а(х) служит мерой дисперсии. Мы будем называть b инфинитезимальной ско- ростью (сносом), а а—инфинитезимальной дисперсией. Следующие примеры показывают, как определяются эти коэф- фициенты в конкретных ситуациях. Примеры, а) Броуновское движение. Предположим, что прост- ранство (ось х) однородно и симметрично. Тогда а (х) не должно зависеть от х, а &(х) должно быть нулем. Мы приходим к клас- сическому уравнению диффузии (4.1). б) Процесс Орнстейна—Уленбека получается при воздействии упругой силы на совершающую броуновское движение частицу. Аналитически это означает наличие сноса по направлению к
382 Гл. X» Марковские процессы и полугруппы началу координат, причем величина сноса пропорциональна рас- стоянию от начала, т. е. &(х) =— рх, Так как это не изменяет инфинитезимальной дисперсии, то функция а(х) остается посто- янной, скажем равной единице. Обратное уравнение принимает вид ди (t, х) 1 д2и (t, х) ди (t3 х) «хчч dt Т di? рХ dic~ ’ V*-1U) Это уравнение решается удивительно легко. В самом деле, замена v (t, х) — и (/, хер‘) . приводит его к виду е2р'^т£’ <4J1) и последующая замена —(4.12) превращает (4.11) в стандартное уравнение диффузии (4.1). Отсюда следует, что переходные плотности qt (х, у) процесса Орнстейна— Уленбека нормальны с математическим ожиданием xe~pt и дис- персией т, определяемой по (4.12). В примере гл. III, 8, д) было показано, что процесс Орнстей- на— Уленбека, описываемый уравнением (4.10) и нормальным начальным распределением, является единственным стационарным нормальным марковским процессом со стационарными переходными вероятностями. (Броуновское движение включается сюда как частный случай при р = 0.) в) Диффузия в генетике. Рассмотрим популяцию, включающую различные поколения и имеющую постоянный размер N (типич- ный пример—поле зерновых культур). Имеется 2N генов, каждый из них принадлежит одному из генотипов. Обозначим Х„ долю генов типа А. Если нет преимуществ при отборе и не рассмат- ривается возможность мутаций, то гены (« + 1)-го поколения могут рассматриваться как случайная выборка объема 2N из совокуп- ности генов n-го поколения. Тогда Х„ будет марковским процес- сом, 0^Х„^1, и при условии, что Хп = х, распределение вели- чины 2/УХ„+1 будет биномиальным с математическим ожиданием 2Nx и дисперсией 2Ух(1—х). Изменение за одно поколение будет иметь математическое ожидание 0 и дисперсию, пропорциональ- ную х(1—х). Допустим теперь, что мы прослеживаем огромное число по- колений и вводим такую шкалу, что изменения представляются непрерывными. При такой аппроксимации мы будем иметь дело с марковским процессом, переходные вероятности которого удов- летворяют нашим основным условиям с Ь(х) = 0 и а(х), пропор- циональной х(1—х). Множитель пропорциональности зависит от выбора единицы измерения времени. Его можно считать равным 1<
§ 4. Диффузионные процессы в др> 383 Тогда (4.6) принимает вид = (4.13) и на этот раз процесс протекает на конечном интервале 0, 1. Влияние селекции и мутаций породило бы снос и привело бы к появлению в уравнении (4.13) члена первого порядка. Генети- ческую модель, математически равносильную нашей, предложили Р. Фишер и С. Райт, однако их рассуждения были другими. Генетические выводы в какой-то степени сомнительны в силу предположенной неизменности размера популяции. Эффект этого допущения не всегда правильно оценивается. Правильная модель1) приводит к уравнению с двумя пространственными переменными (частота генов и размер популяции). г) Рост популяции. Мы желаем описать рост большой попу- ляции, в которой индивидуумы статистически независимы и ско- рость размножения не зависит от размера популяции. Для очень большой популяции процесс приближенно непрерывен, т. е. опи- сывается диффузионным уравнением. Из независимости индивиду- умов следует, что инфинитезимальные скорость и дисперсия про- порциональны размеру популяции. Таким образом, процесс опи- сывается обратным уравнением (4.6) с а —ах и Ь = $х. Постоян- ные аир зависят от выбора единиц измерения времени и раз- мера популяции, и при подходящем выборе можно считать а=1 и р = 1, —1 или 0 (в зависимости от знака скорости). В 1; гл. XVII, (5.7), этот же самый рост популяции описы- вался дискретной моделью. Предполагалось, что при условии Х(т) = /г вероятности событий X (t Н-т) = п+ 1, п—1 и п отли- чаются от Л/г/, рл/ и 1—(Л-Гц) nt соответственно членами вида о(/), так что инфинитезимальная скорость и дисперсия равны (Л—ц)/г и (Л-f-ц) п. Диффузионный процесс получается простым переходом к пределу. Можно показать, что его переходные ве- роятности получаются предельным переходом из вероятностей в дискретной модели. Подобная аппроксимация дискретных процессов диффузион- ными процессами часто бывает весьма практичной. Типичным примером может служить переход от обычных случайных блуж- даний к диффузионным процессам, описанный в 1; XIV, 6 [про- должение см. в примере 5, а)]. § 5. ПРЯМОЕ УРАВНЕНИЕ. ГРАНИЧНЫЕ УСЛОВИЯ В этом параграфе мы для простоты предположим, что пере- ходные вероятности Qt обладают плотностью вероятности qu которая определяется плотностью стохастического ядра ^(х, у). *) Feller W., Second Berkeley Symposium on Math, Statist, and Probabi- lity, 1951, 227—246,
384 Гл. X. Марковские процессы и полугруппы Преобразование (4.5) и последующее обратное уравнение (4.6) описывают переходные вероятности как функции от начального положения х. С вероятностной точки зрения представляется более естественным считать начальную точку х фиксированной и рас- смотреть qt(x, у) как функцию конечной точки у. С этой точки зрения преобразование (4.5) должно быть заменено преобразованием v (s> У) = $ щ (х) qs (х, у) dx. (5.1) Здесь v0—произвольная плотность вероятности. Из стохастического свойства qt вытекает, что при любом фиксированном s > 0 пре- образованная величина v снова является плотностью вероятности. Иными словами, тогда как преобразование (4.5) переводит непре- рывные функции в непрерывные, новое преобразование превращает плотности вероятности в новые плотности. В предыдущем параграфе мы смогли показать с помощью вероятностных рассуждений, что преобразованная функция (4.5) удовлетворяет обратному уравнению (4.6). Даже при том, что новое преобразование более естественно с вероятностной точки зрения, аналогичный непосредственный вывод прямого уравнения невозможен. Однако общая теория дифференциальных уравнений в частных производных делает правдоподобным заключение о том, что v должно удовлетворять уравнению1) ==T7&ta(^v <s> v (s’ ^1- <5-2) В теории вероятностей последнее известно под названием пря- мого уравнения или уравнения Фоккера — Планка. г) Приводим неформальный набросок доказательства (5.2). Из уравнения Чепмена — Колмогорова (1.3) для переходных вероятностей следует, что интеграл J (s, у) и (t, у) dy зависит только от суммы $+/, Тогда Jdv (s, у) .. ч , С . ч ди (t, у) , —и (/, у) dy = ^v (s, у) —dyt (*) Выразим теперь du/dt в соответствии с обратным уравнением (4.6) и приме- ним к полученному в правой части (*) интегралу интегрирование по частям, Если обозначить правую часть уравнения (5.2) через R (s, у), то можно сде- лать вывод, что (*) равно J R (s, у) и (I, у) dy плюс некоторое выражение, зависящее только от величин w, v и их производ- ных, вычисленных на границах (или на бесконечности). При подходящих условиях эти граничные слагаемые могут быть отброшены и переход к пре- делу при t—► О приводит в таком случае к равенству j "°^=0>
$ 5. Прямое уравнение. Граничные условия 385 Сейчас мы покажем, какого рода информацию можно получить из (5.2) более легким путем, чем из обратного уравнения. Пример, а) Рост популяции. Пример 4, г) приводит к пря- мому уравнению (5, У) &yv (s, у) р dyv (s, у) /г г ds - а~д^--------Р ду • Можно доказать, что при данной начальной плотности v0 су- ществует лишь одно решение. Хотя для него трудно получить явные формулы, можно получить массу информации о нем прямо из уравнения. Например, чтобы вычислить математическое ожи- дание размера популяции М. (s), можно умножить (5.3) на у и проинтегрировать обе части по у от 0 до оо. Слева мы получим при этом производную Af'(s). Предполагая, что v стремится к нулю на бесконечности быстрее, чем I///2, и производя интегри- рование по частям, мы увидим, что правая часть равна (s). Таким образом, M'(s) = |3M (s), так что М (s) пропорционально e$s. Аналогичные формальные выкладки показывают, что дисперсия пропорциональна 2aP“M3sx X(e0s—1) [сравните с аналогичным результатом для дискретного случая в 1; гл. XVII, формулы (5.10) и (10.9)]. Конечно, эти вы- кладки требовали бы обоснования, но и на эвристическом уровне их нельзя было бы получить из обратного уравнения, минуя явное вычисление qf. |> Связь между прямым и обратным уравнениями подобна той, которая описана в § 3 для скачкообразных процессов. Мы дадим здесь без доказательства краткое перечисление результатов. Рассмотрим обратное уравнение (4.6) на открытом интервале х19 х2, который может быть конечным или бесконечным. Мы пред- полагаем, конечно, что а > 0 и что коэффициенты а и b доста- точно регулярны для того, чтобы (5.2) имело смысл. При этих условиях существует единственное минимальное решение Qt, такое, Если это справедливо для произвольной функции uQi то выражение внутри квадратных скобок должно быть равно 0, т. е. (5.2) должно быть справед- ливо. Это рассуждение оправдывается во многих имеющих практический интерес ситуациях, и тогда прямое уравнение (5.2) справедливо. Однако в так назы- ваемых процессах с возвращением [см. 1; XVII, 9] граничные члены, которыми мы пренебрегли, играют роль. Поэтому переходные вероятности таких про- цессов удовлетворяют обратным уравнениям (4.6), но не удовлетворяют (5.2); прямое уравнение имеет в этом случае другой вид. Заслуживает внимания также и то, что (5.6) бессмысленно без предполо- жения о дифференцируемости а и Ь, тогда как никаких подобных ограниче- ний по отношению к обратному уравнению нет. Справедливое прямое урав- нение может быть выписано, также и тогда, когда а и b не дифференцируемы, но тогда оно включает обобщенные дифференциальные операторы, о которых было упомянуто в сноске 1 на стр. 380, (43 № 249
386 гл, X, Марковские процёссь! и Полугруппы что (4.5) дает решение обратного уравнения (4.6). При фикси- рованных tnx ядро Qt(x, Г) может определять несобственное распределение. В любых обстоятельствах распределения Qf имеют плотности, и функция v, определяемая в (5.1), удовлетворяет прямому уравнению. На самом деле это решение будет минималь- ным в очевидном смысле слова (который был уточнен в § 3). В таком понимании прямое уравнение является следствием обрат- ного уравнения. Однако эти уравнения определяют процесс един- ственным образом только в случае, когда минимальное решение собственно. Во всех других случаях природа 'процесса опреде- ляется дополнительными граничными условиями. Характер граничных условий лучше всего может быть понят по аналогии с простым случайным блужданием на 0, оо, обсуж- давшимся в 1; гл. XIV. Можно принять различные соглашения относительно течения процесса после его возвращения в нуль. В задаче о разорении процесс на этом останавливается. В этом случае говорят, что нуль является поглощающим экраном. С дру- гой стороны, если нуль представляет собой отражающий экран, то частица мгновенно возвращается в точку 1 и процесс, таким образом, продолжается бесконечно. Следует подчеркнуть, что граничные условия нужны тогда и только тогда, когда граничная точка достижима. Событие «граничная точка х2 достигается ранее момента /» вполне определено для диффузионных процессов ввиду непрерывности их траекторий. Оно тесно связано по своему ха- рактеру с событием «до момента t происходит бесконечно много скачков» в скачкообразных процессах. В некоторых диффузионных процессах с вероятностью единица не достигается ни одна из граничных точек. Таково, например, броуновское движение [пример 4, а)]. В подобных случаях ми- нимальное решение является собственным распределением вероят* ностей и не существует иных решений. В других ситуациях процесс описывается минимальным решением лишь до момента достижения границы. Оно соответствует поглощающим границам, т. е. описы- вает процесс, который останавливается по достижении границ.’ Это наиболее важный тип процессов, и не только потому, что все остальные получаются из него, но и потому, что все ве- роятности первого прохождения состояний могут быть вычис- лены искусственным введением поглощающих барьеров. Этот метод широко применим, но мы объясним его на простейшем примере (он уже был нами неявно использован при изучении случайных: блужданий и в других местах, см., например, задачу 18 в 1J гл. XVII, 10). В последующих примерах мы сосредоточим наше внимание на простом уравнении (5.4). Более общие уравнения диффузии будут рассмотрены в гл. XIV, 5, с помощью методов, использующих преобразования Лапласа.
§ 5. Прямое уравнение. Граничные условия 387 Примеры, б) Один поглощающий барьер. Время первого про- хождения. Рассмотрим броуновское движение на 0, оо с погло- щающим барьером в нуле. Более точно, броуновское движение, начинающееся в точке х > 0 в момент 0, останавливается в мо- мент первого попадания в нуль. По причинам симметрии и обрат- ное, и прямое уравнения принимают вид классического уравне- ния диффузии 5м 1 52м ,к <5-4) Нужное граничное условие таково! <7/(0, у) = 0 при всех t (так же как и в примере случайных блужданий). Проверить это можно либо предельным переходом из формул 1; гл. XIV, 6, или исходя из минимального характера соответствующего решения. Найдем решение (5.4), определенное при t^Q, х^О, и такое, что ы (0, х) = ий(х) и u(t, 0) = 0, где и0—заданная функция. Его построение опирается на метод отражений, введенный Кельви- ном1). Доопределим ы0 на левой полуоси равенством иа (— х) = = — и0(х) и решим (5.4) с этим начальным условием на — оо, оо. По причинам симметрии решение должно удовлетворять условию u(t, 0) = 0. Ограничиваясь теперь лишь положительными х, мы найдем требуемое решение. Оно равно интегралу по 0, оо от функ- ции u^y)qt(x, у), где qt{x’ [ехр(--т)“ехр(—(5'5) Таким образом, функции qt совпадают с плотностями переходных вероятностей нашего процесса (t > 0, х> 0, г/> 0). Легко видеть, что при фиксированном у qt бу inert решением (5.4) с граничным условием 9/(0, у) = 0 [другой вывод, использующий общий прием, см. в примере 5, а) гл. XIV]. Интегрированием по у находим вероятность находиться в мо- мент I в состоянии, отличном от нуля 00 f qt(x, y)dy = 2^lf-^'\—1, (5.6) где 9? обозначает стандартное нормальное распределение. Иными словами, (5.6) дает вероятность того, что процесс, начинающийся в точке х>0, не достигнет нуля до момента Л Поэтому (5.6) можно истолковать и как распределение времен первого прохож- дения в «свободном» броуновском движении (т. е. при отсутствии барьеров). Отметим, что функцию (5.6) можно охарактеризовать как решение дифференциального уравнения (5.4), определенное х) См. задачи 15—18 в 1; гл, XIV, 9, где этот же метод применяется к разностным уравнениям, 13*
388 Гл, X. Марковские процессы и полугруппы при х > 0 и удовлетворяющее начальному условию и (0, х) = 1 и граничному условию u(t, 0) = 0. [Читатель может узнать в (5.6) устойчивое распределение с показателем а — этот же результат был получен в гл. VI, 2, предельным переходом от случайных блужданий к броуновскому движению.] в) Два поглощающих барьера. Рассмотрим теперь броуновское движение при наличии двух поглощающих барьеров—в точках О и а>0. Это означает, что при фиксированном 0 < у < а пере- ходные плбтности qt должны удовлетворять дифференциальному уравнению (5.4) и граничным условиям qt (0, у) = qt (а, у) = 0. Легко видеть, что решение имеет вид1) п (X М - 1 У Jpvnf (y-x+2kay\ <1, (*, И - 21 I - -ехр(-1» + >+гЬ>'1)}, (5.7) где 0 < х, у<а. В самом деле, ряд (5.7) очевидным образом сходится и приведение подобных членов показывает, что </f (0, у)= = Qt («> У) — 0 ПРИ всех / > 0 и 0 < у < а. [Преобразование Лап- ласа для (5.7) см. в гл. XIV, (5.17).] Интегрируя (5.7) по 0<у<а, найдем, что «непоглощенная» вероятностная масса в момент t равна Mt, х) = S W /г=-оо V. х —х\ ^/2ka—х\ Ft ) I yi ) — 5R /2fea+a+*\ _|_ Z2fea±f\l . (5.8) \ V t j \ V t Jl Эта формула дает вероятность того, что частица, выходящая из точки х, не будет поглощена до момента t. Функция является решением дифференциального уравне- ния (5.4), стремящимся к 1 при t—>0 и удовлетворяющим гра- ничным условиям А.а(/, 0) = Ха(/, а) = 0. Это решение можно по- лучить также стандартным применением метода Фурье. При этом оно имеет вид2) Mt> х) = = А У 1 схп ( (2»+02п2Л • (2п+1) лх пч n^2«4-ieXp\ 2аа ,<Sln а ‘ п— 0 ‘ г) Формула получается последовательными приближениями с использова- нием повторных отражений. В (5.5) указано решение, удовлетворяющее гра- ничным условиям' в точке 0 (но не в точке а). Отражение в а приводит к четырехчленному решению, удовлетворяющему граничному условию в а (но не в нуле). Чередующиеся отражения в 0 и в а приводят к пределу (5.7)* Аналогичное решение для случайных блужданий дано в 1; гл. XIV, (9.1), откуда (5.7) может быть получено предельным переходом (см. Г, гл. XIV, 6), 2) Аналогичная формула для случайных блужданий получена в 1; гл# XIV, 5, где, однако, граничные условия имели вид Ка (/, 0)~1 и (it а) = 0,
§ 5. Прямое уравнение. Граничные условия 389 Таким образом, мы получили два совершенно различных пред- ставления1) для одной и той же функции Ка. Это благоприятно для вычислений, так как ряд (5.8) удовлетворительно сходится лишь при малых t, а (5.9) применимо при больших t. Можно дать другую интерпретацию Ка. Рассмотрим положе- ние X (/) частицы, находящейся в свободном броуновском дви- жении, начинающемся в нуле. Событие: частица за время 0, t не выходит из интервала —а/2, а/2, равносильно событию: в про- цессе с поглощающими границами ± а/2, начинающемся в 0, по- глощение не происходит до момента Л Таким образом, величина (t, а/2) равна вероятности того, что в свободном (неограниченном) броуновском движении, начинающемся в нуле, | X ($) | < а/2 при всех s из интервала 0 < s < t, г) Применение к предельным теоремам и критериям Колмо- горова—Смирнова. Пусть Yx, Y2,...—независимые случайные ве- личины с одним и тем же распределением вероятностей, E(Y.•) = (), E(Y^) = 1. Положим Sn = Yx+ ... +Yn. Пусть T„ = max [| Sx |, ..., | Sn |]. Центральная предельная теорема делает правдоподобным заключение, что асимптотйческое поведение Тп будет таким же, как если бы Yy были нормальны. В последнем же случае нор- мированную сумму SklVп можно интерпретировать как значение процесса броуновского движения в момент времени k/п (6 = 0, 1, ..., п). Вероятность того, что это броуновское движение остается в интервале — а/2, а/2, равна, как следует из сказанного ранее, %а(1, а/2), Наши правдоподобные рассуждения поэтому приводят к гипотезе, что при п—> оо Р {Ти < 2} —(г), (5.10) где £(2) = Х22(1, г) находится с помощью (5.8) и (5.9): Цг) = 2 J {SR((4fe + l)Z)-9t((4fe-l)2)} = k— — 00 = ±У (-!)» / (2n+lW 5 .. я“'02п+1еХр\ 8г2 )' (Ь,И' Эта гипотеза была доказана в 1946 г. Эрдёшем и Кацем. Ле- жащая в основе доказательства идея получила с тех пор назва- ние принципа инвариантности. Этот принцип устанавливает, грубо говоря, что предельное распределение некоторых функций от случайных величин нечувствительно к изменениям распреде- х) Равенство выражений (5.8) и (5.9) может служить стандартным при- мером формулы суммирования Пуассона [см. гл. XIX, (5.8)]. Открытое пер- воначально в связи с теорией Якоби преобразования тэта-функций, это ра- венство приобрело некоторую историческую известность. См, теорему 277 в книге Ландау (Landau Et> Verteilung, der Primzahlen, 1909),
290 Гл. Х< Марковские процессы и полугруппы ления этих величин и что оно может быть найдено построением надлежащего аппроксимирующего случайного процесса. Принцип инвариантности был усовершенствован М. Донскером, П. Бил- лингсли, Ю. Прохоровым и другими и стал мощным орудием доказательства предельных теорем. По сходным причинам распределение (5.11) играет важную роль в обширной литературе о непараметрических критериях описанного в гл. I, 12, типа1). д) Отражающие экраны. По аналогии с обычным случайным блужданием при отражающем экране в нуле следует ввести гра- ничное условие dqt — 0. Легко проверить, что решение для интервала 0, оо дается формулой (5.5), где знак минус заменен на плюс. Формальный вывод с применением метода отражений остается таким же, как и раньше, с той разницей, что теперь мы полагаем ы0(—х) = ы0(х). Решение для интервала 0, а при отражающих экранах в 0 и в а получается заменой знака минус на знак плюс в (5.7) (другое выражение для решения, получаемое применением метода Фурье или формулы суммирования Пуассона, дано в задаче 11 гл. XIX, 9). ► Нужно отметить, что в случае отражающих экранов qt будет плотностью собственного распределения вероятностей. § 6. ДИФФУЗИЯ В МНОГОМЕРНОМ СЛУЧАЕ Предыдущая теория легко переносится на двумерный случай. Чтобы не загромождать формулы индексами, мы будем обозна- чать координатные величины через (X(Z), Y (/)), а плотности перехода—через qt(x, у; В. т]); здесь (х, у)—начальная точка и qt—плотность в точке (В, т,). Сохраняются постулаты § 4 с той разницей, что инфинитезимальная скорость Ь(х) заменяется век- тором, а дисперсия а(х)—матрицей ковариаций. Вместо (4.6) мы получим тогда обратное уравнение диффузии du д2и , о 32и . д2и , , ди , . ди . ”37“ = U-ti ? Г Ч Ч Г" $29 "3"-9 О-» 3 Н Ь9 3“ (6,1) dt 11 дх2 1 12 дх ду 1 22 ду2 1 1 дх 1 2 ду \ • f с коэффициентами, зависящими от х и у. В случае двумерного броуновского движения мы налагаем условие круговой симметрии, что приводит (с точностью до несущественной константы) к урав- х) Эта тема сравнительно нова, и тем не менее происхождение часто используемого тождества (5.11) уже успели, как кажется, забыть. [Смл Renyi A., On the distribution function, L (z). Selected Translation in Math,/ Statist, and Probability, 4 (1963), 219—224. Новое доказательство Реньи опи<£ рается на классические рассуждения с привлечением тэта-фунцций и тем самым затемняет простои вероятностный смысл (5Д1).]
§ 6. Диффузия в многомерном случае 391 нению ди___ 1 Г St ~~"2 L дх2 д2и 1 W * (6.2) Соответствующие переходные плотности нормальны с дисперсией t и центром в (х, у). Очевидное разложение этих плотностей на множители показывает, что X (0 и Y (0 статистически независимы. Наиболее интересной из величин, связанных с этим процес- сом, является расстояние R (0 от начала координат (R2 = X2+Y2). Интуитивно ясно, что величины R (0 образуют одномерный диф- фузионный процесс. Интересно сравнить различные способы вывода соответствующего диффузионного уравнения. Нормальные пере- ходные плотности, отвечающие (6.2), в полярных координатах имеют вид №-“>•) (6.3) (где x = rcosa и т. д.). При данных г и а в момент 0 частная плотность R (0 получается интегрированием (6.3) по 0. Параметр a исчезает, и мы получаем1) переходные плотности процесса R(0i wt(r, Р) = 4ехР (“’ (6-4) где Zo—функция Бесселя, определенная в гл. II, (7.1). Здесь г обозначает начальное положение в момент 0. Из самого вывода ясно, что при фиксированном р переходные вероятности wt должны удовлетворять (6.2) в полярных координатах; иными словами, должно быть /д2^ . 1 г-ч dt ~ 2 \^г2 “Г г dr J * ' Это—обратное уравнение для процесса R(Z). Оно просто выво- дится из (6.2) и требования круговой симметрии. Уравнение (6.5) показывает, что инфинитезимальная скорость процесса R(Z) ^рав- на 1/2 г. Существование сноса от начальной точки можно объяснить следующим образом. Рассмотрим двумерное броуновское движе- ние, начавшееся от точки г на оси х. По причинам симметрии ее абсцисса в момент h > 0 с одинаковой вероятностью будет > г или < г. В первом случае, конечно, R (h) > г. Однако это соот- ношение может выполняться и во втором случае. Таким образом, соотношение R(/i)>r имеет вероятность >1/2 ив среднем R обязано возрастать. Наш вывод формул для переходных вероятностей применим и в случае трех измерений, причем с одним существенным упро- щением.’ якобиан р в (6.3) заменяется теперь на p2sin0 и интег- J) Интеграл хорошо известен. Стандартная проверка результата состоит разложении eCQS0 в степенной ряд по cos 9.
392 Гл, X. Марковские процессы и полугруппы рал элементарно вычисляется. Вместо (6.4) мы получаем,следую- щую переходную плотность для процесса R(Z) в трех измерениях: Wt{r> p)==7^7’[exp(”jT1)“exp(“T^)]- м (Снова г обозначает начальное положение в момент 0.) § 7. ПОДЧИНЕННЫЕ ПРОЦЕССЫ Пусть {X (/)}—марковский процесс со стационарными вероят- ностями перехода Qt(x, Г). Исходя из {Х(/)}, можно построить множество новых процессов, вводя то, что называют рандомизи- рованном операционным временем. Предположим, что каждому значению t > 0 соответствует слу- чайная величина Т (t) с распределением Ut. Новое стохастическое ядро Pt может быть определено в таком случае равенством 00 Pt{x, Г) = $ Qs(x, V)Ut{ds}. (7.1) 0- Это есть распределение случайной величины X (Т (/)) при условии, что Х(0) = 0, Пример, а) Если Т (Z) имеет распределение Пуассона с мате- матическим ожиданием at, то 00 Л(х, Г) = Це-“^(2п(х) Г). (7.2) п=0 Эти Pt являются переходными вероятностями некоторого псевдо- пуассоновского процесса. В § 9 будет показано, что рандомизация посредством пуассоновских распределений приводит к так назы- ваемой показательной формуле теории марковских полугрупп. Теперь мы увидим, что удобные результаты могут быть получены и для множества других распределений, каждое из которых при- водит к аналогу показательной формулы. ► Случайные величины X (Т (/)) образуют новый случайный про- цесс, который, вообще говоря, уже не обязан быть марковским. Для того чтобы процесс был марковским, очевидно, необходимо, чтобы Pt удовлетворяли уравнению Чепмена—Колмогорова + оо Л-и(*. Г)= $ РЛх, dy)Pt(y, Г). (7.3) — со Это означает, что распределение X(T(/-|-s)) получается интегри- рованием Pt (у, Г) по распределению X (Т (s))A так что по опре- делению условных вероятностей Pt (у, Г) = Р {X (Т (/+S)) € г IX (Т («)) - у}. (7,4)
§ 7. Подчиненные процессы 393 Аналогичное вычисление переходных вероятностей более высокого порядка показывает, что условия (7.3) достаточно, чтобы гаран- тировать марковский характер полученного процесса {X (Т (/))}. Мы хотим описать распределения Ut, которые приводят к реше- ниям Pt уравнения (7.3). Непосредственный подход к решению этой задачи затруднен, но эти трудности можно обойти, если для начала рассмотреть простой частный случай. Пусть слу- чайные величины Т (/) принимают только значения, кратные фиксированному числу h > 0. Для распределения Т (/) введем обозначение Р{Т(0 = пй} = а„(0. (7-5) При условии X (0) = х величина Х(Т(/)) имеет распределение Г). (7.6) k=0 Так как ядра удовлетворяют уравнению Чепмена—Колмо- горова, то + 00 $ Pt(x, dy)Pt(y, Г)= Say(s)aft(O-Q(/+ft>ft(^ г). (7.7) — 00 7» Отсюда видно, что ядра Pt удовлетворяют уравнению Чепмена — Колмогорова (7.3) тогда и только тогда, когда «о (s) a,t (0 + а1 (s) (О + • • • + ап (s) ао (О = «„(« + 0 (7.8) при всех s > 0 и t > 0. Последнее соотношение выполняется для процесса {Т(0} со стационарными независимыми приращениями. Общее решение (7.8) было изучено в 1; гл. XII, 2. Полученный результат приводит к предположению, что и в общем случае уравнение (7.3) будет удовлетворяться всякий раз, когда случайные величины Т (/) образуют процесс со стацио- нарными независимыми приращениями, т. е. тогда, когда распре- деления Ut удовлетворяют1) соотношению х Ut+A*)= $ Os(x—y)Ut{dy}. (7.9) 0- Мы проверим это предположение переходом к пределу2). Пред- ставим Ut как предел последовательности арифметических рас- пределений только что рассмотренного типа: t^V) сосредото- чены на множестве, чисел, кратных числу hv, причем массы, кото- J) Наиболее общее решение (7,9) будет найдено о помощью преобразова- ний Лапласа в гл, XIII, 7. То же самое можно получить также из общей теории безгранично делимых распределений. 2) Непосредственная проверка требует аналитического мастерства. Пред- лагаемая процедура еще раз показываем что наивный подход иногда может быть более действенным»
g94 Гл. X. Марковские процессы и полугрупп® рые U'^ приписывают точкам nhv, удовлетворяют соотношению вида (7.8). Таким образом, при каждом v мы получим ядро P)v), соответствующее (7.6), которое удовлетворяет уравнению Чепме- на— Колмогорова (7.3). Для того чтобы показать, что ядро из (7.1) также удовлетворяет этому уравнению, достаточно дока- зать, что Р™ —+ Pt или, что означает то же самое, что + оо 4- со $ РГ(Х, dy)f(y)-+ $ Pt(x, dy)f(y) (7.10) — 00 — 00 для каждой непрерывной функции f (у), обращающейся в нуль на бесконечности. Если мы положим + 00 F(t, х) = $ Qt(x, dy)f(y), (7.11) — 00 то (7.10) можно переписать иначе: \F(s, x)U^{ds}-+ ]f(s, x')Ut{ds}. (7.12) О о Это соотношение естественно выполняется, когда F непрерывно, и это накладывает на Qt очень умеренное условие регулярности. Таким образом, мы получаем следующий основной результат. Пусть {Х(^)}—марковский процесс с непрерывными переход- ными вероятностями Qt и {Т (/)}—процесс с неотрицательными независимыми приращениями. Тогда {Х(Т (^))}—также марковский процесс с переходными вероятностями Pt, определяемыми по (7.7). Мы будем говорить, что этот процесс подчиненх) {X (/)} с использо- ванием операционного времени Т(£). Процесс {Т(/)} называется направляющим процессом. Наиболее интересен частный случай, когда процесс X (t) также имеет независимые приращения. В этом случае переходные вероят- ности зависят только от разностей Г—х и могут быть заменены соответствующими функциями распределения. Тогда (7.7) прини- мает более простой вид: 00 Л(*) = 5<2Л*)£Л{<М- (7.13) о Все наши примеры будут именно этого типа. Примеры, б) Процесс Коши подчинен броуновскому движению. Пусть {X (£)}—броуновское движение (винеровский процесс) с пере- ___________________________________L.__L. х2у ходными плотностями qt(x) = (2nt) 2 е 2 • В качестве {Т(/)[ х) Понятие подчиненных полугрупп введено С. Бохнером в 1949. Систе- матическое изложение на «высшем уровне» дано в статье: Nelson Е., A functional calculus using singular Laplace integrate. Trans Amer, Math. Soc., 88 (1958), 400-413, '
$ 7. Подчинённые процессы 395 мы возьмем устойчивый процесс с показателем 1/2 и переходными плотностями Распределение (7.13) имеет при этом плотность — 00 и таким образом наша процедура «подчинения» приводит к про* цессу Коши. Этот результат можно следующим образом интерпретировать в терминах двух независимых броуновских движений X (/) и Y (/). В примере 2, д) гл. VI было показано, что Ut можно интерпре- тировать как распределение времени ожидания момента, в кото- рый процесс Y (s) впервые достигнет значения t > 0. Соответст- венно процесс Коши Z (/) может быть реализован так: случайная величина Z (/)—это значение процесса X в момент Т (/), когда Y (s) впервые достигает значения t. [О другой связи процесса Коши с временами достижения в броуновском движении см. в приме- ре 2, е) гл. VI.] в) Устойчивые процессы. Последний пример легко распростра- няется на произвольные строго устойчивые процессы {X (Z)} и {Т (/)} с показателями аир соответственно. Здесь а <^2, но так как величина Т (/) должна быть положительна, то необходимо Р < 1. Переходные вероятности Qt и Ut имеют вид Qt(x)=Q (х/-1/а) и Ut(x) = U где Q и U—фиксированные устойчивые рас- пределения. Мы покажем, что подчиненный процесс X (Т (/)) устой- чив с показателем ар. Это утверждение эквивалентно соотношению рк t (x) = Pt (х-1/“₽). Это соотношение тривиально выводится из определения Qs и Ut и формулы (7.13) с применением подста- новки s = z/V/₽. [Наш результат по существу эквивалентен формуле для про- изведений, установленной в примере 2, з) гл. VI. При Х(/)>0 эта формула может быть переписана в терминах преобразований Лапласа, см. гл. XIII, 7, д). Вариант, использующий преобразо- вание Фурье, см. в задаче 9 гл. XVII, 12.] г) Обобщенный пуассоновский процесс, направляемый гамма-про- цессом. Пусть Qt—обобщенное пуассоновское распределение, по- рождаемое распределением вероятностей F, и пусть Ut имеет гамма-плотность Тогда (7.13) принимает вид о=а
39б Гл* X» Маршские процессы и полугруппа где Mo4e‘sTc’IW*=-^W'2-“’'' <7J6> о Легко проверить, что вероятностям ап (/) соответствует безгра- нично делимая производящая функция 2a„(0:n = (2-?)-f. д) Гамма-процесс, направляемый законом Пуассона. Рассмотрим теперь те же самые распределения, поменяв их ролями. Тогда опе- рационное время будет целочисленным, и нуль имеет вес е~*. Отсюда следует, что результирующее распределение также имеет атом веса е~* в нуле. Непрерывная часть имеет плотность (7.17) n=0 v где —функция Бесселя (см. гл. II, (7.1)). Из сказанного сле- дует, что это распределение безгранично делимо. Прямая про- верка этого утверждения нелегка. ► § 8. МАРКОВСКИЕ ПРОЦЕССЫ И ПОЛУГРУППЫ В гл. VIII были отмечены преимущества трактовки вероятност- ных распределений как операторов, действующих на непрерывные функций. Преимущества операторного подхода к стохастическим ядрам еще больше, и теория полугрупп приводит к цельной тео- рии марковских процессов, что недостижимо при других методах. Пусть даны стохастическое ядро К в 311 и ограниченная непре- рывная функция и. Тогда соотношение t/(x)= \ К(х, dy)u(y) (8.1) — 00 определяет нам новую функцию. Мы почти не теряем общности рассуждений, предположив, что функция U также непрерывна. Тогда мы могли бы перейти к изучению свойства ядра в тер- минах порожденного им преобразования и —> U семейства непре- рывных функций. По двум приводимым ниже причинам целесооб- разно рассмотреть более общую ситуацию. Во-первых, преобразо- вания вида (8.1) имеют смысл в произвольных пространствах, и было бы крайне неэкономно развивать теорию, которая не охватывает простейший и очень важный частный случай, а именно процессы со счетным множеством состояний [когда (8.1) сводится к матричному преобразованию]. Во-вторых, даже в теории, огра- ничивающейся непрерывными функциями на прямой, различные типы граничных условий вынуждают нас вводить специальные
§ 8. Марковские процессы и полугруппы 397 классы непрерывных функций. С другой стороны, большая общ- ность достигается без всяких затрат. Читатели в зависимости от настроения могут пренебречь общностью и рассматривать все тео- ремы в одной (или нескольких) из следующих типичных ситуа- ций: (i) пространство состояний 2 есть вещественная прямая и 2 есть класс ограниченных непрерывных функций, исчезающих на бесконечности; (ii) пространство 2 есть конечный замкнутый интер- вал I в 91х или 5£2 и 2— класс непрерывных функций на нем; (iii) 2 состоит из целых чисел и 2— из ограниченных последова- тельностей. В последнем случае последовательности лучше всего представлять себе в виде векторов-столбцов, а преобразования — в виде матриц. Как и в гл. VIII, норма ограниченной действительной функ- ции и определяется как || и || = sup | и (%) |, Последовательность функ- ций ип сходится равномерно к и тогда и только тогда, когда ||«„—«||—* о. Начиная с этого места, 2 будет обозначать семейство дейст- вительных функций, определенных на некотором множестве 2 и обладающих следующими свойствами', (i) если щ и и2 принад- лежат 2, то каждая линейная комбинация сгщ + с2и2 £ 2\ (ii) если ип(^2 и ||н„ — и\\—>0, то и£2\ (iii) если и£2, то и и+, и принадлежат 2 (здесь н = — и~— обычное разло- жение и на положительную и отрицательную части). Другими словами, 2 замкнуто относительно образования линейных комби- наций, равномерного перехода к пределу и взятия абсолютной величины. Первые два свойства означают, что 2—банахово про- странство, последнее—что 2 есть структура. Ниже приводятся стандартные определения. Линейное пре- образование Т называют эндоморфизмом на 2, если каждое и £2 имеет образ Ти£2, такой, что ||7^||^m||u||, где m — постоян- ная, не зависящая от и. Наименьшая постоянная с этим свойст- вом называется нормой ||7|| преобразования Т. Преобразование Г положительно, если из вытекает Tu^Q. В этом случае — Ти~ ^Ти^.Ти+. Сжатием называется положительный опера- тор Т, такой, что || Т ||^1. Если постоянная функция I принад- лежит 2 и Т—положительный оператор, такой, что 71 = 1, то Т называется оператором перехода (он автоматически будет сжатием). Пусть даны два эндоморфизма S и Т на 2. Тогда их произ- ведение ST есть эндоморфизм, отображающий и в S (Ти). Очевидно, ||S7||^||S||-||7||. В общем случае ST=^=TS в отличие от частного случая операторов свертки из гл. VIII, 3, которые перестано- вочны один с другим. Мы всерьез интересуемся лишь преобразованиями вида (8.1), где К—стохастическое или по крайней мере субстохастическое ядро. Операторы такого вида суть сжатия или операторы пере- хода. Им присуще также
398 Гл* X* Маршские процессы й полугруппы Свойство монотонной сходимости. Если ип^0 и ип\и(ип£<3? и С <=2?), то Тик—+Ти в смысле поточечной сходимости. Практически во всех ситуациях сжатия, обладающие этим свой- ством, имеют вид (8.1). Два примера иллюстрируют это замечание. Примеры, а) Пусть S—действительная прямая и <57 = С, где С—семейство всех ограниченных непрерывных функций на ней. Пусть СоСеЗ7—подкласс функций, обращающихся в нуль на ± оо. Если Т—сжатие на J27, то при и£С0 значение Ти(х) функции Ти в фиксированной точке х является положительным линейным функционалом на <2?, По теореме Рисса о представлении таких функционалов существует (возможно, несобственное) распределе- ние вероятностей F, такое, что Ти(х) равно математическому ожиданию и относительно F. Так как F зависит от х, то F (Г) мы обозначим /С(х, Г). Тогда для u£CQ + 00 Т«(х)= $ Л(х, dy)u(y). (8.2) - 00 Если оператор Т обладает свойством монотонной сходимости, то это соотношение можно распространить на все ограниченные не- прерывные функции. При фиксированном х ядро К как функция от Г является мерой. Если Г—открытый интервал и {«„}—возрастающая после- довательность непрерывных функций, такая, что и„(х)—> 1 при х€ Г и и„(х) —s-О в других случаях, то Л(х, Г) = lim Тип (х) (в силу основных свойств интегралов). Так как функции Тип непрерывны, мы заключаем, что при фиксированном Г ядро К есть бэровская функция от х. Поэтому К обладает всеми свойст- вами стохастических или субстохастических ядер. То же самое распространяется на случай интервалов или 31п. • б) Пусть S—множество целых чисел, a 3?—множество число- вых последовательностей и — {ип\ с ||«|| = sup | ип |. Если р,7—эле- менты стохастической или субстохастической матрицы, то опре- делим преобразование Т так, что i-я компонента Ти равна (Tw)z = 2/?,.ftuft. (8.3) Очевидно, что Т—оператор сжатия, обладающий свойством моно- тонной сходимости. Если матрица (р17) строго стохастическая, то Т—оператор перехода. Эти примеры типичны, и найти сжатие, не порождаемое сто- хастическим ядром, в самом деле трудно. Как бы то ни было, мы оправдали дальнейшее развитие общей теории сжимающих операторов и убедились в том, что применения к вероятностным задачам будут носить очевидный характер. (В действительности мы никогда не выйдем за рамки указанных примеров.) Переходные вероятности марковского процесса образуют одно-
§ 8. Марковские процессы и полугруппы 399 параметрическое семейство ядер, удовлетворяющих уравнению Чепмена—Колмогорова Qs+t {х, Г) = $ Qs (х, dy) Qt (у, Г) (8.4) (s > 0, t > 0); интегрирование производится по всему простран- ству состояний. Каждое из этих ядер порождает оператор пере- хода £)((), определяемый соотношением (/) и (х) = J Qt (х, dy) и (у). (8.5) Очевидно, что (8.4) эквивалентно S(s-М) = &(«)£! (О. s>0i />0. (8.6) Семейство эндоморфизмов с этим свойством называют полугруппой. Ясно, что £}(s)£}(/) = £}(/)D(s), т. е. каждые два элемента по- лугруппы перестановочны. Последовательность {Тп} эндоморфизмов на S? называется сходящейсях) к эндоморфизму Т тогда и только тогда, когда || Тпи— —Ти ||—>0 при каждом Если последнее соотношение выпоят нено, мы пишем Тп —► Т. Начиная с этого момента, мы сосредоточимся на полугруппах сжимающих операторов. При этом мы введем некоторые условия регулярности. Обозначим опять через 1 тождественный оператор: 1и — и. Определение. Мы будем называть полугруппу сжимающих операторов £}(/) непрерывной* 2), если £} (0) — 1 и £)(Л)—*1 при При 0 t' < t" мы имеем ||D(Om—&(OM<IIW'—О«—М- (8-7) Для непрерывной полугруппы существует такое б > 0, что пра- вая часть <е при Г—('<б. Таким образом, верно не только то, что £1 (/)—>£) (/0) при t—но и большее: формула (8.7) показывает, что &(t)u при любом фиксированном и есть равно- мерно непрерывная функция t3). !) Такая сходимость называется сильной. Она введена в гл. VIII, 3. Из нее не вытекает сходимость ЦТп — Т ||—>0 (называемая равномерной). Более слабый тип сходимости определяется требованием Тпи (х)—>-Ти(х) при каждом х (но не обязательно равномерно); см. задачу 6 в гл. VIII, 10. 2) Мы используем этот термин вместо стандартного «сильно непрерывна в нуле». ?) Существуют полугруппы, такие, что D (ft) стремится к оператору Т 1, но они патологичны. Определим, например, эндоморфизм Т равенством Ти(х) = у«(0)[1-фсо8х] + уИ(л)[1—cosx] и положим £)(0 = Т при всех £^0,
400 Гл, Марковские процессы и полугруппы Преобразование (8.1) — это, конечно, то же самое, что и (4.5); оно слу- жило исходным пунктом при выводе обратного уравнения для диффузионных процессов. Теперь семейство марковских переходных вероятностей порождает также некоторую полугруппу преобразований мер. При этом мера pt перехо- дит в меру Т (t) р,, приписывающую множеству Г массу > Т (0 И (Г) = J и {dx} Qt (х, Г). (8.8) Если Qt имеет плотность то это преобразование совпадает с (5.1) и было использовано для вывода прямого уравнения. Так как теория вероят- ностей имеет в первую очередь дело с мерами, а не с функциями, то возни- кает вопрос: почему мы начали с полугруппы {D (/)}, а не с {Т (/)}? Ответ интересен и проливает новый свет на сложную связь прямого и обратного уравнений. Причина состоит в том (иэто подтверждают приведенные выше примеры)# Что в обычной обстановке непрерывные полугруппы сжимающих операторов на функциональном пространстве £ порождаются переходными вероятностями: изучение наших полугрупп {£} (/)}—это практически то же самое, что изуче- ние марковских переходных вероятностей. Для полугрупп на пространстве мер это неверно. Существуют аналитически очень естественные полугруппы сжимающих операторов, не порождаемые марковскими процессами. Чтобы построить пример, рассмотрим любую марковскую полугруппу вида (8.8) на прямой, предполагая лишь, что абсолютно непрерывная мера р переходит в абсолютно непрерывную меру Т (t) р [например, Т (/) может быть сверткой С нормальным распределением с дисперсией t]. Пусть р = рс + р5 — разложе- ние р на абсолютно непрерывную и сингулярную компоненты. Определим новую полугруппу {£(/)},- положив S (/) = Т (f) Hc + fif Эта полугруппа непрерывна, и S (0) = 1, но легко показать, что она не свя- зана ни с какой системой переходных вероятностей и что она с вероятност- ной точки зрения бессмысленна. § 9. «ПОКАЗАТЕЛЬНАЯ ФОРМУЛА» В ТЕОРИИ ПОЛУГРУПП Псевдопуассоновские процессы § 1 являются, конечно, про- стейшими марковскими процессами. Теперь мы докажем, что прак- тически все марковские процессы представимы как пределы псев- допуассоновских процессов1). Абстрактный вариант этого утвер- ждения играет фундаментальную роль в теории полугрупп. Мы увидим сейчас, что он на самом деле есть следствие закона боль- ших чисел. Пусть Т—оператор, порождаемый стохастическим ядром /С. Тогда оператор £}(/), индуцированный псевдопуассоновским рас- пределением (1.2), принимает вид 00 = ^-Тп, (9.1) /2 = 0 где сумма ряда определяется как предел частных сумм. Из урав- нения Чепмена—Колмогорова (1.3) следует, что эти операторы г) Специальный случай* когда (/) суть операторы свертки* был разо- бран в гл, IX,
§ 9. «Показа/Шьпая формула» в теории полугрупп 401 образуют полугруппу. Предпочтительнее, однако, доказать этот факт заново для произвольных сжимающих операторов Т. Теорема 1. Если Т—сжатие на Д’^то операторы (9.1) обра- зуют непрерывную полугруппу сжатий. Если Т—оператор пере- хода, то это же верно и для £>(/). Доказательство. Очевидно, что D(/)—положительный опера- тор и ||£}(0|Ке“а<+а/и:Г||<1- Полугрупповое свойство легко проверяется формальным перемножением рядов для Щз) и £)(/) (см. сноску 1 на стр. 366). Соотношение С(/1)—>1 очевидно из (9.1). Мы будем записывать (9.1) сокращенно: £(/)==^(Г-1). (9.2) Полугруппы сжатий такого вида будут называться псевдопуассо- новскими1). Мы скажем, что {£W)| порождается оператором Рассмотрим теперь произвольную непрерывную полугруппу сжатий D (/). Она ведет себя во многих отношениях так же, как действительная непрерывная функция. В частности, применима без каких-либо серьезных изменений теория приближения функ- ций, развитая в гл. VII на основе закона больших чисел. Мы покажем, что процедура примера I, б) из гл. VII приводит к важнейшей формуле общей теории полугрупп. Введем при фи- ксированном h > 0 операторы /2 = 0 которые могут быть получены рандомизацией параметра t в (/). Сравнение с (9.1) показывает, что операторы образуют псевдопуассоновскую полугруппу, порождаемую оператором [П(/0 — \\/h. Докажем теперь, что £1/г(0->ад, h-Л. (9.4) Сформулируем этот важный результат в виде теоремы. Теорема 2. Каждая непрерывная полугруппа сжатий £> (/) является пределом (9.4) псевдопуассоновских полугрупп {£^(/)}, порождаемых эндоморфизмами —1]. Доказательство, Отправным пунктом будет тождество (9.5) __________ /2 = 0 9 Существуют "полугруппы сжатий вида ets, где S—эндоморфизм, не представимый в форме а (Т—1). Таковы, например, полугруппы, связанные со скачкообразными процессами § 3, если а (х) огранич^на^ ^
402 Гл. X. Марковские процессы и полугруппы Выберем 6 так, что ||D(s)и—иЦ<8 при 0<s<6. Тогда ввиду (8.7) имеем при \nh—11 < т]/ №(nh)u—D(0w||<8. (9.6) Распределение Пуассона в (9.5) имеет математическое ожидание и дисперсию t/h. Поэтому вклад слагаемых с \nh—/|^>6всумму (9.5) можно оценить с помощью неравенства Чебышева, и мы получаем II (0 и—& (0 и II < 8 + 2 \\и || thb"*. Отсюда следует, что сходимость (9.4) равномерна на всех конеч- ных интервалах изменения t. Другие варианты можно получить, ставя на место распределения Пуассона другие безгранично делимые распределения. Из 1; гл. ХП$ 2, мы знаем, что производящая функция безгранично делимого распределения {ип (/)}, сосредо- точенного на множестве целых чисел п^О, имеет вид S «„ (0 £n = exp (ta [р ©-1]),- (9.7) О где P(?)=Po + Pi?+...> P/SsO, 2р/=1, (9.8) Допустим, что распределение {ип (/)} имеет математическое ожидание Ы л конечную дисперсию ct. Заменяя в (9.3) распределение Пуассона на {ип (t/b)}$ получаем оператор ©Л (0 =2 «» a (nh) (t/bh) (h), (9.9) Как и прежде, простое применение закона больших чисел показывает, что (/) —> D (/) при h—>0. Таким путем мы получаем аналог «показательной формулы», в котором распределение {ип (/)} играет роль распределения Пуас- сона х). Чтобы понять вероятностное содержание и пути обобщения этих рассуж- дений, обозначим через {X (/)} марковский процесс, соответствующий полу- группе {& (/)}, и через {Т (/)}—процесс с независимыми приращениями, опи- сываемый вероятностями перехода {ип (/)}. Операторы (9.9) соответствуют переходным вероятностям процесса X (Ат (tlbh)'). Другими словами, мы ввели специальный процесс, подчиненный X (/). Закон больших чисел, примененный к Т-процессу, делает правдоподобным предположение о том, что при h—>0 рас- пределения нового процесса сходятся к распределениям исходного марковского процесса. Эта процедура аппроксимации никоим образом не связана с цело- численностью случайных величин Т (/). В самом деле, мы можем взять в ка- честве Т (0 любой процесс с положительными независимыми приращениями, такой, что Е ((Т (/))) = &/ и что дисперсия Т (/) конечна. Таким образом, данный марковский процесс {X (/)} выступает как предел подчиненных марковских процессов вида X (/iT (//ш)). Дело в том, что полугруппы аппроксимирующих процессов могут ^иметь значительно более простую структуру, чем исходная полугруппа. Действи- тельно, полугруппа операторов £)д(/), определенных в (9.9), принадлежит псевдопуассоновскому типу. Для проверки положим 00 00 &#=p(&(h)) = S pn£in(h) = S pn&(nh), (9,10X n = Q n=Q £) Это отметил Чжун Kt Л, (см, гл, VII, 5),
§ 10. Производящие операторы. Обратное уравнение 403 Оператор — это смесь операторов перехода и потому тоже оператор пере- вода, Сравнение соотношений (9.7) и (9.9) приводит к формальному равенству ОЛ(0 = ехр^(О*-1)]>, (9.11) что несомненно является разновидностью (9.2). Равенство (9.11) нетрудно Проверить элементарными методами, но мы увидим, что (9.11) на самом деле Только частный случай формулы для производящих операторов подчиненных Полугрупп (см. пример 9, б) гл. XIII), § 10. ПРОИЗВОДЯЩИЕ ОПЕРАТОРЫ. ОБРАТНОЕ УРАВНЕНИЕ Рассмотрим псевдопуассоновскую полугруппу {£)(/)} сжимаю- щих операторов, порождаемую оператором 31 = а (Т—1). Так как это эндоморфизм, то у = 31» определено для всех и h-»Q + . (10.1) Было бы хорошо, если бы это свойство имело место для всех полугрупп, однако этого невозможно ожидать. Возьмем, например, полугруппу, связанную с броуновским движением. Уравнение диффузии (4.1) показывает, что для дважды непрерывно диффе- ренцируемой функции и левая часть (10.1) сходится к и"/2. Однако не существует никакого предела, если и не дифферен- цируема. Тем не менее уравнение диффузии однозначно описывает процесс, так как полугруппа однозначно определяется своим действием на дважды дифференцируемые функции. Поэтому мы не можем ожидать, что (10.1) будет выполняться для всех функ- ций и, но для всех практических целей хватает требования, чтобы оно выполнялось для «достаточно многих» функций. Имея ©то в виду, примем Определение. Если для некоторых и и v из 3 выполняется соотношение (10.1) (в смысле равномерной сходимости), то мы полагаем v = $[u. Так определенный оператор называется произво- дящим оператором1) полугруппы {£!(()}. Умножая (10.1) слева на £)(/), получаем ^_(L+h)-^(^u^Q(t)v, (Ю.2) Таким образом, если 31» существует, то все функции £1 (t) и ле- жат в области определения 31 и ® и(0 31» = ЗШ (0 и. (Ю.З) - х) При анализе полугрупп со сверткой в гл. IX мы ограничивались беско- нечно дифференцируемыми функциями, благодаря чему все производящие опе- раторы имели одну и ту же область определения. Столь удобного средства йет в общей теории полугрупп,
404 Гл. X. Марковские процессы и полугруппы Это соотношение, по существу, то же самое, что обратное урав- нение для марковских процессов. В самом деле, в обозначениях § 4 мы можем положить м(/, х) = £}(/) uQ(x), где и0—начальная функция. Тогда (10.3) превращается в = %u(t, х). (10.4) Это—знакомое нам обратное уравнение, но оно нуждается в пра- вильной интерпретации. Вероятности перехода диффузионных процессов § 4 так гладки, что обратное уравнение верно для всех непрерывных начальных функций uQ. В общем случае этого может не быть. Примеры, а) Сдвиги. Пусть S состоит 'из всех непрерывных функций на прямой, обращающихся в нуль на бесконечности. Положим £1(0 и(х) = и (% + 0- Очевидно, что (10.1) выполняется тогда и только тогда, когда и имеет непрерывную производную и', обращающуюся в нуль на бесконечности. В этом случае &и = и'. Формально обратное уравнение (10.4) сводится к ди ди dt дх ' (10.5) Формальное решение, совпадающее при t = 0 с данной начальной функцией uQ, было бы и (/, x) = uQ (/ + %). Но и в самом деле будет решением только в том случае, когда функция uQ диффе- ренцируема. б) Как и в § 2, рассмотрим псевдопуассоновский процесс X (/) и другой процесс Х#(0 = Х(0—ct. Соответствующие полугруппы связаны очевидным образом: значение £1# (/) и в точке х равно значению £1(/) в точке x-\-ct. Для производящих операторов имеем связь 31# = 91—С±, (10.6) так что область определения 21* ограничена дифференцируемыми функциями. Обратное уравнение выполняется, если только на- чальная функция ы0 имеет непрерывную производную, но не для произвольных функций. В частности, сами переходные вероятности не обязаны удовлетворять обратному уравнению. Этим объясняются как трудности устаревших теорий [обсуждавшихся в связи с гл. IX, (2.14)], так и необходимость принятия неестественных условий регулярности при выводе прямого уравнения (2.1). Польза понятия производящего оператора проистекает из сле- дующего факта; для любой непрерывной полугруппы сжатий про*
§ 10. Производящие операторы. Обратное уравнение 405 изводящий оператор однозначно описывает полугруппу. Простое доказательство этой теоремы будет дано в гл. XIII, 9. Эта теорема дает нам возможность обращаться с обратными уравнениями, не прибегая к излишним ограничениям, и значи- тельно упрощает Ьывод этих уравнений. Так, наиболее общая форма диффузионных операторов, упомянутая в сноске 1 на стр. 380 (§ 4), не могла бы быть получена без априорной уверенности в том, что производящий оператор на самом деле существует.
ГЛАВА XI ТЕОРИЯ ВОССТАНОВЛЕНИЯ Процессы восстановления были введены в гл. VI, 6, и были иллюстрированы примерами в гл. VI, 7. Теперь мы начнем с об- щей теории так называемого уравнения восстановления, с которым часто приходится сталкиваться в различных вопросах. Ярким примером применения общей теоремы восстановления служит предельная теорема из § 8. Параграфы 6 и 7 содержат улучшен- ные и обобщенные варианты некоторых асимптотических оценок, первоначальный вывод которых был трудоемким и требовал при- менения глубоких аналитических методов. Здесь еще раз демон- стрируется та экономия в работе мысли и количестве аналитиче- ских средств, которая достигается за счет общетеоретического подхода к трудным индивидуальным проблемам. Анализ задач теории восстановления с помощью преобразований Лапласа см. в гл. XIV, 1—3. Немало работ было написано и много сил затрачено с целью освободить теорему восстановления от условия положительности случайных величин. Ввиду солидной истории вопроса мы включим в § 9 новое и сильно упрощенное доказательство общей теоремы. § 1. ТЕОРЕМА ВОССТАНОВЛЕНИЯ Пусть F—распределение, сосредоточенное1) на 0, оо. Иными словами, мы предполагаем, что F(0) = 0. Мы не требуем сущест- вования математического ожидания. Однако в силу условия по- ложительности мы можем принять 00 00 Н = ^yF{dy} = $[1— F(y)]dy, (1.1) о о где р^оо. При р —оо мы условимся интерпретировать символ р"1 как 0. В этом параграфе мы исследуем асимптотическое поведение при х—>оо функции (1.2) ._________ п=0 1) Если допустить атом о массой р < 1 в нуле4 то никаких существенных изменений не требуется (см, задачу 1),
§ 1. Теорема восстановления 407 Вскоре мы увидим, что эта задача тесно связана с асимптоти- ческим поведением решения Z уравнения восстановления Z(x) = z(x)+ ^Цх—y)F{dy}, х>0. (1.3) о Для определенности мы считаем интервал интегрирования замк- нутым, но из данного контекста должно быть понятно, что функ- ции z и Z равны нулю на отрицательной полуоси. Поэтому пре- делы интегрирования можно заменить без ущерба на —оо и оо й переписать уравнение восстановления в форме уравнения свертки Z = z + F*Z (1.4) (это замечание относится ко всем встречающимся в дальнейшем интегралам этого типа). Вероятностный смысл U и вероятностные применения уравне- ния восстановления довольно подробно обсуждались в гл. VI, 6, 7. Поэтому сейчас мы приступим к чисто аналитическому исследованию. Здесь уместно отметить, чтд в процессе восстановления значение U(х) равно математическому ожиданию числа моментов восстановления I .............. I на интервале 0, х, при этом нуль считается моментом восстанов- ления. В соответствии с этим U следует интерпретировать как I---- -------------------1 меру, сосредоточенную на 0, оо. Интервалу I = a, Ь отвечает мера U{I} = U(b)—U (а). Отметим, что нуль является атомом этой меры, который имеет массу 1 и вносится нулевым членом ряда (1.2). Следующая лемма просто повторяет теорему 1 из гл. VI, 6, однако новое доказательство, приводимое здесь, способствует не- зависимости настоящего параграфа. Лемма. U (х) < оо для всех х. Если г ограничена, то функ- ция Z, определенная равенством X Z(x) = ^z(x—у) U {dy}, х>0, (1.5) о есть единственное решение уравнения восстановления (1.3)л кото- рое ограничено на конечных интервалах. [При соглашении о том, что z(x) = Z(x) = 0 при х<0, можно записать (1.5) в форме Z=U-fcz.] Доказательство. Положим Un = F°* и выберем такие положительные числа т и ц, что 1—Г(т)>ц. Тогда X $ [1-F (x^y)],U„ {dy} = 1 -№* (х), х > 0, (1.6) о
408 Гл. XI. Теория восстановления и, следовательно, т][^п(х)—Уп(х—т)]<1. Устремляя п—>оо, мы делаем вывод, что U {/} т)"1 для любого интервала /, длина которого < т. Поскольку произвольный интервал длины а можно представить как объединение самое большее 1 + а/х интервалов, длины т, то отсюда следует, что U{x)-U{x-a)^Ca, (1.7) где Са = (й-)-т)/(тг|). Таким образом, U {/} равномерно ограничено на всех интервалах I данной длины. Далее, Zn = Vn^z удовлетворяет уравнению Zn+I = z + F-frZn. Устремляя п—> оо, убеждаемся в том, что интеграл в (1.5) имеет смысл и что Z есть решение уравнения (1.3). Для доказательства единственности заметим, что разность двух решений должна удовлетворять уравнению V = F^V, а следова- тельно, и соотношению V (х) = J V (х—у) Fr* {dy}, х > 0, (1.8) о при г = 1, 2,... . Но Fr* (%) —> 0 при г —> оо и поскольку пред- полагается, что V ограничено на 0, оо, то отсюда вытекает, что У(х) = 0 при всех х>0. Формулировка теоремы восстановления затрудняется из-за специальной роли, которую играют распределения, сосредоточен- ные на множестве чисел, кратных числу X. Согласно определению 3 из гл. V,2, такое распределение называется арифметическим, а наибольшее Л с тем свойством, что F сосредоточено на множестве точек %, 2%, ..., называется шагом F. В этом случаё мера U чисто атомическая, и мы обозначим через ип массу, соответствующую точке Теорема восстановления из 1; XIII, 11, утверждает, что ип—► Х/р. Приводимая ниже теорема1) обобщает этот резуль- тат на случай произвольных распределений, сосредоточенных на 0, оо. Случай арифметического распределения F ради полноты формулировки упомянут снова. (Мы напоминаем о соглашению р“1 = 0, если р —оо.) Теорема восстановления. (Основная форма.) Если распределе- ние F не является арифметическим, то при любом фиксированном /г > 0 и t—+oo (1.9) *) Случай арифметических распределений был рассмотрен П& Эрдёшем, В. Феллером, Г. Полардом (1949). Их доказательство было незамедлительно обобщено Д. Блекуэллом. В тексте дано новое доказательство. Распростра- нение на распределения, не сосредоточенные на 0, оо, см« в § 9, Важнейшие обобщения в другом направлении содержатся в работе Чжоу и Роббинса (Chow Y. S., Robbins Н. Е., A renewal theorem for random variables which are dependent distributed^ Ann. Mailb Stat,A vol. 34 (1963)* 390^401.
§ 1. Теорема восстаЧоелёяия 409 Если же F—арифметическое распределение, то (1.9) верно для h, кратных шагу %. Прежде чем доказывать теорему, мы переформулируем ее в терминах асимптотических свойств решений (1.5) уравнения вос- становления. Поскольку любая данная функция г может быть разложена на свои положительную и отрицательную части, то мы можем допустить, что Для определенности мы пред- положим, что распределение F не является арифметическим и имеет математическое ожидание ц < оо. Если z (х) = 1 для <6 < оо и z(x) = 0 цля всех других х, то мы получим из (1.5) Z (0 = U (t—d)—U (t—b) (&—а)/н, / <х>. (1.10) Этот результат немедленно обобщается на конечные ступенчатые функции. Пусть —непересекающиеся интервалы на положительной полуоси с длинами Lit ..., Lr. Если z принимает значение ак на интервале Ik и обращается в нуль за пределами объединения интервалов Ik, k=l, ..., г, то очевидно, что г е Z(f)—2 = \z(x)dx. (1.11) А=1 о Классический интеграл Римана функции z определяется в тер- минах конечных ступенчатых функций, аппроксимирующих г, и потому правдоподобно, что предельное соотношение (1.11) выпол- няется, когда z интегрируема по Риману. Чтобы прояснить это место, вспомним определение интеграла Римана функции z по конечному интервалу 0 х а. Достаточно рассмотреть разбиения на подынтервалы равной длины h = a/n. Пусть тк и тк соответ- ственно такие наибольшее и наименьшее число, что mk^iz (х)^тк при (k—\)h^x <Zkh. (1.12) Очевидная зависимость тк и тк от h должна быть учтена. Ниж- няя и верхняя римановы суммы при заданном шаге h определяются равенствами o'= /*2^, Gz==hl^mk. (1-13) При /г —>0ио, и о стремятся к конечным пределам. Если о—о—>0, то эти пределы совпадают и интеграл Римана функции z опре- деляется как значение этого общего предела. Любая ограничен- ная функция, которая имеет только разрывы первого рода, ин- тегрируема в этом смысле. Когда мы переходим к интегралам по области 0, оо, то клас- сическое определение приводит к осложнениям, которые, впрочем, можно обойти. Чтобы сделать класс интегрируемых функций воз- можно более широким, интеграл пр 0, оо уславливаются понимать
410 Гл. XI. Теория восстановления как предел интегралов по областям 0, а. Непрерывная неотри- цательная функция г(х) интегрируема в этом смысле тогда и только тогда, когда площадь между ее графиком и х-осью конечна. К сожалению, это не устраняет сильных колебаний функции z (х) на бесконечности (см. пример а)). Очевидно, что нет причин предполагать, что решение Z стремится к конечному пределу, ₽сли данная функция г колеблется беспорядочным образом. Дру- гими словами, усложненное стандартное определение делает слишком много функций интегрируемыми, и для наших целей предпочтительнее поступать проще, распространяя первоначальное определение на бесконечные интервалы. Из-за отсутствия устояв- шегося термина мы будем говорить о непосредственном интегри- ровании в противоположность косвенной процедуре, содержащей предельный переход от конечных интервалов. Определение. Функция z^Q называется непосредственно ин- тегрируемой по Риману, если верхняя и нижняя римановы суммы, определенные в (1.12), (1.13), конечны и стремятся при h—>0 к одному и тому же пределу. Это определение не делает различия между конечными и бесконечными интервалами. Легко убедиться в том, что z непо- средственно интегрируема на 0, оо, если она интегрируема на каждом конечном интервале 0, а и если о < оо при некотором h (тогда о< оо автоматически для всех h). Второе условие как раз и исключает большие колебания функции. Мы можем переосмыслить это определение в терминах аппрокси- мирующих ступенчатых функций. При фиксированном h > 0 по- ложим zA(x) = l в случае (k—V)h^.x<kh и zft(x) = 0 в других случаях. Тогда две функции и z = (1.14) являются конечными ступенчатыми функциями и Интеграл для z есть общий предел при h—>0 интегралов от этих ступенчатых функций. Обозначим через Zk решение уравнения восстановления, соответствующее гк. Тогда решения, соответствую- щие z и г", определяются равенствами и 2=2^4- (1-15) При каждом фиксированном k по теореме восстановления Zk(x)—>й/ц. Кроме того, (1.7) гарантирует нам, что Zft(x)<Cft при всех k и х. Остаточные члены рядов в (1.15) сходятся поэтому равномерно к 0, и мы заключаем, что при х—>оо Z(x)—>о/ц, Z(x)—>о/ц. (1-16) Но Z <1Z Z, и поэтому все предельные значения Z (х) лежат О.
§ L Теорема восстановления 4Ц между tf/ц и o'/ц. Если z непосредственно интегрируема по Риману, то из последних рассуждений вытекает, что Z (х) = ц“х J г (у) dy, х—>оо. (1.17) о До сих пор мы предполагали, что F—не арифметическое рас* пределение и ц < оо. Наши рассуждения применимы без измене- ний в случае ц = оо, если ц"х считать нулем. Если распределение F арифметическое с шагом к, то решение Z уравнения (1.5) имеет вид Z(x) = ^z(x—kk)uk, (1.18) где ик —>Х/ц. Легко сделать вывод, что при фиксированном х Z(x-j-nX)—> Ац~х 2 z (* + А), п—>оо> (1.19) /=1 при условии сходимости ряда, что, конечно, имеет место, если z непосредственно интегрируема. Соотношения (1.17) и (1.19) выведены нами из теоремы вос< становления, но эти соотношения сами содержат теорему восста- новления как частный случай, когда г является индикатором интервала 0, й. Таким образом, нами доказана следующая Теорема восстановления. (Альтернативная форма.) J) Если г непосредственно интегрируема по Риману, то решение Z уравне- ния восстановления удовлетворяет соотношению (1.17), если F неарифметическое, и соотношению (1.19), если F арифметическое с шагом X. Возникает вопрос! может ли быть опущено условие непосред- ственной интегрируемости, по крайней мере для непрерывных функций z, стремящихся к 0 на бесконечности? Следующие ниже примеры показывают, что это невозможно. Пример 3,6) покажет подобным же образом, что теорема восстановления может быть х) Можно надеяться, что эта форма теоремы и предшествующее ей обсуж- дение положат конец достойной сожаления путанице, распространившейся ныне в литературе. Наиболее широко распространены ссылки на статью Смитам Smith W. L., Renewal theory and its ramifications, J. Roy. Stat. Soc, ser. B, vol. 20 (1958), 243 — 302. (Есть русский перевод: Смит В., Теория восста- новления, сб. Математика5:3 (1961), 95 —150.) Со времени своего появления «ключевая теорема восстановления», доказанная Смитом, практически вытеснила все применявшиеся до нее варианты (которые не всегда были корректны)* Ключевая теорема доказывает (1.17) при излишнем предположении, что з монотонна. Доказательство Смита 1954 г. основано на глубоких тауберовых теоремах, принадлежащих Винеру, а работа Смита 1958 г. производит впечат- ление, что этот обходной путь доказательства проще, чем прямое сведение к основной форме теоремы восстановления. Кроме того, условие ограниченности з пропущено g работе, [Относительно его необходимости см. пример 3^б)Д
412 Гл. XI. Теория воатановления неверна для неограниченной функции г даже при том, что она Обращается в нуль вне некоторого конечного интервала. Поэтому несобственные интегралы Римана не находят применения в тео- рии восстановления, а непосредственная интегрируемость появ- ляется как естественная основа теории. Примеры, а) Непрерывная функция г (х) может быть неогра- ниченной и тем не менее интегрируемой по Риману на 0, оо функцией. Чтобы убедиться в этом, положим г{п) — ап при п=1, 2, ..., и пусть z тождественно равна нулю вне объедине- ния интервалов |х—п \ 1/2; пусть между п и п ±hn функ- ция г есть линейная функция х. График функции г при этом образуется последовательностью треугольников с площадями ajin, и, следовательно, z интегрируема по Риману тогда и только тогда, когда '£anhn<<x>. Это не мешает тому, что ап—>оо. б) Чтобы исследовать роль условия непосредственной интегри- руемости в теореме восстановления, достаточно рассмотреть ариф- метические распределения F. Таким образом, можно предположить, что мера U сосредоточена на множестве целых чисел и что масса ип, приписанная точке п, стремится к пределу р,-1 > 0. Тогда для любого целого положительного числа п мы имеем Z (о) = ипг (0) -|- tz„_1z (1) + ... + мог (n). Выберем теперь в качестве г функцию из предыдущего примера с ап— 1. Тогда Z(n)~ пр,-1 и поэтому функция Z даже не огра- ничена. Очевидно, что то же самое справедливо, если ап стре- мится к 0 достаточно медленно. Таким образом, мы получаем пример непрерывной интегрируемой функции г, такой, что z(x)—>-0, но Z(x) неограничена. > § 2. ДОКАЗАТЕЛЬСТВО ТЕОРЕМЫ ВОССТАНОВЛЕНИЯ Для арифметических распределений теорема восстановления была доказана в 1; XIII, 11, и поэтому мы предположим, что распределение F неарифметическое. Для доказательства нам нужны будут две леммы (первая из них вновь появится в усиленной форме как следствие из теоремы в § 9). Лемма 1. Пусть ограниченная равномерно непрерывная функ- ция £ такова, что £(х)^£(0) при —оо<х<оо. Если со Ux) = \^-y)F{dy}, (2.1) о то имеет место тождество С(х) = £(О). Доказательство. Вычисляя свертки с F и используя индукцию,
§ 2. Доказательство теоремы восстановления 413 получаем из (2.1), что со Ш = $Цх-£)Г'*Ж г = 1’ 2’--- ‘ М О Подынтегральное выражение в (2.2) не превосходит ЦО), и поэтому для х = 0 равенство возможно только в том случае, если Ц—= Для каждого значения у, которое служит точкой роста Fr*. По лемме 2 из гл. V, 4а, образованное такими точками множество S асимптотически плотно на бесконечности, и ввиду равномерной непрерывности £ отсюда следует, что Ц—у)—>Ц0) при у—> оо. При г—> оо масса распределения Fr* стремится сосредоточиться «вблизи бесконечности». Поэтому при больших г интеграл в (2.2) по существу зависит только от больших зна- чений у, и для таких значений Цх—у) близко к ЦО). Устремляя г к оо, мы выводим таким образом из (2.2), что Цх) = Ц0), что и утверждалось. Лемма 2. Пусть г—непрерывная функция, обращающаяся в нуль вне интервала 0, h. Тогда соответствующее решение Z урав- нения восстановления равномерно непрерывно и для любого а Z(x + a)—Z(x)—>0, х—+оо. (2.3) Доказательство. Разности Цх + б)—Цх) обращаются в нуль на интервале длины ft+ 26, и поэтому в силу (1.5) и (1.7) I (х + б)—Z (х) | С/1+ 2б шах | г (х + б) — г (х) |. (2.4) Отсюда вытекает, что если z равномерно непрерывна, то это же самое справедливо для Z. Допустим теперь, что г имеет непрерывную производную z,J. Тогда Z' существует и удовлетворяет уравнению восстановления Z'(х) = z'(х) Ц Z'(х—y)F{dy\. (2.5) о Таким образом, производная Z' ограничена и равномерно непре- рывна. Пусть lim sup Z' (х) = я- (2-6) Выберем такую последовательность tn, что Z' (/„)—> т]. Семейство функций определенных равенством ^(x) = Z<(f„ + x), (2.7) равностепенно непрерывно и Ц*)=г'(М-л) + $ ^n{x—y)F{dy\. (2.8) о
^14 Гл. XI. Теория восстановления Следовательно, существует такая подпоследовательность/пг, что сходится к пределу £. Из (2.8) следует, что этот предел удовлет- воряет условиям леммы 1 и поэтому (х) = £? (0) = ц для всех х. Таким образом, Z' Gnr4-x) —*т] или Z(^r + a)—Z(^nr)—>т)«- (2-9) Поскольку это верно при любом а и Z ограничена, то т] = 0. Те же самые аргументы применимы при рассмотрении нижнего пре- дела, и в итоге получаем, что Z'(x)—>0. Таким образом, мы доказали лемму для непрерывно дифферен- цируемой функции z. Но произвольная непрерывная функция z может быть приближена непрерывно дифференцируемой функцией ziy которая обращается в нуль вне интервала 0, h. Пусть — соответствующее zt решение уравнения восстановления. Тогда из | z—Zi | < е следует | Z—Zt | < СЛе, и поэтому | Z (х-|-а)—Z (х) | < <(2СЛ4-1)е для всех достаточно больших х. Таким образом, (2.3) справедливо для произвольной непрерывной функции х. Завершение доказательства теперь облегчено. Если I—это интервал а^х^Р, то пусть /-)-£ обозначает интервал По теореме о выборе (теорема 2 из гл. VIII, 6) существует последовательность tk —* оо и мера V, такие, что U{tk+dy}-+V{dy}. (2.10) Мера V конечна на конечных интервалах, но не сосредоточена на 0, оо. Пусть теперь z—непрерывная функция, равная нулю вне конечного интервала 0, а. Соответствующее решение Z уравнения восстановления удовлетворяет тогда соотношению а а 2(^4-х) = $ z(—s)t/{^ + x-{-ds}—> J z(—s)V {x-f-ds}. (2.11) 0 0 Из леммы 2 следует, что семейство мер V {x-\-ds} не зависит от х, и, следовательно, значение V {/} должно быть пропорционально длине интервала I. Таким образом, (2.10) можно переписать в виде U(tk)-U(tk-h)-,yh. (2.12) Это соотношение есть не что иное, как утверждение (1.9) теоремы восстановления, с той лишь разницей, что множитель ц"1 заме- нен неизвестной величиной у и что t пробегает последовательность \tk\. Однако наш вывод теоремы восстановления в ее альтерна- тивной форме остается справедливым, и, таким образом, 00 Z(U — Hz(lW (2.13) о
§ 3. Уточнения если только z непосредственно интегрируема. Функция z=l—F монотонна, и ее интеграл равен ц. Соот- ветствующее z решение Z уравнения восстановления становится равным 1. Если р < оо, то функция z непосредственно интегри- руема и из (2.13) следует, что ур= 1. Если р = оо, то мы урезаем г и выводим из (2.13), что у-1 превосходит интеграл от z по произвольному интервалу 0, а. Таким образом, из р=оо следует у = 0. Следовательно, предел в (2.12) не зависит от последователь- ности и (2.12) совпадает с утверждением (1.9) теоремы вос- становления. § 3*). УТОЧНЕНИЯ В этом параграфе мы покажем, как свойства регулярности распределения F могут привести к усиленным вариантам теоремы восстановления. Теорема 1. Если F—неарифметическое распределение с мате- матическим ожиданием р и дисперсией о2, то (3.1) Сама теорема восстановления лишь утверждает, что U (/) ~ t/p, а оценка (3.1) значительно сильнее. Даже тогда, когда дисперсия не существует, (3.1) выполняется с заменой правой части на оо. [Аналог теоремы для арифметических распределений дан в (12.2) в 1, ХШ.] Доказательство. Положим z(o=t/w-4‘ (3-2) г Легко проверить, что это есть решение уравнения восстановления, которому соответствует со 2(0 = И[1“ FWdy. (3.3) t Интегрируя по частям, получаем (3.4) Так как функция z монотонна, она непосредственно интегрируема^, и по теореме восстановления (альтернативная форма) заключаем, что (3.1) справедливо. > Перейдем теперь к свойствам гладкости функции U. Если F ♦) Этот параграф может быть опущен при первом чтении,
416 Гл. XL Теория восстановления имеет плотность /, то уравнение восстановления для U принимает вид х U(x) = l + $U(x-y)f(y)dy. (3.5) о Если бы f была непрерывна, то формально выполненное диф- ференцирование показало бы, что U имеет производную и, удов- летворяющую уравнению X U (X) = / (х) 4- J и (х—у) f (у) dy. (3.6) О Это уравнение восстановления стандартного типа, а мы знаем, что его решение единственно, если функция f ограничена (но обязательно непрерывна). Легко проверить, что функция (/, определенная равенством t U(t) = l + $u(y)dy, i>Q, (3.7) О удовлетворяет (3.5), и, следовательно, решение и уравнения (3.6) действительно является плотностью U. Как следствие из теоремы восстановления в ее альтернативной форме мы получили следую- щий результат. Теорема 2. Если F имеет непосредственно интегрируемую плотность f, то U имеет плотность и, такую, что u (t)— Плотности,' не являющиеся непосредственно интегрируемыми, вряд ли могут встретиться в практических ситуациях. Однако и относительно них мы можем сделать некоторые заключения. В самом деле, рассмотрим плотность t fAf}=\f{t-y)f{y)dy (3.8) О распределения F*F. Вообще говоря, f2 «много лучше», чем f. Например, если / < М, то из соображений симметрии получаем f2(i) <2М (3.9) Правая часть—монотонная интегрируемая функция при р < оо и отсюда сле- дует, что /2 непосредственно интегрируема. Разность и—f есть решение уравнения восстановления с z—f2. Таким образом, имеет место Теорема 2а. Если F имеет ограниченную плотность f и конечное матема- тическое ожидание р, то м (/)_/(/) (З.Ю) Полученный результат любопытен, так как означает, что если колебания f велики, то и изменяется так, что компенсирует их. (Близкие результаты см. в задачах 7, 8.) Условие ограниченности f является существенным. Мы покажем это на примере, который, кроме того, проливает новый свет на условие непосред- ственной интегрируемости в теореме восстановления,
4. Устойчивые (возвратные) процессы восстановления 417 Примеры, а) Пусть распределение вероятностей G, сосредоточенное на бл, определено формулой G W =1—ГТ\ 5 0 < х 1. log(e/x)’ (З.П) Это распределение обладает плотностью, которая непрерывна в 'открытом Интервале, но не ограничена вблизи нуля, поскольку x’~1G (х) —> оо при х—>0. Сумма п независимых случайных величин с распределением G, оче- видно, меньше х, если каждая компонента < x/nt Следовательно, G"* (х) (G (х/п))", ‘ (3.12) Отсюда следует, что при каждом п плотность распределения Gn* не ограни- чена вблизи нуля. Положим теперь F (х) = G (х—1). Тогда P2*(x)=Gn*(x— п) и, следова- тельно, Р2* имеет плотность, которая обращается в нуль при х<п, непре- рывна при х>п, но не ограничена вблизи числа п. Поэтому плотность и функции восстановления U = не ограничена в окрестности любого целого числа п>0. б) Плотность и предыдущего примера удовлетворяет уравнению (3.6), которое7 совпадает при z=f с обычным уравнением восстановления (1.3). Функция zl интегрируема, обращается в нуль при х>2 и непрерывна всюду, за исключением точки 1. Тот факт, что решение Z = u не ограничено вблизи любого целого числа, показывает, что теорема восстановления неверна, даже если z сосредоточена на конечном интервале, не не является интегрируемой по Риману в собственном смысле (последнее вытекает из неограниченности z). ► § 4. УСТОЙЧИВЫЕ (ВОЗВРАТНЫЕ) ПРОЦЕССЫ ВОССТАНОВЛЕНИЯ Мы используем теперь теорему восстановления для вывода различных предельных теорем для процессов восстановления, описанных в гл. VI, 6. Мы рассмотрим последовательность взаим- но независимых случайных величин Tf, Т2, ... с одним и тем же распределением F, которые назовем промежутками между вое- становлениями. В этом параграфе мы предположим, что F—• собственное распределение и F (0) = 0. В дополнение к может быть задана неотрицательная случайная величина So, имеющая собственное распределение Fo. Положим S„ = S0 + T1+,..4-T„. (4.1) Случайные величины Sn называются моментами восстановления. Процесс восстановления {S„} называется чистым, если So = O, и называется процессом с запаздыванием в других случаях. Воспользуемся обозначением U в (1«2). 14 №249
418 Гл. XI. Теория восстановления Математическое ожидание числа восстановлений на 0, i равно V(t)=^P{Sn^t} = F^U. (4.2) л=0 Таким образом1), при й>0 t + h V(t + h)-V(t)= \ [U(t+h-y)-U(t-y)]F0{dy}. (4.3) О Если F—неарифметическое распределение, то при t—> оо подынтегральное выражение стремится к p-Vi. Поэтому основная теорема может быть распространена на случай процессов с за* паздыванием: если распределение F—неарифметическое, то мате- ----------------------------------------------1 матическое ожидание числа восстановлений в t, t^h стремится к prVi. В этом утверждении содержатся две теоремы о равно- мерной распределенности: во-первых, скорость восстановления стремится к постоянной и, во-вторых, эта постоянная не зависит от начального распределения. В этом смысле мы имеем здесь аналог эргодических теорем для цепей Маркова [см. 1; гл. XV]. Если р<оо, то V(/)~при >оо. Естественно поста* вить вопрос о том, возможно ли выбрать Fo так, чтобы получить V (/) = рл1/, т. е. постоянную скорость восстановления. Но V удовлетворяет уравнению восстановления V = F0 + F>V, (4.4) и потому V(/) = p"V тогда и только тогда, когда t F^)-~^{t~y-)P{dy}. (4.5) г о Интегрирование оо частям показывает, что это эквивалентно равенству t = (4-6) Функция Fo является функцией распределения, так что ответ утвердителен: при начальном распределении (4.6) скорость восста* новления постоянна, V(/) = p-1/. Распределение (4.6) появляется и как предельное распределен ние времени ожидания восстановления (или как предельное рас* пределение величины перескока через некоторый уровень). Каж- ,J) Вспомним о договоренности в § 1 — интервалы интегрирования предпо» лагаются замкнутыми, пределы интегрирования могут быть заменены на —о? и
4. Устойчивые (возвратные! процессы восстановления 419 дому t >0 соответствует случайный индекс Nf, такой, что SNt<i<SNf+j. (4.7) По терминологии гл. VI, 7, случайная величина Sn<+i—t назы- вается остающимся временем ожидания, соответствующим момен- ту t. Обозначим через H(t, g) вероятность того, что это время Другими словами, H(t, g)—это вероятность того, что пер- вый после t момент восстановления лежит в интервале t, ( + g или что перескок через уровень t не превосходит %. Это событие происходит тогда и только тогда, когда некоторый момент вос- становления $„ равен х t, а время до следующего момента восстановления лежит между t—х и t—% + £. В случае чистого процесса восстановления получаем, суммируя по всем хил, t H(t, {dx}[F(t-x-}-l)-F(t-x)}. (4.8) о Этот интеграл содержит £ как свободный параметр и имеет стан- дартный вид U * г, где 'z (t) = F (t + £)—F(t). Заметим, что по- следняя функция является непосредственно интегрируемой1). Предположим, что распределение F—неарифметическое. Из ра- венства J z (t) dt = J ([1—F (/)]—[1 — F (t £)]) dt = $ (1 — F (s)) ds (4.9) 0 0 0 получаем предельную теорему 1 г8 limtf(t g) = ± J[l_F(s)]ds (4.10) (легко проверить, что это соотношение верно и для процессов с запаздыванием при любом начальном распределении Ео). Эта предельная теорема замечательна в нескольких отношениях. Как показывает дальнейшее обсуждение, она тесно связана с «пара- доксом контроля» из гл. VI, 7, и «парадоксом времени ожидания» из гл. I, 4. Если р, < оо, то предельное распределение (4.10) совпадает с распределением (4.6). Таким образом, при р < оо остающееся время ожидания имеет собственное предельное распределение, кото- рое совпадает с распределением, приводящим к постоянной скорости 1) При ng < х < (n+l) g имеем ?(x)<F((n+2) g)— F (ng), и ряд из этих, членов, очевидно, сходится, 14*
420 Гл. XI. Теория восстановления восстановления. В этом примере мы сталкиваемся еще раз со схо- димостью к «стационарному режиму». Предельное распределение в (4.10) имеет конечное математи- ческое ожидание в том и только том случае, когда F имеет дис- персию. Это указывает, грубо говоря, на то, что «вероятности вхождения» ведут себя хуже, чем F. В случае ц=оо имеем при всех I Н(1. £)->0, (4.11) т. е. вероятность того, что перескок через уровень t превзойдет сколь угодно большое число g, стремится к единице (для случая правильно меняющихся хвостов распределения более точная инфор- мация дается в гл. XIV, 3). Примеры, а) Суперпозиция процессов восстановления. Пусть даны п процессов восстановления. Соединяя все моменты восста- новления вместе, мы получим некоторый новый процесс. Вообще говоря, новый процесс не будет процессом восстановления, однако для него легко подсчитать время ожидания W первого после нуля восстановления. Мы покажем, что при весьма общих условиях рас- пределение W приближается к показательному закону, а состав- ной процесс—к процессу Пуассона. Этот результат объясняет, почему многие процессы (такие, как поток вызовов, поступающих на телефонную станцию) похожи на процесс Пуассона. Рассмотрим п взаимно независимых процессов восстановления, у которых промежутки между восстановлениями имеют распре- деления Fr. .... Fn с математическими ожиданиями р*, ..., рЛ соответственно. Положим 1 (4.12) Pl Нп Мы ’потребуем, грубо говоря, чтобы моменты восстановления в каждом из объединяемых процессов были расположены крайне редко, так что суммарный эффект складывается из многих малых частей. Чтобы удовлетворить это требование, мы допустим, что при фиксированных k и у вероятности Fk(y) малы, а велики. Это предположение оказывается осмысленным в форме предель- ной теоремы. Рассмотрим «стационарную» ситуацию, предполагая, что рас- сматриваемые процессы протекают уже длительное время. Тогда для времени ожидания ближайшего момента восстановления в &-м процессе имеем приближенное равенство t (4ЛЗ) [Последняя аппроксимация основана на малости Fk («/).] Время ожидания W в объединенном процессе равно наименьшему из Wb,
g 4. Устойчивые (возвратные] процессы восстановления 421 и потому P{W>/)«(1-X)... (4.14) Эти рассуждения легко сделать строгими, и при указанных выше условиях показательное распределение будет предельным при п —> оо. б) Вероятности достижения областей в случайных блужданиях. Рассмотрим последовательность независимых случайных величин Xf, Х2, ... и их частные суммы Y„ = X1+...-f-Xrt. Для положительных Xk случайное блуждание {Y„} представляет собой процесс восстановления, однако сейчас мы рассмотрим произвольные Xk. Допустим, что случайное блуждание устойчиво, так что для любого t >0 с вероятностью единица найдется такое что Y„ > t. Если N — наименьший индекс, для которого это верно, то Yn называется точкой первого вхождения в /, оо. Случайная величина Yn — t равна перескоку через уровень Л при первом вхождении и соответствует остающемуся времени ожидания в про- цессах восстановления. Положим снова Р { Yn t + £} = Н (t, g) и покажем, каким образом предельная теорема для остающегося времени ожидания может быть применена к этому распределению. Определим Sf как точку первого вхождения в 0, оо и по индукции определим Sn+1 как точку первого вхождения в Sw, оо. Последовательность S^, S2, ... совпадает с последовательностью лестничных высот, введенных в гл. VI, 8, и образует процесс восстановления, так как разности Sn+1—Sn очевидным образом независимы и имеют такое же распределение, как 8Х. Разность Yn — t есть остающееся время ожидания в процессе восстанов- ления {Sn}, так что можно применить (4.10). & Методом, использованным при доказательстве (4.10), можно показать, что прошедшее время ожидания t—SNt имеет то же самое предельное распределение. Для длины промежутка Lt =; == Sn/+1—Sn# между восстановлениями, содержащего t, имеем P{Lf<g} = $^{dx}[F(g)-F(/-x)]. t-Ь Следовательно, 1 «I 4 * lim P {Lf < g} = -b I [F (g)-F (</)] dy = ± C xF {dx} t~* и i/ и oJ f(4.15) (4-16) Любопытные следствия этой формулы обсуждались в связи с «па- радоксом контроля» в гл. VI, 7 и «парадоксом времени ожида- ния» в гл. I, 4.
422 Гл. XL Теория восстановления Легко видеть, что три семейства случайных величин t—SN^5 Sj^+1— Lf суть однородные марковские процессы. Доказанные нами три предельные теоремы следуют из эргодических теорем для марковских процессов (см, так- же гл. XIV, 3). § 5. ЧИСЛО N/ МОМЕНТОВ ВОССТАНОВЛЕНИЯ Рассмотрим для простоты чистый процесс восстановления, так что r-й момент восстановления является суммой г независимых случайных величин с одинаковым распределением F. Нуль счи- тается моментом восстановления. Обозначим через N* число мо- ।----------------------------1 ментов восстановления на 0, t. Событие равносильно ।--1 тому, что r-й момент восстановления находится на 0, t. Поэтому P{N,>r} = F'*(0. (5.1) Очевидно, что Nt^l. Тогда E(Nt)=SP{Nt>r} = tf(O. (5.2) г=0 (О моментах Nf второго порядка см. в задаче 13.) Случайные величины встречаются также в задачах последовательного анализа. Предположим, что последовательные испытания (наблю- дения) с результатами Тх, Т2, ..., Т„ продолжаются до тех пор, пока сумма результатов испытаний не превзойдет в первый раз t. Тогда Nf равно полному числу испытаний. Можно было бы избе- жать многих утомительных вычислений, если применить оценку (3.1), предлагаемую уточненной теоремой восстановления. Если F имеет математическое ожидание р и дисперсию о2, то асимптотическое поведение распределения величины Nf опреде- ляется тем, что распределение асимптотически нормально. Соответствующие расчеты можно найти в 1, XIII, 6, и они не связаны с арифметическим характером F. Итак, имеет место сле- дующий результат. Центральная предельная теорема для случайной величины Nf. Если F имеет математическое ожидание р и дисперсию о2, то для больших t число Nf моментов восстановления распределено приближенно нормально с математическим ожиданием /р“х и дис- персией Пример, а) Счетчики первого типа. Поступающие частицы образуют пуассоновский поток. Частица, попадающая в счетчик в момент, когда он работает, регистрируется, но «закрывает» счетчик на фиксированное время Частицы, достигающие счет- чика в то время, когда он «закрыт», не регистрируются. Для простоты рассмотрим процесс с того момента, когда новая частица попадает в работающий счетчик. Мы имеем два процесса восста*
§ 5, Число Nf моментов восстановления 423 новления. Первый процесс—входной поток. Это процесс Пуассона, т. е. промежутки между появлениями частиц имеют показательное распределение 1—е~с* с математическим ожиданием и диспер- сией е“2. Последовательные регистрации образуют вторичный про- цесс восстановления, в котором промежутки между последова- тельными регистрациями представляют собой суммы | и показа- тельно распределенных случайных величин. Поэтому их матема- тическое ожидание равно 6 + а дисперсия равна с~2. Таким образом, число регистраций на временном интервале 0, t распре- делено приблизительно нормально - с математическим ооюиданием + и дисперсией /с (1 4-с£)“3. Из того что эти величины различны, следует, что число реги- страций не подчиняется распределению Пуассона. В свое время не было отчетливого понимания того факта, что процесс регистра- ции существенно отличается от первоначального процесса. Резуль- таты наблюдений привели некоторых физиков к ошибочному заключению, что ливни космических частиц не имеют пуассонов- ского характера «чистой случайности». Предельное распределение для Nf существует тогда и только тогда, когда F принадлежит области притяжения некоторого закона. Области притяжения описаны в гл. IX, 8, и XVII, 5, откуда можно вывести, что имеет соб- ственное предельное распределение тогда и только тогда, когда 1—F (х) ~ x~aL (х), х—> оо, (5.3) где L—медленно меняющаяся функция и 0 < а < 2. Предельное распределе- ние для N/ легко вычислить. При этом обнаруживаются парадоксальные свой- ства флуктуаций. Их поведение существенно различно при а < 1 и а > 1, Рассмотрим случай 0 < а < 1. Если аг выбраны таку что r[l-F(a,)]->^, (5.4) ТО Fr*(arx)-^Ga (х), где <?а — одностороннее устойчивое распределение,^ удовлетворяющее условию ха [1— Ga (х)]—> (2—а)/а при х—>оо. (Ср. с гл. IX, 6, и гл. XVII, 5, а также гл. КШ, 6.) Пусть г и t возрастают таким образом, что t ~ агх. Тогда из (5.3) и (5.4) с учетом того, что функ- ция L медленно меняющаясяу получаем 2—а х~а r~~a~ 1— F откуда в силу (5,1) Р {[1-F (0) (5,5) (5.6) Это соотношение— аналог центральной предельной теоремы. Частный случай для а =1/2 содержится в 1; гл. XIII, 6. Неожиданные черты поведения связаны с нормирующим множителем 1—F (t) в (5.6). Грубо говоря, 1—F (/) имеет порядок t~a, так что величина N/ имеет порядок /а; плотность момен- тов восстановления должна неограниченно убывать (что согласуется с асимп- тотическим поведением вероятностей достижения). При 1 < а < 2 распределение F имеет математическое ожидание р, < оо и
424 Гл. XL Теория восстановления вычисления, аналогичные проделанным выше, показывают, что Р (5.7) I н ) где X (/) удовлетворяет соотношению qi-F(MO)] —(5.8) В этом случае среднее число моментов восстановления растет линейно, однако наличие нормирующего множителя К (t) показывает, что случайные отклоне* ния от среднего могут быть весьма велики. § 6. ОБРЫВАЮЩИЕСЯ (НЕВОЗВРАТНЫЕ) ПРОЦЕССЫ Общая теория процессов восстановления с несобственным рас- пределением F почти тривиальна. Однако соответствующее урав- нение восстановления часто встречается в различных «масках», когда случайные черты затемняют общее основание. Ясное пони- мание этого основного факта позволит избежать громоздких рас- суждений в отдельных задачах. В частности, асимптотическая формула теоремы 2 влечет результаты, для доказательства кото- рых ранее использовался в специально преобразованном виде аппарат уравнений Винера — Хопфа. Чтобы избежать путаницы в обозначениях, мы будем исполь- зовать для исходного распределения букву L (вместо F). Иными словами, в этом параграфе L обозначает несобственное распределе- ние вероятностей с L(0) = 0 и L(oo) = Loo< 1. Оно играет роль распределения (несобственных), промежутков между последо- вательными восстановлениями, причем «дефект» 1—равен вероятности обрыва процесса. Начало координат на оси времени считается моментом восстановления с нулевым номером, a Sn == =Т14-...+Тп представляет собой n-й момент восстановления; это несобственная случайная величина с распределением L"*, которому соответствует полная масса L"*(oo) = L". «Дефект» 1—LZ, равен вероятности обрыва процесса до n-го момента вос- становления. Положим снова ’ (6.1) п=0 Как и в случае возвратных процессов, U (/) равно математи- ческому ожиданию числа моментов восстановления в интервале I--1 О, t. На этот раз, однако, математическое ожидание полного числа восстановлений является конечным и равно £7(оо)=^_. (6.2) 1 -*-'00 Вероятность того, что n-й момент восстановления S„ будет послед- ним и при этом ^.х, равна (1— L„)Ln* (х). Таким образом, верна
§ 6. Обрывающиеся (невозвратные) процессы 425 Теорема 1. Обрывающийся процесс восстановления, начинаю- щийся в начале координат, обрывается с вероятностью единица. Момент обрыва М (т, е. максимум последовательности 0, Sif S2, ...) имеет собственное распределение P{M<x} = (l-L„)(/(x). (6.3) Вероятность того, что n-й момент восстановления будет послед- ним, равна (1—LJL", т. е. число моментов восстановления имеет геометрическое распределение. Эти результаты возможно изложить и в терминах несобствен- ного уравнения восстановления t Z(t) = z(t)+ Z(t—y)L{dy}, (6.4) О но при несобственном распределении L соответствующая теория тривиальна. В предположении, что z(x) = 0 при х^О, единст- венное решение задается формулой t Z(t)=\z{t-y)U{dy] (6.5) о и, как очевидно, если только г(/)—>г(оо) при ->оо. Примеры, а) Событие происходит, если процесс за- канчивается на So или если Tf принимает некоторое положитель- ное значение y^t и остающийся процесс «доживает» до момента, который =</—у. Таким образом, = удовлетворяет уравнению восстановления i Z(t) = \-L„+\Z(t-y)L{dy}. (6.7) о Это уравнение эквивалентно (6.3). б) Вычисление моментов. В последнем соотношении собствен- ное распределение Z представляется в виде суммы двух несобст- венных распределений: одно определено, как свертка, а другое имеет единственный атом в нуле. Чтобы вычислить математическое ожидание Z, положим СО EL = \xL{dx}. (6.8) о Аналогичное обозначение примем и для других распределений (как собственных, так и несобственных). Так как L—несобствен- ное распределение, то свертка в (6.7) имеет математическое ожи-
426 Гл. XI. Теория восстановления дание L„-Ez + El. Таким образом, Ez = EL/(l—L^). Для более общего уравнения (6.4) подобным же путем получаем Моменты более высокого порядка могут быть подсчитаны этим же методом. ► Асимптотические оценки В применениях обычно z(t) стремится к пределу г(оо), и в та- ком случае Z(t) стремится к пределу Z(oo), который дан в (6.6). Поэтому важно установить асимптотические оценки для разности Z(oo)—Z(Z). Это можно сделать методом, который широко при- меним в теории случайных блужданий [см. сопряженные случай- ные блуждания в примере 4, б) гл. XII]. Этот метод связ:н с (как правило, безобидным) предположением, что существует такое число х, что \eWL{dy} = \. (6.10) о Такой корень х уравнения (6.10), очевидно, единственный, и так как распределение L несобственное, то х > 0. Введем теперь собственное распределение вероятностей L* равенством L* {dy}=e*vL{dy} (6.11) и сопоставим каждой функции f новую функцию /*, определен- ную соотношением f# (x) — eKXf(x). Достаточно взглянуть на (6.4), чтобы понять, что выполняется уравнение восстановления t Z# (/) = 2# (/) + $ Z# (t-у) М {dy}. (6.12) о Если Z* (/)—>а=4=0, то Z (/) ~ ae~Kt. Таким образом, если г* непосредственно интегрируема [и в этом' случае г(оо) = 0], то из теоремы восстановления следует, что 00 e-H/Z (0 — -L- f eKXz (х) dx, (6.13) И J где 00 li#— eKyyL{dy}. (6.14) о В (6.13) содержится хорошая оценка для Z(t) при больших t. С незначительным изменением эта процедура применима и
§ 7. Различные применения 427 тогда, когда г(оо)^0. Положим Zj (/) = г (оо)—z (0 + г (оо) . Легко проверить, что разность Z(oo)—Z(t) удовлетворяет обыч- ному уравнению восстановления (6.4) с заменой г на гх. Интегри- руя по частям, находим, что интеграл от z* (х) = zt (х) е*х равен правой части (6.15). Применяя (6.13) к Zi( мы приходим к сле- дующему результату. Теорема 2. Если выполняется (6.10), то решение уравнения восстановления .удовлетворяет условию [Z (оо)—Z (0]->^^4- J е*х [г (оо)—z (х)]dx (6.15) о при дополнительном предположении, что =^=оо и что непо- средственно интегрируема. Для частного случая (6.7) получаем (6.16) В следующем параграфе мы покажем, как поразительно сильна эта оценка. В частности, в примере б) будет показано, как с по- мощью нашего простого метода можно иногда быстро получить результаты, требующие обычно более глубоких и трудоемких методов. Случай La, > 1. Если Loo > 1,' то существует постоянная % < 0, такая^ что (6.10) верно, и тогда описанное выше преобразование сводит интеграль- ное уравнение (6.4) к (6.12). Теорема восстановления приводит, таким обра- зом, к точным оценкам асимптотического поведения Z (/) [Дискретный случай охватывается теоремой 1 из 1; гл, XIII, 10, О применениях в демо- графии см. пример 10, д) из 1; гл, XII.] § 7. РАЗЛИЧНЫЕ ПРИМЕНЕНИЯ \ Как уже указывалось, теория предыдущего параграфа может быть применена к задачам, которые не связаны непосредственно с процессами восстановления. В этом параграфе мы дадим два не зависящих друг от друга примера. а) Крамеровская оценка для риска. В гл. VI, 5, было пока- зано, что в решении задачи о разорении в обобщенном пуассо- новском процессе, а также в решении проблем, связанных с раз- мером хранилищ, назначением пациентов и т. п., используется распределение R, сосредоточенное на 0, оо и удовлетворяющее интегро-дифференциальному уравнению 2 (z-x) F {dx}, (7.1) о
428 Гл. XL Теория восстановлена^ где F—собственное распределение1). Интегрируя (7.1) на ОД и производя очевидное интегрирование по частям, получаем t R(t)—R(Q) = 2^R (t—x) [1 —F (x)] dx. (7.2) 0 Здесь 7?(0)—неизвестная постоянная, но в остальном (7.2) пред- ставляет собой уравнение восстановления с несобственным рас- пределением L, имеющим плотность (а/с)[1—F (%)]. Обозначим математическое ожидание F через |л. Тогда полная масса L равна Ьж = а[1/с. [Рассматриваемый процесс имеет смысл только при Loo< 1, так как в противном случае R(t) = 0 при всех /.] Заме- тим, что (7.2) является частным случаем (6.4) и что 7?(оо)=1. Вспоминая (6.6), получаем Я(0) = 1-^. (7.3) Подставляя это значение в уравнение (7.2), мы приведем его к уравнению вида (6.7) для распределения времени жизни М обрывающегося процесса, в котором промежуток между соседними' восстановлениями имеет распределение L. Из (6.16) следует, что если существует постоянная и, такая, что F(x)]dx=l (7.4) О U = у J е*хх[1—F(x)]dx < оо, (7.5) то при t —> оо 1-/Д/)-----(7.6) хД \ с / Это известная оценка, принадлежащая Крамеру, была первона- чально получена при помощи глубоких методов теории комплекс- ной переменной. Моменты R могут быть вычислены, как указано в примере 6,6). б) Пробелы в процессе Пуассона. В гл. VI, 7, мы вывели уравнение восстановления для распределения V времени ожида- ния первого пробела длины в процессе восстановления. Когда этот процесс является процессом Пуассона, то промежутки между последовательными восстановлениями распределены показательно, и уравнение восстановления (7.2) гл. VI имеет стандартную 1) Это специальный случай (5.4) гл. VI с распределением F, сосредото- ченным на 0, со, Он будет рассмотрен с помощью преобразований Лапласа в гл, XIV> 2, б), Общую ситуацию см, в гл< XII, 5, г),
$ 8, Существование пределов в случайных процессах 429 форму V = z + V L с ( 1—е~сх, z(x) = 0 при х < L(x) — | j—г(х) = е~^ npU Так как z(oo) = l—£то, то решение V будет собственным распре- делением вероятностей, что соответствует смыслу задачи. Моменты рассматриваемого нами времени ожидания W легко вычислить методом, описанным в примере 6, б). Мы получаем E(W) = ^, e2c£ — iС’®) Var (W) = е с5— . Условимся интерпретировать W как время ожидания пешехо- дом возможности пересечь поток машин. Тогда указанные фор- мулы показывают, как влияет на ответ возрастание плотности потока. Математическое ожидание числа машин, проходящих за время, необходимое для пересечения потока, равно eg. Пола- гая eg = 1 и 2, видим, что E(W)^ 1,72g и E(W)^3,2g соответ- ственно. Дисперсия возрастает от (примерно) g2 до 6g2. [Явное решение и связь с теоремой о покрытии указаны в примере 2, а) гл. XIV.] Можно применить асимптотическую оценку (6.14). При eg > 1 основное уравнение (6.10) сводится к се(х-С)^х, 0<х<е, (7.9) и стандартными вычислениями мы выводим из (6.14), что (7.10) ► § 8. СУЩЕСТВОВАНИЕ ПРЕДЕЛОВ В СЛУЧАЙНЫХ ПРОЦЕССАХ Сила теоремы восстановления наиболее ярко демонстрируется, пожалуй, тем, что она позволяет без всяких усилий доказать существование «стационарного режима» в обширном классе слу- чайных процессов. От самого процесса мы потребуем лишь, чтобы рассматриваемые вероятности были определены. В противном случае теорема имеет чисто аналитический характер1). Рассмотрим случайный процесс со счетным множеством состоя- ний Ео, £х, ... и обозначим Pk (/) вероятность состояния Ek в момент t > 0. Нижеследующая теорема опирается на сущест- вование «рекуррентных событий», т. е. моментов, в которые процесс как бы начинается заново. Более точно, мы предполагаем, что существует момент Sn такой, что течение процесса после J) Более сложные результаты см. в статье: Benes V. Е.^ A «renewal» limit theorem for general stochastic processes, Ann. Math. Statist., 33 (1962)$ 98—113, или в книге того же автора (1963),
430 Гл. XL Теория восстановления является точной вероятностной копией всего процесса, начинаю- щегося в момент 0. Отсюда вытекает существование целой после- довательности моментов S2, S3t ... с тем же самым свойством. Последовательность представляет собой возвратный процесс восстановления. Мы допустим, что среднее время между восста- новлениями p = E(S1) конечно. Обозначим Pk(f) условную веро- ятность Ek в момент t + s при условии, что Sf =s. Предполагается, что эти вероятности не зависят от s. При этих условиях мы докажем следующее важное утверждение. Теорема. Предел lim />,(/) = р, (8.1) t -> со существует, причем рк^0 и J} рк = 1. Доказательство. Пусть qk(t)—вероятность объединения собы- тий: Sx > t и «в момент t система находится в состоянии Ек». Тогда S <7,(0 =1-^(0, (8.2) &=0 где F—распределение «времен восстановления» Sw+I —Srt. По предположению t Рк (0=(0 + 5 Pk (t-y) р {dy}. (8.3) о Функция qk непосредственно интегрируема, поскольку она мажо- рируется монотонной интегрируемой функцией 1—F. Поэтому по второй теореме восстановления со lim P,(0 = |f<7ft(0^. (8.4) Интегрируя (8.2), видим, что сумма этих пределов равна единице. Теорема доказана. [> Примечательно, что существование предела (8.1) установлено безотносительно к способу его вычисления. Замечание. Если Fo—собственное распределение, то (8.1) влечет t \Рк(*—y)P»{dy}->pk, 7 —оо. (8.5) о Таким образом, теорема охватывает и случай процесса {Sn} вос- становления с запаздыванием, в котором So имеет распределе- ние Eq.
§ 9. Теория востановления на всей прямой 431 Примеры, а) Теория очередей. Рассмотрим систему (типа теле- фонной станции, почтового отделения или части вычислительной машины), состоящую из одного или более «обслуживающих уст- ройств», и пусть Ек обозначает состояние: в системе имеется k ожидающих «клиентов». В большинстве моделей процесс начи- нается заново, когда прибывающие «клиенты» застают систему в состоянии Ео. В этом случае наша предельная теорема приме- нима тогда и только тогда, когда с вероятностью единица насту- пает такой момент и когда математическое ожидание времени между последовательными наступлениями конечно. б) Двустепенный процесс восстановления. Допустим, что име- ются два возможных состояния Ег и £2. Первоначально система находится в Е±. Последовательные промежутки пребывания в Et суть случайные величины Ху с одним и тем же распределением Они перемежаются с промежутками пребывания в Е2, имеющими одно и то же распределение F2. Предполагая, как обычно, что все рассматриваемые случайные величины независимы, мы полу- чаем «вложенный» процесс восстановления с распределением про- межутков между восстановлениями, равным F = F2. Допустим, что Е(Ху) = |лх < оо и E(Yy) = |ji2 < оо. Очевидно, ^(/) = 1— и потому при t—>оо вероятности состояний Ек стремятся к пределам Л(0—-тг—, Л (0-*-*£-• (8.6) 1V ' Р1 + Н2 2V + V Эти рассуждения легко переносятся на случай многостепенных систем. в) Дифференциальные уравнения из 1; гл. XVII, соответст- вуют случайным процессам, в которых последовательные возвра- щения в любое состояние образуют процесс восстановления тре- буемого типа. Поэтому наша теорема гарантирует существование предельных вероятностей в этом случае. Их явный вид можно легко найти из дифференциальных уравнений, в которых произ- водные заменены нулем. [См., например, 1; гл. XVII, (7.3). Мы вернемся к более систематическому изложению этого вопроса в гл. XIV, 9. Точно такие же рассуждения применимы к полу- марковским процессам, описанным в задаче 14 гл. XIV, 10.] ► § 9*). ТЕОРИЯ ВОССТАНОВЛЕНИЯ НА ВСЕЙ ПРЯМОЙ В этом параграфе теория восстановления будет распространена на распределения, не сосредоточенные на полупрямой. Чтобы избежать тривиальностей, мы предположим, что F{—оо, 0} > 0, F{0, оо} > 0 и что F—неарифметическое распределение. Случай •♦) Материал не исподьзуется в дальнейшем,
432 Гл. XL Теория восстановления арифметических распределений требует видоизменений, которые производятся очевидным образом по аналогии с § 1, Мы напомним (см. гл. VI, 10), что распределение F невозвратно тогда и только тогда, когда i/{/} = S {/} (9.1) ' n=0 принимает конечные значения для всех конечных интервалов. В противном случае U {/} = оо для каждого интервала и F называется возвратным. Для невозвратных распределений естест- венно возникает вопрос: переносятся ли на них теоремы восста- новления § 1? Эта задача интересовала многих математиков, и, пожалуй, не из-за ее важности, а в основном по причине связанных с ней неожиданных трудностей. Так, теорема восстановления пере- носилась шаг за шагом на различные специальные классы невоз- вратных распределений Блекуэллом, Чжуном, Чжуном и Полар- дом, Чжуном и Вольфовицем, Карлином и Смитом. Однако общая теорема была доказана только в 1961 г. Феллером и Ореем с ис- пользованием как вероятностных приемов, так и анализа Фурье. Приводимое ниже доказательство значительно проще и более элементарно. Заметим, что если F имеет конечное математическое ожидание, то применимо без изменений доказательство § 2. (О тео- рии восстановления на плоскости см. в задаче 20.) Для дальнейшего нам нужно вспомнить, что распределение с математическим ожиданием является невозвратным (тео- рема 4 из гл. VI. 10). Как обычно, обозначает интервал, полученный сдвигом I на t. Общая теорема восстановления, а) Если F имеет математическое ожидание р > 0, то для всякого конечного интервала I длины Я > 0 (9.2) Z->—оо. (9.3) б) Если F невозвратно и не имеет математического ожидания, то U {I +1} —> 0 при t —> ± оо для каждого конечного интервала I. В дальнейшем предполагается, что F невозвратно и что г— непрерывная функция, которая неотрицательна при — и обращается в нуль вне этого интервала. Прежде чем приступить к доказательству теоремы, напомним несколько фактов из гл. VI, 10. Свертка Z — U^z вполне определена равенством + 00 Z(x)= $ z(x-y)U{dy}, (9.4) — 00 'так как в действительности область интегрирования конечна, По
§ 9. Теория восстановления на всей прямой 433 теореме 2 гл. VI, 10, функция Z непрерывна, удовлетворяет уравнению восстановления Z = z + F*Z (9.5) и имеет максимум в точке g, где z(g)>0. Положим Un = FQ*-{-... Любое неотрицательное реше- ние Z уравнения (9.5) удовлетворяет неравенству Z^z = Uoj(Z и, следовательно, удовлетворяет (по индукции) Z Un г. Отсюда следует, что решение (9.4) минимально в том смысле, что для любого другого неотрицательного решения Z±. Поскольку Zj = Z + const есть снова решение, то lim inf Z (л;) = 0, х —>±оо. (9.6) Лемма 1. Для любой постоянной а Z(x-\-d)—Z(x)—>0, х—>±оо. (9.7) Доказательство совпадает с доказательством леммы 2 в § 2. Там мы использовали тот факт, что ограниченное равномерно непрерывное решение уравнения свертки (9-8) достигающее своего максимума при х = 0, равно постоянной. Это остается верным и для распределений, не сосредоточенных на 0, оо, а соответствующее доказательство в действительности проще, так как в этом случае множество 2, образованное точками роста F, F2*, является всюду плотным. ► Приведем ниже, хотя и не будем использовать, интересное следствие из леммы 1, Следствие1). Любое ограниченное непрерывное решение уравнения (9.8) равно постоянной. Доказательство. В случае когда само решение (9.8) g равномерно непре- рывно, то применимо без изменений доказательство леммы 1. Если же Сесть произвольное распределение вероятностей, то = снова есть решение уравнения (9.8). Можно выбрать такое распределение С, что gx имеет огра- ниченную производную и поэтому gx равномерно непрерывна. В частности, свертка g с произвольным нормальным распределением дает постоянную. Если теперь уменьшать дисперсию G до нуля, то мы видим, что функция g сама сводится к постоянной. Доказательство теоремы восстановления в случае, когда мате- матическое ожидание р, существует. При 0 < р < оо применимо доказательство из § 2 с одним тривиальным изменением. В ито- говом соотношении (2.13) мы использовали функцию г=1 — F, и для нее решение Z было тождественно равно 1. Вместо этой 1) Это утверждение верно для распределений на произвольных группах* см.; Choquet С.л Deny С. R., Acad. Sci, Paris, vol. 250 (1960), 799—801,
434 Гл. XI. Теория восстановления функции мы используем здесь z = F°*—F. (9.9) При ЭТОМ = —р<п+1)*, И1 поскольку |Л > О, ясно, что Z = F°*. Следует отметить, что это доказательство применимо и тогда, когда р. = + оо (в том очевидном смысле, что интеграл от xF {dx} расходится на ,0, оо, но сходится на —оо, 0). ► Если математическое ожидание не существует, то доказатель- ство теоремы требует более тонкого анализа. Следующая лемма показывает, что достаточно доказать основное утверждение для одного хвоста. Лемма 2. Предположим, что F не имеет математического ожидания и что U{I-t}-^Q, /->Ч-оо. (9.10) Тогда U{I + t}-+0, t-^ + oo. (9.11) Доказательство. Мы воспользуемся результатом примера 4, б), имеющего прямое отношение к вероятностям достижения состоя- ний в случайном блуждании, которое управляется распределе- нием F. ^Обозначим через H(t, £) вероятность того, что первое вхождение в t, оо имеет место в промежутке от t до / + £• Интер- вал I-\-t по отношению к /4-х занимает такое же положение, как интервал I—х по отношению к /. Поэтому 00 С/{/ + /} = $//(/, <®и{1-1}. (9.12) о Рассматривая первый шаг в случайном блуждании, получим 1-Я(0Л)>1-^а). (9.13) Мы уже знаем, что утверждение леммы справедливо, если у, < оо или р = —оо, т. е. если правая часть (9.13) интегрируема на О, оо. В ином случае Н имеет бесконечное математическое ожи- дание, и поэтому //(/, £)—>0 при /—>оо и любом £. Следова- тельно, при больших / только большие значения £ играют глав- ную роль и при этих значениях U {I—мало. Таким образом, соотношение (9.11) есть прямое следствие (9.10) и (9.12). ► Лемма 3. Предположим, что Z(x)^.m, и выберем р > О, такое, что р'=1 — рт>0. При заданном е > 0 существует такоеse, что при s > se или Z(s)<e, (9.14) или же Z (s 4- х) > pZ (s) Z (х) для всех х. (9.15)
§ 9. Теория восстановления на всей прямой 435 Доказательство. Исходя из равномерной непрерывности Z И из леммы 1, мы можем выбрать se таким, что Z(s-\-x)—Z(x)>—ер' при s>s& и | х | < h. (9.16) Положим Vs(x) = Z(s-{-x)—pZ(s)Z(x), vs (x) = 2(s + x)—pZ(s)z\x). (9.17) Функция удовлетворяет уравнению восстановления = u, -f- ^-F^VS, и из замечания, предваряющего лемму 1, следует, что если функция принимает отрицательные значения, то она Достигает минимума в точке где ц(£)<0 и, следовательно, Тогда ввиду (9.16) мы имеем при s > sE Ve © >—гр' 4- Z (s) [1 -pZ (&)] > p' [Z (s)-e], (9.18) Таким образом, или выполняется (9.14), или же Vs принимает неотрицательные значения, и в этом случае выполняется (9.15). Лемма 4. Пусть lim sup Z (х) = т], х—> ± оо. (9.19) Тогда limsup [Z(х) + Z (—х)] = 1Ъ х—>оо. (9.20) Доказательство. Выберем такое а, что Z (а) < 6 (это возможно вследствие (9.6)). По предыдущей лемме при достаточно боль- ших s или pZ(s)Z(a—s)<Z(a)<6, (9.21) или же Z(s)<e. Поскольку е произвольно, то неравенство (9.21) будет справедливо при всех достаточно больших s в любом слу- чае. Ввиду леммы 1 отсюда вытекает1), что Z(s)Z(—s) —0. (9.22) Таким образом, если х велико, то или Z(x) мало, или Z(—х) мало, а так как Z^O, то ясно, что (9.19) влечет (9.20). ► Доказательство теоремы. Допустим, что г) > 0, поскольку в противном случае нечего доказывать. Рассмотрим свертки функ- ций Z и 2 с равномерным распределением на 0, t, именно х х Ff(x) = | j* Z(y)dy, Мх) = Т J z(y)dy. (9.23) x-t x-t *--------- x) Легко видеть, что (9.22) эквивалентно соотношению U {/ + /} U {I — /} —> •—>0. Обозначим р {/} вероятность вхождения и интервал / при случайном блуждании {Sn}, которое управляется распределением F. Тогда (9.22) экви- валентно также соотношению р{/ + Ор{^— 0—>0. Если бы это не имело места, то вероятность попадания в окрестность нуля после захода в интервал Жне стремилась бы к нулю, и распределение F не было бы невозвратным»
4-36 Гл. ХГ. Теория восстановления Наша ближайшая цель—показать, что при t—>оо должно иметь место одно из соотношений t о Wt(t)=^Z(y)dy-^ или Ft(0) = | j Z(y)dy-^^. (9.24) О - t В силу (9.7) верхние границы для Z(x) и Wt(x) (с фиксиро- ванным t) одни и те же. Поэтому максимум Wt будет т]. С дру- гой стороны, Wt удовлетворяет уравнению восстановления (9.5) с г, замененным на wt. Как отмечалось раньше, отсюда вытекает, что максимум Wt достигается в точке, где wt положительно, т. е, между —h и t+h. Далее для ±-t t X t-x = Z{y)dy-^^ [Z(i/) + Z(-//)]dy. (9.25) t-x 0 Суммарная длина обоих интервалов интегрирования равна Из (9.20) поэтому следует, что при достаточно больших t Wt(x) < <Л(т) + 8, Таким образом, если Wt(x)^v[, то точка х должна быть близка к t и Wt(t) должно быть близко к т|. Если макси- мум Wt достигается в точке x^.t/2, то, как показывают анало- гичные рассуждения, х должно быть близко к нулю, a Wt (0)—к т]. Мы доказали, что при больших t или или IF ДО) должно быть близко к -ц. Но из (9.23) и (9.20) следует, что 1 limsup[IFt(Z)4-lFj(0)] = linisupZ~l $ [Z (у) + Z(—у)] dy^r^. о (9.26) В силу непрерывности обеих функций должно быть или W tt— и W\(0)—>0, или же Wt(f)—>0 и lFf(0)—>т]. По причине симметрии мы можем допустить, что Wt (/) —> г), т. е, t t/2 Wt(t) = t~i\z(y)dy = t-1 у [z (у/4-у\ у)] dy-+®. о о (9.27) Отсюда следует, что для произвольно больших t существуют такие значения х, что как Z(x), так и Z(t—х) должны быть близки к у). Из леммы 3 вытекает, что при больших t значения Z (0 > с > 0 и поэтому Z (— t) —> 0 вследствие соотношения (9.22). Таким образом, U {I—/}—>0 при t_ —>оо, что ввиду леммы 2 завершает доказательство. ►
§ 10. Задачи 437 § 10. ЗАДАЧИ (См. также задачи 12—20 в гл. VI# 13.) 1. Отбрасывая предположение F (0) = 0, мы заменим F распределением F#=pH0+qF-, где Но сосредоточено в нуле и p-\-q=\, Тогда U заменяется на U# = Ujq. Покажите, что с вероятностной точки зрения это очевидно. Проверьте утверждение, формально а) вычисляя свертки, б) из уравнения восстановления. 2. Пусть F—равномерное распределение на 0, 1. Покажите, что п 1/(0 /г=0 при п^/^и+1. Эта формула неоднократно переоткрывалась в теории оче- редей, но она мало что говорит о природе U. Асимптотическая формула (I) — 2t—> 2/3 гораздо более интересна. Она является прямым следст- вием (3.1). ____ 3. Предположим, что 2^0 и что | zf | интегрируема па 0, оо. Покажите, что г непосредственно интегрируема. Замечание. В следующих ниже трех задачах подразумевается, что Z и Z* суть решения стандартного уравнения восстановления (1.3), соответствующие г иг'. . 4. Пусть 2—>00 И21^2 при х—>оо. Покажите, что Z± ~ Z< 5. Если 2i есть интеграл от 2 и Z!(0) = 0, то Z± есть интеграл от Z. Докажите, что если 2 = xw'“1, то Z ~ хп/(яр,) ПРИ Р- < °0- 6. Обобщение. Если Zx = G^2 (где мера G конечна на конечных интерва- лах), то Zi = G^Z. Полагая G(x) — xa при выведите: если г (х) ~ х"“х, то Z (х) ~ ха/(ар). 7. К теореме 2 из § 3. Обозначим fr плотность распределения Fr* и п0, дожим v — u—f—...—fr. Покажите, что если fr ограничена, то v (х)—> 1/|л, В частности, если f—>0, то и—> 1/р,. 8. Если F2* имеет непосредственно интегрируемую плотность, то распре- деление V— U— 1—F имеет плотность и, которая стремится к 1/р,. 9. Выведите из (4.4), что Z(t) = V(t) — V (t—h) удовлетворяет стандарт- ному уравнению восстановления с z(f)=F0(f)—F0(t—h). Выведите непо- средственно из теоремы восстановления, что V (/) — V (t—h)—>/i/p,. 10. Совместное распределение для прошедшего и остающегося времени ожи^ дания. В обозначениях (4.7) докажите, что при t—> оо 00 Р j/ —> х, SN^+1— t > у} >— J [I—/7 (s)] ds> x+y Указание. Получите уравнение восстановления для левой части. 11. Стационарные свойства. Рассмотрим процесс восстановления с задерж- кой, с начальным распределением Fo, задаваемым (4ft6). Вероятность Н (t, g) того, что п-й момент восстановления Sn лежит между t и /+g, удовлетво- ряет уравнению восстановления Н (/, g) = F0(/+^)—Ео (/) + Е0 ★ Н (^ g), Докажите без вычислений,’ что Н (t, g)=F0(£) тождественно. 12. Максимальное наблюденное время жизни. Пусть V (t, g)—вероятность того, что максимальный промежуток между восстановлениями, наблюденный до момента t в стандартном возвратном процессе восстановления, имеет дли-
438 Гл. XL Теория восстановления тельность > g. Покажите, что & V(t, ё) = 1 —F (g)+J V(t-yi l)F{dy}. о Изучите характер решения, 13. Пусть N/—число моментов восстановления, определенное в §5, Пока- жите, что Е W) = S (2*+1) F** (t) = 2U * и (t) — U (0. k = Q Используя интегрирование по частям, выведите из этого равенства и теоремы восстановления, что t 9 Р л 2 Е (N?) = I U (х) dx +-25- t+o (0 И J Н и далее Var (Nj) ~ (о2/р,3) /, что соответствует оценке в центральной предель- ной теореме. (Замечание: этот метод применим также к арифметическим рас- пределениям, и он предпочтительнее для вывода того же самого результата# который описан в задаче 23 в 1; XIII, 12.) 14. Если F—собственное распределение и а—постоянная, то интегро-диф- ференциальное уравнение Z' = aZ—aZ * F сводится к t г (/) =z (0) 4- а Z (t—x) [1—F(x)] dx, о 15. Обобщенные счетчики второго типа. Поступающие частицы образуют пуассоновский поток. Очередная /-я частица «закрывает» счетчик на время Ту и аннулирует последействие (если оно было) предыдущих частиц. Предпола- гается, что случайные величины Ту независимы между собой, не зависят от поступающего потока и имеют одно и то же распределение G. Пусть Y —длина промежутка времени, в течение которого счетчик закрыт, и Z(/) = P{Y > /}, Покажите, что Y—собственная случайная величина и t Z (/) = [1 — G (/)] e<*-t + J Z (t—x) [1 — G (х)] ae-ах dxt о Покажите, что этот процесс восстановления будет обрывающимся в том и только том случае, когда G имеет математическое ожидание р < а~хв Обсу- дите применимость асимптотических оценок § 6. 16. Эффект «островков безопасности», [Пример 7, б).] Два независимых пуассоновских потока автомашин с одинаковыми плотностями движутся по двум сторонам магистрали. Время, необходимое для пересечения магистрали, равно 2g. Формулы (7.10) применимы и в этом случае. Наличие «островка безопасности» приводит к тому, что время, необходимое для пересечения магист- рали, становится суммой двух независимых случайных величин с математи- ческими ожиданиями и дисперсиями, определяемыми (7.10). Обсудите практи- ческие следствия этого факта. 17. Частицы, попадающие на счетчик, образуют возвратный процесс вос- становления с распределением F. После каждой регистрации счетчик закры- вается на фиксированное время g, в течение которого поступающие частицы не оказывают никакого воздействия на счетчик. Покажите, что распределе- ние для промежутка времени между концом «периода ^нечувствительности»
§ 10. Задачи 439 и моментом появления очередной частицы задается формулой £ ^[F(l + t-y)-F^y)]U{dy}. о Если F—показательное распределение, то и это распределение будет пока- зательным. 18. Нелинейное восстановление. Частица имеет показательное время жизни, в конце которого она с вероятностью рк производит k точно таких же частиц, существующих независимо друг от друга (& = 0, 1# •••)• Вероятность F (/) того,' что весь процесс оборвется до момента /, удовлетворяет уравнению 00 о F (t) = р0 (1 — е-^) + 2 рк J ae-wt-n f& (x) dx. п=1 о (Неизвестно никакого общего метода обращения с такими уравнениями.) 19. Пусть F— произвольное распределение в с математическим ожи- данием р, > 0 и конечным вторым моментом т2» Покажите, что где, как обычно# х+ обозначает положительную часть х. Указание. Обозна- чим Z (/) левую часть. Тогда Z удовлетворяет уравнению восстановления г (х) = t i f FMdx’ r. J — 00 /<0, />0, 00 r t 20. Теорема восстановления в 91*. Пусть распределение пары(Х, Y сосре- доточено в первом квадранте. Пусть I—интервал 0«Сх, р<:1. Обозначим / + а (где а—произвольный вектор) интервал, получаемый сдвигом / на а» Тогда лемма 1 из § 9 может быть обобщена следующим образом» Для любых фиксированных векторов а и b Z7 {/H-a4-/b} —17 {/ + Zb} —О при t —> 00. а) Считая это соотношение выполненным# покажите, что из теоремы вос- становления для маргинальных распределений вытекает U {/ + /Ь|—>0. б) Покажите, что доказательство леммы тривиальным образом применимо х)э х) Более подходящая формулировка задач теории восстановления для плоскости была недавно предложена в работе: Bickel Р. J., Yahav J. At Reneval theory in the plane, Ann. Math. Statist., 36 (1965), 946—955. Эти авторы рас- сматривали математическое ожидание числа попаданий в область, заключен- ную между окружностями радиусов г и г+а при г—со,
ГЛАВА XII СЛУЧАЙНЫЕ БЛУЖДАНИЯ В 9$ В этой главе рассматриваются задачи теории случайных блуж- даний с упором на комбинаторные методы и систематическое использование «лестничных величин». Некоторые из результатов будут выведены заново и дополнены в гл. XVIII методами ана- лиза Фурье. (В другом аспекте случайные блуждания изучались в гл. VI, 10.) Мы ограничимся в основном двумя центральными вопросами. Во-первых, будет показано, что полученные в 1; гл. III, любопытные результаты, относящиеся к бросанию монеты, переносятся на очень общий случай и что, по существу, при этом применимы те же самые методы. Второй вопрос связан с време- нем первого прохождения и задачами о разорении. Стало модным связывать подобные темы с известной теорией Винера—Хопфа. " Однако эти связи не так тесны, как их обычно изображают. Они будут обсуждены в § За и гл. XVIII, 4. Открытие Спарре-Андерсеном в 1949 г. мощных комбинатор- ных методов в теории флуктуаций представило всю теорию слу- чайных блужданий в новом свете. С тех пор отмечается очень быстрый прогресс, одним из стимулов которого является неожи- данное открытие тесной связи между случайными блужданиями и теорией очередей1). Литература по этой теме обширна и порой способна запутать читателя. Теория, излагаемая на следующих страницах, так эле- ментарна и проста, что непосвященный читатель никогда не за- подозрил бы, какими трудными были эти задачи до того, как была понята их истинная природа. Например, элементарные асимптотические оценки § 5 охватывают множество практически интересных результатов, которые ранее были получены глубокими методами и подчас с большой изобретательностью. Параграфы 6—8 почти не зависят от первой части главы. Вряд ли нужно подчеркивать, что наше изложение является а) Впервые такая связь была отмечена-, по-видимому ? Линдли (D. V. Lindley) в 1952 г. Он вывел интегральное уравнение, которое теперь отнесли бы к урав- нениям типа ВинераХопфа,
$ 1. Основные понятия и обозначения 441 односторонним и оставляет в стороне ряд интересных аспектов теории случайных блужданий (таких, как связи с теорией потен- циала или теорией групп1). § 1. ОСНОВНЫЕ ПОНЯТИЯ и ОБОЗНАЧЕНИЯ Всюду в этой главе Хь Х2, ... суть независимые случайные величины с одним и тем же распределением F, которое не сосре- доточено ни на одной из полуосей (случай, когда F(0) = 0 или 77(0)=1, охватывается теорией восстановления). Случайное блуж- дание, порождаемое распределением F,— это последовательность случайных величин so=o, s„=x1 +... +Х„. (1.1) Иногда мы будем рассматривать отрезок (X/+J, ..., Xk) данной последовательности {ХД. Ее частные суммы 0, S/+i—Sy-, ..., —Sy будут называться отрезками случайного блуждания. Ин- дексы будут обычно интерпретироваться как значения временного параметра. Таким образом, момент п делит все случайное блуж- дание на прошедший отрезок и остающийся отрезок. Поскольку So = O, говорят, что случайное блуждание начинается в нуле. Добав- ляя постоянную а ко всем членам последовательности Sn, мы получим случайное блуждание, начинающееся в точке а. Таким образом, S„, S„+i, ...—случайное блуждание, порождаемое рас- пределением F и начинающееся в Sn. Предварительная информация. Если посмотреть на график слу- чайного блуждания, можно заметить его выразительную особен- ность—точки, где S„ достигает рекордного значения, т. е. где S^ превосходит все ранее достигнутые значения So, ..., S^-p Эти точки называются лестничными точками, согласно терминологии,, введенной в VI,8 (см. рис. 1 в том. параграфе). Теоретическая важность лестничных точек объясняется тем, что отрезки между ними являются точными вероятностными копиями друг друга, и, следовательно, важные выводы относительно всего случайного блуждания можно получить при изучении первой лестничной точки. В первом томе мы неоднократно рассматривали случайные блуждания, в которых Xk принимают значения +1 и —1с веро- ятностями р и q соответственно. В таких блужданиях каждое по- следующее рекордное значение превосходит предыдущее на 4-1 и последовательные лестничные точки представляют собой просто первые прохождения через 1, 2, ... . В принятой нами термино- х) Другие аспекты представлены в книге Спицера (1964), хотя там рас- сматриваются только арифметические распределения. О комбинаторных мето-; дах, пригодных в многомерном случае, см.: Hobby С., Pyke R., Combinatorial results in multidimensional fluctuation theory. Ann. Math. Statist., 34 (1963), 402—404»
442 Гл* XII, Случайные блуждания в gp логии мы бы сказали, что лестничные высоты известны заранее и только времена ожидания между последовательными лестнич- ными точками требуют изучения. Они являются независимыми случайными, величинамй с тем же распределением, что и у вре- мени первого прохождения через +1. Производящая функция этого распределения была найдена в 1, XI, (3.6), и имеет вид [1-^1_4W^]/(2<7S), (1.2) где у~ обозначает положительный корень (см. также 1; XIV,4; явная формула содержится в 1; XI,3, г), и 1; XIV,5). При р < q времена первого прохождения являются несобственными случай- ными величинами, так как вероятность того, что когда-нибудь будет достигнуто положительное значение, равна p/q. Одно и то же рекордное значение может быть повторено не- сколько раз, прежде чем будет достигнуто новое рекордное зна- чение. Точки такого относительного максимума называются ела- быми лестничными точками. [В простом случайном блуждании Бернулли первая слабая лестничная точка либо есть (1.1), либо имеет вид (2г, 0).] После этих предварительных замечаний введем формально лестничные величины, частично повторяя уже сказанное в гл. VI,8. Определение основано на неравенствах, и потому существуют четыре типа лестничных величин, соответствующих четырем воз- можностям, именно <, >, Это приводит к двойной клас- сификации, описываемой понятными терминами: возрастающие и убывающие1), строгие и слабые. Возрастающие и убывающие ве- личины связаны столь же симметрично, как плюс и минус, мак- симум и минимум. Однако различие между строгими и слабыми величинами создает трудности в определениях и обозначениях. Простейший выход состоит в том, чтобы рассматривать только непрерывные распределения Г, так как в этом случае строгие и слабые величины равны друг другу с вероятностью единица. На- чинающим можно рекомендовать именно этот путь и не делать различия между строгими и слабыми лестничными величинами, хотя такое различие неизбежно в общей теории, с одной стороны, и в таких примерах, как игра с бросанием монеты,— с другой. Чтобы ввести необходимые понятия и соглашения, рассмотрим возрастающие строгие лестничные величины. Затем мы покажем, что теория слабых лестничных величин является простым след- ствием теории строгих лестничных величин. Убывающие лестнич- ные величины не нуждаются в отдельной теории. Таким образом, мы будем, как правило, рассматривать возрастающие строгие лест- ничные величины, и в случаях, когда не будет опасности пута- ницы, мы будем опускать названия «возрастающие» и «строгие». х) «Ascending» и «descending». В том случае, когда речь будет идти о точ* кахЛ мы будем применять термины «верхние» и «нижние».— Прим, перев.
§ 1. Основные понятия и обозначения 44$ Возрастающие строгие лестничные величины. Рассмотрим по- следовательность точек (n, S„) для п=1, 2, ... (нуль исключается). Первая строгая верхняя1) лестничная точка (<Fj, ^j)—это пер- вый член указанной последовательности, для которого Sn > 0. Иными словами, <зГt—это момент первого попадания на положи- тельную (открытую) полуось, определяемый соотношениями {<TI = n} = {S1<0, .... S„_I^0, SB>0), (1.3) a = S. Величина &£ называется первым лестничным мо- ментом, a —первой лестничной высотой. Эти случайные ве- личины остаются неопределенными, если ни одно из событий (1.3) не наступает. Поэтому обе они могут быть несобственными2). Для совместного распределения (<Fit мы примем обозна- чение Р{^\ = п, ^<х} = Я„(х). (1.4) Тогда маргинальные распределения задаются равенствами р^=п} = Я„(оо), /1 = 1, 2, ..., (1.5) Р{^1<х}=2Я„(х) = Я(х). (1.6) п= 1 Обе случайные величины имеют один и тот же дефект, а именно 1—Я(оо)>0. Отрезок случайного блуждания, следующий за первым лест- ничным моментом, является точной вероятностной копией всего случайного блуждания. Его первая лестничная точка является второй лестничной точкой всего случайного блуждания и обла- дает тем свойством, что Sn>S0, S„>S„_J. (1.7) Так мы ее и назовем—второй лестничной точкой случайного блуж- дания. Опа имеет вид (JrI-}-cF'2, ^Ч-<^2)» где пары (^~it и (<эГ2, ^2) независимы и одинаково распределены (см. также гл. VI,8). Поступая аналогично, мы можем определить [третью, четвертую и т. д. лестничные точки нашего случайного блужда- ния. Таким образом, точка (п, S„) является верхней лестничной точкой, если она удовлетворяет соотношению (1.7). Лестничная точка с номером г (если она существует) имеет вид (Jrj + • • • Ч-^г. Ч* • • • Ч- ^г), где пары (S~k, 3%к) взаимно независимы и имеют одно и то же распределение (1.4) [см. рис. 1 в гл. VI,8]. Для экономии обозначений мы не будем вводить никаких но- вых букв для сумм Ч-... Ч* STr и Ч- • • Ч- Они обра- зуют два (возможно, обрывающихся) процесса восстановления с «.промежутками между восстановлениями» <эГА и $%k. В случай- J) См. предыдущую сноску. 2) Задачи 3—6 могут служить иллюстрацией, понятной без общей теории}
444 Гл. XII. Случайные блуждания в ном блуждании, конечно, только играет роль времени. Отме- тим, что сами лестничные точки образуют двумерный процесс восстановления. Обозначим через S Нп* (1.8) /2 = 0 меру, определяющую среднее число лестничных высот (здесь 7У°*=ф0). Соответствующая несобственная функция распределения, задавае- -------------------------------1 мая равенством ф(х) = ф {—оо, х\, равна нулю при х < 0, а для положительных х функция ф (х) равна единице плюс среднее число ---1 лестничных точек в полосе 0, х (время не ограничивается). Мы знаем из гл. VI,6, и гл. XI,1, что ф(х)<оо при всех х и что в случае несобственных лестничных величин 00 ^(00) = ^ //«(оо) = т—Т—. (1.9) /2=0 ' 7 Наконец, введем обозначение ф0 для атомического распреде- ления с единичной массой в нуле; таким образом, для любого интервала I ф0{/} = 1, если х£1, ф0{/} = 0 в противном случае. (1.10) Возрастающие слабые лестничные величины. Точка (и, Stt) есть слабая (верхняя) лестничная точка в том и только том слу- чае, если Sn Sfc при k — 0, 1, ..., п. Изучение строгих и слабых лестничных величин будет проходить параллельно, и мы будем систематически использовать те же самые буквы, помечая слабые величины чертой сверху. Так, —это наименьший индекс п, такой, что Sf < 0, ..., < 0, но Sn 0. Как отмечалось раньше, утомительная необходимость различать строгие и слабые величины отпадает, если распределение F непрерывно. В общем случае легко выразить распределение Н слабых лестничных высот в терминах распределения Н. Это дает нам возможность ограничиться един- ственным распределением, определенным в (1.6). Первая слабая лестничная точка идентична первой строгой лестничной точке, за исключением того случая, когда случайное блуждание возвращается в нуль, пройдя только через отрицатель- ные значения; в этом случае и мы положим £=Р {^=0}. Таким образом С=£Р{8х<0, ..., S„_, <0, S„ = 0}. (1.11) /2=1 (Это событие не может произойти, если Xf > 0 и, следовательно, 1.) С вероятностью 1—£ первая строгая лестничная точка
§ 2, Двойственность. t Типы случайных блужданий 445 совпадает с первой слабой лестничной точкой. Следовательно, Н = ^0 + (1-$Н. (1.12) Иначе говоря, распределение первой слабой лестничной высоты является смесью распределения Н и атомического распределения, сосредоточенного в нуле. Пример. В простом случайном блуждании Бернулли первая слабая лестничная высота равна 1 тогда и только тогда, когда первый шаг приводит в точку +1. Если первый шаг приводит в точку —1, то (условная) вероятность возвращения в 0 равна 1, есди и равна p]q в противном случае. В первом случае Z = во втором = Возможные лестничные высоты равны 1 и 0, и они имеют вероятности р и q при p^q, тогда как при р <q обе вероятности равны р. В последнем случае лестничная высота является несобственной случайной величиной. ► Вероятность того, что случайное блуждание вернется в нуль k раз до первого попадания в 0, оо, равна £*(1—£). Математи- ческое ожидание числа таких возвращений равно 1/(1—£). Эта величина дает нам ожидаемую кратность каждой лестничной вы- соты (т. е. число ее появлений до следующей лестничной высоты). Следовательно, <1ДЗ) (см. задачу 7). Простота этих соотношений позволяет нам избе- жать явного использования распределения Н. Убывающие лестничные величины. Строгие и слабые убываю- щие лестничные величины определяются по симметрии, т. е. путем замены знака > на <. В тех редких случаях, когда потребуется специальное обозначение, мы будем помечать убывающие вели- чины верхним индексом «минус». Так, первая строгая нижняя лестничная точка будет (<Ffи т. д. - Вскоре мы увидим, что вероятности Р = 0} и Р {^7 = 0} равны между собой, так как P{Sx>0, >0, S„ = 0} = = P{SX < 0, ..., S„_j < 0, S„ = 0}. (1.14) Отсюда следует, что аналоги (1.12) и (1.13) для убывающих лест- ничных величин зависят от той же величины § 2. ДВОЙСТВЕННОСТЬ. ТИПЫ СЛУЧАЙНЫХ БЛУЖДАНИЙ В 1, гл. III, мы установили любопытные свойства флуктуа- ций, возникающих при бросании монеты. При этом были исполь- зованы простые комбинаторные рассуждения, основанные на рас- смотрении величин (Хх, ..., Хл), взятых в обратном порядке. Эти
446 Гл. ХП. Случайные блуждания в др же приемы приведут нас теперь к важным и очень общим ре- зультатам. При фиксированном п мы вводим п новых случайных величин равенствами Х{ = ХИ, ..., X,*=Xi. Соответствующие частные суммы равны Sfe = S„—Sn_fe, где k = 0, п. Совместные распределения величин (So, ..., S„) и (S,, ..., S*) совпадают. Поэтому отобра- жение Xft —> Xfe отображает любое событие Л, связанное с (So, ... ..., S„), в событие Л* равной вероятности. Это отображение легко представить себе наглядно, поскольку графики последователь- ностей (0, Sf, ..., S„) и (0, Sf, ..., S*) получаются один из дру- гого поворотом на 180°. Пример, а) Если S£ < 0, ..., S„_j < 0, но Sn = 0, то Sf > 0, ..., S*_! >0 и S* = 0. Это доказывает справедливость соотноше- ния (1.14), которое используется в § 1. ь. Теперь мы применим указанную выше процедуру «обращения» к событию {S„ > So, ..., Srt > Sn_j}, определяющему верхнюю строгую лестничную точку. Двойственные события определяются неравенствами S* > S„_fe, k=l, ..., п. Но событие S„>S‘_fe сов- падает с событием SA > 0. Таким образом, для всякого конечного интервала /с0, оо Р {S„ > Sy при j = 0, ..., п— 1 и S„ € 1} = = Р {Sy > 0 при / = 1, п и SnCZ}. (2.1) Левая часть равна вероятности того, что найдется лестничная точка с абсциссой п и ординатой, принадлежащей Z. Правая часть равна вероятности того, что в момент п произойдет попадание в / и при этом до момента п не будет заходов на замкнутую полупрямую —оо, 0. Проведем суммирование по п в (2.1) и рас- смотрим результат. Слева мы получим ф {/} в согласии с опре- делением (1.8) меры ф. Справа получим математическое ожида- ние числа попаданий в Z до первогр попадания в —оо, 0. Эта величина конечна, так как ф {/} < оо. Нами установлена тем самым основная Лемма о двойственности. Мера ф допускает две интерпрета- ции. Для каждого конечного интервала ZcO, оо а) ф{/} есть математическое ожидание числа лестничных точек в I. б) ф {/} есть математическое ожидание числа попаданий Sn£l, таких, что Sfe > 0, k = 1, 2, ..., п. Эта простая лемма предоставляет нам возможность доказать элементарным способом теоремы, которые в ином случае потре- бовали бы глубоких аналитических методов. Из-за своей аналити- ческой формулировки лемма не выглядит привлекательной, однако
§ 2. Двойственность. Типы случайных блужданий 447 ее непосредственные следствия оказываются удивительными и противоречащими наивной интуиции. Пример, б) Простое случайное блуждание. В случайном блуж- дании, описанном в примере из § 1, лестничная точка с ординал той k существует тогда и только тогда, когда при некотором п наступает событие {Sw = £}, вероятность которого равна 1 при р>?и (p/q)k при p^q. По лемме о двойственности это озна- чает, что в симметричном случайном блуждании математическое ожидание числа попаданий в состояния k^l до первого возвра- щения в нуль равно единице при всех k. Фантастичность этого ре- зультата можно лучше уяснить в терминологии игры с бросанием монеты. Наше утверждение состоит в том, что до первого возвра- щения на нулевой уровень средний накопленный выигрыш Петра принимает когда-либо любое значение k. Это утверждение обычно порождает недоверие, однако его можно проверить непосредст- венным вычислением (см. задачу 2). (Наш прежний вывод о бес- конечности математического ожидания времени до первого воз- вращения в 0 получается теперь суммированием по k.) ► В симметричном случайном блуждании Бернулли (бросание монеты) каждое из значений ±1 достигается с вероятностью еди- ница, однако математическое ожидание времени ожидания для каждого из этих событий бесконечно. В следующей теореме пока- зано, что это свойство не является особенностью игры в монету, поскольку аналогичное утверждение справедливо для всех слу- чайных блужданий, в которых и положительные, и отрицатель- ные значения допускаются с вероятностью единица. Теорема 1. Существуют только два типа случайных блужданий. (i) Осциллирующий тип: возрастающий и убывающий процессы восстановления возвратны*, Sn колеблется с вероятностью 1 между —оо и оо и £(оГ1) = оо, — (2.2) (ii) Уходящий тип (скажем, в —оо). Возрастающий процесс восстановления обрывается*, убывающий процесс является собст- венным*, с вероятностью единица Sn уходит в —оо и достигает конечного максимума М 0; выполняются соотношения (2.5) 4/ (2.7). [Блуждания типа (ii) очевидным образом невозвратны, но среди блужданий типа (i) имеются как возвратные, так и невозвратные; см. конец гл. VI,10.] Доказательство. Тождество (2.1) выполняется и при замене строгих неравенств слабыми. Для 7 = 0, оо получаем P{SW>S* при 0 Сk п} = Р 0 при 0^k^n}=^ = 1—Р{^Г<4- (2-3) Левая часть есть просто вероятность того, что (и, S^) будет сла^
448 Гл. XII. Случайные блуждания в S№ бой верхней лестничной точкой. Эти вероятности дают в сумме ф(оо)^оо, и в силу равенства (1.13) мы имеем, таким образом, 00 Г=в’1’(00) = Е[1-Р{^Г<«}]- (2.4) 6 п=0 Когда убывающий лестничный процесс—несобственный, то члены ряда не стремятся к нулю и ряд расходится. В этом случае ф(оо) = оо; это означает, что возрастающий лестничный процесс возвратен. Таким образом, мы получили аналитическое доказа- тельство интуитивно очевидного факта: невозможно, чтобы оба лестничных процесса, и возрастающий, и убывающий, были обры- вающимися. Если STj—собственная величина, то (2.4) сводится к E(<F1)= !_^(оо)= , (2.5) с очевидной интерпретацией в случае Н(оо) = 1. Мы видим, что E(Jrj')<oo в том и только том случае, когда //(оо)<1, т. е. когда возрастающая лестничная величина <^г1 является несобственной. Таким образом, или одна из этих вели- чин будет несобственной, или выполняется (2.2).' Если E(<F'r)<oo, то возрастающий процесс восстановления будет обрывающимся. С вероятностью единица существует послед- няя лестничная точка, и максимум М = max {So, Sf, ...} (2.6) конечен. При условии, что n-я лестничная точка существует, вероятность ей быть последней равна 1—Н(оо). Поэтому [см. гл. XI, (6.3)] Р{М<х} = [1 — Я(оо)] S Я«*(х) = [1— Я(оо)]ф(х). (2.7) ► п=0 Условимся' в следующей теореме писать Е(Х) = Ч~оо, если соответствующий интеграл расходится только в +оо, или, что то же самое, если Р {X < t\ интегрируемо на —оо, 0. Теорема 2. (i) Если Е(Х1) = 0, то и Sх—собственные вели- чины1) и E(<F"i) — оо. (ii) Если Е (Хх) конечно и положительно, то и S'i суть собственные величины с конечными математическими ожиданиями и Е(^1) = Е(^)Е(Х1). (2.8) Случайное блуждание уходит в Н-оо. х) Теорема 4 из гл. VI,10, содержит более сильный результат; при £(Xj) = O случайное блуждание возвратно,
§ 2. Двойственность. Типы случайных блужданий 449 (iii) Если Е(Х1) = 4-оо, то E($?i^oo и случайное блуждание уходит в +<5о. (iv) В других случаях либо случайное блуждание уходит в —оо (в этом случае S\u —несобственные величины), либо Е (^!’х)=оо. Тождество (2.8) было впервые открыто А. Вальдом в значи- тельно более общей обстановке,о чем будет идти речьвгл. XVIII,2. Следующее ниже доказательство основано на усиленном законе больших чисел из гл. VII,8. Чисто аналитические доказательства будут даны в свое время (см. теорему 3 из § 7 и задачи 9—11, а также гл. XVIII,4). Доказательство. Если п совпадает с А-м лестничным момен- том, то имеем тождество _ (SK]+•*•+ SKfe)/^ /п Q\ П (<^1+...+^)/fe‘ 1 ' Теперь заметим, что усиленный закон больших чисел применим и в том случае, когда Е(Хх) = +оо, что можно показать с помощью очевидного урезания. (i) Пусть Е(Хх) = О. При k—юо левая часть в (2.9) стремится к 0. Отсюда следует, что знаменатель стремится к бесконечности. Поэтому Si—собственная величина и Е(<^г1) = оо. (ii) Если 0<E(Xi)<oo, то по усиленному закону больших чисел случайное блуждание уходит в оо. В силу (2.5) это озна- чает, что S\—собственная величина и Е(^)<оо. Поэтому чи- слитель и знаменатель в (2.9) стремятся к конечным пределам и (2.8) теперь следует из теоремы, обратной закону больших чисел (теорема 4 в гл. VII,8). (iii) Если E(Xi) = +°°. то с помощью аналогичных доводов можно показать, что Е(.%’1) = оо. (iv) В остальных случаях мы покажем, что если —собст- венная величина и Е^Х», случайное блуждание уходит в —оо. Рассматривая первый шаг случайного блуждания, видим, что при х> О P{Wi>x}^P{Xi>x}. (2.10) Если —несобственная величина, случайное блуждание уходит в — оо. Если она собственная, то интеграл от левой части в (2.10) по области 0, оо равен Е (^х). Если Е (^) < оо, то Е (Хх) либо конечно, либо равно —оо. Случай Е(Хх)^О уже был разобран, а если Е(Хх)<0 (или равно —оо), то случайное блуждание уходит в —оо. Из (2.10) и аналогичного неравенства для х < 0 следует, что если и и —собственные величины и имеют конечные математические ожидания, то Р {| Xj | > х) интегрируемо и, сле- довательно, Е (Хх) существует (лемма 2 из гл. V, 6). При Е (Хх) =+ О одна из лестничных величин должна быть несобственной и, таким образом, мы имеем . . is ? 49
450 Гл. XII. Случайные блуждания в $$ Следствие. Если и 3%^ и являются собственными величи- нами и имеют конечные математические ожидания, то Е(Хх)=0. Обратное неверно. Однако если Е(Х1) = 0 и E(Xf)<oo, то и имеют конечные математические ожидания. (См. задачу 10. Более точный результат содержится в теореме 1 из гл. XVIII, 5, где точки первого попадания Sn и S^ суть слу- чайные величины с распределениями и <Я?Г.) § 3. РАСПРЕДЕЛЕНИЕ ЛЕСТНИЧНЫХ ВЫСОТ. ФАКТОРИЗАЦИЯ ВИНЕРА —ХОПФА Вычисление распределений лестничных высот, т. е. Н и Н, на первый взгляд кажется устрашающей проблемой, и именно так ее первоначально воспринимали. Однако лемма о двойственности приводит к простому решению. Идея состоит в том, что первое вхождение, скажем, в —оо, 0 следует рассматривать вместе с предшествующим ему отрезком случайного блуждания. Мы при- ходим к изучению видоизмененного случайного блуждания {Srt}, обрывающегося в момент первого вхождения в —оо, 0. Обозна- чим через несобственное распределение вероятностей для положения в момент п в этом ограниченном случайном блужда- нии. Иными словами, для любого интервала I и п=1, 2, . . положим Фп{/} = Р^>0, ...» S„>0, (3.1) (заметим, что отсюда следует равенство ф„{—оо, б} = 0). Как и прежде, ф0 обозначает распределение вероятностей, сосредото- ченное в нуле. Формула (2.1) показывает, что tyn{7} равна веро- ятности того, что (п, S„) есть лестничная точка с S„gJ. Сум- мируя по всем п, получаем W=M. (3-2) /2=0 где ф—«функция восстановления», введенная в (1.8). Другими словами, для любого интервала I, расположенного на открытой положительной полуоси, ф{7} равно математическому ожиданию числа (строгих верхних) лестничных точек, ординаты которых принадлежат I. Для интервалов I отрицательной полуоси поло- жим ф{7} = 0. Заметим, что ряд (3.2) сходится для любого огра- ниченного интервала 1 (но может расходиться для 7 = 0, оо). Этот неожиданный результат делает всю последующую теорию неверо- ятно простой. Изучение первого вхождения в —оо, 0—это изучение слабого убывающего лестничного процесса и (в обозначениях § 1) точки
§ 3> Распределение лестничных высот 451 первого входа и ее распределения типографского набора заменим на р. вероятность того, что первое вхождение в момент п и внутри интервала I, т. е. р„ {/} = Р {Sf > О, .... Sn_t>Q, Н~. Для облегчения Обозначим через p„{Z) в —оо, 0 происходит при п= 1, 2, ... S„<0, S„6Z} (3.3) (отсюда вытекает, что р„ {0, оо} = 0; р0 не определено). На этот раз очевидно, что ряд p{z}=Sp„{Z} (3.4) П=1 сходится и определяет (возможно, несобственное) распределение точки первого вхождения (т. е. р {Z} =<%’г {Z}). Легко вывести рекуррентные соотношения для г|)„ и р„. В самом деле, условная вероятность события S„+I СZ при условии, что S;I = у, равна F {I—у}, где Z—у—интервал, получаемый сдви- гом I на —у. Таким образом, 00 Pn+i {Z}= $ % {dy} F {I—у}, fl- если IС—оо, О (3.5а) 00 %+i{Z} = $ ^n{dy}F{I—y}, если ZcO, оо (3.56) о— (нуль дает вклад в интеграл только при п = 0). Для ограни- ченных интервалов Z сходимость S {/} обеспечивается леммой о двойственности, а 2р„ {Z} всегда сходится к числу ^1. Суммы этих рядов равны ip и р, и для них мы получаем р{/}= ty{dy}F{I—у}, если Zc—оо, 0, (3.6а) о- 00 ф{/} = J ty{dy}F{I—у}, если ZcO, оо (3.66) о- с тем соглашением, что в (3.66) рассматриваются только ограни- ченные интервалы Z. Мы увидим, что соотношения (3.6) практи- чески более полезны, чем представления риф рядами. Иногда удобно заменить функции интервала риф соответствующими функциями точки р(х) = р{— ОО, х} и -ф (л:) =тр{—оо, х}. 35®
452 Гл. XII. Случайные блуждания в 5J1 Очевидно, что (3.6а) равносильно соотношению Р W = $ Ф {dy} F (х—у), х<0. (3.7а) о- Из (3.66) при х > 0 получаем ф(х) == 1+Ф{0, х} = 1-Ь $ ф {dy}[F(x—у)—F (— у)], о- Принимая во внимание (3.7а), мы видим, что (3.66) эквивалентно ф(х) = 1 — р(0)4- J -ф{dy}F(x—у), х>0. (3.76) о- Для упрощения обозначений введем свертку Ф*/7=2Ф„*^ (3.8) «=0 I---- Так как гр сосредоточено на 0, оо, то значение гр^Г{/} равно сумме двух интегралов (3.6) и потому конечно. Вспоминая, что гр имеет единичный атом в нуле, соединим два соотношения (3.6) в одно уравнение свертки р + Ф = Фо + Ф^^« (3.9) Ввиду того что р и гр—гр0 сосредоточены на —оо, 0* и 0, оо соответственно, соотношение (3.9) эквивалентно паре соотноше- ний (3.6). Мы будем рассматривать (3.9) как интегральное уравнение, определяющее неизвестные меры р и гр. Большое число важных теоретических выводов можно получить непосредственно из (3.9). Мы отметим самую замечательную из подобных теорем в форме примера, для того чтобы подчеркнуть, что она не используется в дальнейшем и представляет собой отклонение от основного изложения. Примеры, а) Факторизация типа Винера—Хопфа. Из опре- деления (1.7) функции гр следует, что она удовлетворяет урав- нению восстановления Ф = ф0+ф-^-Я. (3.10) Используя это равенство, покажем, что (3.9) можно переписать в эквивалентной форме- F = //4-p-//>p. (3.11) Действительно, вычисляя свертку (3.9) с Н, получаем Н ★ Р + ф—Фо = Н—F ф- ф * F.
§ 3. Распределение лестничных высот 453 Вычитая это соотношение из (3.9), получим (3.11). Обратно, находя свертку (3.11) с ф, получаем ф^Г=ф—ф0+ф* р—(ф—Фо) ★р^ф—Фо + р, что совпадает с (3.9). Тождество (3.11) замечательно тем, что дает представление произвольного распределения F в терминах двух (возможно, несобственных) распределений вероятностей Яир, сосредоточен- ных на 0, оо и —оо, 0 соответственно. Первый интервал открыт, второй замкнут, но эту асимметрию можно поправить, выразив вероятности первого попадания р в — оо, 0 через вероятности Н~ первого попадания в —оо, 0. Соотношение между этими веро- ятностями дается формулой, аналогичной (1.12) при х < 0, а именно р=?Фо + (1— где £ определено соотношением (1.11) (последнее соотношение справедливо, даже если поменять знак неравенства на противо- положный; см. пример 2, а)). Подставляя это выражение в (3.11), после тривиальных пре- образований получаем Фо-f = (1 -я [Фо-#] ★ [Фо-Я-]. (3.12) Конечно, если функция распределения F непрерывна, то соотношения (3.11) и (3.12) совпадают. Различные варианты этой формулы были открыты независимо один от другого различными методами, и все они вызвали восхи- щение. Одно видоизменение см. в задаче 19, другое в терминах преобразований Фурье дано в гл. XVIII, 3. Связь с методами Винера—Хопфа обсуждается в § За. Тождество Вальда (2.8) является простым следствием (3.11). (См. задачу 11 и гл. XVIII, 2.) б) Явные выражения для Н и Н~ обычно трудно получить. Интересное распределение, для которого вычисления особенно просты, было найдено в примере VI, 8, б). Если/7—свертка двух показательных распределений, сосредоточенных на 0, оо и на — оо, 0 соответственно, то его плотность имеет вид а-\-Ь * J^L.P-6x а + 1> ' /(%) = х < 0, >0. Предположим, что b а, так что Е (X) 0. Тогда Н и Н~ имеют плотности, равные be~bx и Ьеах. Здесь Н Н~ z= (b/a) F, и (3.11) тривиально верно. !>
45’4 Гл. ХП. Случайные блуждания в (Другие примеры, содержащие явные решения, см. в задаче 9.) Обратимся теперь к (3.9), как к интегральному уравнению относительно неизвестных мер риф. Мы покажем, что его реше- ние единственно, если принять во внимание свойства, которые риф обязаны иметь в этом контексте. Условимся говорить для краткости, что пара (р, ф) имеет вероятностный смысл, если р— (возможно, несобственное) распределение вероятностей, сосредо- точенное на — оо, 0, a ip—ip0—мера, сосредоточенная на 0, оо и такая, что для каждого интервала I значения ip{Z-f- огра- ничены (последнее условие вытекает из теорем восстановления, так как ip = 2-^'!*)- Теорема 1. Уравнение свертки (3.9) [или равносильная ему пара уравнений (3.6)] обладает только одним решением (р, ip), имеющим вероятностный смысл. Отсюда вытекает, что р есть распределение точки первого вхождения в —оо, 0 и 1р = 2-^'г*» гДе Н—распределение точки первого вхождения в 0, оо. Доказательство. Пусть р* и 1р#—две неотрицательные меры, удовлетворяющие (3.6), и 1р#^1р0. Из (3.66) по индукции полу- чаем ip* ^1р0+... 4-ip„ при любом п. Поэтому наше решение тр минимально в том смысле, что для любого другого решения ip* с единичным атомом в нуле ip# {/}^1р{/} для всех интервалов. Другими словами, 6 = ip*—ip есть мера. Из (3.6а) видно, что это же верно и относительно у = р*—р. Так как и (р, ip), и (р*, ф#) удовлетворяют (3.9), мы имеем 6 + ? = 6*F. (3.13) Положим z (/) = 6 (Z-|-/), где I—фиксированный конечный интер- вал. Возможны два случая. Если р—собственное распределение, то из р*^р вытекает, что р* = р и, следовательно, у = 0. Тогда функция г будет ограниченным решением уравнения свертки z — F^z, и в этом случае по индукции получаем + 00 ?(/)=$ z(t-y)F"*{dy} (3.14) — 00 при всех п. Теперь z^O и г(/) = 0 для любого t, такого, что I -\-t лежит на отрицательной полуоси. Из (3.14) ясно, что при таких t z(t—у) = 0 для каждого значения у, которое является точкой роста для некоторой функции Fn*. По лемме 2 из гл. V, 4а, множество таких у всюду плотно, и мы приходим к заключению, что z тождественно равно нулю. Для несобственного распределения р мы знаем только, что у^О, и тогда из (3.13) следует лишь то, что z^-F^z. В этом случае (3.14) выполнено с заменой знака равенства на Но
§ 3. Распределение лестничных вы1от 455 тогда случайное блуждание уходит в оо, и, таким образом, масса Р1* стремится сосредоточиться «вблизи» оо. Кроме того, z(t—у) = =0 для всех достаточно больших у, и поэтому г должно тож- дественно обращаться в нуль. Таким образом, ф* = ф, как и утверждалось. За. Интегральное уравнение Винера — Хопфа Связь между интегральным уравнением (3.9) и обычным урав- нением Винера—Хопфа можно лучше всего объяснить, начав с вероятностной задачи, в которой встречается последнее урав- нение. Пример, в) Распределение максимума. Предположим для прос- тоты, что распределение F имеет плотность f и отрицательное математическое ожидание. Случайное блуждание |S„} уходит в —оо, и с вероятностью 1 определена конечнозначная случайная величина M = max[0, S£, S2, ...]. (3.15) Найдем ее распределение вероятностей М(х) = Р{М^х}, которое по определению сосредоточено на 0, оо. Событие {М^х} про- исходит тогда и только тогда, когда Х£ = г/^х и max [О, Х2, Х2-|-Х3,.. .]^х—у. Суммируя по всем возможным значениям у, получаем х M(x) = J M(x-y)f(y)dy, х>0, (3.16) — 00 или, что то же самое, М(х) = s)ds, х>0. (3.17) о С другой стороны, мы знаем из (2.7), чтоМ(х) = [1—Я(оо)]ф(х). Мы видели, что ф удовлетворяет интегральному уравнению (3.76), в котором теперь следует принять р(0) = 1. Простое интегриро- вание по частям показывает теперь, что (3.76) и (3.17) совпа- дают. Стандартной формой уравнения Винера — Хопфа является (3.17). Наш пример указывает путь, на котором это уравнение может возникать в теории вероятностей. Однако ссылки на общую теорию Винера—Хопфа могут запутать положение, так как мы ограничиваемся положительными функциями и мерами, что меняет (и упрощает) характер проблемы. Искусный метод1), использованный Винером и Хопфом для х) Около 1931 г. Обширная литература появилась после первого моно- графического изложения: Hopf Е.; Mathematical problems of radiative equi- libriumj Cambridge tracts, 31, 1934,
456 Гл. XII. Случайные блуждания в (3.17), привлек усиленное внимание и был приспособлен для решения различных вероятностных задач, например, Г. Крамером для вывода асимптотических оценок вероятностей разорения. Этот метод включает громоздкий аналитический аппарат, и поэ- тому легкость, с которой подобные оценки получаются при нашем подходе, вызывает некоторое беспокойство. Но следует понять более глубокие причины этой легкости. Уравнение (3.17) пред- ставляет собой в лучшем случае лишь одно из двух уравнений (3.7), а при р(0)< 1 и того меньше. Взятое само по себе, урав- нение (3.17) значительно более трудно для изучения, чем пара уравнений (3.7). Например, теорема единственности неверна для (3.17) даже в классе распределений вероятностей. Основная идея метода Винера—Хопфа состоит во введении вспомогательной функции, которая в общей теории не имеет никакого особого смысла. Этот остроумный прием1) на самом деле заменяет отдель- ное уравнение (3.17) парой уравнений, равносильной (3.7), но единственность при этом теряется. Мы двигались в противополож- ном направлении, начиная с очевидных рекуррентных соотноше- ний для вероятностей, связанных с двумя неотделимыми друг от друга задачами: изучение первого вхождения в —оо, 0 и случайного блуждания на полупрямой х > 0 до момента этого вхождения. Таким путем мы получили интегральное уравнение (3.9) из известных соотношений. Единственность вероятностного решения было легко доказать. Доказательства сходимости, свой- ства решений, так же как и связь между распределением М максимума и «мерой восстановления» ф, основаны на лемме о двойственности. Возможность подхода к уравнению Винера—Хопфа (3.17), опирающегося на принцип двойственности, была отмечена Ф. Спи- цером2). При обычном способе соединять теорию Винера — Хопфа с вероятностными задачами начальным шагом служат формулы, связанные с нижеследующей формулой (9.3) (в форме, содержа- щей преобразования Фурье; мы вернемся к этому в гл. XVIII). В настоящее время имеется обширная литература, посвященная применению метода Винера—Хопфа к вероятностным задачам и расширению возможностей комбинаторных методов. Большая часть работ использует анализ Фурье3). 1) У автора «tour de force» — (фр.)—Прим, перев, 2) Spitzer F., The Wiener—Hopf equation whose kernel is a probability density, Duke Math, J.-, 24(1957), 327—343. 3) Краткий, но осмысленный обзор литературы невозможен; причина в ее полной неупорядоченности и в том, что методология многих статей находится под влиянием случайностей исторического развития. Обобщения, лежащие за пределами теории вероятностей, проиллюстрированы Бакстеров [Baxter G,, An operator identity, Pacific J, Math,, 4 (1958), 649—663], ""
§ 4. Примеры 457 § 4. ПРИМЕРЫ Явные формулы для распределений первого вхождения в об- щем случае получить трудно. К счастью, имеется одно приме- чательное исключение из этого правила, обсуждаемое в примере а). На первый взгляд распределение F из этого примера представ- ляется искусственным, однако этот тип распределений часто встречается в связи с процессами Пуассона, теорией очередей, задачами о разорении и т. д. Крайняя простота наших общих результатов делает непостижимым то, как много изобретатель- ности и аналитического мастерства было затрачено (часто пов- торно) на анализ частных случаев. Пример в) показывает шаг за шагом процесс полного решения для арифметического распределения F с рациональной произво- дящей функцией. Эти вычисления приведены потому, что точно такой же метод пригоден для рациональных преобразований Лапласа или Фурье. Другой пример указан в задачах 3—6. Пример б) посвящен некоторым общим соотношениям, имеющим независимый интерес. Мы придерживаемся обозначений предыдущего параграфа. Таким образом, Яир суть распределения точки первого вхож- дения в 0, оо и —оо, 0 соответственно. (Другими словами, Н и р являются распределениями соответственно первой строгой верхней и слабой нижней лестничных высот.) Наконец, ф =? = —это Функция восстановления, соответствующая Н. Нашим основным орудием будет уравнение (3.7а), утверждающее, что при х < 0 распределение точки первого вхождения в —оо, О определяется формулой 00 Р (*) = $ Ф {dy} F (х—у). (4.1) о- Примеры. а) Распределения с одним показательно убывающим хвостом появляются чаще, чем можно было ожидать. Так, в слу- чайном блуждании примера гл. VI, 8, б), и в соответствующем процессе ожидания гл. VI, 9, д), оба хвоста показательны. Допу- стим для начала, что левый хвост распределения F—показа- тельный, т. е. Р(х) = уе$х при х < 0. Каково бы ни было ф, (4.1) показывает, что р (х) = СеЗ* при х < 0, где С—некоторая постоянная. Произведя это открытие, поменяем полуоси ролями (частью для облегчения ссылок на наши формулы, частью имея в виду наиболее важные применения к теории очередей). Пред- положим, таким образом, что F(x) = l—ре~ах при х^О, (4.2) не делая никаких ограничений при х < 0. Во избежание ненуж-
458 Гл. XII. Случайные блуждания в ных усложнений допустим, что F имеет конечное математичес- кое ожидание у, и что F непрерывна. Из предварительного заме- чания вытекает, что распределение лестничной высоты Н имеет плотность, пропорциональную е~ах. Рассмотрим теперь отдельно два случая. (i) Если р^О, то Н—собственное распределение и, стало быть, при х > О Н(х) = \—e~axt ф(х) = 1 -f-ax. (4.3) [Последнее равенство тривиально следует как из того, что ф = == так и из Уравнения восстановления (3.10).] Из (4.1) получаем p(x) = F(x)-}-a J F(s)ds, x<0. (4.4) Таким образом, мы имеем явные выражения для всех нужных нам вероятностей. Легкий подсчет показывает, что р(0) = 1— ар. (4.5) Это частный случай (2.8), так как в силу (2.5) (1—p(0))~J = = Е(<^"1). (ii) Если р<0, то соотношения (4.3) и (4.4) по-прежнему дают решение интегрального уравнения (3.9), однако (4.5) пока- зывает, что это решение не может иметь вероятностного смысла при р < 0. Для отыскания правильного решения заметим, что Н имеет плотность ft(x)^(a—x)e~ax, где 0<x<a, так как рас- пределение Н—несобственное. Легко подсчитать, что ф'(х) = — (а—х)е_“ при х>0. Неизвестная константа х определяется из условия р (0) = 1. Стандартные вычисления показывают, что х совпадает с единственным положительным корнем уравнения (4.6). Найдя корень этого трансцендентного уравнения, мы снова получим явные выражения для Н, риф. Читатель может легко проверить, что эта же теория приме- нима и тогда, когда величины Х1( Х2, ..., порождающие, слу- чайное блуждание, целочисленны и распределение F имеет гео- метрически убывающий правый хвост, т. е. если F приписывает целому числу k > 0 массу б) Сопряженные случайные блуждания. Допустим, что F имеет математическое ожидание р^=0 и что существует число х=^=0, для которого + 00 $ e^F{dy} = l. (4.6) — 00 Пусть у —произвольная мера на прямой. Свяжем с ней новую меру полагая ау W) = eV's Y {dy}. (4.7)
§ 4. ЙраМеры 459 Мера aF, «сопряженная» с F, представляет собой собственное рас- пределение вероятностей. Мы будем говорить, что .случайные блуждания, порождаемые “F и F, сопряжены друг с другом1). Легко видеть, что n-кратная свертка “F с собой сопряжена с Fn*, так что обозначение aFn* не вызывает сомнений. Кроме того,' рекуррентные формулы (3.5) показывают, что преобразования ар„ и аф„ имеют в новом случайном блуждании тот же самый ве- роятностный смысл, как р„ и в старом. Вообще преобразования ар, аН, аф и т. д. имеют очевидное значение для случайного блуж- дания, порождаемого “F. [Это можно увидеть и непосредственно из интегрального уравнения (3.9).] Интеграл + 00 <р(/)= 5 eytF {dy} — 00 существует для всех t между 0 и х, и в этом интервале функцию <р можно дифференцировать бесконечное число раз. Поскольку вто- рая производная положительна, <р является выпуклой функцией. Если <р' (х) существует, то из равенства <р (0) = ср (х) следует, что Фх(0) и ф1 (х) имеют противоположные знаки. Следовательно, случайные блуждания, порожденные распределениями F и aF, имеют снос в противоположных направлениях. (Очевидно, это остается верным даже в том исключительном случае, когда aF имеет бес- конечное математическое ожидание.) Мы наметили, таким образом, широко применимый метод пере- вода результатов, касающихся случайного блуждания с р<0, в результаты для случайных блужданий с положительным математи- ческим ожиданием и обратно. Если р, < О, то лестничная высота имеет несобственное рас- пределение, но аН имеет собственное распределение. Это означает, что 00 \e^H{dy}^l. (4.8) о Вся сила метода сопряженных случайных блужданий проистекает главным образом из этого замечания. В самом деле, в гл. XI, 6, мы установили, что, зная корень уравнения (4.8), можно дать прекрасные асимптотические оценки для возрастающего лестничного процесса. Эти оценки были бы иллюзорны, если бы они требовали х) Это понятие применяли А. Хинчин, А. Вальд и др., но оно никогда не использовалось в полной мере. Преобразование (4.7) встречалось в теории восстановления (гл. XI, 6) и в форме, замаскированной применением произво- дящих функций, в теореме 1 (iii) в 1; гл. XIII, 10. Оно появится снова в теории преобразований Лапласа^ см, гл, XII h (1.8). Уравнение (4.6) приме- няют и в теории Винера — Хопфа,
|60 Гл. ХП. Случайные блуждания в знания Н, но мы только что видели, что корни уравнений (4.6) и (4.8) совпадают. в) Ограниченные арифметические распределения. Пусть а и b — по- ложительные числа и F — арифметическое распределение с шагом 1 и со скачками fk в точках k = — Ь, а. Меры ф и р также сосредоточены в целых точках. Их скачки в точке k мы обозначим " — —{ фй и р^ соответственно. Первое вхождение в —оо, 0 осуществ- ляется в целой точке — &, так что р* = 0 при &< — Ь. Введем производящие функции а оо О (S) = 2/?(s)=2pZ (4.9) k=-b k-Q k=z-b Они отличаются от производящих функций из 1; гл. XI, тем, что Ф и R содержат также и отрицательные степени s, однако ясно, что основные свойства и правила действий при этом сохраняются. В частности, р, = Ф'(1) есть математическое ожидание F. Свертке распределений соответствует перемножение производящих функций, поэтому основное интегральное уравнение (3.9) равносильно урав- нению Т + R = 1 + Т Ф или Числитель и знаменатель здесь—полиномы степени b и а + Ь соответственно. Степенной ряд слева сходится при | s | < 1, так что все корни знаменателя, лежащие внутри единичного круга, Должны быть в то же время и корнями числителя. Мы покажем, что это условие позволяет однозначно восстановить Р и Т. Предположим для определенности, что ц = 0 (при 0 см. за- дачи 12, 13). Тогда s = l является двойным корнем уравнения Ф (s) = 1. При | s | = 1 имеем | Ф (s) ] Ф (1) = 1, причем неравенство имеет место только тогда, когда sfe = 1 для всякого такого k, что fk > 0. Поскольку предполагалось, что распределение F имеет скачок 1, то это верно лишь при s=l и, следовательно, других корней уравнения Ф($) = 1 на единичной окружности нет. Чтобы найти, сколько корней расположено внутри единичного круга, рассмотрим многочлен степени а + b, определенный формулой Р(8) = 5Ь[Ф(«) — q], q>\. При | s | = 1 имеем | Р (s) | q — 1 > 0 и |Р(5)Ч-<756| = |Ф(5)К 1 < q | $ь |. По теореме Руше1) отсюда следует, что многочлены P(s) и qsb имеют одинаковое число нулей, расположенных внутри единичного х) См., например: Hille Е., Analytic function theory, vol. I. section 9.2 (Ginn and Co., 1959) или Маркушевич А. И. Теория аналитических функ- ций,—М,; Гостехиздатд 1950.
§ 5, Применения 461 круга. Таким образом, Р имеет в точности b корней, таких, что |s| < 1, и а корней, таких, что |s|> 1. Далее, Р(0) = 0 и Р(1)= 1—<0, тогда как P(s)>0 для больших s. Таким об- разом, Р имеет два действительных корня s' < 1 <s". При q—+ 1 корни Р стремятся к корням Ф(з)=1. Таким образом, наконец, приходим к выводу, что знаменатель в (4.10) имеет двойной ко- рень 1 и, кроме того, b— 1 корней slf ..., sb_t с |sy | < 1 и а— 1 корней о^, ..., oa_j с |оу|> 1. Тогда знаменатель имеет вид 8* (Ф (3) - 1) = С (s—I)2 (s-S1). . . (S-S^) (s-oj... (s-o^). (4.11) Корни Si,...,s6_I должны совпадать с корнями числителя, и так как коэффициенты ф„ ограничены, то же самое должно быть верно и для одного корня s»l. Этим ¥ определяется с точностью до постоянного множителя. Но по определению Чг(0) = 1, и мы по- лучаем искомую явную формулу Т (з) = ---------. (4.12) Стандартное разложение на простейшие дроби приводит к явному выражению для ф„. Большое преимущество этого метода в том, что знание доминирующего корня приводит к хорошим асимп- тотическим оценкам (см. 1; гл. XI, 4). Для производящей функции Р вероятностей первого вхожде- ния рА из (4.10) и (4.12) получаем R (S)= 1+С(-1)->. .а.., (1-j) (1 - Л) ... (4-13) [Коэффициент С определяется по (4.11) и зависит только от данного распределения {Д}.] Снова разложение на простейшие дроби приводит к асимптотическим оценкам (продолжение см. в задачах 12—15). § 5. ПРИМЕНЕНИЯ В гл. VI, 9, было показано, что основная задача теории очере- дей сводится к отысканию распределения М для М = тах [0, S,;, ...] (5.1) в случайном блуждании, порожденном величинами ХА с ц = = E(Xft)<0. Примеры 9, а) — 9, в) гл. VI показывают, что это же распределение возникает и в других обстоятельствах, напри- мер в связи с задачей о разорении для обобщенного процесса Пуассона. В последнем случае, как и в теории очередей, основ- ное распределение имеет вид F=A*B, (5.2)
Гл. XII. Случайные блуждания в где А сосредоточено на 0, ос, а В — на — оо,0. Мы предположим, что А и В имеют конечные математические ожидания а и — Ь, так что F имеет математическое ожидание ц==а — Ь. Мы предполо- жим также, что распределение F непрерывно. Это позволит избе- жать утомительной необходимости различать строгие и слабые лестничные величины. Мы обозначим, так же как в двух предыдущих параграфах, распределения для верхних и нижних лестничных высот через Яир соответственно. Иными словами, Яир суть распределения для первых вхождений в 0, оо и —оо, б (а также в соответст- вующие замкнутые интервалы). В примере 3, в) и в (2.7) было показано, что при р < О 00 м w=S нп* (5-3) Пример 4, а) содержит явную формулудля этого распределения, справедливую, если один из хвостов F — показательный, т. е. F(x) = 1 — pe~rj-x при х>0 (5.4) или F(x) — qeax при х<0. По весьма счастливому совпадению условие (5.4) выполняется, если F имеет вид (5.2) с А(х)=1— е~ах при х>0. (5.5) Тогда о р = $ e^B{dy\. (5.6) — 00 Наши простые результаты применимы поэтому к теории очередей, если поступающий поток является пуассоновским или время обслуживания распределено показательно. Кроме того, упомянутое условие выполнено и в задаче о разорении для обобщенного процесса Пуассона. Существует необъятная прикладная литература, разбирающая отдельные задачи при тех или иных предположениях относительно распределения В, иногда в замаскированной форме, как в задаче о разорении. Оказывается, большая общность и значительно большая простота достигаются при использовании только одного условия (5.4) вместо комбинации (5.5) и (5.2). Мы имеем здесь прекрасный пример экономии мысли, присущей х) Другая явная формула указана в примере 4, в) для случая арифмети- ческого распределения F с конечным числом атомов. Эта явная формула слишком сложна для практического использования, но разложение на простейшие дроби приводит к хорошим асимптотическим оценкам, если известен доминирующий корень знаменателя. Такой же метод применим в случае рациональных харак- теристических функций. Это замечание охватывает множество частных случаев, разобранных в литературе,
§ 5. Применения 463 общей теории, когда понимание не затемняется случайными чер- тами отдельных примеров. Примеры, а) Формула Хинчина — Полачека. Допустим, что F имеет вид (5.2), где А удовлетворяет (5.5) и р=1/а—&>0. Случайное блуждание уходит в оо, и мы должны заменить в (5.1) максимум на минимум. Это равносильно замене Я в (5.3) рас- пределением риз (4.4). Простое интегрирование по частям показы- вает, что при х < О X p(x) = aj B(y)dy. (5.7) — со Здесь р (0) = ab, так что при х < 0 P{min(S0, Sb ...)<х} = (1—a&) Зр"* W- (5.8) о Это известная формула Хинчина —Полачека, которую неод- нократно открывали заново в частных случаях, неизменно исполь- 'зуя метод преобразования Лапласа [неприменимый к более общим распределениям типа (5.4)]. Мы вернемся к этой формуле в задачах 10, 11 гл. XVIII, 7. б) Двойственный случай. Рассмотрим такие же распределения, как и в предыдущем примере, но предположим, что р < 0. Как было показано во второй части примера 4, а), в этом случае P{max(S0, ...)<*} = £ф(х) = 1-(1 —, (5.9) где н—единственный положительный корень «характеристического уравнения» (4.6). [Этот результат может быть получен также и методом сопряженных случайных блужданий; достаточно вспомнить, что при р^О ф(х)=1+ах для х>0.] В применении к теории очередей (5.9) означает, что если время обслуживания распределено показательно, то распределение времен ожидания стремится к показательному пределу. в) Асимптотические оценки. Метод, использующий сопряжен- ное случайное блуждание, который описан в § 46, легко приводит к полезным оценкам для хвоста распределения М (x) = P{max(S0, Si, ...)^х}. (5.10) Следующий простой метод заменяет множество сложных вычисле- ний, предназначенных для решения отдельных задач в литературе прикладного характера. Этот метод представляет собой частный случай общей теории из гл. XI, 6, но здесь для удобства его изло- жение будет совершенно самостоятельно. Распределение М дано в (5.3), где через ф обозначена «мера восстановления», соответствующая несобственному распределе- нию Н. Сопряженному собственному распределению аН соответст-
464 Гл. XII, Случайные блуждания в 5№ рует мера аф, заданная равенством вф {dx} = екх ф {dx}, где х дано в (4.6) или (4.8). Таким образом, можно переписать (5.3) в виде М {dx} = [1 —Н (оо)] e~HX-aty {dx}. (5.11) В силу основной теоремы восстановления из гл. XI, 1, мера “ф распределена асимптотически равномерно с плотностью 0-1, где ₽=Jxe4ff{dx}. (5.12) о Интегрируя (5.11) в пределах от t до оо.мы видим, таким образом, что при t —> оо 1 -М (О ~ (5.13) рх если только 0<оо. [В противном случае 1— М (0 = о(е“и/)-] Постоянная 0 зависит от распределения Н, явный вид которого обычно неизвестен, однако показатель степени % зависит только от заданного распределения F. Следовательно, в худшем случае (5.13) дает оценку, в которую входит неизвестный множитель, но даже этот результат нелегко получить другими методами. Следующий пример посвящен важным приложениям. г) Оценка Крамера для вероятностей разорения. Применим теперь предыдущий результат к примеру а). Здесь случайное блуждание уходит в 4-оо, и, следовательно, положительную и отрицательную полуоси можно поменять местами. Это означает, что х < 0 и распределение Н надо заменить распределением (5.7) первого попадания в—оо,0. Таким образом, (5.12) принимает вид о 0 = а J e~\v‘\y\y\B{y)dy. (5.14) — 00 Мы видели, что р(0) = а&, и, таким образом, (5.13) эквивалентно утверждению, что при х —► оо P{min(S0, S1, ...)<х}~^е1нК (5.15) Эта формула имеет много приложений. В теории очередей левая часть (5.15) представляет собой предельное распределение времени ожидания n-го клиента (см. теорему в гл. VI, 9). В примере VI, 9, г), было показано, что к этой задаче теории очередей может быть сведена основная задача о разорении из гл. VI, 5. В других обозначениях эта же задача рассматривается в примере XI, 7, а)1). !) Нашему несобственному распределению р, сосредоточенному на — оо, О, в гл. VI, 7, соответствует сосредоточенное на 0, оо несобственное распределе- ние L с плотностью (а/с) (1— F (х)).
g 6. Одна комбинаторная лемма 465 Поэтому неудивительно, что оценку (5.15) неоднократно выводили при специальных предположениях, но задача оказывается более простой в ее естественной общей постановке. В общей теории оценка (5.15) эквивалентна известной оценке, которая для веро- ятности разорения в математической теории страхования была предложена Крамером1). § 6. ОДНА КОМБИНАТОРНАЯ ЛЕММА ► Распределение лестничных моментов связано с одной простой комбинаторной леммой. Вероятностная часть рассуждений будет более ясной, если мы выделим эту лемму особо. Пусть xit ..., хп — п чисел. Рассмотрим их частные суммы So = 0, . . •, Sn == Xi Мы скажем, что v > О есть лестничный индекс, если sv > s0,..., sv>sv-i,t. е. если sv превосходит все предыдущие частные сум- мы. Ясно, что имеется п лестничных индексов, если все xv по- ложительны, и нет ни одного, если все xv отрицательны. Рассмотрим п циклических перестановок (хо ..., х„), (х2,.... хп, X,), ... (хп, xlt ... , xn_t) и занумеруем их числами 0, ... , п— 1. Частные суммы в перестановке с номером v равны J sv+k-sv при k=\,... ,n-v, , л .I (6-1) ( sn—sv + sk_n+v при £ = а —v-{-l, ... , а. Лемма 1. Пусть sn>§. Обозначим через г число циклических перестановок, в которых п является лестничным индексом. Тогда г>1, и в каждой такой циклической перестановке будет ровно г лестничных индексов. Примеры. Для (—1, —1, —1, О, I, 10) мы имеем г=1. Данный порядок — единственный, в котором последняя частная суммма максимальна. Для (—1, 4, 7, 1) мы имеем г = 3; пере- становки с номерами 0, 2 и 3 содержат по три лестничных индек- са. ► Доказательство. Выберем v так, что sv максимально. Если таких индексов несколько, то возьмем наименьший из них. Дру- гими словами, Sv Sj[, ... , Sv S^_|, Sy $v+i’ • • • > sv Sn. (6.2) Из (6.1) видно, что при этом в v-й перестановке последняя част- ная сумма строго максимальна, так что п есть лестничный индекс. х) Болееновый вывод методом Винера—Хопфа в комплексной плоскости см. в статье.Крамера, цитированной в гл. VI, 5. Наша оценка (5.10) совпадаете формулой (57) у Крамера.
466 Гл. XII. Случайные блуждания в Таким образом, г^1. Не ограничивая общности, допустим, что п есть лестничный индекс в исходной перестановке, т. е. s„ > Sy при всех /. Тогда все величины в первой строке (6.1) будут <sn. Вторая строка показывает, что п будет лестничным индексом для v перестановок тогда и только тогда, когда sv > slt ..., sv > sv-i, т. e. когда в исходной перестановке v будет лестничным ин- дексом. Таким образом, число перестановок, в которых п есть лестничный индекс, равно числу лестничных индексов. Лемма доказана. Слабые лестничные индексы определяются аналогично, с той разницей, что строгие неравенства > заменяются на В при- менении к ним предыдущие рассуждения показывают, что верна Лемма 2. Если то лемма 1 применима и к слабым лестничным индексам. § 7. РАСПРЕДЕЛЕНИЕ ЛЕСТНИЧНЫХ МОМЕНТОВ В предыдущих параграфах наше внимание было сосредоточено на лестничных высотах. Теперь мы перейдем к лестничным момен- там. Рассмотрим вероятность того, что п является моментом пер- вого вхождения в 0, оо, т. е. t„ = P{S1<0,..,,S„_i<0,S„>0}. (7.1) Другими словами, {тп} есть (возможно, несобственное) распреде* ление первого лестничного момента ©ГР Введем производящую функцию -r(s) = 2t„s«, 0<s<1. (7.2) n= 1 Следующая ниже важная теорема показывает, что распреде- ление полностью определяется по вероятностям Р {S„ > 0} и наоборот. Теорема была найдена Спарре-Андерсеном. Данное им остроумное, но крайне сложное доказательство было постепенно упрощено другими авторами. Мы получаем эту теорему как про- стое следствие нашей комбинаторной леммы. [Более строгие ва- рианты содержатся в (9.3) и будут рассмотрены с помощью мето- дов Фурье в гл. XVIII.] Теорема 1£ 00 logr=b)“2?p(S„>0(. (7.3) ' /2=1' Замечание. Теорема и ее доказательство остаются верными, если в (7.1) и (7.3) знаки неравенств > и заменить на и < соответственно. В этом случае {т„[ обозначает распределение первого слабого лестничного момента,
§ 7. Распределение лестничных моментов 467 Доказательство. Для каждой выборочной точки (Хь Х2,..., Х„) рассмотрим п циклических перестановок (Xv, .... Х„, Xlt..., Xv_j) и обозначим соответствующие частные суммы через Sf>V), S^. Фиксируем целое г и определим \п случайных величин Y(V) сле- дующим образом: Y<v> = 1, если п есть r-й лестничный индекс для (S(xv), ..., S^), и Y(v) = 0 в других случаях. Случаю v = 1 соот- ветствует последовательность {So, ..., Sn}, поэтому P{Y(1) = 1} = т#>, (7.4) где {т^}—это распределение r-го лестничного момента. Этот момент есть сумма г независимых случайных величин, распреде- ленных так же, как j, и, следовательно, #’—это коэффициент при s" в тг (s). По причине симметрии все случайные величины Y(W имеют одно и то же распределение. Поскольку они прини- мают лишь два значения 0 и 1, то из (7.4) следует, что т"> ~ Е (Y(i>) = ± Е (Yu) + ... + Y(n’). (7.5) По лемме § 6 сумма Y(1)-{- ... -Ь Y<n) может принимать только значения 0 и г, откуда yT<f> = lp{Y<i’-b... + Y<”> = r}. (7.6) Для фиксированного п и г=1, ... события в правой части (7.6) взаимно исключают друг друга и их объединение есть событие {S„ > 0}. Суммируя по всем г, получаем 00 S|t<'’ = 1p{S„>0}. (7.7) г= 1 Умножая (7.7) на sn и суммируя по п, находим 27^(s) = £gP{Sn>0}, (7.8) Г= 1 1 - что совпадает с утверждением (7.3). Следствие. Если F симметрично и непрерывно, то T(s)==l—(7.9) Доказательство. Все вероятности Р {Sn >0} в (7.3) равны {/2> поэтому правая часть (7.3) равна log(l/j/* 1—s). Интересно обобщить этот результат, предполагая только, что P{S„>O}->1, (7.10) & Это так, когда распределение величин Sn/an стремится к нормальному рас- пределению SR, Мы предположим несколько больше, чем (7Д0), а именно, что
468 Гл. XII. Случайные блуждания в $1г сходится (не обязательно абсолютно) ряд со £-t Гр{8„>°}—1]=С, (7,11) п=1 *- -* В гл. XVIII, 5, будет показано$ что г(7.11) верно всякий раз, когда F имеет нулевое математическое ожидание и конечную дисперсию. Следующая теорема приведена не только потому, [что она имеет само- стоятельный интерес, но и как иллюстрация к использованию уточненных тауберовых теорем, Теорема 1а. Если (7,11) справедливо, то Р{а^>«}~ ' (7,12) у Л у п Таким образом, когда F имеет нулевое математическое "ожидание и конечную дисперсию, распределение {т„} очень близко к распределению, которое встре- чается при случайном блуждании Бернулли. Доказательство. В силу (7,3) мы видим, что при s —> 1 [p{S«>0}-1]->Cs (7.13) Отсюда следует, что J____, (7,14) 1-s ]<l-s ' В левой части можно узнать производящую функцию вероятностей из (7.12), Они монотонно убывают, и, следовательно, (7,12) верно tB силу последней части тауберовой теоремы 5 из гл, XIII, 54 * Теорема 2. Случайное блуждание уходит в — оо тогда и только тогда, когда СО E4P<Sn>0}<oo. (7.15) /1=1 Этот г критерий остается справедливым1) при замене событий {s„ > 0} на Доказательство. Снос в —оо происходит тогда и только тогда, когда возрастающие лестничные процессы обрываются, т. е. когда STт имеет несобственное распределение. Это равно- сильно неравенству т(1)< 1. В этом случае обе части (7.3) остаются ограниченными при s—>-1. Отсюда видно, что условие (7.15) является необходимым и достаточным. Это же рассужде- ние применимо к слабым лестничным моментам, что обосновы- вает заключительное утверждение теоремы. ») Мы увидим, что всегда 2n-ilP {sn=°} <°» 1см» В)Ь
§ 7. Распределение лестничных моментов 469 Мы знаем, что снос в —оо имеет место, если F имеет математическое ожидание р, < 0. Однако не очевидно, что неравенство р < 0 влечет за собой (7.15). Проверка этого факта представляет собой превосходное аналитическое упражнение, имеющее и методологический интерес (см. задачу 16), Эта теорема имеет удивительные следствия. Примеры, а) Пусть F—строго устойчивое распределение с F(0) = 6 < 1/2. Интуитивно можно было бы ожидать сноса в оо, но на самом деле случайное блуждание здесь является блужда- нием осциллирующего типа. Действительно, ряд (7.15) сводится к (1-6)^ и расходится. Таким образом, случайная величина j является собственной. Однако те же самые рассуждения применимы к отрицательной полуоси, и мы видим, что убываю- щая лестничная величина &“ тоже является собственной. б) Пусть F обозначает симметричное распределение Коши. Рассмотрим случайное блуждание, порожденное величинами Х„ = Хп-|-1. Медиана распределения сумм = + n находится в точке п, и интуитивно можно было бы ожидать сильного сноса в оо. На самом деле вероятность Р {S„ > 0} снова не зависит от п, и, как в предыдущем примере, мы приходим к выводу, что случайное блуждание принадлежит осциллирующему типу. Теорема 3. Лестничный момент j имеет конечное матема- тическое ожидание (и собственное распределение) тогда и только тогда, когда случайное блуждание уходит в оо. При этом 00 log Е = log 2 kxk = Е 1Р {S„ < 0}. (7.16) П=1 (Во всех остальных случаях ряд расходится.) Доказательство. Вычитая обе части равенства (7.3) из выра- жения log(l—s)-1, получаем при 0 <s< 1 Jog ? [1 -Р > 0}]- (7.17) П=1 При s—>1 левая часть (7.17) сходится тогда и только тогда, когда —собственная случайная величина и имеет конечное математическое ожидание. Правая часть (7.17) стремится к пра- вой части в (7.16). По теореме 2 сходимость имеет место тогда и только тогда, когда случайное блуждание уходит в оо. В заключение мы покажем, что производящая функция из теоремы 1 имеет альтернативную вероятностную интерпретацию, которая приводит к замечательному закону арксинуса. Теорема 4. Производящая функция вероятностей pa = ?{Si>Qt S2>0, ..., S„ > 0} (7.18)
470 Гл. XII. Случайные блуждания в определяется формулой Р(ь) = Г^й (7Л9> или со logp(S) = £^P{Sn>0}. (7.20) п— 1 Из соображений симметрии вероятности qn = P{Si^, .... S„<0} (7.21) имеют производящую функцию q, определяемую формулой log(7(S) = £ ^P{S„<0}. (7.22) п= 1 (Ср. с задачей 21.) Доказательство. Используем лемму о двойственности из § 2. Из теории рекуррентных событий ясно, что (7.19) является про- изводящей функцией для вероятностей рп того, что п будет лест- ничным моментом: p„ = P{S„>S0, ..., S„>S„_J. (7.23) Меняя порядок случайных величин Ху, получаем двойственное соотношение (7.18). [Этот случай содержится на самом деле в (2.1) при / = 0, оо.] § 8. ЗАКОН АРКСИНУСА Одна из удивительных черт случайных колебаний при броса- нии монеты находит свое выражение в двух законах арксинуса (1, гл. III, 4 и 8). Первый из них имеет следствием, что число положительных членов в последовательности Sy, S2, ..., Sn с большой вероятностью будет ближе к 0 или п, чем к п/2 (п/2 соответствовало бы наивным ожиданиям). Второй закон приводит к такому же выводу относительно положения максимального члена. Мы покажем теперь, что эти законы верны для всех сим* метричных и многих других распределений. Это открытие дока- зывает общезначимость и применимость рассуждений в 1; III. В последующих формулировках нам будет мешать то, что максимум может достигаться несколько раз и что частные суммы могут обращаться в нуль. Эти возможности можно не рассмат- ривать, если распределение F непрерывно, так как в этом слу- чае вероятность равенства двух любых частных сумм равна нулю. (Мы советуем читателю ограничиться только этим случаем.) В общей теории мы условимся рассматривать номер первой мак^
§ 8. Закон арксинуса 471 ► симальной суммы, т. е. индекс k, для которого Sfe > S„ Sft > Sft>Sft+1, Sft>S„. (8.1) Здесь n фиксировано и k пробегает значения 0, 1, .п. При некотором k^n событие (8.1) должно произойти, так как мы можем определить (собственную) случайную величину К„ как номер первого максимума, т. е. номер, при котором верно (8.1). (Здесь So = O.) Для наступления (8.1) необходимо и достаточно, одновременное наступление событий {SA > So, ..., SA > SA_j} и {Sft+I Sft^0, S„ SA^0}. Первое зависит только от случайных величин Х1( ..., Хй, авто- рое—от величин Xft+1, ..., Х„, поэтому они независимы. Но эти события суть события из последней теоремы, следовательно, верна Лемма 1. Для всех kun Р {Kn = k} = pkq„-k. (8.2) Допустим теперь, что Р {S„ > 0} = Р {S„ 0} = 1/2 при всех п. Тогда правые части в (7,15) и (7.17) превращаются в -у log (1—s)-1, так что p(s) = </(s) = l/K1—s. Таким образом, (8.3) что можно переписать в более удобной форме: „ _ _(2k\(2n—2k\_[_ (Я PlAn-k— \k)\ n—k )z2n' (8-4) Это выражение использовалось в 1; III, (4.1), для вывода дис- кретной формы распределения арксинуса, которое было най- дено в 1; III, 4 и 8, и которому подчиняются различные слу- чайные величины, связанные с бросанием монеты; его предельная форма была выведена в Г, III, (4.4). В частности, используя закон арксинуса, из 1; III, 8, е), мы можем установить следующий результат. Теорема 1. Если распределение F симметрично и непрерывно, то распределение вероятностей К„ '(номера первого максимума среди So, Sf, ..., Sn) остается тем же самым, что и в игре с бросанием монеты, и задается формулами (8.3) или (8.4). При п—юо и фиксированном а, 0<а< 1, Р{К„ < па}—> 2-i-arcsinК«- (8-5) Предельное распределение имеет плотность 1/(лКа(1—а)), ко-
472 Гл. XII. Сл^йные блуждания в торая неограничена вблизи точек 0 и 1 имеет минимум в точке 1/2. Это показывает, что значения нормированного максимума Кп/п располагаются вблизи точек 0 и 1 с вероятностью, заметно большей, чем вблизи точки 1/2. Более подробное обсуждение см. 1; гл. III, 4 и 8. Другую форму Теоремы см. в задаче 22. Эту теорему можно обобщить точно так же, как теорему 1 из § 7> Теорема 1ах). Если ряд £ 1[P{S„> О}-1/2]=о (8,6) п = 1 сходится, то при п—>оо и п—k—>оо и, следовательно, справедлив закон арксинуса (8.5). В гл. XVIII, 5, будет показано, что ряд (8.6) сходится, ‘если F имеет нулевое математическое ожидание и конечную дисперсию. К этим распределе- ниям применим, следовательно, закон арксинуса, Доказательство. Из (7.20) и элементарной теоремы Абеля для степенных рядов мы заключаем, что при s —> 1 00 log(Р (s) = Е [₽ {S„ > 0}—И —с (8,8) п=1 J и, таким образом, p(s)^e41—s)~i72- (8.9) По определению (7.18) вероятности рп монотонно убывают, и, следовательно, из последней части тауберовой теоремы 5 гл. XIII, 5, вытекает, что коэф- фициенты обоих степенных рядов в (8.9) ведут себя одинаковым асимптоти- ческим образом, Следовательно, (-1)»; и—>оо. (8.10) Для qn мы получаем то же самое соотношение с заменой с на —с, и, сле- довательно, утверждение (8.7) следует из (8.2), Вывод закона арксинуса основан только на асимптотическом соотношении (8.7), а не на тождестве (8.4), ► Теорема 1 и ее доказательство переносятся на произвольные строго устойчивые распределения, Если Р {Sn > 0} = 6 не зависит от п, мы полу- чаем из (7,20) и (7.22) р (s) = (1—S)“^, q ($) = (1-5)б-1,~ n—>00 (8,11) и, таким образом, P{K„=^}=pft<?n_ft = (-l)«(-®)(^l)‘ (8.12) Предельная теорема (8,5) имеет место, если заменить распределение аркси- х) Эта теорема была доказана трудоемкими вычислениями Спарре-Андер- сеном. Наблюдение, что тауберова теорема устраняет все сложности, при- надлежит Спицеру, Обобщение см« в 9,г),
g 8. Закон арксинуса 473 нуса в правой части распределением с плотностью sin nd 1 Л ' 1 д /< \ д ) О х Л Х1-0 (1— х)О (8.13) Теорема 1а распространяется на распределенияj принадлежащие к области притяжения устойчивого распределения. В 1; гл. III, нам пришлось доказывать оба закона арксинуса по отдельности, однако следующая теорема показывает, что онй эквивалентны. Теорема 2 (для непрерывных распределений) была исходной точкой исследований Спарре-Андерсена, нашедшего новый подход к теории флуктуаций. Первоначальное доказатель- ство было крайне сложным. Сейчас существует несколько дока- зательств, но приводимое здесь кажется простейшим. Теорема 2. Число Пи строго положительных членов последова- тельности Sb ..., S„ имеет то же самое распределение (8.2), что и номер К„ первого максимального числа среди Sofe=O, Si, •.., Sn. (См. задачу 23.) Эта теорема будет сведена к чисто комбинаторной лемме. Пусть ..., хп—произвольные (не обязательно различные) действительные числа. Положим $о = О> ^ = *1+•..+**. (8.14) Максимум среди $0, может достигаться несколько раз, и, следовательно, мы должны различать номера первого и по- следнего максимального членов. Теперь рассмотрим п\ перестановок чисел ..., xin (неко- торые из них могут быть одинаковы). Каждой из перестановок мы поставим в соответствие последовательность из п+1 частных сумм 0, х^, ..., xit + ... + Пример, а) Пусть х^ = х2=1 и х3 = х4 = 1. Только 6 переста- новок (л^, ..., Xjn) различимы между собой, но каждая из них представляет четыре перестановки индексов. В перестановке (1, 1, —1, —1) три частные суммы строго положительны, а (единственный) максимум появляется на третьем месте. В пере- становке (—1, —1, 1, 1) нет ни одной положительной частной суммы, а последняя равна нулю. Первому максимуму соответст- вует номер 0, последнему — 4. Будет доказано, что теорема 2 является простым следствием следующей леммы. Лемма 2. Пусть г—такое целое число, что О^г^п. Число Аг перестановок, которым соответствуют в точности г строго полрокирт^льных частных сумм, равно числу ВГ переста-
474 Гл. XII. Случайные блуждания в др новок, в которых первый максимум среди этих частных сумм появляется на r-м месте. (См. задачу 24.) Доказательство1). Будем рассуждать по индукции. Утверж- дение леммы верно для п = 1, так как если > О, то At = Вг = 1 и До = -Во = 0, а если 0» то At = Bi — 0 и До = Ва = 1. Пред- положим, что лемма верна, если заменить п на п—1^1. Обо- значим через и B'rk} числа, соответствующие Аг и Вг при замене строки (хь ..., х„) на строку из п чисел х, полученную выбрасыванием xk. Тогда по предположению индукции Д(/* ?= В(/г) при1^^^п и г = 0, .... п—1. Это верно также при г — п, поскольку тривиально А^1 = B^y — Q. а) Предположим, что ... + х„^0. Все п\ перестановок (л^, .... х„) можно получить выбором элемента хк на последнем месте и перестановкой оставшихся п—1 элементов. Поскольку n-я частная сумма ^0, ясно, что число положительных частных сумм и номер первого максимального числа зависят только от первых п—1 элементов. Таким образом, п п Дг = S л<ft), Br = s (8.15) А=1 k=l и, следовательно, АГ = ВГ по предположению индукции. б) Предположим, что ... -}-хп > 0. Тогда п-я частная сумма положительна, и из предыдущих рассуждений ясно, что в этом случае (8,16) k=i Чтобы получить аналогичную рекуррентную формулу для Вг, рассмотрим перестановки (xki х^, ...» */ f)> начинающиеся с элемента xk. Поскольку n-я частная сумма положительна, ма- ксимальные члены последовательности частных сумм имеют по- ложительные индексы. Ясно, что первый максимум появляется на месте г тогда и только тогда, когда первый мак- *•) *•) Это доказательство принадлежит А. У. Джозефу (A. W. Joseph) из Бирмингема (Англия), Крайняя простота доказательства может шокировать, если припомнить, что в 1949 г, сенсационное открытие Спар ре-Андерсеном теоремы 2 было встречено с недоверием, а его первоначальное доказательство было крайне запутанным и сложным. Автор свел теорему к чисто комбина- торной лемме 2 и дал [ее ‘элементарное доказательство '(см. первое издание настоящей книги). Доказательство Джозефа не только проще, но является первым конструктивным доказательством, устанавливающим взаимно одно- значное соответствие между двумя типами перестановок* Идея применения этого приема в лемме 3 принадлежит М« Т. Л. Бизли (М. Т. L. Bizley) из Лондона (Англия). Автор благодарен гг. Джозефу и Байзли за разрешение использовать их неопубликованные результаты (они были сообщены мне, когда рукопись была уже в печати) s
§ 8. Закон арксинуса 475 симум частных сумм для (х/р Xjn_J появляется на месте г—1. Таким образом, Br= Mi- (8.17) k=i Сравнение (8.16) и (8.17) снова показывает, что АГ = ВГ, и это завершает доказательство. > Вскоре мы увидим, что проведенные рассуждения приводят к дальнейшим результатам, но сначала мы вернемся к доказатель- ству теоремы 1. Доказательство теоремы 7. Мы поступим так же, как при доказательстве теоремы 1 из § 7. Рассмотрим п\ перестановок (xtl, ..., Xin) и перенумеруем их так, чтобы перестановка с естест- венным порядком (хй ..., хп) имела номер 1. Для фиксирован- ного целого числа г, положим Yv=l, если переста- новка с номером v имеет ровно г положительных частных сумм, и положим Yv = 0 в противном случае. По соображениям симмет- рии п\ случайных величин Y(v) имеют одинаковое распределение и, следовательно, Р (П„ = г} = Р {Y(1) = 1} = Е (Y(1)) = -Ь 2 Е (Y<v)). (8.18) Аналогично P{K„ = rH^2E(Z<V)). (8.19) где Z<V) = 1, если в перестановке с номером v первая максималь- ная частная сумма имеет индекс г, и Z(v, = 0 в противном слу- чае. В силу леммы 2 суммы 2^(v) и 2Z(V) равны и, следова- тельно, вероятности в (8.18) и (8.19) одинаковы. Замечание о преобразованиях Спарре-Андерсена. Из леммы 2 следует, что существует такое преобразование, что каждая строка (xit ..., х„) из п действительных чисел отображается в переста- новку (х(1, .... х;п) таким образом, что: (i) если среди частных сумм sk в (8.14) ровно г строго положительны, то максимальная из частных сумм для (х/,, ..., х,п) появляется в первый раз с индексом г; и (ii) преобразование обратимо (или взаимно однозначно). Такие преобразования будут названы именем Спарре-Андерсена, хотя он имел дело с независимыми случай- ными величинами, не зная о возможности свести теорему 2 к чисто комбинаторной лемме 2. При внимательном изучении доказательства леммы 2 обнаруживается, что оно неявно содер- жит способ построения преобразования Спарре-Андерсена. Про- цедура является рекуррентной, причем первый шаг задается правилом: если s„^0, оставляем (хх, хп) без изменений, но
476 Гл. XII. Случайные блуждания в SW если sn > 0, заменяем (хх, ..., хп) на циклическую перестановку (xn, хх, xn_f). Следующий шаг состоит в применении того же самого правила к (xf, ..., хп_±). Желаемая перестановка (х/р ...» Xin) получается через п—1 шагов. Примеры, б) Пусть (хй . .ш, хс) = (—1, 2, —1, 1, 1, —2). На первом шаге не происходит никаких изменений, но на втором шаге приходим к (1, —1, 2, —1, 1, —2). Поскольку s4 —1, третий шаг приводит к (1, 1, —1, 2, —1, —2), а четвертый щаг не вносит изменений, поскольку s3 = 0. Так как s2=l, по- следний шаг приводит к перестановке (1, 1, 2, —1, —1, —2). Единственная максимальная частная сумма появляется на третьем месте, и в первоначальной перестановке в точности три частные Суммы положительны. в) Предположим, что Ху^О при всех /. Начальная и послед- няя перестановки х, одинаковы. Ни одна частная сумма не яв- ляется положительной, и сумма s0 = О представляет собой макси- мум (который повторяется, если xf = 0). Предпочтительнее заменить рекуррентное построение непо- средственным описанием конечного результата, что мы сделаем в следующей лемме. Мы даем здесь новое доказательство, не опирающееся на предыдущую лемму и представляющее самосто- ятельный интерес (см. также задачу 24). Лемма 3. Пусть (хх, ..., хп)—перестановка действительных чисел, такая, что частные суммы sV1, ..., sVr положительны, а все другие отрицательны или равны нулю-, здесь > v2 >... > > vr > 0. Запишем xV1, ..., xVj>, а за ними оставшиеся х}- в их первоначальном порядке. (Если все частные суммы ^0, то г = 0 и порядок остается неизменным.) Первый из максимумов частных сумм в новой перестановке появляется на r-м месте, а опреде- ленное таким образом преобразование является взаимно одно- значным. Доказательство. Обозначим новую перестановку через (gf, ..., gn), а частные суммы элементов через о0, ..., оп. Каж- дому индексу j п соответствует единственный индекс k, такой, что £. = xk. В частности, %г совпадают с xV1, ..., xVr, взятыми в указанном порядке. Сначала рассмотрим такое /, что sk ^0. Из построения ясно, что и элементы £y_ft+i, .£у представляют собой резуль- тат перестановки хг, ..., xk. Таким образом, оу ==o,y_^ + sfe и, значит, Оу не может быть первой максимальной частной суммой. Если г = 0, то отсюда следует, что первый максимум среди Оу появляется при /=0. Когда г>0, первый максимум появляется на одном из мест 0, 1, ..., г, и мы покажем, что возможно только место г. Действительно, если / г, то из построения еле-
§ 9. Различные дополнения 477 дует, что элементов-совпадают с некоторой перестановкой элементов (хъ ..., xVj). Таким образом, a/-1+v^= — Gj-i + $v. > °7-i, и, следовательно, максимум не может по- явиться на месте с номером j — I. Для завершения доказательства леммы нам остается показать, что полученное преобразование взаимно однозначно. На самом деле обратное для преобразование может быть по- строено по следующему рекуррентному правилу. Если все оу^О, оставьте перестановку без изменений. В противном случае пусть k—наибольший индекс, такой, что > 0. Замените (gf, ..., gn) на (g2, ..., gA+f, .g„) и примените ту же процедуру К q2, ► Замечание о симметрично зависимых величинах. Уместно заметить, что доказательство не предполагает независимости величин Ху. Нужно лишь, чтобы все и! перестановок (Xz , ,,,, Xf ) были одинаково распределены. Другими словами, теорема 2 остается справедливой для каждой системы п симметрично зависимых случайных величин (см. гл. VII, 4). Конечно, общее распределение К» и П„ будет зависеть от совместного распределения Ху. Интересен следую- щий пример. Пусть Xf, Х2, ... независимы и имеют одно и то же рас- пределение F. Положим Y^ = Xfc—Sn/n, k—\, .па Величины Yj, Yn симметрично зависимы, и их частные суммы равны ъ = k=i, ,„,n-l. (8,20) На графике (So, Si, ..., Sn) величина Sft равна вертикальному отклонению вершины Sk от хорды, соединяющей начало координат и концевую точку (n, Sn). Допустим теперь, что распределение F непрерывно (с тем, чтобы избежать необходимости различать первый и последний максимумы). С вероятностью единица последовательность 0, Si, ..., 2n-i имеет единственный максимум. Циклической перестановке (Y2, Yn, YJ соответствуют частные суммы 0,< S2—Si, Sn-i—— 2 , и ясно, что положение максимума смещается при этом на одно место вперед в циклическом порядке (если первоначальный максимум был на нулевом месте, то S^, < 0 при k—\, ..., п—1, а новый максимум будет на (п — 1)-м месте). В п циклических перестановках макси* мум будет появляться ровно один раз па каждом месте, и его положение равномерно распределено на множестве {0, 1, . ..,п—1}. Мы получаем таким образом следующую теорему, принадлежащую Спарре-Апдерсену и связанную с теоремой 3 из 1; гл III, 9, касающейся бросаний монеты. Теорема 3. В любом случайном блуждании, порождаемом непрерывным распределением F, и при любом п число вершин среди S1} ..., S^-i, которые лежат выше хорды, соединяющей (0, 0) и (п, Sn), равномерно распределено на множестве 0, 1, ..., п— 1. (Это же верно и для номера максимально удаленной от хорды вершины.) § 9. РАЗЛИЧНЫЕ ДОПОЛНЕНИЯ а) Совместные распределения Для того чтобы получить совместное распределение лестнич- ных величин, достаточно только изменить обозначения в рассуж- дениях, приводящих к теореме 1 из § 7. Приспосабливая обо-
478 Гл. XII. Случайные блуждания в др значения § 1, обозначим через I интервал в 0, оо и через 77^(7) вероятность того, что п совпадает с r-м лестничным моментом и S„gL Положим s} = S snHn{I}, 0<s<l. (9.1) Л=1 Цо индукции можно установить, что при фиксированном s НГ* {7, s} = S snH? {7}. (9.2) П = 1 Из рассуждений, приведших к установлению (7.3), легко полу- чаем следующий результат Г. Бакстера, который сводится к (7.3) при 7 = 0, оо. Теорема, При 7 с: 0, оо и O^s^l ОО 00 = (9.3) Г=1 П = 1 Более простая и доступная для изучения форма будет выведена в гл. XVIII, 3. б) Интерпретация производящих функций с помощью «исчезно- вения» х) Указываемая здесь интерпретация может помочь интуиции и упростить формальные вычисления. Рассмотрим при фиксирован- ном s, 0 < s < 1, несобственное случайное блуждание, которое может оборваться на каждом шаге с вероятностью 1—s, а в про- тивном случае определяется распределением sF. Тогда snFn* {/) равно вероятности попасть в 7 в момент п. Дефект 1—s" равен вероятности «исчезновения» процесса до момента п. Здесь прохо- дят все прежние рассуждения с той разницей, что все распреде- ления становятся несобственными. В частности, (9.1) представ- ляет собой распределение первой лестничной высоты в нашем слу- чайном блуждании с исчезновением. Функция (9.2) аналогична Нг* (см. § 2, 3). Производящая функция t(s) равна вероятности по- явления лестничного индекса. в) Рекуррентное событие ф<0, S„_j<0, S„ = 0} (9.4) означает возвращение в нуль без предварительного захода на правую полуось. Оно появлялось в § 1 в определении слабых х) В оригинале «mortality»—смертность,— Прим, перев,
_________________________________ § 10. Задача 479 лестничных величин. Обозначим соп вероятность первого наступ- ления события (9.4) в момент п: ®„ = P(Si<0, .... S„_, < О, S„ = 0}. (9.5) Если со (s) = S®rsr, то к>г будет производящей функцией для г-го наступления нашего события, а 1/[1—со (s)] будет производящей функцией для вероятностей (9.4). Упрощенный вариант доказа- тельства (7.3) приводит к основному тождеству (9.6) 4 ' п-1 Сравнивая его с (7.3), (7.16), (7.22) и т. д., мы видим, как легко можно перейти от слабых лестничных величин к строгим и обратно. Формула (9.6) подтверждает замечание § 1, что вероятности (9.4) не меняются, если все неравенства заменить противоположными. г) Обобщение на произвольные интервалы Теория § 3 с тривиальными изменениями в обозначениях при- менима в ситуации, когда полупрямая 0, оо заменяется произ- вольным интервалом Л, а полупрямая —оо, 0—дополнением Л' к Л. Сохраняется, в частности, без изменений интегральное уравнение Винера—Хопфа. Читателю предлагается проследить за деталями; полностью это сделано в гл. XVIII, 1 (см. также задачу 15). § 10. ЗАДАЧИ 1. Рассмотрим биномиальное случайное блуждание (пример 2,6). Пусть — математическое ожидание числа номеров 0, таких, что Sn~k, Si^O,... (это событие означает попадание в k без предварительного за- хода на отрицательную полуось). Обозначим через f вероятность достижения значения —1, т. е. *=1, если q^p и f = q/p в противном случае. Взяв за повое начало координат точку (1, 1), докажем, что е0= 1 и = ==Pfe-i + fe) при Приходим к выводу, что при ek = р"1, если р^ q, ek~(p/q)k q"1, если p^q. 2. Продолжение. Пусть ak при k^A— математическое ожидание числа индексов 1, таких, что S„ = &, Sj > 0, > 0 (это событие озна- чает попадание в k, предшествующее первому возвращению в начало коор- динат). Показать, что —и, следовательно, ^=1, если p^q, ak—(plq')}\ если p^q. Это дает прямое доказательство парадоксального результата примера 2, б). Примечание. Нижеследующие задачи 3—6 могут служить введением к настоящей главе и могут быть решены до ее изучения. Они содержат также примеры явных решений основных интегральных уравнений. Сверх того, они показывают силу и красоту метода производящих функций (попробуйте решить уравнение (1) непосредственно!^
480 Гл. XIГ Случайные блуждания в 51х 3. Случайные величины Х^, порождающие случайное блуждание, имеют одно и то же арифметическое распределение, приписывающее вероятности /1, /2, ,целым числам 1, 2, ... и вероятность q числу —1 + Я-/2+• • • = 0* Обозначим через (г = 1, 2, ...) вероятность того, что первый положительный член последовательности Sf, S2, ... имеет величину г (иными словами {Хг} есть распределение первой лестничной высоты), Пока- жите, что (а) Числа удовлетворяют рекуррентным соотношениям ^Г — fr~\-Q + i + (0 (б) Производящие функции связаны равенством и»-'- lx""-.1 о<!<1- <2> (в) Если Е (Х^) = р, = /'(1)— q > 0, то существует единственный корень 0 < о < 1 уравнения f(S)+|=l. (3) Из того что Л—монотонная функция и X < 1 на 0, 1, выводится, что (4) 4 7 q s—О v 7 Это эквивалентно + , (5) Q (г) Если Е (Xft) < 0, то соответствующее решение получаем, полагая в (2) ^ = (1 — q)/q9 При этом (4) и (5) выполняются с 0=1. 4. Решите предыдущую задачу (изменив ее там$ где нужно) для слабых лестничных высот. Другими словами, рассмотрите вместо вероятность того, что первый из неотрицательных членов последовательности Sb S2, ... принимает значение г (г = 0, 1$ ...), Покажите, что (1) и (4) следует заме- нить на = Tr+i 0а) 1 — у0 И Y(s) = l—(4а) 5. Пусть в случайном блуждании задачи 3 х обозначает вероятность того, что S„ < О при некотором п. Покажите (независимо от задачи 3), что х удовлетворяет уравнению (3) и что, следовательно, х = о. 6. Продолжение. Покажите, что вероятность выполнения при каком-ни- будь /г > 0 неравенства равна q-\-f (о) = 1 — q (о”1— 1). Проверьте,^ что V (1) = ро [q (1 — а)]”1. Это—частный случай (2.8) (или тождество Вальда), 7. Выведите (1.13) из (1.12) непосредственным вычислением. 8. Вероятности достижения. Пусть /^0 и £ > 0. Обозначим G (/, 5) вероятность того, что первая сумма S„, превосходящая /, не будет превышать Докажите, что G удовлетворяет интегральному уравнению Q (t, g) = F (t + g)—F (0 + J G (t—y, g) F {dy}, — 00 В случае неединственности G является минимальным решением. Распределение Я лестничной высоты однозначно определяется формулой //(£) = £ (О, g).
§ 10. Задачи 481 9. Пусть Н—непрерывное распределение, сосредоточенное на 0, оо, а Я"— (возможно, несобственное) непрерывное распределение, сосредоточен- ное на —оо, 0. Предположим, что Я + Я~ — = F (6) есть распределение вероятностей» Из теоремы единственности § 3 следует, что Я и Я" являются распределениями точек первого попадания SK и в случайном блуждании, порожденном F. Таким способом возможно найти распределения F^ допускающие явное представление в виде (6). Это имеет место в том случае, когда 0 < q «С 1 и Ни Н~ имеют плотности, опреде- ляемые либо формулой (а) Ье~Ьх при х > 0, q при — 1 < х < 0Л либо формулой (б) при 0 < х < 6, q при — 1 < х < 0# В случае (а) распределение F имеет плотность, равную (b—q) e~bx-]-qe-b <x + d ПрИ х > 0 и qe~b + м при — 1 < х < 0, В случае (б), если b > 1, плотность F равна qb"1 (1+*) при — 1 < х < О, qb"1 при 0 < х < b — 1 и qb~* (&—х) при b — 1 < х < Ь. В любом из этих двух случаев F имеет нулевое математическое ожидание тогда и только тогда, когда q—1, 10. Покажите, исходя из (3.11), что если распределения Н и Я” собст- венные и имеют дисперсии, то Е (Хх) = 0 и Е (Х?) =— 2Е (<%\) Е (^Г). 11. Аналитическое доказательство тождества Вальда (2.8). Выведите из (3.11), что 0 + 1-F(x) = [l-р (0)] [I-Н (x)J+ J р{^}[Я(х-у)-//(х)], — 0Q X F(x)= J р(^}[1-Я(х-у)] — 00 при х > 0 и х < 0 соответственно, Установите, что F имеет положительное математическое ожидание р тогда и только тогда, когда Я имеет конечное математическое ожидание v и р (0) < 1. Выведите интегрированием на—оо, оо, что р=[1—p(0)]v (что эквивалентно 2.8)). 12. К примеру 4, в). Если р > О, то знаменатель имеет положительный корень s0 < 1, ровно b — 1 комплексных корней в круге |s| < s0 и а—1 комп- лексных корней в области | s | > L Случай р < 0 можно описать заменой s на 1/s; 13. Производящая функция для верхней лестничной высоты в примере 4,в) равна \ С?! J \ J Для нижних лестничных высот результат получается заменой s/o^ на o^/s. 14. К примеру 4, в). Допустим, что Ху принимают значения —2, —1, О, 1, 2, g вероятностью 1/5 каждое. Покажите, что верхняя лестничная высота имеет распределение? для которого а- = 1±£! а _ 2 1 з+К5’ 2 3+/5’ Для слабых высот ^о = ро (7—'/'5), (1 + Х2 = х/б^ 16 Wo 249
482 Гл. XII. Случайные блуждания в 15. Обозначим в примере 4,в) через вероятность того, что первые I-----1 п шагов не выводят из интервала —В, А, а п-й шаг приводит в состояние k (таким образом, г|4п) = 0 при k > А и k <—В; как обычно, ф/J0 равно 1 при k = 0 и равно 0 в других случаях). Пусть ф^.= — математическое ожи- I-----1 дание числа попаданий в k до первого выхода из —В, А. Покажите, что А v=-B и что при k > А и k <—В величина А Рк= 5 ^vfk-v у=-в I-----1 равна вероятности того, что первый выход из интервала —В, А приводит в точку k. |Эта задача важна для последовательного анализа. Она иллюстри- рует ситуацЖо, описанную в 9, г).] 16. Из теоремы 2 § 7 вытекает, что при р, < О 5 n-ip {S„ > 0} < оо. Проведите следующее прямое доказательство. Достаточно показать (вспомните неравенство Чебышева), что п У < °°> у у< °9* I У I > П -п Первое утверждение очевидно. Для доказательства второго разобьем интеграл в сумму интегралов по областям k —1 < |#|<;&, п—1, Меняя порядок суммирования, видим, что весь ряд < 2Е (| X |). 17. Покажите, что при бросании симметричной монеты у — Р {S„=0} = log-------|=. п х 1+1^ 1—Sa Указание, представьте левую часть как интеграл от 0 до s от функции [(1—ха)-1/2 — 18. Предположим, что случайное блуждание невозвратно, т. е, что оо 17 {^J = S {О < 00 для любого К0НеЧ1ЮГ0 интервала, Положим в обозна- о со чениях §ЗФ = 2рП** Докажите справедливость уравнения восстановления 0 и=Ф+и*н9 Если ^-—аналог ф для отрицательной полуоси, то ф" = (1— £) Ф, как и в (1.13). 19. Выведите,- что и покажите^ что это эквивалентно разложению Винера — Хопфа (3.12)* 20. Выведите тождество Вальда Е ($fi) = E i) Е (Хх) непосредственно из уравнения восстановления задачи 18, 21. К теореме 4 ив §7, Вероятности p^ = P{Sx^O, Sn0} и д* = Р< 0, <М8 Sn < 0} имеют производящие функции, удовлетворяющие
§ 10. Задачи 483 соотношениям оо со logp* (s) =£ у Р {Sn 0} и log д:=52 7Г Р {S« < 0}. /2=1 /2=1 22. О последнем максимуме. Вместо случайной величины Кп из § 8 рас- смотрим номер K/г последнего максимума среди частных сумм So> . Используя обозначения предыдущей задачи, докажите, что P{Kn = ft} = PWn-fe- 23. Альтернативная форма теоремы 2 из § 8. Число ПЛ неотрицательных членов последовательности So, ...5 S„ имеет такое же распределение, как и случайная величина Кп из предыдущей задачи. Доказать это, применив тео- рему 2 к (—Хп—...? —Xi). 24. Комбинаторная лемма 2 из § 8 остается верной, если первый макси- мум среди So, .S„ заменить на последний максимум, а число положитель- ных частных сумм—на число неотрицательных членов в последовательности Si, S„ (за исключением So = O). Доказательство остается тем же самым? ва исключением очевидной замены знаков неравенстве Точно таким же обра- зом на рассмотренный случай переносится лемма 3>
ГЛАВА XIII ПРЕОБРАЗОВАНИЕ ЛАПЛАСА. ТАУБЕРОВЫ ТЕОРЕМЫ. РЕЗОЛЬВЕНТЫ Преобразование Лапласа служит мощным практическим ору- жием. В то же самое время соответствующая теория интересна и сама по себе, и по связи ее с другими разделами, например с теорией полугрупп. Теорема о вполне монотонных функциях и основная тауберова теорема с полным правом рассматривались как жемчужины математического анализа. (Хотя приводимые дока- зательства просты и элементарны, первоначальные исследования в этом направлении требовали оригинальности и силы.) Резоль- венты (§9, 10) являются основой теории полугрупп. Материал этой главы предназначен для использования в раз- личных целях. Поэтому были приложены значительные усилия, во-первых, чтобы сделать части настолько независимыми друг от друга, насколько это позволяет тема, и, во-вторых, чтобы дать читателю возможность опускать детали. Для дополнительного чтения может служить гл. XIV. Там же можно найти примеры. Остальная часть книги совершенно не зависит от настоящей главы. Несмотря на то что нам часто будут встречаться правильно меняющиеся функции, мы будем пользоваться только совсем эле- ментарной теоремой 1 из гл. VIII, 8. § 1. ОПРЕДЕЛЕНИЯ. ТЕОРЕМА НЕПРЕРЫВНОСТИ Определение 1. Пусть F — собственное или несобственное рас- пределение вероятностей, сосредоточенное на 0, оо. Преобразова- нием Лапласа распределения F называют функцию ср, опреде- ленную для равенством q>(%)=$e-^F{dx}. (1.1) о Здесь и далее подразумевается, что интервал интегрирова- ния замкнут. Когда мы говорим о преобразсвании Лапласа рас- пределения F, мы неявно предполагаем, что F сосредоточено на
§ 1. Определения. Теорема непрерывности 485 ।---- О, од. Как обычно, мы расширяем смысл терминов и говорим о «преобразовании Лапласа случайной величины X», понимая под этим преобразование Лапласа соответствующего распределения. Применяя привычное обозначение для математического ожидания, имеем ' <р(Л) = Е(е-Ьх). (1.2) Пример, а) Пусть X принимает значения 0, 1, ... с вероят- ностями р0, ... . Тогда ф(М~ Так как произво- дящая функция равна P(s) = 2/’»s“> то ф(^) = -Р(е~х). и преоб- разование Лапласа отличается от производящей функции только заменой переменных s — e~K. Этим объясняется большое сходство свойств преобразований Лапласа и производящих функций. б) Гамма-распределение с плотностью fa(x) = (xa~1/r (а))е~х имеет преобразование Лапласа 00 j,e"<%+1)>^~ldx=(7TlF’ а>0‘ Следующая теорема показывает, что распределение восстанав- ливается по соответствующему преобразованию: без этого польза преобразований Лапласа была бы ограниченной. Теорема 1. (Единственность.) Различным распределениям ве- роятностей соответствуют различные преобразования Лапласа. Первое доказательство. В (6.4) гл. VIII дана в явном виде формула обращения, которая позволяет вычислять F по ее изве- стному преобразованию Лапласа. Эта формула будет выведена заново в § 4. Второе доказательство. Положим у = е~х. При изменении х от 0 до оо у меняется от 1 до 0. Полагая G (г/) = 1—F (х) в точ- ках непрерывности, получим распределение G, сосредоточенное ——। на 0, 1. Тогда 00 I <p(X) = Je-^F{dx} = $ y%G{dy}-, (1.4) оо это—очевидное следствие того, что римановы суммы 2 (xft+I)—F(xft)] совпадают с римановыми суммами ^Ук[в(Ук) — в(Ук+1У] ПРИ Ук~е~Хк- Мы знаем из гл- VI1» 3» что распределение G однозначно определяется своими моментами. Эти моменты равны ф(&). Поэтому значения <р(1), <р(2), ... опре-
486 Гл. XIIJ. Преобразование Лапласа. Тауберовы теоремы. Резольвент^ деляют G, а вместе с тем и F. Этот результат сильнее, чем утверждение теоремы1). Следующий ниже важный результат просто выводится из теоремы 1. Теорема 2. (Теорема непрерывности.) Пусть Fn, п = 1, 2, .. .,— распределение вероятностей с преобразованием <р„. Если Fn—где F—(возможно, несобственное) распределение с преобразованием ср, то срп(А) —>ф(А) при А>0. Обратно, если последовательность {ф„(А)} сходится при каж- дом А > 0 к пределу ф (А), то ср — преобразование (возможно, несоб- ственного) распределения F и Fn—+F. Предел F будет собственным в том и только том случае, когда ср (А) —> 1 при А—>0. Доказательство. Первая часть содержится в основной теореме о сходимости гл. VIII, 1. Для доказательства второй части при- влечем теорему о выборе (теорема 1 из гл. VIII, 6). Пусть {Fnft}—последовательность, сходящаяся к (возможно, несобствен- ному) распределению F. В силу первой части теоремы соответст- вующие преобразования сходятся к преобразованию Лапласа для F. Отсюда следует, что F является тем единственным распределе- нием, которое имеет преобразование Лапласа ср. Поэтому все сходящиеся подпоследовательности сходятся к одному и тому же пределу F. Отсюда вытекает, что Fn сходится к F. Последнее утверждение ясно из (1.1). Для ясности изложения мы сохраним всюду, где это возможно, букву F для обозначения распределения вероятностей. Вместо (1.1) мы могли бы взять более общий интеграл вида со a>(X)=$e-^(/{dx}, (1.5) о где мера U приписывает конечную массу U {/} конечному интер- валу I, но может приписывать бесконечную массу положитель- ной полуоси. Как обычно,, нам удобно описывать эту меру в тер- минах несобственной функции распределения, заданной равенством I-------------1 U {x) = U {Q, х}. В наиболее важном частном случае, когда U определяется как интеграл от функции и^О, интеграл (1.5) сво- дится к интегралу 00 co (А) = J е~Кхи (х) dx. (1.6) о 1) Более общим [образом, вполне монотонная функция однозначно опре- деляется своими значениями; вычисленными по последовательности точек таких? что ряд ^ай1 расходится. Однако если ряд сходится, то существуют две различные вполне монотонные функции, значения которых совпадают во всех точках ап. Элементарное доказательство соответствующей теоремы см. у Феллера: On Muntz* theorem and completely monotone functions, Amer, Math. Monthly, vol. 75 (1968), 342-350^
§ 1. Определения. Теорема непрерывности 487 Примеры, в) Если и(х) = ха с а> —1, то а>(X) — Г(a-J- 1)/A,a+J Для всех К > 0. г) Если и(х) = еах, то <в(%) = 1/(1—а) для 1>а>0. Интеграл (1.6) расходится для д) Если и{х) = е^, то интеграл (1.6) расходится всюду. е) Дифференцируя в (1.1), получаем 00 —ф'(%) = (1.7) о цто представляет собой интеграл вида (1.5) с I/ {dx} — xF {dx}. Этот пример демонстрирует, как интегралы вида (1.5) возникают естественным образом в связи с собственными распределениями вероятностей. Мы будем интересоваться главным образом мерами (7, полу- ченными простыми преобразованиями из распределений вероят- ностей, и интеграл в (1.5) будет, как правило, сходящимся при всех % > 0. Однако, исключая меры, для которых сходимость имеет место только при некотором 1, мы не получаем никакого Выигрыша. Далее из а (а) < оо вытекает ® (%) < оо для всех Л > а, так что значения 1, для которых интеграл (1.5) сходится, запол- няют промежуток а, оо. Определение 2. Пусть U—мера, сосредоточенная на 0, оо. Если интеграл (1.5) сходится при 1>а, то определенная при к > а функция а называется преобразованием Лапласа меры U. Если U имеет плотность и, то преобразование Лапласа (1.6) меры U называется также обычным преобразованием Лапласа функции и. Последнее соглашение принимается единственно ради удобства. Чтобы быть систематичным, следовало бы рассмотреть интеграл более общего типа ^e~Kxv(x)U{dx} (1.8) О и называть его «преобразованием Лапласа функции v по отношению к мере U»* Тогда преобразование (1.6) получило бы название: «преобразование и по отношению к мере Лебега» (или обычной длине). Этот подход мог бы иметь теоретическое преимущество, если бы позволял рассматривать знакоперемен- ные функции и и v. Однако для целей настоящей книги самый простой и самый ясный способ действий состоит в том, чтобы связывать понятие преоб- разования Лапласа только g мерами. Это мы и будем делать х). 9 Терминология еще не вполне сложилась, и в литературе термин «пре- образование Лапласа для F» может обозначать как (1.1), так и (2.6). Мы бы назвали (2.6) «обычным преобразованием Лапласа функции распределения F»i но в учебникахj которые, как правило, рассматривают только такие преобра- зования, прилагательное «обычный» бывает опущено. В подобных случаях во избежание путаницы преобразование (1,1) называют преобразованием Лап» ласа Стильтьеса.
488 Гл. XIII. Преобразование Лапласа. Тауберовы теоремы. Резольвенты И Если U такая мера, что интеграл (1.5) сходится при к —а, то функция 00 00 со (Х-Н) = J е-^е~ахи {dx} = J e-*xU* {dx} (1.9) о о определена при всех 0 и представляет собой преобразование Лапласа ограниченной меры U* {dx} = e~axU {dx}, а со (Xcz)/co (а) является преобразованием Лапласа некоторого распределения вероятностей. Поэтому каждая теорема, касающаяся преобразо- ваний распределений вероятностей, автоматически распростра- няется на более широкий класс мер. Поскольку со(Х-[-а) полу- чается «сдвигом» графика со, мы будем называть указанный по- лезный метод принципом сдвига. Заметим, что U однозначно определяется по U*, a U*—по со(Х-[-а) при Х>0. Поэтому мы можем обобщить теорему 1 следующим образом. Теорема 1а. Мера U однозначно определяется значениями соот- ветствующего преобразования Лапласа (1.5) на некотором интер- вале а < X < оо. Следствие. Непрерывная функция и однозначно определяется значениями своего обычного преобразования Лапласа (1.6) в неко- тором интервале а < X < оо. Доказательство. Преобразование однозначно определяет меру U как интеграл от и, а две различные непрерывные1) функции не могут приводить к одинаковым интегралам. [Явная формула для и в терминах со приводится в (6.6) гл. VII.] Теорема непрерывности обобщается аналогичным образом на последовательности произвольных мер Un, обладающих преобра- зованием Лапласа. Из того, что Vn имеет преобразование Лап- ласа, следует, что Un {1} < оо для конечных интервалов I. Мы напомним из гл. VIII, 1, и VIII, 6, что последовательность таких мер называют сходящейся к мере U тогда и только тогда, когда Un{I}^U {/} < оо на каждом конечном интервале непре- рывности U. Теорема 2а. (Обобщенная теорема непрерывности.) Пусть Un (п==1, 2, ...)—меры с преобразованиями Лапласа а„. Если <о„ W ~® (X) пРи а, то а является преобразованием Лапласа некоторой меры U и Un—+U. Обратно, если U„—tU и последовательность {©„(а)} ограни- чена, то сои (X) —► со (X) при К> а. Доказательство, (а) Допустим, что Un—*U и что со„(а)< Л. !) То же самое рассуждение показывает, что вообще и определяется с точностью до значений на произвольном множестве меры нуль.
§ 2» Элементарные свойства 489 Если t > О—точка непрерывности U, то t t J e-(k+a)x{J {Jx|—►J g-tt>+a)xU {dx}. (1.10) о о Левая часть отличается от со„(Х4*^) самое большее на p-»+a)>t/„{dx} < Ае-М; (1.11) t ее можно сделать меньше 8, если выбрать t достаточно большим. Это означает, что верхний и нижний пределы <»„(% + а) отли- чаются менее чем на произвольное 8, и, следовательно, при каж- дом Z>0 последовательность {®й(Х4-а)| сходится к конечному пределу. (б) Предположим теперь, что (%) —* <в (%) при А.>а. При фиксированном > а функция <»„ (Х4-Х0)/а>„ (Ло) есть преобразо- вание Лапласа распределения вероятностей i/*{dx} = (l/®„(A0))X Xе~^ип {dx}. Поэтому по теореме непрерывности (7* сходится к (возможно, несобственному) распределению U#, а отсюда сле- дует, что Un сходится к мере U, такой, что [U {dx} = a>(X0)x xe^xU# {dx}. > Следующий пример показывает необходимость условия огра- ниченности {®„(а)|. Пример, е) Пусть Uп приписывает массу еп‘ точке п и нуль — дополнению этой точки. Так как п} = 0, мы имеем Un—>0. Однако (X) = —> сю при всех к > 0. ► Иногда говорят о двустороннем преобразовании Лапласа для распределе- ния F, не сосредоточенного на положительной полупрямой, а именно + во Ф(Х)= J e~2-xF {dx}, (1,12) — СР Однако этот интеграл не обязан существовать при % 0. Если он суще- ствует для X =£ 0, то <р (— к) называют обычно производящей функцией мо* ментов, хотя на самом деле она служит производящей функцией для после- довательности {|xn/n!}i где рп—п-й момент4 § 2. ЭЛЕМЕНТАРНЫЕ СВОЙСТВА В этом параграфе мы перечислим наиболее часто используемые свойства преобразований Лапласа. Аналогии с производящими функциями очевидны. (i) Свертки. Пусть F и G—распределения вероятностей и U—их свертка, т. е. X U(x)=[G(x-y)F{dy}. (2.1) о
490 Гл. XIII. Преобразование Лапласа. Тауберовы теоремы. Резольвенты - Соответствующие преобразования Лапласа подчиняются правилу умножения © = <ру. (2.2) Последнее равносильно утверждению, что для независимых случайных величин E(e_X(X+Y>) = E(e-wt)E(e~XY), что есть част- ный случай правила умножения математических ожиданий1). Если F и G имеют плотности f и g, то U имеет плотность u(x)=^g(x—y)f(y)dy (2.3) о и правило умножения (2.2) справедливо и для «обычных» преоб- разований Лапласа (1.6) для плотностей /, g и и. Покажем, что правило умножения можно обобщить следую- щим образом. Пусть F и G—произвольные меры с преобразова- ниями Лапласа <р и у, определенными при %> 0. Тогда свертка U имеет преобразование Лапласа со, заданное формулой (2.2). Отсюда, в частности, следует, что правило умножения применимо к «обыч- ным» преобразованиям Лапласа любых двух интегрируемых функ- ций f и g и их свертке (2.3). Для доказательства сформулированного утверждения введем конечные меры F„, полученные урезанием Fi при х^п положим F„ (х) — F (х) и Fn (х) <= F (п) при х > п. Определим G„ анало- гичным урезанием G. При х<п свертка f/„ = F„*Gn не будет отличаться от U, и, следовательно, не только Fn—>-F и Gn—► G, но и Un—»£/. Для соответствующих преобразований Лапласа имеет место равенство ®п = ф„уи, откуда, полагая п—>-оо, мы получаем утверждение со = фу. Примеры, а) Гамма-распределения. В примере 1,6) правило свертки fa*fp=fa+₽ отражается в очевидном соотношении ФаФр = Фа+₽- б) Степени. Обычное преобразование Лапласа для иа (х) — s= ха-1/Г (а) равно соа (%) = %““. Отсюда следует, что свертка (2.3) функций иа и «р равна ua+p. Результат примера а) можно вывести отсюда с помощью принципа сдвига, так как Фа(Х) = соа(Х-|-1). в) Если а > 0, то е~а}со (%) есть преобразование Лапласа для меры с функцией распределения U (х—а). Это очевидным образом следует из определения, но может рассматриваться и как частный случай теоремы о свертке, так как е~аК является преобразованием распределения, сосредоточенного в точке а. ► (ii) Производные и моменты. Если F—распределение вероят- Обратное неверно: две случайные величины могут быть зависимыми, но распределение их суммы определяется по формуле свертки [см, пример 4, д) гл. II и задачу 1 в гл. III, 9J,
§ !>. Ълемечтарные свойства 491 ностей и ф—его преобразование Лапласа (1.1), то ф обладает производными всех порядков, причем (—1)« ф(«) (X) == $ e~KxxnF {dx} (2.4) о (как всегда, 2i>0). Дифференцирование под знаком интеграла законно, так как формальное дифференцирование приводит к огра- ниченному и непрерывному подынтегральному выражению. Из (2.5) вытекает, в частности, что F имеет конечный п-й момент в том и только том случае, когда существует конечный предел ф"(0). Поэтому для случайной величины X мы можем написать Е(Х) = —ф'(0), Е(Х8) = ф’(0) (2.5) с очевидным соглашением о смысле этих равенств в случае рас- ходимости. Правило дифференцирования (2.4) верно и для про- извольных мер F. (iii) Интегрирование по частям приводит от (1.1) к J e-^F(x) dx == , & > 0. (2.6) о Если F—распределение вероятностей, то (2.6) иногда предпочти- тельнее записывать в форме, содержащей «хвост» распределения, J е-^[1—F(x)]dx=^ (Х)-. (2.7) о Это соответствует формуле (1.6) из 1; гл. XI, для производящих функций. (iv) Изменение масштаба. Из (1.2) выводим, что при любом фиксированном а>0 Е(е~а?1Х) = ф(аА), т. е. <р(аА.) является преоб- разованием для распределения F {dx/a} [с функцией распределения F(x/a)]. Это соотношение часто используется. Пример, г) Закон больших чисел. Пусть Xf, Х2, , -.. —незави- симые случайные величины с одним и тем же преобразованием Лапласа ф. Положим Е(Ху) = р. Преобразование Лапласа для суммы Xf 4-... 4- Х„ равно <ри. Поэтому преобразование для сред- него арифметического [Xt4- • • • +Хи]/п равно <рп(Х/п). Вблизи нуля <р(Х)=1—рХ4*о(^) [см. (2.5)], так что при п—> оо lira Ф”^^ lim = (2.8) Но е-1<л есть преобразование Лапласа для распределения, сосредото- ченного в точке р, следовательно, распределение [Х^ 4- • • • + Хи]/п сходится к этому пределу. Мы получили (слабый) закон больших
492 Гл. XIII. Преобразование Лапласа. Тауберовы теоремы. Резольвенты чисел в форме Хинчина, не требующей существования дисперсии. Доказательство, правда, применимо только к неотрицательным случайным величинам, но оно иллюстрирует изящество метода, основанного на преобразованиях Лапласа. § 3. ПРИМЕРЫ а) Равномерное распределение. Пусть F обозначает равномерное распределение на 0, 1. Его преобразование Лапласа равно ф(Х) = ₽= (1 —е~х)/Х. Используя формулу бинома, можно показать, что n-кратная свертка Fn* имеет преобразование п фЦХ)^£ (-!)*( (3.1) k=o ' ' Функция служит преобразованием для U (х) = xn/nl. При- мер 2,в) показывает, что функция е~кКк~п соответствует (х—k)n+/ri)\, где х+ обозначает функцию, равную 0 для л'<0 и л для х^О. Таким образом, п / Fn4x)^X(-^k(k)(x-k^ k =0 4 ' (3.2) Эта формула была получена прямым вычислением в гл. I, (9.5), и предельным переходом в задаче 20 из 1; гл. XI. б) Устойчивое распределение с показателем 1/2. Функция рас- пределения G(x) = 2[l—ЭТ(1//х)], х>0, (3.3) (где 9?—стандартное нормальное распределение) имеет преобра- зование Лапласа ?(Х) = е-г^. (3.4) Этот результат можно получить, проделав элементарные вычисле- ния, но это неинтересно, и мы> предпочитаем вывести (3.4) из предельной теоремы 3 из Г, гл. III, 7, где с распределением G мы впервые встретились. Рассмотрим простое симметричное слу- чайное блуждание (бросание монеты) и обозначим через Т момент первого возвращения в нуль. Цитированная теорема утверждает, что G является предельным распределением для нормированной суммы (Ti-1-...+TJ/n2, где Тъ Т2, ... —независимые случайные величины, распределенные, как Т. В соответствии с 1; гл. XI, (3.14), производящая функция для Т равна — l—К1—s2, и поэтому V (X) - lim [1 — /1—e-awp - Em 1 _ ₽ e~ v^. (3.5)
§ 3. Примеры 493 Мы несколько раз отмечали, что распределение G является устойчивым, но опять-таки прямая проверка требует трудоемких вычислений. В то же время очевидно, что у"(А.) = у(п2Х), т. е. Gn* (х) — G (п~2х), чем без всякого труда доказывается устой- чивость G. в) Степенные ряды и смеси. Пусть F—распределение вероят- ностей с преобразованием Лапласа ф(^). Мы постоянно сталки- вались с распределениями вида (3.6) k=Q где —распределение вероятностей. Если Р (s) = ^pk^—про- изводящая функция для то преобразование Лапласа для G равно, очевидно, S WP*(M = ^(<₽W)- (3.7) л=о Это соотношение распространяется на все степенные ряды с по- ложительными коэффициентами. Перейдем к примерам. г) Бесселевы плотности. Мы видели в примере 7, с) гл. II, что при г =1,2, ... плотность oz(x) = e-*yZr(x) (3.8) соответствует распределению вида (3:6), где F имеет показатель- ное распределение с <р (Х) = 1/(%Ч- 1) и {рк}—распределение мо- мента первого перехода через точку г > 0 в обычном симметричном случайном блуждании. Производящая функция последнего рас- пределения равна Р(8)=(.1-К.1-£у (з.9) [см. 1; гл. XI, (3.6)]. Подставляя сюда s = (l+A.)-1, мы видим, что обычное преобразование Лапласа для плотности вероятности (3.8) равно [% +1 —/(ХЧ-1)2—1]г. (3.10) Утверждение о том, что vr является плотностью вероятности, преобразование которой равно (3.10), доказано нами только для г = 1, 2, ... . Однако оно верно*) для всех г > 0 и в этом смысле представляет вероятностный интерес. В самом деле, отсюда выте- кает формула свертки = и, следовательно, безграничная делимость vr (см. § 7). *) Результат принадлежит Н. Weber. Очень трудное аналитическое дока- зательство заменено теперь элементарным доказательством; см, J. Soc. Industr. Appl. Math., vol. 14 (1966).
494 Гл. XIII. Преобразование Лапласа. ТауберовЫ теоремы. Резольвенты ч. г) Другие бесселевы плотности. Выберем в (3.6) в качестве Р показательное распределение с <р(Х) = 1/(1+%), а в качестве —распределение Пуассона с P(s) — e~t+ts. Легко дать явную формулу для G, но, к счастью, эта задача уже была решена в примере 7, а) гл. II. Мы видели там, что плотность (З.И) определенная в (7.2) гл. II, является сверткой нашего распреде- ления G с гамма-плотностью Л.р+i- Отсюда следует, что обычное преобразование Лапласа для &ур равно произведению у на преоб- разование для Л, р+х, т. е. на (1+ 1)-(р+». Соответственно плот- ность вероятности (3.11) имеет преобразование Лапласа ~ <312) При 2 = 1, используя принцип сдвига (1.9), получаем, что /FZp(2/x) имеет обычное преобразование !к~о~1е1Р. е) Смеси показательных плотностей. Пусть плотность / имеет вид п п f (х) ~ S Pkake Ра > О» S Ра =1» (3.13) «=1 k=l где для определенности мы будем считать, что 0 < , < ап. Соответствующее преобразование Лапласа задается формулой п <314> где Р—полином степени п с корнями —ak, a Q—полином сте- пени п—1. Обратно, для любого полинома Q степени п—1 от- ношение Q(X)/P(%) допускает разложение на элементарные дроби вида (3.14) с = <3'15> [см. (4.5) в 1; XI]. Для того чтобы (3.14) соответствовало смеси (3.13), необходимо и достаточно, чтобы рг>0 и Q(0)/P(0) = l. Из вида графика Р ясно, что Р' (— аг) и Р'(— ar+i) имеют про- тивоположные знаки и, следовательно, то же самое верно для Q(—аГ) и Q(—ar+i). Другими словами, необходимо, чтобы Q имело корень —Ьг между — аг и —аг+1. Но поскольку Q не может иметь более чем п—1 корней —Ьг, то делаем вывод, что эти корни должны удовлетворять неравенствам 0<ai<bi <a2<b2< ... <Ьп_г <ап. (3.16) Это соотношение гарантирует, что все рГ имеют один и тот же
§ 4. Вполне монотонные функции. Формулы обращения 495 знак. Таким образом, мы приходим к следующему заключению. Пусть Р и Q—полиномы степени п и п—1 соответственно,, и пусть Q (0)/Р (0) = 1. Для того чтобы отношение Q (К)/Р (А) было преобразованием Лапласа смеси (3.13) показательных плот- ностей, необходимо и достаточно, чтобы корни —аг полинома Р и корни —Ьг полинома Q были различны и (в правильном порядке) удовлетворяли условию (3.16). ► § 4. ВПОЛНЕ МОНОТОННЫЕ ФУНКЦИИ. ФОРМУЛЫ ОБРАЩЕНИЯ Как мы видели в гл. XII, 2, функция f, заданная на 0, 1, яв- ляется производящей функцией для положительной последова- тельности {/„} тогда и только тогда, когда f абсолютно монотонна (т. е. когда f имеет положительные производные всех поряд- ков). Аналогичная теорема имеет место и для преобразований Лапласа. Разница лишь в том, что теперь знаки производных чередуются. Определение 1. Заданная на 0, оо функция <р называется вполне монотонной, если она имеет производные <р<'!) всех поряд- ков и (—1)»<р<»>(А)>0, А>0. (4.1) При А —>-0 значения ф(п) (А) приближаются к конечным или бесконечным пределам, которые мы обозначим <р<л)(0). Типичные примеры—функции 1/А и 1/(1А). С. Н. Бернштейну (1928) принадлежит следующая прекрасная теорема, которая послужила отправным пунктом многих исследо- ваний (ее доказательство упрощалось шаг за шагом). Мы в состоянии дать крайне простое доказательство, поскольку подготовительная работа была совершена при характеризации производящих функций, которая была получена в теореме 2 гл. VII, 2, как следствие закона больших чисел. Теорема 1. Функция ф на 0, оо является преобразованием Лапласа распределения вероятностей F тогда и только тогда, когда она вполне монотонна и <р (0) = 1. Мы докажем вариант этой теоремы, который кажется более общим по форме, но фактически может быть выведен из первона- чального варианта при использовании принципа сдвига, описан- ного в связи с (1.9). Теорема 1а. Функция (р на 0, оо является вполне монотонной
496 Гл. XIII. Преобразование Лапласа. Тауберовы теоремы. Резольвенты тогда и только тогда, когда она имеет вид <р(Х) = %>0, (4.2) о где F—(не обязательно конечная) мера на О, оо, (По нашему первоначальному соглашению промежуток интегри- рования всегда замкнут', наличие у F атома в нуле приводит к <р (оо) > 0.) Доказательство. Необходимость условия устанавливается фор- мальным дифференцированием [ср. (2.4)]. Предположим теперь, что <р вполне монотонна. Рассмотрим ф (а—as) при фиксирован- ном а > 0 как функцию от s, 0 < s < 1. Производные этой функции, очевидно, положительны, и по теореме 2 из гл. VII, 2, при 0 s < 1 справедливо разложение Тейлора Ф (а—as) = У У sn. (4-3) п=0 Таким образом, Фв(%) = ф(а—ае~У°) = У. &-rik]a (4 4) л=0 есть преобразование Лапласа арифметической меры, приписываю- щей массу (—а)пф(п)(а)/п\ точке п/а, где п==0, 1,2, ... . При а—*оо фа(Х)—*-ф(%). Поэтому по обобщенной теореме непрерыв- ности существует такая мера F, что Fa—+F и ф будет ее преоб- разованием Лапласа. ► Мы доказали не только теорему 1а, но и соотношение Fa—+ F, которое можно переписать в форме следующей важнейшей теоремы. Теорема 2. (Формула обращения.) Если (4.2) выполняется при 1>0, то во всех точках непрерывности1) F (х) — lim У (~ f)n ф(п> (а). (4.5) Последняя формула представляет значительный теоретический интерес и приводит к различным полезным заключениям. Приме- ром может служить следующий критерий ограниченности, приме- няемый в теории полугрупп [см. задачу 13]. Следствие. Для того чтобы функция ф представлялась в форме Ф (1) = J (х) dx, где 0 </ < С, (4.6) о х) Формула обращения (4.5) была получена в (6,4) гл» VII как прямое следствие закона больших чисел, В (6.6) гл. VII указана аналогичная фор* мула для интегралов вида (4.6) с непрерывной (не обязательно положитель- ной)
§ 4. Вполне монотонные функция. Формулы обращения 497 необходимо и достаточно, чтобы при всех а > О 0<(-а)у)(а)<£> (47) Доказательство. Дифференцируя (4.6) под знаком интеграла, получаем (4.7) [ср. (2.4)]. Обратно, из (4.7) видно, что <р вполне монотонна и потому является преобразованием некоторой меры F. Из (4.7) и (4.5) выводим F (-^а)—*Р (xi) С (Х2~Х1) для любых Xf < х2. Иными словами, F имеет ограниченные раз- ностные отношения и, следовательно, представляет собой интеграл от функции f^C (см. гл. V, 3). ► Теорема 1 приводит к простым критериям того, будет ли данная функция преобразованием Лапласа некоторого распреде- ления вероятностей. Для иллюстрации стандартных приемов до- кажем Критерий 1. Если <р и ф вполне монотонны, то таково же и их произведение фф. Доказательство. Мы покажем по индукции, что знаки про- изводных фф чередуются. Допустим, что для каждой пары <р и ф вполне монотонных функций знаки первых п производных <рф чередуются. Так как —<р' и —ф' вполне монотонны, то предпо- ложение индукции применимо к произведениям —ф'ф и —<рф'. Из равенства —(фф)' = — ф'ф—Фф' заключаем^ что знаки первых производных фф чередуются. Так как при п — 1 утвержде- ние тривиально верно, критерий доказан. ► Точно так же доказывается полезный Критерий 2. Если ф вполне монотонна и ф—положительная функция с вполне монотонной производной, то ф(ф) вполне моно- тонна (в частности, функция вполне монотонна). Типичные применения даны в § 6, а также в следующем при- мере, который часто излагается в литературе с ненужными ус- ложнениями. Пример, а) Уравнение, встречающееся в теории ветвящихся процессов. Пусть ф—преобразование Лапласа для распределения вероятностей F с математическим ожиданием ц, 0 < оо. Пусть с > 0. Мы докажем, что уравнение Р(Х) = Ф(Х+с—сР(Х)) (4.8) имеет единственный корень р (X) 1, а также, что р есть пре- образование Лапласа для некоторого распределения В, которое будет собственным при pc 1 и несобственным в других случаях. (См. применения и ссылки в гл. XIV, 4.)
498 Гл. ХП1. Преобразование Лапласа. Тауберовы теоремы. РезольвентьГ 1 Доказательство. Рассмотрим уравнение ф(Х-|-с—cs)—s = 0 (4.9) при фиксированном Х>0 и O^s^l. Левая часть его—выпук- лая функция, значение которой при s=l отрицательно, а при s = 0—положительно. Отсюда следует существование единствен- ного корня. Докажем, что корень (3 (X) есть преобразование Лапласа. Поло- жим Ро = 0 и Р„+1 = ф(^4-с—<$„). Тогда Ро С Pi =С 1, и так как ф убывает, то Рх Р2 1 • По индукции р„ < Pn+I 1. Предел огра- ниченной монотонной последовательности {Р„} удовлетворяет (4.8), и, следовательно, p = limp„. Функция pf(X) = <р(X4-с) вполне монотонна, и критерий 2 показывает, что Р2, Р2, ... также вполне монотонны. По теореме непрерывности то же самое верно для предела р, и, следовательно, р есть преобразование Лапласа меры В. Поскольку 0 (X) 1 для всех X, то полная масса распре- деления В равна р (0) 1. Остается только выяснить, при каких условиях Р(0) = 1. По построению 5 = 0(0) является наименьшим корнем урав- нения <р(с—cs)—s = 0. (4.10) Левая часть (4.10) как функция s является выпуклой; она поло- жительна при s = 0 и равна нулю при 5 = 1. Отсюда следует, что второй корень s < 1 существует тогда и только тогда, когда производная в точке з=1 положительна, т. е. тогда и только тогда, когда —сер' (0) > 1. В ином случае р (0) = 1, и р есть пре- образование Лапласа собственного распределения вероятностей В. Следовательно, распределение В является собственным тогда и только тогда, когда—ctp' (О) = ср^С 1. ► § 5. ТАУБЕРОВЫ ТЕОРЕМЫ Пусть U—мера, сосредоточенная на 0, оо и такая, что ее пре- образование Лапласа a(k) = 1e-KxU {dx} (5.1) о существует при X > 0. Удобно описывать меру U в терминах соответствующей «функции распределения», определенной при -----------------1 х^0, как U {0, х}. Мы увидим, что при весьма общих условиях поведение и вблизи нуля однозначно определяет асимптотическое поведение U (х) при х—>оо, и наоборот. Исторически любое соот- ношение, описывающее асимптотическое поведение U в терми- нах со, называется тауберовой теоремой, тогда как теоремы, описы- вающие поведение со в терминах U, называются обычно абелевыми,
§ 5. Тауберовы теореме 491 Мы не будем делать различия между этими двумя типами теорем, так как наши соотношения симметричны. Чтобы избежать непривлекательных формул, содержащих обрат- ные величины, введем положительные переменные t и т, связан- ные соотношением /т=1. (5.2) Тогда т-^j-O при t—>оо. Поясним происхождение тауберовых теорем. При фиксирован- ном t замена переменных x = ty в (5.1) показывает, что со(тХ) является преобразованием Лапласа для несобственной 'функции распределения U (ty). Так как <о убывает, возможно найти после- довательность Тр т2) ...—>0, такую, что, когда т пробегает ее, со (тХ) со(т) (5.3) где у (X) конечно по крайней мере при к > 1. По обобщенной тео- реме {непрерывности предел у есть преобразование Лапласа не- которой меры G, и когда t пробегает последовательность tk=I[%k, то ^l->G(x) (5.4) во всех точках непрерывности G. При х—1 мы видим, что асимп- тотическое поведение V (/) при t —* оо тесно связано с поведе- нием ®(/-1). В принципе мы могли бы сформулировать это утверждение как некую всеобъемлющую тауберову теорему, но она была бы неудобна для практического использования. Для того чтобы достичь разумной простоты, мы рассмотрим только случай, когда (5.3) верно при любом способе приближения т к нулю (т. е. когда ® правильно изменяется в окрестностях нуля). Элементарная лемма1) из гл. VIII, 8, утверждает, что предел у необходимо имеет вид у (X) = Х~р, где р 0. Соответствующая мера определяется равенст- вом G (х) = хр/Г (р 4-1). Из (5.4) вытекает, что U правильно меняется и соответствующие показатели у © и V равны по абсо- лютной величине. Мы сформулируем этот важнейший результат вместе с обратным утверждением. Теорема 1. Пусть U—мера, преобразование Лапласа о кото- рой определено при X > 0. Тогда каждое из соотношений * т—+0, (5.5) со(т) ДР * ’ 4 ' х) Эта лемма нужна только для объяснения формы соотношений (5.5) и (5.6) (которая иначе показалась бы неестественной). Теория правильно меняющихся функций не используется нигде в этом параграфе [кроме заме- чания, что (5а 18) влечет за собой (5J6)]»
600 Гл. XJ1L Преобразование Лапласа. Тауберовы теоремы. Резольвенты и ~^хр’ >0°’ (5-6) влечет за собой другое, а также соотношение ®(т)~£/(ПГ(р4-1). . (5.7) Доказательство, а) Предположим (5.5). Левая часть (5.5) представляет собой преобразование Лапласа, соответствующее U (tx)l& (т). По обобщенной теореме непрерывности отсюда следует __ ХР /е о\ <о(т) Г(р+1)’ При х=1 мы получаем (5.7), а подставляя это назад в (5.8), мы получаем (5.6). б) Предположим (5.6). Переходя к преобразованиям Лапласа, мы получаем <п~(тХ) Г(р+1) U (0 Хр в предположении, что применима обобщенная теорема непрерывно- сти, т. е. в предположении, что левая часть ограничена при неко- тором X. В условиях а) мы видим, что из (5.9) выводятся (5.7) и (5.5), поэтому для доказательства теоремы достаточно прове- рить, что отношения <о (x)/U (/) ограничены. Разбивая область интегрирования точками t, 2t, 4tf получаем ®(T)<Se-a’,-,t/(2n0. (5.10) В силу (5.7) существует число ta, такое, что U (2t) < 2p+1 U (/) при t > /0. Последовательное применение этого неравенства дает -^-С52п<Р+1’е-2П"*, (5.11) так что левая часть действительно ограничена при t—><х>. ► Примеры, a) U(x)~\ogx при х—>оо тогда и только тогда, когда ®(X)~log2X при %—*0. Аналогично U(x)~]^x тогда и только тогда, когда ® (X) ~ г/У л/Х. б) Пусть F—распределение вероятностей с преобразованием Лапласа <р. Мера U {dx} = xF {dx} имеет преобразование —<р'. Поэтому если—<р'(Х)~рХ_р при X—.оо, то X U(x) = § yF {dy} ~ хр, х—> оо, О
§ 5. Тауберовы теоремы 501 и наоборот. Это обобщает правило дифференцирования (2.4), кото- рое заключается в (5.7) при р = 0. Иногда полезно знать, в какой степени справедлива теорема в пределе при р—* оо. Мы сформулируем соответствующий резуль- тат как Следствие. Если при некотором а > 1 и t —► оо или —* 0, или V; —> оо, (5.12) то "Я—О. (5.13) со (?) ' ' Доказательство. Если выполняется первое из соотношений (5.12), то со (?Л.)/со (?)—>-0 при %> а, и по обобщенной теореме непрерывности U (tx)/a> (?) —* 0 при всех х > 0. Второе из соот- ношений (5.12) влечет (5.13), так как at (s>(x)'^^e~xitU {dx\'^e~aU (ta). о В применениях более удобно формулировать теорему 1 в тер- минах медленно меняющихся функций. Напомним, что определен- ная на 0, оо положительная функция L называется медленно меняющейся на бесконечности, если при каждом фиксированном х (5.14) Говорят, что L медленно меняется в нуле, если это соотношение выполняется при >0 (т. е. если L(\/x) медленно меняется на бесконечности). Очевидно, что U удовлетворяет (5.6) тогда и только тогда, когда U (х)/хр медленно меняется на бесконечности. Ана- логично (5.5) выполняется тогда и только тогда, когда ^рсо(Х) медленно меняется в нуле. Поэтому теорема 1 может быть сфор- мулирована следующим образом. Теорема 2. Если L медленно меняется на бесконечности и 0<р< °о, то каждое из соотношений q(t) ~t-pL , т—>0, (5.15) и ^(0-T(p+1) /PL(Ot (516) влечет за собой другое. Теорема 2 имеет интересную историю. Переход от (5.16) к (5.15) (от меры к преобразованию Лапласа) называют абелевой теоремой, обратный переход — от (5.15) к (5.16) (от преобразования Лапласа к мере)—называют тауберовой
502 Гл. XIII. Преобразование Лапласа. Тауберовы теоремы. Резольвенты теоремой. В обычном изложении эти две теоремы отделены одна от другой, причем доказательство второй из них заметно сложнее. В знаменитой работе Харди и Литлвуда с помощью трудных вычислений был исследован случай со (X) ~ В 1930 г. Карамата произвел сенсацию, дав упрощенное дока- зательство для указанного специального случая (это доказательство до сих пор приводится в учебниках по теории функции комплексного переменного и преобразованиям Лапласа). Вскоре после этого он ввел класс правильно меняющихся функций и доказал теорему 2. Доказательство было, однако? слишком сложным для того, чтобы включать его в учебники. Понятие мед- ленного изменения было введено Р. Шмидтом около 1925 г. в связи с этими же вопросами. Наше доказательство упрощает теорию и делает ее цельной. Кроме того, оно приводит к малоизвестному, но полезному следствию. Большим преимуществом нашего доказательства является то, что оно без изменений применимо к случаю, когда нуль и беско- нечность меняются ролями, т. е. когда т—>оо, a t—>0. Этим путем мы приходим к двойственной теореме, связывающей пове- дение со на бесконечности и поведение U в нуле [эта теорема будет использована в настоящей книге только для вывода (6.2)]. Теорема 3. Последние две теоремы и следствие остаются вер- ними, если нуль и бесконечность меняются ролями, т. е. если т —> оо и t —> 0. Теорема 2 содержит основной результат этого параграфа, однако для полноты изложения мы сделаем два добавления к ней. Прежде всего если U обладает плотностью £7'= и, то желательно иметь оценки для и. Эту проблему нельзя решить во всей общно- сти, так как «хорошая» функция U может иметь очень «плохую» плотность и. В большинстве применений, однако, плотность и будет «монотонной, начиная с некоторого места», т. е. монотонной на некотором интервале х0, оо. Для таких плотностей верна Теорема 41). Пусть 0<р<оо. Если U имеет монотонную, начиная с некоторого места, производную и, то при%—+0 и при х —> оо соответственно со(Х) (у) тогда и только тогда, когда и (х) ~ -p-J-г х^"1 L (%). (5.17) (Более строгий в формальном отношении вариант см. в за- даче 16.) Доказательство. Утверждение леммы есть прямое следствие теоремы 2 и следующей ниже леммы. Лемма. Допустим, что U имеет монотонную, начиная с неко- I) Эта теорема включает известную тауберову теорему Э. Ландау. Наше доказательство дает новый пример того, [как теорема о выборе устраняет аналитические сложности.
§ 5. Тауберовы теоремы 503 торого места, плотность и. Если выполняется (5.16) и р>0, то и (х) ~ pU (х)/х, х —> оо. (5.18) [Обратно, (5.18) влечет за собой (5.16), даже если и немоно- тонна. Это утверждение получается из (9.6) гл. VIII при Z — u и р = 0.] Доказательство. Для 0 < а < b имеем ъ U(tb)-U(ta) ?u(iy)t. /5 lox U(t) “J U(t) ay' ' • ' a При t—>-oo левая часть сходится к &р—ар. Для достаточно боль- ших t подынтегральное выражение монотонно, и поэтому из (5.16) следует, что подынтегральное выражение остается ограниченным при t—>оо. По теореме о выборе [гл. VIII, 6] существует такая последовательность tit t2, ... —>оо, что, когда t пробегает ее, (5-20) во всех точках непрерывности. Как вытекает из предыдущего, интеграл от ф по а, b равен Ър—ар, так что ф (у) = рур~1. Так как этот предел не зависит от выбора последовательности то (5.20) верно при любом стремлении t к бесконечности. Для у=1 это соотношение сводится к (5.18). ► Пример, в) Для распределения вероятностей F с характеристи- ческой функцией ф имеем [см. (2.7)] J е-^[1 —г (Х)] dx = [1 — ф (1)]/%. (5.21) о Поскольку функция 1—F монотонна, каждое из соотношений 1_<р(Х)~ V-PL(IA) и i—F(x)^-j^—xp^L(x) (5.22) 4 ЧГ/ (р > 0) влечет другое. Полезность этого наблюдения будет про- демонстрирована в следующем параграфе. ► Применение этой теоремы иллюстрируется в следующем пара- графе. В заключение мы покажем, как теорема 2 позволяет полу- чить тауберову теорему для степенных рядов [она используется в (8.10) гл. XII и гл. XVII, 5]. Теорема 5. Пусть qn^0, и пусть Q (s) = S qnsn (5-23) Л=0
504 Гл. XI11. Преобразование Лапласа. Тауберовы теоремы. Резольвенты - сходится при 0 s < 1. Если L медленно меняется на бесконечно- сти и 0^р< оо, то каждое из двух соотношений s-~‘- I5-24) и 9о 4~ 71 • 4“ Яп-i р (р j_ 1) (я)> а ► оо, (5.25) ТЙЙЕЯ влечет другое. Далее, если последовательность {qn} монотонна и 0 < р < оо, то (5.24) равносильно соотношению Япф) ► оо. (5.26) Доказательство. Пусть U—мера с плотностью и, такой, что и(х) = <7„ при п^х <«4-1. (5.27) Левая часть в (5.25) равна U (и). Преобразование Лапласа со меры U определяется равенством М*) s=±=£±£ qne-nK=22^±Q(e-^ (5.28) п=0 Таким образом, видно, что соотношения (5.24) и (5.25) равно- сильны соответственно соотношениям (5.15) и (5.16), и поэтому в силу теоремы 2 каждое из них влечет за собой другое. В свою очередь (5.26) есть прямое следствие теоремы 4. ► Пример, г) Пусть qn = пр-1logaп, где р>0 и а произвольно. Последовательность {<?„} монотонна, начиная с некоторого места, и поэтому (5.24) выполняется с L(Z) = r(p)log° t. § 6*). УСТОЙЧИВЫЕ РАСПРЕДЕЛЕНИЯ Чтобы показать пользу тауберовых теорем, мы выведем общую формулу для устойчивых распределений, сосредоточенных на 0, оо, и дадим полную характеризацию соответствующих областей при- тяжения. Доказательства проводятся прямым методом и обладают замечательной простотой по сравнению с методами, необходимыми для распределений, не сосредоточенных на 0, оо. Теорема 1. При фиксированном 0 < а < 1 функция уа (X) = е~4“ является преобразованием Лапласа распределения Ga, обладающего следующими свойствами") *) За исключением (6.2), результаты этого параграфа получены незави- симо от гл, IX и ХУП. Устойчивые распределения были введены в гл, VI, 1,
§ 6. Устойчивые распределения 505 Ga устойчиво-, более точно, если Хх, . ..,Х„—независимые слу- чайные величины с распределением Ga, то 4- • • • 4~Xn)//i1/a снова имеет распределение Ga; далее ^[1-GaW]—<61) e*"“Ga(x)->0, х->0. (6.2) Доказательство. По второму критерию § 4 функция уа вполне монотонна, так как е~к вполне монотонна и имеет вполне монотонную производную. Поскольку ?а(0)=1, мера Ga с пре- образованием Лапласа уа имеет полную массу, равную единице. Свойство устойчивости очевидным образом вытекает из равенства у" (%) = ya(n1/“l). Соотношение (6.1) является частным случаем (5.22), а (6.2) немедленно получается из теоремы 3 и следствия теоремы 1 из § 5. ► Теорема 2. Пусть F—распределение вероятностей, сосредото- ченное на 0, оо и такое, что Fn ★ (апх)G (х) (6.3) (в точках непрерывности), где G—собственное распределение, не сосредоточенное в одной точке. Тогда а) существует функция L, медленно меняющаяся на бесконеч- ности1), и постоянная a, 0<a< 1, такие^ что б) Обратно, если F имеет вид (6.4), то можно выбрать чис- ла ап так, что (6.5) On В этом случае выполняется (6.3) с G = Ga. Из сказанного следует, что возможные предельные распределе- ния G в (6.3) отличаются от какого-нибудь Ga лишь масштабным множителем. В частности, отсюда видно, что не существует дру- гих устойчивых распределений, сосредоточенных на 0, оо. (См. лем- му 1 гл. VIII, 2.) Доказательство. Если <р и у—преобразования Лапласа F и G соответственно, то (6.3) равносильно соотношению — " log Ф l°gy(X). (6.6) х) То есть L удовлетворяет (5.14). Множитель Г (1 — а) в (6.4) введен лишь для удобства и приводит только к Изменению в обозначениях.
506 Гл. XIII. Преобразование Лапласа. Тауберовы теоремы. Резольвенты По теореме гл. VIII, 8, отсюда следует, что —log<р правильно меняется в нуле, т. е. -log<p(X)~X“L(l) , (6.7) где L медленно меняется на бесконечности и а^О. Тогда из (6.6) —logy(%) = C%“. Так как G не сосредоточено в одной точке, то 0 < а < 1. Теперь из (6.7) следует — ф (Х) ~ Ха-1Л (1V %-+ 0. (6.8) Л» \ Л / Ввиду (5.22) каждое из соотношений (6.4) и (6.8) влечет другое Таким образом, (6.4) необходимо для выполнения (6.1). Для доказательства части б) мы будем исходить из (6.4), которое, как только что было показано, влечет (6.8). Определим а„ при фиксированном п как нижнюю границу всех таких х, что п[1—F(х)] ~ 1/Г(1—а). Тогда (6.5) выполняется. Используя это и медленное изменение L, заключаем из (6.8), что 1 — <р (Х/а„) ~ №a~aL (апГк) - V/n. (6.9) Отсюда следует, что левая часть в (6.6) стремится к и это завершает доказательство. > । (См. задачу 26 о влиянии максимального слагаемого.) § 7*). БЕЗГРАНИЧНО ДЕЛИМЫЕ РАСПРЕДЕЛЕНИЯ В соответствии с определением гл. VI, 3, распределение ве- роятностей U с преобразованием Лапласа со называется безгранично делимым, если для любого п=1, 2,... положительный корень n-й степени <о„==<»1/'г.является преобразованием Лапласа некоторого распределения вероятностей. Теорема 1. Функция со представляет собой преобразование Лапласа безгранично делимого распределения тогда и только тогда, когда со = е_'*, где ф имеет вполне монотонную производную и ф(0) = 0. Доказательство. Используем критерий 2 § 4. Мы видим, что если ф(0) = 0 и ф' вполне монотонна, то функция соп = е_'Ч’/л яв- ляется преобразованием Лапласа некоторого распределения ве- роятностей. Следовательно, условие теоремы достаточно. Для доказательства необходимости предположим, что ап = е~^п есть при каждом п преобразование Лапласа некоторого распре- деления вероятностей. Положим ,_________ Ф„ (%) = п[1-»„(%)]. (7.1) ♦) Материал этого параграфа не используется в дальнейшем*
§ 7. Безгранично делимые распределения 507 Тогда фп—>ф и производная i|^=—псо'п вполне монотонна. По теореме о среднем фп(Л)==ЛфЦ0Л) и так как фп—>ф, то последовательность {ф'(2с)} ограничена при каждом фиксиро- ванном X > 0. Следовательно, из нее можно выбрать сходящуюся подпоследовательность, предел которой автоматически будет вполне монотонной функцией (по обобщенной теореме непрерывности). Таким образом, ф является интегралом от вполне монотонной функции. Доказательство закончено. >> Другой формой этой теоремы служит Теорема 2. Функция со представляет собой преобразование Лапласа безгранично делимого распределения тогда и только тогда^ когда она имеет вид со = 2“^, где = P{dx} (7.2) о и Р такая мера, что со Jlp{dx}<00. (7.3) 1 Доказательство. В силу теоремы о представлении вполне монотонных функций условия теоремы 1 могут быть заменены следующими! должно быть ф(0) = 0 и ф'(Х) = le-uP{dx}, (7.4) o' где Р—некоторая мера. Заменяя в интеграле верхний предел числом а, легко получим, что при любом а > 0 р 1 р~^х Р {dx}. (7.5) и Отсюда вытекает, что правая часть (7.2) имеет смысл, и условие (7.3) выполнено. Формальное дифференцирование показывает, что правая часть (7.2) представляет собой первообразную от (7.4), равную в нуле нулю. >> (См. задачи 17—23 и пример 9, а).) Примеры, а) Обобщенное распределение Пуассона 00 (7-6) о имеет преобразование Лапласа, равное g~fи (7.2) верно о
608 Гл- XIII. Преобразование Лапласа. Тауберовы теоремы. Резольвенты б) Гамма-плотность (а) имеет преобразование со (%) = = 1/(Х+1)й. Здесь П 1 _р-Ьх ф (X) = а \ —-— е~х dx, (7.7) так как ф' (X) = а (А +1)”1 —со' (А)/со (X). в) Устойчивые распределения. Для найденного в § 6 преобра- зования и (А) = е-х“ имеем ip (А) = А“ и (7-8) что опять можно проверить дифференцированием. г) Бесселевы функции. Рассмотрим плотность vr из примера 3,г) с преобразованием Лапласа (3.10). Из вида преобразования ясно, что vr равна n-кратной свертке плотности vr/n с собой, т. е. vr безгранично делима. Формальное дифференцирование показывает, что в этом случае ф' (А) = г/И(А + 1)а—1 и, как нетрудно про- верить (см. задачу 6), что ф' представима в форме (7.4) с Р {dx} = ге~хЦ (х) dx. д) Подчиненность. Если ф^ и ф2—положительные функции с вполне монотонными производными, то, применяя критерии § 4, легко видеть, что функция ф (А) = ф^ (ф2 (А)) имеет те же самые свойства. Соответствующее безгранично делимое распределение представляет особый интерес. Чтобы понять это, обозначим через Q/’ распределение вероятностей с преобразованием Лапласа (где i = 1, 2) и положим (7.9) (Результирующее распределение Ut получается рандомизацией параметра s в Q}2*.) Преобразование Лапласа для Ut равно (А) = J W Q</> {ds} = <4 (7.Ю) Читатель, знакомый с гл. X, 7, легко свяжет (7.9) с подчинен- ностью процессов: Ut подчинено Q(s2) с управляющим процессом Q^. Мы очень легко получили формулу для преобразования Лапласа нового процесса, хотя и при специальном предположении, что Q(2) сосредоточено на положительной полуоси. Заслуживает внимания частный случай, когда % (Z) = № и 1ф2(%)==АД Тогда = Таким образом, устойчивый а-процесс, управляемый устойчивым ft-процессом, будет устойчивый а^-процесс.
§ 8. Многомерный случай 509 Читатель может проверить, что, по существу, это утверждение повторяет формулировку задачи 10. Более общее предложение см. в примере 2, з) гл. VI. >> е) Любая смесь показательных распределений безгранично де- лима х). В наиболее общем случае такое распределение имеет плотность вида f (х) = J se~sx U {ds}, (7.11) о где U—некоторое распределение вероятностей. Для частного случая, когда U сосредоточено в конечном числе точек 0 < at <... ... < ап, в примере 3, е) было показано, что преобразование Лапласа имеет вид ₽М = с'Й5---^Й'й^ Р-12> с ak < bk < ak+i. Далее, функция __£ 1 па k+bk _ 1 J bk~ak /7 1 о\ d%1O8X+aft“A+aft__________________________(%+«*) (Х+&й) { является произведением двух вполне монотонных функций и поэтому сама вполне монотонна. Отсюда следует, что каждый множитель в (7.12) безгранично делим и потому то же самое справедливо для <р. Утверждение для смесей общего вида получа- ется с помощью обычного перехода к пределу (см. задачи 20—23). § 8*). МНОГОМЕРНЫЙ СЛУЧАЙ Понятие преобразования Лапласа распространяется на мно- гомерный случай очевидным образом. Даже формула (1.1) не требует изменения, если интерпретировать х как вектор-столбец (хх, ..., хп), А.—как вектор-строку (kf, .... An), a kx = k1xi +... ... 4-X„xra—как скалярное произведение к и х. В теории вероят- ностей многомерные преобразования используются в ограниченной степени. Примеры, а) Резольвентное уравнение. Пусть /—непрерывная функция одной переменной с обычным преобразованием Лапласа ф(Х). Рассмотрим функцию от двух переменных s и t. Ее двумерное преобразование Лапласа равно <» (к, v) = J le-^f(s+i)dsdt. (8.1) о о х) Это неожиданное наблюдение было сделано Стейтелем, см. F. W. Steutel. Ann. Math. Statist., vol. 40 (1969), 1130—1131, и vol. 38 (1967), 1303—1305. ♦) Материал не используется в дальнейшем,
Б10 Гл. XIII. Преобразование Лапласа. Тауберовы теоремы. Резольвенты После замены переменных s + t = x, —s-\-t = y интеграл сводится к 00 f х 1 00 -i-Ce~~(*'+v)*/(x)dx С е2 (К v)ydy — ^—<\(e~vx—e~Kx)f(x)dx. Q - X О Таким образом, (0(1, v)^-(p(^(V^ (8-2) Мы встретимся с этим соотношением в более «возвышенной» об- становке, как с основным резольвентным уравнением для полу- групп [см. (10.5)]. б) Функции Миттаг-Леффлера. Этот пример иллюстрирует пользу многомерных преобразований как технического средства Вычисления некоторых простых одномерных преобразований. Мы докажем сейчас следующее утверждение} Если F—устойчивое распределение с преобразованием Лапласа е~ка, то (при фиксированном t) распределение Gt(x) = l-F(-^, х>0, (8.3) имеет своим преобразованием Лапласа функцию Миттаг-Леффлера ЁГ7ТТЙ)'“- <8.«) k= о ' Этот результат довольно интересен, так как в различных пре- дельных теоремах распределение G встречается вместе с F [см., например, гл. IX, (5.6)]. Прямая проверка кажется трудной, однако можно поступить следующим образом. Сначала фиксируем х, a t примем в качестве переменной. Обычное преобразование Лапласа yx(v) (v—переменная) для Gt(x) равно, очевидно, (1—e~yiax)/v. С точностью до множителя 1/v это есть функция распределения (по х), и ее преобразование Лапласа равно Это есть не что иное, как двумерное преобразование для функции (8.3). Но оно могло бы быть вычислено и другим путем—интег- рированием сначала по х, а затем по t. Поэтому (8.5) можно рассматривать, как преобразование по t того преобразования, которое мы ищем. Разлагая (8.5) в геометрический ряд, видим, что (8.5) действительно является преобразованием для (8.4). Утверждение доказано. Функция Миттаг-Леффлера (8.4) обобщает показательную функ- цию, к которой она сводится при а = 1. >>
§ 9. Преобразования Лапласа для полугрупп 511 § 9. ПРЕОБРАЗОВАНИЯ ЛАПЛАСА ДЛЯ ПОЛУГРУПП Понятие преобразования Лапласа может быть распространено на абстрактные функции и интегралы х). Однако мы рассмотрим только преобразования Лапласа для полугрупп операторов, свя- занных с марковскими процессами * 2). Мы вернемся к основным обозначениям и соглашениям гл. Х,8. Пусть S—некоторое пространство (например, прямая, интервал или совокупность всех целых чисел), и пусть —банахово про- странство ограниченных функций на 2 с нормой || и || — sup | и (х) |. Мы предполагаем, что из и g S вытекает | и | g Пусть {£} (£), t > 0}—непрерывная полугруппа сжатий J?. Иными словами, мы предполагаем, что для каждой функции и С 3 существует функция Q.(t)u£ S и что £!(/) обладает следующими свойствами: из вытекает 0 г^£1(/) и 1; £1(/4-s) = £1(/)£1(s) и D (h) —> D (0) = 1 (единица обозначает тождественное преобразова- ние) 3). Мы начнем с определения интегрирования. Пусть F—про- извольное распределение вероятностей на 0, оо. Мы желаем оп- ределить сжимающий оператор Е, отображающий 2 в 2, который будем обозначать E = $£l(s)F{ds} (9.1) о и который удовлетворяет равенству C(f)£ = ££>(/)=$ О (* + s) Г {ds}. (9.2) о (Не нужно забывать о зависимости Е от распределения F.) Для полугруппы, отвечающей марковскому процессу с пере- ходными вероятностями Qt(x, Г), этот оператор Е будет порож- даться стохастическим или субстохастическим ядром 00 $&(х, F)F{ds}. (9.3) о Естественное (и почти тривиальное) определение оператора Е *) Плодотворная теория, охватывающая преобразования вида (9.6), была развита С. Бохнером, Completely monotone functions in partially ordered spaces, Duke Math. J., 9 (1942), 519—526. Распространение на произвольные семейства операторов см. у Э. Хилле и Р. Филлипса (1957). 2) Построение минимального решения в гл, XIV, 7, может служить ти- пичным примером излагаемых далее методов. р) Напомним из гл. Х,8, что сильная сходимость Тп-+Т эндоморфизмов означает, что ||Тпн—0 для всех и £ Мы говорим кратко «непрерыв- ность», подразумевая «сильную непрерывность при t^0»s
.512 Гл. XIII. Преобразование Лапласа. Тауберовы теоремы. Резольвенты для случая атомической F приводит к желаемому общему опре- делению с помощью простого предельного перехода. Пусть Pj~^§ и рх . + рг — 1. Линейная комбинация £ = P1£W+...+prD(U (9.4) снова является сжатием и может рассматриваться как математи- ческое ожидание £!(/) по отношению к распределению вероятно- стей, приписывающему вес pf в точке tj. Таким путем опреде- ляется оператор (9.1) для специального случая дискретных рас- пределений с конечным числом атомов. При этом (9.2) оказывается выполненным. В общем случае оператор (9.1) определяется пре- дельным переходом, подобно тому, как это делается в теории интеграла Римана: интервал 0, оо разбивают на интервалы /f, ..., выбирают f и образуют риманову сумму Р \ lk}> которая определяет некоторое сжатие. Ввиду равномерной непрерывности [см. (8.7) гл. X] известное доказа- тельство сходимости римановых сумм применимо без изменений. Таким путем (9.1) определяется как частный случай интеграла Бохнера. Если полугруппа образована операторами перехода, т. е. если £} (/) 1 = 1 для всех t, то £1 = 1. Обозначение (9.1) будет использоваться для Е, а для функции Ew мы будем использовать обычную запись: Eu>=$£l(s)abF{ds} (9.5) о (хотя более логично было бы писать w вне знака интеграла). Значение функции Ew(x) в данной точке х—это обычное ма- тематическое ожидание числовой функции £> (s) w (х) по отношению к F. В частном случае F{ds} = e~Ksds оператор Е называют инте- гралом Лапласа полугруппы или резольвентой. Этот оператор мы будем обозначать sjt(k) = $e-^D(s)ds, k>0. (9.6) Q Ввиду (9.2) оператор (резольвента) 91 (X) перестановочен с любым оператором £1 (f) полугруппы. Для выполнения равенства Х91 (X) 1 = 1 необходимо и достаточно, чтобы D(/)l = l при всех t. Таким образом, оператор сжатия X9l(2i) является оператором перехода тогда и только тогда, когда все D(s) суть операторы перехода. Лемма. Задание 91 (X) w при всех X > 0 и w С 2 однозначно определяет полугруппу.
§ 9. Преобразования Лапласа для полугрупп 513 Доказательство. Значение ЭД (X) w (х) = (I) w(x) • dt о В каждой фиксированной точке х представляет собой обычное преобразование Лапласа числовой функции t, заданной как £l(/)te>(x). Эта функция, будучи непрерывной, однозначно опре- деляется своим преобразованием Лапласа (см. следствие в § 1). Таким образом, Q(t)w однозначно определяется при всех t и всех w С 3. Преобразование Лапласа (9.6) приводит к простой характе- ризации инфинитезимального оператора SI рассматриваемой полугруппы. По определению этого оператора [см. гл. X, 10] имеем зи, h->0 + , (9.7) если Siu существует (т. е. если норма разности правой и левой части (9.7) стремится к нулю). Теорема 1. При фиксированном Х>0 и = ЭД(Х)и» (9.8) тогда и только тогда, когда и принадлежит области определения §1 и Хи—31и = да. (9.9) • Доказательство, (i) Определим и равенством (9.8). Опираясь на свойство (9.2) математических ожиданий, получаем ~1 e~Ks£l(s-\-h)w-ds—£- Сe-XsD(s)w-ds. (9.10) п П j п о о о Замена переменной s + h = t в первом интеграле приводит к x/i 00 h ^^u = e-^l^e-M^w.dt^^eK(h-t)Q^w.dt=s о о Kh =е—=^ (u—K-'w)— § e^-'4&(t)w—w)dt. (9.11) о Так как ||О(1)ш—ау||—>0 при t—>0, то второй член справа стремится по норме к нулю. Поэтому вся правая часть стремится к X (и—Х-1ау). Таким образом, (9.9) верно. (ii) Обратно, предположим, что Siu существует, т. е. что вы- полняется (9.7). Так как оператор сжатия ХЭД(Х) перестановочен 17 №249
514 Гл. XIU. Преобразование Лапласа. Тауберовы теоремы. Резольвенты со всеми операторами полугруппы, то из (9.7) вытекает (9.12) Но, как мы только что видели, левая часть стремится к Ш (X) и—и, В полученном в результате тождестве и представляется кац преобразование Лапласа функции w из (9.9). Следствие 1. Для данного существует ровно одно реше- ние и уравнения (9.9). Следствие 2. Две различные полугруппы не могут иметь один и тот же инфинитезимальный оператор 21. Доказательство. Знание оператора £1 дает возможность найти преобразование Лапласа [R (%) w для всех w £ 3?. По доказанной выше лемме это однозначно определяет все операторы полугруппы. Соблазнительно было бы получить тауберовы теоремы, ана- логичные приведенным в § 5. Однако мы ограничимся совсем простым результатом. Теорема 2. При X—*оо Ш(%)->1. (9.13) Доказательство. Для произвольного w С 3 имеем ||Х9г(Х)ш—||£!(/)№—ш(9.14) О При X —* оо распределение вероятностей с плотностью \е~и схо- дится к распределению, сосредоточенному в нуле. Подынтеграль- ное выражение ограничено и стремится к нулю при t—>0. По- этому интеграл (9.14) стремится к нулю и (9.13) верно. ► Следствие 3. Инфинитезимальный оператор 31 имеет область определения, плотную в 2?. Доказательство. Из (9.13) следует, что каждое w£2 может быть представлено как сильный предел последовательности эле- ментов Ж (X) w. По теореме 1 эти элементы принадлежат области определения 31. Примеры, а) Безгранично делимые полугруппы. Пусть U—без- гранично делимое распределение с преобразованием Лапласа = где гр(Х) дано в (7.2). Распределение Ut с преобразо- ванием Лапласа С е-\х у t {dx} = е-^(А-) =ехр (—t С J^P^dx}^ (9.15) о \ о х ' снова безгранично делимо, и соответствующие операторы свертки
§ 9. Преобразования Лапласа для полугрупп 515 51(0 образуют полугруппу. Чтобы найти ее инфинитезимальный операторх), возьмем какую-либо ограниченную непрерывно диф- ференцируемую функцию V. Тогда, очевидно, v(x) = J ° .^yut {dy}. (9.16) 0 Дифференцирование (9.15) показывает, что мера t~lyUt{dy} имеет преобразование ф' (А) которое стремится к ф' (X) при t —> 0. Но ф' есть преобразование меры Р, так что наша мера сходится к Р. Первая дробь под знаком интеграла (9.16) является (при фиксированном х) ограниченной и непрерывной функцией от у. Поэтому мы получаем соотношение $о(х) = С v(x-y)-v(x) р (9 д 7) W У о Таким образом, мы имеем новую интерпретацию меры Р, вхо- дящей в каноническое представление безгранично делимого рас- пределения. б) Подчиненные полугруппы. Пусть {£1(0} обозначает произ- вольную марковскую полугруппу, и пусть U t—безгранично дели- мое распределение предыдущего примера. Рандомизацией пара- метра t можно получить, как объяснено в гл. Х,7, новую мар- ковскую полугруппу {£1* (/)}. В принятых здесь обозначениях n*(0=j£l(s)t7t{ds}. (9.18) о Полагая для краткости V(s, х)^®"1^*), (9.19) имеем со (/)_1 V (х)=у V(s, х) 1 sUt {ds}. (9.20) о Пусть v принадлежит области определения 5(. При фиксирован- ном х функция V непрерывна всюду, включая точку s = 0, по- скольку V(s, х)—+ Ш(х) при 8——>-0. Мы видели в предыдущем примере, что при /—>0 t~1sUt{ds}—^P {ds}. Таким образом, пра- вая часть в (9.20) сходится к некоторому пределу. Поэтому 31*о Л) Этот вывод дан только как иллюстрация. Вид оператора известен из гл. IX и может быть получен переходом к пределу от обобщенных пуассо- йовских распределений.
516 Гл. XIII. Преобразование Лапласа. Тауберовы теоремы. Резольвенты существует и задается формулой (х) = J V (s, х) Р {ds}. (9.21) О Мы приходим к заключению, что области определения §1 и 31* совпадают и * = J —Р {ds} (9.22) О в том смысле, что (9.21) выполняется для всех v в области опре- деления 31. ► § 10. ТЕОРЕМА ХИЛЛЕ — ИОСИДЫ Известная и весьма полезная теорема Хилле—Иосиды дает характеризацию инфинитезимальных операторов произвольных полугрупп. Мы изложим ее применительно к случаю сжимающих полугрупп. Эта теорема утверждает, что свойства инфинитези- мальных операторов, описанные в предыдущем параграфе, при- сущи только им. Теорема 1. (Хилле—Иосида). Оператор 31 с областью опреде- ления <£?' с: S? представляет собой инфинитезимальный оператор некоторой непрерывной сжимаемой полугруппы £!(/) на 3 (с £1 (0)=1) тогда и только тогда, когда он обладает следующими свойствами! (i) уравнение Ки—У1и — ш, ?t>0, (10.1) имеет для каждого w^3 ровно одно решение щ (ii) если то (iii) область определения 3' оператора 3( плотна в 3. Мы уже знаем, что каждый инфинитезимальный оператор об- ладает этими свойствами, т. е. условия теоремы необходимы. Далее обозначим решение (10.1) через и = Э?(Х)пу. Тогда, как мы знаем, оператор (X) совпадает с преобразованием Лапласа (9.6). Условия теоремы мы можем сформулировать теперь следующим образом. (!') Оператор fR(X) удовлетворяет соотношению Ш(Х)—319Ш) = 1. (Ю.2) Область определения SR (X) совпадает с 3, а область значений —• с J?', т. е. с областью определения 31. (ii') Оператор №Л(%) является сжатием. (iii') Область значений ЭЧ (2i) плотна в 3. Как известно из теоремы 2 § 9, оператор Э? (X) должен удо- влетворять соотношению Ш(Х)->1, (10.3£
§ jO. Теорема Хилле — Иосиды 517 Из него вытекает, что каждая функция и является пределом своих собственных преобразований и, следовательно, область значений 91(A) плотна в S. Отсюда ясно, что (10.3) может за- менить (iii'). Таким образом, три, условия теоремы эквивалентны условиям (i'), (ii'), (10.3). Пусть теперь задано семейство операторов 91 (А) с этими свой- ствами. Мы намерены построить искомую полугруппу как предел семейства псевдопуассоновских полугрупп. При построении ис- пользуется Лемма Е Если w принадлежит 2'—области определения опе- ратора %[, то 9191(А)да = 91(А)91да. (10.4) Операторы 91(A) и 9i (v) перестановочны и удовлетворяют резоль- вентному уравнению 91(A)—9t(v) = (v—А) 91 (А) 91 (v). (10.5) Доказательство. Положим о — $м. Поскольку как и, так и ш принадлежат области ДД, то из (10.1) следует, что то же самое справедливо для о, и Ао—tyv — Ww. Таким образом, получим v = 91 (А) 91да, т. е. то же самое, что и в правой части (10.4). Далее, определим z как единственное решение уравнения vz—$lz = w. Вычитая это равенство из (10.1), после простых преобразований получим А (и—z)—91 (и—z) = (v—А) г, что совпадает с (10.5). Перестановочность операторов вытекает из симметрии предыдущего соотношения. ► Для построения нашей полугруппы вспомним (см. теорему 1 в гл. Х,9), что произвольному оператору сжатия Т и а>0 со- ответствует полугруппа сжатий вида (£^7». (Ю.6) «.= 0 Порождает эту полугруппу оператор а(Т—1), который представ- ляет собой эндоморфизм. Применим этот результат для Т = А91(А). Положим для сокра- щения обозначений 9Ц = А[А91(А)— 1] = АО(А), £М0=Л (Ю.7) Эти операторы, определенные при А>0, перестановочны друг
518 Гл. XIIL Преобразование Лапласа. Тауберовы теоремы. Резольвенты с другом и при фиксированном Z оператор Six порождает псевдо- пуассоновскую полугруппу сжатий Six (О- Из (10.4) следует, что УЪщ—>SIh при всех и из S', области определения данного оператора SI. Мы можем забыть теперь о специальном способе построения Six и получить теорему Хилле—Иосиды как частный случай более общей предельной теоремы, которая полезна и сама по себе. В этой теореме X может пробегать и множество целых чисел. Лемма 2 (лемма об аппроксимации). Пусть {Dx(/)}—семей- ство псевдопуассоновских полугрупп, перестановочных одна с дру- гой и порожденных эндоморфизмами Six- Если SIx«—► SI и на плотном множестве S', то Dx(0~^&(0, X—>оо, (10.8) где {D(/)}—полугруппа сжатий, с инфинитезимальным опера- тором, совпадающим на S' с SI. Далее для и € S' ||D (I) и—(0 « К 0 SIh—Slx« II- (Ю.9) Доказательство. Для любых двух перестановочных сжатий верно тождество S”—Гп = (5'г“1-}- ... 4-Т”"1) (S—Т), и потому ||5"ц—T“u'^n\\Su—Ты||. (10.10) В применении к операторам Dx (^М) это неравенство дает (после очевидных преобразований) ,|Г, /.X о /А Dx(l/n)-l II ...... 11^1(0 Dv (t) и || t и и ||. (10.11) Полагая п—>оо, получаем IIDx (t) u-£v (t) и|| < t ||Slx«-SIv« ||. (10.12) Это показывает, что для и g S' последовательность (Dx (t) u} равномерно сходится при %—*«>. Так как S' плотно в S, то эта равномерная сходимость имеет место для всех и. Обозначая предел через D(I)«, мы видим, что D(/) есть сжатие, удовлет- воряющее (10.8). Полугрупповое свойство очевидно. Полагая в (10.12) v—>оо, приходим к (10.9). Переписывая левую часть, как в (10.11), имеем m||<||SIh-SIx«||. (Ю.13) Выберем Л столь большим, чтобы правая часть стала меньше в. Для достаточно малых t второе разностное отношение в левой части отличается (по норме) от Slx« меньше чем на е. а от SU —
§ 10. Теорема Хилле — Иосиды 519 меньше чем на Зе. Таким образом, для и£Д?! (10.14) чем заканчивается доказательство. ► Примеры. Диффузия. Пусть S?—семейство непрерывных функ- ций на прямой, обращающихся в нуль на ±оо. Чтобы перейти к привычным обозначениям, заменим X на h~3 и положим h—>0. Определим разностный оператор Vft формулой VA« (х) = ± ^(x+h)+u(x-h) и (х)], (10 15) Этот оператор имеет вид h~2(T—1), где Т есть оператор пере- хода, и потому vZl порождает полугруппу операторов пере- хода (марковскую полугруппу). Операторы Ул перестановочны один с другим, и для функций, имеющих три ограниченные про- изводные, равномерно. Лемма 2 утверждает сущест- вование предельной полугруппы {£>(£)}, порождаемой таким опе- ратором 31, что $Ди=^и" (по крайней мере для всех достаточно гладких и). В этом частном случае, как мы знаем, {£!(/)} есть полугруппа сверток с нормальными распределениями с дисперсией /, так что мы не получаем новой информации. Пример тем не менее указы- вает, как легко можно (иногда) установись существование полу- группы с заданным инфинитезимальным оператором. Проведенное выше рассуждение применимо, например, к более общим диффе- ренциальным операторам и граничным условиям (см. задачи 24, 25). ► Замечание по поводу резольвенты и полной монотонности. Теорема Хил- ле— Иосиды посвящена свойствам инфинитезимального оператора 21, однако теорему можно сформулировать так, чтобы получить характеризацию семей- Теорема 2. (Альтернативная форма теоремы Хилле — Иосиды.) Для того чтобы семейство эндоморфизмов {$(%); % > 0} было резольвентой полугруппы {П (0} сжатий, необходимо и достаточно, чтобы а) резольвентное уравнение 91 (Л) —91 (v) = (v-%) 91 (X) 91 (v) (10,16) было удовлетворено, б) %9i (X) был сжатием и в) при К—> оо. Доказательство. Уравнение (10.16) полностью совпадает с (10.5), тогда как условия б) и в) появляются выше в виде (ii) и (10.3). Поэтому все три условия необходимы. Предполагая * что условия теоремы выполнены, определим оператор 21 следующим образом* Выберем некоторое v > 0 и определим как область значений 9t(v), т. е.: и£<£г тогда и только тогда, когда w = 9i(v)ay для не- которого Для такого и положим Ш = —w. Этим определен опера- тор о областью определения который удовлетворяет тождеству v9l(v)-O(v) = b (ИМ?)
520 Гл. XIII. Преобразование Лапласа. Тауберовы теоремы. Резольвенты г Покажем, что это тождество имеет место для всех %, т, е, Х$ (%)-21$ (Х) = Ъ (10.18) Левую часть (10.18) можно переписать в виде (X-v) $ (X) + (v—21) $ (%). (10.19) Используя (10.16) и тот факт, что (v—21) $ (v) = 1, получим (v—21) $ (%) = 1 + (V—%) $ (%). (10.20) Отсюда и из (10.19) следует тождество (10.18). Таким образом, показано, что все условия теоремы Хилле—Иосиды удовлетворены, и это исчерпывает до* казательство. ► Предыдущая, теорема показывает, что вся теория полугрупп строится на резольвентном уравнении (10.16) и поэтому интересно выяснить его смысл в терминах обычных преобразований Лапласа. Из (10.16) ясно, что $ (%) не* прерывно зависит от к в том смысле, что $ (v)—> $ (%) при v—Однако мы можем сделать следующий шаг и определить производную $' (X): ЭГ (X) = lim 91 (X). (10.21) v—л Та же самая процедура, повторенная еще раз, показывает, что правая часть в (10.21) имеет производную, равную —2$ (X) $' (X). Продолжая по индукции# получаем, что $ (X) имеет производные $(n> (X) всех порядков и (_1)« SR(n) (X) = n! gi«+i (X). (10.22) Пусть теперь и—произвольная функция на такая, что 0^и^1, Возьмем произвольную точку х и положим со (X) = $ (X) и (х). Правая часть в (10.22) представляет собой положительный оператор, норма которого не превосходит п!/Хп + 1 и поэтому функция со вполне монотонна и | co(n) (X) | e^n!/Xn+1. Из следствия в § 4 теперь следует, что со есть обычное преобра- зование Лапласа со значениями между 0 и 1. Если мы обозначим эту функцию через £}(/)&(*), то она определяет D (/)—оператор сжатия. Сравнивая ре- зольвентное уравнение (10.16) с (8.2), убеждаемся в том, что оно влечет полугрупповое свойство Q(/ + s)m(x) = Q(/)D(s)m(x). (10.23) Итак, мы видим, что основные свойства теории полугрупп могут быть выведены из (10.16) при использовании только классических преобразований Лапласа для обычных функций. В частности, резольвентное уравнение ока- зывается только абстрактным эквивалентом элементарного примера 8, а). Абстрактная теория лишь повторяет теоремы, касающиеся обычных пре- образований Лапласа. Чтобы подчеркнуть это еще раз, мы докажем формулу обращения. Теорема 3. При фиксированном t > 0 и X—> оо (10.24) Доказательство. Из определения Д (X) как преобразования Лапласа для £1 (/) (см. равенство 9.6) следует, что 00 (—1)” (X) = J e~Xss”D (s) ds. (10.25) о Левая часть (10.24) является интегралом от D (s) по мере с плотностью е~™П (ns/t)”-1 ----nj---------которой соответствуют математическое ожидание t и дис-
§ 11. Задачи 521 Персия /2/п. При п—>оо эта мера сходится к распределению, сосредоточен- ному в /, и ввиду непрерывности D (s) отсюда вытекает (10.24), так же как и в случае обычных функций [формула (10.24)— то же самое, что (1.6) гл, VII]. > § 11. ЗАДАЧИ 1. Пусть Fq — геометрическое распределение, приписывающее массу qpn точке nq3 п — ()3 1, ,. Покажите, что при q—>0 распределение Fq стре- мится к показательному распределению 1—е~х и что соответствующее преоб- разование Лапласа стремится к 1/(Х-}-1)- 2. Покажите, что обычные преобразования Лапласа функций cosx и sin х суть Х/(Х2—J-1) и 1/(Х2-|-1). Докажите, что выражение (1+^“2) О— cosax) есть плотность вероятности с преобразованием Лапласа (1 -f-a2) (Х + 1)~1Х Х[(Х-}-1)2+а2]-'1. Указание. Используйте формулу eix = cos x-\-i sin x или два раза последовательно проинтегрируйте по частям. ___ ____3. Пусть со—преобразование (1.5) меры U\ со интегрируема на 0, 1 и 1, оо тогда и только тогда, когда функция I/х интегрируема по отношению к U на 1, оо и 0, 1 соответственно. 4. Равенство Парсеваля. Если X и Y—независимые случайные величины с распределениями F и G и преобразованиями <р и то преобразование для X Y равно J <Р М G W = $ Y М F {^}. о о 5. Пусть F — распределение с преобразованием <р. Если а > 0, то Ф (X + а)/ф (а) является преобразованием распределения e~axF {dx}/<p (а). Уста* новите, что при фиксированном / >0 функция1) ехр[—tV2Х+a2+at\ есть преобразование безгранично делимого распределения с плотностью t Г 1 / i \21 ---- ехр — -л" ( —==г—а у х) . Y 2лх3 L \ / 6. Покажите, исходя из определения (7.1) гл. II, что обычное преобразо* вание Лапласа функции /0 (х) равно <о0 (Х)= 1/]/’X2—1 при X > 1. Вспомните / о п, \ ( —— \ тождество ( ]= 2 (—4)п. \ п / \ п J 7. Продолжение. Покажите, что /о = Л и что, следовательно, /f имеет обычное преобразование Лапласа, равное coi (X) = соо (X) R (X), где R (X) = = Х—/Х2—1. 8. Продолжение. Покажите,' что 2/n = /ne.f + /„+f при п=1, 2? ? Отсюда по индукции выведите, что 1п имеет обычное преобразование con (X) =э = ©0(Х)/?«(Х). 9. Выведите из примера З^д) посредством интегрирования3 что —1 есть обычное преобразование Лапласа функции Л (2 К х)/К х. 10. Пусть X и Y —независимые случайные величины с преобразованиями Лапласа ф и соответственно* Тогда YX1/<a имеет преобразование Лап- ласа ф (Ха)» х) Эта формула встречается в применениях и неоднократно выводилась с помощью длинных вычислений.
522 Гл* XIII. Преобразование Лапласа. Тауберовы теореМЫ. РеЗбл&ШЯШ 11. Плотность f вероятностного распределения вполне монотонна тогда п только тогда, когда она представляет собой смесь показательных плотно* стей [т. е, если эта плотность имеет вид (7.11)]. Указание. Используйте за* Дачу 3. 12. Проверьте формулу обращения (4.5) путем прямого вычисления для частных случаев ф (X) = 1/(А,+1) и ф(Х) = е_\ 13. Покажите, что следствие в § 4 остается верным, если заменить f и их абсолютными значениями. 14. Предполагая, что функция е~х1п (х) монотонна на бесконечности, выведите из задачи 8, что е~х1п (*) ~ — s X —► оо, У 2 лх 15. Предположим, что 1—ф (A,) ~V“PL (X) при X—>0 (р > 0). Исполь- зуя пример 5, в), покажите, что 1— Fn* (х) ~ пхР-1 L (1/х)/Г (р) прих—> оо, [Сравните это с примером 8, в) из гл. VIII.] 16. В теореме 4 из § 5 достаточно, чтобы и (х) ~и(х), где функция v монотонна, начиная с некоторого места. 17. Каждое безгранично делимое распределение является пределом обоб- щенных пуассоновских распределений. 18. Допустим, что в каноническом представлении (7.2) некоторого безгра- нично делимого распределения Р (х) ~ xcL (х) при х—>оо, где 0<с<1. Тогда 1—F (х)~ х*”1^ (х). [Продолжение см. в примере 4, г) гл. XVII.] 19. Пусть Р—производящая функция некоторой целочисленной безгра- нично делимой случайной величины иф—преобразование Лапласа некоторого распределения вероятностей. Тогда Р (ф) безгранично делима. 20. Преобразования Лапласа фп, соответствующие безгранично делимым распределениям, сходятся к преобразованию Лапласа ф некоторого распреде- ления вероятностей тогда и только тогда, когда соответствующая мера Рп в каноническом представлении (7.2) сходится к Р. Следовательно, предел по- следовательности безгранично делимых распределений сам безгранично делим. 21. Пусть Fn—смесь (7.11) показательных распределений, соответствую- щая «смешивающему» распределению Un. Последовательность сходится к распределению вероятностей F тогда и только тогда, когда Un сходится к распределению U. В таком случае F есть смесь, соответствующая «смеши- вающему» распределению U. 22. Распределение вероятностей с вполне монотонной плотностью безгра- нично делимо. Указание. Используйте задачи 11 и 21, а также пример 7,е), 23. Любая смесь геометрических распределений безгранично делима. Ука- зание. Следуйте схеме примера 7, е). 24. Диффузия с поглощающим экраном. В примере § 10 примем х > 0 и положим в определении Sjh и(х—h) = 0 при х—h^Q. Покажите, что до- казательство сходимости остается в силе, если обозначает пространство непрерывных функций с zz(oo) = 0, w(0) = 0, причем последнее условие нельзя отбросить. Предельная полугруппа описана в примере 5, б) гл. X. 25. Отражающие экраны. В примере § 10 примем х > 0 и положим в опре- делении и (х—h) — u (x-\-h) при х—h < 0. Тогда yhu сходится к пределу для каждой и с тремя ограниченными производными и с и' (0) = 0. Область (область определения оператора 31) определяется этим граничным усло- вием. Предельная полугруппа описана в примере 5, д) гл. X. 26. Влияние максимального члена при сходимости к устойчивым распре- делениям. Пусть Xf,- Хз? —независимые случайные величины с одним и тем же распределением F, удовлетворяющим (6.4), т. е. принадлежащим области притяжения устойчивого закона Ga. Положим Sn= Xi+... + XW и Mrt = max[Xif ,,м Хд]. Докажите, что отношение имеет преобразование
§ 11. Задача 523 Лапласа со/2 (X), сходящееся кх) Й (X) =------j------------------. (*) 1+а^ (1—e-W) t~a~l dt о Следовательно, Е (Sn/M„)—>1/(1 — а). Указание. Оценивая интеграл по об« ласти Xy^Xj, получаем оо /со \П —1 con (X) = ne- J F {dx} f e-^Fx F {dy} j * о хо / Произведем замену y—tx и затем получим x — ans, где ап удовлетворяет (6.5) g Внутренний интеграл, как легко видеть, равен 1—_________________L С (i—c-v) F(andtL_i_0 (J_A _i-j- 0 (2Л «[1— F (an)l n J (l ’l—FSflnr xn) n \ n j 0 где ip (X) обозначает знаменатель в (л), Таким o6pa3OMs 00 О х) Этот результат и его аналог для устойчивых распределений с пока^Ф?' телем а^1 был получен Д. Дарлингом в терминах характеристических функ*, ций, См4| Transs Amen Math. Soc.f 73 (1952)f 95—107.
ГЛАВА XIV ПРИМЕНЕНИЕ ПРЕОБРАЗОВАНИЯ ЛАПЛАСА Эта глава может служить для дополнительного чтения после гл. XIII. Она охватывает несколько независимых друг от друга тем—от практических задач (§ I, 2, 4, 5) до общих теорем су- ществования § 7. Предельные теоремы § 3 иллюстрируют силу методов, развитых в связи с понятием правильно меняющихся функций. В последнем параграфе описываются средства анализа асимптотических свойств марковских процессов и времен первого прохождения для них. § 1. УРАВНЕНИЕ ВОССТАНОВЛЕНИЯ; ТЕОРИЯ Вероятностные основы читатель может найти в гл. VI, 6,7. Хотя теории восстановления целиком посвящена гл. XI, здесь мы излагаем независимый и значительно менее сложный подход. Сравнение методов и результатов поучительно. При известных основах теории преобразований Лапласа настоящий подход проще и прямо ведет к цели. Однако результат основной теоремы вос- становления пока не удается получить с помощью преобразова- ний Лапласа. С другой стороны, преобразования Лапласа позво- ляют легче получить предельные теоремы § 3 и явные решения типа, рассматриваемого в § 2. Объектом нашего изучения будет интегральное уравнение t V(/) = G(0+ JV(/—x)F{dx}, (1.1) о в котором F и G—заданные монотонные непрерывные справа функции, равные нулю при t < 0. Мы рассмотрим их как функ- ции распределения некоторых мер и предположим, что F не со- средоточено в нуле и что их преобразования Лапласа Ф (X) = J е~и F {di}, у (%) = J e~MG {di} (1.2) о о определены при % > 0. Так же как и в предыдущей главе, все интервалы интегрирования считаются замкнутыми. Мы докажем, что (1.1) имеет ровно одно решение V; это будет функция рас-
§ 1. Уравнение восстановления: теория 525 пределения, преобразование Лапласа ф которой существует при всех X > 0. Если G имеет плотность g, то V имеет плотность у, которая удовлетворяет интегральному уравнению t v(t) = g(t)+ \v(t—x)F {dx\, (1.3) о получаемому из (1.1) дифференцированием. Вспоминая правило свертки, мы получаем для преобразова- ния Лапласа ф распределения V (или обычного преобразова- ния его плотности) соотношение ф = у-рфф, откуда формально следует W=T^. (1.1) Чтобы доказать, что это формальное решение является преобра- зованием Лапласа некоторой меры (или плотности), мы рассмот- рим отдельно три случая (из которых только первые два имеют вероятностное значение). Случай (a). F есть распределение вероятностей, не сосредо- точенное в нуле. Тогда ф (0) = 1 и ф (X) < 1 при X > 0.z Соответ- ственно ряд Еф"=г=^=® О-5) о т сходится при Л > 0. Очевидно, что функция со вполне монотонна и поэтому является преобразованием Лапласа некоторой меры U (теорема 1 из гл. XIII, 4). Далее, ф = <оу есть преобразование Лапласа для свертки V=U*G, т. е. i V(t) = ^G(t—x)U{dx}. (1.6) о Наконец, если G имеет плотность g, то V имеет плотность v — U^g. Таким образом, мы доказали существование и единственность решения нашего интегрального уравнения. Асимптотическое поведение V на бесконечности описывается тауберовой теоремой 2 из гл. XIII, 4. Рассмотрим типичный случай, когда G (оо) < оо и F имеет конечное математическое ожидание р. В окрестности нуля ф(%) ^р"1 G(oo) V1, откуда следует, что V(Z) ~ р'Ч?(оо)-/, t—> оо. (1.7) Из теоремы восстановления гл. XI, 1, вытекает более точный результат V (t + h)—V (/) p-JG (оо) h,
526 Гл. XIV. Применение преобразования Лапласа но его нельзя получить из тауберовых теорем. [Последние дают лучший реаультат, если F не имеет математического ожидания; см. § 3.] Случай (б). F—несобственное распределение, F(oo)<l. До- пустим для простоты, что G(oo)<oo. Можно применить пред- шествующие рассуждения с заметным упрощением: так как <р (0) =: ?=F(oo)<l, то со(0) < оо и мера V на этот раз ограничена. Случай (в). В этом случае F(oo)> 1. Для малых X знамена- тель в (1.4) отрицателен, и со (%) для таких % не может быть преобразованием Лапласа. К счастью, это обстоятельство не соз- дает неудобств. Во избежание тривиальностей допустим, что F не имеет атома в нуле, так что ср(Х)—>0 при %—>оо. В этом случае уравнение ф(х) = 1 имеет единственный корень х>0. Рассуждения п. (а) применимы без изменений при % > %. Иными словами, существует единственное решение V, но его преобразо- вание Лапласа со сходится только при %>х. Для этих значений со по-прежнему определяется формулой (1.4)1). § 2. УРАВНЕНИЕ ТИПА УРАВНЕНИЯ ВОССТАНОВЛЕНИЯ: ПРИМЕРЫ а) Время ожидания пробелов в процессе Пуассона. Пусть V обозначает распределение времени ожидания до окончания первого пробела длины £ в процессе Пуассона с параметром с (т. е. в процессе восстановления с показательными временами между поступлениями). Распределение V изучалось аналитически в при- мере 7, б) гл. XI. Соответствующие практические ситуации (задержка пешехода или автомобиля, пытающегося пересечь поток автомашин, время блокировки в счетчиках Гейгера второго типа и т. п.) были описаны в гл. VI, 7. Здесь мы выведем нужное нам уравнение восстановления заново. Время ожидания, если ожидание началось в момент 0, необ- ходимо превосходит £. Оно меньше t, t > если до момента § не будет ни одного поступления (вероятность чего е~с^>} или же если первое поступление происходит в момент х < £ и остающееся время ожидания не превосходит t—х. В силу свойства отсут- ствия последействия вероятность V (t) того, что время ожидания не превосходит t, равна § V(/) = е~Ъ + J V(t—x)• е-^ cdx (2.1) о при и V(t) = O при t < £. Несмотря на непривычный вид, (2.1) есть уравнение восстановления стандартного типа (1.1), х) Решение V имеет вид V {dx} = e*xV# {dx}, где V* есть решение [с пре- образованием Лапласа -ф* (X) =г|) (Х + х)] стандартного уравнения восстанов- ления (1.1) о распределением F, замененным на собственное распределение вероятностей F# {dx} = F {dx}, и с G, замененным на G# {dx} — еГ™ G{dx}>
_____________________§ Уравнение типа уравнения восстановления №7 в котором F имеет плотность f (х) = се~сх на 0 < х < в то Время как G сосредоточено в точке Таким образом, ф(^) = -^рг(1— e-(c+X)g), т(Х) = е-(с+х)-5 (2.2) и, следовательно, преобразование ф для V равно ,ъ,п (с+1)е-<с+^ 1Н^)= х+се-(с+Г)Т- м Выражения (7.8) гл. XI для математического ожидания и дис- персии получаются отсюда простым дифференцированием1). Тоже самое верно и для моментов высших порядков. Поучителен вывод из (2.3) явной формулы для решения. По причинам, которые станут понятны, мы рассмотрим хвост 1 — V (/) распределения. Его обычное преобразование Лапласа равно [1—ф (Х)]Д [см. XIII, (2.7)]. Послед- няя функция может быть разложена в геометрический ряд: 1—Ф(^) t У1 „_гг„_1 Л—е <С+Х>Ц” ь I Г { ’ Выражение в фигурных скобках отличается от преобразования Лапласа (1—е~ ^)Д равномерного распределения только масштабным множителем g и заменой X на %+с. Как неоднократно отмечалось, эта замена соответствует умножению плотности на е~<*. Таким образом, 1 —К {t) = e~ct 5 сп-Ч"-1 /”* (4) > (2.5) л=1 \ ь ] где есть плотность n-кратной свертки равномерного распределения с со- бой. Используя (9.6) гл. I, окончательно получаем оо п Интересна связь этого результата с теоремами о покрытии. Как было пока- зано в (9.9) гл. I, при фиксированных t и g внутренняя сумма представляет собой [вероятность того, что, выбирая наудачу п—1 точек в 0, мы ра- побьем* этот интервал на п частей, каждая из которых не превышает Отметим, что время ожидания превосходит t тогда и только тогда, когда каждый подынтервал 0, t длины £ содержит по крайней мере один момент поступления. Таким образом, (2.6) утверждает: если в процессе Пуассона на О, t происходит ровно п—1 поступлений, то условное распределение моментов поступления равномерно. Если исходить из этого факта, то (2.6) будет след- ствием теоремы о покрытии. С другой стороны, (2.6) дает новое доказатель- ство теоремы о покрытии с помощью рандомизации. б) Задача о разорении в обобщенном процессе Пуассона. В ка- честве второго иллюстративного примера мы возьмем интегро- х) Чтобы избежать громоздкого дифференцирования дробей, знаменатель лучше убрать^ перенеся его в левую часть.
528 Гл. X7V. Применение преобразования Лапласа дифференциальное уравнение t R,(t) — ^R(t)-~^R(t—x)F{dx}, (2.7) О в котором F—распределение вероятностей с конечным математи- ческим ожиданием [х. Это уравнение было получено в гл. VI, 5, где мы отметили его связь с теорией страхования, задачами хра- нения запасов и т. п. Решение этого уравнения и его асимпто- тические свойства были найдены другими методами в примере 7, а) гл. XI. Задача состоит в том, чтобы найти распределение вероятностей R, удовлетворяющее (2.7). Это уравнение связано с уравнением вос- становления и может быть исследовано теми же приемами. Пе- реходя к обычным преобразованиям Лапласа и отмечая, что 00 00 Р(Х) = + (2.8) О о мы находим —^(°) 1 PW- а 1 ф(Х) ’ х » (2.9) с % где ф—преобразование Лапласа для F. Вспоминая, что [1—ср (Х)]/% есть преобразование Лапласа 1—F (х), мы видим, что первая дробь в правой части имеет форму (1.4). Следовательно, эта дробь есть преобразование Лапласа—Стильтьеса некоторой меры R. Множитель 1/% соответствует интегрированию. Поэтому р (X) яв- ляется обычным преобразованием Лапласа некоторой функции распределения R(x) [см. (2.8)]. Так как jR(x)—>1 при х —>оо, то по теореме 4 из гл. XIII, 5, р(Х)—>1 при %—>0. Из (2.9) мы получаем теперь значение неизвестной постоянной R (О); ^(0)=1-у^. (2.10) В соответствии с этим наша задача имеет единственное решение при apt < с и не имеет решений при ар, с. Этот результат сле- довало бы ожидать, исходя из вероятностных соображений. Формула (2.9) встречается и в теории очередей (под названием формулы Хинчина—Полачека, см8 пример 5, а) гл. XII). Много статей посвящено вы- воду явных формул в частных случаях. В случае чисто пуассо- новского процесса F сосредоточено в точке 1 и <р(Х)=е~\ Выражение для р теперь почти такое же, как (2,3), и тот же метод легко дает явную форму решения (2J1) 1 1 *
§ 3. Предельные теоремы 529 Эта формула, хотя она практически бесполезна, интересна тем, что в нее входят экспоненциальные функции с положительными показателями, которые должны занятным образом «компенсировать» друг друга. Формула была из- вестна в связи с задачами страхования1) с 1934 г., но неоднократно пере- стирывалась. § 3. ПРЕДЕЛЬНЫЕ ТЕОРЕМЫ, ВКЛЮЧАЮЩИЕ РАСПРЕДЕЛЕНИЯ АРКСИНУСА Стало привычным называть распределения, сосредоточенные на 0, 1 и имеющие плотности 7a(x)=^H^x-«(i_x)a-i, 0<а<1, (3.1) «обобщенными распределениями арксинуса», хотя на самом деле это специальные бета-распределения. Частный случай а = г/2 со- ответствует функции распределения 2tt"1arcsinj/\, играющей важную роль в теории флуктуаций в случайных блужданиях. Все большее число исследований приводит к предельным распре- делениям, связанным с ^а. Сложность вычисления этих распре- делений делает появление qa мистическим. Подлинная причина заключается в близкой связи qa с функциями распределения, имеющими правильно меняющиеся хвосты, т. е. 1—F(x) = x-aL(x), 0<a< 1, (3.2) где L (tx)/L (t)—+1 при >оо. Для таких функций теорема вос- становления может быть дополнена в том смысле, что для «функ- ции восстановления» = выполняется соотношение и ~ Г (1—а) Г (1+а) ЦТ) ’ t ~* °0, @ Другими словами, если F меняется правильно, то это же верно и для U. Известно (хотя и не очевидно), что постоянный мно- житель в (3.3) равен (sinna)/na, так что соотношение (3.3) может быть переписано в виде [1-F(x)] U (х)-+х-кя. (3.4) Лемма. Если F удовлетворяет (3.2), то выполняется (3.4). Доказательство. По тауберовой теореме 4 гл. XIII, 5, 1— <р(Х)~ Г(1— a)X“L(l/X), Л-*0. Преобразование Лапласа для U равно 2*Pn—V(1—<р), и по тео- реме 2 из гл. XIII, 5, верно (3.3). 2) Явное решение в задаче о разорении до момента t дано Пайком (Pyke R., The supremum and infimum of the Poisson process, Ann. Math. Statist,, 30 (1959), 568—576),
530 Гл. XIV. Применение преобразования Лапласа Рассмотрим теперь последовательность положительных неза* висимых случайных величин с одним и тем же распределе- нием F и их частные суммы Sn = Xx+ ... 4~Х„. При фиксирован* ном />0 обозначим через случайный индекс, такой, что SNf^/^SNf+1. (3.5) Мы интересуемся длинами двух подынтервалов Y/ = Z—Sn* и Z* = Sn*+i—t. Они были введены в гл. VI, 7 и названы там: «прошедшее время ожидания» и «остающееся время ожидания» в момент t. Причины интереса, который могут представлять эти величины, объяснялись ранее по-разному. В гл. XI, 4, было доказано, что при t —> оо случайные величины Yt и Z* имеют (одно и то же) собственное предельное распределение тогда и только тогда, когда F имеет конечное математическое ожидание. В противном случае PlYf^x}—>0 при любом фиксированном х > 0. Аналогичное соотношение верно и для Zt. Побочным результатом наших иссле- дований является следующая интересная теорема (первоначальное доказательство которой представляло значительные аналитические трудности* 2). Теорема. Если имеет место (3.2), то нормированная случай- ная величина Nt/t имеет предельную плотность qa, определяемую по (3.1), a Ztlt имеет предельную плотность2) z ч sin ла 1 . Л /п Ра(*) —’>(1+х) ’ Х>0- <3 *-6> Доказательство. Неравенство tx± < Nt < tx2 осуществляется тогда и только тогда, когда при некоторых п и у, I—х2<у< <1—%i, имеем Sn=ty и Xn+i>/(l—у). Суммируя по всем возможным п и у, получаем P{tX1<\t<ix2}= $ (3.7) 1 -х2 или, используя (3.4), Р/7г <" ¥ /3 8} 1 -х2 i) Дынкин Е. Б., Некоторые предельные теоремы для сумм независимы^ случайных величин с бесконечными математическими ожиданиями, Изв# АН СССР, серия матем., 19 (1955), 247—266. 2) Так как SN^+1 = Zf+/, то распределение Z//SN*+1 получается из (3.6) заменой переменных х = у/(1—у). Таким образом, мы видим, что величина ЗД*+1 имеет предельную плотность
§ 4. Периоды занятости и соответствующие ветвящиеся процессы 531 Теперь —>-уа, так что мера f/ {tdy}/U(t) сходится к мере С плотностью ау**-1. В то же время первый множитель под инте- гралом сходится к (1—у)~а. В силу монотонности наших функ- ций сходимость равномерна. Поэтому Р < Yf < tx.} -+ J (1 dy, (3.9) 1 -Xi чем доказано первое утверждение. Для верности P{Zf>/s} мы получаем такой же интеграл, но в пределах от 0 до 1/(1 +s). Теперь дифференцированием получаем (3.6). Примечательно, что плотность qa становится бесконечной вблизи точек 0 и 1. Следовательно, наиболее вероятные значе- ния величины лежат вблизи точек 0 и 1. Легко так усовершенствовать наши рассуждения, чтобы полу- чить утверждения, обратные к лемме и теореме. При этом станет видно, что условие (3.2) необходимо для существования предель- ного распределения величины Yf//. С другой стороны, (3.2) характеризует области притяжения устойчивых распределений. Этим и объясняется частое появление qa в связи с подобными распределениями. § 4. ПЕРИОДЫ ЗАНЯТОСТИ И СООТВЕТСТВУЮЩИЕ ВЕТВЯЩИЕСЯ ПРОЦЕССЫ В примере 4, а) гл. XIII было показано, что если ф есть преобразование Лапласа некоторого распределения вероятностей F с математическим ожиданием р, то уравнение р (X) = ф (X + с—ф (X)), % > 0, (4.1) имеет единственное решение р. Сверх того, Р является преобра- зованием Лапласа некоторого распределения В; при этом В соб- ственно, если ср 1, несобственно в противном случае. Этот простой и красивый результат находит все больше и больше при- менений. Стоит поэтому объяснить вероятностный смысл уравне- ния (4.1) и его применения. Вывод уравнения (4.1) и аналогичных уравнений оказывается простым, если выражать вероятностные соотношения непосред* ственно в терминах преобразований Лапласа. Типичная ситуация такова. Рассмотрим случайную сумму SN = . • • + XN, где Ху независимы и имеют преобразование Лапласа у(Х) и N—не зави- сящая от X случайная величина с производящей функцией P(s). Преобразование Лапласа Sn равно, очевидно, Р(у(Х)) [см. при- мер 3, с) гл. XIII]. Для пуассоновской случайной величины N это преобразование Лапласа имеет вид Как мы неоднократно видели, в применениях параметр а часто считают
532 Гл. XIV. Применение преобразования Лапласа случайным с некоторым распределением U. Используя ту же терминологию, что и для распределений, мы можем сказать, что есть условное преобразование Лапласа для SN при данном значении а нашего параметра. Безусловное преобразова- ние Лапласа получается интегрированием по отношению к U. Благодаря специальному виду подынтегрального выражения ре- зультат равен, очевидно, со (1—у(Х)), где со обозначает преобразо- вание Лапласа для U. Примеры, а) Периоды занятости1). Клиенты (или вызовы) приходят к обслуживающему прибору (линии связи) в моменты, •образующие процесс Пуассона с параметром с. Последовательные времена обслуживания предполагаются независимыми случайными величинами с одним и тем же распределением F. Допустим, что в момент 0 приходит вызов и линия свободна. Обслуживание начинается мгновенно. Вызовы, поступающие в моменты, когда линия занята, встают в очередь, и обслуживание продолжается без перерывов до тех пор, пока не исчезнет очередь. Под перио- дом занятости понимается интервал от нуля до первого момента, когда линия снова становится свободной. Его продолжительность является случайной величиной. Мы обозначим ее распределение и преобразование Лапласа соответственно через В и 0. В терминологии ветвящихся процессов клиент, начинающий период занятости, есть «предок». Клиенты, прибывающие в мо- менты, когда все еще обслуживается первый, суть его прямые «потомки» и т. д. При условии, что предок уходит в момент х, число N его прямых потомков распределено по закону Пуассона с математическим ожиданием сх. Обозначим Ху полное время обслуживания /-го прямого потомка и всех его потомков. Хотя соответствующие промежутки времени не обязаны следовать не- посредственно один за другим, их общая сумма имеет, очевидно, такое же распределение, как и период занятости. Полное время обслуживания всех (прямых и непрямых) потомков равно поэтому Sn = Xj + ... + XN, где Ху имеет преобразование Лапласа 0 и все случайные величины независимы. Чтобы получить период заня- тости, мы должны добавить время х обслуживания предка. Соот- ветственно при данной продолжительности х времени обслужи- х) То, что уравнение (4.1) возникает в связи с периодами занятости, было отмечено Кендаллом (Kendall D. G., Some problems in the theory of queues., J. Roy. Statist. Soc. (B), 13 (1951), 151—185). Красивая редукция к ветвящимся процессам была предложена Гудом (Good I, J.). Уравнение (4.1) равносильно уравнению t В = (t—x)F{dx], О которое часто называют интегральным уравнением Такача. Внутреннюю про- стоту теории не всегда понимают,
§ 4. Периоды занятости и соответствующие ветвящиеся процессы 533 вания предка длительность периода- занятости * + SN имеет (условное) преобразование Лапласа Параметр х имеет распределение F. Интегрирование по х приводит к (4.1). Если распределение В несобственно, то его дефект 1—В(оо) равен вероятности того, что период занятости никогда не кон- чится (переполнение). Условие означает, что математиче- ское ожидание полного времени обслуживания всех вызовов, поступающих за единицу времени, не должно превышать единицы. Нетрудно вычислить, исходя из (4.1), математическое ожидание и дисперсию В. В частном случае показательных времен обслуживания имеем F(/)= 1—e~aZ и ф(Х) = а/(Х + а). В этом случае (4.1) превращается в квадратное уравнение, один из корней которого не ограничен на бесконечности. Поэтому решение |3 совпадает с другим корнем, а именно ₽(!) = -|/'“ГЛ±^±£—л/~ /х+“+сУ-11. (4.2) V V С [ 2 j/ac Г \ 2 fac / J 7 Это преобразование Лапласа встречалось в примере 3, в) гл. ХШ. Принимая во внимание изменение масштабного параметра и прин- цип сдвига, найдем, что соответствующая плотность равна }/'a/ce~(a+c)xx~’1Ii(2]/racx). (4.3) Тот же самый результат будет получен другим методом в при- мере 6, б); кроме того, он был использован в примере 9, д) гл. VI. б) Задержки в уличном движении х). Допустим, что автомобили, проходящие данный участок дороги, образуют процесс Пуассона с параметром с. Пусть движение задерживается на время б (крас- ным светом или какой-либо другой причиной). Когда движение возобновляется, в очереди будут стоять К автомобилей; К имеет распределение Пуассона с параметром сб. Так как r-й автомобиль в очереди не может двинуться ранее г—1 автомобилей, находя- щихся впереди него, то каждый автомобиль создает задержку для всех следующих за ним автомобилей. Естественно предполо- жить, что отдельные задержки суть независимые случайные вели- чины с одним и тем же распределением F. При наличии ожи- дающих вновь прибывший автомобиль обязан стать в очередь, тем самым увеличивая общую задержку. Положение такое же, как в предыдущем примере, с той лишь разницей, что здесь имеется К «предков». Полная задержка, создаваемая автомобилем и всеми его прямыми и непрямыми потомками, имеет преобразование Лапласа р, удовлетворяющее (4.1), а полный «период занятости»— промежуток времени от возобновления движения до первого мо- х) Этот пример возник под влиянием изучения Дж. Литлом числа авто- мобилей, задержанных при движении более медленным транспортом [Litt- le J. D. С., Operations Res4 9 (1961), 39—52].
534 Гл. XIV. Применение преобразования Лапласа мента, когда нет ожидающих автомобилей,— имеет преобразова- ние Лапласа e-cfl у р (X) = е-сб [!-₽(%)]. Легко вычислить математическое ожидание задержки. Этот результат можно использовать для выяснения эффекта, созда- ваемого последовательными светофорами, и т. п. (см. задачи 6 и 7). § 5. ДИФФУЗИОННЫЕ ПРОЦЕССЫ Как мы знаем, в одномерном броуновском движении переход- ные вероятности нормальны, а время первого прохождения имеет устойчивое распределение с показателем — (см. пример 2, е) гл. VI). Имея в своем распоряжении эти результаты, мы не вправе ожидать новой информации от использования преобразований Лапласа. Причиной возвращения заново к диффузионным урав- нениям служит то, что метод сам по себе поучителен и применим к наиболее общим диффузионным уравнениям (с той разницей, что явные решения не удается получить при произвольных коэф- фициентах). Для упрощения записи мы допустим с самого начала, что переходные вероятности имеют плотности qt (хотя метод, который мы укажем, был бы применим без всяких специальных ограничений). Мы начнем с частного случая броуновского Движения. Пусть f—данная непрерывная ограниченная функция. Положим — + ы(Л х)= J qt(x, y)f(y)dy. (5.1) — 00 Нашим исходным пунктом будет установленный в примере 4, а) гл. X факт, что (по крайней мере для достаточно гладких f) и удовлетворяет диффузионному уравнению ди (/, х)_ 1 д2и (t, х) /г dt дх2 ' и начальному условию и (/, л:)—>/(%) при 2 —>0о Вводя обычное преобразование Лапласа оо W = J е~ии (t, х) dt, (5.3) о мы выводим из (5.2), что1) = Д (5.4) 1) Читатели, ознакомившиеся с параграфами, посвященными полугруппам! заметят, что мы имеем дело с марковской полугруппой, порождаемой диф- ференциальным оператором ?l = -—rf2/rfx2. Дифференциальное уравнение (5.4) есть частный случай основного уравнения (10.1) гл. ХШ* встречающегося в теореме Хилле—Иосиды.
§ 5. Диффузионные процессы 5ЗД а из (5.1), что + 00 ©х(х)= J Кк(х, s)f(s)ds, — оо (5-5) где Кк(х, у)—обычное преобразование Лапласа функции qt(x, у). р теории дифференциальных уравнений называют функцией Грина для уравнения (5.4). Мы покажем, что (5.6) Справедливость этой формулы можно установить, если про- верить, что (5.5) изображает требуемое решение дифференциаль- ного уравнения (5.4), однако это не объясняет, как была найдена эта формула. Мы намерены вывести (5.6) из вероятностных соображений, применимых и к более общим уравнениям и приводящих к явным выражениям для времен первого прохождения (задача 9). Мы при- мем как данное, что траектория X (/) непрерывно зависит от t. Пусть X (0) = х. Обозначим через F (t, х, у) вероятность того, что точка у будет достигнута до момента t. Мы назовем F распре- делением момента первого перехода из х в у и обозначим его преобразование через фДх, у). Пусть х < у < г. Тогда событие X (/) = г имеет место тогда и только тогда, когда первое прохождение через у происходит в некоторый момент т < t и когда за ним следует переход из у в г за время t—т. Таким образом, qt(x, z) есть свертка F(t, х, у) и qt(t), г), откуда (х, г) = <рл(х, у)(у, г), х<у<г. (5.7) Фиксируем точку у и выберем в качестве f функцию, сосред®» точенную на у, оо. Умножаем (5.7) на /(г) и интегрируем относи- тельно г. Ввиду (5.5) в результате имеем юл(х) = <рх(х, у)а>к(у), х<у. (5.8) В то же время в силу (5.4) при фиксированном у фДх, у) удов- летворяет дифференциальному уравнению Их—-= Х<У' (5-9) Ограниченное на —оо решение необходимо имеет вид Так как йб (5.8) <рк(х, у)—>1 при х—+у, то фДх, г/) = е^2^<х~»> при х <у. По соображениям симметрии выводим отсюда, что преобразование Лапласа времени первого перехода из х в у равно фх(х, (5.10)
536 Гл. XIV. Применение преобразования Лапласа Полагая z~y в (5.7), видим, что у) = е-г^^х~У^Кк(У, У)- Поскольку К должно симметричным образом зависеть от х и у, отсюда следует, что К. (у, у) сводится к постоянной С\, зависящей только от К. Таким образом, мы определили с точностью до постоянного множителя С\. Равенство К= 1 легко полу- чается из того, что значению f = 1 соответствует решение сод, (х) =* s= 1/Л.. Это доказывает справедливость формулы (5.6). Следующие далее примеры показывают, как вычислить вероят- ность того, что точка у± > х Сбудет достигнута ранее, чем неко- торая другая точка у2 < х. В то же время эти примеры проде- монстрируют, как учитываются граничные условия. Примеры, а) Один поглощающий экран. Броуновское движе- ние на 0, оо с поглощающим экраном в нуле получается оста- новкой обычного броуновского движения с X (0) = х > 0, когда оно достигает начала координат. Обозначим соответствующие вероятности перехода через q}bs(x, у). Аналогично изменим дру- гие обозначения. В неограниченном броуновском движении плотность вероят- ности перехода от х > О в у > О с заходом в 0 равна свертке плотности первого перехода из х в 0 и <?<(0, у). Соответствующее преобразование Лапласа равно <р%(х, 0)Кк(0, у). Следовательно, должно быть (х, у) = (х, y)-VK (х, 0) Кк (0, у), (5.11) где х > 0, у > 0. Это эквивалентно Albs (х, у) = -Д= [е ~У2К 1 х~у । —е~у2К <х+^] V 2л (5-12) или <frabs(*, y) = qt(x, y)—qt(x, —у) (5.13) в соответствии с решением (5.5) гл. X, найденным методом отражения. Рассуждения, приводящие к (5.7), применимы без изменений и к процессу с поглощающим экраном. Поэтому из (5.12) мы выводим, что при 0 < х < у <plbs (X, У) — gV2k X_e-V2k X eV2k y_g-V2k у (5.14) Это1) есть преобразование Лапласа для вероятности того, х) При фиксированном у <pjjbs является решением дифференциального уравнения (5.9), которое обращается в нуль при х = 0 и в 1 при х — у. В та- кой форме, результат применим к любой тройке точек а < х < b и а > х > b и к более общим дифференциальным уравнениямэ
§ 5. Диффузионные процессы 537 что в неограниченном броуновском движении с Х(О) = х точка у> х будет достигнута до момента t и до прохождения через нуль. При к—>0 приходим к выводу: вероятность того, что точка у будет достигнута ранее точки 0, равна х/у (точно так же, как в симметричном случайном блуждании, соответствующем схеме Бернулли, см. задачу о разорении в 1; гл. XIV, 2). (Про- должение см. в задаче 8.) б) Два поглощающих экрана. Рассмотрим теперь броуновское движение, начинающееся в точке х интервала 0, 1 и оканчиваю- щееся при достижении точки 0 или точки 1. Легче всего этот процесс получить из предыдущего процесса с одним поглощаю- щим экраном, ставя дополнительный экран в точке 1. При этом рассуждения, приводящие к (5.11), применимы без изменений. Переходные плотности qt (х, у) нового процесса имеют преобра- зование Лапласа 7<*, определяемое соотношением К*(х, y) = fi^(x, y)-<rtbs(x, Wbs(l, У), (5.15) где х и у принадлежат интервалу 0, 1. [Отметим, что выпол- няются граничные условия /С* (0, У) = Кк (1, */)•] Простые вычис- ления показывают, что К*(х, У) = е-У'2К | х-у |_ e-Vn (2-| х-у |) _ е-V2X (х+у)_е-У2Х (2-х-у) (5.16) Разлагая дробь 1/[1—e-2^2^J в геометрический ряд, мы прихо- дим к другому представлению: Последнее эквивалентно решению (5.7) гл. X, полученному с помощью принципа отражения. Сходные рассуждения применимы и к более общему диффу* зионному уравнению + а > 0, (5.18) на конечном или бесконечном интервале. Вместо (5.4) мы полу- чаем —у a<f>i—ba'K = f, (5.19) и решение снова имеет форму (5.5) с функцией Грина Кх вида (5.7). При этом <рл(х, у) есть преобразование плотности первого перехода от х к у > х. При фиксированном у эта функция должна;
538 Гл. XIV. Применение преобразования Лапласа удовлетворять дифференциальному уравнению, соответствующему (5.9), а именно Лхрл —&Фл=0. (5.20) Эта функция должна быть ограничена на левом конце. Кроме того, фх (у, у) = 1. Эти условия определяют фх однозначно, за исключением случая, когда (5.20) имеет ограниченное решение. В последнем случае (как и в приведенных выше примерах) сле- дует добавить надлежащие граничные условия (см. задачи 9, 10). § 6. ПРОЦЕССЫ РАЗМНОЖЕНИЯ И ГИБЕЛИ. СЛУЧАЙНЫЕ БЛУЖДАНИЯ В этом параграфе мы исследуем связь между процессами размножения и гибели из 1; гл. XVII, 5, и рандомизированным случайным блужданием из гл. II, 7. Основная цель состоит в том, чтобы проиллюстрировать технику применения преобразований Лапласа и правильное использование граничных условий. Рассмотрим простое случайное блуждание, начинающееся в нуле, в котором размер отдельного скачка равен 1 или — 1 с вероятностями р и q соответственно. Промежутки между после- довательными скачками предполагаются независимыми показа- тельно распределенными случайными величинами с математичес- ким ожиданием 1/с. Вероятность Рп (t) (находиться в состоянии п в момент t) была найдена в (7.7) гл. II, но мы проведем вычис- ления заново, с новой точки зрения. Составляя уравнение для Рп (/), мы будем рассуждать следующим образом. Состояние п=0=О может наблюдаться в момент t только при условии, что до момента t произошел скачок. Пусть первый скачок происходит в момент t — х и приводит в точку 1. Тогда (условная) вероят- ность состояния п в момент t равна Рп_г (х). Таким образом, при /г = ±1, ±2, ... t РП (0 = $ Се~с [pPn-i (.x) + qPn+i (*)] dx. (6.1а) о При п = 0 к правой части следует добавить член e~ct, соответ- ствующий отсутствию скачков до момента t. Таким образом, t PQ (t) = e~ct + $ ce~c [pP.f (x) + qPi (x)] dx. (6.16) о Точно так же Pn должны удовлетворять бесконечной системе уравнений свертки (6.1). Простое дифференцирование приводит к бесконечной системе дифференциальных уравнений1) _________ p;(o=-^«(o+^n-i(o+^p„+1(o (6.2) х) Эта система представляет собой частный случай системы уравнений 1? гл. XVIIj (5.2)j для процессов размножения и гибели и может быть получена таким же путем.
§ 6. Процессы размножения и гибели 539 с начальными условиями Рв(0)=1, Р„(0) = 0 при п^=0. Системы (6.1) и (6.2) эквивалентны, но последняя имеет то формальное преимущество, что специальная роль состояния п = 0 проявляется только в начальных условиях. Для применения преобразований Лапласа безразлично, отправляемся ли мы от (6.1) или от (6.2). Переходя к преобразованиям Лапласа, обозначим 00 nn(K) = ^e~^Pn(t)dt. (6.3) о Поскольку операция свертки соответствует перемножению пре- образований Лапласа, а е~сх имеет преобразование Лапласа 1/(с4-Х), то система (6.1) эквивалентна =^[pn„_i(X) + <7n„+I(X)], п=£0, (6.4а) М*) = W + (*)]. (6.46) (Аналогичный результат можно было бы получить из (6.2), так как справедливо равенство $ е-и Р'п (0 dt = - Рп (0) + Хл„ (X), о которое получается интегрированием по частям.) Система линейных уравнений (6.4) аналогична системе, уже появлявшейся в связи со случайными блужданиями в 1; гл. XIV, Мы можем решить ее таким же методом. Квадратное уравнение eqs*—(c-{-X)s4-cp = 0 (6.5) имеет корни a = „ oi C=(p/?)S.I. <6 6) Легко проверить, что при произвольных постоянных Ак и Вк линейные комбинации л„ (1) = AKsr{ -}- Врз^ удовлетворяют (6.4а) при п=1, 2, ... . Коэффициенты можно выбрать так, чтобы получить для л0(%) и лДХ) правильные значения. Если л0 и даны, то, исходя из (6.4а), можно вычислить последовательно л2, л3, ... . Поэтому при п 0 каждое решение имеет вид л„ (X) — AKs^-|-Bjfli. При Л—* оо имеем s^—>0, но > оо. Так как наше решение л„(%) остается ограниченным на бесконеч- ности, то необходимо Вд, = О и л„(Х) = л0(ХИ, n = 0, 1, 2............. (6.7а) При мы имеем по аналогии л„ (X)» л0 (Л) (% = (р[д)пщ (Л.) si", п = 0, -1, —2, ... , (6.76)
540 Гл. XIV. Применение преобразования Лапласа Подставляя в (6.46), наконец, получаем л0 (%) = ..1_____= , (6.8) 0 ’ /(с+А,)2-4с2р<? 4 ' так что все л„(Х) определяются единственным образом. Из этих преобразований Лапласа можно извлечь максимум информации без знания явных формул самого решения. Напри- мер, поскольку перемножение преобразований Лапласа соответ- ствует свертке, то из (6.7) следует, что при вероятности Рп имеют вид Pn = Fn*"kPQi где F (возможно, несобственное) распределение вероятностей с преобразованием Лапласа, равным С вероятностной точки зрения это означает следующее. Если в момент t случайное блуждание находится в точке п, то первое прохождение через п могло произойти в некоторый момент t. Тогда (условная) вероятность попасть в момент t снова в п равна Ро(/—т)- Таким образом, Рп является сверткой Ро с распреде- лением Fn времени первого прохождения через п. В свою оче- редь это время первого прохождения есть сумма п одинаково распределенных независимых случайных величин, а именно сумма времен (ожидания) между последовательными прохождениями через 1, 2, ... . Это объясняет вид (6.7) и в то же время пока- зывает, что $5с (для п>0) есть преобразование Лапласа распре- деления Fn времени первого прохождения через п. Это распреде- ление является несобственным, кроме случая p = q — ^ так как только в этом последнем случае s0=l. В рассмотренном случае мы, к счастью, имеем возможность обратить преобразование Как было показано в примере 3, г) гл. XIII, функция (X—КX2— 1)г представляет собой (при X > 1) обычное преобразование Лапласа для (r/x) 1Г (х). Замена X на Х/2сКpq меняет лишь масштабный параметр, а замена X наХ + с соответствует умножению плотности на е~сх. Отсюда следует, что при п > 0 есть обычное преобразование Лапласа для распреде- ления F с плотностью = (6.9) Это есть плотность времени первого прохождения через точку п > 0. Этот факт был установлен прямыми методами в (7.13) гл. II (и поэтому последнее рассуждение может рассматриваться как новый вывод преобразования Лапласа для х~Чп (х)). Явное выражение для вероятностей P„(t) можно получить проще. В задаче 8 гл. XIII, 11, мы нашли преобразование Лап- ласа для а подбор параметров, как указывалось, непосредст- венно ведет к точным формулам РП (0 = V (Plq)n e~ctIn № Vpq t), п~0, ±1, ±2,.... (6.10)
§ 6. Процессы размножения и гибели 541 С другой стороны, этот результат был получен прямыми мето- дами (7.7) гл. II. Как мы уже видели в Г, гл. XVII, 7, различные задачи связи и обслуживания приводят к той же самой системе дифференци- альных уравнений (6.2) с той лишь разницей, что рассматрива- ются только неотрицательные значения п и что граничному зна- чению п = 0 соответствует иное уравнение. Как действует наш метод в подобных случаях, покажут два следующих примера. Примеры, а) Очередь к одному обслуживающему прибору. Рассмотрим систему обслуживания с одним прибором, в которой вновь прибывшие вызовы становятся в очередь, если обслу- живающий прибор занят. Состояние системы описывается чис- лом вызовов в очереди, включая обслуживаемый вызов. Промежутки между вызовами и время обслуживания являются взаимно независимыми случайными величинами и имеют пока- зательные распределения с плотностями и [ле~ц- соответст- венно. Этот пример не что иное, как частный случай примера б) со многими обслуживающими приборами из 1; гл. XVII, 7, но мы заново выведем дифференциальные уравнения, чтобы разъяснить тесную связь с рассмотренной выше моделью случайного блужда- ния. Предположим, что в данный момент времени имеется п 1 вызовов в очереди. Последующие изменения состояния системы можно охарактеризовать +1 в случае, если прибудет новый вызов, и —1, если закончится текущее время обслуживания. Время ожидания Т изменения системы есть наименьшее из вре- мен ожидания каждого из этих двух событий, а поэтому Р {Т > £}=$ == где с = Л + р,. Если изменения системы происходят с веро- ятностью р=Л!с, это +1, ис вероятностью q = \ilc, это —1. Другими словами, пока существует очередь, рассматриваемый процесс подобен случайному блужданию и, следовательно, диф- ференциальные уравнения (6.2) выполнены для п^1. Однако когда обслуживание не происходит, изменение состояния может быть вызвано только поступлением нового вызова, а поэтому для п = 0 дифференциальное уравнение принимает вид — cpP0(t) + cqPi(t). (6.11) Решим эти дифференциальные уравнения в предположении, что обслуживающий прибор первоначально был свободен, т. е. Ро(0) = 1. При п>1 преобразования Лапласа л„(Х) снова удов- летворяют уравнениям (6.4а), но при п = 0 мы получаем из (6.11) (ср + к) л0(Х) = 1 (к). (6.12) Как и в общем случайном блуждании, имеем л„ (А) — л0 (X) s£ при 0^1, но ввиду (6.12) = = (6.13) 0 4 7 ср-\-К—cqs^ л \ /
542 Гл. XIV, Применение преобразования Лапласа Таким образом, 1 — Si (Ь) + Лп+1 (*) + . . . = (SX + sr1 + ...) = sr«. Мы нашли, что sn является преобразованием Лапласа для рас- {феделения Fn с плотностью (6.9). Множитель 1/Х соответствует интегрированию, а поэтому при п > О Pn(0+^+f(0+...₽F„(0, (6.14) где Fn есть распределение с плотностью (6.9). При п = 0 левая часть, очевидно, равна единице. б) Флуктуации в период занятости. Рассмотрим по-прежнему один обслуживающий прибор, но только в период занятости. Другими словами, предполагается, что в момент 0 поступает вызов, причем на свободную линию, и что мы обрываем процесс, когда линия впервые снова становится свободной. Аналитически это означает, что теперь рассматриваются значения и началь- ное условие имеет вид /^(0) = !. При /1>2 в уравнениях (6.2) ничто не меняется, однако в связи с отсутствием нулевого состоя- ния в первом уравнении отпадает член cpPb(t). Таким образом, преобразования Лапласа зтп(Х) удовлетворяют при п^2 уравне- ниям (6.4а). Кроме того, (X 4- с) jt± (X) = 1 —{— cqn2 (X). (6.15) Как и прежде, при получаем пп (X) = (X) s""1. Однако nf(X) следует определить, исходя из (6.15). Стандартные вычис- ления показывают, что зтх (Х) = «Л/(^Р)» и, следовательно, пп (X) = ~syj(cp). Таким образом, используя предыдущий пример, имеем окончательный результат; Рп (t) = fn (f)/(cp), где fn определяется по (6.9). Для того чтобы обеспечить периоду занятости конечную про- должительность, предположим, что р < q. Обозначим продолжи- тельность периода занятости через Т. Тогда Р{Т>4 = Р(/) = ==2Р„(0- Далее» имеет место равенство £'(/) =— cqPiit). Вего справедливости можно убедиться, суммируя дифференциальные уравнения или опираясь на следующие вероятностные соображе- ния. Пренебрегая событиями с очень малыми вероятностями, получим, что период занятости закончится в интервале между t и t + h тогда и только тогда, когда в момент t в очереди нахо- дится только один вызов и его обслуживание закончится в сле- дующий интервал времени продолжительности h. Эти два условия имеют вероятности Pj\t) и cqh-}-o(h) соответственно, а поэтому плотность распределения Т удовлетворяет условию —Pf(t)~ — cqPi (t). Таким образом, продолжительность периода заня- тости имеет плотность -Р' (() = | 7 h (2сГм 0 (6.16) А Н *
_____________ § 7. Дифференциальные уравнения Колмогорова 543 Этот результат был получен другим методом в конце примера 4, а) и был использован при изучении длины очереди в примёре 9,д) гл. VI (см. задачу 13). ► § 7. ДИФФЕРЕНЦИАЛЬНЫЕ УРАВНЕНИЯ КОЛМОГОРОВА1) Мы вернемся теперь к марковским процессам, состояния кото- рых описываются целыми числами 1, 2, ... .Дифференциальные уравнения Колмогорова были выведены в Г, гл. XVII, 9, и заново в гл. Х,3. В этом параграфе дано независимое изложение, осно- ванное на преобразованиях Лапласа. Чтобы сделать это изложе- ние замкнутым, мы приведем новый вывод основных уравнений, на этот раз в форме уравнений свертки. Основное предположение состоит в том, что если X (т) = i в некоторый момент т, то в течение некоторого промежутка вре- мени /< т + Т, длина которого имеет показательную плот- ность cze"^, значение Х(/) остается постоянным. Вероятность того, что Х(т + Т) = /, равна pif. Пусть дано, что X (0) = Л Тогда вероятность Pik(t) того, что Х(/) = &=/=/, может быть вычислена суммированием по всем возможным значениям момента и размера первого скачка: t pik (0 = S J (!~х) dx (k 1). (7.la) /=1 0 При k = i мы должны добавить член, соответствующий отсут* ствию скачков t PiM) = 4- 5 $ cfi~CiX PijP/i (t-x) dx. (7.16) /=1 о Эти уравнения могут быть объединены, если использовать символ Кронекера 6Zft, равный 1 при k — i и 0 при k^i. 9 Развитая в этом параграфе теория без существенного изменения приме* пима к общим скачкообразным процессам, описанным в гл. Х,3. В качестве хорошего упражнения можно предложить провести доказательство в терминах самих распределений вероятностей без использования преобразований Лапласа» Элегантность утрачивается, но теория легко обобщается при этом на неста* ционарный случай, где коэффициенты Cj и pjk зависят от Л В этом виде теория была развита (для общих скачкообразных процессов) В. Феллером$ см. Trans. Amer. Math. Soc.-, vol. 48 (1940), 488—515 [поправка в т. 58, 474]./ Вероятностное изложение, опирающееся на изучение траекторий, см.' в книге Чжуна, 1960. Обобщение на полу марковские процессы см, в задаче 14.
544 Гл. XIV. Применение преобразования Лапласа Нашим отправным пунктом будет обратное уравнение (7.1)1); при любых данных с,- > О и стохастической матрице р = (pZfc) мы ищем стохастические матрицы P(/) = (P;ft(/)), удовлетворяющие (7.1). С другой стороны, если мы предположим, что в любой конеч- ный интервал времени происходит лишь конечное число скач- ков, мы можем видоизменить наши рассуждения, рассматривая момент х последнего скачка до момента t. Вероятность скачка из j в k имеет плотность а вероятность отсутст- вия скачка между х и t равна e~ci^~x\ Поэтому вместо (7.1) мы получаем прямое уравнение t 00 Ры (О = 6,^-? + $ 2 P.J (X) cjPjke-^ V-X)dx. (7.2) о /=1 Однако, как мы увидим, существуют процессы с бесконечным числом скачков, удовлетворяющие обратному уравнению. Следо- вательно, прямое уравнение не вытекает из основных предполо- жений о рассматриваемом процессе. Это обсуждалось в гл. Х,3, а также в 1; XVII, 9. В терминах преобразований Лапласа 00 ^ikW = \^Pik(t)dt (7.3) О обратное уравнение (7.1) принимает вид П'-ИЧ=^ + ^ ЗлАИЧ- (7.4) Мы перейдем теперь к более удобным матричным обозначениям (правила действий над матрицами вполне применимы к бесконеч- ным матрицам с неотрицательными элементами). Мы вводим мат- рицы п СМ = (П/feW), ^(О = (Лй(О). Р==(Р«) и диагональную матрицу с с элементами ch Через 1 мы обозначим вектор-стол- бец, все компоненты которого равны 1. Суммы по строкам мат- рицы А образуют вектор-столбец А1. Наконец, I обозначает единичную матрицу. Из (7.4) видно, что обратные уравнения (7.1) превращаются в (2с + с) П (X) = I + срП (X), (7.5) а прямые уравнения—в П(Х)(Х + с) = 7 + П(2с)ср. (7.6) х) Замена переменных y—t—х облегчает дифференцирование, производя которое найдем, что уравнения свертки (7.1) эквивалентны системе дифферен- циальных уравнений p'ik (о=- ctpik (о+а 2 PijPjb io при начальных условиях Ргт(О) — 1 и Р^(0) = 0 при k # i. Эта система со гл а* суется с Г, гл. XVII, (9.14), с той разницей, что там коэффициенты с/ и pij зависели от времени и Р^ было функцией двух переменных т и t. а н,е только разности t—т,
§ 7, Дифференциальные уравнения Колмогорова 545 Чтобы построить минимальное решение, полагаем последова- тельно (X + с) П'®>(Х) = I, (Х4-с)П<«+1>(Х) = / + срП<«>(Х). (7.7) Для сумм по строкам матрицы ХП(П) (X) мы вводим обозначение ХП<В>(Х)1 = 1 — £<»>(Х). (7.8) Подставляя в (7.7) и вспоминая, что р1 = 1, получаем (Х-|-с)^+1>(Х) = срВ(п>(Х). (7.9) Так как |(0)^0, то g(n)(X)^O при всех п. Поэтому матрицы ХП(П) (%) субстохастические. Их элементы суть неубывающие функ- ции п. Поэтому существует конечный предел П‘*’(Х) = 11тП<">(Х), (7.10) п -*8 и .матрица ХП(ю)(Х)—стохастическая или субстохастическая. Очевидно, что П<со)(Х) удовлетворяет обратному уравнению (7.5) И что для любого другого неотрицательного решения П (Л.) тривиаль- но верно неравенство П (А,) П(о) (X). По индукции П (%) П(в) (%) при всех п. Таким образом, П(Х)>П<“>(Х). (7.11) Менее очевидно, что П(*’ (X) удовлетворяет и прямому урав- нению (7.6). Для доказательства этого мы установим по индук- ции, что П<«> (X) (X + с) = 14- (X) ср. (7.12) Это верно при п=1. Предполагая справедливость (7.12) и про- изводя подстановку в (7.7), получаем (X + с) П'”*1» (X) (X + с) = X/ + с + [/ + срП<«-1> (X)] ср. (7.13) Выражение в скобках равно (Х4-с)П(п>(X). Умножая (7.13) слева на (X-j-c)-1, приходим к (7.12) с заменой п на n-j-l. Следова- тельно, это соотношение верно при всех п, и поэтому П(“>(Х) удовлетворяет прямому уравнению. Повторяя рассуждение при выводе (7.11), мы видим, что лю- бое неотрицательное решение прямого уравнения (7.6) удовлет- воряет неравенству П (X) П("> (X). По этой причине П1”’ (X) назы- вается минимальным решением. Нами доказана, таким образом, Теорема 1. Существует матрица П(”’ (Х)^0, у которой суммы по строкам не превосходят X-1 и которая удовлетворяет урав- нениям (7.5) и (7.6). Сверх того, для любого неотрицательного решения уравнения (7.5) или (7.6) выполняется неравенство (7.11). Теорема 2. Минимальное решение является преобразованием Лапласа семейства субстохастических или стохастических мат- 18 №249
546 Гл. XIV. Применение преобразования Лапласа риц P(f), удовлетворяющих уравнению Чепмена—Колмогорова P(s + t) = P(s)P(i), (7.14) а также прямому и обратному уравнениям (7.1), (7.2). При этом или все матрицы P(t) и ХП(“’’(Х) (t > О, Х>0) строго сто- хастические, или ни одна из них не обладает этим свойством. Доказательство. Отбросим верхний индекс оо и будем писать П (X) вместо П(“*(Х). Из определения (7.7) ясно, что П^’(X) есть преобразование положительной функции Р^, представляющее собой свертку конечного числа показательных распределений, В силу (7.8) суммы по строкам элементов Р{п} (t) образуют мо« нотонно возрастающую последовательность, ограниченную 1. По» этому П(Х) есть преобразование матрицы P(t), стохастической или субстохастической. Из (7.5), (7.6) ясно, что P(t) удовлетво* ряет первоначальным прямому и обратному уравнениям; отсюда вытекает, что P(t) непрерывно зависит от t. Ясно, что если для P(t) i-я сумма по строкам < 1 при некотором t, то i-я сумма по строкам матрицы П (X) будет < Х-х при всех X и обратно. Выразим уравнение (7.14) в терминах преобразований Лап* ласа. Для этого умножим его на e~M~vs и произведем интегри* рование по t и s. Справа получим произведение матриц П (X) П (v). Левая часть легко оценивается с помощью подстановки х = 14- s, z/ =— (Ч-s. Окончательный результат таков: — ~= П (Х)П <v)- (7.15) Обратно, (7.15) влечет за собой (7.14) [это рассуждение повтори* ется в примере 8, а) гл. ХШ]. Для доказательства (7.15) рассмотрим матричное уравнение (X+c)Q = Д + cpQ. (7.16) Если А и Q неотрицательны, то, очевидно, Q>(X+с)-1 А = П<0) (X) А и по индукции Q П(л> (X) А при всех п. Таким образом, Q П (X) А. Теперь П (v) удовлетворяет (7.16) с А = 14- (X—v) П (v)f и потому при X > V П(т)>П(Х) + (Х—v)n(X)II(v). (7.17) С другой стороны, правая часть (7.17) удовлетворяет прямому уравнению (7.6) с X, замененным на v. Поэтому она не меньше П (у), и в (7.17) имеет место знак равенства. Доказательство за* конченох). х) Уравнение (7.15) есть резольвентное уравнение для семейства сжатий &П (X) на банаховом пространстве ограниченных векторов-столбцов. Мы ви» дели в гл. XIII, 10, что оно выполняется тогда и только тогда, когда об» ласть значений этих преобразований не зависит от X, Это гарантируется их минимальным характером,
§ 7. Дифференциальные уравнения Колмогорова 547 Чтобы понять, является ли матрица АП(О0) (А) строго стохасти- ческой1), мы вернемся к соотношениям (7.8) и (7.9). Так как элементы |<л) (^) суть невозрастающие функции п, то существует Ьредел В (А) ?= lim В*"’ (А), такой, что АП(0°>(А)1 = 1 — В (А) (7.18) 9 (А + с) В (А) = срВ (А), O<BW<1. (7.19) С другой стороны, мы имеем (А+с)В(0)(А)==с1=ср1, (7.20) р потому В(о) (А) В (А) Для любого вектора, удовлетворяющего (7.19). Из (7.9) по индукции выводим В<л) (А) > В (А) Для всех п, так, что вектор В (А) в (7.18) является максимальным вектором, удов- летворяющим (7.19). Таким образом, верна Теорема 3. Дефекты по строкам минимального решения опи- сываются максимальным вектором В (А), удовлетворяющим (7.19). Следовательно, матрица АП*"1 (А) будет строго стохастической Тогда и только тогда, когда (7.19) влечет за собой В(А) = О. Следствие 1, Если cz М < оо при всех I, то минимальное решение будет строго стохастическим {так что ни прямое, ни 'обратное уравнения не имеют других допустимых решений). Доказательство. Дробь с/(А 4-с) является возрастающей функ- цией с. Из (7.19) по индукции получаем при всех п. Следовательно, g(X) = O. ► Если А (X)—матрица с элементами вида I/(X) rjfe (X) с произвольными то П (Х)4~Д (X) снова будет решением обратного уравнения (7.5). Всегда Можно выбрать А (X) так, чтобы получить допустимые матрицы, удовлетворяю-* )цие уравнению Чепмена — Колмогорова. Эта процедура проиллюстрирована в Следующем параграфе. Соответствующие процессы характеризуются наличием бесконечного числа скачков в конечном промежутке времени. Любопытно, что прямые уравнения могут выполняться, даже когда их интерпретация в тер- минах последнего скачка недопустима. Таковы основные результаты. Мы закончим параграф крите- рием, полезным в применениях и интересным с той точки зре- ния, что при его доказательстве появляются понятия теории потенциалам ядро Г в (7.25) служит типичным примером потен- №--------- *) Предостережение. Казалось бы, что формальное умножение прямого уравнения на вектор-столбец 1 должно привести к тождеству ХП (X) 1 = 1> Однако получающийся ряд может расходиться» Эта процедура законна^ если все с/ ограничены (следствие
548 Гл. XIV. Применение преобразования Лапласа циала. Допустим, что fz>0. Перепишем (7.19) в форме g(%)4-Xc-1U^) = pBW. (7.22) Умножая на pft и суммируя по k — Q, п—1, получаем /2-1 W+% 2 pftc-ig (X) = (%). (7.23) Л = 0 Отсюда следует, что (X) монотонно зависит от п, так что р'^(Х)—>%, где х—минимальный вектор-столбец, удовлетворяю- щий *) рх = х, |(Х)<Х1. (7.24) Определим теперь матрицу (возможно, с бесконечными элемен- тами) равенством Г = (7.25) л=1 Полагая в (7.23) п—>оо, получаем £(Ь) + Щ(Х) = х. (7.26) Отсюда вытекает, что (X) = 0 при каждом k, для которого Vkk — оо, Так будет, если k является возвратным состоянием цепи Маркова с матрицей р. Мы имеем Следствие 2. Минимальное решение будет строго стохасти- ческим (и потому единственным), если в дискретной цепи Мар- кова с матрицей р все состояния возвратны. § 8. ПРИМЕР: ЧИСТЫЙ ПРОЦЕСС РАЗМНОЖЕНИЯ Вместо того чтобы продолжать изложение общей теории, мы подробно рассмотрим процессы, в которых возможны лишь пере- ходы i—>/+1. Они дают хорошую иллюстрацию того, какими могут быть процессы в обстановке неединственности. Во избежа- ние тривиальностей допустим, что > 0 при всех i. По опреде* лению pz, z+1 = l и pitk = 0 для всех других пар индексов. Обрат- ное и прямое уравнения сводятся теперь к (Х-j*0j) (X)—ь W = ^ik (8*1) и + ck) (?0 k-i W (8-2) где 6^=1 при l = k и 0 в других случаях. Положим для крат- *)Нетрудно видеть, что х не зависит от А, и АП(оо) (tyx=x— | (А,)»
§ 8. Пример: чистый процесс размножения 549 Трости Pz cH-V Г‘ с/+Г (8-3) Функция pz есть преобразование Лапласа (показательного) вре- мени пребывания в состоянии /, a rt есть обычное преобразова- ние Лапласа для вероятности того, что это время превосходит Л В дальнейшем следует иметь в виду зависимость Гу и ру от X. а) Минимальное решение. Легко проверить, что • ш - Jp/P/+i *'' Р*"1Г* для k l’ /ft 1 0 для k < i (8-4) является минимальным решением как для (8.1), так и для (8.2). В (8.4) отражается тот факт, что переходы из i в k > i невоз- можны, а момент прихода ъ kyi равен сумме k—I независимых времен пребывания в I, ..., k—1. Пусть Pik(t) обозначают переходные вероятности процесса, определенного в (8.4). Докажем следующий важный результат, который был получен другими методами в 1; гл. XVII, 4. Лемма. Если (8.5) то 1 (8.6) для всех i и / > 0; в противном случае (8.6) не выполняется для всех i. Доказательство. Заметим, что Хгй=1—pft, откуда Х[П;7 (Х)+ ... 4-П,-. ,•+„ (20]= 1 — Pt- --Pi+n- (8.7) Следовательно, (8.6) выполняется тогда и только тогда, когда Для всех А > 0 Р,Р1+г...р„-*О, м—>оо. (8.8) Далее, если сп—юо, то pn~a_x/€,« и, следовательно, в этом слу- чае (8.5) необходимо и достаточно для (8.8). С другой стороны, если сп не стремится к бесконечности, то существует такое число q < 1, что рл < q для бесконечно многих п. Следовательно, и (8.8), И (8.5) выполняются. ► В том случае, когда ряд в (8.5) расходится, ничего особенного не происходит: сп однозначно определяют процесс размножения, удовлетворяющий основным исходным постулатам. Поэтому в дальнейшем предположим, что ^сй1 < оо. Дефект 1—2Л*(0 равен вероятности того, что к моменту
550 Гл. XIV. Применение преобразования Лапласа система прошла через все состояния или «достигла границы оо»( Момент достижения есть сумма времен пребывания в г, i’+1, .. ,ц Этот ряд сходится с вероятностью единица, так как сходится в силу (8.6) ряд из соответствующих математических ожиданий. В процессе, начинающемся в состоянии I, момент достижения ос? имеет преобразование Лапласа gz = limp/p(.+j...p1.+„ (8.9) П “> 00 и удовлетворяют уравнению (7.19), а именно (% + С/)?,. = сД.+1. (8.10) Для сумм по строкам получим из (8.7) x2nZft(X)=i-gz. (8.11) б) Процессы с возвращением. Отправляясь от процесса (8.4), можно определить ряд новых процессов следующим образом, Выберем числа qit такие, что <7z2>0, 2^=1. Мы требуем, чтобы после достижения оо система мгновенно приходила в состояние 1 с вероятностью1) qt. Первоначальный процесс повторяется заново до второго достижения оо. Время между двумя достижениями ор есть случайная величина с преобразованием Лапласа i(*) = 2?&- (8-12) Марковский характер процесса требует, чтобы после второго достижения оо процесс вел себя прежним образом. Теперь мы опишем переходные вероятности P$\t) нового процесса в термин нах соответствующих преобразований Лапласа (Д). Вероят* ность перехода из состояния i в момент 0 в состояние k в mqj мент t без промежуточного захода в оо имеет преобразование (8.4), Вероятность достичь k после ровно одного захода в оо имеет? преобразование Лапласа ?/2?/П/й(Х), и момент второго захода в оо имеет преобразование ^zt(X). Рассматривая последующие возвращения, мы приходим к формуле (X) = nZft (X) + Ъ 2 qjUjb (X), (8.13) где [1—т (X)]-1 = 2 W учитывает многократные прохождений через оо. Тривиальные вычисления, использующие (8.11), пока* зывают, что суммы по строкам в (8.13) равны 1/Х, поэтому П£‘(Х) суть преобразования строго стохастических матриц nepei ходных вероятностей Pret(Z). ?) Варианты процессов с возвращением получаются при 2 9i < 11 Прв достижении оо процесс с вероятностью 1—2 9» обрырается,
§ 9. Вычисление эргодических пределов 5511 Легко проверить, что новый процесс удовлетворяет обратным уравнениям (8.1), но не удовлетворяет прямым уравнениям (8.2). Все происходит так, как и должно быть: постулаты, приводящие К прямому уравнению, нарушены, так как последний скачок не обязан существовать. в) Двусторонний процесс размножения. Чтобы получить про- цесс, удовлетворяющий и прямому и обратному уравнениям, мы видоизменим процесс размножения, приняв в качестве состояний системы числа 0, ±1, ±2.........Все другие условия остаются прежними: постоянные ct > 0 определены для всех целых i и переходы возможны только из i в i'4-l. Предположим опять, что где суммирование идет от —оо до оо. По-прежнему минимальное решение определяется по (8.4). Предел lim nZft(^) = rftpft_ipft_-2pft_s... (8.14) i -> - се существует и может быть интерпретирован как преобразование «вероятности k (t) перехода из — оо в момент 0 в k в мо- мент /». При такой начальной точке процесс пробегает все со- стояния от —оо до оо и «достигает оо» в момент с преобразо- ванием Лапласа lim £л. Определим теперь новый процесс п -> - 00 Следующим образом. Он начинается как процесс, соответствую- щий минимальному решению (8.4), но по достижении оо он пе- рескакивает в — оо и таким образом продолжается неопределенно долго. Построение примера б) приводит к следующим преобразо- ваниям переходных вероятностей: П*(1) = П«(^)+Т^. (8.15) Легко проверить, что П* удовлетворяет и обратному и прямому уравнениям (8.1) и (8.2). В то же время процесс удовлетворяет предположениям, приводящим к обратным уравнениям, но не предположениям, приводящим к прямым уравнениям. § 9. ВЫЧИСЛЕНИЕ ЭРГОДИЧЕСКИХ ПРЕДЕЛОВ И ВРЕМЕН ПЕРВОГО ПРОХОЖДЕНИЯ Можно ожидать, что поведение при t —* оо переходных веро- ятностей в марковском процессе с целочисленными состоя- ниями аналогично поведению переходных вероятностей за боль- шое число шагов в дискретных цепях Маркова (с тем, однако, приятным упрощением, что помехи, создаваемые периодичностью, исчезают). В теореме 1 этот факт устанавливается как простое следствие эргодических теорем 1; гл. XV. Затем нашей основной заботой будет вычисление пределов для переходных вероятностей процессов § 7. Мы покажем также, как могут быть исследованы
552 Гл. XIV, Применение преобразования Лапласа времена первого прохождения. Используемые методы применимы в широком круге задач. Теорема 1. Пусть Р (t) —семейство стохастических матриц, дм которого P(s + t) = P(s)P(t) (9.1) и P(t) —> 1 при t —> 0. Если никакой из элементов Pik не равен нулю тождественно*), то при t—*oo Pik<f)~+uk, (9.2) где или ик = 0 при всех k, или «л>0, 24 = 1 (9.3) к U 2 uj р jk (0=uk‘ (9-4) Вторая возможность осуществляется, если найдется вероят- ностный вектор (щ, и2, ...), удовлетворяющий при некотором i > 0 соотношению (9.4). В этом случае (9.4) верно при всех / > 0, и вероятностный вектор и определяется единственным .способом. (Как уже объяснялось в I; гл. XVII, 6, важная особенность состоит в том, что пределы не зависят от i. Иначе говоря, влия- ние начальных условий асимптотически пренебрежимо.) Доказательство. Фиксируем 6 > 0 и рассмотрим дискретную цепь Маркова с матрицей вероятностей перехода Р(6). Матрица перехода за п шагов будет Р”(6) = Р(п6). Если при некотором п все элементы Prt(n6) положительны, то цепь неприводима и не- периодична, и по эргодической теореме 1; гл. XV, 7, наши ут- верждения верны для значений t, пробегающих подпоследова- тельность 6, 26, 36, ... . Так как любые два рациональных числа имеют бесчисленное множество общих кратных, то предел при п—* оо Prt(n6) будет одним и тем же для всех рациональ- ных 6. Для завершения доказательства достаточно проверить, что Pik (t) есть равномерно непрерывная функция положитель- ная для больших t. По (9.1) Pit (s) Pik (0 < Pik (« + /)< pik (0 + [1 -Plt (S)] (9.5) [первое неравенство тривиально, а второе вытекает из того фак- та, что члены Pz/(s) с /=/=£ в сумме дают 1—Pi7(s)]. Для до- статочно малых s имеем 1—e^Pn(s)^l, так что из (9.5) сле- х) Это условие введено только во избежание тривиальных осложнений}1 этого же можно достигнуть, ограничиваясь надлежащим образом выбранными множествами состояний. Нетрудно видеть, что наши условия влекут строгую положительность (/) при всех
§ 9. Вычисление эргодических пределов 553 дует равномерная непрерывность Pik. Из (9.5) видно также, что если Рг*(0>0» то Plk(t + s) > 0 в некотором интервале значе- ний s фиксированной длины. Поэтому или Pik тождественно равно нулю, или, начиная с некоторого момента, становится положи- тельным. Мы применим теперь этот результат к минимальному реше- нию § 7, предполагая, что оно является строго стохастическим (и стало быть, единственным). В матричных обозначениях (9.4) означает uP(t) = u, или, в терминах преобразования Лапласа, пАП(А) = «. (9.6) Пусть вектор и удовлетворяет (9.6) при некотором частном зна- чении % >0. Тогда резольвентное уравнение (7.15) показывает справедливость (9.6) при всех X > 0, а вместе с тем и справедли- вость (9.4) при всех t > 0. Подставляя (9.6) в прямое уравнение (7.6), получаем иср = ис, (9.7) причем компоненты икск конечны (хотя, возможно, не ограниче- ны.) С другой стороны, если и—вероятностный вектор, удовлет- воряющий (9.7), то из (7.12) по индукции следует, что «АП1”’ (А) и при всех п и потому «АП (А) и. Так как матрица АП (А) строго стохастическая, то суммы компонент в правой и левой частях должны быть равны. Поэтому верно (9.6). Нами доказана Теорема 2. Если минимальное решение является строго стоха- стическим (и потому единственным), то соотношения (9.2) выпол- няются с uk> 0 тогда и только тогда, когда найдется вероят- ностный вектор и, удовлетворяющий (9.7). Отсюда вытекает, в частности,- что решение и уравнения (9.7) единственно. Вероятностная интерпретация. Рассмотрим для определенности простейший случай, когда дискретная цепь с вероятностями пе- рехода рц эргодична. Иными словами, мы предполагаем, что су- ществует строго положительный вероятностный вектор а =* = (a,, a2, ...), такой, что ар — а и р1$—>aft при п—>• оо. Тогда ясно, что если o = 2asc*1 < 00 > то вероятностный вектор с ком- понентами uk = akck1/8 удовлетворяет (9.7). В то же время при 0=оо решение не существует. Интуитивно ясно, что переходы в нашем процессе такие же, как и в дискретной цепи Маркова с матрицей р, однако моменты их осуществления иные. Рассмотрим, к примеру, какое-либо со- стояние и пометим его индексом 0. Последовательные времена пребывания в 0 чередуются с временами отсутствия, в продол- жение которых система находится в состояниях j > 0. Число
554 Гл. XIV. Применение преобразования Лапласа переходов в состояние j регулируется матрицей р, а продолжи- тельность пребывания в нем зависит от с,. В дискретной цепи Маркова при большом числе переходов частоты попадания в j и О относятся как а7:а0. Следовательно,. а/а0 равно среднему числу попаданий в j за время отсутствия в 0. Средняя продолжитель- ность каждого пребывания в / равна 1/Су. Поэтому за большой период наблюдения времена пребывания в состояниях / и 0 (а следовательно, и вероятности этих состояний) относятся как ajC^'.a^1 или и^:и0. Эти рассуждения могут быть сделаны строгими, даже в случае, когда Р,-j (/)-> —» 0. В соответствии с теоремой Дермана, упомянутой в 1, гл. XV, 11, если р по- рождает неприводимую и возвратную цепь, то существует вектор а, такой, что ар = а. При этом а определяется однозначно с точностью до постоянного множи. теля а^^О, но ряд может расходиться. Даже в этом случае отношения а/ а0 допускают данную выше частотную интерпретацию, так что рассужде- ния имеют общий характер. Если < «ц то (9.2)—(9.4) выполняются с Uh, пропорциональными а^1. В противном случае Р (f) —>• 0 при t—> оо. Интересно отметить,- что пределы могут быть положительны, даже если все состояния дискретной цепи нулевые. Существование пределов Pik(oo) можно установить также, привлекая аргументы теории восстановления, тесно связанные с поведением времен возвращения. Покажем, как можно вычислить распределение времен возвращения и первого прохождения. При- пишем состояниям номера 0, 1, 2, ... и выделим состояние 0. Рассмотрим новый процесс, который совпадает с первоначальным до момента первого достижения 0, а затем остается в нуле на- всегда. Другими словами, новый процесс получается из старого установкой в нуле поглощающего экрана. Обозначим переходные вероятности .видоизмененного процесса через °Pift(/). Тогда °Р00(/) = 1. В терминах первоначального процесса °/\0(/) равно вероятности первого перехода из «=£ 0 в 0 до момента t, a °Pik (0 равно вероятности перехода из i Ф 0 в k =0= 0 без промежуточного захода в 0. Из вероятностных соображений ясно, что матрица °Р(0 должна удовлетворять тем же самым обратному и прямому уравнениям, что и Р (/), с той разницей, что с0 заменяется на 0. Теперь мы пойдем в обратном направлении! мы изменим обрат- ное и прямое уравнения, заменяя с0 на 0, и покажем, что един- ственное решение этих уравнений имеет требуемые свойства. Пусть g—вектор^ совпадающий с нулевым столбцом П(Х). Обратное уравнение показывает, что вектор (Х4-с—ср)| = т] (9.8) имеет компоненты 1, 0, 0, ... . Теперь обратное уравнение для °П(А) получается заменой с0 на 0, так что если £ обозначает ну- левой столбец #1Щ), то вектор (9.8) имеет компоненты т)£==:112=’ sss ... «0, но т]0 = р 0. Отсюда следует, что вектор с компо- нентами £а™П/;0(Х)—р°Пй0(Л) удовлетворяет (9.8) о л-0. Так
$ 10. Задачи 555 как матрица MI (X) строго стохастическая, то |ft —0 при всех k (теорема 3 из § 7). Так как °П00(Л)= 1/А, мы имеем при k~^() Щв(Х) = Х«П40(Л)Пв0(%). (9.9) Учитывая первое уравнение (9.8), мы видим, что п» w=rh+& 2 рч т п“(Ч- <9-10> i Уравнения (9.9) и (9.10) суть уравнения восстановления с очевид- ным вероятностным содержанием. В самом деле, пусть процесс начинается в точке &>0. Тогда °ПЙ9 есть обычное преобразова- ние Лапласа для вероятности °Pft0 (/) того, что первое попадание в 0 произойдет до момента t. Следовательно, Х°ПАо(Х) представ- ляет собой преобразование Лапласа распределения Fk момента первого достижения нуля. Таким образом, (9.9) утверждает, что PM(t) есть свертка Fk и Роо. Событие Х(/)=0 осуществляется тогда и только тогда, когда первое попадание в 0 происходит в некоторый момент х < t и когда t —х единиц времени спустя система снова находится в 0. Аналогично 2/,о/^°П/о задает распределение Ро времени, про- веденного вне 0, т. е. времени между двумя последовательными пребываниями в состоянии 0. Следовательно, множитель при П00(Х) в правой части (9.10) соответствует времени ожидания первого возвращения в нуль, если система первоначально в нем находится. (Это есть также распределение полного периода, рав- ного сумме времени пребывания и времени отсутствия.) Урав-. нение восстановления (9.10) выражает Роо(/) как сумму вероят* ности того, что время пребывания в нуле превосходит t, и вероят* ности события Х(О = 0 [после первого возвращения в момент х</. Если состояние 0 возвратно, то из (9.10) и теоремы вос- становления следует, что I Ро» (°°>=т+^й’ (9-П) где р.—математическое ожидание времени отсутствия в 0 и Со1 р —• математическое ожидание длины полного цикла. § 10. ЗАДАЧИ 1. Положим в уравнении восстановления (1,3) F! = (/>)» Тогда ,, , Т. (“•>) (Л-j* *
556 Гл. XIV. Применение преобразования Лапласа Разложением на простейшие дроби покажите, что при целых3-) р Р- 1 Р k=0 где a^ = e^^2n^JP и i2 =—1. 2. На линию обслуживания поступает пуассоновский поток вызовов с пара- метром а. Время обслуживания имеет функцию распределения G с преобра- зованием Лапласа у. Пусть Н (t) обозначает вероятность, того, что время обслуживания не превосходит /ив течение этого времени обслуживания не поступают новые вызовы. Покажите, что Н является несобственным распре- делением с преобразованием Лапласа—Стильтьеса, равным у (%+«)• 3. Потерянные вызовы. Предположим, что линия обслуживания из преды- дущей задачи свободна в момент 0. Обозначим через U (t) вероятность того, что все прибывающие до момента t вызовы застают линию свободной. Выве- дите уравнение восстановления для U и покажите, что обычное преобразова- ние Лапласа со для U удовлетворяет линейному уравнению Среднее время ожидания первого вызова, пришедшего в течение периода за- нятости, равно 1+________‘______ а 1 а[1 — у (а)] 4. Продолжение, Решите предыдущую задачу с помощью метода, описан- ного в задаче 17 гл. VI, 13, рассматривая U как распределение полного вре- мени жизни для обрывающегося процесса восстановления с запаздыванием. 5. Если F имеет математическое ожидание р, и дисперсию о2 и если ш < 1, то решение уравнения (4.1) для периода занятости имеет дисперсию (aa+q?)/(l— ср,). 6. В примере 4,6) производящая функция общего числа задержанных автомобилей равна где ф (s) = s<p (с—сф ($))* (10,3) 7. Покажите, что если ф есть преобразование Лапласа собственного рас- пределения вероятностей, то решение ф уравнения (10.3) есть производящая функция некоторого (возможно, несобственного) распределения. Последнее будет собственным тогда и только тогда, когда F имеет математическое ожи- дание jx 1/с. 8. В процессе с поглощающим экраном из примера 5, а) обозначим через F (/, х) вероятность того, что (при условии, что процесс начинается в точке х) поглощение произойдет в течении времени (Таким образом, F обозначает распределение полного времени жизни процесса.) Покажите, что обычное преобразование Лапласа для 1—F выражается интегралом от функции Kabs (х, у) по области 0 < у <_оо, Докажите, что преобразование Лапласа — Стильтьеса для F равно e'-Vzhх в согласии с тем, что это преобразование удовлетворяет дифференциальному уравнению (5.9). 9. Исходя из (5.7), покажите, что функция Грина общего диффузионного х) Корни знаменателя будут одни и те же при р — п и р==п/2, но реше- ния совсем различны. Это показывает, что популярное «разложение по кор- ням знаменателя» требует осторожности при иррациональной функции ф,
§ Задачи 557 уравнения (5.19) в любом интервале необходимо имеет вид А’л (х, У) = —прихСу, W (у) ппи г->. и —ww~ п^х^у> (Ю.4) где и т]л. суть решения уравнения 2кр—— tzcp"—bq' =0, (*) ограниченные соответственно на левом и правом концах. Если(*) не имеет огра- ниченных решений, то gx и qx определяются с точностью до мультиплика- тивной постоянной, которую можно включить в W (в противном случае нуж- но наложить подходящие граничные условия). Покажите, что функция сол, определенная по (10.4) и (5.5), удовлетворяет дифференциальному уравнению’(5.19) в том и только в том случае, когда W есть вронскиан: V (У) = [££ (У) % (У) — & (У) л; (9)1 а/2. (10.5) Решения g% и обязательно монотонны, и потому W (у) Ф 0. 10* Продолжение. При х < у момент первого перехода из х в ухимеет преобразование Лапласа £л(х)/£л(#). При х > у оно равно т)л (#)• 11. Покажите, что метод, использованный в § 5 для диффузионных про- цессов, применим и к общему процессу размножения и гибели1). 12. Разберите пример 6, а) для случая а > 1 линий (вычисление а постоян- ных в явном виде затруднительно и не рекомендуется). 13. В условиях примера 6, б) выведите непосредственно из дифферен- циальных уравнений, что период занятости имеет математическое ожидание г и дисперсию —5-7-----------го. c(q—Р) н с2 (9—Р) 14. Полумарковские процессы. Полумарковский процесс с состояниями 1, 2, ... отличается от марковского тем, что времена пребывания могут за- висеть и от конечного состояния: пусть система входит в состояние i в мо- мент т; тогда условная вероятность того, что пребывание в i оборвется до момента т+/ скачком в k, равна F[k(t). Тогда дает распределение k времени пребывания, a pz^ = Fz-A, (оо) равно вероятности скачка в состояние k. Обозначим через Р^ (/) вероятность состояния k в момент /4-т при условии, что вхождение в i произошло в момент т. Выведите аналог обратного урав- нения Колмогорова. В понятных обозначениях для преобразований Лапласа имеем П(Х) = у(%) + Ф(Х)П(Х), где у(X)-—диагональная матрица с элементами [1—2ф/*А)1А‘ При Fik{t)= k = р/й (1—е~с это сводится к обратному уравнению (7.5), Построение мини- мального решения § 7 осуществимо2). х) Детали и граничные условия см.: W. Feller, The birth and death pro- cess as diffusion process, Jour. Math. Pures Appliquecs, vol. 38 (1959), 301 — 345. 2) Детали см.: W. Feller, On semi-Markow processes, Proc. Nat. Acad. Sci.f 51 (1964); 653—659. Полумарковские процессы были введены П, Леви и В. Смитом и были исследованы, в частности, Р, Пайком:
ГЛАВА XV ХАРАКТЕРИСТИЧЕСКИЕ ФУНКЦИИ Эта глава содержит основы теории характеристических функ- ций и совсем не зависит от гл. VI, VLI, IX — XIV. Более глу- бокое изложение анализа Фурье отложено до гл. XIX. § 1. 'ОПРЕДЕЛЕНИЕ. ОСНОВНЫЕ СВОЙСТВА Производящей функцией неотрицательной целочисленной слу- чайной величины X называют функцию Е($х), определенную для O^s^l, т. е. математическое ожидание величины sx. Как,было показано в гл. XIII, замена переменной s = e~K дает возможность изучать любые неотрицательные случайные величины. Пользу от таких характеристик мы получаем в первую очередь из-за муль- типликативного свойства sx+y — sx-sy и е~Х(х+У) = е~Кхе~кУ. Этим свойством обладает и показательная функция от чисто мнимого аргумента, т. е. функция, определенная для действительных х равенством 4 е^х = cos + i sin g х, (1.1) где £—действительное число и i2 =—1. Так как эта функция ограничена, то ее математическое ожидание всегда существует. Использование Е (е'^х) в качестве замены для производящей функ- ции дает нам мощный универсальный метод, но это достигается ценой введения комплекснозначных функций и случайных вели- чин. Заметим, однако, что независимая переменная остается точ- кой действительной прямой (или будет позже точкой пространства 51г). Под комплекснозначной функцией w — u-^iv понимается пара действительных функций и и V, определенных для действитель- ных х. Математическое ожидание Е(ау)—это не более чем сокра- щенное обозначение для Е (и) 4- iE (и). Как обычно, через w => tpsu—iv мы обозначаем функцию, комплексно сопряженную к w, а через |ш|—абсолютную величину функции а> (т. е. |а»|2=*а ww = ц24-о2). Основные свойства математических ожиданий сохраняются. Объяснения требует только теорема о среднем зна- чении: если j w [ < а, то ,[ Е (ш) | а. В самом деле, по неравен-
§ 1. Определение. Основные свойства 559 ству Шварца | Е (ш) |2 = (Е (и))2 4- (Е (о))2 < Е (и2) 4- Е (о2) = Е (| w |2)< а2. (1.2) Две комплекснозначные случайные величины Wz — U,- 4- г Vy, / = 1, 2, называются независимыми, если независимы пары (Uv VJ и (U2, V2). Обычным разложением на действительную и мнимую части можно показать, что мультипликативное свойство E(W1W2) = E(W1)-E(w2) выполняется (эта формула иллюстри- рует преимущества записи в комплексной форме). После этих подготовительных замечаний дадим определение аналога произво- дящей функции. Определение. Пусть X—случайная величина с распределением вероятностей F. Характеристической функцией распределения F (или случайной величины X) называется функция <р, определенная для действительных £ формулой + 00 Ф (0 = $ F {dx} = w (?) + iv (?), (1.3) — QO где и (£) = J cqs£x-F {dx}, v.(?)] = $ sin£x F {dx}. (1.4) — 00 — 00 Для распределения F с плотностью f имеем, конечно, 4-GO. ф(?)== $ e‘ix f. (x) dx. (1.5) — 00 Замечание по терминологии. В анализе Фурье функцию <р принято называть преобразованием Фурье—Стильтьеса распреде- ления F. Такие преобразования определены для любой конечной меры, и термин «характеристическая функция» подчеркивает, что значение меры на всем пространстве равно единице (для других мер характеристические функции не определены). Но- интегралы типа (1.5) встречаются во многих ситуациях, и мы будем гово- рить, что (1.5) определяет обычное преобразование Фурье функции f. Характеристическая функция распределения F является обыч- ным преобразованием Фурье плотности f (когда последняя су- ществует), но термин «преобразование Фурье» применяется также и к другим функциям. Для удобства ссылок мы перечислим некоторые основные свойства характеристических функций. Лемма 1. Пусть (f) = u-^iv—характеристическая функция случайной величины. X с распределением F. Тогда. а) ф непрерывна', б) Ф.(0) = 1 ы |ф(£)|^1 пРи есех
660 Гл. XV. Характеристические функции в) аХ + b имеет характеристическую функцию _ Е(^(дХ+&)) = е^<р(ау. (1.6) (в частности, ср —и— iv служит характеристической функцией величины —X); г) и—четная, a v—нечетная функция*, характеристическая функция действительна тогда и только тогда, когда распределе- ние F симметрично*, д) для всех £ 0<1-^(2^)<4(1-«(^)). (1.7) (Другие варианты леммы см. в задачах 1—3.) Доказательство, а) Заметим, что | е^х | = 1 и поэтому] |^u+h)_e^| = |^_i |. (18) Правая часть не зависит от х и может быть сделана сколь угодно малой при достаточно малом h. Таким образом, ф на самом деле даже равномерно непрерывна. Свойство б) с очевидностью выте- кает из теоремы о среднем значении, а свойство в) не требует пояснений. Для доказательства п. г) мы привлечем тот факт, что различным распределениям соответствуют различные характери- стические функции. В самом деле, ср действительна тогда и только тогда, когда <р = <р, т. е. тогда и только тогда, когда X и —X имеют одинаковые характеристические функции. Но это равно- сильно тому, что X и —X имеют одно и то же распределение, т. е. F симметрично. Наконец, чтобы доказать д), рассмотрим элементарное тригонометрическое соотношение 1 —cos 2£х = 2(1 —cos2 tpc) 4 (1 —cos t>x), (1.9) справедливое, поскольку 0^Cl+cos£x^2. Переходя к матема- тическим ожиданиям, получаем (1.7). Рассмотрим теперь две случайные величины Хх и Х2 с рас- пределениями Fj и F2 и характеристическими функциями фх и ф2 соответственно. Если Xf и Х2 независимы, то мультипликативное свойство показательной функции приводит к равенству Е (^ (Xi+x2)) = е (^xt) е (е^х9. (1.10) Этот простой результат часто употребляется, поэтому мы отметим его в форме леммы. Лемма 2. Свертка Ft F2 имеет характеристическую функ- цию фхф2. Другими словами, сумме Хх + Х2 двух независимых случайных величин соответствует произведение фхф2 их характеристических функций1). х) Обратное неверно: в гл. II, 4, д), и в задаче 1 гл. III, 9, показано, что в некоторых исключительных случаях сумма двух вависимых величин может иметь распределение Fx ★ Fz и, следовательно, характеристическую функцию Ф1ф2.
§ I. Определение, Основные свойства 561 Если ;Х2 имеет такое же распределение, как Xj, то [сумма Xf—Х2 оказывается симметризованной величиной (см. гл. V, 5). Поэтому справедливо Следствие. Функция |<р|2 является "характеристической функ- цией симметризованного распределения °F. Следующая лемма дает описание арифметических распреде- лений. Лемма 3. Если ^=^0, то три следующих утверждения эквива- лентны: а) <р(Х) = 1; б) <р имеет период X, т. е. <р (£ + ^Л) = <р (?) для всех £ и п\ в) все точки роста распределения F находятся среди точек 0, ±h, ..., где И, = 2л/Ь. Доказательство. Если в) справедливо и F приписывает массу рп точке nh, то Эта функция имеет период 2n/h. Поэтому из в) следует б), ко- торое в свою очередь влечет за собой а). Обратно, если а) выполнено, то математическое ожидание не- отрицательной функции 1—cos%% обращается в нуль, а это воз- можно только при условии, что 1—coskx = 0 в каждой точке х, которая является точкой роста F. Таким образом, распределе- ние F сосредоточено в точках, кратных 2лД, и, следовательно, в) выполняется. Доказанная лемма покрывает и крайний случай, когда рас- пределение F полностью сосредоточено в нуле. Тогда ср (£) = 1 для всех £, так что каждое число будет периодом для ср. В общем случае из того, что X—период для (р, вытекает, что периодами будут все кратные X: iX, ±2%, .... Но для отлич- ной от константы периодической функции (р существует наимень- ший положительный период. Его называют истинным периодом. Аналогично для арифметического распределения F существует наибольшее положительное h, для которого выполняется свой- ство (в). Такое h называют шагом распределения F. Из леммы 3 следует, что шаг h и (истинный) период К связаны равенством Mi = 2n. Итак, за исключением случаев, когда <р (£) =^= 1 для всех Z =# 0 или когда (р (£) = 1 тождественно, существует наименьшее Й > 0, такое, что ср (Z) == 1, но (р (£) =# 1 Для 0 < £ < к Все сказанное можно сформулировать в более общем виде. Вместо <р(Х)=1 предположим, что только | <р (X) | = 1. Тогда существует такое действительное число &, что q)(k) = eibK, и мы можем применить предыдущий результат к случайной величине X — b с характеристической функцией <р(£)е~1^, равной 1 при £ = %. Каждый период последней функции автоматически будет периодом для |<р|. Таким образом, доказана
562 Гл. XV. Характеристические функции Лемма 4. Существуют только следующие три возможности! а} | <р(£) | < 1 для всех £ т^О; б) | <р (X) | = 1 и | Ф (£) | < 1 для 1 < £ < А.. В этом случае | ф | имеет период % и существует такое действительное число Ь, что распределение F (х±&) является арифметическим с шагом h = 2л/Х; в) | ф (£) | = 1 для всех £. В этом случае ^ф(£) = ^65 и F со* средоточено в точке Ъ. Пример. Пусть распределение F сосредоточено в 0 и 1 и каж- дой из этих точек приписывает вероятность 1/2. Тогда F явля- ется арифметическим распределением с шагом 1, а его характе- ристическая функция ф(£) = (1+е'£)/2 имеет период 2л. Распре- деление F (х4-1/2) сосредоточено в точках ±1/2. Оно имеет шаг 1/2, и его характеристическая функция cos£/2 имеет пе- риод 4л. § 2. СПЕЦИАЛЬНЫЕ ПЛОТНОСТИ. СМЕСИ Для облегчения ссылок мы даем таблицу характеристических функций десяти употребительных плотностей и указываем метод, каким получена каждая функция. Замечания к таблице 1. 1) Нормальная плотность. Для тех, кто не боится интегрирования в комплексной плоскости, резуль- тат есть очевидное следствие подстановки у = х—it,. Чтобы до- казать приведенную формулу, не выходя из области действи- тельных чисел, можно использовать дифференцирование и интег- рирование по частям, что даст ф'(£) =—£ф(£). Так как ф(0) = 1, то 1пф(£) = — ^-£2, что и утверждается. 2)—3) Равномерные плотности. Вычисления здесь очевидны. Распределения (2) и (3) отличаются одно от другого только масштабными параметрами. Связь между их характеристическими функциями можно получить из формулы (1.6). 4) Треугольная плотность. Легко провести прямое вычисле- ние, используя интегрирование по частям. Другой способ: заме- тим, что треугольная плотность является сверткой равномерной плотности на —4а <х <4 а с собой. В силу 3) ее характери- стическая функция равна (•^•siny 1 . 5) Эта плотность получается применением формулы обращения (3.5) к треугольной плотности 4). (См. также задачу 4.) Харак- теристическая функция этой плотности весьма важна, так как многие доказательства в анализе Фурье опираются на использо- вание характеристических функций, равных нулю вне некоторого конечного интервала. 6) Гамма-плотности. Можно воспользоваться подстановкой г/ = л(1 —с£). Если же не выходить из- области действительный
§ 2. Специальные плотности. Смеси 563 чисел, то можно разложить е'х в степенной ряд. Для характери- стической функции получаем на этом пути равенство п=0 0 п=0 п= О в правой части которого стоит ряд для (1—/^)“< (бином с отри- цательным показателем). Таблица I № Название ПЛОТНОСТИ Область определения Характеристическая функция 1 -4-*’ - 1 Нормальная ~г==е V 2л ОО < X < оо е 2 1 ’ eia& — 1 2 Равномерная а 0 < х < а iag 3 Равномерная 1 2а 1*1 < а sin ag «С 4 Треугольная | *| < а 1—cosag аЧ? 5 I 1 — cos. ах ( < |g| при я ах2 — 00 < X < 00 { a |g|<a 0 при | g | > а 6 Гамма —-— Х^ “ 1Р “ % Г (/) л е х > 0, t > 0 1 (l-'g)‘ 7 Двусторонняя показательная — 00 < X < оо 1 2 ’l+ga 8 Коши 1 t 00 < X < 00, е-ИЛ Л /2_|_х2 t > 0 9 Бесселева е-х L ]. (х) х > 0, t > 0 [1-ig- — у (l-ig)2-lp. 10 Гиперболиче- 1 — 00 < X < 00 1 ский косинус jichx ch (ng/2) В частном случае t = 1 (показательное распределение) вычис- ления можйо провести без выхода из действительной области, повторно применяя интегрирование по частям. По индукции то же самое можно проделать при всех целых t. 7) Двустороннее показательное распределение получается сим- метризацией показательного распределения, так что формула для характеристической функции получается из 6) при t = \. Это легко проверить и непосредственно, с помощью повторного интег- рирования по частям,
564 Гл. XV. Характеристические функции 8) Распределение Коши. Снова формула вытекает из предшест- вующей и формулы обращения (3.5). Прямая проверка представ- ляет собой стандартное упражнение на отыскание вычетов. 9) Бесселева плотность. Соответствующая формула—это пре- образование Фурье, аналогичное преобразованию Лапласа, полу- ченному в гл. XIII, 3, г), и может быть доказана тем же путем. 10) Гиперболический косинус. Соответствующая функция рас- пределения равна F(x) = l— (2/tt)arctge”\ Формула 10) не очень важна, но она любопытна тем, что в ней появляются «взаимные пары»: плотность и характеристическая функция получаются одна из другой линейным преобразованием аргумента и линейным пре- образованием самой функции (нормальная плотность служит пер* вым примером такой связи). Для вычисления характеристической функции можно разложить плотность в ряд Применяя результат 7) к отдельным членам ряда, получаем ка- ноническое разложение характеристической функции на простей- шие дроби. (Дальнейшие примеры см. в задачах 5—8.) Возвращаясь к общей теории, укажем метод построения новых характеристических функций, исходя из перечисленных. Принцип весьма прост и, как показывает пример б), с его помощью можно избежать длинных вычислений. Лемма. Пусть Fa, Fit ...—распределения вероятностей с ха- рактеристическими функциями ф0, фх......... Если Рь^О и J1 pk — 1, то смесь U^PkFk (2.1) есть распределение вероятностей с характеристической функцией <» = 2/МР*- (2.2> Примеры, а) Сумма случайного числа слагаемых. Пусть Х1( Х2, ...—независимые случайные величины с одним и тем же распределением F и характеристической функцией ф. Пусть N — целочисленная случайная величина с производящей функцией P(s) = 2^sft и не зависящая от всех Ху. Тогда случайная сумма X14-...4-Xn имеет распределение (2.1) с Fk = Fk*, и соответст- вующая характеристическая функция равна ®(С) = Р(ФО). (2.3) Наибольшего внимания заслуживает частный случай — обобщенное распределение Пуассона. Здесь pk = e~ttn!k\ ©(Q^g-'+MC). (2.4)
§ 2. Специальные плотности. Смеси 565 Обычное распределение Пуассона получается в случае, когда F сосредоточено в точке 1, т. е. когда <р (£) = е^. б) Выпуклые полигоны. Из формулы 5 табл. 1 мы видим, что 1-151 Для |51<1, .... 0 для |£|>1 <2'5> характеристическая. При любых положительных aIt ап смесь ®(?) = Л<р (-^) + ••• 4-/VP (^) (2.6) является четной характеристической функцией, график которой на интервале 0, оо есть выпуклый полигон (см. рис. 1). Дейст- вительно, не ограничивая общности, можно предположить, что ai < < • • • < ап. На интервале 0 < £ < а± график функции © имеет вид отрезка прямой с угловым коэффициентом —(Pi/Of + . .7 ...+р„/ап). На интервале между а, и а2 в этом выражении нужно отбросить член pjat и т. д. Наконец, между a„_f и ап график совпадает с отрезком прямой с угловым коэффициентом — рп1ап. Следовательно, на 0, оо график составлен из п конеч- ных отрезков с убывающим наклоном и интервала ап, оо оси £. Как легко видеть, каждый полигон с этими свойствами может быть графиком функции типа (2.6) (и «сторон» пересекают ось © В точках рп, pn + pn_i, .... рп-\-... +pi= 1). Отсюда можно заключить, что любая четная функция ©^0 с ©(0) = 1, график которой на 0, оо есть выпуклый полигон, является характери- стической функцией,,
566 Гл. XV. Характеристические функций Простой переход к пределу приводит к известному критерии) Пойа [пример 3, б)] и указывает на естественный источник. Hq даже и"наш частный критерий приводит к удивительным и интерес* ным результатам. 2а. Некоторые неожиданные явления Мы несколько отступим от основной темы, чтобы ввести некоторые сне* циальные типы характеристических функций с неожиданными и интересным^ свойствами. Начнем с предварительного замечания относительно арифметиче< ских распределений. Предположим, что распределение G сосредоточено в точках вида nn/Lj п = 0, ±1, ...5 кратных некоторому положительному фиксированному числу зт/L. Точке пп/L распределение G приписывает вероятность п = 0, ±1, Характеристическая функция равна Y(C)= S Pneinn*IL (2.7) И=-00 и имеет период 2L. Обычно нелегко отыскать явное выражение для у, тогд^ как выразить вероятности рг в терминах характеристической функции у не* сложно. Действительно, умножим выражение (2.7) на e~lrn^L. Вероятность рп выступает как коэффициент периодической функции ^/L, интеград от которой в интервале —L, L обращается в нуль при п = гЛ Отсюда еле* дует, что L Pr^ib ^^e~irnVLd^ '=°> i1................ (2.8) -L Теперь мы воспользуемся раньше времени следующим критерием из теоремы I гл. XIX, 4. Пусть у—непрерывная периодическая функция с периодом L >0 и такая, [,что у(0) = 1. у является характеристической функцией тогда ц только тогда, когда все числа рг из (2.8) неотрицательны. В этом случае {рг} автоматически является вероятностным распределением и (2.7) имеет место* Пример, в) Выберем произвольное L^l, и пусть у—функция с перио* дом 2Л, которая при совпадает с характеристической функцией <р из (2.5). Тогда у является характеристической функцией арифметического рас? пределения, сосредоточенного в точках, кратных эт/L» Фактически в силу симметрии (2.8) принимает вид L L Pr=T J7 ©cos (m?/L) dS=r j*(1 ~S) cos (m?/L) (2,9J о 0 и простым интегрированием по частям находим, что Po=l/(2L), = (1—cos rjt/L)^O, г 0, (2.10) Таким образом, нами получено целое семейство периодических характеристик ческих функций, графики которых состоят из периодически повторяющихся правильных треугольников с основаниями 2nL — 1 < х < 2nL +1 и промежуточ* ных отрезков £-оси (см_. рис. 2). (Мы вернемся к этому примеру в более общей ‘постановке при рассмотрении формулы суммирования Пуассона в гл> XIX,5.) Неожиданные примеры, (i) Две различные характеристические функция могут совпадать внутри конечного интервала ^а* а» Это очевидное следам д
§ 2* Специальные плотности* Смеси 567 ₽ие примеров б) и в) показывает существенную разницу между характеристик вескими и производящими функциями (или преобразованиями Лапласа), (ii) Соотношение F * Ff = F * F2 между тремя распределениями вероят* Носте й не влечет1) ва собой равенства Fi~F2> -1 О 1 46 рис. 2. Иллюстрация к примеру в). Действительно? для функции ф? определенной в (2.5), имеем фф< = фф£ Для двух произвольных характеристических функций? совпадающих внутри интервала —1? 1. В частности? имеем ф2 = фу для любой периодической ха* рактеристической функции у из примера в), (iii) Еще более удивительно то, что существуют две действительные ха* рактеристические функции ф£ и ф2? такие, что всюду |ф2|=Ф1^0, В самом деле, рассмотрим характеристическую функцию у примера в) с L=L Ее график на рис. 3 изображен сплошной ломано^1 ли- нией. Мы видели, что соответствующее распределение приписывает Нулю массу} равную 1/2. Исключая этот атом и удваивая все дру- гие массы? получаем распределение с характеристической функцией 2у — 1. Ее график изображен ломаной линией? колеблющейся в Пределах ±1; ее отрезки имеют наклон ±2. Отсюда следует? что 2у zQ — I 5сть характеристическая функция? график которой получается из графика ункции у отражением каждого второго треугольника относительно оси £ (рис. 3). Таким образом, у(£) и 2y(~Q — 1—две действительные характери- стические функции, которые отличаются только знаками, (Подобное построе- ние, относящееся к рис, 2? см, в задаче 9), х) Статистики и астрономы иногда задаются вопросом: содержит ли дан- ное распределение нормальную компоненту? Этот вопрос осмыслен? так как характеристическая функция нормального распределения не имеет нулей и, следовательно, из вытекает фх=ф2> следовательно^ по теореме единственности
568 Гл. XV. Характеристические функции § 3. ЕДИНСТВЕННОСТЬ. ФОРМУЛЫ ОБРАЩЕНИЯ Пусть F и G—два распределения с характеристическими функциями <р и у соответственно. Тогда j e^x-»F{dx}. (3.1) — со Интегрируя по G{d£}, имеем J е-ФФа)б{^}= j v(x-/)F{dx}. (3.2) — со Это соотношение известно под названием равенства Парсеваля (которое, впрочем, может быть записано во многих эквивалент- ных формах; мы вернемся к этому в гл. XIX). Будем рассматривать только специальный случай, когда G = есть нормальное распределение с плотностью ап (ах).^Соответст- вующая характеристическая функция равна у(£) = К2лп(£/а), и поэтому (3.2) принимает вид + 00 +00 j e-ft/<p(;)an(a^)d^ = ]/‘2n J (3.3) — co или, что то же самое, й? Т е~'^ ® е~' *4' = Т C-f1)г w- (3.4) — со — со Удивительно много выводов может быть сделано из этого тож- дества. Прежде всего правая часть является плотностью ★ F— свертки F с нормальным распределением с нулевым математическим ожиданием и дисперсией а2. Таким образом, знание ф позволяет в принципе вычислять распределения для всех а. Но имеет дисперсию а2, и, следовательно, F—>F при а—>0, Отсюда следует, что ф однозначно определяет распределение F. Таким образом, доказана важная Теорема 1. Различным распределениям вероятностей соответ* ствуют различные характеристические функции. Предположим далее, что дана последовательность распределений вероятностей Fn с характеристическими функциями фл, такими, что ф„(£)—>ф(С) Для всех По теореме о выборе из гл. VIII, 6, существует последовательность {п^.и (возможно, несобственное)
3. Единственность. Формулы обращения 569 распределение F, такие, что Fnk—+F. Применяя (3.4) к паре Fn^ и устремляя k—>оо в пределе, мы снова получим тож- дество (3.4) (в левой части используется теорема об ограниченной сходимости, в правой части—то, что подынтегральное выражение п((х—t)/a) обращается в нуль на бесконечности). Но мы видим, что для данной ф тождеством (3.4) F определяется однозначно и, следовательно, предел F одинаков для всех сходящихся под- последовательностей {Fnk}. Таким образом, справедлива Лемма. Пусть Fn — распределение вероятностей с характери- стической функцией фп. Если ф„(£)—>ф(£) при всех то сущест- вует (возможно, несобственное) распределениеF, такое, 4tnoFn—+F> Пример, а) Пусть распределение вероятностей U имеет действительную неотрицательную характеристическую функцию со. Пусть Fn = Un*, так что ф„ (£) = со72 (£). Тогда ф„ (£) —> 0, за исклю- чением множества точек, где со(£) = 1, а по лемме 4 § 1 это множество состоит из всех точек вида где X—некоторое неотрицательное фиксированное число. Отсюда следует, что левая часть в (3.4) равна тождественно нулю, и поэтому Un*—>0. Используя сим- метризацию, заключаем, что Grt*—>0 для любого распределения вероятностей G, которое не сосредоточено в нуле. ► В следующей теореме, по существу, утверждается, что предель- ное распределение F является несобственным тогда и только тогда, когда предельная функция ф разрывна в нуле. Теорема 2. (Теорема непрерывности.) Последовательность распределений вероятностей сходится в собственном смысле к рас- пределению вероятностей F тогда и только тогда, когда последо- вательность {фп} соответствующих характеристических функций сходится поточечно к предельной функции ф и эта функция ф является непрерывной в некоторой окрестности нуля. В этом случае ф является характеристической функцией рас- пределения F. (Отсюда следует, что ф непрерывна всюду и схо- димость фп—>ф равномерна в каждом конечном интервале.) Доказательство, а) Предположим, что Fn—где F—собст- венное распределение вероятностей. Согласно следствию из гл. VIII, 1, характеристические функции фп сходятся к характе- ристической функции ф распределения F, и сходимость эта равно- мерна на конечных интервалах. б) Предположим, что ф„ (£) > ф (£) для всех £. По предыдущей лемме предел F = limFrt существует и справедливо тождество (3.3). Левая часть есть математическое ожидание ограниченной функции вычисленное относительно нормального распределения
670 Гл, XV. Характеристические функций с нулевым математическим ожиданием и дисперсией a~i. При а—>оо это распределение стремится сосредоточиться вблизи нуля, и по- этому левая часть стремится к <р (0), если <р непрерывна в неко- торой окрестности нуля. Но так как <р„ (0) = 1, то <р (0) = 1. С другой стороны, V2л п (х) 1 для всех х и поэтому правая часть не превосходит F{—оо, оо}. Таким образом, F{—оо, оо}^1, и, следовательно, распределение F—собственное. ► Следствие. Непрерывная функция, являющаяся пределом (в смысле поточечной сходимости) последовательности характеристических функций, сама является характеристической. Пример, б) Критерий Пойа. Пусть ю —действительная непре- рывная четная функция, равная единице в нуле и нулю на беско- нечности. Пусть график ее является выпуклым на 0, оо. Тогда го —.характеристическая функция. Действительно, мы видели в примере 2, б), что это утверждение верно для случая, когда график функции го—выпуклый полигон. Так как полигоны, впи- санные в вогнутую линию, сами выпуклы, то общее утверждение вытекает из приведенного выше следствия. Этот критерий (вместе со сложным доказательством) в свое время сыграл интересную роль. Пойа с его помощью доказал в 1920 г., что е-1г,“ при 0 < а 1 является характеристической функцией устойчивого распределения (говорят, что Коши был уверен в этом, но не имел доказательства). В действительности е~1 £ |<х есть характеристическая функция даже при 1 < а 2, но критерий уже неприменим. ► Мы отложим до гл. XIX систематическое применение метода, развитого при доказательстве теоремы 1. Мы, однако, используем этот метод здесь для вывода важной теоремы, которая уже была использована при составлении таблицы в § 2 (формулы 5 и 8). Условимся для краткости писать ф С L в том и только том случае, если |ф| интегрируема на —оо, оо. Теорема 3. (Обращение интеграла Фурье.) Пусть ф — характе- ристическая функция распределения F и <p£L. Тогда F имеет ограниченную непрерывную плотность f, определенную формулой + 00 J ^SW)C (3.5) — со Доказательство. Обозначим правую часть (3.4) через Тогда /д—плотность свертки Fa = ^a-^ F распределения F с нор- мальным распределением с нулевым математическим ожиданием и дисперсией а?. Отсюда, как уже упоминалось, следует, что +F при а—>0. Из представления левой части (3.4) видно, что ограничено, где /—ограниченная непрерывная
§ 3. Единственность. Формулы обращения 571 функция, определенная в (3.5). Таким образом, для каждого огра- ниченного интервала I Fa{I} = \fa(t)dt-^fWdx. (3.6) I I Но если I—интервал непрерывности для F, то Fa{7} стремите^ к F (/}, так что f действительно является плотностью распреде* ления F. ► Следствие. Если ф О, то <p£L тогда и только тогда, когда соответствующее распределение F имеет ограниченную плотность. Доказательство. По теореме 3 интегрируемость функции ф влечет за собой существование у F непрерывной ограниченной плотности. Обратно, если F имеет плотность f < М, то мы получае^ из (3.4) при / = 0 + СО J + 00 J Фа)е"“аЧ2^=рХ- J (3.7) — 00 — 00 Подынтегральное выражение слева неотрицательно, и, если бы ф не была интегрируема, левый интеграл стремился бы к оо при а—>0. ► Примеры, в) Тождество Планшсреля. Пусть распределение F имеет плотность f и характеристическую функцию ф. Имеем | ф |2 £ L тогда и только тогда, когда f-^L, ив этом случае + 00 + 00 j P(y)dy = -L J |ф(0|М£. (3.8) — 00 — 00 Действительно, ] Ф р—это характеристическая функция симметрии зованного распределения °F. Если | ф |2 £ L, то плотность + оо °/W= $ f(y + x)f(y)dy (3.9) — 00 распределения °F ограничена и непрерывна. Левая часть в (3.8) равна (0), а применяя формулу обращения (3.5) к °f, убеждаемся) что то же самое справедливо и для правой стороны. Обратно, если f2 С L, то применение неравенства Шварца к (3.9) показывает, что °/ ограничена, и в силу приведенного выше следствия | ф р € Мы вернемся к соотношению (3.8) в гл. XIX, 7. ✓ г) Теорема непрерывности для плотностей. Пусть ф„ и ф-ч интегрируемые характеристические функции, для которых + 00 — ОС
572 Гл. XV. Характеришические функции" По следствию теоремы 3 соответствующие распределения Fn и F имеют ограниченные и непрерывные плотности fn и f. Из формулы обращения (3.5) ясно, что + 00 И„(х)-7(х)|<(2«и $ |Ф„(?)-Ф(?)!<• — 00 При этом сходимость fn—равномерна. (См. задачу 12.) д) Формула обращения для функций распределения. Пусть F — распределение с характеристической функцией ср, и пусть h > 0 — Ьроизвольно, но фиксировано. Докажем, что F(x+h)-F(x) = С ф(0е_(3д j} — 00 как только подынтегральное выражение в правой части интегри- руемо (например, если подынтегральная функция есть О(1/£2), т. е. если | ф (£) | — О (1/£) при £—>оо). В самом деле, левая часть йредставляет собой плотность свертки F с распределением, равно- мерным на —h, 0; множитель при е~‘& под интегралом есть Характеристическая функция этой свертки. Поэтому (3.11) пред- ставляет собой не что иное, как частный случай общей формулы обращения (3.5). ► Замечание о так называемой формуле обращения. Формула (3.11) приме- дима только в случае, когда функция | <р (£)/£ | интегрируема на бесконечности, В общем же случае применяются формулы, получаемые ее видоизменением* Например, пусть Fa снова обозначает свертку распределения F с симметричным относительно нуля нормальным распределением с дисперсией а2, Тогда по (3.11) F. ф(Ос-4«-ц^._,м, (,12) — 00 Если х и x-\-h—точки непрерывности распределения F, то правая часть стре- мится к [F (*+А) — F (x)]/h при а—>0. Это—типичный пример «теоремы обращения». Можно предложить бесчисленное множество эквивалентных фор- мулировок. Традиционная форма получается заменой в (3.12) нормального распределения распределением, равномерным на — t, t, и переходом к пределу при t—> оо. В силу традиции формулы обращения остаются популярной темой, гкотя они и потеряли в значительной степени свою важность. Заметим, что вывод их из интеграла Дирихле выпадает из логической структуры всей теории» От распределений с интегрируемыми характеристическими функ- циями мы перейдем к решетчатым распределениям. Пусть F при- писывает массу pk точке b + kh, где и.2рй—1. Характе- ристическая функция <р имеет вид ф(£)=2р/М)£. (3.13) — 0D Предположим, что h > 0.
g 4. Свойства регулярности 57§ Теорема 4. Если у—характеристическая функция вида (3.13), то л/h Pr = -^ j <p(S)e-'(t+rA)E^. (3.14) — л/Л Доказательство. Подынтегральное выражение может быть пред- ставлено в виде ряда, где множитель при pk равен Ин- теграл от него равен 0, если k^r, и 2л//г, если & = г, так что (3.14) верно. ► § 4. СВОЙСТВА РЕГУЛЯРНОСТИ Основной результат этого параграфа может быть грубо резю- мирован так: чем меньше «хвосты» распределения F, тем глаже его характеристическая функция <р; обратно, чем глаже F, тем лучше ведет себя <р на бесконечности (леммы 2 и 4). Многие оценки, связанные с характеристическими функциями, опираются на оценку ошибки, с которой функция еа аппроксимируется ко- нечным отрезком своего ряда Тейлора. Следующая ниже лемма показывает, что эта ошибка мажорируется первым отброшенным членом. Лемма I1). Для п = 1, 2, ... и / >0 Доказательство. Обозначим выражение, стоящее под знаком абсолютной величины, через р„ (/). Тогда t Pi (0 —1 $ elx dx, (4.2) 6 откуда | Pj (/) | t. Далее, при п > 1 t Pn(0 = ^Pn-i(x)dx, (4.3) о и (4.1) выводится теперь по индукции. ► В дальнейшем F будет обозначать произвольное распределение, а <р—его характеристическую функцию. Моменты и абсолютные моменты распределения F (коль скоро они существуют) обозначим = $ xnF{dx}, Мп= J |x|”F{dx}. (4.4) — оо — оо *•) То же самое доказательство показывает, что при оставлении в ряде Тейлора для sin t или cos / конечного числа членов ошибка имеет тот же знак, что и первый отброшенный член, и меньше его по абсолютной величине Например, 1 — cos / /2/2,
|74 Гл. XV. Характеристические фцнкй^й Лемма 2. Если Мп < оо, то п-я производная от <р существует, Непрерывна и задается формулой ф(л) J gi^x хпр (4.5) — со Доказательство. Разностное отношение для <р равно fg+>.>-T(O=p,t.^fW. (4.6) — 00 р соответствии с последней леммой подынтегральное выражение мажорируется функцией | х |, и потому для п = 1 утверждение (4.5) йытекает из теоремы о мажорированной сходимости. Общий случай Доказывается по индукции. ► Следствие. Если т2<°о, то ф' (0) = imt, ф" (0) — — т2. (4.7) Утверждение, обратное к последнему1), также верно: если ф"(0) существует, то /п2 < оо. Доказательство. Обозначая действительную часть функции ф «крез и, имеем ’X?F W- <4-8) — со Так как и" (0) существует, то производная и' определена в окрест- ности нуля и в нуле непрерывна. В частности, и' (0) = 0, так как —четная функция. По теореме о среднем значении существует такое число 0, что 0 < 0 < 1 и р (/0 —1J р ' (49) При h—>0 правая часть стремится к и" (0). Но отношение под интегралом в (4.8) стремится к 1/2, так что интеграл стремится к оо, если /п2 = оо. См. обобщение в задаче 15. ► Примеры, а) Функция ф, отличная от постоянной и такая, что <фг'(0) = 0, не может быть характеристической, так как соответ- ствующее распределение должно было бы иметь второй момент, равный нулю. Например, функция e-Kia при ос>2 не будет кар актер истической. ----------- Метод неприменим к первой производной. Проблема отыскания условий существования о/ (0), привлекавшая долгое время внимание, решена | гл, XVIЬ 2а,
§ 4. Свойства регулярности б) Слабый закон больших чисел. Пусть Xv Х2, ...—незавиц симые случайные величины с Е (Ху) = 0 и одной и той же характер ристической функцией ср. Положим S„ = Хх-|-• • • + Х„. Средне^ арифметическое Sn/ti имеет характеристическую функцию <р" (?/«), ’ В окрестности нуля <p(/i) = 14-о (Я), и потому <р (?/«) = 1 + о (1/п) при п—+оо. Переходя к логарифмам, мы видим, что <р" (?/«) —* h) По теореме непрерывности (теорема 2 из § 3) отсюда вытекает,1 что распределение величины Sn/n сходится к распределению, сосре* доточенному в нуле. Это и есть слабый закон больших чисел. Такая простота и ясность доказательства вообще типичны для метода характеристических функций. Некоторое видоизменение этого рас-»' суждения приведет нас к доказательству центральной предельной теоремы1). ► Лемма 3. (Риман—Лебег.) Если g интегрируема и + оо 7(0= $ e^xg{x)dxt (4.Ю) — 00 то '?(£)—’ О при *±°°. Доказательство. Утверждение проверяется непосредственно для ступенчатых функций с конечным числом ступенек. Для про,-» извольной интегрируемой функции g и любого е > 0 найдется n<J) теореме об аппроксимации в среднем из гл. IV, 2, такая ступеи* чатая функция gt с конечным числом ступенек, что + 00 $ \g(x)—gi(x)ldx<&. (4.11) — 00 Соответствующее преобразование gt функции. из (4.10) обра* щается в нуль на бесконечности, и вследствие (4.10) и (4.11) длй всех £ имеет место неравенство |.у(£)—Vi (£) 1 < е. Соответственнд [Т1 (01 < 2® Для всех Достаточно больших | £ |, а поскольку е про- извольно, то 71(0—>0 при £—>±оо. ► В качестве простого следствия получается Лемма 4. Если F имеет плотность f, то <р(£)—>0 при 1-^±оо. Если f имеет интегрируемые производные f'-, |ч>(Ш=°([БГв) при Г£|—>о°- Доказательство. Первое утверждение содержится в лемме 3, В гл. VII 7? было показано, что слабый закон больших чисел може^ выполняться даже в том случае, когда величины Ху не имеют математически^ ожиданий. Доказательство в тексте показывает^ что существование производной Ф* (0) есть достаточное условие4 На самом деле это условие также необходимо (см. гл8 XVII; 2а),
676 Гл. XV. Характеристические функции Если f1 интегрируема, то интегрирование по частям показывает, что + оо Ч>(0 = -^ j е*хГ(х)<1х (4.12) — 00 и, следовательно, |<р(£)| = о(|£|-1) и т. д. ► Дополнение. Разложение Тейлора для характеристических функций. Неравенство (4.1) можно переписать в виде I irx( Их 1 itx (^)"“1\1^- \tx\n /Л 1Q\ | elix 1 _. _1_2__ j | < J_!_, (4.13) Отсюда, используя (4.5), получаем I I /п-1 I I /\п Iф(5+0-ф(О—ф'(9-...Ф'""1’© I < • (4J4) Если Мп < оо, то это неравенство верно при любых £ и / и дает верхнюю границу для модуля разности между ф и первыми членами ряда Тейлора. В частном случае, когда F сосредоточено в точке 1, неравенство (4.14) превращается в (4.1). Предположим теперь, что все моменты существуют и что Йш — A4yn = X < оо. (4.15) П 00 Из формулы Стирлинга для п\ тривиально вытекает, что при |/| < 1/(ЗХ) правая Часть неравенства (4.14) стремится к нулю при п—> оо, так что ряд Тейлора для ф сходится в некотором интервале вокруг £. Отсюда следует, что ф ана- литична в некоторой окрестности любой точки действительной оси и, стало быть, однозначно определяется своим разложением в степенной ряд в окрест- ности нуля. Но ф(/г> (0) = (l)n тп, так что ф однозначно определяется моментами тп распределения F, Соответственно если (4.15) выполняется, то распределение F однозначно определяется своими моментами и ф аналитична в некоторой окрест- ности действительной оси. Этот критерий единственности слабее, чем указанное в гл, VII достаточное условие (3.14), принадлежащее Карлеману: = оо. Но оба критерия не так уж далеки один от другого (пример распределения, не определяемого однозначно своими моментами, приведен в гл. VII, 3). § 5. ЦЕНТРАЛЬНАЯ ПРЕДЕЛЬНАЯ ТЕОРЕМА ДЛЯ ОДИНАКОВО РАСПРЕДЕЛЕННЫХ СЛАГАЕМЫХ Исследования, связанные с центральной предельной теоремой, сильно влияли на развитие и совершенствование методов, приме- няемых теперь повсюду в теории вероятностей. Поэтому представ- ляется поучительным сравнение различных доказательств. До по- следнего времени метод характеристических функций (впервые употребленный П. Леви) был несравненно проще, чем прямой подход, примененный Линдебергом (мы не говорим здесь о других доказательствах). Освобожденный от усложнений современный ва- риант последнего метода (изложенный в гл. VIII, 4) не труднее метода характеристических функций и, кроме того, имеет некото*
§ 5. Центральная предельная теорема Ы7 рые преимущества. С другой стороны, метод характеристических функций приводит к уточнениям, которые в настоящий момент не удается получить прямыми методами. К их числу относятся локаль- ные предельные теоремы этого параграфа, а также оценки ошибок и асимптотические разложения, изучаемые в следующей главе. Мы выделяем случай слагаемых, имеющих одно и то же распределение отчасти из-за важности и отчасти потому, что желаем на примере простейшего случая показать существо метода. Всюду в этом параграфе Хь Х2, ... предполагаются незави- симыми случайными величинами с одним и тем же распределе- нием F, которому соответствует характеристическая функция <р. Мы предполагаем также, что Е(Х/) = 0, Е(Х®)=1, (5.1) и обозначаем S„ = Xt Х„. Теорема !х). Распределение величины Sj^ п сходится к нормаль- ному распределению 91. В силу теоремы непрерывности (теорема 2 из § 3) это утверж- дение эквивалентно следующему? при п —► оо и всех £ <pn('-U-')->e“~S2. (5.2) \ V п / Доказательство. По лемме 2 предыдущего параграфа существует непрерывная вторая производная ф", и, следовательно, по формуле Тейлора Ф(х) = ф(0)4-хф'(0) + у х2ф" (0) 4-о (х2), х—>0. (5.3) Задаваясь произвольным £ и полагая х = £/п, получаем ф(-4=Л = 1— -^-C24-of—У л——>°о. (5.4) Возводя (5.4) в п-ю степень, получаем (5.2). ► Естественно ожидать, что, когда [F обладает плотностью ft плотность величины Sj]/'п должна сходиться к нормальной плот- ности и. Это не всегда так, но, к счастью, исключения носят «патологический» характер. Сформулированная ниже теорема охва- тывает множество практически интересных случаев. Теорема 2. Если функция | ср | интегрируема, то случайная величина Snl\/~п имеет плотность fn, равномерно сходящуюся к нор- мальной плотности п. х) Существование дисперсии вовсе не обязательно для асимптотической нормальности величины Srt. Необходимые и достаточные условия даны в след- ствии 1 в гл. XVII, 5. 19 № 249
578 Гл. XV. Характеристические функции Доказательство. Формула обращения интегралов Фурье (3.5) применима как к fn, так и к и, и поэтому d£. (5.5) — 00 Правая часть здесь не зависит от х9 и мы должны показать, что она стремится к нулю при п—>оо. Ввиду (5.3) можно выбрать 6 > 0 так, чтобы |ф(0К^’1/4)^ при \ Ц<8. (5.6) Мы разобьем теперь интеграл (5.5) на три части и покажем, что каждую часть можно сделать меньше е при достаточно боль- шом п. 1) Как мы видели в последнем доказательстве, внутри фиксированного интервала —подынтегральное выраже- ние равномерно стремится к нулю, так что интеграл по этому проме- жутку стремится к нулю. 2) Для а < | £ | < S ]/ п подынтегральное выражение меньше, чем 2е<~1/4>£2, так что величина соответствую- щего интеграла меньше 8, если только а взято достаточно боль- шим. 3) Мы знаем из леммы 4 из § 1, что |ф(£)| < * Для и из леммы 3 § 4, что ф(£)—>0 при |£|—>оо. Отсюда следует, что макс имум функции | ф (£) | при | | 6 равен числу т] < L Поэтому часть интеграла (5.5), взятая из области |£|>Sj/n, меньше, чем + 00 dc+ j e-^^dZ. (5.7) KI>ъ¥п Первый интеграл равен интегралу от ]/"п | ф |, так что выражение (5.7) стремится к нулю. ► На самом деле из доказательства вытекает1) более сильный результат, а именно: если |ф|г£Л при некотором целом г, то fn—равномерно для всех х. В то же время следствие теоремы 3 § 3 показывает, что если | ф |.г не интегри- руема ни при • каком г, то каждая из функций fn не ограничена. Приведем любопытные примеры, подтверждающие, что такие патологические случаи действительно встречаются. Примеры, а) Для х > 0 и р^ 1 положим “^W=s7IoPF7’ (5'8) Пусть g—плотность распределения, сосредоточенного на интервале 0, 1, и пусть g (%) > Up (х) на некотором интервале 0, h. Существует интервал^ 0, б, в котором ир монотонно убывает, и внутри этого интервала х g2 * (х) Ss J Up (х—у} Up (у) dy > хир (х) = и2р (х). (5.9) о !,"’Ч Нт^) х) Единственное изменение состоит в томА что в (5,7) множитель заменяется на ту1”^ а ф на фг.
§ 5. Центральная предельная теорема 579 По индукции устанавливаем, что при п=2& существует интервал 0, hnt в ко- тором g"* ^ипр, и, следовательно, g"* (х) —> оо при я—/О-]-. Таким образом,- каждая свертка g"* не ограничена. б) В варианте предыдущего примера та же самая патологическая особен- ность проявляется в еще более резкой форме. Пусть v—плотность, получен- ная симметризацией функции g. Положим /(x)=y(f(x+l)+f(x-l)). (5.10) Тогда f (х) будет четной плотностью, сосредоточенной на —2, 2. Мы можем предположить, что соответствующая дисперсия равна 1. Анализируя преды- дущий пример, мы видим, что v непрерывна всюду, кроме нуля, где она не ограничена. Это же верно и по отношению^ко всем сверткам vn*t Теперь/2"* (х) является линейной комбинацией функций у2"* (x-\-2k) с k = 0, ±1, ±2, ... ..., ± п и, следовательно, не ограничена во всех этих точках. Плотность нормированной суммы S2„/]/"2n случайных величин Xf с плотностью / опре- деляется формулой f2n (х) = ]/*2п/2"* (х ]/"2п). Она непрерывна всюду,- кроме 2п-|-1 [точек вида 2/г/У~2п (& = (), ±1, ±п), в которых она не ограни- чена. Так как каждой рациональной точке t соответствует бесконечно много пар (k, п) целых чисел, таких, что 2kiy'2n=ti то мы приходим к выводу: распределение случайной величины Sn/yn стремится к 9?, но плотности fn не сходятся ни в одной рациональной точке и последовательность {/„} не будет ограниченной ни в одном интервале. в) См. задачу 20. Чтобы сделать картину полной, перейдем теперь к решетчатым распределениям. Предположим, что случайные величины Ху. при- нимают значения вида b, b ±h, b ±2h, .... Предположим, что h является шагом распределения, т. е. максимальным положитель- ным числом с указанным свойством. Лемма 4 из § 1 утверждает, что | ср | имеет период 2л/й и, следовательно, функция | ф | не интегрируема. Однако теореме 2 соответствует аналогичная тео- рема, касающаяся «масс» возможных значений (атомов) распреде- ления величины Sn/Kп. Все эти атомы находятся среди точек вида х = (nb + kty/j/’n, где & = 0, ±1, ±2, .... Положим для таких х = = (5-11) Для всех других х функция р„(х) не будет определена. Таким образом, значения х в соотношении (5.12) принадлежат наимень- шей решетке, содержащей все атомы случайной величины Sn/Kп. Теорема З1). Если F—решетчатое распределение с шагом h, то при П—+ОО ^-рп{х)—п(х) —0 (5.12) равномерно относительно х. х) Предполагается, как и раньше, что выполнены условия (541)4 — Прим9 перев. 8|9*
580 Гл. XV. Характеристические функции — 1 Чп( 2л J т V Доказательство. В силу (3.14) имеем V пл/h <5J3> - Vпл/h Используя снова формулу обращения (3.5) для нормальной плот- ности п, получаем, что левая часть в (5.12) не превосходит V пл/h d£ + V п J - Vпл/h 4-_L J e<-V2)t’dg. (5.14) I £ I > Упл/ь Повторяя в точности доказательство теоремы 2, видим, что первый интеграл стремится к нулю. Ясно, что и второй интеграл стремится к нулю. Этим завершается доказательство. ► § 6. УСЛОВИЕ ЛИНДЕБЕРГА Рассмотрим теперь последовательность таких независимых слу- чайных величин Хь что Е(Хй) = 0, Е(Х1) = <т|. (6.1) Мы обозначим распределение величины Хй через Fk, характери- стическую функцию через <pft, а также, как обычно, обозначим S„ = X1-|- ... 4-Х„ и s2 = Var(S„). Таким образом, s2 = a?+...+o2. (6.2) Мы будем говорить, что выполняется условие Линдеберга, если при любом фиксированном t > 0 п -VS f n^oo. (6.3) S" * = 11 x | > tsn Грубо говоря, это условие требует, чтобы дисперсии al образовы- вались в основном за счет масс, сосредоточенных в интервалах длины, малой по сравнению с s„. Далее ясно, что al/si меньше, чем t2 плюс левая часть в (6.3). Так как t произвольно, то из (6.3) следует, что при любом е > 0 и достаточно большом п 6=1,2.......п. (6.4) Разумеется, отсюда следует, что sn—>оо.
§ 6. Условие Линдеберга 581 Отношение on/sn можно принять за меру того вклада, который вносит слагаемое Хп в нормированную сумму Sn/sn. Тогда условие (6.4) можно описать следующим образом: асимптотически Sn/sn является суммой «многих индивидуально пренебрежимых слагае- мых». Условие Линдеберга было введено в г. VIII (соотношение (4.15)), и следующая ниже теорема совпадает с теоремой 3 из гл. VIII, 4. Каждое из доказательств имеет свои преимущества. Приводимое здесь доказательство позволяет установить, что усло- вие Линдеберга в некотором смысле и необходимо; это доказатель- ство применимо для вывода асимптотических разложений (гл. XVI) и теорем о сходимости плотностей (задача 28). Теорема 1. Если выполняется условие Линдеберга (6.3), то рас- пределения нормированных сумм Sn/sn сходятся к стандартному нормальному распределению 91. Доказательство. Выберем £ > О произвольное, но фиксирован- ное. Мы должны показать, что <PiC/sre)...<pn(C/s„)-> е~^\ (6'5) Поскольку <pfe(0) = 0 и | ср* (х) | ol для всех х, из формулы Тейлора и (6.4) следует, что для достаточно больших п (6.6) Мы покажем, что если (6.6) выполнено, то (6.5) эквивалентно соотношению п X [<Pft(C/sJ-l] + 4c2— 0- (6.7) k = 1 В самом деле, как показано в (2.4), е^ь 1 является характеристи- ческой функцией обобщенного распределения Пуассона и поэтому ^“’1^1. Далее, для любых комплексных чисел, таких, что я* 1=^3 и справедливо неравенство п |лР . .ап—bi.. .6„|< 2 \ak — bk\, k— 1 (6-8) которое может быть получено по индукции из тождества •^1^2 У1Уг = (^1 У1) %2 4“ (^2 Уй) У1* Для произвольного 6 > 0 имеем | е*— 1 —z | < 61 г |, если | z | доста- точно мало, и, следовательно, для достаточно больших п из (6.6)
582 Гл. XV. Характеристические функции имеем | 1ФЙ <E/s„>-1] _ ф1 . фп (ySn) | п < ЕИк',"’-‘-тИЕЮк Л = 1 п п <6 S |<MC/s„)-l|<6(№) S ои = 6^. (6.9) /г=1 &=1 Поскольку 6 произвольно, то левая часть стремится к нулю и, следовательно, (6.5) справедливо тогда и только тогда, когда выполняется (6.7). Теперь (6.7) можно переписать в виде k= 1 J L sn zsn _ 00 (6.10) Из основного неравенства (4.1) следует, что при | х| tsn подын- тегральная функция мажорируется выражением | x£/sn |3 < а при | х | > tsn—выражением x2£2/s2 • Поэтому левая часть в (6.10) по абсолютной величине меньше, чем п г ^3 + № $ x*Fk{dx}. (6.11) fc-1 | X I > tsn Вследствие условия Линдеберга (6.3) второй член стремится к нулю, а поскольку t можно выбрать произвольно малым, то отсюда следует, что (6.10) справедливо. ► Пояснительные примеры даны в гл. VIII, 4, в задачах 17—20 из гл. VIII, 10, и в задачах 26, 27 настоящей главы. Следующая теорема содержит утверждение, в определенном смысле обратное к теореме 1. Теорема 2. Предположим, что sn--+ оо и <yjsn—>0. Тогда усло- вие Линдеберга (6.3) является необходимым для сходимости распре- деления Sn/sn к 9J. Предостережение. Мы скоро увидим, что даже в том случае, когда условие Линдеберга не выполнено, распределение Sn/sn может стремиться к нормальному распределению (с дисперсией <1). Доказательство. Сначала покажем, что (6.4) выполнено. По предположению существует v, такое, что gJs„ < е для п > v. Для v < k п имеем ck/sn oft/sft < е, а отношение ok/sn с k --С v стре- мится в 0, так как sn—>оо. Предположим далее, что распределение Sn/s„ стремится к 9?, т. е. предположим (6.5). В предыдущем доказательстве мы видели,
§ 6. Условие Л и и Ребер га 5&3 что выполнение соотношений (6.4) влечет за собой (7.10). По- скольку cos г—1 + уг2^0, то действительная часть подынтег- рального выражения в (6,10) неотрицательна и поэтому действи- тельная часть всего выражения, стоящего слева в (6.10), не мень- ше, чем (6.12) Таким образом, для произвольных £ и t правая часть стремится к нулю и, следовательно, (6.3) выполняется. Условие Qn!sn—>0 не является строго говоря необходимым. Например, в частном случае, когда все распределения Fk нор- мальны, <зк можно выбрать произвольными и тем не менее рас- пределение Sn/sn совпадает с 9с (см. также задачу 27). Однако условие cn/sn—>0 естественным образом гарантирует, что влияние каждого из слагаемых Xk является предельно пренебрежимым, а без этого условия радикальным образом меняется характер этой проблемы. Но даже если onlsn —>0 и sn—> оо, условие Линдеберга не является необходимым для существования таких нормирующих постоянных ап, чтобы распределение Sn/an стремилось к 91. Сле- дующий пример разъясняет эту ситуацию. Пример. Пусть —последовательность величин, удовлет- воряющих условиям теоремы 1, включая нормировку (6.1). Пусть величины Хд взаимно независимы, независимы от Xk и такие, что S Р{х;,^0}<оо. (6.13) п— 1 Положим Хп = Хга4-Х„ и обозначим частные суммы {Х^} и {Хп} через S„ и S„ соответственно. По первой лемме Бореля — Кантелли с вероятностью единица только конечное число Х„ будут отли- чаться от нуля, и, следовательно, с вероятностью единица = О (sn). Отсюда легко сделать вывод, что асимптотическое поведение распределений S„/s, и Sn/sn одно и то же. Таким образом, распределение Sn/sn стремится к 9? даже тогда, когда s2 не является дисперсией S„; на самом деле, не требуется даже, чтобы Х„ имела конечное математическое ожидание. Если E(S„) = 0 и E(S„) = s2<oo, то распределение S„/s„ сходится только тогда, когда s„/s„ стремится к пределу р. В этом случае предельное распределение является нормальным с дисперсией р^. 1. ► Этот пример показывает, что частные суммы S„ могут быть
584 Гл. XV. Характеристические функции асимптотически нормально распределены даже в том случае, когда Хп не имеют математических ожиданий, а также то, что дисперсии не всегда являются подходящими нормирующими кон- стантами. Мы не будем здесь развивать эту тему по двум' при- чинам. Во-первых, общая теория будет рассмотрена в гл. XVII» Во-вторых, и это более важно, обобщение теорем, доказанных выше, может служить превосходным упражнением, а задачи 29—32 предназначены для того, чтобы с помощью простых методов по- лучить необходимые и достаточные условия для центральной предельной теоремы. § 7. ХАРАКТЕРИСТИЧЕСКИЕ ФУНКЦИИ МНОГОМЕРНЫХ РАСПРЕДЕЛЕНИЙ Теория характеристических функций в пространствах несколь- ких измерений так близка к теории для 5J1, что ее системати- ческое изложение представляется излишним. Для того чтобы описать основные идеи и обозначения, достаточно рассмотреть случай двух измерений. Мы будем через X обозначать в этом параграфе пару действительных случайных величин Хх и Х2 с за- данным совместным распределением вероятностей F. Мы будем рассматривать X как вектор-строку с компонентами Хх и Х2; аналогично аргумент х в F (х) следует понимать как вектор-строку с компонентами х1 и х2. С другой стороны, аргумент £ соответ- ствующей характеристической функции будет пониматься как вектор-столбец с компонентами и £2. Это соглашение удобно тем, что скалярное произведение записывается в виде х£ = хх£х-|- + х&2. Характеристическая функция <р для X (или для F) опре- деляется равенством <р (?) = Е (е^х). (7.1) Это определение по форме такое же, как и в одномерном случае, однако показатель степени имеет новый смысл и интегрирование производится по отношению к двумерному распределению. Основные свойства двумерных характеристических функций очевидны. Например, при £2 = 0 скалярное произведение пре- вращается в х^ и, следовательно, ср (£х, 0) представляет собой характеристическую функцию (маргинального) распределения Хх. При любых фиксированных значениях параметров £х, rQ2 линейная комбинация £iXx-]-£2X2 является (одномерной) случайной величиной с характеристической функцией Е (е* (^х1+^х2)) = ф Х?2). (7.2) Здесь £х и Ц фиксированы, а независимой переменной служит %. В частности, характеристическая функция суммы Хх + Х2 равна ср(Х, X). Таким путем двумерная характеристическая функция порождает одномерные характеристические функции всех линей- ных комбинаций CiXi-H2Xa. Обратно, если известны распределения
§ 1. Характеристические функции многомерных распределений 585 всех таких комбинаций, мы можем вычислить все выражения типа cp(Z^, ^2), а вместе с ними и двумерную характеристи- ческую функцию* 1). Следующий пример показывает пользу и гиб- кость этого подхода. В примере используются обозначения, вве- денные в гл. III, 5. Примеры, а) Многомерные нормальные характеристические функции. Пусть Х = (Хх, Х2) (который надо считать вектором- строкой!) имеет невырожденное нормальное распределение. Пред- положим для простоты, что Е(Х) = 0. Обозначим матрицу кова- риаций Е(ХГХ) буквой С. Ее элементами будут ckk = Var (Хд.) и c12 = c21 = Cov(X1, Х2). При фиксированных и £2 линейная комбинация Х^ = ^Хх + ^2Х2 имеет математическое ожидание О и дисперсию q2 = = + 2е12^2 + (7.3) Поэтому характеристическая функция для Х£ = ^Xj + g2X2 (ее ар- гумент обозначим через X) имеет вид еЫ/зХуЧ2, следовательно, двумерная характеристическая функция для Х = (Х1Э Х2) равна (7.4) Эта формула применима и в r-мерном случае с той лишь разни- цей, что является квадратичной формой г переменных Таким образом, (7.4) представляет собой характери- стическую функцию г-мерного нормального распределения с нуле- вым математическим ожиданием и матрицей ковариаций С. Иногда желательно перейти от переменных (Хр Х2) и (&, £2) к полярным координатам. Введем новые величины Xi = Rcos0, X2 = Rsin0, ^ = pcosa, £a = psina. (7.5) (О таких преобразованиях см. гл. Ill, 1.) Тогда <p(£) = E(e‘pRcos<e-“>). (7.6) Следует иметь в виду, однако, что это не есть характеристи- ческая функция пары случайных величин R, 0; последняя равна Е(е'(С»*+ие>). Примеры, б) Круговая симметрия. Если пара (Xf, Х2) описы- вает «случайно направленный вектор» (см. гл. I, 10), то совмест- ное распределение для (R, 0) является произведением распреде- ления G для R и равномерного распределения на —л < 0 < п. Тогда математическое ожидание в (7.6) не зависит от а и при- нимает форму 00 Л Ф&, G{dr} J ^co.0d0, (7.7) О -Л 1) Этим мы доказали попутно, что распределение вероятностей в 512 одно- значно определяется по вероятностям всех полуплоскостей. Этот результат (отмеченный Крамером и Вальдом) пока не доказан элементарными методами, Его применение к проблеме моментов указано в задаче 211
586 Гл. XV. Характеристические функции Производя замену переменной cos0 = x и преобразуя внутренний интеграл (см. задачу 6), получаем со <Р(^У=ро(Р^)ОЖ (p = KIFhI), (7-8) о где Л (х) = /в (1х) = Д (4) (7.9) (Бесселева функция 70 была введена в гл. II, 7.) Единичный вектор в случайном направлении имеет распреде- ление G, сосредоточенное в точке 1. Таким образом, J" (K&i + £2) является характеристической функцией суммы п независимых единичных случайно направленных векторов. Этот результат был получен Рэлеем в одном специальном случае. в) Мы рассмотрим частный случай, когда (Xf, Х2) имеет дву- мерную плотность f (*1, *2) = (2л)~1 a*e~ar, r~Vxi-\*xl, (7.10) где а—положительная постоянная. Тогда (7.8) принимает вид1) 00 <Р (С1, □ = аТ e~arJо (Pf)r dr = (1 + Р W)- ?/2. (7.11) о г) Сферическая симметрия в 31\ Пример б) может быть рас- пространен на трехмерный случай. Отличие состоит в том, что теперь мы имеем два полярных угла: географическую долготу со и полярное расстояние 0. Внутренний интеграл в (7.7) прини- мает вид — f da Г elrPcos 0 sin 0 d0 = S- C (e;'PCO90 + e-frPcos0)sin0d0, (7.12) 4Я J J J -л 0 0 где р2 = С1+?2 + Сз- Подстановка cos0 = x преобразует это выра- жение к (гр)-1 sin гр, а поэтому равенство (7.8) получает трех- мерный аналог со Ф&, £з) = р-^6М (7.13) Подставляя вместо Jo ее разложение (749)? получаем ы-Е <-«* (£)“=е(“Д) ($)‘ что предгтавляет собой ряд для (14*р2/а2)*^2ш ,
§ 8. Две характеризации нормального распределения' 587 В частности, для единичного случайного вектора интеграл сво- дится к виду p“1sinp. Полагая £2 = £з> видим, что характеристи- ческая функция компоненты Xf единичного вектора записывается в виде sin Таким образом, мы получаем новое доказатель- ство факта (установленного в гл. I, 10), что эта компонента имеет равномерное распределение в интервале —1,1. ► Мы предоставляем читателю проверить, что основные теоремы, касающиеся характеристических функций в одномерном случае, обобщаются без существенных изменений. Так, теорема об обра- щении интегралов Фурье в 91* утверждает, что если ф (абсо- лютно) интегрируема на всей плоскости, то X имеет ограни- ченную и непрерывную плотность, задаваемую формулой + 00 f (xv Х2) = j j (k, Q d^. (7.14) — 00 Пример, д) Двумерное распределение Коши. Если формула обращения (7.14) применяется к плотности f из примера в), то, как легко видеть, после деления на /(0, 0)==(2л)"1а2 имеем т(^-. = (7.15) что представляет собой характеристическую функцию двумерной плотности g, определяемой формулой = 2я(в2 + Х?+^)3/2 ' (7‘ 1б) Отсюда следует, что эта плотность обладает основными свойствами обычной плотности Коши. В частности, она строго устойчива: если Х(1), ..., Х(/2)—взаимно независимые векторы с плотностью (7.16), то их среднее арифметическое (Х(1)+... +Х(/г))/п имеет ту же самую плотность. ► § 8*). ДВЕ ХАРАКТЕРИЗАЦИИ НОРМАЛЬНОГО РАСПРЕДЕЛЕНИЯ Мы начнем с известной теоремы, высказанной П. Леви и до- казанной в 1936 г. Г. Крамером. К сожалению, ее доказательство опирается на теорию аналитических функций и потому несколько выходит за рамки нашей трактовки теории характеристических функций. Теорема 1. Пусть Хг и Х2—независимые случайные величины, сумма которых распределена нормально. Тогда Хх и Х2 имеют нормальное распределение. ♦) В этом параграфе разбирается специальная тема* Результаты исполь-> зуются только в задаче 27,
588. Гл, XV. Характеристические функции Другими словами, нормальное распределение может быть раз- ложено только на нормальные компоненты. Доказательство будет опираться на лемму, представляющую самостоятельный интерес. Лемма. Пусть F—такое распределение вероятностей, что f (т)) = J {dx} < оо (8.1) — 00 при некотором т] > 0. Тогда его характеристическая функция {рассматриваемая как функция комплексного аргумента £) яв- ляется целой функцией. Если ср (£)=/= О для всех комплексных £, то F—нормальное распределение. Доказательство леммы. При любых комплексных £ и дейст- вительных х, ц имеем | х£ | y]2x2 + т]~21 £ I2- Поэтому интеграл, определяющий ср, сходится при всех комплексных £ и |Ф(С)1<^-^127(П). (8.2) Это значит, что <р есть целая функция порядка не более 2, и если такая функция не имеет нулей, то log ср (£) является многочленом __ib'Q не выше второй степени1). Следовательно, <р(£) = е 2 , где а и b—некоторые, возможно, комплексные числа. Но (р—харак- теристическая функция, и поэтому —ир' (0) равно математическому ожиданию, а —ср" (0)—второму моменту соответствующего рас- пределения. Отсюда видим, что & действительно и а>0, так что распределение F нормально. ► Доказательство теоремы 1, Не ограничивая общности, мы можем предположить, что случайные величины Xj и Х2 центри- рованы своими медианами. Тогда P{|X1 + X2|>0>lp{|Xi|>f}, (8.3) Теперь с помощью обычного интегрирования по частям [см. гл. V, 6] находим, что / С<1) т)2$ х• ^*х* [ 1—F(x)+F(—x)]dx. (8.4) о Поэтому функции fk, соответствующие Xft, удовлетворяют нера- венству (г]) 2/(1]) < оо. Так как <р£ (^)ф2(?) = е(-1/2) a™+ib\ то ни фх, ни <р2 не могут обращаться в нуль. Поэтому Х£ и Х2 нормальны. Мы переходим к доказательству другого характеристического г) См., например: Hille Е., Analytic Function Theory, Boston, 1962, тл 1I? стр, 199 (теорема Адамара о факторизации)*
§ 8. Две характеризации нормального распределения 589 свойства нормального распределения, о котором уже шла речь в гл. III, 4. Теорема 2. Пусть Хх и Х2—независимые случайные величины, и пусть Yj = ^ifXj -|” ^12^2» У2 = а2ХХх4-а22Х2. (8-5) Если У* и Y2 взаимно независимы, то или все четыре случайные величины распределены нормально, или же преобразование (8.5) тривиально в том смысле, что либо N.—aXr, Y2 = 6X2, либо Yx = aXa, Y2 = feXp Доказательство. При специальном предположении, что слу- чайные величины Ху имеют непрерывные плотности, теорема была доказана в гл. III, 4. Доказательство опиралось на решение функционального уравнения (4.4) гл. III. Мы покажем теперь, что характеристические функции фу случайных величин Ху удов- летворяют функциональному уравнению того же типа. Мы по- кажем сначала, что достаточно рассматривать действительные характеристические функции. При этом мы продемонстрируем пользу теоремы 1. Примеры, а) Редукция к случаю симметричных распределений. Введем случайные величины Xf и Xf, которые не зависят друг от друга и от Ху и которые распределены как —Хх и — Х2 соот- ветственно. Линейное преобразование (8.5) переводит симметри- зованные случайные величины °Ху = Ху 4-Xf в пару (°YX, °Y2) сим- метричных и независимых случайных величин. Если теорема верна для таких случайных величин, то величины °Ху нормальны и по теореме 1 величины Ху также нормальны. б) Функциональные уравнения. В силу независимости Yf и Y2 двумерная характеристическая функция для (Yx, Y2) должна представляться в форме произведения соответствующих характе- ристических функций, т. е. Е (е1 <^+№) = Е (e^Y0 Е (8.6) Подставляя сюда выражение (8.5), мы получаем следующее соот- ношение между характеристическими функциями для Хх и Х2! Ф1 “Ь ^21^2) Ф2 (^12^14” ^22^2)= = Фх (Яц^х) Ф2 (^12^1) Ф1 (^21?г) Ф2 (^22^2)’ Теперь (8.7) совпадает с соотношением (4.4) из гл. III (с тем лишь исключением, что я12 и я21 меняются местами). По предпо- ложению фу действительны и непрерывны и так же, как в гл. III,4, можно считать, что все aJk отличны от нуля. Поэтому по лемме из гл. III, 4, Фу(С) = в~°Л2. Отсюда следует, что Ху нормальны. ►
£90 Гл. XV. Характеристические функции § 9. ЗАДАЧИ 1. Выведите из неравенства (1.7) (без всяких вычислений), что для любой характеристической функции ср 2. Пусть ф = и-(-ш— характеристическая функция. Покажите, что u2©<4(1+“(20)i (9-2) Последнее в свою очередь влечет за собой неравенство |ф©Р^1(1 + |Ф(2С)|). (9.3) Указание. Для (9.2) используйте неравенство Шварца^ для (9.3) рассмот- рите характеристические функции вида eiaty (Q. 3. Докажите (обозначения те же, что и выше), что |ф (С2) 1-1 ф (Ci) |2 < 2 [1 — rz g2-4i)b (9.4) При £2 = —Si отсюда следует (1.7). 4. Из элементарных формул выведите (без явного использования иптегри- । |________________________________________________cos X рования), что характеристическая функция ф плотности —-%--отличается лишь постоянным множителем от функции 2| —1£+1| —|£—1 |» Отсюда вытекает, что ф (?) = 1 — | | для | £ | 1. 5. Из характеристической функции для плотности -^-ае~а^х1 получите дифференцированием по а новую характеристическую функцию. Используйте этот результат—покажите, что свертка данного распределения с собой имеет плотность ~ае ~а ’ х ' (1 -j-a | х |). 6. Пусть плотность f распределения, сосредоточенного на —1, 1, имеет вид f(x)=—2=. (9.5) я у 1 — X2 Покажите, что ее характеристическая функция равна й=0 (9.6) Отметим, что Jo(O — Л» ОХ)? где /0—функция Бесселя,- определенная форму- лой (7.1) в гл. II. Указание. Разложите е1£х в степенной ряд. Коэффициент при с? выражается интегралом, а (9.6) может быть доказано индукцией по /г, используя интегрирование по частям. ______ 7. Докажите, что распределение арксинуса с плотностью 1/[л ]fx (1—х)], сосредоточенной на 0, 1, имеет характеристическую функцию е1^2/0(£/2). Указание. Сведите к предыдущей задаче. 8. Исходя из формулы 10 таблицы на стр. 563, покажите, что 2л2х (shx)"^ 2 есть плотность с характеристической функцией —д . Указание. Ис- пользуйте задачу 6 из гл. II, 9. 9. Пусть обозначает характеристическую функцию с периодом 2L-, опи- санную в примере 2, в). Покажите, что 2у2£—yi является снова характери- стической функцией арифметического распределения, Ее график получается
§ 9. Задачи 591 из графика на рис. 2 (см. стр. 567) отражением каждого второго треуголь- ника относительно оси ?. 10. х). Пусть X и Y—независимые случайные величины с распределениями Р и G и характеристическими функциями ф и у соответственно. Покажите, что произведение XY имеет характеристическую функцию + оо + оо $ У (£*) F {dx} = Ф (£х) G {dx}. — 00 — 00 (9.7) 11. Если {<р„}—такая последовательность характеристических функций? что (?) -» 1 при —-6 < ? < 6, то фи (?) -> 1 при всех ? 12. Пусть g—четная плотность со строгой положительной характеристи- ческой функцией у. Тогда „ /и — ё W I* 1— COStfX] ёа l-ф (с) (9.8) есть плотность вероятности с характеристической функцией v 2 *У ©-V (С+")-Т(5~«) /от Ve ®----------2 [1—7(c)] * (9>9) При а —> оо имеем уа -> у, но ga не стремится к g. Это показывает? что в теореме непрерывности для плотностей условие (3.10) существенно. 13. Если у—действительная неотрицательная характеристическая функ- ция, то существуют четные плотности gn со строго положительными характе- ристическими функциями уп, такими, что уп —> у. Указание, Рассмотрите смеси (1—е) G-f-eF и свертки. 14. Если у—характеристическая функция, такая, что у^О и у (а) # 1? тогда (9.9) определяет характеристическую функцию. Указание. Воспользуй- тесь предыдущими двумя задачами. 15. Обобщение утверждения, обратного к (4.7) Рассматривая распределе- ния x^F {dx} (если они существуют), докажите по индукции, что распре- деление F имеет конечный момент порядка т2г тогда и только тогда, когда существует 2г-я производная характеристической функции ф в нуле. 16. Пусть f—плотность вероятности с положительной и интегрируемой характеристической функцией. Тогда f имеет единственный максимум в пуле, Если вторая производная f” существует, то /(0)>/W >Ш-^-Г(0); (9.10) аналогичное разложение верно и для первых 2г членов формулы Тейлора [заметьте, что f— четная функция и, следовательно, (0) = 0]. 17. Пусть ф—действительная характеристическая функция с непрерывной второй производной ф\ Тогда [исключая случай ф(?) = 1 для всех ?] ф (?) —- * . 2 (9 11) ?2 |ф"(0)| ( 4 будет характеристической функцией. Ей соответствует четная плотность /2> х) Комбинируя (9.7) с теоремой, указанной в сноске па стр. 186, полу- чаем следующий критерий (принадлежащий Хипчину): функция со является, характеристической функцией унимодального распределения тогда и только 1 тогда > когда со(?)=^ ф(?х)сй, где у—-характеристическая функция, о
592 Гл. XV, Характеристические функции определяемая для х > 0 формулой wrbf(’ldt <9J2> Распространи re это утверждение на моменты высших порядков. 18. Пусть f—четная плотность с характеристической функцией ф. Для х > 0 положим 00 Я(х)=$Ж£_, g(-x)=g(x). (9.13) Тогда g—снова четная плотность, и ее характеристической функцией будет 7(0—4-J<P(s)ds- (9Л4) ® о __ 19. Пусть у—характеристическая функция, такая, что lim | у (Q | = 1 при ► оо. Соответствующее распределение F является чисто сингулярным (отно- сительно меры Лебега). 20. Предположим, что ck > О, cfe = 1, по SСь?А = оо. Пусть и—четная, непрерывная плотность, сосредоточенная на —1, 1, и пусть (о—соответствую- щая характеристическая функция. Тогда /W = Scft2*u(2M (9.15) определяет плотность, непрерывную всюду, за исключением нуля, и имеющую характеристическую функцию <P©=S<V»(2"*O- (9.16) Покажите, что функция | ф |га не интегрируема ни при каком п. Указание. Для х Ф 0 ряд в (9.15) конечен. Воспользуйтесь тривиальным неравенством (2 ckPk^n S Pk, которое выполняется при р^ 0. 21. Проблема моментов в 912. Пусть Xf и Х2—две случайные величины с совместным распределением F. Положим Ak = Е (| Xi \k) + Е (| Х2 |*)« Пока- жите, что F однозначно определяется своими моментами, если lim k"1 Ak/k < < оо. Указание. Как отмечено в сноске на стр. 585 достаточно доказать, что распределения всех линейных комбинаций а1Х1-^а2Х2 определены единствен- ным образом. Используйте критерий (4.15). 22. Вырожденное двумерное распределение. Пусть <р—одномерная характе- ристическая функция и alt а2—произвольные постоянные. Покажите, что <Р (^iSi + ^Ea) как функция от gf и £2 является двумерной характеристической функцией пары (Х1? Х2) для которой тождественно ц2Х1 = ц1Х2. Сформулируй- те обратное утверждение. Рассмотрите специальный случай я2 = 0. 23. Пусть X, Y, U — взаимно независимые случайные величины с характе- ристическими функциями <р, у, со. Покажите, что произведение Ф (£i) у (£2) X X °>($1+?2) представляет собой двумерную характеристическую функцию пары (U + X, U+Y). Указание. Используйте трехмерную характеристическую функцию. Примеры и дополнения к центральной предельной теореме 24. Докажите центральную предельную теорему 4 из гл. VIII, 4, для сумм случайного числа слагаемых методом характеристических функций. 25. Допустим, что Х& имеет плотность (аь), где Дисперсия Sra равна $п=(й1+•••+an)- Покажите, что условие Линдеберга выполнено, если п k =i
§ 9. Задачи. 593 26. Пусть Р {Xft= ± 1} = (&—1)/2& и Р {Xft = ± k }= 2_ k. Покажите, что ни при каких нормирующих постоянных ап распределение Snlan не схо-. Дится к 91. Указание. Перейдите к логарифмам и используйте неравенство 27. Если распределение Sn/sn стремится к 9J, но en/sn-+ р > О, то рас- пределение Xn{sn стремится к нормальному распределению с дисперсией р2. Указание. По теореме Крамера—Леви из § 8 из равенства = сле- дует, что как [/, так и V — нормальные распределения. Используйте сходя- щиеся подпоследовательности последовательности распределений Xnlstt и 28. Центральная предельная теорема для плотностей. Покажите, что теорема 2 § 5 обобщается на последовательности с различными плотностями fk в предположении, что эти плотности удовлетворяют некоторым «равномерным» по k условиям гладкости. Например, достаточно, чтобы третьи абсолютные моменты были ограничены и чтобы fk имели производные, причем \fk \ < М для всех k. 29. Центральная предельная теорема для схемы серий. При каждом п рас- смотрим п независимых случайных величин XiiW, ..., Х„,„ с функциями рас- пределения Пусть T„ = X1|W+...+ Xn|Zr’Предположим, что Е (ХЛ1П) = О, Е (Тп) = 1 и что п У, $ x*Fk<n{dx}-+0 (9.17) k= 1 I X I > t для каждого t > 0. Покажите, что распределение Тм стремится к 91. Указа- ние. Используйте доказательство теоремы 1 из § 6. Замечание. В частном случае, когда Х^ n = Xk/sn и Tn = Sn/sn, получаем теорему Линдеберга. При этом (9.17) превращается в условие Линдеберга (6.3). О схемах серий см. в гл. VI, 3. 30. Урезание. Допустим, что {X/J—последовательность независимых слу- чайных величин с симметричными распределениями. Пусть для каждых п и k^n Xk,n обозначает случайную величину,- полученную урезанием величины п Xk на уровне ± ап. Предположим, что 2 { I I > ап} -+ 9 и выполнено k=i (9.17). Покажите, что распределение Sn/an стремится к 9J. 31. Обобщенная центральная предельная теорема. Предположим,- что рас- пределения Fk симметричны и что для любого t > 0 п п У $ Fk{dx}^0, J. x*Fk{dx}-+\. (9.18) k=l | х I > tan k-1 I x I < tan Докажите, что распределение Sn/an стремится к 91: а) используя две послед- ние задачи; б) непосредственно приспосабливая доказательство теоремы 1 561). 32. Продолжение. Условие симметричности распределений может быть за- х) Теорема 2 обобщается подобным же образом, но требует другого до- казательства,
594 Гл. УТ7. 'Характеристические функции менено более слабым условием: п (9.19) /?=1 \х\<ап 33. Для того чтобы существовали нормирующие постоянные ап1 удовлет? аоряющие условиям (9.18), необходимо и достаточно,- чтобы для некоторой последовательности tn —> оо У, 5 $ x-Fk{dx}-+ оо. & = 1 | X I > tn n & = 1 lx|<fre В последнем случае можно взять a"=Si $ x^F^dx}, fe=i | X |< tn (Обычно этот критерий применяется без затруднений.)
ГЛАВА XVI1) АСИМПТОТИЧЕСКИЕ РАЗЛОЖЕНИЯ, СВЯЗАННЫЕ С ЦЕНТРАЛЬНОЙ ПРЕДЕЛЬНОЙ ТЕОРЕМОЙ Вопросы, рассматриваемые в настоящей главе, технически довольно трудны. Они группируются вокруг двух проблем. Одна — вывод оценок для точности центральной предельной теоремы и улучшение этих результатов за счет построения асимптотических разложений. Другая проблема—уточнение центральной предель- ной теоремы для далеких от математического ожидания значений аргумента, для которых классические формулировки мало содер- жательны. Чтобы облегчить подход к важным теоремам и объяснить основные идеи, мы выделяем сначала случай одинаково распре- деленных слагаемых. Методы, развитые в § 7 для больших отк- лонений, не опираются на содержание первых пяти параграфов, в которых излагается теория, существенно использующая два приема: прямую оценку абсолютно сходящихся интегралов Фурье и сглаживание. Мы различаем две главные идеи, рассматривая сначала асимптотическое разложение для плотностей, хотя это и приводит к некоторым повторениям и уменьшает изящество по- строений. Кульминационный пункт главы—теорема Берри—Эссеена в § 5. Метод сглаживания, описанный в § 3, был впервые исполь- зован Берри при доказательстве этой теоремы. Сейчас использу- ется бесчисленное множество приемов сглаживания. Заметим, к сожалению, что долгая и примечательная история предмета этой главы привела к печальному обстоятельству: случайности исто- рического развития все еще влияют на подход к отдельным вопро- сам. Возникшее в результате разнообразие средств и избыток созданных ad hoc методов привели к тому, что эта область про- славилась своей хаотичностью. Систематическое использование метода Берри и современных неравенств позволяет, к счастью, придать всей теории удиви- тельную цельность и простоту* 2). *) Эта глава посвящена специальным вопросам и может быть опущена при первом чтении. 2) Наилучшим введением в асимптотические разложения может служить книга Г. Крамера (1962). В пей содержатся теоремы из § 2 и § 4 для одина- ково распределенных слагаемых и несколько более сильный вариант теорем из § 7. Первое строгое изложение теорем о асимптотических разложениях принадлежит Крамеру, однако его методы больше не используются» Материал § 1—5 изложен и в монографии Гнеденко и Колмогорова (1954)*
696 Гл. XVJ. Асимптотические разложения § 1. ОБОЗНАЧЕНИЯ Через F мы будем обозначать всюду (кроме § 6, где рассмат- ривается случай неодинаково распределенных величин) одномер- ное распределение вероятностей с характеристической функцией Момент порядка k (если он существует) будет обозначаться + 00 Ий= $ (1.1) — 00 Предположим, что ^ = 0. Положим, как обычно, р,2 = о2. Распре- деление, полученное после нормировки пжраягной свертки F, обозначим Fn, т. е. F„(x) = /:’”*(x<jj/’n). (1.2) Обозначим плотность Fn (если она существует) через fn. За исключением § 7 (посвященного большим отклонениям), нам придется иметь дело с функциями вида + 00 = 5 (1.3) — со к которым будем применять очевидную оценку + со S о-4) — 00 Как w, так и v предполагаются интегрируемыми. Если и—плот- ность, то v будет соответствующей характеристической функцией. Для упрощения формулировок примем Соглашение. Функция v # (1.3) будет называться преобразованием Фурье для и, а правая часть неравенства (1.4)—нормой Фурье для и. Как всегда, нормальная плотность обозначается n(x)=?Uea. (1.5) Ее преобразование Фурье—характеристическая функция e(-i/2>C’, Повторным дифференцированием получаем тождество + <» 1 ^2 Afl 1 С — —— ® = 8 С (1.6) — со
§ 2. Асимптотические разложения для плотностей 597 верное для А—1, 2, ... . Очевидно, что левая часть имеет вид ^-п(х)=(-1)‘Я4(х)п«( (1.7) где Hk—полином степени k. Полиномы Hk называют полиномами Эрмита1). В частности, Ях(х) = х, Н2(х) = х2—1, Н3(х) = х3—Зх. (1.8) Характеристическое свойство полиномов Hk состоит, следователь- но, в том, что преобразование Фурье для Hk(x)n(x) равно {i^)k . § 2. АСИМПТОТИЧЕСКИЕ РАЗЛОЖЕНИЯ ДЛЯ ПЛОТНОСТЕЙ Центральную предельную теорему для плотностей (теорема 2 из гл. XV, 5) можно значительно усилить, если допустить конеч- ность моментов высшего порядка. Важную роль играет предпо- ложение2) о том, что + 00 $ I<P(S)IV^<°° — GO (2-1) при некотором v^l. Доказательство, данное в гл. XV,5, можно резюмировать, грубо говоря, следующим образом: разность ип =; = /и—п имеет преобразование Фурье п„(С) = Фп(-^Т)-е'-1/2>Е\ (2.2) Интеграл от рп(С)| стремится к нулю в силу двух причин. При сколь угодно малом, но фиксированном б > 0 интеграл по об- ласти |£|>6oj/"tt в силу (2.1) сходится к нулю. На интервале |£| <6o,j/n подынтегральное выражение |уп| мало из-за поведе- ния ф вблизи нуля. Последнее связано лишь с тем, что рх = 0 и р2 = о2. Если существуют моменты более высокого порядка, то мы можем использовать большее число членов разложения функции Ф по формуле Тейлора и можем получить таким путем более х) Иногда полиномами Чебышева — Эрмита. Единой терминологии нет. Вст- речаются различные нормирующие множители, а вместо e“x2/2 берут е~*2. 2) В связи с этим условием см. примеры 5 а), б) из гл, XV и задачу 20 гл. XV, 9,
598 Гл. XVI. Асимптотические разложения точную информацию относительно скорости сходимости fn —> п. К сожалению, все вычисления заметно усложняются, если взять более чем три члена асимптотического разложения. Поэтому мы рассмотрим отдельно простейший и наиболее важный частный случай. Теорема 1. Допустим, что момент ^существует и что для некоторого v^l функция |<p|v интегрируема. Тогда при n^v существует плотность fn и при п—> оо fn (*) — п(х) — (xs—Зх) п (х) = о (2.3) 6о3 У п \ynj равномерно относительно х. Доказательство. По теореме обращения для интегралов Фурье [гл. XV,3] при n^v левая часть равенства (2.3) определена и имеет норму Фурье + 00 <рп( —— e<-V2)£2 \ о/ п ) -^(^)М-^К2|^ (2.4) 6озу п Фиксируем произвольное 6 > 0. Так как ср"—характеристическая функция распределения, имеющего плотность, то | <р (£) | < 1 при и <р(£)—>0 при £—> оо (лемма 4 из гл. XV, 1, и лемма 3 из гл. XV, 4). Поэтому существует < 1 с тем свойством, что |ф(С)1<?з Для Часть интеграла (2.4), взятая по обла- сти | £ | > л, меньше (2-5) Ц I > toVn и, таким образом, стремится к нулю быстрее любой степени числа 1/п. Полагая для краткости 1) ч|)(0 = 1п<р(0+4С1Ч% (2-6) имеем 2л ехр (2.7) j б(-1/2) I С I < 6аУИ J) Используемые в дальнейшем логарифмы комплексных чисел опреде- ляются разложением Тейлора log (1 + z) = 2 (—которое имеет место при |z| < 1, Никакие другие значения г не рассматриваются^
§ 2. Асимптотические разложения для плотностей 699 Оценим подынтегральное выражение, используя неравенство ]е“-1 -₽ I = I (^_еР) + (е₽_ 1 _р) |< (| а—р | -|- Ip*) ev, (2.8) где у^шах(|а|, ||3|) (справедливость этого неравенства для лю- бых действительных или комплексных аир очевидным образом доказывается заменой еа и их разложениями в степенной ряд). Функция ф трижды непрерывно дифференцируема и ф(0)~ 5= ф' (0) = ф" (0) = 0, тогда как ф'" (0) = Z3p3. Поскольку ф'" не- прерывна, можно найти окрестность | £ | < б точки £ = 0, в кото- рой изменение ф'" менее е. Из разложения в ряд Тейлора выво- дим, что при | £ | < б (□—§-МФ3| < ea’lSl3. (2.9) Теперь мы выберем б столь малым, чтобы, кроме того, при |£| < б KU)I (Ф3|<4^2. (2.10) В самом деле, благодаря существованию р3 найдется окрестность нуля, в которой ф трижды дифференцируема и (2.9) оказывается лишь формой записи разложения по формуле Тейлора. При таком выборе б из неравенства (2,8) следует, что подын- тегральное выражение в (2.7) меньше, чем В силу произвольности 8 имеем Nn = o (l/j/n), так что (2.3) дей- ствительно верно. Точно такие же рассуждения приводят к асимптотическим разложениямf включающим большее число моментов. Однако их члены нельзя выразить простыми явными формулами. Поэтому мы пока отложим точное описание по- линомов,- входящих в эти разложения. Теорема 2. Предположим, что моменты pig, существуют и что для некоторого v1 функция | ф |v интегрируема, Тогда при n^v сущест- вует fn и при п —> оо fn W—П(х) —П(х) Р^(х)=о(а(*1/2) r+1) (2.12) /г=3 равномерно относительно х9 Здесь —полином с действительными коэффи- циентами вависящими только от pif? (но не от п и г или других характеристик распределения F)* Первые два члена имеют вид где Нь—полиномы Эрмита,- определенные в (1,7), Разложение (2.12) назы- вается (точнее, называлось) разложением Эджворта для fn. Доказательство, Ниже мы используем обозначение (2.6), Если р—поли-
600 Гл. XVJ. Асимптотические разложения ном с действительными коэффициентами ръ р2, то имеет норму Фурье fn П PfcHk N”~2n р(К) dZ. (2.14) (2.15) Теорема будет доказана построением подходящих полиномов р (чтобы не де- лать обозначения громоздкими, мы не будем писать индекс п). Начнем с оценки подынтегрального выражения. Процедура будет такой же, как и в предыдущем доказательстве, но с той лишь разницей, что для ап- проксимации ф будут взяты члены формулы Тейлора со степенями аргумента до r-й включительно. Это аппроксимирующее выражение мы обозначим £2Фг (£)• Таким образом, фг — полином степени г—2 с фг(0) = 0, Он одно- значно определяется требованием Положим теперь 1|)(С)-^г©=о(1£Ю> £-*о. /п v — Г с2ль ( МА р © = 2- м |5 w * У ’ /г=1 J (2.16) Тогда р (iQ будет полиномом с действительными коэффициентами, зависящими от п. При фиксированном £ с другой стороны р будет полиномом относительно 1/]/* п, коэффициенты которого можно вычислить в явном виде как полиномы относительно |лт, |Л2, ..., р.г. Как и в предыдущем доказательстве, очевидно, что при фиксированном о > 0 часть интеграла (2.15), взятая по области |£| > бо]/" п. стремится к нулю быстрее любой степени числа 1/п. Рассмот- рим поэтому только подынтегральное выражение при | £ | < бег ]/" ц, Чтобы оценить его, мы воспользуемся [вместо (2.8)] неравенством г -2 1 — 2 РМ! 1 г-2 —1 — J P*/fe! 1 1 (г-1)1 (2.17) <|е«— е₽| + (|«-₽Н IPI'-1). верным при | а | < у и | ₽ | < у. Подберем б по аналогии с (2.9) таким образом, чтобы при |£| < б вы- полнялось неравенство |Ф(0~£2Фг ©l<eoqcir< (2,18) Мы можем предположить также (учитывая, что коэффициент при ?вфгравен *3р3/6), что при |С|<6 и а> 1 + 1 Р-з I I Я5/ (О I < а I ? I < j Л (2.19) Наконец, мы потребуем, чтобы при |£| < б lWI<+’Ca. (2.20)
§ 3. Сглаживание 601 Тогда при |£| < п подынтегральное выражение в (2.15) меньше, чем ar-1 |g|3(r-D (о/п)'-1 (2.21) В силу произвольности 8 имеем Nn = o \п 2 J. Теперь мы должны определить действительные коэффициенты р^, завися- щие от п, такие, чтобы левая часть (2.14) была о (n^”1^ r+1) равномерно по х. При фиксированном £ правая часть (2.16) является полиномом относи- тельно Х/У п. Производя упорядочение по возрастающим степеням Х/У п,мы получаем разложение типа (2.12) с той лишь особенностью, что суммирование может идти и по индексам k, большим г. Но слагаемые, содержащие степени X/nk с k > 1/2 г—можно отбросить, и мы приходим к желаемому разложе- нию (2.12). Таким образом, явное вычисление полиномов можно провести следующим образом. Полином фг степени г—2 однозначно определяется из формулы Тейлора 1п<р© = ^ -|-0(| еп, (2.22) справедливой в окрестности нуля. Упорядочим слагаемые в (2.16) соответст- венно степеням 1/]/* п. Обозначим коэффициент при ^~1/2)/г+1 через 4k 09- Тогда Pk—такой полином, что преобразование Фурье для п(х)Рк(х) равно е(-1/2) qk § 3. СГЛАЖИВАНИЕ Интегрируя асимптотическое разложение для плотностей fn9 получаем аналогичное асимптотическое разложение для распре- делений Fn, но эта простая процедура не подходит, если не вы- полняется условие (2.1). Чтобы справиться с этим случаем, мы должны будем идти обходным путем (следуя Берри). Для оценки расхождения Fn—91 или какой-либо аналогичной функции А мы сначала применим основанные на анализе преобразований Фурье методы предыдущего параграфа к некоторой аппроксимации функции А (обозначим ее ГА). Затем мы прямыми методами оце- ним разность ГА—А. В этом параграфе мы дадим основные спо- собы такой оценки. Пусть VT—распределение вероятностей с плотностью рг(х)=-- (3.1) и характеристической функцией сог. Для | £ | Т имеем ®r(o=i-4L. <3-2) но эта явная форма не играет существенной роли. Важно лишь то, что сог(С) обращается в нуль при |£|^7\ Последнее обстоя- тельство снимает все вопросы о сходимости.
602 Гл* XVL Асимптотические разложения Нас будут интересовать границы для Fn—91 или, более общим образом, для функций вида Д/г = Г/г—Gn, Эти функции мы будем аппроксимировать их свертками с VT. Положим вообще ГД = 1/г^Д. Другими словами, для данной функции Д мы определяем + 00 гА(0= J Д(/ — x)vT(x)dx. (3.3) — 00 Если функция Д ограничена и непрерывна, то ГД —► Д при Т—* оо. Наша основная задача состоит в том, чтобы оценить максимум функции [ Д | через максимум функции | ГД |. Лемма L Пусть F—распределение вероятностей и G—такая функция, что G(—оо) = 0, G(oo)=l и | G' (х) | ^.т < оо. Положим Д (x) = F(x)—G (х) (3.4) и т] = sup | А (х) |, = sup IГА (х) |. (3.5) X X Тогда Доказательство. Функция А обращается в нуль на бесконеч- ности, и пределы справа A(x0 + ) и слева А(х0—) существуют в каждой точке. Отсюда ясно видно, что найдется точка х0, та- кая, что или |А (х0 -}-) | — т| или |А(хв—)| = ц. Допустим, что Д(х0) = т]. Так как F не убывает, а модуль производной от G не превосходит т, то A(xu-J-s)г]—ms для s>0. (3.7) Полагая 2т ’ / = Х04-Й, x = h—s, (3-8) имеем А(/—х)у + тх при |х|^й. (3.9) Оценим интеграл (3.3), используя (3.9) и неравенство А(/—х)^>—ц при | х | > h. Интеграл от линейного члена обращается в нуль в силу симметрии. Далее плотность vT приписывает области | х | > h массу, которая не превосходит 4/(n77i). Поэтому п >гА('х)>—fl_______—1— п—_______Д_-®3- = Д—— . nTh J II nTh — 2 nTtl 2 лТ ’ (3.10) ► В наших приложениях G будет иметь производную g, совпа-
$ 3. Сглаживание 603 дающую или с нормальной плотностью п или с начальным отрезком асимптотического разложения, указанного в предыдущем параграфе. В любом случае преобразование Фурье у, соответствующее g, имеет две непрерывные производные и у(0)=1, у'(0) = 0. Оче- видно, что преобразование Фурье свертки Tg = VT^g равно усог. Аналогично по теореме обращения преобразований Фурье из гл. XV, 3, произведение фсог является преобразованием Фурье плотности Tf распределения VT^F. Иными словами, т е-^[ф(£)-т(ЭД<МО^. (З.Н) -т Интегрируя по х, получим гд (7=i j е~*х --^v(a (У (3-12> - т Постоянная интегрирования здесь отсутствует, так как при |х|—> оо обе части стремятся к 0, причем левая часть—в силу F (х)— G(x)—>0, а правая часть—по лемме Римана — Ле- бега (лемма 4 из гл. XV, 4). Заметим, что ф(0) = у(0)=1 и ф' (0) = у' (0) = 0, следовательно, выражение под знаком интеграла является непрерывной функцией, обращающейся в нуль в нуле, так что вопрос о сходимости не возникает. Комбинируя верхнюю границу для г|г, содержащуюся в (3.12), с (3.6), получаем верхнюю границу для ц, а именно |F(x)-G(x)|<l j (3.13) -т Поскольку это неравенство служит основой всех оценок в после- дующих двух параграфах, суммируем условия его применимости. Лемма 2. Пусть F—распределение вероятностей с нулевым математическим ожиданием и характеристической функцией ф< Предположим, что F—G обращается в нуль на бесконечности и что G имеет производную g с | g | т. Допустим, что g имеет преобразование Фурье у, которое дважды непрерывно дифференци* руемо и при этом у (0) = 1, у'(0) = 0. Тогда для всех х и 71 > 0 выполняется (3.13). Мы дадим два независимых друг от друга применения этого неравенства. В следующем параграфе мы выведем интегральный вариант теорем § 2. В § 5 мы выведем знаменитое неравенство Берри—Эссеена для разности Fn—%1.
604 Гл. XVJ. Асимптотические разложения § 4. АСИМПТОТИЧЕСКИЕ РАЗЛОЖЕНИЯ ДЛЯ РАСПРЕДЕЛЕНИЙ Интегрируя асимптотическое разложение (2.3) для плотностей, получаем, что Fn (х)—91 (х) — —3ИЛ— (1 —х2) и (х) = о ( —U) . (4.1) Однако для того, чтобы это асимптотическое разложение имело место, не обязательно, чтобы распределение F имело плотность. Действительно, сейчас мы докажем, что (4.1) выполняется для всех распределений, за единственным исключением решетчатых распределений^, е. когда/7 сосредоточено на множестве точек вида b±nh). Из формулы обращения для решетчатых распределений следует, что наибольший скачок распределения Fn имеет порядок 1/Гп [см. (5.12) из гл. XV], и, следовательно, (4.1) не может быть верным для решетчатых распределений. Оказывается, однако, что следующая теорема с небольшими поправками применима даже для решетчатых распределений. Для удобства мы эти два случая разделяем. Теорема 1. Если F—нерешетчатое распределение и если мо- мент третьего порядка р,3 существует, то (4.1) выполняется равномерно для всех х. Доказательство. Положим G (х) = 91 (х)-—(х2— 1) п (х). (4.2) бегу п Тогда G удовлетворяет условиям последней леммы 2 с (4.3) постоянная а всех х. Тогда Мы применим неравенство (3.13) с Т = а]/'щ выбирается столь большой, что 24 | G' (х) | < га aV~n qn( А—-у(£) где для (4.4) Г п Так как область интегрирования конечна, то мы можем исполь- зовать рассуждения из § 2 даже в том случае, когда | <р | не ин- тегрируема на всей прямой. Разобьем интервал интегрирования на две части. Так как распределение F не является решетчатым, то в соответствии с леммой 4 из гл. XV, 1, максимум | <р (£) | при б^|строго меньше единицы. Как и в § 2, отсюда следует, что интеграл по области |^|> стремится к нулю, быстрее, чем любая степень числа 1/п. Далее, при | | боК
§ 4. Асимптотические разложения для распределений 605 подынтегральное выражение в (4.4) в силу оценки (2.11) меньше и поэтому при больших п правая часть в (4.4) меньше lOOOs/j/*^* В силу произвольности 8 это завершает доказательство теоремы. Это рассуждение неприменимо к решетчатым распределениям, потому что их характеристические функции периодичны (и, стало быть, интеграл по области | £ | > баК п не стремится к нулю). Но утверждения теоремы можно спасти естественным изменением формулировки с учетом решетчатого характера распределения. Функция распределения F является ступенчатой функцией, но мы будем аппроксимировать ее непрерывной функцией распреде- ления F# с полигональным графиком. Определение. Пусть F сосредоточено на решетке точек b ± пй, но не сосредоточено ни на какой подрешетке (т. е, h есть шаг F). Будем называть распределение F# полигональным приближе- нием к F, если график функции распределения F* представляет собой полигон с вершинами в точках b±^n + ^h, лежащих па графике F (эти точки называются средними точками решетки). Таким образом, F# (x) = F (%), если x = b±^n+^h, (4.5) F# (х) = (*) + ^ (x—)], если x = b± nh. (4.6) Пусть теперь Fn есть решетчатое распределение с шагом и, следовательно, при больших п полигональное приближение Fn очень близко к Fn. Теорема 2х). Для решетчатых распределений асимптотическая формула (4.1) остается верной, если заменить Fn ее полигональным приближением F%. В частности, (4.1) выполняется во всех средних точках b ± (п 4- -у) hn решетки для Fn (с шагом hn), тогда как в точках решетки (4.1) выполняется с [Fn (х) + Fn (х—)] вместо Fn(x). г) Вместо того чтобы заменять Fn на F*, можно разложить F# — Fn в ряд Фурье и прибавить это к правой части (4.1). Таким образом, мы формально приходим к теореме, имеющей вид той, которую доказал Эссеен с помощью длинных вычислений, См., например, книгу Гнеденко и Колмогорова,
606 Гл. XVI. Асимптотические разложения Доказательство. Нетрудно установить, что приближение F# представляет собой свертку F с равномерным распределением на интервале —|-/i < х <-^h. Соответственно F# есть свертка Fn с равномерным распределением на интервале —х <Z-^hn. Обозначим через G# свертку последнего равномерного распреде- ления с G, т. е. hn/2 G#(x) — hn1 $ G(x—y)dy. (4.8) -W2 Пусть максимум j G" | равен М, |тогда из разложения G в ряд Тейлора в точке х следует, что 1G* (x)—G (х) | < = 0 (-Ц . О \ JL f (<9) Для доказательства теоремы достаточно поэтому показать, что |F*(x)—G#(x)| = o(l/K«). : (4.10) Поскольку вычисление сверток соответствует перемножению пре- образований, мы выводим из (4.4), что aV п |F*(x)-G*(x)|< J - а V п (4.Н) где <в„ (£) = (sin-yесть характеристическая функция равномерного распределения. Все оценки, используемые для вы- вода (4.4), применимы и здесь с тем исключением, что требуются новые аргументы для обоснования соотношения a Vn а/о j |ф"(£/ап)ш„(£)|£-М£==у j |T"G/)sin^|rr®<ty = o^ . SaVn $ (4.12) По лемме 4 из гл. XV, 1, характеристическая функция ф имеет период 2л/Л и то же самое, очевидно, верно для |sin-^-/iy|. Поэтому достаточно доказать, что л/h f lTnG/)|^ = o(-U). (4.13) J \ V n ) 0 Но это соотношение справедливо, так как в некоторой окрестно- I /Х| ---- « сти нуля I ф (у) I < е 4 , а за пределами этой окрестности ] ф (у) [ отделено от 1, и, следовательно, подынтегральное выраже-
§ 4< Асимптотические разложения для распределений 607 ние в (4.13) убывает быстрее любой степени числа 1/п. Таким образом» интеграл на самом деле имеет порядок О(1/п). ► Перейдем теперь к асимптотическим разложениям более высокого порядка. Доказательство соотношения (4.1) отличается от доказательства (2*3) только применением сглаживания, которое делает пределы интегрирования в (4.4) конечным. Точно такое же сглаживание можно применить и к разложениям^ ука- занным в^(2.12), но приэгом, очевидно, чтобы получился>остаток'01(/г^'“1//2^г+1), мы должны взять Т~ап^2)Здесь возникает следующая трудность. Доказа- тельство соотношения (4.1) использует тот факт, что максимум функции I <₽ (С/О У"п) I на интервале dopr/?< | £ | < Т меньше единицы. Для нерешет- чатых распределений это всегда верно при Т — a но может быть неверно при 7, растущем как более высокая степень числа п. Поэтому для вывода асимптотических разложений более высокого порядка мы вынуждены предпо- ложить „ что to |ф©КЬ (4.14) Ш -> откуда для не решетчатых распределений следует, что максимум q& функции | ф (£) | для |£|>6 меньше L При дополнительном условии (4.14) метода детально объясненный для (4.1), применим без всяких изменений к разложениям (2.12), что приводит к следующей теореме. Теорема 3. Если существуют моменты р3, ttf-, и выполняется (4.14), то при п —> оо F п (х)(х)—П (х) n^1^2^k+1Rk (х) = о (4&15) /г=3 равномерно по х. Здесь Rk—полином, зависящий только от pij, р,г, но не от п или г (или других характеристик распределения F). Разложение (4.15)—это лишь интегральный вариант формулы (2.12), и полиномы Rk связаны с Рк из (2.12) соотношением . (4.16) Следовательно, пет нужды повторять их конструкцию. Заметим, что (4,14) выполняется для любого несингулярного распределения F. Формула (4.15) называется разложением Эджворта для F. Если F имеет конечные моменты всех порядков, возникает искушение перейти к пределу при г—>оо. Однако соответствующий бесконечный ряд не сходится ни при каком п. (Г. Крамер показал, что он сходится при любом п тогда и только тогда, когда функция *а интегрируема относительно F,) Формальное раз- ложение Эджворта не следует смешивать с разложением по полиномам Эрмита F (x)-9l(x) = J ckHk(x)e~xil\ (4.17) /2=1 которое сходится при условии, что F имеет конечное математическое ожида- ние, но без какого-либо вероятностного смысла. Например, даже если воз- можно разложить каждую функцию Fn в ряд типа (4.17), то коэффициенты не дают нам никакой информации относительно скорости сходимости Fa—► 9L
608 Гл. XVI. Асимптотические разложения § 5. ТЕОРЕМА БЕРРИ — ЭССЕЕНА1) Приводимая ниже важная теорема была доказана (совершенно различными путями) А. С. Берри (1941) и К. Г. Эссееном (1942). Теорема 1. Пусть взаимно независимые случайные величины с одинаковым распределением F таковы, что Е (X.) = О, Е (Х|) = а* 2 > 0, Е (| X J3) == р < оо. (5.1) Пусть Fn обозначает распределение нормированной суммы (Хх +... ... 4-X + „)/aj/'tt* Тогда при всех х и п (5.2) Поразительное свойство этого неравенства заключается в том, что оно зависит только от первых трех моментов. Разложение (4.1) дает лучший асимптотический результат, но скорость сходи- мости определяется более тонкими свойствами исходного распре- деления. Множитель 3 в правой части (5.2) можно было бы заме- нить^ лучшей верхней границей С, но мы не ставим себе цели достичь в нашем изложении оптимальных результатов2). Доказательство. Доказательство будет опираться на неравен- ство (3.13) с F~Fn и G = $l. В качестве Т выберем т = (5.3) тогда Т 4" У п в СИЛУ неравенства между моментами о3 < р (см. 8, в) из гл. V). Поскольку нормальная плотность имеет макси- мум, меньший 2/5, мы получаем т л|Г„(х)-ВД|< j -т _ __ 1 <Р" (£/<* К«) — е~ 2 4. (5 4) KI + Т * V» Чтобы оценить подынтегральное выражение, воспользуемся тем, что для разности а"—0" имеет место неравенство |а"—0п|^п|а—0l-y"-1,’еслы |а|«^у, |₽|^у. (5.5) Пусть а = ф(^/а/п) и р = е 2 £ /п. Из неравенства (4.1) для elt х) В этом параграфе используется неравенство сглаживания (3.13) (где G обозначает нормальное распределение), но в остальном этот параграф не зави- сит от предыдущих. 2) Берри утверждал, что С<:1,88, но его вычисления содержали ошибку. Эссеен показал, что С ^7,59. Неопубликованные вычисления дают оценки С^2,9 (Эссеен, 1956) и С^2,05 (Д. Л. Уоллес, 1958). Наш прямолинейный метод дает удивительно хорошую границу, даже без обычных сложных числен- ных расчетов. Никаких существенных улучшений нельзя ожидать без уточне- ния погрешности 24т/л в (3.13). [В, М. Золотарев (1966) показал, чтоС^ sC0,9051Прим> nepee.]i
§ 5. Теорема Берри — Эссеена 609 из гл. XV получаем <p(/)-l+yG2^ «{pm* (5.6) и, следовательно, |ф(01 < 1—4-ав;а + 4-р1^Is’ если (5.7) Тогда при |£|<Т j—£— I с I3 1 Г 6а3га3/2 1 1 5 18п cs^Z.e 18 (5-8) Так как ст3 < р, то утверждение теоремы тривиально при j/ц^З. Поэтому можно предположить, что п^=10. Тогда I <Р (С/о Кп)1п 1 < е~ 4 £, (5-9) и оценку в правой части можно принять за у"-1 в (5.5). Используя неравенство е~х—1-|-х -1-х2 при х > 0, получаем из (5.6) п <P(~V=^ \ о у п £2 2п с _ 6а3 ]/* п i_IL_e-^£2/n 2п ОП (5.Ю) —е 2 + « Поскольку то из (5.5) и (5.9) следует, что подынтеграль- ная функция в (5.4) не превосходит тСЬ2 + 1^13)е"'^ (5-11) Эта последняя функция интегрируема на —оо<£<оо,и обычное интегрирование по частям приводит к неравенству ЛТI F„ (х) -ЭТ (х) К 4 г Л+4 + 10. (5.12) Поскольку Vп < ~, правая часть (5.12) меньше < 4л, поэтому (5.2) выполняется. Теорему и ее доказательство можно распространить на после- довательности {XJ с разнораспределенными ХА. Теорема 21). Пусть Xk—взаимно независимые случайные вели* чины и . Е(Х*) = 0, Е(Х1) = о1, Е(|ХЦ) = р*. 1(5.13) 1) Дана Эссееном (но с созершенвр иным доказательством), 20 ЭД249
610 Гл. XVI. Асимптотические разложения Положим s* = CTf4-...-I-о*, r„ = pi+. •.+р„ (5.14) и обозначим через Fn распределение нормированной суммы (Xt -f-.., X„)/s„. Тогда для всех х и п |Fn(x)-SR(x)l<64. (5.15) sn Доказательство. Пусть cok—характеристическая функция тогда исходное неравенство (5.4) заменяется неравенством я|г.ы-адк j |Ш1 . (5.16) На этот раз выберем тЦ’-р (5Д7) 'п Вместо (5.5) мы воспользуемся теперь неравенством Рр..₽„|< S (Ti-..?A-iaA—₽ATA+i•••?»)• (5-18) k= 1 которое имеет место при и Применим это неравенство к - 2_ (a?/s) t* flk = e , ККГ. (5.19) По аналогии с (5.8) получим 1 2 * f 2 I (£/s„) | < 1 С2 + -g- к I3 < ехр ( - + -Ц-)V (5.20) при условии, ЧТО GkT <ZSnV2. Для того чтобы получить ПОДХО/ дящее при всех k выражение для ук, изменим коэффициент 1/6 на 3/8 и положим г‘=«К~-йНЯ:!- (8-21) Очевидно, что | Ра К 7а- Из (5.20) также следует, что | ак К V* для всех таких k, что окТ^-^sn. Но из неравенства для момен- тов рА > о* следует, что ук > 1, если акТ >-jSn. Поэтому | ак К при всех k. Теорема тривиальна, если правая часть в (5.15)^ 1, т. е, если 1/6. Таким образом, мы предположим в дальнейшем, что Ks«< V6 или Т > 16/3. Свое ыднимальнре значение ук принимаем
$ 5. Теорема Берри — дссеена 611 при некотором k, для которого верно неравенство < у 7 >— . Следовательно, y^^e-^2 при всех k. В итоге имеем IVI• • - I < ехР ( -7 + -^ + <е~^. (5.22) По аналогии с (5.10) получаем п п (5.23) k = l 8sn k = l Для того чтобы оценить последнюю сумму справа, вспомним, что oKpFC^/8-pft, откуда 1 V <--/'2a\4/8<--_J_________гп 5 гп 4 Z-l 3 ) gl/3 3 9 3 ЬП k = l X ьп / • $П 8п Эти неравенства показывают, что подынтегральное в (5.16) меньше и поэтому лТ | F„ (х)-9? (х) | С § K2S + ^ • 64 + 9,6. (5.24) выражение (5.25) (5.26) Правая часть здесь меньше 16л/3, и из (5.26) следует (5.15). ► В последнее время большое внимание уделялось обобщениям теоремы Берри—Эссеена на величины, не имеющие момента'третьего порядка. В этом случае верхняя граница в неравенстве выра- жается через момент дробного порядка или какую-либо родствен- ную величину. Первый шаг в этом направлении был сделан М. Л. Кацем (1963). Обычные вычисления в этом случае доста- точно запутаны, а попытки разработать универсальные методы, применимые ко многим случаям, не предпринимались. Наше дока- зательство предназначалось для этой цели и может быть приспо- ёоблено для значительно более широкого круга задач. В самом деле, необходимость в моменте третьего порядка появляется в доказательстве теоремы только из-за неравенства I —Их + 4- t*x*1 <-J-1 tx |3. I 1 о Фактически было бы достаточно использовать эту оценку в неко- тором конечном интервале | х | < а, а в ином случае удовлетво- риться границей /2х2.|Имеет место следующая теорема, полученная разными методами Л. В. Осиповым и В. В. Петровым. Теорема 3. Предположим, что выполнены условия теоремы 2 с той разницей, что моменты третьего порядка не обязаны сущест- £0*
612 Гл. XVI. Асимптотические разложения ковать. Тогда для произвольного %к > О |Fn(x)—^(x)|<6fs;a J |x|3F {dx}+s„2 J x2F{dx}\ \ |x|<rs | X । > Tft J (5-27) С помощью обычных приемов урезания можно распространить этот результат на случай, когда не делается никаких предполо- жений о существовании моментов1). § 6. АСИМПТОТИЧЕСКИЕ РАЗЛОЖЕНИЯ В СЛУЧАЕ РАЗЛИЧНО РАСПРЕДЕЛЕННЫХ СЛАГАЕМЫХ Теория, развитая в § 2 и 4, легко переносится на последова- тельности {Х4 независимых случайных величин с различными распределениями Uk. В действительности все наши обозначения и рассуждения были предназначены для подготовки к решению этой задачи и потому не всегда были простейшими из возможных. Мы предполагаем, что Е(Х^) = 0 и Е(Х|) = о|. Как обычно, положим Sn = °'i+• • •+°'л« Чтобы сохранить единство, мы по- прежнему будем обозначать через Fn распределение нормирован- ной суммы (Хг + ... +X„)/s„. Для определенности рассмотрим асимптотическое разложение (4.1). Очевидным аналогом левой, части (4.1) является выражение ,,(П) Dn (х) = Fn (x)-9i (x)~JV n (x), (6.1) OSn где n ^n,= SE(Xl). - (6.2) k= 1 Как было показано, в случае одинаково^ ас пр ед елейных XftDn (x)=s = о (1/Кп). Теперь Dn представляет собой сумму различных оста- точных членов, которые в данной ситуации не обязаны быть срав- нимыми по величине. Действительно, если Хк имеют четыре момента, то можно показать, что при слабых дополнительных условиях \Dn(x)\ = O(n^) + O(ns^). (6.3) Здесь любое из слагаемых может быть главным в зависимости от поведения последовательности ns~2, которая может колебаться между 0 и оо. Теоретически возможно найти универсальные оценки *) Подробнее см: W. Feller, On the Berry—Esseen theorem, Zs. Wahj> scheinlichneitstheorie verw. Gebiete, vol. 10 (1968), 261—268. Удивительно то# что универсальный общий метод фактически . упрощает рассуждения даже в классическом случае и, более тогоа без излишних усилий приводит к лучшим числовым оценкам.
§ 6. Случай различно распределенных слагаемых 613 для суммарной ошибки1), но они по своему характеру не отра- жали бы существа дела, а результаты применения их в отдельных случаях, возникающих на практике, были бы разочаровывающими. Поэтому более осмотрительно ограничиться только последователь- ностями {Х^}, в некотором смысле типичными, но при этом дока- зательства сделать столь гибкими, чтобы они были пригодны в различных ситуациях. В качестве типичной схемы мы рассмотрим такие последова- тельности, что отношения s2n/n остаются ограниченными сверху и снизу (положительными постоянными)2). Мы покажем, что при слабых дополнительных ограничениях асимптотическое разложе- ние (4.1) остается справедливым и доказательство не требует изменений. В других ситуациях остаточный член может принимать другой вид. Например, если s2=o(n), то можно сказать только то, что \Dn(x)\==o(n/s2). Однако доказательство можно приспосо- бить к такой ситуации. Доказательство (4.1) опирается на преобразование Фурье функ- ции Dn (х). Если обозначает характеристическую функцию Хь это преобразование можно записать в виде envn (g/s„)_e~T£2(?)„. гзе"Тр (6 4) 6s^ v ' где п = Slog«ft(C). (6.5) k — 1 Мы получили в точности ту же самую формулу, которая была использована в доказательстве (4.1), с той лишь разницей, что там функция vn (£) = log ср (£) была независима от п. Посмотрим теперь, как эта зависимость влияет на доказательство. При дока- зательстве были использованы только два свойства v. а) Мы использовали непрерывность производной третьего порядка ср'" для нахождения интервала | £| < 6, внутри которого изменение v'n" меньше 8. Чтобы быть уверенным в том, что такое 6 можно выбрать независимо от п, мы должны теперь ввести некото- рые условия «равномерности» относительно поведения производ- ных вблизи нуля. Чтобы обойти малоинтересные технические 1) Например, у Крамера оценка имеет вид / / П \3/2 D„W=o «‘Ч’ s Е(4) что может быть хуже (6.3)* 2) Тогда (6.3) дает | Dn (х) | = О (1/п), что точнее, чем оценка о[1/У п], полученная в (4.1), Возможно уточнение, если предположить существование четырех моментов*
614 Гл. XVI. Асимптотические разложения проблемы, мы предположим, что моменты Е (Х|) существуют и оста- ются ограниченными. Тогда производные co^,z равномерно ограни- чены и то же самое справедливо для v'n". б) Доказательство (4.1) было основано на том, что |<рп(£)| — = о(1/Гп) равномерно для всех £ > 6. Аналогом этого здесь служит условие |ац(£) ... соп(£)| = о(1/К^) равномерно по £ > 6 > 0. (6.6) Это условие исключает ту возможность, когда все Xk имеют решетчатые распределения с одним и тем же шагом; в последнем случае произведение в (6.6) было бы периодической функцией £. В остальных отношениях это условие достаточно умеренно, чтобы тривиально выполняться в большинстве случаев. Например, если Xk имеют плотности, то каждый множитель | | отделен от единицы, и левая часть в (6.6) убывает быстрее, чем любая сте- пень числа за исключением того случая, когда | со„ (£) | стре- мится к 1, т. е. случая, когда Хп стремится стать постоянной. Таким образом, условие (более сильное, чем (6.6)) ]сс>1 (£) ... со„(£)| = о(п~а) равномерно при £ > 6. (6.7) при всех п>0 часто выполнено и легко проверяется. При двух указанных дополнительных условиях доказательство (4.1) проходит без изменений, и мы получаем теорему. Теорема 1. Предположим, что существуют такие положитель- ные постоянные с, С, М, что при всех п cn<s*<Cn, Е(Х*)<?1 (6.8) и что выполняется (6.6). Тогда \Dn (х) | — о (1/К^) равномерно для всех х. Как указывалось, доказательство применимо и к другим ситуа- циям. Например, предположим, что s^/n —>0, но Sn/n—>оо. (6.9) Доказательство (4.1) проводится с T = as3n/n, а поскольку T—o(sn), условие (6.6) становится излишним. Таким образом, мы приходим к следующему варианту теоремы. Теорема 1а. Если выполняется (6.9) и Е(Х|) равномерно огра- ничено, то | Dn (х) | = о (n/s3n) равномерно относительно х. Подобным же образом обобщаются другие теоремы из § 2 и 4. Например, доказательство теоремы 3 из § 4 приводит без сущест- венных изменений к следующей общей теореме об асимптотических разложениях *). 4) Эта теорема с несколько более слабыми условиями равномерности содержится в основополагающей работе Крамера* Сами методы Крамер а,- однако, теперь устарели»
§ 7. Большие отклонений. 615 к-------------------- Теорема 2. Допустим, что О < с < Е (1X |v) < С < оо, v=l, г+1, (6.Ю) и что (6.7) выполняется с а = г-\-\. Тогда асимптотическое раз- ложение (4.15) выполняется равномерно относительно х. Полиномы Rj зависят от моментов, входящих в условия (6.10), но при фиксированном х последовательность {/?,(*)} ограничена. § 7. БОЛЬШИЕ ОТКЛОНЕНИЯ1) Мы снова начнем с рассмотрения общей проблемы в частном случае одинаково распределенных случайных величин Хл с Е (Xk)=0 и Е(Х|) = а2. Как и раньше, Fn обозначает распределение норми- рованных сумм (Xi+ ... +Х„)/сг У п. Информация о том, что Fn стремится к нормальному распределению 5R, является очень важ- ной при умеренных значениях х, но при больших х как Fn(x), так и 91 (х) близки к единице и утверждение центральной пре- дельной теоремы становится бессодержательным. Аналогично боль- шая часть наших приближенных формул и асимптотических раз- ложений становятся бесполезными. В действительности нам нужна относительная ошибка аппроксимации 1—Fn величиной 1—Л. Часто желательно бывает использовать соотношение 1^в(х) 1-91 (х) когда и х, и п стремятся к бесконечности. Это соотношение не может быть верно всегда. Так, для симметричного биномиального распределения числитель (7.1) обращается в нуль для всех х > У п. Мы покажем, однако, что (7.1) верно, если х меняется вместе с п таким способом, что хп"1/6—>0. При этом предположим, что интеграл + 00 f&)~\&F{dx} (7.2) — 00 конечен при всех £ из некоторого интервала | £| < £0. [Это равно- сильно тому, что характеристическая функция <р (С) = /(*£) анали- тична в некоторой окрестности нуля; но мы предпочитаем иметь дело с действительной функцией Теорема 1. Если интеграл (7.2) сходится в некоторой окрест- ности точки £ = 0 и х меняется вместе с п так, что х —> оо й х = о(п^в), то верно (7.1). Заменяя х на —х, мы получаем двойственную теорему для левого конца. Теорема йредставляется достаточно общей, чтобы ^) Этот параграф полностью не зависит qt предыдущц^аараграфов этой главы.
616 Гл. XVI. Асимптотические разложения охватить все «практически интересные ситуации», но метод дока- зательства приводит к значительно более сильным результатам. Для доказательства перейдем от функции f к ее логарифму. Равенство w=inf(:)=E^A (7.3) определяет функцию, аналитическую в некоторой окрестности нуля. Коэффициент ф^ зависит только от моментов распределения F и носит название семиинварианта порядка k распределения F. В общем случае ф^ = Ф2 = q2> ••• . Мы пред- полагаем = 0, и потому фх = 0, ф2 = и2, ф3==р3, .... Доказательство основано на применении сопряженных распре- делений1). Распределение V, сопряженное к F, задается равенством V {dx} = е(s) esx F {dx}, (7.4) где параметр s изменяется в интервале сходимости функции ф. Функция играет по отношению к V ту же роль, что и f по отношению к исходному распределению F. В частности, дифференцируя (7.5), видим, что V имеет математическое ожидание ф' (s) и дисперсию Ф" (s). Идею доказательства можно объяснить следующим образом. Как легко видеть или из (7.4), или из (7.5), распределения и V"* также связаны соотношением (7.4). Лишь нормирующая константа r^s) заменяется на e~n^{s\ Обращая соотношение (7.4) относительно F, получаем 1—Fn(x)=l — F»*(xo/n)=e'"l>(s) $ e-s)Vn*{dy}. (7.6) X&V n Имея в виду центральную предельную теорему, представляется ес- тественным заменить Vn* соответствующим нормальным распределе- нием с математическим ожиданием т|/ ($) и дисперсией пф" (s). Отно- сительная ошибка такой аппроксимации будет малой, если нижний предел интеграла в (7.6) близок к математическому ожиданию V”*, т. е. если х близко к ф' (s)K nlo. На этом пути можно получить при достаточно больших значениях х хорошие аппроксимации для величины 1—Fn(x) и в том числе (7.1). Доказательство. Функция ф в окрестности нуля является ана- х) Они уже были использованы в теории восстановления (гл. XI, 6) и при изучении случайных блужданий (гл. XII, 4)»
.§ 7. Большие отклонения 617 литической функцией со степенным рядом ip(s)=14--i-o2s2 + -i-g3sa4-.... (7.7) Кроме того, ф—выпуклая функция с ф'(0) = 0, и поэтому она возрастает при s > 0. Соотношение /пф' (s) = ox, s>0, х>0, (7.8) устанавливает взаимно однозначное соответствие между перемен- ными s и х, когда s и х/]/"п принимают значения из достаточно малой окрестности нуля. Каждая из этих величин может быть рассмотрена как аналитическая функция другой, и, очевидно, если -^=—>0. (7.9) а/n /и Разобьем доказательство на две части. а) Сначала мы вычислим величину Л5, получаемую заменой К'2* в (7.6) нормальным распределением с тем же математическим ожиданием пф' (s) и с той же самой дисперсией пф" ($). Стандарт- ная подстановка у = пф' (s) +1 /пф" (s) дает As = еп № <s)-(s)i. —!— C e- (i/2) dt. Ю) /2л J Дополняя показатель под интегралом до полного квадрата, полу- чаем As = exp (л [ф (s)—зф' (з)+у з2ф" (s)j V [1 — (s /пф"(з))]. (7.11) Показатель и первые две его производные в нуле обращаются в нуль, и поэтому соответствующий ряд по степеням s начинается с члена третьего порядка. Таким образом, Л, = [1- 9ЦзКм^)][1+О(пз8)], s —* 0. (7.12) Если ns3—s-О или, что то же самое, если х = о(п1/в), то (7.12) можно переписать в виде As = [1 -9? (х)] [1 + 0 (х2//п)], (7.13) где x = s К«Ф”(з)- (7-14) Осталось показать, что в (7.13) можно заменить х на х. Разло- жение (х—х)/п по степеням s не зависит от п и, как показывают обычные вычисления, начинается с члена третьего порядка. Таким образом, |х—х| = 0(ИЙ8®)==0 (х3/п). (7J5)
618 Гл. XVI. Асимптотические разложения Из 1, гл. VII, (1.8), мы знаем, что при t->-oo п (0 f Интегрируя в пределах от х до х, получаем при х—>оо 11о§ !-<(х) = О (х • | х—х |) = О (х4/п). (7.16) (7.17) Следовательно, |^|Й=1+0(х7п). (7.18) Отсюда и из (7.13) получаем при х—>оо и х = о(п1/6) 4 = [1-9Цх)][1+0(Жп)]. (7.19) б) Пусть 97 обозначает нормальное распределение с математи- ческим ожиданием m|/(s) и дисперсией m|/(s). Тогда As по опре- делению есть правая часть в (7.6), где распределение V'z* заме- нено на 975. Мы приступим теперь к оценке ошибки, совершаемой при такой замене. По теореме Берри—Эссеена из § 5 для всех у |У"*(1/)-^(у)|<ЗМ,/озКп, (7.20) где обозначает абсолютный момент третьего порядка распре- деления V. Производя интегрирование в (7.20), после интегриро- вания по частям находим, что 11—F„(x)—Л5| < 3/И5 о3)/" п em|;(s) e-st'(s).|_s e-^dy = - m|/(s) — e"W(s>~s*'(s>i. В силу (7.11) д s = en^(s) ~ • e2 x*[l-W)]~l (7.21) (7.22) И, следовательно, правая часть в (7.21) равна Д18-О(х/Кп). Таким образом, l-Fn(x) = As[i + O(xl/n)]. (7.23) Вместе с (7.19) это доказывает не только теорему, но и более сильное утверждение. Следствие. Если х—* оо, так что х=о(пЧ*), то l~Fn(x) 1-Я(х) (7.24) \ У п / Мы попутно получили более обаде§ соотношение} которое применимо,
§ 7. Большие отклонения 619 тогда, когда х меняется вместе с п так, что х^->оо, но х = О(рг п). Дейст- вительно, в этом случае в силу (7.23) 1 —Fn (x)~As> где Л^определено в (7.11). Аргументом функции распределения 91 в (7.11) служит х, но из (7.18) следует, что х можно заменить на х, Мы получаем, следовательно, общую формулу 1— Fn (х) = ехр {п [ip (s)—sip'(s) + (l/2)i|>'a(s)]} [1 —ЭД (х)] [14-0 (х/У п)]. (7.25) Показатель можно представить степенным рядом относительно s, начинаю- щимся с члена третьего порядка. Как и в (7.8), мы определяем теперь ана- литическую функцию переменного z равенством ф' (s)=ozt Затем мы опреде- ляем степенной ряд X соотношением z2X (2) = XjZ» 4- V4 * 4-.,, = 4 (s)—S1|>' (s) 4- у (s). (7.26) Тогда верна Теорема 21). Если в теореме 1 условие х = о(п^в) заменить х = о (У и), то В частности, если х = о (п1^4), то достаточно учитывать только член степенного ряда X. Мы получаем ~еХР U1X3//«}. *i= -gh Если х возрастает как о(и3^10), имеем 1—fn(x) р Х* I 1 О2Ар4 —ЗЦ)! 1 —ЭД(х) РР11/’^+\п )’ 24ов условием (7.27) первый (7.28) (7.29) и так далее. Заметим, что правые части в приведенных соотношениях могут стремиться или к 0, или к оо (и, следовательно, из этих формул не вытекает асимптоти- ческая эквивалентность 1—Fn (х) и 1—9? (*)). Такая эквивалентность сущест- вует только в случае, когда х = о(п1/6 * В. *) [или в случае, когда х = о(п^4) и третий момент равен нулю]. При любых условиях мы имеем следующее интересное Следствие. Если х — о(У п), то при любом 8 > О exp (- (1 + 8) х2/2) < 1 -Fn (х) < exp (- (1 - 8) х2/2). (7,30) Развитую здесь теорию можно распространить на суммы слу- чайных величин с различными распределениями и характери- стическими функциями Эту процедуру можно иллюстрировать х) Использование преобразования (7.4) в связи с центральной предельной теоремой принадлежит, по-видимому 5 Эсшеру (1932). Теорема 2 доказана Г. Крамером (1938) и была затем распространена на разнораспределенные слагаемые Феллером (1943). Более новые результаты указаны в статьях В. В. Петрова [УМН, 9 (1954)] и В. Рихтера [Локальные теоремы для боль- ших отклонений, Теория вероятностей и ее применения, 2 (1957), стр, 206—220]* Последний рассматривает,’ правда, не функции распределенияа плотности, О другом подходе приводящем к аппроксимации вида 1 — Fn(x)^ = exp [у (x)-J-o (v (х))], см. в работе Феллера, Zs. Wahrscheinlichkeitstheorie verw. Gebiete, v, 14 (1969), 1 — 20,
620 Гл. XVI. Асимптотические разлвжениЯ следующим ниже обобщением теоремы 1, где условия равномер- ности являются излишне строгими. Распределение нормированной суммы (Xj + ... + X„)/s„ снова обозначается через Fn. Теорема 3. Предположим, что существует интервал —а, а, на котором все характеристические функции являются аналити- ческими, и что Е(|Х„|’)<МС (7.31) где постоянная М. не зависит от п. Если sn и х стремятся к оо так, что х = о($„/3), то с ошибкой О(х*1$^. Доказательство остается тем же с той лишь разницей, что ф заменяется теперь определенной в пр и —a<s<a аналитической функцией принимающей на этом интервале действительные значения: п = (7.33) " k= i Во всех выкладках место хвУ п займет теперь xsn. Основное со- отношение (7.8) примет вид ty'n(s) = xsn/n.
ГЛАВА XVII БЕЗГРАНИЧНО ДЕЛИМЫЕ РАСПРЕДЕЛЕНИЯ В этой главе представлено ядро ставшей теперь классической области предельных теорем теории вероятностей. Эта область по- добна водохранилищу, образовавшемуся из бесчисленных отдель- ных потоков и течений. Наиболее экономное изложение следовало бы начинать со схемы серий, представленной в § 7. Однако мы и на этот раз начнем с обсуждения простых частных случаев для того, чтобы облегчить восприятие разнообразных важных вопросов. Понятия безграничной делимости, устойчивости и т. д. и их интуитивный смысл обсуждались в гл. VI. Основные результаты этой главы были получены в другой форме и другими методами в гл. IX, но эта глава содержит более детальную информацию. Настоящая глава автономна и ее можно изучать как непосред- ственное продолжение гл. XV (о характеристических функциях) независимо от других глав. § 1. БЕЗГРАНИЧНО ДЕЛИМЫЕ РАСПРЕДЕЛЕНИЯ Мы по-прежнему будем использовать определенную термино- логию, в равной степени относящуюся как к распределениям, так и к характеристическим функциям. Имея это в виду, переформу- лируем определение безграничной делимости, данное в гл. VI,3, следующим образом. Определение. Характеристическую функцию со называют без- гранично делимой тогда и только тогда, когда при каждом п существует характеристическая функция а)п, такая, что (1.1) Ниже будет показано, что безграничная делимость может ха- рактеризоваться и другими замечательными свойствами, которые объясняют, почему это понятие играет такую важную роль в тео- рии вероятностей. Замечание о корнях и логарифмах характеристических функ- ций. Заманчиво рассматривать сол в (1.1) как корень /i-й степени из со. Однако, чтобы этим воспользоваться, мы должны показать, что этот корень почти всюду определяется однозначно. Для об- суждения вопроса о неопределенности корней и логарифмов в комп- лексной области удобно тригонометрическое представление a^reiQ комплексного числа а 0. Положительное число г однозначно опре-
622 Гл. XVII. Безгранично делимые распределения делено, однако аргумент 0 определен только с точностью до крат- ных 2л. По существу, эта неопределенность распространяется на представления log а = log г -|- id и аДп = f^e®!11 (где г^п обозна- чает арифметический корень, a log г—обычный логарифм дейст- вительного числа). Тем не менее в любом интервале | £ | < £0, в котором со (£) =й= О, характеристическая функция со допускает единственное представление вида co(£) = r (t)eiQ&\ такое, что 0 непрерывна и 0(О) = О. В таком интервале мы можем записать однозначным образом log со (g)=log г (g)+id (£) и со1/" (£)=г1^ (£) eiQ^)/n. Наши определения—это единственный способ сделать log со и <о1/п непрерывными функциями, которые действительны в точке £ = 0. В этом смысле log со и однозначно определены в любом интервале | £ | < £0, не содержащем нулей характеристической функции со. Мы будем использовать обозначения log со и со1/" только в указанном смысле. Однако надо иметь в виду, что это опреде- ление перестает действовать1), как только со(£0) = 0. ► Пусть F—произвольное вероятностное распределение и ср—его характеристическая функция. Напомним, что, согласно (2.4) из гл. XV, F порождает семейство обобщенных распределений Пуассона (1.2) /г = 0 с характеристическими функциями где с > 0—произволь- ный параметр. Очевидно, что функция —безгранично делимая (корень со1/п имеет ту же самую форму с заменой с на с/n). Нормальное распределение и распределение Коши свидетель- ствуют, что безгранично делимое распределение не обязано при- надлежать обобщенному пуассоновскому типу. Однако мы покажем, что любое безгранично делимое распределение является пределом последовательности обобщенных пуассоновских распределений. Основой всей теории является Теорема 1. Пусть {<pj—последовательность характеристи- ческих функций. Для того чтобы существовал непрерывный предел ©(□ = lira <$(£), (1-3) необходимо и достаточно, чтобы "[<₽„©-!]->№ (1-4) где функция ф непрерывна. В этом случае со(£) = еЖ (1.5) 1) В конце гл. XV,2 (а также в задаче 9, гл* XV,9), указаны пары дей- ствительных характеристических функций, таких, что фа = ф2* Это показы- вает, что при наличии нулей даже действительные характеристические функ- ции могут иметь два действительных корня, котррыр такда будут характери- стическими функциями*
$ /. Безгранично делимые распределения 623 Доказательство. Напомним, что согласно теореме непрерыв- ности из гл. XV,3, если последовательность характеристических функций сходится к непрерывной функции, то последняя является характеристической функцией, а сходимость автоматически будет равномерной на любом конечном интервале. а) Начнем с более простой части теоремы. Пусть выполнено (1.4), где ф непрерывна. Тогда Ф„(£)~>1 при каждом фиксиро- ванном £ и сходимость равномерна на конечных интервалах. Это означает, что в любом интервале | £ | < для всех достаточно больших п выполняется неравенство |1 — Ф„(£)| < 1- Тогда для таких больших п из разложения Тейлора функции log(l—z) мы заключаем, что П log<pn (O = nlog[l—[1—ф„ (£)]] = . (1.6) В соответствии с (1.4) первый член справа стремится к ф(£) и так как фл (s)—>1, то получаем, что все остальные члены стре- мятся к нулю. Таким образом, п1о2ф„—>ф или ф„—что и утверждалось. в) Обратное утверждение также легко доказать, если известно, чтов (1.3) предельная функция со не имеет нулей. Действительно, рассмотрим произвольный конечный интервал В нем оп- ределяемая соотношением (1.3) сходимость равномерная, и для всех достаточно больших п отсутствие нулей у функции со при- водит к тому, что также и ФЛ(С)¥=О при Следовательно, мы можем перейти к логарифмам и сделать вывод, что п log фд —> log со и поэтому ^ф„—>0. Это приводит нас к тому, что ФЛ (£) —> 1 для каждого фиксированного £, причем на каждом конечном интервале эта сходимость равномерная. Так же как и в а), мы делаем вывод, что разложение (1.6) справедливо, и, так как 1 — Ф„(£)—>0, приходим к тому, что «log ф„ (£) = — П [1 —ф„ (У] [1 + О (1)], (1.7) где О (1) обозначает величину, стремящуюся к нулю при п—>оо. По предположению левая сторона имеет пределом log<o(£), и поэтому очевидно, что п[1 — срп] —>—logTp, что и утверждалось. Для завершения доказательства мы должны показать, что со (£) не может обращаться в нуль ни при каком значении £. Для этого заменим функции со и фл характеристическими функциями |со|2 и | фи |2 соответственно и нам достаточно рассмотреть частный слу- чай (1.3), когда все фл—действительные и фл^0. Пусть теперь —интервал, в котором <о(£)>0. Внутри этого интервала —п^фп(£)—положительная и ограниченная функция. С другой стороны, для справедливо разложение (1.6) и, так как все члены имеют одинаковый знак, заключаем, что и п[1—фп(£)] ограничена для всех |£|<£г Однако на основании основного
$24 Гл. XVII. Безгранично делимые распределения неравенства гл. XV, (1.7), для характеристических функций «t1 — Фп (2С)] < 4n [1—<р„ (£)], мы заключаем, что п(1—(£)] остается ограниченной для всех |£|^С2£Р Следовательно, этот интервал не содержит нулей функ- ции со. Теперь, применяя наши рассуждения к этому интервалу, сделаем вывод, что со(£)>0 для всех Этот процесс показывает, что со (£) > 0 для всех £, что и завершает доказа- тельство. ► Теорема 1 имеет много следствий. Умножив соотношение (1.4) на t > 0, отметим, что оно эквивалентно следующему: е^[Ф„ю-1] _> е'Ш) = (i s) Левая часть представляет собой характеристическую функцию обобщенного распределения Пуассона, и, следовательно, — характеристическая функция для всех t > 0. В частности, мы отмечаем, что функция со = е^ безгранично делима. Другими сло- вами, каждая характеристическая функция со, представимая в виде предела последовательности {срй} характеристических функций, безгранично делимая. Это можно было бы принять за обобщение определения безграничной делимости, заменив тождество (1.1) более общим предельным соотношением (1.3). В § 7 будет пока- зано, что этот результат можно дальше продолжить на более рбщую схему серий. Зафиксируем наши результаты в виде тео- ремы 2. Теорема 2. Характеристическая функция со безгранично делима тогда и только тогда, когда существует последовательность {сри| характеристических функций {ср„}-, таких, что ср^—>со. В этом случае для любого t > 0 со*—характеристическая функ- ция и со (£) =7^0 для всех £. Следствие. Непрерывный "предел последовательности {со„} без- гранично делимых характеристических функций—также безгра- нично делимая функция. Доказательство. По предположению ср„ = соУп снова характе- ристическая функция, и поэтому соотношение сол = со можно пере- писать в виде ср"—>со. ► Каждое обобщенное распределение Пуассона безгранично де- лимо, и теорема 1 указывает, что любое безгранично делимое распределение можно представить как предел последовательности обобщенных распределений Пуассона (см. (1.8) при £=1). Таким образом, мы получаем новую характеризацию безгра- нично делимых респределений.
§ 2, Канонические формы, Основная предельная теорема. 625 Теорема 3. Класс безгранично делимых распределений совпадает с классом предельных распределений для обобщенных пуассонов- ских распределений. Применение к процессам с независимыми приращениями. Согласно гл. VI,3, такие процессы могут быть описаны посредством семейств {X (/)} случайных величин, обладающих тем свойством, что для любого набора t0 < . < tn приращения X (tk)— X представляют собой п взаимно независимых слу- чайных величин. Приращения стационарны, если распределение X ($+0 — X (s) зависит только от длины t интервала и не зависит от его положения на вре- менной оси. В этом случае X (s+/) — X (s) есть сумма п независимых случай- ных величин, распределенных так же, как X(s-]-t/n)—X (s). Следовательно,- распределение X(s+0 — X (s) безгранично делимо. Обратно, любое семейство безгранично делимых распределений с характеристическими функциями вида определяет процесс с независимыми стационарными приращениями. В § 7 этот результат будет обобщен для схемы серий на процессы с нестационар- ными независимыми приращениями. Приращение X (/ + s) — X (s) будет тогда суммой приращений Х(^ + 1) — X(/fe), которые являются взаимно независимыми случайными величинами. Тогда теорема из § 7 применима при условии, что процесс непрерывен, т. е. X(t-}-h) — X (t) стремится по вероятности к нулю при h—>0. Для таких процессов распределение приращений X(/ + s) — X (s) безгранично делимо. (Существуют разрывные процессы такого типа, однако разрывы имеют простую природу и в определенном смысле устранимы. См. обсуждение в гл. IX,5а, и IX,9.) Обобщенные пуассоновские процессы допускают очень простую вероят- ностную интерпретацию (см. гл. VI,3, и гл. IX,5). и тот факт, что любое безгранично делимое распределение представимо как предел обобщенных пуас- соновских распределений, помогает понять природу более общих процессов с независимыми приращениями. § 2. канонические формы, основная предельная теорема Мы видели, что для отыскания наиболее общего вида безгра- нично делимых характеристических функций = достаточно определить общий вид возможных пределов последовательностей характеристических функций ехр сп (£п— 1) обобщенных пуассонов- ских распределений. Для различных приложений желательно по- ставить более общую задачу, используя произвольное центриро- вание. Таким образом, мы ищем возможные пределы характери- стических функций вида (дп = е^п, где мы полагаем «)=г„[ф»(О-1-(2-1) Так как со„ безгранично делимы, то же самое верно и для их непрерывных пределов. Наша цель—найти условия, при которых существует непре- рывный предел Ш) = 1йпфп(£). (2-2) При этом фга—характеристическая функция вероятностного рас- пределения Fn, сп—положительные постоянные, —действитель- ные центрирующие постоянные. Для распределений, имеющих математическое ожидание, естест- венно центрирование математическим ожиданием, и всякий раз,
626 Гл. XVII'. Безгранично делимые распределения когда это. возможно, мы будем выбирать соответствующим об” разом. Однако нам нужно подходящее ко всем случаям центри* рование с подобными свойствами. Как оказывается, в простейшем случае такое центрирование получается, если потребовать, чтобы при £=1 значение ярЛ было действительным. Если ип и vn обоз* начают действительную и мнимую части ср„, то наше условие тре- бует, чтобы 00 ₽n = y»(1)= $ sinxFJdx}. (2.3) — оо Отсюда видно, что такое центрирование всегда возможно. При этом 00 $ [е‘г*— 1 — i£smx]F„{dx}. (2.4) — 00 Подынтегральное выражение в (2.4) ведет себя вблизи нуля подобно' —т- е- так же» как ПРИ более привычном цент- рировании математическим ожиданием. Полезность центрирова- ния с постоянной (2.3) в большой степени обусловлена следую- щим утверждением. Лемма. Пусть заданы последовательности {сп} и Если существуют центрирующие постоянные £п, такие, что ярп стре- мятся к непрерывному пределу яр, тогда и для центрирующих постоянных (2.3) яри стремятся к непрерывному пределу. Доказательство. Определим ярл формулой (2.1) с произволь- ными и предположим, что яр„—>яр. Если b обозначает мнимую часть яр (1), то (2-5) Умножая на /£ и вычитая левую часть из яр„, а правую часть из яр, мы получаем Сп [<Р„ (О— 1 -ivn (1) £]ф (£)-*K, (2.6) что завершает доказательство. Мы начнем исследование проблемы сходимости в специальном случае, когда ее решение особенно простое. Предположим, что функции яра и яр дважды непрерывно дифференцируемы (это озна- чает, что соответствующие распределения имеют дисперсии; см. гл. XV, 4). Предположим также, что не только ярл—>яр, но и яр„—>яр". Это означает, согласно (2.1), что + 00' сп $ e‘txx2Fn{dx}—*—$" (£) (2.7) — со Предполагая, что enx2Fn {dx} определяет конечную* меру,, обозна-
§ 2. Канонические формы. Основная предельная теорема 627 чим ее полную массу через р,„. Полагая £ = 0 в (2.7), мы заклю- чаем, что |л„—>—ф" (0). После деления обеих частей (2.7) на р,„ мы получим слева характеристическую функцию некоторого собст- венного распределения вероятностей, которая при п—>оо стре- мится к ф"(£)/ф"(0). Отсюда следует, что ф" (£)/ф" (0) есть харак- теристическая функция некоторого распределения вероятностей и, следовательно, + 00 —ф"(0 = $ e^xM{dx}, (2.8) — 00 где М—конечная мера. Находим теперь ф повторным интегри- рованием равенства (2.8). Принимая во внимание, что ф(0) = 0 и при нашем центрировании ф(1) должно быть действительным, мы получаем Ф© = f м (2.9) — 00 Этот интеграл имеет смысл, поскольку подынтегральное выраже- ние—ограниченная непрерывная функция, принимающая в нуле значение — При наших предположениях относительно дифференцируемости предел ф необходимо имеет вид (2.9). Теперь мы покажем, что для произвольно выбранной конечной меры М интеграл (2.9) определяет безгранично делимую характеристическую функцию Однако мы можем сделать еще один шаг. Для того чтобы интег- рал (2.9) был определен, нет необходимости требовать конеч- ности меры М. Достаточно того, что М принимает конечные зна- чения на конечных интервалах и что М {—х. х} возрастает достаточно медленно, чтобы интегралы М+(х)= J y~2M{dy}, М-(—х)= $ y~*M{dy\ (2.10) X — 00 сходились для всех я>0. (Для определенности мы считаем ин- тервалы интегрирования замкнутыми.) Типичные примеры пред- ставляют собой меры, определяемые плотностями fx^dx при О < р < 1. Мы покажем, что если М обладает указанными свой- ствами, то (2.9) определяет безгранично делимую характеристи- ческую функцию, и что все безгранично делимые характеристи- ческие функции получаются таким способом. В связи с этим удобно ввести специальное название для таких мер. Определение 1. Назовем меру М канонической, если она при* Нимает конечные значения на конечных интервалах и интег* ралы (2.10) сходятся для некоторых (и, следовательно, всех) х > 0. Ледо 2. Если М—кйнт^сская мера и ф задается выраже*
628 Гл. XVII. Безгранично делимые распределения наем (2.9), то ё® — безгранично делимая характеристическая функция. Доказательство. Мы рассмотрим два важных частных случая. а) Предположим, что мера М сосредоточена в нуле и прини- мает там значение т > 0. Тогда ф(0 =—т£2/2 и —характе- ристическая функция нормального распределения с диспер- сией /п"1. б) Предположим, что мера М. сосредоточена на множестве | х | > т|, где п > 0. В этом случае можно переписать (2.9) в более простом виде. В самом деле, теперь х“2М {dx} определяет конеч- ную меру с полной массой р = Л4+(т]) + М~ (—т]). Соответственно х~2М {dx}/[i = F {dx} определяет вероятностную меру с характе- ристической функцией ср и очевидно, что ф (£) = р [ф (£)—1 — ibQ где b—действительная константа. Таким образом, в этом случае е^—характеристическая функция обобщенного пуассоновского рас- пределения и, следовательно, является безгранично делимой. в) В общем случае, пусть мера М задает массу m>0 в нуле и пусть %(?)= j (2.11) I X I > T) Тогда Km (2.12) Мы видели, что —характеристическая функция безгранично делимого распределения Если т > 0, то сложение величины (—т£2/2) с фп (£) соответствует свертке с нормальным распре- делением. Таким образом, с учетом (2.12) е^ предстает как пре- дел последовательности безгранично делимых характеристических функций, и, следовательно, е^ безгранично делима, как и утверж- далось. Мы теперь покажем, что представление (2.9) единственно в том смысле, что различные канонические меры приводят к раз- личным интегралам. Лемма 3. Представление (2.9) для ф единственно. Доказательство. В частном случае конечной меры М. ясно, что существует вторая производная ф" и что —ф" (£) совпадает с математическим ожиданием е*х относительно меры М. Из тео- ремы единственности для* характеристических функций следует, что М однозначно определяется по ф" и, следовательно, по ф. Это рассуждение может быть приспособлено для случая неог- раниченных канонических мер. При этом необходимо вторую произ- водную заменить оператором с теми же свойствами, но применимый к произвольным непрерывным функциям, Такие операторы можно
§ 2. /(анонМЖё формы. Основная предельйай гпёорема 629 выбрать различными способами (см. задачи 1—3). Мы выберем оператор, который преобразует ф в функцию ф* по формуле h M + (2-13) -h где /i>0— произвольное, но фиксированное число. Для функции ф, определяемой равенством (2.9), мы получим ф*(£) = J e‘l*K(x) М {dx}, (2.14) — 00 где мы для краткости обозначили Л(х) = х-2 [1—. (2.15) Это строго положительная непрерывная функция, принимающая в нуле значение /г2/6; К(х)~х~2 при х—> + оо. Поэтому мера Л4*, определяемая соотношением Л4* {dx} = К(х) М {dx}, конечна, а равенство (2.14) задает ф* как преобразование Фурье меры Л4*. По теореме единственности для характеристических функций зна- чения ф* однозначно определяют меру Л4*. Но тогда и M{dx} = =К~1 (х) /И* {dx} однозначно определено, а поэтому значение ф позволяет нам вычислять соответствующую каноническую меру (ср. с задачей 3). |> Наша следующая цель состоит в том, чтобы доказать, что лемма 2 описывает совокупность всех безгранично делимых харак- теристических функций. Однако для этого мы должны сначала решить проблему сходимости, поставленную в начале этого па- раграфа. Теперь мы сформулируем ее в несколько более общей форме. Пусть {Мп} — последовательность канонических мер и Ф„ (С) = j elZX-l-^siRX мп {dx} + ib£, (2.16) — co где bn—действительные числа. Нас интересуют необходимые и достаточные условия сходимости %—>ф, где ф—непрерывная функция. Заметим, что функции фп, определенные формулами (2.1) или (2.4), представляют собой частный случай (2.16), когда Mn{dx} = cnx2Fn{dx}. (2-17) Предположим, что ф„—>ф и предельная функция ф непре- рывна. Тогда для преобразований, определяемых формулой (2.13), выполнено ф* —»-ф*, т. е. + оо $ К (х) Мп {dx} ф* (С), (2.18)
630 Гл. XVII. Безгранично делимые распределения где К—строго положительная непрерывная функция из (2.15). Слева в (2.18) мы имеем преобразование Фурье конечной меры с полной массой + со $ K(x)Mn{dx}. — со (2-19) Очевидно, что pfi—>ф*(0). Легко видеть, что р„ —>0 должно влечь за собой ф(£) = 0 для всех Следовательно, мы можем положить ф*(0) = р>0. Тогда меры М*, определяемые равен- ством №*{<bc} = ±K(x)Mn{dX}, (2.20) Р'П являются вероятностными мерами, и, согласно (2.18), их харак- теристические функции стремятся к непрерывной функции ф* (£)/ф* (0). Поэтому М*->А4*, (2.21) где М*—распределение вероятностей с характеристической функ- цией ф* (£)/ф* (0). Однако ф„ можно переписать в виде = J е‘£Х~1 JZ£sin Х К'1 (*) М* {dx} + ibnt. (2.22) — 00 Поскольку подынтегральное выражение представляет собой огра- ниченную непрерывную функцию аргумента х, то ввиду (2.21) интегралы сходятся при п—>оо. Отсюда следует, что Ьп—+ Ь и предельная функция ф имеет вид + 00 № = 1*J ? 1J %sln Х К-1 (х) М* {dx} + (2.23) — 00 Так как А4*—вероятностная мера, то мера М, определяемая соотношением М {dx} = (х) M* {dx}, (2.24) является канонической и Ф(0= M{dx}-HX- (2.25) Теперь видно, что, если отвлечься от центрирующего слагаемого ib£, все предельные функции имеют вид, установленный в лемме 2. Как уже отмечалось, функции фп из (2.1) являют собой частный случай (2.16), и, следовательно, мы решили проблему сходимости, сформулированную в начале этого параграфа. Зафиксируем этот результат в форме теоремы.
§ 2. Канонические формы. Основная предельная теорема 631 Теорема 1. Класс безгранично делимых характеристических функций совпадает с классом функций вида ё*, где ф определяется равенством (2.25) через каноническую меру М и действительное число Ъ. Другими словами, с точностью до произвольного способа цен- трирования существует взаимно однозначное соответствие между каноническими мерами и безгранично делимыми распределениями. В предыдущих рассуждениях мы подчеркивали, что условия М* —>М* и bn—*b являются необходимыми для сходимости ф„ —> -ф. На самом деле мы также показали и достаточность этих условий, так как ф„ можно записать в виде (2.22), откуда с оче- видностью следует, что ф„ стремится к предельной функции, опре- деляемой формулой (2.23). Таким образом, нами получена полез- ная предельная теорема, но было бы желательно условие М* —> М* выразить в терминах канонических мер Мп и М. Связь между М„ и Мп задается соотношением (2.22). Поскольку на конечных интервалах значения функции К(х) отделены от 0 и оо, то для любого конечного интервала / соотношения М* {/}—>-М*{1} и М„{7}—>-М {/} равносильны. При х—> оо функция К(х) прибли- женно ведет себя как х~2, и, следовательно, М*п {х, оо} ~ М„ (x)t где М« обозначает один из интегралов (2.10), которые были введены при определении канонических мер. Таким образом, собственная сходимость М*—>М* полностью эквивалентна соот- ношению М„{7}—>М{7} (2.26) для всех конечных интервалов непрерывности меры М или соот- ношениям Mt (х) -> М+ (х), М- (х) М-(х) (2.27) во всех точках х > 0 непрерывности предельных функций. В слу- чае канонических мер вида Mn{dx} = cnx2F„{dx} (где^—вероят- ностное распределение) эти соотношения принимают вид c„$x2F„{dx}->M{/} (2.28) I и Сп [i-Fn (X)] М+ (X), cnFn (- X) — М-(- х). (2.29) Если I = a, Ь—конечный интервал непрерывности, который не содержит точку нуль, то из (2.28), очевидно, вытекает cnFn {/}—> М-М+(а)—М+ (Ь) и поэтому можно рассматривать (2.29) как распространение (2.28) на полупрямые. Это условие равносильно требованию, чтобы не было «утечки массы на бесконечности» в том смысле, что для любого е > 0 найдется такое т, что т)]<е (2.зо)
632 Гл. XV11 .Безгранично делимые распределения по крайней мере для всех достаточно больших п. При наличии (2.28) условия (2.29) и (2.30) эквивалентны. [Заметим, что левая часть (2.30) есть убывающая функция т.] Последовательности канонических мер Мп {dx} = cnx2Fn {dx} будут встречаться настолько часто, что желательно ввести удобное понятие для ссылок. Определение 2. Последовательность {Мп} канонических мер называют собственно сходящейся в собственном смысле к канони- ческой мере М, если выполняются условия (2.26) и (2.27). В этом и только в этом случае мы пишем Используя новую терминологию можно сформулировать полу- ченный результат о сходимости фп—>ф в следующем виде. Теорема 2. Пусть Мп—каноническая мера, а ф„ определяется по формуле (2.16). Для того чтобы фп сходилась к непрерывной предельной функции ф, необходимо и достаточно, чтобы сущест- вовала такая каноническая мера М, что Мп —> Л4, и чтобы Ьп —Ь. В этом случае ф определяется из (2.25). В дальнейшем мы будем пользоваться этой теоремой только в частном случае, когда «)=с„[фвю-1-ад. (2-31) где есть характеристическая функция вероятностного распре- деления Fn. Тогда наши условия принимают вид c„x*Fn{dx} —*M{dx}, спфп-Ьп)-^Ь, (2.32) где + 00 ₽„= $ sinx-F{dx}. (2.33) — 00 В силу теоремы 1 § 1 наши условия применимы не только к по- следовательностям обобщенных пуассоновских распределений, но и к более общим последовательностям вида {ф„}. Замечание о других канонических представлениях. Представление с мерой М не единственное, которое можно встретить в литературе. В первоначальных исследованиях П. Леви использовалась мера Л, определяемая для х 0 ра- венством Л {dx} — x~2M {dx}. Эта мера служит пределом для nFn{dx}. Она конечна на интервалах | х | > 6 > 0, но может быть неограниченной в окрест- ности нуля. Атом М в нуле, если он существует, не учитывается мерой А* В терминах этой меры (2.9) принимает вид Ф © = —Va2£2+^£+ lim f [е^х— 1 + «С sin х] Л {dx}. (2.34) * д -> о J I х| >6 Это есть (с точностью до выбора центрирующей функции), первоначальное каноническое представление, данное П. Леви. Его основной недостаток в том, что полное описание свойств меры Л оказывается слишком длинным. Хинчин ввел ограниченную меру Д, определяемую равенством Д {rfx} = = (l+x2)”i М {dx}t Эта ограниченная мера может быть выбрана произвольно»
§ 2. Канонические формы. Основная предельная теорема 633 .Поэтому каноническое представление по Хинчину задается выражением + со *(£)=»£ + j [е^-1—(2-35) — со Его легче всего описать, поскольку оно имеет дело только с ограниченными мерами. Это преимущество нейтрализуется тем обстоятельством, что искусст- венный выбор меры К излишне усложняет многие рассуждения. Устойчивые распределения и пример 3, е) показывают характер этих трудностей. 2а. Производные характеристических функций Пусть F — распределение вероятностей с характеристической функцией ф5 Как было показано в гл. XV, 4, если F имеет математическое ожидание р, то ф имеет производную ф' и ф'(0)==ф,. Обратное утверждение неверно. Дифференцируемость функции ф тесно связана с законом больших чисел для последов ател ьности ,{Х„} независимых случайных величин с общей функцией распределения F. Поэтому во многих работах изучались налагаемые на F условия, при которых существует ф'. Эта проблема была решена Питмэном в 1956 г. вслед за А. Зигмундом (1947), который получил частичный ответ, налагая на ф некоторые условия гладкости. Поскольку прямой подход к про- блеме грозит большими трудностями, интересно узнать, что ее решение есть простое следствие последней теоремы 2. Теорема. Каждое ив трех следующих условий влечет ва собой два других, (О ф' (0)=ф- (ii) При t—> оо t — P(t) + F (/)]—> О, ^xF{dx}—(2.36) (iii) Арифметическое среднее (Xr-f-.. сходится по вероятности к pi, Доказательство. Так как действительная часть ф является четной функ- цией, то производная ф' (0) обязательно будет чисто мнимой. Чтобы просле- дить связь между нашей предельной теоремой и соотношением ф'(О) = гр, последнее лучше записать в виде t [ф (£//) -1] —> фС, i —> 00. (2,37) Когда t пробегает последовательность {сп}, то (2.37) становится частным слу- чаем (2.31), где фи (£) = ф (£/Ог) и Стало быть, теорема 2 утверждает, что (2.37) справедливо тогда и только тогда, когда + со tx2F {/ dx} —► 0, t sin xF {/ dx} —> pi, (2.38) — 00 а) Предположим, что выполнено (2,36). Производя интегрирование по частям, получаем, что для произвольного а > О а а t x2F {t dx}<4 j tx [1— F (tx) + F (— tx)] dxt (2,39) -a 0 Подынтегральное выражение правой части при t —> 00 стремится к нулю1 следовательно, то же самое верно и для интеграла в левой части. Так как | / sin x/t—х| < Сх2, легко показать, что верно (2.38), а это влечет (2.37), Обратно, очевидно, что из (2,38) следует (2,36), Таким образом5 (i) и (ii) эк- вивалентны, . .
Гл. XVII. БезгрШшд №Ш рйЯ&дШтя Ь) Согласно теореме 1 из § 1, <p” (Z/ri) —> е1(1^ тогда и только тогда, когда при П —> 00 п [ф (£/«) —1] -(2.40) Другими словами, для применимости закона больших чисел необходимо и достаточно выполнение (2.37) при том условии, что t пробегает последова- тельность целых положительных чисел. Так как сходимость характеристи- ческих функций автоматически равномерная на конечных интервалах,’ то ясно, что- из (2.40) следует (2.37) и поэтому условия (i) и (ii) эквивалентны. То, что (2.36) представляет собой необходимое и достаточное условие для закона больших чисел (iii), было показано другими методами в теореме 1 гл, VII, 7, 6 3. ПРИМЕРЫ И СПЕЦИАЛЬНЫЕ СВОЙСТВА Мы укажем несколько специальных распределений, а затем рассмотрим такие свойства, как существование моментов или по- ложительность. Эти свойства помещены в разделе «примеры» час- тично для того, чтобы сделать изложение более ясным, частично для того, чтобы подчеркнуть отсутствие связи между отдельными пунктами. Никакая часть материала этого параграфа не исполь- зуется в дальнейшем. Дополнительные примеры можно найти в задачах 6, 7 и 19. Примеры, а) Нормальное распределение. Если мера М сосре- доточена в нуле и приписывает ему массу о2, то (2.25) превра- щается в равенство ф(£) =— -у0^2 и будет нормальным рас- пределением с нулевым математическим ожиданием и дисперсией о2. б) Распределение Пуассона. Стандартное распределение Пуас- сона с математическим ожиданием а имеет характеристическую функцию (o = e^ с ф(£) = а(е‘£— 1). Изменим параметры так, чтобы получить распределение, сосредоточенное в точках вида —b + nh. При этом показатель степени превращается в р(^)=а(е^—1) — ib£, что представляет собой частный случай (2.25) с мерой М, сосре- доточенной в одной точке h. Свойство, состоящее в том, что мера М сосредоточена в одной точке, характеризует класс нор- мальных распределений и класс пуассоновских распределений С произвольными параметрами. Свертка конечного часла подоб- ных распределений приводит к каноническим мерам с конечным числом атомов. В общем случае мера М может быть представлена как предел подобных мер. Поэтому все безгранично делимые рас- пределения могут быть представлены как пределы сверток конеч- ного числа распределений Пуассона с нормальными распределениями. в) Рандомизированное случайное блуждание. В (7.7) гл. II мы встретились с семейством арифметических распределений, припи- сывающих точкам г = 0, ±1, ±2, ... вероятности «гЮ=/' (f)r (3.1)
§ 3. Примеры и специальные свойства 63% Тде параметры р, q, t положительны, р + ^=1 и 1Г—функци^ Бесселя, определенная в (7.1) гл. II. Из того факта, что рас* пределение удовлетворяет уравнению Чепмена—Колмогорова^ вытекает его безграничная делимость. Соответствующую характе- ристическую функцию со = легко вычислить, так как она отли* чается от разложения Шлёмильха [(7.8) гл. II] только заменой переменных u = Vp/qe~^. Окончательный результат ^ = -t + t(pe* + qe-*) (3.2) показывает, что {аг(/)} можно рассматривать как распределение разности двух независимых случайных величин, распределенных по закону Пуассона с математическими ожиданиями pt и qt соот- ветственно. Каноническая мера сосредоточена в точках ±1. г) Гамма-распределение. Распределение с плотностью ^(х) = е“^^/Г(0 при х > 0 имеет характеристическую функцию ?/(£) = (1— *£)“** которая, очевидно, безгранично делима. Чтобы представить ее в каноническом виде, заметим, что (log Yi (О)' = it (1 -ф'1 = it $ e^~*dx. (3.3) О Проинтегрировав, получаем log = (3.4) О Таким образом, каноническая мера М задается плотностью txe~xt х > 0. При этом нет необходимости в центрирующем члене, так как интеграл сходится и без него. д) Плотность гиперболического косинуса. В гл. XV, 2, было показано, что плотности соответствует характеристи- ческая функция о(£)== 1/сЬ(л£/2). Для того чтобы показать ее безграничную делимость, заметим, что (log со)" = — (л2/4) со2. Здесь со2 есть характеристическая функция плотности /2*, которая была вычислена в задаче 6 из гл. II, 9. Таким образом, + со log со (□ = - j ^=-х dx. (3.5) - со Так как в нуле (log®)' обращается в нуль, то мы получаем logo» (£) = j e^~iZx exre~dx. (3.5)
636 Гл, XVII. Безгранично делймые распределения Следовательно, каноническая мера имеет плотность х/(ех—е~х).> По соображениям симметрии вклад слагаемого %х в интеграл будет равен нулю, а так как интеграл сходится и без него, то i&c в числителе можно опустить. е) Пример П. Леви. Функция М) = 2 S 2-*[cos24-l] (3.7) k— - 00 имеет вид (2.9) с симметричной мерой Л4, приписывающей массы 2* точкам ±2*, 6 = 0, ±1, ±2, .... (Ряд сходится, так как 1—cos 2*£ ~ 22*“1£2 при k—>—оо.) Характеристическая функция б) = е^ обладает любопытным свойством: со2 (g) = со (2g), и, следо- вательно, co2*(g) = со (2*g). Эта функция была бы устойчивой (как это определено в гл. VI, 1), если бы при каждом п co"(g) = = <o(a„g), но последнее соотношение выполняется только для п = 2, 4, 8, ... . В терминологии § 9 функция со принадлежит своей собственной области частичного притяжения, но она не имеет области притяжения (см. задачу 10). ж) Односторонние устойчивые плотности. Перейдем к вычис- лению характеристических функций, которые соответствуют со- средоточенным на 0, оо каноническим мерам, таким, что М{бГ7} = Сл:2-а, 0 < а < 2, С>0. (3.8) Этот пример очень важен, так как с его помощью мы получим общую форму устойчивых характеристических функций. (i) При 0 < а < 1 рассмотрим характеристическую функцию <оа = №, где оо р pl&C__1 = (3.9) О По сравнению с каноническим видом (2.9) здесь отсутствует центрирующее слагаемое, которое несущественно, поскольку инте- грал сходится и без него. Для вычисления интеграла в (3.9) мы предположим, что g > О, и рассмотрим его как предел при Z—>0 + интегралов 00 ,. 00 Г» Л—(Л-1;Ол: 1 1 Р j-----“ dx = т ® J e-(X~‘s’ Xx~adx = о о = -±Г(1-а)(Х-(Х)“ (3.10) (характеристическая функция гамма-распределения рассматрива- лась в гл. XV, 2). Заметим, что (%— (Х)“ = (V + С2)“/2 e,0a ,
3. Примеры и специальные свойства 637 где 0—аргумент X—i£, т. е. tg0 =—£/Х. Очевидно, что 0—► —►—п/2 при X—>04- и, следовательно, (X—t£)“— Окончательный результат мы запишем в виде «) =?“-с-£г^е'гяа/2. £>°- <3-п) t (Л 1 у Для £ < 0 вычислим фа (£) как функцию, сопряженную к фа(—£). (ii) При 1 < а < 2 положим = (3.12) Отличие от канонического вида (2.9) состоит в более подхо- дящем центрировании при котором математические ожидания ста- новятся равными нулю. Интегрирование по частям приводит к понижению показателя степени в знаменателе и позволяет нам воспользоваться предыдущим результатом. Обычные вычисления показывают, что % опять задается выражением (3.11). (Действи- тельная часть снова отрицательна, так как теперь cosaji/2<0.) (iii) При а=1 используем канонический вид со . /<.ч е 1 — fgsinx , (£) - С j------------------------dx. о (3.13) Из гл. XV, 2, известно, что (1—cosx)/(n;x2) есть плотность вероятности и, следовательно, действительная часть г|)х (£) равна — Для мним°й части получаем СО Г ОО 00 Р sin &—£sinx , v р sin Ёх , Р sin х , J —— dx=J ~7^dx~\~^dx О £->0 Ls е (3.14) Когда £ > 0, замена переменных £x = z/ приводит первый интеграл к тому же виду, что и второй. В целом получаем -£limfs-^dx = -£limf^.^ = -£log£. (3.15) е->0 J х 8->0 J У е 1 Окончательно = С (-!«£-»£ log£), £ > 0. (3.16) Естественно, что функция фх (— £) сопряжена с фх (£). При характеристическая функция © = еч’“ обладает тем свойством, что со" (£) =<о (п1/а£). Это в соответствии с определе- нием гл. VI, 1, означает, что со строго устойчива, т. е. сумма независимых случайных величин Х1( ..., Х„ с характеристиче- ской функцией © имеет такое же распределение, что и п1/аХ4.
638 Гл. XVII. Безгранично делимые распределения Если а=1, то со" (£) = (о (n£) e_,’£losn, и, следовательно, распреде- ление суммы отличается от распределения п1/аХ^ центрированием. Таким образом, характеристическая функция ф^ устойчива в ши- роком смысле. [Свойства и примеры устойчивых распределений даны в гл. XV, 1, 2. Дополнительные свойства будут получены в § 5. В § 4 (см. пример 4, в)) мы покажем, что при а < 1 рас- пределение сосредоточено на положительной полуоси. При а 1 это неверно.] в) Произвольные устойчивые плотности. Каждой функции фА предыдущего примера можно поставить в соответствие аналогич- ную характеристическую функцию, которая порождается канони- ческой мерой с точно такой же, но сосредоточенной на отрица- тельной полуоси плотностью. Чтобы получить такие характери- стические функции, мы должны только заменить в наших фор- мулах i на —г. Можно получить более общие устойчивые харак- теристические функции, составляя линейные комбинации из характеристических функций, относящихся к двум экстремальным случаям, т. е. используя каноническую меру М, такую, что при х > 0 ____ ____________________ М {0, х} = Срхг~а, М {— хГО} = Cqx*~a, (3.17) где р^О, и р-|-<7=1. Из сказанного ясно, что соответ- ствующая характеристическая функция <о = е* задается выра- жением = ±Kp-7)sinf], ХЗ-18) если 0 < а < 1 или 1 < а 2, и выражением №=-IU-С [|л± i(p-<7)log|u], если а = 1 (здесь везде берется верхний знак для £ > 0 и ниж- ний для £<0). Заметим, что при а = 2 мы получаем ф(£) = ==—т. е. нормальное распределение. Это соответствует мереМ, сосредоточенной в нуле. В § 5 будет показано, что (с точностью до произвольного центрирования) эти формулы задают самый общий вид устойчи- вых характеристических функций. В частности, все симметричные устойчивые распределения имеют характеристические функции вида а > 0. § 4. СПЕЦИАЛЬНЫЕ СВОЙСТВА Везде в этом параграфе со = е'1’ обозначает безгранично дели- мую характеристическую функцию с ф, имеющей стандартный вид + (4-1) — О>
§ 4. Специальные свойства 639 где М — каноническая мера, а b—действительное число. В соот- ветствии с определением канонической меры интеграл со Л4+(х) = J y~2M{dy} (4.2) X сходится при всех х > 0, и аналогичное утверждение имеет место для Л4“(х) при х<0. Будем обозначать через U вероятностное распределение с ха- рактеристической функцией со. а) Существование моментов. В гл. XV, 4, было показано, что второй момент U конечен тогда и только тогда, когда со дважды дифференцируема, т. е. когда существует ф". Точно так же дока- зывается, что это имеет место тогда и только тогда, когда мера М конечна. Другими словами, для существования второго момента U необходимо и достаточно, чтобы мера М была конечна. Аналогичное рассуждение (см. задачу 15 из гл. XV, 9) позво- ляет доказать более общее утверждение: для любого целого k 1 2k-u момент распределения U существует тогда и только тогда^ когда М имеет момент порядка 2k—2. б) Разложения. Каждое представление меры Л4 в виде суммы М=Л4£4-М2 двух мер порождает разложение со = е^е^2 характе- ристической функции со на два множителя, каждый из которых является безгранично делимой характеристической функцией. Если мера М. сосредоточена в одной точке, то же самое справедливо для и Л42. Другими словами, если со — ха- рактеристическая функция нормального распределения или рас- пределения Пуассона1), то же самое будет верно и для множи- телей е^ и Однако любая другая безгранично делимая (о может быть представлена произведением двух совершенно раз- личных компонент. В частности, любая отличная от нормальной устойчивая характеристическая функция может быть разложена в произведение не являющихся устойчивыми безгранично делимых характеристических функций. Особенно полезно разложение со = е^^г, получаемое представ- лением Л4 как суммы двух мер, сосредоточенных на интервалах | х | т] и | х | > т| соответственно. Для второго интервала выра- зим Л4 через меру N, определяемую соотношением N {dx} == = х“2Л4 {dx}» Тогда мы запишем где MWi © + Ф2 (« + *₽£, ^(□= f М {dx}, |X|<Y] (4-3) (4.4) х) По теореме 1 гл. XV, 8, для характеристической функции нормального распределения не допускается произвольное разложение через произведение .характеристических функций, не являющихся нормальными. Аналогичное рверждение справедливо и для распределения Пуассона (теорема Райкова),
640 Гл. XVII. Безгранично делимые распределения $ (№-l)N{dx}, (4.5) а разность b—(3 образуется за счет изменения центрирующих слагаемых в (4.4) и (4.5). Заметим, что является характеристической функцией обоб- щенного распределения Пуассона, порожденного таким распреде- лением вероятностей F, что F{dx} = cN{dx} или 1—F(x) = cM + (х), х > 0. (4.6) Характеристическая функция бесконечно дифференцируема. Таким образом, каждое безгранично делимое распределение U пред- ставимо в виде свертки распределения Uif имеющего конечные моменты всех порядков, и обобщенного распределения Пуассона U2, порожденного распределением вероятностей F, хвосты которого пропорциональны Л4+ и М". Отсюда, в частности, следует, что U имеет момент порядка k тогда и только тогда, когда сущест- вует момент порядка k распределения F. в) Положительные случайные величины. Мы покажем, что рас- пределение U сосредоточено на 0, оо тогда и только тогдаг когдах) • 00 (4.7) ' о где Ь^О и Р—такая мера, что функция (14-х)"1 интегри- руема относительно Р. (В соответствии с (4.1) имеем Р {dx} ~ = х~гМ {dx}.) Предположим, что мера U сосредоточена на 0, оо, и рассмот- рим разложение, описываемое соотношениями (4.3)—(4.5). Для обобщенного распределения Пуассона U2 нуль является точкой роста. Распределение имеет нулевое математическое ожида- ние и, следовательно, некоторую точку роста s^O. Отсюда следует, что $4~₽—точка роста U и, следовательно, р^О. Ана- логичное рассуждение показывает, что t/j не может иметь нор- мальной компоненты, и поэтому вклад в ф(£) должен стре- миться к нулю при т]—>0. Наконец, если t—точка роста рас- пределения вероятностей F, порождающего U2, тогда nt есть точка роста самого распределения U2. Поэтому F и, следова- тельно, N сосредоточены на положительной полуоси. Таким образом, интеграл в (4.5) на самом деле сводится к интегралу по области х>т]. Подынтегральная функция в нуле обращается в нуль, и поэтому при т|—>0 мера N не обязана быть ограни- х) Это было отмечено П. Леви и непосредственно следует из варианта преобразования Лапласа (7.2) гл. XIII. Интересно отметить, что формаль- ная проверка утверждения без вероятностных рассуждений достаточно громоздка (cms Бакстер и Шапиро, Sannhya, vol, 22),
§ 4. Специальные свойства 641 ценной. Однако при х > т] можно перейти от меры N к мере P{dx\=xN{dx\ (что совпадает с x"1M{dx}). При этом новое подынтегральное выражение (е^х—l)*"1 при приближении х к О само к нулю не стремится, и, следовательно, мера Р должна приписывать конечные значения различным окрестностям нуля. Таким путем мы получим представление (4.7). Обратно, если гр определено формулой (4.7), то проведенные нами рассуждения показывают, что будет пределом характеристи- ческих функций обобщенных распределений Пуассона, сосредо- точенных на 0, оо. Следовательно, то же самое верно для пре- дельного распределения U. г) Асимптотическое поведение. Полученное нами утверждение относительно существования моментов, по-видимому, означает, что асимптотическое поведение функции распределения U при х —> ± °° зависит только от поведения канонической меры М. вблизи ± 00 или, что равносильно, от асимптотического поведения функ- ций и Л4“. Прежде чем приступить к доказательству этого утверждения в наиболее общей форме, мы рассмотрим типичный случай. Предположим, что М.+ правильно меняется на бесконечности, т, е. М+(x) = x~^L(x), (4.8) где и L — медленно меняющаяся функция. Тогда 1—U (х) ~ (х), х—>оо. (4.9) Доказательство, Пусть S—случайная величина с функцией распределения U, Рассмотрим каноническую меру М. как сумму Л41 + Л42 + Л43 трех мер, сосредоточенных на интервалах 1, оо, — 1, 1 и —оо, —1 соответственно. Как показано в п. б), это порождает представление S = Х2 + Х2 + Х3 +/3 в виде суммы трех независимых случайных величин, таких, что Xf имеет обобщенное распределение Пуассона Ui9 которое порождено распределением F, сосредоточенным на 1, оо и определенным формулой (4.6); кано- ническая мера, соответствующая Х2, сосредоточена на —1, 1; наконец, Х3 определяется так же, как и Хр но только интервал 1, оо заменяется теперь на —оо, —1. Нетрудно показать, что Р {Xj> х} - М+ (х), х оо (4.10) (см. теорему 2 из гл. VIII, 9). Поэтому, чтобы доказать утвержде- ние (4.9), достаточно показать, что Р {S > х} - Р {Хх > х}, х -> оо. (4.11) В этой связи центрирующая постоянная ₽ не играет никакой роли, и поэтому мы полагаем 0 = 0. Тогда для любого 8>0 P{S > х} Р {Xi > (1 4-е)х}-Р{Ха + Хз >-ех}. (4.12) 21 249
642 Гл. XVII. Безгранично делимые распределения С другой стороны, поскольку Х3^0, Р {S > х} < Р {Xi > (1 — 8) х} + Р {Х2 > &х}. (4.13) При х—> оо последняя вероятность в (4.12) стремится к 1, тогда как последняя вероятность в (4.13) убывает быстрее, чем любая степень х~а, так как Х2 имеет моменты всех порядков. Таким образом, (4.12) и (4.13) подтверждают справедливость (4.11). д) Подчиненность. Если безгранично делима, то при любом s>0 также безгранично делима. Каково бы ни было сосре- доточенное на 0, оо распределение G, можно, рандомизируя пара- метр $, построить новую характеристическую функцию 00 ф($)= $e^(OG{ds}. (4.14) о Характеристическая функция ф не обязана быть безгранично делимой, однако легко проверить, что если G = GX^G2—свертка двух вероятностных распределений, то (обозначения очевидны) ф = ф1ф2. Отсюда следует, что если распределение G безгранично делимо, то (4.14) определяет безгранично делимую характеристи- ческую функцию. Этот результат допускает простую вероятностную интерпре- тацию. Пусть {Х(/)}—случайный процесс с независимыми при- ращениями, причем случайная величина X (/) имеет характерис- тическую функцию е^. Если Т—положительная случайная вели- чина с распределением G, то ф из (4.14) можно интерпретиро- вать как характеристическую функцию сложной случайной вели- чины Х(Т). Теперь предположим, что распределение G безгра- нично делимо с характеристической функцией еу. Мы можем представить себе другой процесс {Т (/)} с независимыми прира- щениями, такой, что будет характеристической функцией Т (/). При каждом t > 0 мы получим новые случайные величины X (Т (/)), которые снова являются значениями процесса с незави- симыми приращениями1). Таким образом, случайная величина Т(/) служит операционным временем. В терминологии гл. X, 7, новый процесс {Х(Т(/))} получается подчинением процессу {X(Z)} с Направляющим процессом {Т(/)}. Мы нашли чисто аналитичес- кое доказательство того, что процедура подчинения всегда при- водит к безгранично делимым распределениям. х) Если G имеет преобразование Лапласа e~v^, то Т (t) соответствует преобразованию Лапласа и легко проверить, что характеристическая функция X (Т (/)), имеет вид e~tv
§ 5. Устойчивые распределения и их области притяжения 643 § 5. УСТОЙЧИВЫЕ РАСПРЕДЕЛЕНИЯ И ИХ ОБЛАСТИ ПРИТЯЖЕНИЯ Пусть — последовательность взаимно независимых слу- чайных величин с общим распределением F. Положим Sn = Xf +... .. .4-Хи. Пусть U — некоторое распределение, несосредоточенное в одной точке. В соответствии с терминологией гл. VI, 1, мы говорим, что F принадлежит области притяжения распределения U, если существуют такие постоянные ап > 0 и Ьп, что распределе- ние случайной величины a^S”—nbn сходитсяк U. Исключение распределений, сосредоточенных в единственной точке, из числа предельных, служит цели устранить тривиальный результат, когда Ьп —> &, а ап возрастают настолько быстро, что 1SZ2 сходится по вероятности к нулю. Мы хотим перефразировать определение в терминах характе- ристических функций ф и со распределений F и U соответственно. Согласно лемме 4 гл. XV, 1, распределение U сосредоточено в одной точке тогда и только тогда, когда |со(£)| = 1 для всех Таким образом, ф принадлежит области притяжения характе- ристической функции со, если | со | не равно тождественно единице и существуют такие постоянные ап> 0 и Ьп, что ^^/ап)е^)п^^(^ (5Д) В гл. VI, 1, было показано, что предельная функция со необ- ходимо устойчива. Однако мы построим всю теорию заново, как простое следствие основной предельной теоремы § 2. Для согла- сия с принятыми там обозначениями положим Ф„ (£) = Ф (£/<*„) e-ibnZ, Fn (х) = F (ап (х 4- &„)). (5.2) Согласно теореме 1 из § 1, соотношение (5.1) выполняется тогда и только тогда, когда для всех £ п[Ф„(«-1] — 1р(С), (5.3) где со — е^. Рассмотрим сначала случай симметричного распределения F. Тогда Ъп = 0. Из теоремы 1 § 2 мы знаем, что из (5.3) следует существование такой канонической меры М, что nx2Fn\dx\—> —>M{dx}. Чтобы выразить это, мы введем урезанные моменты х р. (X) = $ y2F {dy}, X > 0. (5.4) -X Тогда во всех точках непрерывности х Л-и(«„•*) —”м {~х> (5-5) О'П И n[l-F(a„x)]->M+(x), (5.6) 21*
644 Гл. XVII. Безгранично делимые распределения где 00 М + (х) — у~гМ {#//}. X (5.7) Из соотношения ф(£/аи)—>1 следует, что ап—юо, и, следо- вательно, Sn/an и Sn/an+i имеют одинаковое предельное распре- деление U. Отсюда заключаем, что отношение стремится г- г- к 1, и, следовательно, лемма 3 из гл. VIII, 8, применима к (5.5). Мы приходим к выводу, что р меняется правильно, а канони- ческая мера М имеет вид Л4 {—х, х} = Сх2"а, х>0, (5.8) где а^2 (обозначение 2—а показателя степени введенному П. Леви). Если а = 2, то мера М в нуле. Для сходимости интеграла (5.7) нужно, При 0 < а < 2 мы находим М+(х) = С — х~« х > 0. соответствует сосредоточена чтобы а > 0. (5.9) Аналогичное рассуждение применимо и к несимметричному распределению F, но вместо (5.6) мы получим менее привлека- тельные соотношения П [1 — F (ап (х + &„))] — М+ (х), nF (ап (— х + &„)) —• М~ (—х); (5.Ю) подобное изменение касается и (5.5). Тем не менее из фи (е)—> —> 1 и ап—>оо следует Ьп—»0, и поэтому (5.10) и в самом деле полностью эквивалентно (5.6) и аналогичному соотношению для левого хвоста. Таким образом, мы видим, что (5.6) выполняется всякий раз, когда F принадлежит области притяжения. Ввиду леммы 3 гл. VIII, 8, это означает, что или М+ тождественно равно нулю, или же хвост 1—F правильно меняется и М+(х) = А%“а. Тогда (5.7) показывает, что на положительной полуоси мера М. имеет -плотность Аах1-^. То же самое рассуждение применимо для левого хвоста, а также для суммы хвостов. Следовательно, пока- затель а должен быть общим для того и другого хвоста. Если оба хвоста тождественно равны нулю, то мера М сосре- доточена в нуле. Ни в каком другом случае у меры М не может быть атома в нуле. Это подтверждается тем, что каноническая мера °М, соответствующая симметризованному распределению °f7, представляет собой сумму М и ее зеркального отражения отно- сительно нуля, а мы видели, что °М либо вовсе не имеет атомов, либо сосредоточена в нуле. Таким образом, при а < 2 канони- ческая мера М однозначно определяется своими плотностями на
§ 5. Устойчивые распределения и их области притяжения 645 каждой из полуосей, и эти плотности пропорциональны (х]1"^. Следовательно, для интервалов — у, х, содержащих нуль, мы имеем ______ М{—у, х\ = С (qy2~a + рх2~а), (5.11) причем в последнем равенстве можно считать, что 0 < а 2 (при а = 2 мера М сосредоточена в нуле); кроме того, С > 0 и p+q— = 1. В силу (5.7) все это равносильно М+(х) = Ср^^х~а, М~ (-x)=Cq^x-. (5.12) Соответствующие этим мерам характеристические функции опре- деляются формулами (3.18) и (3.19). Они ясно показывают, что наши распределения устойчивы в том смысле, что распределение Un* отличается от распределения U только параметрами сдвига. Это означает, что каждое устойчивое распределение принадлежит своей собственной области притяжения. Таким образом, мы решили задачу отыскания всех распределений, обладающих областью при- тяжения. Суммируем наши заключения в виде теоремы. Теорема 1. Распределение обладает областью притяжения тогда и только тогда, когда устойчиво, (i) Класс устойчивых распределений совпадает с классом безгранично делимых распределений, канонические меры которых заданы в (5.11). (ii) Соответствующие характеристические функции имеют вид <o(^) = e^(^+z^, где ф определяется формулами (3.18), (3.19) с О < 2. (iii) При х—> оо хвосты соответствующего распределения U удовлетворяют соотношениям х“[1 — t/(x)]->Cp^, x«t/(—х)->С<7^. (5.13) Если вспомнить, что U принадлежит своей собственной обла- сти притяжения с нормирующими постоянными а„ = п1/а, то последнее утверждение теоремы является прямым следствием (5.6). [С другой стороны, (5.13) представляет собой частный слу- чай результата, полученного в 4, г).] Заметим, что каждая из трех характеризаций, указанных в теореме, определяет распределение U однозначно с точностью до произвольного сдвига. Прежде чем вернуться к исследованию условий, при которых распределение F принадлежит области притяжения устойчивого распределения, мы вспомним основные факты о правильном изме- нении функций. В согласии с определением гл. VIII, 8, функция Ь меняется медленно на бесконечности, если для каждого фикси- рованного х > О 7®—1, 1—+оо. (5-14)
646 Гл, XVII. Безгранично делимые распределения В этом случае для произвольного 6 > 0 и всех достаточно боль- ших х мы имеем х-ъ<Ь(х)<хЬ. (5.15> Функция р изменяется правильно, если она имеет вид ii(x) = = xvL(x). Мы рассматриваем, в частности, функцию р(х)—усе- ченный момент (5.4). Применим теорему 2 гл. VIII, 9, с £ = 2Г т) = 0 к функции распределения F (х)—F(—х), сосредоточенной на 0, оо, и получим следующий важный результат. Если р, изменяется правильно с показателем 2—а (где 0 <_ < а^2), то x2[^F(x) + F(-x)] 2—а 5 р(х) а \ - I Обратно, если (5.16) справедливо при а < 2, то р(х) и суммам хвостов \-F(x) + F(-x} изменяются правильно с показателями 2—а и—а соответственно. Если (5.16) выполнено при а = 2, то р, изменяется медленно. При выводе (5.8) мы видели, что для того, чтобы симметрич- ное распределие F принадлежало некоторой области притяжения,, необходимо, чтобы функция р, изменялась правильно: р,(я) ~x2"aL(x), при х —>оо, (5.17> где L—медленно меняющаяся функция. Мы сейчас увидим, что это верно и для несимметричных распределений. При а = 2 это условие оказывается также и достаточным. Однако при а < 2 каноническая мера (5.11) приписывает положительной и отрица- тельной полуосям массы в отношении p:q и оказывается, что оба хвоста распределения F должны быть сбалансированы подобным же образом. Мы теперь в состоянии доказать основную теорему. Теорема 2. а) Для того чтобы распределение F принадлежало некоторой области притяжения, необходимо, чтобы функция (урезанный момент} р, менялась правильно с показателем 2— 0<а^2 (т. е. выполнялось (5.17)). б) При а = 2 это условие также достаточно, если только F не сосредоточено в одной точке. в) Если при 0 < а < 2 выполняется (5.17), то распределение F принадлежит некоторой области притяжения в том и только том случае, когда хвосты F сбалансированы так, что при х —> оо \-F(x)-}-F(—x) Р’ l—F(x)+F(—x) (5.18) Отметим, что никаких предположений относительно центриро- вания F не делается. Таким образом, теорема приводит к выводу.
§ 5. Устойчивые распределения и их области притяжения 647 что (5.17) либо верно при любом центрировании, либо не выпол- няется ни при каком. Справедливость этого заключения легко установить прямой проверкой. Исключением является лишь тот случай, когда F сосредоточена в единственной точке /; при этом .левая часть соотношения (5.17) тождественно равна нулю при центрировании величиной t и меняется правильно при всех дру- гих способах центрирования. Теорема была сформулирована так, чтобы охватить и сходи- мость к нормальным распределениям. При а < 2, по-видимому, более естественно выразить основное условие через сумму хвос- тов распределения F. В приводимых ниже следствиях заключены равносильные варианты теоремы 2. Следствие 1. Распределение F, не сосредоточенное в одной точке, принадлежит области притяжения нормального распре- деления тогда и только тогда, когда р—медленно меняющаяся функция. Это имеет место в том и только том случае, когда условие (5.16) выполнено при а = 2. Излишне говорить, что функция р меняется медленно, если распределение F имеет дисперсию. Следствие 2» Распределение F принадлежит области притя- жения устойчивого распределения с показателем а < 2 тогда и только тогда, когда хвосты F удовлетворяют условию (5.18), а юумма хвостов правильно меняется с показателем а. Последнее условие полностью равносильно (5.16). Доказательство, а) Необходимость. Предположим, что для предельного распределения U каноническая мера задается равен- ством (5.11). При выводе этого соотношения мы убедились, что распределение, принадлежащее области притяжения U, удовлет- воряет условию (5.6) и аналогичному условию для левого хвоста. Поэтому п[1—F (anx) + F (— anx)]—(х)4-М“ (—х). (5.19) Сначала предположим, что а < 2, поэтому правая часть не равна тождественно нулю. Уже говорилось о том, что лемма 3 гл. VIII, 8, гарантирует в этом случае правильное изменение с показателем —а суммы хвостов 1—/?(%) + /?(—х). Тогда вы- полняется (5.16) и поэтому р меняется правильно с показателем 2—а. Условие (5.18) теперь немедленно следует из (5.6). Остается рассмотреть случай а = 2. Левая часть (5.19) в этом случае стремится к нулю. Поэтому вероятность того, что | Xk | > > ап при некотором k п, стремится к нулю. Отсюда нетрудно вывести следующее утверждение: если Sn/n не стремится по веро- ятности к нулю, то и сумма урезанных вторых моментов величин
648 Гл. XVII. Безгранично делимые распределения не стремится к нулю. Но Ц(«п) 1-f («„)+F(- ап)~^°°’ (5.20) и, следовательно, при а = 2 (5.16) выполняется. Отсюда следует медленное изменение функции р,, и поэтому наши условия необ- ходимы. б) Достаточность. Мы не только докажем, что наши усло- вия являются достаточными, но одновременно определим норми- рующие постоянные ап и Ьп, которые будут обеспечивать сходи- мость к предписанному устойчивому распределению. Это сделано в теореме 3. Формулировка теоремы 3 предполагает известным то, что распределения, принадлежащие любой области притяжения при а>1, имеют математическое ожидание. При доказательстве нам потребуется дополнительная информация относительно урезанных первых моментов. Естественно сформулировать эти результаты в обстановке наибольшей общности, хотя нам будет нужен только, частный случай Р = 1. Лемма. Распределение F, принадлежащее некоторой области притяжения с показателем а, обладает абсолютными моментами т$ всех порядков Р, Р < а. При а < 2 не существуют моменты, порядка р > а. Более точно, если Р<а, то при t—>оо 1*1 > t (5.21} тогда как при а < 2 и Р > а $ | х |₽ F {dx} ~ Р [1 —F (t) + F (-/)]. (5.22), lxl<t P (Заметим, что в каждом из этих случаев интеграл является пра- вильно изменяющейся функцией с показателем р—а.) Доказательство. Соотношения ^5.21) и (5.22) обобщают (5.16> и являются прямым следствием теоремы 2 гл. VIII, 9, если при- менить ее к распределению, заданному функцией F(x)-\-F(—х) на 0, оо (для вывода достаточно положить £ = 2, т] = Р и £ = 2,. (П = 0). ► При доказательстве теоремы 2 подразумевалось, что норми- рующие постоянные ап должны удовлетворять условию (5.23). ап Если р меняется правильно [удовлетворяет (5.17)], такие ап су-
§ 5. Устойчивые распределения и их области притяжения 649 ществуют. Можно определить ап как нижнюю границу всех х, для которых пх~2р(х) ^С. Вследствие правильного регуляр- ного изменения р, мы имеем при х > О п|х(апх)^Сл.2_„ (5.24) ап Это означает, что масса, которую мера nx2F {andx} приписывает любому симметричному интервалу —х, х, стремится к М {—х, х}. Ввиду (5.16) соотношение (5.24) автоматически влечет за собой соотношение (5.19) для суммы хвостов распределения F. При а = 2 правая часть (5.19) тождественно равна нулю. При а<2 условие (5.18) обеспечивает подчинение каждого отдельного хвоста условиям n[\—F (апх)]^ Ср^^х~а, nF (—апх) —» х~а, (5.25) где правые части совпадают соответственно с Л4+(х) и Л4~(х). [Между прочим, при а<2 из соотношений (5.25) в свою очередь вытекает (5.24).] Таким образом, мы показали, что меры nx2F {andx\ сходятся в собственном смысле к канонической мере М. По теореме 2 из § 2 имеем тогда J etX*-l-^sinx nx2F {а„J </e*-l-<gsinx М (5. 2Q) — ОС — 00 Теперь легко получить теорему 3. Теорема 3. Пусть устойчивое распределение U определяется {включая и центрирование) характеристической функцией (3.18), если а =т^1, или (3.19), если а=1. Пусть распределение F удовлетворяет условиям теоремы 2, а последбвательность {ап}—соотношению (5.23). (i) Если 0<а<1, то <р”(^и)—>со(^) = ^ (ii) Если 1 <а^2, то справедливо то же самое при условии, что распределение F имеет нулевое математическое ожидание, (iii) Если а=1, то Ч (5.27) 00 &„= f sin-^-F{dx}. (5.28) О иП — оо Таким образом, мы имеем приятный результат, который со- стоит в том, что при а < 1 вовсе не требуется центрирование,
650 Гл. XVII. Безгранично делимые распределения тогда как при а > 1 нам достаточно естественное центрирование математическим ожиданием. Доказательство, (i) Пусть а<1. В стандартном интеграле для ф(^), который приводит к (3.18), отсутствует слагаемое i£sinx, и этим он отличается от правой части (5.26). Мы пока- жем, что слагаемые i£sinx могут быть опущены и в (5.26),,. так что 00 00 J —^-nx2F {andx\-^^ —-2--------------M{dx}. — 00 — 00 (5.29> Вне некоторой окрестности точки нуль подынтегральное выраже- ние непрерывно, а так как nx2F {andx}—то соотноше- ние (5.29) выполняется, если исключить интервал |х|<б области интегрирования. Достаточно показать, что, выбирая до- статочно малое б, можно сделать интеграл по области |х| < б как часть интеграла слева в (5.29) сколь угодно малым. Указан- ный интеграл мажорируется выражением « S [x\F {andx\ = ^a $ \y\F\dy]. (5.30) I X I < 6 | у I < anb Теперь (5.22) при 0=1 и (5.25) показывают, что правая часть (5.30) ~ у—^Сб1-а, 0 < а < 1, и поэтому стремится к нулю вместе с б. Таким образом, (5.29) справедливо. Это соотношение можно переписать в виде п[ф(£/аи)—1]—>ф(£), что, по теореме 1 § 1^ равносильно искомому соотношению ср* $Jan) —> log ip (£). (ii) Пусть а>1. На этот случай переносится предыдущее, рассуждение, с той лишь разницей, что (5.26) заменяется соотно- шением вида J nx*F {andx} -Д M{dx}. (5.31> — 00 — co Для обоснования (5.31) мы должны показать, что, выбирая t достаточно большим, можно сделать часть левого интеграла в (5.31), взятую по области (х|>/, сколь угодно малой. Это непосредственно вытекает из (5.21). (iii) Пусть а=1. В этом случае соотношение (5.26) сохраня- ется без изменений, но для того, чтобы доказать, что это соотно- шение равносильно искомому (5.27), необходимо показать, что при* фиксированных £ ~е" (5.32>
§ 6. Устойчивые плотности 651 или, что то же самое, ^l<P(^rt)-l|2 —0. (5.33) При Р < 1 абсолютный момент т$ распределения F конечен. Из очевидного неравенства | еи — 11 < 211 мы заключаем, что | ср (^/ап)— 11 < 2тр | £ р а~&, и поэтому левая часть (5.33) есть &(па„2Р). Используя определяющее ап соотношение (5.23), полу- чаем, что п = О(а\+&) при любом е > 0, и поэтому (5.33) спра- ведливо. Заключительное замечание. Область притяжения нормального распределения не следует смешивать с введенным Б. В. Гнеденко понятием «области нормального притяжения устойчивого распре- деления U с показателем а». Говорят, что распределение F при- надлежит указанной области, если оно принадлежит области при- тяжения U при нормирующих коэффициентах ап = п^а. Выделение этой области представляло собой первоначально серьезную задачу, однако в нашей обстановке решение дается условием (5.23), определяющим нормирующие постоянные. Распределение F при- надлежит области «нормального» притяжения U в том и только том случае, когда ха [1 — F (х)] —>Ср и xaF (—х) —>Cq при х —> оо. Здесь С> 0—некоторая постоянная. (Отметим попутно, исполь- зуя введенную терминологию, что нормальное распределение обладает областью ненормального притяжения.) § 6*). УСТОЙЧИВЫЕ ПЛОТНОСТИ Невозможно, по-видимому, выразить устойчивые плотности в «замкнутой» форме. Разложения в ряды для них были даны независимо друг от друга Феллером (1952) и Бергстремом (1953). В этих работах неявно содержатся результаты, установленные позже более сложными методами. Вывод этих разложений пред- ставляет собой хороший пример использования формулы обраще- ния Фурье (хотя при этом применяется интегрирование в комп- лексной области). Мы не будем рассматривать случай а=1. При £ > 0 мы можем представить устойчивые характеристи- ческие функции в форме где а—некоторое комплексное число. Его абсолютная величина определяется только масштабным параметром, поэтому мы можем допустить, что а по модулю равно единице, именно a = elJTV/2, где у—действительное число. Таким образом, мы полагаем ф(£) = — | £ |а .£±^7/2, (6.1) где в символе «±» верхний знак выбирается при £ > 0, а ниж- ♦) Этот параграф посвящен специальным вопросам, Его следует пропустить .при первом чтении.
652 Гл. XVII. Безгранично делимые распределения ний—при £<0. [См. каноническую форму (3.18) для ф(£).] Отношение действительной и мнимой частей подчиняется нера- венствам, очевидным из (3.18). Тогда в принятых здесь обозна- чениях для того, чтобы функция была устойчивой характе- ристической функцией, необходимы и достаточны условия ( а, если 0 < а < 1, 2__а если 1<а<2 Так как ё*> абсолютно интегрируема, то соответствующее распределение имеет плотность, которую мы обозначим р(х; а, у). Мы вычислим ее, используя формулу обращения для интегралов Фурье (3.5) из гл. XV. Так как р—действительная функция и величина ф(—£) сопряжена с ф(£), мы получаем р(х; a, y) = -i-Re^ (%. (6.3)- о Так как р(—x; a, y) = p(x; а, —у), (6.4> то эту функцию достаточно ВЫЧИСЛИТЬ ЛИШЬ ДЛЯ X > 0. а) Случай а< 1. Рассмотрим подынтегральное выражение как функцию комплексного переменного £. При х>0и Img—> — оо подынтегральное выражение стремится к нулю благодаря тому„ что главную роль в показателе играет линейный член. Мы можем заменить путь интегрирования отрицательной частью мнимой осиг что сводится к подстановке £ = —и проведению дальнейших выкладок так, как если бы все коэффициенты были вещественны. Новое подынтегральное выражение имеет вид Используя разложение е~с*а в ряд и формулу для гамма-функции, мы по- лучаем сразу Р(-Х- а, у) = Re^- Д Г 1} ( -х~ “exp [i (т-а)] )*. (б.5> б) Случай I < a < 2Л Формальную подстановку t-='“-exp (-;£*-) легко обосновать так же, как это было сделано при a < 1. Новое подынтегральное выражение имеет вид Разлагая в степенной ряд, получаем р(—х\ а, у) = » rfra+1>l ₽^Reexp(-fS)X- »Г (-/хехр[-^])п-<б-б> * /2=0 4 L J z
§ 7. Схема серий 653 Заменяя индекс суммирования п на k—1 и применяя известную рекуррентную формулу r(s+l) = sF(s), имеем р(—х; а, у) = = Re * £ Е + ° ( ~х ехР [~ ^ (У" Ч )*• <6-7> k = 1 u * Таким образом, нами доказана Лемма 1. Для х > О и 0 < а < 1 р (х; а, у) =— £ (—*-“)* sin(у—а). (6.8) J1Л /v 1 Хг k = 1 Для х > 0 и 1 < а < 2 р (х; а, у) = X r(fe№fe/+1) (—х)к sin (у—а). (6.9) k = 1 Для х < 0 значения р определяются в соответствии с (6.4). Отметим, что (6.8) дает асимптотическое разложение для х—> оо. Попутно из доказанных формул вытекает следующий любопытный результат. Лемма 2. Если -^-<а<1 и х > О, то “• V*). (6-10) где y*=a(y-f-l)—1. Простая проверка показывает, что значения у* попадают в интервал, указанный в (6.2). Тождество (6.10) было впервые отмечено (с другим доказательством) В. М. Золотаревым. § 7. СХЕМА СЕРИЙ Понятие схемы серий было описано в гл. VI, 3, следующим образом. Каждому п соответствует конечное число, скажем гп, независимых случайных величин Х^ п (£ = 1,2, ..., гп) с распре- делениями Fk* п и характеристическими функциями Мы обра- зуем «суммы по строкам» S„ = Хъ „+ ... -f-Х^, п. Обозначим их распределения и характеристические функции через Un и соответственно. По причинам, объясненным в гл. VI,3, мы инте- ресуемся в первую очередь схемами, где влияние отдельных компонент асимптотически пренебрежимо. Чтобы обеспечить это свойство, мы ввели условие (3.2) гл. VI: величины п должны стремиться по вероятности к нулю равномерно относительно £=1, ..., г„. В терминах характеристических функций это озна- чает, что при любых числах 8 > 0 и Ц > 0 для всех достаточно
654 Гл. XVII. Безгранично делимые распределения больших п: |1— <Pfe.»(C)l<e при Ц| <£0> 6=1, (7.1) Такие схемы мы назовем нулевыми схемами. В § 1 и 2 мы имели дело со схемами серий, в которых распре- деления Fk, п не зависели от k. Такие схемы автоматически ока- зываются нулевыми. Условие (7.1) дает возможность применить построенную в первых двух параграфах теорию. В частности, будет показано, что основной результат переносится на произ- вольные нулевые схемы: если распределения сумм по строкам Sn сходятся к некоторому пределу, то последний безгранично делим1). Нами будет найден критерий сходимости к заданному безгранично делимому распределению. Для удобства читателей напомним, что мера М считается ка- нонической, если она приписывает конечные массы М {/} конечным интервалам и если при любом х > 0 существуют интегралы 00 — X М + (х) = $ y~2M{dy\, М-(—х) = J y~2M\dy\ (7.2) X — 00 £см. определение 1 из § 1). Для упрощения обозначений введем меру Мп следующим образом: ги Mn{dx}=^x2Fk,n{dx\. (7.3) Aj 1 Эта мера есть аналог мер nx2Fn{dx} из предыдущих параграфов. При х > 0 положим по аналогии с (7.2) гп гп Mi(x) = 2 [1-Fft,„(x)]t М-(х)=2 4„(-х). (7.4) k=l k=i Мы будем широко использовать урезанные случайные вели- чины, однако стандартная процедура урезания будет несколько видоизменена для того, чтобы избежать обычных затруднений, возникающих при использовании разрывных функций. Новая процедура урезания заменяет случайную величину X величиной т (X), где т (х)—такая непрерывная монотонная функция т (х), что т(х) = х при )х| т(х) = ±а при \х\^а (7.5) [очевидно, т(—х) = — т(х)]. Введем обозначения для математи- ческих ожиданий усеченных случайных величин: ₽,.„== Е(т(Х*.„)), L" (7.6) k-1 /г= 1 х) Относительно применения этого результата к процессам с независимыми, но нестационарными приращениями см. замечание в конце § 1,
§ 7. Схема серий 655 Существует теоретическая возможность центрировать Xfet п та- ким образом, чтобы все п обратились в нуль. Это упростит рассуждения, но полученный критерий нельзя будет применять непосредственно во многих конкретных ситуациях. Однако воз- можно так центрировать п, чтобы сделать |3Л1 п настолько ма- лыми, чтобы Вп—>0. В этом случае условия нижеследующей теоремы сводятся к условию М.п—> М, хорошо известному по предыдущим параграфам. В общем случае {/}-—> Л4 {/} для ин- тервалов /, расположенных на положительном расстоянии от нуля. В окрестности же нуля будет сказываться влияние Вп. (Выбор точки урезания а не имеет значения.) Теорема. Пусть {Х^„}— нулевая схема. Если можно найти такие постоянные Ьп, что распределения Sn—bn сходятся к пре- дельному распределению U, то они сходятся и при постоянных, удовлетворяющих (7.6)х). Предельное распределение U безгранично делимо* 2). Для сходимости к предельному распределению U с канони- ческой мерой М необходимо и достаточно, чтобы во всех точках непрерывности х > 0 Л4+(х)—>Л4 + (х), М-(—х)->Л1-(—х) (7.7) и чтобы для некоторого s > 0 М„{ —s, s}——s, s}. (7.8) В этом случае распределение Sn—bn стремится к распределению с характеристической функцией со = е^, где J M{dx^ (7.9) — 00 [Условие (7.8) будет автоматически выполняться во всех точках непрерывности.] Доказательство. Разобьем доказательство на отдельные этапы. а) Предположим сначала, что все случайные величины Х^ п симметричны, так что распределения Sn должны сходиться без предварительного центрирования. Характеристические функции cpkt п действительны, и ввиду (7.1) для произвольного £ справед- х) Теорема остается также в силе и при обычной процедуре урезания, т. е. когда т заменяется функцией, обращающейся в нуль при |х| > а. Чтобы избежать усложнения обозначений, необходимо при этом предположить^ что у меры Л4 нет атомов в точках ± а. [Часть б) доказательства становится более сложной, так как можно не найти такое 0, чтобы Е (т (X-j-O)) = 0.] 2) Распределение, сосредоточенное в одной точке, является безгранично делимым, соответствующая ему каноническая мера тождественно равна нулю.
656 Гл. XVII. Безгранично делимые распределения ливо разложение Тейлора ? -log <h, п Ю = [1 -<h, п (С)]+411 п (□? + • • • (7.10) при одном условии, что п достаточно велико. Вопрос состоит в том, справедливо ли соотношение гп 2 log<pft,„(0 — W. (7.11) k-\ Все члены разложения (7.10) положительны и, следовательно, (7.11) требует, чтобы сумма линейных членов была ограниченной. Ввиду (7.1) это означает, что влияние членов более высокого порядка асимптотически незначимо. Поэтому (7.11) справедливо тогда и только тогда, когда гп 2 [<р*,и(С)-1]-> W- (7.12) k— 1 Левая часть может быть переписана в виде гп[фп—1], где ф„ — характеристическая функция арифметического среднего распреде- лений п. Таким образом, мы имеем дело с частным случаем теоремы 2 из § 2 и можем сделать вывод, что соотношение (7.12) выполняется тогда и только тогда, если существует каноническая мера М, такая, что Мп—>М. Если Вп = 0, то условия (7.7), (7.8) равносильны Мп—так как для интервала /, находящегося на положительном расстоянии от нуля, соотношение Мп{1}—{/}• следует из (7.7). Это доказывает теорему для симметричных рас- пределений. б) Предположим теперь, что |3ft,п = 0 для всех k и п. Мы до- кажем, что (7.11) верно, если верно 2|<р*.Л)-1|<с(С), (7.13) k— 1 т. е. если сумма слева ограничена. В таком случае (7.11) и (7.12) будут снова равносильны, и, используя заключительное рассужде- ние предыдущего пункта доказательства а), снова сводим утвержде- ние к теореме 2 из § 2. Правда, в этой теореме центрирующие постоянные ^вычисляются по функции т(х) вместо sin х; однако это легко компенсируется сдвигом предельного распределения, поскольку j J T(x)-sblxM{dx}. (7.14) — оо — оо Чтобы вывести (7.13) из (7.11), мы начнем с тождества + оо %, п (□-1 = $ [^-l-^t(x)]FftiB{dx}, (7.15) — 00
§ 7. Схема серий 657 которое справедливо, так как „ = 0. Подынтегральное выра- жение (7.15) при | х | < а равно е1*х—1 — it,x и мажорируется функцией 4-£2хг. Так как \х(х)\^а, мы заключаем, что Гп 1 ____ 2 ЖЛ-а, а} + (2+а|С|)(МП«)+М7(-а)). k— 1 (7.16) Чтобы показать, что М+ (а) должно быть ограничено, рассмотрим схему {QXk, полученную симметризацией схемы {Хк, Из уело- вия (7.1) для нулевой схемы следует, что при достаточно боль- шом п вероятность события °Xki п > Хк, п—е превосходит % для всех k^rn. Таким образом, (а) < °М+ (а), и мы знаем, что последняя величина остается ограниченной, если имеет место сходимость. Мы заключаем, что в случае сходимости сумма М-п (а) + (—а) остается ограниченной и, следовательно, гп ' ___ 2 I<₽*,„(£)-Ч2 = ЛМ-а, аН„(£), (7.17) k= 1 где &п обозначает величину, стремящуюся к нулю. С другой сто- роны, действительная часть подынтегрального выражения в (7.15) не меняет знака. При jx|<a и достаточно малых £ ее абсолют- ная величина больше ~ -£2х2, и, следовательно, гп I ____ -ReS(<pft,„(C)-l)>7C2Mn{-a, а}. (7.18) = 1 Последние два неравенства показывают, что левая часть (7.11) не может быть ограничена, если не ограничена —а, я}. Поэ- тому в нашем случае (7.13) является следствием (7.16). в) Наконец, мы рассмотрим произвольную нулевую схему Так как Е(т(Х^п—9))—непрерывная монотонная функ- ция параметра 0, которая изменяется от +& до —а, то существует такое единственное значение 0ft? п, при котором случайная вели- чина Nk n = Xk n—Qk n удовлетворяет условию Е (т (Yfe? „)) = 0. Ясно, что образует нулевую схему и, следовательно, к ней применима наша теорема. Таким образом, мы нашли общий вид возможных предельных распределений. Однако условия сходимости выражены в терминах меры Nn {dx} = ^x2Fk, п {0Й| n-rdx} для искусственно центриро- ванных распределений Yft, п. Другими словами, мы доказали тео- рему с Nn вместо Мп в (7.7) и (7.8) и заменой Вп на 0. Чтобы исключить центрирующие постоянные 9fti вспомним, что они равномерно стремятся к 0 и поэтому в конечном счете М„+ (х + е)< N* (х) < М+ (х—е).
658 Гл. XVII. Безгранично делимые распределения Это позволяет заключить, что условие (7.7) применимо в равной степени к обеим схемам. Прежде чем обратиться к условию (7.8), мы замечаем, что схемы Д и {Xftj п — ₽*, „} имеют одно и то же предельное распределение, т. е. 23 *о. (7.19) /г=1 Положим ZAi„ = T(Yft,„)—T(Xft,„) + 0ft,„. Из определения т ясно, что Zft< „ обращается в нуль, если || Xfti n j—п, а в противном случае | Zkt п | 10fti п j —> 0. Следовательно, условие (7.7) гарантирует, что 2 IЕ (Zft. „) I = 2 10*. „-0*. J — 0, (7.20) k=1 k—1 и это сильнее, чем (7.19). В заключение мы обратимся к условию (7.8). Для того чтобы показать, что при п—> оо разность двух частей (7.8) стремится к нулю, мы используем знак Легко увидеть, что если спра- ведливы (7.7) и (7.20), то _____ гп A1J—а, а} — Впж 2 J (x—9^n)2Fkt„{dx}^ k~ 1 | х | < a {dy + ^k. — a, а}. (7-21) Таким образом, (7.8) эквивалентно соответствующему условию для схемы Пример. Роль центрирования. Пусть ' величины п (й = 1, 2, ..., п) распределены нормально с математическим ожи- данием п"1/4 и дисперсией и”1. При центрировании математи- ческими ожиданиями предельное распределение существует и яв- ляется нормальным. Однако, когда центрирующие постоянные n = n~1^f мы имеем Вп ~ 2J/"п —» оо. Отсюда следует, что Мп\—а, а\—> оо. Этот пример показывает, что при произволь- ном центрировании «нелинейная» форма теоремы неизбежна. Пример показывает также, что в общем случае в разложении (7.10) для logcpfti п уже недостаточно рассматривать только ли- нейные члены. Другие результаты см. в задачах 17 и 18.
§ 8. Класс L 659 § 8*). КЛАСС L Мы проиллюстрируем силу последней теоремы, приведя простое доказательство одной теоремы, установленной П. Леви. Мы еще раз вернемся к частным суммам Sn = Xx+...+X„ последова- тельности взаимно независимых случайных величин. Однако здесь в отличие от § 5 распределение Fn случайной величины Хп мо- жет зависеть от п. Положим S* = (S„—Ьп)/ап. Мы желаем опи- сать все возможные предельные распределения для {S*} при условиях а„—>оо, -^^1. (8.1) п а х 1 ип Первое условие исключает сходящиеся ряды ^Х^, которые рас- сматриваются в § 10. Ситуации, которые исключает второе усло- вие, легче всего поможет уяснить следующий пример. Пример, Пусть Хп имеет показательное распределение с ма- тематическим ожиданием п!. Положим, ап = п\ и b„ = 0. Тогда очевидно, что распределение S* сходится к показательному рас- пределению с математическим ожиданием 1, но эта сходимость имеет место исключительно благодаря подавляющей роли слагае- мого Хп. ► Следуя Хинчину, обычно говорят, что распределение принад- лежит классу если оно является предельным распределением для последовательности {S^|, удовлетворяющей условиям (8.1). При таком определении не ясно, что все распределения класса L безгранично делимы. Мы выведем этот факт из следую- щей леммы. Лемма. Характеристическая функция со принадлежит классу L тогда и только тогда, когда для любого s (0 < s < 1) отношение co(£)/co(s£) есть характеристическая функция. Доказательство, а) Необходимость. Обозначим характеристи- ческую функцию S*n через сои. Пусть м > т. Случайная величина S* может быть представлена в виде суммы (ajan) S*m и случайной величины, зависящей только от Хт+1, Хп. Следовательно, = (8.2) \ ип / где п—характеристическая функция. Пусть теперь п—> оо и т—> оо так, что ат1ап—>s<l [этого возможно добиться в силу (8.1)]. Левая часть (8.2) сходится к со (£), а первый множи- тель справа—к co(s£), так как сходимость характеристических функций равномерна в каждом конечном интервале (теорема 2, гл. XV, 3). Из этого мы выводим прежде всего, что со не имеет нулей. В самом деле, функции ср^э п ограничены, поэтому равенство *) Здесь рассматриваются специальные вопросы,
660 Гл. XVII. Безгранично делимые распределения (о(£0) = 0 влекло бы (о($£0);=0 и вообще co(s*£o) = 0 при всех k > 0, в то время как co(s*£o)—>1. Соответственно отношение со(£)/со($£) будет непрерывной функцией, предельной для характе- ристических функций Фст, а потому оно будет характеристиче- ской функцией. б) Достаточность. Рассуждения выше показывают, что со не имеет нулей и, следовательно, справедливо тождество ш(п£)= <»(£). <o(2g) со (ng) <o(g) •••<o((n-l)g)- (8.3) п CD (kQ g. В условиях леммы множитель будет характеристиче- ской функцией некоторой случайной величины Xk. Поэтому со(£)—характеристическая функция для (Хх + • • • + XJ/n. ► Мы не только доказали теорему, но и установили, что со яв- ляется характеристической функцией n-й суммы в схеме серий. Условие (7.1), выделяющее нулевые схемы, тривиальным образом выполняется. Следовательно, функция со будет безгранично дели- мой. Чтобы отыскать каноническую меру Л4, определяющую со,, отметим, что отношение co(£)/co(s£) также безгранично делимо. Это видно из формулы (8.3). Каноническая мера N, соответствую- щая со (£)/со ($£), связана с М тождеством N {dx} = М {dx} —s*M {s-'dx}. (8.4) В терминах функций Л4+ и Л4~ это соотношение имеет вид N+ (х) = М+ (х)—М + (x/s), N~ (—%) = М- (—х)—М- (—x/s). (8.5) Мы показали, что если каноническая мера М определяет характеристическую функцию со класса L, то функции М+ и ТУ”, определенные в (8.5), должны быть монотонны при каждом 0<s< 1. Обратно, если это верно, то (8.4) определяет канони- ческую меру, соответствующую со (£)/со (s£). Нами -доказана, таким образом, Теорема. Характеристическая функция со принадлежит классу L тогда и только тогда, когда она безгранично делима и ее ка- ноническая мера М такова, что две функции (8.5) монотонны при любом фиксированном 0 < s < 1. Примечание. Легко проверить, что указанные функции моно- тонны тогда и только тогда, когда Л4+(е*) и Л4~(—ех) суть выпуклые функции.
g 9. Частичное притяжение. «Универсальные ваконы» 661 § 9*). ЧАСТИЧНОЕ ПРИТЯЖЕНИЕ. «УНИВЕРСАЛЬНЫЕ ЗАКОНЫ» Как мы уже видели, распределение F не обязано принадле- жать какой-либо области притяжения. Поэтому возникает вопрос о том, существуют ли какие-нибудь общие законы асимптотиче- ского поведения последовательности {Р2*} сверток F с собой. К сожалению, можно встретить практически любое мыслимое поведение. Мы опишем здесь несколько возможностей главным образом по причине их неожиданного характера. Говорят, что характеристическая функция ф принадлежит области частичного притяжения у, если существуют такие нормирующие постоянные аг и Ьг и такая последовательность натуральных чисел пг—> оо, что (9.1). Здесь предполагается, что | у | не равен тождественно единице, т. е. что соответствующее распределение не сосредоточено в одной точке. Таким образом, соотношение (9.1) обобщает понятие обла- сти притяжения, позволяя рассматривать пределы подпоследова- тельностей. По теореме 2 § 1 предел у будет обязательно безгранично делимым. Приводимые ниже примеры показывают, что возможны оба крайних случая: существуют как распределения, не принад- лежащие никакой области частичного притяжения, так и распре- деления, принадлежащие области частичного притяжения любого безгранично делимого закона. Примеры, а) В примере 3, е) указана характеристическая функция ф, которая не является устойчивой, но принадлежит своей собственной области частичного притяжения. б) Симметричное распределение с медленно меняющимися хвостами не принадлежит ни одной области частичного притя- жения. Допустим, что функция L(x)— 1—F (x)-\~F (—х) медленно меняется на бесконечности. По теореме 2 гл. VIII, 9, в этом случае X U (х) = \ y2F \dy\ = o(x2L(x)), х —> оо. (9.2) -X Согласно теореме § 7, для того чтобы распределение F принад- лежало какой-либо области частичного притяжения, необходимо условие: для п, пробегающих некоторую подпоследовательность,. *) Здесь рассматриваются специальные вопросы,
662 Гл. XVII. Безгранично делимые распределения функции n[l—F(anx) + F(—anx)\ и па~2U (апх) сходятся во всех точках непрерывности. Из первого условия следует nL(an) ~ 1, а из второго—nL(oQ—>оо. в) Безгранично делимое распределение не обязано принадле- жать своей собственной области частичного притяжения. В са- мом деле, из теоремы 1 из § 1 следует, что если ф принадлежит области притяжения у, то тем же свойством обладает безгранично делимая характеристическая функция Последний пример показывает, что функция е^~г может не принадлежать ни одной области частичного притяжения. г) Мы докажем сейчас одно утверждение, которое подготовит нас к странностям последующих примеров. Рассмотрим произ- вольную последовательность безгранично делимых характеристи- ческих функций = с ограниченными показателями. Положим 00 (9.3) ' fe=l Пк Тогда возможно подобрать постоянные ак > 0 и целые пк так, что при всех £ при г —> оо «А (£)-«) —°’ (9.4) Доказательство. Выберем в качестве \пк\ монотонную после- довательность целых чисел, возрастающую столь быстро, что nklnk_r > 2/гшах|фА,|. Левая часть (9.4) не превосходит в этом случае «г £ |М^)1+ £ (9-5) k = 1 k=r+1 Коэффициенты аг мы будем выбирать один за другим по следую- щему правилу. Положим*аг = 1. При данных а1У ..., аг_^ выбе- рем аг столь большим, чтобы величина (9.5) была меньше 1/г для всех (£|<г. Это можно сделать, так как первая сумма непрерывно зависит от £ и равна нулю при £ = 0. д) Каждая безгранично делимая характеристическая функция со = е^ имеет область частичного притяжения. В самом деле, мы знаем, что функция может быть представлена как предел последовательности характеристических функций = обобщен- ного пуассоновского типа. Определим X по (9.3) и положим <р = е^. Тогда ср будет характеристической функцией и, согла- сно (9.4), lim qA ( — } = lim e^r= со (£). (9.6) \ar / e) Другие возможности. Возьмем две безгранично делимые
§ 9. Частичное притяжение. «Универсальные законы» 663 характеристические функции еа и е^. Выберем в (9.3) слагаемые так, что а Ф2/г+1~^Р- Из (9.4) легко выводим, что если последовательность n^^/ak ) сходится, то ее предел необ- ходимо является линейной комбинацией а и р. Другими словами, ек принадлежит области частичного притяжения каждого рас- пределения с характеристической функцией вида epa+q^(p-]-q= 1) и не принадлежит никаким другим областям частичного при- тяжения. Этот пример легко обобщить. В терминах выпуклых множеств можно утверждать, что существует распределение Fy принадлежащее области частичного притяжения любого распре- деления, расположенного в выпуклой оболочке п заданных безгра- нично делимых распределений. ж) Пусть дана последовательность безгранично делимых ха- рактеристических функций еа2, .... Тогда существует функ- ция ф = е\ принадлежащая области частичного притяжения каждой из этих функций. Разобьем последовательность целых чисел на бесконечное число подпоследовательностей (например, включая в п-ю подпоследовательность все те целые числа, которые делятся на 2""1, но не делятся на 2п). Выберем фг в примере г) так, что фг—при г, пробегающем n-ю подпоследовательность. В этом случае, как показывает (9.4), функция ф = ех обладает требуемым свойством. з) «Универсальные законы» Деблина. Существуют функции <р, принадлежащие области частичного притяжения любой без- гранично делимой функции со. Действительно, очевидно, что если Ф принадлежит области частичного притяжения каждой из функ- ций со1? со2, ... и (o„—>со, то ср принадлежит и области частичного притяжения со. Далее рассмотрим безгранично делимые характе- ристические функции, у которых соответствующие канонические меры сосредоточены в конечном числе рациональных точек и при- писывают каждой из них только рациональные массы. Множество этих функций счетно. Расположим их в последовательность еа’, £% .... Тогда каждая безгранично делимая функция со будет пределом некоторой подпоследовательности последовательности \еаь}. Характеристическая функция ф, построенная по методу предыдущего примера, принадлежит области частичного притя- жения каждой из функций а*, а потому и области частичного притяжения со. [Примечание. Последний результат был получен в замечательной статье Деблина (1940), продолжившей работу Хинчина (1937). Технические труд- ности, связанные с этой задачей, в то время были весьма значительными. Явление, описанное в примере б), было в частных случаях отмечено Гнеденко, Хинчиным и Леви. Интересно отметить те трудности, с которыми сталки- ваются в отдельных примерах, если не принимают во внимание основной роли, которую в этой теории играют правильно меняющиеся функции,
664 Гл. XVII. Безгранично делимые распределения § 10*). БЕСКОНЕЧНЫЕ СВЕРТКИ Пусть Хп Х2, ...—независимые случайные величины с харак- теристическими функциями ф1т ф2, .... Как и в (7.5), мы опре- делим «монотонную непрерывную урезающую функцию» т ра- венствами : т (х) = х при | х | < а и т (х) = ± 1 при | х | > а. Основная теорема о бесконечных свертках утверждает: распределения частных сумм Хх + ... +ХЛ сходятся к некоторому распределению вероят- ностей U тогда и только тогда, когда S Var(т(Хй)) < оо, i P{|xft|>a}<oo (10.1) fe=l fe=l и S E(r(Xft))—>- b, (10.2) k= 1 где b—некоторое число. Частный случай конечных дисперсий был разобран в гл. VI 11,5, с указанием примеров и применений. В общей форме теорема появилась в гл. IX,9, где сформулированный результат был обобщен (была доказана сходимость ряда 2Xrt—«теорема о трех рядах»). Было показано, что упомянутая теорема является простым след- ствием основных теорем, касающихся схемы серий, и поэтому нет необходимости повторять сделанные рассуждения *•). Поэтому мы удовлетворимся примерами, иллюстрирующими использование ха- рактеристических функций. Примеры, а) Факторизация равномерного распределения. Пусть X^ = ±2”ft с вероятностью 1/2. В примере 11, в) гл. I было объ- яснено, что 2Xfe можно интерпретировать как «число, выбран- ное наудачу на отрезке от —1 до 1». Это равносильно утверж- дению, что характеристическая функция (sin £)/£ равномерного распределения представима в виде бесконечного произведения характеристических функций cos (£/2ft). Аналитическое доказатель- ство основано на тождестве s!hI_cos!.cos-£- С 2 4 cos| Sin (С/2«) S/2« (10.3) которое доказывается по индукции, исходя из формулы sin 2а = ♦) Здесь рассматриваются специальные вопросы. х) Прямая проверка того, что (10.1) и (10.2) обеспечивают равномерную в каждом конечном интервале сходимость произведений Ф1...фп, представ- ляет собой хорошее упражнение. Необходимость этих условий менее оче- видна. Однако она легко вытекает из того факта, что схема серий с n-й стро- кой Xrt, X„+i, Х/1+г„ должна удовлетворять условиям теоремы из § 7 с Л4 = 0,
§11. Многомерный случай 665 =2 sin a cos а. При п—> оо последний множитель сходится к 1 равномерно в каждом конечном интервале. Отметим, что произведение четных членов снова соответствует сумме независимых случайных величин. Мы знаем из примера 11, г) гл. I, что эта сумма имеет сингулярное распределение кан- торовского типа1) [см. задачи 5, 7 и 19]. б) Пусть Nk имеет плотность с характеристической функцией 1/(1 + £2). Ряд сходится. Для соответствующей характеристической функции мы получаем каноническое раз- ложение на множители (sh — гиперболический синус). Используя задачу 8 из гл. XV,9, находим, что плотность равна 1 1 4(ch(x/2))2 § 11. МНОГОМЕРНЫЙ СЛУЧАЙ Развитая в этой главе теория без существенных изменений: переносится на многомерный случай. Мы не будем останавли- ваться на деталях. В канонической форме для безгранично дели- мых распределений лучше выделять нормальную компоненту и рассматривать только канонические меры, не имеющие атома в начале координат. Прежние формулы не потребуют никаких, изменений, если интерпретировать £х как скалярое произведение (см. гл. XV,7). Для определенности мы выпишем формулу для двумерного случая. Мера М, не имеющая атома в 0, является канонической, если она приписывает конечные массы конечным интервалам и если по отношению к ней интегрируема функция 1/(1 4-х2 + %i). Выберем подходящую одномерную центрирующую функцию, скажем т (х) = =sinx, или функцию, указанную в (7.5). Положим (&, U = f м (1। л> Xi-j-X2 где интеграл распространяется на всю плоскость. Тогда = будет двумерной безгранично делимой характеристической функ- цией. Наиболее общая безгранично делимая характеристическая функция получается умножением на нормальную характеристи- ческую функцию. Переход к полярным координатам может сделать ситуацию легче воспринимаемой. Положим ^ = pcos(p, g2 = psinq), х = г cos 0, z/ = rsin0. (11.2) Определим каноническую меру в полярных координатах следую- х) Шоке дал привлекательное геометрическое доказательство, применимое и к более общим бесконечным сверткам. Оно приведено в статье: Tortrat А,> J, Math. Pares. Appl., 39 (1960), 231—273.
666 Гл. XVII. Безгранично делимые распределения щим образом. Выберем при каждом 9, —л < 9 л, одномерную каноническую меру Л0, сосредоточенную на 0, оо; выберем далее конечную меру W на —л <9<J л (на окружности). Тогда М можно определить с помощью рандомизации по параметру 9, и (с тривиальными изменениями центрирующей функции) мы можем переписать (11.1) в форме j .^-№.-9>-»-^(Нсо5(ф-9) AeW -Я 0 4- (11.3) (В такой форме, добавляя к Л0 атом в нуле, можно охватить и случай нормальной компоненты.) Пример. Устойчивые распределения. Положим по аналогии с одномерным случаем Л0 {dr} = r~a+1dr. Можно было бы доба- вить произвольный множитель С0, но это свелось бы к замене меры W. Как мы видели в примере 3,ж), при такой мере Л0 функция (Н.З) принимает вид + л Ж. С2) = -О>“ У |cos(<p-0)|“(l±tg^)uz {d0}, (11.4) где верхний (нижний) знак выбирается при <р — 9>0 (ф—9<0). Отсюда ясно, что —строго устойчивая характеристическая функция и так же, как и в § 5, можно установить, что других строго устойчивых функций нет. Тем не менее точно так же, как и в одномерном случае при а=1 существуют характеристические функции, которые устойчивы только в широком смысле и имеют логарифмический член в показателе. При а=1 и равномерном распределении W мы получаем ха- рактеристическую функцию е~а& симметричного распределения Коши в 512 [см. пример 7, д) гл. XV и задачи 24—23]. ► § 12. ЗАДАЧИ 1. В § 2 было показано, что если ф представляет собой логарифм безгра- нично делимой характеристической функции, то функция + /i J = (12.1) -а отличается лишь действительным множителем от некоторой характеристической функции. Докажите обратное: если ф— непрерывная функция и % (£)/% (0) — характеристическая функция при любом выборе h > 0, то ф отличается от логарифма безгранично делимой характеристической функции только на ли- нейную функцию. Более того, ф есть тот самый логарифм, если дополнительно ф(0) = 0 и ф(—£)=ф(£). Указание. Докажите, что все решения однородного уравнения (12.1) (при % = 0) линейны. 2. Показать, что задача 1 и рассуждения в § 2 остаются верными, если
§ 12. Задачи 667 в (12.1) или (2.13) вместо равномерного распределения используется распреде- ление, сосредоточенное в точках ±/к W- 4’[М+Л)+1’ (?~Л)]=%(5). . (12-2) Однако здесь появляются небольшие осложнения из-за того, что плотность соответствующая %, не является строго положительной. 3. Обобщение. Пусть 7?—произвольное симметричное распределение веро- ятностей с конечной дисперсией. Если —безгранично делимая характеристи- ческая функция и Х = ф — 7?*ф, (12.3) то X (Е)/х (0) — характеристическая функция. При этом применимо рассуждение § 2 с заменой (2.13) на (12.3). В частности, если R имеет плотность то приходим непосредст- венно к нормальной форме Хинчина для ф (см. заключительное замечание к § 2). Однако необходима некоторая осторожность в связи с тем, что ф не ограничена. 4. Пусть со—безгранично делимая характеристическая функция. Тогда существуют такие постоянные а и Ь, что | log со (£) | < a-^-bt? при всех £. 5. Дробовой эффект в вакуумных лампах. В примере 3, з) гл. VI мы имели дело со схемой серий, в которой п обладает характеристической функцией <Р», П (?) = 1 + ah 1], где h =}/У' п. Покажите, что характеристические функции сумм Sw = Xii п -j-..,-)-... + ХП1 п сходятся к пределу где 00 ф(9 = а J — 1] dx; о является характеристической функцией случайной величины X (/). Диффе- ренцированием получаем теорему Кемпбелла, см. (3.4) в гл. VI. 6. Пусть U = 2 Хга/п, где случайные величины Х^ независимы и имеют одну и ту же плотность х/2е“'хI Покажите1), что случайная величина U без- гранично делима и что соответствующая каноническая мера равна р-1 *1 М {dx} = | х | -—j- dx. 1— е ,Х| [Не требуется никаких вычислений, кроме суммирования геометрической про- грессии.] 7. Пусть -Р (s) =2где Pk^® и — Допустим, что Р (0) > О и что разлагается в степенной ряд с положительными коэффициен- тами. Если ф — характеристическая функция какого-либо распределения F, то Р (ф)—безгранично делимая характеристическая функция. Опишите соответст- вующую каноническую меру М в терминах Fn*. х) Характеристическая функция со равна бесконечному произведению, ко- торое совпадает с хорошо известным каноническим произведением для функ^ 2л (С | ЦИИ ~Т71 У i—!—Ьтгг»
§j58 Гл. XVIL Безгранично делимые распределения Интересный частный случай: если 0 «с а < b < 1, то функция 1—b I—ау 1—а 1 — Ьф будет безгранично делимой характеристической функцией. (См. также задачу 19.) 8. Продолжение. Интерпретируйте Р (ф) в терминах рандомизации и под- чиненных процессов, принимая во внимание тот факт, что Р— производящая функции безгранично делимой целочисленной случайной величины. 9. Пусть случайная величина X имеет устойчивое распределение с харак- теристической функцией (0 < а^2), и пусть Y не зависит от X. Если Y— положительная случайная величина с распределением G, сосредоточенным нг С, сю, то покажите, что характеристическая функция XY1^ имеет вид 00 J G{dy}. О Вывод: если X и Y—независимые строго устойчивые случайные величины с по- казателями (X, и 0 и если Y >0, то XY1/06—строго устойчивая величина с показателем ар, 10. Пусть со—такая характеристическая функция, что со2 (£) = со (а£) и <в3 (£) = <о (££). Тогда со устойчива. [Пример 3, е) показывает, что одного первого условия недостаточно. Пока- затели степени 2 и 3 могут быть заменены любыми двумя взаимно простыми числами.] 11. Покажите, что простая лемма 3 из гл. VIII,8, применима не только К монотонным функциям, но и к логарифмам характеристических функций. Выведите отсюда, что если (£) = со (яп£) при всех п, то log со (£) = At? при £ > 0, где А—комплексная постоянная. 12. Продолжение. Используя результат задачи 28 из гл. VIII, 10, пока- жите непосредственно, что если о—устойчивая характеристическая функция, то при £>0 или log со (?) = или log со (£) = log £, где 6 — действительное число. 13. Пусть F сосредоточено на 0, оо и 1—F (х) ~ x~aL (х) с 0 < а < 1, где L — медленно меняющаяся на бесконечности функция. Докажите, что 1-ф©~ А^Ц1/£) при £->0+. 14. Продолжение. Опираясь на результаты § 5, докажите обратное ут- верждение, а также докажите, что А = Г(1—а)е~1Ла/2. 15. Продолжение. Докажите индукцией по k следующее утверждение: для того чтобы при х—>оо было 1 — F (х) ~ ax~aL (х), где L — медленно меняю- щаяся функция и k < а < k+ 1, необходимо и достаточно, чтобы при £—>0+ было -----<*) L! Ki \ ъ / Тогда автоматически А ~ —аГ (k—а) 1ла/2. 16. Сформулируйте слабый закон больших чисел для схемы серий как частный случай общей теоремы §*7. 17. Пусть {Х^„}— нулевая схема, в которой суммы по строкам имеют предельное распределение с канонической мерой М. Покажите, что при х > О Р{тах[Х11П, ХГп Сформулируйте обратное утверждение. 18. Пусть {Х*,„} —нулевая схема из симметричных случайных величин^ в которой суммы по.строкам имеют предельное распределение с канонической
§ 12. Задачи 669 мерой М, имеющей атом массы о2 в нуле. Покажите, что распределение слу- чайной величины = п—°2 сходится к распределению, определяемому мерой M# без атома в нуле и такой, что (х)=2М + (У' х) при х > 0. 19. Пусть 0 < rj < 1 и 2 rj < °0* При любых действительных tzy беско- нечное произведение 1—Н 1 —f2 . 1 — г-^а^ 1 — r2eia& сходится и представляет собой безгранично делимую характеристическую функцию. Указание. В соответствии с задачей 7 каждый множитель безгра- нично делим. 20. Используйте метод примера 9, г) для построения распределения такого, что lim sup Fn* (х) = 1 и lim inf Fn* (x) = 0 во всех точках. 21. Возьмем в (11.4) в качестве W равномерное распределение. Тогда Mi. £2)=-с[Й +аа/2. так что И5—симметричное устойчивое распределение. 22. Возьмем в (11.4) в качестве W распределение с массами 1/4 в четы- рех точках 0, л, У2л, —14 л. Тогда (11.4) определяет двумерную характери- стическую функцию пары независимых одномерных устойчивых случайных величин. 23. Пусть распределение W в (11.4) сосредоточено в двух точках а и <т + л. Тогда (11.4) задает вырожденную характеристическую функцию такой пары, что Хх sin о—Х2 cos о = 0. Вообще любой дискретной мере W соответствует свертка вырожденных рас- пределений. Объясните (11.4) с помощью предельного перехода.
ГЛАВА XVIII ПРИМЕНЕНИЕ МЕТОДОВ ФУРЬЕ К СЛУЧАЙНЫМ БЛУЖДАНИЯМ В этой главе в значительной степени повторяются вопросы, уже разобранные в гл. XII, и по этой причине применения све- дены до минимума. Была предпринята серьезная попытка по- строить эту главу независимо от других и сделать ее доступной при минимальных предварительных сведениях (исключая анализ Фурье из гл. XV). Излагаемая теория совсем не связана с со- держанием двух предшествующих глав. Содержание § 6 не зави- сит от § 1 — 5. § 1. ОСНОВНОЕ ТОЖДЕСТВО Всюду в этой главе Х^, Х2, ... обозначают взаимно незави- симые случайные величины с одним и тем же распределением F и характеристической функцией ср. Как обычно, мы полагаем So = 0 и S„ = Хх + ... + последовательность образует случайное блуждание, порожденное F. Пусть А — произвольное множество на действительной прямой и А'—его дополнение (в большинстве применений А' будет ко- нечным или бесконечным интервалом). Если /—подмножество (интервал) из Л' и если S^x,s^ex, Sn£/ (Zc=X'), (1.1) то мы скажем, что (первое) вхождение1) в А' происходит в мо- мент п в точке из /. Так как вхождение в А’ не обязано быть достоверным собы- тием, то момент вхождения N может оказаться несобственной случайной величиной, равно как и точка SN первого вхождения. Для совместного распределения пары (N, SN) мы примем обоз- начение Р {N = n, S„ С/} = //„ {/}, п=1, 2,.... (1.2) Таким образом, Нп{1} есть вероятность события (1.1). Дополни- тельное соглашение, что Я„р} = 0 при la Л, позволяет опреде- лить распределение (1.2) для всех 1 на числовой прямой. Веро- ятности (1.2) будут называться вероятностями достижения. Их изучение неотделимо от изучения случайного блуждания до мо- мента первого вхождения в Л', т. е., иными словами, случайного блуждания, ограниченного множеством А. Положим для /сЛ и 1) Иногда мы будем говорить «достижение А'».— Прим, перев.
§ 1. Основное тождество 671 и=1, 2, ... G„{Z} = P{S1€:4, .... Sn_i6A S„€Z}, (1.3) т. е. Gn (I) есть вероятность того, что в момент п блуждание при- водит в 1с: А и что до момента п не произошло вхождения в А'. Мы распространим это определение на все множества /, считая Gn\I\ = 0 при 1с:А'. Отметим, что, согласно нашему определению, G„{4)=l-P{N<n}. О-4) Случайная величина N будет собственной тогда и только тогда, когда эта величина стремится к нулю при п—>оо. Рассматривая положение блуждающей точки в моменты п=1, 2, ..., видим, что при 1с: А' Hn+1{I} = \Gn{dy}F{I-y}, (1.5а) А а при 1с: А G„+1{/}=Jg„{^F{/-//}. (1.56) А Условимся теперь обозначать буквой Go распределение вероятно- стей, сосредоточенное в нуле. Тогда соотношения (1.5) верны при п = 0, 1, 2, и с их помощью можно последовательно вычис- лить все вероятности Нп и Gn, Эти два соотношения можно объ- единить в одно. Разобьем произвольное множество I на числовой прямой на части IA' и /А и применим к ним (1.5). Вспоминая, что Нп и Gn сосредоточены на А' и А соответственно, получаем для п = 0, 1, ... и произвольного I Hn+i {/HG„+I {/} = 5 G„ {dy} F {I-y}. (1.6) A Частный случай A = 0, оо разбирался в гл. XII, 3. Соотноше- ние (3.5) гл. XII играло там ту же роль, что (1.5) здесь. Мы могли бы повторить здесь прежний путь и вывести интегральное урав- нение типа Винера — Хопфа, аналогичное (3.9) гл. XII. Оно снова имело бы только одно вероятностное решение (хотя эта единст- венность решения не абсолютна). Однако на этот раз предпочти- тельнее опираться на мощный метод анализа Фурье. Нас интересует распределение пары (N, SN). Так как N — целочисленная случайная величина, то мы будем использовать производящую функцию для N и характеристическую для SN. Соответственно этому положим X (S, С) = i е^Нп {dx}, v (s, О = S S" J e**Gn {^} (1.7) п=1 А, п=0 А (члены с п = 0 в этих двух рядах равны соответственно 0 и 1.) Оба ряда сходятся по крайней мере при |s | < 1.
672 Гл. XVIII, Применение методов Фурье к случайным блужданиям Для ясности здесь указана существенная часть области инте- грирования; можно было бы взять интеграл в пределах от —оо до оо. В частности, интеграл в (1.6) есть обычная свертка. После применения преобразования Фурье—Стильтьеса соотношение (1.6) принимает вид х„+1 (С)+ти+1 (С)=?„(□<?(£)• (1-8) Умножая на sn+1 и суммируя по n = 0, 1, ..., получаем X(s, O + v(s, l=sy(s, С)<р(С) для всех s, при которых ряд (1.7) сходится. Таким образом, мы получили основное тождество = (1.9) (Другое доказательство см. в задаче 6.) В принципе хиТ могут быть вычислены, исходя из (1.5), и поэтому тождество (1.9) может на первый взгляд показаться избы- точным. В действительности прямые вычисления редко можно довести до конца. В то же время непосредственно из (1.9) можно извлечь много ценной информации. Пример. Пусть F обозначает двустороннее показательное рас- пределение с плотностью и характеристической функцией ।--1 <р(£) = 1/(1 + £2), и пусть А = — а, а. При х > а из (1.5а) получаем а Hn+1 {х, оо} = //„+1 {—оо, —х} =1 j Gn {dy} е-<х-у) = с„е~я, (1.10) - а где сп не зависит от х. Отсюда следует, что точка Sn первого вхождения в множество | х | > а не зависит от момента этого вхож- дения и имеет плотность, пропорциональную е~\х\ (при | х | > а). Этот результат, как подсказывает интуиция, согласуется со свой- ством отсутствия памяти у показательного распределения, описан- ного в гл. 1. Независимость означает, что совместная характери- стическая функция % может быть разложена на множители, и из вида плотности SN заключаем, что i<s. о=4'’«[тЪг+т+<г]. <1J1> где Р—производящая функция момента N первого вхождения в множество | х | > а. (Множитель 1/2 появляется вследствие того, что х(Ь °)= 1-) Прямое вычисление Р (s) громоздко, однако явное выражение для нее легко может быть получено из (1.9). Действительно, в нашем случае правая часть (1.9) равна нулю при £ = ± iV 1—s, поэтому при таких £ величина х (s, 0 должна быть равна единице.
§ 2. Конечные интервалы. Вальдовская аппроксимация 673 Таким образом, ^(s) = 2 1 + /Т=? (М2) Отсюда следует, что момент N первого вхождения в множество | х| > а имеет математическое ожидание 1 + аа. (Другие примеры см. в задачах 1—5). ► § 2*). КОНЕЧНЫЕ ИНТЕРВАЛЫ. ВАЛЬДОВСКАЯ АППРОКСИМАЦИЯ Теорема. Пусть А = — а, b—конечный интервал, содержащий точку нуль, и пусть пара (N, Sn) соответствует достижению дополнения А' к А. Тогда случайные величины N и Sn будут собственными. Ряд для производящей функции S s"P{N>n}« i s“Gn{A} (2.1) /г=0 и=0 сходится при некотором1) s>l, и потому N имеет моменты всех порядков. Величина Sn имеет математическое ожидание тогда и только тогда, когда распределение F, определяющее случайное блуждание, имеет математическое ожидание р,. В последнем случае E(Sn) = p-E(N). (2.2) Тождество (2.2) впервые было получено А. Вальдом. В частном случае А = 0, оо оно сводится к (2.8) гл. XII. Доказательство. Как уже отмечалось, Gn{AJ- иР{М>п}есть разные обозначения для вероятности того, что случайное блужда- ние не выйдет из множества А за время п, и поэтому выражения в обеих частях (2.1) идентичны. Выберем целое число г так, что Р{|8г|<а + 6)- = т|< 1- Собы- тие {N > п-}-г} не может осуществиться, если не выполняется хотя бы одно из неравенств N > п и | Xrt+1 + ... + Хл+г | < а 4- Ь. (Эти два события независимы, потому что {N > п} зависит только от Хг .. Хп.) Так как Х„+1+ ... -ЬХл+г и Sr одинаково рас- пределены, имеем P{N>n4-r}^P{N >п}ть *) Включение в книгу этого параграфа объясняется его важностью в ста- тистике; он может быть опущен при первом чтении. г) Это утверждение известно статистикам как лемма Стейна. Другое дока- зательство см, в задаче 8. 22 № ^41)
674 Гл, XV111. Применение методов Фурье к случайным блужданиям Отсюда по индукции P{N>&4<T]ft. (2.3) Последнее неравенство показывает, что последовательность Р {N>n} убывает не медленнее геометрической прогрессии со знаменателем т]1/г. Отсюда следует, что N является собственной случайной вели- чиной и что ряд (2.1) сходится по крайней мере при | s | < Это доказывает первое утверждение. Отсюда следует также, что соотношение (1.9) справедливо при |s|<T]“1/r. При s—1 получаем 1-Х(1, 0 = 7(1, 0[1-<Р(0]. (2.4) Но % (1, 0 есть характеристическая функция SN , и то, что % (1,0)= = 1, показывает, что Sn — собственная случайная величина. Событие | Sn | > t + а + b не может осуществиться, если ни при каком п не выполняются неравенства N > п — 1 и | Хл| > t, Как уже отмечалось, последние события независимы, и так как Хд одинаково распределены, то Р {I $n | > / я 4* Ь} < J P{N>n-l}.P{|X1|>/} = E(N).P{lXI|>^}. П=1 Математическое ожидание р = Е (XJ существует тогда и только тогда, когда правая часть интегрируема на 0, оо. В этом случае интегрируема и левая часть, и, следовательно, E(SN) существует. С другой стороны, P{|Sn|>O>P{|Xi|>Z +a + b}, потому что осуществление события в правой части влечет за собой SN = Хг Таким образом, из существования Е (SN) следует существо- вание р = Е (Xi). Когда эти математические ожидания существуют, можно, дифференцируя (2.4), получить ZE(Sn)=-№-^- = <p'(0)t(1, O) = J>E(N). (2.5) ► Перейдем теперь к выводу одного из вариантов основного тож- дества (1.9), известного как тождество Вальда. Чтобы избежать использования мнимого аргумента, введем /(%)== J e~KxF{dx}. (2.6) — 00 Предположим, что этот интеграл сходится в некотором интер- вале —Zo < Z < Xlt содержащем точку нуль. Тогда характеристи- ческая функция определяется соотношением <p(iZ) = /(X), причем Ф (z) аналитична в полосе —%0 < I*m (z) < %f. Формально тождество Вальда получается подстановкой gssi’A и s= 1/ф (й) в (1.9). При
§ 2. конечные интервалы. Вальдовская аппроксимация 675 таких значениях £ и s правая часть (1.9) обращается в нуль и, следовательно, %($, £)=1. Исходя из определения %, этот резуль- тат может быть сформулирован на вероятностном языке следую- щим образом. Тождество Вальда1). Если интеграл (2.6) сходится при —%0 < то в этом интервале E(/-N(%)e~XSN) = l. (2.7) Доказательство. Повторим рассуждение, приведшее к формуле (1.9). Так как меры Gn сосредоточены на конечных интервалах, их преобразования Фурье %п определены при всех комплексных По предположению ф (А,) = f (%) существует, и, следовательно, соот- ношение (1.8) справедливо при £ = /%. После умножения на f-”--1 (А,) оно принимает вид Г"’1 W Х„+1 R=f (%) Yn+i (iX). (2.8) Если /”w(%) yn (l’X)—>0, сумма по n правых частей (2.8) равна 1. В этом случае суммирование (2.8) приводит к утверждению (2.7), и, следовательно, достаточно показать, что (2.9) Теперь если /(ц) < оо, то ь ^e(a+6)|nl g-nxpn-k |dx}^e(a+Z,)l*ll7"(T]). -а Поэтому (2.9) справедливо, если > f(q). Так как выбор q находится в нашем распоряжении, то тем самым (2.7) доказано для всех точек, кроме тех, где f достигает своего минимума. Но, будучи выпуклой функцией, f может иметь не более одной точки минимума. Для нее (2.7) верно по непрерывности. ► Пример. Оценки для распределения N. Вальд пришел к тожде- ству (2.7) от задач последовательного анализа, в которых было необходимо получить приближения для распределения момента N первого выхода из интервала А, а также оценить вероятности того, что выход произойдет вправо или влево от этого интервала. Метод Вальда является обобщением процедуры для арифметических распределений с конечным числом скачков, описанной в 1; XIV, 8. (Там же показано, как можно получить строгие неравенства.) г) Вальд применял (2.7) в связи с последовательным анализом. Это было еще до 1945 г. и до того времени, когда началось систематическое изучение общих случайных блужданий. Естественно поэтому, что его условия были жесткими, а методы—трудными. Однако, к сожалению, их влияние на стати- стическую литературу все еще продолжается. Рассуждения в тексте исполь* зуют одну идею Миллера (Не D. Miller, 1961). 22*
676 Гл. XV111. П рименение методов Фурье к случайным блужданиям Положим pft = P{N=£, SN>&}, ^ = P{N=£, Sn<—a} (2.10) и обозначим соответствующие производящие функции через Р (s) и Q(s). (Тогда P + Q будет производящей функцией для N.) Допустим теперь, что а и b велики по сравнению с математиче- ским ожиданием и дисперсией F. Тогда SN, по-видимому, будет близко к Ь или —а. Если бы только эти числа были возможными значениями Sn, то тождество (2.7) имело бы вид <2J1> Естественно ожидать, что при сделанных предположениях (2.11) будет приближенно выполняться. Функция f выпукла, и обычно можно найти такой интервал s0 < s < sx, что на нем уравнение s/(2i)=l (2.12) имеет два корня (s) и %2 (s), непрерывно зависящих от s. Под- ставляя их в (2.11), мы получаем два линейных уравнения для производящих функций Р и Q и таким образом можем найти (по крайней мере, приближенно) распределение N и вероятности вы- хода вправо или влево. ► § 3. ФАКТОРИЗАЦИЯ ВИНЕРА —ХОПФА В этом параграфе чисто аналитическими методами мы выведем различные следствия из основного тождества (1.9). Мы увидим, что они в более гибкой и отчетливой форме содержат в себе мно- гие результаты, полученные в гл. XII комбинаторными методами. Это может создать ложное впечатление о превосходстве методов Фурье, однако в действительности именно взаимодействие этих двух методов характеризует последние успехи в данной теории. Каждый метод приводит к результатам, которые кажутся недо- ступными для другого (см., например, § 5; закон арксинуса для числа положительных частных сумм, а также теория симметрично зависимых случайных величин иллюстрируют преимущества ком- бинаторного подхода). В дальнейшем N и SN будут обозначать момент и точку первого вхождения в открытую полупрямую 0, оо. Их совместное распре- деление P{N?=n, SN ^1} = Нп{1} задается соотношением Я„{7} = Р{81^0, .... S^CO. s„e/}, (3.1) где подразумевается, что Нп сосредоточено на 0, оо, а /70=>0. Как и прежде, вместо двумерной характеристической функции
§ 3. Факторизация Винера — Хопфа 677 введем более удобную комбинацию производящей и характеристи- ческой функций X(s, ?) = E(SVss"), (3.2) то есть X(s, 0= J ^n]e^Hn{dx}. (3.3) П=1 0 (Интегрирование производится по полупрямой, однако ничего не изменится, если нижний предел заменить на —оо.) Для кратко* сти мы будем называть % «преобразованием» последовательности мер Нп. Для момента и точки первого вхождения в открытую отри- цательную полупрямую введем обозначения N” и SN-; тогда {Н~\ и —соответствующие распределение и преобразование. Когда распределение F не является непрерывным, мы должны различать первые вхождения в открытую и замкнутую полупря- мые. Поэтому необходимо рассматривать событие, заключающееся в «возвращении в нуль через отрицательные значения». Соответ- ствующее распределение вероятностей {fn} задается соотношениями [/„ = ₽{§!< о, ...» S„_,< О, S„ = 0}, п>1. (3.4) 00 Положим f (з) — 2] fnsn. Вскоре будет показано, что правая часть п= 1 (3.4) не изменится, если все неравенства заменить на противопо- ложные. Очевидно, Используя, эти обозначения, можно теперь сформулировать основную теорему. Теорема о факторизации Винера — Хопфа. При |s| С 1 спра- ведливо тождество l-s<p(C) = [l-/(s)]-[l-x(s, O]-[l-X-(s, 0]. (3.5) Доказательство приведет к явным выражениям для f и %, кото- рые мы оформим в виде отдельных лемм1). Лемма 1. При 0^s< 1 (3-6) п= 1 0 + х) При £ = 0 лемма [1 сводится к теореме 1 из гл. XII, 7. Обобщенный вариант (9.3) из гл. XII эквивалентен лемме 1, однако менее удобен для использования. Лемма 2 представляет собой иную формулировку (9.6) из гл. XII, Она принадлежит Г. Бакстеру (G. Baxter). Значительно упрощенное (но все еще технически сложное) доказательство было дано Спицером, F. Spitzer, Trans. Amer. Math. Soc., vol. 94 (1960), p. 150—169.
678 Гл. XVIII. Применение методов Фурье к случайным блужданиям Аналогичная формула для %“ получается из соображений сим- метрии. Лемма 2. При 0 s 1 lo2-r4)-E^-P(S.-0|. (3.7) Так как в правую часть (3.7) не входят неравенства, то (3.4) остается неизменным если все неравенства в нем заменены на противоположные. Этот результат был получен в примере 2, а) гл. XII кай следствие принципа двойственности. Примечательная черта факторизации (3.5) в том, что с ее помо- щью произвольная характеристическая функция ср представима через два (возможно, несобственных) распределения, сосредоточен- ных на двух непересекающихся полупрямых. Лемма 1 показывает, что это представление единственно. Для непрерывных распределений доказательство простое. В об- щем случае нам понадобится аналог леммы 1 для вероятностей ।---------------------------------------- вхождения в замкнутую полупрямую 0, оо. Они будут обозна- ~ I---- чаться Rn{I\ для любого интервала I с: 0, оо, т. е. .... S„_i<0, (3.8) Конечно, i?o = O и Rn {—оо, 0} = 0. Лемма 3. При 0 s < 1 преобразование р последовательности определяется соотношением 00 оо тт^то = V J “* W- <3-9> Доказательство. Применим основное тождество (1.9) кА — = 0, оо. Для вероятностей вхождения /?п(1.9) записывается в виде l-p(s, C) = y(s, C)[l-s<p(C)]. (3.10) Здесь у—преобразование последовательности вероятностей G„, определяемых на —оо, 0 соотношениями G«K} = P{Sx<0........S^CO, S„<0, (8.11) т. e. « °; (3-12) При фиксированном | s | < 1 функции 1—s<p(£) и 1—%(s, £) не имеют нулей и, следовательно, (см. гл. XVII, 1) их логарифмы
§ 3. Факторизация Винера — Хопфа 679 однозначно определяются как непрерывные функции равные нулю в нуле. Поэтому (3.10) можно переписать в виде log = log 1 _p(S; gj + logY(s, C), (3.13) или oo +oo E v feitxFn* W = = 1 — 00 = E 0+ E (s, C)-lp. (3.14) /2=1 /2=1 Рассмотрим это соотношение при фиксированном 0 < s < 1. Тогда pn(s, С)—характеристическая функция несобственного вероятност- ।------------------------------------------ ного распределения, сосредоточенного на 0, оо, и, следовательно, первый ряд справа представляет собой преобразование Фурье — ।----------------------------------------------- Стильтьеса конечной меры, сосредоточенной на 0, оо. Аналогично, (3.12) показывает, чтор(з, Q—1 является преобразованием Фурье — Стильтьеса конечной меры, сосредоточенной на —оо, 0. То же самое справедливо для [р (s, £)—1р, и поэтому второй ряд в пра- вой части представляет собой преобразование разности двух мер __________ ।----------------------------------------- на —оо, 0. Отсюда следует, что для множеств из 0, оо первые два ряда в (3.14) представляют одну и ту же конечную меру, а именно 2 ($п/п) Fn*- Соотношение (3.9) выражает это свойство в терминах соответствующих преобразований. Доказательство леммы 2. Эта лемма фактически содержится в лемме 3, потому что обе части (3.7) суть массы атомов в нуле мер, чьи преобразования содержатся в (3.9). Это утверждение очевидно для правых частей. Рассмотрим левые части. По опре- делению (3.8) атом Rn в нуле имеет массу fn. Тогда /(s) есть масса, приписываемая нулю мерой ^snRn, чье преобразование равно p(s, £). Поэтому мера с преобразованием 2pn(s, £)/п при- писывает нулю массу 2fn(s)/n = log(l— /(s))-1. Доказательство леммы 1. Проведем доказательство двумя способами. (i) Лемма 1 является аналогом леммы 3 для открытых полу- прямых и приемлет точно такое же доказательство. Если счи- тать обе леммы доказанными, то, вычитая (3.6) из (3.9), получим P(s. P=f(s)4'[l— /(»)]%(s, С). (3.15) I---- (Это тождество утверждает, что первое вхождение в 0, оо может быть возвращением в нуль через отрицательные значения и что, если такого возвращения в нуль не было, (условное) распреде-
680 Гл. XVIII. П рименение методов Фурье к случайн ым б л ужданиям ление точки первого вхождения в 0, оо равно распределению \НП} первого вхождения в 0, оо.) (ii) Иначе, соотношение (3.15) можно доказать непосредст- венно, исходя из определений (3.1) и (3.8) мер Нп и Rn. [Для этого достаточно в (3.8) рассмотреть последний индекс k^in, при котором S^ = 0, и взять точку (&, 0) в качестве нового начала координат.] Подставляя (3.15) в (3.9), получаем лемму 1 как следствие лемм 2 и 3. Доказательство теоремы о факторизации. Складывая тожде- ства лемм 1, 2 и аналога леммы 1 для —оо, 0, получаем соот- ношение, представляющее собой логарифмический эквивалент (3.5). То, что (3.5) выполняется при s=l, следует по непрерывности. Следствие. О=т=А1>- (3.16) Доказательство. Из леммы 3 и (3.13) имеем / « °- \ y(s, £) = ехр §e^F«*{dx}\ (3.17) \П = 1—00 / и в силу леммы 1 правые части в (3.16) и (3.17) совпадают. Примеры, а) Биномиальное случайное блуждание. Пусть P(Xi = l) = p и Р{Х1 = -!} = </. Первое вхождение в положительную и отрицательную полупря- мые обязательно происходит через точки +1 и—1 соответственно, и, следовательно, %(s, £) = P(s)e* %-(s, C) = Q(s)e-^, (3.18) где P и Q—производящие функции моментов первого вхождения. Поэтому обе части* факторизационного соотношения (3.5) явля- ются линейными комбинациями трех величин eik%> при А = 0, ±1. Приравнивая коэффициенты, получаем три уравнения [1 -f (S)] [1 + Р (S) Q (S)] = 1, [1 ~f (s)] Р (в) = SP, [1-/(s)]Q(s) = s9. (3.19) Эти уравнения сводятся к квадратному уравнению для 1—/(s); его решение, удовлетворяющее условию / (0) = 0, имеет вид /(s) = 4(l-/l-4Wsa). (3.20) Производящие функции Р и Q находятся теперь из (3.19). Если р></, имеем f(l) = q и, следовательно, Q(l) < 1. Таким образом,
§ 3. Факторизация Винера — Хопфа 681 теорема о факторизации непосредственно приводит к распреде- лениям времен первого достижения и возвращения, найденным другими методами в 1; XI, и 1; XIV. б) Конечные арифметические распределения. Тот же метод в принципе применим, когда F сосредоточено в целых точках между —а и Ь. Преобразования %, %“ и f в этом случае опре- деляются я + &4-1 уравнениями, однако решение в явном виде получить трудно (см. пример 4, в) гл. XII). в) Пусть F—свертка двух показательных распределений, одно из которых сосредоточено на положительной, а другое—на отрицательной полуосях, т. е. пусть fl>0’ 6>0- (3’21) В силу непрерывности F имеем /(s) = 0 тождественно. Левая часть формулы (3.5) в теореме факторизации имеет полюс в точке £ =—ib, но %" (s, £) регулярна в окрестности любой точки £ с отрицательной мнимой частью (это следует из того, что %"" является преобразованием меры, сосредоточенной на —оо, 0). Отсюда следует, что % должно иметь вид % (s, £) = (b—ft;)*"1 U (s, £), где U регулярна при всех £. Можно поэтому предполагать, что LF не будет зависеть от £, т. е. % и будут иметь вид Г(». 0=Д4й- <3-22) Для этого необходимо, чтобы 1 — s. , .Л, = fl—(3.23) (6z+^)(Z?— tQ \ b— tZ J \ «+^7 V ' Освобождаясь от знаменателей и приравнивая коэффициенты при одинаковых степенях £, находим, что Р (s) = Q (s) и что P(s) удов- летворяет квадратному уравнению. Условию Р(0) = 0 удовлетво- ряет только один из двух корней этого уравнения, и в резуль- тате мы получаем Р (s) = Q (s) = | [а + 6—К(а + bf—4abs ]. (3.24) Предположим, что а > Ь. Тогда Р(1) = Ь, и, следовательно, P(s)lb и Q(s)/<2—производящие функции соответственно собствен- ного и несобственного распределений вероятностей. Следова- тельно, функция х, определенная соотношением (3.22), является преобразованием пары (N, SN), такой, что SN не зависит от N и имеет характеристическую функцию bl(b — iQ. Такое же утверж- дение справедливо для и в силу единственности факторизации P(s)/& и Q(s)/# на самом деле являются производящими функ- циями моментов N и N” первого вхождения. [То, что Sn и SN- показательно распределены, было получено также в примере 4, а)
682 Гл. XVIII. Применение методов Фурье к случайным блужданиям гл. XII. Напомним (см. пример 9, д), гл. VI), что распределе- ния вида (3.21) играют важную роль в теории очередей.] Другие примеры см. в задачах 9—11. § 4. ВЫВОДЫ И ПРИМЕНЕНИЯ Перейдем к анализу результатов предыдущего параграфа с ве- роятностной точки зрения и установим их связь с некоторыми результатами, полученными в гл. XII. (i) Принцип двойственности. Сначала покажем, что следствие (3.16) эквивалентно следующему утверждению. Лемма 1. Для любого интервала /с О, оо P{SX<S„, 8п_.<8п, S„€Z} = = Р{Sx > 0, ..S„_£ > О, S„(4.1) Это равенство мы получили в (2.1) гл. XII, рассматривая величины Хх, ..., Хп в обратном порядке. Лемма, будучи оце- ниваема с этой точки зрения, кажется почти очевидной, однако мы видели, что ее простыми следствиями являются многие важ- ные соотношения. Она не играет никакой роли при исследова- нии с помощью преобразований Фурье, но примечательно, что она может быть получена как строгий аналитический резуль- тат1). (Чтобы вспомнить удивительные следствия леммы 1, касаю- щиеся блужданий, читатель может обратиться к примеру 2, б) гл. XII.) Доказательство. Следствие (3.16) относится к отрицательной полуоси, и для прямого сравнения все неравенства в (4.1) должны быть заменены на противоположные. Вероятность в пра- вой части (4.1) совпадает тогда с вероятностью Gn {/}, введенной в (3.11), a y(s, £)— это просто соответствующее преобразование. Для доказательства леммы мы должны, следовательно, показать, что [1—x(s, ^)]“1 является преобразованием последовательности вероятностей из левой части (4.1). Далее, x(s, £) было опреде- лено как преобразование распределения точки (N, SN) первого вхождения в 0, оо, поэтому %г есть преобразование r-й лестнич- ной точки (Nz, SnJ* Отсюда следует, что Т±__1==Х_|_Х2+... (4.2) х) Используемые нами аналитические методы довольно элементарны, однако исторически так сложилось, что первоначально отправным пунктом здесь служила теория Винера—Хопфа. Поэтому в большинстве работ исполь- зуются глубокие методы теории функций комплексного переменного, которые на самом деле не уместны в теории вероятностей, так как даже оригиналь- ная теория Винера—Хопфа значительно упрощается, если ограничиться по- ложительными ядрами. См. обсуждение в гл, ХЩ За,
§ 4. Выводы и применения 683 есть преобразование последовательности вероятностей того, что п есть лестничный момент и S„ СI. Но именно эти вероятности стоят в левой части (4.1). Лемма доказана. > (ii) Момент N первого вхождения в 0, оо имеет производя- щую функцию т, равную t(s)f=%(s, 0). Следовательно, из (3.6) 00 log7—Ст = У -P{S„>0}. (4.3) Ь1—т (s) п ’ J 4 7 ' /2=1 Эта формула была выведена комбинаторными методами в гл. XII, 7. Там же обсуждались различные ее следствия. В частности, устремляя в (4.3) s—>1, видим, что случайная величина /Убудет собственной тогда и только тогда, когда ряд > 0} расходится; в случае сходимости этого ряда имеет место снос в — оо. Прибавляя log(l—s) = —%sn/n к (4.3) и устремляя s—> 1, получаем О0 logE(N) = logT'(l) = E (4.4) п=1 при условии, что N— собственная случайная величина. Но мы уже видели, что ряд из (4.4) сходится тогда и только тогда, когда случайное блуждание уходит в оо. Следовательно, мы до- казали следующее утверждение. Лемма 2. Для того чтобы случайная величина N была собст- венной и E(N) <оо, необходимо и достаточно, чтобы случайное блуждание уходило в оо. Этот результат был получен в гл. XII, 2, другими методами. Другие свойства распределения N см. в гл. XII, 7. (iii) О математическом ожидании точки SN первого вхожде- ния. Используя методы гл. XII, о распределении SN можно было сказать немного. Теперь же, подставляя s=l в (3.6), мы нахо- дим характеристическую функцию величины SN. Тем не менее предпочтительно получить некоторую существенную информацию о распределении SN непосредственно из факторизационной фор- мулы. Лемма 3. Если SN и Sn- являются собственными случайными величинами с конечными математическими ожиданиями, то F имеет нулевое математическое ожидание и дисперсию о2, задан- ную равенством |a2 = _[l_/(l)].E(SN).E(SN-). (4.5) Теорема 1 следующего параграфа показывает, что справедливо и обратное утверждение. Неожиданным следствием является то,
684 Гл. XVIII. Применение методов Фурье к случайным блужданиям что для конечности математического ожидания Sn необходимо существование второго момента F. Доказательство. При s=l из (3.5) получаем (4.6) При £—>-0 дроби в правой части стремятся "к производным ха- рактеристических функций % и %-, т. е. к iE(Sn) и iE (SN-). Левая часть имеет поэтому конечный предел о2, а это означает, что ф'(0) = 0 и!<р"(0)= -j-a2. Отсюда следует, что о2—дисперсия F (см. следствие из гл. XV, 4). ' ► Рассмотрим случай сноса блуждания в оо. Из лемм 1, 2 § 3 и соотношения (4.5) следует, что в этом случае при s—► 1 и С —о [l-/(s)]-1-[l-X-(s, С)]’1 — (» \ £ lp{Sn<0}UE(N)<oo, (4.7) /2=1 / По теореме о факторизации x(i, g)-i ф(£)-1 1 С ~ 5 ОГ Устремляя £—►0, получаем следующий важный результат! E(Sn)«E(Xi).E(N), (4.8) (4-9) при условии, что E(Sn) и E(Xf) существуют (последнее матема- тическое ожидание положительно вследствие предполагаемого сноса в оо). Из приведенного доказательства можно получить и другие результаты. Наши рассуждения показывают, что левая часть в (4.8) сходится к конечному пределу тогда и только тогда, когда существует ф' (0) = Zp,. Как было пока- зано в гл. XVII, 2а, это имеет место в том и только том случае, когда наше случайное блуждание подчиняется обобщенному слабому закону больших чисела именно (4.10) ( —► означает сходимость по вероятности). Было показано также, что для положительных случайных величин р совпадает с их математическим ожида- нием. Таким образом, левая часть в (4.8) сходится к пределу тогда и только тогда, когда Е (N) <оо, а правая часть в (4.8) сходится тогда и только тогда, когда ср' (0) существует. Таким образом, справедлива Лемма 4. Если случайное блуждание уходит в оо, то Е (N) <оо тогда и только тогда, когда существует такое число р > 0, что выполняется (4.10). В гл. XII, 8, мы смогли показать только, что/для указанного выше утверждения достаточно существования Е(Х3), но даже для этого более сла- бого результата нам потребовался усиленный закон больших чисел и обратная к нему теорема.
§ 5. Две более основательные теоремы 685 § 5. ДВЕ БОЛЕЕ ОСНОВАТЕЛЬНЫЕ ТЕОРЕМЫ Чтобы проиллюстрировать использование более тонких мето- дов, мы докажем две теоремы, представляющие самостоятельный интерес. Первая уточняет лемму 3 предыдущего параграфа, вто- рая имеет приложения к теории очередей. Доказательства опи- раются на фундаментальные тауберовы теоремы; при доказатель- стве второй используются преобразования Лапласа. Теорема 1. Если F имеет нулевое [математическое ожидание и дисперсию о2, то ряд S 4 [p;s„>o}—(5.1) П=1 U -* сходится по крайней мере условно и E(SN)=^e- (5,2) Эта теорема принадлежит Спицеру. Сходимость ряда важна в связи с теоремами 1а из гл. XII, 7 и 8. Доказательство, Дифференцируя (3.6) по £ и полагая £ = 0, получим . dx ($, 0) __ £ % JxF«* {dx} exp -£±P{S„>0} . (5.3) n= 1 0 Оба ряда сходятся абсолютно при |s| < 1, так как коэффициенты при sn ограничены. Действительно, в силу центральной предель- ной теоремы моменты порядка случайных величин Sn/a]/~n сходятся к соответствующим моментам нормального распределе- ния, а это означает, что при п]—>оо (5.4) о Следовательно, в соответствии с «абелевой» частью теоремы 5 из гл. XIII, 5, при s—> 1 (5'6) п=1 0 r n=l r г Левая часть в (5.3) стремится к математическому ожиданию Е (Sn), которое может быть конечным или бесконечным, но не нулевым. Комбинируя (5.3) и (5.5), получаем Е (SN) = -^=lim V 2 s-и (5.6)
686 Гл. XVIII. Применение методов Фурье к случайным блужданиям Выражение в показателе экспоненты стремится или к конечному пределу, или к -{-оо. То же самое рассуждение применимо kN”, т. е. к показателю экспоненты в (5.6), в котором {S„ > 0} за- менено на {S„ < 0}. Но сумма этих двух показателей равна 2 (sn/ri) Р {S„ = 0} и остается ограниченной при s —> 1. Отсюда следует, что показатель экспоненты в (5.6) остается ограничен- ным и, следовательно, стремится к конечному пределу —с. Так как коэффициенты ряда в показателе имеют порядок о (я"1), отсюда следует1), что при s=l ряд сходится к—с. Доказатель- ство завершено. * Рассмотрим теперь случайное блуждание со сносом в —оо и положим M„ = max{0, Sp .... S„}. (5.7) Напомним (см. гл. VI, 9), что в приложениях к теории очередей изображает время ожидания /i-го требования. Метод доказа- тельства следующей предельной теоремы, по-видимому, имеет больший интерес, чем сама теорема. Теорема 2. Если случайное блуждание уходит в —оо, то рас- пределение Un случайной величины стремится к предельному распределению U, характеристическая функция которого <о за- дается соотношением ®(С) = ехр п— 1 О (5-8) Заметим, что вследствие (4.3) {Sn > 0} <оо, и поэтому ряд в (5.8) сходится абсолютно при всех £ с положительной мнимой частью. Доказательство. Пусть со„—характеристическая функция Un. Покажем сначала, что при | s | < 1 У (С) п=0 Г=3 ехр У 7 J ^х~1) 1/2= 1 О (5.9) Событие осуществляется тогда и только тогда, когда выполняются следующие два условия: первое—для некоторого 0 5^/г 5^ v точка (/г, S„) является лестничной и S„g/, второе — —S„<0 при всех Первое условие включает только Хх, ...» Хп, второе—только Хп+х, Xv. Следовательно, эти два события независимы и поэтому . P{Mv6/} = a06v+ • • • Ч-аД» (5.Ю) ’) В силу элементарной оригинальной теоремы Таубера. См., например: Titchmarsh Е. С. Theory of Functions, 2nd ed., Oxford 1939, p. 10.
§ 6. Критерии возвратности 687 где ап = Р {Sx < Sn, . .., Sn_j < Sn, S„ &„ = P{N>n}. (5.11) Вероятности an появляются в левой части (4.1), и мы видели, что их преобразование равно [1—x(s, £)]-1. Производящая функ- ция последовательности {Ьп\ равна [1—т($)]/(1—s), где т опре- делено в (4.3). Так как правая часть (5.10) представляет собой свертку {ап} и {Ьп}, то произведение функций [1—%(s, £)]-1 и [1—x(s)]/(l—s) является преобразованием для /вероятностей Р{М„€/}, а соотношение (5.9) просто выражает этот факт. Мы уже отмечали, что показатели экспонент' в (5.8) и (5.9) регулярны при всех имеющих положительную мнимую часть. Поэтому, полагая £ = при X > 0, мы можем ввести преобразо- вание Лапласа ($п W = У е~Кх Un {dx} -; X J e~KxUn (x)dx. (5.12) о 0 Из монотонности последовательности максимумов Мп следует, что при фиксированном х последовательность {t/n(x)} убывает, и, следовательно, при фиксированном X преобразования Лапласа соп(й) образуют убывающую последовательность. Ввиду (5.9) при s —> 1 имеем 00 X (5.13) п=о и, используя последнюю часть тауберовой теоремы 5 из гл. XIII, 5, получаем соп(^)—>co(fZ). Отсюда вытекает сходимость Un—+U. ► § 6. КРИТЕРИИ ВОЗВРАТНОСТИ Материал этого параграфа не связан с предшествующей тео- рией; он посвящен методу, развитому Чжуном и Фуксом (1950) и позволяющему определить, является ли случайное блуждание возвратным или невозвратным. Несмотря на наличие указанных в гл. VI и XII критериев и методов, метод, основанный на ана- лизе Фурье, сохраняет и методологический, и исторический инте- рес. Кроме того, в настоящее время это единственный метод, применимый в многомерном случае. В дальнейшем F обозначает одномерное распределение с характеристической функцией ср(£) = = u^) + iv^). Определим при 0 < s < 1 конечную меру Us = 2 snFn* ~ (6 1) п = о В соответствии с теорией, развитой в гл. VI, 10, распределение F
688 Гл. XVIII. Применение методов Фурье к случайным блужданиям является невозвратным тогда и только тогда, когда для некото- рого открытого интервала /, содержащего нуль, U S{I} ограни- чено при s —> 1; в этом случае Us {/} ограничено для любого отк- рытого интервала I. Критерий. Распределение F будет невозвратным в том и только том случае, когда при некотором а > 0 интеграл п С 1 — su J (1—SW)24-S2y2 (6-2) остается ограниченным при стремлении s—>1 слева. (Мы увидим, что в противном случае интеграл стремится к ОО.) Доказательство, (i) Предположим, что интеграл (6.2) остает- ся ограниченным для некоторого фиксированного а > 0. Равен- ство Парсеваля (3.2) гл. XV, примененное к Fn* и треугольной плотности (см. формулу (4) в гЛ. XV, 2), дает 2 S (6-3) -со -а ' Умножая на вп и суммируя по п, получаем 4-со а 2 ( -~сй08/* Us{dx}^~ (1—1Ш—d£... = a2x2 51 1 а \ а ) 1—s<p (£) ~~а\ О “"а ) ' “(1—su)2+s2i>2 (б-4) (так как действительная часть <р—четная функция, а мнимая часть—нечетная). Пусть I означает интервал | х | < 2/а. При х СI подынтегральное выражение в крайнем левом интеграле (6.4) будет > 1/3, так что величина US{I} ограничена. Поэтому условия теоремы достаточны. (ii) Необходимость условия устанавливается на основе равен- ства Парсеваля с распределением, которое имеет характеристиче- скую функцию 1—Щ-при |£|<а (формула (5) в гл. XV, 2). При этом (6.4) заменяется соотношением а J (1 __и А и {dx} = - ( - —2 а (%. (6.5) J \ a j 3 1 1 nJ а£2 (1—su)2-|-s2y2 ъ у ' Для невозвратного распределения F левая часть остается огра- ниченной, так что интеграл (6.2) ограничен. В качестве применения критерия докажем лемму, результат
§ 6. Критерии возвратности 689 которой был получен другими методами в теореме 4 гл. VI, 10. Другие примеры см. в задачах 13—16. Лемма 1х). Вероятностное распределение с нулевым матема- тическим ожиданием является возвратным. Доказательство. Характеристическая функция дифференцируе- ма в нуле, и соответствующая производная равна нулю, следо- вательно, можно выбрать столь малое а, что 0^1—При 0^£<Я. Тогда 1 — su(Q^l—s + Используя неравенство 21 ху | ^х2 + у2, можно оценить интеграл в (6.2) снизу величиной 1с (1-s)^ _ 1 nrpf^ ________п 3 J (1— s)2+e2g2 зе^1 1—S бе* Правая часть может быть сделана как угодно большой, и поэто- му интеграл (6.2) стремится к оо. Переход к пределу, который включается в критерий, довольно сложен, поэтому весьма полезны приводимые ниже более простые достаточные условия. Следствие. Распределение вероятностей F возвратно, если для любого а > 0 а и невозвратно, если при некотором а > 0 а о Доказательство. Подынтегральное выражение в (6.2) уменьшится, если 1—su в числителе заменить на 1—и, a sv в знаменателе — на и. Тогда (6.6) следует из теоремы о монотонной сходимости. Аналогично подынтегральное выражение в (6.2) увеличится, если слагаемое s2v2 в знаменателе отбросить. Отсюда в силу теоремы о монотонной сходимости вытекает (6.7). Эти критерии практически без изменений переносятся на многомерный случай (отличие только в лом, что и и v будут функциями многих перемен- ных, а интегралы распространяются на шары с центрами в нуле). Таким об- разом, мы доказываем следующие критерии. Лемма 2. Невырожденное двумерное распределение с нулевыми математи- ческими ожиданиями и конечными дисперсиями является возвратным. Доказательство. Характеристическая функция в этом случае является дважды непрерывно дифференцируемой. Используя разложение в ряд Тейло- 3) Тот факт, что условие Е(Ху) = 0 влечет возвратность, был установлен Чжуном и Фуксом. Интересно отметить, что в 1950 г. эта задача доставляла серьезные затруднения и многие попытки решить ее закончились неудачей. Внимание к этой задаче было привлечено неожиданным открытием обманчиво «безобидного» случайного блуждания, в котором Р {S„ > z?/log п} -> 1. (См. 1; гл. Х,3, и задачу 15 в 1; гл. Х,8.) О родственных явлениях см. сноску к задаче 13 на стр. 691,
690 Гл. XVIII. Применение методов Фурье к случайным блужданиям ра, видим, что в некоторой окрестности нудя подынтегральное выражение в (6.6) > 6/(5?+5г) • Следовательно, интеграл, соответствующий (6.6), расхо- дится. ► Лемма 3. Каждое невырожденное трехмерное распределение невозвратно. Доказательство. Рассматривая разложение в ряд Тейлора функции cos (Xi5i+ «^252 + ^3) в некоторой окрестности нуля, можно показать, что для любой характеристической функции существует окрестность начала координат, в которой ?2, £з)^«(Й + Й + Й). Поэтому трехмерный аналог для (6.7) оценивается сверху интегралом от (51 + ^2 + £з)“Л распространенным по окрестности нуля, а этот интеграл в слу- чае трехмерного пространства сходится. § 7. ЗАДАЧИ 1. Распространите пример § 1 на случай несимметричного интервала —а, Ь. (Выведите два линейных уравнения для двух производящих функций, соответствующие двум границам. Явное решение затруднительно). Задачи 2—5 касаются симметричного случайного блуждания Бернулли, т. е. <р (5) = cos 5. Используются обозначения § 1. 2. Пусть А состоит из двух точек 0 и 1. Покажите элементарным путем, что 1 / <? е2 \ x(s’Os=T^7 те',г+те2,:) 1 — S и 3. Если в предыдущем примере поменять ролями А и А', то %(s, И Дайте вероятностное объяснение. 4. Пусть А состоит из одной точки 0. Тогда % зависит только от s и у будет суммой двух степенных рядов, расположенных по степеням е^ и соответственно. Используя эту информацию, найдите % и у непосредственно из (1,9). 5. Если Ах состоит из одной точки 0, то % = sqp и у=1. 6. Другое доказательство тождества (1,9). Покажите, что (в обозначе- ниях § 1) п рп*{1}= 2 ( Hb{dy}F*-to* {I—y} + Gn{/} (*) k=1 i а) прямыми вероятностными рассуждениями? б) по индукции. Покажите, что (*) равносильно (1,9)9
$ 7. Задачи 691 7. В случае (не обязательно симметричного) случайного блуждания Бер- нулли вальдовская аппроксимация из § 2 совпадает с точным решением. По- кажите, что (2.12) сводится к квадратному уравнению для т = б”\ которое приводит к решению, известному из 1; XIV, (4.11). В частности, Q (S) сов- падает, вообще говоря, с Uz с той лишь разницей, что последняя величина определялась для интервала 0, а, а не для —а, Ь, и для начальной точки г. 8. Пусть, как и в § 2, Gn{I} обозначает вероятность того, что S„g/czA и что все это время не было выхода из А = —а, Ь. Покажите, что если два распределения F и F# совпадают в интервале |х| < а-\-Ь, то они приводят к одним и тем же вероятностям Gn. Используя этот факт, а также метод уреза- ния, получите другое доказательство сходимости ряда (2.1) при некотором s > 1. 9. Случайные блуждания, в которых распределение F сосредоточено на конечном множестве целых чисел, рассматривались в примере 4, в) гл. XII. Покажите, что полученные там формулы содержат неявно факторизацию Ви- нера— Хопфа для 1—ср. 10. (Формула Хинчина—Поллачека.) Пусть F будет сверткой показатель- ного распределения с математическим ожиданием 1 /а, сосредоточенного на 0, оо, и распределения В, сосредоточенного на —оо, 0. Обозначим через Р и —b < 0 соответственно характеристическую функцию и математическое ожидание распределения В. Предположим, что математическое ожидание а""1 2— b распределения F положительно. Тогда а — \ а—/ \ 1 Замечание. Эта формула играет важную роль в теории очередей. Другие способы ее получения см. в примерах 5, а)—б) гл. XII и 2,6) гл. XIV. 11. Продолжение. Покажите, что при ab > 1 существует единственное положительное число % между 0 и а, такое, что ар (—ix) = a — к. Докажите, что %~(1, £) — -—jg—. Указание. Примените результат за- дачи 10 к сопряженному случайному блужданию с характеристической функ- цией а(р (£)= ср (£— гх). Вспомните, что %~(1, £) = а%“(1, ?— ix). [См. при- мер 4,6) гл. XII.] 12. Пусть Un = max [О, Sx, ..., Sn] и Vn = Stl-— Vn. Слегка изменяя рас- суждения, использованные при выводе (5.9), покажите, что двумерная харак- теристическая функция для пары (Un, Vn) равна коэффициенту при sn в х) £ J (еЪ* — l)F«*{dx} . О —оо Т=ГехР 132) . Допустим, что в некоторой окрестности нуля 11—(р (?) | < А«|?|. Тогда F возвратно, за исключением случая, когда оно имеет математическое J) Результат получен впервые аналитическим путем Спицером, Spitzer F., Trans. Amer. Math. Soc. 82 (1956), 323-—339. 2) Эта задача представляет теоретический интерес. Она применима, если <р имеет производную в нуле. Мы видели в гл. XVII, 2а, что это возможно даже в том случае, когда F не имеет математического ожидания, и что тем не менее слабый закон больших чисел применим в этом случае. Таким обра- зом, мы получаем примеры случайных блужданий, в которых при каждом достаточно большом п с очень большой вероятностью Sn > (1—s) nix при р > 0 и, однако же, нет сноса в оо: случайное блуждание возвратно»
692 Гл. XV111. Применение методов Фурье к случайным блужданиям а 1/& ожидание |х # 0. Указание. Интеграл (6.6) превосходит d'Q x2F {dx}. о -i/£ Подстановка £=1// и перемена порядка интегрирования показывают, что этот интеграл расходится (за исключением случая, когда существует р). 14. Используя критерий (6.7), покажите, что если при некотором р > 0 и 00 t /-1-Р J x2F{dx}-+ оо, то распределение F невозвратно х). 15. Распределение с характеристической функцией ср (£)=* = e~x ^’^j’cos (и! £) невозвратно, Указание. Используйте (6.7) и замену пе- ременных £==—/, 16. Асимметричное устойчивое распределение с показателем а=1 невозв- ратно, а распределение Коши возвратно. х) Отсюда видно, что при слабых условиях регулярности F невозвратно, если абсолютный момент какого-либо порядка р < 1 расходится. Затруднения, возникающие при отказе от условий регулярности, показаны в статье: Shepp L. A, Bull Amer. Math, Soc., 70 (1964), 540—542,
ГЛАВА XIX ГАРМОНИЧЕСКИЙ АНАЛИЗ В этой главе даны дополнения к изложенной в гл. XV тео- рии характеристических функций, а также даны применения гармонического анализа к случайным процессам и стохастическим интегралам. Обсуждение формулы суммирования Пуассона в § 5 практически не зависит от остального материала. Глава как це- лое не зависит от гл. XVI — XVIII. § 1. РАВЕНСТВО ПАРСЕВАЛЯ Пусть U—распределение вероятностей с характеристической функ- цией + CD ©(£) = J el^U\dx\. (1.1) - 00 Интегрируя это выражение по какому-либо другому распределе- нию F, получаем + оо +оо $ $ <p(x)t/{dx}, (1.2) — 00 — 00 где ф—характеристическая функция F. Это одна из форм равен- ства Парсеваля, из которого были выведены основные результа- ты гл. XV, 3. Удивительно, какое изобилие новой информации можно получить, переписывая равенство Парсеваля в эквивалент- ных формах и рассматривая специальные случаи. Этот метод, который мы постоянно будем использовать, можно проиллюстри- ровать простым примером (имеющим и самостоятельный интерес). Пример. Формула + 00 +<Ю J e-^(QF{dQ = $ <p(x)t/{a + dx} (1.3) — со —00 отличается от (1.2) только обозначениями. Рассмотрим частный случай, когда F—равномерное распределение на —/, t и ф (%) =з * Эта функция не превосходит по абсолютной величине единицы и стремится к нулю, при I—» оо при всех По
694 Гл. XIX. Гармонический анализ теореме об ограниченной сходимости получаем 1 р t/(a)—U (a—)= lim J е-'^со (g)d£. (1.4) Эта формула позволяет узнать, будет ли а точкой непрерывности, и, если а—атом, позволяет определить его массу. Наиболее ин- тересный результат получается применением (1.4) к симметризо- ванному распределению °t7 ^характеристической функцией |со|2. Если Pi, р2, ... суть массы атомов £7, то °C/ .име^т атом массы ^Pk в нуле (см. задачу 11 в гл. V, 12). Поэтому 1 р 27 $ (1.5) Эта формула показывает, в частности, что характеристические функции непрерывных распределений «в среднем» малы. Приведем теперь полезный и «гибкий» вариант формулы Пар- севаля (1.2). Пусть А и В—произвольные распределения вероят- ностей с характеристическими функциями ос и Р соответствен- но. Тогда w(s—t) A {ds} В {dt} = J а (x) (3 (х) U {dx}, (1.6) — 00 — 00 где P—величина, комплексно сопряженная с р. Справедливость (1.6) проверяется непосредственно интегрированием + 00 со (з—1)= J е‘ is~tix U {dx} (1.7) — 00 по Л и В. Может создаться обманчивое впечатление, что соотно- шение (1.6) является более общим, чем (1.2). На самом деле (1.6) есть специальный случай равенства Парсеваля (1.2), соот- ветствующий F = A^~B, где "В—распределение с характери- стической функцией р (т. е. “В(х) = 1—В(—х) во всех точках непрерывности). Действительно, F имеет характеристическую функцию ф = ос6, так что правые части (1.2) и (1.6) идентичны. Левые части отличаются лишь формой записи. Лучше всего это можно показать, вводя две независимые случайные величины X и Y с распределениями А и В соответственно. Тогда левая часть (1.6) представляет собою прямое определение математического ожидания Е(со(Х—Y)), а левая часть (1.2) выражает это мате- матическое ожидание в терминах распределения F разности X—Y. (Мы еще вернемся к формуле Парсеваля в § 7.)
§ 2. Положительно определенные функции 695 § 2. ПОЛОЖИТЕЛЬНО ОПРЕДЕЛЕННЫЕ ФУНКЦИИ В 1932 г. С. Бохнер доказал важную теорему, которая де- лает возможным описание класса характеристических функций по их «внутренним» свойствам. Путь рассуждений указывается сле- дующим простым критерием. Лемма 1. Пусть со—ограниченная непрерывная комплексно- значная функция, интегрируемая1) на —оо, оо. Определим и равенством + 00 a(x)=4Jr‘M)C (2.1) — 00 Для того чтобы функция со была характеристической, необходимо и достаточно, чтобы было со(0) = 1 и и(х)^0 при всех х. При этих условиях и является плотностью вероятности% соответст- вующей со. Доказательство. Теорема об обращении интеграла Фурье [гл. XV, (3.5)] показывает, что высказанные условия необходимы. Выберем теперь произвольную четную плотность f с интегрируе- мой характеристической функцией ф > 0. Умножим (2.1) на ф (tx)eiax и проинтегрируем по х. Применяя к паре /, ф формулу обраще- ния (3.5) гл. XV, получаем J и (х) ф (tx) eiax dx= J co (£)/ • (%•%) — 00 — 00 Правая часть представляет собой математическое ожидание со по отношению к некоторому распределению вероятностей и потому не превосходит максимума |со |. При а = 0 подынтегральное вы- ражение слева не отрицательно и стремится к и(х) при t —>0. Из ограниченности интеграла вытекает интегрируемость и. Пе- реходя в (2.2) к пределу при t —->0, получаем + 00 У и (х) eiax dx = ю (а) (2.3) — 00 (в левой части применяется теорема об ограниченной сходимости, в правой части распределение, по которому интегрируется со, сходится к распределению, сосредоточенному в точке а). Полагая а = 0, видим, что и—плотность вероятности, которой соответст- вует характеристическая функция со. >> Условие интегрируемости, появляющееся в лемме, выглядит более ограничительным, чем оно в действительности является, х) Как и всегда, это означает абсолютную интегрируемость,
696 Гл. XIX. Гармонический анализ В самом деле, по теореме непрерывности непрерывная функция о будет характеристической в том и только том случае, когда а)(£)е-е£2 есть характеристическая функция при каждом 8 > 0. Из леммы следует, что ограниченная и непрерывная функция с со (0) = 1 является характеристической тогда и только тогда, когда при всех х и 8 > 0 + 00 J e-^a^e-^dZ^O. (2.4) — 00 Этот критерий имеет совершенно общий характер, однако его трудно применять в частных случаях. К его недостаткам отно- сится и произвольный выбор «множителя сходимости» е~££2. По- этому мы сформулируем критерий в новой форме. Лемма 2. Ограниченная непрерывная функция со будет харак- теристической в том и только том случае, если со (0) = 1 и для любого распределения вероятностей А и всех х J е-^со(£) M{d£}>0, (2.5) — 00 где °Л — —распределение, полученное симметризацией. Доказательство, а) Необходимость. Пусть ос—характеристи- ческая функция А. Тогда °А имеет характеристическую функцию |ос|2, и необходимость (2.5) вытекает из равенства Парсеваля (1.3). б) Достаточность. Как показывает (2.4), условие (2.5) является достаточным уже в том случае, когда в качестве Л выбираются нормальные распределения с произвольными дисперсиями. Мы видели, что (2.5) можно переписать в виде (1.6) с В = А. В частности, если А сосредоточено в конечном числе точек /2, ..., tn и приписывает им массы рь р2, рп, то (2.5) при- нимает форму S a(tf- 1к)е-{х((гЧ)Р/Рк^0. (2.6) /, k Если это неравенство верно при любом выборе tj и то (2.5) выполняется для всех дискретных распределений с конеч- ным числом атомов. Так как каждое распределение может быть представлено как предел подобных дискретных распределений, условие (2.6) оказывается необходимым и достаточным. Обозначим z. = p.e~ тогда оно принимает вид S со(^—^)г/й>0. (2.7) /, k Для окончательной формулировки нашего критерия введем один часто используемый термин.
§ 3. Стационарные процессы 697 Определение. Комплекснозначная функциях) вещественного переменного t называется положительно определенной, если (2.7) выполняется при любом выборе вещественных чисел t±, ..., tn и комплексных чисел гх, гп. Теорема. (Бохнер.) Непрерывная функция со является характе- ристической функцией некоторого распределения вероятностей в том и только том случае, когда она положительно определена и- со (0) = 1. Доказательство. Мы показали раньше, что эти условия необ- ходимы и что они достаточны, если со ограничена. Доказатель- ство заканчивается ссылкой на следующую далее лемму, которая утверждает, что все положительно определенные функции огра- ничены. Лемма 3. Если со положительно определена, то со(0»0, | со (ОК со (0), (2.8) со (—0=^7?). (2.9) Доказательство. Полагая в (2.7) п — 2, /2 = 0, г2=1, ti = t, Zi = z, получаем со(0)[1 + |г|2] + со(0г + со(—(2.10) При z = 0 видим, что со(0)>0. Рассматривая (2.10) при поло- жительных г, получаем (2.9), откуда следует, что со = 0, если со(0) = 0. Наконец, если со (0)^=0 и z = — со (£)/со (0), (2.10) сво- дится к |со(0|2<со2(0). § 3. СТАЦИОНАРНЫЕ ПРОЦЕССЫ Важные следствия имеет применение последней теоремы к слу- чайным процессам со стационарными ковариациями. Под этим понимается семейство случайных величин {XJ, определенных на некотором пространстве при всех — оо < t < оо и таких, что Cov(X5+f, Х,) = р(0 (3.1) при любых s. До сих пор мы рассматривали только действитель- ные случайные величины, но теперь мы введем комплексные слу- чайные величины, что сделает обозначения более простыми и более симметричными. Комплексная случайная величина—это просто пара действительных случайных величин, записанная в форме X=U-H’V. Мы не делаем никаких предположений от- носительно совместного распределения величин U и V. Случайная х) Об «обобщенных» положительно определенных функциях (эквивалентных распределениям в смысле Л, Шварца) в произвольных пространствах см, Гельфанд и Виленкин (1964).
698 Гл. XIX. Гармонический анализ величина Х = И —/V называется комплексно сопряженной с X, и произведение XX играет здесь ту же роль, что и X* 2 для ве- щественных случайных величин. Отсюда некоторая асимметрия в определении дисперсии и ковариации. Определение. Для комплексных случайных величин с E(X) = E(Y) = 0 определим Cov(X, Y) = E(XY). (3.2) Тогда Var (Х) = Е(|Х |2)^0, a Cov(Y, X) является числом, комплексно сопряженным с Cov(X, Y). Теорема. Пусть {XJ—такое семейство случайных величин, что функция р(0 = Е(Х/+Х) (3.3) не зависит от s и непрерывна1). Тогда р положительно опреде- лена и потому р(/) = J (3.4) - сю где R—мера на вещественной прямой, приписывающая всей пря- мой массу р(0). Если случайные величины Xt действительны, то мера R сим- метрична и р(£) = J cos МЛ? {Л}. (3.5) — СО Доказательство. Выберем произвольно точки tt, ..., tn и комплексные числа ..., гп. Тогда Зр (tj-t,) Z/zk = 2 Е (X9XZft) Zfr = = F (2X(/2/X.kzk) = E (12 X/ .z, I*) > 0 (3.6) и (3.4) вытекает из критерия предшествующего параграфа. Если р действительно, то соотношение (3.4) выполняется также и для «отраженной» меры, получаемой заменой х на —х. По теореме единственности R симметрична. ► Меру 7? называют спектральной мерой2) случайного процесса. Множество ее точек роста называют спектром {XJ. В большин- стве применений случайные величины центрированы так, что Е (Xf) = 0. В этом случае р (/) = Cov (Xt+iS, Х^). По этой причине р х) Непрерывность существенна: для взаимно независимых случайных ве- личин Xf мы имеем р (/) — 0 для всех t 0; эта функция не допускает пред- ставления (3.4) (см. задачу 2). 2) В теории связи говорят также о «спектре мощностей».
§ 3. Стационарные процессы 699 называют обычно ковариационной функцией процесса. Центриро- вание Xt никак не влияет на те свойства процесса, которые мы будем изучать. Примеры, а) Пусть Z*, Zn—попарно некоррелированные случайные величины с нулевыми математическими ожиданиями и дисперсиями of, ..., о*. Положим Xt = Z^V+...+z/M, (3.7) где числа А*, .Кп действительны. Тогда = + (3.8) так что мера R сосредоточена в п точках Af, ..., Zn. Мы увидим позже, что общий стационарный процесс можно трактовать как предельный случай процессов, указанных в этом примере. Если процесс (3.7)—действительный, его можно представить в виде Xf = их cos . + Ur cos А/ + Vj sin 4-... 4- Nr sin Krt, (3.9) где Uy и Vy.—действительные попарно не коррелированные слу- чайные величины и E(U?) = E(V?) = 4 Типичный пример см. в (7.23) гл. III. Соответствующие ковариа- ции равны p(0 = °ricos%1it4- * • • 4-°>cosAr/. б) Марковские процессы. Если случайные величины Xt нормальны и процесс марковский, то p(/) = e-flHI ^см> (8.14) гл. III]. Спект- ральная мера пропорциональна распределению Коши. в) Пусть Xt = Zeity, где Y hZ — независимые действительные случайные величины и E(Z) = 0. Тогда p(0 = E(ZZ)E(et7y). Это равенство показывает, что спектральная мера R совпадает с распределением вероятностей Y, умноженным на E(ZZ). Теоретически не так важно, описывается ли процесс в терми- нах ковариационной функции р(/) или эквивалентным образом в терминах спектральной меры 7?. Однако с практической точки зрения описание в терминах спектральной меры проще и пред- почтительнее. В применениях к теории связи спектральное опи- сание имеет технические преимущества при проектировании при- боров и измерениях, но мы не будем задерживаться на этом об- стоятельстве. Более важным преимуществом с нашей точки зрения является то, что линейные операции на Xt (часто называемые «фильтрами») лучше описываются в терминах R, чем в терминах р. Пример, г) Линейные операции. Начнем с простейшего при*
700 Гл. XIX. Гармонический анализ мера случайных величин Y^, определяемых равенством Yf = £^-V (З.Ю) где ск и %к—постоянные (%к действительны) и сумма содержит конечное число членов. Ковариационная функция для опре- деляется двойной суммой py(0=ScAp(^—т/.+т*)' (зп) Подставляя в (3.4), находим 00 Py(0= S - 00 Отсюда следует, что спектральная мера задается равенством 7?Y{dM = l2^-tV|2/? {dty. (3.12) В отличие от (3.11) последнее соотношение допускает интуитив- ную интерпретацию: составляющая 7?, соответствующая «частоте» X, умножается на «частотную характеристику фильтра» /(X), определяемую данным преобразованием (3.10). Этот пример имеет значительно более широкую область при- менимости, чем это может показаться на первый взгляд. Причина этого в том, что интегралы и производные суть пределы сумм вида (3.10), и потому аналогичное замечание применимо и к ним. Пусть, например, Xt—сигнал, подаваемый на вход стандартной электрической цепи. Тогда выходной сигнал может быть пред- ставлен в виде некоторого интеграла, содержащего Хр и спектраль- ная мера опять может быть выражена через R и частотную характеристику. Последняя зависит от строения цепи. Поэтому наш результат может быть использован в двух направлениях: именно чтобы описать процесс на выходе и чтобы строить цепи, выходной сигнал которых обладает заданными свойствами. >> Перейдем к теореме, обратной к доказанной выше. Мы пока- жем, что для любой меры R на числовой прямой найдется ста- ционарный процесс {XJ со спектральной мерой R. Поскольку преобразование Xt —>aXt переводит R в a*R, мы можем, не огра- ничивая общности, считать R вероятностной мерой. Возьмем в качестве выборочного пространства Х-ось вместе с мерой R и обозначим .Xt случайную величину Xt(X) = eitK. Тогда + 00 р(0=Е(Х/+Х)= 5 e^R {Л}, (3.13) — 00 и поэтому спектральная мера нашего процесса равна R. Мы по’ строили, таким образом, модель стационарного процесса с задан- ной спектральной мерой. Приятной неожиданностью является тот факт, что в подобной модели возможно выбрать в качестве
§ 4. Ряды Фурье 701 выборочного пространства действительную прямую. Мы вернемся к этой модели в § 8. Легко видоизменить модель так, чтобы получить случайные величины с нулевыми математическими ожиданиями. Пусть Y—случайная величина, не зависящая от всех X/ и принимающая значения ± 1 с вероятностью по У2 каждое. Положим X;=YXf. Тогда Е (Х^) = 0 и Е (X/+sXs) = E (Y2) Е (Xf+SXS). Таким образом, {X/} является стационарным процессом с нулевым математи- ческим ожиданием и ковариационной функцией (3.13). § 4. РЯДЫ ФУРЬЕ Арифметическое распределение, приписывающее точке п ве- роятность фп, имеет периодическую, с периодом 2л, характери- стическую функцию 'P(P = fwlX. (4-1) — 00 Вероятности <prt выражаются с помощью формулы обращения л = i j (4.2) -л которая легко выводится из (4.1) [см. гл. XV, (3.14)]. .Возьмем теперь произвольную функцию ср с периодом 2л и определим числа ф^ с помощью (4.2). Задача состоит в том, чтобы узнать, является ли ср характеристической функцией, т. е. задают ли числа <рп распределение вероятностей. Метод опирается на исследование семейства функций /г, определенных при 0 < г < 1 равенством W = S (4.3) — 00 Наши рассуждения, несмотря на их простоту, приведут к важ- ным результатам относительно рядов Фурье и характеристических функций распределений, сосредоточенных на конечных интервалах. В последующем удобнее рассматривать основной интервал — л, л как круг (т. е. отождествить точки л и —л). Для интегрируемой Ф число фй будет называться k-м коэффициентом Фурье функции у. Ряд (4.1) называют «.формальным рядом Фурье», соответствующим ф, Он не обязан сходиться, но так как последовательность {ф,(} ограничена, то ряд (4.3) сходится к непрерывной (и, более того, дифференцируемой) функции fr. При г —* 1 функции fr могут стремиться к пределу ф, даже если ряд (4.1) расходится. В этом случае говорят, что ряд «суммируем по Абелю» к функции ф. Примеры, а) Пусть ф„==1 для /г = 0, 1, 2, ..., ноф„ = 0для
702 Гл. XIX. Гармонический анализ п<0- Каждый член ряда в (4.1) равен по абсолютной величине единице, и поэтому ряд может сходиться, но не при любом значении £. С другой стороны, правая часть (4.3) есть сумма членов геометрической прогрессии, которая сходится к <4'4’ Предел при г —> 1 существует во всех точках, кроме £ = 0. б) Важный частный случай (4.3) получается, когда <р = при всех т + 00 Pr(t)=-^£Sn'eM. (4-5) — 00 Сумма членов с я>0 указана в (4.4). По соображениям симмет- рии получаем 2яргт = т-Д?+_±__1 (4.6) ИЛИ 1 1_г2 Pr W = 14-г2—2г cos /' (4<7) Эта функция постоянно используется в теории гармонических функций [где pr(t—£) называют «ядром Пуассона»]. Для удобства ссылок мы сформулируем ее основное свойство в следующей лемме. Лемма. При фиксированном 0 < г < 1 функция рг есть плот-, ность некоторого распределения Рг на единичной окружности. При г—>1 последнее сходится к распределению вероятностей, сосредоточенному в точке / = 0. Доказательство. Ясно, что рг>0. Из (4.5) видно, что инте- грал от рг по —л, л равен единице, так как при п^= 0 интеграл от eint равен нулю. При б^/^л знаменатель в (4.7) больше некоторого положительного числа. При г—>1 в каждом открытом интервале, не содержащем t = 0, pr (t) ограниченно сходится к нулю. Следовательно, Рг имеет предельное распределение, сосредоточен- ное в точке / = 0. Теорема 1. Непрерывная функция ср, имеющая период 2л, будет характеристической тогда и только тогда, когда ее ко- эффициенты Фурье (4.2) неотрицательны и ср(0)=1. Если эти условия выполнены, ряд Фурье (4.1) равномерно сходится к ср. [Иными словами, формальный ряд Фурье с неотрицательными коэффициентами <рл из (4.2) сходится к непрерывной функции
§ 4. Ряды Фурье 703 в том и только том случае, когда 00 • Последнее условие влечет за собой (4.1).] Доказательство. В силу (4.2) и (4.5) функция fr из (4.3) мо- жет быть представлена в виде л Ш= 5 (4.8) -Л Справа стоит свертка <р и распределения вероятностей Рг, поэтому при г —> 1 ш->ф©. (4.9) Далее, если т—верхняя грань | <р |, то в силу (4.8) fr(O)=S (4.10) - 00 1 Так как члены последнего ряда неотрицательны, то переходом к пределу при г—>1 получаем неравенство Поэтому ряд сходится равномерно и из (4.3) с очевидностью вы- текает, что fr (£) сходится к его сумме. Таким образом, (4.1) верно. Доказательство закончено. ► Заметим, что (4.9)—прямое следствие свойств свертки и не зависит от предположения о неотрицательности коэффициентов фя. То есть нами попутно доказана Теорема 21). Если ср непрерывна и имеет период 2л, то (4.9) выполняется равномерно относительно £. (Обобщение на случай разрывных функций см. в следствии 2 и задачах 6—8). Следствие 1. (Фейер.) Любая непрерывная периодическая функ- ция ф может быть представлена как предел равномерно сходящейся Последовательности тригонометрических многочленов. Другими словами, для любого 8 > 0 найдутся числа a_N, ...taNf такие, что N Ф(£)~ 2 апе1п^ n=-N (4.П) < в *) Теорема может быть сформулирована по-другому: ряд Фурье непрерыв- ной периодической функции ф суммируем по Абелю к ф. Теорема (и метод до- казательства) легко распространяется па другие методы суммирования. Указанное явление было впервые замечено Л. Фейером (для суммирования по Чезаро, см. задачу 9) в то время, когда расходящиеся ряды все еще пред- ставлялись чем-то таинственным. Открытие Фейера было сенсационным, и по историческим причинам в учебниках до сих пор употребляют суммирование по Чезаро, хотя метод Абеля более удобен и делает доказательства едино- образными,
704 Гл. XIX. Гармонический анализ при всех £. Доказательство. Для произвольного N и 0 < г < 1 N ф(С)— 5 <Vl 'eini п = — N <|ф(£)-Ш1+ S ш-нч (4.12) Мы вправе выбрать г настолько близким к 1, чтобы первый член справа был меньше 8/2 для всех £. После этого можно выбрать N столь большим, чтобы сумма последнего ряда в (4.12) была меньше 8/2 Тогда (4.11) выполнено с ап = фпг1“!. ► Полноты ради укажем следующий результат, который факти- чески содержится в лемме 1 § 6. Следствие 2. Две интегрируемые периодические функции с оди- наковыми коэффициентами Фурье могут отличаться друг от друга только на множестве меры нуль (т. е. неопределенные интегралы совпадают). Доказательство. Для интегрируемой периодической функции ф с коэффициентами Фурье фЛ положим X Ф(х) = J [<р(0 — ф0]<й. (4.13) -Л Эта функция Ф непрерывна и периодична, и интегрирование по частям показывает, что при п=^0 ее n-й коэффициент Фурье равен —iqn/n- Соотношения (4.9) и (4.3) вместе показывают, что непрерывная функция ср однозначно определяется своими коэффициентами Фурье фи. Поэтому коэффициенты фп при п=^=0 определяют ф с точностью до аддитивной постоянной. Отсюда следует, что коэф- фициенты Фурье произвольной интегрируемой функции ф опреде- ляют интеграл Ф и, следовательно, ф однозначно определяется с точностью до значений на множестве меры нуль. ► § 5*). ФОРМУЛА СУММИРОВАНИЯ ПУАССОНА В этом параграфе будем считать, что характеристическая функ- ция ф такова, что | ф | интегрируема на всей прямой. Из формулы обращения для интеграла Фурье (формула (3.5) из гл. XV) вы- текает существование непрерывной плотности f. По теореме Ри- мана—Лебега (лемма 3 гл. XV, 4) как ф, так и f обращаются в нуль на бесконечности. В случае когда ф стремится к нулю достаточно быстро, можно строить периодические функции спо- собом, который заключается, грубо говоря, в «наматывании £-оси» *) Здесь рассматриваются важные, но специальные вопросы. Содержание параграфа не используется в дальнейшем и не зависит от предыдущих пара- графов, кроме того, что здесь используется теорема 1 из § 4.
§ 5. Формула суммирования Пуассона 705 на окружность длины 2%. Новая функция может быть представ- лена в виде S Ф(;+2а) (5.1) — со (+ оо сумма бесконечного в обе стороны ряда S ak определяется /? = — 00 N \ здесь как предел Ит 2 ak, если он существует ). В случае / сходимости ряда функция ф является, очевидно, периодической с периодом 2%. В своем простейшем вероятностном варианте фор- мула суммирования Пуассона утверждает, что если ф непрерывна, т° ФОФ(О) есть характеристическая функция арифметического распределения, приписывающего точкам пя/К массы, пропорцио- нальные f (плД) (п = 0, ±1, ±2, На первый взгляд этот результат может показаться только забавным, однако он включает в себя известную теорему теории передачи сообщений и много частных случаев, представляющих несомненный интерес. Формула суммирования Пуассона1). Предположим, что харак- теристическая функция ср абсолютно интегрируема и, следова- тельно, соответствующая плотность вероятности f непрерывна. Тогда 00 00 Ф (£ + 2Н) = - J У f (пл Д) ein (5.2) — 00 — 00 если ряд в левой части сходится к непрерывной функции ф. При £ = 0 отсюда следует, что 00 2ф(2^А.) = (л/А.)2/(/ш/Х) (5.3) — 00 есть положительное число, скажем А, и поэтому ф(£)/Л—харак- теристическая функция. Доказательство. Достаточно показать, что правая часть (5.2) представляет собой формальный ряд Фурье периодической функ- ции ф, стоящей слева в (5.2), т. е. что к ’ f ^(£)е-^(Я/МЕ^=«^(пяД). (5.4) ^/v /V Действительно, коэффициенты Фурье (5.4) неотрицательны и функ- х) Тождество (5.2) обычно устанавливается при различных дополнительных условиях. Наша простая формулировка, так же как и очень простое доказа- тельство, стала возможна благодаря систематическому использованию положи- тельности Л По поводу других вариантов теоремы и их доказательств см. задачи 12 и 13» 23 № 249
706 Гл. XIX. Гармонический анализ ция ф по предположению непрерывна; таким образом, по теореме 1 предыдущего параграфа ряд Фурье сходится к ф, и поэтому (5.2) справедливо. Вклад &-го члена ряда (5.1) для ф в левую часть (5.4) равен % (2£+1)Х У ф(^ + 2^)е”1’Л(л/Х)^^ = -^- У cp(s)e”Zn^/X)sds, (5.5) -Л, (2k — 1) к и его абсолютная величина меньше чем (2Л+1)% $ |<p(s)|ds. (5.6) (2k — 1) К Интервалы (2k—1) А,< s^l(2k-\- 1)А, попарно не пересекаются и покрывают всю действительную прямую. Поэтому в сумме ве- личины (5.6) дают интеграл от | <р |, который конечен. Суммируя (5.5) по —N < К <N и устремляя N—>оо, получаем в силу теоремы о мажорированной сходимости X оо 4г f W)e-z"(,lA>£^ = 4r f (p(s)e-in<^sds. (5.7) — Z, -co По формуле обращения для интегралов Фурье правая часть (5.7) равна (лД)/ (плД). Теорема доказана. ► В наиболее интересном частном случае функция ф тождественно равна нулю при |£|^я, где а < X. Ряд (5.1) сводится в этом случае к единственному слагаемому, и ф представляет собой пе- риодическое продолжение (р с периодом 2К. Соотношение (5.2) выполняется. Левая часть (5.3) равна 1, откуда следует, что ф является характеристической функцией некоторого распределения вероятностей. Таким образом, справедливо Следствие. Если характеристическая функция равна нулю при | £ | а, то все ее периодические продолжения с периодом 2Х > 2а тоже являются характеристическими функциями. Это утвержде- ние в действительности несколько сильнее1) приводимой ниже теоремы 2 (известной под названием «sampling theorem»), которая обычно присутствует в трактатах по теории передачи сообщений и приписывается то Найквисту, то Шеннону2). Теорема 2. («Sampling theorem».) Допустим, что плотность вероятности f имеет характеристическую функцию, равную нулю х) Обычно дополнительно вводятся ненужные условия. Это вызвано тем, что доказательства опираются на общую теорию Фурье, которая пренебрегает в отличие от теории вероятностей свойством положительности 2) А также В. А, Котельниковуs—Прим, перев.
§ 5. Формула суммирования Пуассона 707 вне —а, а. Тогда f однозначно определяется1) по значениям у / (я т) П?и ЛН)б°м фиксированном X > a (n = O, ± 1, ...). Эти значения индуцируют распределение вероятностей с характери- стической функцией, которая является периодическим продолже- нием ф с периодом 2Х. Примеры, а) Рассмотрим плотность f(x) = (l—cosx)/jix2 с ха- рактеристической функцией ф (£) = 1 — | £ | для | £ | 1 и ф (£) = О для |£|>1. При А,= 1 и £=1, учитывая, что f (0) = 1/(2л), по- лучаем из (5.3) 00 "2 л? X (2v + I)2 = 1 v=0 v r 7 Периодическое продолжение ф с периодом 2Х = 2 изображено на рис. 2 в гл. XV, 2, а продолжение с периодом К > 2 на рис. 3 там же. б) Простой пример к (5.2) указывается в задаче 11. ► Как часто бывает в подобных ситуациях, формулу (5.2) можно переписать в форме, которая кажется более общей. В самом деле, применяя (5.2) к плотности f(x-\-s), мы получаем другую запись формулы суммирования Пуассона: У <р '£ + 2J&) е-is +m> = £ у f ( п 4 + s ) ein е. (5.9) — оо — оо Примеры, в) Для нормальной плотности и £ = % выводим из (5.9) gе- Т <2*+1)2 vcos(2k +1) Xs = £ 0* « ((2k^i)n + s). (5.10) — a> — oo x) Явное выражение для f (x) может быть получено следующим путем. При имеем <р(£)=ф(£), и, следовательно, по формуле обращения для интегралов Фурье + 00 J у (£) е-ixt dt. — 00 Далее используется то, что ф определяется правой частью (5.2), и, интегри- руя, получаем окончательную формулу: /(х) ' "V С л\ (-1)" 2тс X J \ X / X \ А» / х щгс/А, — оо -Л. — ОО Это выражение, имеющее много приложений, иногда называется «кардиналь- ным рядом». [См. теорему 16 в книге: Whittaker J. М., Interpolator function theory, Cambridge Tracts. 33, 1935. Многомерный аналог см.: Petersen D. P., Middleton D., Information and Control, 5 (1962), 279—323.] 23*
708 Гл. XIX. Гармонический анализ Это—знаменитая формула теории тэта-функций, которая была доказана более элементарным методом в гл. X, 5. В самом деле, производя дифференцирование по х в выражениях (5.8) и (5.9) гл. X, мы видим, что равенство этих выражений равносильно (5.10) с К = (п/а) J/” i и s = x/y t. г) Для плотности f (х) ~ л"1 (1 Ч-х2)”1 с характеристической функцией cp(g) = ^-,N мы получаем из (5.2), полагая £ = 0, е% _[_ е- Л _ * X ||v — 2^ X2+n2jc2’ v 7 /7= — oo Это не что иное, как разложение гиперболического котангенса на простейшие дроби. д) Плотности на окружности длины 2л можно получить, «наматывая» действительную ось на окружность, как это объяс- нено в гл. II, 8. При этом плотности f на прямой ставится в соответствие плотность на окружности, задаваемая рядом 2/ (2лп + s). Из (5.9) при £ = 0 мы получаем новое представление этой плотности в терминах первоначальной характеристической функции. В частном случае f = и мы получаем аналог нормальной плотности на единичной окружности в виде тЬг £ехр (- 4- <s+2wr>2)=i £ е~ ~n!t cos ns- <5-12> — 00 — CO Представление справа ясно показывает, что свертка двух нор- мальных плотностей с параметрами tt и t2 есть нормальная плот- ность с параметром t1 + t2. ► § 6. ПОЛОЖИТЕЛЬНО ОПРЕДЕЛЕННЫЕ ПОСЛЕДОВАТЕЛЬНОСТИ Этот параграф посвящен распределениям вероятностей на ко- нечном интервале; для определенности будем считать, что длина интервала равна 2л. Как и в § 4, мы отождествим две концевые точки интервала и будем интерпретировать интервал как круг единичного радиуса. Таким образом мы рассматриваем F как рас- пределение вероятностей на окружности единичного радиуса и определяем коэффициенты Фурье распределения F равенством л ±i. •••• (6.1) -л Отметим, что <pft = <p_fe. Покажем, что распределение F однозначно восстанавливается по коэффициентам <pft. Отвлекаясь от тривиаль- ного изменения масштаба, мы видим, что наше утверждение экви- валентно следующему: распределение, сосредоточенное на —X, X,
§ 6. Положительно определенные последовательности 709 однозначно определяется по значениям ср (пл/Л), принимаемым характеристической функцией в точках с абсциссами, кратными л/к. Это утверждение двойственно теореме 2 предыдущего параграфа, в соответствии с которой характеристическая функция, равная нулю вне — X, Л, однозначно определяется по значениям f (пл/к) соответствующей плотности. Теорема 1. Распределение F на окружности однозначно опре- деляется своими коэффициентами Фурье <рЛ. Доказательство. Как и в (4.3), положим при 0^r< 1 М0=2ф„'Г1',|-Л (6.2) — QO Вычисления, подобные тем, которые привели к (4.8), показывают, что теперь ЭХ № = 5 Prk-t)F{dt\, (6.3) — л где рг—ядро Пуассона, определенное в (4.7). Мы знаем, что рг является плотностью вероятности, и мы обозначим через рг соответствующее распределение. Таким образом, fr есть плотность свертки Рг ★ Т7, которая сходится к F при г —* 1. Поэтому F вос- станавливается по fr. ► Лемма 1. Пусть {^ — произвольная ограниченная последова- тельность комплексных чисел. Для того чтобы на окружности существовала мера F с коэффициентами Фурье <рп, необходимо и достаточно, чтобы при каждом г < 1 функция fr, определяемая формулой (6.2), была неотрицательной. Доказательство. Необходимость, очевидно, следует из (6.3) и строгой положительности z Умножая теперь (6.2) на e~ik< и интегрируя, получаем л = i (6.4) -л Полагая fe = 0, видим, что ср0 > 0. Не ограничивая общности, допустим, что ф0 = 1/(2л). Тогда fr есть плотность некоторого распределения Fr на окружности и (6.4) показывает, что есть k-й коэффициент Фурье Fr. По теореме о выборе найдется такая последовательность значений г—> 1, что Fr сходятся к не- которому распределению F. Из (6.4) вытекает, очевидно, что числа ср* удовлетворяют (6.1). Доказательство закончено. ► Отметим, что эта лемма сильнее, чем следствие 2 из § 4. Поступая так же, как и в § 2, мы установим аналог теоремы Бохнера (принадлежащий Гер гл отцу).
710 Гл. XIX. Гармонический анализ Определение. Последовательность {ф^} называется положи- тельно определенной, если для любого конечного набора комплекс- ных чисел гх, ..zn 5 > 0. (6.5) i, k Лемма 2. Если последовательность {фп} положительно опреде- лена, то ф0 0 и I Фи I Фо- Доказательство. Применимо доказательство леммы 3 из § 2 (см. также задачу 14). Теорема 2. Последовательность {фп} представляет собой после- довательность коэффициентов Фурье некоторой меры F на окруж- ности в том и только том случае, когда она положительно опре- делена. Доказательство, а) Простые вычисления показывают, что для Фа, задаваемых (6.1), левая часть (6.5) равна интегралу по мере F от Поэтому условие (6.5) необходимо. б) Для доказательства достаточности положим zk = rkeikt при и ?/г = 0 при &<0. При такой последовательности левая часть (6.5) принимает вид S S ^j-krJ+kei (/“Л) f = 2 qneint 5 ^n^+2k = j = 0 k=Q n=-<x> /г=0 = (1—r2)"1 S <p„r'” (6.6) «=—00 и по определению (6.2) последняя сумма равна Хотя нера- венство (6.5) постулировалось только для конечных наборов {zn}, простой предельный переход показывает, что оно справедливо также и для нашей бесконечной последовательности. Таким образом мы доказали, что fr (/) 0. В силу леммы 1 отсюда следует, что Фл действительно являются коэффициентами Фурье некоторой меры, сосредоточенной на единичной окружности. ► Используя этот критерий, получаем аналог теоремы § 3. Теорема 3. Пусть {Хп}—последовательность случайных вели- чин, заданных на некотором вероятностном пространстве, и пусть p„ = E(Xn+vXv) (6.7/ не зависит от v. Тогда существует и притом только одна мера Л ।----------------------- на окружности —л, л, такая, что числа р„ суть ее коэффици- енты Фурье.
§ 7. LP-теория 711 Доказательство. Очевидно, 2 = V Е (ХАХЛ) = Е (| 2 Ъ*, 12)> (6.8) т. е. последовательность {р„} положительно определена. ► Обратное утверждение также верно: какова бы ни была мера на окружности, найдется такая последовательность {Хп}, что ри из (6.7) будут ее коэффициентами Фурье. Это можно было бы увидеть из построения в конце § 3, но мы еще вернемся к этому вопросу в § 8. Примеры, а) Пусть Хп—действительные независимые одинаково распределенные случайные величины с E(XJ — ц и Var (XJ = о2. Тогда р0 = о2 + ц2 и = jll2 для всех Спектральная мера представляет собой сумму вырожденной в нуле меры, имеющей массу ц2, и равномерного распределения с плотностью о2/(2л). б) Из построения § 4 видно, что плотности, определенной при фиксированных г<1 и 0 как pr(t — 0), соответствуют коэффици- енты Фурье рл = г1 п ^einQ. в) Марковские процессы, В гл. III, 8, было показано, что нор- мальная стационарная марковская последовательность имеет ковариации вида = r\п 1 с 0 г 1. Сходные рассуждения показывают, что ковариации произвольной комплексной стацио- нарной марковской последовательности имеют вид r|n|ein0. При г <1 спектральная мера имеет плотность pr(t—0), а при г = 1 она сосредоточена в точке 0. § 7. £2-ТЕОРИЯ Для целей теории вероятностей мы ввели характеристические функции, определив их как некоторые преобразования мер. Однако в равной степени естественны и другие подходы к гар- моническому анализу. В частности, возможно ввести преобразо- вания Фурье для функций (а не для мер!). Формула обращения интегралов Фурье делает правдоподобным предположение о том, что на этом пути можно достичь большей симметрии. Оказы- вается, что простота и красота теории становятся наибольшими, когда рассматриваются лишь функции с интегрируемым квадра- том. ?Аы разберем сейчас этот случай. Он интересен и сам по себе, и по тем обширным применениям, которые он находит в теории случайных процессов. Определим норму ||и||^0 комплекснозначной функции и действительного аргумента х равенством + 00 IM2 = j fu(x)l2dx. (7.1) — 00 Две функции, отличающиеся только на множестве меры нуль,
712 Гл. XIX. Гармонический анализ мы будем рассматривать как идентичные (другими словами, мы будем фактически иметь дело с классами эквивалентности, но присоединимся к обычному и безвредному неправильному слово- употреблению). При этом соглашении ||и|| = 0 тогда и только тогда, когда и = 0. Класс всех функций с конечной нормой обо- значим Л2. Расстояние между и и v из L2 определяется как ||и—а||. При таком определении Z? становится метрическим про- странством, и последовательность функций ult из L2 сходится в этой метрике тогда и только тогда, когда [ип — и\\—>0. Эта схо- димость* 1) будет обозначаться символами и=Л. i. ш. ип или i. m. Un—>U. Эту сходимость называют «сходимостью в среднем квадратич- ном». {ип} называют последовательностью Коши, если и только если 11«л~М —0 при «» т-^оо. Отметим без доказательства, что метрическое пространство L2 полно в том смысле, что каждая последовательность Коши {ип} имеет единственный предел и £ L2. Примеры, а) Функция и из L2 интегрируема на любом конеч- ном интервале, так как | и (х) | < | и (х) |2 + 1 при всех значениях х. Это утверждение перестает быть верным в случае бесконечных интервалов. Действительно, функция (l+l*!)"1 принадлежит Л2, но не является интегрируемой. б) Любая ограниченная интегрируемая функция’принадлежит А2, поскольку неравенство | и | М влечет неравенство | и |2^Л4 | и |. Это неверно в случае неограниченных функций: функция %"1/2 интегрируема на отрезке 0, 1, но не интегрируема с квадратом. Скалярное (внутреннее) произведение (и, у) двух функций и и v из L2 определяется равенством + 00 (и, V)— J u(x)v(x)dx. (7.2) — 00 Оно существует для любых двух функций из L2, так как по не- равенству Шварца 00 J | uu|dxO|M||-||y||. (7.3) — 00 I. m. 1) Поточечная сходимость ип к пределу v не влечет ип—>v [см. при- мер 2, д) гл. IV]. Однако если известно, что и— 1. i. m. ип существует, то и~и. В самом деле, по лемме Фату + <30 +00 f | и (х) — о (х) |2 dx^ lim | и (х) — ип (х) |2dx = 0a
$ 7. L2-теория 713 В частности, (и, u)==||u||a. При таком определении скалярного произведения L2 становится гильбертовым пространством. Ана- логия между скалярным произведением (7.2) и ковариацией двух случайных величин с нулевыми математическими ожиданиями оче- видна и позже будет нами использована. После этих предварительных замечаний перейдем к нашей основной задаче—определению преобразований вида + 00 «(С) = j и (*) е££л dx. (7.4) — 00 В случае если и—плотность вероятности, и лишь множителем К2л отличается от характеристической функции. Чтобы избежать недоразумений, назовем и преобразованием Планшереля функции и. Определение (7.4) применимо только к интегрируемым функциям, однако мы расширим область определения и до всего простран- ства L2. Следующие примеры должны облегчить понимание про- цедуры и природы обобщенного преобразования. Примеры, в) Поскольку любая функция и из L2 интегрируема на любом конечном интервале, можно определить урезанные пре- образования п и™ (□ = f u(x)e^xdx. у J —п Заметим, что //(ZI) есть истинное преобразование Планшереля функции и{п\ которая определяется как и{п} (х) = и (х) при |х|<п и и(/г)(%) = 0 при всех остальных х. При /г—>оо после- довательность и{п} (£) не обязана сходиться ни при каком фикси- рованном однако мы покажем, что является последова- тельностью Коши, и, следовательно, существует функция и из Л2, такая, что w=;l.i.m. и(л). Эту функцию и следует определить как преобразование Планшереля функции и, если даже интеграл в (7.4) не сходится. Конкретный вид урезания не играет роли: та же самая функция и может быть получена для любой другой последовательности интегрируемых функций и(п\ сходящихся в среднем квадратичном к и. г) Если и—плотность равномерного распределения на —1, 1, то ее преобразование Планшереля—функция и = sin х/(х К2л) не интегрируема. Однако и принадлежит L2, и мы увидим, что ее преобразование Планшереля совпадает с исходной плотностью и. Таким образом, мы получаем обобщение формулы обращения для интегралов Фурье (3.5) из гл. XV, применимой к плотностям, чьи характеристические функции не интегрируемы. >>
714 Гл. XIX. Гармонический анализ Перейдем к определению общего преобразования Планшереля. Для любой интегрируемой функции и ее преобразование и опре- деляется формулой (7.4). Такая функция и непрерывна (в силу теоремы о мажорируемой сходимости), и величина | и | ограничена умноженным на (2л)’1/2 интегралом от |и|. В общем случае и не интегрируема. Для краткости договоримся называть функцию и «хорошей», если она ограничена, непрерывна и интегрируема вместе с и. Тогда и тоже «хорошая» функция, и обе, как и, так и и, принадлежат L2 [см. пример б)]. Сначала мы покажем, что для «хороших» функций справед- лива формула обращения + 00 u(O = p= j (7.5) — 00 (Мы повторим рассуждение, приведенное для формулы обраще- | __L g2£2 ния в гл. XV, 3). Умножая (7.4) на 2 и интегри- руя, получим + 00 1 +00 1 Г ~/5-\ —т £2ь8 jc. С / \ ft—х\ dx а\ и(£)е 2 d£= ы(х)п — (7-6) Р ZJT J J \ ь ь — оо — оо где п обозначает стандартную нормальную плотность. При е—>0 интеграл слева стремится к интегралу в (7.5), в то время как свертка справа стремится к и (Г). Таким образом, (7.5) для «хороших» функций выполняется. Пусть теперь v—другая «хорошая» функция. Умножим (7.5) на функцию и, комплексно сопряженную с и, и произведем интегрирование по множеству —оо</<оо. Левая часть будет равна скалярному произведению (и, и), а правая, после перемены порядка интегрирования, сведется к (и, v). Таким образом, «хорошие» функции удовлетворяют соотношению (u, v) = (u, 0, (7.7) которое будем называть равенством Парсеваля в ZA Для v = u оно сводится к ЙНМ- J7.8) Отсюда следует, что расстояние между преобразованиями и и и равно расстоянию между и и v, т. е. можно сказать, что пре- образование Планшереля на множестве «хороших» функций изо- метрично. Далее, покажем, что соотношения (7.7) и (7.8) остаются справедливыми для произвольных интегрируемых функций и и v,
§ 7. Ь2-теория 715 принадлежащих /Л Преобразования не обязаны быть интегри- руемыми, однако из (7.8) вытекает, что они принадлежат L2 (сравните примеры а) и г)). Убедимся сначала в том, что интегрируемая функция w, у которой две первые производные интегрируемы, обязательно является «хорошей». В самом деле, из леммы 4 гл. XV, 4, полу- чаем, что | w (£) | = о (£“2) при ±оо и, следовательно, w интег- рируема. Предположим теперь, что и ограничена и интегрируема (и, следовательно, принадлежит Л2). По теореме об аппроксимации в среднем из гл. IV, 2, существует такая последовательность «хороших» функций ип, что + 00 |и(х)—u„(x)\dx—>0. (7.9) — 00 Если | и | < Л4, то все ип можно выбрать так, чтобы |uw|<7M. Тогда ип сходится в среднем квадратичном к и, так как ||ц—un||2 не превосходит значения интеграла в (7.9), умноженного на 2/И. Таким образом, из равенства (7.8) для «хороших» функций выте- кает, что {йп} есть последовательность Коши. С другой стороны, при каждом фиксированном £ ип (£) —> и (£), поскольку | и (£)—ип(£) | не превосходит значения интеграла в (7.9). Но, как было отме- чено в последней сноске, поточечная сходимость элементов после- довательности Коши влечет за собой сходимость в среднем квад- ратичном, и, следовательно, и = \. i. ш. йп. (7.10) Применяя (7.7) к паре ип и v и устремляя п—> оо, видим, что (7.7) остается верным в том случае, когда функция и ограничена и интегрируема, a v—«хорошая» функция. Еще один переход к пределу показывает, что (7.7) остается справедливым для лю- бой пары ограниченных интегрируемых функций. Остается показать, что (7.7) справедливо также для неогра- ниченных функций и и v при условии, что они интегрируемы и принадлежат Л2. Для доказательства мы повторим предыдущие рассуждения с тем единственным изменением, что аппроксими- рующие функции ип определяются теперь с помощью следующего урезания: ип(х) = и(х) ддя. таких х, что |ц(х)|<п, и uw(x) = 0 i. m. для всех остальных х. Тогда (7.10) выполняется и ип—+и. Даль- нейшее доказательство проводится без изменений. Теперь мы готовы сделать заключительный шаг, а именно распространить определение преобразования Планшереля на все пространство L2. Как показано в примере в), каждая функция и из L2 является пределом последовательности Коши интегрируе-
716 Гл. XIX. Гармонический анализ мых функций ип из L2. Мы только что показали, что преобразо- вания ип, определенные по формуле (7.4), образуют последова- тельность Коши, и мы теперь определим и как предел этой по- следовательности. Так как две последовательности Коши могут быть соединены в одну, предел и не зависит от выбора аппрок- симирующей последовательности \ип\. Кроме того, если и ока- жется интегрируемой, мы можем положить ип = и при всех п, и, таким образом, мы видим, что новое определение согласуется с (7.4), если и интегрируема. Подведем итоги. Преобразование Планшереля и определено для каждой функции и из L2] для интегрируемых и оно задается формулой (7.4), а в общем случае—с помощью следующего правила: если и = 1. i. m. ип, то и = \. i. m. ип. (7.11) Равенство Парсеваля (7.7) и свойство изометрии (7.8) справед- ливы в общем случае. Отображение и—является взаимно од- нозначным; преобразованием и является и (—х). Последнее утверждение является вариантом формулы обраще- ния Фурье (7.5), который применим в случае, когда и или и не интегрируемы, так что интегралы (7.4) и (7.5) не определены в обычном смысле. Эта полная симметрия между исходными функ- циями и их преобразованиями является основным преимуществом анализа Фурье в гильбертовых пространствах. Изложенная теория находит широкое применение в теории прогнозирования случайных процессов. В качестве примера при- менения в теории вероятностей приведем критерий, обычно при- писываемый А. Я. Хинчину, хотя он встречается еще в класси- ческой работе Н. Винера В силу исторических традиций этот результат до сих пор связывается с их именами, хотя по суще- ству он является частным случаем равенства Парсеваля и не тре- бует отдельного доказательства. Критерий Винера — Хинчина. Для того чтобы функция ср была характеристической функцией плотности вероятностей f, не- обходимо и достаточно, чтобы существовала функция и, такая, что I] и ||2 = 1 и <р(Х) = $ и (х) и (х + X) dx. (7.12) — GO .в этом случае f = \u |а. Доказательство. При фиксированном X положим v (х) = и (л4-Х).
§ 7. ^-теория 717 Тогда o(^) = u(^)e-*^. Равенство Парсеваля (7.7) принимает вид + со +оо | и (х) \2eiKxdx = J и (х) и (х + Л.)dx, (7.13) - 00 - со и так как || и ||2 = 1, то левая часть представляет собой характе- ристическую функцию некоторой плотности вероятности. Обратно, для заданной плотности вероятности f можно выбрать и так, что f = |u|2, и тогда (7.12) выполняется. Выбор и возможен не един- ственным способом. (Решение одной из задач теории прогнозиро- вания случайных процессов связано с возможностью выбора функ- ции и, равной нулю на полупрямой.) Изложенная здесь /Атеория интегралов Фурье переносится на ряды Фурье. В этом случае функции определены на окруж- ности, а преобразованиям Фурье (или Планшереля) соответствуют теперь последовательности коэффициентов Фурье. За исключе- нием этого формального различия, обе теории по существу оди- наковы. Поэтому достаточно краткого изложения основных фактов. Пространством L2 в данном случае будет гильбертово прост- ранство Л2(—л, л) функций, интегрируемых с квадратом на окружности. Норма и скалярное произведение определяются фор- мулами л л IMI2 = i J 1«(*)12<&» (ы, п)=2^-j W.(x)v(x)dr, (7.14) — Я - JT где подразумевается, что интегралы берутся по всей окружности (точки —л и л отождествляются). Роль «хороших» функций играют конечные тригонометрические полиномы вида и(х) = £ипе{пх. (7.15) Их коэффициенты Фурье равны, очевидно, л = j u(x)e~lnxdx. (7.16) -л Каждой «хорошей» функции соответствует конечная последователь- ность {ип\ ее коэффициентов, и, обратно, каждой конечной пос- ледовательности комплексных чисел соответствует «хорошая» функ- ция. Соотношения (7.16) и (7.15) определяют преобразование Фурье и = {ип\ и.обратное преобразование. Умножение и интег- рирование показывают, что для двух «хороших» функций л J u(x)?(x)dx = 2wA- <7-17) -л
718 Гл. XIX. Гармонический анализ Рассмотрим теперь гильбертово пространство бесконечных по- следовательностей « = и т. д. Определим норму и скалярное произведение равенствами II «11 = S \ип 12> (“’ *0 = 2 «Л- (7-18) Это пространство обладает свойствами, сходными со свойствами L2. В частности, конечные последовательности образуют всюду плотное множество. Можно показать, что существует взаимно однозначное соответствие между последовательностями и = {ип} из § и функциями и из L2 (—л, л). Каждой последовательности {ип}, для которой 21 ип I2 < 00» соответствует функция с интег- рируемым квадратом и коэффициентами Фурье ип. Верно и об- ратное утверждение. Отображение и^{ип} снова изометрично. Снова имеет место равенство Парсеваля (и, v) = (u, у). Ряд Фурье п не обязан сходиться, но его частные суммы ^ukeikx образуют последовательность непрерывных функций, сходящуюся кив мет- рике Л2. Это же верно и по отношению к другим непрерывным аппроксимациям: так, 2 ukr^ k^cikx сходится к и при г—> 1. Рассмотрим, как и выше, специальный случай равенства Пар- севаля л J м(х)р(х)e~inxdx = Stik+nvk. (7.19) -л При u = v получаем, что последовательность является после- довательностью коэффициентов Фурье некоторой плотности ве- I----- роятности на —л, л в том и только том случае, когда она допускает представление фп=2ы»+А’5 l“J2=1- (7-20) Ковариация такого вида встречалась в (7.4) гл. III (см. также задачу 17). § 8. СЛУЧАЙНЫЕ ПРОЦЕССЫ И СТОХАСТИЧЕСКИЕ ИНТЕГРАЛЫ Ради упрощения обозначений мы рассмотрим в этом параг- рафе лишь последовательности случайных величин. Однако, и это станет очевидным из дальнейшего, все изложение пригодно и для семейств, зависящих от непрерывного параметра. Отличие лишь в том, что спектральная мера не будет сосредоточена на конечном промежутке, и суммы должны быть заменены интегра- лами. Пусть тогда обозначает бесконечную в обе стороны пос.
' § 8. Случайные процессы и стохастические интегралы 719 ледовательность случайных величин, заданных в некотором вероят- ностном пространстве © и имеющих конечные вторые моменты. Эта последовательность предполагается стационарной «в широ- ком смысле»1), т. е. Е (Xn+vXv) = р„ не зависит от v. По теореме 3 из § 6 существует единственная ।----------------------------- мера R на окружности —л, л, такая, что л pn = i У e~inxR{dx}, n=Q, ±1.............. (8.1) — Л Мы рассмотрим теперь более детально отмеченную еще в § 3 идею о том, что окружность вместе со спектральной мерой R могут быть использованы для построения конкретного представления случайного процесса {Хл} (представления, пригодного во всяком случае для изучения свойств, зависящих только от вторых мо- ментов). Мы будем применять терминологию гильбертовых про- странств и рассмотрим два гильбертовых пространства. а) Пространство 1%. Построим пространство функций, опре- деленных на окружности, повторяя (с заменой прямой на окру- ।-------------- жность —л, л и меры Лебега на меру R) рассуждения, каса- ющиеся L2 (см. § 7). Норма и скалярное произведение (комплексно- значных) функций на окружности определяются при этом равен- ствами II«II2 = i J I« W 1’Я = J u(x)v(x)R{dx}. (8.2) — Л —• л Примем основное соглашение: считать две функции равными, если они отличаются друг от друга на множестве R-меры нуль. Последствия этого соглашения серьезны. Так, если R сосредо- точено в двух точках 0 и 1, то «функция» в нашем понимании вполне определяется своими значениями в этих точках. Например, функция ппх равна нулю. Однако даже в этих крайних случаях использование обычных формул для непрерывных функций и ссылки на их графики не принесут никакого вреда. Точно так же осмысленно (и упрощает язык) применение термина «ступен- чатая функция». Гильбертово пространство L# состоит из всех функций, за- данных на окружности и имеющих конечную норму. Если |]ип— — и||—> О, то мы назовем последовательность {ип} сходящейся к и в нашей метрике (или в среднем квадратичном по отношению х) У автора — «in restricted sense».—Прим, перев.
720 Гл. XIX. Гармонический анализ к мере 7?). Гильбертово пространство L2R есть полное метриче- ское пространство. Непрерывные функции образуют в нем плотное множество (определения см. в § 7). б) Гильбертово пространство <£), натянутое на {Х„}. Обозна- чим символом семейство случайных величин с конечными вто- рыми моментами, заданных на произвольном, но фиксированном выборочном пространстве По неравенству Шварца E(UV) су- ществует для любой пары таких случайных величин. Естественно обобщить (8.2), рассматривая вместо круга выборочное простран- ство © и вместо меры R основное распределение вероятностей в ©. Мы опять условимся отождествлять две случайные величины, если они отличаются друг от друга на множестве меры нуль. Определим скалярное произведение как E(UV) и норму U как положительный корень из E(UU). Тогда <£)0 превращается в гиль- бертово пространство. Это—полное метрическое пространство, в котором последовательность принадлежащих ему случайных вели- чин называют сходящейся к U, если Е (| — U |2) —>0. Изучая последовательность {Хп}, обычно интересуются только случайными величинами, которые являются функциями Хй, а во многих случаях ограничиваются лишь линейными функциями, т. е. рассматривают конечные линейные комбинации ^akXk и их пре- делы. Получаемые таким образом случайные величины образуют подпространство <£) пространства $0, называемое гильбертовым пространством, натянутым на величины Xk. В, нем скалярные произведения, нормы и сходимость определены, как только что описано, и <£) является полным метрическим пространством. В настоящем контексте математические ожидания Е(Х„) не играют никакой роли, но, так как термин «ковариация» звучит лучше, чем «скалярное произведение», мы примем обычное пред- положение, что Е(Хп) = 0. Единственная цель этого предполо- жения—добиться совпадения рп и ковариации. Никакое центри- рование не нужно, если согласиться назвать E(XY) ковариацией X и Y. Мы подходим теперь к решающему моменту. Мы покажем, что для наших целей возможно взять пространство LR (простое для интуитивного восприятия) в качестве конкретной модели <£). В самом деле, по определению ковариация pj_k — Cov (Ху, Xfe) любой пары X равна скалярному произведению функций elJX и eikx в L2r. Отсюда следует, что ковариация конечных двух ли- нейных комбинаций U = И У = Равна скалярному произведению соответствующих линейных комбинаций и v = ^bkel'kx. Определения сходимости в рассматриваемых про- странствах позволяют распространить отображение на все слу- чайные величины. Мы получаем, таким образом, важный резуль- тат: отображение Х%<->е1'*х порождает взаимно однозначное соот- ветствие между случайными величинами из и функциями из Lr\ это соответствие сохраняет скалярные произведения и нормы
£ 8. Случайные процессы и стохастические интегралы 721 (и, следовательно, сходимость). Иными словами, эти пространства изометричны х). Теперь мы в состоянии изучать $ и {Хп}, рас- сматривав лишь конкретное пространство LR. Эта процедура, помогая интуиции, в то же время имеет и теоретические пре- имущества. Так как функции на окружности—объект хорошо знакомый, то сравнительно просто построить последовательность {nU)} функций из UR с заданными структурными свойствами. Функ- циям ип соответствуют некоторые случайные величины Zn, опре- деленные на исходном выборочном пространстве @. Если известны коэффициенты Фурье и{п}, то Z„ возможно выразить явно в виде предела конечных линейных комбинаций величин Xk. Если со- вместные распределения ХЛ нормальны, то и распределение Тп будет нормальным. На практике указанная процедура часто производится в обрат- ном порядке. Если данный процесс {Х^}—сложный, то наша цель—выразить его в терминах величин Z„, образующих более простой случайный процесс. Практически это достигается переходом от исходного пространства к пространству L2R. Несколько при- меров пояснят это лучше, чем теоретические рассуждения. Примеры, а) Представление {Хп} в терминах независимых случайных величин. Как и всюду в этом параграфе, {Хп} обозна- чает случайный процесс с ковариациями р„ и спектральной мерой /?, определенными формулой (8.1). При нашем отображении случайная величина Хп соответствует функции е1'пх на окружности. Покажем теперь, что для определенных функций у случайные величины, соответствующие einx/y(x), не коррелировании Рассмотрим только случай, когда спектральная мера R имеет плотность г. Для простоты допустим, что г строго положительна и непрерывна 2). Выберем функцию у так, что |V(x)|2 = r(x). (8.3) х) Читателям, знакомым с теорией гильбертовых пространств, полезно иметь в виду связь изложенного со стандартной спектральной теоремой для унитарных операторов. Линейный оператор, отображающий § на себя таким образом, что Xn+i, называют оператором сдвига, и LR служит моделью, в которой действию этого оператора сдвига соответствует умножение па eix. Обратно, пусть дан произвольный унитарный оператор Т на гильбертовом пространстве и произвольный элемент Хо£§о- Тогда последовательность элементов X„ = TWXO можно рассматривать как стационарную последователь- ность и Т — как оператор сдвига в подпространстве натянутом на эту по- следовательность. Если Хо можно выбрать так, что § = §0, мы получаем стандартную спектральную теорему для Т (с тем отличием, что для «разло- жения единицы» взято конкретное представление, основанное на выборе Хо). Если § с: то можно представить как прямую сумму двух инвариантных подпространств и можно повторить рассуждения. Таким путем возможно прийти к общей теории .спектральных разложений, включая теорию кратности спектра. 2) Эти ограничения используются лишь затем, чтобы избежать скучных объяснений того, как понимать г (х)/у (х) при г (х) = у (х)=0 и как понимать сходимость рядов, 24 м 2-10
722 Гл. XIX. Гармонический анализ Ряд Фурье у сходится в /Анорме, как это было объяснено в § 7. Обозначая коэффициенты Фурье у через уь имеем Ы2 < °° и по равенству Парсеваля (7.20) + 00 Р»= 2 Ь+А (8-4) k = — 00 Рассмотрим теперь бесконечную в обе стороны последователь- ность и{п}, определенную соотношением Подставляя и{п} в (8.2), видим, что ||u(«>||=l, (им, uw) = О (8.6) при т=£п. Отсюда вытекает, что соответствующие функциям и{п} случайные величины Z„ не коррелированы и имеют единичные дисперсии. В частности, если Хк нормально распределены, то Zk взаимно независимы. Интересно отметить, что пространство, натянутое на случай- ные величины Хь содержит стационарную последовательность {Zn} из некоррелированных величин. Явное выражение Z„ в терминах Хк может быть получено из разложения Фурье функции и{п}. Однако предпочтительнее идти в обратном направлении — вы- разить Хк в терминах Zn, так как структура последовательности {Zn} проще, чем структура {XJ. Мы имеем * eibx * Ъ ynu{n+k} = 2 упе1пх- (8.7) Сумма справа представляет собой отрезок ряда Фурье для у и сходится (в метрике гильбертова пространства) к у. Отсюда сле- дует, что величина (8.7) стремится к eik*. При нашем отображе- нии и{п+к} соответствует Zn+k, так что ряд ^ynZn+k сходится, и мы можем написать 2 ?nz„+ft. (Ь.8) П = — 00 Мы получили, таким образом, явное выражение Хк в форме «сколь- зящих средних» стационарной последовательности некоррелирован- ных величин Zn. Очевидно, что представление (8.8) не единственно. Возникает естественный вопрос, возможно ли выразить Хк только через Zk, Z^, Z^2, ... (через «прошлое» процесса {Z„}), или, что то же самое, возможно ли функцию у в (8.3) выбрать так, что у„ = 0 при п^1. Эта проблема имеет фундаментальный характер для теории прогнозирования случайных процессов, но она лежит вне
§ 8. Случайные процессы и стохастические интегралы 723 рамок этой книги. Типичные примеры см. в (7.5) гл. III и за- даче 18. б) Соответствующий процесс с некоррелированными приращени- ями. Для каждого t, —л</^л, положим ( 1 при х I, yt(x) = {a F (8.9) v 7 (0 при х > t 4 7 и обозначим через Nt соответствующую случайную величину в $. Очевидно, что ковариация приращений —Ys за непересе- -----------------------------------------------------------1 кающиеся интервалы равна 0; более того, Var(Yf) = 7?{—л, /}. Таким образом, —процесс с некоррелированными приращениями и дисперсией, определяемой по R. Если X/ нормально распреде- лены, то приращения процесса Yf будут независимы. Итак, для каждой стационарной последовательности {Xft} су- ществует связанный с ней указанным образом процесс с некорре- лированными приращениями. Явное выражение для Y^b терминах Xk можно получить стандартным путем—разлагая функцию yt из (8.9) в ряд Фурье. Однако снова предпочтительнее идти в обратном направлении. Это будет сделано в следующем примере. в) Стохастические интегралы. Представление какой-либо слу- чайной величины U в терминах Xk определяется (как мы видели) разложением Фурье функции, соответствующей U. По сравнению с этим представление в терминах Y t может показаться «слишком простым». Оно связано с графиком функции, соответствующей рассматриваемой случайной величине. Для простоты мы предпо- ложим эту функцию непрерывной. Рассмотрим сначала «ступенчатую функцию» w, т. е. функцию вида = + ytl)+ ... +ап (yn—ytn.J, (8.10) где —постоянные и —л < < t2 <... <tn^ < л. Соответ- ствующая случайная величина W получается заменой в (8.10) у^ на Y/.. Теперь каждая непрерывная функция w может быть равномерно приближена ступенчатыми функциями ш(п) вида (8.10). Равномерная сходимость wU) к w влечет за собой сходимость в L^-норме, а следовательно, и сходимость соответствующих случай- ных величин WU) к W. Это дает нам рецепт отыскания образа W произвольной непрерывной функции w с помощью простого предельного перехода: надо аппроксимировать w ступенчатыми функциями типа (8.10) и заменить yt^ на Yy Напомним, что (8.10) определяет функцию, а не число; точно так же как и w, предел является функцией, а не числом. Но (8.10) выглядит как риманова сумма, и формально наша процедура напоминает определение интеграла Римана. Поэтому общепринятым стало 24*
724 Гл. XIX. Гармонический анализ обозначение Л W= $ w(t)dNt, (8.11) - л указывающее на описанный выше предельный переход. Случай- ная величина (8.11) называется стохастическим интегралом от непрерывной функции w. Название это до некоторой степени произвольно, а обозначение — не более как краткое выражение предельного перехода, который был строго определен выше. По определению функция eint соответствует случайной величине Х„, и потому мы можем написать л Х„= $ e"*dNt. (8.12) - л Это есть спектральное представление произвольной стационарной последовательности {Хп} в терминах соответствующего процесса с некоррелированными приращениями. Обозначение стохастического интеграла, пожалуй, более наг- лядно, чем логично, но мы не будем касаться этого вопроса. Наша цель состояла в том, чтобы показать, как это полезное понятие и важное представление (8.12) могут быть получены средствами анализа Фурье. Этим иллюстрируются возможности канонического отображения, использованного в этом разделе (и введенного впервые Крамером). Изложенная теория использует только вторые моменты {Хп} и практически применима лишь в случаях, где эти моменты в самом деле значимы. Таков случай, когда процесс является нормальным, так как нормальные распределения полностью опре- деляются своими ковариациями. В других применениях можно верить, что процесс «не слишком отклоняется от нормального» (подобно тому как регрессионный анализ основывался на вере в универсальную приложимость методов, развитых для нормального закона). К сожалению, один лишь факт существования прекрасной теории никоим образом не оправдывает этой веры. Так, в примере 3, в) выборочные функции процесса строго периодичны. Будущее отдельной реализации вполне определяется ее заданием на полном периоде. Однако методы прогнозирования, опирающиеся на L2- теорию, не принимают во внимание этот факт и отождествляют все процессы с одной и той же спектральной мерой. Наблюдатель, получающий последовательность ..., 1, —1, 1, —1,..., может однозначно предсказать следующий член ряда, но /Аметоды заставляют его предсказывать появление нуля. Эти методы, таким образом, не являются универсально приложимыми. Однако они дают идеальное средство изучения нормальных процессов.
§ 9, Задачи 726 § 9. ЗАДАЧИ 1. Любопытные примеры характеристических функций. Пусть Тд (х) =а = 1 — |x|//i для | x|^/i и xh (х) = 0 для |х|^Л. Положим 06 W= 2 а»тл (*—«)• (9*1) П = — СО Когда ап вещественны и Л=1, график а представляет собой ломаную линию с вершинами (п, ап). При h < график а состоит из отрезков оси х и боко- вых сторон равнобедренных треугольников с вершинами (п, ап). Используя критерий леммы 1 из § 2, покажите, что a (Q/a (0) является характеристической функцией, если ап действительны, а_п = ап и + + I а2 | + • • • а°‘ 2. Обобщение. Последнее утверждение остается верным, если заменить произвольной четной интегрируемой характеристической функцией. (Используя характеристические функции, изображенные на рис. 1 гл. XV, 2, можно по- строить характеристические функции, графики которых представляют собой весьма причудливые ломаные линии.) 3. Продолжение. Результат предыдущей задачи является специальным случаем следующего утверждения: если т—четная интегрируемая характери- стическая функция, если Кп—действительные, а ап — комплексные постоян- ные и 2 | ап j < оо, то <9-2) есть характеристическая функция в том и только том случае, когда а(0) = 1 и для всех (^а самом деле достаточно, чтобы последний ряд был суммируем по Абелю к положительной функции.) 4. Ковариационная функция р, определенная в (3.3), непрерывна всюду тогда и только тогда, когда она непрерывна в нуле. Последнее верно в том и только том случае, когда Е (Х^— Х0)2 0 при t-+ 0. 5. Разностные отношения и производные. Пусть {XJ—стационарный процесс с р (/) = Е (Xf+^Xj) и спектральной мерой R. Для h > 0 определим новый процесс как X/ft) = (Х/+л —Х/)//г. а) Покажите, что спектральная мера нового процесса определяется соотношением {dx} = 2h~2 [1 — cos/и] R {dx}. Ковариации р(Л) (/) стремятся к пределу при h -> 0 в том и только том случае, если существует непрерывная вторая производная р"(0, т« е» если мера x2R{dx} конечна. б) В последнем случае Е (| Х(/8)—Xj6) |2) 0 при 8 0 и б -> 0. Замечание. В терминологии гильбертовых пространств из § 7 это означает, что при фиксированном t и &п 0 последовательность {Х^£">} есть последо- вательность Коши и поэтому производная X/= 1. i. т. х/° существует. 6. См, теорему 2 из § 4. Еслиф непрерывна всюду, кроме нуля$ где она имеет разрыв первого рода, то fr (£) -> ф (£) равномерно вне некоторой окре- стности нуля и fr (0) -+ ~-[ф (0+) — ср (0—)]. 7. Продолжение, Если ф может быть представлена как разность двух мо- нотонных функций, то /г (?) -> у [ф (£+)—ф (£—)] во всех точках. 8. Ограниченная периодическая функция ф с неотрицательными коэф- фициентами Фурье фп необходимо непрерывна и 2Фп < оо. Пример фп = — по- казывает, что утверждение неверно, если предполагается только интегриру- емость ф» Указание, Используйте основную идею доказательства теоремы 1 из § 4.
776 Гл. XIX. Гармонический анализ 9. Суммируемость по Чезаро. Заменим (4.3) на fr ©=S‘Pnane,'n£> где ап= 1 — | п | (2W +1)-* при | п | 2N и ап = 0 при | п | > 2W. Покажите, что при замене рг (/) на 1 81П*(Л/+±)/ + 1 sin2^.z сохраняется теория § 4 (<?jy(O снова плотность вероятности). 10. Продолжение. Докажите более общее утверждение, что эта теория сохраняется, если в качестве ап взять коэффициенты Фурье симметризованной плотности вероятности, заданной на окружности. 11. Покажите, используя формулу суммирования Пуассона (5.2)j что / (V—*+2&Х\ / г/+ x2&Х \ 1_. 2-14 vr ЛЧ vr Д- — 00 00 1 V ( 1 . о я2 \ ПЛ ПЛ =Т Ъ ехР (—2 tn V) cosТX>COST у' — 00 где П обозначает стандартную нормальную плотность. [Это есть решение задачи об отражающем экране, см. гл. Х,5,д).] 12. В формуле суммирования Пуассона (5.2) условие о том, что + 2/?%) сходится к непрерывной функции ф, можно заменить на условие 2/ (пл/Х) < °°. Указание: ф— при любых обстоятельствах интегрируемая функция. Используйте следствие 2 § 4. 13. Другой вывод формулы суммирования Пуассона. Пусть (р—характери- стическая функция произвольного распределения F. Если рг обозначает ядро Пуассона из (4.5), то (4.7) показывает (без дальнейших вычислений), что при О < г < 1 + 00 00 3- У ф&+п)г1лМпЛ= С Vх pr (х+%) F [dx}. (9.3) 2Л О П — — СЮ — 00 Отсюда следует, что левая часть есть характеристическая функция. Полагая г—> 1, выведите отсюда, что если F имеет плотность /, то — S ФЙ+Л)^ = 5 ^(-х+2^)/ (— Л+2И (9.4) 2п /2=-00 fe=-<x в предположении 2Н—^ + 2&л) <оо. Покажите, что (9.4) равносильно ва- рианту (5.9) как формуле суммирования. Замечание. Результат может быть переформулирован следующим образом: левая часть (9.4) суммируема по Абелю к правой части, если последняя непре- рывна. 14. Последовательность {фп} положительно определена тогда и только тогда, когда последовательность {фпЧп|} положительно определена при лю- бом г, 0 < г < 1. Для этого необходимо и достаточно условие 2 Фп^ П * для всех К и 0 < г < 1. 15. Выведите (без вычислений) из задач 1 и 14 следующую теорему (от- меченную Л. Шеппом), Пусть {у п} —положительно определенная последовав
§ 9. Задачи 727 тельность. Обозначим через а кусочно-линейную функцию с вершинами (/г,ф„). Тогда а положительно определена. 16. Пусть <р—характеристическая функция. Обозначим через а кусочно- линейную функцию с вершинами (п, (р (/г)). Тогда а—характеристическая функция (это лишь иная формулировка задачи 15 и частный случай задачи 1 с /г=1). Используйте задачу 1 и опишите другие любопытные характеристи- ческие функции, которые можно получить из ф. 17. При r< 1 ковариации рд = г* п * etnQ марковских последовательностей удовлетворяют (7.20) с uk = ]/" 1 — г2г^е1^ при ^0 и цА: = 0при k < 0. Най- дите другие представления. 18. Продолжение. Пусть {Х„}—марковская последовательность с ковариа- циями ри = г' п * е1П®. Если г < 1, то Хп=]/~1 — г2 £ г&еи^ Zn_k, где вели- /? = 0 чины Zk не коррелированы. При г=1 имеем Xn = ein0Zo.
ОТВЕТЫ НА ЗАДАЧИ Глава I 1. (i) 4г (ii) при х > 3 3 ’У X2 z (iii) при всех х (iv) ае~ах при х > О (v) аЛ+1 ' (vi) ае'™ + f е~ах1/- - a Q + у у= ) е-ах~ах1/3. 2- W 4 TtW пРи | х | < 1 (ii) при 1 ♦< t < 5 (iii) т(1—п₽и 1 х | < 2 (iv) 1 при О < х < 2 (v) т~т?/3 +4*"2/8 п₽и I * I < 1 (vi) 4+ Т*1/8 + Г5Х~ 2/8 при И < L 3. (i) h"1 (1—е” ах) при О < х < h и /г-1 (eaft —1) е"ах при х > h (ii) Л-1 (1 —(х+,г)) при — h < х < О и /г“х (1 — е~ ah) е~ ах при х > О. 1 2 1 4. (i) -у- h, если h 1, и — - , если h 1 3 ; К л 1 (ii) “(l-SR(/5/2)). 5. (i) 1 — я-1 при х > 1; (ii) х2(х+1)~2 при х > О. 7. Р {Z «С х} = 1 —ах при х < t и= 1 при х > t. 10. б) Колонна вместе с возглавляющим и замыкающим автомобилями обра- зует выборку, в которой наименьший элемент на последнем месте, наимень- ший из оставшихся на втором. 1 16. р = 2 /?-" j При т= 1, п = 2 получаем р = 2.. 18, (л—1)^.
Ответы на задачи 729 ------------------- 1 1 19. (i) 2 (1— г) dz =у О х (ii) Плотность равна 21—t2 при 0 < / «с 1 и (2 — /)2 при 1 t < 2 (iii) Плотность равна 2t2 при 0 < t < 1 и снова (2 —/)2 при 1 <2. 1 20. 2 J х (1—х) dx = -^ . Две из шести перестановок приводят к пересечению, о 21. Хи: 4 log — при х < у ; Xi2 и Х21: 4 log 2 при х< ± ; 4 log при у <х< ±-, Х22:4 log 4х при у < х < у ; 4 log у при -у < х < 1. Математические 1 3 9 ожидания равны -тт , -г- , тн • 1 10 16 1 о 2 11 2 1 27. Функции распределения — arcsin — х и — х2; плотности —— Л 2 4 Л л/ ^2 и у х при 0 < х < 2. 28. 2jt”1arcsin у х. 30. a) log 4. б) v l°g 1 , Где о < х < 1. л X 31. у sin2Od0 = y V1 —у2 dy = 2n~l[arcsin х-{-х]/~ 1-—х2], где О < cos 0<л О О < X < 1. л/2 32. F (t) = j- j V (^) (1 -cos 20) d6. О 35. Подстановка s = F(y) преобразует интеграл к соответствующему интегралу для равномерного распределения. Заметим, что F (т-]-х) « у + f (т) х для малых х. Глава II 4. g*g (х) = 4 е~ 1 х 1 (1 +1 х |) ^*(х) = 4е’1х|(3+31ж1+х2) g4* М = 1X1 (5 + 5 |х| + 2^+± |х|?) . 10. a) Xp.(e~w— как свертки двух показательных плотностей, б) Используя а), получаем 12. Плотность равна 1----— t2 при 0 < > < 1 и у (2 — t)2 при всех 1 < t < 2» Математическое ожидание равно Л- s
730 Ответы на задачи 13. (j+k+y—/—k~ 1^^+п+н+у— 1 Глава III 7. а) е~х и 1—е~х—е~У -\-е~х~У~ахУ при х > 0, у > 0, б> Е<¥|Х|“7та?' 1 2/1 а2 Var (Y|X)^-;t--—4- л , ---Z1 , -гт. 7 (1-|-ях)2 ' (1 +flx)3 (1 +flx)4 8. Если f имеет математическое ожидание р и дисперсию о2, то Е (X) = = Е (Y)= ± И, Var(X) = Var (Y)= ± ± Cov (X, Y)= у а* - ± 9. Плотность равна 2х2 в единичном квадрате. Для выборки объема п она равна (п—1)! X/z-i в (п — 1)-мерном единичном кубе. 10. при у > х > 0 и -±-е~У+2Х ПРИ У > х» х < 0. Если у < х, поменяйте х и у местами. 1 2 11. а) 4$ °<Х<Т« 2х б) 8 У f (s) f (у) f 7(|~Ls) ’ где ° < х < -j- < У < 1 и область ин- ♦ I тегрирования удовлетворяет условиям: 2х < s < — и 1—2у < s < 1—у, 12. Двумерная нормальная плотность с дисперсиями т, п и ковариацией У т/п> ,г т , п — т Условная плотность имеет математическое ожидание — / и дисперсию т-. п п 13. Сумма X]2-H*’ + Xfl имеет гамма-плотность f j п [см, гл. II, (2.2)]в Т ’ Т Поэтому из (3,1) При т — 2-> п = 4 мы получим пример 3? а). 15. а) 4ху, когда х-}-у < !**>(), у > 0 4ху—4 (х-\-у— I)2, когда х+у > 1, 0 < х, у < 1 Чх(2—х— у), когда у > 1-, х-\-у <2, х > 0 4у (2—х-у), когда х > h х-\~У <2, у > 0, б) 2 (1—х — у)2 при 0 < х, у < 1 х-\-у < 1 2 (1 —х)2 при х > 0, у < 0, х-{-у > 0 2 (1 +^/)2 при х > 0, у < 0 х-\-у < 0, Прп х < 0 по симметрии. 16. 2 (arocos i L
Ответы на задачи 731 00 2л 17. J f (р) р dp J g (Кr2 + p2 —2rp cos 0) d§. о о 20. а) Хп= (и cos-y шг +Vsin у лл ) А, б) W + pV(—1)« в) % (и cos у- л^ + V sin пп +pW. 21. a) Var (Y„ + 1) —Var (Y„) = Var (С„) — 2 Cov (Y„, C„) +1, откуда Y„ = £ + <7«Yo + (bp—a) (1 -q»)/p, /г = 0 6) a2—2aop+1 =0 B)a = ±(a+1), где <7=1—p. 1 / 1 \2 22. a2^±(a + |) Глава VI 11. He обязательно. Необходимое условие: n[l—F (гп)]—>0. 12. При x > 0 плотности равны 1 и — (1—е~гк). 13. qU (х) — 1—qe~ Pci. Число моментов восстановления всегда распределено геометрически. 19. Z = z+F*Z, где г (/) = 1 — е~ct при t z(t) = z(l) при и F (t) = e-c%—e~ct при t > g. 20. V = A+B*V, где A {dx}= [1 — G (x)] F {dx} и В {dx} = G (x) F {dx}, 23. Плотность арксинуса g (у) — --* — t n Yy^-y) Глава VII 6. a) Pk (1 — p)n~k> Распределение F сосредоточено в p, 6)------FT > плотность f (x) = 1. 7 n+1 ' z B) 7—ГТГ7—Hi? > плотность 2xt (n+l)(n + 2)
ЛИТЕРАТУРА А. Общие курсы Krickeberg К. Probability theory. (Translated from the German 1963.) Addison — Wesley, Reading, Mass, 1965, 230 pp. Loeve M. Probability theory. 3rd ed. Van Nostrand, Princeton, N. J., 1963, 685 pp. Имеется перевод: Лоэв M. Теория вероятностей,— Перевод с англ.— Мл ИЛ, 1962. Neveu J. Mathematical Foundations of the Calculus of Probability. (Translated from the French 1964.) Holden Day, San Francisco, Calif, 233 pp. Имеется перевод: Неве Ж« Математические основы теории вероятностей, — Перев, с фр.— Мл Мир, 1969. Б. Специальные темы Bochner S. Harmonic Analysis and the Theory of Probability. Univ, of Califo - nia Press, 1955, 176 pp. Grenander U. Probabilities on Algebraic Structures, John Wiley, New York, 1963, 218 pp. Имеется перевод: Гренандер У. Вероятности па алгебраических структу- рах.— Перев. с англ.— Мл Мир, 1965, 275 с. Lukacs Е. Characteristic Functions, Griffin, London, 1960, 216 pp. Имеется перевод: Лукач Е. Характеристические функции.— Мл Нау- ка, 1964. Lukacs Е., Laha R. G. Applications of Characteristic Functions. Griffin, London, 1964, 202 pp. В. Случайные процессы (теория) Chung К. L. Markov Chains with Stationary Transition Probabilities, 2nd ed., Springer, Berlin, 1967, 301 pp. Имеется перевод первого издания: Чжун Кай-Лай. Однородные цепи Маркова.— Перев. с англ.— Мл Мир, 1964, 425 с. Дынкин Е. Б. Марковские процессы.— Мл Физматгиз, 1963, 859 с. Ito К., Mckean Н. Р. Jr., Diffusion Processes and their Sample Paths. Springer, Berlin, 1965, 321 pp. Имеется перевод: Ито Ки Маккин X. Диффузионные процессы и их траектории.---Перев. с англ.— Мл Мир, 1968. Kemperman J. Н. В. The Passage Problem for a Stationary Markov Chain. University of Chicago Press, 1961, 127 pp. Levy P. Processus Stochastiques et Mouvement Brownien. 2nd ed. Gauthier- Villars, Paris, 1965, 438 pp. Имеется перевод: Леви П. Стохастические процессы и броуновское дви- жение.—Перев. с фр.—Мл Наука, 1972. Spitzer F. Principles of Random Walk. Van Nostrand, Princeton, 1964, 406 pp. Имеется перевод: Спицер Ф, Принципы случайного блуждания.— М.:
Литература 733 Скороход А. В. Случайные процессы с независимыми приращениями.— М.: Наука, 1964, 278 с. Яглом А. М. Введение в теорию стационарных случайных функций. Успехи математических наук, т. 7, № 5, 1952, 3 —168. Г. Случайные процессы (приложения и примеры) Barucha-Reid А. Т. Elements of the Theory of Stochastic Processes and their Applications. McGraw-Hill, New York, 1960, 468 pp. Имеется перевод: Баруча-Рид A. T. Элементы теории марковских про- цессов и их приложения. Перев. с англ.— М.: Наука, 1969, 511 с. Benes V. Е. General Stochastic Processes in the theory of Queues. Addison- Wesley, Reading, Mass., 1963, 88 pp. Grenander U., Rosenblatt M. Statistical Analysis of Stationary Time Series. John Wiley, New York, 1957, 300 pp. Хинчин А. Я. Математические методы теории массового обслуживания.— М.: Физматгиз, 1963, 120 с. Prabhu N. U. Stochastic Processes. Macmillan, New York, 1965, 233 pp. Prabhu N. U. Queues and Inventories. John Wiley, New York, 1965, 275 pp. Имеется перевод: Прабху H. Методы теории массового обслуживания и управления запасами. Изучение основных случайных процессов. Перев. с англ.— М.: Машиностроение, 1969, 356 с. Riordan J. Stochastic Service Systems. John Wiley, New York, 1962, 139 pp. Имеется перевод: Риордан Дж. Вероятностные системы обслуживания. Перев. с англ.— М.: Связь, 1966, 184 с. Wax N. (Editor). Selected Papers on Noise and Stochastic Processes. Dover, New York, 1954, 337 pp. Д. Книги, имеющие исторический интерес Cramer Н. Random Variables and Probability Distributions, 2nd ed. (The first appeared in 1937), Cambridge Tracts, 1962, 179 pp. Имеется перевод с 1-го изд.: Крамер Г. Случайные величины и распре- деление вероятностей.—М.: ИЛ, 1947. Doob J. L. Stochastic Processes. John Wiley, New York, 1953, 654 pp. Имеется перевод: Дуб Дж. Вероятностные процессы.— Перев. с англ.— М.: ИЛ., 1965-, 605 с. Гнеденко Б. В., Колмогоров А. Н. Предельные распределения для сумм независимых случайных величин.— М.: Гостехиздат, 1949. Колмогоров А. Н. Основные понятия теории вероятностей, 2-е изд.,— М.: Наука, 1974. Levy Р. Calcul des Probabilites. Gauthier Villars, Paris, 1925, 350 pp. Levy P. Theorie de 1’Addition des Variables aleatoires. Gauthier Villars, Paris, 1937 and 1954, 384 pp. E. Полугруппы и общий анализ Hille Е., Phillips R. S. Functional Analysis and semigroups (Revised Edition). Amer. Math. Soc., 1957, 808 pp. Имеется перевод: Хилле Э., Филлипс Р. Функциональный анализ и по- лугруппы.— Перев. с англ.— М.: ИЛ, 1962, 829 с. Karlin S. Studden W. Tchebycheff Systems: with Applications in Analysis and Statistics. Interscience, New York, 1966, 586 pp. Имеется перевод: Карлин С., Стадден В. Чебышевские системы и их применение в анализе и статистике.— Перев. с англ.— М.: Наука, 1976, 586 с. Yosida К. Functional Analysis. Springer, Berlin, 1965, 458 pp. Имеется перевод: Иосида К. Функциональный анализ.— Перев. с англ,— М,; Мир, 1967,
ПРЕДМЕТНЫЙ УКАЗАТЕЛЬ Абелевы теоремы 472, 501 Абеля интегральное уравнение 48 Абсолютная непрерывность 165, 167 Абсолютно беспристрастная последова- тельность 246 — монотонные функции 260, 495 Абсолютные вероятности 243—245 Аварии 73, 213 Адамара теорема факторизации 588 Аддитивные функции множеств 128, 129 Алгебра множеств 134, 135, 139, 142 -----порожденная 192 Ансамбли кругов и шаров 22 — случайные точек в пространстве 22 Арифметическое распределение 164, 561 -----конечное 681 См. также Ре- шетчатое распределение Арксинуса распределение 66 -----в случайном блуждании 471 -----и предельные теоремы 529 Арцела — Аскола теорема 310 Асимптотическая пренебрежимость 208, 653 Асимптотически несмещенная оценка 256 — плотное множество 174 Асимптотические оценки 426, 463 — разложения и центральная пре- дельная теорема 595 ----- для распределений 604 •----, различно распределенные слага- емые 612 — свойства правильно меняющихся функций 320 Астрономия, применения к 48, 202, 203—204, 242, 252 Атомические меры 163 Атомы (мер) 163 — при свертке 174 Банаха пространство 296, 397, 546 См. также Гильбертово пространство Б ателье процесс См. Броуновское движение Безгранично делимые полугруппы 514 ----- распределения 206, 334, 506 --------в ЗГ 665 Безобидность абсолютная 246 Бернулли испытания 168 Берри — Эссеена теорема 608 Бернштейна полиномы 258 -----в 512 283 Бесконечная дифференцируемость 295, 336 Бесконечные свертки 305, 361, 664, 669 Бесселева плотность 564 Бесселевы функции 74, 75, 586 -----, безграничная делимость 207, 508 -----в стохастических процессах 75— 77, 368 -----, Лапласа преобразование 493, 540 -----, распределения, связанные с ни- ми 76, 77, 176, 196, 197 -----, характеристические функции 563 Бета-интеграл 62 — плотность 65 — распределение 529 Ближайшие соседи 23 Борелевская алгебра 135, 142, — —, измеримые функции 139 Борелевское множество 135 •----, аппроксимация 137, 148 —----, соглашения об обозначениях 151 Бореля — Кантелли лемма 126, 362 Бохнера интеграл 511 Бросание монеты 246, 248, 471 -----и случайный выбор 49 Броуновское движение 120, 212, 378, 534 -----в ЗГ 205, 390 -----, два поглощающих экрана 388, 537 -----, один поглощающий экран 387, 536 -----, непрерывность траекторий 212, 348, 379
Предметный указатель 735 -----, первое прохождение 204, 387, 535 -----, подчиненность 394 Бэровские функции 127, 131, 136, 137, 140, 151, 154, 348, 398 Бюффона задача об игле 78 Вальда тождество 453, 481, 482, 673, 675 Вейбула распределение 68 Вейерштрасса теорема об аппроксима- ции 259 Вероятностные меры и пространства 138, 155, 159 — распределения 151, 155 Ветвящиеся процессы 282, 497, 531 Взаимные пары функций 564 Видимость в х-направлении 23 Винера — Б ателье процесс 120, 212 Винера процесс См. Броуновское дви- жение Винера — Хинчина критерий 716 Винера — Хопфа интегральное урав- нение 455, 459, 479 -----метод 465 -----факторизация 440, 452, 482, 676, 691 Вложенные процессы восстановления 224, 431 Вогнутые функции 182 Возвратные (устойчивые) процессы См. Невозвратный или обрывающийся процесс восстановления Возвращение в нуль 478 Восстановления моменты 216, 417, 422 — процессы 25, 216, 253 -----вложенные 224, 431 -----двустепенные 431 ----- нелинейные 439 -----обрывающиеся 424 -----, применения 427 -----, суперпозиция 420 — теорема 236, 408, 411, 432, 439 -----, доказательство 412 — уравнение 217, 407 Вполне монотонные функции 260, 495, 507, 522 .------абстрактные 511 Вращения 97, 104, 122 Времена ожидания 31 Время возвращения 216 -----максимальное 222, 437 Выборка, медиана, экстремумы 32 —, среднее значение, дисперсия 106 Выпуклые функции 181 ----- и мартингалы 251 Вырожденное распределение 102, 107 Вырожденные процессы НО Гамеля уравнение 341, 348 Гамма-плотность 24, 62 — процесс, направляемый пуассонов- ским процессом 396 ----, направляющий пуассоновский процесс 395 — распределение 24, 62, 63, 207 ----, безграничная делимость 207, 363, 509, 635 ----как предел порядковых статис- тик 38 ----, подчинение 396 ----, приближение 256 ---- рандомизированное 75 — функция 62 Гармонические функции 282 Гейгера счетчики 222, 223, 422, 438, 526 Гёльдера неравенство 184 Гильбертово пространство 312, 713, 719 Гиперболические функции и плотно- сти 563, 590, 635, 665, 708 Гнеденко — Королюка теорема 54, 59 Гравитационные поля 203, 252, 253 Граничные условия 383, 536 Грина функция 380, 535, 556 Группировка данных 17 Гюйгенса принцип 67 Двойные орбиты 48 Двойственность 445, 682 Двустороннее преобразование Лапла- са 489 Двусторонняя показательная плот- ность 65, 563 --------, факторизация 681 --------, характеристическая функ- ция 563 Дисперсия 18, 60, 162 — инфинитезимальная 381 — условная 91 Диффузионные процессы в генетике 382 --------многомерном случае 390 ----и процессы размножения и ги- бели 557 ---- с упругой силой 381 Длина случайной цепи 242 Длительность диффузии 388—389 — периода занятости 533, 542 ----нечувствительности 223 — процесса восстановления 219, 253, 425 ----—, оценки 426 ---размножения 551 Дробная доля 175, 308 Дробовой эффект 209, 667
736 Предметный указатель Естественный масштаб в диффузии 379 Жордана разложения 164, 169 Задача о разорении 213, 233, 371, 527 --------в обобщенном пуассоновском процессе 213, 231, 527 --------, оценки 427, 464 Задержки в движении 222, 429, 438, 533, 556 Закон больших чисел 255, 271, 328, 401, 575 -------- для мартингалов 280 --------для одинаково распределен- ных случайных чисел 271 -------- для серий 361, 668 --------для стационарных последо- вательностей 284 -------, обратная теорема 279 --------слабый 273 --------усиленный 276, 279 --------Хинчина 272 — нуля или единицы 148, 149 Заражение 74 Значащие цифры 80 Йенсена неравенство 181, 251 Измеримое пространство 135 Измеримость 136 Изометрия 721 Индикатор множества 125 Индуцированное разбиение 36 Интеграл Дирихле 572 Интегрирование по частям 178 Интервал непрерывности 286 Инфинитезимальная скорость и дис- персия 381 Инфинитезимальные операторы 513 Исчезающие на бесконечности функ- ции 286 «Исчезновение», случайные блуждания 478 Канонические меры 627 Кантора диагональный метод 307 — тип распределения 50, ]67, 665 -------- (свертки) 173 Квазиустойчивое распределение 202 Ковариация 86 —, матрица 99 — процесса 108, 698, 724 Колмогорова дифференциальные урав- нения 370, 543 — неравенство 280, 284 ----- для мартингалов 280 — обратное уравнение 372, 544 — прямое уравнение 369, 373, 544 — Смирнова теорема 54, 389 — теорема о трех рядах 362 — Чепмена уравнение 77, 119, 380, 384, 392—394, 399, 400, 635 --------, дискретное время 119 -------- и полугруппы 399 --------, непрерывное время 367, 546 Компактность в схеме серий 353 Конкордантные (согласованные) функ- ции 247, 283 Координатные случайные величины 16, 86 Корреляция 86 Коши полугруппы 346 — распределение 66, 81, 203, 564 ----в броуновском движении 205, 395 ----в 89, 92, 121, 587, 666 ---- двумерное 587 ----симметричное в 89, 666 -------------М3 89 ----, случайное блуждание 227, 692 ----, устойчивость 203, 622 Крамера — Леви теорема 587 — оценка для вероятности разорения 214, 427, 456, 465 Критерий значимости 95 Кронекера лемма 277 — символ 543 — ядро 241, 543 Круг, равномерное распределение на нем 308, 314 Круговая симметрия 585—586 Кэмпбелла теорема 209, 329, 667 Лапласа второй закон распределения 65 — преобразование 270, 484, 524 ---- , примеры 492 ----, производные и моменты 490 ----, случайные блуждания 687 ----, элементарные свойства 489 — Стильтьеса преобразование 487, 528, 556 Лебега интеграл 128 — мера 48, 150 Никодима теорема 167 — пополнение 150 — Стильтьеса интеграл 128, 132, 156 — теорема о разложении 169 Леви каноническое представление 632 — Крамера теорема 587 — метрика 327 — Парето распределение 206 — примеры 252, 364, 636 Лежандра формула удвоения 81
Предметный указатель 737 Лестничные величины 225, 421, 441, 467 -----возрастающие слабо 444 -------- строго 443 -----в процессе ожидания 232 -----убывающие 445 — высоты 225, 421, 443, 450 — индексы 465 — моменты, распределения 443, 465, 466 — точки 441, 443 Линдеберга условие для диффузии 380 — условия 301, 328, 580 Линейные операции над стохастичес- кими процессами 699 — приращения в скачкообразных про- цессах 369 Линейный функционал 143 Логарифмы комплексных чисел 622 Логистическое распределение 68 Локально |компактные пространства 144, 147, 286 Ляпунова условно. 328 Мажорированная сходимость 133 Максвелла распределение 46, 63, 97 Максимальная оценка 463 — характеристическая функция 686, 691 — частная сумма 226, 233, 365, 455, 461, 473 Максимальное время возвращения 222, 437 Максимальный член 195, 202, 318, 329, 448, 455 -----влияние на сумму 522 см. также Порядковые статистики. Рекордные значения Маргинальные (частные) распределе- ния 85, 159, 185 — — заданные 195 ----- нормальные 121 Марковские процессы с дискретным временем 115, 121, 240, 254 ------------- и мартингалы 282 -------------} спектральная функ- ция 711, 721 -------------} эргодические теоре- мы 311 --------непрерывным временем 118, 366, 697 -------------в процессах восстано- вления 419 ----------------счетных простран- ствах 543 -------------и полугруппы 396, 511 ---------------- эргодические тео- ремы 429, 553 Марковское свойство 21 См. также Строго марковское свойство Мартингалы 245, 280 —, неравенства 280, 284 Масштабные параметры 60, 163 Математические ожидания 17, 140, 156 ---- условные 191 Медиана 32, 163 Медленно меняющиеся функции см. Правильно меняющиеся функции Мера скорости (speed measure) 380 Метрики 327 См. также Банахово пространство, Гильбертово прост- ранство, Минимальное решение, Винера — Хоп- фа уравнение 454 ----, дифференциальное уравнение Колмогорова 545 ----, диффузия 386 ----, полумарковские процессы 557 ----, скачкообразные процессы 375 Миттаг-Леффлёра функции 510 Моменты 18, 162, 178, 639 — восстановления 216, 417 — в процессах восстановления 425 — и производные 490 —, неравенство 183 —, проблема однозначности 264, 271, 576 --------в 592 —, производящие функции 489 —, сходимость 290, 309 —, Хаусдорфа проблема 260, 284 Монотонной сходимости принцип 132 ---- свойство 398 Монотонные последовательности 126 — функции 316—318 ----изменяющиеся доминируемо 317, 330 Направляющий процесс 394 Невозвратное распределение 688 Невозвратные случайные блуждания 236 -------, критерий 239, 448, 468, 687, 692 -------, уравнение восстановления и теорема для них 235, 432, 433, 482 Невозвратный или обрывающийся про- цесс восстановления 219, 424 Невозможность систем игры 250, 251 Независимость случайных величин 18, 87, 89, 145, 159 -------, комплексные величины 559
738 Предметный указатель --------, критерий для нее 161 Независимые приращения 116, 210, 335, 347, 362, 723 ---, подчиненность 394 ---, разрывы 334, 362 Неймана тождество 77 Нелинейное восстановление 439 Непосредственная интегрируемость по Риману 410 Непрерывность полугрупп 399 См. также Фиксированные разрывы Несмещенная оценка 256 Несобственные вероятностные меры 138, 155 — (дефектные) распределения 153, 155, 241 --------в процессах восстановления 218 Неудачи, устойчивость 29—31 Номер первого максимума 47L Норма 296, 397, 711, 719 —, топология, порождаемая 327 Нормальное распределение 61, 82, 106, 203, 563, 634 -----в Ю2, 585 -----вырожденное 107 -----двумерное 88, 91, 121 -----маргинальное 103, 105, 121, 195 ----- марковское 115 -----, область притяжения 358, 643 -----, характеристические свойства 82, 96, 103, 587 Нормальные полугруппы 342, 351, 363 Нормальный стохастический процесс 107, 718 Носитель меры 60 Нулевая схема серий 208, 654 Нулевое множество 149, 166, 711, 719 Область притяжения 201 -----и устойчивые распределения 643 -----, критерий для нее 356, 365, 643 — — нормальная 651 -----частичная 365, 636 Обобщенный пуассоновский процесс 211, 348, 368, 395 --------и полугруппы 340, 342 --------, разорение в нем 213, 233, 527 Образование колонн 55, 556 Обратное уравнение 380, 382, 390, 535 -----для полугрупп 400, 403 -----— полумарковских процессов 557 — — Колмогорова 372 -----, минимальное решение 375, 545 ----, скачкообразный процесс 372, 544 Обрывающийся или невозвратный про- цесс восстановления 219, 424 Обслуживание больных 214 Обслуживающие устройства См. Оче- реди Одновершинные (унимодальные) рас- пределения 186, 591 -------, свертки 197 Ожидания процесс 229, 244 Окружности и плотности на них 708 ----равномерное распределение на них 308, 314 ---- распределение вероятностей на них 314 ----распределения на них 43, 78, 702 —, теорема о покрытии 43 Оператор перехода 397 — сдвига 269, 295, 721 Операторы, связанные с распределе- ниями 295 Операционное время 212, 392 Орнстейна — Уленбека процесс 120, 381—382 Остаточные события 148 Остающееся время ожидания 220, 419 -------, предельная теорема 419, 437, 530 Осциллирующие случайные блужда- ния 240, 447 Отношение правдоподобия 247 Отражающий экран 386, 390, 522 Оценка 57 Очереди 70, 71, 82, 231 — и парадоксы 25 ----предельные теоремы 431 — параллельные 31, 32, 56 См. также Периоды занятости —, совместное распределение для прошедшего и остающегося времени ожидания 437 Ошибки округления 36, 79 t Парадокс контроля 219, 421 Парадоксы 25, 37, 219, 421 — времени ожидания 24, 421 Парето распределение 66, 206 Парсеваля равенство 521, 568, 688, 693, 694, 714, 716, 718 ------как критерий Хинчина 716 Первое возвращение 444, 479, 555 Первые прохождения, диффузия 204, 386, 535
Предметный указатель 739 ---- , марковские цепи 553 ----, процесс размножения и гибе- ли 77, 540, 554 Периодограмма 95 Периоды занятости 222, 234, 533, 542 Петербургская игра 274 Пирсона система распределений 63, 66 Планшереля преобразование 713 — тождество 571 < Плотность 15, 65, 84, 164 —, обозначения и определения 60 Поглощающие экраны 386, 522, 536, 537 Поглощение (физическое) 39, 45 Подчиненные процессы 392, 402, 508, 515, 642, 668 Пойа критерий 566, 570 — распределение 74 — урновая схема 74, 247, 267 Показательная формула для полугрупп 268, 400 Показательное распределение 13, 21, 54—59, 92 ---- двумерное 121 ---- двустороннее 65, 176 ----и равномерное распределение 59 ----как предел 38, 59, 420 См. так- же Гамма-распределение Положительно определенные матрицы 100 ----последовательности 708 ----функции 695 Положительные случайные величины 640 Полугруппы 269 — и безгранично делимые процессы- 332 ----марковские процессы 396 — Коши 346 — , Лапласа преобразование 511 — нормальные 342 — обобщенные пуассоновские 342 — , показательная формула 400 — , производящие операторы 403 — разрывные 348 — с конечными дисперсиями 341 — со сверткой 335 — устойчивые 349 Полумарковский процесс 543, 557 Полярные координаты 86 Попадания в случайных процессах 224, 238 Пополнение множеств 150 Популяция, рост 383, 385 —, случайное рассеяние 301 Порядковые статистики 32, 34, 37в 121 -----, предельные теоремы 38, 58 -----, применение к статистическому оцениванию 57 Потенциал 547 Потеря энергии 39, 368 См. также Столкновение частиц Потерянные вызовы 223, 556 Правильно меняющиеся функции 315, 320 Предельные теоремы 38, 285, 389 ----- и очереди 431 -------- распределение арксинуса 529 Принцип инвариантности 389 — отражения 205, 387, 536, 537 Притяжение См. Область притяжения Проекция случайных векторов 44, 46, 58 Произведение мер и пространств 145 Производные и преобразование Лап- ласа 490 Производящие операторы 336, 403, 512, 534 — функции, интерпретация с по- мощью «исчезновения» 478 -----, характеризация 259 Произвольная остановка 250 Пропуски (пробелы) большие 221, 428, 526 — малые 254 Прохождение света через сферу 45 Процесс авторегрессии 109, 117 — восстановления 25 -----с запаздыванием 219, 417 Прошедшее время ожидания 220, 437 -----, предельные теоремы 421, 530 Прямое уравнение 383, 544 -----и диффузия 383, 535 ----- полугруппы 400 -----процесс скачков 370, 373 -----Колмогорова 369, 373 -----, минимальное решение 375, 377, 545 Прямоугольная плотность 35, 65 Псевдопуассоновский процесс 367 -----, показательная формула 400 -----, полугруппа 401, 517 -----с линейными приращениями 369 Пуанкаре задача о рулетке 79 Пуассона распределение 25, 73, 634 -----обобщенное 622, 624, 625 -----симметризованное 176, 196, 635 — формула суммирования 80, 389, 704, 726 — ядро 702, 726 Пуассоновские ансамбли 22, 23, 28 См, также Гравитационные поля
740 П редметный указатель — распределения, аппроксимация с их помощью 328 Пуассоновский процесс 24, 28 -----как предел в процессах восста- новления 420 ----, направляемый гамма-процессом 395 -----, направляющий гамма-процесс 396 -----, пробелы 428 -----, supremum 214 -----, характеристические функции 561, 572 -----, центральная предельная тео- рема 579, 605 Римана—Лебега теорема 575, 603, 704 Рисса теорема о представлении 144, 160, 289 Рулетка 36, 79 Руше теорема 460 Равенство Парсеваля 521 Равномерное распределение 35, 65, 562, 563 ----- на сфере 87 Равностепенная непрерывность 291, 310 Радона-Никодима производная 165 ----- теорема 167 Разбиения шахматные 158 Различные распределения 360 Разложения 639 Размножения и гибели процессы 538, 557 ---------- — и диффузия 557 ----------t периоды занятости в них 542 См. также Рандомизированные случайные блуждания — процесс 56, 306, 548 -----двусторонний 551 * * Разности (обозначения) 257 Разрывы 363 — фиксированные (скачки) 370, 374 Райкова теорема 639 Рандомизация 69 — и подчиненные процессы 392 —, полугруппы 269, 401 —, симметрично зависимые случайные величины 265 Рандомизированные случайные блуж- дания 75, 538, 634 Расслоение 73 Расстояние между распределениями 327 Расхождение См. Эмпирические рас- пределения Регрессия 90, 109 Регулярное стохастическое ядро 312 Резольвентное уравнение 509, 519, 546 Резольвенты 484, 509, 512, 546 — и полная монотонность 519 Рекордные значения 29, 55 См. также Порядковые статистики Решающая функция 250 Решетчатые распределения 164, 174 Самовосстанавливающиеся совокупно- сти 219 Свертка ядер 241 Свертки 169, 312, 319 — бесконечные 305, 361, 664 — и преобразование Лапласа 489 ---теоремы о покрытии 41 — на окружности 81, 170, 314 — определение 19 — плотностей 19, 61, 89 — сингулярных распределений 173 — формула 15, 16 Свободный пробег 23 Сглаживание 108, 170, 601 Сдвиг, оператор 269, 295, 721 — , полугруппы 337, 404 — принцип 488 Сдвиги случайные 47 Сепарабельность 309 Сервостохастический процесс (меха- низм) 123 Серии 5 См. также Рекордные зна- чения Сжатие 397, 516 Сильная непрерывность в нуле 399 — сходимость 296, 399 Симметризация 175 — , неравенства 176 Симметрично зависимые величины 265, 477 --------, центральная предельная теорема 328 Симметричные распределения 202, 589 — события 149 Сингулярные (вырожденные) распреде- ления 51, 129, 167 —-------, свертки 173, 665 Скалярное произведение 712 Скачкообразный процесс 371 ---с бесконечным числом скачков 376, 544 Скользящее среднее 108, 722 Скрытая периодичность 95 Слабая сходимость 288 Случайная величина 16, 86, 139, 155, Й58
Предметный указатель 741 -----, независимость, последователь- ности 147—149 Случайные блуждания биномиальные 680 -----в St1 224, 235, 440, 670 ----------и эмпирическое распреде- ление 53 ----------простые (Бернулли) 250, 363, 445, 447, 479, 493 ----------сопряженные 458 --------.У1Г 47 ---------- , центральная предель- ная теорема 300 -----, порождаемые распределением 441 — направления 44, 58, 169, 173, 243, 585 — последовательности 147 — разбиения 36, 39, 57, 93, 122 См. также Теоремы о покрытии — суммы 70, 188, 197, 564 -----, характеристическая функция 564 -----, центральная предельная теоре- ма 304, 593 — цепи 242 -----, длина 22 Случайный вектор 46, 47, 129 См. также Случайные направления — выбор 14, 35, 87 -----и бросание монеты 49 См. так- же Теоремы о покрытии, Случайные разбиения Смеси 69, 92, 187, 194 —, преобразование Лапласа 493, 564 Снедекора плотность 64 Снос в диффузии 381 -----случайных блужданиях 448, 683 Собственное распределение 155 -----, сходимость 286, 326 Совместное распределение 90, 477 Совпадения 254 Сопряженные случайные блуждания 458 Спарре-Андерсена преобразование 475 Спектр мощностей 698 Спектральная мера 698, 700, 725 -----, представление для унитарных операторов 721 Статистика 32 Стационарная марковская последова- тельность 118 — мера и вероятность 244, 313 Стационарное приращение 211, 335 Стационарные процессы 107, 122, 697 -----закон больших чисел 284 См. также Стационарный режим* Эрго- дическая теорема Стационарный режим (steady state) 27, 243, 371 ----в процессах восстановления 420, 437 Стирлинга формула 63 Столкновение частиц 242, 368, 370 Стохастическая ограниченность 293, 353 Стохастические интегралы 724 — и случайные процессы 718 Стохастическое разностное уравнение 110—111 — ядро 188, 240, 311, 396, 398 Строгая непрерывность полугрупп 511 Строго марковское свойство 34 — устойчивые распределения 199 Стъюдента плотность 64 Субмартингал 251, 280 Субстохастическое ядро 241 Суммируемость по Абелю 701, 703, 726 ----Чезаро 703, 726 Суперпозиция процессов восстановле- ния 420 Схемы серий 208, 253, 352, 653, 668 Сходимость в среднем квадратичном 712 — мажорированная 133 — мер 285, 307—310, 326—327 — моментов 290, 309 — операторов 296, 327, 399 —, основные понятия и обозначения 286 — плотностей 290 — по вероятности 292 — сильная 296, 399 — слабая 288 Счетно-аддитивные функции (сг-адди- тивные) 130, 142, 154 Счетные пространства состояний 377 Счетчики 422 См. также Гейгера счет- чики, Очереди Такача интегральное уравнение 532 Тауберовы теоремы 411, 498 ----, применение 472, 504, 526, 529, 685 Тейлора ряд (разложение) 573, 576, 577, 598, 600 — формула 356 ----обобщенная 267 Телефонные вызовы 73, 210 ----потерянные 223, 556 См. так- же Периоды занятости Теорема непрерывности 484, 569 ----для плотностей 571
742 П редметный указатель -----, Лапласа преобразования 486 -----, характеристические функции 570, 571 — об аппроксимации в среднем 133 — о продолжении 142, 147 -----равномерном распределении дробных долей 308 ----- среднем значении 131 ----- трех рядах 362 . Теоремы о выборе 307 -----покрытии 96, 253, 527 -------- и свертки 41 Теория надежности 68 — страхования 214 См. также За- дача о разорении Тип распределения 60, 162 -----, сходимость 291 Точка роста 163, 174 Точки первого вхождения (достиже- ния) в процессах восстановления 220,. 421, 480 См. также Лестничные ве- личины -------------случайных блужданиях 480, 670 Точные выражения 227 Транспортные задачи 55, 222, 429, 438, 533 Треугольная плотность 41, 65, 562, 563 Треугольника неравенство 295 Тэта-функции 389, 708 Универсальные законы Дёблина 663 Унимодальность по Хинчину 187, 591 Унитарные операторы в гильбертовом пространстве 721 Упругая сила 381 Уравнение восстановления 217, 407, — — для всей прямой 236, 482 -----, процесс 25, 216, 417 Уравнения восстановления, теоремы 406, 411, 432, 439 Условная вероятность 186 Условные распределения и математи- ческие ожидания 90, 185, 189 Устойчивое распоеделение 198, 504, 643, 645 -----в М2 666 --------узком смысле (строго устой- чивое) 199 ------- —широком смысле 199 --------экономике 205 -----, область притяжения 201, 643 -----, подчинение 395, 508 -----, положительное 504 — — порядка х/2 68, 82, 203, 363, 492 -----, произведение 206 -----, симметричное 202, 669 —---, характеристический показа- тель 199 Устойчивые плотности 651 Фату лемма 132, 712 ----для граничных значений 283 Фиксированные разрывы (скачки) 370, 374 Фильтр 108, 699 Фишера Z-статистика 64 Фоккера—Планка уравнение 338, 368, 369, 370, 373 Формула обращения 167, 257, 568, 714 ----и проблема моментов 264 ----, характеристические функции 570, 572, 587 — удвоения 81 Фреше максимальное распределение 195 Фубини теорема 133, 171 Функции интервалов 128, 153 — простые 156 Функционал линейный 143 Фурье интегралы, обращение 570, 572 713 — коэффициенты 702, 708, 717, 721 — преобразование 559, 597 См. так- же Планшереля преобразование — ряд 701, 717 — Стильтьеса преобразование 559, 6/9 Характеристические функции 558 ----безгранично делимые 621, 624, 628, 631 ----и их. логарифмы и корни 621 ----многомерных распределений 584 --------‘ нормальных распределений 585 ----периодические 566, 572, 701, 703, 704 ----, производные 633 ----, разложение Тейлора 576 См. также Пуассона формула суммиро- вания Характеристический показатель рас- пределения R 199 Хи-квадрат, плотность 63 Хилле — Иосида теорема 516, 534 Хинчина закон больших чисел 272, 491—492 — каноническое представление 633 — критерий 716 ----унимодальности 187, 591 — Поллачека формула 463, 528, 691 Хольцмарка распределение 202, 203, 252, 253
П редметный указатель 743 Центральная предельная теорема 297—305, 328, 333, 593, 595 — — —, асимптотические разложе- ния 595 и т. д. ----—, бесконечная дисперсия 299 ----—, большие отклонения 615 ----— для одинаково распределен- ных слагаемых 576 -----------плотностей 597 --------, приложения 245, 592—594 --------, процессы восстановления 422 Центрирование 60, 163, 655 — безгранично делимых распределе- ний 625 Цепи, прочность 22 — случайные 242 Цифры, распределение 49, 80 Частичное притяжение 365, 636, 661 Частицы, изменения направления движения 368 —, расщепление 39, 57, 122 Ср. Столк- новение частиц Частные (маргинальные) распределе- ния 85, 159, 185 -------, заданные 195 ------- нормальные 121 Чебышева неравенство 179, 354, 402 ----, обобщение 272 ------- на мартингалы 284 — Эрмита полином 609 Чепмена — Колмогорова уравнение, дискретное время 119 ---—, непрерывное время 367, 546 -------, полугруппы 399 Чистого размножения процессы (birth processes) 56, 306, 548 ---—, двусторонние 551 Шаг распределения 164 Шварца неравенство 180, 559, 590, 720 Шлёмильха формула 77, 635 Шум 328 См. также Дробовой эффект Эджворта разложение 599, 607 Эквивалентные функции 149, 712, 719 Экраны см. Поглощающие экраны, Граничные условия Эмпирические распределения 51 Эндоморфизм 397 Эргодические стохастические ядра 311 — пределы 551 — теоремы 311, 551 См. также Стационарный режим Эрланга распределение 63 Эрмита полиномы 597, 607 Ядро стохастическое 188, 240, 311, 396, 398 Якоби тэта-функция 389, 708 — о-аддитивность 130 — алгебра 134 — • конечная мера 138
именной указатель Амбарцумян В. А. 242, 370, 371 Анникян (Hennequin Р. L.) 124 Байес (Bayes Т.) 72 Бакстер (Baxter G.) 456, 478, 640, 677 Баруча-Рид (Barucha-Reid А. Т.) 733 Бенеш (Benes V. Е.) 429, 733 Бенфорд (Benford F.) 80 Бергстрём (Bergstrom Н.) 651 Бернштейн С. Н. 98, 495 Берри (Berry А. С.) 595 601, 608 Бизли (Bizley M.T.L.) 474 Бикел (Bickel Р. J.) 439 Биллингсли (Billingsley Р.) 54, 304. 390 Блекуэлл (Blackwell D.) 408, 432 Блам (Blum J. R.) 328 Боль (Bohl) 308 Боровков А. А. 228 Боттс (Botts Т. А.) 124 Бохнер (Bochner S.) 366, 394, 511, 695, 697, 709, 732 Брело (Brelot М.) 283 Будро (Boudreau Р. Е.) 231 Бурбаки (Bourbaki N.) 124 Бюльман (Biihlmann FI.) 266 Вальд (Wald А.) 265, 449, 459, 675 Вебер (Weber Н.) 493 Вейль (Weyl Н.) 308 Виленкин И. Я. 697 Винер (Wiener N.) 212, 411, 455, 716 Винтнер (Wintner А.) 197 Вольд (Wold Н.) 585 Вольфовиц (Wolfowitz J.) 235, 314, 432 Гальтон (Galton F.) 91 Гейтлер (Heitler W.) 368 Гельфанд И. М. 697 Герглотц (Herglotz G.) 709 Гилберт (Gilbert Е.) 254 Гири (Geary R. С.) 106 Гнеденко Б. В. 53, 54, 318, 595, 605, 6519 663, 733 Гренандер (Grenander U,) 96, 732, 733 Гринвуд (Greenwood М.) 74 Гриффин (Griffin J. S.) 231 Гуд (Good D. I.) 532 Гумбел (Gumbel Е. J.) 195 Дарлинг (Darling D. А.) 523 Дворецкий (Dvoretzky А.) 314 Дени (Deny С. R.) 433 Дерман (Derman С.) 554 Дёблин (Doblin W.) 202, 663 Джозеф (Joseph A. W.) 474 Донскер (Donsker М.) 54, 390 Дуб (Doob J. L.) 124, 193, 246, 283, 733 Дынкин Е. Б. 366, 380, 530, 732 Зигмунд (Zygmund А.) 633 Золотарев В. М. 608 Иахав (Yahav J. А.) 439 Ибрагимов И. А. 197 Иосида (Yosida К.) 366, 733 Ито (Ito К.) 380, 732 Кантор (Cantor G.) 307 Карамата (Karamata J.) 202, 285, 315, 320, 502 Карлеман (Carleman Т.) 264, 576 Карлин (Karlin S.) 265, 432, 733 Кац (Кас М.) 98, 231, 389 Кац (Katz М. L.) 611 Кельвин, лорд (Kelvin 387) Кемперман (Kemperman J. И. В.) 732 Кендалл (Kendall D. G.) 228, 269, 532 Кингман (Kingman J. F. С.) 217 Кифер (Kiefer J.) 235 Колмогоров А. Н. 54, 147, 148, 210, 370, 379, 595, 605, 733 Королюк В. С. 53, 54, 59 Котельников В. А. 706 Коши (Cauchy А.) 202, 570 Крамер (Cramer Н.) 214, 428, 456, 585,
Именной указатель 745 587, 595, 607, 613, 614, 619, 724, 733 Крикеберг (Krickeberg К.) 124, 732 Ламперти (Lamperti А.) 222 Ландау Л. Д. 368 Ландау (Landau Е.) 389, 502 Лаха (Laha R. G.) 732 Леви (Levy Р.) 202, 204, 210, 212, 246, 252, 301, 314, 348, 358, 363, 557, 576, 587, 632, 636, 640, 644, 659, 663, 732, 733 Ле Кам (Le Cam L.) 328 Линдеберг (Lindeberg J. W.) 576 Линдли (Lindley D. V.) 228, 440 Литл (Little J. D. C.) 533 Литлвуд (Littlewood J. E.) 183, 502 Лоэв (LoeveM.) 124, 125, 266, 304, 366, 732 Лукач (Lukacs E.) 106, 732 Лундберг (Lundberg F.) 214 Маккин (McKean H. P. Jr.) 380, 732 Макшейн (McShane E. J.) 124 Мандельброт (Mandelbrot B.) 206, 329 Марков A. A. 265 Маршалл (Marshall A. W.) 284 Мидлтон (Middleton D.) 707 Миллер (Miller H. D.) 675 Миллс (Mills H. D.) 123 Мюнц (Muntz H. Ch.) 284 Найквист (Nyquist N.) 706 Неве (Neveu J.) 124, 732 фон Нейман (Neumann J.) 59 Нейман (Neyman J.) 213 Нелсон (Nelson E.) 121, 394 Ньюэл (Newell G. F,) 55 Орей (Orey S.) 432 Осипов Л. В. 611 Пайк (Pyke R.) 214, 441, 529, 557 Партасарати (Parthasarathy К* RJ 124 Петерсен (Petersen D. P.) 707 Петров В. В. 611, 619 Пинкхэм (Pinkham R. S.) 81 Пирсон (Pearson К.) 63 Питмэн (Pittman E. J.) 633 Пойа (Polya G.) 183, 202, 213 Полард (Pollard H.) 408, 432 Полак (Pollak H. O.) 254 Подачек (Pollaczek F.) 233 Порт (Port S. C.) 320 Прабху (Praj)hu N. U.) 733 Прохоров Ю. В. 54, 390 Пуанкаре (Poincare H.) 79 Райт (Wright S.) 383 Райт (Wright E. M.) 308 Рвачева E. Л. 54 Реньи (Renyi A.) 390 Риордан (Riordan J.) 733 Рисе (Riesz M.) 269 Рихтер (Richter W.) 619 Роббинс (Robbins H. E.) 121, 304, 408 Розенблат (Rosenblatt M.) 96, 328, 733 Ройден (Royden H. L.) 265 Рэй (Ray D.) 379 Рэлей, лорд (Rayleigh; Стрэтт Дж. У.) 47, 586 Серпинский (Sierpinski W.) 308 Скелам (Skellam J. G.) 301 Скитович В. П. 98 Скороход А. В. 54, 733 Смирнов Н. В. 54, 58 Смит (Smith W. L.) 411, 432, 557 Спар ре-Андерсен (S parre-Andersen Е.) 440, 466, 472—475 Спицер (Spitzer F.) 233, 441, 456, 472, 677, 685, 691, 732 Стадден (Studden W.) 265, 733 Стейн (Stein С.) 673 Стейтель (Steutel F. W.) 509 Стивенс (Stevens W. L.) 96 Стильтьес (Stieltjes Т. J.) 265 Сэвидж (Savage L. J.) 148, 266 Тамаркин Я. Д. 265, 284 Таннер (Tanner J. С.) 222 Тейчер (Teicher Н.) 328 Титчмарш (Titchmarsh Е. С.) 628 Тортра (Tortrat А.) 124, 665 Троттер (Trotter Н. F.) 301 Угахери (Ugaheri Т.) 254 Уилкс (Wilks S. S.) 55 Уиттекер (Whittaker J. М.) 707 Уоллес (Wallace D. L.) 608 Уолш (Walsh J. W.) 67 Уэкс (Wax N.) 47, 733 Фейер (Fejer L.) 703 Феллер (Feller W.) 69, 78, 210, 228, 301, 320, 330, 370, 377, 379, 383, 408, 432, 486, 543, 557, 612, 619. 651 Филлипс (Phillips R. S.) 269, 336, 511, 733 де Финетти (Finetti В.) 58, 210, 267 Фишер (Fisher R. А.) 96, 318, 383 Фукс (Fuchs W, Н, J.) 687, 689
746 Именной указатель Халмош (На Im os Р. R.) 124, 250 Хант (Hunt G.) 247 Харди (Hardy G. Н.) 183, 308, 502 Харрис (Harris Т. Е.) 282 Хаусдорф (Hausdorff F.) 262 Хейди (Неуde С. С.) 264 Хелли (Helly Е.) 307 Хилле (Hille Е.) 268, 269, 336, 460, 511, 588, 733 Хинчин А. Я. 162, 202, 210, 459, 591, 632, 659, 663, 716, 733 Хоби (Hobby С.) 441 Хопф (Hopf Е.) 455 Хьюиг (Hewitt Е.) 148, 266 Чандрасекар (Chandrasekhar S.) 47 Чебышев П. Л. 179 Чернов (Chernoff Н.) 328 Чжоу (Chow Y. S.) 408 Чжун (Chung К. L.) 126, 197, 269, 402, 432, 543, 687, 689, 732 Шапиро (Schapiro J. М.) 640 фон Шеллинг (Schelling Н.) 244 Шеннон (Shannon С.) 706 Шепп (Shepp L.) 82, 187, 692, 726 Шмидт (Schmidt R.) 502 Шоке (Choquet G.) 433, 665 Шохат (Shohat J. А.) 265, 284 Эйнштейн (Einstein A. Jr.) 213, 379 Эрдёш (Erdos Р.) 389, 408 Эссеен (Esseen G.) 605, 608, 609, 611 Эсшер (Esscher F.) 619 Юл (Yule G. U.) 74 Яглом А. М. 733 Яноши (Janossy L.) 368
ОГЛАВЛЕНИЕ Из предисловия к русскому изданию 1967 г............................. 5 От переводчика....................................................... 6 Предисловие к первому изданию..................................... 7 Предисловие ко второму изданию................................... 10 Обозначения 12 Глава I. Показательные и равномерные плотности..................... 13 § 1. Введение................................................. § 2. Плотности. Свертки................................. . . § 3. Показательная плотность............................ . . § 4. Парадоксы, связанные с временем ожидания. Пуассоновский процесс ...................................................... § 5. Устойчивость неудач.............................„ ... . § 6. Времена ожидания и порядковые статистики................. § 7. Равномерное распределение............................... § 8. Случайные разбиения..................................... § 9. Свертки и теоремы о покрытии............................ § 10. Случайные направления................................... § 11. Использование меры Лебега............................... § 12. Эмпирические распределения.............................. § 13. Задачи.................................................. 13 15 21 24 29 31 35 39 41 44 48 51 54 Глава II. Специальные плотности. Рандомизация.................... § 1. Обозначения и определения ....... ....................... § 2. Гамма-распределения...................................... § 3. Распределения математической статистики, связанные с гамма- распределением ............................................... Некоторые распространенные плотности .................... Рандомизация и смеси..................................... Дискретные распределения ................................ Бесселевы функции и случайные блуждания.................. Распределения на окружности.............................. § 9. Задачи................................................... §4. §5. § 6. §7. § 8. 60 60 62 63 65 69 72 74 78 81 Глава III. Многомерные плотности. Нормальные плотности и процессы § 1. Плотности.............................................. § 2. Условные распределения.................................. §3. Возвращение к показательному и равномерному распределениям § 4. Характеризация нормального распределения................ § 5. Матричные обозначения. Ковариационная матрица........, § 6. Нормальные плотности и распределения................... § 7. Стационарные нормальные процессы ....................... § 8. Марковские нормальные плотности........................ § 9, Задачи .................................................. 84 84 90 92 96 99 102 107 115 120
748 Оглавление Глава IV. Вероятностные меры и пространства........................ 124 § 1. Бэровские функции......................................... 125 § 2. Функции интервалов и интегралы в ......................... 128 § 3. о-алгебры. Измеримость.................................... 134 § 4. Вероятностные пространства. Случайные величины.......... 138 § 5. Теорема о продолжении . .................................. 142 § 6. Произведения пространств. Последовательности независимых случайных величин.............................................. 145 § 7. Нулевые множества. Пополнение............................. 149 Глава V. Вероятностные распределения в ............................. 151 § 1. Распределения и математические ожидания.................... 152 § 2. Предварительные сведения............................ 162 § 3. Плотности.................................................. 164 § 4. Свертки.................................................... 164 § 5. Симметризация.............................................. 175 § 6. Интегрирование по частям. Существование моментов.........- 178 § 7. Неравенство Чебышева....................................... 179 § 8. Дальнейшие неравенства. Выпуклые функции................... 180 §9. Простые условные распределения. Смеси.................... 185 § 10. Условные распределения................................... 189 §11. Условные математические ожидания......................... 191 § 12. Задачи.................................................... 195 Глава VI. Некоторые важные распределения и процессы................ 198 § 1. Устойчивые распределения в ............................... 198 § 2. Примеры................................................... 203 § 3. Безгранично делимые распределения в 511................... 206 § 4. Процессы с независимыми приращениями...................... 210 § 5. Обобщенные пуассоновские процессы и задачи о разорении . . 213 § 6. Процессы восстановления................................... 215 § 7. Примеры и задачи.......................................... 219 § 8. Случайные блуждания....................................... 224 § 9. Процессы массового обслуживания........................... 228 § 10. Возвратные и невозвратные случайные блуждания.......... 235 § 11. Общие марковские цепи.................................... 240 § 12. Мартингалы............................................... 245 § 13. Задачи................................................... 252 Глава VII. Законы больших чисел. Применения в анализе............ 255 § 1. Основная лемма. Обозначения............................. 255 § 2. Полиномы Бернштейна. Абсолютно монотонные функции . . . 258 § 3. Проблема моментов....................................... 260 § 4. Применение к симметрично зависимым случайным величинам 265 § 5. Обобщенная формула Тейлора и полугруппы............. 267 § 6. Формулы обращения для преобразования Лапласа............ 270 § 7. Законы больших чисел для одинаково распределенных случай- ных величин................................................ 271 § 8. Усиленный закон больших чисел ......................... 275 § 9. Обобщение для мартингалов............................... 280 § 10, Задачи ............................................. 283
Оглавление 749 Глава VIII. Основные предельные теоремы........................... 285 § 1. Сходимость мер.......................................... 285 § 2. Специальные свойства..................................... 291 § 3. Распределения как операторы.............................. 293 § 4. Центральная предельная теорема........................... 297 § 5. Бесконечные свертки...................................... 305 § 6. Теоремы о выборе......................................... 307 § 7. Эргодические теоремы для цепей Маркова................... 311 § 8. Правильно меняющиеся функции............................. 315 § 9. Асимптотические свойства правильно меняющихся функций . . 320 § 10. Задачи............................................... 326 Глава IX. Безгранично делимые распределения и полугруппы......... 332 § 1. Общее знакомство с темой................................. 332 § 2. Полугруппы со сверткой................................... 335 § 3. Подготовительные леммы................................... 339 § 4. Случай конечных дисперсий................................ 341 § 5. Основные теоремы ........................................ 343 § 6. Пример: устойчивые полугруппы............................ 349 § 7. Схемы серий с одинаковыми распределениями................ 352 § 8. Области притяжения...................................... 356 § 9. Различные распределения. Теорема о трех рядах............ 360 § 10. Задачи................................................. 363 Глава X. Марковские процессы и полугруппы . . .<.................. 366 § 1. Псевдопуассоновский тип.................................. 367 § 2. Вариант: линейные приращения............................. 369 § 3. Скачкообразные процессы.................................. 371 § 4. Диффузионные процессы в 5&1.............................. 378 § 5. Прямое уравнение. Граничные условия...................... 383 § 6. Диффузия в многомерном случае............................ 390 § 7. Подчиненные процессы..................................... 392 § 8. Марковские процессы и полугруппы......................... 396 § 9. «Показательная формула» в теории полугрупп............... 400 § 10. Производящие операторы. Обратное уравнение.............. 403 Глава XI. Теория восстановления................................... 406 § 1. Теорема восстановления.................................. 406 § 2. Доказательство теоремы восстановления.................... 412 § 3. Уточнения................................................ 415 § 4. Устойчивые (возвратные) процессы восстановления.......... 417 § 5. Число N/ моментов восстановления......................... 422 § 6. Обрывающиеся (невозвратные) процессы..................... 424 § 7. Различные применения..................................... 427 § 8. Существование пределов в случайных процессах............. 429 § 9. Теория восстановления на всей прямой..................... 431 § 10. Задачи................................................. 437 Глава XII. Случайные блуждания в ................................. 440 § 1. Основные понятия и обозначения......................... 441 § 2. Двойственность. Типы случайных блужданий................. 445 § 3. Распределение лестничных высот. Факторизация Винера — Хопфа......................................................... 450 § 4. Примеры.............................................. 457 § 5. Применения........................................... 461 § 6. Одна комбинаторная лемма............................. 465 $ 7. Распределение лестничных моментов.................... 466
750 Оглавление § 8. Закон арксинуса........................................... 470 § 9. Различные дополнения...................................... 477 § 10. Задачи................................................... 479 Глава XIII. Преобразование Лапласа. Тауберовы теоремы. Резольвенты 484 § 1. Определения. Теорема непрерывности........................ 484 § 2. Элементарные свойства..................................... 489 § 3. Примеры................................................... 492 § 4. Вполне монотонные функции. Формулы обращения.............. 495 § 5. Тауберовы теоремы......................................... 498 § 6. Устойчивые распределения.................................. 504 § 7. Безгранично делимые распределения......................... 506 § 8. Многомерный случай........................................ 509 § 9. Преобразования Лапласа для полугрупп.................. 511 § 10. Теорема Хилле—Иосиды..................................... 516 § 11. Задачи................................................... 521 Глава XIV. Применение преобразования Лапласа....................... 524 § 1. Уравнение восстановления: теория.......................... 524 § 2. Уравнение типа уравнения восстановления: примеры.......... 526 § 3. Предельные теоремы, включающие распределения арксинуса 529 § 4. Периоды занятости и соответствующие ветвящиеся процессы 531 § 5. Диффузионные процессы..................................... 534 § 6. Процессы ^размножения и гибели. Случайные блуждания . . . 538 § 7. Дифференциальные уравнения Колмогорова.................... 543 § 8. Пример: чистый процесс размножения........................ 548 § 9. Вычисление эргодических пределов и времен первого прохож- дения ......................................................... 551 § 10. Задачи.................................................. 555 Глава XV. Характеристические функции............................... 558 § 1. Определение. Основные свойства............................ 558 § 2. Специальные плотности. Смеси.............................. 562 § 3. Единственность. Формулы обращения......................... 568 § 4. Свойства регулярности..................................... 573 § 5. Центральная предельная теорема для одинаково распределенных ' слагаемых ..............................е...................... 576 § 6. Условие Линдеберга.................*...................... 580 § 7. Характеристические функции многомерных распределений . . 584 § 8. Две характеризации нормального распределения.............. 587 § 9. Задачи . ................................................. 590 Глава XVI. Асимптотические разложения, связанные с центральной предельной теоремой .......................................... 595 § 1. Обозначения.............................................. 596 § 2. Асимптотические разложения для плотностей................ 597 § 3. Сглаживание.............................................. 601 § 4. Асимптотические разложения для распределений............. 604 § 5. Теорема Берри—Эссеена . . ...................... 608 § 6. Асимптотические разложения в случае различно распределен- ных слагаемых................................................. 612 § 7. Большие отклонения..................... • ........... 615
Оглавление 751 Глава XVII. Безгранично делимые распределения .................... 621 § 1. Безгранично делимые распределения........................ 621 § 2. Канонические формы. Основная предельная теорема.......... 625 § 3. Примеры и специальные свойства........................... 634 § 4. Специальные свойства............................... 638 § 5. Устойчивые распределения и их области притяжения .... 643 § 6. Устойчивые плотности................................ 651 § 7. Схема серий........................................ 653 § 8. Класс L............................................. 659 § 9. Частичное притяжение. «Универсальные законы»........ 661 § 10. Бесконечные свертки............................... 664 § 11. Многомерный случай................................ 665 § 12. Задачи............................................ 666 Глава XVIII. Применение методов Фурье к случайным блужданиям . . 670 § 1. Основное тождество.................................. 670 § 2. Конечные интервалы. Вальдовская аппроксимация....... 673 § 3. Факторизация Винера — Хопфа......................... 676 § 4. Выводы и применения................................. 682 § 5. Две более основательные теоремы..................... 685 § 6. Критерии возвратности............................... 687 § 7. Задачи.............................................. 690 Глава XIX. Гармонический анализ............................ 693 § 1. Равенство Парсеваля................................. 693 § 2. Положительно определенные функции................... 695 § 3. Стационарные процессы............................... 697 § 4. Ряды Фурье.......................................... 701 § 5. Формула суммирования Пуассона....................... 704 § 6. Положительно определенные последовательности........ 708 § 7. /Лтеория............................................ 711 § 8. Случайные процессы и стохастические интегралы....... 718 § 9. Задачи.............................................. 725 Ответы на задачи............................................... 728 Литература..................................................... 732 Предметный указатель........................................... 734 Именной указатель , ...................................• . . . 744
УВАЖАЕМЫЙ ЧИТАТЕЛЬ! Ваши замечания о содержании кни- ги, ее оформлении, качестве перевода и другие просим присылать по адресу: 129820, Москва И-110, ГСП, 1-й Риж- ский пер., д. 2, издательство «Мир». Вильям Феллер ВВЕДЕНИЕ В ТЕОРИЮ ВЕРОЯТНОСТЕЙ И ЕЕ ПРИЛОЖЕНИЯ В 2-х томах Том 2 Старший науч, редактор А. А. Бряндинская Младший науч, редактор Т. А. Денисова Художественный редактор В. И. Шаповалов Художник Е. И. Волков Технический редактор Н. И. Борисова Корректор А. Я Шехтер ИБ № 3129 Сдано в набор 26.10.83. Подписано к печати 14.05.84. Формат 60Х901/!-. Бумага типограф- ская № 2. Гарнитура литературная. Печать высокая. Объем 23,50 бум. л. Усл. печ. л. 47,00. Усл. кр.-отт. 47,00. Уч.-изд.л. 46,53. Изд. № 1/1767. Тираж 40 000 экз. Зак. 249. Цена 3 р. 50 к. ИЗДАТЕЛЬСТВО «МИР» 129820, Москва, И-110, ГСП 1-й Рижский пер„ 2 Набрано и сматрицировано в ордена Октябрь- ской Революции и ордена Трудового Красного Знамени Первой Образцовой типографии имени А. А. Жданова Союзполиграфпрома при Государственном комитете СССР по делам издательств, полиграфии и книжной торговли. Москва, М-54, Валовая, 28. Отпечатано в Ленинградской типографии № 2 головном предприятии ордена Трудового Крас- ного Знамени Ленинградского объединения «Техническая книга» им. Евгении Соколовой Союзполиграфпрома при Государственном комитете СССР по делам издательств, поли- графии и книжной торговли. 198052, г. Ленинград, Л-52, Измайловский проспект, 29.