Текст
                    А.Н.КОЛМОГОРОВ
ТЕОРИЯ
ВЕРОЯТНОСТЕЙ
и
МАТЕМАТИЧЕСКАЯ
СТАТИСТИКА

АКАДЕМИЯ НАУК СССР Отделение математики
АНДРЕЙ НИКОЛАЕВИЧ КОЛМОГОРОВ 30-е годы
А.Н.КОЛМОГОРОВ ТЕОРИЯ ВЕРОЯТНОСТЕЙ и МАТЕМАТИЧЕСКАЯ СТАТИСТИКА Ответственный редактор академик 10. В. ПРОХОРОВ В 0 МОСКВА «НАУКА» 1986
УДК 519.2 Колмогоров А. Н. Теория вероятностей и ма- тематическая статистика: [Сб. статей].—М.: Наука, 1986.— 535 с. Настоящее издание представляет собой вторую книгу избранных трудов А. Н. Колмогорова. В ней помещены исследования по теории вероятностей (ос- нования, предельные теоремы, случайные процессы, разнообразные приложения), математической статис- тике и некоторым другим вопросам. Редакционная коллегия: Н. Н. БОГОЛЮБОВ (главный редактор), С. М. НИКОЛЬСКИЙ, А. М. ОБУХОВ, Ю. В. ПРОХОРОВ, В. М. ТИХОМИРОВ, А. Н. ШИРЯЕВ Составитель А. Н. ШИРЯЕВ Рецензенты: Б. В. ГНЕДЕНКО, С. X. СИРАЖДИНОВ 1702060000—234 К 042(02)-86 126-86-III © Издательство «Наука», 1986 г.
ОТ РЕДАКЦИИ В соответствии с постановлением Президиума АН СССР первая книга избранных трудов академика А. Н. Кол- могорова «Математика и механика» (М.: Наука) выш- ла в свет в 1985 г. Запланированную к изданию вторую книгу трудов А. Н. Колмогорова редакционная колле- гия сочла целесообразным разбить на две: в первой из них собраны труды по теории вероятностей и математи- ческой статистике, во второй — по теории информации и теории алгоритмов. В списке трудов А. Н. Колмого- рова, помещенном в первой книге, отмеченные двумя звездочками работы естественным образом должны быть разделены на помещенные в настоящей второй книге и подготовленные к опубликованию в третьей книге. Подготовка второй и третьей книг избранных трудов А. Н. Колмогорова осуществлена Ю. В. Прохоровым и А. Н. Ширяевым.
НЕСКОЛЬКО СЛОВ ОБ А. Н. КОЛМОГОРОВЕ * П, С. Александров Необыкновенная широта творческих интересов А. Н. Колмого- рова, огромный диапазон и разнообразие тех областей математики, в которых он работал в различные периоды своей жизни, выделяют Андрея Николаевича среди математиков не только нашей страны, но и всего мира, и можно прямо сказать, что в отношении этого свой- ства своего дарования он не имеет себе равных среди математиков нашего времени. При этом во многих математических дисциплинах, в которых работал А. Н. Колмогоров, им получены действительно основополагающие, принципиально важные результаты, доказатель- ство которых часто требовало преодоления больших трудностей и поэтому было сопряжено с большим творческим напряжением. Это относится уже к результатам, полученным Андреем Николаевичем в совсем молодые годы, по теории множеств и функций, как дескрип- тивной, так и метрической, например к построенной им теории опе- раций над множествами и к его знаменитому примеру расходящегося ряда Фурье. Далее последовали работы по общей теории меры, как абстракт- ной, т. е. «собственно общей», так и геометрической, а затем начались и фундаментальные работы А. Н. Колмогорова в различных направ- лениях теории вероятностей, поставившие Андрея Николаевича бесспорно на первое место среди представителей этой дисциплины во всем мире. Рано возникли и первые работы А. Н. Колмогорова, посвящен- ные математической логике и основаниям математики. В значитель- но более поздние годы к этим работам присоединились исследования по теории информации. Очень велик вклад, сделанный Андреем Николаевичем, в тополо- гию. Достаточно напомнить, что одновременно с выдающимся аме- риканским топологом Александером и совершенно независимо от него А. Н. Колмогоров пришел к понятию когомологии и основал теорию когомологических операций, т. е. получил результаты, су- щественно преобразовавшие всю топологию. Общеизвестны глубокие связи топологии с теорией обыкновенных дифференциальных урав- нений, небесной механикой и, далее, общей теорией динамических систем. Эти связи возникли при первых же работах Пуанкаре. Идеи А. Н. Колмогорова во всей этой огромной математической дисцип- лине, далее развитые в работах его многочисленных учеников, в зна- чительной степени определили ее состояние в настоящее время. Не- обходимо, наконец, указать на исследования А. Н. Колмогорова, относящиеся собственно к механике, в частности на его знаменитые работы в теории турбулентности, уже непосредственно переходящие * УМН, 1983, т. 38, вып. 4, с. 7—8.
Несколько слов об А. II, Колмогорове 5 в область экспериментальных наук о природе. Все сказанное, а ска- зано далеко не все, что можно было бы сказать об А. Н. Колмогоро- ве как об ученом, делает очевидным, что в его лице мы имеем одного из самых выдающихся представителей современной математики в самом широком смысле этого слова, включающем и прикладную математику. Это положение Андрея Николаевича в науке пользуется бесспорным признанием в международном научном мире и находит свое внешнее выражение, в частности, в том, что А. Н. Колмогорову принадлежит первое место среди всех советских математиков по числу иностранных академий и научных обществ, избравших его своим сочленом, а также университетов, сделавших его своим почет- ным доктором. Среди них находим: Парижскую академию наук, Лон- донское королевское общество, Академию естествоиспытателей «Лео- польдина», Нидерландскую академию наук, Польскую академию наук, Академию наук ГДР, Польское математическое общес^ро, Лондонское математическое общество, Национальную академию наук США, основанное Б. Франклином Американское философское об- щество, Парижский, Берлинский, Варшавский университеты и др. А. Н. Колмогоров родился 25 апреля 1903 г. в Тамбове, в котором его мать Мария Яковлевна Колмогорова задержалась по пути из Крыма. Мария Яковлевна умерла при самом рождении ее сына, и все заботы по его воспитанию взяла на себя ее родная сестра Вера Яковлевна Колмогорова, которая действительно заменила мать Андрею Николаевичу. А. Н. Колмогоров в соответствии с этим и относился к Вере Яковлевне, как к своей матери, до самой ее смерти (В. Я. Колмогорова умерла в 1950 г. в Комаровке в возрасте 87 лет). По материнской линии А. Н. Колмогоров был дворянского проис- хождения: его дед со стороны матери<| Яков Степанович Колмого- ров, был угличским уездным предводителем дворянства. Отец Ан- дрея Николаевича был сыном священника. Он был агрономом с выс- шим специальнымчобразованием или, по тогдашней терминологии, «ученым агрономом». Моя дружба с А. Н. Колмогоровым занимает в моей жизни со- вершенно исключительное, неповторимое место: эта дружба пере- шагнула в 1979 г. через свое пятидесятилетие и за весь этот полу- вековой период не только ни разу не дала никакой трещины, но не сопровождалась даже никакой ссорой, не было у нас за все это время и какого бы то ни было взаимного непонимания по вопросам, сколь- ко-нибудь важным для нашей жизни и миросозерцания; даже тогда, когда наши взгляды на какой-нибудь из этих вопросов бывали раз- личны, мы относились к этим взглядам друг друга с полным понима- нием и сочувствием. Как уже упоминалось, у А. Н. Колмогорова было много учени- ков в различных областях математики, некоторые из которых сами сделались крупными представителями своей специальности. Стар- шими учениками А. Н. Колмогорова являются ставшие потом дей- ствительными членами АН СССР Сергей Михайлович Никольский
6 Несколько слов об А. Н. Колмогорове (род. 1905 г.) и ныне покойный Анатолий Иванович Мальцев (род. 1910 г.). Следующими по возрасту являются Борис Владимирович Гнеденко (род. 1912 г.), действительный член Академии наук УССР, видный всемирно признанный специалист по теории вероятностей, действительный член АН СССР Михаил Дмитриевич Миллионщиков (род. 1913 г., скончался в 1973 г.) и Израиль Моисеевич Гельфанд (род. 1913 г.), член-корреспондент АН СССР, избранный иностран- ным членом Национальной академии наук США и Парижской акаде- мии наук. Значительно моложе, но все же принадлежат к старшему поколению учеников А. Н. Колмогорова действительный член АН СССР Александр Михайлович Обухов (род. 1918 г.), член-корреспон- дент АН СССР Андрей Сергеевич Монин (род. 1921 г.). Далее идут: Владимир Андреевич Успенский, Владимир Михай- лович Тихомиров, Владимир Михайлович Алексеев, Яков Григорь- евич Синай, Владимир Игоревич Арнольд. Особенно обширна группа учеников Андрея Николаевича, посвя- тивших себя работе в теории вероятностей и математической стати- стике. Среди них — действительный член АН СССР Юрий Василье- вич Прохоров, член-корреспондент АН СССР Логин Николаевич Большее, действительный член АН УзССР Сагды Хасанович Сираж- динов, действительный член АН УССР Владимир Сергеевич Миха- левич, Борис Александрович Севастьянов, Юрий Анатольевич Ро- занов, Альберт Николаевич Ширяев, Игорь Георгиевич Журбенко. Разумеется, этот список ни в какой мере не является полным, да и по самому заглавию моей статьи ясно, что она, не будучи юбилейным обзором жизни и деятельности А. Н. Колмогорова и вообще не буду- чи в каком бы то ни было смысле традиционной «юбилейной статьей»,; не претендует на полноту ни в каком отношении1. Март 1981 г. 1 В 1984 г. действительными членами Академии наук СССР избраны И. М. Гельфанд и В. С. Мпхалевич, членами-корреспондентами Академии наук СССР — В. И. Арнольд и Б. А. Севастьянов.— Примеч. ред.
1 О СХОДИМОСТИ РЯДОВ, ЧЛЕНЫ КОТОРЫХ ОПРЕДЕЛЯЮТСЯ СЛУЧАЕМ* Совместно с А.Я.Хинчиным Рассмотрим ряд У1 + Уъ + • • • + Уп + • • •, (1) члены которого являются случайными величинами; обозначим при этом значения (их конечное или, возможно, счетное число), принимав' мые уп, через у(п\ Уп\ • • Уп\ . . ., а соответствующие вероят- ности через р(п\ Рп\ . . ., Рп\ ... с У р(п = 1. Далее, обозначим i через &П-- Z1 Уп Рп i математическое ожидание величины уп и через Ьп = S {у и ’ — «пР • РпУ i математическое ожидание квадрата отклонения уп — ап. Сначала мы докажем, что в предположении сходимости рядов IX и вероятность* Р сходимости] ряда (1) равна 1. Част- ный случай этого утверждения (а именно когда каждое уп принимает только два значения + сп и — сп с одинаковой вероятностью * 1/2) был установлен Р адемахером в теоретико-функциональных терминах х. В § 1 мы дадим доказательство общей теоремы, пользуясь обобще- нием метода, предложенного Радемахером. В § 2 мы передокажем ее другими средствами, которые приведут быстрее к цели. В § 3 уста- новим, что для одного важного и очень широкого класса случаев сходимость рядов San/ является не только достаточным, но и необходимым признаком для справедливости равенства Р = 1; именно таковым является случай, когда значения, принимаемые уп^ ограничены в совокупности. Наконец, в § 4 укажем одновременно необходимый и достаточный признак справедливости соотношения ^ == 1 в общем случае. § 1 принадлежит А. Я. Хинчину, § 2, 3 и 4 — А. Н. Колмого- рову. * Ueber Konvergenz von Reihen, deren Glieder durch den Zufall bestimmt werden.- Мат. сб., 1925, т. 32, с. 668-677. Перевод П. Л. Ульянова, 1 Math. Ann., 1922, Bd. 87, S. 135.
8 1, О сходимости рядов, члены которых определяются случаем § 1 Приведем задачу в более удобную для наших целей теоретико- функциональную форму. Для этого построим систему функций Ф1 (*), Фа (*). .... фм («),•• • посредством следующего рекуррентного определения: допустим, не ограничивая этим общность, что (О <Ш) Рп рп для всех п и i; разделим отрезок 0 х 1 слева направо на части длины п(1) п<2) п'{) Pl 1Р1 ? • • •> Pl » • • • и положим (я) равной постоянной на каждом из этих частичных интервалов, а именно Ф1 («) = = у(1г) — «1 в i-м интервале. Тогда имеем 1 1 § epi (x)dx = 0, {<pi (x)}2dс — bi. о о * Если функция (£„-! (х) уже определена, то функция фп (х) опреде- ляется в общем случае так: каждый интервал постоянства 6 функции <Pn—i (х) делится на интервалы, длины которых (слева направо) про- порциональны величинам п(1) О(2) D(i) Рп ? Рп » • • •» Рп ? • • • и на z-м частичном интервале полагаем ф„ (х) = = у(пУ — а,„ тогда 11 §<j>„(.r)dte = O, * § О)}2 сГг = 0 0 Значения функций <рп (х) в концах частичных интервалов не играют роли и могут быть взяты произвольно. В предположении, что ряд’ 2ап сходится, вероятность сходимо- сти ряда (1) совпадает с вероятностью сходимости ряда Ф1 (^) + ф2 00 + • > • + Ф^ (х) + -•••» (2) которая при нашем понимании задается мерой (в смысле Лебега) того точечного множества, на котором сходится этот ряд. Следова- тельно, наш главный результат можно толковать так 2: сходимость 2 Очевидно, что это утверждение совпадает со сформулированным во вве-
1. О сходимости рядов, члены, которых определяются случаем 9 ряда является достаточным признаком сходимости почти всюду ряда (2). Нижеследующее доказательство обобщает данное Радемахером доказательство для частного случая 3. Положим п х лп(.г) - П {1 + <Pi (ж)}, in (^) = 5 ЯП (О dt, О Имеем X X I /п+1 (^’) ‘— fn (^) I = 15 (t) “* лп (t)} dt I = I лп (t) <pn+i (t) dt L ’o 'o 1 Пусть 6 (a, Ь) — тот интервал постоянства функции <pn (Z), ко- торый определяется как а х < Ъ. Очевидно, что a jjnn(i)(pn+1(i)di = O О и, следовательно, X X | /п+1 (#) /п (^) I == I (0 фп+1 (0 dt I = | Лп (.20 | ’ I фп+1(0 dt I, (3) a ‘a ‘ так как лп (t) постоянно в интервале (а, х). Из условий ^z^p^ = 0 (п-1,2,...) получим 14° р{п |=|5 4г) р(п I j — 1,2,...) и из неравенства Шварца 14j) р'Р I < 1/ 'JTFwTTF < Уь~п г i^j __Vi- n (nJ =1,2,...). Pn Итак, если на интервале (a, b) <р!г (х) = 2^’ (к = 1, 2, . . п), то ________ * I П /• ' I п ( Vi |лп(^)|= Ц {l + z/*} < П 1 +/&»------------<ГГ“ ’ <4> I , « I nJ fc-=l /с=1/ Рк 7 дении. Общее рассмотрение связей такого рода можно найти у Штейнгауза (Fund, math., 1923, vol. 4, р. 286-310). 3 См. сноску 1.
10 1. О сходимости рядов, члены которых определяются случаем С другой стороны, имеем хх Ъ I § фп+1 (<) dt I < i <pn+1 (t) IЛ < $ I фп+1 (i) | dt = a a a = Р1'}Р2г)- Pnn} $ I <₽n+i (01 dt < П Pkk) (5) 0 и еще I ( Фп+1 (0 dt |< I x - a I • 1z£?i | < П Pkk) V bn+1 --—/^Pn+X , д k—1 Pn+1 где [ | — наибольшее значение | <рл+1 (t) | на а < t х. Если / \ ^71+1^ • "— фп+1 (#) ^п+1 ? 7 п+1 Щ то согласно нашему предположению выполнено P{n+i1} Pn2i> значит, тем более имеем Л ” ___if _ оп+1) 1\ фп+1(о^ < Пр,рАя r Pw+1_________________ (6) 'aJ 1 Из (5) и (6) вытекает 15Фп+1 (Оdt| < 2 У&„+1 р%г\ .. — Рп”1х>> (7) так как при р(^1'> */2 это следует из (6), а при p„+n1+1) < V8 из (5). Теперь (3), (4) и (7) влекут за собой |Дп(л)| = |/п+1(а:) — /п(ж)| < < 2 Kl-p^ fl {p^k} + VK /1 - Pkk)} k=l или с подстановкой 1 — ~ tri | Д„(х) К 2 ]/bn+1wn+1 П {I — w2k + Wit V bk} < (bn+1 + Wn+1) П — wk 4-----2----Ь •у} <С k=l 1 J bn+1 П + -у) + ^n+i П (1 2~) fc=l “ fc=l
1. О сходимости рядов, члены которых определяются случаем 11 Если еще принять обозначения со П (1 + ы=5, -^-^k=vk, А=1 ТО п |Дп(ж)|<В&п+1 + 25рп+1 П(1-ра). (8) А=1 Поскольку для каждого целого положительного N и г0 = О справедливо соотношение N п N+1 1-2^+1П(1-^)= П(1-^)>о, П—Q А=1 А--1 то в правой части (8) стоит общий член сходящегося ряда. Следова- тельно , существует lim fn (х) =f (х). п—>ОО В частном случае, рассмотренном Радемахером, / (х) оказалась монотонной функцией, что не обязательно имеет место здесь в общем случае. Но монотонность служила лишь для доказательства дифферен- цируемости / (х), поэтому достаточно обнаружить, что / (х) пред- ставляет собой функцию ограниченной вариации. Это легко полу- чается следующим образом. Полная вариация функции f (х)во всяком случае не превышает верхней грани полных вариаций всех функ- ций /п (х) и, следовательно, она не больше lim sup| лп(0 \dt. о Но 1 1 п п 1 $|лп(0|Л = 5| П {1 + <Рл(^)}| dt= П 5 |1 + <РИО1Л < О о ’ А—1 1 /с=о О п / 1 Г~ < П 1/ $|1 + <М012<й = 1/ П (1 + ь*хУЖ О , Л*=1 * где допустимость замены порядка взятия произведения и интегри- рования непосредственно вытекает из специальной структуры функ- ций (х). Этим желаемое установлено. Итак, функция f (х) имеет почти всюду производную /' (х). Если. х — произвольная точка отрезка (0, 1), отличная от точек разбие- ния и в которой существует /' (г), а через (ап, Ьп) обозначен тот ин- тервал постоянства функции <рп (х), в который попадает х, то в силу
12 1. О сходимости рядов, члены которых определяются случаем / (ап) = fn М, f (Ь„) = /п (6„) получим f (х) = hm—п - = llm ь -а = 11т П~*оо п иП П—оо п П П—со так как из-за постоянства функции лп (х) в («п, Ъп) справедливо 4 /„(&п) - 4 Ю Ьп-ап Следовательно, lim лп (х) существует почти всюду. G другой п-*оо стороны, ряд сю 3 ОрН^)}2 fc=l сходится почти всюду, ибо в противном случае расходится ряд оо 1 оо 2 ${ФпС»)}ш = 2 к==1 о К=1 что противоречит предположению. Но из сходимости почти всюду последовательности лп(х) и ряда 2 {фп (я)}2 вытекает сходимость почти всюду ряда 2<рп (х), что и требовалось доказать. § 2 Сейчас мы собираемся установить данное утверждение другим и к тому же намного более простым путем. Положим, 2 4>k(x) = Sn(x). к—1 Если бы ряд (2) оказался расходящимся в каждой точке некото- рого множества положительной меры, то должны были бы сущест- вовать множество Е положительной меры тЕ и положительная по- стоянная Л, что для каждого целого положительного числа п и каждой точки х множества Е при подходяще выбранном р = р (х. п) п выполнялось неравенство I Sp (х) — sn (х) I > А. Так как разность sp (х) — sn (х) остается постоянной на каждом интервале постоянства функции (рр (х), то отсюда в силу способа 4 Если имело бы место lim (&Л — ап) > 0, то при достаточно малом е > О П—>ОО 1 = lim J- [/ (х + г) - /п (х — е)] = lira лп (х). П-*эо ^8 П-*оо
1. О сводимости рядов, члены которых определяются случаем 13 построения наших функций следует, что можно найти конечное чис- ло непересекающихся интервалов 6 со следующими свойствами: 1) 26 (сумма длин всех 6) больше 1/2тЕ, 2) каждый 6 является интервалом постоянства функции Фр (х) (Р> п) и справедливо неравенство I 8р (х) — sn (*) | > А В Если теперь к — наибольшее из указанных чисел р (их конеч- ное число) и 6 — интервал постоянства для зр (х) (р к), то из способа построения наших функций вытекает {Sfc (х) — sn(r)}2dx = $ {sl.(x)—sn(x)}2dx + $ {s4 (х) — sp(x)}sdx > Л26 6 6 6 » и, следовательно, 1 У, ър= jj {sA.(^) —«п(«)}2^> А2 6> —42/пЕ, р—п-j-l О что влечет за собой расходимость ряда вопреки предположению. § 3 Итак, сходимость ряда 2ЬЛ является достаточным признаком схо- димости почти всюду ряда S<pn (х). Этот признак, вообще говоря, не является необходимым, что легко можно показать на примере. Именно если фп (х) равняется соответственно 0, +сП1 —сп на х- множествах меры 1 — тЛ, 1/2тп, х/2тп и ряд 2тп сходится, то почти всюду фп (х) отлична от нуля только для конечного числа значений п и поэтому ряд 2фп (х) почти всюду сходится, каковыми бы ни были числа сп. Так как bn = c^Tn, то после подходящего их выбора мож- но сделать ХЬп расходящимся. Для соответствующего ряда (1) имеем, очевидно, Р = 1, поэтому условие сходимости ряда не необходимо для выполнения ра- венства Р = 1. Так же легко показывается, что условие сходимости ряда не обязательно для сохранения этого равенства. Для этого можно положить = 0, Рп} = Тп, РТ = 1 — тЛ, при- чем 2тп следует выбрать сходящимся, а расходящимся. Имеется, однако, важный частный случай, в котором наш приз- нак будет и необходимым. Действительно, если функции фп (х) по абсолютной величине ограничены в совокупности, то из сходимости почти всюду ряда 2фЛ (х) вытекает сходимость ряда Соответст- венно обстоит дело с рядом (1): если Р = 1, а случайные величины Уп (п = 1, 2, . . .) ограничены в совокупности, то обязательно должны сходиться оба ряда и Чтобы доказать последний, общий результат, сначала установим следующее: если фп (х) равномерно ограничены и существуют
14 7. О сходимости рядов, члены которых определяются случаем множество Е положительной меры и константа К со свойством | $k (#1) 8 ft (^2) I < (9) выполняющимся для любого к и всех пар точек (хи я2)> принадлежа- щих множеству Е. то обязательно сходится ряд Обозначим через Ек объединение тех интервалов постоянства функции (х) (и, значит, суммы (ж)), внутри которых содер- жатся точки из Е. Очевидно, что Ек содержит Е и Ек+1. Также ясно, что (9) остается справедливо для любой пары точек множества Ек. Если положить Ек — Ек+1 = то 5 $ {Sfc+i(*i) — Sfc+1 (x2)}2dx1dx2= 5 $ {^+1(^1) — Eh'41 Ek+1 Ek Eft — s^1(x2)}2dxldx2 — 2 § {sk+i(x1) — sk+1(x1)}2dx1dx2 — Ek+1 k — $ $ {^4i (fl) — (х2)}2dxxdx2. К ** Ho <Pfc4-i (x) на E% ортогональна к sk (x) и к 1, и, следовательно, имеем $ {Sk vi(x‘l) — Sk^(x2)}2 dxxdx2= {^(^1)—^(ж2)}2^1^2 + Ek+l Eft Eft + $ $ {<Рк+х(Ж1) — <рк+1(хг)}2 dxidxz— 4 Ek — 2 {Sfc (Xi) — sk (x2) + <p4+1 (Xi) — ФА-+1 (x2)}2 dxi dXi — Ek+1 Fk — § § —M*2) + Tk+i(*i)~T!m(*2)}2<taid.r2> Fk F4c > $ $ — sk(x<i)}2 dx\dx2-\- 2bk+1(mEk)2— Ek Ek — (К + 2M)2 {2mEk+1 • mFk + (mFk)2}, где M есть верхняя грань для | срп (х) |, а тЕ обозначает меру мно- жества Е. В полученном неравенстве положим к = 0, 1, . . п — 1, сложим и заметим, что . 3 {2тЕА+1 • mFk + (mF*)2} < 1. к—о
1. О сходимости рядов, члены, которых определяются случаем * 15 В результате имеем п—1 $ 5 ~ Sn dxi dx* 2 26'>-1 (тЕк)2 — {К + 2М)2, Ь„ Еп fc-0 следовательно, в силу | sn (хл) — sn (х2) | < К получаем 3126;с+1(^)2<2(ЛГ + 2М)2 и тем б.олее (тЕ? "2^1<(^ + 2М)2, /г^'О что, очевидно, доказывает сходимость ряда 2ЬП. Пусть сейчас значения случайных величин уп ограничены в со- вокупности и пусть выполнено Р == 1, откуда вытекает сходимость почти всюду ряда 2 (ап + фп (х)). Поскольку ап не зависит от х, то для ряда 2<рп (х) выполнены предположения только что дока- занного вспомогательного утверждения 5. Следовательно, ряд является сходящимся и согласно § 1 или 2 тогда 2<рп (х) сходится почти всюду. Но это влечет за собой сходимость ряда 2ап, чем все доказано. § 4 Рассмотрим наряду с (1) второй аналогичный ряд и1 + и2 • • • + ип + • • • Я (10) обозначим через Q вероятность его сходимости и через тп вероят- ность события Уп Щъ» В случае, когда 2тп сходится, ряды (1) и (10) назовем эквивалент- ными 6. Легко видеть, что в этом случае Q — Р. Теперь мы утверждаем, что необходимое и достаточное условие справедливости равенства Q = 1 для ряда (10) состоит в существо- вании эквивалентного ряда (1), для которого 2ап и 2ЬП сходятся. Очевидно, что в доказательстве нуждается только необходимость условия. Итак, допустим, что Q = 1 и определим ряд (1) следующим образом. Положим уп = un, если | ип | < 1, и уп — 0 в противном случае. Величина тп совпадает здесь с вероятностью выполнения соотношения | ип (х) | > 1. В силу Q = 1 это дает немедленно схо- 5 Из равномерной ограниченности уп вытекает, конечно, равномерная огра- ниченность ап, значит, и <рп (х). 6 Это означает, что между ип и уп обнаруживается определенная взаимная зависимость.
16 2. О законе больших чисел димость ряда 2тп, так что ряды (1) и (10) на самом деле эквивалент- ны. Построенный таким образом ряд (1) является уже равномерно ограниченным, поэтому согласно § 3 соответствующие ряды 2«п, 26п сходятся и все доказано. Отметим еще, что наш способ доказательства выясняет не только существование ряда (1), но и дает крайне простое правило построе- ния этого ряда. Москва, 3 декабря 1925 г. 2 О ЗАКОНЕ БОЛЬШИХ ЧИСЕЛ* Пусть Еи Е2, . . ., Еп. ... — последовательность независимых испытаний. Приводимые ниже рассуждения справедливы толь- ко в случае конечного числа различных возможных исходов Е$\ E[k \ . испытания Ек. Однако доказываемая теорема оста- ется верной и в общем случае. Пусть Fn — величина, зависящая от первых п испытаний. Если при любом положительном е вероятность неравенства I Fn Dn | < где Dn — математическое ожидание стремится к единице при неограниченном увеличении и, то говорят, что Fn удовлетворяет закону болъшихгшсел или же что Fn устойчиво. Наиболее простые совокупности условий, достаточные для устой- чивости Fn, состоят в ограничениях, налагаемых на дисперсию Fn. В качестве дисперсии Fn относительно Ек естественно рассмотреть верхнюю грань разности * Fn (Ер>, Е^, Е**\ Е^\ Епп)) - — Fn(4i*),..EftV, Е**\ EkA+1\ • • Епп\ когда i2, . . ., in и д независимо пробегают все возможные зна- чения. Обозначим эту дисперсию Используя это определение, мы можем сформулировать следующую теорему. Т е о р е м а. Если сумма Qnl + + ...•+ Qnn стремится к нулю с ростом п, то Fn удовлетворяет закону больших чисел. ♦ Sur la loi des grands nombres.— C. r. Acad. sci. Paris, 1927, vol. 185, p. 917—919. Представлено Э. Борелем. Перевод О. В. Вискова.
2. О законе больших чисел 17 Следствие. Для устойчивости Fn достаточно также условия = о (1//Й), (1) Доказательство теоремы. Обозначив Вп математи- ческое ожидание квадрата уклонения Fn — Dn, для устойчивости Fn имеем известное условие вп ->0. (2) Чтобы воспользоваться этим условием, нужно для Вп дать более эффективное выражение. С этой целью обозначим Z)nfe математиче- ское ожидание Fn при условии, что известны результаты первых к испытаний. Обозначим также Znfc разность Dnk — Таким образом, Znk есть приращение математического ожидания Fn, когда становится известным результат испытания Ек. Очевидно, имеем Dn = Дю, Рп ~ (3) Fn — Znl + Zn2 + . . . + Znn. Можно доказать, что математическое ожидание ZniZnk (i^ к) равно нулю. Пусть к i. Предположим, что результат Еи Е2, . . ., известен. При этом предположении математическое ожидание Dnk равно таким образом, математическое ожидание Znk равно нулю и, поскольку Zni — постоянная, математическое ожидание ZniZnk также равно нулю. Этот факт имеет место при любых резуль- татах испытаний Е^ Е2, . . Ек-г. Следовательно, и само матема- тическое ожидание ZniZnk тоже равно дулю. Итак, обозначив математическое ожидание ZJ^, получим Вп == Рп1 + Рп2 + • • • + Рпп- (4) Можно доказать, что Pnfc Вп г/4 (ЙП1 4- йп2 + ... 4" ^пп)« (5) Неравенство (5) позволяет вывести нашу теорему в силу условия (2). Замечание. В классическом случае Чебышева испытание Ек состоит в определении величины Хк и Fk равно среднему арифме- тическому Х19 Х2> • • м Хп.’Обозначив dk математическое ожидание Х^ и Ьк математическое ожидание (Хп — dn)2, будем иметь Pnfc = ьк/пг Qnk = (max Хк — min Хк)!п. Условие (1) преобразуется в известное условиё max | Хп | = о (Уп). Вышеизложенное представляет обобщение случая Чебышева, в.котором Fn является суммой независимых случайных величин,
18 3. Об одной предельной формуле А. Хинчина поскольку касается сумм зависимых величин. Очень часто слагаемые этих сумм суть функции некоторых других независимых величин. Мы думаем, что в таком случае метод произвольных функций неза- висимых величин, предложенный здесь, был бы очень естествен. -31 октября 1927 г. 3 ОБ ОДНОЙ ПРЕДЕЛЬНОЙ ФОРМУЛЕ А. ХИНЧИНА* Пусть . . ., zn, ... (1) — последовательность независимых в совокупности случайных величин. Без ограничения общности можно предполагать, что мате- матическое ожидание zn равно нулю. В этом случае обозначим Ьп математическое ожидание квадрата zn, a Sn и Вп обозначим суммы Sn= 2 zk, Вп = 5j bk. к—1 к=1 Хинчин [1] предположил, что при широких предположениях ве- роятность соотношения lim sup .....— 1 (2) /2BnloglogBn равна единице. Сам Хинчин доказал эту формулу для некоторых важных частных случаев [2]. Наша цель — сформулировать доста- точно общие условия, при выполнении которых эта формула остает- ся справедливой. Вот эти условия: (I) Вп ->ОО, _______ (II) тп-ограничено сверху, | zn | = о (iOg' jog Вп) ' Легко видеть, что первое условие является необходимым, если исключить случай zn = 0. Если величины zn равномерно ограничены, то второе условие вытекает из первого и в этом случае это условие необходимо и достаточно. Если желать использовать лишь вероятностные соотношения, которые могут быть эффективно наблюдаемы, то можно пояснить смысл формулы (2) следующим образом: * Sur une formule limite de M. A. Khintchine.— С. r. Acad. sci. Paris, 1928, vol. 186, p. 824—825. Представлено Ж. Адамаром. Перевод О. В. Вискова.
3. Об одной предельной формуле А. Хинчина 19 1°. Каковы бы ни были положительные числа т] и б, существует целое п такое, что вероятность выполнения всех неравенств < ]/ 2Вк log log Вк (1 + 6) (fc = п,' п + 1, . . п + р) не меньше 1 — ц, каково бы ни было р. 2°. Каковы бы ни были ц, 6 и тп, существует целое р такое, что вероятность одновременного выполнения неравенств Sk < У 2В^ log log Вк (1 — 6) (fc = тп, т + 1, . . ., т + р) не превзойдет ц. Полное доказательство утверждений 1° и 2°, использующее толь- ко условия (I) и (II), будет опубликовано Ч В задаче о повторных испытаниях из нашей теоремы можно из- влечь такое следствие: пусть рп — вероятность осуществления со- бытия 8 при n-м испытании, и пусть |Л (п) — число осуществлений события 8 за п первых испытаний. В этой ситуации вероятность соотношения ,. Р'(«)-(Р1 + Р2+... + рп)М 1 im sup-- = - —.. п ........ = 1 (3) 1/ 2 Рк I1 “ Pfc) log 2J Рк С1 - Pfe) r k=i k=l равна единице при условии, что ряд ^Рп (1 Рп) расходится. ЛИТЕРАТУРА 1. ХинчинА. Я, Основные законы теории вероятностей. М., 1927. 2. Khintchine А.— Math. Ann., 1928, Bd. 99, S. 152. 1 См. работу № 5 наст, изд.— Примеч. ред.
20 4. О суммах независимых случайных величин 4 О СУММАХ НЕЗАВИСИМЫХ СЛУЧАЙНЫХ ВЕЛИЧИН* § 1 ОБОЗНАЧЕНИЯ Р (А) — вероятность события А; Рв (А) или Р (А | В) — условная вероятность события А отно- сительно В; Mg — математическое ожидание случайной величины g; MBg или М (g | В) — условное математическое ожидание g от- осительно события В; М (g; В) — Р (В)'-ЬК (g | В), или то же, что интеграл Лебега $ W в но множеству В; Dg — дисперсия случайной величины g, Dg = М (g — Mg) 2. Если gx, , . gn — случайные величины, то положим к S = Sn; п= max|Sk|; г—1 к = T = T^, i=l u = max I T\ |, M = sup | £& I, D = MT2 = DS2. к (Предполагается, что математические ожидания Mgfe и Mg2 суще- ствуют, 1 тг.) Очевидно, что = 0, •— M5fc. Если величины gx, . . ., g& взаимно независимы, то i=l § 2 НЕСКОЛЬКО ТЕОРЕМ О КОНЕЧНЫХ СУММАХ Будем предполагать, что величины взаимно независимы. Теорема 1. Пусть R^> 0. Тогда Р {max | Щ > R} < МГ/Я2. * Ueber die Summen durch den Zufall bestimmter unabhangiger Grossen.— Math. Ann., 1928, Bd. 99, S. 309—319; Bemerkungen...^- Math. Ann., 1929, Bd. 102, S. 484—488. Перевод A. H. Ширяева.
4. О суммах независимых случайных величин 21 Теорема 2. Пусть е > 0, т — натуральное число и R = eD + М. Тогда Р { max | | > mR} е-2”1. Теорема 3. Пусть R> 0. Тогда Р { max I Sfc I < R} < 4 (М + R)2ID2. Теорема 4. Теорема 5. Р {Т > - 3Jf} > Vie. Теорема 6. Р {J $ | > R} > >/4в [1 - 4 (4М + R)2ID2\. Док азательство теоремы 1. Пусть событие Ак = { | Tt | < R, I < кк | Тк | > R} п и А= 3 Ак. Тогда k=i Р{тах|П|>1?} = Р(Л)= 3 Р(Ак). к к—1 Поскольку величины Ц о i > к не участвуют в определении события Ак, то, учитывая предположение о взаимной независимости 11, . . ., £п, находим, что М(П;Л) = М(Г|;40+ S М(Й; 4к)>М(П; 4fc)> 2?2Р(4Д г—к—1 откуда МТ2 > R2P (Л), что и доказывает требуемое неравенство. Замечание. Доказанное неравенство превращается в равен- ство, например, в следующем случае: п = 1 и Р{С1 = Я} = ^-, Р^ = -Я} = ^-, Р{Сг = О} = 1 - Доказательство теоремы 2. Обозначим Aiit { I j I к\ | | iR.} и п 4 ==: 21 ^гк- к-1
22 4, О суммах независимых случайных величин На множестве А & Очевидно, что Р(Л+1|Л») = р{м>(г +1)Я)<Р{ max | S bJ>eZ)}. J=.V+1 Как и в случае доказательства теоремы 1, заметим, что величины для / к не входят в определение событий Aik. Поэтому Р (Ai+l | Aik) < DW = 1/82 й, следовательно, Р (Ai+1 ] At) < l/s2, Р {и > тВ} = Р(Ат) = = Р (Ат^ | Ат) Р (Ат^ | Ат_2) ...Р (А.) < 1/82т, ' что и доказывает теорему 2. Доказательство теоремы 3. Пусть = { | £ г | &}, В = Ви = {г</?}, Ск ~ Вк-1 \ &к* Очевидно, что Р(В) + 5 Р(б\)=1. (1) Обозначим = АЛ (У^. | Вк). На множестве Вк I Тк - ак | = | Sk - ЛЛ (5fr | Вк) | < 27?, | ак — ак_х | = | М (£fc | Вк) |< М. Рассмотрим теперь выражение М [(Л - ак)2- Вк^] = — М [(7\ — ak)2; .BJ + М [(7\_х — — (ац — a^-i) + + ^)2; Ск] < М [(Tk - а,)2; Вк] + Р (Ск)-4 (Я + М)*. (2) С другой стороны, М [(ТЛ - afr)2; B.-J = = М [((^.х - aft_x) - (ак - ак_х) + £k)2; Bk-J = = М [(ZVx - ак-х)2 + (ак - ак^)2 + &; Вк.г] > > М l(Tk_x - flk_x)2; 2?w] + Р (В) М (3)
4. О суммах независимых случайных величин 23 Сравнивая (2) и (3), получаем М [(П_х - а^-, В^] + Р (В) МЙ < <М [(Тк - afc)2; + Р (Ск)-4 (В + М)2. Полагая в этом неравенстве к = 0, 1, . . п и суммируя соответст- вующие неравенства, получим с учетом (1), что Р (В) Я2 <М[(7\+ § Р(Ск).4(Я + 2И)2< <Р(В)-4Я2 + § Р(C^-^R + Му <4(7? + Му, fc=l что и доказывает теорему 3. • Замечание. Если вместо £* взять zfe, то утверждение тео- ремы будет верным с заменой v на и. Доказательство теоремы 4. Обозначим Cm = {mR < Т < {тп + 1) /?}, где R = 8D + М и положим Rm — S • к»| Очевидно, что #о = {Т > 0}. В силу теоремы 2 Р {Вт} < 1/82ТП; М (Г; Во) = У М(Т; Cm) < (т + 1) RP(Ст) = т=0 т=0 = я^Р(в,)<д[р(В.) + _£-51г]< т=0 т=1 < R [Р (Ро) + С другой стороны, легко доказать, что М (Т; BQ) > V2Z>. Таким образом, 4-£<я[Р(Ро) + ^]=(8£ + М)[Р(Ро) + -У ; p/Р Р 1 1 D~M 2(8I>+M) 32 16 D+M ’ что и требовалось доказать.
24 4. О суммах независимых случайных величин Доказательство теоремы 5. Пусть D > 3/2М. Тогда в силу теоремы 4 Если D > 3/2М. то по теореме 1 Р {| Т | < ЗМ} < Р2/9М2 < Vv - В обоих случаях эти оценки доказывают требуемое утверждение* Доказательство теоремы 6. Обозначим W= max I .S'- 3 Cj. к i=*k Тогда из теоремы 3 Р {W > R + ЗМ} > 1 — 4 (4М + Я)2АО2 п и, применяя теорему 5 к сумме 2 находим, что i—k Р {s>R\W>R + 3M}> V48. Отсюда непосредственно следует требуемое утверждение. § 3 СХОДИМОСТЬ РЯДОВ Здесь будут рассмотрены необходимые и достаточные условия сходимости рядов из независимых случайных величин, ранее уста- новленные другими методами в Нашей совместной статье с А. Я. Хин- чиным (см. № 1 йаст. изд.). Рассмотрим две последовательности случайных величин Я = (Яь Яг, • • Яп, • • •), Я = (Я1, Яг, • • •, Яп,. . •)• Будем называть последовательности т| и fj эквивалентными, если 1 2 Р{Яг#=Яг}<°°- (4) г-=1 В дальнейшем будем предполагать, что каждая из последовательно- стей ц и Т] состоит из взаимно независимых случайных величин. 1 Это определение принадлежит А. Я. Хинчину.
4. О суммах независимых случайных величин 25 Теорема 7. 1) Вероятность Р сходимости ряда 2 Гк (5) г=1 равна единице, когда для последовательности 1] = (т]п) существует эквивалентная ей последовательность rj = (ц?1), для которой сходят- ся ряды 2 (6) г=1 2 М??, (7) где = f)r- — Мт]г. 2) Вероятность Р равна нулю, если не существует эквивалентной последовательности, для которой одновременно сходятся ряды (6) и (7). Доказательство. 1) Согласно теореме 1 для каждого положительного у • р N. СЮ р 1I >4 < v £ <-? £ ма- (8> k—n k=n к=п Так как ряд (7) сходится, то для всякого 8 О найдется такое, быть может, большое т, что для п > т правая часть в (8) будет меньше 8. Согласно определению р Р = Пт lim lim Р { max | 3 Лк I <у} • 1/—О п—оо N—оо fc=n Поэтому из (8) следует, что вероятность сходимости ряда § L • (9) П=1 равна единице. Таккак’ряд (6) сходится, то то же верно и для ряда 2 лп- (Ю) П=1 Поскольку в конечном счете вероятности сходимости эквивалентных рядов совпадают, то Р — 1. 2) Положим %, |Пп|<1, о, h„|>i. (Н)
26 4. О суммах независимых случайных величин Предположим сначала, что последовательности ц = (цп) и fj = (rjn) эквивалентны, что равносильно тому, что 3 Р {|%|> 1} О- п=1 (12) В этом случае должен расходиться один из рядов (6) или (7). Если не сходится ряд (7), то по теореме 3 получим, что для любого у и всякого п Р { max I У. iJ <«/} < пг+2'2 к—п при N -> оо. Это означает, что вероятность сходимости ряда (10) равна нулю. Из эквивалентности последовательностей ц = (т]п) и г) == (т]п), отсюда следует, что Р = 0. Если сходится ряд (7), то вероятность сходимости ряда (9) со- гласно первой части теоремы равна единице. Поэтому если ряд (6) расходится, то Р = 0. оо Рассмотрим теперь случай, когда У Р { | цп | 1} = оо. п=1 В этом случае мы непосредственно имеем, что для всякого п N P{maxl?/fc|< 1}= П [1 — Р {|Пь|> О]0, к—п iV -> оо и, следовательно, Р = 0. Таким образом, наша теорема доказана для всех возможных случаев. Замечание. Если известно, что существует некоторая по- следовательность ц = (пн), удовлетворяющая условиям теоремы, то тогда последовательность, определяемая формулой (11), также будет удовлетворять условиям этой теоремы. § 4 ОБОБЩЕННЫЙ ЗАКОН БОЛЬШИХ ЧИСЕЛ Рассмотрим систему случайных величин г111' 412, • • •, Ч17ПР 421, 422, • • •, 42т2, 4п1, 4п2, • • •, 4пт,г, кратко обозначаемую как || ||. Будем предполагать, что в каж- дой строке величины независимы между собой, тогда как в разных строках они могут быть и зависимыми.
4. О суммах независимых случайных величин 27 Мы говорим, что средние Оп = (Лп1 + • • • “Ь ^nmnVmn, п 1» устойчивы, если существует такая последовательность чисел dif d2, • • что для любого 8 О р { I — 4 I > <0->о, П-+ОО. Дадим одно необходимое и достаточное условие для устойчивости средних. Будем говорить, что системы || || и || |1 эквивалент- ны, если тп — тп и Р {On =# °п} О, П->-ОО. Очевидно, что эквивалентные системы или одновременно обладают свойством устойчивости средних, или же этим свойством не обла- дают. Теорема 8. Необходимое и достаточное условие для устой- чивости средних an, п 1, заключается в существовании некоторой системы || ||, эквивалентной || т)п^||, для которой тп -W,М^->0, Л-^ОО. (13) • Доказательство достаточности. Из теоремы 1 следует, что для любого 8 О тп тп р {| о» — M5n I > е} = Р |1 У | > ттгпе} < У М^-. 4 п к=1 Поэтому из (13) следует, что Р { I On — М <Ъг1 > е} О, и из эквивалентности систем || г|Л?с || и || || получаем Р { I оп — М ап | > е} О, (14) что и доказывает достаточность. Доказательство необходимости. Пусть средние on, п > 1, устойчивы. Для любой случайной величины T]n/f найдется константа такая, что р {1W > /nJ .< v2, Р {%s < /„J < v2. (15)
28 4. О суммах независимых случайных величин Легко доказать, что для любого положительного 8 О о, (16) Положим теперь если —/гЛ I < если | /п& | если — если [ т]пь- — fnk I > ”4^ (17) fnkt -(e) _ I *!»»*» Hnfc — I 4 I Jriki Согласно (16) системы || r]nfr ||, || || и || rjn!c (е) || эквивалентны а также устойчивы средние ап и оп (е). Заметим, что I Ink (s) I < 2emn. Поэтому по теореме 6 тп р {| (f) — dn | > e} = P || У rjnfc (e) — mndn | > emn k~i 1 48 324m^2 1 I ’ k=l Для всякого 8^>0 левая часть этого неравенства сходится к нулю. Следовательно, тп lim sup Ц- У М (Цк (е)) < 324е2. п тп & (18) ДЛЯ 8^1 | (в) | < 8/Лп р (I T]n& — fnli I > гтп} и согласно (16) _Ь£|мйк-м&.(8)|-> о. Поэтому условие (13) следует из (18). Замечание. Если существует некоторая система • удовлетворяющая условию теоремы, то в качестве таковой быть взята система, определяемая формулами (17) и (15). может
4. О суммах независимых случайных величин 2В' Будем говорить, что средние on, n > 1, обладают свойством нормальной устойчивости, если для любого 8 О Р { | стп — мо« I > е} 0, п -> ОО. Теорема 9. Необходимое и достаточное условие нормальной устойчивости средних on, п 1, состоит в существовании экви- валентной системы || цп7; ||, для которой справедливо (13) и МоЛ — МоЛ->0, п->оо. Доказательство теоремы следует непосредственно из формулы (14), установленной для любой устойчивой системы. Замечание. В случае нормальной устойчивости вместо, системы || ||, определяемой в (17), (15), можно взять систему с _ _ ( Ппь если |£)ifc|On, — I MtU- если |£«k|>mn. § 5 . ЗАКОН БОЛЬШИХ ЧИСЕЛ Условие устойчивости средних • On = (П1 + • • • + где т)!, т|2, • • • — независимые случайные величины, является спе- циальным случаем теорем 8 и 9, если положить тп = п, = гц. Нормальная устойчивость таких средних обычно именуется законом больших чисел. В этом случае справедлива следующая Теорема 10. Для того чтобы для каждого 8 0 Р { I I 0, оо, (19) необходимо и достаточно существование такой системы || ||, что: 0. тп = п. Лп/f} 0* п 2- 4- £[М7^ - Mn”ft] °- 3- k~l Замечание. Если имеется система |( ||, удовлетворяю- щая вышеизложенным условиям, то в качестве таковой может быть
30 4. О суммах независимых случайных величин взята система _ _ f Пь если I Ct I < п, ’1-пк~ | если (Ct |>п. Теорема 11. Для того чтобы Р { | ап — Мап | > е) 0, п -> оо, необходимо и достаточно, чтобы: 1. 3 Р{|и-|>«}->0. п 2- 4 У,м^-; п к=1 Москва, 24 декабря 1927 г. ЗАМЕЧАНИЯ Целью данных замечаний является, с одной стороны, уточнение и усовершенствование некоторых результатов (§ 1, 2), а с другой — исследование одного важного специального случая закона больших чисел (§ 3). § 1 Я обязан замечанием В. В. Немыцкому о том, что в доказатель- стве теоремы 4 использовалось неравенство М (Г; BQ) > 42D, которое неверно. На самом деле, легко доказать, что М (Г; во) = 1/2М I Т I < Ъ'г = V2D, т. е. имеет место прямо противоположное неравенство. В этой связи теоремы 4, 5 и 6 указанной работы надо заменить на следующие. Теорема 4*. Пусть М D. Тогда Р II SI > & ] Х> 1 11 I 2 1- 1600 ’ Теорема 5*. р н ci х Г1 |>я}> 1600 р Di J. Теоремы 7—11 остаются без изменения.
4. О суммах независимых случайных величин 31 Теорема 6, использованная только для доказательства теоремы 8Г должна быть заменена на теорему 6*. Доказательство теоремы 4*. Пусть Е = { | 5 I > D/2} и Ё — дополнительное событие. Тогда если | > 2D, то D2 > М (Г; Ё) М ((2D — D/2)2; Ё) 9/tP (E)-D2, Р (£) < V2, что и доказывает требуемое утверждение. Если же | MS | < 2D, то введем событие) Ет = {3mD < | Т | < 3 (т + 1) D, | S | > DI2}. В силу теоремы 2 имеем -25В2. & и На множестве Е'= 3 Ет т=о имеем I Т I С 18Z>, I S К 20D. Отсюда М (52; Е') < 400В2Р (Е). Поскольку М (S2; Ё) < V4D2, то D2 < M.S’2 < М (s2-, Е -Ь Е' + У Его) < т-6 оо < 4-7)2 + 4007)2р (£) + У, 2502 < <3/4С2 + 400Л2Р(Е), откуда что и доказывает теорему 4*. Доказательство теоремы 5*. Если М 4> D или то требуемое неравенство справедливо, поскольку тогда его правая часть отрицательна.
32 4. О суммах независимых случайных величин Если же М D и R 1/2Z), то требуемое неравенство следует из теоремы 4*. §2 При доказательстве теоремы 8 я использовал формулу 3 P(hn& —/пк| >тп-п} —>0. ' (16) ft =6 Для строгого доказательства этой формулы нужна следующая Теорема 6*. Пусть . . ., Еп— последовательность 'неза- висимых событий и U есть событие, состоящее в том, что Р (U | Е.) > и, Р (Ег + . . . + Еп) > и. Тогда Р (U) > V» и*. Доказательство. Если существует к такое, что для него Р (Ек) > 1/3и, то P(U)^ Р (Ек)-Р {U |Е,)>1/з^ что и доказывает требуемое утверждение. Пусть теперь для всех к Р (Ек) < Ч3и. Покажем, что тогда найдется такое к, что 1/3и < Р (Ev + . . . + Е*) < 2/3а. С этой целью обозначим Ft = Е± + . . . + Ei-г и пусть Pi — дополнительное событие. Поскольку и Et взаимно независимы’, то для i к Р (Fi \Ei) = P (Fi) < Р (Fk) < 2/3u, Р (UFi | Ei) > V3u, P (UPiEi) > 43uP (E^, к к P(U)>£p (UFiE'i) ^и^Р (Ei) >±-uP (F,:) > -±- u\ г—1 M что и требовалось доказать. Доказательство формулы (16). Обозначим и = { | an - dn I > е/2}, Fk “ { | ^}пк fnk I ?
4. О суммах независимых случайных величин 33 Очевидно, что Р (U | Fk) > V2. Для достаточно большого п в силу устойчивости средних Р (U) < v4 и, значит, Р (^) < v2. Если событие Ек выполнено, a Fk нет, то событие U выполняется. Следовательно, Р (Fk \Ek) + P(U\ Ек) > 1. Но события Ек и Fk независимы, поэтому для достаточно большого п Р (< | Ек) = Р (Fk) <V2, Р (U | Ек) > У2. Согласно теореме 6* P(U)>^P*(E1+...+Emn) и так как при п -> оо Р (U) —> 0, то . +Emn) + 0, тп S Р(Ек)-Л, к=1 что и требовалось доказать. § 3 Здесь мы хотим исследовать один особый случай закона больших чисел, а именно тот, в котором независимые случайные величины Ль Л2, • . . имеют • одно и то же распределение Р {rji < х} = F (х). В этом случае имеет место Теорема 12. Для устойчивости средних ап = = (т|х + . . . + Лп)/П, п > 1» необходимо и достаточно, чтобы пР { I I > п} 0, п оо. Доказательство. Положим _ _ ( %, если | rjn |< К, 'l'nlt ( 0, если | rjn | К. 2 А. Н. Колмогоров
34 5. О законе повторного логарифма Легко видеть, что при выполнении условия пР { | гц | п} -> О, гг —оо, системы (Tjnfr) и (т}п) эквивалентны и что 4-£а«><-^£м5й.-о, йг=1 7г=1 Следовательно, согласно теореме 8 средние <тп, n > 1, устойчивы. Обратно, если средние on, n > 1, устойчивы, то, как было показано, имеет место формула (16). В рассматриваемом случае эта формула принимает вид т Р { | th — / | > еп} О, где f — некоторая константа. Из этой формулы непосредственно следует доказываемое условие. Если случайные величины т]п имеют конечное математическое ожидание со § \x\dF(х) —оо то условие теоремы 12 выполняется, поскольку тогда —п -]-оо «Р{|П1|>га}<( $ + J)|a:|dF->0. —оо п Можно показать, что в этом случае устойчивость является нор-, мальной. Итак, имеет место Теорема 13. Для нормальной устойчивости средних ап = = (тц + . . . + ft > 1, последовательности независимых оди- наково распределенных случайных величин т|х, т]2, . . . с собственным распределением необходимо 2 и достаточно, чтобы М | т)х | < оо. Последнее утверждение ранее было установлено А. Я. Хинчи- ным (С. г. Acad. sci. Paris, 1929, vol. 188, p. 477). 8 февраля 1929 г. 5 О ЗАКОНЕ ПОВТОРНОГО ЛОГАРИФМА* * Мы рассматриваем последовательность взаимно независимых случайных величин 21, 22, . . ., Zn, . . ., (1 ) 2 Необходимость тривиальна и следует из того, что определение нормаль- ной устойчивости имеет смысл только в случае существования математического ожидания. * Ueber das Gesetz des iterierten Logarithmus.-— Math. Ann., 1929, Bd. 101, S. 126—135. Перевод Ю, В. Прохорова,
5. О законе повторного логарифма 35 математические ожидания которых Mzn равны нулю. Пусть далее п п Ьп = Вп == S == 3 П k=l к=1 Вместе с А. Хинчиным скажемх, что последовательность (1) подчиняется закону повторного логарифма в том случае, когда вероят- ность соотношения ₽) равна единице. В одном важном частном случае этот закон был установлен самим А. Хинчиным 2; мы доказываем, что он применим при следующих условиях: I. Вп > оо, П. |< тп = о ы . Легко выводится необходимость первого условия, если только ис- ключить случай zn = 0. Если все величины zn ограничены в совокупно- сти по абсолютной величине, то второе условие следует из первого, которое в этом случае является необходимым и достаточным. Без использования вероятностей соотношений, которые не могут быть наблюдены непосредственно, например таких, как событие (2), закон повторного логарифма может быть сформулирован следующим образом. 1°. Для произвольных положительных чисел г) и S найдется на- туральное число п такое, что вероятность выполнения хотя бы одного из неравенств Sk > In In Bk (1 + 6) (k = n, n + 1, . . n + p) при любом p остается меньше т]. 2°. Для произвольных т), S и т найдется натуральное число р такое, что вероятность одновременного выполнения (всех) неравенств &k <С V2Вк In In Вк (1 — 6) (к — т, т + 1, . . ,т + р) будет меньше т]. § 1 ЛЕММЫ Пусть max тк, Un = max Sk, l^k^n wn(^) = p x}, Wn (x) = P {Un > x}. 1 См. его кн.: Основные законы теории вероятностей. М., 1927. 2 Math. Ann., 1928, Bd. 99, S. 152. 2*
36 5. О законе повторного логарифма В нижеследующих леммах х означает положительную величину. Так как п в этом параграфе будет предполагаться фиксированным, то в обозначениях мы будем^ его опускать. Лемма I. Если хМ В, то W (х) < e-WsBXi-O), 0 = хМ/2В. Лемма II. Если хМ то3 * * W (х) < е~х'ш. Доказательство лемм I и II. Пусть а О, аМ<1. Тогда Мёаг* = Ml + М(ozk) + М \—£-) + М (3) ; п а*В / аМ \ MeaS= П Ме'12'г<е 2 ' 2 71—1 W (х) еах < М eaS. Из (4) и (5) следует . пвВ г . аМ \ Ж(.г)<е °*+ 2 ( + 2 ). (5) При хМ В мы полагаем в последующей формуле а = х!В, и получаем лемму I; при хМ > В мы полагаем а = 1/М и получаем Л _1_ _— (i-HM —— W(x)<e ш. В обоих случаях условие аМ < 1 выполнено. ’ Из леммы I непосредственно следует Лемма III. Если хМ В, то W (х) < e-xi^B. Лемма IV. Если хМ1В = со < 1/25в, х2!В = X > 512, (6) (7) 3 Ср.: Бернштейн С. Об одном видоизменении неравенства Чебышева и о погрешности формулы Лапласа.— Уч. зап. науч.-исслед. кафедр Украины. Отд. мат., 1924, вып. 1, с. 38—48. (См. также: Собр. соч., т. 4, с. 71—79).
5. О законе повторного логарифма 37 то W (х) > где е означает наибольшее из чисел 32 У (In А)/Х и 64 У а» Доказательство. Пусть 6 = Vs е, тогда 62 = max (б4в, 16 (8) а также вследствие (6) и (7) б2 < V4, (9) д < х/2, (Ю) 6 > 2б2. ' (11) Мы полагаем далее а = х/В (1 - б). Очевидно, х = аВ (1 - б), (12) х/В<а< (13) • аМ < 2о) < х/128, (14) а2 В 512. . (15) Так как для каждого положительного и выполняется неравенство 1 4- и > то наряду с формулой (3) мы имеем и следующую: Подразумеваемое при этом условие аМ в нашем случае выпол- нено вследствие (4). Далее, согласно (4) мы имеем е(агВ/2) (1-аМ). В силу (14) и (8) (17) - аМ < б2/4, так что окончательно мы получаем а‘В (, 6» MeaS е 2 \ (18)
38 5. О законе повторного логарифма Мы имеем, с другой стороны, ОО ОО / bKeaS = — еаУ dW (у) = а eavW (у) dy = —ОО —(30 О аВ (1—6) аВ (1+6) 8аВ оо ~а( $ + $ + S —оо О аВ (1—6) аВ (1+6) За В — а (^г + ^г + ^з + А + А)* (19) Так как W (у) 1, то о «Л а § еаУ dy 1. (20) —оо По лемме II и формуле (14) для всех у В/M выполняется неравен- ство Ж (у) e~v>iM е~2аи. По лемме III мы имеем также при 8аВ у BIM W (у) е-2/7<в е~2аУ. Стало быть, мы получаем оо а/в<^а е~°У(1у<^1. (21) ЗаВ Так как вследствие (18), (9) и (15) М eaS 8, то из (20) и (21) следует неравенство aJr + aJ6 < V4M e“S. (22) Для оценки величин aJ2 и aJ4 мы применим лемму I. Вследствие (6) и (8) мы имеем при у^ЗаВ неравенства 0<«<1/8б2, W)<« 2В 1 8 ’ Поэтому мы получаем аВ (1—6) ЗаВ yt / 1 \ а(Л+Л)<«( $ + $ )eav~^^~~^dy. О аВ (1+6) В обоих интервалах интегрирования величина
5. О законе повторного логарифма 39 не превосходит границы М(в5(1 + 6)) = а25(1 + (1 + S/(1.--1-62) = =[ 1 - б2+462 а+s)2] < - 4б2) • Следовательно, мы имеем 8«в Л«в г 2. м) “!В (, _ 1 л«) «(Л + ЛХа J е 2 1 2 = 2 о Так как в силу (7), (8) и (15) In (32Х) < 2 In X < !/Д62, In (32а2Б) < (а25/8) 62, (23) то в конце концов мы получаем из (18) неравенство а’В ( б* \ a (J2 + Л) < V4 е~ < V4 (24) Из (19), (22) и (24) следует Л «Л>1/2М^>1/2^ 2 (1 (25) С другой стороны, так как W (у) монотонна и не возрастает, то вслед- ствие (12) аВ (1+6) aJ3 = a J eavW (у) dy < 2а? В (х). (26) аВ (1-6) Из (25) и (26) выводим Так как наряду с (23) и по аналогичным причинам имеет место фор- мула In (4a2fi) < (а2В/2) 6, то окончательно а2В ж* ж1 х* W (X) > е~ - (1+4в) > е~ (1+4б) > е~ <1+8в) = е~ (1+Е>. Лемма V. W (х) < 2W (х -<У2В). Доказательство. Обозначим буквой Е событие U > х
40 5. О законе повторного логарифма и буквой Ек событие Sk = U>x. Очевидно 4 *, Е = Ег + Е2 + . . . + Еп, TF (х) = Р {£}. Так как величины Z} с I >► к не входят в определение события £jt, то мы имеем мв (о*)=м(( £ ^)2Ш = 3 мг|<в, к к 1 7 г—к+1 РЕк Так как 8 = U + то выполняются также неравенства PBjt {S>U- Y2B} > v2, W(x- Y2B) = P {5 > x - V2B} > . >W(x) PE {8 >U - /25} > W (x). Этим наше утверждение доказано. § 2 ДОКАЗАТЕЛЬСТВО ПЕРВОЙ ЧАСТИ ОСНОВНОЙ ТЕОРЕМЫ (1°) Достаточно рассмотреть случай д<1/а. ' (27) Очевидно, что в силу условий I и II возможно найти пв такое, что Вщ>е, (28) /1п1пВПо>4/6 (29) и что для каждого п nQ МЦВп < 6/16, (30) мп/тгн’<т- • <31) 4 Знак + здесь употребляется вместо IJ с тем, чтобы подчеркнуть, что объ- единяемые события попарно несовместны.— Примеч. пер.
5. О законе повторного логарифма 41 После того как п0, тгь . . определены, мы выбираем п* так, что в^/в^ 1 + 6/4, (32) Bn^/Bn^>i + 8/^ (33) В силу (30) и (32) мы имеем и, следовательно, по (28) 5^>(l + S/8)\ (34) Пусть далее X (0 ]/”2i In In t. Вследствие (32) мы имеем Х(%)/х(ВпМ)<1 + 6/4. (35) Из осуществления хотя бы одного из неравенств Sn > X (Вп) (1 + S) (nw < п < nfc) вытекает неравенство 1 (В^) (1 + 6). (36) Обозначим Vk вероятность неравенства (36). Тогда очевидно^ что сходимость ряда S (37) достаточна для справедливости утверждения 1°. Вследствие (35) мы имеем ^<P{t7„ft>x(^)(l +6/2)}, (38) а по лемме V последняя вероятность не превосходит lx (B„k) (1 + 6/2) - V2B7kl Отметим, что из (29) следует неравенство < (6/4) х (ВПк), так что мы получаем . < 2W (X (В ) (1 + 6/4)] Л Л
42 5. О законе повторного логарифма и по лемме I Х’(В„ ) = 2(?-1п1пвпД1+А)’(1-в) где вследствие (31) 0==— V -B-nk-<~8- Отсюда следует V, < 2е-1" "« (1+ т) < 2 (In ВЧГ (,+ т) < <2[Мп(1 + А)]"(1+^)<сГ(‘+^, что доказывает сходимость ряда (37). § 3 ДОКАЗАТЕЛЬСТВО ВТОРОЙ ЧАСТИ ОСНОВНОЙ ТЕОРЕМЫ (2°) Пусть, как и раньше, выполнено (27). Вследствие условий I и II и только что доказанной первой части основной теоремы возможно найти такое п0, что, во-первых, имеет место (28), во-вторых, для каждого п п0 Мп/Вп<42 . (39) иА в-третьих, вероятность осуществления всех неравенств I sn 1 < 2х (Вп),. (п = n0, n0 + 1, . . п0 + р) (40) для каждого р больше 1 — ч\12. Выберем пк таким образом, что Тогда вследствие (27) и (39) имеем ^/^<32/6, Bnfc<Bn.(32/6)ft. • (42) Положим — Snk — Р/с = = Bnk — ВП/е_г тогда из (41) следует (1-6/4), х (М > % (ВПк) (1 - 6/4), (43) X(Pfr)(l. - 6/4) > х (ВПк) (1 - 6/2). (44)
5. О законе повторного логарифма 43 С другой стороны, из (41) следует также X (В.,) (‘ - 8/2) - 2% (Вщ-х) > X (»„,) (1 - 6). (45) Так как Snk = о* + то в случае, когда выполняется (40), из неравенства Ъ > X (Pi) (1 “ 6/4) . (46) вследствие (44) и (45) вытекает неравенство ^>X(^t)(l-6). (47) Мы докажем теперь, что при достаточно большом р вероятность осуществления хотя бы одного из неравенств (46) с k == 1, 2, . . , р будет больше 1 — ц/2. Отсюда будет следовать, очевидно, что анало- гичная вероятность для неравенств (47) будет больше 1 — ц, и вто- рая часть основной теоремы будет доказана. Так как величины ак взаимно независимы, то для указанной цели достаточно доказать расходимость ряда 5 V. (48) к—1 вероятностей неравенств (46). Для оценки вероятностей Vk мы применим лемму IV, полагая в = м = мПк, * = 1 (PJ (1 - 6/4). Для достаточно больших к выполняются условия (6) и (7), так как вследствие (43) ₽* > 1кВПк и потому х (₽fc) Мп / Л In In \ lim <lim \2М^ у °* lim - > limIn In Вп 'j = оо. р& V 2 */ • Из последних формул мы усматриваем, что 8 стремится к нулю при к -> оо. Итак, для достаточно больших к мы имеем (1 + 8) (1 + 6/4) < 1
44 6. О законе больших чисел и вследствие (42) = (ln₽ft) *)>(lnB„s) t1" ^>Ck чем доказана расходимость ряда (48). Москва, 24 ноября 1927 г. 6 О ЗАКОНЕ БОЛЬШИХ ЧИСЕЛ* В математической теории вероятностей под законом больших чисел обычно понимают либо теорему Пуассона, либо теорему Чебы- шева с их обобщениями на случай зависимых испытаний. Однако этому закону можно дать более широкую интерпретацию, которая более согласуется с его натурфилософской трактовкой, если исполь- зовать это понятие всякий раз, когда можно утверждать с вероят- ностью, близкой к единице, что некоторая величина лишь немного отличается от некоторой априори заданной постоянной <2>. В преды- дущей заметке я привел теорему, которая, как мне кажется, наиболее отвечает этой интуитивной концепции. В настоящей работе я хочу вернуться к этой теме и сформулировать несколько более о»б- щее утверждение, а также пояснить некоторые возникающие здесь вопросы. § 1. Для точной постановки задачи мы рассмотрим последователь- ность действительных чисел (4> хг, х2,..хп,. . в которой значение Хп зависит от результата последовательных ис- пытаний ^(П), g>(n), g,(n)e Условимся говорить, что Хп устойчивой или же что Хп подчиняет- ся закону больших чисел, если существует последовательность по- стоянных ^2? • • •» : такая, что для каждого положительного ц Р{ \Xn-dn |>ц}->0. (1) * Sur la loi des grands nombres.—Atti Accad. naz. Lincei. Rend., 1929, vol. 9, p. 470—474. Представлено Г. Костельнуово Перевод О. В. Вискова.
6. О законе больших чисел 45 В большинстве важных случаев в качестве dn можно брать мате- матическое ожидание Е (Хп). Если окажется, что Рп (Я) = Р { I Хп - Е (Хп) | > п} -*0 (2) для каждого положительного ц, то будем говорить, что устойчивость Хп нормальна. Можно доказать, что если Хп — Е (Хп) равномерно ограничено, то соотношение (2) является следствием соотношения (1), «г. е. в этом случае устойчивость может быть лишь нормальной. Согласно Чебышеву имеем pn(Ti)<w, (3) где положено #1 - Е [Хп - Е (О2. Таким образом, условие Вп -> 0 (условие Маркова) (4) является достаточным условием нормальной устойчивости Хп. Если Хп — Е (Хп) равномерно ограничены по абсолютному значению по- стоянной то, как нетрудно доказать, ЛЛФ = Рп - n2)W2 - П2)- (5) Следовательно, в этом случае условие Маркова не только достаточ- но, но также и необходимо для устойчивости Хп, которая, как уже отмечалось, в рассматриваемой ситуации может быть лишь нор- мальной. § 2. Формулируя условие Маркова, мы касались только опреде- ления нормальной устойчивости. Однако интерес этого условия за- висит от того факта, что вычисление Впв большинстве случаев проще чем вычисление Рп (ц). В общем случае, обозначив Efr (Хп) математическое ожидание Хп в предположении, что известны результаты к первых испытаний #1°, •••? будем иметь следующую фундаментальную фор- мулу: е[ена\)-ем(хп)]. (6) к==1 В самом деле, очевидно, Eo(Xn)-E(Xn), Еп(Хп) = Хп, поэтому, обозначив Znfe = Eft(Xn)-E^(Xn), имеем *п Е (ХП) = Znl + zn2 4-... + znn.
46 6. О законе больших чисел Вообще, обозначив (У) математическое ожидание Y при условии, что известны результаты испытаний получим Eft_! (Znfc) = Е^г [Efe (Уп) - E^(Xn)J = Е,_г (Хп) - Е^ (Хп) = 0. Поскольку Zni при i < к является константой, если фиксированы ре- зультаты к — 1 первых испытаний, то имеем также Efc-1 (^ni^nfc) = 0 и, наконец, E(ZniZnfe) = E[Efe_x(ZniZnJ] = O. Из этого последнего равенства немедленно следует формула <7> Вп = Рп1 + Рп2 + • • • + Pnn, Pnfc = УЕ (Znk)f (7) отличающаяся от (6) только обозначениями. Обратим внимание на смысл $пк. Это есть среднее квадратичное уклонение математического ожидания Хп, когда известен результат испытания $&п). Поэтому |3nfc является естественной мерой зависи- мости Хп от результата испытания <8) Это согласуется с форму- лированной в начале заметки концепцией закона больших чисел. Однако сейчас мы измеряем зависимость Хп от каждого испытания 2/7) с помощью моментов и доказали, что закон больших чисел эффективно применим к Хп, если сумма квадратов |3ПЙ. бесконечно мала. Это имеет место, в частности, если = о (1//Й). (8) § 3. Рассмотрим теперь случай, когда испытания определяю- щие значение Хп, независимы в совокупности. Обозначим Ек (У) математическое ожидание У, если известны результаты всех испыта- ний ^п), за исключением $^п). В рассматриваемом случае независи- мых испытаний имеем $»<а„к = Е[Хп-.Е*(Хп)], (9) Вп^Ап — «Гц + ««г + . . . + а®п. (10) Таким образом, для нормальной устойчивости. Хп достаточно усло- вие 0. (11) Доказательство формулы (9) можно провести следующим образом: Ek[EJC(^n)] = Efc_1(Xn)) Efc [Хп - Е* (ад > {Es (Хп) - ЕЛ. [Е* (Xn)]}2=[Ek (Хп) - Ew (Хп)]\ = Е [Хп - Е* (ад > Е [Eft (Хп) - ЕЛ_! (ад = ftk.
6. О законе больших чисел 47 В общем случае зависимых испытаний первая из этих формул неверна. Пусть M(fr) (Хп) — верхний предел возможных значений Хпч если известны результаты всех испытаний г), за исключением 81п), и пусть тп(А) (Хп) — соответствующий нижний предел. Обозначим = sup I (Хп) - (Хп) |. Таким образом йп& — максимальное уклонение Хп, если неизвестен лишь результат испытания $&п). Можно видеть, что (12) Al < V4 (Qnl + Qna + • •. + Qnn). (13) Отсюда следует условие для устойчивости Хп в случае незави- симых испытаний, приведенное в моей предыдущей работе: Q2ni + Q^ + .-. + G™->0. (14) В заключейие отметим еще» что в случае, рассмотренном Чебы- шевым, , Хп ~ (#i 4" 4” • • • + где х* зависит от испытания и эти испытания независимы в совокупности, имеем п о л d* (х ) =с4 в ХЕ [хп - е и приходим к классическому условию для устойчивости Хп: п3 ПРИМЕЧАНИЯ 1 Представлена 3 марта 1929 г. 2 См.: Бернштейн С. Н. Теория вероятностей, с. 142, где приводится еще более широкое определение. 3 С. г. Acad. sci. Paris, 1927, vol. 185, p. 917. 4 Можно получить аналогичные результаты, рассматривая векторы. В. Гливен- ко сообщил мне, что аналогичные рассмотрения могут быть проведены даже для векторов в функциональном пространстве Гильберта. 5 Мы постоянно предполагаем, что эти испытания независимы в совокупности. 4 Относительно этого определения устойчивости см. мою статью: Ueber die Sum- men durch den Zufall bestimmter unabhangiger Grossen.— Math. Ann., 1928, Bd. 99, S. 309. В моей цитированной заметке эта формула доказана только в случае незави- симых в совокупности испытаний. * Предполагается, что испытания осуществляются в соответствии с поряд- ком их индексов к. Это условие особо интересно, поскольку в определение моментов апк не вхо- дит порядок испытаний
48 7. Общая теория меры 'и исчисление вероятностей 7 ОБЩАЯ ТЕОРИЯ МЕРЫ 7 И ИСЧИСЛЕНИЕ ВЕРОЯТНОСТЕЙ* Возникающий в современной математике интерес к теории веро- ятностей обусловлен не только растущим значением ее в математи- ческом естествознании, но и постепенно обнаруживающейся глубо- кой связью этой теории со многими вопросами различных областей чистой математики. Получается впечатление, что формулы исчисле- ния вероятностей выражают одну из основных групп наиболее об- щих математических закономерностей. * Тем не менее было бы неосторожным утверждать, что эти факты указывают на зависимость понятий чистой математики от понятия случайности, с которым имеет дело теория вероятностей. Например, тот факт, что распределение знаков десятичного разложения ирра- ционалов может изучаться при помощи формул исчисления вероят- ностей, отнюдь не обязательно толковать, как указание на зависи- мость этого распределения от случая.. Мы полагаем, напротив, что подобные факты намекают на воз- можность построения некоторой весьма общей и чисто математиче- ской теории, формулы которой могут быть применены как к исчис- лению вероятностей, так и ко многим другим областям чистой и прикладной математики. Чтобы наметить содержание такой теории, достаточно выделить из изложения теории вероятностей те элемен- ты, которые обусловливают ее внутреннюю логическую структуру и совершенно не связаны с конкретным значением теории. Прежде всего мы приходим таким образом к общей теории меры. Общее понятие меры множества охватывает как частный случай понятие вероятности. Множество произвольных элементов, рассма- триваемое с точки зрения меры его подмножеств, мы будем называть чисто метрическим пространством, хотя, быть может, это и являет- ся злоупотреблением термином «пространство». В частности, в исчис- лении вероятностей мы будем говорить о пространстве элементарных случаев данной проблемы и о вероятностях различных множеств этих случаев. Дальнейшим развитием общей теории меры является теория функций в чисто метрических пространствах. Эта теория занимается изучением тех свойств функций, которые зависят только от меры мно- жеств, на которых функции принимают ту или иную совокупность значений. Таковы, например, свойства ортогональности двух функ- ций или полноты системы ортогональных функций. Если рассматри- вать величины, зависящие от случаев (случайные величины), как * Тр. Коммунистической академии. Разд, мат., 1929, т. 1, с. 8—21.
7. Общая теория меры и исчисление вероятностей № функции, определенные в пространстве элементарных случаев, та все относящиеся к ним предложения теории вероятностей окажутся частными следствиями предложений такой общей теории. Сила методов теории вероятностей в применении к вопросам чи- стой математики в значительной мере основана на употреблении по- нятия независимости случайных величин. Это понятие не получило до сих пор явной чисто математической формулировки, хотя дать ее и не представляет больших затруднений. Мы определяем далее «не- зависимость» системы функций, причем независимость оказывается чисто метрическим свойством. Свойства множеств, на первый взгляд совершенно различных,, когда их рассматривают только со стороны установленного для их подмножеств мероопределения, часто оказываются тождествен- ными. Так, например, элементарно доказывается, что куб любого числа измерений может быть обратно однозначно отображен на отрезок прямой таким образом, что все измеримые (Л) множества точек куба переходят в множества линейной меры, равной мере начальных мно- жеств. Мы говорим поэтому, что куб любого числа измерений метри- чески эквивалентен отрезку. Кроме понятия метрической эквивалент- ности, мы определяем более общее понятие изометричности двух пространств. Трудно предвидеть, потребуется ли немедленное действительное развитие намеченных теорий или достаточно будет ограничиться указанием на принципиальную их возможность. Последнее во вся- ком случае необходимо для установления правильного взгляда на связь различных областей математики. Кроме того, это доставляет метод перенесения рассуждений из одной области в другую из числа тех, в которых могли бы найти применение предложения общей теории. I. АБСТРАКТНОЕ МЕРООПРЕДЕЛЕНИЕ Рассмотрим множество А элементов а. Мы говорим, что для мно- жества А дано некоторое мероопределение М, если некоторым определенным его подмножествам Е приписана определенная мера М (Е). Множество А вместе с мероопределением М мы будем назы- вать метрическим пространством. Мы должны дать теперь аксиомы, которым будут удовлетворять все рассматриваемые нами мероопреде- ления. Прежде всего мы предполагаем, что мера множества является Действительным числом, положительным или равным нулю. ' Аксиома!.' ' М (Е) > 0. Во-вторых, мы допускаем, что если два множества не пересе- каются, то мера их суммы равна сумме мер.
ъо 7. Общая теория меры и исчисление вероятностей Аксиома II. Если . Ег X Е2 = О, ,то М (Е± + Е2) = М (Ег) + М (Е2). При этом предполагается, что существование мер для двух из рассматриваемых множеств влечет за собой существование меры третьего. Можно доказать на основании этой аксиомы общую формулу М (Ех + Е2)^М (Я,) + М (Е2 - EJ. (1) Но при этом отнюдь нельзя предполагать, что существование мер для двух множеств, если они пересекаются, влечет за собой существо- вание меры для их суммы или разности: существуют важные мерооп- ределения, не обладающие этим свойством. Так как произведение двух множеств может быть определено так: — -^2)» (2) то формула (1) служит для вывода всевозможных соотношений между суммами, разностями и произведениями конечного числа множеств. Для удобства мы вводим в число рассматриваемых множеств пустое множество, которое будем обозначать через 0. Если в некото- ром мероопределении хотя бы одно множество имеет меру, то из акси- -омы I следует, что М (0) = 0. (3) Наконец, третья аксиома вводит совершенно произвольное огра- ничение рассматриваемых мероопределений: мера всего пространства принимается равной единице. А к с и о м а III. М (А) = 1. Это сильно упрощает изложение, общий же случай легко может <>ыть изучен на основании этого частного. Во многих же применениях, в частности в исчислении вероятностей, это ограничение вызывается существом вопроса. Рассмотрим теперь некоторые примеры мероопределений, удов- летворяющих приведенным аксиомам. 1. Лебегово мероопределение для множеств точек n-мерного куба со стороной, равной 1. 2. Плотность линейных множеств в точке 0 может рассматривать- ся как их мера. 3. Если множество А состоит из натуральных чисел, то в каче- стве меры множества может рассматриваться его плотность, т. е. предел отношения числа элементов множества, не превышающих п, ж п при п -> оо.
7. Общая теория меры и исчисление вероятностей 51 4. Если А есть множество элементарных случаев проблемы ис- числения вероятностей, то за меру множества элементарных случаен принимается вероятность появления хотя бы одного из них. II. ЗАМКНУТОСТЬ МЕРООПРЕДЕЛЕНИЯ § 1. Данному мероопределению М соответствует вполне опреде- ленная система (Е) множеств Е, имеющих меру. Относительно этой системы нам известно пока только, что в нее входят пустое множест- во 0 и все пространство А, а также, что если Е± + Е2 Е$.) ЕГ*Е2 = О, то из вхождения в (Е) двух из этих множеств следует принадлеж- ность к (Е) и третьего. Очевидно, что, в частности, дополнение мно- жества, входящего в (£), входит в (£), так как Е + Ё - А, Е-Ё = 0. § 2. Мероопределение называется полным, если состоит из всех подмножеств пространства А. Нам неизвестно ни одного полного мероопределения, в котором все множества из одного элемента имели бы меру, равную нулю. Доказать существование таких мероопределений без помощи прин- ципа произвольного выбора представляется нам задачей большой трудности. § 3. Мы говорим, что мероопределение М заключает в себе ме- роопределение М', данное для того же множества А, если (£) за- ключает в себе (£"), и для множеств, принадлежащих к (£*')? меры в обоих мероопределениях совпадают. Отнюдь нельзя предполагать, что всякое мероопределение заклю- чается в каком-либо полном; противоречащие примеры элементарны. Впрочем, ни про одно из обычно употребляемых в математике меро- определений не доказана невозможность рассматривать их как за- ключающиеся в полных мероопределениях. Напротив, Банах доказал при помощи принципа произвольного выбора, что линейное лебегово мероопределение содержится в некотором полном х. В силу метриче- ской эквивалентности пространств любого числа измерении то же верно и для n-мерного лебегова мероопределения. Но уже в трехмер- ном случае в полном мероопределении, заключающем в себе лебего- во, не может быть выполнен принцип равенства мер конгруэнтных множеств, что доказывается данным Хаусд орфом примером разло- жения сферы на три множества, из которых каждое конгруэнтно сум- ме двух других с точностью до счетного множества. Даже в случае счетности основного множества А построение пол- ного мероопределения наталкивается на большие трудности. Так, например, проблема обобщенной плотности последовательностей на- 1 Fund, math., vol. 4.
52 7. Общая теория меры и исчисление вероятностей дуральных чисел, т. е. нахождения полного мероопределения, за- ключающего в себе мероопределение 3 предшествующей главы, пред- i ставляет трудности, подобные построению 2 точечного множества, \ неизмеримого (L). § 4. Соответственно с этим и при постановке проблем исчисле- ния вероятностей следует требовать, чтобы было указано, для каких случаев вероятности предполагаются существующими. Очевидно, например, что в случае геометрических вероятностей было бы неосто- рожным, предполагать существующими вероятности попадания точки , на каждое множество точек пространства. § 5. Но в большинстве случаев можно предполагать систему (Е) •обладающей некоторыми свойствами замкнутости. Мы будем гово- рить, что система (Е) конечно замкнута* если в нее входят все суммы шар принадлежащих к ней множеств. Очевидно, в силу формулы Е± Е2 — Е± Е2 (4) .в замкнутую систему входят все разности, а в силу формулы (2) и произведения принадлежащих к ней множеств. § 6. Для каждой системы (Е) существует определенная мини- мальная система F (Е), замкнутая и содержащая в себе (£). Если .можно приписать меру всем множествам системы F (£), совпадающую с данной для множеств системы (Е) и удовлетворяющую нашим трем аксиомам, то мы говорим, что начальное мероопределение допускает -замыкание. Неизвестно, всякое ли мероопределение допускает замыкание. Если замыкание возможно, то не обязательно единственным спосо- бом; примеры последнего элементарны. Отыскание мероопределения, замыкающего данное выше под № 3, представляется нам задачей большой трудности. Точно так же спорен вопрос, обязательно ли мероопределение, связанное с каким-либо вопросом исчисления вероятностей, должно быть замкнутым. § 7. Система (Е) называется счетно замкнутой, если в нее входят всевозможные счетные суммы ее элементов. В счетно замкнутую систему входят и счетные произведения ее элементов, так как П£п-Ж (п = 1, 2, . . .). (5) Но изучение счетной замкнутости тесно связано с понятием нор- мальности мероопределения и, собственно, только для нормальных мероопределений имеет смысл. 2 На близость обеих проблем указывают результаты, сообщенные мной в «С. г. Acad. sci. Paris», 1925.
7. Общая теория меры и исчисление вероятностей 53 III. НОРМАЛЬНОСТЬ МЕРООПРЕДЕЛЕНИЯ §’8. Мероопределение нормально, если для множеств, имеющих меру, из следует, что М(Е) = ^М(Еп) (п = 1, 2, . . .). Из приведенных выше мероопределения 2 и 3 не являются нор- мальными. Мероопределения, соответствующие проблемам исчисле- ния вероятностей, также не обязательно нормальны. § 9. В случае конечно замкнутого нормального мероопределения легко доказать формулы м (SЕп} = 3М {Еп-^-Ек}, (6) к—1 п м(ПЯп) = ИтМ(П Еа.), п=1,2,......................... (7) к=1 верные при единственном условии, чтобы множества Еп и их сумма или произведение имели меру. § 10. Кроме того, для конечно замкнутых нормальных мероопре- делений верно следующее предложение о счетных покрытиях: если Еа%Еп (п = 1, 2, ..), то М (£)< 2М(£П) (п = 1,2, . . .). В самом деле, положим Еп = Е(Еп-^ Ек} (п = 1, 2,...); /г=1 очевидно, тогда Еп-Ет — 0, п у= т\ Е = W (En) > (Еп) = М (Е) (п = 1, 2, . . .). § И. Будем называть множество Е измеримым при мероопреде- лении М, если для любого наперед заданного е существуют две по- следовательности множеств системы (Е) Е^ . . ., Еп, . . . £*!, £2, • • •» Епг • • .
54 7, Общая теория меры и исчисление вероятностей такие, что Е CZ 2Еп, Ё с ЪЕп, 2М (Еп) + М (Еп) <1+8 (п = 1, 2, . . .). Будем называть обобщенной мерой измеримого множества Е нижний предел сумм SM (Еп) (п = 1, 2, . . .) для его покрытий, состоящих из множеств системы (Е). § 12. Мы получим таким образом некоторое новое мероопреде- ление L (М), придающее меру каждому измеримому относительно М множеству. Если М конечно замкнуто и нормально, то L (М) удов- летворяет аксиомам I—III, нормально и счетно замкнуто. Методы доказательства этих фактов совпадают с применяемыми при ис- следовании обычной лебеговой меры. Таким образом для всякого нормального конечно замкнутого мероопределения существует за- ключающее его в себе счетно замкнутое. § 13. Мероопределение L (М) не является минимальным счетно замкнутым мероопределением, заключающим М. Не составляет большого труда определить такое минимальное мероопределение В (М), которое содержится в L (М). Но мероопределение L (М) обладает другим замечательным свойством: измеримое относительно М множество во всяком нормаль- ном мероопределении, заключающем в себе М, имеет ту же меру, что и в L (М). § 14. В частности, в исчислении вероятностей, если система случаев, имеющая определенные вероятности, конечно замкнута и нормальна, то можно без противоречия и единственным образом оп- ределить, что следует понимать под вероятностью счетного произ- ведения или счетной суммы, имеющих вероятность случаев. Мы полагаем, что только после этого можно считать прочно обоснованными рассуждения о вероятностях таких событий, как сходимость ряда случайных величин и пр. IV. МЕТРИЧЕСКАЯ ЭКВИВАЛЕНТНОСТЬ И ИЗОМЕТРИЧНОСТЬ ПРОСТРАНСТВ § 15. Два метрических пространства называются метрически эквивалентными, если они могут быть поставлены в обратно одноз- начное соответствие таким образом, что множествам, имеющим меру, будут соответствовать множества того же рода и меры соответствую- щих множеств будут равны. § 16. Куб любого числа измерений со стороной, равной 1, рас- сматриваемый вместе с лебеговым мероопределением для его подмно- жеств, метрически эквивалентен отрезку длины, равной единице тоже с лебеговым мероопределением. Доказательство элементарно.
7. Общая теория меры и исчисление вероятностей 55 § 17. Два множества Ег и Е2 в метрическом пространстве об- ладают одним и тем же метрическим типом, если М l(2?i — ^2) + (^2 ~ -^1)1 = 0. Во многих вопросах, в которых можно пренебрегать множествами меры нуль, можно вводить в рассмотрение только метрические типы, а не сами множества 3 *. Если мероопределение конечно замкнуто, то тип суммы, произ- ведения или разности двух имеющих меру множеств зависит только от их типов и, следовательно, можно говорить о суммах, произве- дениях и разностях самих типов. Если мероопределение счетно замкнуто и нормально, то то же имеет место для счетных сумм и произведений. § 18. Два конечно замкнутых пространства называются изоме- трическими, если между Метрическими типами их имеющих меру подмножеств можно установить обратно однозначное соответствие таким образом, чтобы суммам двух типов соответствовали суммы соответствующих типов и чтобы меры соответствующих типов были равны. Очевидно, что произведениям и разностям двух типов будут так- же соответствовать произведения или разности соответствующих типов. Если же оба мероопределения нормальны и счетно замкнуты, то то же будет верно и для счетных сумм и произведений. Но при этом надо заметить, что счетно замкнутое и нормальное мероопреде- ление может быть изометрично ненормальному. § 19. Мероопределение обладает счетным базисом, если в систе- ме (Е) имеется счетная система (I) (базис) такая, что каждое множе- ство системы (2?) измеримо при базисе (/), т. е. и оно и его допол- нение допускают покрытие множествами системы (/) с суммой мер, сколько угодно мало превышающей их меру. Конечно, это определе- ние интересно только в случае нормальности пространства. Лебегово мероопределение на отрезке имеет счетный базис, со- стоящий из отрезков с рациональными концами. Нам неизвестно ни одного нормального пространства мощности континуума, не имеющего счетного базиса (если не считать определяемых с помощью принципа произвольного выбора). Но подобное пространство мощно- сти 2е легко построить. § 20. Мероопределение М, нормальное, конечно замкнутое и об- ладающее счетным базисом, обязательно изометрично мероопреде- лению М1, заключающемуся в лебеговом мероопределении отрезка § 21. Укажем в заключение, что так как многие свойства чисто метрических пространств зависят только от соотношений метриче- 3 Конечно, все дальнейшее можно5изложить и не вводя понятия метрическо- го типа, как основанного на аксиоме «разбиения», пользуясь вместо этого поня- тием метрического «равенства» множеств.
56 7. Общая теория меры и исчисление вероятностей ских типов их подмножеств, которые могут быть тождественны у самых различных пространств, даже у пространств различной мощности, то заслуживала бы внимания попытка изложить теорию таких пространств, если рассматривать их как систему метрических типов, которые могут быть складываемы, умножаемы и т. д., и не предполагая существования «элементов» пространства. V. ЧИСТО МЕТРИЧЕСКАЯ ТЕОРИЯ ФУНКЦИЙ § 22. Мы будем рассматривать только функции, принимающие в каждой точке чисто метрического пространства определенное ве- щественное значение. Такая функция называется измеримой, если множество точек, в которых она принимает значения, принадлежа- щие какому-либо интервалу, всегда имеет меру. § 23. Очевидно, множество, на котором функция принимает определенное значение а, также имеет меру, так как Е [Ь < f < а] + Е [/ = а\ + Е [а < f < d,= Е [6 < f < d. Если мероопределение в рассматриваемом пространстве счетно замкнуто, то множество, на котором: измеримая функция принимает измеримое (В) множество значений, имеет меру, так как оно может быть получено посредством счетных сложений и умножений из мно- жеств, заведомо имеющих меру. Но, конечно, нельзя утверждать того же в случае измеримого (L) множества значений функций, даже если рассматриваемое мероопределение будет типа L (М), § 24. Множество функций [/] называется измеримым в совокуп- ности, если множество, на котором значение каждой функции попа- дает в определенный соответствующий ей интервал, имеет меру при любом выборе интервалов. В случае конечно замкнутого мероопределения конечная группа измеримых функций измерима в совокупности. В случае счетно замкнутого мероопределения то же верно для счетного множества функций. В случае счетно замкнутого мероопределения множество, на котором значения последовательности функций определяют точку измеримого (В) множества в счетномерном пространстве, имеет меру. Таково, например, множество точек сходимости ряда функций. Все сказанное непосредственно применяется к рассмотрению случайных величин в теории вероятностей. § 25. Интеграл функции / по множеству Е может быть опреде- лен в чисто метрической теории только по Лебегу как предел выра- жения оо т=—зо
7. Общая теория меры и исчисление вероятностей 57 и п оо, если входящий в него ряд абсолютно сходится и самый предел существует. При рассмотрении вопросов, связанных с поня- тием интеграла, мы будем предполагать пространство нормальным. § 26. Обычным методом доказывается, что для ограниченной из- меримой функции интеграл существует. § 27. Для определенного таким образом интеграла имеют место следующие соотношения: 1. +/2)—Уfi + У/2. Е Е Е 2. {cf = c^f. Е Е 3. J / = У/ + У f, если Ei-E2 = 0. Ei Ег к. limj/n=jf, если А</2<.••</«•••->/• Е Е § 28. В теории вероятностей давно употребляется близкое к по- нятию лебегова интеграла понятие математического ожидания. Если рассматривать вероятность как меру множества элементарных случаев, то математическое ожидание случайной величины Z будет равно 7)(Z)=yZ, А а ее математическое ожидание при гипотезе Е равно Е По аналогии с понятием относительной вероятности введем обоз- начение МЕ1 (Е2) = М (Е^/М (Ei), тогда т==—х> § 29. На основе данного определения интеграла может быть раз- вита теория ортогональных функций в чисто метрических простран- ствах. Так, например, для того чтобы система ограниченных; орто- гональных функций не могла иметь мощности выше счетной, доста- точно, чтобы рассматриваемое мероопределение имело счетный базис. Интересно, в какой мере возможно изложить чисто метрическую теорию функций в терминах, инвариантных для изометричных про- странств. Уже самое определение функции должно получить для этого другую формулировку.
58 7. Общая теория меры и исчисление вероятностей VI. НЕЗАВИСИМОСТЬ § 30. Два разбиения пространства А на множества непересекаю- щихся частей А - SF', А = SF" называются независимымщ&ыт дляисяких двух измеримых множеств Е* и £", состоящих первое из некоторых F1, а второе из некоторых имеет место соотношение М (Е'-Е") = М (Е')-М (Е"). § 31. Произведением разбиений [F] в конечном или бесконечном числе называется разбиение пространства на произведения элемен- тов данных разбиений по одному из каждого. Разбиения [F] в конечном или бесконечном числе взаимно незави- симы, если любые два произведения из них, не имеющие общих эле- ментов, независимы. Из попарной независимости* разбиений не сле- дует их взаимная независимость. § 32. Установленные общие определения допускают в частных случаях ряд упрощений. Так, например, если мероопределение ко- нечно замкнуто и разбиения (F') и (F") состоят из конечного числа имеющих меру элементов, то для их независимости достаточно, чтобы М (F'-F") = M(F')*M (F") для каждой пары F' и F". В случае нормальности мероопределения то же самое верно для разбиений на счетное множество частей. § 33. Каждая функция определяет разбиение пространства на множества, на которых она принимает то или иное значение. Функ- ции называются взаимно независимыми, если соответствующие раз- биения независимы. § 34. Точно так же определяется независимость разбиений мно- жества (Е) и независимость функций на множестве. Для функций fj, /2, . . /п, независимых на множестве Е, имеет место соотношение DE (А/2 . . . /п) = DE (A) DE (/2) . . . DE (/п).
8. Об усиленном законе больших чисел 59 8 ОБ УСИЛЕННОМ ЗАКОНЕ БОЛЬШИХ ЧИСЕЛ* Пусть £1? #2? • • •’ *Г/г’ • • • (Ч __ последовательность независимых в совокупности случайных величин с равными нулю математическими ожиданиями £ (хп)- Следуя Кантелли и Хинчину, будем говорить, что последователь- ность (1) удовлетворяет усиленному закону больших чисел (у.з.б.ч.), если вероятность того, что средние 8п ^1 + Х2 + . . . + Хп Gn==~7l П сходятся к нулю, равна единице. Мы сейчас докажем, что у. з. б. ч. имеет место, если вторые мо- менты Е (4) = ьп существуют и ряд сходится. Это условие не может быть заменено другим, менее силь- ным условием: если для некоторой последовательности постоянных Ьп ряд (2) расходится, то можно построить последовательность (1) независимых случайных величин, удовлетворяющих равенствам Е == О, Е (4) = и таких, что они не удовлетворяют у. з. б. ч* Для доказательства можно воспользоваться леммой, которая выражается формулой к=п (3) fc=l И которая была нами доказана в другом месте (для 2? > 0) Ч Очевидно, согласно (3) Рт = Р {max I CTn > 8} < n<2rn+1 < Р {max | Sn > 2me} < ( * У V bn, \ 64 £ / ЛиивЛ n==l * Sur la loi forte des grands nombres.— G. r. Acad. sci. Paris, 1930, vol. 191, p. 910—912. Перевод О. В. Вискова. 1 Ueber die Summen durch den Zufall bestimmter unabhangiger Grossen.— Math. Ann., 1928, Bd. 99, S. 310, Satz 1.
60 9. Об аналитических методах в теории вероятностей Но вероятность Р не изменится, если конечное число первых членов последовательности (1) заменить нулем. Если ряд (2) сходит- ся, то последний член в неравенстве (4) можно сделать сколь угод- но малым. Следовательно, вероятность Р равна нулю. Поскольку это выполняется для всякого е^>0, то в рассматриваемой ситуации имеет место у. з. б. ч. Для доказательства второй части нашего утверждения предполо- жим, что ряд (2) расходится. Пусть в случае Ьп/п* 1 хп == п, хп = —/?, хп — 0 с вероятно- стями, равными соответственно ЬЛ/2и2, . Ьп/2п2, 1 — Ъп!п\ в случае Ъп!п2 1 положим и хп — Ъп с вероятностями 1/2н г/2. Легко проверяется, что Е (хп) = 0, £ (х„) = = Ьп и что у. з. б. ч. для построенной последовательности не имеет места. 9 ОБ АНАЛИТИЧЕСКИХ МЕТОДАХ В ТЕОРИИ ВЕРОЯТНОСТЕЙ* ПРЕДМЕТ ИССЛЕДОВАНИЯ Физический процесс (изменение некоторой физической системы) называется стохастически определенным, если из знания состояния Хо системы в некоторый момент времени следует также знание функции распределения вероятностей для возможных состояний X этой системы в момент t tQ. * Ueber die analytischen Methoden in der Wahrscheinlichkeitsrechnung.— Math. Ann., 1931, Bd. 104, S. 415—458. Рус. пер.: УМН, 1938, вып. 5, c. 5—41.
9. Об аналитических методах в теории вероятностей 61 Автор систематически рассматривает простейшие случаи стоха- стически определенных процессов и в первую очередь — процессы непрерывные во времени (в этом заключается существенная новизна метода: до сих пор стохастический процесс рассматривался обычно как дискретная последовательность отдельных «событий»). Если множество 51 различных возможных состояний системы, конечно, то стохастический процесс может быть охарактеризован с помощью обыкновенных линейных дифференциальных уравнений: (гл. II). Если состояние системы определяется одним или нескольки- ми непрерывными параметрами, то соответствующий аналитический аппарат приводится к дифференциальным уравнениям с частными производными параболического типа (гл. IV). При этом мы прихо- дим к различным функциям распределения, среди которых нормаль- ное распределение Лапласа выступает как естественный простейший случай. ВВЕДЕНИЕ I. Желая подвергнуть математической обработке явления приро- ды или социальной жизни, необходимо предварительно эти явления схематизировать: дело в том, что к исследованию процесса изменения некоторой системы математический анализ применим лишь в том случае, если предположить, что каждое возможное состояние этой системы может быть вполне определено с помощью известного мате- матического аппарата, например, при помощи значений, принимае- мых известным числом параметров; такая математически определи- мая система есть не сама действительность, но лишь схема, пригод- ная для описания действительности. Классическая механика пользуется лишь такими схемами, при которых состояние у системы для момента времени t однозначным образом определяется ее состоянием х в любой предшествующий мо- мент £0; математически это выражается формулой У = / (х, to, t). Если такая однозначная функция / существует, как это всегда предполагается в классической механике, то мы говорим, что наша схема есть схема вполне детерминированного процесса. К числу впол- не детерминированных процессов можно было бы отнести, кроме тогог процессы, в которых состояние у не вполне определяется заданием состояния х для единственного момента времени i, существенным об- разом завися еще от характера изменения этого состояния х перед моментом t. Однако обычно предпочитают избегать такой зависимо- сти от предшествующего поведения системы, для чего расширяют са- мое понятие состояния системы в момент времени t и соответственно этому вводят новые параметры х. 1 Хорошо известный пример применения этого метода мы имеем во введе- Нии при описании состояния некоторой механической системы, кроме коорди- нат ее точек, также компонент их скоростей.
£2 9. Об аналитических методах в теории вероятностей Вне области классической механики наряду со схемами вполне детерминированных процессов часто рассматривают и такие схемы, где состояние х системы в некоторый момент времени tQ обусловли- вает лишь известную вероятность для наступления возможного состояния у в некоторый последующий момент t tQ. Если при лю- бых заданных t0, t и х существует определенная функция рас- пределения вероятностей для состояний у, мы говорим, что наша схе- ма есть схема стохастически определенного процесса. В общем случае эта функция распределения представляется в виде Р (£0, х, t, 6), причем S обозначает некоторое множество состояний у, а Р есть ве- роятность того, что в момент t окажется реализованным одно из со- стояний у, принадлежащих этому множеству. При этом возникает одно затруднение, заключающееся в том, что, вообще говоря, невоз- можно определить эту вероятность для всех множеств 6. Строгое •определение стохастически определенного процесса, устраняющее указанное затруднение, дается в § 1. Как и в случае вполне детерминированного процесса, мы могли бы рассматривать здесь также схемы, в которых вероятность Р су- щественным образом зависит не только от состояния х, но и от всего предшествующего поведения системы. Однако от такого влияния предшествующего течения процесса можно освободиться при помощи того же метода, что и в случае схемы вполне детерминированного про- цесса. Заметим еще, что возможность применения схемы вполне детер- минированного или только стохастически определенного процесса при исследовании какого-либо действительного процесса ни в какой мере не связана с вопросом о том, является ли самый этот действи- тельный процесс в конечном счете детерминированным или случай- ным. II. Обычно в теории вероятностей рассматривают только такие схемы, при которых изменения состояния системы возможны лишь в определенные моменты времени fx, t2, . . tn, . . ., образующие дискретный ряд значений. Башелье 2 впервые, насколько нам извест- но, занялся систематическим изучением схем, в которых вероят- ность Р (t0, х, t, 6) изменяется непрерывно с течением времени t. К тем случаям, которые были исследованы Башелье, мы еще вернем- ся в § 16 и в заключении. Здесь же мы только заметим, что построе- ния Башелье ни в какой мере не отвечают требованиям необходимой математической строгости. В предлагаемой работе, начиная со второй главы, мы главным образом рассматриваем упомянутые выше непрерывные относитель- 2 I. Theorie de la speculation.— Ann. Ecole norm, super., 1900, vol. 17, p. . 21; II. Les probabilites a plusieurs variable.— Ann. Ecole norm, super., 1910, vol. 27, p. 339; III. Calcul des probabilites, Paris, 1912.
В. Об аналитических методах в теории вероятностей № но времени схемы. С математической стороны такие схемы имеют то важное преимущество, что позволяют ввести в рассмотрение диффе- ренциальные уравнения для Р относительно времени и приводят к простым аналитическим выражениям, которые в обычной теории по- лучаются лишь как асимптотические формулы. Что касается прило- жений, то, во-первых, новые схемы могут быть непосредственно при- менены к реальным процессам, а, во-вторых, из решений дифферен- циальных уравнений непрерывных во времени процессов можно вы- вести новые асимптотические формулы для прерывных схем, как это- будет показано в § 12. III. Мы не исходим из полной системы аксиом теории вероятно- стей; однако мы отметим теперь же все те предпосылки, которыми в дальнейшем нам придется пользоваться. Относительно множества возможных состояний х мы не делаем никаких специальных пред- положений: математически можно рассматривать 31 как произволь- ное множество, состоящее из произвольных элементов. Все предпо- ложения, касающиеся системы множеств § и функции Р х, tr @), приведены в § 1. В дальнейшем вся теория развивается нами как чисто математическая. ОГЛАВЛЕНИЕ Глава первая. Общие положениях § 1. Общая схема стохастически определенного процесса. § 2. Опера- тор Fi (х, (£) * F2 (х, (£). § 3. Классификация специальных случаев. § 4. Эрго- дический принцип' Глава вторая. Конечные системы состояний: § 5. Предварительные замечания. § 6. Дифференциальные уравнения не- прерывного стохастического процесса. § 7. Примеры. Глава третья. Счетные, системы состояний:] § 8. Предварительные замечания. Прерывные схемы. § 9. Дифференциаль- ные уравнения непрерывного во времени процесса. § 10. Однозначность решений и их вычисление для случая однородного во времени процесса. Глава четвертая. Непрерывные системы состояний, случай одного параметраг § 11. Предварительные замечания. § 12. Метод Линдеберга. Переход от прерывных схем к непрерывным. § 13. Первое дифференциальное уравнение- Для непрерывных во времени процессов. § 14. Второе дифференциальное урав- нение. § 15. Постановка вопроса об однозначности и существовании решений Для второго дифференциального уравнения. § 16. Случай Башелье. § 17. Об одном способе преобразования функций распределения. § 18. Стационарные функции распределения. § 19. Другие возможности. Заключение
«4 9. Об аналитических методах в теории вероятностей Глава I ОБЩИЕ ПОЛОЖЕНИЯ § 1 ОБЩАЯ СХЕМА СТОХАСТИЧЕСКИ ОПРЕДЕЛЕННОГО ПРОЦЕССА Пусть в — некоторая система, которая может находиться в со- стояниях х, у, z, . . ., и § — система множеств* €, образованных из элементов х, у, z, . . . Мы называем процесс изменения системы © стохастически определенным по отношению к если при любом выборе состояния х, множества @ и моментов времени и t2 (fa t2) существует определенная вероятность Р (£1? х, t2, @) того, что при наличии состояния х в момент tr в момент t2 осуществится одно из состояний S. Если вероятность Р (£х, х, t2, 6) определена лишь для ^2 > £о> мы говорим, что процесс изменения стохастически оп- ределен при t tQ. Что касается системы то мы предполагаем, что она, во-первых, «аддитивна (т. е. содержит все разности, равно как и конечные или счетные суммы своих элементов) и, во-вторых, содержит в себе нуле- вое множество, множество 91 всех возможных состояний х, у, z, . . . и все множества, составленные из одного элемента каждое. Если мно- жество 91 конечно или счетно, то уг состоит, очевидно, из всех под- -множеств множества 9(. Но в наиболее важном случае, когда множе- ство 91 несчетно, предположение, что % охватывает собой все подмно- жества из 91, не выполняется ни для одной из известных в настоящее время схем. Мы, разумеется, предполагаем, что Р (h, х, t2, 91) = 1 (1) и для нулевого множества 91 * Р (^, х, t2, SR) = 0. Далее мы предполагаем, что Р (tly х, t2, 6) как функция множе- ства 6 аддитивна, т. е. что для любого разложения множества S на конечное или счетное число слагаемых @п без общих элементов имеет .место равенство 3 Р (#1, X, t2, — Р (h, X, t2, 6). (2) п Для формулировки • дальнейших предположений относительно Р (Ч, h, S) нам необходимы понятия измеримости функции f (х) по отношению к системе g и определение абстрактного интеграла Огилтьеса. Эти понятия мы дадим здесь в форме, отвечающей нашим щелям 3. 3 По поводу этих понятий, а также по поводу аддитивных систем множеств и т. п. см., например:} Frechet М. Sur I’integrale d’une fonctionnelle etendu a un ensemble abstrait.— Bull. Soc. math. France, 1915, vol. 43, p. 248.
9. Об аналитических методах в теории вероятностей 65 Мы называем функцию / (х) измеримой по отношению к системе ек если при любом выборе действительных чисел а и & множество < f (х) &) всех п₽и которых / (ж) удовлетворяет указанно- му в скобках неравенству, принадлежит к системе Легко пока- зать, что если система $ аддитивна, а / (ж) измерима по отношению к $, то множество @ всех тех х^ при которых / (х) принадлежит к данному измеримому по Борелю множеству, всегда также содержит- ся в системе %. qg X Пусть теперь / (х) измерима по отношению к системе и ограни- чена, и пусть ф (@) обозначает некоторую неотрицательную адди- тивную функцию множеств, определенную на тогда, как извест- но, сумма т при п оо стремится к определенному пределу. Этот предел мы на- зовем интегралом J нх)чт. Предлагаемое обозначение отличается от обычно употребляемого только тем, что в нем специально указана переменная интеграции и знак дифференциала стоит внутри скобок. В дальнейшем мы будем предполагать, что Р (£ь ж, t2, €) как функция состояния х измерима по отношению к системе Наконец, для произвольных t2, t3 <^t2<^ t3) P x, t2, €) должно удов- летворять фундаментальному уравнению Р (*i, я, \ Р (t2, у, @) Р (^i, х, t2, d9I). (3) % у Если состоит из конечного или счетного множества элементов х19 ж2, • . жп, . . то 5 Р (<2, у, t3, @) Р (ii, х, t3, dW) = 2 Р {h, Хп, t3, @) р (h, X, f2, Хп) и в правой части мы имеем выражение полной вероятности Р (£х, ж, h, €); тем самым для этого случая формула (3) доказана. В случае же, когда множество 91 j несчетно, мы принимаем соотношение (3) за новую аксиому. Сформулированные выше требования вполне определяют понятие стохастически определенного процесса: элементы я, у, z, . . . произ- вольного множества 91 можно рассматривать как признаки, опреде- ляющие состояние некоторой системы, а произвольную функцию Р 01, х, t2, @), удовлетворяющую указанным требованиям, как со- ответствующую функцию распределения вероятностей. 3 A. H. Колмогоров
66 9. Об аналитических методах в теории вероятностей Неотрицательную функцию F (в) Л определенную на системе аддитивную и удовлетворяющую, кроме того, условию F(9l) = l, (4) мы будем называть нормальной функцией распределения. Все требова- ния, наложенные нами на Р (£х, х, t2, S), мы можем теперь выска- зать следующим образом: Р (flt х, t.2, S), как функция от есть нормальная функция распределения, как функция от х, измерима по отношению к системе {у, и, наконец, удовлетворяет интегральному уравнению (3). Пусть теперь мы для момента времени t = имеем нормальную функцию распределения Q (£0, @), дающую вероятность того, что си- стема S в момент t0 находится в’ одном из состояний, принадлежащих к €. Функцию" распределения Q (£, €) для момента времени I мы определяем с помощью второго фундаментального уравнения Q (t, ®) = $ Р (t0, х, t, <£) Q (t0, dT). (5) Мы имеем, очевидно, Q (t, И) = $ Q (t0, d3() = Q (to, «) = i, - (6) a $ P(ti, x, to, ®)Q(t{, d%) = = $ P(ti, x, h, @) $ P(t0, у, h, dM)Q(t0, d%') = Ия ад? = J P (ti, x, to, €) P (to, У, h, d%) Q (to, <йГ) = = 5 p (to, У, to, @) Q (to, dW) = Q (to, €). (7) 91* У Формулу (5) мы рассматриваем как определение функции Q (£, (£), а не как новое требование, налагаемое на систему ®; заметим, одна- ко, что (5) содержит в себе соотношение (3) как частный случай. § 2 ОПЕРАТОР Л (х, (£) ♦ F2 (х, (£) Пусть (х, @) и F2 (х, @) — две нормальные функции распреде- ления, которые, рассматриваемые как функции от х, измеримы по отношению к системе %. Мы положим F (х, @) = Л (х, @)*F2 (х, €) = Fi*F2 (х, 6) = $ F2 (у, ®) (х, J91);
9, Об аналитических методах в теории вероятностей 67 как легко видеть, F (х, @) удовлетворяет тем же условиям измери- мости и аддитивности, что и функции F, (х, @) и F2 (ж, ®); равенство (4) также оказывается выполненным: F(X, «)= $ А (у, ад(х, dW) = $ Fi(x, d9l') = l, следовательно, F (x, 6) также является нормальной функцией рас- пределения. Далее, оператор Fx * F2 подчиняется сочетательному закону: Fi * (F2 * Fa) — (Fx * F2) ♦ F8, (9) в чем легко убедиться с помощью следующего несложного вычисле- ния: FX*(F4*F8) (х, @) = $ $ Fa (z, @) Ръ (у, dW) Fi (х, d%) = = $ Fs(z, €) $ Ft(y, d^)F1(x, d%) = (FX*F2)*F8 (x, €). ®v Напротив., переместительный закон для оператора Ft * F2, во- обще говоря, не имеет места. Мы определим теперь единичную функцию р (х, <£), которая для всякой нормальной функции распределения F (х, 6) удовлетворяет уравнению р ♦ F (х, €) = F * р (х, ®) = F (х, €). (10) Для этой цели достаточно) положить р (ж, @) = 1, когда х содержит- ся в <8, и р (х, @) = 0 в противном случае; тогда мы, действительно, имеем H*F(x, €)= J F(y, ®)р(ж, d%) = F(x, €), ®v F*p(х, S) = $ р(у, «)F(х, d%)=\F(х, d€) = F(х, €). Вероятность Р (£ь х, @) была определена пока лишь для *2 ^х; примем теперь для любого t р (*, «, €) = р (®, €). (11) Это новое определение в силу формулы (10) не противоречит фунда- ментальному уравнению (3), поскольку это последнее может быть на- писано в виде р (hl X, t2, @) ♦ Р (f2, X, £„ = р (ti, X, ts, €). (12) 3*
68 9. Об аналитических методах в теории вероятностей • --------------------:-------------------------------------------- < § 3 4 КЛАССИФИКАЦИЯ СПЕЦИАЛЬНЫХ СЛУЧАЕВ | Если изменения состояния системы ® наступают лишь в извест- ные моменты времени, образующие дискретный ряд | ^0 < ^2 < • • • 00 9 . то, очевидно, * Р (t', х, Г9Ъ) = Р (tm, х, t™ @) (13) I для всех моментов времени tf и Г, удовлетворяющих неравенствам * 1т ^т+1» tn < ^п+1* * Вводя обозначения Т Р (^т> %9 ^П9 ®) = Ртп (ж? ®)г (14) Рп-1,п (х, €) = Рп (х, €), (15) > будем иметь Ртп (#» ®) — Рт+\*Рт+Ъ* • • • *Рп (% 9 ®)« (1®) | Следовательно, в данном случае процесс изменения системы S впол- I не определяется элементарными функциями распределения Рп (х, в). Пусть теперь Рг (х, @), Р2 (х, @), . . ., Рп (ж,@) — произвола < ные нормальные функции распределения, которые как функции от х мы предйолагаем измеримыми; пусть, далее, Jo <^i <С • • • <С < . . . — некоторая последовательность моментов времени. Опре- г деляя Ртп (х, (£) и Р (f, х, f9 6) посредством формул (16), (14) | и (13), мы получаем также нормальные функции распределения, удов- : летворяющие уравнениям Ртп (#> €)*Р„р (х, €) = Ртр (х, @) (т < п < р), (17) а, следовательно, и уравнению Р (Г, х9€)*Р (Г, z, Г, S) = Р (f, х, f", @) (t' < tH < Г). Но это последнее представляет собой не что иное, как фундаменталь- ное уравнение (12) или (13). Мы видим, таким образом, что всякая последовательность произвольных нормальных функций распреде- ления Рп (х, @), измеримых как функции от х, характеризует не- который стохастически определенный процесс. В теории вероятностей обычно и рассматривают только определен- ные выше схемы с прерывным временем. Если все функции распреде- ления Рп (х, @) между собой тождественны: Рп (х, €) = Р (X, €)4 (18) то мы имеем однородную схему с прерывным временем; в этом случае мы получаем на основании (16) Рпя п+р @) = Р S)*P (х, <£)♦.. @) = [Р (х, @)$ = Рр(х9 ®). ---------р раз--------> (19)
9, Об аналитических методах в теории вероятностей 69 Еще в 1900 г. Башелье занимался рассмотрением непрерывных во времени стохастических процессов 4, и существуют все основа- ния к тому, чтобы схемы с непрерывным временем заняли централь- ное положение в теории вероятностей. Наиболее важными представ- ляются здесь однородные во времени схемы, в которых Р (t, х, t + + т, @) зависит лишь от разности t2 — tf. Р (t, x,t + т, @) * Р (т2, х, €) = Р (т, х, @). (20) фундаментальное уравнение для этого случая напишется в виде Р (?!, ж, 6) * Р (та, х, g) = Р (Тх + т2, ж, @). (21) Другой ряд специальных случаев мы получаем при введении спе- циальных предположений относительно множества 91 элементарных состояний х. Здесь различают случаи конечных или счетных мно- жеств 91; в непрерывном случае классификация производится по числу параметров, определяющих состояние системы. На разгра- ничении таких отдельных случаев и основано подразделение дальней- шего материала. § 4 ЭРГОДИЧЕСКИЙ ПРИНЦИП Не прибегая к специальным предположениям относительно мно- жества 91 всех возможных состояний х, мы можем доказать лишь несколько общих теорем, а именно теоремы, связанные с эргодиче- ским принципом. Говорят, что стохастический процесс подчинен эргодическому принципу, если для любых t^\ х, у и & lim [Р ($(°), х, t,&) — Р (£(°), у, t, €)] = 0. (22а) t—»ОО Для схемы с прерывным временем условие (22а), очевидно, эк- вивалентно следующему: lim [Pmn (х, S) - Ртп (у, €)] = 0; (226) n->jo в этом последнем случае имеет место следующая Теорема I. Если для любых х, у и (£, Рп (х, «) > КпРп (у, 6), > 0, (23) и ряд S К (24) 71=1 Расходится, то эргодический принцип (226) выполняется и в формуле (226) мы имеем равномерное относительно х, у, @ приближение к пределу. 4 См. первую из статей, указанных в сноске 2.
70 9, Об аналитических методах в теории вероятностей Доказательство. Пусть будет sup (х, (g) = Mkn ((g), inf (x, (g) = mkn (<g). X x Для i <Z k имеем, очевидно, Лп(*, <S)= $ Ры(У, VPidx, <W)<MKn;(g) $ Pik(x, dW)=Mkn(€) «v (25) и аналогично Pin (x, (g) > mkn ((g). (26) В силу неравенства (23) для любых х и у имеем Рк (х, (g) - КкРк (у, (g) > О, Pfc-i, п(х, <g) = 5 ркп (z, (g) Рк (х, dV) — = $ Р*п (z, €) [Pk (X, d%) - КкРк (у, d’K)] + яг + Pkn(z,€)Pk(2/.^)> «* > ткп ((g) $ [Ps (х, d%) - КкРк (у, d*)] + ХЛ-1,п(у, «) = = ткп(&) (1 — ^к) 4- hkPk-itn(y, (g), P^nty, ®)-Л-1,„(х, €)<(l-MP*-i.n(y, «)-rn*n(€)]; отсюда в силу (25) Pk-ltn(y, 6) - Р»_11П(Х, (g) < (1 - Xk) [Mkn ((g) - /nkn((g)]. (27) Поскольку (27) справедливо при любых х и у, мы имеем также n(S) - тп^1, „(®) < (1 - Ч) [Мкп (ё) - ткп ((g)]. (28) Полагая в (28) последовательно к = т i, т + 2, . . пи пере- множая затем все полученные неравенства, находим Мтп(€)-тптп(@)< П (1-М- (29) к==т-}-1 Правая часть в формуле (29) при п -> оо стремится к нулю; тем самым наша теорема доказана. В случае однородной схемы с прерывным временем имеет место следующая
9. Об аналитических методах в теории вероятностей 71 Теорема II. Если для любых х, у и<& Р (х, €) > ХР (у, €) (X > 0), (30) то Рп (ж, €) равномерно сходится к некоторой определенной функ- ции распределения Q (€). Доказательство. В настоящем случае имеем Мп> п+р (@) == sup Рр (х, €) = Мр (€), тп, п+р (€) == inf Рр (х, €) = тр (€), Xn = X, и на основании неравенства (29) мр (<s) - шр[(€) < (1 - х)р. * (31) Но из (25) и (26) вытекает, что для q р имеют место неравенства РЦХ, <2) = Pw(x, g)<J/g_p>g(€) = Mp(@), (32) Р» (х, (?) > тр (@); (33) поэтому Mp(<S)>Mq(®)>mg(6)>mp((S). (34) Из неравенств (31) и (34) непосредственно вытекает справедливость доказываемой теоремы. Важные частные случаи теоремы II были доказаны Гостинским и Адамаром в. Функция распределения Q (S), как показано в этих частных случаях Адамаром, удовлетворяет интегральному уравне- нию <?(«) = J Р(х, Q)Q(d%). (35) В случае наиболее общей стохастически определенной схемы име- ет место Теорема III. Если для некоторой последовательности iv <Z i± <2 • • • < in < • • • 00 и любых х, у и @ (in-h ini ®) 5^ (in-гч У4 ini ®)> оо и ряд У, hn расходится, то эргодический принцип (22а) выполняет- ся и сходимость в формуле (22а) равномерна относительно х, у, 6. 6 С. г. Acad. sci. Paris, 1928, vol. 186, p. 59; 189; 275.
72 9, Об аналитических методах в теории вероятностей Доказательство. Пусть при данном £С°) sup Р (£<°>, х, (t, @), х inf Р (#°), х, t, 6) = m (i, <g). X Если t ^п+1» то таким же путем, как при доказательстве теоремы I, мы получаем аналогичную (29) формулу п fr==m4-l Так как п безгранично возрастает вместе с t, то разность М (t, 6) — — т (t, 6) стремится к нулю при t. -> оо, что и доказывает нашу тео- рему. Наконец, в случае однородной во времени схемы справедлива аналогичная теореме II Теорема IV. Если существует такое в, что при любых х, у,& Р (ст, х, €) > КР (а, у, @) (% > 0), . (37) то Р (т, ж, @) при т —> оо равномерно сходится к некоторой опреде* Ленной функции распределения Q (€). Глава II КОНЕЧНЫЕ СИСТЕМЫ СОСТОЯНИЙ § 5 ПРЕДВАРИТЕЛЬНЫЕ ЗАМЕЧАНИЯ Мы будем теперь предполагать, что множество 91 образовано из конечного числа элементов #1, Х2, . ^П- В этом случае полагают Р (^1» ^2, Xj) = Рtj (£j, £2)* (38) Так как для любого множества 6 будет, очевидно, Р(Ъ,хьЪ,®)= 3 PiAHrh), (39) то мы можем ограничиться рассмотрением вероятностей Рц (£х, £2)* Фундаментальное уравнение (3) принимает теперь вид З-Рt*)=Pikttl, (40) 3
9. Об аналитических методах в теории вероятностей 73 тогда как уравнение (1) представляется в форме (41) 3 Любые неотрицательные функции Ри (£1? t2), удовлетворяющие ус- ловиям (40) и (41), определяют некоторый стохастически определен- ный процесс изменения системы в. . Оператор определяется в данном случае следующим образом: = = (42) 3 вследствие чего фундаментальное уравнение (40) приводится к виду Рtk (^х> ^2) * Ptk (^21 is) = РИс (^i> *з)- (43) В случае схемы с прерывным временем полагаем Рм (®ь */) = Р^\ Рр х}) = Р<%>. Вероятности Р{$ удовлетворяют при этом уравнению (44) з и, обратно, произвольные неотрицательные величины Р^, удовлет- воряющие этому последнему уравнению, можно рассматривать как соответствующие значения вероятностей в некотором стохастически определенном процессе. Вероятности при этом вычисляются по формуле P%q} = р^\р^% .. .*/>$). (45) В случае однородной схемы с прерывным временем имеем р(Р)_ р pH_________гр lq~p__№~р *4 —Г ij —гШ —^г3 • Если все величины Pi} положительны, то, очевидно, выполняются условия теоремы II § 4 и, следовательно, Р^ стремится к некоторо- му пределу Qj, когда q ->= 00. Интегральное уравнение (35) в нашем случае преобразуется в систему уравнений Qi=2QiPii (i = l.......n). ' (46) 3 ' Эти результаты были получены Гостинским и Адамаром 6. 6 См. сноску 5.
74 Р. Об аналитических методах в теории вероятностей § 6 ДИФФЕРЕНЦИАЛЬНЫЕ УРАВНЕНИЯ НЕПРЕРЫВНОГО СТОХАСТИЧЕСКОГО ПРОЦЕССА На основании формулы (11) имеем РП(М) = 1. Po(M)=0t (47) Если изменения нашей системы <5 возможны в любой момент време- ни то естественным является предположить, что lim Рц (if t + Д) = 1, lim Pl} (t, t + Д) = 0, i ^=j, (47a) Д—>oo Д—*0 т. e. что для малых интервалов времени и вероятность изменения со- стояния системы мала. Это предположение содержится в гипотезе непрерывности функций Рц (^, t2) относительно и t2. . Допустим теперь, что функции Р^ (s, t) непрерывны и при t s допускают производные по t и з. Дифференцируемости этих функций при t = з мы не требуем. Было бы неосторожным предполагать a priori существование производной в этих особых точках 7. Для t з имеем —--------= lim ——---------т-----------— М А_П А =i‘“ 4- [Е ₽«(s’ °р“ <5> о] = да =[Ер^- 0 -] Если определитель s = I Рц («, «) I отличен от нуля, то уравнения V Р (S t\ * + Д) +Р (ч А ‘ + Д) “ 1 — п Ч -------------д--------Г (®, Ч--------д---------aik (j = l,...,n) могут быть разрешены: / + Ч (49) Так как aile на основании (48) стремятся к предельным значениям дР^ (з, t)!dt% когда Д 0, то и величины (49) будут при этом стре- 7 Ср. е рассматриваемыми в гл. IV функциями F (s, х, t, у), которые для t = s необходимо имеют точки разрыва.
9. Об аналитических^метод ах в теории вероятностей 75 миться к определенным пределам 8 /> (t, t + Д) - 1 lim -----= А№ (0, (50а) lim -^4--------- = Ajls (t), j^k. (506) Что определитель S при надлежащем выборе s<Z t действитель- но может быть отличен от нуля, видно из соотношения lim S =* 1, (51) s-*t которое выполняется в силу равенства (47) и непрерывности S. Из (48) и (50) непосредственно получается первая система диффе- ренциальных уравнений для функции Pik (s, t): -= У Aj1t(0Pii(s, t) = Pu(в, 0*Ai1t(t). (52) i При этом в силу (47) и (50) A jit 0г / у= к, Акк 0, (54) а в силу (41) и (50) ЗЛЛ = 0. (55) к Уравнения (52) были установлены лишь при гипотезе однако формулы (47) и (53) показывают, что эти уравнения сохраня- ют силу также и для t = $. Для s <Z t. мы имеем, далее, дРгк (*’ _ I • Pik 0 — Pik (s, t) _ * ~ д “ д “ = lim 4- [ Pik (8 + Д. 0 - У, Рц (8. 8 + Д) Pik (8 + Д, о] = 3 = — limГ-*— * -—- Pik (s + ^,t) + д-*о L а +2;/«(.д,+а)рй(.+д.о] от 8 Можно было бы поступать и наоборот: предположить a priori выполнение условий (47а) и (50) и вывести отсюда непрерывность и дифференцируемость функ- ции Pij (s, t) по t
76 9. Об аналитических методах в теории вероятностей и получаем в силу (50) вторую систему дифференциальных уравне- ний дР-, (s, t) Ч----------->, АИ (S) (*> О = - Aik (s)*Pilc (s, t). (57) 3 Если функции А и (s) непрерывны, то уравнения (57) имеют место, очевидно, и для s = t. Положим теперь, что для момента времени 10 известна функция распределения ^(^о> ^) = ^л(^о), 3(?И^о) = 1> к вероятностей того, что система в в момент tQ находится в состоянии хк. Уравнение (5) в данном случае принимает вид Qk (0 = (*о) Pik (*0, 0* На основании (52) функции Qk (t) будут удовлетворять дифферен- циальным уравнениям (^--...п). (58) 3 Если функции Aik (t) непрерывны, то функции Pik (s, t) образу- ют единственную систему решений уравнений (52), удовлетворяющую начальным условиям (47); следовательно, рассматриваемый стохас- тический процесс вполне определяется заданием всех Aik (t). Реаль- ный смысл функций Aik (t) можно пояснить следующим образом: для i =/= к A ik (t) dt представляет вероятность перехода из состоя- ния Xt в состояние хк за время от момента t до момента t + dt, в то время как ^кк (0 = 3 Akj (£). З^к Можно также показать, что если заданы какие угодно непрерывные функции Aik (t), удовлетворяющие условиям (54) и (55), то решения Pik (s, t) дифференциальных уравнений (52) при начальных условиях (47) будут неотрицательны и удовлетворяют условиям (40) и (41), т. е., другими словами, определяют некоторый возможный стохас- тический процесс. Действительно, в силу (52) и (55) мы имеем Pi* (s. t) = £ [£ А* (О] Pi}(?, t) = 0, (59) Jt It а так как на основании (47) ... ^pik(t,t)=i, к то из (59) следует соотношение (41).
9. Об аналитических методах в теории вероятностей 77 Положим, далее, для < t2 Pin (ti, t) = Pi1e (*!, t), если fj < t < i2. (60) Pin (ti, t) = S PH (0» 0) pik (0, 0» если h < t. (61) 3 функции P'vt- (fi, t) непрерывны и удовлетворяют дифференциальным уравнениям (52), следовательно, равенство (60) справедливо для вся- кого t, а не только для t t2; но тогда формула (61), если положить в ней t = t3, совпадает с (40).1 Остается показать, что решения (£1? t) неотрицательны, С этой целью полагаем, что при фиксированном 5 гр (t) — min Pik (s, £).j При надлежащем выборе i и к мы будем, очевидно^ иметь я+Ф (0=-^121, PiS (,, t)=ф (о, и если 4 (ОХ 0, то на основании (54)! (0 ^ik ($» 0 о, Ajk (0 0 (0 ф (0, ] =£ к, ^(0 = -^^- = ^лл(0ру(«. 0> 3 = У, A*(t) (0 = Ж0Ч> (0- З^к Так как ip (s) = 0, то легко видеть, что яр (0 будет больше любого отрицательного решения уравнения dy/dt = R (t) у, а, следовательно, само не должно быть отрицательным. § 7 ПРИМЕРЫ В схемах, однородных во времени, коэффициенты (0 пред- ставляются независимыми от времени t; процесс в этом случае впол- не определяется п2 постоянными величинами Ai]t. Уравнения (52) принимают при этом вид -^Д=^лл(0; (62) 3 решение этих уравнений не представляет затруднений. Если все величины Л ilt отличны от нуля, то имеют место условия теоремы IV
78 9. Об аналитических методах в теории вероятностей § 4 и, следовательно,' Pik (t) стремится к определенному пределу Qk, когда t -> оо. Величины Qk удовлетворяют уравнениям 3&=1, 3^=0 (*=*.................«)• * . i Пусть, например, п = 2, Л12 = А 21 = А, А у = А22 — ~Ai т. е. вероятности перехода из состояния хк в состояние «2 и обрат- ного перехода из ж2 в xt одинаковы. Дифференциальные уравнения (62) для нашего случая дают Рп (О = Л1(0^1/2(1-е^‘)4 Ри (0 = Рп (0 = % (1 + Мы видим, что Pik (t) при t 00 стремится к предельному значению & = V2. Следующий пример показывает, что приближение к пределу мо- жет сопровождаться затухающими с течением времени колебаниями: М = 3, 4ц ” ^23 ^31 ~ Л.21 = 4 32 = 4 ц ~ Of -4 ц = 4.22 = 4 33 = —4$ Р11 (i) = Рп (i) = Рп (0 = -у- cos at + 4" ’ (1 i \ 1 —т=- sinai-□-cosai) + -3-, (1 1 \ 1 —sinai + -j-cosai ) +-5-, у О ** / ** а = -^-4. Аналогичные затухающие колебания для схем с прерывным вре- менем были обнаружены Романовским.
9. Об аналитических методах в теории вероятностей 79 Глава III СЧЕТНЫЕ СИСТЕМЫ СОСТОЯНИЙ § 8 ПРЕДВАРИТЕЛЬНЫЕ ЗАМЕЧАНИЯ. ПРЕРЫВНЫЕ СХЕМЫ В случае, когда 91 состоит из счетного множества элементов #2» • • •» • • «г сохраняют силу все обозначения и все результаты § 5 прошлой главы. Сходимость рядов к к при этом предполагается, а отсюда уже выводится сходимость рядов (40), (42), (46); напротив, мы не требуем, чтобы ряд 3 ?ik (tl, ti) i был сходящимся. Мы сделаем теперь лишь несколько замечаний по поводу схем с прерывным временем, и именно однородных. Условия наших тео- рем, касающихся эргодического принципа, для схем со счетным мно- жеством состояний в большинстве случаев не выполняются, но, не- смотря на это, самый принцип зачастую оказывается выполненным. Рассмотрим, например, игру, исследованную недавно С. Н. Бернштейном: в каждой отдельной партии игрок выигрывает один рубль с вероятностью А и проигрывает такую же сумму с вероят- ностью В (В > А, Л последнее, однако, лишь при том условии, что его денежная наличность не равна нулю; в про- тивном случае он не проигрывает ничего. Если через хп обозначить такое состояние, в котором капитал нашего игрока составляет п — 1 рублей, то условия игры запишутся следующим образом: ^n,n+i = А, Рn+i,n = В (п = 1, 2, 3, . . .), Ри = 1 - А, Рпп = 1 - А - В (п = 2, 3, 4,;. . .), Pi} = 0 во всех остальных случаях. Легко доказать, что ihnPfi=(i-4)(4y-=fe 3 откуда и следует выполнение для данного случая эргодического принципа. Л ‘ л
80 9. Об .аналитических методах в теории вероятностей Заметим, что из факта существования пределов lim Р?,- = Л; р—»оо лишь в том случае вытекает эргодический принцип, если сумма Ел,=л э равна единице. Можно было бы показать, что всегда А 1 и что в случае Л < 1 эргодический принцип не может иметь места. Если все Л; существуют и равны нулю, то возникает вопрос об асимптотическом выражении для Рц при р -> оо. Если такое выра- жение возможно независимо от i: P*tj = 1? + о (g), то говорят, что выполняется локальный эргодический принцип. Этот последний должен иметь, по-видимому, большое значение для слу- чая счетного множества возможных состояний. Пусть теперь возможные состояния х будут перенумерованы с помощью всех целых чисел (— оо < и < + оо). Все обозначения и формулы § 5 при этом сохраняются с той разницей, что знаки сум- мирования распространяются теперь на все целые числа. Рассмотрим подробнее случай Рц = Очевидно, что в этом случае будет также Р?- = PJL<, РГ1 = 3 Р?Р?_4, РГ* = 3 РГР”-г. i , i Если ряды к к абсолютно сходятся, то возникает вопрос об условиях приложимо- сти обобщенной формулы Лапласа РРк=—j=e +оШ. (63) Ь у2лр \ ур / Мы знаем только, что она имеет место для случая Бернулли, когда Ро = 1-Л, РХ = Л, (64) а все остальные Рк обращаются в нули.’ Теорема Ляпунова для нашей проблемы не дает ничего, как это можно заключить из следующего примера: Р*1 == Р-i = ^29 Pfc = Of к Ф ±1*
9. Об аналитических методах в теории вероятностей 81 (65) в котором формула (63) неприменима. Для действительности форму- лы (63) вообще необходимо 9, чтобы для всякого целого т существо- вало такое А, при котором выполнялись бы условия А; =£= 0 (mod тп), Рк 0. Заметим еще, что только в случае а = 0 формула (63) при задан- ном к действительно дает асимптотическое выражение для Рк. В этом случае из (63) вытекает, что при заданном Рк=----7= + ° и при заданных I и ] РЪ=----* +<>(*). (66) 3 bjP2jtp \lfpj В силу (66) в рассматриваемом'случае мы получаем эргодический принцип. Приближенные формулы совершенно особого рода мы получаем для P?j в том случае, когда вероятности Рц, т. е. вероятности неизме- няемости состояния системы в каждый отдельный момент, весьма близки к единице. Например, в случае Бернулли (64) при малых зна- чениях А может быть применена приближенная формула Пуассона к к (67) Общий метод для вывода подобных формул получается путем при- менения дифференциальных уравнений непрерывных во времени процессов, как это будет показано в § 10 для формулы (67). § 9 ДИФФЕРЕНЦИАЛЬНЫЕ УРАВНЕНИЯ НЕПРЕРЫВНОГО ВО ВРЕМЕНИ ПРОЦЕССА Как и в § 6, мы предполагаем, Что функции (s, t) непрерывны и при t ф. s имеют производные по t и 5. Формулы (48) и (56) в рас- сматриваемом случае счетного множества возможных состояний ос- таются по-прежнему справедливыми; но чтобы доказать возможность- перестановки в этих формулах операций суммирования и предель- ного перехода и прийти таким путем к дифференциальным уравне- ниям (52) и (57), нам придется ввести новые ограничительные усло- вия, а именно предположить: А. Существование предельных значений (50). . В. Равномерность сходимости в (506) относительно ] при задан- ном к. 9 Подробнее по этому вопросу см.: Mises R. von, Wahrscheinlichkeitsrech- aung. Berlin, 1931. Глава о «локальной» предельной теореме.— Примеч. авт~ к наст, пер.
32 9. Об аналитических методах в теории вероятностей С. Равномерность сходимости ряда . £ + = + (68) по отношению к Д (что этот ряд сходится, следует непосредственно из (41)). В § 6 для случая конечного числа состояний мы доказали усло- вие, основываясь на свойстве дифференцируемости функции (s, t) при t s; напротив, в случае счетного множества состояний это ус- ловие, по-видимому f из указанного свойства функции еще не вы- текает. По поводу условия В заметим, что равномерность сходимости в (506) по отношению к к при заданном / следует из очевидного нера- венства (М + Д) < 1 - Pjj (t, t + Д). Заметим, далее, что мы не требуем равномерности сходимости в (506) для любых ] и fc, равно как и равномерности сходимости в (50а) по отношению к к\ такие требования были бы неудобны для приложений. Поскольку множители Pjj (s, t) в формуле (48) образуют абсолют- но сходящийся ряд, мы можем на основании условий А и В произ- вести в этой формуле перестановку знаков lim и S и получить таким путем дифференциальные уравнения (52). При этом, очевидно, вели- чины Ajk (t) удовлетворяют формулам последнего условия, а также из равномерной ограниченности множителей Р^ (s + Д, t) следует возможность перестановки знаков суммы и предела в формуле (56), что является достаточным для вывода дифференциальных уравнений (57). § 10 ОДНОЗНАЧНОСТЬ РЕШЕНИЙ И ИХ ВЫЧИСЛЕНИЕ ДЛЯ СЛУЧАЯ ОДНОРОДНОГО ВО ВРЕМЕНИ ПРОЦЕССА В данном случае уравнения (52) принимают вид (69) 3 причем А я — постоянные. Мы докажема что в случае сходимости рядов ;.................................................. (70) 3^п)|4^| = 51"+1), 3
9, Об аналитических методах в теории вероятностей 83 И<6(>0), (71) и при наличии начальных условий Рц (0) = 1, Pi} (0) = 0, i Ф j, (72) уравнения (69) допускают единственную систему решений Pi1e (t), удовлетворяющую условиям нашей задачи. Действительно, поскольку всегда Pt} (t) < 1, мы получаем и» (69) и (70) неравенство | dPi1t (t)/dt |< следовательно, уравнения (69) можно дифференцировать почленно: _ V1 A dPi}{t} — d Р (t\* А dt* / ,di — dt Aik‘ Аналогичным образом получаются общие соотношения at dfn+l (0 = ~~^п (0 * (73) (74) Из (73) и предположенной сходимости рядов (71) следует, что функции Pi1c аналитические. Далее, на основании (69) и (74) мы.на- ходим (75) at в частности, для t = 0 имеем на основании (72) Ап АгЛь(0) = [А№]:, (76) at откуда следует, что аналитические функции (t) определяются однозначным образом при помощи постоянных А^. Формулы (76) и (75) служат вместе с тем и для вычисления решений системы (69) с помощью рядов Тейлора. Например, если А-i, г+1 = Ац = At Aij = 0 во всех остальных случаях, мы легко получаем t А^х"1-™ Ртп(t) — -у—-—ггe~At, п^т, тпх 7 (п — иг)! ’ ’ &тп (0 = 0, Ш Л,
154 9. Об аналитических методах в теории вероятностей т. е. формулу распределения Пуассона; для к — п — т, р = t по- лученная формула совпадает с формулой (67). Если имеет место эргодический принцип и Pik (i) при t -*• оо стре- мится к Qk, то, очевидно, постоянные Qk будут удовлетворять урав- нениям S<?S=1, 5U«a==o (k=i, 2,...). к i Если, например, Aj, г+1 = A, 4i+1j = В, В 4, 4И = —4, Ац = — (4 + В), i > 1, Atj = 0 во всех остальных случаях, то из уравнений (77) без труда найдем Qn = (1 - AIB) (А1В>Г\ В качестве второго примера положим ^г,г+1 A, = 4.. = — (« — 1) 4^ = 0 во всех остальных случаях. Уравнения (77) дают здесь т. е. опять формулу Пуассона. (77) Глава IV НЕПРЕРЫВНЫЕ СИСТЕМЫ СОСТОЯНИЙ, СЛУЧАЙ ОДНОГО ПАРАМЕТРА § 11 ПРЕДВАРИТЕЛЬНЫЕ ЗАМЕЧАНИЯ Пусть теперь состояние рассматриваемой системы определяется значением некоторого действительного параметра х; в данном случае буквой х мы обозначаем как самое состояние системы, так и соответ- ствующее этому состоянию значение параметра. Если — множе- ство всех тех состояний ж, при которых х у, то мы полагаем Р (^1, ^2» = Р (^1> ^2> У)* F (*i, ^2, У) как функция от у представляется монотонной и непре- рывной справа и, кроме того, удовлетворяет граничным условиям F (*i, Ъ <») =0, F (t19 х, t2, + оо) = 1. (78)
9. Об аналитических методах в теории вероятностей 85 Для функции F (^, х, t2, у) фундаментальное уравнение (3) преоб- разуется в следующее: оо F(h, х, t3, z) = J F(t3, у, t3, z)dF(tb x, t2, y). (79) —oo Мы возвращаемся, таким образом, к пользованию интегральными функциями распределения случайных величин и к интегралам Стил- тьеса в обычном смысле. Интеграл (79) по Лебегу 10, наверное, существует, если F (t2, у, t z) измерима относительно у в смысле Бореля. В дальнейшем мы будем предполагать, что система $ (см. § 1) совпадает с системой всех борелевских множеств, откуда вытекает измеримость по Боре- лю F (£i, х, t2, у) как функции х. При этом, как известно, аддитив- ная функция множеств Р (£п х, t2, @) для всех борелевских мно- жеств S однозначно определяется с помощью соответствующей функции F (£х, х, t2, у). Мы назовем нормальной функцией распределения монотонную и непрерывную справа функцию F (у), удовлетворяющую условиям F (- оо) = О, F (+ оо) = 1.; Если (х, у) и F2 (х, у) как функции х измеримы по Борелю, а как функции у являются нормальными функциями распределения, то то же самое имеет место и для функции оо Р(х, y) = Ft(x, y)®F3(x, у)= 5 Л(2, y)dFi(x, z). (80) —«оо Этот оператор ф, подобно *, подчиняется сочетательному закону; пользуясь им, можно фундаментальное уравнение (79) изобразить в виде Р (fi, х, ts, у) = F (tu х, t3, у) ф F («2) х, t3, у). (81) Если (х, у) = Ух (у — х), F3 (х, у) = V2(y — х), то будем иметь, как легко вычислить, Pi (*, у) ф F3 (х, у) = V (у — х) = 7Х (у — х) О V3 (у — х), (82) где оо V(x) = Vi(x)QV3(x)= $ V^ix-zjdV^z). (83) —оо Для оператора 0 также имеет место сочетательный закон, а в случае нормальных функций распределения, кроме того, и закон перемес- , ы Лебег А. Интегрирование и отыскание примитивных функций/Пер. с Франц. М., 1934.
86 9. Об аналитических методах в теории вероятностей тительный; если рассматривать (л?) и V2 (х) как функции распреде- ления для двух независимых случайных величин и Х2, то V1 (х) Q О ^2 (#), как известно, представляет функцию распределения для суммы 11 X = Хг + Х2. В том случае, когда F (#lt я, £2, у) как функция у абсолютно не- прерывна, мы имеем у F(h, х, t2, у)= j f(t19 х, t2, y)dy. (84) — 00 Неотрицательная функция / (tu x, t2, у) при этом измерима в смысле Бореля относительно аргументов х, у и удовлетворяет уравнениям J f{h, х, ta, у) = 1, (85) —00 00 /(fi, х, t3, z) = 5 /(fl, x, t2, y)f(t2, y, f8, z)dy. (86) —00 И обратно, если указанные условия для / (fx, х, t2, у) выполняются, to функция F (fx, х, t2, у), определяемая формулой (84), удовлетво- ряет соотношениям (78) и (79); следовательно, такая функция / (flt я, f8, у) определяет схему некоторого* возможного стохастического процесса. Эту функцию / (fx, х, t2, у) мы назовем дифференциальной функцией распределения для случайной величины у. Мы отметим еще следующие смешанные формулы: F(h, х, f8, z)= J F(fa, у, f3, z)/(fi, x, fa, y)dy, (87) —oo / (fi, x, t3, z) = § /(fe, y, f3, z)dF(t{, x, t2, y). (88) —OO В случае прерывной во времени схемы рассматривают функции F-mn (х, У) ~ F (tm, X, fn, у), Fn (я, у) — (х, у), которые удовлетворяют уравнениям Fm,n+l (®, У) ~ F тп (я, р) ф Fя+1 (ж, у), (89) F]cn (х, у) = Fbm (xf у) Ф Fmn («, у) (к < т < п). (90) Если V Fmn(x, у)= J fmn(x, y)dy, fn(x, y) — fn-i,n(x, у), 11 См., например: Levy Р. Calcul des probabilites. Paris, 1927, p. 187*
9. Об аналитических методах в теории вероятностей 87 ^0 имеем, кроме того, оо z)= $ fmn&, y)fn+i(y, z)dy, (91) oo 2)= $ /ш(®» y)fmn(y, z)dy (k<m<n). (92) —OO § 12 МЕТОД ЛИНДЕБЕРГА. ПЕРЕХОД ОТ ПРЕРЫВНЫХ СХЕМ К НЕПРЕРЫВНЫМ Как было отмечено в § 3, теория вероятностей обычно занимается лишь схемами, прерывными во времени. В случае таких схем основ- ная задача заключается в нахождении приближенных выражении для распределений Fmn (х, у) при больших значениях разности п — — т или, что по существу одно и то же, в построении асимптотиче- ских формул для Fmn (х, у) при оо. Важнейшим результатом, достигнутым в этом направлении, является теорема Лапласа—Ля- пунова. Мы рассмотрим теперь подробнее данное Линдебергом до- казательство этой теоремы 12, имея в виду выяснить в возможно бо- лее общей форме основную его мысль и получить таким путем общий метод построения асимптотических выражений для Fmn (х, у). Пусть будет Fn(x, y) = Vn(y — x), со оо «»(«)= $ (V — x)dFn(x, у)= J ydVn(y) = O, —со —со со оо bn(®)= 5 (y~x)2dFn(x, у)= 5 y2dVn(y) = Ъ2п, —оо —оо S*7nn = “F Ьт+2 “F • • • “F теорема Лапласа—Ляпунова утверждает, при известных дополни- тельных предположениях, что при неизменном т и неограниченно растущем п имеет место равномерно относительно х и у соотношение FMn^ Ю = Ф( ' \ тп / где Z Ф (z) = —\ e-^dz. /2л J —ОО 12 Math. Ztschr., 1922, Bd. 15, S. 211.
88 9. Об аналитических методах в теории вероятностей Наряду со стохастическим процессом с прерывным временем, определяемым функциями Fn (х, у), мы будем рассматривать еще и другой — с непрерывным временем; пусть он характеризуется функцией х, Г, . Положим, далее, = 0, tn — Вот Ртп(я, У) — F(tmi х, tn, у), Fп(х, у) — Fn-i,п(х, у)» Мы имеем, очевидно, ?п(х, у) = ф(-£^\, \ П / оо ап(х) = $ (У — x)dFn(x, y)=Q, —оо со 5п(«)= $ (у — x)2dFn(x, y) = b2n; —оо при этом первый и второй моменты ап (х) п Ъп (х) распределения Fn (я, У) совпадают с соответствующими моментами ап (х) и Ьп (х) распределения Fn (х, у). Основываясь на этом последнем обстоятель- стве, Линдеберг доказывает, что разность Р тп {х, у) — Ртп (х, у) стремится к нулю, когда п оо, после чего теорема Лапласа—Ляпу- нова непосредственно вытекает из очевидного равенства Ртп^Х, У) = Ф(^Л. В общем случае произвольных функций Fn (х, у) мы можем также применить метод Линдеберга, если только нам будет известна такая функция F (£', х, t”9 у), которая характеризует непрерывный стохасти- ческий процесс и для некоторой последовательности моментов вре- мени ^2 tn < • • • дает моменты ап (х) и Ьп (х), совпадающие с ап (х) и Ьп (х) или близ- кие к ним. Общий метод для построения таких функций F получается применением дифференциальных уравнений непрерывных процес- сов, которые будут рассмотрены в следующих параграфах. Для пере- хода от Р к F может служить следующая _ Теорема перехода. Пусть функции Fn (х, у) и Fn (х, у} определяют два стохастических процесса с прерывным временем*
9. Об аналитических методах в теории вероятностей 89 Если оо со 5 (у — x)dFn(x, у) = ап(х), 5 (y — x)dFn(x, у) = ап(х), —со —со (93) оо оо $ (у — x)*dFn(x, y) = bl(x), J (у — x)zdFn(x, у) = Ъ*п(х), —оо —оо (94) ОО ОО \y — x\3dFn(x, у) = сп(х), J |У —»|8й/'п(«, у) = сп(х), —со —оо (95) | ап (х) ап (х) | рп, | Ьп (х) Ъп (х) | 7п» Сп (%) ^п, сп (*^) (96) и если существует такая функция R (х), что R (х) = 0, когда х О, О < R (х) 1, когда 0 < х < Z, (97) R (х) = 1, когда I х, и для ОО ukn (х, z) = 5 R (2 — У) dPkn (х, У) (98) —ОО выполняются неравенства |-^^»n(®, z)|<^« \-^иы(х, z)|< К™, (99) |-&-^»(*» *)|<^3) (к = 0, то имеет место соотношение FOn(x, у — I) — en<F0B(x, у)<Лп(®, у + 0 + 8п» (ЮО) где ч=к™ у, рк+4- у як+4-У (^+^)- ?;=1 fc=l fc==l Для применения этой теоремы к тому случаю, когда моменты а (^), Ь (х), с (х) при возрастающем х не ограничены, часто оказыва- ется возможным устранить эту неограниченность путем введения но- вой, надлежащим образом выбранной переменной х' = ф (х).
80 9. Об аналитических методах в теории вероятностей Доказательство теоремы перехода. На ос- >, новании формулы (98) мы имеем * y) — Fk-i,n(x, у)® Н(у — х) = I = Л(я, У)фА+1(ж, у)® . ..®Fn(x, у)® R(y — x) = = Fk(x, y)®Ultn(x, у) (101) ? и в силу (93) — (95), (99) оо Uk-ltn(x, у)= C7kn(z, у) dFk (х, z) = —оо = J У) + ^икп(х, у)-^- + —оо + JLukn(x, y).^L + '^ukn(i у)-ЦЗ^Ш(*, Z)= : i/«v *л vw Iz I 4 = Ukn (x, y) + ^- ukn (x, y) ak (x) + + -^Ukn{x, у)-^+ё^8)^Д, |0|<l. (102) t Полагая Vk-1, n (x, y) = Fk (x, у) ф Ukn (x, y), (103) i получим аналогичную (102) формулу Ь-i, П (X, y) = ukn (x, y) + ~ ukn (x, y) ak(x) + + JLukn(x,y)^- + BKT-^-, |0|<l. (Ю4) . Из (102) и (104) на основании (96) и (99) следует, что | Uk-i, п (х, у) — V j-i, п (х, у) | Кп )pk + 1/zK^)gk + 1/e-^n> (rk + ?*)- (105) Пусть теперь Wkn (х, у) »= Fok (х, у) ф и^п (х, у) =' = Л (я» у) Ф Ft (х, у) ф . . . ф Fk (х, у) ф икп (х, у) = = f’o.it-i (ж» У) Ф Vk.!,n (х, у);^ (106) тогда в силу неравенства (105) мы будем иметь |W^n(*. y) — Wk-!,n(x, у)| = = | Ft, k-i (х, у) ф Vk_!, п (х, у) — F9, fc_i (х, у) ф Uk-i, п (г, у) | <
9. Об аналитических методах в теории вероятностей 91 < j |П-1.п(г, у) — Uk-i, n(z, y)\dF0,k-i(x, z)< < sup | n (z, y) — n (z, y) | < K^pk + Va^n + + l!eK(n (rk 4- rk). (107) y) = wOn(x, y)|< <ЛГп1) Ур» + -%-Kn} У gfc + Kn* У*,(rk + Гк) = fin. k=l 7f=l Ы Ho Wnn(x, y) — FOll(x, y)®R(y — x) = R(y — z)dFon(x, z) —oo и oo Woo (x,~y) = Fan (x, y)Q)R(y — x) = $ R(y — z) dFon (xt z); —oo принимая во внимание формулы (97), мы получаем у Wпп fat у) On (#> == РOn (&9 у), —оо У Wnn (х, у + Z) > $ dFon (X, z) = Fon (х, у), <1с8> Won (х, Z/) > j dFon (х, z) = Fon (X, у — I), —оо v+l Won(x, у + 1)^ $ dFon(x, z) = Fon(x, у + l)‘ —00 Из (107) и (108) непосредственно следует формула (100). По поводу Деталей доказательства см. указанную выше работу Линдеберга. § 13 ПЕРВОЕ ДИФФЕРЕНЦИАЛЬНОЕ УРАВНЕНИЕ «ДЛЯ НЕПРЕРЫВНЫХ ВО ВРЕМЕНИ ПРОЦЕССОВ Если для нашей системы S изменение состояния возможно во всякий момент времени t, то естественным является предположение, что значительные изменения параметра х в течение малых промежут- ков времени будут встречаться лишь очень редко или, точнее, что для
92 9. Об аналитических методах в теории вероятностей любого положительного 8 будет Р (t, X. t + Д, I у — X I > 8) -> О, Д -> 0. (109) По большей части можно предполагать, что и более узкое условие 4-00 m^(t, х, Д) = J \y-x\v dF(t, х, t + Д, у)->0, Д-^ О, (110) выполняется по крайней мере для первых трех моментов тР\ т{2>1 и m(S\. Общее исследование тех возможностей, которые возникают при этих предположениях, представляло бы значительный интерес; некоторые замечания по этому поводу читатель найдет ниже, в § 19. В ближайших параграфах мы, кроме того, предполагаем, что вы- полняется следующее важное условие: (t, хч А) (J, х, А) О, Д>0, (111) Выполнение этого условия будет наверное обеспечено, если в опреде- > лении (£, х, Д) по формуле (110) существенную роль при беско- > нечно малых Д играют лишь бесконечно малые значения разности L у — х или, точнее, если *4-8 J I У ~ х \3 dF (t, х^ t + А, у) ---------------------------->1, Д-0. (112) |У — x\*dF(t, х, * + А, у) —оо Только в этом случае, строго говоря, наш стохастический про- цесс будет непрерывным во времени. Из (111) вытекает также фор- \ мула m^ (t, X, A) л/1' (г, х, A) J Наконец, мы будем еще предполагать, что для s^= t существуют все частные производные функции F (s, х, t, у) до четвертого порядка и что эти производные при неизменных t, у равномерно ограничены относительно 5 и х для t — $ к > 0. Из формул (78) и (110) мы зак- лючаем, что при s = t функция F ($, х, £, у), напротив, необходимо разрывна. Функция /(«, X, t, y) = -?-F(s, X, t, у), [(ИЗ), очевидно, удовлетворяет уравнениям (84)—(86) и при заданных t, у допускает для значений t — s> к > О равномерно ограниченные относительно а и t производные до третьего порядка. Все дальнейшие
9. Об аналитических методах е теории вероятностей 93> вычисления мы ведем применительно к этой дифференциальной функ- ции распределения / (s, ж, t, у). Положим a(t, х, Д) = J (у — ж)/(/, х, /4-Д, y)dy, (114) —оо b?[t, х, Д)= $ (у — x)2f(t, х, /4*Д, у) dy = тп<2> (t, х, Д), (115) —00 c(t, х, Д) = \У— хI3/(*» х' ^+д» y)dy = ir№(t, х, Д). (116) —со На основании (85) и (86) мы имеем со f(s, х, t, у) — f(s, х, «4-Д, z)f(s, Д, z, t, y)dz = —со со = / (s, х, s + д, г)^/(8 + Д, х, t, у) + + g-/(s + A, х, t, y)(z — ж) + + + д> х> у)-{г~^я-~ + + -^-/(8+Д, t, y)Ji^>l]dz = = /(« + Д, х, t, p) + -g/(s + Д, х, t, y)a(s, x, Д) + + -gr/fr + A, x, t, y)b4s'*' A) +6 c^6g» |0|<C, (117) причем С для s + Д < т < t может быть выбрано независимо от Д. Из (117) непосредственно находим /(s + Д, a;, y) — f(s, х. t, у) - -£-/(«+д. г. g)b'(,’22\A> -еС(‘'ДД1 <118) Теперь мы предварительно докажем, что если определитель D (з, х, t’, у\ tn, у") = if(8, X, f, у') if(8, х, Г, у") ~dx»f(si f, f (s, X,t, ]f) (119)-
34 9. Об аналитических методах в теории вероятностей при заданных х и s не обращается в нуль тождественно для любых t'9 У'9 ^9 У*9 то отношения a (s, х9 Д)/Д и Ь2 (5, х, Д)/2Д стремятся к определенным предельным значениям А ($, х) и В2 (5, х), когда Д -> 0. В самом деле, пусть t', у' 9 t", у" выбраны так, что определитель (119) отличен от нуля; в таком случае для любого достаточно малого Д имеем также D (5 + Д, х9 t', у’9 t", у") ф 0, так что уравнения Х(Д)-^-7(« + Д, X, г, /) + (л;(Д)-А/(5 + д, ж, r,v)=o, at at (120) 1(Д)-^./(, + д, х, f, +и(д)-^/(8 + д, X, e, /) = 1 J допускают единственное решение. При этом X (А) и р. (А) при А -> 0 стремятся к пределам ЦО) и ц (0). Далее, на основании (118) мы по- лучаем Х(Д) /(S + A. f, y’) — f(s, х, е, у') J , „ ,ЛЧ /(»4-Д, х, Г, y’)-f(s, X, f, у") _ + Р (А) ------------д----------------- = - — ’£ А)— + °’) с(*’бД А)' • (121) Левая часть формулы (121) при А 0 имеет пределом 2=^(0)-sr^s’ + х’ уУ ® правой же части в силу условия (111) второй член бесконечно мал по сравнению с первым, и, следовательно, этот член стремится к оп- ределенному пределу] В2 ($, ж) —lim д’ д) = —Q. (122) д-о № Из (122) и (111) непосредственно вытекает, что с (s, X, А)/А ->• 0, А -> 0. (123) В силу формул (122) и (123) формула (118) при Л = 0 переходит в следующую: х> g(J,r А) ] = “ х’у)~ — SrH5' y^B2(s’ х}-
9. Об аналитических методах в теории вероятностей 95- Так как df (s, х, t, у)/дх не равно нулю тождественно при любых 2 и у, то будет существовать также предел z v 1 • a(s. х. Д) А = Д ~ д—о — df (s, х^ t, у)/д8 — В2 (s, х) d2f (s, х, t, у)/дх2 " 6f (s, x, t, y)/dx (124} Из (H8), (122), (123) и (124) путем предельного перехода получа- ется первое основное дифференциальное уравнение / (s, х, t, у) = —А ($, х) f (s, х, t, у) — — В* («’ ж) S» f («’ У)' (125> Когда определитель D (з, х, t', у', t", у") обращается в нуль при любых значениях у', t", у", то пределы A (з, х) и В2 (з, х), вообще говоря, не существуют, как это можно видеть на следующем примере: / (s, X, t, у) = e-OWM-i) Здесь для х = 0 имеем (126} Ь2 (з, х, Д)/2Д -> + оо, Д 0. Впрочем, можно было бы показать, что такие особые точки ($, х) об- разуют на плоскости 5, х нигде не плотное множество. Реальное значение этих очень важных величин А (5, х) и В ($, таково: A (s, х) есть средняя скорость изменения параметра х в тече- ние бесконечно малого промежутка времени; В ($, х) есть дифферен- циальная дисперсия процесса. Дисперсия разности у — х для интер- вала времени Д будет b(s,x, Д) = 5(з, х)У2Д + о(/Д) = О(/Д); (127} математическое ожидание этой разности таково: а (з, х, Д) = А (з, х,) Д + о (Д) = О (Д). (128} Стоит еще отметить, что математическое ожидание т® (£, х, Д) ве- личины | у — х | подобно дисперсии Ъ (з, х, Д) есть величина поряд- ка Уд. Как будет показано в следующем параграфе, функции А (з, х} И В (s, х) в некоторых случаях определяют однозначным образом нашу стохастическую схему. § 14 ВТОРОЕ ДИФФЕРЕНЦИАЛЬНОЕ УРАВНЕНИЕ В настоящем параграфе мы сохраняем в силе все требования, на- ложенные на функцию f (з, х, t, у) в предыдущем параграфе, и, кро- Не того, предполагаем, что / (з, х, t, у) допускает непрерывные произ-
£6 9. Об аналитических методах в теории вероятностей водные до четвертого порядка. Тогда из (120) легко следует, что ес- < ли определитель (119) не равен нулю, то X (0) и р, (0) имеют непрерыв- 4 ные производные по 5 и х до второго порядка; в силу (122) и (124) то же самое имеет место также для В2 (s, х) и А ($, х). Пусть теперь для определенного значения t нам задан интервал t У b такой, что ни в одной из его точек определитель D (t9 у9 и'9 z'9 и"9 z") не обращается в нуль тождественно для любых u', z', и"9 z”. Пусть, далее, R (у) —некоторая функция, отличная от нуля лишь на отрезке а < у < Ь, неотрицательная и имеющая ограничен- ные производные до третьего порядка. В таком случае мы имеем ь ь . х> f’ y}R(y)dy= х> y)R(y)dy = и а • /. ОО в 1 р =1пп-д- \ [f(s, х, t + А, у) — f(s, х, t, y)]R(y)dy = « Д—o a J oo oo = дт4"{$ $ /(s> x> z> * + д. y)dzdy — A 0 —oo —oo oo — § f(s, x, t, y)R(y)dy} = lim-i- x —oo X { § f(s, x, t, z) f(t, z, * + Д, у) [я(z) ±R’(z)(y — z) + —00 —oo 4- R* (z) (у7г)3 + Rm (£) <у~г)3-] dy dz - oo 1 Г lim-т- \ f(s, x, t, z) x д-о a J —oo X [д' (z) a (t, z, b) + R" (z) b*{t'z’ A). + 0 c(f’6z’ A)] dz = = J f(s, x, t, z) [Д' (z) A (t, z) + R" (z) B2 (t, z)] dz = —oo = $ f (S, t, у) {Д' (у) A (t, y) + R" (у) B2 (t, y)] dy, 1 0 I < sup | Rm G) |. (129) Предельный переход по Д, совершенный нами при этом выводе, оправдывается тем, что а (^, z, Д)/Д, b*(t9 z, Д)/2Д и с (t, z9 Д)/Д рав- номерно стремятся соответственно к пределам A (t, z), В2 (t, z) и О и что множитель f(s, х9 t, z) имеет конечный интеграл по аргументу 2.
9. Об аналитических методах в теории вероятностей 97 Интегрируя по частям, мы находим Ь га \ / (s, х, t, у) R' (у) A(t,y)dy = — — [f (s, х, t, у) A (t, y)]R(y) dy; а а (130) точно так же с помощью двукратной интеграции по частям получаем ь ь ( / (s, х, t, у) R" (у) В2 (t, y)dy=\^[f (s, х, t, у) В2 (t, у)] R (у) dy, a a (131) поскольку R (a) = R (b) = R' (a) = R' (b) = 0. Из формул (129)— (131) непосредственно следует равенство ъ ъ $ ~5Г х' R dy==\ { " [А f <s’ х> *' + а а + [В2 (t, у) f (s, X, t, у)]} R (у) dy. (132) Но так как функция R (у) при соблюдении лишь указанных выше ус- ловий может быть выбрана произвольно, то мы легко убеждаемся, что для точек (Z, у) с не равным тождественно нулю определителем D и'> z'> и”> z”) имеет место также второе основное дифферен- циальное уравнение ^Hs, X, t, y) = _JL[A(t, y)f(s, X, t, у)] + + -^[B2(t,y)f(s,x,t,y)]. (133) Это второе уравнение мы также могли бы получить, не прибегая к первому, применяя непосредственно методы § 13; однако при этом на функцию / (^, х, t, у) пришлось бы наложить новые, более тяже- лые ограничения, которые мы здесь не будем* приводить. Мы исходи- ли бы в таком случае из аналогичной (118) формулы 1 — [/($, х, t, y) — f(s1 лг, Z —Д, ?у)] = = f(s, x,t — ^, у)-^- £ J /(Z — Д, z, Z, y)dz — 1J + —оо оо д 1 Р + f(s, X, t — Д, у)Л- f(t — Д, z, t, у) (z — y)dz + —оо 4 А. Н. Колхмогоров
98 9, Об аналитических методах в теории вероятностей + *~д> У)-Й" $ f(t-b,z,t,y)(z — y?dz + —оо оо 4 р Ц + -6Д- ) / (/ — A, Z, у) I z — г/13 с?з, (134) 1 —оо затем мы доказали бы, что оо lim-i- f(t— \z,t,y)\z— y\3dz—0 д-о л <1 — 00 i и что существуют пределы оо lim-A- /(* — А, г> y)\z~ y\2dz = B2(t, у), (135) А-О J lim-i- С / (t — A, z, t, у) (z — у) dz = A (t, у), (136) д-о а J —оо оо lim А- ( / (t — A, z, t, у) dz — 1) == N (t, у), (137) A 0 —oo и таким образом получили бы наше второе уравнение в такой форме: -^-/(s, х, t, y) = N(t, y)f(s, x, t, у) + + z> y) + B2(t, y)-^f(s, x, t, y). (138) Чтобы обнаружить тождественность этого уравнения с найденным ранее, нам пришлось бы еще доказать, что В* (t, у) = В2 (t, у), (139) A(t,y) = -A(t,y) + -^-B2(t,y), (140) у)=4у-а^ у> + -^в*^ у^- (141> § 15 ПОСТАНОВКА ВОПРОСА ОБ ОДНОЗНАЧНОСТИ И О СУЩЕСТВОВАНИИ РЕШЕНИЙ ДЛЯ ВТОРОГО ДИФФЕРЕНЦИАЛЬНОГО УРАВНЕНИЯ Для того чтобы с помощью дифференциальных уравнений (125) и (133) определить функцию f (5, х, t, у) однозначным образом, сле- довало бы, разумеется, установить те или иные начальные условия.
9. Об аналитических методах в теории вероятностей 99 Для второго уравнения (133) можно поступить следующим образом: согласно формуле (85) функция / (5, я, t, у) для всякого t^>s удов- летворяет условию оо § f(s, х, t, y)dy = 1, (142) —00 а на основании (110) мы, кроме того, имеем (у— х)2 f (s, х, t, y)dy —>0, t-+s. (143) —00 Основной вопрос относительно однозначности решений состоит в следующем: при каких условиях можно утверждать, что при задан- ных s и х может существовать лишь единственная неотрицательная функция / (5, х, t, у) переменных t9 у, определенная для всех значе- ний у и t 5 и удовлетворяющая уравнению (133) и условиям (142), (143)? В некоторых важных частных случаях на этот вопрос может быть дан положительный ответ; такими являются, например, все случаи, рассматриваемые в ближайших двух параграфах. Пусть теперь функции A (t, у) м. В2 (t, у) будут нам заданы напе- ред; можно поставить вопрос о том, существует ли такая неотрица- тельная функция / (5, х, t, у), которая, с одной стороны, удовлетво- ряла бы уравнениям (85) и (86) (как было выяснено в § 11, эти тре- бования необходимы для того, чтобы / (s, х, t, у) могла определять стохастическую схему), а, с другой стороны, после предельных пе- реходов по формулам (122) и (124) приводила бы к этим заданным функциям A (t, у) и В2 (t, у). Для решения подобной задачи можно, например, сперва опреде- лить какое-либо неотрицательное решение нашего второго диффе- ренциального уравнения (133), удовлетворяющее условиям (142), (143), а затем исследовать, является ли оно действительно решением нашей задачи. При этом возникают следующие два общих вопроса: 1) при каких условиях существует такое решение уравнения (133)? 2) при каких условиях можно утверждать, что это решение дейст- вительно удовлетворяет уравнениям (85) и (86)? Существуют все основания полагать, что эти условия имеют дос- таточно общий характер. § 16 СЛУЧАЙ БАШЕЛЬЕ Мы примем теперь, что / (s, х, t, у) произвольным образом зависит от $ и t, в остальном же является функцией разности у — х, т. е. что наш процесс является однородным относительно параметра: / ($, х, t, у) = v (s, t, у — х). (144) 4*
100 Р. Об аналитических методах в теории вероятностей В этом случае, очевидно, A (s, 1)иВ (s, t) зависят только от з, так что дифференциальные уравнения (125) и (133) напишутся теперь в виде + <146) Для функции v (s, t, z) из (145) и (146) получаются уравнения =J(s)_----2?2(S) (14:/) os v ' az ' ' dz2 ’ ' ' -^ = -^)-£- + *3(0>. (148) Уравнений (148) было найдено Башелье 13, но, строго говоря, | не было им доказано. ¥ Если имеем тождественно A (t) = 0 и В (t) = 1, то уравнение | (133), соответственно (146), обращается в уравнение теплопроводно- | сти i df/dt = d2jldy2, (149) | для которого единственное неотрицательное и удовлетворяющее ус- | ловиям (142), (143) решение дается, как известно, формулой Лапласа " f(s, х, t, у) = -— 1 --„-(У-х)»/^). (150) I —s) В общем случае мы полагаем 1 s t х' = х — ^A(u)du, у' = у — А (и) du, а а s t s' — В2 (и) du, t'=^B2(u)du. а а Тогда уравнение (146) преобразуется в df/dtf = d2fldy'2, I а условия (142), (143) сохраняют для новых переменных s', х', t\ ; у' тот же вид, что и для переменных s, х, t, у. Следовательно, в общем j случае функция f(s, X. t, у) — — ----^-(у'-х')2/4(Г~з') — —1— g-(y-a)W —s') .]/лр i t (p = ^Z?2(u)du, a = xA(u)du} (151) 3 8 есть единственное решение уравнения (146), удовлетворяющее на- шим условиям. 13 См. работы, указанные в сноске 2 за номерами I и III.
9. Об аналитических методах в теории вероятностей 101 § 17 ОБ ОДНОМ СПОСОБЕ ПРЕОБРАЗОВАНИЯ ФУНКЦИЙ РАСПРЕДЕЛЕНИЯ Пусть будет s' = Ф (^), t' = ф (0, х' = ф (5, х), у' = ф(£, у), / (s, х,t, у) = (5ф (t, у)/ду) f (s', х', t', у'), (152) причем мы предполагаем, что ф (t) — непрерывная и нигде не убы- вающая функция, в то время как ф (t, у) относительно t произвольна, а по 'у допускает непрерывную положительную производную. Если f (s, х, t, у) удовлетворяет условиям (85) и (86), то то же самое имеет место, как легко проверить, й для функции /' по отношению к новым переменным s', х', t', у'; другими словами, наше преобразование приводит к новой функции /' (s', х', t', у'), которая подобно / (5, х, t, у) определяет некоторую стохастическую схему. Если ф (t) и ф (t, у) допускают соответствующие производные, то уравнения (125) и (133) при переходе к новым переменным преобра- зуются к виду (153) (154) где положено I' if <*’ MW) 52 У) + W ММ A (t, у) + dtp (t, y)/dt [ ’у >-------------------------д<р (t)/dt ; * BVf, /) = (155) ' <?<р При помощи только что рассмотренного преобразования можно получить решения уравнения (133) для многих новых типов коэффи- циентов A (t, у) и В2 (t, у). Пусть, например, . Л (t, у) = a (0 у + b (0, в2 (t, у) = с (0; (156) мы полагаем ф(0 = ^c(0e“®i ' f р С (157) гр (/, у) = уе~ J _ $ b (0 е~ J a(t:dt dt и получаем для новых переменных s', х', t', у', /' простейшее уравне- ние теплопроводности: df/dt' = d2f!dy'2. (158)
102 Р. Об аналитических методах в теории вероятностей При этом начальные условия (142) и (143) остаются справедливыми | и для /' (s', х', t', у') и, следовательно, формула 1 * f' = 1 ---(159) * /л (Г -s') ' совместно с (157) и (152) дает единственное удовлетворяющее нашим условиям решение / (s, х, t, у) уравнения (133) с коэффициентами ви- да (156). Легко видеть, что в этом случае функция / (s, х, t, у) необ- ходимо будет иметь вид (160) где аир зависят только от s, х и t, но не от у. Одной из важных задач является отыскание всех возможных ти- пов коэффициентов A (t, у) и В2 (t, у), для которых при любых s, t, х всегда получается функция вида (160), т. е. функция распределения Лапласа. В качестве второго примера рассмотрим случай Л (t, у) = а (0 (у — с), В2 (t, у) = b (t) (у — с)2. (161) Полагая теперь (р (t) = f Ъ (t) dt, Ф (t) = In (у — с) + р[6 (t) — a (t)] dt, (162) : мы снова получаем для /' (s', х', t', у') уравнение (158), решение ко- торого (159) нам уже известно. Заметим, что здесь достаточно рас- сматривать лишь значения- х е, у е, так как при изменении х или у в пределах от с до + оо переменная х (и соответственно г/') пробегает все значения от — оо до + оо. Некоторые затруднения, возникающие в связи с этим обстоятельством при переносе условий (142) и (143) на функцию /', легко могут быть устранены. В частности, для случая A (t, у) = 0, В2 (t, у) = у2 (163) мы имеем формулу № х’ 'g)=s -.) ехр {- • <‘64> Для приложений наиболее важным является случай, когда A (t,y) и В2 (t, у) зависят только от у, не завися от времени t. Ближай- шим шагом в этом направлении было бы решение нашей задачи для случая коэффициентов вида А (у) = ау + Ъ, В2 (у) = су2 + dy + е. (165)
9. Об аналитических методах в теории вероятностей 103 § 18 СТАЦИОНАРНЫЕ ФУНКЦИИ РАСПРЕДЕЛЕНИЯ Если для момента времени t0 известна дифференциальная функ- ция распределения вероятностей g (tQ, у), то аналогично общей фор- муле (5) функция распределения g (t, у) для любого t^> t0 определя- ется формулой оо g{t,y)~ 5 gfa,x)f(to,x,t,y)dx. (166) — оо функция g (£, г/), очевидно, удовлетворяет уравнению > = - 4-[ А (Z) +w[в* у} gJ- (167) Мы будем предполагать теперь, что коэффициенты A (t, у) и В2 (£, у) зависят только от у (однородность процесса во времени), и исследуем, какие функции g (t, у) остаются в этом случае неизмен- ными в течение времени. Ясно, что для такой функции мы имеем -Ag + (B2g)' = С. (168) Если предположить, что g и g' для у = ± оо стремятся к нулю и при- том настолько быстро, что то же самое имеет место и для всей левой части равенства (168), то, очевидно, должно быть С = 0, и мы имеем g'/g = U - (52)']/52. (169) Помимо того, функция g (у) должна еще удовлетворять условию оо 5 gdy—i. (170) — сю В большинстве случаев оказывается возможным доказать, что если существует стационарное решение g (х), то / (5, х, t, у) при t -> оо и произвольных постоянных 5 и х стремится к g (у); таким об- разом, g (у) оказывается не только стационарным решением, но так- же и предельным решением. Если коэффициенты А и В2 имеют вид (165), то (169) обращается в уравнение Пирсона X =------' (171) 6 + iiV + <11У- ’ ' ' причем d — b е d е .Л = Ж2) Мы можем, следовательно, построить такие стохастические схемы, Для которых стационарным решением является любая из функций Распределения Пирсона.
104 9. Об аналитических методах в теории вероятностей § 19 ДРУГИЕ ВОЗМОЖНОСТИ Изложенная в § 13—18 теория в существенной мере обусловлена сделанным нами предположением (111). Если отказаться от этого предположения, то даже при сохранении условия (НО) возникает ряд новых возможностей. В качестве примера рассмотрим схему, определяемую функцией распределения у F (s, х, I, у) = е~аУ~8\з (у — х) + (1 — e~a^-s^) u(z)dz, (173) ? —оо I где о (z) = 0 для z < 0 и о (z) = 1 для г > 0, a u (z) — непрерывная неотрицательная функция, для которой | оо Ч;. и (z) dz = 1 Я --ОО Л. S и моменты оо u(z)|z|ldz (6=1, 2, 3) — оо конечны. Легко проверить, что функция F (s, х, t, у) удовлетворяет требованиям (78) и (79), равно как и (110). Эту схему можно истолковать следующим образом: в течение бес- конечно малого промежутка времени (t, t + dt) параметр у или оста- ется неизменным с вероятностью 1 — adt, или переходит к значению у', z <Z у' <Z z + dzy с вероятностью аи (z) dtdz. Таким образом, в каждом интервале времени возможен скачок, причем функция расп- ределения для значений параметра после скачка не зависит от пред- : шествовавшего скачку значения этого параметра. Приведенную схему можно было бы обобщить еще следующим образом: представим себе, что за бесконечно малый промежуток вре- f мени (t, t + dt) параметр у с вероятностью 1 — a (t, у) dt сохраняет прежнее значение и с вероятностью и (£, у, z) dtdz переходит в у', z <Z у' <С z + dz. При этом, конечно, предполагается, что оо § u(t, у, z)dz — a(t, у). (174) — оо В этом случае для g (t, у) должно, по-видимому, иметь место интегро- дифференциальное уравнение оо у) = — a(t, y)g(t, у) 4- g(t, z)u(t, z, y)dz. (175) —оо i
9, Об аналитических методах в теории вероятностей 105 Если мы хотим рассматривать не только скачки, но и непрерыв- ное изменение параметра г/, то естественно ожидать для g (£, у) урав- нение оо g (t У) = — а {t, У) в у) + g(t, z)u(t, z, y)dz — —oo • -4rlA^y)g(t>y)l + ^lB2(t,y)g^y)l (176) причем предполагается выполненным условие (174), а коэффициенты X (t, у) и В2 (t, у) имеют значения, указанные в § 13. ЗАКЛЮЧЕНИЕ Если состояние рассматриваемой системы определяется при по- мощи п действительных параметров хи х21 . . то при известных условиях, аналогичных установленным в § 13, мы будем иметь сле- дующие дифференциальные уравнения для дифференциальной функ- ции распределения / (s, х19 . . ., хп, t, у 1? . . ., уп)' =*’•••> *n) SSBi’(S’ Хи i^i 1 г з (177) п ~дГ~~ У} ~ду7 ’ Уп) Я + i=l 1 п п (178> i=l г 3 Для случая, когда Аг (t, у19 . . ., у,.) и Вц (t, у19 . . ., уп) зависят только от t, эти уравнения были открыты и разрешены Башелье 14. Решения, удовлетворяющие условиям нашей задачи, в этом случае будут вида / = Рехр{— -^-'^Pij(yi — Xt — д,)(У} — Xj — • (179) причем Р, Q, ри и qt зависят лишь от 5 и t. Можно было бы рассматривать также смешанные схемы, где со- стояние системы определяется с помощью параметров, частью пре- рывных, частью непрерывных. Москва, 26 июля 1930 г. 14 См. работу, указанную в сноске 2 за номером II.
106 10. Проблема ожидания 10 ПРОБЛЕМА ОЖИДАНИЯ* § 1. Цель этой статьи состоит в том, чтобы показать несколько ‘ применений общих уравнений, которые я исследовал в моем мему аре, сданном в печать в журнал «Mathematische Annalen» * 1 (см. № 9 наст. изд.). С этой целью я даю новое решение «проблемы ожидания», которой посвящен обширный мемуар М. Полячека 2. Суть задачи состоит в следующем. (Та же математическая задача естественно может возникнуть при изучении других реальных явле- ний, поэтому такие выражения, как «телефонные линии», «разговор», употребляются здесь только для наглядности изложения.) Предположим, что на телефонной станции имеется п линий, ко- торые могут быть заняты обслуживанием телефонных разговоров. В каждый момент имеется т клиентов, ведущих телефонный разго- * вор или же ожидающих своей очереди; последний случай имеет мес- то только при т п, когда длина очереди равна т — п. Теорети- чески число т может принимать все целые неотрицательные значе- ния: т 0, 1, 2, . . . Мы обозначим <2о W. Ql W, <?2 (0, • • ; Qm (0, . • . вероятности этих значений в момент t. Очевидно, X Оп(0=1. т—0 Если в момент tQ нам известно значение т, то Qin (Ч) ~ 1> Qi Go) ~ i т. (1) (2) Первая решаемая нами задача состоит в том, чтобы вычислить ве- роятности Qm (t) для t tQ, если известны их начальные значения Qm Go), которые, в частности, могут иметь вид (2). Вторая задача заключается в том, чтобы определить математическое ожидание и закон распределения продолжительности ожидания для клиента, прибывающего в момент t. § 2. Мы будем исходить из следующих двух допущений относи- тельно характера изучаемых случайных событий. * Sur la probleme d’attente.— Мат. сб., 1931, т. 38, № 1/2, с. 101—106. Перевод Б. А. Севастьянова. 1 Настоящая статья, впрочем, не предполагает знакомства с этим мему аром, за исключением доказательства нескольких вспомогательных утверждений. 2 Math. Ztschr., 1930, Bd. 32, S. 64—100.
10, Проблема ожидания 107 I. В каждый бесконечно малый интервал времени (t, t -f- dt) с вероятностью a (t) dt на станцию прибывает новый клиент. Более точно, в любой интервал (£, t + Д) вероятность прибытия нового клиента равна a (t) Д + о (Д), в то время как вероятность прибытия более одного клиента равна о (Д); как обычно, о (Д) означает здесь бесконечно малую величину, имею- щую порядок малости выше Дг мы предполагаем, что функция a (t) непрерывна по t. Вероятности, относящиеся к интервалу (£, t + Д), не зависят от числа клиентов, прибывших ранее и от моментов, их прибытия. II. Вероятность окончания разговора в интервале времени (t, t + dt),, ведущегося клиентом в момент t, равна $dt\ она не зависит от продолжительности разговора до момента t. Это приводит к по- казательному закону распределения продолжительности разговора: вероятность, что эта продолжительность заключена между t и t + dt, равна р (t) dt = (3) В этом случае математическое ожидание продолжительности разго- вора равно D = = (4) о Вместо закона распределения (3) М. Полячек предполагает, что продолжительность разговора всегда равна некоторой константе D; это предположение столь же произвольно, что и наше. § 3. Обозначим Qmp (£, t + Д) условную вероятность того, что в момент t + Д на станции имеется р клиентов при условии, что в момент t там находилось т клиентов. Вероятность того, что в интер- вале времени (t, t + Д) прибудет более одного клиента или закон- чится более одного ведущегося разговора, равна о (Д). Поэтому Qmp (t, t + Д)< со (Д) = о (Д), | р — т | > 1, (5) гДе со (Д) не зависит от т и р. Для | р — т | 1 имеем (t, t + Д) = a (£) Д + О (Д), (6) Qm, m-i (Л f + А) = 7П0Д + о (Д), если т < п. (7) Qrn, m-i (t, t 4- Д) = «РД + о (Д), если т > п, (8)
108 10. Проблема ожидания TLQdWMy Qmm Q, t + A) = 1 — (a (0 + m0) A + о (А), если m < n, (9) Qmm (i, i + A) = 1 — (a (t) + n0) A + о (А), если тп > n. (10) По формуле полной вероятности имеем ^(«4-Д)= § Qm(t)Qmp(t + S). (11) m=0 Подставляя в (11) значения Qmp (t, t + Д) из формул (5) — (10), доказываем, что предел Qp (t) = hm —£-----j2-------- (12) д—о а всегда существует и имеют место уравнения <2о (0 = РС1 (0 - a (0 <2о 0), (13) Qi (0 = (i + 1) ₽ Qi+1 (0 - (a (0 + jp) Qi (0 + a (0 Q^ (0, 1 < i < n, (14) Qi (0 = np<?i+1 (0 — (a (0 + nP) Qt (0 + a (0 Q^ (0, n < i.. (15) Таким образом, для функций Qt (0 мы получили счетную беско- нечную систему дифференциальных’ уравнений. Достаточно найти решение Qim) (0 с начальными условиями типа (2). Общее решение можно получить тогда с помощью формулы полной вероятности оо Qi(t)= 3 QMQ\m)(t). (16) пг—0 § 4. Рассмотрим наиболее простой и важный случай, когда функ- ция a (t) константа: • a (t) = а. (17) В этом случае система уравнений (13) — (15) имеет постоянные коэф- фициенты. В упомянутой выше работе я доказал для таких систем существование и единственность решения (в предположении, что Qm (t) неотрицательны и удовлетворяют условию (1), как это и име- ет место в нашей задаче). Поэтому функции Qm (t) однозначно опре- деляются уравнениями (13) — (15) и их начальными значениями Qm (t0). Нахождение приближенного решения таких уравнений не представляет большого труда; один метод получения такого решения дан в упомянутой выше моей работе. Но с практической точки зре-. ния предпочтительнее прямо переходить к предельному решению.
10, Проблема ожидания 109 Это решение существует только в случае пР > а. (18) Если выполняется обратное соотношение т]р < а, (19) то очередь на станции бесконечно растет. Случай пр = а] (20) имеет только теоретическое значение, поэтому мы ограничимся изу- чением случая (18). Найдем сначала константы Qm (t) = Qmi удовлетворяющие урав- нениям (13) — (15) и (1). В этом случае РС1 - «Со = 0. (21) (I + 1) 0£г+1 - (а + pl) Qi '+ = 0. 1 < i < n, (22) np<?i+i - (a + n|3) Qi 4- <i = 0. n < i, (23) 3 ^m=l. . (1) m~0 Из (21) — (23) легко получить Qi ~ ®iQoi * = * <24> откуда в силу (1) имеем ’ (26) i=0 Q = ®0 + ®! + ... +®n_i + l_n-1(a/P) • (27> Формулы (24) - (27) дают единственное стационарное решение на- шей задачи. Можно доказать, что в любом другом решении функции Qm (t) при t —оо стремятся к пределам Qm, т. е. стационарное решение яв- ляется также предельным. Сделаем еще следующее замечание относительно формул (24) — (27). Условимся говорить, что распределение вероятностей {ф™ (0}
но 10. Проблема ожидания превосходит распределение {($? (t)}, если для каждого т Rm (i) > Rm (t), (28) где m (29) i—0 Если начальные условия (t0)} превосходят {Qm (^o)L то это от- ношение сохраняется в любой момент t tQ. Пусть Qm (t) — решение нашей задачи с начальными условиями <?о (^о) = 1, е™(*о) = О, т>0. (30) Эти начальные условия превосходят все возможные другие условия. Поэтому решение Qm (t) в любой момент превосходит любое другое решение и, в частности, превосходит стационарное решение. Таким образом, мы видим, что если коэффициенты аир достаточ- но долгое время остаются постоянными, то искомые вероятности да- ются формулами (24) — (27). Например, если п = 3, а/р = 2, то т 0 1 2 3 4 5 6 Qm 1/9 2/9 2/9 4/27 8/81 16/243 32/729 Rm 1/9 1/3 5/9 19/27 65/81 211/243 665/729 Мы видим, что в этом случае, когда из трех линий в среднем за- нято две, с вероятностью Т?2 = 5/9 имеется свободная линия, в то время как вероятность т > 6, т. е. вероятность того, что более трех клиентов ожидают своей очереди, равна 1 — 7?6 = 64/729 ~ 1/11. § 5. Если принять предельное распределение за точное, то мож- но просто вычислить математическое ожидание Е длительности ожи- дания в очереди. Для этого надо среднюю длину очереди »=1>-")^=47ЫтП1-4тГ <31> m>n разделить на п$: Е = о/пр. (32) Таким образом, в нашем примере при п = 3, а/р = 2 находим _______ 8 j-, 8 8 __ 8 ° Т’ Л = 9-Зр = “27Р’ = Это означает, что среднее время ожидания равно 8/27 от среднего времени разговора.
11. Метод медианы в теории ошибок 111 § 6. Для того чтобы иметь возможность вычислить закон распре- деления времени ожидания, нам остается только решить следующую задачу: в предположении, что в момент tQ на станции имеются т кли- ентов и в этот момент появился новый клиент А, вычислить для это- го клиента закон распределения времени ожидания. Нас интересует только случай т > п, так как в противном случае имеются свобод- ные линии. Положим т — п + р и обозначим Pq (£), q — 0, 1, . . . р, вероятность того, что в интервале (tQ, t) окончилось ровно q разговоров, и через Р (t) вероятность того, что это число больше р. В момент £0, очевидно: Ро (0) = 1, Pq (t0) = 0, q > О, Р (t0) = 0. (33) функции Рй, Р±, . . Рр, Р удовлетворяют уравнениям Ро (0 = - п0Ро (0, pq (t) = (Pq^ (0 - Pq (0), q = 1, 2, . . p, (34) P' (0 = npPg(0. Таким образом, мы нашли конечную систему линейных уравне- ний, которую легко решить. Отсюда получаем вероятность Р (0 того, что время ожидания клиента А не более t — t0. Париж, 24 ноября 1930 г. И МЕТОД МЕДИАНЫ В ТЕОРИИ ОШИБОК* При допущении нормального закона распределения ошибок метод средней арифметической, как хорошо известно, является наилучшим для вычисления истинного значения наблюдаемой величины. Метод медианы в этом случае хуже, хотя, как показал Хааг, и незначитель- но. Однако, если гипотеза нормального распределения не удовлетво- ряет фактам, встает вопрос об отыскании наилучшего метода, соот- ветствующего данному закону распределения. В частности, во мно- гих случаях, в которых считается необходимым исключение «анор- мальных наблюдений», было бы методологически более правильно исследовать общий закон распределения и найти наиболее соответст- вующий ему метод вычисления истинного значения. В этой статье я хочу указать, как, зная закон распределения оши- бок, определить степень точности метода медианы и сравнить ее с точт ностью метода средней арифметической. Какой из двух методов ока- жется предпочтительней, зависит от характера принятого закона * Мат. сб., 1931, т. 38, № 3/4, с. 47—50.
112 11. Метод медианы в теории ошибок распределения; однако в силу теоремы II при совершенно неизвестном и могущем сильно уклоняться от нормального законе распределения I надежнее употреблять метод медианы. Метод исследования в существенных чертах принадлежит Хаагу I [1], применившему его, однако, только в случае нормального закона распределения. ' i Пусть вероятность ошибке отдельного наблюдения лежать между f х и х + dx равна / (x)dx. Мы будем предполагать, что j(x) непрерыв- I на и / (т) У= 0 для медианы т: • ; •1 & т f(x)dx—-^-. -г со • :> Пусть, далее, | +~ . I а= \ xf(x)dx 'I —ОО .S — математическое ожидание ошибки. Обозначим через хг, х2, . . . 1 . . ., хп результаты п последовательных наблюдений, через ап их i среднее арифметическое и через тпп их медиану. Мы ограничимся | случаем нечетного п = 2k + 1, когда тп = х^+1. предполагая, что f Xi занумерованы в порядке их возрастания. Разности (ап — а) и | (тп — т) будут (как это следует из дальнейшего) порядка \ O(itfn), поэтому естественно положить g ап = {ап —a) Yn, |лп = (тп — т) Yп j и исследовать законы распределения ап и р,п. Для ап, как известно, д имеем непрерывный закон распределения: вероятность ап лежать между а и а + da равняется <pn (a) da, где <рп (а) вычисляется по хо- рошо известным формулам. Если дисперсия | +°° а2_ — a)*f(x)dx / —00 существует, то <рп (а) сходится к нормальному закону распределения t ’<“>-iL.• J с дисперсией a. 4 Вероятность тЛ лежать между t и t + dt равняется ?
11. Метод медианы е теории ошибок 113 где 1 1 0(0 = 2 ^f(s)ds. т * Вероятность же р,п лежать между р и р + dp равна 'Р„(Р)=Мп(0у^=. |M-m)0 + l, t = m + y=!==? . Т е о р е м а I. фп (р) с увеличением п стремится к нормально- му закону распределения V 2л °т с дисперсией vm = 1/2/ (тп). В самом деле, (и)=~~VA*2*)!~{1 ~02 (0}Л f (z)* По формуле Стирлинга ЖД (2Л?)! 1 (A:!)24fe гл* Далее ясно, что /(«)->/ (т). Остается рассмотреть множитель {1 — 02 (0}'с« Во-первых, имеем 0 (0 = т + (1 + 8), ' /24 + 1 /24 +1 V ’ где е стремится к нулю с возрастанием п. Следовательно, 62(0 = -tL(14-s'), {1 _ е2 (£)}* = (1 е")9 где е' и е" тоже стремятся к нулю. Сопоставляя полученные выра- жения, получаем % (Р) -> У/ (т) е-^г^, что и доказывает нашу теорему. 1 См. вывод аналогичной формулы (4) в [1].
114 12, Одно обобщение теоремы Лапласа — Ляпунова Мы видим таким образом, что при неограниченном возрастании п разности тп — т н ап — а имеют бесконечно малые дисперсии. Сле- довательно, систематической ошибкой в методе медианы будет щ, а в методе средней арифметической а. Что же касается сравнитель- ной точности обоих методов, то все решается отношением X = <5т1<5 ~ 1/2/ (т) о. В случае нормального распределения / (х) отношение % вычислено еще у Хаага и равно kg = У л/2 ~ 5/4. Легко построить примеры законов распределения, для которых А принимает любые значения между 0 и оо. Однако имеет место следую- щая Т е о р е м а II. Для законов распределения с одним максимумом отношение к может принимать любые значения в промежутке О < к < ]Лз; но не может быть больше ]/3. Максимальное значение достигается, если / (х) = а, х 1/2а, / (х) — 0, х^> 1/2а, но’этот закон распределения уже не удовлетворяет условию непре- рывности: к == 0, если о = + оо. ЛИТЕРАТУРА 1. Haag J.-~ С. г. Acad. sci. Paris, 1924, vol. 179, p. 1388. 2. Borel E. Traite du calcul des probabilites et de ses applications. Paris, 1924. 12 ОДНО ОБОБЩЕНИЕ ТЕОРЕМЫ ЛАПЛАСА — ЛЯПУНОВА * Пусть х^ х2, . . . — независимые случайные величины с матема- тическими ожиданиями = о, fAxn = 2Z>n, м I Хп I 3 = dn; при этом отношения djbn меньше некоторой фиксированной конс- танты: djbn р. (1) * Eine Verallgemeinerung des Laplace—Liapounoffschen Satzes.— Изв. АН СССР, OMEH, 1931, c. 959—962. Представлено С. H. Бернштейном. Пере- вод A. H. Ширяева.
12. Одно обобщение теоремы Лапласа — Ляпунова 115 Положим Sn = Н” *^П9 = Н" • • • 4“ Ьп, Одна из важных задач теории вероятностей состоит в следующем: исследовать поведение при п -> оо сумм Sn в зависимости от свойств величин tn при [л -> 0. На основе уже ставшего классическим зако- на Ляпунова 1 вероятность# Р{а<^п<Ь} = ь e~s!/itn ds + 07? (tn, ц), 101 < 1, VZntn * (2) a R (tn, н) стремится к нулю равномерно по щ если tn больше неко- торой константы Т. Итак, при фиксированном п имеем формулу асимптотического поведения для Sn. Рассмотрим следующую проблему. Пусть a (t) и b (t) — функции параметра t. Спрашивается, с какой вероятностью выполняются все неравенства вида a (tk) <Sk<b (tk), к = 1,2, . . ., п, (3) Предположим, что a (t) и Ъ (t) непрерывно дифференцируемы и что а (0 < b (t), а (0) < 0 < Ъ (0). Тогда можно получить асимптотическое решение поставленной зада- чи, аналогичное (2). Все последовательности S2, . . Sn (до Sn) можно разбить на следующие три класса: К содержит те последовательности, для которых выполнены все неравенства (3); Кг — такие последовательности, для которых существуют такие/с, что выполняются все неравенства a (ti) < Si<Zb (tt), i = 1, 2, — 1. Sk a (J*); K2 — такие последовательности, для которых существуют такие к, что выполняются неравенства a(ti) < Si<. b (t^, i = 1, 2, . . к — 1, b (tk) < Sk. Обозначим вероятности, соответствующие этим множествам, через Рп, Рп\ Р{п- Наконец, обозначим через Рп (х, у) вероятность собы-' тия a (М <Sk<b (tk), к = 1, 2, . . ., п — 1, х < Sn < у. 1 Liapounoff А. МBull. Acad. sci. St.-Petersb., 1900, vol. 13, p. 359.
116 12, Одно обобщение теоремы Лапласа — Ляпунова Очевидно, что Рп = Рп {a (tn), Ъ (tn)}. Неравенства t > 0, a (t) < s < b (t) выделяют в плоскости (5, t) область G. Обозначим через g (sQ, tQ; s, t) •функцию Грина для уравнения теплопроводности df/dt = d*f/ds2 для области G и положим g (s, t) = g(0, 0; s, t), dg (s, t)/ds = и (s, t), vi (0 = (0» 0, ^2 (0 = w [& (£), d. Теорема. Имеют место следующие асимптотические фор- мулы'. Pn(x,y) = \g(s,tn)ds + en(tn,n), (5) X fn е<,г>=$ (б) о *n Рп ) z== -h 02^2 (h)> (7) 10 I <1, I 01 I <1, I 02 I <1, где R, R14 R2 стремятся к нулю равномерно по р; при этом для R (t,\i)dma сходимость равномерна по t, если t больше некоторой кон- станты. Если вместо (3) имеем односторонние неравенства, например а Gfc) < А = 1, 2, . . п, (8) то справедлив аналогичный результат, который, впрочем, легко мо- жет быть получен из предшествующего предельным переходом. Гёттинген, 20 января 1931 г.
13. Об общей форме стохастического однородного * процесса 117 13 ОБ ОБЩЕЙ ФОРМЕ СТОХАСТИЧЕСКОГО ОДНОРОДНОГО ПРОЦЕССА* (Проблема Бруно де Финетти) Пусть X (X) — действительная переменная, которая меняется случайным образом как функция времени X, точнее таким образом, что распределение вероятности Фд (*) = Р {X (Х2) - X (Хх) < х} (Х2 > Хх) зависит только от А = Х2 — и не зависит ни от Хх, ни от X (Хх), ни от поведения X (X) при X < Хх. Символ Р, как обычно, обозначает вероятность соотношения в скобках. Тогда, как известно, функция распределения Фд (х) удовлетворяет функциональному уравнению * 1 оо $ Фд,(* — У)йФд2(«/)- (0 —оо В настоящей работе мы дадим, обобщая некоторые результаты Бруно де Финетти 2, решение уравнения (1) при единственном пред- положении, что конечны первый и второй моменты оо оо Шд = § хс1ф±(х), (х — 7ИД)2 <М>Д (#). —оо —оо * Заметим для неспециалистов, что функция Фд (х) не убывает, непрерывна слева и Фд (—оо) == О, Фд (оо) — 1. Пусть оо (?) — eitxd<b^ (х) —оо *— характеристическая функция Фд (г). На основании известных свойств характеристических функций имеем (0 = IM’I (011/л, ^-/п (0 = hh (0F'". * Статья представлена 6 марта 1932 г. членом Итальянской академии наук Г. Кастельнуово в журнал «Atti della Reale Accademia nazionale dei Lincei. Ser. sesta. Rendiconti» и в том же году опубликована двумя частями на итальянском языке. Первая часть носила название «Sulla forma generale di un processo stocas- tico omogeneo» (vol. 15, N 10, p. 805—808). Его перевод принят в настоящем издании в качестве заголовка всей статьи. Вторая часть имела название «Апсога sulla forma generale di un processo omogeneo» (vol. 15, N 12, p. 866—869). Пере- €°д JI. Басалыго. 1 См., например, мою работу: Ueber die analytischen Methoden in der Wahr- Scheinlichkeitsrechnung.— Math. Ann., 1931, Bd. 104,.. S. 415—458. 2 Cm.: Finetti B. de. Le funzioni caratteristiche de legge istantanea.— Atti Accad. naz. Lincei. Rend., 1930, vol. 12, p. 278—282.
118 13. Об общей форме стохастического однородного процесса -------------------------------------------------------------------- I Так как фд (t) непрерывна по Д, то 3 Фд G>= ЬМ01Д- (2) л И поскольку распределение Фд (х) однозначно определяется фд (t)> ; то для его описания достаточно найти общую форму фт (t). Согласно Финетти имеем 4 “Ф1 (Z) = lim <?А П, logi|)i(£) = lim-i-[^A (t) — 1], Д-^0. Кроме того, оо -3- ["Фа (0 — 1] = -у- [ еИжйФд (х) — 1J - —оо СЮ ОО = -д- х ЙФд (х) + (eitx — 1 — itx) (1Ф& (х) j — — оо —оо оо = -^-[й/Ид+ (<?’** —1 — г£г)</Фд (ж)] = — оо оо 4 — itmi + -i- (eitx — 1 — itx) йфд (х). — ею * Пусть теперь X Fs(x) = -L у^Ф&(у). (3) * —оо Функция Fs (х) не убывает по х и обладает свойствами ^д (— оо)= 0 и оо Fa(oo) = -A- ( яМфд (х) = -^-(щ\ + = + а*. л= 1 Ло Для каждого интервала (а, Ь), не содержащего нуля ни внутри, ни Н на концах, имеем ъ ь _А_ ^eitx — 1 — z?#) ЙФд р (х^ а а 3 В случае, когда Л < 1/п, имеем о^ = — а1/п-д < ai/n ~ ar Поэтому Од стремится к нулю при А —> 0, а грд (0 соответственно стремится к 1. Учитывая равенство я|)д (Z) = г|)Д1 (/) ярд2 (/), заключаем, что г|)д (t) непрерывна по А. 4 (Я’д (0 — 1]/Д ограничено для каждого фиксированного t4 следовательног равенство (0 = 0 исключено, так что логарифм 4ч (t) можно определить для - любого t. I
13. Об общей форме стохастического однородного процесса 119 где р (х, о = (eltx. — 1 — itx)/x* при х Ф О, р (х, t) = —f2/2 при х = 0. ’ ' Так как для каждого заданного t функция р (х, t) конечна и непре- рывна (в том числе и при х = 0), то _1_ (eitx—1 — Их)с1Фь(х)— р (х, t) dFb (х). — оо —оо Выберем теперь последовательность положительных величин Дъ Д2, . . ., Д», • • •, стремящихся к нулю. Из последовательности функ- ций Fbt {F), F^ (х), . . F^n (х), . . . можно, как известно, выбрать подпоследовательность Fbfli (ж), (х), . . F^n; (х), . . сходящуюся к некоторой функции F (х) во всех точках, в которых "она непрерывна. Функция F (х) будет, конечно, неубывающей и с край- ними значениями F (— оо) > lim F& (— оо) = 0, F (оо)< lim FA (оо) = о?, Принимая во внимание то, что функция р (х, t) стремится к нулю при фиксированном t и х-+ ± °о, мы окончательно получаем ОО оо § р (х, t) dF(х) —> р (х, t) dF (х), — оо —оо log ф1 (0 = lim -i- [фд (t) — 1] = оо = lim pZmi -р (eitx — 1 — itx) dtb^ (x) j — —oo oo = limpZmi+ p (x, t) dF& (я)] , Д—>0; —oo oo logip’i (/) = + § p (x-, t)dF(x). (6) —oo Так как второй момент конечен, то 1 °i l°g ф1 (Z) = imit-12 -f- о (t2).
120 13. Об общей форме стохастического однородного процесса Кроме того, из (6) имеем оо log (t) = itm'1 + (----+ o(t2)^dF(x)~ — oo /2 = itm! - [F (oo) - F (- oo)] + 0 (/2), откуда следует, что F (oo) — F (— oo) = nJ и поэтому с учетом (5) F (—- оо) = 0, F (оо) = Qi. Будем считать, что F (х) непрерывна слева (впрочем, значения F (х) в точках разрыва несущественны). То что F (х) не убывает, мы уже отметили. Формулы (6), (4) и (2) вместе с известной формулой ОО фд (X) -фд (0) =-^- J J - Фд («)dt (7) —оо дают общее решение поставленной проблемы. Функция F (х) полностью определяется функцией распределения Фд (х). Действительно, интеграл оо $ Р t) dF (х) = log ф1 (Z) — itmi —оо можно дважды продифференцировать по t и получить с учетом ра- венства Л2 t) — — eux, ЧТО оо jj eitx dF (*) = -£ log фх (0 = X (0. —oo OO 4 p 4_____ e F&-F<f>)= 4- $ -L-^—х(()й. —oo Последнее равенство позволяет определить F (х) с точностью до ад- дитивной константы, которая, в свою очередь, определяется условием F (— оо) = 0. Мы уже говорили, что из всякой последовательности Рьп (я), когда Дп стремится к нулю, всегда можно извлечь подпоследователь- ‘
13. Об общей форме стохастического однородного процесса 121 ность FSn (х), сходящуюся к F (х). Отсюда вытекает, что Ft, (х) при д О стремится к F (х): р (х) = 1 im Ft, (х) = 1 im jj у2 (/Фд (у)'. (8) —оо Однако (8) верно вообще только в тех точках, где F (х) непрерывна. При х < 0 из (3) следует равенство X -2-фд(х)х= jj y-2df\(y). —оо Далее, в силу (8) имеем в каждой точке непрерывности х <. О функ- ции F (х): X Р1(л:) = Нш4-Фд (х) = jj y~2dF(y). (9) —оо Аналогично получаем при х 0: оо -1- [1 — Фд (ж)] = -i- [Фд (оо) — Фд (х)] = jj у~г dFt, (у), X оо Р2(х) = Пт-1-[1-Фд (x)\==^dF(y). (10) X Объяснить действительный смысл функций Рг (х) и Р2 (х) можно следующим образом. В общем случае функция X (X) не обязана ме- няться непрерывно по времени X, она может иметь и скачки. Вели- чина Р2 (х) dk представляет собой вероятность того, что за прираще- ние времени dk имел место положительный скачок, больший чем х. Аналогично Pt (х) dk есть вероятность появления отрицательного скачка с абсолютным значением, большим чем | х |. Из (9) и (10) следует, что y2dPM х<0, (И) Л —эо оо <fl~F(x) = F(o0)-F(x)=^ y2dP2(y), х>0. (12) X Понятно, что справедливость этих формул, как и всех других, кУда входят Рг (х) и Р2 (х), ограничена точками непрерывности F (х). Таким образом, поведение F (х) вне точки х = 0 полностью опре- деляется распределением вероятностей скачков функции X (1). Вмес- те с тем разрыв F (х) в начале координат связан наоборот с непре-
122 13, Об общей форме стохастического однородного процесса рывной вариацией X (X). Чтобы пролить свет на это обстоятельствог положим Й (х) = F (х), х О, Q (х) — F (х) — Оу, х О, где через <у% обозначен скачок F (х) в точке х = 0. Вне окрестности начала координат очевидно, что dF (х) = dQ. (х), Мы можем записать формулы (И) и (12) следующим образом: х Й(х)= § уМР1(г/), л <0, (13) — оо оо с22 — 9.(х) = \ y2dP2(y), ж>0, (14) X где 02 = <*? — Так как й (х) должна быть непрерывна в начале координат, то 02 = й (оо) и, следовательно, функция й (х) полностью определяется функциями Рг (х) и Р2 (х), Имеем ОО оо § p(x,t)dF (х) = Пор (0, t) + § р (х, t) dQ (х). — оо —оо Поскольку р (0, t) — —t2/2, то в результате получается в ее оконча- тельном выражении следующая ОСНОВНАЯ ФОРМУЛА О? с log фд (t) — imit---t2 -f- \ p(x,t)dQ(x), (15) — ОО Если Q (х) — 0, т. е. когда X (X) может меняться лишь непре- рывно как функция времени, то Оо — Ор Имеем ( °? 1 фд (0 = exp j im.it-у- t2} , Фд (#) = —exp /------------—~ 1 dy. V ' С1/2лД J F 2Да? У —оо I 1 J Покажем в заключение, что формулы (7), (6) и (2) при любом вы- боре функции F (х) (неубывающей, непрерывной слева и со значения- ми F (— оо) = О, F (оо) = 0J <С оо) дают решение рассматриваемой проблемы. Другими словами, речь идет о доказательстве того, что при упо- мянутых условиях функция Фд (х), задаваемая (7), представляет при всех А 0 настоящую функцию распределения.
13, Об общей форме стохастического однородного процесса 123 С этой целью рассмотрим прежде всего ступенчатую функцию Т (х), которая только в конечном числе точек х19 х2, . . хп имеет скачки Ю/f = Т (хк + 0) Т (^), сумму которых обозначим через of = + со2 + . . . + о>п, и кото- рая постоянна в каждом интервале, не содержащем ни одной из то- чек хк. Условимся также, что между точками хк нет начала коорди- нат х = 0. Тогда 5 f р (х, t) dT (х) = ^pk (еихк — 1 — itxk), —оо к # log ipi (i) = itP + S Pk [Xfc (t) — 1], к p = mi — pk = — , Xfc(0 = exp(i^ft); к Фд (t) = bPi (OF = exP + h^Pk [Xk (0 — 1]}- Функции %k (t) — exp (itxk) и exp (itPA) являются, очевидно, харак- теристическими функциями (это означает, что они порождают с по- мощью (7) функции распределения). Из результатов де Финетти следует, что в этом случае характеристическими функциями являются exp {&рк [%fc (0 — 1]} и функция фд (t), представляющая собой про- изведение характеристических функций. Выбрав tQ и 8 > 0, можно всегда аппроксимировать любую функ- цию F (х) посредством ступенчатой функции Т (х) таким образом, чтобы неравенство | $ р (х, t) dF (х) — § р(х, t)dT (я)| <е (16) —оо -60 выполнялось для всех | t | < f0. Образуем теперь последователь- ность Тп (х) функций Т (х) таким образом, чтобы разность (16) стре- милась к нулю для всех t и притом равномерно для каждого ограни- ченного интервала. Тогда соответствующие им функции (t) схо- дятся к Фа (0» откуда следует, что фА (0> будучи пределом характе- ристических функций, сама является характеристической функцией. 5 При замене функции F (х) функцией Т (х) мы пишем вместо фд.
124 14. К вычислению средней броуновской площади 14 К ВЫЧИСЛЕНИЮ СРЕДНЕЙ БРОУНОВСКОЙ ПЛОЩАДИ* Совместно с М. А. Леонтовичем В настоящей работе будет решена следующая задача, поставлен- ная перед нами С. И. Вавиловым. Требуется определить среднее значение (математическое ожидание) площади, покрываемой за за- данное время проекцией на плоскость движущейся броуновской час- тицы конечного размера. Элементы площади, которые эта проекция проходит несколько раз, должны засчитываться только единожды. Решение этой задачи будет нами сведено к решению следующей более общей задачи: определить вероятность того, что при броуновском дви- жении в области G плоскости бесконечно малой частицы, находящей- ся в момент t = 0 в заданной точке (х, у), эта частица за время t по крайней мере один раз достигнет границы R данной области. В раз- деле 1 будет разъяснен метод решения этой последней задачи, а в разделах 2 и 3 она будет применена к расчету средней броуновской площади. Разделы 1 и 2 статьи принадлежат А. Н. Колмогорову, а раздел 3 — М. А. Леонтовичу. 1. Рассмотрим прежде всего движение бесконечно малой частицы в плоскости с декартовыми координатами х и у. (Аналогичная трех- мерная задача может исследоваться точно таким же образом.) Обо- значим через Р (х, у; t) вероятность того, что находившаяся в момент t = 0 в точке (х, у) области G частица за время t по крайней мере один раз достигнет границы R этой области. Пусть далее PL (х, у; t) — это вероятность того, что находившаяся в точке (х, у) частица за время t по крайней мере один раз достигнет границы R и притом так, что первое достижение границы частицей будет иметь место на части L этой границы. Ясно, что при этом Pl {х, у, t) < Р (х, у, t). Обозначим теперь через р (х, у, т); t) вероятность того, что находившаяся в момент t = 0 в точке (х, у) частица в момент t ока- жется в области (5, 5 + d& т), г) + йц), причем за время t она ни разу не достигнет границы. В таком случае, очевидно, $ Р (У, I, Т, 0 dl dq + Р (х, у; t) — 1. (1) G * Zur Berechming der mittleren Brounschen Flache.— Phys. Ztschr. Sow., 1933, Bd. 4, S. 1—13. Перевод 'A. M. Яглома.
14, К вычислению средней броуновской площади 125 Кроме того, легко видеть, что р (а у, t + т) = р (х, у, т) + р (ж, у, g, л; Н р (g, л; 0 <%> ^л, (2> G Pl<х, y,t + P) = PL(х, у, т) + р(х, у,.g, л; т) PL(g, л; 0(3) G Примем теперь следующие предположения. I. Функции Р (х, у; t) и PL (х, у; t) в окрестности каждой внут- ренней точки области G могут быть разложены в ряд Тейлора, так что р (I 4t) = P (?, у, t) + ° (1 - X) + дР{х^1. (л - у) + + (1 _ ж)2 + 2 д'р^ (I - *Хп - У) + + diP{xd'J't} (Л - У)2} -Ю {(£ -Xf + (Л -У)2>4 (4> Рла,л;е = Рь(АУ;.)+^^(^-.)+^^(л-У)+- 1 ( д2Рг (х, у\ t) д2Рг (х. у\ t) + -т(-- t (В -х)2 + 2 - х)(л - У) + д2Рг (х у\ t) ) +---------(П - У)2} -F 0' {(В - *)2 + (Л - У)2Г\ (5) где | 0 | М, | 0' | <; М\ причем М и М' не зависят от £ и ц (но могут зависеть от у и t). II. В каждой внутренней точке области G выполняется соотно- шение ит£Ь±121 = о. (6) т-*о В силу неравенства PL Р отсюда также вытекает, что III. Функция р\х,у*, 0 удовлетворяет следующим условиям: l-o {“Г р — х>>dtl} = А1 <8> G rilo ^р(х' III. * У * * *’’ л; — 2/)й^л} = А2(х, у), (9) V-lo Ы- 5 Р У' 1,5 Т) — Х^2 = Blt (х, у), (10) G
126 14. К вычислению средней броуновской площади Иш § Р (х, у; I, ц; тХл — у)2 dl di]} = (.г, у), (11) G Iim {2Г^Р(л?/;М;т)(£ — ^)(П — y)dldr[} = Bi2(x, у), (12) т~° g J Hm {-L р (х, у; g, ц; T)[(g — х)2 4- (i] — ?/)2]3/! d% dt]} = °, (13) тде А19 А2, 2?п, В12, В2i — некоторые функции, определяемые эти ми соотношениями. При условии, что справедливы предположения I, II и III, функ- ции Р (х9 у\ t) и PL (х, у; t) будут решениями следующего дифферен- циального уравнения: дР п д2р । oz? д2р I о д2р । л дР । л дР ~дГ~ 511 ~д^~ + 2В12~д^ + В22~ду + А1~дГ+ А2~дГ‘ (14) Доказательство мы приведем для функции Р (х, у; t), так как в слу- чае функции PL (х, у; t) доказательство проводится совершенно ана- логично. В силу (2) и (4) мы имеем Р (т, у-1 + т) __ Р (х, у; t) _ т т Р У’ т) . 1 С* / о \ 77 /f. 7 Р (•£, У*1 =------- + — J Р (X, у; g, я; т) Р (g, n; t) dl dr}------1 /’ = G = --xy’T) + -7-P(x, y; g, i];T)dg(7>i —l|p(.r, y‘,t) + G + § P (x, y; g, Т); тХ£ — X) dg di] + G 1 С / * \/ \ 7 dP(.r, и;£) , + — \)P(x,y; g, t); тХп — у) dgdq —4- G + $ P (x, y, g, n; TXi - X)2 dg di] azp{xd]f't} + G + 17 У’ ^n;T)(g —ж) (11 —?/)dg di] d'PgXx'gyy't} 4- G + \p y; —y?dii djP~fey~ + J °y G 4- 4" 5 p ('x’ y’' 11; T) — + (Л — 3/)a}3/2^B dr\, (15) G
14. К вычислению средней броуновской площади 127 где | 0" I В силу (6) и (13) первый и последний члены правой части равенства (15) при т-> 0 стремятся к нулю. Но так как в силу (1) 1 — $ р (А у; М; 0 dldx\=P (х, у, t\ G то при т -> 0 стремится к нулю также и второй член правой части (15). Коэффициенты при производных Р по х и у имеют предельные значения А2, Вп, 2В12, В22; поэтому правая часть (15) при т О стремится к правой части (14). Левая часть (15) также имеет предель- ное значение, которое равно dPIdt. Тем самым справедливость урав- нения (14) нами доказана. Уравнение (14), которому удовлетворяет вероятность Р, сопря- жено к уравнению Фоккера. Это уравнение можно также вывести при значительно более слабых предположениях (ср. [1—4]). Допустим теперь, что, помимо условий I—III, выполняются так- же следующие два условия IV и V: IV. При фиксированном t (где t 0) вероятность Р (z, у\ t} стремится к единице, когда точка (х, у) неограниченно приближает- ся к границе области G. При t — 0 для любой внутренней точки об- ласти G выполняется тождество Р (х, у, t) = 0. V. При фиксированном t (где t 0) вероятность Pl (х, у; t) стремится к единице, когда точка (х, у) стремится к какой-либо внут- ренней точке части L границы, но она стремится к нулю, когда (х, у) стремится к какой-либо точке границы, лежащей вне части L. При t = 0 для каждой внутренней точки (х, у) области G выполняется тождество PL (х, у\ t) = 0. Принимая во внимание, что и Р, и PL ограничены (а именно, не- отрицательны и не превышают единицы), легко показать, что Р и Pl однозначно определяются уравнением (14) и условиями IV и V. 2. Вычисление площади, описываемой броуновской частицей ко- нечного размера. Предположим теперь, что проекция броуновской частицы может быть представлена в виде круга единичного радиуса (при соответствующем выборе единицы длины). Так как мы ниже будем рассматривать только такие проекции, мы будем именно их Для простоты называть частицами. Отметим, впрочем, что соответ- ствующую трехмерную задачу вычисления объема, описываемого броуновской частицей, можно исследовать совершенно аналогично. Центр частицы будет подчиняться законам, сформулированным в разделе 1. Из соображений симметрии естественно принять, что» А = А2 = В12 — 0 и = В22 = D. При этом уравнение (14) при- нимает следующий вид: IL = D । д2р\ dt и дх* ду* ) ‘ В силу (10) коэффициент диффузии D определяется соотношением ».liin.E6-l’ =|im Т-0 с -о Л
128 14, К вычислению средней броуновской площади где Е — символ математического ожидания. Нетрудно убедиться, что значение D совпадает со значением аналогичной же постоянной для трехмерного броуновского движения. Наша задача заключается в определении математического ожида- ния площади, которую покроют последовательные положения части- цы за время от t =0 и до заданного t. Выберем в качестве начала ко- ординат точку, совпадающую с центром частицы в момент t = 0. Обозначим через W (х, у; t) вероятность того, что в течение времени t заданная точка (х, у) будет по крайней мере один раз покрыта час- тицей. В случае, когда расстояния от точки (х, у) до начала коорди- нат не превосходят единицы, очевидно, W (х, у; t) = 1. Если же это расстояние превосходит единицу, то тогда точка (х, у) будет хоть раз покрыта частицей в том и только в том случае, если путь центра час- тицы по крайней мере один раз достигнет окружности единичного радиуса с центром в точке (х, у). В силу соображений симметрии ве- роятность такого события равна также вероятности того, что центр броуновской частицы, находившийся в момент t — 0 в точке (х, у), за время t по крайней мере один раз достигнет границы круга 5 еди- ничного радиуса с центром в начале координат. Эту же последнюю вероятность можно вычислить с помощью соображений, содержащих- ся в разделе 1 нашей статьи. Таким образом, внутри круга S должно выполняться равенство W (х, у- 0 = 1, ’ (16) а вне этого круга функция W (х, у*, t) должна удовлетворять диффе- ренциальному уравнению dfF rd vw , = D -т-г- 4- . (10 dt \ дх2 ду* / х ’ Кроме того, на границе круга 5 должно выполняться граничное усло- вие W (х, у, t) = 1 (18) и должно быть справедливым также начальное’условие W (х, у; 0) = 0. (19) При нахождении математического ожидания броуновской площа- ди можно рассуждать следующим образом. Пусть § — область, по- крытая частицей за время t, a F — площадь этой области. Примем, что б (х, у, = 1 при (х, у), расположенном внутри и б (х, у\ %) = 0 в противоположном случае. Ясно, что Е {S (х, у; 5)} = W {х, у, t), а броуновская площадь F может быть определена соотношением F — SS 6 и, у; ю dxdy.
14. К вычислению средней броуновской площади 129 Отсюда вытекает, что Е (F) = И Е {5 (х, У> Ю} dxdy = Л W (х, у, t) dxdy. (20) 3. Решая нужную нам задачу с граничными условиями, перейдем к полярным координатам (г, <р). Ясно, что функция W будет зависеть только от радиус-вектора г, но не от угла ср. Выберем теперь так еди- ницу времени, чтобы D приняло значение 1. В таком случае интере- сующая нас задача с граничными условиями для W (г, t) принимает вид д№ _ d2W dt dr2 W(i, 0 = 1; W (r,0) - о, Для решения Лапласа. А именно умножим обе стороны (21) на e~vt и проинтегри- руем результат по t в пределах от 0 до оо. Применив интегрирование по частям и используя также начальное условие (23), для величины + ’ (21> Ж (оо, 0 = 0; (22) г > 1. (23) этой задачи мы воспользуемся преобразованием (24) U (г, v) = W (г, t) e~vt dt о можно получить следующее дифференциальное уравнение: 4т- + _ vU = 0. (25) dr2 ' г dr 4 ' Из граничных условий (22) для функции W вытекают следующие условия для U: U (1, v) = 1/р; t/(oo,p) = 0. (25') Решение уравнения (25) при условиях (25') имеет вид тт z ч 1 К(гу/~у) U (г, v) —----v , v 7 v К (/v) где K(x)=^-H^(ix), . а — первая функция Ганкеля нулевого порядка (см. [5, раздел 17.71]). В силу (24) для того, чтобы найти функцию W (г, £)> нам надо только решить линейное интегральное уравнение первого рода О 5 А. Н. Колмогоров 1 К (г У V) v к (/7) (26)
130 14. К вычислению средней броуновской площади Правая часть этого уравнения при Re v 0 представляет собой це- I лую функцию переменного v. В самом деле, в силу известной теоремы (см., например, [6, раздел 15.7]) функция К (х) не имеет нулей при | arg х | л/2. Решение интересующего нас интегрального урав- ’ нения в случае, когда правая часть удовлетворяет указанному усло- вию, хорошо известно (см., например, [7, раздел 6.7]) и имеет следую- щий вид: л aV°° Ж(г,0 = -й^ \ — ' ’ ' 2ш J v а—гоо К (г if у} K(]fv) dv, (27) где интегрирование проводится по прямой, параллельной мнимой оси, а а 0. Тем самым мы нашли решение нужной нам задачи « с граничными условиями. Выражение (27) справедливо при г^>1; ч если же г 1, то в силу (16) W (г, t) = 1. ‘ (27') J Для математического ожидания Е (F) в силу (20)—(23) и (27') J мы получаем Е (F) = 2л W (г, t) г dr — л 4- 2л W (г, t) г dr = ° ' 1 , о С С dW , о (• Д . f d*W | 1 0Ж\ = л + 2л \ \ -^-rdrdt = л + 2л \ dt \ rdrl-^- + ~"57/ = 10 0 1 о f дЖ(1,0 /9йч = л — 2л \----— - dt, (*о) о причем в силу (27) а+Г fiVt £(F)=i \ Ац J V /г а—гоо К' (]Л) dv 1$, т где а-Н°° 70 = л — t а—гоо у'* Ktfv) Найдем асимптотическую формулу для Е (F), справедливую для больших t. Известно (см. [5, раздел 17.71]), что J К (х) = - Jo (ix) In + х2Р (х), К> (х) = — 7о(г>)- - i In Jo {ix) + х [2Р {г) + хР' (х)], X
14. К вычислению средней броуновской площади 131 где у = ес,С — постоянная Эйлера (так что у — 1,7810...), а Р (х) — целая функция. Следовательно, JlM = 1 + xR(x); К(х) х\п(ух)2) ' ' i In (ух/2) J0 (ix))2 - 2Р (х) - Р' (х) х + Р (я)/1п (ух/2) R ~ 70 (ix) In (ух/2) - х*Р (х) ' Так как К'(х)/К(х) не имеет особенностей при | arg х | < л/2 (за исключением^ точки х = 0), а при | х | оо эта функция стремится к нулю (что следует из известных асимптотических формул К (х) ~ (п12)'<'ге-х1хЧ* и К' (х) ~ —(л^)1^-*/^), то R (х) не имеет в этой же области других особенностей, кроме особенности в точке х = 2/у. При стремлении х к нулю х 1 । А । в 2 *" In (ух/2) 1п(уж/2) ’ так что | R (х) | при этом остается ограниченным. В силу (28') мы можем положить Е (F) = /0 + Л + 12, - ' (29) где а+Г evt dv evt 11 = 2,1 \ , A = i \ —R(Vv)dv. J v2 In (т2у/4) ’ & •) у а—гоо а—гоо __ Для того чтобы избежать особенности функции R (]4v) в точке и = 4/у2, мы выберем в качестве пути интегрирования прямую, пересекающую вещественную ось между значениями 0 и 4/у2; иными словами, мы примем, что а < 4/у2. В таком случае интеграл /2 легко оценить. Полагая vt = g, получаем а"М°° a^H-ioo ______ Л = г J ^-R(Vv)dv = i J -i- R ( у ) dl = а—гоо at—гоо = i $ тй(/т)'г£- 3—гоо где р можно считать независимым от t. Выражение при любом t будет ограниченным. В этом легко убедиться, применяя к его вещественной и мнимой частям вторую теорему о среднем зна- чении. 5*
132 14. К вычислению средней броуновской площади Таким образом, мы убедились, что л = о (1). Интеграл Iq не зависит от t, так что /о = 0(1). Остается только оценить интеграл а-Moo f at+ioo т n. С g dy _____________9. / У2 \ С g dz 1 1 J р21п(72р/4) \ 4 J j zalnz ’ а—гоо а2—г*оо где положено z = уу2/4, т = 4^/у2, 04 = у2а/4. Преобразуя тральную функцию интеграла 1г с помощью тождества (30) (31) подынте- Р Р dz da \ е-2а1пг+гтйз + г 4- \ А--------------• J 1 2 J In z о мы получим 1 а<4-гоо а.-Мос> h = — iy2 0. oct—гоо а,—гоо f е2Т dz В слагаемом, пропорциональном \ —, интегрирование можно вести вдоль мнимой оси. При этом легко показать (например, при- лагая вторую теорему о среднем значении к вещественной и мнимой частям интеграла), что это слагаемое имеет порядок О (1). В выра- жении J е~~2а ln z+ZTdz путь интегрирования можно деформировать таким образом, чтобы он совпал с петлей в, охватывающей отрица- тельную часть вещественной оси (см. рисунок), после чего можно преобразовать это выражение следующим образом: е-2а In zvzx fiz _ Т2а~1 £-2ае£ £ = zx. Воспользуемся соотношением (см. [5], раздел' 12.22]) в силу которого 7 2лу2 f е2а1пт , . 71 — т J Г (2а) da + ()
14. К вычислению средней броуновской площади 133 Интеграл в правой части последнего соотношения равен 1 2 1 С Л _ т2 С e-y'axdy _ та ff , }Т72^Г 2 } Г (2 — у) ~ 2 1J Г(2 —у) + О о о I 1 с 0 — y)e~vlnxdy ] + т J Г (2-1/) р о Отсюда в силу (29), (30) и (31) следует, что 1 , ® S -y In т J Г(2-,) + °W- О При больших значениях In т имеет место асимптотическое соотноше- ние С _ 1 _ 1 J ' Г (2 — у) In т “ In (4*/у2) ’ о и, следовательно, EW-TJWT- <32> При 0 < у < 1 выполняются неравенства 1 _1 Г (2 - у) 0,88 ’ и поэтому 1 Г 1 In т J Г (2 — у) 0,881п т * о Желая получить асимптотическое разложение для Е (F), мы можем при помощи последовательных интегрирований по частям предста- вить последний интеграл в виде С e-y^dy __ 1 fi4_ 1 ^(2) J J Г (2-у) ~ 1пт»Г(2) In т Г (2) о 1 Т2(2)-Т'(2)Г(2) | Т in2 т Г (2) -Г-р где Y (х) = Г' (х — 1)/Г(х — 1). Подставляя сюда числовые значе- ния функций Г и Т, получаем р (р\__ Гл I 0,423_______0,467 1 I fl / Л \ 1п1,2бГ[1-1 in 1,26* In21,26* +•••} + О (1).
134 15. Об эмпирическом определении закона распределения В случае, когда времена и длины измеряются в произвольных еди- ницах, t должно быть заменено на Dtla2. a F — на где о — радиус частицы. Таким образом, окончательно мы получаем Е (Л = — 114* - 0323________________°»467 4- 1 д. v 7 In (1,26Р£/о2) Г ' In (l,26Pi/<s3J ln3(l,26D//<53) + + 0(1). Эта формула и представляет собой асимптотическое решение постав- ленной задачи. ЛИТЕРАТУРА 1. Kolmogoroff А. N. Ueber die analytischen Methoden in der Wahrscheinlich- keitsrechnung.—Math. Ann., 1931, Bd. 104, H. 3, S. 415—458. Pyc. nep.: УМН, 1938, вып. 5, c. 5—41. 2. Kolmogoroff A. N. Zur Theorie der stetigen zufalligen Prozesse.—Math. Ann., 1933, Bd. 108, H. 1, S. 149-160. 3. Kolmogoroff A. N. Eine Verallgemeinerung des Laplace—Liapounoffschen Satzes.— Изв. АН СССР, OMEH, 1931, c. 959-962. 4. Kolmogoroff A. N. Ueber die Grenzwertsatze der Wahrscheinlichkeitsrech- nung.— Изв. АН СССР, OMEH, 1933, c. 366—372. 5. Whittaker E. T., Watson G. N. A course of modern analysis. Cambridge: Univ. Press, 1927. 608 p. Рус. пер.: Уиттекер Э. T., Ватсон Г. H. Курс совре- менного анализа. М.: Физматгиз, 1963. Ч. 1. 343 с. Ч. 2. 515 с. 6. Watson G, N, A treatise on the theory of Bessel functions. Cambridge: Univ. Press, 1922. 804 p. Рус. пер. 2-го англ, изд.: Ватсон Г. Н. Теория бесселе- вых функций. М.: Изд-во иностр, лит., 1949. Ч. 1. 799 с. Ч. 2. 219 с. 7. Fowler R. Н. Statistical mechanics. Cambridge: Univ. Press, 1929. 864 p. 15 ОБ ЭМПИРИЧЕСКОМ ОПРЕДЕЛЕНИИ ЗАКОНА РАСПРЕДЕЛЕНИЯ* Рассмотрен вопрос о возможности определения закона распреде- ления на основании конечного числа испытаний. 1. Пусть Х19 Х2, . . Хп — результаты п взаимно независимых наблюдений, расположенные в порядке возрастания, < . . . < Хп, и пусть F (х) = Р {X < х} — закон распределения, соответствующий этой последовательности наблюдений. Эмпирическим законом распределения называется * Sulla determinazione empirica di una legge di distribuzione.— G. 1st. ital» attuar.,* 1933, vol. 4, N 1, p. 83—91. Перевод А. С. Холево.
15, Об эмпирическом определении закона распределения 135 функция Fn (х), определяемая соотношениями Fn (х) =0, х < Xi, Fn (х) = k/n, Хк < х < Xs+1, k = 1, 2, .... п — 1; Рп (Р) ~ -1 ’ Хп Ж- Следовательно, nFn (х) представляет собой число значений Хк, не превосходящих х. Естественно, возникает вопрос: приближается ли Fn (ж) к Р (х), когда п очень велико. Теорема, относящаяся к этому вопросу, была сформулирована фон Мизесом [1] под названием метода о)2. Однако фундаментальное утверждение о том, что вероятность выполнения неравенства D = sup | Fn (х) — F (х) | < е стремится к единице при п —> оо для любого 8, на мой взгляд, до сего времени не было ясно сформулировано, хотя его было бы можно доказать различными простыми способами. Я получу это утверждение как непосредственное следствие дока- зываемой ниже теоремы. Должен добавить, что постановка рассма- триваемого вопроса мотивирована недавними исследованиями Гли- венко [2]. Теорема I. Вероятность Фп (%) неравенства D = sup | Fn (х) — F (х) | < п стремится при п оо равномерно по % к +°° Ф (л) _ У. (1) —оо для любой непрерывной функции распределения F (х). Ниже приводится таблица некоторых значений Ф (%), вычислен- ных Н. Кожевниковым. Ф(М % ' Ф(М X Ф(Х) 0,0 0,0000 1,0 0,7300 2,0 0,99932 0,2 0,0000 1,2 0,8877 2.2 0,99986 0,4 '0,0028 1.4 0,9603 2,4 0,999973 0,6 0,1357 о 0,9888 2,6 0,9999964 0,8 0,4558 1,8 0,9969 2,8 0,99999966 Из этой таблицы видно, что неравенство может Рассматриваться как практически достоверное. Кроме того, оказы- вается Ф (0,83) - 0,5.
136 15. Об эмпирическом определении закона распределения Если % мало, то ряд (1) сходится очень медленно; в этом случае можно использовать асимптотическую формулу ф(Х)~ J^Le-«’/8W А При X = 0,6 эта формула дает Ф (0,6) - 0,1327 вместо значения Ф (0,6) - 0,1357, вычисленного посредством точной формулы (1). 2. Лемма. Функция вероятности Фп (X) не зависит от функ- ции распределения F (х), если последняя предполагается непрерывной. Доказательство. Пусть X — случайная величина с не- прерывным законом распределения F (ж); случайной величине Y = = F (X) соответствует, очевидно, закон распределения FW (х), такой, что F<°) (х) = 0, х < 0; F(° (х)=х, 0<я<1; FM (х) = 1, > 1. Если Fn (х) и Fn} (х) представляют эмпирические законы распреде- ления X и Y по п наблюдениям, то верны следующие равенства: Fn (х) — F (х) = F^ [F (х)] - F<°> [F (ж)] = F<°> (у) - FW (у), sup | Fn (x) — F (x) | = sup | F„o) (y) — F<°> (y) |. Отсюда вытекает, что функция Фп (X), соответствующая произволь- ной непрерывной функции распределения F (ж), идентична той, которая соответствует функции F^ (х). Поэтому при доказательстве нашей теоремы можно ограничиться случаем F (х) — FW (х). В дальнейшем вместо F^ (х) будем писать Fn (х) и ограничимся значениями 'х в отрезке 0 х 1, где FW (х) = х. Тогда наша задача сводится к нахождению вероятности Фп (X) неравенства sup | Fn (х) — х | < Х/]Лп, 0 х 1. (2) Пусть >Х имеет вид X — yd^n, где р, — целое число. Подставляя в (2), получаем Фп (X) = Р {sup I Fn (х) - XI < -В.}, Х = -^. (3)
15, Об эмпирическом определении закона распределения 137 функция Fn принимает лишь значения, кратные 1/п; пусть, например, Fn (х) = Ип и х = jin + е (0 8 < 1/п). Принимая во внимание, что Fn (х), будучи функцией распределения, является монотонной функцией, получаем немедленно Поэтому для выполнения неравенства необходимо, чтобы выполнялось по крайней мере одно из следующих неравенств: F JL п\ п ) п п п ’ Отсюда следует, что формулу (3) можно заменить следующей: <pn(x)=p{max|Fn(v) —v|<"r}’ z = 0’1’ •••>”• (4) Пусть теперь Pilz — вероятность события Eiliy состоящего в од- новременном выполнении соотношений I Fn {jin) — jin | < р/п, 7=0,1,...,*; I Fn (k/n) — k/n | = i/n. Заметим, что Фп &) = <«) При k = 0, очевидно, имеем Л)0 = 1, Ло = О (^0). (7) Вообще Р* - 0 (8) при | i | ;> р, поскольку в этом случае неравенства (5) противоречи- вы. Далее, = |г|<Н> (9)
138 15. Об эмпирическом определении закона распределения где обозначает вероятность события Eik+1 при условии, что выполнено событие т. е. вероятность равенства * ~ 7 + * п (10) при условии Еп (k/п) = (к + ])/п. (11) Соотношение (11) означает, что из результатов п наблюдений Xi, Х2, . . Хп ровно п ~ к — j попадают в промежуток к!п< < х 1; равенство (10) может поэтому выполняться только в том случае, когда i — j + 1 из указанных п — к — / результатов на- блюдений находятся в промежутке к/п < х (к + 1)/п. При условии, что Хт имеют равномерное распределение, полу- чаем следующее выражение для искомой вероятности: <12> Формулы (7)—(9), (12) и (6) позволяют найти вероятность ФП(Х) в случае % = fx/jAi. Эти формулы можно заменить другими, более удобными. Для этого положим Условия (7) и (8) переходят в следующие: Лоо = 1, = ^0; (14) Rtk = 0« | И > (15) Соотношение (9) после элементарных вычислений сводится к формуле = (i'-АйГ), g~‘- <16’ 3 Наконец, из (6) и (13) получаем Ф»(Х)=Л^оп. (17) п Формулы (14)—(17) также позволяют найти Фп (%) в случае % == = [1//п. 3. Пусть теперь Ух, У2, . . Уп последовательность взаимно независимых случайных величин с законом распределения, харак- теризующимся формулой Р {г, = 1 = 1,2,... (18)
15. Об эмпирическом определении закона распределения 139 Если ПОЛОЖИТЬ S. = У, + У2 + . . . + Уь то легко убедиться, что вероятность Rik одновременного выполнения соотношений I Sj I < И» 7 0t 1, . . ., k; sk = i/p, (19) удовлетворяет тем же условиям (14)—(16), что и Rik; другими сло- вами, Rik — Rtk. Это позволяет дать асимптотическое выражение для Rik при п -> оо. Для достижения этой цели может служить сле- дующая общая Теорема II. Пусть Уь Y2, . . Yn — последовательность взаимно независимых случайных величин, принимающих лишь кратные постоянной 8 значения. Пусть Е (У*) = О, Е (УА?) = 2^, Е ( | У? | ) = dk, S, = Yt + У2 + . . . + Уь tk — + ^2 + • • • + Ьк и. a (t), Ъ (t) — непрерывно дифференцируемые функции, удовле- творяющие неравенствам a(t)<b (0, а (0) < 0 < Ъ (0). Обозначая Rin вероятность одновременного выполнения соотно- шений Gfe) А = 1, 2, . . п, === 18 и и (о, т, s, 1) функцию Грина уравнения теплопроводности df/dt = d*f/ds* в области G, определяемой неравенствами a(t)<s<b (0, имеем Rin = (0, 0, 1г, tn) + Д}, где \ равномерно стремится к нулю вместе с е, если выполняются следующие условия: а) а (0 и Ъ (0 остаются постоянными, a tn ограничены фиксиро- ванными пределами о < Тг < tn < Т2;
140 15. Об эмпирическом определении закона распределения Ь) существует постоянная С 0 такая, что ^k/^k (/&, с) существует постоянная К 0 такая, что для любого к можно найти i%, для которого удовлетворяются неравенства Р {П = ifce} >К, Р {У, = (ik + 1) 8} > К-, d) существует постоянная А такая, что a(tn) + А < /е < 6 (tn) — А. В остальном величины Yk, а также их количество п и целое i могут произвольно зависеть от 8. Эта теорема относится к тому же кругу идей, что и теорема, из- ложенная в моей заметке [3]. Впрочем, утверждение сформулированной выше теоремы являет- ся более точным: теорема в указанной заметке позволила бы утверж- дать лишь, что % Rin=^ u(Q,O,z,tn)dz +К, i=p ре где Д' стремится к нулю вместе с 8 при выполнении условий а) и Ь). Условие с), являющееся существенной частью нашей новой теоремы, уже использовалось фон Мизесом в аналогичных рассмотрениях. В нашем случае 8 = 1/|Л, Е (У0 =0, Е (У?) = 2bh = 1/И3, Е (У?) = 4 = = С7ц = Се, tn = п/2р* = 1/X2, a (t) = -1, b (t) = +lt 7?0n=e|u (0,0, 0, -1-) + д} , +<ЗО __ (s-2/f)2 * —оо Ф„(М = Роп=-^е"Яоп = п + <30 = {]Л2лп + S) -L{-А=- У (- 1)* е~^ + д} = * —оо +°° = ^(-l)frc-2W+7? = O(X)4-7?. 1 —ОО Остаток R в этой формуле стремится равномерно к нулю при п->оо в случае, если % больше некоторого определенного Хо > 0.
16. О предельных теоремах теории вероятностей 141 Действительно, в данном случае е = 1/р, = '1/(Хуги) стремится К нулю при п —> оо. Утверждение теоремы I, таким образом, доказано для значений X вида \klrfп и при условии % >Х0. Поскольку предельная функция ф (Z) непрерывна и имеет предельное значение Ф (0) =0, то легко видеть, что указанные ограничения несущественны. К вопросу дока- зательства теоремы II мы предполагаем вернуться в следующей заметке. ЛИТЕРАТУРА 1. Mises R. von. Wahrscheinlichkeitsrechnung und ihre Anwendung in der Sta- tistik und theoretischen Physik. Leipzig; Wien: Fr. Denticke, 1931. 2. Glivenko V. Sulla determinazione empirica delle leggi di probabilita.— G. 1st. ital. attuar., 1933, vol. 6, N 1, p. 92—99. 3. Kolmogoroff A. Eine Verallgemeinerung des Laplace—Liapounoffschen Sat- zes.— Изв. АН СССР, OMEH, 1931, c. 959-962. 16 О ПРЕДЕЛЬНЫХ ТЕОРЕМАХ ТЕОРИИ ВЕРОЯТНОСТЕЙ* Основополагающие идеи П. Лапласа [1] и П. Л. Чебышева [2], как известно, были обобщены после работ А. А. Маркова [3] и А. М. Ляпунова [4] в весьма общем утверждении (так называемая теорема Ляпунова) о пределе распределения вероятностей для суммы большого числа малых независимых случайных величин. В дальней- шем исследования А. А. Маркова [5] и С. Н. Бернштейна [6] показа- ли, что аналогичное утверждение во многих случаях справедливо и для сумм не полностью независимых величин. Эти обобщения в осо- бенности важны для приложений, но принципиально они не идут много дальше: во всех случаях, исследовавшихся этими авторами, лишь мало удаленные друг от друга слагаемые сильно зависят друг от друга, но если разложить сумму на достаточно длинные частные суммы, то последние будут уже почти независимы. Гораздо дальше идет дву- (и много-)мерное обобщение теоремы Ляпунова на случай сумм случайных векторов, впервые строго обоснованное С. Н. Берн- штейном [6]. После всех этих исследований осталось еще определить неиз- вестные даже в простейшем случае независимых слагаемых предель- ные значения вероятностей разного рода, связанных со всем набором частных сумм данной последовательности случайных величин. * Ueber die Grenzwertsatze der Wahrscheinlichkeitsrechnung.— Изв. АН СССР, OMEH, 1933, с. 366—372. Представлено С. Н. Бернштейном. Пере- вод К, И. Осколкова.
142 16. О предельных теоремах теории вероятностей К этой области во всяком случае относятся старые результаты П. Лапласа и С. Пуассона [7] о вероятности разорения игрока, которые нашли продолжение в исследованиях П. Леви [8]. Недавно я опубликовал одно общее утверждение подобного рода [9]. Некото- рые частные двумерные проблемы аналогичного типа между тем были исследованы Р. Люнебургом [10]. В обеих из последних работ выяс- нена связь, существующая между этими проблемами и дифферен- циальными уравнениями теплопроводности [11]. Несколько месяцев назад И. Г. Петровский в Москве нашел об- щий метод, который в весьма общей ситуации сводит к соответствую- щим дифференциальным уравнениям теоретико-вероятностные зада- чи о суммах малых случайных величин. В настоящей работе этот метод будет применен к доказательству теоремы Ляпунова (§ 1) и моей вышеупомянутой теоремы (§ 2 и 3). Приложения к задаче блуждания можно найти в еще неопубликованной работе И. Г. Пет- ровского, существенно обобщающей постановки задач Р. Люне- бурга. По-видимому, метод может быть также применен, когда закон распределения каждого слагаемого х%+1 зависит от суммы + + х2 + . . . + всех предыдущих слагаемых. Этот случай явля- ется решающим для строгого математического обоснования теории диффузии, когда внешние силы, а также коэффициенты диффузии являются функциями точки. При этом пришлось доказать, что за- коны распределения сумм могут быть приближенно представлены соответствующими решениями дифференциального уравнения Фок- кера—Планка [12, 13]. § 1. Пусть #2> • • •> — независимые случайные величины с математическими ожида- ниями Е fo) = 0, Е (4) = 2bk, Е (| ^ I’) = dj., и пусть при этом отношения d* : bk по своей величине равномерно ограничены фиксированной постоянной dic/bk < р. ‘ (!) Из (1) в силу хорошо известного неравенства моментов Ь2 ей вы- текает, что h < н2. (2) Положим, далее, + . . . 4- = Sfc, sn = s, + b2 -f- . . . + bk = tn = T. •
16. О предельных теоремах теории вероятностей 143 Пусть Т фиксировано (а п меняется); тогда теорема Ляпунова утверждает, что ъ ^e~^ds + QR(y^ 191 < 1, (3) Р{а<5<&} =—= где Р обозначает вероятность выполнения неравенства в скобках, a R (р) стремится к нулю вместе с ц. Чтобы доказать это, рассмотрим вероятность Рк (*) = р {а < 5 ~ с тем, чтобы в предположении sk = s сумма S содержалась между а и Ь. Искомая вероятность Р {а < S < &}, очевидно, совпадает с Ро (0). Рк (s) удовлетворяет уравнению 1 Р* (s) = У Рк+1 (s + х) dT^i (х), к = 0, 1, 2, . . ., п — 1, (4) где 7\+i — функция распределения а интеграл берется от — оо до 4- оо. Кроме того, Рп (s) = 1, если а < 5 < Ь, (5) Рп (s) = 0, если s а или s Ь. Начальные условия (5) и уравнение (4) однозначно определяют Рк ($) для всех к (0 к п). Назовем Р* ($) верхней функцией, если выполнены неравенства (S) > (3 + (Д (6) р: (s) > рп (s). (?) Нетрудно проверить, что неравенство РГ (8) > Рк (8) (8) сохраняется и при Аг< п. Аналогично определяются и нижние функ- ции. Мы хотим построить теперь функцию и* (5, t), которая для каж- дого достаточно малого fx приводит к верхней функции Р: (8) = U* (8, М- (9) С этой целью сначала мы определим четырежды непрерывно диффе- ренцируемую функцию v ($), которая удовлетворяет следующим не- равенствам: v (s) = 0, 5 а — е, ОО(*)0» Ъ s Ъ + е, 0 v (s) 1, а — 8 a, v (s) — 0, Ъ 4- 8 Р (s) = 1, Ъ, (Ю) 1 Формула (4) доказывается совершение аналогично формуле для функции распределения суммы двух независимых величин; см., например: Levy Р. Calcul des probabilites. Paris, 1927, p. 187.
144 16. О предельных теоремах теории вероятностей Пусть теперь 1 и (s, t) =-----r - - л ’ 7 2 /л (Т -t) и* (5, t) — й (s, t) + 8 (Т — t). (12) При этом в (10), как и в (12), 8 > 0. Функциям (5, t) удовлетворяет (при t Т) дифференциальному уравнению du!dt = —dhblds2 (13) и ее производные до четвертого порядка по $ и второго до t ограниче- ны. Пусть М — верхняя граница этих производных. Если опреде- лить функцию Р* (5) по формуле (9), то получим Рп (з) = U* (з, Т) = й (з, Г) = V (з) > Рп (з). Таким образом, условие (7) выполнено. Поэтому достаточно доказать (6) для малых р. С этой целью рассмотрим разность Д= Р* (з) — P*+i(s + x)dTk+1(x) = &{T — tk) + U(s, tk) — е (Т £fc+i) — Й (§ 4~ £fc+l) fc+i (х) = 8 (tft+i — tft) 4“ 4- й (s, tk) — J {«(s, ^+i) + -%- w (s, ^+i) x + й (s, tk+1) £- 4- 4- I x31} dTk+1 (x) = ebk+i 4- й (s, tk) — й (s, iA+1) — — й (s, tk+1) bk+14- Q'M dk+1, (14) |0|<1, |0'|<1. Но поскольку «(s, tk) — Й (s, tk+1) = = —й (s, tk+1)(tk+1 — tk) 4- Q'M (tk+i — tk)2 = — —й (®> ^s+i) bfc+i 4- 6 "Mbk+ip?, |0"|<1, l^'Ki, то из (14) с учетом (1) и (13) следует, что Д = ebj+i 4* |—й (s, £fc+i) —й (s, £»+i)} bk+i 4- 01уЛ7Ь/г+1|л 4~ + 0wM&fc+1(A2 = ftfc+1 (8 4- eivMn + (15) 101V I < 1. Из (15) непосредственно следует, что если |Л достаточно мало, то Д > 0, v (з 4- х) Т~Ц dx, (11)
16. О предельных теоремах теории вероятностей 145 что и доказывает условие (6). Поэтому для достаточно малого ц Р* ($) является верхней функцией, и выполнено неравенство Р И < sn < 6} = Ро (0) < Р* (0) = и* (0, 0) = ъ = еТ + —4=г v (х) dx = —1= е-^т dx + Д, (16) 2^лТ J v 21Л1Г J ’ ' ' v а причем R при соответствующем выборе 8 сколь угодно мало. Рас- смотрение нижних функций дает обратное неравенство, и таким об- разом наша главная формула (3) полностью доказана. § 2. Пусть теперь a (t) и b (t) — четырежды непрерывно диффе- ренцируемые функции t, удовлетворяющие условиям a (t) < Ь (0, а (0) < 0 < b (0). (17) Спрашивается, какова вероятность Р выполнения всех неравенств a (h) < sk < Ъ (^), к = 1, 2, 3, . . ., п. (18) Неравенства 0 < t < Z, a (t) < 5 < Ъ (t) (19) определяют в плоскости (s, t) некоторую область G. Пусть и (s, t) — ограниченное решение уравнения duldt = —druids2 (13) в этой области G с граничными условиями u(s, Т) = 1, а(Т)<$<Ь(Л, и [а (t), t] = 0, 0 < t < Т9 (20) и [Ь (£), Л = 0, 0 t < Т. Наша цель — установить, что Р = и (0, 0) + 07? (н), I 0 I < 1, (21) причем 7? (р) стремится к нулю вместе с р,. Рассмотрим для этого, общее, вероятность (s) того, что нера- венства а (h) < st — S]j + s < b (ti) (22) выполнены для всех i, к i n. Искомая вероятность равна Ро (0) Если « th) <s<b (tk), kCn, (23) To Pk (s) удовлетворяет тому же уравнению рк (s) = J pk+1 (s + х) dTk+1 (х), (4)
(24) следует / (25) , (26) i 146 iq. о предельных теоремах теории вероятностей что и в § 1. Вместо условий (5) теперь появляются следующие: Рп (s) = 1, если а (Т) < s < b (Т), Рп (§) = 0, если з < а (Тк) или s > b (7\). Уравнения (4) и (24) однозначно определяют Z\- (з) для всех к (0 < к < п). Назовем теперь Р* (з) верхней функцией, если из (23) неравенство Р* (s) > f P*+i (з + «) <*П+1 («) И р* (s) > 1 для a (T)<Zs<b (Т), Рп (з) > О для з < a (Tfc) и соответственно’s > b (7\). Как и в § 1, доказывается, что при к < п остается справедливым | неравенство . I Pt (з) > рк (з). i Чтобы построить верхнюю функцию, нам потребуется функция f й (з, t), которая определяется в области G как решение дифференциального уравнения (13) со следующими граничными условиями: й(з, Т) = 1, а (Т) < з < b (Г), 4 и {a (0, 0 = v (t), 0 < t < Т, (27) й {fc (0, t} = v (t), 0<f<7, причем v (0 — четырежды непрерывно дифференцируемая функция, < которая удовлетворяет условиям v (f) = о, 0 < t < Т — е, O<v(0<l, Т — (28) = v' (Т) = V (Т) = 0. Поскольку й (s, t) (в том числе и на границе G) имеет непрерывные >1 производные до четвертого порядка, то можно так продолжить эту .| функцию вне G, что производные по з до четвертого порядка останут- i ся ограниченными во всей плоскости (з, t) и всюду | й (з, 0 > - 8. (29) J Теперь положим j и* (з, 0 = й (з, t) 4- е + е (Т — 0, (30) * Pt (з) = «* (з, 0). (9) |
16, О предельных теоремах теории вероятностей 147 Доказательство того, что Р* (s) для каждого достаточно малого и, является верхней функцией, остается, если не считать очевидных изменений, тем же, что и в § 1. Таким образом для указанных р по- лучаются неравенства Р = Ро (0) < Р* (0) = и* (0, 0). и* (0, 0) стремится к и (0, 0) при е 0. Для завершения доказатель- ства формулы (21) остается провести в целом аналогичные оценки ве- роятности Р снизу, что достигается с помощью того же метода для нижних функций. § 3. Пусть теперь Р;1) и соответственно Р^ обозначают вероят- ность существования такого к, что a (tt) CSfCb (tt), и соответственно a (tt) <st< Ь (tt), i = 1, 2, . . ., к - 1, i = 1, 2, . . ., к - 1, (31) (32) b (h) < sfc, и наконец, P (ж, у) — вероятность того, что выполнены все неравен- ства • a (£fc) < зк < b (tit), к — 1, 2, 3, . . ., n — 1, (33) x < sn < у, причем a (T) < x < у b (T). Тогда выполнены предельные соотношения p(D = W(D (о, о) + &»r& (p), । o<x> । < i, P(2) = (0, 0) + (p), | 0<a> | < 1, p (x, y) = uXty (0, 0) 4- 6R (p), I 0 К 1, (34) (35) (36) причем Я'1) (p), R2> (p) и R (p) стремятся к нулю вместе с р и u(1) (s, t), (s, t) и мж,„ (s, t) ~ ограниченные решения дифференциального уравнения (13), кото- рые определены с помощью следующих граничных условий: u(i) (S, Т) = о, а < s < Ь, “(1> {« (0» 0 = 1» 0 < t < Т, (37) U(1) {b (t), 0 = 0, о < t < т, и<2) (з, Т) = 0, а < $ < Ъ, . п<2) {а (0, 0 = 0, 0 < t < Т, и(2> {5 (0, 0 = 1» 0<г<Т, (38)
148 16. О предельных теоремах теории вероятностей их, у (S9 Т) О, их, у = их,у (s>?) = О, а < 5 < х, xCsCy, у <^s<^b, их,у {& (О> О О» О < * <С Т, их, у {Ъ (О» О = О, О < t < Т. (39) Доказательство остается тем же, что и в § 2. В моей вышеупомяну- той работе [9] для этих же величин и(1) (0, 0), и(2) (0, 0) и их,у (0, 0) получены другие выражения 2 * *. Днепропетровск, 8 июня 1932 г. ЛИТЕРАТУРА 1. Laplace Р. Theorie analytique des probabilite. 3 ed. Paris, 1886. 2. Tchebycheff P. L. Sur deux theoremes relatifs aux probabilites.— Oeuvres de Tchebycheff. St.-Petersb., 1907, vol. 2, p. 481—491. 3. Марков А. А. Закон больших чисел и метод наименьших квадратов.— Изв. физ.-мат. о-ва при Казан, ун-те, 1898, т. 8. 4. Liapounoff А. М; Sur une proposition de la theorie des probabilites.— Bull. Acad. sci. St.-Petersb., 1900, vol. 13, p. 359; Nouvelle forme du theoreme sur la limite de probabilite.— Mem. Acad, sci., St.-Petersb., 1901, vol. 12, N 5. 5. Марков А. А. Распространение предельных теорем исчисления вероятностей на сумму величин, связанных в цепь.— Зап. Акад, наук, 1910, т. 22. 6. Бернштейн С. Н. Распространение предельной теоремы теории вероятнос- тей на суммы зависимых величин.— УМН, 1944, вып. 10, с.65—114 (рус. пер. из: Math. Ann., 1926, Bd. 97, S. 1—59). 7. Poisson S.-D. Recherches sur la probabilite... Paris, 1837. 8. Levy P. Nuove formule relative al giuoco di testa e croce.— G. 1st. ital. attuar., 1931, vol. 2, p. 3. 9 Kolmogoroff A. N. Eine Verallgemeinerung des Laplace—Liapounoffschen Satzes.— Изв. АН СССР, OMEH, 1931, c. 959—962. 10. Luneburg R. Das Problem der Irrfahrt.— Math. Ann., 1931, Bd. 104, S. 700. 11. Courant RFriedrichs K.,Lewy H. Uber die partiellen Differenzengleichungen.— Math. Ann., 1928, Bd. 100, S. 32-74. 12. Fokker 4.—Ann. Phys., 1914, Bd. 43, S. 812. 13. Plank M.— Sitzungsber. Preuss. Akad. Wiss., 1917, 10. Mai. 14. Kolmogoroff A. N.— Math. Ann., 1931, Bd. 104, S. 415, особенно § 12—14. 2 В моих упомянутых работах [9] и [14] не предполагается многократная диф- ференцируемость a (t) и b (£). Если a (t) и b (t) только один раз непрерывно диф- ференцируемы, то для доказательства пришлось бы в этом случае приблизить функции четырежды непрерывно дифференцируемыми. Стремление к нулю остат- ков в формулах (3), (21), (34) — (36) равномерно по Г, когда Т больше фикси- рованной постоянной, доказывается без труда, если умножить случайную вели- чину на То : Т и таким образом свести случай произвольного Т к случаю = TQ. Дальнейшее простое исследование показывает, что в формулах (34) и (35) остатки стремятся к нулю вместе с ц и без условия Т > То.
17. К теории непрерывных случайных процессов 149 17 К ТЕОРИИ НЕПРЕРЫВНЫХ СЛУЧАЙНЫХ ПРОЦЕССОВ* Пусть в — физическая система с п степенями свободы; это зна- чит, что допустимые состояния х системы в образуют риманово мно- гообразие Ж размерности п. Процесс изменения системы ® называ- ется стохастически определенным, если при произвольном выборе состояния х, области @ (в 9?) и моментов времени t' и t" (f < t") определена вероятность Р (tf, х, t", @) того, что в предположении со- стояния х в момент времени t' в момент времени t” имеет место одно из состояний из Дальше предполагается, что вероятность Р (t', х, t", 6) может быть представлена формулой р (t', х, г,«)=J / (f, х, г, y)dvy, (1) где dVy обозначает элемент объема. Функция / (t', х, t", у) при этом должна удовлетворять следующим фундаментальным уравнениям: $ f(t',x,f,y)dVy = l, (2) ft f (Zi, x, /3, y)=\ f (h, x, t2, z) f z, t9, y) dV z, tr < t* < t2. (3) ft' Интегральное уравнение (3) было исследовано Смолуховским и затем некоторыми другими авторами х. В работе «Uber die analy- tischen Methoden in der Wahrscheinlichkeitsrechnung» * 1 2 я доказал при определенных дополнительных условиях, что функция / (t', х, t”, у) удовлетворяет определенным дифференциальным уравнениям пара- болического типа 3. Но в А. М. изложение проводилось полностью только для одномерного случая. Кроме того, в А. М. не был дан от- вет на вопрос 4, в какой степени функция / (f, х, t", у) однозначно определяется коэффициентами A (t, х) и В (t, х). В данной работе * Zur Theorie der stetigen zufalligen Prozesse.— Math. Ann., 1933, Bd. 108 S. 149—160. Перевод П, Дитриха (ГДР). 1 См. библиографию: Hostinsky В. Methodes generates du calcul des probabi- htes.— Mem. sci. math., 1931, fasc. 52. 2 Math. Ann., 1931, Bd. 104, S. 415—458. Дальше цитируется как A. M. (см. Ко 9 наст. изд.). 3 Эти дифференциальные уравнения вводились. Фоккером и Планком неза- висимо от интегрального уравнения Смолуховского. См.: Fokker A.— Ann. yhys., 1914, Bd. 43, S. 812; Planck M.— Sitzungsber. Preuss. Akad. Wiss., 1917, Ю. Mai. 4 См. A. M., § 15.
150 17. К теории непрерывных случайных процессов теория развивается в общем случае риманова многообразия Э1 и во- прос единственности решается положительно в случае замкнутого многообразия Э1. § 1 ПЕРВОЕ ДИФФЕРЕНЦИАЛЬНОЕ УРАВНЕНИЕ Итак, пусть 91 — риманово многообразие размерности п. Функ- ция / (t', х, t", у) в силу ранее сделанных предположений определена для f < f и любой пары точек х, у. Предполагается, кроме того, что / х, t", у) имеет непрерывные производные до третьего порядка по всем аргументам (£', f и координатам хъ хй, . . ., хп, ylt Уг, . . . . . ., уп точек х и у) и удовлетворяет условию непрерывности f \t, х, t -J- Д, z) р8 (x, z) dVx -I-------------------------->0, Д->0, (4) : \ f (i, z) P3 z) ft где p (x, z) обозначает геодезическое расстояние 6 между xzz. Пусть в окрестности 91 точки х выбрана система координат z ~ = (%, . . zn). Мы тогда положим 5 f (s, х, s + Д, z) (z* — Xi) dVz = az (s, x, Д), (5) Л я 5 / (s, x, s + Д, z)(Zj — — Xj) dVz = bij (s, ж, Д), (6) : a . § / (s, x, s + Д, z) p2 (x, z) dVz = P ($, x, Д), (7) 91 f(s, x. s + Д, z)p3(#, z)dVz = v (5, x, Д)» (8) st Наша цель — доказать, что отношения at (s, х, &)/&, bu (s, x, Д)/Д при Д -> 0 стремятся к независимым от окрестности 91 пределам At (5, х) и Bij (s, х). Это в дальнейшем доказывается в предположе- нии, что все N = п + п (п + 1)/2 функций -^/^,Х^,У), -^-f(s,x,t,y) от у и t (при фиксированных 5 и х) линейно независимы, т. е* что tv ylt t2, у2, . . ., t]c, УЪ, . . ., tN, yN можно выбрать так, чтобы | 5 См. А. М., § 13, формула (112).
17, К теории непрерывных случайных процессов 151 определитель ($, х) — (9) * J был отличен от нуля* 6. В окрестности 51 имеем р2 (х, z) = 2gl7 (гг — Xi) (z} — Xj) + 0p3 (x, z), | 0 ! < C, а вне окрестности 51 очевидным образом имеет место р2 (х, z) = 0'р3 (х, z), | 0' | < С', где С, как и С,— константа, не зависящая от г. Следовательно, имеет место Р (s, х, Д) = § / ($, х, s + A, z) р2 (г, z) dVz = я = 3 ёи $ f (s, x, s 4- A, z^Zi — xi\Zj — Xj) dVz + SI + 5 f (5, 5 + A,z) ®P3 (x>2) dVz + si + s A, z) ®zp3(^, ^)dVz = = S gifri <s> д) + (s, X, A), 10” I < C. (10) Но так как по условию непрерывности (4) £(s, А) д 0 (П) из (10) вытекает соотношение Мы теперь рассмотрим при фиксированных х, s, т, t, s <Z т < t только настолько малые А, чтобы было $ + А < т. Тогда функция / ($ + A, z, t, у) и ее производные по z до четвертого порядка в ок- рестности 9( равномерно ограничены и непрерывны (предполагается, 6 См. А. М., .§ 13, определитель (119).
152 17. К теории непрерывных случайных процессов что 91 компактно). Следовательно, для любой точки z из 91 имеет место / ($ + Д, z, t, у) — / ($ + Д, х, t,у) = У (Zi — Xi) f (s + д, х, t, у) + + 4- У. & — ~ xi> ~д^7 / (s + д’ ж> z> у) + + ©р3(х, Z), I ©|<с, (13) где константа С не зависит от Д и z. С другой стороны, из фундамен- тального уравнения (3) следует равенство /($, x,t,y) = ^ /($,#,$ +Д, z)f(s + &,z,t, y)dVz = st = / (^, x. s + Д, z) f (s + Д, x, t, y) dVz + ft, + 5 f(s,x, s + Д, z) {f(s + Д, z, t,y)—f(s + Д, X, t, y)} dVz + + §/($, x, s + Д, z) {f(s + Д, z, t,y) — f(s + Д, X, t, y)} dVz = 91-21 = Zi +/з +/з- (14) Ho (2) Ii = / (s, x, s + A, z) f (s + Д, x, t, y) dVz — 9t = f(s + Д, x, t, y) J f(s, x. s + Д, z)dVz = f(s + Д, x, t, y). (15) Далее, из (13), (5) и (6) следует /2= /(^, х, s + Д, z){f(s + Д, z, t, у) — f(s + Д, х, t, y)}dVi~ % = /(s, х, s + Д, z){У,(Zi — Xi)-^-f(s + A, x, t, у) + 21 1 + 4" У, (Zi — X№i — xi) д^дх. f (s + Д’ y) + + ©p3 (x, z)j dVz = ^\ii (s, x, Д) / (s + Д, x, t, y) 4- + 4" У <s’x'Д) f (s + Д’ + + f(s, x,s + Д, z) ©р3(ж, z) dVz. (16) ’4
17. К теории непрерывных случайных процессов 153 Наконец, так как в SR — 31 всюду р3 z) А" > О, где К не зависит от и, то в Э? — 31 можно положить / (з + Д, Z, t, у) — / ($ + Д, X, t, у) = 0'р3 (х, z). Тогда имеет место /з = § / (s. я,5 •+• д.z) {/ (з 4- Д, Z, t,y) — f(s + Д, X, t, у)} dVz = = § f(s,x,s + S,z)e'ps(x,z)dVz, 10' I < C' = . (17) После подстановки (15)—(17) в уравнение (14) получается, наконец, /(з, х, t,y) = f(s + Д, X, t,y) + ^ai(s, X, Д) ~^f(s + Д, х, t, у) 4- + 4" У. ЪИ х' ^~дх.дх. + Д’ х’у>) + + J/(s,^,s + A,z)0"p3(j;,z)d7z,. |0"|<С". (18) я Если учесть еще очевидное равенство $ f (s, X, s + Д, z) 0"р3 (х, z) dVz = 0'" $ / (5, х, s + ^z) р3 (х, z) dVx = я % = е"у(8,х,&), |0",|<С'", то соотношению (18) можно придать следующий вид: л_ f (! + д,s) _ + <«) Левая часть в (19) при Д ~>0 стремится к (s, х, t, у). Пусть для t19 уъ t2, у2,. . tN, yN определитель DN (5, х) отличен от нуля. Тогда при достаточно малом Д также и DN (s + А» х) =/= О* Следовательно, можно найти такие (А), = 1, 2, . . ., 7V, чтобы было У Ч (Д) t (з 4- д, X, tk, Ук) = ait V (20) 2 , h (Д) -^7- / (« 4- Д, х, tk, yk) = ai}. к г 3
154 17. К теории непрерывных случайных процессов Если уравнение (19) для t = t* и у = ук умножить на (Д) и все N возникающих таким образом равенств сложить, получится Д у (Д) f Cs + A,*- tk, ук) - Цз, х, tk, Ук) = к “i <s>*’ Л) VI Ь.^з,х,Ь) .v(s<x^} Д / ; аИ 2Д °* Д i, 3 К dx.dx- (21) Если Д стремится к нулю, величины (Д) как решения уравнений (20) стремятся к решению к* (0) уравнений У h (0) / («, х, h, Ун) = “i, У ж- **’ = а^ к г 3 Левая часть (21) имеет, следовательно, при Д -> 0 конечный предел Ао = У, h (0)-§7 f (s>х' (23) 5 В частности, если положить = 0, = gi7-, то получается J Василу ранее доказанного соотношения (12) второй член в (24) бес- конечно мал по сравнению с первым (так как (Д) остаются огра- ниченными). Следовательно, имеем ($» я, Д)/2Д —> Ар, № (25) Но из (25) и (12) следует v ($, х, Д)/Д -> 0, Д -> 0. (26) Если сейчас в (21) все коэффициенты аг и а^-, кроме одного, поло- жить равными нулю, то путем аналогичного предельного перехода j с использованием (26) получается, что все*пределы Ai(s, х) = lim—г,- ’д-—~, Д —> 0, (27) . (s, х) = lim гз -д 1—-, Д -г-> 0, (28) <
17. К теории непрерывных случайных процессов 155 существуют и не зависят от выбора 7 окрестности 5L Из (27), (28), (26) и (19) уже непосредственно следует первое дифференциальное уравнение X, = — x)-^f(s,X,t,y') — ~^в^,х)-^-^8,х^,у). <29) Условие, что Dy (s, х) не обращается тождественно в нуль, можно, конечно, заменить прямым требованием существования пределов (27) и (28), так как из (28) следует существование конечного предела (25) и тем самым соотношение (26). То, что в некоторых исключительных точках пределы (27) и (28) могут не существовать, в А. М. было показано 8 следующим приме- ром: 9? — обычная числовая прямая, и ,, . . Зи2 Г (У3 — •cS)2 1 /ол\ / ($, ж> t, У) = —г охр —-7~п—\ > (30) м ’ ,г" 2]Лл(«-5) f L J 7 для х = 0 легко получаем b (s, х, Д)/2Д ->-|-оо, Д -> О, так что конечный предел В ($, х) не существует. §2 ВТОРОЕ ДИФФЕРЕНЦИАЛЬНОЕ УРАВНЕНИЕ Теперь мы предположим, что в окрестности 91 точки уй при за- данном t пределы Лг (t, у) и у) существуют равномерно и что v (t, у, &)/&. в 91 равномерно стремится к нулю. Пусть еще В (у) — обращающаяся в нуль вне 91 неотрицательная функция с ограни- ченными производными до третьего порядка. Тогда для у е 91, z G= 91 имеем В (у) = В (2) + £ (Vi - Zi) R (z) + + ~ У (Vi 2д(Уз zi) dz^dz. (Z) . + &p3(y,z), |©'|<С", (31) тогда как для у — 91 и г ее 91 Я (у) = в (2) + ©"р3 (у, г), | ©" | < С"; (32) наконец, для у ЕЕ Э? — z 5R — 51 имеет место в (у) = о. (33) 7 См. А. М., § 13, формулы (122)—(124). 8 См. А. М., § 13, формула (126).
156 17. К теории непрерывных случайных процессов Если в соответствующих областях R (у) заменить выражениями (31)—(33), получкм $ х’ y)dVv = = ^\П^^х^У)Жу = -^\^УМ{з, х’ *’ y)dVy = ад з1 = lim-i- jj R (у) [f(s, x,t + ^,y) — f (s, х, t, у)] dVy = ft = R (y) jj f(s, x, t, z)f(t, z,t + Д, y)dVzdVy — » st — ^R(y)f(s,x,t,y)dVy} = %, = f(s, x, t, z) ^R(y)f(t, z,t + &, y)dVydVz — st » — jj R (z) f (s, x, t, z) dVz] = ft = f(s, x, t, z) R(z)f(t, z,t-\-&, y)dVydVz + a st + jj f(s,x,t, z) J Г У (Vi — Zi)-^R(z) + a a ’ ‘ + 4" £ (У1 ~ zi^i ~ ZJ) R&]f 2’f + Д> У)dVv dV^ + f(s, x, t, z) jj 0'"р3(г/, z)/(Z, z, t + Д, y)dVy dVz — ад ft — R(z)f(s, x, t, z)dVzj= Я5’ж’ z)R(z)dVz + a a + jj/(s, x, t, з)[^а4(М, Д)-^-Я(г) + + © jj f (s, x, t, z) v (t, z, Д) dVz — jj / (s, x, t, z) R (z) dV^ = a a = jj/ (s, x, t, z) Г У Ai (t, z) R (z) + a 1
17. К теории непрерывных случайных процессов 157 После замены в правой части этого уравнения z на у получается формула ( R (y)-^f(s, x,t,y)dVv=^f(s, х, t,y) Ai(t, y)J_R(y) + я и 4 + <34>- Теперь пусть предполагается, что At (t, z) и Bi} (t, z) два раза непрерывно дифференцируемы в Й. Мы тогда обозначим <2 (I, У) = I gti (t, У) I и получим после интегрирования по частям x,t,y)Ai(t, y)-^-R(y)dVy = Я г . , = V (8, X, t,y) Ai(t, у) Q (t, yj-j^R (у) dyi dy2... dyn = 21 4 1 = — § -5^- [/ (3, X, t, y) Ai (t, y) Q (t, y)] R (y) dyi dyz... dyn. (35} 21 1 Двукратное интегрирование по частям дает (так как все производные на краю 91 исчезнут) ( / (s, х, t, у) Bij (t, у) R (у) dVy = я г 3 = $ дудгду: If (з, Л у) В a (t, у) Q (t, г/)] R (у) dyi dyz... dyn. (36) я г 3 Из (34)—(36) сразу следует (У) Q (Л y)-^f (з, х, t, у) dyi dy2... dyn = = $ R (У) {- £ -^7 [ A i (t, y) Q (t, y) f (s, X, t, y)] + я ’ + У, [Вц (t,y)Q (t, y) f (s, X, t, y)]} dyi dyz... dyn. Так как R (y)9 кроме упомянутых выше условий, произвольно, от- сюда легко можно заключить, что для внутренних точек 91 справед- ливо и второе дифференциальное уравнение Q(t,y)-^f (3, X, t, у) = — [Ai(t, у) Q (t, у) f (s, х, t, у)] + + У^-^-[5ь(Лг/)<2(^у)/(з,ж,Лу)]. (37).
158 17, К теории непрерывных случайных процессов Если для момента времени t0 задана дифференциальная функция распределения вероятностей, т. е. неотрицательная функция g Go? У) от У> удовлетворяющая условию $\ g(to, y)dVv = 1, (38) то функция распределения g (£, у) для произвольного t > t0 дается формулой g (*, у) = $ g (А>, х) f (to, х, t, у) dVx. (39) i Функция g (t, у) при этом удовлетворяет уравнению 9 (40) ’ § 3 ЕДИНСТВЕННОСТЬ При замене системы координат коэффициенты At ($, х) и В^ (s, х) преобразуются следующим образом: <«>) <«>• Принтом всегда Вц = lim Ьгг^2\ А) = Нт~ f(s, х, s + Д;з)(^ — ^)2dVz> О, (43) «следовательно, квадратичная форма (44) неотрицательна. Этот факт — решающий для доказательства еле- | дующей теоремы 10. Теорема единственности!. Если 91 замкнуто, то уравнение (40) имеет не более одного решения g (t, у) с заданным не- прерывным начальным условием g (tQ, у) — g (у). 9 См. А. М., § 18, формулы (169) и (170). 10 См.: RotheЕ. Ober die Warmeleitungsgleichung. — Math. Ann., 1931, Bd. 5. 353—354 (доказательство единственности).
17. К теории непрерывных случайных процессов 159 Доказательство. Очевидно, достаточно рассмотреть на- чальное условие g (t0, у) = 0 и доказать, что тогда g (t, у) и для t > у, t0 равняется нулю. Уравнение (40) можно преобразовать к виду = У Bi} + У St + Tg. (45) dt Z-J 3 dy^Vj Zj dyi ' ° ' 7 Теперь положим v (t, у) = g (t, у) e~ct. функция v (t, у) удовлетворяет уравнению ~ = У Bij +У Si-^- + Tv-cv. (46) dt гз ду^у. 1 дУг При фиксированных t0 и tr константа с может быть выбрана настоль- ко большой, чтобы было Т (*, у) - с < О для всех у и При этих условиях функция и (£, у) ни в какой точке (£, у), tQ < t < не может иметь положительного мак- симума, так как в таком максимуме было бы -g- = o, -^ = 0, У^-^У^<0, (T-c)v<0, dt 1 dyt Z-J v ду.ду. \ ’ что противоречит уравнению (46). Внутри данных границ также не- возможен и отрицательный минимум и (£, у). Так как при 7 == V Оо, у) = 0, то, следовательно, мы получаем для tQ <Z t < tx V (t, у) < max V (tu y) = e~ci* max g (tu y), g (t, y) <е~с^ max g (t19 y). Так как с было произвольно большим, отсюда следует, что g(t, у) = 0. Теорема единственности II. Пусть SR замкнуто} тогда существует не больше одного неотрицательного непрерывного* решения / (5, х, t, у) уравнений (2) и (3), которое удовлетворяет урав- нению (29) с заданными два раза непрерывно дифференцируемыми, коэффициентами Лг- (£, у) и Вц (t, у) и условию непрерывности (4). ' Условие непрерывности (4) может быть заменено следующим, более слабым: 5 f(stx,t,y)p2(x,y)dVy-^0, t—>s. (47} st Доказательство. Предположим, что две различные функ- ции Д (5, х, t, у) и /2 ($, х, t, у) удовлетворяют всем нашим условиям.
160 77. 7Ь теории непрерывных случайных процессов Тогда можно было бы выбрать 5 и такую непрерывную функцию g (х), чтобы функции gi (*, У) = $ g (*) Л (5, х, t, у) dVx, gz (t, «/)==$ g (я) /2 ($, x, t, y) dVx 5t также были различными. В силу условий (2) и (47) (£, у) и g2 (£, у) лри t s стремятся к g (у). Так как функции gr (t, y)ng2(t,y) удовлетворяют уравнению (40), это противоречит первой теореме единственности. § 4 I ОДИН ПРИМЕР Следующий интересный и для приложений пример показывает, что квадратичная форма (44) не обязательно должна быть положи- тельно определенной: Э? — обычная евклидова плоскость, и | £/ . , ч 21/^3 f (vi — #i)2 / (s, an, x3, t, yi, y2) = exp I - - I 3 [^2 — ^2 — (t—s)(yl-]~x2)/2]2] /zq\ 7i (t - s)3 J • f Легко вычисляется, что 5ц — 1, S12 = 0, В22 = 0, А± = 0, Л2 (5, х) — xv § 5 ПРЕДЕЛЬНОЕ РЕШЕНИЕ Пусть 91 замкнуто, а / (5, х, t, у) всюду положительна и зависит только от разности t — $: f (s, X, t, у) = ф (t — s, x, у). (49) Тогда уже из общих эргодических теорем 11 следует существование предельного распределения вероятностей. Другими словами, для любого распределения g {t, у), определенного равенствами (38) и (39), и любой области @ имеет место соотношение ^g(t,y)dVy-->P(®), t-^ + oo, (50) где Р (@) не зависит от выбора функции g (£0, у). Легко доказывает* ? 11 См. А. М , § 4, теорема IV.
18. К вопросу о пригодности найденных формул прогноза 161 ся, что g (i, у) при больших t равномерно непрерывно. Из этого дела- ется вывод, что 18 P(<S) = -$g(y)drv, (51> И g (t, y)-^g (у)> t -> -ь оо. (52) При этом, очевидно, функция g (у), так же как и Р (@), не зависит от g (t0, У)- Пусть теперь g (у) — решение уравнений - Л [А{(у) Q (у) g (р)1 + £ [Ву (у) Q (у) g(y)] = О, (53) g(y)<Wy = i. (53а) 91 Если положить g (£0, у) = g (у), то легко убедиться в том, что и для t > t0 остается g (t, у) = g (у) (см. уравнение (40) и теорему единст- венности I). Из этого делается вывод, что решение уравнений (53) и (53а) (если оно вообще существует) определено однозначно и совпада- ет с предельной функцией g (у). Из (52) следует как частный случай / fc, X, t,y)-+g (у), t -+ + ОО. (54) Клязьма под Москвой,- 12 апреля 1932 г. 18 К ВОПРОСУ О ПРИГОДНОСТИ НАЙДЕННЫХ СТАТИСТИЧЕСКИМ ПУТЕМ ФОРМУЛ ПРОГНОЗА * § 1. Рядом авторов (Экснером, Бауром, Визе) делались попытки посредством статистического анализа данных за прошедшие 30— 50 лет получить формулы, связывающие уклонение Ду того или иного метеорологического фактора у, подлежащего предсказанию, от его многолетнего среднего у с аналогичными уклонениями Дхи &хк ряда факторов, которые могут быть определены за- ранее. При этом пока употреблялись лишь линейные формулы Ду == ^Д#! + а2&х2 + . . , + а&Дл*. (1) Надлежащим подбором факторов х19 х2, . . ., х^ в числе от трех- четырех до семи и коэффициентов аи а2, . . ., а* во многих случаях 12 См.: Hostinsky В. Methodes generales..., § 36. * Жури, геофиз., 1933, т. 3, с. 78—82. А. Н. Колмогоров
162 18» К вопросу о пригодности найденных формул прогноза удается достигнуть того, что коэффициент корреляции между факти- чески наблюдающимся значением Ду и его значением, вычисленным по формуле (1), вычисленный на основании ’ данных за те же 30— 50 лет, которые служили для построения формулы, достигает 0,60— 0,75. Однако в тех случаях, когда была произведена проверка форму- лы на основе наблюдений за годы, не входящие в число тех, которые послужили для вывода формулы (Визе), коэффициент корреляции между вычисленными и наблюденными значениями Ду оказался рав- ным 0,30—0,40. Между тем коэффициент корреляции 0,30—0,40 уже не имеет практической ценности, тем более что предсказания этой степени надежности можно получить значительно более простым пу- тем. Теория получения уравнений регрессии типа (1) основывается на следующих допущениях. Предполагается, что у, xi, х2, . . хк суть случайные величины, имеющие определенный, не меняющийся из года в год закон распределения w (у, х2, . . ., хк). Предпола- гается далее, что вероятности тех или иных значений у, х±, х2, . . . ? . . .*хк на данный год не зависят от значений, принятых этими вели- чинами в предшествующие годы. Без первого условия (устойчивости) задача установления уравнения регрессии вообще не имеет опреде- ленного смысла. Если это первое условие выполнено, то существуют ; определенные коэффициенты а2, . . ., ак, обращающие математи- А ческое ожидание v Е (и2) = Е (Ду — ai&xx — а2Дж2 — . . . —^Д^)2 в минимум. Отношение | . Е(ДуЗ)-Е(иа) 3 Е(ДЯ называется истинным коэффициентом корреляции. Второе условие (независимости) существенно для доказательства того, что коэффи- циенты а2, . . ., вычисленного на основе наблюдений за доста- точно большое число лет п эмпирического уравнения регрессии (1) будут близки к теоретическим коэффициентам ai, а2, . . ., а эм- пирический коэффициент корреляции R также при достаточно боль- шом п будет близок к теоретическому б. Применимость двух указанных выше условий к метеорологиче- i ским явлениям, естественно, может подвергаться сомнениям. Более того, если считать существование вековых, или периодических мно- f голетних, колебаний климата установленным, то уже первое условие < заведомо неверно. Именно этим обстоятельством и склонны объяснять указанное в начале статьи расхождение: предполагают, что урав- нение регрессии (1) действительно с большой точностью отражает закономерности, действовавшие в течение изученного периода, но что эти закономерности сами претерпевают изменения в связи с дли- тельными колебаниями климата. Я предполагаю доказать, что по- явление чрезмерно высоких эмпирических коэффициентов корреля-
18. К вопросу о пригодности найденных формул прогноза 163 дии вполне объяснимо и в предположении полной устойчивости и независимости изучаемых факторов от года к году, иначе говоря^ нто при употребляемых указанными исследователями методах не- избежно своеобразное «вздувание» коэффициентов корреляции. Этому посвящен § 2. В § 3 разбирается вопрос о том, является ли устойчивость и независимость в метеорологических рядах достаточ- ной для того, чтобы статистическое определение уравнений регрес- сии было возможным и целесообразным; в § 4 даются некоторые со- ображения о приемах отыскания уравнений регрессии. § Математический - аппарат, нужный для решения стоящей перед нами задачи, создан сравнительно недавно Фишером [1] в его исследованиях о законе распределения для коэффициента корреля- ции при множественной корреляции (см. также обзорную статью Райдера [2]). При этом предполагается, что закон распределения w (z/, #i, #2, • • •, %к) нормален. Пусть имеется уравнение регрессии для некоторой величины у. Допустим, что у связано с величинами х^ х2, . . хк так, что истин- ный коэффициент корреляции равен 6. Исследования Фишера дают возможность вычислить по 6 и числу наблюдений (числу лет, данные за которые предполагается использовать) п закон распределения для эмпирического коэффициента корреляции R. Однако непосред- ственно этот закон распределения еще не дает ответа на стоящий перед нами вопрос. В самом деле, самый выбор величин ^i, х2, . . . . . хх совершается так, чтобы коэффициент корреляции б оказался возможно большим; при этом, хотя в уравнение регрессии и не вводится более 5—7 величин, запас величин, из которых эти 5—7 могут быть выбраны, очень велик. Предположим поэтому, что имеется i групп величин х(У> Х,(2) ж!,I 2) т{2) » •*'2 > • • ^к , I ^2 ? из Л величин каждая. Для простоты допустим, что у связано с каж- дой из этих групп величин с истинным коэффициентом корреляции б. Для любого Л формулы Фишера позволяют вычислить вероятность того, что в каждом отдельном случае эмпирический коэффициент корреляции R превзойдет %. Пусть эта вероятность будет р. Естест- венно допустить, что с вероятностью Р = I _ (1 _ ру (2) неравенство R % осуществится хотя бы для одной из групп: так будет в предположении независимости уклонений R от б, соот- 6*
164 18. К вопросу о пригодности найденных формул прогноза ветствующих различным группам х. Если, например, i = 14 и р = 1/20, то р = 1 _ (1 _ i/20)i4 ~ i/2. Значения %, соответствующие р = 1/20 при данных 6, к и 7?, могут быть вычислены при помощи таблиц, приведенных у Фишера. Для этого надо положить т = п^к — 1, £ = arc th 6, • найти по р и иг по таблицам Фишера 2 соответствующие В и, наконец, *.• отыскать X по формуле В = Ут arcth %. Положим для примера п = 42 и к = 5. Тогда после надлежащих вычислений найдем: б 0,20 0,30 0,40 0,50 ; к 0,56 0,61 0,66 0,72 Непосредственное значение полученных результатов таково: < вычисляя по 42 наблюдениям пятичленную формулу регрессии, мы при 6 = 0,20; 0,30; 0,40; 0,50 в одной двадцатой доле случаев полу- J чим R, превышающее соответствующее %. Если же из 14 формул регрессии будет выбираться та, у которой коэффициент В наибольший, то R превзойдет вычисленные нами зна- чения Л уже с вероятностью, превышающей 1/2. * В заключение укажем на общие формулы Фишера. Вероятность ; того, что R2 будет заключаться между v и v + dv по Фишеру равна ,, _ р/г о»+*-i)]i (1 - a*),/»<w+fc) 1 ~ Р/а (т - 2)]! р/а (к - 3)]! л Л X С ------------------ dv=z У ’ J Л (ch* - 6Я COS <p)m+k __ P/2 (>» + & — 2)]! v P/a (m — 2)]! p/a(A — 2)]!U > . X F [4-(™ + *). 4"<W + *)» 4"*’ S2p] где E (p, q, г, x) обозначает гипергеометрическую функцию. Эти вы- ражения могут быть упрощены в частных случаях и заменены асим- птотическими по иг, но даже и после упрощений они остаются доста- точно сложными, чтобы сделать их непосредственное употребление затруднительным. 1 Сделанное допущение достаточно произвольно, однако в действительности число групп, из которых может быть сделан выбор, должно быть еще болыпе, чем принятое в примерных расчетах i = 14; этим, надо думать, искупается * произвольность нашего допущения. 2 Таблицы на с. 665 работы [1].
18. К вопросу о пригодности найденных формул прогноза 165 § 3. Установленный факт «вздувания» коэффициента корреля- ции сам по себе не вызывает необходимости отказаться от пользова- ния найденными статистически формулами регрессии. Необхо- димо только по возможности ограничить число к величин, входящих в уравнения регрессии, а также запас тех величин, из которых они будут выбираться; в этом случае опасность получить искусственно вздутый коэффициент корреляции может быть значительно умень- шена. Более существенно для оценки дальнейших перспектив статисти- ческого установления прогностических уравнений выяснить, в ка- кой мере метеорологические ряды могут быть признаны удовлетворя- ющими условиям устойчивости и независимости. Самое наличие ве- ковых изменений, или периодических колебаний, еще не заставляет отказаться от исследований, исходящих из предположений устой- чивости и независимости, если роль этих вековых, или периодических, колебаний в образовании уклонений Ду, Д^, Дх2, . . ., Д^ незначи- тельна. Наиболее простым методом проверки устойчивости ряда и неза- висимости его членов является следующий. Пусть Ду<*> есть значение уклонения Ду за i-й год. Следует вычислить за длительный промежу- ток из п лет коэффициенты корреляции между ДуО> и Ду<г‘+1>, между ДуО> и Ду^’+2) и т. д. Если эти коэффициенты корреляции уклоняются от нуля в пределах, соответствующих теоретическим расчетам, сделанным при гипотезе независимости и устойчивости, то это подтверждает на- званную гипотезу. В самом деле, вековое изменение, или периоди- ческое колебание с периодом в четыре года и больше, неизбежно влечет за собой положительную корреляцию между Ду(<) и Ay(i+4). Короткие же колебания в два или три года приведут к положитель- ной корреляции между Ду^ и Ду<*+2> или Ду<^ и Ду(<+8>. В случае устойчивости и независимости математическое ожидание квадрата каждого из рассматриваемых коэффициентов корреляции равно (при не слишком малых п) приблизительно 1/(п — 3). Соответствующие вычисления были произведены для средних месячных температур в Ленинграде. Для каждого месяца были вы- числены коэффициенты корреляции между Ду**) и ДуО+1), Д/*+2> и Ду(г+3> на основании данных за сто лет. Среднеквадратичные этих трех коэффициентов корреляции по двенадцати месяцам оказались рав- ными 0,065, 0,064 и 0,110, что хорошо соответствует теоретическому значению 1/|ЛГ=“3 = 1/^97 = 0,102. Пусть теперь рассматриваются два ряда у& и Если у связа- Но с х положительной корреляцией, то произведение &у&х имеет положительное математическое ожидание. Для изучения устойчи- вости корреляционной связи между у& и х^ следует образовать коэффициенты корреляции между Дг/(г> — и Дя<<+1> — Ду<<+1\ Дх<г+2) _ д^(г+2) и т. д. В случае устойчивости двойного ряда и неза-
166 18, К вопросу о пригодности найденных формул прогноза висимости пар у<% х^\ относящихся к различным годам, квадрат этого коэффициента корреляции имеет математическое ожидание, равное, как и в первом случае, 1/(м — 3). Таким способом была изу- чена устойчивость связи между средними температурами соседних месяцев в Ленинграде (как известно, между ними имеется значитель- ная положительная корреляция): среднеквадратичное коэффициентов корреляции между и — ДяО+1> по двенадцати па- рам смежных месяцев получилось 0,071, что также хорошо согла- суется с теоретическим значением 0,102. Аналогично можно исследо- вать устойчивость изменяемости величин у, образуя коэффициенты корреляции между (ДуО>)2 и (Az/O+i))2, (Ду(<+2>)2 и т. д. Только такое систематическое изучение устойчивости метеоро- логических рядов может решить вопрос. Отдельные же замечания о том, что такой-то коэффициент корреляции оказался неустойчивым, могут создать лишь ложное представление о положении вещей. Если какой-либо изолированно взятый коэффициент корреляции между двумя метеорологическими факторами оказался для двух смежных двадцатипятилетий имеющим резко различные значения, то это вовсе еще не доказывает, что во второе двадцатипятилетие измени- лись общие климатические закономерности, действовавшие в течение первого. Скорее, расхождение может быть признано чисто случай- ным. Конечно, нескольких приведенных цифр далеко недостаточно для решения вопроса, но вполне возможно, что и дальнейшие исследова- ния обнаружат довольно полное согласие с гипотезами устойчивости и независимости. Дело в том, что исследования, имеющие целью до- казать наличие вековых изменений климата, или многолетних перио- дических колебаний, обычно ведутся над сильно осредненными вели- чинами, основанными на наблюдениях многих отдельных станций, для которых абсолютные размеры уклонений Az/ сравнительно малы, и поэтому более резко выступает роль длительных колебаний. § 4. Предположим теперь, что требования устойчивости и неза-, висимости для наших рядов выполнены. Если бы число лет наблюде- ний было достаточно велико, то при сделанном допущении сколь угодно сложные уравнения регрессии, выделенные на основании этих наблюдений, достаточно точно отражали бы закономерности, го- сподствующие во всем ряде. Однако при п, равном 30 или 50 и даже 100, положение существенно меняется: введение чрезмерно большого числа величин, из которых делается выбор величин, входя- щих в это уравнение, создает опасность возникновения случайных удачных комбинаций, употребление которых для предсказаний бу- дет совершенно необоснованным. Напротив, если на основании серьезных теоретических наблюде- ний устанавливается, что подлежащая предсказанию величина у должна в значительной мере определяться величинами х2, например, в числе трех, то вычисленная на основе 50-летних наблю- дений формула регрессии вида (1), связывающая Ay с Д^1, Д#2 и
18. К вопросу о пригодности найденных формул прогноза 167 Д^з> должна считаться надежной. При этом мы имеем в виду теорети- ческие соображения, обоснованные динамически, а не «теории», имеющие чисто статистическое происхождение. Однако и чисто ста- тистические приемы могут помочь выяснить, в каком направлении следует искать неслучайные коррелятивные связи. Такая попытка в широком масштабе была предпринята Бауром [3]. Именно им вычис- лены коэффициенты корреляции между средней месячной температу- рой в Исландии и давлением за предшествующий месяц в различных точках земного шара. При этом обнаружилось, что для станций юж- ного полушария коэффициенты корреляции по абсолютной величине в среднем (по различным станциям и двенадцати месяцам) не пре- восходят размеров, предсказываемых теорией в случае полной независимости обоих явлений (температуры в Исландии и дав- ления на данной станции южного полушария). Это заставляет от- нестись с большим недоверием и к изредка встречающимся коэффи- циентам корреляции, значительно превышающим общую норму. Давления на станциях северного полушария в противоположность этому обнаруживают связь с последующей температурой в Ислан- дии, систематически превышающую размеры, которые можно было бы приписать случаю. Правда, Баур замечает, что, быть может, влия- ние аномалий давления в отдаленных пунктах земного шара сказы- вается на температурах в Исландии лишь по истечении более дли- тельных промежутков времени, чем один месяц. Достаточных доказательств этой гипотезы Бауром не приведено. Решение вопроса возможно только посредством продолжения систематических ис- следований Баура над средней высотой коэффициентов корреляции, а не посредством разыскания новых отдельных случаев высокой кор- реляции. При этих исследованиях следует пользоваться результатом Фи- шера, в силу которого в случае независимости величин х и у эмпири- ческий коэффициент корреляции между ними г имеет закон распре- деления, переходящий после преобразования z = arctg г в нормальный закон для z с центром в начале и дисперсией о = НУ п — 3, где п — число наблюдений. ЛИТЕРАТУРА 1. Fischer R. A. The general sampling distribution of the multiple correlation coefficient.— Proc. London Roy. Soc. A, 1928, vol. 121, N 787, p. 654—673. 2. Rider P. R. A survey of the theory of small samples.— Ann. Math., 1930, vol. 31, N 4, p. 577—628. 3. Baur F. Statistische Untersuchungen iiber Auswirkungen und Bedingungen der grofien Storungen der allgemeinen atmospharischen Zirkulation.— Ann. Hydrogr. maritimen Meteor., 1925, Bd. 53, H. 1, S. 1—6; H. 8, S. 241—258.
168 19. Случайные движения (К теории броуновского движения) 19 СЛУЧАЙНЫЕ ДВИЖЕНИЯ * (К теории броуновского движения) В двух более ранних работах [1, 2] мною была развита общая тео- рия непрерывных случайных процессов. В этих работах при очень общих условиях было доказано, что в случае, когда состояние физи- ческой системы в каждый заданный момент времени полностью определяется п параметрами х19 х29..хП9 причем эти параметры не- прерывно 1 меняются со временем I, соответствующие функции распре- деления удовлетворяют дифференциальному уравнению Фоккера— Планка. В общем случае такого случайного процесса приращения Дх^ параметра' X/ имеют тот же порядок величины, что и (Аг)1/*. Отсюда следует, что в общем случае отношение Дх^ : Д£ неограни- ченно возрастает при Д£ 0, так что здесь нельзя говорить ни о ка- кой определенной скорости изменения параметра х$. Сейчас мы пока- жем, как эта общая теория может быть приложена к случайным дви- жениям, в отношении которых предполагается, что не только коор- динаты системы, но и их производные по времени изменяются непре- рывно. Пусть q19 q29 . . ., qn — координаты системы с п степенями сво- боды. Допустим, что в случае, когда нам известны значения q и q в момент времени t9 может быть определена плотность вероятности • • •> • • •> ?п> • • •, ^1» • • •> 9п) возможных значений q' и q' координат системы и их производных по времени в произвольный момент времени t' t. Дополнительно будет также предполагаться, что G не зависит от поведения системы перед моментом t. Естественно предположить 2, что Е | Д^ — qtM ( = о (Д£), (1) Е(Д?08 = о(М)9 ' (2) где Д* == t' — t9 а Е — символ математического ожидания. Из (1) и (2) вытекают соотношения Е (Ддг) = (ДО, (3) Е (Ддг Д?,) < /Е (Д?г)2Е(Д^)г = о (Д*). (4) * Zufallige Bewegungen (Zur Theorie der Brownschen Bewegung).— Ann. Math., 1934, vol. 35, p. 116—117. Перевод A. M. Яглома. ^По поводу точного значения условия непрерывности случайных процессов 2 Поскольку Ьхц должно быть того же порядка малости, что и Аг.
19. Случайные движения (К теории броуновского движения) 169 В [2] при очень общих предположениях было доказано, что, по- мимо (2)—(4), должны выполняться еще следующие соотношения: Е (Д?,) = ft (t, q, g) Д* + о (ДО, . (5) Е (Д?г)а = kit (t, q, q) At + о (Д0, (6) Е (Д?гД?;) = ktj (t, q, q) At + о (At), (7) где / и k — непрерывные функции. Во многих физических задачах предположения (5)—(7) допускают также непосредственную про- верку. Из (2) и (6) следует, в частности, что Е < /Е (Д^)2Е(Д^)2 = о (ДО- (8) При физически совершенно естественных дополнительных пред- положениях из (2)—(8) следует, что G является фундаментальным решением следующего дифференциального уравнения типа Фоккера- Планка8: •^= я'' 4')8,+ В случае п = 1 мы, таким образом, приходим к уравнению -4'^г£--^г{Ж q')gJ+-^{k(t', q', q')g). (Ю) Если / и к — это две постоянные, то фундаментальное решение урав- нения (10) может быть представлено выражением 2/3 | 8== пкч*’-в* expi~ [V- -7 -/(«'- ПР 4Л (Г — t) k(t' — О3 (11) Легко видеть, что здесь Дд имеет поядок (Д£),/2, т. е. ведет себя как и Дя в случае общего непрерывного процесса. Однако для Дд мы получаем 4 Дд = qbt +О (kt)*/*. (12) Можно доказать, что последнее соотношение выполняется и в случае общего уравнения (9). 3 Доказательство этого утверждения см. в [2]. 4 Этот результат означает, что вероятность неравенства | Дд — дД£| К (Дг) при любой сколь угодно большой постоянной К будет меньше любого Фиксированного заранее числа 8>0 и притом равномерно по At
170 20. Уклонения от формул Харди при частичной изоляции ЛИТЕРАТУРА 1. Kolmogoroff A. N. Ueber die analytischen Methoden in der Wahrscheinlich- keitsrechnung.— Math. Ann., 1931, Bd. 104, H. 3, S. 415—458. Pyc. nep.: УМН, 1938, вып. 5, c. 5-41. 2. Kolmogoroff A. N. Zur Theorie der stetigen zufalligen Prozesse.— Math. Ann 1933, Bd. 108, H. 1, S. 149-160. 20 УКЛОНЕНИЯ ОТ ФОРМУЛ ХАРДИ ПРИ ЧАСТИЧНОЙ ИЗОЛЯЦИИ* Глубокие математические исследования Р. Фишера [1] и С. Райта [2] относятся к эволюции концентрации гена в популяции, в которой господствует свободное скрещивание. Задачей настоящей заметки является указать метод, при помощи которого можно получить ана- * логичные результаты в случае популяции, распадающейся на боль- шое число частичных популяций, слабо связанных между собой. Математическому анализу удалось повергнуть следующую схему: популяция с постоянным числом особей N распадается на 5 частич- ных популяций по п особей (N = sri); в каждой из частичных попу- ляций происходит свободное скрещивание, кроме того, в каждом поколении из каждой популяции выделяется в среднем по к «странст- вующих» особей; странствующие особи независимо от их происхож- дения присоединяются наудачу к любой из частичных популяций, где и участвуют в создании следующего поколения. Схема эта была ука- зана как одна из возможных Н.П. Дубининым и Д. Д. Ромашовым. Ряд других не менее интересных схем ограниченного скрещивания, к сожалению, не поддается пока математической обработке. § 1. Случай отсутствия отбора. Будем обозначать через р концен- трацию некоторого гена в большой популяции и через р концентра- цию того же гена в частичной популяции. В этом параграфе мы предполагаем, что изучаемый ген не подвер- гается отбору. Приводимые далее формулы являются асимптотиче- скими формулами, справедливыми при пр, п!№ и s, стремящихся к бесконечности. Практически их можно считать применимыми, если величины пр, п!№ и 5 достаточно велики. Обозначим через Др приращение концентрации р в некоторой частичной популяции за одно поколение. Следуя Р. Фишеру и С. Райту, мы принимаем, что для математического ожидания Др И (Др)2 справедливы формулы ; .4 = Е(Др)=А(р-р), в = Е(дР)2 = ^., ♦ ДАН СССР, 1935, т. 3, с. 129—132. Представлено С. Н. Бернштейном»
20. Уклонения от формул Харди при частичной изоляции 171 где Q = 1 — Р- Так как s велико, то изменения суммарной концен- трации р будут протекать много медленнее, чем изменения частичных концентраций р. Поэтому можно принять на время концентрацию р постоянной. Концентрации р в частичных популяциях будут укло- няться в ту и другую сторону от р. По истечении достаточного проме- жутка времени колебания р вокруг р приведут к некоторому ста- ционарному распределению вероятностей для концентрации р. Это стационарное распределение и (р) удовлетворяет дифференциаль- ному уравнению 4--Д- {Ви) - 4- {Аи) = 0. 2 др2 ' 7 др v 7 Решая это уравнение, получаем и = B(4kp, 4kq) • Формула (1) была получена другим методом С. Райтом. Можно доказать, что (1) не только дает распределение вероятностей для концентрации р, но что при достаточно большом числе $ частичных популяций фактически наблюдаемое распределение частичных попу- ляций по концентрациям р будет тоже даваться формулой (1). При сделанных допущениях в каждой частичной популяции осу- ществляется формула Харди, т. е. концентрации особей типа АА, Аа и аа равны q2, 2pq и р2. Концентрации особей типа АА, Аа и аа в большой популяции могут быть, следовательно, вычислены по фор- мулам 1 А А = g2u(p)dp, о 1 Аа = 2 § pgu (р) dp, о 1 аа = р2и (p)dp. , о Производя вычисления, получаем = 4А + 1 + 4А + 1 Аа = 2 j- pq, (2) ^=4АТТ^2+ 4Я=Т^- Формулы (2) решают поставленную в заглавии настоящей заметки задачу. В силу отсутствия отбора математическое ожидание Е (Д/7) при- ращения суммарной концентрации гена (в большой популяции) за одно поколение равно нулю. Интенсивность же случайных коле-
172 20. Уклонения от формул Харди при частичной изоляции баний концентрации в большой популяции характеризуется вели- чиной Е (Др)2. Эта последняя величина вычисляется по формуле _ 1 С 1 е Е (Др)2 = — Е (Др)2и (р) dp = 2^- pju (р) dp. О о Результат вычисления таков: Е (Д^)2 = 1 • (3) В случае свободного скрещивания мы имели бы, по Р. Фишеру и С. Райту, Е(Др)2 = дау. § 2. Действие отбора. Формула (1), формула Харди для частич- ных популяций и заменяющая ее формула (2) для большой популяции сохраняют силу при наличии отбора в случае, если коэффициент отбора а много меньше, чем 1/п. Мы ограничимся рассмотрением имен- но этого случая: предлагаемые ниже формулы являются в Соответст- вии с этим лишь асимптотическими формулами, справедливыми при па, стремящемся к нулю. Особенно интересен случай рецессивного гена. В этом случае приращение концентрации гена, вызванное от- Д бором, в каждой частичной популяции в среднем равно ap*q. Для суммарной концентрации получаем поэтому 1 Е (Др) = а У p27tt (р) dp, о или ’ Е “ (4& + 2) + ™ ^Р + Х)- Формула (4) может быть использована для подтверждения в слу- чае изученной нами схемы общего положения о существовании оп- тимума частичной изоляции для отбора рецессивных генов, выдви- нутого и обоснованного с качественной стороны А. А. Малиновским. Легко вычислить, при каком значении к отбор идет скорее всего. При малых концентрациях р такое оптимальное значение к равно kQ = V4 /2 = 0,35. Институт математики МГУ, 18 июня 1935 г. ЛИТЕРАТУРА Fischer R. A. The genetical theory of natural selection. Oxford, 1930. t Wrigth S. Genetics. London, 1931, p. 97—157, ;
21. К -теории цепей Маркова 173 21 К ТЕОРИИ ЦЕПЕЙ МАРКОВА* Нижеследующие рассмотрения представляются мне, несмотря на их простоту, новыми и небезынтересными для некоторых физиче- ских приложений, в особенности для анализа обратимости статисти- ческих законов природы, проведенного Шредингером 1 в одном спе- циальном случае. Всюду далее безразлично, какое из двух следую- щих предположений делается относительно временной переменной i: либо t пробегает все вещественные значения, либо ограничивается целочисленными значениями. Классическое понимание цепей Мар- кова соответствует второй возможности. 1 ПОНЯТИЕ ЦЕПИ МАРКОВА Рассмотрим физическую систему, которая в каждый момент вре- мени Сможет находиться в одном из состояний конечного набора Е19 Е2, . . ., En. При этом предположим, что для каждой пары состояний Ei и Ej и каждой пары моментов времени t и 5, t 5, определена ус- ловная вероятность Ptj (t, s) того, что в момент времени s наступит состояние Ej в предположении, что в момент времени t система на- ходилась в состоянии Ei, Существенное, но не всегда с достаточной ясностью акцентируемое, предположение состоит в независимости условной вероятности Ptj (t, s) от знания предыстории системы до момента времени t. На этом предположении основывается вывод фун- даментального’уравнения теории цепей Маркова Pik(s, 0 = 3 АД», U)Pjk(llt f), (1) 3 с условиями Ptj (t, ») > 0, (2) ЗРу(Л8) = 1, (3) 3 Рц (t, t) = бу, (4) где = 0 или 1 в зависимости от того f =/= у или i = у. * Zur Theorie der Markoffschen Ketten.— Math. Ann., 1936, Bd. 112, S. 155 — 160. Перевод К. И. Осколкова. 1 Berliner Berichte, 1931, S. 144.
174 21. К теории цепей Маркова 2 АБСОЛЮТНЫЕ ВЕРОЯТНОСТИ До сих пор мы рассматривали лишь условные вероятности пере- хода Pij (t, s). Возникает вопрос: возможно ли по заданным вероят- ностям Ри (t, s) указать и абсолютные вероятности появления различных состояний в каждый момент времени t? Если допустить, что процесс изменения нашей системы начинается в некоторый опреде- ленный момент времени to, то можно приписать различным состоя- ниям Е19 Е29 . . ., Ен в момент времени tQ совершенно произвольные вероятности Qt (Q, Q2 (f0), . . QN (t0), Qk (t0) >0t^Qk (*0) = 1. k Для каждого момента времени t > t0 получаются следующие выра- жения для вероятностей Qk (t) появления состояний Ек (к = 1, 2, . . ДГ): <?И0=3<?г(МЛ»(^0, t). Тогда при tQ t 5 автоматически получается также и формула Qk («) = 2 Qi (0 Pik (i, s). (5) He столь тривиальным является введение абсолютных вероятностей, если не предполагать никакого определенного начала процесса и, напротив, пытаться найти абсолютные вероятности Qk (t) во все моменты времени t, — оо<(<^-|-оо. Но все же и здесь справед- ливо следующее утверждение: По произвольно заданным при всехtus(t^s) вероятностям пере- хода Pik (t, s) можно по меньшей мере одним образом для всех t, — оо t 4-оо, определить соответствующие этим вероятнос- тям перехода Pik (t, s) абсолютные вероятности Qk (t). Чисто аналитически теорема означает следующее. При каждом выборе величин Pik (t, з), соответствующих условиям (1)—(4), бесконечная система уравнений (5) имеет по крайней мере одно реше- ние, которое удовлетворяет дополнительным условиям <?ио>о. Зе» (0=ь (в) Для доказательства теоремы прежде всего заметим, что для каж- дого tQ, как мы уже видели, существует по меньшей мере одна систе- ма, величин которые определены для всех £>£ои для > tQ удовлетворяют уравнениям (5) и (6). С помощью диагонального процесса можно извлечь из последовательности = —1, —2, —3, . . . подпоследовательность ^3> • • •
21, К теории цепей Маркова 175 со свойством Хп-> — оо, так что для каждого к и каждого цело- численного t величины Q^ (£), определенные при каждом фиксиро- ванном t для всех достаточно больших значений и, стремятся при п -> оо к определенному пределу Q* (t). На основе формул (6) легко доказывается, что и для всех вещественных нецелочисленных значе- ний £ существуют предельные значения Q* (0- Эти предельные значе- ния, как это доказывается с помощью предельного перехода, удов- летворяют уравнениям (5) и (6). Тем самым теорема доказана. * В особенности интересен случай, когда абсолютные вероятности единственным образом определяются заданием вероятностей пере- хода Рцс (t, s). Для подобной однозначной определенности абсолют- ных вероятностей необходимым и достаточным является следующее условие: Для произвольных фиксированных к и s величины Pilz (t, s) при Z — оо стремятся к некоторому пределу Q* ($), не зависящему от i. Если это условие выполнено, то упомянутые пределы Q* (s) в точ- ности составляют искомую единственную систему абсолютных вероятностей. Сначала докажем, что условие достаточно. Пусть*Qk (t) — неко- торые абсолютные вероятности, согласованные с вероятностями перехода Pik (t, s). Тогда Qk ($) — S Qi (0 Pik (^> 5)> (5) i но поскольку при t -> — oo величины Ptx (t, s) 'стремятся к Q* (s)9 то при t->—oo правая часть уравнения (5) стремится к S <?*(«) О) = <?*(«), i откуда следует, что & (*) = 0. Пусть теперь наше условие не выполнено. Тогда можно выбрать h и i2 и две такие последовательности ti > *2 > . . . > tn — оо, t'l t% tn > • • . —> оо, что Piik (tn, s) и соответственно Piik (tn, s) при n -> + oo стремятся соответственно к пределам Qk (s) и Qk (s) для произвольных k и s и при этом Qk (s) и Qk (s) не совпадают тождественно. Тогда легко Доказать, что Qk (s), как и Qk (s), могут быть взяты в качестве абсо- лютных вероятностей, откуда следует необходимость условия.
176 21. К теории цепей Маркова 3 ОБРАТНЫЕ ВЕРОЯТНОСТИ Предположим теперь, что выбрана некоторая фиксированная система абсолютных вероятностей Qi (s) и что все Q* (s) положитель- ны. В этом случае наряду с вероятностями перехода PiJt (t, s) можно определить и обратные условные вероятности. А именно обозначим Пи (t, s) условную вероятность появления состояния Et для момен- та времени t в предположении, что в некоторый более поздний момент s, s t, наблюдалось состояние Ек. Очевидно, что О.(П Пи s) = Рц (t, s). (7) Легко вывести следующие формулы, аналогичные формулам njS (s, 0 = ЗП4Д$, и)П}й(и, t), s^u^t, (1*) 3 f)>0, (2*) Sniif(S, o=i, (3*) k Пэд (t, t) = (4*) Qi (s) = 3 Qk (t) n4& (s, 0, (5*) k Отметим при этом, что если желать обойти некоторый новый прин- цип «независимости от будущего», то формулу (1*) следует выводить на основе приведенных выше формул, а не доказывать непосредст- венно по аналогии с (1). После этого можно доказать этот последний принцип на основе формулы (1*). 4 ОБРАЩЕНИЕ ЗАКОНОВ ПРИРОДЫ Допустим теперь, что вероятности перехода Pik ($, t) зависят только от разности t — s: Pik ($> 0 = Pik В этом случае, как известно, существует по крайней мере одна си- стема не зависящих от времени t абсолютных вероятностей Qk (0 = Qk- Для фиксированной системы таких вероятностей Qk обратные ве- роятности nifc (5, t) точно так же зависят лишь от разности t — s: (5, t) = Iljfc (t — 5). 4
21. h теории цепей Маркова 177 Возникает вопрос: при каких условиях справедливо равенство Ъъ(г) = Рк№ (8> Так как == (QilQr) Pik (г)> То для справедливости равенства (8) необходимо и достаточна следующее условие: Qt niJfe (г) = QkPki (г). (9> Следует при этом, однако, отметить, что необходимые и достаточ- ные условия справедливости равенства (8) можно выразить и бев использования величин Qk чисто в терминах вероятностей перехода Pik (г). В самом деле, Мизес 2 доказал, что все состояния можно таким образом разбить на классы, что выполнены следующие усло- вия: 1) Pik (г) могут отличаться от нуля только тогда, когда Et и Ек принадлежат одному и тому же классу; 2) для каждых двух Ег и Е^ из одного класса отношение Qi : Qk однозначно определяется зада- нием вероятностей перехода Pik (г). Из этого вытекает: если Et и Ек принадлежат одному классу, то справедливость равенства (9) не зависит от выбора абсолютных вероятностей ф; если же Ег и Ек берутся из разных классов, то (9) тривиально следует из равенств Рис (г) = Ркг (г) = 0. Мы также видим, что справедливость усло- вия (9) не зависит от выбранной системы вероятностей Qk< Можно следующим образом сформулировать необходимое, и дос- таточное условие обратимости (8), не зависящее от величин Qk: Соотношения обратимости (8) выполнены тогда и только тогдаг когда для произвольно выбранных г, q, kr, k2, . . kq выполняется равенство Pkjtt (r) Pktkt (?)••• Pkq-ikqPltqkx = Pkjtq (r) P'kqkq-i • • • Pk^Pk^kp (Ю) В дискретном случае (когда t пробегает только целые значения)* достаточно потребовать (10) лишь при г = 1. В частности, если вероятности перехода симметричны: Pik (Г) = Pki W, (11)’ то условие (10) выполнено. Следовательно, условие симметрии (11) Достаточно для обратимости (8). 5’ ЗАКЛЮЧЕНИЕ Эти почти тривиальные факты находят много физических прило- жений. Мы ограничимся здесь примером, отличающимся от перво- начального примера* Шредингера. Пусть окружность разбита 2 Mises R. von Wahrscheinlichkeitsrechnung. Berlin, 1931. § 16.
178 22. К статистической теории кристаллизации металлов на очень большое число М одинаковых интервалов. Большое число L подвижных частиц перемещается по этой окружности и притом так, что каждая частица независимо от прочих на каждом шаге переходит в соседний интервал либо направо, либо налево и обеим этим воз- можностям соответствует вероятность 1/2. Имеется всего ML = N различных возможных расположений L частиц на М интервалах. Абсолютные вероятности Q*, которые соответствуют этим N возмож- ностям, все одинаковы и равны UN. Вероятности перехода Pi1e (г), очевидно, симметричны, и поэтому справедливо уравнение обрати- мости (8). Если рассмотреть «макроскопическое» распределение ча- стиц на окружности, то оно с вероятностью, весьма близкой к единице, будет равномерным. Если же известно (хотя это априори очень ма- ловероятно), что в некоторый момент времени t0 имеет место большое отклонение от этой равномерности, то с вероятностью, весьма близ- кой к единице, можно утверждать, что эта неравномерность при t будет выглаживаться приблизительно в соответствии с диффе- ренциальным уравнением диффузии. Формула обращения (8) теперь учит нас, что с равной вероятностью вытекает появление равно- мерности при t < t0 с тем же дифференциальным уравнением, но про- тивоположным знаком временной переменной. Институт математики МГУ, 20 мая 1935 г. 22 К СТАТИСТИЧЕСКОЙ ТЕОРИИ КРИСТАЛЛИЗАЦИИ МЕТАЛЛОВ * В настоящей работе при некоторых схематических, но все же до- вольно общих предположениях дается строгое решение задачи о ско- рости течения процесса кристаллизации. Для металлургии имеет существенное значение изучение процесса роста кристаллов при случайном образовании центров кристаллиза- ции. Известные затруднения представляет при этом учет столкновений зерен кристаллического вещества, возникающих вокруг отдельных центров кристаллизации. Эти столкновения нарушают правильную форму зерен, прекращая их рост в некоторых направлениях. Опуб- ликованные до настоящего времени работы Ф. Гелера и Г. Закса [1], Г. Тамманна [2], Б. В. Старка, И. Л. Миркина и А. Н. Романов- ского [3] и других дают лишь грубо приближенные формулы для ро- ста кристаллической массы. В настоящей заметке я даю при некото- рых довольно широких допущениях точную формулу для вероят- * Изв. АН СССР. Сер. мат., 1937, № 3, с. 355—360. Представлено <3. Н. Бернштейном.
22. К статистической теории кристаллизации металлов 17» ности р (0, с которой наудачу выбранная точка Р объема, запол- ненного подлежащим кристаллизации веществом, попадет в течение^ промежутка кристаллизации внутрь уже закристаллизованной мас- сы. С вполне достаточным приближением можно считать, что доля вещества, закристаллизовавшегося за промежуток времени t, так- нее равна р (t). В заключение я определяю число центров кристалли- зации, образующихся в течение всего процесса кристаллизации. Пользуюсь случаем выразить мою благодарность И. Л. Мирки- ну, заинтересовавшему меня решаемой здесь задачей и любезно пре- доставившему все нужные материалы. § 1 МАТЕМАТИЧЕСКАЯ ПОСТАНОВКА ЗАДАЧИ Дан некоторый объем V. Вначале (t = 0) он весь занят «маточной фазой». Через промежуток времени t некоторая часть.Vr (t) объема К занимается кристаллизовавшимся веществом. Рост объема V1 (£> со временем t. совершается следующим образом. 1. В свободной части V — Vr объема V возникают новые центры кристаллизации. При этом для любого объема V' < V — вероят- ность образования в этом объеме за промежуток времени между t и t + \t одного центра кристаллизации равна а (0 V'Ai + о (А0, а более чем одного центра равна о (А0, где о (Д0 обозначает величину,, бесконечно малую по сравнению с At Вероятности эти не зависят от распределения центров кристаллизации, образовавшихся рань- ше времени t, если только оно гарантирует (см. далее) свободу объе- ма V' от кристаллической массы к моменту t. 2. Вокруг новообразованных центров кристаллизации и вокруг всей закристаллизованной массы происходит нарастание этой мас- сы с линейной скоростью е (0 п) = к (0 с (п), зависящей от времени t и направления п. Предполагаем, что концы векторов длины с (п), отложенных в направлении п из начала коор- динат, образуют выпуклую поверхность. В изложенных /словиях существенным ограничением является то, что линейная скорость роста с (t, п) хотя и может зависеть от направления п, но зависимость эта во всех точках должна быть од- ной и той же. Иначе говоря, выводимые далее формулы справедли- вы или при упрощенном предположении равномерного роста во всех направлениях, или для случая одинаково ориентированных в про- странстве кристаллов произвольной формы.
480 22. К статистической теории кристаллизации металлов § 2 ОПРЕДЕЛЕНИЕ ВЕРОЯТНОСТИ p{t) Введем величину с, определяемую равенством J с8 (zi) do, S где интегрирование производится по поверхности единичной сферы S с центром в начале координат. Очевидно, объем кристалла, рас- тущего свободно вокруг центра, образовавшегося в момент времени /0, достигнет к моменту t > величины с8 k (т) drj3. Рассмотрим теперь произвольную точку Р объема Vx лежащую на расстоянии, большем t max c(n) J А(т) dr о ют краев объема V. Для того чтобы точка Р попала внутрь закристаллизовавшейся массы к моменту t, необходимо и достаточно, чтобы в ка$сой-то мо- мент t' < t. в какой-то точке Р', лежащей отР на расстоянии, мень- шем t с (п) к (т) dr, V где п обозначает направление Р'Р, образовался центр кристаллиза- ции. При фиксированном t' объем У' (f), занятый точками Р', ко- торые удовлетворяют выдвинутым условиям, равен t У'(?)==-^.сз^А:(т)йту. Г Вероятность того, что за промежуток времени Д$' в объеме У'(О образуется центр кристаллизации, равна a (f) V'(f)ДГ + о (ДГ), . а вероятность того, что это не произойдем равна s <7(0 = II {1-а(0)Р(0)А«'} + <’(1). г
22, К статистической теории кристаллизации металлов 181 Поэтому вероятность того, что точка Р к моменту t не будет вклю- чена в закристаллизовавшуюся массу, равна q (f) = П (1 - a (h) V At'} + о (1), (1) i=l где t = s&t', ti = iAt', а о (1) бесконечно мало при бесконечно ма- лом Д£'. Логарифмируя (1), получим s t log q (t) = V a (ti) V (ti) At' + о (1) = — ( a (f)V' (?) dt’ = i=l 0 t t == _^1сз k(x)dx^df. (2) Для искомой вероятности P (О = 1 — 9 (О включения точки Р в закристаллизовавшуюся массу получим, на- конец, р (t) = 1 — exp {— -J-c3Q}, (3) где t t Q = § a(f) (jj к (т) dr) dt'. (4) o r § 3 ВЫВОДЫ При достаточно большом по сравнению с размерами отдельных зерен объеме V можно положить Vj (t) = Vp (г), или в силу (3) V1(t) = 7(l-exp|--^-c3Q}), (5) тде Q определяется формулой (4). Формула (5) для объема Vx (I) закристаллизовавшейся за время t массы решает первую из поста- вленных во введении задач. Если a (t) и с (£, п) не зависят от време- ни, можем положить a (t) = af к (t) = 1. В этом случае Q = at*/к (4а) и формула (5) дает Vi (t) --= V (1 — exp |-j- c3otf4}j . (5а)
182 22. К статистической теории кристаллизации металлов Для числа N (t) центров кристаллизации, образовавшихся за время справедлива при достаточно большом объеме V формула t N (t) = V^a(i;)g(T)dT. (6) о При постоянном a (t) = а и k = 1 получаем из (6) t N(t) ==Va § exp {----^-с3ат4|йт, (7) о или X • (6а> о где 4, — х — у лс3а/3 h При t = + оо формулы (6) и (6а) дают полное число центров кри- сталлизации, возникающих в течение всего процесса. В частности* при постоянных a (t) = а и к = 1 получим У(+оо) = У у (7a) О Отметим еще особый случай, в котором все центры кристаллиза- ции образуются в самом начале в среднем по (3 на единицу объема* Соответствующие формулы получаются из общих предельным пе- реходом. Вместо (4) получаем t Q = $ (J ft (т) dr)3, (4b) 0 формула (5) сохраняется, а формула (6) заменяется при любом I > 0 тривиальным равенством N = 70. Если, кроме того, допус- тить, что к = 1 (т. е. с (t, п) независимо от £), то получаем Q = 0*3, (4с) Vi (I) = V (1 — ехр {- с3р/3}) . (5с) Институт математики МГУ, 20 апреля 1937 г. ЛИТЕРАТУРА 1. Gdler F.t Sachs G.— Ztschr. Phys., 1932, Bd. 77, S. 281. 2. Tammann G.— Ztschr. andrg. Chemie, 1933, Bd. 214, S. 407. 5. Старк Б. В., Миркин И. Л., Романовский А. Н. Металловедение и терми- ческая обработка.— Тр. Моск, ин-та стали, 1935, т. 7, с. 5—38.
23. Цепи Маркова со счетным числом возможных состояний 183 23 ЦЕПИ МАРКОВА СО СЧЕТНЫМ ЧИСЛОМ ВОЗМОЖНЫХ СОСТОЯНИЙ * В моей статье [1] высказан ряд общих предложений, относящихся к асимптотическому поведению вероятностей перехода из одного «состояния в другое при неограниченно возрастающем числе шагов для случая цепей Маркова со счетным множеством возможных сос- тояний. Предлагаемая сейчас читателю статья содержит расширенное^из- ложение тех же вопросов, пополненное доказательством основных тео- рем, высказанных мною ранее без подробного доказательства, а также сообщением некоторых новых фактов. Принятая здесь система изложения может иметь известный интерес и для цепей Маркова с конечным числом -возможных состояний. На это указано в появив- шейся в промежутке заметке В. ДёблинаД2]. Как мне известно из его письменного сообщения, В. Дёблин доказал независимо неко- торые из опубликованных мною теорем о цепях Маркова со счетным числом состояний. § 1 ОБОЗНАЧЕНИЯ Различные возможные состояния изучаемой системы обозначаем через где i пробегает все натуральные числа. Впрочем, все даль- нейшее изложение пригодно и для случая, в котором i принимает конечное число различных значений; в этом случае ряд дальнейших формулировок может быть очевидным образом упрощен. Вероят- ности ри перехода из Et в Ej за один шаг предполагаются, как обыч- но, подчиненными условиям Ри > о, (1) Хр«=1. (2) 3 Вероятности перехода из Et в Ej за п шагов определяются ин- дуктивно из равенств (3) (4) к {1 при i = ]. л ' О при i =/= J. * Бюл. МГУ. Математика и механика, 1937, т. 1, выл. 3, с. 1—16.
184 23. Цепи Маркова со счетным числом возможных состояний Обозначим, далее, через вероятность перейти за п шагов из состояния Ei в состояние Ej, не попадая за меньшее число шагов в состояние Ej. Очевидно, К$> = Р$ - K^Pfr»K^Pfr** —... — К$-»Р%- (5) В частности, есть вероятность, отправляясь от состояния впервые вернуться в то же самое состояние через п шагов, Положим еще Л 3 К(#=Цу (6) -42=1 Очевидно, 1. Если — 1, то, отправляясь от состояния Ец система неизбежно рано или поздно должна попасть в состояние Е^ Математическое ожидание числа шагов, потребного в этом случае для перехода из Ei в Ej, равно оо Mi} = 3 пК%>. (7) п==1 В частности, Мц есть математическое ожидание числа шагов до первого возвращения в состояние Et при условии наличия этого же состояния Et вначале. Mtj может быть как конечным, так и бесконечным. § 2 НЕСУЩЕСТВЕННЫЕ СОСТОЯНИЯ, КЛАССЫ И ПОДКЛАССЫ СУЩЕСТВЕННЫХ СОСТОЯНИЙ Состояние Et называется несущественным 9 если существуют такие ] и п9 что Р*$ 0 и для всех т имеет место Р{$* = 0, т. е. из Et возможен переход в Ej, не допускающий возвращения в Ег. Все остальные состояния называются существенными. Очевидно, что если состояния Ег и Ej существенны и существует п с Р$ 0, то должно существовать также т с В случае существования таких п и т существенные состояния Et к Ej называются сообщаю- щимися. Если Ei сообщается с Ej и Е} сообщается с Еи то и Е} сообщается с Е*. Поэтому все существенные состояния распадаются на классы так, что состояния, принадлежащие одному классу, сообщаются, принадлежащие же разным классам — не сообщаются. Очевидно, кроме того, что для существенного состояния Et и несущест- венного Е; всегда Р$ = 0. Таким образом, изучаемая нами система, попав однажды в одно из состояний класса S(a\ никогда уже не вый- дет за пределы этого класса состояний. Рассмотрим теперь какое-либо существенное состояние Ег. Обо- значим через множество тех чисел п, для которых Р$ > 0. Так как Et существенно, то множество $0^ не пусто. Если п иАтж
г 23. Цепи Маркова со счетным числом возможных состояний 185 входят в 3)?/, то п + т также входит в Пусть dt есть общий наибольший делитель всех чисел множества Множество состоит исключительно из чисел, кратных Легко установить, что все достаточно большие кратные dt входят в Число dt на- зывается периодом состояния Et. Легко доказать, что все состояния, принадлежащие к одному и тому же классу S^, имеют один и тот же период, который мы обоз- начаем через d (а) и называем периодом класса В самом деле, пусть для двух состояний Ej одного и того же класса най- дены такие п*и т, что Р($ 0 иР$ > 0 (такие п и т, как указано выше, существуют). При достаточно большом k P$dj} > 0. Следова- тельно, при достаточно большом к и т. е. все достаточно большие числа вида kdj + п + т входят в а это возможно только, если dj делится на dt. Так как и, обратно^ di должно делиться на dj, то dt = dj. Для двух состояний Ei и Ej, принадлежащих одному и тому же классу 5(а), только в том случае может быть одновременно Р(ц 0 и Р^ 0, если п и т сравнимы по модулю d (а). Поэтому, выбрав какое-либо определенное состояние Е^ класса для любого состояния Ei того же класса получим вполне определенное число Р (Е^ = 1, 2, . . ., d (а) такое, что Р($ 0 возможно лишь для л ==: 0 (Ei) (mod d (а)). Все состояния Ej с заданным числом р (Ej) отнесем к подклассу 8$а). Таким образом класс 5(а) разбит на d (а) подклассов Наша система с каждым шагом неизбежно переходит из состояний подкласса S$a) в одно из состояний подкласса а в случае Р = d (а) — в одно из состояний подкласса 51а). Таким образом, если Et и Ej принадлежат соответственно подклассам и 5уа), то Р{$ лишь в том случае может быть отлично от нуля, если п = у — Р (mod d (а)). С другой стороны, для всех достаточно больших п, удовлетворяющих последнему сравнению, действительно Р{$ > 0. § 3 ВОЗВРАТНЫЕ И НЕВОЗВРАТНЫЕ КЛАССЫ Кроме вероятности Ъц, отправляясь из состояния Е^ рано или поздно хотя бы раз попасть в состояние Ej, введем еще в рассмотре- ние вероятность отправляясь от состояния Ei, побывать беско- нечное число раз в состоянии Ej. Очевидно, имеет место неравенство ' (8) С другой стороны, мы докажем сейчас следующую лемму. Лемма I. Из Ьц =-1 вытекает £2П = 1.
186 23. Цепи Маркова со счетным числом возможных состояний Доказательство. Обозначим через вероятность, отправляясь от состояния Еь еще не менее к раз побывать в том же состоянии. Очевидно, всегда Л1) ^(fr+1) = = Ит T(fr). к—*оо В случае Ьц — 1 из этих формул явствует, что — 1. В этом и следующем параграфах мы будем интересоваться лишь соотношениями, господствующими внутри каждого класса сущест- венных элементов,— иначе говоря, будет предполагаться, что все индексы, относящиеся к состояниям, пробегают лишь значения, со- ответствующие состояниям одного класса. В формулировках теорем это будет отмечаться словами «в пределах одного класса». Теорема 1а. В пределах одного класса либо все < 1, либо все = 1. Доказательство. Очевидно, достаточно установить, что при любых г, /, к: 1) из — 1 следует Qik = 1, 2) из £lji — 1 следует = 1. Если эти два обстоятельства будут установлены, то при любых г, J, Г, f из = 1 будут следовать = 1 и = 1. Перейдем к доказательству предложения 1). Допустим, что == = 1, т. е. что с вероятностью единица, отправляясь от состояния Eit мы будем возвращаться в состояние Ej бесконечное число раз. Рас- смотрим промежуток между s-м и ($ + 1)-м возвращением в состоя- ние Ej. Так как все рассматриваемые состояния принадлежат одному классу, то событие $в, состоящее в заходе в промежутке между $-м и ($ + 1)-м посещением состояния Ej в некоторое фиксированное со- стояние Ек, имеет положительную вероятность. Легко видеть, что эта вероятность не зависит от $, а сами события §)s при различных s независима между собой. Но из бесконечной последовательности воз- можных независимых событий имеющих одинаковую положи- тельную вероятность, с вероятностью единица действительно осуще- ствится бесконечное число, т. е. == 1, что и требовалось доказать. Остается доказать предложение 2). Для этого мы воспользуемся формулой (9) к справедливой при любых i, j, к, п. Так как = 1, то из Од = к = 1 вытекает = 1 для всех тех к, для которых Pffl > 0. Но для любых / и к (в пределах одного класса) существует такое п* Таким образом предложение 2), а вместе с ним и теорема 1а дока- заны.
23, Цепи Маркова со счетным числом возможных состояний 187 Если все = 1, то в силу неравенства (8) и все = 1. Если же все Qfj < 1, то в силу леммы I и все Ьц <; 1. Отсюда получается Теорема Ib.fi пределах одного класса или все Ьц < 1, или ясе Lij = 1* Следует заметить, что в случае, когда все < 1, все же могут иметься некоторые Lu = 1 (i =/= j). Если все Ltj = 1 и все = 1, то класс называется возвратным. Если, наоборот, все Ьц < 1 и все < 1, то класс называется невозвратным. Легко убедиться, что в случае принадлежности со- стояния Ej к невозвратному классу и любого Et lim Pij} = 0. П-»+оо § 4 ПОЛОЖИТЕЛЬНЫЕ И НУЛЕВЫЕ КЛАССЫ Рассмотрения этого параграфа относятся к явлениям, наблюдаю- щимся внутри каждого возвратного класса. В результате этих рас- смотрений возвратные классы будут разделены на положительные и нулевые. Заметим, однако, что в следующих параграфах мы будем относить к нулевым классам также и все невозвратные классы. Основное значение при изучении возвратных классов имеют математические ожидания Мц (см. (7)). В связи с ними мы будем рассматривать средние <10> Лемма Па. Для любого Et из возвратного класса в случае конеч- ности Мц lim JiiT = ИМц, n-*oo в случае же Мц = +оо lim == 0. п—>оо Доказательство. С вероятностью, равной единице, от- правляясь от состояния Ei9 мы вернемся в это состояние бесконечное число раз. Пусть первое, возвращение в Et происходит на пгм шагей второе — на ^2-м шаге, вообще А-е — на n^-м шаге. Разности - —- П]^ Х% П% 72-1, • • •? ~~ 1, • • • образуют последовательность случайных величин, независимых между собой и имеющих одинаковый для них всех закон распределе- ния: хк = з с вероятностью К$. Очевидно, что Мц есть не что иное как математическое ожидание каждой из величин х%. Допустим сначала, что математическое ожидание Мц случайных величин х* конечно. Тогда по теореме А. Я. Хинчина [3] последова-
188 23. Цепи Маркова со счетным числом возможных состояний тельность удовлетворяет закону больших чисел, т. е. для любо* го е О существует такое &0, что при k^k0 вероятность неравенства будет меньше е. Пусть е<1/2-и п>п0 = 2&0Мп. Положим F=ir(1+e)- Легко видеть, что к' кОг к" к0. Поэтому с вероятностью^ боль* шей 1 — 8, можно утверждать, что | — Мц | < е, а из этого неравенства следует (так как Мц 1) I — п (1 — е) | < к'е, откуда пк> < п. Аналогично с вероятностью, большей 1 — 8, имеем | п^/к” — Мц\< 8/2, | пкв — п (1 + в) | < к"ъ12 < П8Г > п. Итак, в случае п > п0 с вероятностью, большей 1—2е, будут выпол- нены неравенства < п < т. е. число т|?п возвращений в состояние Et за первые п шагов будет заключено между к1 и к". Легко видеть, что математическое ожида- ние частоты tyn/n возвращения в Ег в течение первых п шагов рав- но Так как 1|)п/и при и > п0 с вероятностью, большей 1—28^ заключено в пределах кЧп и к“1п*. п || П iVL || П и так как всегда О t|?n/n 1, а Мц 1, получаем, наконец, при п > и0 4?) 1 ми С| 1 I П Ми 2в, откуда н следует, что lim я\? = 1/Ма. п-н-со Рассмотрим теперь случай Мц = +оо. В этом случае, каковы бы ни были М < + оо и е J> 0, существует такое к^ что при к къ
23. Цепи Маркова со счетным числом возможных состояний 18& вероятность неравенства к ;=1 будет меньше е. Для доказательства этого обстоятельства достаточна ввести новую последовательность независимых между собой случай- ных величин xjt, меньших, чем соответствующие величины (х^ <2 хъ при каждом к), но с математическими ожиданиями, равными,. например, 2М, и применить к этой новой последовательности закон больших чисел в указанной выше формулировке. Полагая к = [n/Jlf] + 1 > п1МА мы видим, что при п > к$М будет к > kQ и, значит, с вероятностью Л большей 1 — справедливы неравенства Следовательно, при п kQM я(?) — £ ( ___I__L 4» 8 что и приводит нас к заключению, что в этом случае lim = 0. П-*+оо Теорема II. В пределах одного класса или все Мц бесконечны & или все Ми конечны. Доказательство. Для любых двух состояний Ei и Е$ одного и того же класса существуют такие к и т1 что Р$ > 0Л Pffl > 0. Ясно, далее, что при любом п т>(п+к+т) -- n(m)D(n)D(fr) * 33 ji * гг ij • Из этого неравенства уже легко вывести, что lim л£>. п-*оо П—»оо Следовательно, или пределы для всех i (соответствующих дан- ному классу) равны нулю, или они для всех i положительны. Поэтому по лемме Па Мц также или все бесконечны, или все конечны. Остается еще доказать, что из конечности всех Мц вытекает и конечность всех М^. Обозначим для этого через вероятность^, отправляясь от состояния Еь за п шагов попасть в состояние^
190 23. Цепи Маркова со счетным числом возможных состояний £j (j =£ j), не побывав в промежутке в Ец Тогда 1 Мн= 3 mK[T + 4-п). ш=1 Но в пределах одного класса для любых i и j можно найти п, для которого Rip>0. Мы видим, таким образом, что из Мц = +<» вытекало бы Мц = 4- оо. Этим доказательство теоремы приводится к благополучному концу. Классы, в которых все Мц конечны, называются положительны- ми, а классы, в которых все Мц = + о°, называются нулевыми. Следует заметить, что в нулевых классах некоторые Мц (i Ф j) смогут быть конечны. Теорема III. В нулевом классе вероятность Р($ при п -> +°° стремится к нулю, каковы бы ни были состояния Et и Ej из данного .класса. Для доказательства теоремы III нам понадобится следующая Лемма ПЬ. В нулевом классе для любого Ej выражение <ю)=4(р#+1)+р«+г)+• • •+p>rm)) (in при т -> + оо стремится к нулю равномерно относительно п. Доказательство. Обозначим через вероятность того, что при начальном состоянии Ej начиная с (п + 1)-го шага состояние Ej появляется впервые на (п + $)-м шагу (независимо от того, про- исходило ли возвращение в Ej на протяжении первых п шагов). Тогда к p(n+fc) _ 2 jgr(s)p(^-s) 33 s—1 33 тр in m—s «» 4- E p'stK=4 У H'n У p« = k—1 s=l fc<=0 m m =X HW n»~s)+4 E H(s)- <12> 5=1 5=1 1 В самом деле, при г > п Поэтому тК<^ = § тК^+ 3 г % = m=l m=l r>n m=l s=l m=l
23. Цепи Маркова со счетным числом возможных состояний. 191 Выберем (что возможно по лемме Па) такое г0, что при г ;> г» всегда <Z е; выберем т0 г0/ъ. Пусть, далее, т т0. Тогда при т — s С го будет (т — s)/m < е, а при т — s > г0 будет < е. Так как всегда (т — s)/m 1, л^~е) 1, 'то для всех т > т» будет <е. т Замечая, что т * Зя(5)<1, 5=1 мы видим из (12), что < 8 + 1/тп, как только т mQ. Так как 8 0 произвольно и не зависит от п, то лемма доказана. Доказательство теоремы III. Заметим прежде* всего, что для полного доказательства этой теоремы достаточно до- казать ее в случае i = j, т. е. доказать стремление к нулю вероятно- стей Р$ при п -> +оо„ В самом деле, выберем такое что Р$*> О* Очевидно, п(п+ш) nO™)n<n) Будем при постоянном т стремить п к + оо; тогда из Р$+т) ->• О будет вытекать Р$ -> 0. Допустим теперь, что lim sup Р{$ — % 0. п—*+оо Если из этого допущения будет извлечено противоречие, то теорема III будет доказана. Выберем такое целое число что К$ = А > 0. Для любого 8 > 0 существует такое п0, что из п > и0 следует Р$ < X + 8. Выберем, далее, для некоторого б 0 такое тп0 а, что 3 ^<6. m>m0 Тогда из допущений п > По + т0, Р$ > Л — Т] (Г) > 0) вытекает ^Га) > % - (п + 8 + б)/л.
492 23. Цепи Маркова со счетным числом возможных состояний В самом деле, % - М<=K^Pfl + к$-1Ур$ + • •. + = =к($р^ + 3 к^р^-т)+ S KWpfrm}^ тп^т^п <AP^ +(1- Л) (% + e).+ S. В ^случае же п > nQ + m0 + sa из PS’> x - ч жытекает Pg’o) > * - (n + е + б)М = К - Th, Р$-2а) > К - (Щ + 8 + б)М = X - Т]2, P^~sa) > М- 01,-х + в + 6)М = К - т|„ тде П < Пх < Пг < • • • < П>- Но при любом s можно подобрать т] 0, е^>О,'б^>О так, чтобы 45ыло < Х/2. Подбирая соответствующие п0 и т0, получим для всех п nQ + mQ + sa и таких, что Р$ > X — т), неравенства Ptf > М2, P(-j'a) > М2, . . ., P^~sa) > М2, я(п-,а,,а) > (1/sa).s.x/2 = x/2a. Так как X/2a постоянно, 5 сколь угодно велико, а п при фиксирован- ном 5 может принимать произвольно большие значения, получаем противоречие с леммой ПЬ. § 5 АСИМПТОТИЧЕСКИЕ СООТНОШЕНИЯ ВНУТРИ ПОЛОЖИТЕЛЬНОГО КЛАССА Доказательством теоремы III в первом приближении заканчивает- ся изучение нулевых классов. Что же касается положительных клас- сов, то здесь имеет место следующая общая Теорема IVa. В положительном классе для любых Е} из ^подкласса и Ej из подкласса вероятность стремится jk пределу Pj = d (a)/Mjj9 не зависящему от i, когда п стремится к бесконечности, пробегая ^значения п = у — 0 (mod d (а)).
23. Цепи Маркова со счетным числом возможных состояний 193 Замечание. В случае п ф у — р (mod d (а)), как уже ука- зывалось» Pij) =0. Доказательство теоремы IV требует ряда лемм. Лемма III. В положительном классе для любых i, j и еЛ> 0 существует такое т, что при любом п вероятность, отправляясь от Ei, посетить хотя бы раз Ej в промежутке между п-м и (п + т)-м шагом будет больше 1 — 8. Доказательство. Вероятность, отправившись из Et, не посетить Ej за указанный промежуток времени равна Р= S + = р^=п-^т k=i р=п-[-т—к оо n+m—1 n—1 = 3 Kf;’+ 3 к'№ 3 р<<" + р=п-\-т р=т-|-1 к=п-]-т—р оо п—1 ОО оо + S S рк^=и(т). p=n^m k=l р—тп p=m+l Но если м»= 5 рК%> Р=1 конечно, то при т -> +оо стремится к нулю. Так как U^) не зависит от п, то лемма доказана. Лемма IVa. В положительном классе, состоящем из одного под- класса, lim inf Pij} 0. П-И-00 Доказательство. Если класс состоит из одного подкласса, то существует такое к0, что при к kQ всегда Р$ 0. Выберем по лемме III такое т, что при заданных i и / число*8 леммы III можно принять равным 1/2. Обозначим % = inf {Р$\ Р$+1), . . ., Р$+т)}. Очевидно, X > 0. Пусть теперь п’> т + kQ. Положим пг = п + + т + kQ. Вероятность, отправляясь от Е}, посетить между n-м и (п + тп)-м шагом состояние Ej больше х/2. Пусть в промежутке между n-м и (п + пг)-м шагом первое посе- щение ^произошло после (п + $)-го шага (s < т). Условная вероят- ность при этой гипотезе вернуться в Ej по окончании п' = п + + т + kQ шагов равна P$o+m"s) > %. Это неравенство справедливо при любом 5 (1 т). Поэтому полная вероятность Р$ \ выйдя из Et, прийти через nf = п + т + kQ шагов в Ej удовлетворяет неравенству р^ > г/2к, У А. Н. Колмогоров
194 23, Цепи Маркова со счетным числом возможных состояний чем в силу произвольности п и заканчивается доказательство леммы. Лемма IVb. В положительном классе, состоящем из одного подкласса, lim Р® = ИМц. • П—»оо Док а’з ательство. Сначала докажем самое существование предела Р^ при п -> + оо. Обозначим lim inf P^i = a, lim sup P$ = b. П-*+оо П-*+оо В силу леммы IVa имеем fe > а > 0. Пусть е > 0. Выберем т, удовлетворяющее условиям леммы III при-/ = г. Выберем, далее, такое Ао, чтобы при к к0 имели место неравенства а — 8<Р^<Ы-8. Пусть п > т + кй таково, что Р$ < а +"е, а п' > п + к0 таково, ЧТО Pii Ь — 8 (такие пип' всегда найдутся). Обозначим п' — п = к. Тогда Р^'> = Р$Р%> + А^Р^ + A(2)Pii-2) + ... + Л(п)Р|?), где А^ есть вероятность при условии начала в £г после к-го шага впервые попасть в Et лишь на (к + а)-м шаге. Очевидно, п р« + 3 S—1 i Кроме того, по лемме III т Р® + 3 4(s)>1-8. 3=1 Из этих двух неравенств вытекает, что 3 Л(‘><8. Заметим еще, что при а т соблюдается неравенство п — а к и, следовательно, Pii 8) < Ь 4- 8. Поэтому ш г; п I Р|р = Р$Р$> + з 4(4)PS’S) + 3.4(s)Pli"s) < e=l e=m4-l < Р® (а + 8) + (1 - Р^?) (& +» + 8 = ь; + 28 - PIF (Ь - а). Если же принять во внимание, что Р^р > а — 8, Р<<J > Ъ — в и b — a 1, то получаем Ь — в Ъ + 2в — (а — е) (Ь — а) < b + Зв — а (Ъ — a)t а (Ъ — я) 'С ^е, Ъ — а 4₽/я.
23. Цепи Маркова со счетным числом возможных состояний 195 Так как а > 0, а 0 произвольно, то Ъ — а == 0, что доказывает существование предела равного Ь = а. Из леммы Па непо- средственно вытекает, что этот предел равен i/Мц. Доказательство теоремы IVa. Рассмотрим рядом с заданной нам цепью Маркова новую цепь, определяемую элемен- тарными вероятностями перехода -- _ p(d) Рлз — *4 > где d есть период рассматриваемого класса. Очевидно, в пределах состояний нашего класса рф = р^\ Относительно новой цепи Маркова наш класс состояний образует один-единственный подкласс. Поэтому по лемме IVb lim P%d) = lim РЙ’ = -=- n-*-]-oo n— d • Таким образом теорема IVa в случае i = j доказана. Чтобы дока- зать ее в общем случае, обозначим через q минимальное число ша- гов, в которое может совершиться переход из Е± в Ej (очевидно, q st у — Р (mod d)). Тогда п p(nd+q')_ yi g(md+q)p(nd-md) m=0 3 M При этом S K$d+q} == 1, m=l a p^d-md) При постоянном тп и п -> + оо стремится к d/MИз этого вытекает, что lim P§d+<z) = d/Mn. п-*+со Существенным дополнением к теореме IVa является Теорема IVb. В положительном классе сумма пределов Pj по всем состояниям каждого подкласса равна единице. Теорема IVb непосредственно вытекает из следующей леммы. Лемма V. В положительном классе имеется для любого & О такая конечная система состояний Е^ Е£, . . ., Ejlf, что при любом Ei из того же класса для всех достаточно больших п . Доказате л|ь с т в о. Выберем произвольное т0. По лемме III существует такое тп, что при любом п вероятность, отправляясь из 7*
196 23, Цепи Маркова со счетным числом возможных состояний Ei9, посетить хотя бы раз Ei9 в промежутке между n-м и (п + тп)-м шагом будет больше 1 — е/3. Очевидно, всегда можно выбрать такую систему состояний Е^ Е^ . . ., Ejk, что при любом г т к £т>‘—г- S=1 Мы докажем, что выбранная система состояний удовлетворяет усло- виям леммы. Для этого зафиксируем какое-либо i и выберем такое . д, что Q 1=1 Пусть теперь п т + q, Положим п = q' + т, q' q. С веро- ятностью, большей 1 — е/3, мы за первые qf шагов, отправляясь из Еь попадем в Eie На каком бы шагу <^д' мы ни попали впервые в Е^, с вероятностью, большей 1 — е/3, мы вернемся в Е^ между g'-м и (д' + ?п)-м шагом. Если же это случится на каком-либо (д' + т — г)-м шагу, то с вероятностью, большей 1 — е/3, мы ока- жемся после д' + тп шагов в одном из выбранных состояний Ej* Таким образом, с вероятностью, большей (1 — е/3)3 > 1 — е, от- правившись из Ei. мы придем через п = qf + т шагов в одно из выбранных состояний Ej8. Тем самым лемма доказана, а с ней дока- зана и теорема IVb. Замечание. Из теоремы IVa следует, что не только лЙ* стремится к i/Мц (лемма Па), но и при любом Ej из того же класса, что и Еь стремится к тому же пределу. В силу же теоремы IVb Сумма S (i/Мц). распространенная на состояния одного под- класса, равна 1/й(где d—период класса), а распространенная на все состояния одного класса, равна единице. § 6 АСИМПТОТИЧЕСКОЕ ПОВЕДЕНИЕ ВЕРОЯТНОСТЕЙ В ДРУГИХ СЛУЧАЯХ Мы оставим в стороне такие комбинации состояний Et и Eji для которых Р$ = 0 при всех п в силу рассмотрений § 2, и заме- тим, что если Ej несущественно, то всегда Pty стремится к нулю при п —> + оо. Разберем здесь наиболее сложный случай: Ег не- существенно, a Ej существенно и принадлежит некоторому классу 5<а). Обозначим для несущественного состояния Ег через вероятность, отправляясь от состояния Еь рано или поздно попасть
24, Об обратимости статистических законов природы 197 в одно из состояний класса 5(а\ Очевидно, ЗМа)<1, а так как, попав в одно из состояний класса 5<а), уже нельзя выйти за пределы этого класса. В случае попадания при начальном состоя- нии Ei в класс обозначим через по число шагов до первого попадания в одно из состояний Ej класса 8Ю и чэрез Ро номер подкласса к которому принадлежит это пэрвое состояние Ер Обозначим через N(*\ вероятность при начальном состоянии Ei по- пасть в пределы класса SW так, чтобы п0 = + у (mod d (а)). Очевидно, d(a) ЗМа>=уГ>. Y=1 Можно показать, что имеет место следующая Теорема V. В случае несущественного Ег и существенного Ej из подкласса вероятность Р$ стремится к N^^Pj, когда п _|_ оо, пробегая значения п = р (mod d (a)). Мы видим, таким образом, что при твердых i и / зависимость ве- роятности Р^ от п во всех случаях (существенных или несуществен- ных состояний) будет асимптотически периодической. Средние же всегда имеют при п -> + оо определенные пределы л^. Комаровка, 22 декабря 1936 г. ЛИТЕРАТУРА 1. Kolmogoroff A. Anfangsgriinde derTheorieder Markoffschen Ketten mit unend- lich vielen moglichen Zustanden.— Мат. сб., 1936, т. 1, с. 607—610. 2. Doeblin W. Sur les chaines discretes de Markoff.— C. r. Acad. sci. Paris, 1936, vol. 203, p. 24—26. 3. Khintchine A. Sur la loi des grandes nombres.— C. r. Acad. sci. Paris, 1928, vol. 188, p. 477—479. 24 ОБ ОБРАТИМОСТИ . СТАТИСТИЧЕСКИХ ЗАКОНОВ ПРИРОДЫ * 1 ПОСТАНОВКА ЗАДАЧИ Рассмотрим n-мерное дифференциально-геометрическое многооб- разие R. Обозначим через / (t, х, у) dy^dy^. . . dyn вероятность пере- хода за время t 0 из точки х в какую-либо точку г] с координата- * Zur Umkehrbarkeit der statistischen Naturgesetze.— Math. Ann., 1937, Bd. 113, S. 766—772. Перевод A. M. Яглома.
198 24. Об обратимости статистических законов природы, ми т]ь i р= 1, 2, . . ., п, удовлетворяющими неравенствам yi<Z^i <Z <Z Vi + dyt. Предположим, что функция / (i, ж, у) имеет все произ- водные вплоть до некоторого достаточно высокого порядка и, кроме того, удовлетворяет следующим условиям: / («» % у) > о, # (1) К ‘ k* V х' dyi dy*---dVn — (2) f(s + t, х, у) = ^. (s, х, z)f(t, z, y)dzidz2.. .dzn, (3) S'g’S^’ *' у^ЛУ\Лу%..-dyn-*l при Z->0, (4) если x — внутренняя точка области G (ср. [1, 2]). При заданной функ- ции / (I, х, у) функция р (х) будет определять совместное с / (t, х, у) стационарное распределение вероятностей в том и только в том слу- чае ( когда выполняются условия: Р (*) > 0 (5) й * * •$ р (*) dxi dx*' * ‘ dXn = Р (^) = й ’ “ J Р (Х) / Xi dX1 dX2--- dxn- (7) Стационарное распределение является эргодическим, если при любых хну при t -> оо имеет место соотношение / (t, х, у) -+ р (у). Из формулы (7) следует, что эргодическое стационарное распре- деление всегда является единственным стационарным распределе- нием, т. е. что в случае, когда существует эргодическое стационарное распределение р0 (х), никакое другое, отличное от pQ (х), неэргоди- ческое стационарное распределение р (х) уже не может существовать. Отметим, что в случае замкнутого многообразия R существование эр- годического (и, следовательно, единственно возможного) стационар- ного распределения непосредственно вытекает из одного только усло- вияа что / (t, х, у) > 0 для любых хну при достаточно большом t (ср. [2, § 51)Л Будем считать, что функция / (t, х, у), так же как и какое-то стацио- нарное распределение р (ж), заранее заданы. Помимо того, предпо- ложим еще, что р (х) > 0 при любом х. В таком случае, зная положе- ние у в конце временного интервала продолжительности t, можно также определить условное распределение вероятностей (при задан- ном у) начального положения х. Обозначая плотность этого условного распределения вероятностей через h (t, х, у), будем иметь * у) Р (у) = Р (х) f X, у). (8) Равенство (8), очевидно, однозначно определяет функцию h(t, х, у).
24. Об обратимости статистических законов природы 199 Упомянутый в заглавии настоящей работы вопрос об обратимости статистических законов природы 1 может быть сформулирован сле- дующим образом: при каких условиях имеет место соотношение h (t, х,у) = f (t, у, х)? (9) Настоящая работа посвящена специальному случаю, когда функция / (£, ж, у) удовлетворяет следующим уравнениям Фоккера—Планка: («ч (по поводу этих уравнений см. [2}). Ради простоты мы в дальнейшем ограничимся лишь случаем зам- кнутого многообразия R. В этом случае из (11) вытекает, что каждое стационарное распределение р (у) должно удовлетворять уравнению - У А {Л< (у) р} + У У —(у)р) = 0. (12) А-J ду I ду ду г г 3 В дополнение к. у казанным выше предположениям допустим еще,; что квадратичная форма Вг^ всюду является строго положительно определенной. Случай вырожденной формы Вг? весьма интересен для многих физических вопросов (см., например, [5]), но* в настоящей работе мы его не будем рассматривать. Предположение о поло- жительной определенности формы Вг^ влечет за собой справедливость соотношения / (ж, у. t) > 0 при любых х, у и t > 0, а, следователь- но, также и существование единственного стационарного распределе- ния р (х), где р (х) 0 при любом х. Это единственное стационар- ное распределение р (х) представляет собой единственное решение уравнения (12) такое, что .. .^p(x)dxidxi... dxn — 1. (13) При сделанных предположениях необходимые и достаточные усло- вия справедливости соотношения (9) могут быть непосредственно вы- ражены в виде свойств коэффициентов А* и Вг? уравнений (10) и (11). А именно при указанных выше предположениях для справедливости со- отношения (9) необходимо и достаточно, чтобы определенный ниже вектор а (у)$ компоненты которого выражаются через Аг (у) и Вг} (у), был бы градиентом некоторого скалярного потенциала. В случае, когда Вгэ (у) = 6г\ это условие принимает особенно простой вид, так как здесь а (у) — это не что [иное, как вектор с компонентами (у). 1 Обсуждение этой проблемы для 'случая марковских цепей с конечным числом состояний может быть найдено в работе [3]; ср. также [4].
200 24. Об обратимости статистических законов природы I Сформулируем теперь еще раз принятые нами предположения. 1. Функция f (t, х, у) дифференцируема достаточное число раз и удовлетворяет условиям (1) — (4), (10), (11). 2. Многообразие R является замкнутым. 3. Форма Вг} (у) положительно определена 2. 2 ИНВАРИАНТНАЯ ФОРМА УРАВНЕНИЙ ФОККЕРА-ПЛАНКА Рассмотрим теперь более общий случай, чем тот, с которым мы име- ли дело в разделе 1. А именно теперь мы предположим, что переходы из х в у в течение промежутка, времени между моментами 5 и t s имеют распределение вероятностей, описываемое плотностью вероят- ности / (^, £, х, у). При этом функция / (з, t, х, у) должна удовлетво- рять следующим условиям (ср. [1, 2]): /($, t, х9 у)>0, (14) $•••$/ (М, lO dy\ dy2. ..dyn — i, (15) R f(s, t, x, y) = ^.. и, x, z)f(u, t. z, y}dz19 dz%. .. dzn9 (16) J R xty)dy1dy2-. .dyn-+l при t->s (17) G и ж, лежащем внутри области G. Уравнения Фоккера—Планка в этом случае будут записываться в следующем виде: -'S'/'1,1 = - (», / (S, I.я - i (18) —jr’ ---------£-5р-М*(М)/(М,*,Й> + г j Коэффициенты Bij (з, х) образуют контравариантный тензор второго ранга, в то время как коэффициенты Аг (з, х) преобразуются по следую- 2 Как уже отмечалось, отсюда вытекает, что р (х) > 0 при любом ж»
24. Об обратимости статистических законов природы 201 дему более сложному закону: А =ЛА +7^в (начиная с этого места знак суммы всегда будет опускаться). Будем считать, что квадратичная форма Вгз ($, х) всюду и при лю- бом значении s является положительно определенной^ и выберем эту форму в качестве основной метрической формы многообразия R (за- метим, что введенная нами метрика зависит от $). Положим далее, что а1 ($, х) = Аг (5, х) — iT ($, х), (20) где — символ Кристоффеля, соответствующий метрической форме В*’ (s, х). Контравариантный вектор аг представляет собой вектор, который в каждой геодезической системе координат (в точке х) сов- падает с А\ В выбранной в точке х геодезической системе координат уравнение (18) может быть записано в следующем виде: df/ds = — У (s, х) — №f, (21} где значок (х) указывает аргумент, по которому берется производная, Де означает ковариантную производную, а А — оператор Лапласа, т. е. А = AfA*. Последнее уравнение в силу его инвариантности должно быть справедливым также в любой другой системе координат. При изме- нении координат х функция / (5, t, х, у) не меняется: если, однако,1 изменяются координаты у, то эта функция преобразуется как ска- лярная плотность. Положим теперь / (s, t, х, у) = У | В и (i, z/)|<p (s, t, X, у). (22). Ясно, что функция ф (s, t, х, у) будет уже инвариантной и относи- тельно замены координат х, и относительно замены координат причем она также будет удовлетворять уравнению (21): dy/ds = — аг (s, х) Д<х) ф — Д(х> ф. - (23) Что касается уравнения (19), то оно теперь приобретает следующий вид: л («-(Z, йф) + Д«>ф + 4- ф. (24). з ' РЕШЕНИЕ ЗАДАЧИ ₽ 7 Вернемся теперь снова к случаю, когда выполняются условия, указанные в конце раздела 1. При этом квадратичная форма ВУ (х) Уже не будет зависеть от времени, а только от координат точки х
202 24, Об обратимостей статистических законов природы многообразия R. Положим 1 а*(ж) =4*(ж)-Г? (ж), (25) / (*, х, у) = У \Bif(y) | <р (t, х, у), (26) Р (ж) = УI ви (ж)1 л (х), (27) h (t, х,- у) = У | Bi} (ж) |4 (t, х, у). (28) В таком случае вопрос об условиях справедливости соотношения (9) сводится к вопросу об условиях, при которых имеет место экви- в алентное соотношение 4 (t, х, у) = Ф (t, у, х). (29) В силу результатов раздела 2 функции ф (t, х, у) и л (ж) удовлет- воряют уравнениям dyldt = а’ (ж) Д^ ф + Д(ж>ф, (30) d(fldt = — Д?’ {а4 (у) ф} 4- ДМ ф, (31) -Д?> {а4 (ж) л} + Д(*>л = 0. * (32) Так как, кроме того, 4 (*, ж, У) = ф (?, х, у) л (ж)/л (у), то соотношение (29) можно переписать в виде Ф (I, х, у) л (х) = ф (t, у, х) л (у). (33) Допустим, что соотношение (29), а следовательно и (33), выпел- няется. Переменив местами х и у и воспользовавшись уравнением < (31), можно получить следующее уравнение для ф (t, у, х): dtp/dt = — Af {агф} + Аф (34) (здесь и в дальнейшем все встречающиеся производные — это про- изводные либо по t, либо по х, но никогда не по у, а функции аг за- ( висят лишь от х). Тому же уравнению должна удовлетворять функ- ция ф (t, х, у), а следовательно, и ф (i, ж, у) л (у) = ф (t, х, у)л (х): д (фл)/д£ = — Af (агфл) + А (фл), (35) или л = — лагД$ф — фД$ (а1 л) + лАф + 2 (Дгл) (Д^) + фДл. (36) ; Умножив все члены уравнения (32) на — ф, а все члены уравнения (30) на —л и добавив оба получаемые прп этом равенства к равенст- ву (36), будем иметь 0 = —Зла'Д^ф + 2 (Дгл)(Дгф),
24. Об обратимости статистических законов природы' 203 или (Д,ф)(-с?л + Д*л) = 0. (37) Легко убедиться, что в любой области многообразия R выраже- ние Д$ф не обращается в нуль тождественно (т. е. при любом t > 0). Поэтому на всюду плотном множестве точек ж, а значит (в силу не- прерывности), и всюду —агл + Дгл = 0, —а|Л-Ь Д$л = —о^л + дп!дхг = 0, (38) т. е. = д (log п}1дх\ (39) Обозначая log л = Р, мы видим, что Р — это потенциал а. Тем самым мы доказали, необходимость сформулированного в разделе 1 условия. Пусть теперь, наоборот, известно, что существует Р такоех что at = дР/дх\ требуется доказать, что в таком случае будет справедливо и соотно- шение (29). Легко убедиться, что ер удовлетворяет уравнению (32). Так как, однако, л — единственное решение уравнения (32) такое, что .. Л л У"\Bij(я)| . dxn — 1, то, очевидно, л = (1//)еЛ где J = СС.. С ер У | Bi $ (х) | dxr dx2... dxn. (40) Из (40) последовательно вытекают равенства (39), (38), (37), (36) и (35). Из (35) следует, что ф (t, х, у) удовлетворяет уравнению dty/dt = —&i (агф) + Дф, (41) т. е. тому самому уравнению, которое выше было обозначено как Уравнение (34), справедливое для ф (t, у, х). Начальные условия для ф (t, у, х) и ф (t, х, у) при t = 0, очевидно, совпадают друг с другом. Следовательно, ф (£, у, х) = ф (£, ж, у), что и завершает доказатель- ство нашей теоремы 3. Москва, 1 июля 1936 г. 3 Ср. доказательство теоремы единственности в [2]. Существование непре- рывных производных у коэффициентов Л* и следует из существования до- статочно высоких производных функции /. Условие непрерывности (29) работы 12] в случае замкнутого многообразия R эквивалентно нашему условию (4).
204 25. К решению одной биологической задачи ЛИТЕРАТУРА I 1. уKolmogoroff A. N. Ueber die analytischen Methoden in der Wahrscheinlich- keitsrechnung.— Math. Ann., 1931, Bd. 104, H. 3, S. 415—458. Pyc. neo • УМН, 1938, вып. 5l c. 5-41. 2. Kolmogoroff A. N. z>ur Theorie der steitigen zufalligen Prozesse.—- Math. Ann., 1933, Bd. 108, H. 1, S. 149—160. Рус. пер.: Наст, изд., № 17. 3. Kolmogoroff A. N. Zur Theorie der Markoffschen Ketten.— Math. Ann., 1936. Bd. 112, H. 1, S. 155-160.' . Hostinsky B., Potocek J. Chaines de Markoff inverses.— Bull. Intern. Acad, tcheque sci., 1935, vol. 36, p. 64—67.| 5. Kolmogoroff A. N. Zufallige Bewegungen.— Ann. Math., 1934, vol. 35, N 1, p. 116—117. i ; . 25 К РЕШЕНИЮ ОДНОЙ БИОЛОГИЧЕСКОЙ ‘ЗАДАЧИ* Р. А. Фишер [1] дал интересное приложение теории итераций к вопросу о законах размножения нового гена в неограниченной по- пуляции. Ж. Ф. Стеффенсен недавно [2] дал 1 подробное изложение Этого метода в применении к вопросу о вероятности гибели всего потомства одного индивида. Однако оба эти вопроса математически ’ тождественны. Кратко изложив постановку вопроса и известные ре- зультаты, мы намерены дополнить результаты Фишера и Стеффен- сена в некоторых направлениях. 1 МАТЕМАТИЧЕСКАЯ ПОСТАНОВКА ВОПРОСА Следующие предположения существенны для наших математи- ческих рассуждений. Пусть Fo, . . ., Fn, . . . будет последователь- ность поколений. В поколении FQ имеются Ко индивидов с призна- ком М (ЛГ-индивиды). Скрещивания между тИ-иидивидами ис- ключаются. Всякий ТИ-индивид из Fn+i происходит от определенного М-индивида из Fn. Даны вероятности что некоторый Af-индивид поколения Fn будет иметь ровно к M-потомков в Рп+Х, и эти вероят- ности независимы от судьбы других ветвей М-потомства. Наша задача заключается в том, чтобы определить вероятнос- ти Р^ (п 1) того, что число Кп М-индивидов в n-м поколении равно к. При этом Р^ есть вероятность гибели 7И-потомства. Вероят- ность Р^п), очевидно, вместе с сможет только возрастать. .Главный результат настоящей работы состоит в определении асимптотическо- го течения Р0П/ при больших п. ♦ Изв. НИИ мат. и мех. Томск, ун-та, 1938, т. 2, вып. 1, с. 7—12. 1 У Стеффенсена можно найти указания на старую литературу.
25. К решению одной биологической задачи f 2С5 Мы предполагаем, что три первых факториальных момента а = Pi 2р2 + . . . + крк + . . . b = 2р2 + 6р3 + • • • + к (к — 1) рк + . . . с = &Рз + 24р4 + . . . + к (к — !)(& — 2) рк + • • • конечны. 2 БИОЛОГИЧЕСКИЕ ОБЪЯСНЕНИЯ Кп означает число тех М-индивидов в n-м поколении, которые достигли определенного возраста. В предполагаемые заданными вероятности рк включается, следовательно, и влияние отбора. Если, например, у взрослого М-иидивида всегда бывает очень большое число т М-потомков следующего поколения, имеющих, однако, очень небольшую вероятность alm достигнуть возраста, намеченного для определения Кп, то получим Рк = Ст (1 — а/m)™"1* (а/т)\ или приближенно по формуле Пуассона /. к В этом случае легко, вычисляется, что Ь = а2, с = а3. Величина, имеющая наибольшее влияние на судьбу M-поколе- ния, это первый момент а, т. е. среднее число М-потомков одного М-индивида в последующем поколении. Если Кп очень велико, то мы приближенно имеем — аКп. Следует различать три случая,существенно отличных друг от друга, в зависимости от того, будет ли а больше, меньше или равно единице. Если а 1, то без всякого вычисления ясно, что в конце концов М-потомство должно исчезнуть. Мы далее доказываем, что этот ре- зультат остается в силе еще и при а = 1, Ъ > 0. Если а 1, то мы имеем отличную от единицы вероятность Ро вымирания М-потомст- ва (Ро = lim Р^ при п -> оо). Вероятность того, что потомство не погибнет, а размножится неограниченно, равняется 1 — Ро. Исключение а = 1, 6=0 возможно лишь в том случае, если Pi = 1, рк = 0 (к 1). В этом случае 2ГП, очевидно, всегда равня- ется KQ и, следовательно, Р^ всегда равно пулю. Конкретная задача, которая привела к исследованиям Фишера, состоит в следующем.
206 25. К решению одной биологической задачи | " ' I В очень большой стационарной популяции, состоящей исключи- тельно из индивидов типа ВВ, появляется небольшое количество индивидов типа ВЪ (поколение 50). Если в дальнейших поколениях Pi-» Fz, • • • 56-потомство остается сравнительно немногочисленным, то Bb X 56-скрещения практически исключаются. При этом пред- положении наша схема применима к 56-потомству. Если а = 1, то 56-индивиды обладают той же жизнеспособностью, что и 55-индивиды. Однако вследствие случайных колебаний числа Кп они непременно должны вымирать (случай а = 1, 6=0 здесь невозможен). Тем более исчезают 56-индивиды,, если a <Z 1. Если а }> 1, то имеется положительная вероятность 1 — Ро, что 56-ин- дивиды размножатся неограниченно (неравенство а 1 соответст- вует предположению, что 56-индивиды обладают большей жизнеспо- собностью, чем 55-индивиды). В действительности же случайные колебания Кп и при а = 1 могут оказаться столь большими, что скрещения 56 X 56 получают неисчезающую вероятность. Тогда приходится принимать в расчет и жизнеспособность 66-индивидов. ЗОБЩАЯ ТЕОРИЯ Главный результат Фишера и Стеффенсена состоит в сведении вычисления вероятностей Р^ к определению коэффициентов извест- ных степенных рядов. С этой целью полагают Я (х) = р0 + Pix + № + . • . + Ръх* + . . (2) Q{n) (ж) = + Р^х + Р £п)х2 + + Р^х* + ... (3) Так как рк < 1, P£n) 1, то q (х) и (х) при | х | < 1 — аналити- । ческие функции. Пусть будет gw (х) п-й итерацией q (х): Я1 (х) = Я (ж), Я"*1 (х) = q (qn (я)). Главной формулой всей теории является следующая 2: (х) = [?п (4) ! В частности, Р<П> = (?(п) (0) и, следовательно, Р^ = lgn (0)1к% (5) Ро = lim = lim [дО (0)]к« = п -> оо. (6) Предел X = lim gn (0), п —* оо, 2 Ср. [2]. Впрочем, читатель сам легко воспроизведет доказательство» ।
25. К решению одной биологической задачи 207 определяется из общей теории итераций. Доказывается, что X равня- ется наименьшему неотрицательному корню уравнения 3 g (X) _ % = о. (7) Такой корень существует, так как q .(1) = Ро + Pi + • • • + Рк + • • • = 1, q (1) — 1 = 0. Далее доказывается, что в случае а > 1 искомый наименьший корень % меньше единицы. В этом случае мы имеем, следовательно, положительную вероятность ! _ р0 = 1 _ неограниченного размножения М-потомства. Если, напротив, а 1 (и в случае а = 1 еще и Ь> 0), то необходимо X = 1 и, следователь- но, Ро = 1- ^/-потомство в этом случае с необходимостью должно' вымирать. Поэтому желательно исследовать асимптотический ход вероятности = 1 — выживания до n-го поколения. Ни Фишер, ни Стеффенсен этого не сделали при общих предположениях. 4 АСИМПТОТИЧЕСКИЙ ХОД 7?(п) В СЛУЧАЕ а < 1 Пусть будет rn = 1 - (0), гп при п —» оо в нашем случае сходится к нулю. Следовательно, при тг —» оо асимптотически имеется 7?(n) = l_[9n(O)]K«=i_(l_rn)K’~2i:orn. . (8) Остается исследовать асимптотический ход гп. Заметим прежде все- го, что q' (1) = а, а при 0 < х < 1 . о < q" (*) < g" (1) = b, 0 < (х) < (1) = С. Теперь пусть будет а < 1. Если разложить q (1 — у) в строку Тейлора, то получится q (1 - у) = q (1) - q' (1) У + О (у2) = 1 - ау + о (у*). 8 Ср. [2].
208 25. К решению одной биологической задачи Положим у = Гп-! = 1 — (0), тогда получится 1 rn = 1 - (0) = 1 - q [д’1'1 (0)J = 1 - q (1 - rn_x) = arn^ + О (r2_i), rn/rn-! = a [1 + О (Гп-i)]. (9) Из (9) после некоторых простых рассуждений следует, что асимп- тотически гп ~ Cd* , (10) причем С — подходящая постоянная. Вследствие (8), наконец, име- ет место формула RW ~ CKQan. (И) Мы, таким образом, видим, что в случае а < 1 вероятность R^ асимптотически убывает по геометрической прогрессии со знамена- телем а. Пусть будет а = q’ (1) = 1. В таком случае ?(1 — У) = У(Д) — +1/zq"(i)y2 +P(ys) = i — y + 1/2by2 + O(y3), rn = 1 — gn(0) = 1 — q (1 — Гп-i) = Гп-i — VaMLi + О (Tn-i), rnlrn-i = 1 — Vabrn-i + О (г®_1). (12) Из (12) вытекает, что асимптотически (при Ь 0) rn ~ 2/пЬ. (13) Вследствие (8), наконец, будет ' । R<V ~ 2K<Jnb. (14) Таким образом, мы видим, что в случае а = 1 5(п) приближается к нулю существенно медленней. Формула (14) показывает, что в слу- чае о = 1 при большом п вероятность выживания до n-го поко- i ления обратно пропорциональна второму моменту Ь. В частности, в случае применимости для вероятностей ps формулы Пуассона (1) Ь = а2 = 1 и, следовательно, R™~2KJn. < Эта формула указана у Фишера. В качестве второго примера мы рассмотрим случай, в котором каждый 56-индивид дает после скре- ( щивания Bb X ВВ ровно два потомка. Здесь будет р0 = 1/4, Р} = = Pz = V<. Pk — 0 (* > 2), откуда b = V2 и RW = 4/Г0/п. 5 ПРИБЛИЖЕННАЯ ФОРМУЛА Теперь вернемся к случаю а > 1. Но предположим, что со = а — 1 „ абсолютно и по’отношению к Ъ > 0 мало. В этом случае и р = 1 — X
26, Об одном -новом подтверждении законов Менделя 201> мало и можно положить приближенно q (X) = q (1 — fl) ~ 1 — / (1) И + Чм" (1) р,2 = 1 — ар, + + W- Уравнение (7) дает g (X) — X ~ 1 — ар, + — 1 + р = —сор, + Vafyx2 = О, . р - 2со/Ь, (15} X ~ 1 - 2со/Ь. (16) Если со в сравнении с KQ мало, то из (15) и (16) следует приближен- но 1 - Ро ~ 2К0(д/Ь9 т. е. вероятность 1 — Ро неограниченного размножения M-потом- ства прямо пропорциональна коэффициенту отбора и обратно про- порциональна второму моменту Ь. ЛИТЕРАТУРА 1. Fischer R. A, The genetical theory of natural selection. Oxford, 1930. 2. Stefjenson J. F. Deux problcmes du calcul des probability.— Ann. Inst. H. Poincare, 1933, vol. 3, p. 331—334. 26 ОБ ОДНОМ НОВОМ ПОДТВЕРЖДЕНИИ ЗАКОНОВ МЕНДЕЛЯ* В происходившей осенью 1939 г. дискуссии по вопросам генетики много внимания уделялось вопросу проверки состоятельности за- конов Менделя. В принципиальной дискуссии о состоятельности всей менделевской, концепции было естественно и законно сосредоточить- ся на простейшем случае, приводящем, по Менделю, к расщеплению в отношении 3: 1. Для этого простейшего случая скрещивания А а х X А а при условии доминирования признака А над признаком а мен- делевская концепция приводит, как известно, к выводу, что в доста- точно обширном потомстве (безразлично, составляющем одно семей- ство или объединяющем много отдельных семейств, полученных от различных пар гетерозиготных родителей типа Аа) отношение числа особей с признаком А (т. е. особей типа АА или Аа) к числу особей с признаком а (типа аа) должно быть близким к отношению 3 : 1. На проверке этого простейшего следствия из менделевской концепции и сосредоточили свое внимание Т. К. Енин [1, 2], Н. И. Ермолаева * ДАН СССР, 1940, т. 27, с. 38-42.
210 26. Об одном новом подтверждении законов Менделя 13] и Э. Кольман [4]. Между тем менделевская концепция не только приводит к указанному простейшему заключению о приближенном соблюдении отношения 3:1, но и дает возможность предсказать, каковы должны быть в среднем размеры уклонений от этого отноше- ния. Благодаря этому как раз статистический анализ уклонений от отношения 3 : 1 дает новый, более тонкий и исчерпывающий способ проверки менделевских ^представлений о расщеплении признаков. Задачей настоящей заметки является указание наиболее рациональ- ных, по мнению автора, методов такой проверки и их иллюстрация на материале работы Н. И. Ермолаевой [3]. Материал этот, вопре- ки мнению самой Н. И. Ермолаевой, оказывается блестящим новым подтверждением законов Менделя х. § 1 ОБЩИЕ ЗАМЕЧАНИЯ О РОЛИ СЛУЧАЯ В ЯВЛЕНИЯХ НАСЛЕДСТВЕННОСТИ Станем сначала на точку зрения, независимую от менделизма. Пусть в результате скрещивания двух особей аир получается по- томство из п особей. Обычно при этом каждая из двух особей аир производит число гамет значительно большее, чем число потомков п. Пусть а производит гаметы а1, ^2> • • •» а Р — гаметы Рг» • • •> Какие именно из весьма большого числа ки к2 возможных пар гамет будут действительно использованы для получения потомства, зави- сит от многих обстоятельств. Эти обстоятельства законно разделить на внутренние, определяемые биологическими свойствами особей а и р и гамет а$ и рь и на внешние, независимые от этих биологиче- ских свойств. Например, при опылении у растений решение вопро- са о том, какие именно из пыльцевых зерен попадут на рыльце, а ка- кие нет, или о том, каково будет расположение на рыльце попавших на него зерен, зависит, от бесчисленного множества факторов совер- шенно внешнего по отношению к биологическим закономерностям характера. При изучении биологических закономерностей следует считать эти внешние для них обстоятельства оплодотворения слу- чайными и применять к ним аппарат теории вероятностей. Выбор п пар (ait’ Ря)’ Pjt)’ • • •» (ain’ возможен S— n! (*!- П)! (ka- n)! 1 На работу H. И. Ермолаевой обратил мое внимание А. С. Серебровский.
26. Об одном новом подтверждении законов Менделя 211 различными способами. В соответствии со сказанным выше дальней- шее исследование должно исходить из предположения, что биологи- ческими факторами определяется для каждого из этих возможных способов выбора лишь некоторая вероятность его действительного осу- ществления. Вывод менделевских законов основывается (см. далее § 2) на прос- тейшем допущении, что вероятности, соответствующие любому из этих $ возможных способов выбора, одинаковы (и, следовательног все равны 1/$). Биологически это допущение означает равную жизне- способность гамет, отсутствие селективного оплодотворения и рав- ную жизнеспособность (по крайней мере до момента подсчета потом- ства) особей, получающихся от любой парной комбинации гамет. Назовем эту простейшую гипотезу для краткости гипотезой не- зависимости (вероятности того или иного набора гамет, используе- мых для получения потомства, от их биологических особенностей). Как и всякая другая гипотеза о независимости одних явлений от других, интересующая нас гипотеза, взятая в виде абсолютной дог- мы, не допускающей никаких коррективов, неверна: существует це- лый ряд твердо установленных примеров уклонений от этой гипоте- зы, иногда количественно незначительных, а иногда и очень крупных. Ясно, сколь неосновательной была бы точка зрения, пытающаяся вовсе отрицать роль внешних с биологической точки зрения случай- ных обстоятельств в подборе гамет, участвующих в оплодотворении. Серьезный спор может идти между такими двумя точками зрения. 1. Гипотеза независимости в большинстве случаев является хо- рошим первым приближением к действительному положению вещей (сторонники менделевской и моргановской генетики). 2. Селективное оплодотворение и неравная жизнеспособность играют всюду столь решающую роль, что рассмотрения, опирающие- ся на гипотезу независимости, для биологии бесплодны (школа акад. Т. Д. Лысенко). § 2 РАСЩЕПЛЕНИЕ В ОТНОШЕНИИ 3 : 1 Вернемся теперь к более специальным менделевским допущениям для случая скрещивания А а X А а и доминирования признака А. В этом случае принимается, что каждый из родителей образует столь- ко же гамет типа Л, как и гамет типа а, пары гамет типов А А и Аа дают потомков, обладающих свойством Л, а пары гамет типа аа — потомков, обладающих свойством а. Из этих предположений в соеди- нении с допущением, что kr и к2 несравненно больше, чем и, и с ги- потезой независимости получается вывод: I. Вероятность того, что в группе из п потомков окажется ровно особей с признаком Л (остальные же с признаком а) равняется Рп(т)=—гт^—rrfX) Н-) . (1) ' ' ml (n — ш)! \ 4 ( \ 4 / ' '
212 26. Об одном новом подтверждении законов Менделя Пусть теперь произведено большое число г скрещиваний Аа X X А а и от каждого из них получено по семейству из Пх, п2, . . пг особей, из числа которых соответственно mi, т2, . . ., тп/ обладают признаком А. Спрашивается, как возможно полнее про- верить, согласуется ли такой результат опыта с менделевскими допу- щениями или нет? Если число особей в каждом семействе очень мало (например, меньше 10), то целесообразно непосредственно проверять формулу (1) при помощи %а-критерия Пирсона. Если каждое семейство сравнительно многочисленно, то целесо- образнее другой метод. В этом случае из (1) вытекает: II. Нормированные уклонения Д = (т!п — 3/4) : оп, где ’ оп = V 3/4 У п, подчиняются приближенно закону Гаусса с единичной дисперсией, т. е. вероятность неравенства Д < я приближенно равна Р(х) = -±= £ (2) ]/ 2л J Здесь an = 3/4 п есть среднеквадратичное уклонение частоты mln от 3/4. Мы видим, что это среднеквадратичное уклонение пропор- ционально 1/|/\. Следовательно, только в случае очень больших семейств менделевская теория предсказывает большую близость час- тоты т!п к 3/4. Например, чтобы с вероятностью 0,99 можно было бы утверждать, что | т!п — 3/4 [ < 0,01, п должно быть больше 12 000. Зато рассмотрение большого числа семейств средней величины дает возможность гораздо более тонкой проверки менделевских допуще- ний при помощи рассмотрения распределения уклонений Д. В част- ности, из формулы (2) вытекает, что вероятность неравенства | Д | 1 приблизительно равна 0,68. Следовательно, по менделевской тео- рии среди достаточно большого числа семейств должно быть прибли- зительно 68% с Д 1 и приблизительно 32% С [ Д | > 1. В работе
26. Об одном новом подтверждении законов Менделя 213 н. И. Ермолаевой [3] для проверки этого следствия менделевской теории пригодны серия из 98 семейств с расщеплением по окраске цветка и пазухи листа (табл. 4 работы Ермолаевой) и серия из 123 се- мейств с расщеплением по окраске семядолей (табл. 6 работы Ермо- лаевой). Остальные серии содержат слишком мало семейств (или групп семейств) для надежной проверки. Результаты приведены в следующей таблице 2. Число семейств Расщепление (по окраске) цветка и пазухи листа Расщепление (по окраске) семядолей Теоретически, % Общее 98 100% ’ 123 10096 100 С |Д|< 1 66 67% 85 69% 68 С |Д| > 1 32 33% 38 31% 32 При указанном числе семейств в серии совпадение с теорией сле- дует признать очень хорошим. В силу странного недоразумения сама Н. И. Ермолаева утверждает в своей работе, что наличие замет- ного процента семейств с [ Д | > 1 опровергает менделевскую теорию. Можно было бы провести аналогичную проверку совпадения с теорией процента семейств, для которых | Д | а при каком-либо а Ф 1. Например, теория предсказывает, что приблизительно у 50% семейств должно быть | Д | 0,674. Однако лучше всего сразу про- извести полную проверку близости фактически наблюдаемого рас- пределения уклонений Д к теоретическому гауссовскому. Для этого вычерчиваем на одном и том же чертеже теоретическую кривую У = Р (х) в соответствии с формулой (2) и эмпирическую ступенча- тую кривую У = У (х)/г, где г обозначает общее число семейств в данной серии, a q (х) — число семейств в серии, для которых Д х. Результаты такой проверки для двух интересующих нас серий Н. И. Ермолаевой показаны на рис. 1 и 2. Как видно, совпадение эмпирической и теоретической кри- вой в обоих случаях получается достаточно хорошее. Чтобы оце- нить, является ли наблюдаемое между ними расхождение допусти- мым при данной численности серий, следует воспользоваться выве- денными мною ранее формулами (см. [5]). Для случаев, изображен- 2 Сводная табл. 1 работы Н. И. Ермолаевой содержит несколько отличные Цифры, чем приводятся здесь, так как она учитывает некоторые семейства (2 в первой серии и 4 во второй серии), не внесенные по неизвестным нам причи- нам в табл. 4 и 6. Наша сводная таблица охватывает только семейства, представ- ленные в табл. 4 и 6. Однако следующие ниже выводы остаются без изменений, если исходить из данных .сводной табл. 1 Н. И. Ермолаевой.
214 26. Об одном новом подтверждении законов Менделя ных на рис. 1 и 2, находим по этим формулам = 0,82, Х2 = 0,75, ф (^) = 0,49, Ф (Л2) = 0,37, что вполне удовлетворительно. Мы видим, таким образом, что болыпей близости частот mtn по отдельным семействам к их среднему значению 3/4, чем получилось у Н. И. Ермолаевой, при данной численности семейств и нельзя было бы ожидать по менделевской теории. Если бы в какой-либо достаточно обширной серии семейств ук- лонения mln от 3/4 были бы систематически меньше, чем требует тео- рия, то это в такой же мере опровергало бы применимость к этой серии семейств сформулированных выше допущений, как и система- тическое превышение теоретически предсказываемых размеров этих уклонений. Намек на такую систематическую чрезмерную близость частот т!п к 3/4 имеется в материалах работы Т. К. Енина [1]. Одна- ко материалы этой работы недостаточно обширны (25 семейств по сравнению с двумя сериями в 98 и 123 семейства у Н. И. Ермолае- вой) и возбуждают ряд других сомнений (сам автор считает их не вполне однородными). Поэтому в детальное их рассмотрение мы вхо- дить не будем. Из упомянутых в начале заметки работа Э. Кольмана, не содер- жащая нового фактического материала, а посвященная анализу ма- териалов Т. К. Енина, целиком основана на непонимании изложен- ных в нашей заметке обстоятельств. 20 февраля 1940 г. ЛИТЕРАТУРА 1. Енин Т. Я.- ДАН СССР, 1939, т. 24, с. 176-178. 2. Енин Т. К.— Докл. ВАСХНИЛ, 1939, № 6. 3. Ермолаева И. И.— Яровизация, 1939, т. 2 (23), с. 79—86. 4. Кольман Э.— Яровизация, 1939, т. 3(24), с. 70—73. 5. Романовский В. Математическая статистика. М.; Л., 1938, с. 226.
21* Стационарные последовательности в гильбертовом пространстве 215 27 СТАЦИОНАРНЫЕ ПОСЛЕДОВАТЕЛЬНОСТИ В ГИЛЬБЕРТОВОМ ПРОСТРАНСТВЕ* ВВЕДЕНИЕ Определение 1. Последовательность {х (t)} элементов ком- плексного гильбертова пространства Я, где t пробегает все целые значения от —оо до + ©о, называется стационарной, если скалярные произведения Вхх ik) = (x{t + k), x(t)) (0.1) не зависят от t. Определение 2. Две стационарные последовательности {х (t)} и {у (t)} называются стационарно связанными, если скалярные произведения Вух (к) = (у {t + к), X (0) (0.2) не зависят от t. Из определения величин] Вух (к) и В** (к) непосредственно выте- кает, что Вху (к) = Вух (- к), (0.3) ВХх (&) = Вхх (— &)• (0-^) Такого рода стационарные и стационарно связанные последова- тельности имеют большое значение в теории вероятностей и матема- тической статистике. В терминах теории вероятностей они под- вергнуты подробному изучению в книге X. Волда [1] и в статье X. Крамера [2]. Мы излагаем основные результаты X. Волда и X. Крамера в тер- минах геометрии гильбертова пространства в § 3 и в § 7. Все новые проблемы, которые изучаются и решаются в настоящей работе, тоже возникли на почве теории вероятностей и математичес- кой статистики. Применения полученных нами результатов к за- дачам экстраполирования и интерполирования стационарных ря- дов случайных величин подробно освещены в моей статье [7]. Следующая теорема показывает очень простую связь, которая существует между стационарными и стационарно связанными по- следовательностями и унитарными операторами. Теорема 1. Пусть последовательности (0), {Xz (0},. . ., {хп (0) * Бюл. МГУ. Математика, 1941, т. 2, вып. 6, с. 1—40.
216 27. Стационарные последовательности в гильбертовом пространстве стационарны и попарно стационарно связаны и пусть есть минимальное линейное замкнутое подпространство простран- ства Н, содержащее все элементы этих последовательностей. Тогда равенства Ux^ (t) = х^ (t + 1), pt = 1,2,. . ., п, —оо < t < +оо, однозначно определяют унитарный оператор отображающий пространство на самого себя. Эта теорема позволяет получить ряд основных свойств стационар- ных и стационарно связанных последовательностей в качестве не- посредственных следствий известных результатов спектральной тео- рии унитарных операторов. Таков характер всех теорем § 3—6. Более своеобразными и существенно новыми представляются нам результаты § 8—10, § 1—2 имеют вспомогательный характер. Теорема 1 непосредственно вытекает из определений 1 и 2 и лем- мы 1, доказанной в § 1. § 1 ДВЕ ЛЕММЫ Пусть на каком-либо подмножестве М пространства Н определен оператор Тх = у со значениями из Н. Оператор Т называется изометрическим, если для любых х и у из М (х, у) = (Тх, Ту). (1.1) Пусть Нм есть минимальное замкнутое линейное подпространство пространства Н, содержащее М. Тогда имеет место следующая Лемма 1. Оператор Т может быть продолжен с сохранением изометричности на все пространство Нм- Такое продолжение един- ственно. Для доказательства леммы выберем в М всюду плотную последо- вательность элементов z15 z2, . . zn, . . . • (1.2) Из этой последовательности выкинем все элементы zn, которые ли- нейно зависят от предшествующих им zk. Получится последователь- ность Zn2, • • •? • •, (1.3) для которой множество! R всех элементов z вида z = а^П1 4- a2Zn2 4- ... 4- а^Пр (1.4)
2^, Стационарные последовательности в гильбертовом пространстве 217 содержит все элементы последовательности (1.2) и всюду плотно на Ям- Так как элементы множества R представимы в виде (1.4) един- ственным образом (в силу линейной независимости элементов после- довательности (1.3)), то формула = dyTznt + a2Tzni 4” • • . 4" йрТ%пр (1*5) однозначно определяет некоторый оператор Т7* на R. При этом для любых z' и zn из R (z', z”) = (T*z', T*z"), т. е. оператор Т* изометрический на Я. По непрерывности его можно продолжить с сохранением изометричности на все пространство Нм- Так как-все элементы последовательности (1.2) входят в 7?, то из формулы (1.5) вытекает, что для всех элементов (1.2) = Tzn; по непрерывности это равенство соблюдается и на всем множестве М. Существование требуемого продолжения доказано. Любое другое изометрическое продолжение оператора Т в силу формулы (1.5) совпадает с Т7* на множестве R. По непрерывности такое совпадение сохраняется и на всем Нм- Следовательно, изомет- рическое продолжение Т на все пространство Нм единственно. Лем- ма доказана. Лемма 2. Для того чтобы в пространстве Н существовала последовательность элементов ^2> • • м ип> • • •« удовлетворяющая условиям (ит$ ип) ~ стп1 1» 2, . . ., (1.6) необходимо и достаточно, чтобы при любых к, тъ т2, . . ., т^ мат- рица || cmi7n, || была эрмитовой неотрицательной, т. е. чтобы было 1 к $= 2! (1*7) для любых комплексных g2, • • •, Чтобы доказать необходимость условия (1.7), рассмотрим элемент пространства Н и = В1^7П1 + 4" Легко вычислить, что || u f = (и, и) = S. (1.8) Так как всегда || и ||2 0, то из (1.8) вытекает (1.7). 1 Здесь, как и во всем дальнейшем, а 0 означает, что а действительно и неотрицательно.
218 27. Стационарные последовательности в гильбертовом пространстве Переходим к доказательству достаточности условия (1.7). Пред- положим в соответствии с этим условием, что при каждом п sn= 3 i, 3=1 Найдем преобразование 3=1 которое приводит форму Sn к виду т ^=Shil2. i=l Выберем в Н ортогональную нормированную систему векторов z<n> zln) z(n) Z1 > z2 > • • •» zm И ПОЛОЖИМ = 3 ~ 1, 2,..., n. j=l Легко вычислить, что тогда (ut\ u<n)) = Произведя это построение для всех положительных целых п, постро- им последовательность Ui, п2, . . ип, . . . следующим индуктивным процессом: 1) положим 1*1 — Ui , 2) предполагая ult и2, . . Г, уже'найденными и удовлетворяю- щими требованию (1.6), для всех тп, п N положим TNUn+1 = ип, n = 1, 2, . . АГ. На множестве М$ = {i4W+1),. • •, оператор Тц изометричен. По лемме 1 его можно продолжить с сохранением изометричности на пространство Hmn- Так как пространства Hmn и конеч- номерны, то оператор Тц можно продолжить с сохранением изомет- ричности на все пространство Я (см., например, теорему 2.49 книги М. Стоуна [3]). Выбрав такое продолжение, положим un+i = Т wujv+i1). Очевидно, что элементы ult и^,. . ., wn+i удовлетворяют условию (1.6) при всех m, п < N 4- 1.
27 Стационарные последовательности в гильбертовом пространстве 219 § 2 ОПЕРАТОРНОЕ ИСЧИСЛЕНИЕ В ПРОСТРАНСТВЕ Н В соответствии с теоремой 1 обозначим через Нх минимальное замкнутое линейное подпространство пространства Н, содержащее все элементы стационарной последовательности {х (t)}, и рассмот- рим унитарный оператор U^, определяемый равенствами Ux х (0 = х (t 4- 1). (2.1) Пусть л Ux= $ e*dExW (2.2) —Я есть спектральное представление 2 оператора Ux. Положим для — л X + зт Fxx (Л) = И | Ех (X) х (0) |2. (2.3) Следуя изложению М. Стоуна (13, гл. 6, § 1]), обозначим через /Д класс всех измеримых относительно Fxx (X) комплексных функ- ций, определенных на отрезке —л X л, для которых интеграл л J . (2.4) —Я конечен. Две функции <рх и’ср2 класса Lx б удем’считать тождественными, если Ф1 (Ь) = Ф2 РО почти всюду относительно Fas (X). Каждой функции <р класса Lx соответствует (см.. [3, теорема 6.1]) оператор я Г(ф)= J <f(K)dEx(k), (2.5) —Я 2 См. по поводу спектральных представлений линейных операторов книгу М. Стоуна [3]. Заметим здесь, что во всем дальнейшем употребляются лишь Разложения единицы Е (X), соответствующие унитарным операторам, для кото- рых Е (-—л) = 0 и Е (+л) = 1. К ним применимы все теоремы книги М. Стоуна, Употребляемые далее, которые сформулированы в этой книге для более общего случая разложений единицы, соответствующих спектральному представлению самосопряженных операторов в виде оо А — Хй£(Х).
220 27. Стационарные' последовательности в гильбертовом пространстве область определения б (ф) которого состоит из всех тех элементов z пространства Нх, для которых интеграл л $ |ф(Х)|М|£(Х)2|2 (2.6) —л конечен. Из конечности интеграла (2.4) вытекает, что х (0) принад- лежит б (<р) для любой; функции^) из класса Lx. Поэтому каждой функции ср класса 1?х соответствует определенный элемент я 2ф = Т1(ф)^(О)= $ ф(Х)ЙЕя(Х)х(0) (2.7) —л пространства Нх. Введенные обозначения позволяют сформулировать следующие две леммы, которые являются почти непосредственными следствиями теорем 6.1 и 6.2 М. Стоуна [3]. Лемма 3. Отображение Ф Т (ф) отображает класс 1?х взаимно однозначно на класс 3~х всех операто- ров Т, представимых в виде (2.5), где ф принадлежит L*. При этом аф -> аТ (ф), (За) Фх + Ф2 Т (Ф1) + Т (ф2); (ЗЬ) если фхф2 принадлежит Lx, то Ф1Ф2 Т (фх) Т (ф2) = Т (ф2) Т (фх), (Зс) е™ (3d) если хк (ц) = 1 при р X и хк (и) = 0 пРи И 1710 %к^Ех (X). (Зе) Лемма 4. Отображение . ф Z<p отображает класс 1?х взаимно однозначно на все пространство Нх. При этом аф -> аиф, (4а) Ф1 + Фг “» гФ1 4- «ф,; (4Ь) если фхф2 принадлежит Lx, то Ф1Ф2 -> Т (ф^Зф, =\Т (ф2) «ф„ (4с) е<а <р _> Utz?,, (4d) Хх (ф) -> Ех (X) Зф, • (4е)
27. Стационарные последовательности в гильбертовом пространстве 221 п (Zq>„ гф2)= $ <р1(Х)ф2(М^х(Ч t . (4f) —Я (Ех (^) Z(pt, £ф2) = <pi (X) фз (A,) dFxx (X). (4g) —л Свойства (За), (ЗЬ) и (Зс) отображения <р -> Тф вытекают из тео- ремы 6.2 М. Стоуна [3]. Свойства (3d) и (Зе) можно вывести из срав- нения формулы (2.5) с формулами Ux = $ ейЧЕж(Х), (2.8) —Л . X л Exfy) = dEx(ц) = %х(Р')^^х(Р')’ (2«9) —л —л Взаимная однозначность отображения ф Т (ф) вытекает из того, что при фх Ф ф2 (в смысле определения; тождества, принятого в L*) разность л Т (Ф1) х (0) - Т (ф2) х (0) = $ [Ф1<Х) - ф, (%)] dEx (X) х (0) —« имеет норму} л л $ |Ф1(Х)-ф2(Ь)|М|Ех(Ь)х(0)\*= $ |Ф1(%)-Ф2(Х)|2^хх(Х)^0 —л —л и, следовательно, Т (фт) х (0) #= Т (ф2) х (0). Для доказательства леммы 4 заметим следующее: множество всех элементов Нх, представимых в виде (2.7), где ф принадлежит LXi является по теореме 6.2 М. Стоуна [3] замкнутым линейным под- пространством пространства Нх, так как] л x(t) = Uxx(Q) = J e^dE*(k)xt(Q) (2.10) —Л И функция, принадлежит Lx, то Я? содержит все х (t), откуда вытекает, что 3» = Нх. После этого замечания лемма 4 в части однозначности соответствия Ф-Мф и его свойств (4а), (4Ь) и (4f) становится непосредственным: следствием теоремы 6.2 М. Стоуна [3].
.*222 27. Стационарные последовательности в гильбертовом, пространстве Свойства (4с), (4d) и (4е) соответствия ф z<p вытекают из соот- ветствующих свойств (Зс), (3d) и (Зе) отображения ф -> Т (ф). На- конец,4 из (4е) и (4f) вытекает (4g): л (Ех (%) z^, аф1) == J [%* (ц) <Р1 (fl)] ф2 (fl) dFxx (fl) = —Л С’1 5 Ф1 (М фз (^) &&хх (М* —Я Таким образом, леммы 3 и 4 доказаны. § 3 ОСНОВНЫЕ СПЕКТРАЛЬНЫЕ СВОЙСТВА Т е о р е м а 2. Для любой стационарной последовательности {х (t)} величины Вхх (к) можно представить в виде л вхх(к)= $ ^dFxx(K), (3.1) —Я где Fxx есть действительная непрерывная справа неубывающая функ- ция, определенная на отрезке —л X л, для которой Fxx (- л) = 0. (3.2) Функция Fxx (%), удовлетворяющая перечисленным условиям^ определяется однозначно по величинам Вхх. Заметим здесь же, что функция Fxx (X), которую будем называть в дальнейшем спектральной функцией последовательности {х (£)}, как явствует из дальнейшего, совпадает с функцией, определенной в § 2 формулой (2.3). Т е о р е м а 3. Если две стационарные последовательности {х (t)} и {у (t)} стационарно связаны между собой, то я Bxy(k)= $ eikKdFX!,(b), (3.3) —Я где Fxy (X) есть (вообще говоря, комплексная) непрерывная справа функция с ограниченным изменением, определенная на отрезке — л X л, для которой (-л) = 0. . (3.4) Функция FXy (к), удовлетворяющая перечисленным условиям, опреде- ляется однозначно по величинам Вху. Так как каждая стационарная последовательность стационарно связана сама с собой, теорема 2, за исключением утверждения о том, что функция Fxx (%) является действительной и неубывающей, мо- жет рассматриваться как частный случай теоремы 3.
27» Стационарные последовательности в гильбертовом пространстве 223 Для доказательства теоремы 3 рассмотрим спектральное пред- ставление Uxy = § dExy(K) (3*5) —я оператора Uxy, существование которого вытекает из теоремы 1 при п = 2, хх = х, х2 = у. Положим для — л X л: (Еху (X) х (0), у (0)) = Fxy (X). (3.6) Как известно|(см. Стоун] (3, с. 177]), Fxy (X) есть непрерывная справа функция с ограниченным изменением. Из . Еху (- л) = 0 (3.7) вытекает, что Fxy ( л) = 0. Наконец, ^(Л) = (х(Л). у(0)) = (Л(0), у(0))= ( $ z/(0))= —Я = $ eikKd(E(k)x(Q), у(0))== $ eikt>dFxv(K). —Я —я Таким образом, функция Fxy'(k), определенная] формулой (3.6)f удовлетворяет всем требованиям теоремы. В частном случае одной последовательности {х (t)} = {у (t)} функция Рхх (X) = (Ех (X) х (0), X (0)) - I Ех (X) X (0) I2 (3.8} будет действительной и неубывающей (см. М. Стоун [3, с. 189]). Этим оправдывается соответствующее утверждение в формулировке тео-* ремы 2. Из элементарных свойств ряда Фурье для функций с ограничен- ным изменением (см., например, А. Зигмунд [4, с. 131) вытекает, что ^(*) = ^И^(Х + 0) + С, . (3.9) где ’ wKt (Л)=вху (0) х - £ (М0> а константа С вычисляется из условия Fxy(-n)=0. (3.11,
224 27. Стационарные последовательности в гильбертовом пространстве Формулы (3.9) и (3.10) показывают, что функция Fxy (X) однознач- но определяется по величинам Вху. Таким образом, теоремы 2 и 3 ! доказаны полностью. Заметим еще, что из (3.8) непосредственно вытекает Fyx (М ~ ?ху (М* (3.12) Теорема 4 (X. Крамера). Если последовательности {#1 (0}, {ж2 (0}, • • •? {^П (0} стационарны и стационарно связаны, то при любых — л а Р л приращения = PxyFv (0) FXyXN (а) (3.13) образуют неотрицательную эрмитову матрицу, т. е. S A^VvUv>0, (3.14) каковы бы ни были комплексные |2, • • • > In- * Обратно, если непрерывные справа функции Рцу (М, v = 1, 2, . . ., п, определенные на отрезке — л<^%<^л, удовлетворяют условиям SiAF^Iv>0, (3.15) ^(-л)-0, (3.16) то в Н существует система стационарных и стационарно связанных . последовательностей {Х2 (t)},. для которой FX^) = F^). (3.17) Для доказательства первой части теоремы рассмотрим спектраль- ное представление U= $ eftd£(X) —л оператора и = иХ}х2..,Хп | теоремы 1 и, положив [ Z= 3 (0), I Ц=1
27. Стационарные последовательности в гильбертовом пространстве 225 рассмотрим на отрезке — л X л выражение <р (X) = IЕ (X) z I2 = (Е (X) z, z) = [Е (X) 3 (0), 3 Ъъ (0)) = Ц=1 V=1 = S (^(X)^(0),5v®v(0))= 3 ^v(B(X)xu(0),xv(0)) = g,v=i n,v=i = X & U,V=1 и Так как функция ср (X) действительная и монотонно неубывающая (см. М. Стоун [3, с. 189]), то при а < Р ср(Р) — ср(сх) = Дф= S Ц, V=1 и что и требовалось доказать. Переходя к доказательству второй части теоремы, положим В^(к)= jj e^dF^fi). —л По лемме 2, для того чтобы в пространстве Н существовали элемен- ты х^ (0, соответствующие любому целому t и любому р. = 1,2, ... . . ., п, при которых (а-ц (t'), xv (t")) = Bpv X — t»), достаточно, чтобы было 5 = 2j (*р 0, P,Q=1 P q каковы бы ни были г, рР, tp, |р. Это требование всегда выполняется, так как, полагая ёр(Ь)=ЛХ, ^(X)=2(g)^W. где 2М распространяется на все р, для которых = р,, имеем в силу неравенств (3.15) гл гл В= S $ ^WdF^q(K)lplq= 2 ^Р(Х)1,(Х)^МЛ(Х) = р, q—1 —Л Р, q~ 1 —Л = $ S Сц(Х)^(Х)^(Х)>0. —л Ц, V=1 Для элементов (t) пространства Н, существование которых та- ким образом установлено, == “Ь ^)’ (0)= (^)«. ,, 8 A. H. Колмогоров
226 27. Стационарные последовательности в гильбертовом пространстве Поэтому последовательности {^1 (0), {*2 (01. • • •> {Хп (0} стационарны й стационарно связаны. Легко видеть, что при этом = Теорема 4 полностью доказана. В случае п = 1 из второй части теоремы 4 вытекает Теорема 5. Для любой действительной непрерывной справа неубывающей функции F (X), определенной на отрезке — л X л и удовлетворяющей условию F (— л) = 0, существует стационарная последовательность {х (£)} с Fxx&) = F (М. В случае п = 2 условие (3.15) равносильно совокупности условий kFx х 0, &FXoX 0, IAFX х I2 AFX х AFXoX (см. X. Крамер [2, с. 227]). В этом случае теорема 4 дает: Теорема 6. Если последовательности {х (t)} и {у (t)} стацио- нарны и стационарно связаны, то при любых “Л%а<р^я | \Fxy | 2 < \FXX \Fvy. (3.18) Обратно, если функции Fn (X), F22 (X) и F12 (к), определенные на отрезке — л X л, непрерывны справа и удовлетворяют усло- виям &Fn > 0, &F22 > 0, | AF12 |2 < ^F^F22, (3.19) Л1 (— л) = F22 (— Л) = F12 (— л) = 0, то существуют стационарные и стационарно связанные последова- тельности {х (t)} и {у (t)}, для которых Fxx (X) = Fn (X), Fyy (X) = = F22 (X), Fxv (К) = F12 (k). Дальше нам понадобится следующее усиление теоремы 6. Теорема 7. Если функции F1X (X), F22 (X) и F12 (X) удовлет- воряют всем условиям второй части теоремы 6, стационарная по- следовательность {х (t)} такова, что Fxx (X) = F21 (X) и ортогональное дополнение Н Q Нх пространства Нх до простран- ства Н бесконечномерно, то в Н существует стационарная и стацио- нарно связанная с {х (t)} последовательность {у (t)}, для которой Fyy (*) = F22 (X), Fxy (X) = F12 (X). Чтобы доказать теорему 7, заметим, что по теореме 6 из принятых условий относительно функций F1X (X), F22 (X) и F12 (X) вытекает существование стационарных и стационарно связанных последова-
27. Стационарные последовательности в гильбертовом пространстве 227 тельностей {х* (0} и {z/* (t)}, для которых Fx*x* (X) = Fu (X), Ру*у*(к) = /^22 (X), Fx*y*(k) = 7^12 (X). Положим для всех целых t Тх* (t) = х (t). Легко проверить, что оператор Т изометричен на множестве {х* (t)}. По лемме 1 оператор Т с сохранением изометричности продолжает- ся на все пространство Нх*. Очевидно, при этом ТНХ* = Нх. Так как ортогональное дополнение Н Q Нх бесконечномерно, то оператор Т может быть продолжен с сохранением изометричности с Нх на все’ пространство Нху (см. М. Стоун [3, теорема 2.49]). Вы- брав такое продолжение, положим Ту* (0 = У (0. Последовательность {у (0} обладает, как легко видеть, всеми требующимися в теореме 7 свойствами. § 4 ПОДЧИНЕННЫЕ ПОСЛЕДОВАТЕЛЬНОСТИ Определение 3. Стационарная последовательность {у (0} называется подчиненной стационарной последовательности {х (0}, если последовательности {х (0} и {у (0} стационарно связаны и все элементы последовательности {у (0} лежат в пространстве Нх. Очевидно, если последовательность {у (0} подчинена последова- тельности {х (0}, то -Hxv = Нх, (4.1) С7ЖИ = Ux. (4.2) Пользуясь понятиями, введенными в § 2, мы докажем следующую теорему. Теорема 8. Каждой последовательности {у (0}, подчинен- ной {х (0}, соответствует одна-единственная функция (p?7x) (X) класса Lx, для которой FW(X)= $ |<P<v!')(X)|2dFwx(X), (4-3) —Л X Fyx(k)=\^{\)dFxx(P). (4.4) —л Отображение {у (t)} -> <р<х> (X) 8*
228 27. Стационарные последовательности в гильбертовом пространстве отображает взаимно однозначно класс Yx всех последовательностей {у (0}» подчиненных (х (£)), на класс Lx функций ср (X). При этом для двух последовательностей {у± (t)} и {у2 (0} из ¥х х ______ Fy'Vi (^) = 5 Фу/ W Фу? (М dFXX (^)« (4.5) —Л Утверждение о единственности функций фуХ) (X) понимается в тео- реме 8 в смысле, соответствующем данному в § 2 определению тожде- ства для функций <р (X) класса Ь2Х. Однозначность вытекает из фор- мулы (4.4), в силу которой № (X) = dFyx (k)/dFxx (X). ' , (4.6) Существование функций фуХ) (К) для любой последовательности {у (0) класса Yx мы докажем на основании леммы 4 цз § 2. Если {у (?)} входит в Yx, то у (0) принадлежит Нх и по лемме 4 существует такая функция фу } (А,) класса Lx, для которой У (0) = z (х). (4.7) По формуле (3.6) и утверждению (4g) леммы 4 имеем, каковы* бы ни были последовательности {yr (t)} и {у2 (t)} из Yx. FWJi (*) = (EWJt (X) У1 (0), у г (0)) = (Ех (X) У1 (0), у2 (0)) = X ______ = 5 4>X(^dFxx(k), —Л что доказывает формулу (4.5). В частном случае уг = у. у2 = х получаем (4.4), а при уг = у2 = я формулу (4.3). Взаимная однозначность соответствия между {у (t)} и ф^ (X) также вытекает из леммы 4. Существенным дополнением к теореме 8 является Теорема 9. Если последовательности {х (I)} и {у (t)} стацио- нарны и стационарно связаны, то для того, чтобы последователь- ность {у (t)} была подчинена последовательности {х (t)}, необходимо и достаточно существование такой функции у (X) из Lx, для которой х ^уу(М= S |ф(^)|2^х(Х), . (4.8) —л X Fyx(^= S ф(Х)^хх(Х). (4.9) —л Необходимость условия вытекает из теоремы 8. Докажем его до- статочность. Если функция ф (X) из L2, удовлетворяющая равен-
27. Стационарные последовательности в гильбертовом пространстве 229 ствам (4.8) и (4.9), существует, то по теореме 8 существует подчинен- ная последовательности {х (t)} последовательность {у* (0), для ко- торой <№ (1) = <Р (X) и, следовательно, Fy*y* (X) = Fyy (X), Fy.x (X) = Fyx (X). По лемме 1 на Нху* можно определить изометрический оператор Т, для которого при любом целом t Тх (0 = х (0, Ту* (0 - у (0. Очевидно, что Т (Ях?/0 = Нху, Т (Нх) = Нх. (4.10) Так как {у* (0} подчинена {х (0}, то Нху* = Яж. (4.11) Из (4.10) и (4.11) вытекает НХу Нх, что и означает, что {у (0} подчинена 3 {х (0}. Определение 4. Стационарные последовательности {х (0} и {у (0} называются эквивалентными, если каждая из них подчи- нена другой, т. е. если они стационарно связаны и Нх - Ну. Теорема 10. Для того чтобы последовательность {у (*)}, подчиненная {х (0}, была эквивалентна {x(t)}, необходимо и достаточ- но, чтобы функция (X) была отлична от нуля почти всюду отно- сительно Fxx (X). Если это условие выполнено, то qW) = 1/ф<“> (X) (4.12) почти всюду относительно Fxx (X) и относительно Fyy (X). 1°. Докажем необходимость условия. Допустим, что {у (0} под- чинено {х (0}, а {х (0} подчинено {у (0}. Тогда из формулы (4.3) и из получающейся перестановкой индексов формулы Fxx(X)= $ |<Р^(Х)|М^(Х) (4.13) —л вытекает, что функции (X) и Fyy (X) абсолютно непрерывны друг относительно друга. Поэтому понятия «почти всюду относительно 3 После того как этот вывод сделан, становится ясным, что в действительно- сти последовательность {у (t)} совпадает с {х (t)}.
230 27. Стационарные последовательности в гильбертовом пространстве Fxx» и «почти всюду относительно Fyy» совпадают. В силу (4.3) и (4.13) fxx(V = $ |ф№|2^(Ь) = $ —л —л и, следовательно, почти всюду относительно Fxx l^y)(W|v£W = l- (4.14) Формула (4.14) показывает, что фуХ) (X) =# 0 почти всюду отно- сительно Fxx, что и требовалось доказать. 2°. Докажем достаточность условия. Допустим, что {у (t)} под- чинено {х (t)} и фуЛ) (X) -ф 0 почти всюду относительно Fxx. Так как по формуле (4.3) функция Fyy (к) абсолютно непрерывна относительно Fxx (X), то фуЛ) (X) также абсолютно непрерывна почти всюду относительно Fyy (X). Поэтому законно писать f = ( '’“'УГ--'1-’ . С ^lW=r„(4. (4.15) С _ A |<p<x>(X)|MFxa(X) А = J Ф?)(Х)с/Аха(Х) = /’уж(Х) = /’хг/(Х). —л (4.16) Формулы (4.15) и (4.16) показывают, что функция ф (X) = i/<> (X) удовлетворяет требованиям X Fxx^)= $ |ф(Х)|М^(Х), —Л (4.17) (4.18) X Рху (к)= Ф (М dFyy (X). •—л (4.19) По теореме 9 следует отсюда, что последовательность {х (t)} подчинена {у (t)}, что и требовалось доказать. 3°. По теореме 8 из формул (4.15) и (4.16) вытекает, что ф^ (X) - ф (X) = 1/ф<*> (X).
27. Стационарные последовательности в гильбертовом пространстве 231 § 5 РАЗЛОЖЕНИЕ СТАЦИОНАРНЫХ ПОСЛЕДОВАТЕЛЬНОСТЕЙ НА ОРТОГОНАЛЬНЫЕ СЛАГАЕМЫЕ Определение 5. Две последовательности {у± (0} и {у2 (t)} лазываются ортогональными друг другу, если (г/i (* + *), Уг (0) = 0 (5-1) для всех целых к и t. Очевидно, что для того, чтобы две стационарные и стационарно связанные последовательности {уг (t)} и {у2 (0} были ортогональны друг другу, необходимо и достаточно условие Byiy2 (к) = 0, (5.2) или равносильное ему условие (М - 0. (5-3) Теорема 11. Если две последовательности {уг (0} и {у2 (0} стационарны и ортогональны друг другу, то: а) последовательность {х (0} = {У1 (0 + У2 (t)} стационарна: Ь) последовательности {уг (0} и {у2 (0} стационарно связаны как между собой, так и с последовательностью {х (0}: (С1) Вхх (к) = ВУ1У1 (к) + ВУ2У2 (к), (с2) (к) — ВУ1У1 (к), (сз) ВУ2Х(к) = ВУгУ2 (к), (<h) Fxx (М = (X) + РУ2У2 (X), (d2) FyiX (X) = Fyi?fl (X), (d3) Fy2X(ky=Fy2y2(K). Доказательство теоремы 11 осуществляется при помощи простых вычислений на основании формул (0.2), (3.9) — (3.11). В условиях теоремы 11 в силу формулы (с^) и неотрицательности приращений &FXX, &Flhyi, &ЕУ2Уг (при неотрицательных АХ) . | &FyiyJbFxx | < 1, | bFyzyJ№xx | < 1. (5.4) Поэтому функции dFyjh __ dFy*y* (5 Г)1 W“ dFxx{T) ’ W - dFxx&)
232 27, Стационарные последовательности в гильбертовом пространстве ограничены и однозначно определены (в смысле, принятом в [3]) равенствами —л х (5.6) FVM = $ —Л Теорема 12. В условиях теоремы 11 или обе последовательно- сти {уг (0} и {у2 (0} подчинены {х (0}, или обе не подчинены {х (t)}. Для того чтобы имел место первый из этих двух случаев, необходимо и достаточно соблюдение условия < (М С (*) = 0 (5.7) почти всюду относительно Fxx. Доказательство. 1°. Если {yt (t)} подчинено {х (0}, то в силу соотношения Уг (0 = я (0 — У1 (0 и {Уъ (0} подчинено х (t). Точно так же если {у2 (0} подчинено {х (0}, то и {z/i (0} подчинено {х (0}. 2°. Если обе последовательности {уг (0) и {у2 (0} подчинены {х (0}, то из сравнения (5.6) с (4.3) вытекает, что почти всюду от- носительно Fxx С = I I2, < = I 4? I2, (5.8) если же принять во внимание равенства (d2) и (d3), то из сравнения (5.6) с (4.4) вытекает, что почти всюду относительно Fxx = Ч«', Й? - 4lS- (5-9) Сопоставление равенств (5.8) и (5.9) приводит к выводу, что почти всюду относительно Fxx функции ф^/ и фу^ равны нулю или единице. Так как, кроме того, почти всюду относительно Fxx d/x) I ih(x)_ _U dFy^ dFxx ____Л /г 4П\ XX XX XX то отсюда и вытекает справедливость условия (5.7). 3°. Пусть условие (5.7) выполнено, тогда в силу (5.10) функции фу*} и ф!^ почти всюду относительно Fxx равны нулю или единице. Следовательно, почти всюду относительно Fxx справедливы ра- венства С <’=!<’ ! (5.11)
27. Стационарные последовательности в гильбертовом пространстве 233 Из (5.11), (5.6), (d2) и (d3) вытекает, что FVM = $ \^WdFxx(\), —Л Fg,x(X) = $ —л Fy^)= 5 l<(W«W- (5.12) —Л X F^(X) = $ <(Wxx(M- —Л В силу теоремы 9 из существования функций и ф£\ удовлет- воряющих равенствам (5.12), вытекает, что последовательности {У1 (01 и {у* (0) подчинены {х (0}. Теорема 13. Пусть для стационарной последовательности {х (t)} ортогональное дополнение Н Q Нх пространства Нх до про- странства Н бесконечномерно. Тогда любому представлению Fxx(k) в виде суммы Fxx (X) = Ft (X) + F2 (X) (5.13) двух действительных неубывающих непрерывных справа функций FT (X) и F2 (X), для которых Fx (— л) = F2 (— л) — 0, соответст- вует хотя бы одно представление последовательности {х (t)} в виде х (0 = У1 (0 + Уг (0, (5.14) где последовательности {г/х (0) и {у2 (£)} ортогональны друг другу и обладают спектральными функциями (V = Ft (*), Fvtvs (X) = F2 (X). (5.15) Для доказательства положим Л1 (М - Fxx (X), F22 (X) = Ft (X), F12 (X) = Л (X). Функции Fn (X), F22 (X) и F12 (л) удовлетворяют условиям второй части теоремы 6. Поэтому по теореме 7 в пространстве Н существует стационарная и стационарно связанная с {х (t)} последовательность {У1 (t)}, для которой (М = F22 (М = Л (X),. Fxm (X) = F12 (X) = F. (X). Положив У2 (0 - х (t) — yr (0, можно простыми вычислениями убедиться в том, что последователь- ности {у! (t)} и {у2 (t)} ортогональны друг другу и удовлетворяют Равенствам (5.15).
f i 234 27. Стационарные последовательности в гильбертовом пространстве f В теореме 12 уже установлено, какие условия следует наложить на функции Fr (К) и F2 (X) в представлении (5.13) для того, чтобы последовательности {yt (t)} и {у2 (t)} оказались подчиненными {x(t)},T. е. лежащими в пространстве Ях. При этих дополнительных условиях требование бесконечномерности дополнения Н Q Нх ста- новится излишним4, заключение же теоремы 13 оказывается воз- можным усилить в том отношении, что представление (5.14) опре- деляется представлением (5.13) однозначно 5, и мы получаем такую теорему: Т е о р е м а 14. Какова бы ни была стационарная последователь- ность {х (£)}, каждому представлению спектральной функции Рхх (X) * виде Fxx (X) - Fx (X) + F2 (X), ~де F± (X) и F2 (X) — действительные неубываюцие непрерывные справа функции X, для которых Fv (—л) = F2 (—л) == 0 и почти всюду относительно Fxx dFr ( dF2 n dF dF xx XX соответствует одно-единственное представление {x (/)} в виде % (0 = Ух (О + у2 (0. для которого последовательности {уг (£)} и {у2 (t)} ортогональны друг другу и = FytVt (X) = F2 (X). При этом последовательности {у± (t)} и {у2 (t)} подчинены {х (t)}. (5.16) § 6 СКОЛЬЗЯЩЕЕ СУММИРОВАНИЕ Определение 6. Будем говорить, что последовательность {х (t)} получается скользящим суммированием из стационарной пос- ледовательности {и (£)}, если можно подобрать такие коэффициенты ап, что +<30 x(t) = У, anu(t — п), (6.1) — оо где ряд в правой части сходится по норме. 4 В самом деле, рассмотрим расширение II* пространства Я, для которого i Н* Q Н бесконечномерно. В Я* по теореме 13 найдутся интересующие нас по- следовательности {i/i (/)} и {у2 (0}, при дополнительных же условиях теоремы 12 последовательности {у± (£)}, {у2 (t)} лежат в Нх. 5 Это вытекает из того, что по теореме 8 функций = dFjdFxx и =* = dF2ldFxx однозначно определяют последовательности {yr (t)} и {.z/2 (Ob подчиненные х (t). I
27. Стационарные последовательности в гильбертовом пространстве 235 Очевидно, что последовательность {х (t)}, получающаяся сколь- зящим суммированием из стационарной последовательности {и (0},; всегда стационарна и подчинена {и (£)}. Мы разберем в этом параг- рафе специальный случай, в котором верно и обратной утверждение. Определение 7. Последовательность {и (t)} элементов пространства Н называется фундаментальной, если она стационар- на и удовлетворяет условиям вии (0) = 1, Вии (к) = 0 при к 0. (6.2) По формулам (3.9) и (3.10) легко вычислить, что для каждой фундаментальной последовательности {и (t)} Fuu (X) = (X + л)/2л. (6.3) Обратно, каждая стационарная последовательность {и (t)} со спект- ральной функцией вида (6.3) является фундаментальной. Элементы фундаментальной последовательности {и (t)} образуют полную нормированную ортогональную систему в пространстве Ни. Поэтому каждый элемент z пространства Ни однозначно представ- ляется в виде 4-00 2=3 ctu (0> (6‘4) — оо где 4-00 S c? = hl|2< + ~. (6.5) t — оо Коэффициенты ct в формуле (6.4) определяются равенствами ~ (z. и (£)). (6.6) Теорема 15. Для того чтобы стационарная последователь- ность {х (t)} могла быть получена скользящим суммированием из фундаментальной последовательности {и (t)}. необходимо и доста- точно, чтобы последовательность {х (t)} была подчинена {и (t)}. Если это условие выполнено, то единственное представление {х (£)} в виде (6.1) дается формулой оо = 3 Bxu(n)u(t — п). (6.7) 71==—оо Необходимость условия теоремы была уже указана выше. Если же это условие выполнено, то каждый элемент х (t) последователь- ности {х (t)} принадлежит Ни и в силу формул (6.4) и (6.6) предста- вим в виде оо оо- x(t)-= 3 (jc(t),u(s))u(s) = 3 Bxu(t — s)u(s) S —— oo $= — oo или, полагая t — s = n. в виде (6.7).
236 27. Стационарные последовательности в гильбертовом пространстве Учитывая однозначность представления любого элемейта в виде (6.4), мы убеждаемся в том, что каждое представление последова- тельности {х (t)} в виде (6.1) совпадает с (6.7). Заметим еще, что из сравнения (6.7) с (6.4) и (6.5) вытекает Js, I Вхи (п) I* = || х (/) IP = Вхх (0). (6.8) Ив (4.3), (4.4) и (6.3) вытекает ^х(%) = 4г $ |4и)|2^, (6.9) —Л х = (6.10) —л Формула (6.9) показывает, что q/x} (А) есть функция с интегрируе- мым квадратом. Из (3.3) и (6.10) получается л (П) = 4" $ dX- <6Л1> —л Таким образом, величины Вхи (га) являются коэффициентами. Фурье функции фхи) (X), т. е. q£°(X)~ S Вт(п)е-™\ (6.12) П=—ОО Заметим по поводу приведенных сейчас формул, что в силу (6.3) «почти всюду относительно Fuu» обозначает просто «за исключением множества лебеговой меры нуль», а класс Lu совпадает с классом L2 функций с интегрируемым квадратом в обычном лебеговом смысле слова. Теорема 16. Для того чтобы стационарную последователь- ность {х (t)} можно было получить скользящим суммированием из какой-либо фундаментальной последовательности, необходимо, чтобы спектральная функция Fxx (А) была абсолютно непрерывной. Если ортогональное дополнение Н Q Нх бесконечномерно, то указанное условие является и достаточным. Необходимость условия ясна из формулы (6.9). Чтобы доказать его достаточность, рассмотрим произвольную функцию у (А) из L2, для которой почти всюду на —л А л J у (X) | 2 = 2л dFxxldl, (6.13) и определим функции F1X (A), F22 (А) и F12 (А) формулами Fu(M = Fxx(K), F22(X) = ^±2L, Ла(Х) = ^ J Т(Х)^1. —л
27. Стационарные последовательности в гильбертовом пространстве 237 Легко проверить, что эти функции удовлетворяют условиям вто- рой половины теоремы 6. По теоремё 7 при условии бесконечномер- ности Н Q Нх отсюда вытекает существование стационарной и ста- ционарно связанной с {х (t)} последовательности {и (t)}, для кото- рой Fuu (X) = F22 (V = (X + л)/2л, (6.14) X - Fxu (X) = F12 (X) = А- $ V ЙХ. (6.15) —Л Формула (6.14) показывает, что {и (t)} есть фундаментальная последовательность. Из абсолютной непрерывности Fxx (X) и фор- мулы (6.13) вытекает, что к Fxx (X) = (X) = -1- $ IТ (М I2 Ы. (6.16) —Л Из (6.15) и (6.16) по теореме 9 заключаем, что последовательность {х (t)} подчинена последовательности {и (t)}. По теореме 15 отсюда следует, что {х (t)} получается скользящим суммированием из {и (0). Теорема 17. Для того чтобы стационарную последователь- ность {х (t)} можно было получить скользящим суммированием из какой-либо фундаментальной последовательности, подчиненной {х (С)}, необходимо и достаточно, чтобы функция Fxx (X) была аб- солютно непрерывна, а функция fxx (X) - dFxx (XVrfX (6.17) почти всюду на —л X л положительна. Если же эти условия выполнены, то: А. Каждая фундаментальная последовательность, из которой можно получить {х (t)} скользящим суммированием, подчинена {х (/)}. В. Последовательность {х (t)} может быть получена скользя- щим суммированием из любой подчиненной ей фундаментальной по- следовательности. С. Для того чтобы последовательность {и (t)}, подчиненная {х была фундаментальной, необходимо и достаточно, чтобы почти всюду на —л X л было | (X) |2 = 1/2л/жзс (X). . (6.18) По поводу формулы (6.18) заметим, что при условиях абсолют- ной непрерывности Fxx (X) и положительности почти всюду fxx (X) класс множеств меры нуль относительно Fxx совпадает с классом множеств лебеговой меры нуль. Поэтому функции класса Lx’ в частности функция определяются с точностью до множества меры нуль в обычном лебеговом смысле слова.
238 27. Стационарные последовательное?и в гильбертовом пространстве Доказательство теоремы 17. 1°. Необходимость условия абсолютной непрерывности уже уста- новлена в теореме 16. Докажем необходимость положительности почти всюду функции fxx. Если фундаментальная последователь- ность {и (t)} подчинена {х (0), то по теореме 9 = Fuu (X) = jj | ф£> (X) I* dFxx (Л), (6.19) —Л откуда после дифференцирования по 1 получается, что почти всюду 1/2л = | <р£> (X) I7xx (X). . (6.20) Из (6.20) ясно, что jxx положительна почти всюду. 2°. Допустим теперь, что функция Fxx абсолютно непрерывна, а функция jxx почти, всюду положительна. Уже из одной абсолют- ной непрерывности Ехх вытекает по теореме 16, что последователь- ность {х (£)} может быть получена скользящим суммированием из некоторой фундаментальной последовательности {и (t)}, лежащей в некотором расширении Н' пространства Нх. По формуле (6.9) имеем почти всюду | (X) |2 = 2л/хж (X) =# 0. По теореме 10 отсюда следует, что последовательность {и (t)} подчинена {х (t)} (т. е. лежит в действительности в самом простран- стве Нх). Мы доказали, таким образом, достаточность условий тео- ремы и вместе с тем дополнительное утверждение А. Подчиненная {х (t)} последовательность {и (t)} в том и только в том случае является фундаментальной, если X к Fuu (Ь) = $ | Ф^ (X) I2 dFxx (X) = jj | ф£> (X) I2 fxx (X) d\ = , — Л —л т. е. почти всюду | Фи} (X) |а/хж (X) = 1/2л. (6.21) Таким образом, доказано утверждение С. В силу (6.21) для каждой фундаментальной последовательности {и (£)}, подчиненной {х (t)}, почти всюду | ср(и) (X) |2 #= 0. По тео- реме 10 отсюда вытекает, что последовательность {х (t)} подчинена {и (t)} и, следовательно, по теореме 15 получается из {и (t)} сколь- зящим суммированием. Этим доказано утверждение В.
27. Стационарные последовательности в гильбертовом пространстве 239 § 7 ' РАЗЛОЖЕНИЕ ВОЛДА Для лйэбой стационарной последовательности {х (t)} будем обоз- начать через Нх (t) минимальное линейное замкнутое подпростран- ство пространства Нх, содержащее все х ($), для которых $ t, и через Sx пересечение всех Нх (£). Очевидно, что UXHX (t) = НХ (t + к), (7.1) U*sx = Sx. (7.2) Определение 8. Стационарная последовательность {х (t)} называется сингулярной, если] Нх. (7.3) Очевидно, что для сингулярной последовательности {х (t)} Нх (0 = Нх, (7.4) каково бы ни было t. Обратно, если равенство (7.4) верно для ка- кого-либо одного. t, то последовательность {х (t)} сингулярна. В самом деле, из справедливости равенства (7.4) для какого-либо одного t вытекает в силу (7.1) его справедливрсть и для всех других t, откуда следует, что Sx ~ Нх. Обозначим через sx (t) проекцию х (t) в пространство Sx. Легко видеть, что {$х (t)} является сингулярной стационарной последо- вательностью, подчиненной {х (t)}, для которой S*x=HSx=Sx. (7.5) Последовательность {.sx (£)} называется сингулярной компонентой последовательности {х (t)}. Допустим теперь, что последовательность {х (t)} несингулярна. Тогда х (t) однозначно представляется в виде х (0 = I it) + Д (0, (7.6) где принадлежит Hx(t — 1), а Д (0 =# О ортогонально (t — 1). Положим их (0 = Д (0/ || Д (0 ||. (7.7) Легко видеть, что элементы их (0, их (t — 1), . . ., их (t — п), . . . образуют полную нормированную ортогональную систему в прост- ранстве нх (0 е sx.
240 27. Стационарные последовательности в гильбертовом пространстве Так как х (t) принадлежит Нх (0, то х (t) однозначно представляется в виде x(lf) = Sx(Z) + 2J сп>ых (* — ”)• (7.8) п=0 Так как последовательность {их (t)} стационарна и подчинена {х (t)}, то коэффициенты = (х (Г), их (t — и)) = ВХ11 (п) (7.9) в формуле (7.8) не зависят от t. Из (7.6) и (7.7) вытекает, что с0 = || А (0 II > 0. (7.10) Представление несингулярной последовательности в виде (7.8) будем называть разложением Волда, Из предыдущего изложения вытекает, что * (0 = sx (0, и (Z) = их (*), сп = С,? обладают следующими свойствами: Wv Последовательность {$ (t)} сингулярна и подчинена {х (£)}. W2. {и (£)} есть фундаментальная последовательность, подчинен- ная {х (£)}• W3. и (t) лежит в пространстве Нх (t). W4. Последовательности s (t) и и (t) ортогональны между собой. W5. с0 > 0. Следующая теорема показывает, что разложение (7.8) однозначно определяется перечисленными пятью свойствами. Теорема 18. Если стационарная последовательность {х (t)} представлена в виде X — + 25 cnu(t— п), (7.11) п—0 последовательности же {s (t)} и {и (t)} и коэффициенты сп удовлет- воряют условиям Wx—W5, то последовательность {х (t)} несингу- лярна и 5 (£) = sx (£), и (Z) = их (£), сп ~ Сп . Доказательство. Так как х (?) и все и (? — п) при п = 0, 1, 2, . . . (по условию W3) входят в Нх (f), то оо 5 (?) = X (?) — 2J спи (? — я) П—0 тоже входит в Нх (?). Так как Нх (?) при ? t лежит в Нх (t), то все $ (?) при ? t лежат в Нх (t). Следовательно, Hs (t) лежит в Нх (t). Так как по условию Wi Ss = Hs (t), то *S5 входит во все
27. Стационарные последовательности в гильбертовом пространстве 241 Нх (О и’ следовательно, в Sx. Отсюда вытекает, что все s (f) при- надлежат Sx и, следовательно, всем Нх (0. Перепишем формулу (7.11) в виде х (t) = £ (0 + сои (0, (7.12) где £ (0 = з (0 + Д спи (t — п). Так как s (0 и все и (t — п) при п = 1, 2, 3, . . . лежат в Нх (t —1), то Z (0 лежит в Нх (t — п). Так как все х (Г)при£' < t выражаются линейно через элементы з (Г) и и (Г) с t' < t, а и (0 ортогонально со всеми з (Г) и с и (Г) при t" <t,iou (0 ортогонально всем тем х (/'), для которых t' < t и, следовательно, пространству Нх (t — 1). Из того что £ (0 лежит в Hx(t — 1), а и (0 ортогонально Цх (t — 1), заключаем, сравнивая (7.12) с (7.6), что ; (0 = В (0, Сйи (t) = Д (0. (7.13) Из сравнения (7.13) с (7.7) в силу условия W8 вытекает, что u(t) = их (0. (7.14) В силу W2 и W4 из (7.11) вытекает сп = (0, и (t — 70]. (7.15) Из (7.14), (7.15), и (7.9) получаем сп = с*\ , (7.16) Из сравнения (7.8) с (7.11), принимая во внимание (7.15) и (7.16), получаем, наконец, s (0 = зх (0. § 8 РЕГУЛЯРНЫЕ ПОСЛЕДОВАТЕЛЬНОСТИ Теорема 19. Для того чтобы стационарную последователь- ность {х (0} можно было представить в виде х(0 = 3 cnu(t — п), , (8.1) 71=0 где {и (t)} — некоторая фундаментальная последовательность, не- обходимо и достаточно условие (0 = 0. (8.2) Если х (t) = 0, то условие sx (t) — 0 выполнено и представление (8.1) возможно (со всеми коэффициентами сП1 равными нулю). Ос- тается рассмотреть случай х (t) Ф 0. Достаточность условия sx (t) =0
242 27. Стационарные последовательности в гильбертовом пространстве в этом случае также ясна: если sx (t) = 0 и х (t) = 0, то последо- вательность х (t) несингулярна и по формуле (7.8) предыдущего параграфа представима в виде x(t) = с(п}их (t — n). (8.3) n—Q Докажем необходимость условия (8.2). Для этого заметим, что в случае существования представления (8.1) пространство ffx (t) содержится в пространстве Ни (£), а пространство Sx — в прост- ранстве Su. Поэтому из равенства Sv = 0, (8.4) справедливого для каждой фундаментальной последовательности, вытекает, что Sx = 0 и, следовательно, что sx (t) — 0. Определение 9. Будем называть стационарную последо- вательность {х (t)} регулярной, если я (0 ¥= sx (0 = 0. Если {и (t)} — фундаментальная последовательность, то (8.1) есть частный случай представлений, изученных подробно в § 6. Поэтому в соответствии с формулами (6.7), (6.8), (6.12) Вхи (я) = сп при га > 0, Вхи (п) = 0 при п < 0, (8.5) 5 ы2=|*(012=д»с(0), (8.6) п=0 4>xU)W= § cne-in\ (8.7) n=0 В силу (8.6) ряд П(0=ЗспГ (8.8) п=0 представляет в круге | £ [ < 1 аналитическую функцию. Ее гра- ничные значения при | £ | = 1 даются в силу (8.7) формулой Г“(е-<х) = фх“’(Х). (8.9) , Из принятого нами условия х (t) 0 вытекает, что Гх (£) не может тождественно равняться нулю. Поэтому 6 почти всюду на - I £ I = 1 <№ (X) 0. (8.10) Так как по формуле (6.9) почти всюду Д>21 = /1,(Ч = А.|(р»(Ц|!, (8.11) 6 См., например, монографию И. И. Привалова [5, с. 39].
27. Стационарные последовательности в гильбертовом пространстве 243 то из (8.10) вытакет, что почти всюду М (М > 0. (8-12) По теореме 17 отсюда заключаем, что последовательность {и (0} под- чинена {х (0). Теорема 20. Если регулярная последовательность {х (0} представима в виде (8.1) через фундаментальную последовательность {и (0}, им последовательность {и (0} подчинена {х (0). Для того чтобы стационарная последовательность {х (0), под- чиненная фундаментальной последовательности {и (0), представ- лялась через {и (0) в виде (8.1), необходимо и достаточно, чтобы функция ухп) (£), определенная при | £ | = 1 равенством у^ (е-а) - (X), (8.13) совпадала почти всюду на окружности | £ | = 1 с граничными зна- чениями аналитической функции Гхи) (£), определенной при | £ | < 1 формулой • (8л4> 111=1 ' ' Если это условие выполнено, то коэффициенты сп формулы (8.1) оп- ределяются из (8.8). Первая часть теоремы, необходимость условия второй части тео- ремы и утверждение о форме зависимости между коэффициентами и функцией Гхи) (£) уже доказаны выше. Остается доказать достаточность условий во второй части тео- ремы. Если эти условия выполнены, то для граничных значений Гхи) (£) имеем разложение в ряд Фурье (е-^) = <plu) (X) ~ (8.15) п—0 Из сравнения (8.15) с (6.12) и (6.7) заключаем, что х (0 пред- ставляется в виде (8.1) с коэффициентами с,п определенными из (8.15), или, что то же самое, из (8.8). Доказательство теоремы 20 закончено. Теорема 21. Для любой регулярной последовательности х (0 Функция оо , I\G) = r^’(C)= • (8.16) п=0 не имеет нулей внутри круга | £ | < 1. Допустим, вопреки утверждению теоремы, что Гх (£) имеет нуль Со> лежащий в круге | £ | < 1. Построим подчиненную {их (0}
S }' I 244 27. Стационарные последовательности в гильбертовом пространстве ' 4 последовательность {и (t)}, для которой 5^: (8.17) Такая последовательность существует в силу теоремы 8, так как функция * т 2 т <> ограничена и, следовательно, входит в класс LUx = L~. Легко вычислить, что для любого % I Фи х) (X) р = 1. (8.18) Так как /иЛ(X) Ь= Fuxux(X) = = "2Г ’ то по утверждению С теоремы 17 из (8.18) вытекает, что {и (t)} есть фундаментальная последовательность. По формуле (4.5) Fxx (X) = ( ф!“ж) (X) ф“х> (X) dFu „ (X) = 4- ( W х) J Xе X мЭь —л —л (8.19) Из (4.6) вытекает, что почти всюду ч>?’(4 = =2д-^гг±=1-“*> W?»'’ W- <8'20’ а*ии В силу (8.18) ф5>* (X) = 1/ф^> (X). Поэтому формула (8.20) может быть записана в виде Ф?° (X) = ф<и^ (Х)/ф^ (X). (8.21) В силу (8.9) и (8.16) имеем (X) = (е~^) = Гж (е-й-). Из (8.21), (8.22) и (8.17) заключаем, что • ^(Х) = Гж(е-^) е — t>0 Легко видеть, что Тх ’ (е-л) = фхи) (X) (8.22) (8.23) 1
27. Стационарные последовательности в гильбертовом пространстве 245 совпадает почти всюду с граничными значениями при | £ | = 1 функции ГГ(:) = ГХ(Р1=^Ь. (8.24) Так как £0 есть нуль функции Гх (£), функция Гки) (£) является аналитической при | £ | <; 1. По теореме 20 отсюда следует, что 7 x(t) = 3 cnu(t — п), (8.25} п=0 где коэффициенты сп определяются из формулы (8.8). Функция v« (е-”)=Фи* (Ь) = Г Д совпадает почти всюду на окружности | f — 1 с граничными зна- чениями аналитической в круге | £ | < 1 функции Ги“*>(о=4гй-- (8-26) 1-SoS Поэтому по теореме 20 ы(/)== dnux(t — n), (8.27) n=O где dn суть коэффициенты ряда Тейлора функции ГиПх) (С)- Формула (8.27) показывает, что и (t) лежит в Них (0. Так как по свойству W3 последовательности {их (0} (см. § 7), HUjc (t) лежит в Нх (t), то и и (t) лежит в Нх (0. Из только что сказанного вытекает, что все и (t — п) при п > 0 лежат в Нх (t — п). Поэтому, сравнивая формулы (8.25) и (7.6), получаем е0 и (t) = Д (0, а в силу (7.7) и (7.10) с0 и («) = с(ох) их (t). Легко проверить, что последовательности {и (t)}, определяемой по формуле и (0 = (с^/с0)их (0, 7 Для применимости теоремы 20 существенно, чтобы функция (?) пред- ставлялась в виде интеграла Коши через свои граничные значения (г"1*'). То, что это действительно так, вытекает, например, из замечания С*на с. 94 работы Ф. Рисса [6], так как, очевидно, функция (£), как и функция Гх (£), принадлежит классу Нг в смысле этой работы Ф. Рисса.
246 27. Стационарные последовательности в гильбертовом пространстве должна соответствовать функция (X) = 4х)/со. ' (8.28) Противоречие между (8.28) и (8.17) доказывает теорему 21. Теорема 22. Для того чтобы стационарная последователь- ность {х (t)}' была регулярной, необходимо и достаточно выполнение на — л К л совокупности условий: * 1) функция Fxx (X) абсолютно непрерывна', 2) функция fxx (X) почти всюду положительна', 3) функция log fxx (2i) суммируема. Если эти условия выполнены, то Гж (0 = (8.29) (х) _ Q* (О = 4- + У, № + (8.30) fc=l где коэффициенты а^ и определяются из разложения 4* w —+У (а^х) c°s sin k^- (8-31) k=1 Так как каждая регулярная последовательность {х (t)} получа- ется скользящим суммированием из подчиненной ей фундаменталь- ной последовательности {их (t)}, то необходимость условий 1 и 2 вытекает из теоремы 17. Докажем необходимость условия 3. Если последовательность {х (t)} регулярна, то по теореме 21 функция Гх (£) аналитична и отлична от нуля~в круге | £ | < 1. Будем обо- значать через Qx (£) то значение log (Гх (£)/|Л2л), которое получает- ся по непрерывности из действительного значения , г»<«) , ,'гТтП '|°8Пт Благодаря отсутствию нулей у функции Гх (£) функция Qx Л) однозначно определяется во всех точках круга | £ | < 1. Для дей- ствительной части функции Qx (£) имеем в силу (8.29) Re Qx (£) = log | Гх (£) | - V2 log 2л. (8.32) Обозначим через Re+^x (£) функцию, равную Re(?x(£) при Re Qx (Л) > 0 и равную цулю при Re фх (£) <^ 0. Так как из (8.32) вытекает Re+<?x(£)<log+ | Гх (£) [< |ГХ(£) |, то при любом р < 1 л л л $ Re+ Qx (ре^) dk < $ | Гя (ре-^) | dk < $ | <рГж) (k) | dk = К. —л —л —л
27. Стационарные последовательности в гильбертовом пространстве 247 Так как J Ке<2х(ре-л)</Х, = 2лКе<2ж(0), —Л то J |Re^x(pe-^)|dl= [2Re+<2x(pe-^)-Re^(pe-^)]dX< < 2К — 2л Re Qx (0). Из последнего неравенства вытекает, что граничные значения Re <?ж(е-л) = log Г (₽’ix) X ' ' У 2л = log ч>хх) (М J^2n =-rlog (U„) /1 X <РХ х (М У 2л 2 = 4-l°g^(X) (8.33) функции Re Qx (e~iK) суммируемы по X. Таким образом необходи- мость суммируемости log (X), т. е. условия 3 нашей теоремы, доказана. Прежде чем переходить к доказательству достаточности условий теоремы, докажем, что для любой регулярной последовательности {х (t)} функция Гх (£) определяется формулами (8.29)—(8.31). Так как по доказанному в случае регулярной последовательности {х (t)} функция ^log/xx^) суммируема, то для этой функции сущест- вует разложение Фурье (8.31). Из (8.33) и (8.31) вытекает, что Re<2x(eix) — —|--------h J1 (a(fcx)cosZrX —fe^sinWv). k=l (8.34) Так как Qx (0) == log Г.Л r /2л log / 2л (8.35) Действительно, то мнимая часть Im Qx (е х) выражается формулой Im Qx (eiK) — У| (а^ж) sin kk + b™ cos k\). ’ (8.36) k -i Из (8.34) и (8.36) вытекает (8.30). Наконец, формула (8.29) вытекает из самого определения Qx (g). Обратимся теперь к доказательству достаточности условий тео-
I 248 27. Стационарные последовательности в гильбертовом пространстве ремы. Для этого предположим, что эти условия выполнены и поло- жим а(х) * (?(?)= —|~ + (а?) + (8-37> Г(£) = /2^>, (8.38) где коэффициенты и Ь(р определяются из разложения (8.31)Ф Тогда 8 log = 2 Re Q (pe-i>j = а0 2 У р® (а^ cos к/. 4- 4-bjc*)sinH)= log fxx (р) Рр (р — X) dp, (8.39) —Л де р»<9>=4-—P-*zgCTJe-- <8-4о> Из неравенства между геометрическим и арифметическим средним9 вытекает, что У'1"' < ( (И) РР (И - V Ф- (8.41) —л л Так как функция fxx (X) суммируема и [ PQ (ц — X) dp = 1, то в ч *~л силу (8.41) J | Г (pei%) |2 dX = J /ха(р) J Pp(p-X)dXdp= J /x,(X)dX. —Л —Л —Л —Л (8.42) Установленная таким образом ограниченность интеграла в левой части равенства (8.42) гарантирует 10 представимость функции Г (t) 8 См. [5, с. 15]. 9 Это неравенство мы употребляем в следующей форме: если ъ ь ь m=^P (х) / (х) dx, log s = Р (г) log / (х) dx, Р (х) dx == 1, а а а > о, / (1:) > О, ТО S WI. 10 См. замечание С на с. 94 работы [6].
27Стационарные последовательности в гильбертовом пространстве 249 ---_—ш в виде интеграла Коши от ее граничных значений Г (e‘lX) = <Р (X). Из (8.38) и (8.31) вытекает что | Ф (X) |2 = | Г (е~^) |2 = = 2n/w (X). (8.43) Поэтому V ^—-dFxxO.)=i J |Ф(А)Н XXV ' —Л и, следовательно, функция 1/<р (X) принадлежит классу Найдем подчиненную {х (()} последовательность {и (t)}, для которой ф£> (X) = 1/ф (X). Из равенства (8.43) и теоремы 17С вытекает, что {и (t)} есть фунда- ментальная последовательность, эквивалентная {х (/)}. По теоре- ме 10 ф*> (X) = 1/ф(“> (X) = ф (X) = Г (е-»’-). Таким образом, последовательность {и (t)} удовлетворяет всем ус- ловиям второй части теоремы 20. Следовательно, {х (t)} представ- ляется через {и (t)} в виде (8.1), что и доказывает достаточность условий теоремы 22. Легко видеть, что построенная нами последо- вательность {и (/)} совпадает в действительности с {их (t)}. Отметим еще в заключение вытекающую из (8.30) и (8.35) фор- мулу 11 сох) = У2л е<г«(0) = ]/"2л ехр —— = у 2л explogfxx(X)dk} . (8.44) k§ 9 СПЕКТРАЛЬНАЯ ХАРАКТЕРИСТИКА {СИНГУЛЯРНЫХ ПОСЛЕДОВАТЕЛЬНОСТЕЙ И СИНГУЛЯРНЫХ КОМПОНЕНТ В силу результатов § 7 каждая несингулярная стационарная последовательность {х (£)} представляется в виде х (О = sx (i) +. rx (t), (9.1) где rx(t} — 2 Cn^x(^ - n)‘ (9’2) n=0 11 Формула эта верна не только для регулярных, но и для любых несингу- лярных последовательностей, как это ясно из теоремы 23 следующего параграфа.
250 27. Стационарные последовательности в гильбертовом пространстве Последовательность {гЛ. (t)} будем называть регулярной компонен- той 12 последовательности {х (t)}. Очевидно, что она всегда подчинена {х (t)} и регулярна. Положим для любой стационарной последовательности $ fxx(^)dX, (9.3) —л Dxx (X) = Fxx (X) - Ахх (X). (9.4) Будем различать следующих три случая: 1) fxx (М = 0 на множестве положительной меры; 2) fxx (X) = 0 лишь на множестве меры нуль, но функция log fxx (X) несуммируема; 3) fxx (X) = 0 лишь на множестве меры нуль и функция log fxx (X) суммируема. Теорема 23. В случаях 1) и 2) последовательность {х (t)} сингулярна. В случае 3) последовательность {х (/)} несингулярна, Fs s (X) = Dxx (Ц Fг г (X) = Ахх (л) (9.5> Л Л «Л/ «Д' и коэффициенты с(0Л) разложения (9.2) определяются из формулы (8.16), где функция Гх. (£) определяется формулами (8.29)—(8.31). Доказательство. Предположим, что последовательность {х (t)} несингулярна. Тогда в силу регулярности последовательности {rx (t)} по теореме 22 функция frxrx (М почти всюду положительна и функция log(л) суммируема. Так как последовательности {$х (г)} и {rx (t)} ортогональны между собой (см. § 7), то по теоре- ме 11 ^(Х) = ЛЛ(Х) + ^Ж(Х) (9.6) и, следовательно, почти всюду fxx (М = fsxSx (X) + frxrx (X). (9.7) Из (9.7) вытекает, что почти всюду fxx (М > frxrx (М > 0. (9.8) Поэтому каждое множество положительной меры по Лебегу имеет положительную меру и относительно Fxx (X). Так как {sx (t)} и {rx (t)} подчинены {х (0), то по теореме 12 почти всюду относительно Fxx (Z), а следовательно, и в обычном 12 Так как последовательность, тождественно равная нулю, сингулярна, но не регулярна, то у регулярной последовательности сингулярная компонента равна нулю, а у сингулярной последовательности пет регулярной компоненты.
27. Стационарные последовательности в гильбертовом пространстве 251 лебеговом смысле имеем dF, s (X) dFr г (Л) ~dFxX(k) dFxx(K) Так как в силу (9.8) почти всюду dt r г (М /г г (^) XX ______ X X \ п dFxxW 4х(М то почти всюду dFs s (X) fs s (Л) х х ____________ х х ______А ' dFxX^~ ~ fxx^ — 1 т. е. fsxsx (М ~ О, /хх (М = frxrx (М. (9.9) (9.10) Из формулы (9.10), положительности почти всюду fVx (к) и суммируемости log /ГхГх (%) вытекает, что для несингулярной по- следовательности всегда имеет место случай 3). Покажем, что, обратно, в случае 3) последовательность {х (t)} несингулярна. По теореме 14 в случае 3) последовательность (х (t)} однозначно разлагается в сумму x(t) = s (0 4- г (0 взаимно ортогональных и подчиненных {х (t)} последовательностей, для которых Лз (М = Dxx (X), Frr (X) - Ахх (К). По теореме 22 последовательность {г (t)} регулярна. Поэтому x\t) = s(t) c{n}ur(t — n). (9.11) n=0 Формула (9.11) показывает, что пространство Нх (t) лежит в пространстве 13 5S ф Hr (t). Представив х (t + 1) в виде х (t Н- 1) = а + р, где а = c(or)ur(t + 1), ₽ = s(t -h 1)+ S Cn}u,{t — n 4- 1), n=l 13 @1 Ф @2 обозначает минимальное линейное' замкнутое подпространство пространства Я, содержащее и @2.
252 27. Стационарные последовательности в гильбертовом пространстве легко установить, что р лежит в пространстве Sx ф HUr (^)> а а 0 ортогонально этому пространству. Поэтому х (t ф 1) не по- мещается в пространстве Sx ф HUr (t) и, тем более, в пространства Нх (0. Отсюда вытекает, что последовательность {х (t)} несингу- лярна. Для любой несингулярной последовательности {х (t)} мы дока- зали выше формулу (9.10). Поэтому функция Гх(^), определяемая в соответствии с (8.29)—(8.31), совпадает с ГГх (£). Чтобы доказать, что коэффициенты с*} получаются из разложения (8.16) функции Гх (С)» остается лишь установить, что № = <№. (9.12) Для этого достаточно проверить, что разложение (9.2) удовлетво- ряет условиям Wx—W5 (с сингулярной компонентой, равной нулю). Выполнение условий Wu W2, W4 и W5 ясно непосредственно. До- кажем соблюдение для разложения (9.2) свойства W3. Для этого» заметим, что в силу (9.8) и теоремы 17А последовательность {их (t)} подчинена {гх (0). Из (9.1) и (9.2) видно, что Нх (t) содержится в Sx ф НГх (t). Так как их (t) содержится в Нх (t) и ортогонально» (см. § 7), то их (t) содержится в НГх (t), а это и значит, что разло- жение (9.2) удовлетворяет условию W3. Формулы (9.5) для несингулярной последовательности вытекают непосредственно из (9.1), (9.10) и абсолютной непрерывности Frxrx (X) (последняя обеспечивается регулярностью последователь- ности {rx (t)} по теореме 16). § Ю МИНИМАЛЬНЫЕ ПОСЛЕДОВАТЕЛЬНОСТИ Для любой стационарной последовательности {х (t)} будем обо- значать через Нх (t) минимальное линейное замкнутое подпро- странство пространства Нх, содержащее все х (s), для которых s =?= t- Так как UXHX (0 = Нх (t + к), (10.1) то возможен только один из двух случаев: или все Нх (0 совпадают с Нх, или все Нх (0 отличны от Нх. Определение 10. Стационарная последовательность на- зывается минимальной, если . Нх (0 ф Нх. (10.2) Каждый элемент х (0 последовательности {х (0} однозначно пред- ставляется в виде суммы X (t) = V (0 + 6 (0, , (10.3)
27. Стационарные последовательности в гильбертовом пространстве 253 где и (О ^ежат в #х (0» а б (О ортогонально Нх (t). Положим dx = I б (0 |. (10.4) Очевидно, условие dx > о . (10.5) необходимо и достаточно для минимальности последовательности { с (0}* Теорема 24. Стационарная последовательность {х (t)} в том* и только в том случае минимальна, если функция fxx (л) почти всю- ду положительна и интеграл JtSt (10'6> конечен. Если эти условия выполнены, то —л Докажем сначала достаточность условий теоремы. Пусть —Л если fxx (к) определена и конечна, и <Р (X) = 0, если fxx (Z) неопределенна и бесконечна. Тогда интеграл $ |Ф(Х)|М^Ж(М = 1 —л конечен. Следовательно, ср (X) входит в класс Lx и равенство фГ (к) = Ф (X) - определяет некоторую последовательность {у (t)}, подчиненную { ' (0), Для которой по формуле (4.4) $ ^(WxxW^ + я): —л —л х По формуле (3.3) при s =^= t [У (t). X (s)) = Вух (t-s) = $ е^>-dFyx (X) = 0. —Л
254 27. Стационарные последовательности в гильбертовом пространстве Следовательно, элемент у (t) ортогонален пространству Нх (t). Так как л я кЮ|2 = ^(0)= J dFyu(X)= JI 1 =# О, —л —л то пространство ffx, содержа у (£), не может совпадать с Нх (t). Минимальность последовательности {х (t)} доказана. Чтобы доказать необходимость условий теоремы, предположим, что последовательность {х (t)} минимальна. Легко видеть, что после- довательность {6 (t)} стационарна и подчинена {х (I)}. При этом В6х (&) = (б (t + к), х (t)) = 0 при к 0, (10.8) вйх (0) = (6 (0, X (0) = I 6 (0 | 2 = dl (10.9) Отсюда вытекает по формулам (3.9)—(3.11), что Ftx (X) = dx (X + л)/2л. (10.10) В то же время по формуле (4.4) F6x(X)= jj <р^(Х)^яя(Х). (10.11) —Л Из (10.10) и (10.11) вытекает, что + $ Фвх)(Х)^яя(Х) (10.12) х —л и, следовательно, производная конечна почти всюду относительно Fxx (X). Так как в силу (10.12) X абсолютно непрерывно относительно Fxx (X). то производная d'kldFxx (X) конечна почти всюду относительно X, т. е. в обычном ле- беговом смысле. Следовательно, производная fxx (к) — dFxx (X)/dX почти всюду отлична от нуля. После этого замечания из (10.13) полу- чается, что почти всюду а _ 4 . dFxx(k) _ 4 4,6 2л dFxx&) - 2л • dl - 2nfxxa) • По теореме 8 интеграл ? ? d2 2 % ну J |фвЖ)(Х)|2йГяя(Х) = 5 2л/жж(А) dFxx^^l^ /ЖЯ(Х) ' —л —л —л (10.14)
28. Интерполирование и экстраполирование последовательностей 255 конечен. Необходимость условий теоремы доказана. Заметив, что л л 4 = I б (О - В66 (0) = $ dF&6 (л) = $ I <р{Г> (1) I2 dFxx (X), (10.15) л — л пз (10.14) и (10.15) получаем формулу (10.7). ЛИТЕРАТУРА 1. Wold Н. A study in the analysis if stationary time series. Uppsala, 1938. 2. Cramer IL— Ann. Math., 1940, vol. 41, p. 215—230. 3. Stone M. Linear transformations in Hilbert space.— Amer. Math. Soc. Col- loq. Publ., 1932, vol. 15. 4. Зигмунд А. Тригонометрические ряды/Пер. с англ. М., Л.: ОНТИ, 1938. 5. Привалов И. И. Интеграл Cauchy. Саратов, 1919. 6. Riesz F.— Math. Ztschr., 1923, Bd. 18, S. 87—95. 7. Колмогоров A. II.— Изв. АН СССР. Сер. мат., .1941, т. 5, с. 3—14. 28 ИНТЕРПОЛИРОВАНИЕ И ЭКСТРАПОЛИРОВАНИЕ СТАЦИОНАРНЫХ СЛУЧАЙНЫХ ПОСЛЕДОВАТЕЛЬНОСТЕЙ* Устанавливаются спектральные условия для возможности экстра- полировать и интерполировать стационарные случайные последова- тельности по достаточно большому числу членов с любой заданной точностью. ВВЕДЕНИЕ Пусть каждому целому t (—оо < t < 4-ос) соответствует дейст- вительная случайная величина х {t) с конечным математическим ожиданием квадрата. Последовательность {х (t)} случайных вели- чин х (t) будем называть стационарной, если математические ожида- ния 1 т = Мх (t) и В (к) = М [(ж (t + к) — т) (х (t) — т)] не зависят от t. Без ограничения общности можно положить 7П-МЖ(^) = 0. , (1) * Изв. АН СССР. Сер. мат., 1941, т. 5, с. 3—14. 1 Математическое ожидание случайной величины у обозначается далее через М у.
256 28. Интерполирование и экстраполирование последовательностей Тогда В (k) = М [х (t + k)x (t)]. (2) Так как В (-к) = В (*), (3) то достаточно рассматривать вторые моменты В (к) лишь для к 0. Задача линейного экстраполирования стационарной последова- тельности, удовлетворяющей условию (1), заключается в подборе при заданных п 0 и т 0 таких действительных коэффициентов as, при которых линейная комбинация L = агх (t — 1) + а2х (t — 2) + • • • + апх (t — п) случайных величин х (t — 1), х (t — 2), . . ., х (2 — п) доставляет возможно более точное приближение к случайной величи- не х (t 4- т). За меру точности такого приближения естественно принять математическое ожидание о2 = M(x(z + т)— Lf= 5(0)—2 В[т + s)as + S В(р — q)allaq. s—1 р=1 7—1 Если вторые моменты В (к) известны, то легко решается задача разыскания таких значений коэффициентов as, при которых о2 до- стигает наименьшего значения. Это наименьшее значение о2 будем обозначать через о# (п, т). Очевидно, при увеличении п величина g2e (ft, т) не может возрас- тать. Поэтому существует предел lim Ge (ft, т) = Ое (т). (4) П—оо Определение этого предела и является первой из решаемых в на- стоящей работе задач. Что касается задачи интерполирования, то мы рассмотрим лишь случай оценки х (t) по величинам х (t + 1), х (t. + 2), . х (t + и), х (t — 1), х (t — 2), . . x (t — ri). Для этого случая обозначим через af (п) минимальное значение ма- тематического ожидания о2 = М (х (0 - (?)2, ’ где Q есть линейная форма Q = а±х (t 4- 1) 4~ d2x (t 4“ 2) 4“ • • • -\-dnx (t 4" ft) 4" 4- a_xx (t — 1) 4- a_2x (t — 2) 4- • . • +d-nx (t — ri) с постоянными действительными коэффициентами as.
28. Интерполирование и экстраполирование последовательностей 257 z При возрастании п величина о/ (п) не возрастает. Поэтому су- ществует предел lim о/ (п) = б/. (5) П-*оо Нашей второй задачей является определение Предлагаемое далее решение двух сформулированных выше задач было сообщено без доказательства в моей заметке [I]2. Оно опирается на понятия, относящиеся к спектральной теории стационарных случайных про- цессов. Спектральная теория стационарных случайных процессов была построена А. Я. Хинчиным [2] для случая непрерывного изменения временного аргумента t. Для интересующего нас сейчас случая дис- кретной стационарной последовательности подробное изложение теории дано в книге Уолда [3]. Основное значение здесь имеет следую- щая теорема 3. Теорема 1. Для любой стационарной последовательности {х (0} вторые моменты В (к) можно представить в виде л в (к) = cos k’KdW (X), (6) о где W (X) есть неубывающая действительная функция, определяемая формулой w (X) = В (0) X 4- 2 У sin кК. fc=l (7) Производная w (k) = dW (K)/dK неубывающей функции W (X) существует почти всюду, неотрицатель- на и суммируема. Так как log w (К) w (X), то из суммируемости w (X) вытекает, что интеграл Р = -i- log w (X) dX (8) о 2 В формуле (|) этой заметки допущена опечатка. Правильный вид форму- лы (1) таков: л lim (п) = л: С . П-»оо J $ (Л,) 0 3 См. [3, § 17]. 9 А. Н. Колмогоров
258 28. Интерполирование и экстраполирование последовательностей либо конечен, либо равен 4 — оо. Далее мы доказываем следующую теорему. Теорема 2. Если Р = —оо, то ue (m) = 0 для всех т 0. Если же интеграл Р конечен, то Ge (т) = ер (1 + г? + + . . . +4), (9) где г определяются из соотношений = 1 + Г1£ + г£2 + _ , (10) л «& = — \ cosArX logw(X)dX. (11) о Так как w (X) > 0, то интеграл л либо конечен, либо равен 6 + оо. Мы докажем далее такую теорему: Теорема 3. Если R = 4-оо, то <jj = 0. Если же интеграл ко- нечен, то - 1/R. ‘ (13) В моей работе [4] построена теория стационарных последователь- ностей элементов комплексного гильбертова пространства. В § 1 настоящей статьи я показываю, что стационарные случайные после- довательности в определенном выше смысле могут рассматриваться как частный случай стационарных последовательностей, рассмотрен- ных в [4]. Это позволяет получить сформулированные выше теоремы 1, 2 и 3 в качестве простых следствий из результатов работы [4]. В дальнейшем изложении ссылки на формулы с номерами из двух чисел, разделенных точкой (например, (8.44)), относятся к формулам из [4]. 1 СТАЦИОНАРНЫЕ СЛУЧАЙНЫЕ ПОСЛЕДОВАТЕЛЬНОСТИ И ГЕОМЕТРИЯ ГИЛЬБЕРТОВА ПРОСТРАНСТВА Будем исходить из аксиоматики и построения основных понятий теории вероятностей, предложенных в моей книге [5], с тем измене- нием, что рассматриваемые далее случайные величины могут прини- мать не только действительнывд но и комплексные значения 6. 4 Если w (X) = 0 на множестве положительной меры, то считаем Р = — оо. 5 Если w (%) = 0 на множестве положительной меры, то считаем R — -т 6 Комплексная функция х (£), определенная на множестве Е элементарных событий называется случайной величиной, если при любом выборе действи- тельных чисел а и Ъ множество всех |, для которых действительная и мнимая части х (t) удовлетворяют соответственно неравенствам Re х (|) < a, Im х (Е) < Ъ, принадлежит системе F.
28. Интерполирование и экстраполирование последовательностей 259 Рассмотрим множество ф всех случайных величин х какого-либо борелевского поля вероятностей (jF, Р), имеющих конечное матема- тическое ожидание квадрата абсолютной величины, считая при этом эквивалентные случайные величины (т. е. случайные величины, от- личающиеся друг от друга лишь с вероятностью, равной нулю) за тождественные. Введем в © скалярное произведение (х, У) = М (ху). (14) Нормы в § определим формулой || < = (х, х) = м I X I2, (15) сложение же элементов § и их умножение на комплексные числа бу- дем понимать в обычном смысле. Легко проверить, что множество © при установленных сейчас определениях удовлетворяет постулатам А, В и Е книги М. Стоуна [6], т. е. всем постулатам абстрактного унитарного пространства. Пусть теперь {х (t)} есть стационарная последовательность дей- ствительных случайных величин х (t) поля вероятностей (F, Р) в смысле, принятом во введении, удовлетворяющая дополнительному условию (1). Тогда в силу (2) и действительности х (t) В (к) = М Ь (t + к) х (0] = (х (t + к), х (£)). Так как по определению В (к) не зависит от t, то {х (t)} является ста- ционарной последовательностью элементов пространства § в смыс- ле [4]. В [41 я рассматриваю стационарные последовательности, лежащие в гильбертовом пространстве, т. е. в пространстве, удовлетворяю- щем, кроме постулатов А, В и Е, еще постулатам С и D книги М. Стоуна [6]. Это ограничение/ однако, несущественно. В самом деле, обозначим через Нх минимальное замкнутое линейное подпро- странство пространства содержащее все элементы последователь- ности {х (t)}. Легко доказывается, что Нх сепарабельно, т. е. удов- летворяет постулату D. Сепарабельное унитарное пространство или само является гильбертовым (т. е. удовлетворяет, кроме А, В и Е, еще постулату С), или конечномерно и в последнем случае может быть расширено до некоторого гильбертова пространства Н. Таким образом, к последовательности {х (t)} можно применить, полагая в (к) = Вхх (к) = (х (t + к), х (*)), (16) все результаты, полученные в [4]. 2 ДОКАЗАТЕЛЬСТВО ТЕОРЕМЫ 1 В силу (3) и (16) в случае действительных случайных величин « (0 Вхх (-к) = Вхх (к). (17) 9*
260 28. Интерполирование и экстраполирование последовательностей Поэтому из формулы (3.10) получаем Wxx (X) = Вхх (0) X - = = Я~(0)Х 4-2^3^sinЛХ. (18) S=1 Из (18) вытекает, что wxx (-Х) = -Wxx (X). (19) Наконец, из (3.1), (3.9) и (19) получаем +я В(*) = вхя(^)= J eiladFxx(k)= —л 4-я п =4- $еШ ^х« см=4 Jcos dW™ <2°) —л о Из формул (18) и (3.9) и теоремы 2 работы [4] ясно, что Wxx (X) есть действительная неубывающая функция. Вместе с равенствами (18) и (20) это показывает, что функция W (К) = Wxx (Z) удовлетворяет требованиям теоремы 1. 3 <4 (тп) в ОБЩЕМ СЛУЧАЕ Обозначим, следуя [4], через Нх (t —• 1) минимальное линейное замкнутое подпространство пространства Нх, содержащее элементы x(t- п), . . . Элемент х (t + т) при любом т 0 единственным образом пред- ставляется в виде х (t + т) == g (t — 1, т) + Д (t — 1, m), (21) где £ (£ — 1, т) принадлежит Hx(t — 1), a A (t.— 1, тп) ортогональ- но Нх (t — 1). Легко показать, что в случае стационарной последовательности действительных случайных величин 7 а|(тп) = || Д (Т — 1, тп) || 2. (22) 7 Как известно, Ц A (J — 1, т) || равняется «расстоянию» точки х (t + тп) от пространства Нх (t — 1), т. е. нижней грани расстояний || х (t + тп) — у 1 для всех у из Нх (t — 1). Так как элементы вида L = ахх (t — 1) + а2х (t — 2) + . . . + апх (t — п)
28. Интерполирование и экстраполирование последовательностей 261 В общем случае стационарных последовательностей в смысле [41 будем считать (22) за определение величины (т). Если последовательность {х (t)} сингулярна, то Нх (t — 1) == = и, следовательно, о! (т) = 0. (23) Если последовательность {х (t)} несингулярна, то по формуле (7.8) * x(t + m) = sx(t + т) + 21 c{nUx(t + т — п). (24) П=& Так как sx (t + т) и их (t + т — п) при п т лежат в Цх (t — 1), а их (t + т — п) при п т ортогональны Нх (t — 1), то сопостав- ление (21) с (24) дает A (t — 1, т) = c(q}ux (t + т) + с\}их (t + т — 1) + . . . • • • (0* (25) Так как элементы их (t + 0 попарно ортогональны и нормированы, то из (25) вытекает ol (т) = II A (t - 1) II2 = (<Л2 + + • •. + (А (26) 4 <j2e (т) В ДЕЙСТВИТЕЛЬНОМ СЛУЧАЕ Для стационарных последовательностей действительных случай- ных величин из формулы (26) легко вывести теорему 2. Этому выводу посвящен настоящий параграф. В силу формулы (3.9) имеем JXxW~ dK — 2л dK ~ 2л ^)- Из (19) вытекает, что w (—А.) = w (X). (28) Пользуясь (27) и (28), получаем Ч-л л log/^(%)dX== 2^ logip(X)dX— 2л log2л. (29) ~л о всюду плотны на Нх (t — 1), то |] А (£ — 1, т) || равняется также нижней грани расстояний II X (t + т ) - L || = /м|х(г.+ тп)-ЬГ2. (») Если все х (s) являются действительными случайными величинами, то нижняя грань выражения (*) не изменяется при ограничении одними действительными коэффициентами в этом же случае она, очевидно, совпадает с оЕ (т).
262 28. Интерполирование и экстраполирование последовательностей Формула (29) вместе с теоремой (23) из [4] показывает, что равенство л Р — § log w(k)dk — — оо о необходимо и достаточно для сингулярности последовательности {х (£)}. Мы уже видели в § 3, что в этом и только в этом случае о! (тп) = 0. (30) Если последовательность {х (/)} несингулярна, то из (8.44) и (29) вытекает 4-л л (соХ))2 = 2л exp log fxx (X) dkj = exp (-i- log wk dk) — ep. —л о (31) В том же предположении, что последовательность {х (t)} несин- гулярна 8, из (8.31), (27) и (28) заключается, что при +л л / \ 1 If* — \ cos kx log = —\ cos &X log ш(Х)Л n 4 я Jo (32) Ч-л Ч-л sin kx log/xx(X)dX = -^— sin&Xlogu>(X)dX = 0. —я —я Из (8.16), (8.29), (8.30) и (32) вытекает, что У, <№п - гя (С) = Гя (0) = Гх (0) eQ^-Q^ = * Х V7/ п—0 = с««хр(£4ве)- (33) к=1 Положив exp(S 4xV) = l + ^ + r2S? + ..., (34) k=i имеем из сравнения (33) с (34) с^/с(ох) = гп. (35) Из (35) и (26) вытекает о! (тп) = (С(ОХ))^ (1 + rl + rl + . . . + 4). (36) Формулы (30), (31) и (36) полностью доказывают теорему 2. 8 Как указано в теореме 23 из [4], формулы (8.16), (8.29)—(8.31) применимы к любой несингулярной последовательности. ч
28. Интерполирование и экстраполирование последовательностей 263 5 ОПРЕДЕЛЕНИЕ of Обозначим, следуя [4], через Нх (t) минимальное линейное замк- нутое подпространство пространства Нх, содержащее элементы х (t 4- 1), х (t + 2), . . х (t. + n), . . x (t — 1), x (t — 2), . . x (t — n), . . . Элемент x (t) однозначно представляется в виде (10.3) X (0 - V (0 + 6 (0, где v (t) лежит в Нх (t), а 6 (t) ортогональна Нх (£). Легко показать,; что в случае стационарной последовательности действительных слу- чайных величин = II б (0 F = <£- (37) По теореме 24 из [4] 4-я 4 = (2")!:S7J>- (38) —Л причем в случае бесконечности интеграла в знаменателе правой части 4 = о. Из (37), (38), (27) и (28) заключаем, что что и доказывает теорему 3. МИАН СССР, 26 ноября 1940 г. ЛИТЕРАТУРА 1. Kolmogoroff A. Sur Г interpolation et extrapolation des suites stationnai res.— C. r. Acad. sci. Paris, 1939, vol. 208, p. 2043—2045. 2. К hintchine A. Korrelationstheorie der stationaren stochastischen Prozesse.— Math. Ann., 1934, Bd. 109, S. 604-615. 3. Wold H. A study in the analysis of stationary time series. Uppsala, 1938. 4. Колмогоров A. H. Стационарные последовательности в гильбертовом про- странстве.— Бюл. МГУ. Математика, 1941, т. 2, вып. 6, с. 1—40. 6. Колмогоров А. Н. Основные понятия теории вероятностей. М.: ОНТИ, 1936. 6. Stone М. Linear transformations in Hilbert space.— Amer. Math. Soc. Col- loq. PubL, 1932, vol. 15.
264 29. О логарифмически нормаль ном законе 29 О ЛОГАРИФМИЧЕСКИ НОРМАЛЬНОМ ЗАКОНЕ РАСПРЕДЕЛЕНИЯ РАЗМЕРОВ ЧАСТИЦ ПРИ ДРОБЛЕНИИ * В недавней заметке Н. К. Разумовского [1] указано много слу- чаев, в которых логарифмы размеров частиц (золотин в золотонос- ных россыпях, частиц горных пород при их дроблении и т. п.) подчи- няются приближенно гауссовскому закону распределения. Задачей настоящей заметки является указать довольно общую схему случай- ного процесса последовательного дробления частиц, для которой в пределе (при неограниченном продолжении дробления) гауссовский закон распределения для логарифмов размеров частиц может быть установлен теоретически. Возможно, что аналогичные соображения помогут объяснить и применимость гауссовского распределения к логарифмам содержания минералов в отдельных пробах (этому воп- росу посвящена в основном цитированная заметка Н. К. Разумов- ского). Будем изучать общее число частиц N (t) и их распределение по размерам в последовательные моменты времени t = 0, 1, 2, 3, ... Пусть N (г, t) обозначает число частиц с размерами р г в мо- мент времени t (для дальнейшего несущественно, обозначает ли р диаметр, вес или какую-либо иную характеристику размеров час- тицы, лишь бы соблюдалось условие, что размеры каждой из частиц, получившихся в результате дробления частицы размера г, не превос- ходят г). Обозначим через Q (к) математическое ожидание числа частиц размеров р кг, образующихся за промежуток времени между t и t + 1 из одной частицы, имевшей в момент времени t размеры г, и положим 1 (1) о 1 (2) О При некоторых перечисленных далее допущениях можно дока- зать, что отношение N(ex, t)/N(t) (3) ДАН СССР, 1941, т. 31, с. 99—101.
29. О логарифмически нормальном законе 265 при достаточно,большом t с вероятностью, сколь угодно близкой к единице, будет сколь угодно мало отличаться от 1 2В2/ J dl. (4) Наиболее существенным допущением, которое мы употребляем при выводе этого соотношения, является независимость вероятно- стей каждой частице раздробиться за единичный промежуток време- ни на то или иное число частей тех или иных относительных разме- ров от размеров исходной частицы. Чтобы точно сформулировать нужные нам допущения, введем некоторые обозначения. Пусть рп есть вероятность за промежуток времени между t и t + 1 из одной частицы получить при дроблении ровно п частиц, а Fn (^1* ^2» • • •, «п) Р {^1 ^2 • • • ч — условный закон распределения отношений kt = rjr размеров по- лучающихся при этом п частиц к размерам исходной частицы. Ну- мерацию п частиц, получившихся при дроблении, будем считать произведенной в порядке возрастания их размеров: т\ г2 < г3 < . . . < гп. В соответствии с этим функция Fn а2, . . ., ап) определяется только при 0 а2 Очевидно, что <?(&) = S р^п(МД...Д1) + МЛ1--..Д1)+ ... п=1 ... -|- Fn(k. к, к,..., к. 1) + Fnfa к,к,... ,к, к)}. Мы допускаем, что а) вероятности рп и распределения Fn не зависят от абсолютных размеров частицы, от ее предшествующей истории (т. е. от того, в ре- зультате каких предшествующих дроблений она возникла) и от судь- бы других частиц; Ь) математическое ожидание Q (1) общего числа частиц, полу- чающихся за промежуток времени между t и t + 1 из одной частицы, конечно и больше единицы; с) интеграл 1 $ | log к |3 dQ (к) (5) О конечен; d) в начальный момент времени t = 0 имеется определенное чис- ло частиц N (0) с произвольным распределением по размерам N (г, 0). При этих допущениях:
266 29. О логарифмически нормальном законе 1) математическое ожидание общего числа N (t) частиц к момен- ту времени t равно 2V (0 = N (0) Q* (1); (6) 2) отношение (3) при достаточно большом t с вероятностью, сколь угодно близкой к единице, сколь угодно мало отличается от отноше- ния N (е » О _ N (е ? О______Т (т N{t) “ ЛГ (0)<?е (1) ~ 1 (7) соответствующих математических ожиданий х. В силу сказанного наша задача сводится к оценке величины Т (х, t). Из допущений (а) и (Ь) вытекает, что 1 N(r, t 4-l) = jj TV(-£-,/)</?(*). (8) О Положив <?(Л).= ^(1)5 (log Л), (9) получаем из (7) и (8) о Г(М + 1)= S T(x — £,t)dS(l). (10) —оо Из (7) и (9) легко вывести, что функции S (х) и Т (х, 0) = = N (ех, 0)/N (0) удовлетворяют всем требованиям, предъявляемым к функциям распределения 2. В силу рекуррентного соотношения (10) то же самое справедливо и в применении к функциям 3 Т (х, t) • при любом целом t 0. Из условия (с) вытекает, что интеграл о $ \x\3dS(x) (И) —со конечен. В силу (10) и (11) по теореме Ляпунова имеем при t —> оо - <12> ~00 1 Не следует считать это обстоятельство слишком очевидным. Для величин N (0 и N (г, £), взятых отдельно, аналогичное утверждение о близости к единице отношений N (t)/N (t) и N (г, t)/N (г, t) было бы ошибочным. 2 При этом для х > 0 полагаем S (х} = S (0) = 1. Поэтому во всех интегралах с dS верхний предел 0 может быть заменен без изменения значения интеграла на + оо. 3 В нашей задаче S (х) и Т (х, t) не являются распределениями вероятностей, а выражают собой некоторые математические ожидания. Это не мешает приме- нить к ним теорему Ляпунова ^рассматриваемую как теорему чистого анализа.
30. К обоснованию метода наименьших квадратов 267 равномерно относительно х, где о о А== $ xdS(x), В*= $ (ж —А)М5(ж) —оо — со очевидно, совпадают с определенными формулами (1) и (2). Было бы интересно изучить математические схемы, в которых скорость дробления частиц уменьшается (или увеличивается) с умень- шением их размеров. Естественно рассмотреть при этом в первую очередь случаи, в которых скорость дробления пропорциональна той или иной степени размеров частицы. Если эта степень отлична от нуля, то, по-видимому, логарифмически нормальный закон будет уже неприменим. МИАН СССР, 17 декабря 1940 г. ЛИТЕРАТУРА 1. Разумовский Н. К,— ДАН СССР, 1940, т. 28, № 8. 30 К ОБОСНОВАНИЮ МЕТОДА НАИМЕНЬШИХ КВАДРАТОВ* ВВЕДЕНИЕ С чисто практической стороны общеупотребительная литература по методу наименьших квадратов страдает одним существенным не- достатком: в ней не дается указаний о пользовании законами распре- деления Стьюдента и X2 для оценки надежности получаемых результа- тов (вычисления вероятности ошибок, превосходящих те или иные пределы). Употребление же вместо этих законов распределения за- кона Гаусса при небольшом числе наблюдений приводит к очень большой и практически весьма ощутимой переоценке этой надежно- сти (см. далее § 9, 10). Другой методический недостаток общеупотребительных руко- водств по методу наименьших квадратов особенно чувствителен при преподавании в университетах и педагогических институтах, где от слушателей законно предполагать знание серьезного курса линей- ной алгебры. Недостаток этот заключается в том, что обычно все ос- новные результаты теории метода наименьших квадратов получаются весьма громоздким чисто вычислительным путем, в то время как ис- пользование надлежащих общих понятий современной линейной алгебры (например, понятия ортогональности) позволяет получить * УМН, 1946, т. 1, вып. 1, с. 57-70.
2в8 30. К обоснованию метода наименьших квадратов. те же результаты значительно более прозрачным образом. Особенно наглядным получается изложение при употреблении представлений n-мерной векторной геометрии. Задача настоящей статьи заключается в том, чтобы показать на примере простейшей задачи метода наименьших квадратов в пред- положении одинакового веса всех наблюдений, как могут быть устра- нены оба указанных недостатка. У читателя предполагается знание линейной алгебры в векторном геометрическом изложении и основ теории вероятностей. Греческие буквы, за исключением л и Г, обозна- чают случайные величины. I. СВОДКА ОСНОВНЫХ ПОДЛЕЖАЩИХ ОБОСНОВАНИЮ РЕЗУЛЬТАТОВ § 1 ПОСТАНОВКА ЗАДАЧИ Предполагается, что переменные У, х2, . . хп связаны однородной линейной зависимостью у= 3 (О 7=1 Коэффициенты а; неизвестны. Для их определения эксперименталь- но находятся значения Уг= S азхю r=i,2,...,N. (П) j=i Предполагается, что коэффициенты а; однозначно определяются зна- чениями Xjr и уГ1 т. е. что ранг матрицы II х1г II не меньше п. Отсюда вытекает, что п. Экспериментальное определение уг сопряжено с неизбежными ошиб- ками. Вместо истинных значений уг мы получаем из эксперимента значения Пг = Уг + Аг- (ПО Требуется по заданным xir и т|г определить наиболее рациональные приближенные значения ocf коэффициентов at.
30. К обоснованию метода наименьших квадратов 269 § 2 ДОГМАТИЧЕСКОЕ ИЗЛОЖЕНИЕ РЕЗУЛЬТАТОВ ГАУССА Пусть (IV) j=i Sr = Пг — П*- (V) По Гауссу а7- определяются из условия N п [ее] = S (Пг“ 3 «Лг)2 = min. (VI) Г=1 Здесь, как и везде в дальнейшем, принято гауссовское обозначение N [аб] = 3 яД- [*] Г=1 Требование (VI) равносильно системе уравнений (п 3 а,= [«{П], i=l, 2,..., п. (VII) i=i Из этих «нормальных уравнений» и находятся ocf. Полученные приближенные значения не содержат «системати- ческой ошибки», т. е. математическое ожидание ос;- равно aj Ма; = aj. (VIII) Оценка точности этих приближений дается формулой для средне- квадратичной ошибки — дисперсии D (а7): D2a, = М {aj — a,}2 = g?7s2,i (IX) где 5 — среднеквадратичная ошибка экспериментального определе- ния величин уг (она предполагается независимой от номера г), а qir определяется из уравнений Qjk 1, 2, . . . , 71. (X) При этом, как обычно, | 0 при егк | । при i==jC9 Формула (IX) является частным случаем (при i = /) формулы М {(af — аг) (aj — a;)} = (XI) О практическом значении этой последней будет сказано в § И.
270 30. К обоснованию метода наименьших квадратов Если 5 a priori неизвестно, то оно обычно принимается прибли- женно равным а = '|Л[ее]/(Лг — п). (ХП) Этот прием основан на том, что Ма2 = 52? (ХЩ) Do2 = М {а2 - s2}2 = 2s*/(N - п). (XIV) Последняя формула показывает, что при больших N — п отношение а : 5 действительно с вероятностью, близкой к единице, близко к единице. Это позволяет в соединении с формулой (IX) рассматривать ^7о2 как приближенное значение Da/ Da; ~ g77o2. (XV) Замечание. Если N = п, то система уравнений п т]г — 2 г = 1, 2,..., N — п разрешима и из (VI) вытекает, что [ее] = 0. В этом случае знаменатель в правой части формулы (XII) обращается в нуль, и о становится неопределенным. § 3 ПРОДОЛЖЕНИЕ ДОГМАТИЧЕСКОГО ИЗЛОЖЕНИЯ РЕЗУЛЬТАТОВ ГАУССА Формулы (VIII), (IX), (XIII) и (XIV) дают лишь грубую ориен- тировку относительно размеров ошибки, происходящей от замены aj на а7- и s на а. Окончательное решение задачи должно было бы за- ключаться в указании законов распределения отклонений а7- — а7- и а — s. Этот вопрос был решен Гауссом (в предположении что ошиб- ки Аг независимы и подчинены гауссовскому закону распределения со средним, равным нулю) для отклонений а7- — а7. Именно, он обнаружил, что величина (a; — a;)/s подчинена нормальному распределению г ( а • — а • 1 4 i* р !> <XV1> 4 Г JJ ' г --------ОО
30. К обоснованию метода наименьших квадратов 271 § 4 БОЛЕЕ НОВЫЕ РЕЗУЛЬТАТЫ Более точная оценка отклонений aj от а; производится при помо- щи Р {(N - п) а2/*2 < /г2} = Н^п (7г2), (XVII) где h 2W-„,‘r(m;2) ' (XVlll) Таблицы функции Hm и обратной к ней функции имеют широкое употребление. В § 10 мы указываем на возможное видоизменение этих таблиц, которое кажется желательным с точки зрения практики метода наименьших квадратов. Оценка ошибки, происходящей от замены а,- на а;, в случае не- известного 5 производится на основании теоремы о подчинении отно- шения) т = (<x.j — а})/у^о закону распределения Стьюдента р f < Л=SN-n (0, (XIX) I W J где 1 * * * sm (t) = U1+dt. (XX) /тлГ(т/2) Д \ ™ V II. ДОКАЗАТЕЛЬСТВА § 5 ФОРМУЛА VII Эквивалентность требования (VI) системе нормальных уравнений (VII) является фактом вполне элементарным, который может быть установлен самыми различными способами. Лишь для сохранения единства стиля мы получим его векторным путем. С этой целью заметим, что гауссовские скобки [&с] с точки зре- ния современной линейной алгебры суть не что иное, как скалярное произведение n-мерных векторов . Ъ = (&1, ъ2, . . Ьп), с = (съ с2, . . сп). 1 Мы прилагаем в конце статьи таблицу функции, обратной к Sm ($), которая является сокращением таблицы, опубликованной Е. Н. Померанцевой, и, как нам кажется, удовлетворяет основным потребностям, возникающим при практи- ческом пользовании методом наименьших квадратов (см. далее § 9).
272 30. К обоснованию метода наименьших квадратов Считая Ут, Ar, T)r, 8Г компонентами JV-мёрных векторов у, хь ц, А, Т]*, 8, запишем соотношения (II)—(V) в виде п у= 3 а&, (1) j=i П = У + A, (2) П* = S “jX;, (3) n 1] = T)* + S — 3 aixi + 8- (4) Так как выбор af принадлежит нам, то (3) обозначает лишь т]* е L, (5) где L = Ь.(хъ х2, . . хп)\ есть линейное подпространство, порождаемое в TV-мерном векторном пространстве VN векторами xt. Требование (VI): [ее] = min (6) в соединении с (5) на геометрическом векторном языке обозначает следующее: В разложении (4) ц* есть ортогональная проекция ц на L, а & — дополнительный ортогональный к L вектор. Отсюда вытекает, что [е^] =0, i ~ 1, 2, . . ., п. (7) В силу (7), умножая равенство (4) скалярно на хь получим — / = 2,... ,7i. (8) i Это и есть нормальные уравнения (VII) для определения а7-. Соответ- ствующий детерминант G = | \xtXj} | (9) есть детерминант Грама системы векторов х^, х2, . . хп. Так как по предположению § 1 матрица Ij Xjr || имеет ранг п, то векторы Xi линейно независимы и G =# 0., > Поэтому уравнения (8) однозначно определяют aj.
30. К обоснованию метода наименьших квадратов 273 § 6 ФОРМУЛЫ (VIII) — (XII) Для обоснования формул (VIII)—(XII) необходимы некоторые теоретико-вероятностные предпосылки. Вот они: (А) Истинные ошибки Дг суть случайные величины, (В) МДГ = О, (С) мд? = s2, где s2 конечно и не зависит от г, (D) М {ДгДу} = 0 при г Ф г'. Определим бп-ортогональную к системе хъ х2, . . хп систему векторов лежащих в L: \.XiUj\ = eih (10> Uj е L. (11) Так как каждая из систем векторов {хъ гг2, . . жп} и {иъ и2, . . . . . ип} является линейным базисом в L, то п п Щ:==2 3 Qikxki 2j ^ik^k* fc=i k—i Умножая первое из этих равенств скалярно на uj, а второе на Xj и поль- зуясь (10), получим Vij = [uiUj], Си = [xiXj], (12> т. е. Щ = 3 QijXj = 3 luiui\ <13) п 2j [xixj\ uj- (14> В силу (13)—(14) матрица || qij || есть обратная матрица к матри- це || [xjXj] (I, т. е. величины q^ действительно определяются из урав- нений (X). Умножая (1) скалярно на иь получаем «г = lyUtY (15) Аналогично из (3) вытекает = [rj*uJ. (16>
274 30. К обоснованию метода наименьших квадратов Но так как .вектор е ортогонален к L, то [euj = О и из (16) вместе с (4) получается аг = [т1иг]. (17) «(15) и (17) дают вместе с (2) «г = Яг + [AwJ, (18) откуда в силу (В), (С), (D) получаем Маг = аг, (19) М {(аг — а») (а; — а^} = М {[Дп{] [Ди,]} = N N п' S S {ДДз'} UigUjs' —— WjgUjs [UjUj] S.“ t 8=1 s'=l s=l ”т. e. в силу (12) M {(«i — яг) (а; — а;)} = qi}s2. , (20) *(19) и (20) суть не что иное, как формулы (VIII) и (XI). Из (XI) при Л = j, как уже было сказано, получается (IX). Обозначим А* = т]* — у, (21) Из (2), (4) и (21) вытекает А = д* + е. (22) Так как А* вместе с т|* и у лежит в L, а 8 ортогонально к L, то (22) представляет собой разложение вектора А на его ортогональную ^проекцию в L и ортогональное дополнение к этой проекции. Выберем в нашем V-мерном векторном пространстве ортогональ- ный базис из векторов ьг = (Ьг11 Ьг2, . . ., 6rN), г = 1, 2, . . ., V, так, чтобы первые п векторов лежали в £, а следующие N — п бы- .ли ортогональны к L. Положив Дг = [ дм, ) (23) лтолучим д= 3 дд, (24) Г=1 Д* = S (25) Г=1
30. К обоснованию метода наименьших квадратов 275 N ~ С = S (26} Г==П-}"1 Легко видеть, что в силу условий (С) и (D) _ N N М {ДГДГ} = М ( 2 ^k^rk 3 ^к'вг'к') ===‘ к=1 к'—1 Л f S2 при г — г', = 12Дм(дА'}^=52 x§1e’,ser'Jt==(o при г^г'. (27} Из (26) и условия (В) вытекает Me = 0. (28> Из (26) и (27) вытекает М [ев] - (N - n) s2. (29> Из (29) и (XII) (эта формула служит просто определением о) непо- средственно вытекает (XIII). § 7 ГИПОТЕЗЫ ГАУССОВСКОГО РАСПРЕДЕЛЕНИЯ И НЕЗАВИСИМОСТИ ИСТИННЫХ ОШИБОК Для дальнейших выводов допущения (В), (С) и (D), указанные в начале § 6, должны быть заменены следующими, более сильными: (G) Ошибки &г подчинены гауссовскому распределению t Р{Дг</} = —Х- С e-^dt, 1/2л s J где $2 не зависит от г. (U) Ошибки Д1? Д2,. . ., An образуют систему взаимно независи- мых случайных величин. Хорошо известно, что из (G) вытекает (В) и (С), а из (В) в соеди- нении с (U) вытекает (D). Из (G) и (U) вытекает, что система случайных величин А1? Дг, • • • » An подчинена TV-мерному закону распределения, характеризующемуся: плотностью вероятности' N Щ-4—е’(г/2Н, • (30) r=l\V2ns / или в векторном обозначении f (i) = 2ns)-N e-l»l/2< (31}
276 30. К обоснованию метода наименьших квадратов Формула (31) выражает плотность вероятности случайного вектора .Д, взятую при элементе объема dv = dt1dt2- . .dtx. (32) | В системе координат f tr = [tbr],. (33) л Ar = [AM, (34) ' тде базисные векторы br подчинены обычному условию ортогональ- ности == врт' , (35) .элемент объема (32) сохраняет вид dv — dt\dt2. • -dtx- (32') Поэтому f (t) можно рассматривать как плотность вероятности век- тора Див этой новой системе координат. Иначе говоря, плотность {вероятности случайных величин Дх, Д2, . . ., A# имеет вид N f (Fi ,h, • • •, М = П f e^/2s*) . (30') Г—1 \ V 2n s ' Формула (30') показывает, что случайные величины Дг взаимно независимы и подчинены каждая тому же закону распределения t Р {Д, < t} = -2=- <?"“/«*• dt, (36) т/2тс 8 «7 * —оо что и величины Дг. Важно отдавать себе отчет в том, что взаимная независимость величин Дг выведена нами из совокупности допущений (G) и (U). При замене гауссовского распределения первичных ошибок Дг на какое-либо иное этот вывод теряет силу. § 8 ДОКАЗАТЕЛЬСТВО ФОРМУЛ (XIV) — (XX) В силу формулы (18) есть линейная функция (с неслучайными коэффициентами) от случайных величин Дг. Поэтому из (G) и (U) вытекает, что подчиняется гауссовскому распределению вероят- ностей. Нормируя это распределение в соответствии с (VIII) и (IX), получим формулу (XVI). Выведем теперь закон распределения величины X2 = [ee]/s2 = (N — п) сг2/Л (37)
30. К обоснованию метода наименьших квадратов 277 Для этого заметим, что в силу (26) N [ез]= У Д*> г=п-Н N , .о (38) (39) Г=пН-1 Из независимости случайных величин Дг вытекает независимость слу- чайных величин Дг/$. В силу (36) каждая из этих последних величин подчинена нормальному закону распределения с плотностью вероят- ности —L- е-/г/2. /2л Поэтому их (N — п)-мерный закон распределения характеризуется плотностью вероятности N Г—п4-1 Вероятность неравенства X < h получается интегрированием этой плотности по (N — п)-мерному объему, в котором R2 = 3 <?<Ла. r—n-j-1 Таким образом получаем 2 1 • • • в ^^п+1 -- R*<h' h = --- ------------ С h^le^/2 dh. 2(ЛТ-п-2)/2Г д^2) J Это и есть формула (XVIII). Из (40) можно вычислить, что MX2 = N — п, DX2 = М {X2 - (V - и)}2 = 2 (N - и). В силу (37) формулы (41) и (42) равносильны (XIII) и (XIV). 2 При выводе формулы (40) следует заметить, что поверхность сферы ради у - са 7? в m-мерном пространстве равна Г (т/2) (40) (41) (42)
278 30. К обоснованию метода наименьших квадратов Нам остается рассмотреть закон распределения величины Ь' = («/ — (43) I Для этого целесообразно представить т7- в виде отношения = У;/Х, (44) где = Y'N - п (а} — aj)/yqJjS. (45) Заметим теперь, что в силу (15), (16), (21) и (25) (Xj CLj = [Д*1/у] = UjrДг, ('16) r=l где Ujr = [ujbr]. (47) Сравнивая (46) с (37)—(38), мы видим, что в выражение а7- — а/ входят только те Дг, которые отсутствуют в выражении для X2. Поэ- тому из взаимной независимости величин Дг вытекает независимость а7- — aj от X. В силу (45) у7 и X тоже независимы. В соответствии с (XVI) плотность вероятности для есть 4 e-cz/2(N-n)t |/ 2л (TV — п) В соединении с (40) получаем отсюда, что двумерная плотность веро- ятности и X есть ________________1__________________TiN-n-l J с3 I /л (ЛГ - nj.2<JV_n_1)/2 Г ((N - n)/2) еХ₽ I ~ 2{/V—n) TJ • Интегрируя эту плотность вероятности по области, где clh<Zti получим /л (ДГ _ п) 2(N'^D/2r ((N — п)/2) X j J 1 exp { - - 4} dc dh- Произведем теперь замену переменных с и Л из с 1 с* .Л* S~ h ’ U~~ 2(N — n) + 2 * Так как d (s,») _ , . a3 hi________________2tt d(c,h) —N — n ’ l + ’ (48)
30. К обоснованию метода наименьших квадратов 279 то из (48) получается . ~ N-n-1 . ‘ г 1У-П4-1 — ---------------\и 2 e~ndu \fl + —) 2 ds= = г Hy - „ + па—c/1+ (49) /л (N - n) Г ((N — n)/2) J \ Я — » / x ' Формулы (XIX) и (XX) являются не чем иным, как другой записью равенства (49). III. ЗАМЕЧАНИЯ О ПРАКТИЧЕСКОМ ЗНАЧЕНИИ УСОВЕРШЕНСТВОВАНИЯ ОБЩЕПРИНЯТОГО ИЗЛОЖЕНИЯ ТЕОРИИ МЕТОДА НАИМЕНЬШИХ КВАДРАТОВ § 9 О ПОЛЬЗОВАНИИ ЗАКОНОМ РАСПРЕДЕЛЕНИЯ СТЫОДЕНТА В соответствии с общими принципами современной математической статистики 3 будем называть «доверительными границами» для соответствующими «коэффициенту доверия» со, такие две величины <z'- и aj, что при любых допустимых гипотезах о неизвестных ве- личинах Р {а; < а} < «} > (0. (50) Если s известно, а неизвестными являются только а19 а2, . . ап9 то этому требованию удовлетворяют в силу (XVI) а- = ау — t^q^s, а] = а}- + «Уs, (51) где t определяется из G (0 - (1 + <о)/2. (52) Значения t, соответствующие различным со, приведены в предпослед- ней строке (ш = оо) табл. 1, приложенной в конце статьи. Если 5 известно, то в соответствии с (XV) принято считать о за приближенное значение $. Однако, для того чтобы доверительные границы ocj = qjjQ, а] = а, + t]f q^a (53) 3 См. статью Неймана [1] или мою статью (2].
280 30. К обоснованию метода наименьших квадратов удовлетворяли требованию (50), t следует определять не из (52) а в соответствии с (XIX), (XX) из * SN_n.(t) = (1 + со)/2. (54> ' Значения t, соответствующие различным со при различных N — п ' = тп по формуле (54), приведены в той же табл. 1. При тп —> оо ^ определенные из (54), сходятся к t, определенным из (52) с заменой $ на а, но сходимость эта довольно медленная* особенно при со, близких к единице. Например, при со = 0,998 по (52) t - 3,090, : что примерно соответствует классическому правилу «трех сигма», а по (54), например, при тп = 6 t = 5,959. § 10 . ОБ ОЦЕНКЕ $ ПО а Удовлетворить равенству Р (AjO < s < к2о} — со (55) проще всего, подобрав и к2 так, чтобы Р (s < к±о} - (1 - со)/2, Р {Лг2сг < «} - (1 + со)/2. (56) В соответствии с (XVII), (XVIII) это будет достигнуто, если опре- делить кх и к2 из HN~n\~k1 )— 2 ’ HN-n\~2 2 • ' С точки зрения интересов метода наименьших квадратов, по-ви- димому, было бы желательно иметь таблицу, которая непосредствен- но давала бы кг и к2 по тп = N —- п и со. Это сделано в нашей табл. 2 для со — 0,98. Заслуживает внимания резкая асимметрия верхней и нижней границ в оценке Лдсг Например, при со = 0,98 и тп = 3 кг = 0,514, к2 = 5,111, т. е. а, более чем вдвое превышающие 5, встречаются лишь с вероят- ностью 0,01, но $ превышает о с вероятностью 0,01 в 5 раз. Поэтому употреблять при небольших тп доверительные границы для s вида (1 + к') а было бы нецелесообразно, нижнюю границу часто при-
Таблица 1. Значения t, удовлетворяющие уравнению Sm (t) — Р m Р 0,75 0,90 0,95 0,975 0,99 0,995 0,9975 0,99 0,9995 1 1,000 3,078 6,314 12,076 31,821 63,657 127,321 318,309 636,619 2 0,816 1,886 1,638 2,920 4,303 6,965 9,925 14,089 22,327 31,600 3 0,765 2,353 3,182 4,541 5,841 7,453 10,214 12,922 4 0,741 1,533 2,132 2,776 3,747 4,604 5,597 7,173 8,610 5 0,727 1,476 2,015 2,571 3,365 3,143 4,032 4,773 5,893 6,869 6 0,718 1,440 1,943 3,447 3,707 4,317 5,208 5,959 7 0,711 1,415 1,895 2,365 2,998 3,499 4,029 4,785 5,408 8 0,706 1,397 1,860 2,306 2,896 3,355 3,833 4,501 5,041 9 0,703 1,383 1,833 2,262 2,821 3,250 3,690 4,297 4,781 10 0,700 1,372 1,363 1,812 2,228 2,764 3,169 3,581 4,144 4,587 И 0,697 1,796 2,201 2,718 3,106 3,497 4,025 4,437 12 0,69 0,694 1,356 1,782 2,179 2,681 3,055 3,428 3,930 4,318 13 1,350 1,771 2,160 2,650 3,012 3,372 3,852 4,221 14 0,692. 1,345 1,761 2,145 2,624 2,977 3,326 3,787 4,140 15 0,691 1,341 1,753 2,131 2,602 2,947 3,286 3,733 4,073 16 0,690 1,337 1,746 2,120 2,583 2,921 3,252 3,686 4,015 17 0,689 1,333 1,740 2,110 2,567 2,898 3,222 3,646 3,965 18 0,688 1,330 1,734 2,101 2,552 2,878 3,197 3,610 3,922 19 0,688 1,328 1,729 2,093 2,539 2,861 3,174 3,579 3,883 20 0,687 1,325 1,725 2,086 2,528 2,845 3,153 3,552 3,849 21 0,686 1,323 1,721 2,080 2,518 2,831 3,135 3,527 3,819 22 0,696 1,321 1,717 2,074 2,508 2,819 3,119 3,505 3,792 23 0,685 1,319 1,714 2,069 2,500 2,807 3,104 3,486 3,768 24 0,685 1,318 1,711 2,064 2,492 2,797 3,092 3,467 3,745 25 0,684 1,316 1,708 2,060 2,485 2,787 3,078 3,450 3,725 26 0,684 1,315 1,706 2,056 2,479 2,779 3,067 3,435 3,707 27 0,684 1,314 1,703 2,052 2,473 2,771 3,057 3,421 3,690 28 0,683 1,313 1,701 2,048 2,467 2,763 2,756 3,047 3,408 3,674 29 0,683 1,311 1,699 2,045 2,462 3,038 3,396 3,659 30 0,683 1,310 1,697 2,042 2,457 2,750 3,030 3,386 3,646 оо 0,67449 1,28155 1,64485 1,95996 2,32634 2,57582 2,80703 3,09023 3,29053 О) 0,5 0,8 0,9 0 95 0,98 0,99 0,995 0,998 0,999 30. К обоснованию метода наименьших квадратов
282 30. К обоснованию метода наименьших квадратов Таблица 2. Значения к, удовлетворяющие уравнению Hm(rn ‘jk)— Р{к~> ^s} ==: р т Р т р т Р 0,01 0,99 0,01 0,99 0,01 0.99 1 0,388 79,750 8 0,631 2,204 40 0,792 1,343 2 0,466 9,975 9 0,644 2,076 50 0,810 1.297 3 0,514 5,111 0,657 - <1,977 60 0,824 1,265 4 0,549 3,669 15 0,708 1,694 70 0,835 1,241 5 0,576 3,003 20 0,730 1,556 80 0,844 1,222 6 0,597 2,623 25 1,751 1,473 90 0,852 1.207 7 0,615 2,377 130 0,768 1,416 100 0,858 1,195 ходилось бы принимать отрицательной! Только при очень больших т можно считать кг — 1 — t/]f 2т, к2 — 1 + t/]/~2m, (58) где t определяется по гауссовскому закону из (52). § И ЗАМЕЧАНИЕ О ЗНАЧЕНИИ МАТРИЦЫ цц Значение дисперсионной матрицы Sij = М {(аг — dj (а; — dj)} = qtjs2 (59) дает значительно более полную информацию о характере ошибок af — чем знание одних ее диагональных элементов D (af) « Sit. (60) Например, для определения среднеквадратичной ошибки, совершае- мой при замене at через af в выражении b ~ c1d1 + c2d2 + . . . + спал, где коэффициенты ct заданы, недостаточно знания'дисперсий D (а,), но вполне достаточно знания дисперсионной матрицы 8ц. Полагая Р = + С2а2 + . . . + Спап, имеем г j
31. Формула Гаусса из теории метода наименьших квадратов 283 Обычно диагональные элементы матрицы вводятся в рассмотрение е виде обратных значений «весов» рп — ' z Это маскирует существенную роль всей матрицы ЛИТЕРАТУРА 1. Нейман Ю. Статистическая оценка в проблеме классической теории вероят- ностей.— УМН, 1944, вып. 10, с. 207. 2. Колмогоров А. Н. Определение центра рассеяния й меры точности по огра- ниченному числу наблюдений.— Изв. АН СССР. Сер. мат., 1942, т. 6, с. 3-32. 31 ОДНА ФОРМУЛА ГАУССА ИЗ ТЕОРИИ МЕТОДА НАИМЕНЬШИХ КВА ДРАТОВ * Совместно с А .{А. Петровым и Ю. М. Смирновым Статья содержит уточнение некоторых оценок из гауссовской теории метода наименьших квадратов. В § 39 гауссовской «Theoria combinationis observationum егго- ribus minimis obnoxiae» вычисляется среднеквадратичная ошибка,; совершаемая при замене рр на М __ и + W + W . . . л — р л — р Гаусс устанавливает, что эта среднеквадратичная ошибка равна Л^-Т^1Р“2<“ + !’₽ + ‘Т’ + ---П (О В § 40 Гаусс извлекает из формулы (1) более простые оценки ин- тересующей его среднеквадратичной ошибки. Эти оценки он основы- вает на неравенствах рр/л У (аа 4- ьр + су + . . .)2 < л. (2) По какому-то недосмотру Гаусс не заметил, что верхняя из оце- нок (2) может быть заметно усилена и неравенства (2) могут быть за- менены неравенствами рр/л < 3 (ла + &р + су + • • -)2 < Р- (3) Из-за этого недосмотра выводы § 40 оказались неожиданно сла- быми: нижняя оценка, предлагаемая Гауссом для исследуемой им * Изв. АН СССР. Сер. мат., 1947, т. 11, № 6, с. 561—566.
284 31. Формула Гаусса из теории метода наименьших квадратов среднеквадратичной ошибки, оказывается в некоторых случаях даже отрицательной. Нашей задачей является доказательство неравенств (3) и установ- ление того обстоятельства, что они не могут быть усилены. § 1 ПОСТАНОВКА ЗАДАЧИ Мы начнем с краткого изложения задачи в современных обозна- чениях, примыкающих к статье А. Н. Колмогорова [1]. Пусть величины уг, и xir, где г = 1, 2, . . ., A; i = 1, 2, . . . п; п < А, удовлетворяют N уравнениям Ут S а^гт* (^) i=l Величины xir предполагаются известными точно, вместо же величин уГ предполагаются заданными величины Чг = Ут + Аг, (5) где Дг — взаимно независимые случайные величины, для которых М (Дг) =0, М (Д2Г) = Д М (Д*) = /4 (6) (М есть знак математического ожидания). Матрица || xir || предпола- гается имеющей ранг п. В указанных предположениях метод наименьших квадратов ре- комендует принимать в качестве приближенных значений неизвест- ных величин значения af, определяемые из условия N п 2 S (лг — S «йг) = min- (7) r=l г—1- Решение поставленной таким образом задачи, как известно, однознач- но и имеет вид N 3 ЩтЧг- (8> Коэффициенты uir в формулах (8) имеют следующий геометрический смысл: в A-мерном пространстве векторы Щ = (ufl, ui2, . . ., uiN), i = 2, . . ., n, образуют биортогональную систему к векторам • • •» i == 1, 2, • • ., П. Это значит, что векторы wi, u2, . . ., un однозначно определяются следующими условиями: они лежат в линейном n-мерном подпрост- ранстве L, определяемом векторами хг, х2, . . ., хп, и удовлетворяют
31. Формула Гаусса из теории метода наименьших квадратов 285> —,—, . I ——— условиям биортогональности: 11 при i — 7, ir ir ij при \ г Полагая N <10> r=l где &r Лг (^)3 i=l имеем Mo2 - s2. (12> Задача Гаусса, указанная в начале нашей статьи, заключается в оп- ределении Do2 = М {а2 - s2}2. (13) Гауссова формула (1) в наших обозначениях записывается так: <14> где N п а=3(3здг)2. (15> г—1 г=1 § 2 ОЦЕНКА Q Выражение (15) имеет простой геометрический смысл. Именно если обозначить через “ (^и., £*2» • • •, efw) проекцию единичного координатного вектора еГ в пространство Lr то N N N Q=S|e:|*=S[3(e*02] • (16) Г=1 r=l fc=l В самом деле, проекция z* любого вектора z в пространство L может быть записана в виде
286 31. Формула Гаусса из теории метода наименьших квадратов Вычисляя скалярное произведение (zi^), получим в силу (9) (zui) = (z*uf) = Ci. Вели z == ег, то последняя формула дает ~ uir. Поэтому ву — и^х^ г=1 или в координатной форме ert=S»A- (18) г--1 Вполне аналогично получим г е* = S (19) 4=1 erfc — 3 •^iruih- (20) Из (18) и (20) вытекает N N п п п |е*|2= S (е* )2= S S S («<^4^Л) = 3 uirxir. (21) Л'==1 г—1 j—1 г==1 Равенство (21) в соединении с (15) непосредственно приводит к (16). Введем теперь в нашем TV-мерном пространстве новую ортого- нальную систему координат, расположив первые п осей в пространст- ве £, а остальные N — п выбрав ортогональными к этому простран- ству. Пусть в новой системе координат векторы ег представляются в виде er = (Qrl, Йг2, • • •? ^riv)« Очевидно, что в этой системе координат е* = (Qrl, fir2, . . .,Qrn, 0,0, . . .,0). Поэтому N п 2 (22) r==l k=i Матрица || Qr& || ортогональна. Легко заметить, что никаких дру- гих ограничений на вид этой матрицы общая постановка нашей зада- чи не накладывает: при надлежаще подобранной матрице || xir || ран- га п можно достигнуть того, что матрица || Qrfe || будет произвольной ортогональной матрицей. Таким образом, проблема оценки возможных значений может быть поставлена так: какие значения может принимать при п N выра- жение (22) для ортогональной матрицы N-го порядка!
31. Формула Гаусса из теории метода наименьших квадратов 287 Так как то всегда п 2 п ( &гк) 2 --Н’* Л*=1 Поэтому из (22) вытекает N п г—1 k—i В установленном таким образом неравенстве Q < п (23) знак равенства достигается, если матрица || QTli || единичная: &rk ~ crk* С другой стороны, так как всегда то из (22) вытекает В полученном неравенстве Q > nW (24) знак равенства тоже достижим при любых N и n <W, как это была установлено по нашей просьбе А. И. Мальцевым [2]. В § 2 установлено, что nW < Q < п § 3 ВЫВОДЫ (25) и обе указанные в (25) границы достигаются. Для оценки D2o2 от- сюда получаются в силу (14) f*-s* N — п п "V если /4 — Зз4 > О, + » если /4 — 3s4 «С О, 1 N \ N — п /’ 1 ’ (26) N — п
-288 32. Ветвящиеся случайные процессы причем указанные в (26) границы достигаются при любых N и п < N в некоторых частных случаях. Если /4 — 3s4 = О, то из (26) получается известная для случая нормального гауссовского распределения ошибок Дг формула Do2 = 2s*/(N — n). (27) Если отношение n/N стремится к нулю и /4 — $4 0, то асимпто- тически Do2 — (/4 - 54)/(7V - п). (28) В мемуаре Гаусса вместо этого при n/N, стремящемся к нулю, ука- заны для Do2 лишь асимптотические оценки (2/4 _ 4$4)/(7У — п) и 2s4/(7V - п). Заметим еще, что в вырожденном случае /4 = s4 (случай /4 < s4t как хорошо известно, невозможен) из (26) получается Do2 < 2ns4N (N — ri). (29) 5 мая 1947 г. ЛИТЕРАТУРА 1. Колмогоров А. Н. К обоснованию метода наименьших квадратов.— УМН, 1946, т. 1, вып. 1, с. 57—70. 2. Мальцев А. И. Замечание к работе А. Н. Колмогорова, А. А. Петрова и Ю. М. Смирнова «Одна формула Гаусса из теории наименьших квадратов».— Изв. АН СССР. Сер. мат., 1947, т. И, с. 567—568. 32 ВЕТВЯЩИЕСЯ СЛУЧАЙНЫЕ ПРОЦЕССЫ* Совместно с Н. А. Дмитриевым § 1 ПОСТАНОВКА ВОПРССА Будем рассматривать совокупность объектов (например, молекул) каких-либо п типов 7\, Т2, • • • , Тп и предположим, что один объект типа Тк за промежуток времени (£х, t2) превращается с вероятностью -Pfc (*ь h) = р (Дк Sa | ^1, t2) в совокупность Sa == &1Т1 + ^2^2 + • • • + а?гГп, состоящую из объектов первого типа, а2 объектов второго типа и вообще объектов i-ro типа. Случайный процесс, состоящий из та- кого рода превращений, называется ветвящимся, если вероятности Рк (£i, t2) однозначно определяются заданием моментов времени ^ДАН СССР, 1947, т. 56, № 1, с. 7-10.
32. Ветвящиеся случайные процессы 289 ti номера исходного типа к = 1, 2, . . ., п и n-мерного вектора а = (аг, а2, . . ., ап) с целочисленными компонентами = = 0, 1, 2, . . . Существенным здесь является допущение, что вероятности незави- симы от: 1) способа и времени возникновения исходного объекта типа 7\, про который лишь предполагается, что он существует в момент вре- мени 2) судьбы могущих входить в рассмотрение других объектов типов 7\, Т2, . . ., Тп, отличных от данного в момент времени tr объекта типа п объектов, возникающих из него при t > tv Изложенная сейчас теоретико-вероятностная схема может иметь разнообразные применения в биологии, химии и физике элементарных частиц. В частности, в химии цод нее могут быть подведены началь- ные стадии самых разнообразных химических реакций. В самом деле, в начальной стадии химической реакции обычно можно считать кон- центрации одних типов молекул Т2, . . ., Тт большими, ю приближенно постоянными, концентрации же других типе в Ti, Т2, . . Тп переменными, но весьма малыми. В этих предпо- ложениях встреча двух молекул типов Т" практически невозможна, результаты же встреч одной молекулы одного из типов Т" с одной или несколькими молекулами типов Т' в отношении числа возникающих молекул типов Т" приближенно подчиняются сформулированным выше требованиям. В химических и физических вопросах естественно применять ва- риант нашей схемы с «непрерывным временем», предполагая вероят- ности Р? (^, t2)' дифференцируемыми по tr и t2. Дифференциальные уравнения, которые мы получаем в этом предположении в § 3 этой работы для частного случая «мономолекулярных» реакций (Р* (^, t2) > 0 только при o&i 4- а2 + . . . + an = 1), были ранее указаны М. А. Леонтовичем [1]. В биологических вопросах естествен другой подход с «дискретным временем», где «время» t принимает лишь це- лые значения и обозначает номер поколения. В этом варианте изла- гаемые далее результаты были для случая п — 1 получены Р. А. Фишером [2]. Исследования Фишера были продолжены Ж. Ф. Стеффенсеном [3] и одним из авторов настоящей заметки [4]. §2 ОСНОВНОЕ ФУНКЦИОНАЛЬНОЕ УРАВНЕНИЕ В силу общих принципов теории вероятностей Р% (tu t2) под- чинены условиям (*i, t2) > О, (I) 2jP£(*M8)=1. (11) а Ю А. Н. Колмогоров
290 32. Ветвящиеся случайные процессы Считая эти вероятности определенными при любых tr t2, для tr — t2 естественно принять „ „ ( 1, если ак = 1, cq = 0, i к, P$(t,t) = E$ = п (111) ' ' ( 0 во всех остальных случаях. v ' Наконец, в силу сделанных выше допущений вероятности Р% (£1? t2) удовлетворяют при любых ^2 ^3 уравнению р% (h, /з) = S (*1. М Pl (t2, t3), (IV) а где Ра G1> ^2) = Р (*^а *^(3 I ^1? ^2) означает вероятность превращения за промежуток времени (£ь t2) совокупности Sa — <*1^1 + <*2^2 + • • • + ап?п в совокупность == + Рг^2 + • • • + РЛ- Вероятности (£ь t2) допускают выражение через вероятности Р к Gi? t2)l р£(*м2)=ЗП П р^‘Чч,ь), <1Va) г=1 з=1 где суммирование распространяется на все такие наборы векторов 0 (i, s) = (0! (i, s), 02 (i, s), . . 0n (i, s)) с целыми неотрицательными компонентами 0ft (j, s), для которых 1 SS0G» = 0. (ivb) i=l 3=1 Формулы (I)—(IV) заключают в себе полный перевод понятия «ветвящегося случайного процесса», определенного в § 1 на языке теории вероятностей, на язык чистого анализа. Из (IV) и (IVa) вытекает, что вероятности Р& (£1? t2) удовлет- воряют основному уравнению марковских процессов Pl (Ь, М = S Pl (h, t2) Pl (t2, t3). (1) _______ e 1 В формулах (IVa) и (IVb) в случае щ = 0 соответствующее произведение полагается равным единице, а соответствующая сумма равной нулю.
32. Ветвящиеся случайные процессы 291 Уравнение (1) вытекает непосредственно из теоретико-вероятностных предпосылок § 1. Уравнение (IV) по существу является лишь част- ным случаем уравнения (1). Это замечание показывает, что наши «ветвящиеся случайные процессы» по существу являются лишь частным случаем марковских процессов со счетным множеством со- стояний. Для этого частного случая мы получим, однако, аналитиче- ский аппарат, значительно более эффективный, чем тот, который может быть развит для общего случая марковских процессов со счетным числом состояний. С этой целью мы введем производящие функции Fk (/i, t2; х2, х2,.. ., хп) = 3 Р% (h, fa) x?tf... (2) а Целесообразно п функций Fk записывать как одну векторную функцию F (^1» ^2» #) ~ (^1 (^1? ^2? я)» F2 ^2» Д')» • • •» Fn (f19 ^2» #)) векторного аргумента X = (хъ #2, . . £Л). Смысл введения производящей функции F (^, t2; х) заключается в том, что при ее помощи соотношения (IV) записываются в следующей форме: F (*i, t3; х) = F (£ь t2; F (t2, t3; х)). (А) Кроме основного функционального уравнения (А), из (III) для функ- ции F (£ь t2; х) получается еще граничное условие F (t, t; х) = х. (В) Естественно, что функция F (Jx, t2; х) считается определенной лишь для tr t2. Что касается аргумента х, то он имеет чисто фор- мальное значение, однако из (I) и (II) во всяком случае вытекает, что Fk (£ь t2, х) определены и аналитичны по аргументам х2, . . . • • хп при | xt | < 1, 5 = 1, 2, . . ., п. Особенно интересен случай процессов, однородных во времени, т. е. удовлетворяющих условию р“ («1, t2) = Р$. (t2 - fi). (3) В этом случае для Fk^x)^Pl{t)x^...x^ (4) а получаем вместо (А) и (В) F (t + т; х) = F (t; F (т; «)), (Ах) F (0; х) = х. (Вх) 10*
292 32. Ветвящиеся случайные процессы § 3 ДИФФЕРЕНЦИАЛЬНЫЕ УРАВНЕНИЯ ДЛЯ СЛУЧАЯ НЕПРЕРЫВНОГО ВРЕМЕНИ Допустим теперь, что Р* (*, t + А) = + Ьр<% (0 + о (A), (V) где о (А) бесконечно мало по сравнению с А. В этом случае естествен- но ввести производящие функции h (*; *)=3 (0 . <». (5j а Тогда при | Xi | < г < 1, i = 1, 2, . . п, получим F (t, t + А; х) = х + А/ (t; х) + о (А). (6) Полагая в (A) tr = t', t2 = t' + A, t3 — t" и переходя к пределу при А -> О, получим для F (£', t"; х) при tf < Г дифференциальное урав- нение dFldt’ = -/ (f; F). (С) Это дифференциальное уравнение вместе с граничным условием (В) и может быть положено в основу расчета процессов занимающего нас сейчас типа. В самом деле, р% (t) обычно могут быть определены непосредственно из условий задачи, целью же математической тео- рии является определение вероятностей Р% (Z19 t2), иногда же их асимптотического поведения при i2~>+oo. Так как функции Д легко находятся по заданным а искомые Р* получаются из раз- ложения функций Fit по степеням переменных xh то определение вероятностей Р% и исследование их асимптотического поведения сводится к решению уравнения (С) при граничном условии (В) и исследованию асимптотического поведения решений. В однородном во времени случае плотности вероятностей р% по- стоянны и функции Fit (f; • • •» хп) связаны с функциями fk , Хг,..., хп)= 2J Pkxf'xz1 ...х“п (7) а уравнениями ________________ dF2 _ __________ _dFn___д А (Л, F2.. . . , Fn} — /2 (Л, F2, . . . , Fn) fn(Fu F2,..., Fn) — которые следует решать для t > 0, считая xt постоянными при на- чальных условиях Pit (0> Х29 • • •» Хп) = , (В) Часто этот метод значительно эффективнее, чем непосредственное обращение к бесконечным системам дифференциальных уравнений
32. Ветвящиеся случайные процессы 293 марковских процессов со счетным множеством состояний, получаю- дихся из (1) при допущениях, подобных (V). Мы ограничимся здесь одним простым примером применения метода (решение той же задачи методом бесконечных систем см. у Н. Арлея [51). п = pl = а, р{ = —(а + b), pi = b, pi = 0 при г > 2, / (ж) = а — (а + Ь) х + Ьх2 = (1 — х) (а — Ьх). dF -dt F — а + ^(°~Ь:< (1 - F) (а - bF) al' 6 + ce^ ' F{Q-,x) = ^ = x, bx — a 1 — x c F (t; x) = g(*Ta:) + (b* а)е!°м = Pi (t) + (0 x + Pf (t)x2+... ' ’ b (1 - x) + (bx - а) e(a-b,f 1V ' V ’ 1' ' 1 - «(“-ЬХ 1 - (alb) e(a-b)t ’ b / [1 — (a/b) «<“-”>*] *+1 ’ где к = 1, 2, . . . 20 февраля 1947 г. ЛИТЕРАТУРА 1. Леонтович М. А. Основные уравнения кинетической теории газов с точки зрения теории случайных процессов.— ЖЭТФ, 1935, т. 5, с. 211—231. 2. Fischer R. A. The genetical theory of natural selection. Oxford, 1930. - 3. Steffenson J. F. Deux problemes du calcul des probability. — Ann. Inst. H. Poincare, 1933, vol. 3, p. 331—334. 4. Колмогоров A. H. К решению одной биологической задачи.— Изв. НИИ мат. и мех. Томск, ун-та, 1938, т. 2, № 1, с. 7—42. 5. Arley N. On the theory of stochastic prosesses and their application to the theory of cosmic radiation: Diss. Copenhagen, 1943.
294 33. Вычисление финальных вероятностей 33 ВЫЧИСЛЕНИЕ ФИНАЛЬНЫХ ВЕРОЯТНОСТЕЙ ДЛЯ ВЕТВЯЩИХСЯ СЛУЧАЙНЫХ ПРОЦЕССОВ* Совместно с Б. А. Севастьяновым Настоящая заметка примыкает в отношении терминологии и обоз- начений к [1]. Мы рассматриваем далее однородную по t дискретную схему: t пробегает только значения 1, 2, 3, ... и может трактоваться как «номер поколения» рассматриваемой частицы. В соответствии с этим Р? (О = р (П -> ОС1Л + а2т2 + . . . + апТп 1t) (1) ость вероятность того, что одна частица типа Т* даст через t поколе- ний по <хь а2, . . ., ап частиц типов Т2, • • Тп. В основе всех дальнейших подсчетов лежат производящие функции Л- (1 ; =A W=S . • • <п V) а вероятностей р?=р“(1) (3) различных переходов за одно поколение. Через них по индукции определяются производящие функции (4) а для всех натуральных значений t: Fi (t + 1; х) = f* {Fr (t; x), Fz (t; x), . . Fn (i; x)}. (5) В соответствии с общей теорией, изложенной в [1], =/Н0,0, . . .,0) (6) обозначает вероятность того, что частица типа за одно поколение исчезнет, не произведя никаких новых частиц рассматриваемых типов Т2, . . ., Тп. Для дальнейшего целесообразно избавиться от этой возможности и рассматривать только схемы, в которых Л(0, 0, ...,0) = 0. (7) Если условие (7) не выполняется в какой-либо схеме, то всегда можно ввести дополнительный фиктивный тип Тп+1 и считать, что исчезновение частицы любого другого типа обозначает превращение ее в частицу типа Тп+1, частицы же типа Тп+1 остаются далее неиз- ♦ ДАН СССР, 1947, т. 56, № 8, с. 783—786.
33. Вычисление финальных вероятностей 295 ценными. Аналитически это равносильно переходу от первоначальной системы производящих функций /х, /2, . . ., fn к новой системе fit (“£1> • • •> #n+i) = fk (^li • • •, *^n) + + (яп+1 - 1) fk (0, 0, . . .,0), к = 1, 2, . . ., n, (8) /п+l • • •» »^n+l) &n+l* Во всем дальнейшем мы предполагаем условие (7) выполненным уже для первоначальной системы типов Тх, Tit . . .,Тп и функций /1, /2, • • •» fn* Группа типов Тк„ . . ., Ткт называется замкнутой, если частица любого типа группы производит только частицы, принад- лежащие типам той же группы. Система всех типов Т1В Т2, . . ., Тп разложима, если ее можно разбить на две замкнутые группы. Естест- венно ограничиться рассмотрением неразложимых систем типов. Так мы и делаем во всем дальнейшем. Группа типов называется финальной, если: а) она замкнута; б) каждая частица любого из типов группы всегда производит ровно одну частицу; в) она не содержит в себе никакой меньшей группы, обладающей свойствами а) и б). Легко видеть, что две финальные группы не имеют общих элемен- тов. Поэтому вся система типов Тг, Т2, . . ., Тп состоит, вообще говоря, из некоторого числа финальных групп = {Тт1, Тт2, . . - . . ., ТГПг}, г = 1, 2, . . ., $ и некоторого числа типов Го1, Г02, . . . . . ., ТОПо, не принадлежащих финальным группам. При этом no Hr + • • • *4“ — п* Мы будем считать процесс закончившимся, когда остались лишь частицы типов, входящих в финальные группы. Такое понимание естественно, так как потомство частицы типа, принадлежащего к фи- нальной группе, в любом дальнейшем поколении будет состоять ив одной частицы типа, принадлежащего к той же финальной группе, переходы же из одного типа в другой тип в пределах финальной группы управляются хорошо изученными законами так называемых Цепей Маркова в их простейшей форме, соответствующей предполо- жению, что все «состояния» «существенны» и образуют один «класс» (см., например, [2]). Будем обозначать = Р {Тк -> 0^ + + . . . + рх I оо } (9) вероятность того, что эволюция всего потомства одной частицы типа Тк рано или поздно закончится на том, что останется по 0Г частиц, принадлежащих типам финальных групп Тг; (Ю) 0
296 33. Вычисление финальных вероятностей есть полная вероятность того, что процесс развития потомства одной частицы рано или поздно закончится (в указанном выше смысле). Введем производящие функции <Р* («1. •«»,•••, W.) = S (11) & В соответствии с двойным обозначением типов частиц функцию Ф&, соответствующую типу = Trm, будем иногда обозначать <ргт. Так как 0, то в силу (10) функции (И) во всяком случае опре- делены и аналитичны по всем переменным при 0 < ит < ls г = 1, 2, . • ., з. (12) Когда некоторые из переменных достигают значения 1, то аналитич- ность может потеряться, но непрерывность сохраняется. В частно- сти, Ф* (1, !,...,!) = Q*. (13) Из вероятностных соображений легко вывести следующее основ- ное для нас соотношение: = fk (фь ф2, • • м Фп), k = 1, 2, . . ., п. (14) Кроме того, из определения финальных групп можно вывести, что фгт = Wr, Ш == 1, 2, . . Пг, Г « 1, 2, . . ., 3. (15) Уравнения системы (14), для которых номер Л: соответствует типу какой-либо финальной группы, являются следствием уравнений (15). Поэтому окончательно для определения имеем систему уравнений Фот s /от (ф1, ф2, • • фп),; 7И- == lf> 2, е (16) Фгт = иги. ИЪ = 1, 2, * * Пг, Г = 1? 2, • • ., 3. Младшим из авторов настоящей заметки доказана следующая теорема относительно однозначности решения уравнений (16). Теорема. Система (16) вместе с ограничениями 0 ф& < 1, к = 1, 2, . . ., тг, однозначно определяет значения функций Фь ф21 • • •, фп при любых заданных 0 иТ < 1, г = 1, 2, . . ., з. Замечание 1. Доказательство теоремы будет опубликовано в другом месте. Оно опирается на свойства функций /&, вытекающие из предположения о неразложимости системы типов и из определения финальных групп, на допущение (7) и на соотношения р?>о, Зр?=1. (17) а Последние соотношения, впрочем, используются не полностью аналитичность функций /^ несущественна для доказательства.
33. Вычисление финальных вероятностей 297 Замечание 2. Все изложенное применимо и к вычислению финальных вероятностей ql для ветвящихся процессов с непрерыв- ным временем. Для этого достаточно вести счет не по времени в бук- вальном смысле слова, а по «поколениям» частиц. Только для типов, не допускающих совсем дальнейших превращений, надо ввести допол- нительные фиктивные превращения частиц этих типов самих в себя (с вероятностью единица). Это замечание будет пояснено на примере в конце настоящей заметки. Замечание 3. В большинстве применений к химическим цепным реакциям каждая финальная группа состоит из одного типа (конечные продукты реакции). Изложенная теория в этом случае упрощается. Пример. Пусть в схеме с непрерывным временем и двумя ти- пами Ti и Т2 заданы положительные плотности вероятностей перехода (см. [1, § 31) <» = p(Ti-* 27\), Й0’« = р (Ti -+ Т2), остальные же переходы запрещены (в частности, частица Т2 ни во* что не превращается). Переходя к счету по поколениям, полагаем р(2’ °) « = Р (Г, ~ 2Tl} = fl,,, = Р, Pi Т Pi s(0,1) ₽»» = Р (7, 27,> = = 1 - Р, и дополнительно р(0Л) = р {Ti = ! (здесь рк имеют уже смысл вероятностей, введенных в настоящей заметке). Финальная группа в нашем примере одна из одного типа Чл = {Т2}. Для функций <рх (Wi), ср2 (их) получаем уравнения Ф1 = РФ1 + (1 — Р) <Р2, Ф2 = Решая эти уравнения, получим формально <Pi = 4- ±/1-4р(1-р)М1). (18) При ограничениях 0 ur < 1, О «С Ф1 < 1 остается только одна ветвь кривой (18) (со знаком минус). Проведем до конца расчеты для случая р = 1/2- Для коэффици- ентов разложения (и±) = ^i0) + qi}ux + . получим в этом случае о!0).— п л(1)_1/ Л(2)_1/ _ 1-3-5 ... (2m — 3) q± — /2, q± — /8, • • •» (7i — “rn ; » m я, 2 *m\
298 33. Вычисление финальных вероятностей т. е. асимптотически ?<Г*> ~ (1/2|/ л) тг3^. (19) Отметим, что хотя <РЦ1) = = m ч. е. процесс непременно заканчивается, математическое ожидание Мх = S числа получаемых из одной частицы 7\ частиц Тг m бесконечно. С этим связано своеобразное явление неустойчивости числа частиц Г2, производимых заданным, хотя бы и очень большим числом частиц 1\. Чтобы разобраться в этом, обозначим цп число 'частиц Г2, производимых п частицами Тг. Очевидно, Pn = Ki + Ч- + . . . + хп, где обозначает число частиц Т2, производимых 4-й частицей типа 7\. Величины взаимно независимы и подчинены «распределению вероятностей Р {х$ — к] — qi Отсюда и из (19) вытекает (см. [3]), что величины « Нп/п2 (20) имеют закон распределения Sn (х) = Р {£п < х}, который при п -> оо стремится к вполне определенному непрерывному предель- ному закону распределения 5 (х) = $ s (х) dx. (21) о Предельный закон распределения (21) может быть найден по ло- гарифму своей характеристической функции со оо log % (t) = log ( s (x) eux dx = - "— ( (elut — 1) . (22) J 21/ Л t) и12 0 v 0 Таким образом, при больших п число будет порядка п2, но отношение рп/п2 будет колебаться от случая к случаю. ЗДосква, 12 апреля 1947 г. ЛИТЕРАТУРА 1. Колмогоров А. Н., Дмитриев Н. А. Ветвящиеся случайные процессы.— ДАН СССР, 1947, т. 56, № 1, с. 7-10. 2. Kolmogoroff А. М. Anfangsgriinde der Theorie der MarLoffschen Ketten mit unendlich vielen moglichen Zustanden.— Мат. сб., 1936, т. 1, № 4, с. 607—610. 3. Гнеденко В. В. То the theory of the domains of attraction of stable leaws.— Уч. зап. МГУ, 1939, т. 30, с. 61—82.
34. Статистическая теория колебаний с непрерывным спектром 299* 34 СТАТИСТИЧЕСКАЯ ТЕОРИЯ КОЛЕБАНИИ С НЕПРЕРЫВНЫМ СПЕКТРОМ* 1. Предмет, которому посвящен настоящий очерк, может быть охарактеризован в весьма' общих терминах, не связанных с какой- либо специальной областью механики или физики. Для простоты мы ограничимся рассмотрением изменения во времени какого-либо конечного числа величин * и (0, • • Лз (О- Аргумент t (время) будет, естественно, предполагаться действитель- ным, а величины £г (£), вообще говоря, комплексными. Если величи- ны £г (t) изменяются периодически с периодом со, то процесс их изменения изучается обычно при помощи математического аппарата рядов Фурье —S«rn)ei2"nt/®. (1} n Благодаря этому колебательный процесс изменения величин (t) с периодом со разлагается на гармонические колебания периодов со, со/2, со/3, со/4, . . . Естественным обобщением периодических колебаний являются поч- ти периодические колебания вида M0-S4W (2) п Здесь периоды со?! := 2 л/1 J , вообще говоря, несоизмеримы между собой. Естественно, дальней- шим обобщением представляется переход в формуле (2) от сумм по последовательности специально выделенных частот Хп к интегри- рованию по непрерывно меняющейся частоте X оо <3> —оо или в совсем общей форме, объединяющей дискретный случай (2) и непрерывный случай (3), к представлению колебательных процессов * Юбилейный сборник, посвященный тридцатилетию Великой Октябрьской социалистической революции. М.; Л.: Изд-во АН СССР, 1947, т. 1, с. 242—252.
300 34. Статистическая теория колебаний с непрерывным спектром в виде интегралов Стилтьеса оо $ e^d<Dr(M- —оо (4) Однако если ограничиться арсеналом средств классического ана- лиза, то на намеченном сейчас пути встретится существенная труд- ность. Классические интегралы Фурье вида (3) способны представ- лять лишь функции, которые при t -> оо стремятся в среднем к кон- стантам. Интегралы вида (4) тоже способны представлять лишь функции, которые разлагаются на две компоненты ИО = л (0 + I (0, тде ц (£) — почти периодическая (т. е. имеет дискретный спектр), а £ (0 при t оо в среднем стремится к константе. Таким образом, ^классический аппарат интегралов Фурье для случаев непрерывного спектра приводит лишь к затухающим колебаниям. Так и говорится ® учебниках физики, желающих сохранять математическую стро- гость х. Тем не менее идея о том, что и в случае незатухающих колебаний возможны колебания с непрерывным спектром и что их можно изо- бражать интегралами вида (3), культивируется многими, иногда очень крупными представителями механики и физики. Такого рода исследования, несмотря на отсутствие в них математической строго- сти, во многих случаях приводят к правильным и полезным резуль- татам. Предпосылки для строгого математического обоснования теории незатухающих колебаний с непрерывным спектром по существу содержатся в спектральной теории операторов 1 2. Математически строгая спектральная теория функций .£ (0 действительного аргу- мента t, непосредственно ориентированная на математическое обос- нование физических представлений о незатухающих колебаниях с непрерывным спектром, была впервые создана Норбертом Вине- ром 3 в 1925 г. Концепция Винера, однако, не приводит ни к пред- ставлениям вида (3), ни к представлениям вида (4). Полную ясность в весь рассматриваемый круг вопросов внесла лишь спектраль- ная теория стационарных случайных процессов, предложенная А. Я. Хинчиным в 1934 г. [1]. Она, в частности, приводит к мате- матически строгому и в то же время физически осмысленному обос- нованию представления незатухающих статистически стационарных колебаний в виде (4). Это обоснование обладает, по-видимому, вполне достаточной для применений общностью. Представление же незату- 1 См., например, [15, § 54]. 2 См. изложение этой теории в статьях А. И. Плеснера и В. А. Рохлина 116, 17]. 3 Систематическое изложение теории Винера можно найти в четвертой главе его книги [18]; см. также [19].
34. Статистическая теория колебаний с непрерывным спектром 301 хающих колебаний в виде (3) и в концепции А. Я. Хинчина не получает строгого математического обоснования. Автору этой статьи представляется, что такое положение вещей следует считать окон- чательным: в случае непрерывного спектра функциям Фг (X), по- видимому, никаким разумным способом нельзя приписать определен- ные производные <pr (X). Целью настоящего очерка и является рассмотрение некоторых советских и иностранных исследований, развивающих концепцию А. Я. Хинчина. 2. Все очень простые и законченные результаты, излагаемые далее, получаются благодаря радикальному изменению точки зрения: величины (t) рассматриваются как случайные величины в смысле, принятом в теории вероятностей. Таким образом, основным пред- метом изучения делается не индивидуальный вполне определенный колебательный процесс, а закон распределения вероятностей в функ- циональном пространстве различных возможных вариантов течения такого процесса. Формальное изложение теории может исходить из таких опреде- лений 4 5: 5-мерным случайным процессом называется совокупность комплекс- ных случайных величин (£), заданных для всех действительных t и для г = 1, 2, . . ., S. Предполагается, что математические ожидания м Rr (0 12 конечны и процесс стохастически непрерывен в том смысле, что М \ lr(t + A) —gr(0 |2->о при А -> 0. Случайный процесс {|*1 (£), (0» • • м & W) называется стационар- ным, если, каковы бы ни были t, tr, t2, . . tn, sn-мерный закон рас- пределения sn случайных величин £1 (t + h), Вх (t + f2), . . (i + tn), U (i + *1), (t + f2), ...,£>(* + tn), Is (t + tt), (t + t2), . . .,b(t + tn) не зависит от сдвига t. Из стационарности вытекает, в частности, что математические ожидания 6 Bqr(x) = М (t + т) 1г (0} (5) 4 Употребляемые далее понятия теории вероятностей строго вводятся, например, в моей книге [20]. 5 В равенстве (5) £ обозначает величину, комплексно-сопряженную с g.
ЗЭ2 34. Статистическая теория колебаний с непрерывным спектром не зависят от t. Само по себе требование независимости от t матема- тических ожиданий (5) называется стационарностью в широком смысле. Все дальнейшее изложение этого и следующего параграфов основано лишь на гипотезе стационарности в широком смысле. Основной результат А. Я. Хинчина в форме, приданной ему Харальдом Крамером [2], таков: Функции Bqr (т) допускают представление со Bv(r)= J e^dFv{\), (6) —00 где при любых < %2 матрица И3г(Д*)11 приращений Fqr (ДХ) = Fqr (Х2) - FqT (М) является эрмитовой неотрицательной. Чтобы понять смысл хинчиновских спектральных функций Fqr (^)> следует обратиться к дискретному случаю, в котором инте- гралы (6) превращаются в суммы ^gr(T)=34rV^. (7) п Этот случай был исследован Е. Е. Слуцким (3]. Оказалось, что в предположении (7) имеет место разложение (8) п где а!-п) — некоторые случайные величины, однозначно6 опреде- ляемые по заданным (О-Г При этом 4? = М {a<n)d<n)}. (9) В частности, 4? = М | с4п) |2. • (9') Естественно было предположить, что и в общем случае Fqf (Дк) = М {ф, (Дх) ф, (Дх)}, (10) FTT (Дл) = М | Фг (Дх) |2, (Ю') где Фг (Дх) суть приращения спектральной функции, входящей в представление величин (£)* вида (4). Это предположение оказывается правильным. Соответствующее углубление хинчиновской теории стационарных случайных процес- 6 Однозначность здесь имеет место с точностью до эквивалентных величин, т. е. до величин, совпадающих с вероятностью единица.
34. Статистическая теория колебаний с непрерывным спектром 303 сов является почти автоматическим следствием ее сведения к спект- ральной теории однопараметрических групп унитарных операторов, которое указано в работах [4—7] и излагается в следующем пара- графе настоящего очерка. 3. Случайные величины |r (t) можно рассматривать как элементы гильбертового пространства, в котором скалярное произведение определено формулой Q, n) = М (gTj). (11) Легко устанавливается, что любой стационарный процесс (t)f £2 (0> • • •> Ss (0} в соответствующем гильбертовом пространстве порождает однопараметрическую группу унитарных операторов {[7Т}, которые удовлетворяют соотношению U4r (0 = lr(t + т) (12) для всех действительных t и т и всех г = 1, 2, • . s. Операторы С7Т, как известно, допускают представление Vх = $ e^dE(K), (13) —оо где Е (X) — «разложение единицы». Положив Фг (X) = Е (X) gr (0), (14) мы и получим (при надлежащем понимании знака интегрирования) основную формулу (4). Теоретико-вероятностная интерпретация формулы (4) более широко, чем в [6] и [7], изложена в новейших работах X. Крамера [8], М. Лоэва [9], А. Блан-Лапьера и Р. Форте [10, 11]. Чтобы понять реальный смысл основных спектральных функций Фг (X), естественно рассмотреть их приращения Фг (Дх) = Фг (Х2) - Фг (Хх) и скачки ar (X) = Фг (X + 0) - Фг (X - 0) в отдельных точках X. Естественно, что Фг (Ах) и аг (^), как и Sr (0> случайные величины, однако в отличие от gr (t) они не зависят от вре- мени t. Если при каком-либо X скачок ar (X) отличен от нуля, то в 1-r (t) содержится строго периодическая компонента Sr (t, X) = аг (X) (15) В частности, аг (0) есть среднее (по времени) значение 1 аг(°)=Ит — 1 -*оо Т $ Ufidt. —т (16)
304 34. Статистическая теория колебаний с непрерывным спектром Аналогичен реальный смысл приращений Фг (Дх) для достаточно коротких отрезков Дх. Именно компонента Дх) = $ ^МФ(Л), (17) соответствующая участку спектра Дк, на любом конечном участке — Т t + Т временной оси в случае достаточно короткого Дк сколь угодно хорошо аппроксимируется выражением Фг (Дх) (17') где X — любая точка из Дх. Естественно, однако, что в случае непре- рывного спектра компоненты («, Да) ни для какого конечного фиксированного интервала Дх не являются строго периодическими (если‘только они не равны тождественно нулю). Их временное поведение в случае коротких интервалов Дх аналогично колебаниям маятника со слабым затуханием, возбуждае- мого хаотически распределенными малыми случайными толчками. Компоненты (£, Дх) для непересекающихся интервалов Дх и Дх между собой не коррелированы, т. е. м (f, Ai) lT (f, Дх)} = o, (18) если Дх и Ах не пересекаются. Для одного интервала Д% Ax)|r(i. Ax)) = Fgr(AK). (19) В частности, М | (t, А?,) | 2 = FTT (Д%), (19') т. е. Frr (Дх) есть не что иное, как среднее значение (по вероятности) квадрата спектральной компоненты (t, Дх) величины (t). 4. Использование абстрактного аппарата операторов в гиль- бертовом пространстве могло создать у читателя впечатление, что спектральные компоненты Нг (£, Дх) являются какой-то математиче- ской фикцией, далекой от возможностей непосредственного экспери- мента. В действительности это не так: с любым заданным приближе- нием они могут быть выделены из любого статистически стационар- ного колебательного процесса при помощи надлежащим образом уст- роенных фильтров. Именно в принципе с любым желательным при- ближением можно осуществить прибор, связывающий с любой заданной случайной стационарной функцией (/) случайную ста- ционарную функцию Ы0 = Jm* —т)8(т)йт, (20) о
34. Статистическая теория колебаний с непрерывным спектром 305> где s (т) подчинено единственному условию (| s (т) |adr<oo. О Если положить 1 егх2(т-Т) _ eiXt(T-T) s (т) = 2ni Х—Т ’ то при достаточно большом положительном Т 4 I* Ы' + Л = -гИ >('-)• /—Ь -т (21} будете вероятностью, сколь угодно близкой к единице4 сколь угодна мало отличаться от ii(<, W = i J S.(<-T) dr. Заметим еще, что приближенно зависимость (20) можно осущест- вить в виде L|2=Ii, . (22> где L = co + ci-^-+ са-^г+ • • • + сп-^п (23) и характеристические числа L все имеют отрицательные действитель- ные части. При сделанных предположениях, если (0 статистиче- ски стационарно, то и £2 (0 будет при t -> +оо стремиться к ста- тистической стационарности. Это предельное статистически стацио- нарное поведение £2 (t) определяется формулой С eiKt М0 = J K(z)==c0 + c1Z+..l. + cnz”. (24) —оо Формула (24) имеет самостоятельный интерес независимо от вопроса об экспериментальном определении спектральных компонент I? (t, Д^). Из нее вытекает, что ^<4= $ <25> —оо $-твдг • <26>
306 34. Статистическая теория колебаний с непрерывным спектром Формулы (24), (25) и (26) содержат в себе обобщение обычной теории резонанса на случай произвольной статистически стационарной внешней силы. Обычное, не статистическое, изложение этой теории применимо лишь к случаю дискретного спектра внешней силы, т. е. к случаю (0 вида (2). Впрочем, естественно, что без строгого мате- матического обоснования соответствующие рассмотрения для случая непрерывного спектра широко употребляются в физической литера- туре. 5. В приложениях в случае непрерывного спектра обычно к Fgr(X)= $ /er(X)dX, (27) —оо т. е. формула (6) может быть заменена формулой оо £gr(T)= J e«%r(W- (28) —оо Этот переход к спектральным плотностям fqr (X) позволяет в той части теории, которая не связана с функциями Фг (X), обходиться без интегралов Стилтьеса. Самым простым и наиболее важным в применениях является случай, когда законы распределения любого конечного числа величин (t) являются гауссовскими. В этом случае величины Фг (Д£) тоже подчиняются гауссовским законам распределения. Как раз в этих простейших и типичных для случая непрерывного спектра предполо- жениях (применимость формул (27) и (28) и гауссовских распределе- ний) случайные функции Фг (К) оказываются заведомо недифферен- цируемыми и переход от формул (4) к формулам типа (3) представляет- ся безнадежным. На тех участках оси %, на которых спектральная плотность fTT (X) непрерывна и отлична от нуля, функция Фг (X) имеет тот же характер изменения, какой имеет зависимость от вре- мени координат частицы, подверженной броуновскому движению в случае пренебрежения силами инерции, т. е. для малых Д 2=5 = Х2 — приращения Фг (X) имеют порядок У Д- Мы имеем здесь новый случай вторжения в математическую физику непрерывных, нигде недифференцируемых функций вейерштрассовского типа. Если в случае броуновского движения более тонкие рассмотрения с учетом сил инерции вновь возвращают нас к дифференцируемым функциям, то здесь недифференцируемость неразрывно связана с самой идеей непрерывного спектра. За пределами механики и физики колебаний идеи спектрального анализа статистически стационарных процессов находят себе при- менение (например, в метеорологии) по преимуществу в слегка отлич- ной форме спектральной теории стационарных последовательностей* Этой теории, помимо уже цитированных работ [4, 5], посвящена кни- га шведского математика Германа Волда [12]. Существенные допоЛ-
34. Статистическая теория колебаний с непрерывным спектром 307 яения к теории Волда были сделаны В. Н. Засухиным [13]. Ясное понимание того обстоятельства, что существование спектра являет- ся автоматическим следствием статистической стационарности и вовсе не обязательно указывает на реальное возникновение изучае- мого процесса из наложения строго периодических компонент, имели большое значение для критической переоценки так называемой периодографии, претендовавшей на основное значение в метеороло- гии и даже экономике. Ставшие классическими в статистической литературе работы в этом направлении принадлежат Е. Е. Слуц- кому (особенно [14]). ЛИТЕРАТУРА 1. Khintchine A. Korrelationstheorie der stationaren stochastischen Prozesse.— Math. Ann., 1934, Bd. 109, H. 4, S. 604—615. Рус. пер.: УМН, 1938, вып. 5, c. 41—51. 2. Cramer H. On the theory of stationary random processes.— Ann. Math,, 1940r vol. 41, N 1, p. 215-230. 3. Slutsky E. Sur les fonctions aleatoires presque periodiques et sur la decompo- sition des fonctions aleatoires stationnaires en composantes.— Actual. sci.r 1938, N 738, p. 35—55. Рус. пер. в кн.: Слуцкий E. E. Избр. труды. M.: Изд-во АН СССР, 1960, с. 252—268. 4. Колмогоров А. Н. Интерполирование и экстраполирование стационарных случайных последовательностей.— Изв. АН СССР. Сер. мат., 1941, т. 5 № 1, с. 3—14. 5. Колмогоров А. Н. Стационарные последовательности в гильбертовом про- странстве.— Бюл. МГУ. Математика, 1941, т. 2, № 6, с. 1—40. 6. Колмогоров А. Н. Кривые в гильбертовом пространстве, инвариантные по от- ношению к однопараметрической группе движений.— ДАН СССР, 1940, т. 26, № 1, с. 6—9. 7. Колмогоров А. Я. Спираль Винера и некоторые другие интересные кривые- в гильбертовом пространстве.— ДАН СССР, 1940, т. 26, № 2, с. 115—118. 8. Cramer Н. On harmonic analysis in certain functional spaces.— Ark. mat.,, astron., fys. B, 1942, vol. 28, N 12, p. 1—7. 9. Loeve M. Analyse harmonique generale d’une fonction aleatoire.— C. r. Acad, sci. Paris., 1945, vol. 220, N 12, p. 380—382. 10. Blanc-Lapierre A., Fortet R. Sur la decomposition spectrale de fonction alea- toire stationnaire d’ordre deux.— C. r. Acad. sci. Paris, 1946, vol. 222, N 9, p. 467—468. 11. Blanc-Lapierre A., Fortet R. Resultats sur la decomposition spectrale des fonctions aleatoires stationnaires d’ordre 2.— C. r. Acad. sci. Paris, 1946,. vol. 222, N 13, p. 713—714. 12. Wold H. A study in the analysis of stationary time series. Uppsala, 1938. 214 p.; 2nd ed. 1954. 236 p. 13. 3 асу хин В. H. К теории многомерных стационарных случайных процессов.— ДАН СССР, 1941, т. 33, № 5, с. 435-437. 14. Слуцкий Е. Е. Сложение случайных причин как источник циклических про- цессов.— Вопросы конъюнктуры, 1927, т. 3, вып. 1, с. 34—64. Доп. авт. англ. пер. см.: Econometrica, 1937, vol. 5, № 2, р. 105—146. См. также: Избр. тр. М.: Изд-во АН СССР, 1960, с. 99—132. Шпольский Э. В. Атомная физика. М.; Л.: Гостехиздат, 1944. 675 с. Плеснер А. И. Спектральная теория линейных операторов.— УМН, 1941, . вып. 9, с. 3—124. 17• Плеснер А. И., Рохлин В. А. Спектральная теория линейных операторов.— УМН, 1946, т. 1, вып. 1, с. 192—216.
308 35. О суммах случайного числа случайных слагаемых 18. Wiener N. The Fourier integral and certain of its applications. New York 1933. 201 p. Рус. пер.: Винер H. Интеграл Фурье и некоторые его приложе! ния. М.: Физматгиз, 1963. 256 с. 19. Wiener N. The harmonic analysis of irregular motion.— J. Math. Phvs 1926, vol. 5, p. 99-122, 158-191. 20. Колмогоров A. H. Основные понятия теории вероятностей. М.; Л.: ОНТИ 1936. 80 с.; 2-е изд. М.: Наука, 1974. 119 с. * 35 О СУММАХ СЛУЧАЙНОГО ЧИСЛА СЛУЧАЙНЫХ СЛАГАЕМЫХ* Совместно с Ю. В. Прохоровым В работах Вальда и ряда других американских авторов установ- лены некоторые интересные теоремы относительно сумм Sv — + ?2 + • • • + Sv v первых случайных величин из бесконечной последовательности • • •» 5п» • • •» где само число слагаемых v есть случайная величина (см. [1—3]» где можно найти ссылки на более раннюю литературу). По методу доказательства эти теоремы восходят к работе одного из авторов на- стоящей заметки [4], где для оценки вероятности Р {max [ Zn — Ап I > h} l^n^N рассматривались суммы с индексом v, равным первому номеру для которого I Cn An I h. Доказанное в [4] неравенство (см. о нем также [5, с. 154]) легко вы* водится из теоремы 5 настоящей заметки. Мы даем далее очень простые доказательства теорем вальдовско- го типа, относящихся к первым и вторым моментам. Условия при- менимости основных тождеств у нас несколько шире, чем у Вальда и Вольфовица. Достигнутое нами обобщение условий применимости этих тождеств важно для некоторых применений. Во всем дальнейшем v будет обозначать случайную величинуt способную принимать лишь целые неотрицательные значения п = 0, 1, 2, 3, . . . Событие, заключающееся в том, что v = п, будет обозначаться Sn = {v - п}, ♦ УМН, 1949, т. 4, вып. 4, с. 168—172.
35. О суммах случайного числа случайных слагаемых 309 вероятность этого события Рп = Р (5п)- Положим, кроме того, Pn=P{V = n}= 3 Рт- ТП—П Математические ожидания случайных величин М (т]) = § т] d? и будут пониматься в смысле абстрактного интеграла Лебега по мно- жеству U элементарных событий. В соответствии с этим математи- ческие ожидания, когда они существуют, всегда конечны и из су- ществования М (т|) вытекает существование М ( | т] | ). Условные распределения вероятностей и условные математические ожидания понимаются в смысле, объясненном в [6]. Основное значение для всех теорем вальдовского типа имеет допущение (w) При п^> т случайная величина %п и событие Sm независимы. В соответствии с [6] условие (w) означает, что при п т услов - ное распределение gn при условии Sm совпадает с безусловным распределением |п: Теорема 1. Если выполнено условие (w) и существуют мате- матические ожидания м (v) u М (I) = а, М ( |£п| ) = с, где а и с не зависят от п, то математическое ожидание сущест- вует и равно м (Cv) = а м (V). (1) Так как M(v)= 2 Рпп = 2 Рп, п==1 п=1 то теорема 1 является очевидным следствием следующего более об- щего предложения: Теорема 2. Если выполнено условие (w), существуют мате- матические ожидания * (In) = ап, м ( I I ) = Сп
310 35. О суммах случайного числа случайных слагаемых и ряд оо 2l Р'пРп П=1 (I) сходится, то математическое ожидание Zv существует и равно М (c>v) = РпАп, Ап = М (£п) = а± + а2 + • • • + ап- (II) П=1 Доказательство теоремы 2. В силу условия (I) ряд в правой части (II) абсолютно сходится. Применяя к нему пре- образование Абеля, получим 3 РпАп= 3 Рп^п* . (2) п=1 п—1 Вспомним, что Рп = Р {V > п}. Событие {v > п} является дополнительным к событию {v < п}, от которого в силу (w) случайная величина независима. Но из неза- висимости от некоторого события вытекает независимость от допол- нительного события. Поэтому, обозначая M(iq|A) условное матема- тическое ожидание т| при условии А, получим оо оо оо 3 РпАп = 2 р {V > П} ап = 2 р {V > Л} м (gn|vn > п) = п=1 п— 1 п=1 оо оо оо = 2 $ мр=2 3 $ р- <з> n=l {V>n} n=l m=n Sm Так как из независимости от событий {v > п} величины gn вытекает независимость от этого события и величины | £п |, то в силу (I) 2 21$ мр|<2 2 $ 1^=2 $ ie,> = п—1 m==n Sm n=l m=n Sm n—1 {v>n} 00 = 2 p<v>n}M(|gn||vAre = n=l = 2 P{v>«)M(|in|)= 2 pncn<oo. <4) n=l n=l Конечность выражения (4) гарантирует законность следующей заме- ны порядка суммирования: оо оо со т оо 2 2 $ 2 2 $ wp= 2 $ <5’ п=1 m=n Sm m=l n=l sm W=1 Sm
35. О суммах случайного числа случайных слагаемых 311 Так как на Sm имеет место равенство Zm = &v, то оо S $ UdP = JSvdP = M(Cv). (6) и По поводу последнего равенства заметим, что «необходимое собы- тие» U является соединением событий Sm, включая £0, однако про- пуск члена с т = 0 в левой части (6) несуществен, так как в соот- ветствии с установившимся обычаем мы считаем сумму £0 пустого множества слагаемых равной тождественно нулю. Из сопоставления (3), (5) и (6) получается равенство (II), которое л требовалось доказать. При рассмотрении вторых моментов мы будем считать In = (In, In) векторами с двумя компонентами gn и £п- Условие (w) будет теперь пониматься в том смысле, что при п т двумерное условное рас- пределение вектора при условии Sm совпадает с безусловным рас- пределением того же вектора. В дополнение к (w) мы примем еще условие (z) Векторы £2, 1з, • • • взаимно независимы. Зависимость между компонентами одного и того же вектора, наоборот, может быть произвольной. Далее мы рассмотрим частный случай, когда = In. Теорема 3. Если выполнены условия (w) и (z) и существуют математические ожидания М (v’A>, М (^), М {(^ _ а{) (& -1?)} = bl i, 7 = 1, 2, где аг и не зависят от п, то существует М {(& - va1) (&- va2)} = &12M(v). (Ill) Естественно, что в (III) & обозначает & = & + + • . . + & I = 1, 2. Теорема 3 легко выводится из более общей теоремы 4, если заме- тить, что конечность М (V’/.) = 5 рпп‘/г = S Рп — {п — 1)’А) п—1 П—1 оо равносильна сходимости ряда PnVп- п—1 При формулировке теоремы 4 мы употребляем обозначения Лп = а\ + а2 + . . . + йд, = b[j + . + ь1
312 35. О суммах случайного числа случайных слагаемых Теорема 4. Если выполнены условия (w) и (z), существуют математические ожидания М (й) = 4, М {(£ - 4) $ - а3п)} = i, j= 1, 2, и ряд § Pn(]/W+/W) (7) п—1 сходится, то существует М {($ - 4) (Cv - ^)) = 3 рпВ™ (IV) п=1 Доказательство теоремы 4. Переходя от величин |п к величинам *|п = £п — Лп, можно свести общий случай к слу- чаю м (4) = 4 = 0. (8) Его мы и будем далее рассматривать. Положив Фп = £nin + £п£п-1 + £п£п-1> (9) имеем тождественно Хп = £п£п = Ф1 + ф2 + • • • + Фп- (10) Из (8), (9) и независимости |п от (которая вытекает из усло- вия (z)) получаем М (фп) = М (&£) = Ь1*, М (Хп) = В*. (И) Подлежащее же доказательству равенство (IV) при условии (8) переходит в M(Xv)=SPn^n. (12) 71—1 Сравнивая (10), (И) и (12) с формулировкой теоремы 2, мы видим, что (12) есть не что иное, как равенство (II), примененное к суммам XV = Ф1 + ф2 + • • • + Ф*4 Остается проверить, выполнены ли условия теоремы 2. Специальных вычислений требует лишь проверка условия (I), которое в примене- нии к суммам Xv пишется в виде 5 ЛгМ(|фп|)<оо. (13) п—1
36. Локальная предельная теорема 313 При помощи неравенства Буняковского получаем из (9) для М(|фп1) оценку М(|фп|)<М(|^|) + М(|^.1|)< < V + У ъ"в* + У ьж<2 (Уь"в% + У ъгж). (14) Сопоставляя (7) и (14), убеждаемся в том, что требование (13) выпол- нено, чем и заканчивается доказательство теоремы 4. В частном случае можно, отказавшись от векторных обо- значений, писать Вп == Вп == Вп» -Ап === #1 + ^2 + • • • + Вп = bi + Ьа + ... 4- Ьп. Тогда из теоремы 4 получается Теорема 5. Если для последовательности случайных величин выполнены условия (w) и (z), существуют математические ожида- ло ния (^ti) == ЛЛ (Bn ^п)^ :== Ьп ряд 2j Рп *1^&п^п сходится^ п—1 то существует M(^-Xv)2=5 рпВп. (V) 71=1 ЛИТЕРАТУРА 1. Wald A. On cumulative sums of random variables.— Ann. Math. Statist., 1944, vol. 15, p. 283—296. 2. Wald A. Differentiation under the expectation sign of the fundamental iden- tity in sequential analysis.— Ann. Math. Statist., 1946, vol. 17. 3. Wolfowitz J. The efficiency of sequential estimates and Wald’s equation for sequential processes.— Ann. Math. Statist., 1947, vol. 18, p. 215—2 31. 4. Kolmogoroff A. N. Ueber die Summen dutch den Zufall bestimmter unab- hangiger Grossen.— Math. Ann., 1928, Bd. 99, S. 309—319. 5. Бернштейн С. H. Теория вероятностей. 4-е изд. М.; Л.: ГТТИ, 1946. 6. Колмогоров А. Н. Основные понятия теории вероятностей. М.; Л.: ОНТИ, | 1936. 36,1 ЛОКАЛЬНАЯ ПРЕДЕЛЬНАЯ ТЕОРЕМА ДЛЯ КЛАССИЧЕСКИХ ЦЕПЕЙ МАРКОВА* В работе проводится исследование предельных распределений числа попаданий в различные состояния для цепи Маркова с по- стоянной матрицей вероятностей перехода. * Изв. АН СССР. Сер. мат., 1949, т. 13, с. 281—300.
314 36. Локальная предельная теорема § 1 ПОСТАНОВКА ЗАДАЧИ И ОБЗОР РЕЗУЛЬТАТОВ Мы будем рассматривать классическую цепь Маркова, т. е. мар- ковский случайный процесс с дискретным временем, конечным числом s 1 состояний ^1» ^2» • • * 1 и неизменными вероятностями перехода Ра = Р {8 (« + 1) = вр| 8 (0 = еа) (1.1) из состояния е (t) = еа в момент времени t в состояние & (t + 1) = в момент времени t + 1. Естественно, что при этом будут предпола- гаться выполненными обычные условия р£>о, Зр£=1. (1.2) 3 Если считать состояния еа единичными векторами ег = (1, 0, . . ., 0), е2 = (0, 1, . . ., 0), (1.3) es = (0, 0, . . ., 1) s-мерного координатного векторного пространства, то компоненты [Л1, р,2, . . ., р,8 вектора Р, (0 = 8 (1) + 8 (2) + . . . + 8 (0 (1.4) будут равны числу попаданий соответственно в состояния ^1, ^21 • • • > в моменты времени t' = 1, 2, . . ., t. Таких векторных представлений мы будем придерживаться далее. При t = 0 будем считать р, (t) равным нулевому вектору [I (0) = О = (0, 0, . . ., 0). (1.5) Возможными частными значениями вектора р, (t) являются исклю* чительно векторы т = (т1, тп2, . . ., тп8) с целочисленными компонея тами, удовлетворяющими условию = (1.6) fl Для любого целочисленного вектора тп с тп 0 мы положим Wa (т) = Р {|1 (тй) = т I е (0) = еа}. (1.7)
36, Локальная предельная теорема 315 Таким образом, функция Wa (тп) от векторного аргумента тп содер- эяйт в себе условные распределения при 8 (0) = еа всех векторов р (£) для t = 1, 2, 3, . . . Это возможно потому, что в силу соот- ношения hW = 3p₽(0=« (1.8) 3 распределения эти по существу не более чем (5 — 1)-мерны. Естест- венно, что сумма вероятностей Wa (т), относящихся к одной и той же величине р, (t), равна единице: %Wa(m) = l. (1.9) m=t В существенном все дальнейшее исследование будет посвящено выяснению предельного поведения вероятностей Wa (тп) при т оо. К этой задаче сводится без труда исследование предельных распреде- лений сумм случайных величин, «связанных в цепь» (по терминоло- гии А. А. Маркова). Основным заслуживающим внимания случаем является тот, когда все состояния еа образуют в терминологии [1] один класс, т. е. когда выполнено условие (А) Для любых двух состояний еа и е$ существует последователь- ность состояний (еа, eV1, eY2, . . ., еУ}., е^), вдоль которой все вероят- ности перехода Ра, р??, . . Р?£_р Рук положительны. Самый общий случай может быть редуцирован к случаю (А). Это сделано в § 7. Следующие далее леммы 1—3 верны лишь при условии (А). При их формулировке мы будем обозначать знаком Ма условные мате- матические ожидания при гипотезе 8 (0) = еа. Доказательство этих лемм можно найти в [1—3]. Леммы 2 и 3, впрочем, заново доказы- ваются в § 2 этой работы. Лемма 1. Система уравнений = (0 = 1, 2, . ... S), а q =3<7“=1 а (1.10) имеет единственное решение. Лемма 2. При £ —> оо 4? (0 == (t) = tqa + О (1). (1.11) Лемма 3. Вторые моменты = 4?(0)W) -4? О (1-12) при t -> 00 имеют вид (t) = + 0 (1), (1.13) гбе постоянные определяются исключительно матрицей исход- н^х вероятностей Ра.
316 36. Локальная предельная теорема Из общих свойств вторых моментов любой системы случайных величин вытекает, что матрица || W || симметрична, а соответст- вующая квадратичная форма 6(х)= 3 (1.14) а, р неотрицательна. Из тождества (1.8) легко далее вывести, что 3&av = 5Jbv₽=0. (1.15) Y Y Из (1.15) вытекает, что 6 (х) = Ъ (х — Ж). (1.16) Поэтому форму Ъ (х) достаточно рассматривать в ($ — 1)-мерном пространстве N векторов х с X = 0. (1.17) Общим «невырожденным» случаем для нашей задачи естественно считать случай, когда (В) Форма Ъ (х) положительна в пространстве N векторов х, для которых 3=0. В силу (1.15) определитель формы b (х) всегда равен нулю: | И>| = 0, (1.18) а все главные миноры матрицы || W|| равны друг другу: Дц — Д22 = . . . = Д8в = Д. (1.19) Из неотрицательности Ъ (х) вытекает, конечно, что всегда Д > 0; (1.20) условие же (В) равносильно требованию Д>0. (1.21) При условии (В) форма b (х) имеет в пространстве N обратную форму с(х), которую можно записать, например, в виде Ь11 b12 ... «-1 X1 С («) =—2- 621 Ь22 ... 62- s-1 X2 (1.22) fts-1. 1 X1 &»-1. 2 X2 frs-i, s-1 . . . Xs"1 Xs'1 0 или аналогичным образом, выделив вместо индекса s — 1 какой- либо другой индекс у.
36. Локальная предельная теорема 317 Положив р (х) = —г * .=- е_,/2с<х\ Уз (2л>8"’1 А (1.23) (1.24) мы можем формулировать «невырожденную» интегральную предель- ную теорему. Теорема 1. При условиях (А) и (В) для любого у и любой квадрируемой области G пространства N при t оо Р (*) е G18 (0) = еу} -> $ р (х) dx, (1.25) G где dx = Уsdx}dx2 . . . dx8-i (1.26) обозначает объем в пространстве N. Эта теорема доказана в § 4. Однако, чтобы сформулировать наиболее простую локальную предельную теорему, мы должны еще произвести некоторый допол- нительный анализ возможных направлений перехода из состояния в состояние. Будем называть цепочкой последовательность состояний (^Yo> • • •> eYfc)> (1-27) для которой все вероятности перехода Ръ> Рч‘, • • •> Ръ-1 положительны. Цепочку (1.27) будем называть циклом, если То = Ъ- ’ (1.28) Назовем, далее, s-мерный вектор z циклическим, если существует такой цикл (1.27), что и = + ву9 + . . . + (1.29) Назовем, наконец, основной решеткой множество всех векторов т* представимых в виде т = а^ + a2z2 + . . . + anzn, (1.30) гДе zx, z2, . . ., zn — циклические векторы, а ах, а2, . . ., ап — произвольные целые числа (число слагаемых п тоже произвольно). Основную решетку будем обозначать через Z. Очевидно, что Z состоит исключительно из векторов с целочисленными компонентами. и образует группу относительно сложения. Нужное нам дополни- тельное условие формулируется теперь так:
318 36. Локальная предельная теорема (С) Основная решетка Z совпадает с множеством Q всех целочис- ленных векторов s-мерного векторного координатного пространства. Из результатов § 6 и 7 вытекает, что совокупность условий (А) и (С) необходима для того, чтобы предельное поведение вероятностей Wy (т) не зависело от индексов у. Таким образом, случай соблюде- ния обоих этих условий является единственным, в котором можно рассчитывать на получение идеально простой по формулировке ло- кальной предельной теоремы. Это заставляет считать в известном смысле вполне окончательными результаты § 3 и 5: Следствие 3 леммы 10 (§3). Из условий (А) и (С) выте- кает условие (В). Теорема 3 (§ 5). Если 1 выполнены условия (А) и (С), то при <т -> оо независимо от выбора индексов у Wy(m)~ -- 1---- у (гпй)8-^ -где х = (т — mg)/y (1-31) | i (1.32) Представляется крайне интересным вопрос, на который мы не имеем пока ответа: не являются ли в предположении, что условие < (А) выполнено, условия (В) и (С) равносильными? Если бы ответ на этот вопрос был положительным, то условия применимости локаль- ной теоремы 3 и приведенной выше интегральной теоремы совпадали бы 2 * * * * *. В § 6 полностью разобраны осложнения, возникающие при со- хранении условия (А) от нарушения условия (С). Как уже упомина- лось выше, в § 7 рассмотрен случай нарушения условия (А). Форму- лировки результатов этих параграфов несколько сложнее, однако 1 В формуле (1.31) в отличие от (1.23) нет множителя s под знаком корня, так как в (5 — 1)-мерном пространстве векторов т с заданным т (напри- мер, в пространстве N) целочисленные точки распределены с плотностью Заметим еще, что в самом тексте § 5 формулировка теоремы 3 отличается от при- веденной здесь более точным указанием характера приближения вероятностей Wy (т) к их асимптотическому выражению. 2 Пусть L есть линейное замыкание основной решетки Z, т. е. множество всех векторов, представимых через циклические в виде (1.30) с произвольными .действительными коэффициентами а^. В § 3 (см. следствие 2 леммы 10) доказано, что при условии (А) требование (В) равносильно требованию (В') Пространство L совпадает со всем 5-мерным векторным пространством Л. Остающийся нерешенным вопрос о равносильности (В) и (С) был бы решен, если бы было показано, что (*) При условии (А) основная решетка Z всегда совпадает с множеством всех целочисленных точек из L. Весьма вероятно, что предложение (*) верно. Если бы оно было доказано, то это привело бы и к некоторому усовершенствованию результатов § 6. Позднее предложение (*) было доказано Розенкнопом в Москве и Чуланов- ским в Ленинграде.
36. Локальная предельная теорема 319 вопрос о предельном поведении вероятностей Wy (т) по существу разрешен в них в самом общем случае с той же полнотой, как и для случая соблюдения условий (А) и (С). § 2 МЕТОД ДЕБЛИНА Локальные теоремы, составляющие основное содержание настоя- щей’работы, будут получены в § 5 и 6 при помощи некоторого усиле- ния метода, который был развит Деблином для доказательства ин- тегральной предельной теоремы в случае бесконечного числа состоя- ний [4]. Для того чтобы сделать ясным развитие метода, мы выделя- ем в этом параграфе краткое изложение метода Деблина в той его первоначальной форме, в которой он годен лишь для доказательства интегральных теорем. Изложение в этом параграфе будет кратким, так как излагаемые здесь результаты можно считать в существенном известными. Условие (А) здесь, как и в § 3 —6, будет предполагаться выполненным без особых о том упоминаний. Кроме того, во всем этом параграфе ин- декс у будет считаться фиксированным и будет предположено, что 8 (0) - ву. (2.1) Условные вероятности и математические ожидания при этой гипотезе будут обозначаться через Р {А [ 8 (0) = М = Pv (А), M{g | 8 (0) = М = MY (g). Пусть 0 = т (0) < т (1) < т (2) < . . . < т (п) < . . . — последовательность всех тех моментов времени £, в которые наб- людается состояние ву. Будем обозначать при n 1 6 (п) = р (т (га)) — р (т (га — 1)), (2.2} X (га) = б (1) + 6 (2) + . . . + 6 (га) = р (т (га)). (2.3} При п = 0 положим X (0) = 0. (2.4). Компоненты 6“ (га) вектора б (и) обозначают число попаданий в со- стояние еа в моменты времени t, удовлетворяющие неравенствам т (га — 1) < t т (и), т- е. между (га — 1)-м и и-м возвращением в исходное состояние (включая самый момент га-го возвращения). Очевидно, что всегда б* (га) = 1, (2.5} а Для сумм X (га) V(ra) = га. (2.6)-
320 36. Локальная предельная теорема В основе метода Деблина лежит простое замечание: случайные векторы б (п) взаимно независимы и одинаково распределены. Бла- годаря этому обстоятельству к суммам % (п) можно применять пре- дельные теоремы, установленные для сумм независимых слагаемых. Соотношение же (2.3) позволяет переходить от сумм % (п) к суммам |Л (0. Мы изложим далее два варианта этого перехода: один опира- ется на лемму 6 и дает наиболее точные результаты при оценке вто- рых моментов] (t), второй опирается на лемму 7 и удобен при вы- воде интегральных предельных теорем. В [1] доказана Лемма 4. Величины ба (п) имеют конечные математические ^ожидания а? = MY6a (n) = q*/q\ (2.7) В силу независимости слагаемых б (м) MYXa (п) = (2.8) .а в силу тождества т (n) = X (п) (2.9) из (2.7) и (2.8) получается рЦ9—7- <2Л0> Методами [1] легко доказывается Лемма 5. Существуют такие постоянные С и D > 0, что при .любом к для 6 (п) = т (п) — т (п — 1) выполняется неравенство Р [б (п) > к} < Се~™. (2.11) Из леммы 5 вытекает Следствие. Вторые моменты {(6« (п) — а*) (б₽ (п) — 4)} (2.12) .конечны. Подобно (2.8) для вторых моментов Ха (п) получаем Mv{(X«(n) — па%)(№(п) — nafy} = nb^. (2.13) Пусть обозначает наименьшее из чисел т (п), которое а V (0 — соответствующий номер п. Положив х (0 = х (vt) = ц (тг) = S 6 (п), (2.14) п==1 «получим Xl = vf, (2.15) Г, = т,. (2.16)
36. Локальная предельная теорема 321 Вполне аналогично лемме 5 доказывается Лемма 6. Существуют такие постоянные С и D > 0, что при любом к выполняется неравенство (2.17) Так как всегда I (0 - Иа (И I < 11 - t' I, (2.18) то из (2.17) вытекает, что Pv {| Х“ - (I) | > к} < Се~™. (2.19) К суммам со случайным индексом v< vt Х,= 3 6(n) п=1 применимы известные тождества Вальда (об условиях их примени- мости см. [5]), в силу которых справедливы соотношения MYX? = a?MY(V/), (2.20) Mv {(X? - V(d?) (X? - vt4)) = (Vt). (2.21) Из (2.16) и (2.20) получаем (2.22) a ® В силу леммы 6 при t -> оо Myt( = t + О (1). (2.23) Из (2.22) и (2.20) получаем поэтому, что при MyV/ = # + о (1), (2.24) MVX? = qt + О (1). (2.25) Неравенство (2.19) позволяет из (2.25) извлечь М^ (£) = q^t + О (1). (2.26) Мы получаем новое доказательство леммы 2, сформулированной в § 1. Заметив, что тождественно X? _ Ttg«=(Xta- v,a?) - g«3(X?- vta?), (2.27) , ч> получаем далее при помощи (2.21) Му{(Х?-т/д“)(Х?-т^)} == ' = Му (V,) - 3 (<№ + «<) + 3 «V*?*] • (2-28) ф ф, А. н. Колмогоров
322 36. Локальная предельная теорема Лемма 6 позволяет в (2.28) при t оо с точностью до О (1) заме- нить левую часть равенства на (0 = м7 {(и* (0 - Ау (0) (0 - 4? (0)} (1.12) Вместе с (2.24) это приводит к формулам (О = tb<* + о (1), (1.13) где Ьа₽ = ду _ 2 (д₽Ь“ф + q<*bf) + 3 qOqtbf]. (2.29) ф ф» ф Мы доказали, таким образом, лемму 3 из § 1, выяснив дополнитель- но связь коэффициентов с моментами (содержащееся в лем- ме 3 утверждение о независимости Ьа$ от индекса у надо доказать от- дельно, но это в силу принятого нами условия (А) не представляет затруднений). Отметим здесь, хотя оно и не понадобится нам далее, обращение а формул (2.29): = -L(W - _ a₽fe«Y + afyfyw). (2.30) <г Введем в рассмотрение векторы г ----------- П П(п) = У 4^(n)-X(n)g]=-^ Уд(Л), (2.31) Vn k^i где Д (и) = qt [6 (и) — S (п) д]. (2.32) При помощи (2.7), (2.12) и (2.29) получим МуДа(п) = Мтт1«(п) = 0, (2.33) МуД“ (га) ДР (И) = МуЯ« (га) т]₽ (га) = W. (2.34) Так как Д (га) независимы и одинаково распределены, то в силу (2.33) и (2.34) векторы г] (га) в пределе при га -> оо подчиняются гаус- совскому распределению, соответствующему матрице вторых момен- тов || &“Р ||. Применяя к суммам п" S Д(Л) k—nf известное усиление неравенства Чебышева (см. [2, с. 154]), легко доказать такое предложение. 8 (2.30) можно доказать непосредственно аналогично приведенному в тексте доказательству (2.29), исходя вместо (2.27) из тождества которое очевидно в силу (2.15).
36. Локальная предельная теорема 323 Лемма. Если при п ->• оо случайная величина vn, принимающая только натуральные значения, удовлетворяет условию | vn — п | < где С — некоторая постоянная, то при любом h О Pv {I П (vn) - т) (п) | > h} -> 0, (2.35) когда п-* <х>. Для перехода от векторов т) (п) к векторам I (О = (и (О - (1.24) введенным в § 1, служит теперь Лемма 7. Если щ есть целая часть от tqV, то при любом Н>0 Ру {IU0-n («<)!>#}-► О, (2.36) когда оо. При доказательстве леммы 7 можно совершить переход от £ (t) к т] (Г) через посредство векторов £ (т() и П (vt) = (я)- (2.37) Для оценки vt следует при этом использовать соотношение Mv (v< — = b^t + О (1), (2.38) которое получается из (2.24) и (2.28), если в (2.28) положить а = = ₽ = у. В силу леммы 6 из (2.28) вытекает, что при достаточно больших С и t вероятность РуЦу, — nJ>C Vnt} делается сколь угодно малой. Это позволяет применить соотноше- ние (2.35), положив в нем h = 1/^Н, и написать Ру {I Я (я) — Л («г) I > Vs#) -* О ПРИ *-*•<». (2.39) Из леммы 6, (2.38),. определения щ и (2.37) вытекает, что Ру {I В (Т|) — П Ы | > 4J1} -> 0 при t -> ОО. (2.40) Наконец, в силу леммы 6 ру {I £ (0 - В (Я) I > ЗД -> о при t -> оо. (2.41) Соединяя (2.39)—(2.41), получаем (2.36). Применение леммы 7 к выводу интегральных предельных теорем будет изложено в § 4. it*
324 36. Локальная предельная теорема § 3 ЦИКЛИЧЕСКИЕ ВЕКТОРЫ И ОСНОВНАЯ РЕШЕТКА Кроме вероятностей Wy (тп), нам понадобятся еще вероятности Wy (т) = PY {j* (ffl) — т,ъ (ffl) = е№}. (3.1) (тп) есть условная вероятность при гипотезе 8 (0) = ev совмеще- ния двух событий: 1) в моменты времени t = 1, 2, . . попасть по тп& раз соответ- ственно в состояния ер, (0 = 1, 2, . . ., а) и 2) в заключительный момент t = fn попасть в состояние еа. Для нулевого вектора тп = 0 положим ^(0) = |! П1" (3.2) 7 ' ' (0 при у =Д а. Т Очевидно, что вероятности Wy (тп) выражаются через вероятности (тп) по формуле ТГу(тп) = 31Г?(тп). (3.3) а Специальный интерес имеют вероятности Wy (тп) с совпадающи- ми верхним и нижним индексами. Через них можно выразить рас- пределения вероятностей векторов % (п), рассмотренных в предыду- щем параграфе: PY {1 (тп7) = тп} = Wy (тп). (3.4) Так как всегда X7 (п) = п, (3.5) то распределение К (п) при гипотезе е (0) = eY полностью определя- ется значениями Wy (тп) с тп7 = п и . при любом п >= 0 3 ТГ?(тп)=1. (3.6) Очевидно, что для любого циклического вектора z, для которого zY 0, имеет место неравенство IF? (z) > 0. (3.7) Легко видеть, что и обратно: если при каком-либо у имеет место не- равенство (3.7), то вектор z циклический 4. Особое значение имеют для нас циклические векторы с zY = 1* Они и только они являются значениями векторов S (п), которые (ес- тественно, при гипотезе 8 (0) = еа) имеют положительную вероят- ность. К ним относится 4 Отметим еще здесь, хотя оно нам и не понадобится, любопытное тождество (г) = (г).
36. Локальная предельная теорема 325 Л е м м а 8. Минимальная аддитивная группа векторов^ содер- жащая все циклические векторы с zy = 1, совпадает со всей основной рететкой Z. Для доказательства леммы достаточно установить, что любой циклический вектор z может быть представлен в виде линейной ком- бинации с целыми коэффициентами циклических векторов z с С этой целью рассмотрим три случая: 1) если zY = 1, то наше утверждение уже доказано; 2) если zY 1, то порождающий вектор z цикл можно разбить на zY циклов от попадания в еу до ближайшего (вдоль по циклу) следующего попадания в eY и вектор z представится в виде Z = + z2 + . . . + ZzY, где векторы z^ соответствуют частным циклам; 3) если zY = О, т. е. порождающий z цикл (eYe, eY1, . . eYo) совсем не содержит еУ9 то в силу допущения (А) можно найти цепочки (cY, са1, с<х2, ..., eYo), (eYo, e$i9 e&29 ..e^9 eY). Можно выбрать эти цепочки так, чтобы они содержали eY, только первая — в виде первого элемента, а вторая — в виде последнего. Тогда цепочки • • •» • • •> ^Y» • • •> eYo)’ (eYo* ePi9 • • •> ePj> ^ap • • •> ^Vo) будут циклами, а для соответствующих им циклических векторов zi и z2 получим 21 — z2 = Z9 Zi = 1, 4 = 1. Доказательство леммы, таким образом, закончено. Обозначим через й минимальное линейное подпространство s-мер- ного векторного пространства, содержащее все циклические векторы (а следовательно, и всю основную решетку Z). Размерность г этого пространства будем называть рангом рассматриваемой цепи Мар- кова. Пересечение й с (s — 1)-мерным пространством N векторов х с $ = 0 обозначим через £0. Так как й заведомо не содержится в N Существуют циклические векторы z с z 0), то размерность Й рав- на г — 1. Лемма 9. Пространство £ совпадает с линейной оболочкой качений векторов 6 (п), имеющих (при гипотезе 8 (0) = еу) положи- тельную вероятности а пространство £в,— с такого же рода
326 36. Локальная предельная теорема линейной оболочкой возможных значений векторов Д (п) = [6 (п) — 6 (п) д]. (2.32) Первая часть леммы 9 непосредственно вытекает из леммы 8. До- казательство второй части можно осуществить так: 1. Из леммы 4 и первой части леммы 9 вытекает, что вектор g принадлежит пространству 2. Легко проверить, что Д (га) = 0. Поэтому возможные значе- ния Д (п) входят в Й. 3. Так как возможные значения 1 - б(га)=-^=-Д(я) + б(п)? порождают все пространство S, получающееся присоединением к £0 не лежащего в £0 вектора д, то возможные значения Д (п) порож- дают все пространство £0. Так как М?Д (п) = 0, М?Да (и) ДР (п) = &а₽, (2.33) (2.34) то из леммы 9 почти непосредственно вытекает Лемма 10. Лемма 10 приводит нас к следующим выводам (некоторые из них уже упоминались в § 1): Следствие 1. Ранг матрицы || ЬаР || равен г — 1. Следствие 2. Условие (В) равносильно условию (BJ Г = S. Следствие 3. Из условия (С) вытекает условие (В). В заключение этого параграфа мы покажем, что определение ос- новной решетки Z и проверка условия (С) являются чисто арифмети- ческими задачами, допускающими простое алгоритмическое решение. Легко видеть, что при определении циклов достаточно рассматри- вать вместо матрицы || || матрицу || 6а ||, где Последовательность (eVo» eYP • • •» ^Yf)
36. Локальная предельная теорема 327 будет циклом в том и только в том случаег если (3.10) Цикл будем называть простым, если он содержит каждое состоя- ние не более одного раза. Соответствующие простым циклам простые циклические векторы характеризуются тем, что для них все компо- ненты не превосходят единицы: za < 1. (3.11) Так как простых циклов конечное число и все они могут быть легко найдены, то следующая лемма делает определение основной решетки вполне эффективным. Лемма 11. Все векторы т из Z представимы в виде (1.30) с простыми циклическими векторами z^. Для доказательства достаточно заметить, что любой цикл, в ко- тором какое-либо состояние встречается более одного раза, может быть разбит на два цикла. Повторяя такое разбиение, можно любой цикл разбить на простые циклы. Пусть /1» fit * • •> fh есть система всех простых циклических векторов. Из сказанного вы- ше непосредственно вытекает Лемма 12. Решетка Z есть минимальная аддитивная группа,t порождаемая векторами /1? f2, . . ., fh, а пространство £ есть линей- ное замыкание этой системы векторов. Ранг г марковского процесса равен рангу матрицы IIЙII, а условие (С) равносильно условию (СЦ Ранг матрицы || || равен s, а общий наибольший делитель определителей s-го порядка, которые можно образовать из ее строк (fg, fg, • . /g), равен единице. Пример . Пусть з = 5 и 0 10 11 0 0 10 0 10 0 10 0 10 0 1 0 1* 1 о о /i = (11100) /2 = (10101) Легко проверить, что простые цгклы здесь имеются только мз трех или четырех состояний. Вот полная их таблица: (^1» е3, е^, («и е5> е3, ег)
• 328 36. Локальная предельная теорема (^2* *3» ^4> ^2) (^3> ^4> ^б> *з) (^1, ^41 ^2> *3, ^1) (^i, в^, £5, £3, в}) (^1, ^5» ^2» *3, ^1) (^2? *3> ^4> ^б> ^2) /3 = (OHIO) /4 = (00111) /5 = (11110) /в = (10111) /7 = (11101) /8 = (01111) Справа приведены соответствующие циклам векторы fg. Так как оц» ределитель А /» /з — 1 1 1 10 1 0 1 1 0 0 0 1 10=. — !, h /5 0 0 1 0 1 1 1 1 1 1 то г == 5 и условие (С) выполнено. Если в матрице || 0а || этого примера 01 = 1 заменить на ©1 = 0t то из простых циклов сохранятся только первые шесть и можно будет подсчитать, что ранг понизится до г = 4. § 4 ИНТЕГРАЛЬНЫЕ ПРЕДЕЛЬНЫЕ ТЕОРЕМЫ В силу леммы 10 распределение векторов А (п) и т| (п) полностью сосредоточено на пространстве £. Так как форма Ь (х) на этом про- странстве положительна, то при п —>• оо в пределе ц (п) подчиняется соответствующему форме Ь(х) невырожденному на £0 гауссовскому распределению. Плотность вероятности этого гауссовского распре-? деления мы обозначим через р(х). В силу леммы 7 из сказанного вытекает Теорема 2. При условии (А) для любого у и любой области в пространстве G, у которой пересечение границы с пространством £0 имеет в £0 меру нуль, при t-+ 00 PY (0 е G} -> J р (х) dx, (4.1) on*. где dx — элемент объема в £0. В частном случае соблюдения условия (В) пространство £0 сов* падает с N и из теоремы 2 получается теорема 1, сформулированная в § 1.
36. Локальная предельная теорема 329 § 5 ОСНОВНОЕ ТОЖДЕСТВО И ЛОКАЛЬНАЯ ПРЕДЕЛЬНАЯ ТЕОРЕМА В НЕВЫРОЖДЕННОМ СЛУЧАЕ Видоизменение метода Деблина, позволяющее сводить локаль- ные предельные теоремы для цепей Маркова к локальным предель- ным теоремам для независимых слагаемых, основано на следующем тождестве: Wv(m) = 5 (5.1) lY=o Суммирование в правой части распространяется на все целочислен- ные векторы I е неотрицательными компонентами, удовлетворяющими условиям la < wa, (5.2) 1У = 0. (5.3) Тождество (5.1) с вероятностной точки зрения очевидно. Легко подсчитать, что сумма вероятностей (Z) по всем векто- рам I, удовлетворяющим условию (5.3), равна 3 TTv(Z) = M?6(n)=-l. (5.4) 9 При дополнительном ограничении (5.2) эта сумма может сделаться несколько меньше, но в силу абсолютной сходимости ряда (5.4) та- кая урезанная сумма стремится к l/gv, когда все та неограниченно возрастают. Если выполнены условия (А) и (С), то в силу леммы 8 минималь- ная аддитивная группа, порождаемая имеющими положительную ве- роятность (при гипотезе 8 (0) = еу) значениями векторов б (п), со- стоит при любом у из все-л целочисленных векторов. Что касается разностей возможных с положительной вероятностью значений век- торов б (п), то для них всегда пгу = 0 (так как для самих возмож- ных значений б (п) всегда ту = 1), т. е. они содержатся в группе yy всех целочисленных векторов m с mY — 0. Легко видеть, что на самом деле они порождают всю эту группу: если бы векторы. ^1 — тп0, т2 — 7По, . . ., . . ., : г^е пгъ . . ., . . .— все возможные значения б (п), порожда- ли не всю группу Qy, sl лишь ее собственную подгруппу, то после Рисоединения одного вектора иг0 они не могли бы породить всю РУппу Q, между тем группа, порождаемая векторами то? пг1 — тп0, т2 — тп0, . . тк — т0, . .
330 36. Локальная предельная теорема очевидно, совпадает с группой, порождаемой векторами 7П0, 7П1? ТП2, . . Tftfc, . . ., т. е. в силу допущения (С) с полной группой целочисленных вект<ь ров Q. В силу сказанного имеет место Лемма 13. При условиях (А) и (G) минимальная группа, по- рождаемая разностями возможных значений векторов 6 (п), совпади- ет с группой Qy всех целочисленных векторов т с тУ = 0. Из леммы 4, следствия из леммы 5 и леммы 13 при помощи локаль- ной предельной теоремы [6], примененной к суммам X (п) = 6 (1) + 6 (2) + . . . + 6 (п), получается Лемма 14. Если выполнены условия (А) и (С), то при тУ -> оо D/W? (т) = Ру (у) + о (1), (5.5) где у= (5.6) у тУ Ру (у) — гауссовская плотность вероятностей в пространстве соответствующая нулевым средним значениям и матрице дисперсий В оценка остаточного члена действует равномерно при | — тУда1дч \<СУтУ (5.7) с любым фиксированным С. Если обратить внимание на то, что при условии (5.7) и тУ ~ тд\ то (5.5) можно записать в виде 8—1 _ 8—1 W 2 И^(тп) = (д*) 2 Ру (у) 4-0(1). * (5.8) Эту оценку следует теперь применить к Wy (т — I) в формуле (5.1)» Так как в силу сходимости ряда (5.4) в правой части (5.1) можно при fn —> оо ограничиться членами, для которых отношения (та — Za)/zna сколь угодно близки к единице, то из (5.1), (5.4) и (5.8) получаем при fn —оо 8—1 _ 84-1 W 2 Wy(m) = (gV) 2 ру (у) 4- о(1), (5.9) где ограничение (5.7) можно заменить ограничением | та — fficp | < С Yт, (5.Ю)
36. Локальная предельная теорема 331 Так как при т->оо и ограничении (5.10) х= ~ ~ (5Л1-* у Ш у qV у (х - xfq/qy), (5.12) То (5.9) можно переписать в виде 8—1 ~~ 5 * *Ч~1 _ Wy (m) = (pv) 2 Py [ (x- «W)] + 0 (1). (5.13) формула (5.13) действует равномерно при ограничении (5.10). Этого достаточно, чтобы из сопоставления с интегральной теоремой 1 полу- чить 8 pv [Yfi (х — x'lqlq'i')] = Y'sp (х). (5.14) Окончательно результат проведенных в этом параграфе рассуж- дений формулируется так: Теорема 3. Если выполнены условия (А) и (С), то при т оо: для любого у (т) = Ysp(x) + o (1) (5.15) равномерно при условии (5.10). § 6 СЛУЧАЙ НАРУШЕНИЯ УСЛОВИЯ (С) В этом параграфе мы сохраняем условие (А), но отбрасываем ус- ловие (С). Так как теперь основная решетка Z не совпадает с полной решеткой Q всех целочисленных векторов, то естественно рассмотреть вычеты Q по Z. Более подробно это означает следующее. Два вектора и тп2 будем считать сравнимыми по модулю Z, если т1 — т2 е Z. (6.1) Все векторы с целочисленными компонентами разбиваются на клас- сы векторов, сравнимых по модулю Z. Эти классы и будут вычетами по Z. Лемма 15. Векторы т, для которых при фиксированных а и р П (ш) > 0, (6.2) сравнимы между собой по модулю Z. Можно высказать лемму 15 и так: 5 Равенство (5.13) можно, конечно, доказать непосредственно из соотноше- ний между моментами и Ь0^. Тогда доказательство формулируемой ниже ло- кальной теоремы 3 сделалось бы независимым от интегральных теорем. Такое более последовательное с алгебраической стороны изложение было бы, однако, Несколько громоздко. Множитель в (5.14), как уже было указано в § 1^ связан с тем, что целочисленные точки в N расположены с плотностью l/p^s.
332 Зв. Локальная предельная теорема Лемма 15'. Все векторы т, для которых имеет место нер^ венство (6.2), входят в один и тот же вычет по модулю Z. Вычет этот мы будем обозначать через Р». Для доказательства леммы 15 допустим, что W& (т^ 0 и ТУ* (^2) 0- Тогда существуют цепочки (^а> ^Ф2> • • •» == (^а> ^ф2» • • •» == £$)» для которых еФ1 + вф2 + • • • + e<pj = mi, + ... + е^. = тп2. В силу условия (А) существует цепочка еХ1, еХ2, . . ., eXfc = = еа. Легко видеть, что (еа, ефх, еФ2» • • •> = еХ2> • • •» eXfc = еа)> (ва, е-фр в<ф2,..., еХр .., ех^ = еа) суть циклы. Соответствующие циклические векторы обозначим через и z2. Так как тг — т2 = — z2 е= Z, то лемма доказана. Легко видеть, что всегда 6 D] = Z, (6.3) I% + Dl = Dt (6.4) Из общей локальной предельной теоремы [6] вполне аналогично лемме 14 получается Лемма 16. Если выполнено условие (А) и г 1, то при тУ -> оо —rxrv f 0 при m<^Z, (тп?) 2 (т) = I / \ । /л \ Г7 (6.5) ' ' ' I <oYpY (у) +0 (1) пРи mgEZ, v у= т-тУд/дУ , (5<6) ту оценка остаточного члена действует равномерно при | та — тУд'Чдч | < С ^тУ, (5.7) PV (у) есть гауссовская плотность, соответствующая в пространстве £y векторов у ЕЕ 2 с у? = 0 нулевым средним значениям и матрице вторых моментов || ||, a coY есть плотность расположения точек из Z в пространстве ’^Формулу (6.5) можно, подобно тому как формула (5.5) была заме- нена формулой (5.8), переписать в виде Ру (У) + ° (!)> ,с <6-6). /А® Вычеты .складываются по обычным в алгебре правилам.
36. Локальная предельная теорема 333 Для каждого вычета D в группе Q по модулю Z обозначим через (D) сумму всех Иу (Z) с 1У = 0 и I G= D: 4 fy[(D)=^Wy(l). (6.7) Л=о g соответствии с (5.4) У>) = |. (6.8) « Так как Wy(I) = %W“(l), (3.3) а то в силу леммы 15 /у (D) положительно лишь для тех D, которыа совпадают с каким-либо Dy, т. е. лишь для конечного числа выче- тов D. Из (6.6), (5.1) и (6.7) подобно формуле (5.9) выводится, что при оо и условии (5.7) для тп, принадлежащих вычету D, W 2 Wv (m) = (eft) 2 (D) ру (у#) + о (1), (6.9) где m — mtqlqt У*= ——т=---------, Vm* ТП* — ТП — Up, (6.10) (6.11) ud — некоторый фиксированный вектор D. Легко проверить, что у* €= £у. Замена вектора у на этот вектор у* необходима, так как у может не принадлежать £у и для него плот- ность р (у) будет тогда не определена. Из (6.9) вполне аналогично выводу теоремы 3 в § 5 получается Теорема 4. Если выполнено условие (А) и г 1, то при оо для т из вычета D (ж)™ Жу (т) = co/у (D) р (х*) + о (1), (6.12) еде 7 ^ = («* — ^*9)//™’ (6-13) есть плотность расположения точек решетки Z в пространстве So, р (х) есть гауссовская плотность в £0, соответствующая нуле- вьгм средним значениям и матрице вторых моментов || W ||, а оцен- ка о (1) действует равномерно при условии | та — fnqa | < С (5.10) 7 Определение х* зависит от выбора векторов uD в (5.7), но, так как (D) > 0 лишь для конечного числа вычетов D, этот произвол никак не отражается на цредельных теоремах.
334 36. Локальная предельная теорема § 7 СЛУЧАЙ НАРУШЕНИЯ УСЛОВИЯ (А) В самом общем случае множество состояний elf е2, . . ., es распа- дается на некоторое число «классов» Къ К2, . . Кп «существенных» состояний и на множество R «несущественных» состояний (см. И]). В пределах каждого класса Kt выполнено условие (А); переходы из состояния еа е Kt в состояние G= К} при 1^4=/ невозможны, так же как и переходы из состояния, принадлежащего одному из Ki, в состояние из R; из состояний ел е R всегда существует воз- можный переход за какое-либо число шагов в состояние хотя бы од- ного из классов Ki. Переходы последнего ряда, очевидно, безвоз- вратны: попав в состояние класса рассматриваемая система уже не может выйти из состояний этого класса. Пусть К есть соединение всех классов Ki. Для еа €= К обозначим через Qa множество целочисленных векторов m с неотрицательными компонентами, удовлетворяющими условиям — 1, zn.P = 0 при 0 #= а, 0 К. (7.1) Так как из любого состояния е? е R рано или поздно происходит переход в какое-либо состояние ер ЕЕ К, то имеет место Лемма 17. Если, eyEzR, mo з 3 W^(m)=l. (7.2) asK Рассмотрим следующие разновидности векторов тп с неотрица- тельными целочисленными компонентами: М' — у вектора m все компоненты ma с X равны нулю; М" — у вектора т имеются компоненты 0 с е“ , принадле- жащими более чем одному классу Mt — у вектора т имеются компоненты т“ 0 с е* £= Kit но не компоненты та > 0 с е® G= KjJ *£= t. Подобно леммам 5 и 6 доказывается Лемма 18. Существуют такие постоянные CuD> 0, что при любом у и любом т G: М' Wy (т) < Ce~™D. (7.3) Исследование предельного поведения Wy (т) при m -> оо закан- чивается теперь без труда: (I) Если т ЕЕ М', то применима лемма 18. (II) Если т ЕЕ. М”, то при любом у Wy (т) = 0. (7.4) (III) Если т G= М(<), то' т однозначно представляется в виде т = + m2t (7.5),
37. Решение одной задачи из теории вероятностей 335 где mi S М', а т2 имеет компоненты zn? > О лишь при е“ €= Ki» Тогда Wy(m)— 3 (zni + еа) Жа (zn2 — еа), (7.6) аеК^ та>0 исследование же предельного поведения вероятностей Wa (т2 — еа) осуществляется при помощи теоремы 4, так как в пределах класса К выполнено условие (А). 15 марта 1949 г. ЛИТЕРАТУРА 1. Колмогоров А, Н. Цепи Маркова со счетным числом возможных состояний. — Бюл. МГУ. Математика и механика, 1937, т. 1, вып. 3, с. 1—16. 2. Бернштейн С. Н. Теория вероятностей. 4-е изд. М.; Л.: ГТТИ, 1946. 3. Frechet М. Recherches theorique modernes sur la th£orie des probabilites. Paris, 1937. 4. Doeblin W. Sur deux problemes de M. Kolmogoroff concernant les chaines denombrables.— Bull. Soc. math. France, 1938, vol. 66, p. 210—220. 5. Колмогоров A. H., Прохоров Ю. В. О суммах случайного числа случайных слагаемых.— УМН, 1949, т. 4, вып. 4, с. 168—172. 6. Мейзлер Д. Г., Парасюк О. С., Рвачева Е. Л. Многомерная локальная пре- дельная теорема теории вероятностей.— ДАН СССР, 1948, т. 60, с. 1127— 1128. 37 РЕШЕНИЕ ОДНОЙ ЗАДАЧИ ИЗ ТЕОРИИ ВЕРОЯТНОСТЕЙ, СВЯЗАННОЙ С ВОПРОСОМ О МЕХАНИЗМЕ СЛОЕОБРАЗОВАНИЯ* А. Б. Вистелиус и О. В. Сарманов обратили мое внимание на одну математическую задачу, которая им встретилась при статисти- ческом изучении мощностей слоев в геологических отложениях. Рас- сматривавшаяся ими схема слоеобразования может быть понята из примера, изображенного на рис. 1. По горизонтальной оси здесь откладывается время, а по вертикальной — мощность накоплений п размывов. Слой с номером п откладывается в промежуток времени On-i; sn) и имеет (до последующих размывов) мощность = gn — — hn_lt В промежутки времени (sn; tn) происходят размывы на глу- бину Т]п = gn — hn. В результате такого чередования накоплений и размывов некото- рые слои могут размываться несколько раз (слой 1 размывается два раза — при первом и втором размывах), а некоторые могут и совсем * ДАН СССР, 1949, т. 65, № 6, с. 793—796.
336 37. Решение одной задачи из теории вероятностей Рис. 1 исчезнуть (слой 2 полностью смывается при втором размыве). Если считать, что в среднем мощности накоплений больше, чем глубины размывов, то каждый слой будет подвергаться значительному риску быть размытым лишь в течение небольшого числа следующих за его образованием чередований накоплений и размывов. Это позволяет говорить о вероятности «окончательного» сохранения слоя и об ус- ловном распределении , вероятностей «окончательных» мощностей сохранившихся слоев. Именно эти условные распределения и следует сопоставить с фактически наблюдаемыми статистическими распреде- лениями имеющихся в каком-либо разрезе слоев по мощности. По данным А. Б. Вистелиуса, эти последние часто имеют типичную форму распределений резко асимметричных и как бы «урезанных» слева на нулевой абсциссе. Обозначим 6n = In — т)п = hn — разность между перво- начальной мощностью n-го слоя и глубиной непосредственно следую- щего за его возникновением размыва. При дальнейших математиче- ских построениях мы будем предполагать заданной бесконечную по- следовательность случайных величин 619 62, . . ., 6П, . . . и сделаем следующие допущения: 1) случайные величины 6П'взаимно незави- симы и имеют один и тот же закон распределения Р {бп < х} = G (х); оо 2) математическое ожидание М — М6П == хсЙ? (х) положительно; —оо 3) распределение величин бп непрерывно, т. е. выражается через со- ответствующую плотность вероятности g (х\ по формуле х G(x) = § g (х) dx. —ОО Третье допущение могло бы быть совсем снято за счет некоторого усложнения дальнейшего аналитического аппарата. Но ввиду при-
37. Решение одной задачи из теории вероятностей 337 кладного значения задачи мы не сочли уместным загромождать из- поженив употреблением интегралов Стилтьеса. Второе допущение гарантирует х, что суммы = 6П + 6п+1 + ... 4- бп+г при не- ограниченном возрастании второго индекса будут стремиться к + оо 0 поэтому нижние грани <pn = inf (Сп0), ЙР, . . .) будут- конечны и будут достигаться при каком-либо (зависящем от случая^ конечном номере г. Легко видеть, что слой с номером п в случае фп О полностью* размывается, в случае же фп > 0 от него сохраняется окончательная мощность <рп. Поэтому задача сводится к определению вероятности р = Р {фп > 0} и условного распределения величины фп при гипо- тезе фп 0. Из допущения 1) ясно, что как вероятность р, так и ука- занное сейчас распределение не зависят от номера п. Из допущения 3) можно вывести, что распределение случайных величин фп непрерывно, т. е. может быть охарактеризовано некото- оо рой плотностью вероятности / (ж). Очевидно, что р = J/ (ж) dx, а о условное распределение <рп при гипотезе <рп > 0 задается плотностью вероятности /* (ж) = / (ж)/р при ж > 0, /* (ж) = 0 при ж < 0. (1) Чтобы найти /* (ж) и р, достаточно знать функцию а (ж) = / (х)1р~ f* определится тогда формулами (1), а р вычислится по формуле - р = 1: § а(ж)с7ж. «(2) —оо Теорема. При допущениях 1), 2), 3) функция s (h) — f (х)/р (— оо <; х < + °°) является единственным решением интеграль- ного уравнения о а(ж) = ^(ж)+ $ g(x — y)s(y)dy. (3) —оо Уравнение (3) очевидным образом равносильно уравнению о /(®) = Р^(«)+ $ g(x — y)f(y)dy. (4) —ОО Доказательство равенства (4) осуществляется следующим обра- зом. Из определения величин фп легко вывести, что Фп = fin, если Фп+i >0; фп = fin + Фп+i, если фп+1 < 0. (5> 1 В силу известной теоремы А. Я. Хинчина из 1) и 2) вытекает, что наши суммы подчиняются усиленному закону больших чисел, т. е.
338 37. Решение одной задачи из теории вероятностей В силу допущения 1) величины 6П и <рп+1 взаимно независимы. По- этому, представив / (х) в виде / (®) = Pfi (*) + (1 — Р) fz (*)» (6) где Д (х) и /2 (х) суть условные плотности для <рп соответственно при гипотезах <pn+i > 0 и <рп+1 < О и заметив, что условная плотность для (рп+1 при гипотезе <рп+1 < 0 есть 2 /** (х) — / (я)/(1 — р) при х <0; /** (х) = 0 при х>0£ (7) получим /1 (ж) = g («)» /г(«)= J g(^ — y)f**(y)dy = 1-=rj J g(x — y)f(y)dy. (8) (9) Из (6), (8) и (9) непосредственно вытекает (4). Для полного доказательства теоремы остается установить единст- венность решения уравнения (3). Рассмотрим итерированные ядра Ki («. У) = g — У) °РИ У < 0; Ki У) = ° при у > 0; оо КТ (х, у)= Ki (х, z) Кг-! (z, у) dz. —ОО Все эти ядра, как и функции «о («) = g (*)» со зг(ж)= 5 Kr(x,y)g(y)dy = —оо = $•••§ g(ui).. .g(ur)g(x — ui~ .. . — Ur)dui.. .dUrt +ufc<0 fc=l, 2,..., r неотрицательны. Формальное решение уравнения (3) записывается в виде s(x)= sr(x). (10) r=0 Чтобы установить, что оно действительно является решением и к тому же единственным, достаточно доказать сходимость ряда СО ОО 2 /г> W 1Г— $ sr(x)dx — g(ui). ..g(ur)dui...du^ r=0 —во u14-u2+...4-u^<o fc=l, 2,...,r (11) 2 Здесь мы принимаем p < 1. В случае р = 1, g (х) = 0 при х << О / (х) = g (х) и равенство (4) тривиальным образом выполняется.
37. Решение одной задачи из теории вероятностей 33» Сходимость ряда (11) можно вывести из вероятностного смысла ’ его членов. Обозначим через А(п} событие {<рп = £п}}, которое мо- жет быть записано иначе в виде ( бп+£ + Sn+fc+i + .. . + $n+r < о, к = 1, 2,..., г. П I Фп+г+1 > О* Легко видеть, что Р{4Г)} = = Р {фп+r+i 0} Р {^n+fc + ^n+fc+i + . •. + 6n+r 0; к = 1,.. .,г) = ' =pir- Так как события 4п\ г = 1, 2, . . ., образуют (с точностью до вероятности, равной нулю) полную систему попарно несовместных событий, то Ё/’=тЕР(Л"),=4-- <12> О Г Поставленная в начале заметки задача в принципе решена: фор- мула (10) доставляет нам функцию 5 (х). По этой функции вычисля- ется /* (х) = $ (х) при х > 0; /* (х) = 0 при я < 0, (13) а вероятность р находится по формуле (12). Остаточные члены рядов (10) и (12) можно оценить. Использование этих рядов для получения числовых результатов довольно громоздко, но вполне возможно. На рис. 2 изображены функции / (х) и /♦ (х) для случая g(®) = <p(® —а), 4 ]/ £71 при а = 1 (этому значению а соответствует р = 0,82). Получение функции f*(x) «урезанием» функции $ (х) по формуле (13) объясняет отмеченные в начале заметки качественные особенности наблюдае- мых в действительности распределений. 2 марта 1949 г.
340 38. Несмещенные оценки 38 НЕСМЕЩЕННЫЕ ОЦЕНКИ* В статье рассматривается ряд задач на нахождение несмещенных сценок <р (хъ «2, . . Хп) для различных функционалов / (Р), зави- сящих от закона распределения Р наблюдаемых величин xlt #2,... . . ,,хл. Некоторые из этих задач связаны с вопросами статистическо- го контроля и браковки массовой промышленной продукции. § i ОБЩИЕ ОПРЕДЕЛЕНИЯ И ТЕОРЕМЫ Пусть дана система $ «допустимых» распределений вероятностей Р (Л) = Р {х (= А} для случайной точки х в некотором пространстве X л определенный на ф функционал f (Р). Определение 1. Заданная на X функция ф (х) называется несмещенной оценкой для f (Р), если при любом распределении Р из ф выполняется равенство 1 М₽ф = / (Р). (1) Например, если X есть n-мерное пространство точек 00 == , 3^2, • • •, 1 а ф состоит из распределений Р, задаваемых плотностями вероят- ностей Р {XI а) = (2л)-п/2 ехр •(-5?, («» — а)2|, то общеизвестной несмещенной оценкой для f (Р) = а является среднее арифметическое % = (Xi + х2 + ... + х^п* для / (Р) = * Изв. АН СССР. Сер. мат., 1950, т. 14, № 4, с. 303—326. х В формуле (1) и далее Мр есть знак математического ожидания, соответст- сующего распределению Р: М₽ = <р (ж) Р (dx). X
38. Несмещенные оценки 341 несмещенной оценкой может служить ф = я2 — 1/п я т. Д- Мы увидим далее, что во многих важных случаях несмещенные оценки не существуют. В этих случаях полезно Определение^. Функции ф+ (х) и ф_ (х) называются со- ответственно верхней и нижней оценкой для f (Р), если при любом распределении Р из ф выполняются неравенства МрФ+>/(Р), (2) мрФ_</(Р). (3) G другой стороны, в большинстве задач, в которых несмещенные оценки существуют, их имеется не одна, а много. Так, в рассматри- ваемом выше примере несмещенной оценкой для а может служить любая линейная форма ф = Cfa + С2Х2 + • • • + СпХп с коэффициентами, подчиненными условию С1 + с2 + . . . + сп = 1. Чрезмерное разнообразие несмещенных оценок может быть значи- тельно сокращено, если ограничиться несмещенными оценками, ко- торые выражаются через надлежащим образом выбранные достаточ- ные статистики задачи. Чтобы сформулировать относящиеся сюда общие теоремы, мне придется привести несколько обобщенное опре- деление достаточной статистики. Так как в этом определении доста- точная статистика может быть не только скалярной, но и векторной величиной, то отпадает необходимость отдельно вводить понятие «достаточной системы статистик»: при нашем общем определении та- кая система статистик (Xi, Ха> • • •> X») может считаться одной ста- тистикой X = (Хь Ха. • • Xs)- . Нижеследующие несколько абстрактные формулировки будут конкретизированы в § 2 и 3, куда и следует обратиться читателю, которому эти формулировки покажутся трудными. Пусть х (я) — заданная на X функция со значениями из некото- рого другого пространства Н. Рассмотрим условные распределения вероятностей Р (А | h) = Р {х е= А | х (х) = h} (4) и условные математические ожидания 2 — § ф (х) Р (dx I h) (5) _______х 2 Интеграл (5) надо понимать в смысле формул (10) и (И) в § 4 главы 5 моей книжки [1].
342 38. Несмещенные оценки при фиксированном значении % (я) = h. Определение 3. Функция % (х) называется достаточной статистикой для системы распределений ф, если условные распре- деления вероятностей Р (А ] h) не зависят от выбора Р из ф. Так как условные вероятности Р (4 | h) в соответствии с [1] оц^ ределены лишь с точностью до множества значений /г, на которое X (х) попадает (при распределении Р для х) с вероятностью нулц то точный смысл определения 3 таков: х (#) называется достаточной статистикой для ф, если существует такая функция Q (А \ h) от 4 С X и /2 Е Я, которая при любом Р из ф может быть принята за Р (А | h). Теорема 1. Если х (я) есть достаточная статистика дм ф, то для любой функции ф (х) с конечными при всех Р ЕЕ ф матема- тическими ожиданиями Мр, условные математические ожидания Мдф не зависят от ?Еф. Как и в случае определения 3, точный смысл теоремы 1 нужда- ется в пояснении. Он заключается в следующем: для любой функ- ции ф (х) с конечными при всех Р из ф математическими ожидания- ми Мрф, существует такая функция М (/г), которая при любом Р е ф может быть принята за Мд ф. Для доказательства теоремы 1 достаточно положить M(h)= ^(x)Q(dx\h). (6> х где функция Q (А | h) взята из пояснения к определению 3, а интег- рал понимается в смысле примечания к формуле (5). Следующие две теоремы являются некоторым обобщением резуль- татов Блеквелла [3]. Теорема 2. Если ф (х) является несмещенной оценкой для f (Р), а х (х) — достаточной статистикой для ф, то3 <р* (ж) = Мх(зс) ф (ж) = М [% (а:)] (7) тоже является несмещенной оценкой для / (Р). Теорема 3. Для любого Р ЕЕ ф, для которого дисперсия Орф существует, в условиях теоремы 2 имеет место неравенство Орф* < Орф. (8> Для доказательства теорем 2 и 3 достаточно воспользоваться тож- дествами М (Мхф) = Мф, (9) Оф = D (Мхф) + М (Ф - Мхф)2, (10) 3 Верхний индекс Р при М в формуле (7) опущен, так как в силу теоремы 4 функция ф* может быть выбрана независимой от Р.
38. Несмещенные оценки 343 которые справедливы при любых функциях <р (х) и % (ж), если только /Лф и Эф существуют. Теоремы 2 и 3 можно рассматривать как обоснование и без того естественной тенденции употреблять только несмещенные оценки* выражающиеся через достаточные статистики задачи: теорема 2 доказывает, что при этом мы не суживаем круга задач, в которых несмещенные оценки существуют, а теорема 3 — что при переходе от произвольной несмещецной оценки ф к осредненной оценке ф** выражающейся через статистику %, мы можем только уменьшить дисперсию. Можно было бы показать, что оценка ф* всегда бывает «не хуже» порождающей ее оценки ф и при других способах сравне- ния «качества» оценки. Теорема 2, кроме того, как мы увидим, дает сильное средство для нахождения несмещенных оценок с малыми дисперсиями: часто ос- реднением «плохих», но легко обнаруживаемых оценок ф можно по- лучить «хорошие» оценки ф*. В довольно широком классе случаев несмещенные оценки, выражающиеся через надлежаще выбранную достаточную статистику, оказываются однозначно определенными оцениваемым функционалом / (Р). По этому поводу см. интересную работу Халмоша [4], которая является одной из немногих попыток подойти к изучению несмещенных оценок с достаточно общей точки зрения. Некоторые результаты Халмоша будут приведены в § 10 настоящей статьи. § 2 ОСНОВНЫЕ ФОРМУЛЫ ДЛЯ ДИСКРЕТНОГО СЛУЧАЯ Если множество X возможных значений х конечно: X = {^i, ^2, . . ., Яп}, а распределения PQ системы $ определяются однозначно заданием одного или нескольких параметров 9, то естественно ввести в рас- смотрение вероятности 4 Рк (0) = Р0{« = а*}, Функционал / (Р) записывать в виде функции f (0) и ввести обозна- чение <Рк = <р (а*) Для возможных значений оценки ф. Условие того, чтобы ф являлось несмещенной оценкой / (9), запишется тогда в виде Зф»р*=/(О). (1) fc=l 4 В случае нескольких параметров 0Ь 02, . . ., 0П мы обозначаем через 9 вектор (0Ь 0а, . . ., 0П).
344 38. Несмещенные оценки Формула (1) показывает, что в случае, когда 0 пробегает беско- нечное множество значений, лишь немногие функции / (0), а именно те, которые выражаются линейными формами вида (1), допускают несмещенные оценки <р. Если функции рк (0) линейно независимы, то для-каждой функции / (0), которая допускает несмещенную оцен- ку, такая оценка существует только одна. Если возможные значения х занумерованы парами индексов: X = {ahk}, 1 < h < ml 1 < k < nh, то естественно нумеровать аналогичным образом вероятности (0) и значения ср^ оценки <р. Первый индекс h будет при этом достаточ- ной статистикой задачи в том и только том случае, если рм(0) могут быть записаны в виде Phi (0) = Ph (0) ?ль (2) где Ям не зависят от 0, nh fc=l т ^(0)>о, 3?Л(0)=1. *=i В случае (2) из несмещенной оценки ф (аМс) — tyhh для / (0) можно получить в соответствии с теоремами 2 и 3 несме- щенную оценку nh Ф* («м) = tyh = 3 9hktyhi (3) ы с дисперсией De<p* De(p при любом 0. Доказательство теорем 2 и 3, которое в общем случае, хотя и было чрезвычайно просто и кратко, опиралось на несколько трудную общую теорию условных вероятностей и математических ожиданий, в рассматриваемом частном случае делается чисто арифметическим, так как входящие в рассмотрения математические ожидания и дис- персии выражаются общеизвестными формулами т nh ~ т м9ф= 2 2 рль(0)фль меф*= 2 рл(0)ф*, Л=1 fr=l Л=1 т nh оеф= 2 S рм(0)(фм-мф)2. h=l k=l ) т d%*= 2 Ы0)(ф*-м0ф*)-- h=l
38. Несмещенные оценки 345 § 3 ОСНОВНЫЕ ФОРМУЛЫ В НЕПРЕРЫВНОМ СЛУЧАЕ Пусть распределения из ф заданы плотностями вероятностей р (я I 0)- В этом случае условие того, чтобы ср (х) являлось несмещенной оцен- кой для / (0), записывается в виде j <p(x)p-(x|0)c?x = /(0), (1) X «г. е. нахождение несмещенной оценки <р (х) для заданной функции / (0) сводится к решению интегрального уравнения. Пусть, далее, задана функция X (х) со значениями из пространст- ва Я. Эта функция порождает разбиение пространства X на подмно- жества Уд, на которых X имеет постоянное значение X (х) = h. Допустим, что элемент объема dx может быть выражен в виде dx = dx-tdh, где dh — элемент объема в Я, a dxr — надлежащим образом опре- деленный элемент объема в Vh. Тогда X является достаточной стати- стикой задачи в том и только том случае, если плотности вероятно- стей р (х | 0) могут быть записаны в виде Р (х | 0) = Р (h (х) I 0) q (х), (2) где q (х) не зависит от 0 и д(х)^0, § q(x)dxi = l, р(Л)>0, Jp(A|0)d/j=l. н В случае (2)’ из несмещенной оценки ф = ф (ж) Для / (0) можно получить в соответствии с теоремами 2 и 3 несмещен- ную оценку Ф* = ф* (х) = У ф (х) q (я) dxi (3) vX(x) дисперсией □9ф* < ООф (4) при любом 0, которая зависит только от % (ж): Ф* = (я)1.
346 38. Несмещенные оценки § 4 НЕСМЕЩЕННЫЕ ОЦЕНКИ СЛУЧАЙНЫХ ВЕЛИЧИН В этом параграфе мы укажем дальнейшее обобщение задачи § 1 которое будет использовано в § 5. Пусть дана система ф допустимых распределений вероятностей р (Л) = р {(ж, у) е А} для пар, состоящих из «наблюдаемой» точки ЕЯи ненаблюдаемой непосредственно случайной величины у. Функция ср (х) «называется несмещенной оценкой для у, если при всех Р из ф Мрф — ЬКру. (1^ Вопрос о нахождении таких несмещенных оценок для случайных величин не связан с какими-либо новыми трудностями, так как он равносилен нахождению несмещенных оценок для / (Р) = Мру. Только вместо дисперсии Dpcp в качестве характеристики точности оценки ф для у естественно рассматривать выражение Мр(Ф - у)*. В случае, когда х и у при любом Р из ф независимы^ + (2) и так как Dpz/ не зависит от выбора ф, то задача нахождения несме- щенной оценки ф для у с наименьшим значением Мр (ф — у)2 равно- сильна задаче нахождения несмещенной оценки для Мру с мини- мальной дисперсией Орф. § 5 БРАКОВКА ПО КАЧЕСТВЕННОМУ ПРИЗНАКУ НА ОСНОВАНИИ ОДНОКРАТНОЙ ВЫБОРКИ. СЛУЧАЙ РАЗРУШЕНИЯ ИЗДЕЛИЯ ПРИ ИСПЫТАНИИ Чтобы показать на достаточно конкретном примере значение тео- рии нахождения несмещенных оценок в вопросах браковки массо- вой продукции по выборочным данным, мы рассмотрим в этом пара- графе и в § 7 две задачи из этой области. В детали, связанные с прак- тическим применением предлагаемого метода, мы в настоящей пуб- ликации входить не будем. В этом параграфе будет предположено, что испытание изделий приводит к их разрушению и поэтому принци- пиально может быть только выборочным. Подлежащая нашему рас- смотрению система браковки состоит в следующем. Из партии, содержащей N изделий, производится случайная вы- борка объема п. Выбранные п изделий испытываются и устанавли- вается число х «дефектных» изделий в выборке. Если х с9 то
38. Несмещенные оценки 347 jy — п изделий, не вошедшие в выборку, принимаются. Если х = с + 1, то вся партия бракуется. Если в партии до испытания имелось у дефектных изделий, то число принятых дефектных изделий будет равно f У — х при я с, ( 0 при x^d. Положим q == y/N, q* = у* IN. Задача браковки состоит в том, чтобы гарантировать достаточно малые значения q*, не вызвав в то же время без надобности;т. е. при малых чрезмерно частого забракования всей партии и не увеличи- вая чрезмерно объем выборки п. Чтобы удовлетворить этим требованиям, выбирают надлежащие п и с. Основной характеристикой системы браковки с данными п я с является условная вероятность L (q) = Р {х < с | q } ири заданном q получить х с, т. е. принять партию. Для вычисле- ния L (q) служат условные вероятности рт (q) = Р {X = т I q} = (Дте)! (ЛГ -М-!~—х х (q—-#-)• ••(? —)(!—?)(i — q — • • (A П — ТП — 1 \ zn i-q-----й------------) (1) появления при заданном q значений х = т. Легко видеть, что Ь(9)= 5 pm(q)- (2) Если признано целесообразным браковать партии с q < qQ и при- нимать партии с q д0, то идеальной оперативной характеристикой £ (q) была бы функция L ( 1 при 7<7о, (0 при <7^>(7о» изображенная на рис. 1. Такой вид функции L (q) мог бы быть дос- тигнут лишь при п = N, что в случае испытания разрушительного характера лишило бы операцию смысла. Однако можно приблизить- ся к идеальной характеристике рис. 1, если выбрать достаточно большое с н взять п ~ c/qQ*
348 38. Несмещенные оценки Если N очень велико, то это еще не приведет к чрезмерному увеличе- нию отношения n/N, которое, конечно, должно оставаться доста- точно малым. На рис. 2 приведена6 оперативная характеристика для случая N = 10 000, п = 1000, с = 20, д0 ~ с/п = 0,02. К сожалению, получение вполне удовлетворительной оператив- ной характеристики даже при N порядка 1000—10 000 часто оказы- вается возможным только за счет чрезмерного увеличения отношения n/N. Поэтому часто применяются системы браковки с недостаточно круто падающей при возрастании q оперативной характеристикой» Рис. 1 Рис. 2 В этих случаях приобретает основное значение вопрос о последующей оценке по результатам испытаний доли фактически принятых дефект- ных изделий. При хорошо налаженном производстве она часто бы- вает значительно меньше, чем та доля дефектных изделий д0,* исходя из которой рассчитана система браковки. Последующая оценка по результатам испытаний доли дефектных изделий в предъявленной на проверку продукции и доли пропущен- ных в результате применения данной системы браковки дефектных изделий имеет, конечно, большое значение и при вполне удовлетво- рительной оперативной характеристике. К решению этой задачи мы и переходим. Предположим, что система браковки с данными п и с применена к большому числу партий s. Введенные выше отношения q и q* для партии с номером г будем’ обозначать через qr и д?. Кроме того, обо- значим через sm число партий, при проверке которых число Дефект- ных изделий х оказалось равным т. Очевидно, что S = $0 + + . . . + sn, а а' = а0 + $1ае 6 Sampling inspection. Statistical research group. Columbia Univ., 1948.
38. Несмещенные оценки 34£ обозначает число принятых партий. Общее число изделий в а партиях равно R = sN, число же принятых изделий равно R' — s' (N — п). Общее число дефектных изделий равно Y= iyr = N^gr, г=1 r=l число же принятых дефектных изделий равно Г=1 Г=1 Успешность всей браковочной процедуры определяется тем, насколь- ко отношение = Y'/R' меньше, чем отношение _ Y _ 1 V &Р —-д’----Г X г—1 Так как £ср = » где * __ У' _ 1 V ? 9ср— д — s 2^^' г=1 а отношение RIR' после приемки становится известным и к тому же? при сколько-либо нормальном ходе производства близко к единице то мы можем считать, что наша задача состоит в оценке дСр и д*р. Если число партий $ достаточно велико, а <р (я) и <р* (х) являются несмещенными оценками q и соответственно д* по х, то в силу зако- на больших чисел для оценки дср и д*р можно пользоваться при- ближенными формулами $ ?ср ~ <рСр = 4- У, Ф («г). (3> г=1 9с*р~ф:р = 4-^Ф*(®г). (4> г=1
350 38. Несмещенные оценки Точность этих формул определяется обычными стандартными мето> дами, так как слагаемые в правых частях равенств S ?ср — Фер = — У, [?г — Ф (®г)]. Г=1 8 7ср — Фер = "у“ [?r — ф* (xr)] r=l взаимно независимы. По этому поводу см. конец следующего пара- графа. Несмещенная оценка для q хорошо известна: Ф (х) = xln. (5) Юна приводит к оценке п 9сР ~ Фер = — У, msm (6) m=l .ДЛЯ £ср‘ Так как всегда 6 ?ср ?ср» (7) то фер может служить также и верхней оценкой (см. определение 2 § 1) для д*р. Этот общеизвестный способ оценки однако, совсем нечувствителен к уменьшению числа дефектных изделий в результа- те браковки. Чтобы ориентироваться в возможностях более эффек- тивной оценки д*р, рассмотрим общий вопрос о том, какие функции У (х) допускают несмещенную оценку по числу дефектных изделий х в выборке объема п. Вопрос этот решается очень просто в соответст- вии с § 2. Для любой функции ф (х) /0) = М’ф(а:)= 2 Ф(т)рт(?) (8) т=0 «есть многочлен от q степени не выше п. Так как при этом п + 1 мно- гочленов рт (q) линейно независимы, то любой многочлен / (q) сте- пени не выше п единственным образом записывается в виде (8). Иначе говоря, многочлены / (д) степени не выше п и только они до- пускают несмещенные оценки по х и оценки эти определяются мно- гочленом f (q) однозначно. Легко проверить, что <?(?)= =^(?~-J-) Pm (?) (9) ________ т<с s 6 И даже более точно g*p < gcp — -L у1 xf. r=l
38, Несмещенные оценки 351 является многочленом (п + 1)-й степени. Поэтому точной несмещен- ной оценки <р* (х) для д* по х не существует. Мы увидим, однаког р следующем параграфе, что поставленная нами задача нахождения такой оценки допускает при довольно широких допущениях очень простое приближенное решение. Кроме того, представляют интерес следующие два замечания. 1. При любом пг <^п существует несмещенная оценка по числу дефектных изделий х в выборке объема п для д*, которое получи- лось бы при браковке по выборке объема п* (с любым с). 2. Аппроксимируя Q (q) многочленами Q+ (q) и Q_ (q) степени нс выше тг, удовлетворяющими неравенствам Q_ (я) < Q (q) < Q+ (q), можно получить для g* верхнюю и нижнюю оценки <р* (х) и ф* (х)\. Этот метод обещает дать вполне приемлемые практические резуль- таты для многих случаев, в которых приближенные формулы следу- ющего параграфа неприменимы. § 6 СЛУЧАЙ с << п << N Если п мало по сравнению[с N, то можно с достаточно хорошим приближением положить [ q при ( 0 при а формулы (1), (2), (9) § 5 заменить формулами L{q)= 3 Pm(?), (2> m<c W = C(<7WM<7)- (3> в предположении законности пользования формулой (1) для дис- персии Вдф (х) = D* (х/п) = q (1 — q)ln оценки (5) из предшествующего параграфа получается несмещенная оценка чьа =
352 38. Несмещенные оценки найденная Гиршиком, Мостеллером и Сэвиджем [5]. Из нее получу «тся несмещенная оценка п—1 Д2= (5) щ=1 для дисперсии фср. При т, малых по сравнению с п, вероятности рт (?) сколько- либо заметно отличаются от нуля лишь при малых q и формула (1) зюжет быть заменена еще более простой приближенной формулой Pm(?) = -^?me"n’- (6) Так как в силу (6) 9Рт (?) = Рт+1 (?). -то в предположении, что с мало по сравнению с п, из формул (2) и -(3) получается = (7) m<d Таким образом, в случае законности применения формул (3),; *(6) и (7) функция Q (q) является линейной комбинацией функций (?) и мы получаем возможность в соответствии с § 2 сформировать несмещенную оценку для Q (?) (а следовательно, и для ?*) по х. Оценка эта имеет вид ( х/п при #^d = c + l, Ф (х) | q при x^d + i. (8) Для ?*р отсюда получается несмещенная оценка * * 1 * /Л\ ?ср фср — ~ns~ / t ТП8т> (У) m<d Поучительно сравнить формулу (9) с формулой (6) § 5. Из их -сопоставления получается, что разность Фср — Фср = У, msm (Ю) m>d при больших s приближенно равна разности ?ср — ?*р или (в случае отношения RIR', близкого к единице) разности ?ср — ?£р, т. е. со- кращению доли дефектных изделий, достигнутому в результате -браковки. Точность приближенного соотношения (9) может быть достаточ- но эффективным образом оценена. Из независимости выборок из раз- личных партий (такая независимость входит в понятие «случайной*
38. Несмещенные оценки 353 выборки) вытекает, что s м (4 - <р*р)а=4- У,м [?* - <р* (*<•)]*• г=1 (11) Так как (<Д,-Фс*р)а = (д — х/п)2 при (®/п)а при О при X с, x = d = c +1, х~^ d + 1, (12) ТО d с с (g*v — Фер)* = 4- У т*Рт (?) + — У тРт (у) + д2 У рт (?)» m=l тп=1 т=0 или после надлежащих преобразований d М? (?*р — фср)а = 4" [ У, тР™ (?) + d <^+ 4) Ры («)] • (i3) т=1 Поэтому несмещенной оценкой М9 (д* — ф*)а является Ф*(*) = ’ ,х/п?. d(d+l)/n2 ' О 4 < при при при x^d, x = d + 1, + 2, (14) а несмещенной оценкой М (д*р — Фер)2 может служить д*=4" У =-(4* [,Sms’»+d<d+i) s<j+i] = г«1 т—1 _ Фер , d(d + l) „ — — + Sd+1> При больших а м (дс*р - ф?р)2 - А2# (15) и по теореме Ляпунова р{|9:р-ф:р|<^}~-^ «-«‘/ML (16) Рассмотрим в заключение численный пример на употребление формул (6) § 5 и формул (4)( (9), (15) и (16) этого параграфа. Пусть N = 1000, п = 50, s = 200, с = 1, <2 = 2. 12 А. Н. Колмогоров
1 354 38, Несмещенные оценки т 0 1 2 3 4 5 6 7 8 9 10 И sm 143 27 12 9 3 1 2 1 1 — — 1 фср = 0,0133, А* ~ 0,0010, А - 0,0011, ?ср ~ 0,0133 ± 0,0011, ф*р = 0,0051, д* - 0,0051 ± 0,0010, или при За-х пределах I ?ср — фср I ЗА, | — фср | ЗА, 0,0100 < дср < 0,00166, 0,0021 < q& < 0,0081. Я думаю, что при выбранных для примера значениях s, N, п, с упот- ребление формул, введенных в предположениях c<^n<^N и боль- шого s, уже законно. Но этот вопрос заслуживает более подробного исследования. § 7 БРАКОВКА ПО КАЧЕСТВЕННОМУ ПРИЗНАКУ НА ОСНОВАНИИ ОДНОКРАТНОЙ ВЫБОРКИ. СЛУЧАЙ ИСПЫТАНИЙ, НЕ НАНОСЯЩИХ ВРЕДА ИЗДЕЛИЯМ Если испытание изделий не наносит вреда изделиям, то может быть принята система браковки, отличная от рассмотренной в § 5. Из партии, состоящей из N изделий, производится случайная выборка объема п. Выбранные п изделий испытываются и устанавли- вается число «дефектных» изделий в выборке. Если х с, то х обна- руженных дефектных изделий заменяются заведомо годными (не «дефектными») и вся партия принимается. Если я > d — с + 1, то проверяется вся партия, все обнаруженные при этом дефектные из- делия заменяются заведомо годными и только после этого вся партия принимается. Как и в § 5, ( q — x/N при х с, flF* = { I 0 при x^d, но теперь величина д* получает более простой смысл: это доля дефект- ных изделий, остающаяся в партии после описанной выше проце- дуры. Формулы (1)—(9) § 5 сохраняются. При этом Q (q) получает новый смысл математического ожидания доли дефектных изделий в принятой продукции в предположении, что до браковки в каждой партии доля дефектных изделий была равна q. Поэтому теперь ока- зывается осуществимой априорная оценка наихудшего возможного среднего качества принятой при данной системе браковки продув
38. Несмещенные оценки 355 ^0й: каково бы ни было распределение дефектных изделий по пар- тиям до браковки, в среднем в принятой после браковки продукции дефектные изделия будут составлять долю, не превышающую I Ql = max Q (g). (1) В обстановке § 5 такая априорная оценка невозможна. На рис. 3 7 дан график функции Q (д) для N = 1000, с = 1, п = 100, d = 2. . Максимум Ql = 0,0035 достигается здесь при q = 0,009. Кроме числа дефектных изде- лий х, в выборке в новой обста- новке становится доступным для наблюдения число {0 при х^с, qN— х при x^d дефектных изделий, обнаружен- ных при сплошной проверке не вошедших в выборку N — п из- делий, если такая проверка про- изводится. Это доставляет новые возможности для получения несме- щенных оценок q и д*. Легко обнаружить, что достаточной статистикой задачи является сумма и~ х z = X qN при X с, при x^d. Мы увидим сейчас, что при 0 <^с п для любой функции / (q) существует несмещенная оценка ср (и) и притом она единственная. В самом деле, требование м9<р (ы) = 3 <р (rn) рт (д) + <р (qN) [1 — L (g)] = / (g) (2) m<c заключает в себе N + 1 уравнений в соответствии с возможными зна- чениями q = 0, 1/7V, 2/N, . . ., 1. Так как при g = 0, 1/N, . . c/N множитель 1 — L (g) в (2) Равен нулю, то <р (и) для и с однозначно определяется системой d Уравнений m = 0,1,с. и-^с 7 Grant. Statistical quality] control, 1946, p. 353.- (3) 12*
356 38. Несмещенные оценки При u > d, положив q = ulN, получаем из (2) / (u)N) - 2 Ф (m) Pm (UIN) ф = 1 -Z (u/N) * Ф В частности, при / (q) = Q (q) формулы (3), (4) приводят к несме- щенной оценке для Q (д), т. е. для д*. § 8 ОЦЕНКА / (а) В СЛУЧАЕ НОРМАЛЬНОГО РАСПРЕДЕЛЕНИЯ С ЗАДАННЫМ о Пусть х19 х2, . . хп независимы и подчинены нормальному рас- пределению с плотностью вероятности 1 р (х | а, а) = _ e-(«-a)‘/2o*, (1^ У 2л G Будем считать а известным. Тогда Я = (хх + х2 + . . . + хп)/п (2> является достаточной статистикой задачи. Плотность вероятности для X может быть записана в виде р (% | а, о) = G (X —а, Т), (3) где G(z,t) = -±=-e-W, (4) Л у Ль Т = о2/2п. (5) Основное уравнение (1) § 3 в нашем случае (для несмещенных оце- нок вида <р («) функции / (а)) может быть записано в форме J ф(Ж)б(Ж-а, T)dx = f{a). (6) — 30 Положим при t —Т ф (Z, t) = j ф (£)(?(£ - z, Т - №. (7) —°° Очевидно, что ф (z, 0) = / (z). (8) Без потери каких-либо решений задачи, имеющих практический интерес, можно ограничиться такими функциями ф (z), что: 1) функция ф (z, t) аналитична при всех действительных z и t — Т по обоим переменным z и J; 2) почти всюду по z у функции ф (z, t) существуют предельные значения Ф — Т) — ф (z). (9)
38, Несмещенные оценки 357 Как известно, при t > — Т функция <р (z, t) удовлетворяет теп- ловому уравнению dqldt — d^qldz* (Ю) й при сделанных допущениях однозначно определяется для t > — Т своими значениями / (z) при t = 0. В силу (9) это. приводит к тому, что <р (z) однозначно определяется 8 по / (z). Таким образом, если задача нахождения несмещенной оценки для f(a) разрешима, то при ограничениях 1) и 2) ее решение единственно. В силу уравнений (8)—(10), задача нахождения несмещенных оценок для / (а) сводится к «обратной задаче теплопроводности»,; которой посвящены, например, работы [6—8]. Мы отметим для даль- нейшего лишь следующее связанное с этим обстоятельство. Если при некотором TQ Т функция / (z) уже представлена в виде оо /(z)= J G(;-Z,r0)dF(C), (Н) —оо то несмещенная оценка ср (ж) дается формулой со , <р(г)= J G&-z,T0-T)dF(£). (12) —со В частности, для самой плотности вероятности р (х | а. а) = G (я —- а, о2/2) (13) в какой-либо фиксированной точке х мы получаем несмещенную оценку при п 1 в виде (14) у Gq ' / Интегрируя (14), получим при любом фиксированном множестве А, расположенном на числовой прямой х, для Р (Л) = Р {х е А | а. а} = j dx (15) А несмещенную оценку9 («) у 2<Л So 8 Так как в силу (3) попадает на множество меры нуль с вероятностью, рав- ной нулю, то возможная неопределенность <р (z) на множестве меры нуль не мешает делу. Во всех подобных случаях однозначность решения законно пони- мать в смысле однозначности с точностью до случаев, имеющих (при всех допус- тимых распределениях Р) вероятность нуль. 9 На оценку (14) и возможность получить из нее интегрированием оценку (16) обратил мое внимание Ю. В. Линник. До этого замечания Ю. В. Линника я выводил оценки вида (16) для частных видов множества А непосредственно из Уравнения (6).
358 38. Несмещенные оценки Формула (16) применима в случае п> 1. В случае п = 1 вместо нее действует несмещенная оценка для Р (А) по X = вида ( 1 при е= А, 'Фа (^i) — | о при (17) По аналогии с (17) можно и в случае п 1 дать для Р (А) несме- щенную оценку п Ф*(*1, *2, Хп) = — ^Фа(^), (18) равную Ип от числа точек хт, попавших на множество А. Эта оцен- ка имеет то преимущество, что она является несмещенной оценкой Р (А) и в том случае, если класс ф допустимых распределений Р (А) - Р {х^А} расширить до класса всех одномерных распределений Р (А). Однако в случае нормальных распределений с неизвестным а и заданным о оценка ф* значительно менее эффективна, чем фА. § 9 ОЦЕНКА / (а, о) В СЛУЧАЕ НОРМАЛЬНОГО РАСПРЕДЕЛЕНИЯ С НЕИЗВЕСТНЫМИ а и о Будем исходить из формулы (1) § 8 и сохраним допущение о не- зависимости хъ х2, . ... хп между собой, но предположим, что оба параметра неизвестны. Из формулы р (Xi, Xi,..xn I д, о) = е (1) (\/ <5у для n-мерной плотности вероятности видно-, что достаточных стати- стик задачи две: X и п Si = --S\l(Xm — «)2. (2) Двумерная плотность вероятности для х и s выражается формулой 2n(n"1)/2sn"2 р (Ж, s а, о) = п~2 „----е } + ’ ’ (]Л2лб)" где (™-1)/2 ^п"2 = Г((п-1)/2) (3) (4) есть (п — 2)-мерный объем сферы единичного радиуса в (п — 1)- мерном пространстве. Основное уравнение (1) § 3 приобретает теперь
38. Несмещенные оценки 359 ВИД ос со J У Ф (X, s) р (X, s \а, о) ds dx = / (а, а). (5) — 30 —оо Мы ограничимся тем, что при помощи теоремы 2 § 1 найдем решение уравнения (5) для случая f(a, о) = Р(А)= § р(х{а, <y)dx. (6) л Как уже было указано в § 8, для Р (А) существует несмещенная оценка ( 1 при xiEEA, Фа(^1) — | q при Чтобы получить несмещенную оценку для Р (А) вида ф (я, $),, нам остается вычислить интеграл Я|)Л(£»«)= j ^fA^qdv, (7) Vx.s где Vx,s обозначает подмножество n-мерного пространства точек (х19 х2. . . хп), определяемое равенствами т=1 которое является (п — 2)-мерной сферой радиуса р = / ns- • (8) dv обозначает элемент объема в Тх, s, а множитель q имеет постоянное значение а =------------. (9) 4 K^ns)^' При п > 2 <рЛ (г, s)= \yxdx, (10) А где фх является несмещенной оценкой по х и 5 для плотности вероят- ности р (х | а, о) в точке х. Для определения фх рассмотрим объем tyxdxlq кольца, высекаемого из сферы Тх, s плоскостями хг — х, хг = х + dx.
360 38. Несмещенные оценки В случае это кольцо исчезает и Фх = 0. В случае же интересующее нас кольцо имеет радиус р'= j/p2 — (X - ж)а, ширину 6=1/ZZZ р dx г п — 1 р' и объем = Кп_3 (р')"-з 6 = Кп-3 У Р (Р')n~4 dx. Пользуясь формулами (9)—(И), получаем теперь окончательно п—4 Кп-3 1 1 [л 1 2 яп-2 « I п -1 \ 5 / J если | — | 1, 0, (12) Вводя .функцию п—4 /„(/) = 2 при pKfzTZT, .0 при |^|^Уп—1, где с = Кп-3 _ г»»-1)/2)^ n Кп-2 n~1 V2n Г ((п - 2)/2)- 1 можно записать <рж в виде При п -> оо функции fn (t) сходятся к пределу /«(0=^е-“/2. Л/ (13) (14) (15) (16)
38. Несмещенные оценки 361 § Ю НЕСМЕЩЕННЫЕ ОЦЕНКИ ХАРАКТЕРИСТИК ПРОИЗВОЛЬНОГО РАСПРЕДЕЛЕНИЯ ПО НЕЗАВИСИМЫМ НАБЛЮДЕНИЯМ Рассмотренные нами примеры дали читателю некоторое пред- ставление о разнообразии конкретных задач, связанных с нахожде- нием несмещенных оценок. Мне представляется, что эта область математической статистики заслуживает большего внимания, чем ей уделяется. В заключение этой статьи, которая и не претендует на большее, чем на демонстрацию на примерах недостаточной разрабо- танности этой области, я хочу указать на связь общего подхода к не- смещенным оценкам и достаточным статистикам, изложенного в § 1,; с результатами уже цитировавшейся работы Халмоша [4]. Пусть в некотором пространстве Хо задана система распределений ф0. Допустимыми распределениями в пространстве X упорядочен- ных систем X = (#j_, #2» • • *^п)1 где хт ЕЕ Хо (т = 1, 2, . . ., п), будем считать те и только те распре- деления, которые получаются обычным образом из предположения, что все хт независимы и подчиняются одному и тому же распределе- нию 0 ЕЕ фо- Вопрос о том, какие функционалы / (0), заданные на фо, допус- кают несмещенную оценку вида ф (^1, #2, • • Я'п), равносилен вопросу о том, какие заданные на фо функционалы /(0) могут быть представлены в виде / (0) = j j .. • j q> (xi, х2,1 .хп) 0 (dxi) 0 (</ж2)... 0 (dxn). (1) у. х„ х. Функционалы вида (1) естественно называть функционалами степе- ни ^п. Они10 во многом аналогичны многочленам степени На^- пример, легко видеть, что они обладают следующим свойством: (*) при любых 0! и 02 выражение F (%) = f [А0Х + (1 - %)02] Для всех тех %, для которых 0 = Х0! Ч- (1 — М 02 принадлежит фо, может быть выражено в виде многочлена степени *4 п от X. 10 Легко видеть, что всякий функционал / (0), представимый в виде (1) при * — пъ представим в виде (1)при п = п2>п1. Функционалы f (0), представимые в виде (1) при п = п0 и не представимые в виде (1) при любом меньшем п, есте- ственно называть функционалами степени п0.
362 38. Несмещенные оценки j При некоторых ограничениях на систему ф0 верно и обратное* из свойства (*) вытекает представимость в виде (1), т. е. свойство (*) может быть принято за определение функционала степени п (по этому поводу см. определение полиномиальных операций, дан- ное в [9]). Изложенный очевидный критерий существования несмещенных оценок для / (0) привел Халмоша к некоторым интересным следст- виям. Например, если ф0 состоит из всех распределений 0 на число- вой прямой, для которых абсолютный момент оо —оо конечен, где 5 — натуральное число, то центральный момент оо сю ps(0) = J [Л—zn (0)р d0, m(0)= J tdQ, —оо —сю имеет несмещенную оценку вида . ф (хг, х2, .хп) в том и только том случае, когда s <^ п (несмещенные оценки в случае s п хорошо известны, см. [2, 27.6]). Легко видеть, далее, что в соответствии с общим определением . § 1 для рассматриваемой нами задачи оценки / (0) по значениям хь гг2, • • •, хп существует достаточная статистика % в виде системы зна- чений (х19 х2, . . яп), рассматриваемой независимо от порядка ну- j мерации входящих в нее точек хт (но с учетом кратностей в случае, если некоторые совпадают). Функции ср (xls х2, . . хп), выражаю- щиеся через эту достаточную статистику %, суть не что иное, как сим- метрические функции от1 х^ x2l . . хп. Это очевидное замечание приводит нас в силу теорем 2 и 3 § 1 к одному из результатов Хал- моша: если для / (0) имеется несмещенная оценка вида ср (хъ х2,. . ♦ . . ., хп), то для / (0) имеется и симметрическая несмещенная оценка | ср* (хъ х2, . . ., хп) с дисперсией, не превосходящей дисперсию ср (Ж1, х2, . . ., хп). Халмошу удалось, однако, пойти и несколько дальше этих оче- видных результатов и доказать при некоторых не слишком стесни^ тельных ограничениях на систему фо единственность симметричной несмещенной оценки. (По этому поводу см. непосредственно его статью [4].) 30 марта 1950 г.
39. О дифференцируемости переходных вероятностей 363 ЛИТЕРАТУРА 1. Колмогоров А. Н. Основные понятия теории вероятностей. М.; Л.: ОНТИ, 1936. 2. Крамер Г. Математические методы статистики/Пер. с англ. М.: Изд-во иностр, лит., 1948. 3. Blackwell D. Conditional expectation and unbiased sequential estimation.— Ann. Math. Statist., 1947, vol. 18, p. 105—110. 4. Halmos P. The theory of unbiased estimation.— Ann. Math. Statist., 1946, vol. 17, p. 34-43. 5. Girshick M. A., Mosteller F., Savage L. J. Unbiased estimates for certain binomial sampling problems with applications.— Ann. Math. Statist., 1946, vol. 17, p. 13-23. 6. Тихонов A. H. Теоремы единственности для уравнения теплопроводности.— ДАН СССР, 1935, т. 1, с. 294-300. 7. Тихонов А.Н. Теоремы единственности для уравнения теплопроводности.— Мат. сб., 1935, т. 42, с. 199—216. 8. Levy Р. Sur un probleme decalcul des probabilites lieacelui du refroidis- sement d’une barre homogene.— Ann. Scuola norm, super. Pisa. Ser. 2, 1932, vol. 1, p. 283-296. 9. Mazur 5., Orlicz W. Grundlegende Eigenschaften der polynomischen Opera- tionen.— Stud, math., 1934, vol. 5, p. 50—68, 179—189. 10. Halmos P., Savage L. J. Application of the Radon—Nikodim theorem to the theory of sufficient statistics.— Ann. Math. Statist., 1949, vol. 20, p. 225-241. 39 К ВОПРОСУ О ДИФФЕРЕНЦИРУЕМОСТИ ПЕРЕХОДНЫХ ВЕРОЯТНОСТЕЙ В ОДНОРОДНЫХ ПО ВРЕМЕНИ ПРОЦЕССАХ МАРКОВА СО СЧЕТНЫМ ЧИСЛОМ СОСТОЯНИЙ* Интересующие нас переходные вероятности pa (t) определены для всех действительных f > 0 и удовлетворяют соотношениям: Ра (0 > 0, (Ц Xp£w = i, (И) 6 о [ 0 при a=j£=p, „»(0) = 4 = {1 при а = р> (Ш) . ЕРа(0Р₽(О = рХ(* + О- (IV) В Кроме этих соотношений алгебраического характера, мы будем счи- тать выполненным условие непрерывности Pa (0->Ра.(°) = 4 ПРИ «->0. (V) * Уч. зап. МГУ, 1951, т. 148. Математика, № 4, с. 53—59.
364 39. О дифференцируемости переходных вероятностей Хотя в условии (V) требуется непрерывность функций только при t = 0, легко видеть, что из совокупности условий (I)—(IV) вытекает непрерывность этих функций при всех t 0. В случае конечного числа состояний, т. е. в случае, когда а, £ и у в формулах (I)—(V) пробегают лишь значения 1, 2, . . ., п, из (I)—(V) вытекает (см. [2]) дифференцируемость функций р$ (t) при всех t 0 (при t = 0, естественным образом, только справа), т. е., в частности, существование пределов <*> 4 = [-Jr (01 _ = Um при 0=#а. (2) Пределы эти удовлетворяют соотношениям — 2j frACX (3) и имеют хорошо известный вероятностный смысл плотностей вероят- ности выхода из состояния с номером а (в случае аа)*и плотностей вероятности перехода из состояния с номером а в состояние с номе- ром р (в случае Сами вероятности перехода Ра (0 однозначно определяются плотностями перехода (по которым аа вычисляются в соответствии с формулой (3)) как решения любой из двух систем дифференциальных уравнений 4-Ра(0= - aapl(t) + (4) Y-^а -^-Ра(0= —Ра(0«₽+ (5) Y^3 удовлетворяющих начальным условиям (III). После моей работы [1] системы уравнений (4) и (5) сделались основным аппаратом изучения переходных вероятностей Ра (t) и в случае счетного множества состояний, т. е. в случае, когда индек- сы а, Р, т в формулах (I)—(V) пробегают все натуральные значения 1, 2, 3, . . . Однако в общей форме даже предварительные вопросы о существовании пределов (1) и (2), дифференцируемости переход- ных вероятностей Ра (0 при t > 0 и применимости к ним соотношения (3) и дифференциальных уравнений (4) и (5) долго оставались без ответа. По-видимому, если ограничиться допущениями (I)—(V) и не вводить никаких дополнительных ограничений, дело обстоит в случае счетного числа состояний так: (А) Пределы аа всегда существуют, но имеются примеры, в кото- рых они равны оо.
39, О дифференцируемости переходных вероятностей 365 (Б) Пределы а» при 0 а всегда существуют и конечны. (В) Всегда 2 (6) яо даже при конечных аа существуют примеры, в которых 3 (7) (Г) При t > 0 функции ра (0 всегда имеют конечные производные. (Д) Если все аа конечны, то для справедливости системы уравнений (4) необходимо и достаточно соблюдение всех равенств (3). (Е) Существуют примеры, где система уравнений (5) не имеет места, несмотря на то что все аа конечны и все равенства (3) выпол- нены. (Ж) Существуют примеры двух различных систем функций р« (О» удовлетворяющих требованиям (I)—-(V) с одинаковыми и конечными и а», удовлетворяющими соотношениям (3). Из перечисленных утверждений остается гипотетическим утвер- ждение (Г). Остальные были частично доказаны Дубом (см. [3, 4]) и полностью устанавливаются в настоящей работе. Доказательство предложения (А). Существова- ние конечных или бесконечных пределов было доказано Дубом. Мы приведем другое вполне элементарное доказательство (доказатель- ство Дуба использует меры в функциональных пространствах). Положим г . ₽ /ov аа = lim inf-----------. (о) t->o г Очевидно, что 0. Если аа = оо, то и аа == аа является искомым пределом. Если аа <С оо, то при; любом £ > 0 ш (1 -$(*))/* <5а. (Ю) В самом деле, возьмем произвольное £ > 0 и в > 0 и выберем такое h, что (1 _ (h))/h < «а + 8/2, (Н) Ра (s) > 1 — (s/2)f при s < h. (12) Представим t в виде t =nh + s,
366 39, О дифференцируемости переходных вероятностей где п 0 целое и 5 < h, Тогда Ра (0 > {pa W)” Ра (*) > {1 - («а + -у) hX (1-Г 0 > >{1 — п(аа + -|-)л}(1— — ^4-х X (1 — > 1 — (аа + е) t, (1 — pS(W<«a + e. (13) Так как е> 0 произвольно, то из (13) вытекает (10). Из (10) а (8) вытекает (9). Таким образом, существование предела а% == = —аа = — аа доказано и в случае конечности аа. - Вопрос о возможности случая аа = оо был оставлен в работах Дуба открытым. Положительный ответ на этот вопрос дает Лемма. Пусть аа 0 при а 2 конечны и таковы, что £v<“- (14> а==2 Тогда существует процесс Маркова, удовлетворяющий условиям (I)-—(V), для которого аа имеют заданные значения аа при а 2, л „ а В л ^СС---I а1==оо, af = 1 при Р^>2, R ? при а >2, а^Р>2» «а=0 ) Отвечающие этим требованиям (£) можно построить следую- щим образом. Положив р\ (0 = Ф (0. (15) допустим, ЧТО при Р > 2 -^-Р1(0=Ф(0 — «вРх(<)> что вместе с pl (0) = о дает pl (/) = ^ ф (5) e'a&(t~s) ds. (16) о Требование SPi W = pl (0 + 3 Pi (^) = 1
39, О дифференцируемости переходных вероятностей 367 приводит к уравнению <р (t)+$ ф (®) 2е вр< )^«=1- О Р=2 Условие (14) приводит к тому, что ядро ВД = 2 е~^х ₽=2 имеет конечный интеграл (17) ^(T)dT = ^A.. о 8 Поэтому 1 уравнение (17) имеет непрерывное при t > 0 решение <р (t), которое может быть вычислено обычным методом при помощи преобразования Фурье. Легко установить, что это решение непре- рывно и удовлетворяет условиям Ф (0) = 1, ф' (0) = — оо. Для окончания нашего построения остается к (15) и (16) присоеди- нить при а 2 значения pa (t), удовлетворяющие уравнениям 2 Ра (0 = #аР1 (0 аара (^)> “^“Ра (0 — Ра(0 ^аРа(0» — Ра (0 а$Ра (0> которые легко интегрируются одно за другим (с начальными усло- виями (III)). Построенные вероятности ра (0 удовлетворяют всем требованиям (I)—(V). Доказательство предложения (Б). Лемма. Пусть при t Н 1 — Ра (0 < 6, 1 — pl (0 < 8. (18) Тогда при nh t Я, где п > 0 целое, £ (0 > npl (/0(1 - Зе). (19) 1 См.: Титчмарш Е. К. Введение в теорию интегралов Фурье/Пер. с англ. №.; Л.: Изд-во иностр, лит., 1948, § 11.5. 2 Второе и третье уравнения здесь взяты из системы (5), а первое из системы (<).
368 39. О дифференцируемости переходных вероятностей Доказат е л ь с т в о. Пусть 3 Рк= Д (h) (Л)... p^h), *=1,2,..., k—1 р=%р*, к=1 <?» = ТД р« (А) PV1 W • • • PVi+1 (й). • • Pvft_i W- Легко установить, что 1 - Ра (0 > Ра (0 > Д PkpI (t - kh) > (i;- г)Р. (20) Из (18) и (20) вытекает Р < 8/(1 - 8). (21) С другой стороны, fc—1 £»>₽£(**) - 3 Pi>K&h)-P, (22) t=i что вместе с (18) н (21) дает & > 1 - 8 - 8/(1 - 8). (23) Наконец, PW> S Q^Pl(h)^t-kh), (24) K—l откуда вместе с (18) и (23) получается Р&(0 > nj>» (Л) (1 — в — 5^) (1 — в) > пр₽ (Л) (1 - Зв), что и требовалось доказать. Предположим теперь условия леммы выполненными для данного Н ъ рассмотрим h < Н. Пусть п есть целая часть H!h п t = nh. Тогда п > H/2h и в силу (19) 1 > Ра (0 > npl (й)(1 - Зе), 3 Для понимания неравенств (20), (22) и (24) читатель должен восстановить для себя теоретико-вероятностный смысл P^hlQ^. Впрочем, эти неравенства лег* ко доказываются и чисто алгебраически на основе (I)—(IV).
39, О дифференцируемости переходных вероятностей 369» т. е. h nh (1 — Зе) Н (1 — Зе) * Следовательно, -ft 1- 4(0 aP = Iimsup—-—<^оо. t-*o 1 Для любого t Н выберем такое /г, чтобы pl (h)/h > 4 (1 - 8), hit е, и обозначим через п целую часть t/h. Тогда nh t (1 — 8) и в силу (19) при 8 < 1 —^->-^--^^-(1-38)>-^^-(1 —38)(1 —8)> (25> (26> (27> (1-48) (1-8). (28> При любом 8, удовлетворяющем условиям 1 8 О, неравенства (28) доказано, если t Я, где Н достаточно мало. Отсюда вместа с (25) вытекает, что 4(0 -» » lim—j—= аВ = йе. Доказательство предложения (В) в части не- равенства (6) вполне элементарно и может быть найдено в работах Дуба [3, 4]. Вот пример, в котором для а = 1 имеет место неравенство (7), хотя все аа конечны. 1) При а > 3 вероятности р% (0, ра (0 для 3 < £ < а и ра (0 определяются из дифференциальных уравнений ЗГ Pl W = - а Л ₽ = «-!, a - 2, •... 3, (с обычными начальными условиями (III)), где aa^> 0 подобраны так, Что со 1 ОО. (29)
370 39. О дифференцируемости переходных вероятностей 2) При а > 2 и р = 1 или Р > а (0 о. 3) pl (0 = 1. 4)р1(0 = е-‘. 5) При р 1 t ₽?(<) = $e-sp&(s)ds, о где pl (t) = lim pl (t). а-*оо Так как для построенных (t) ai=-[4^H=0=i, ^=[fpiW](=» = 0 при всех ТО S о? < а Можно проверить, что условия (I)—(V) в построенном примере вы- полнены. Предложение (Д) доказано Дубом (см. [4, VIII]). На только что рассмотренном примере можно непосредственно убе- диться, что в нем уравнения (4) неприменимы. В самом деле, в этом примере ах = 1 и af = 0 при р #= 1. Поэтому при а — 1 уравнения (4) имеют вид = — pl (г) и вместе с pl (0) = 0 приводят к абсурдному выводу, что р1 (0 = 0 при всех р =^= 1. Доказательство предложений (Е) и ( К) дано Дубом (см. [4, теорема 2.2]). ЛИТЕРАТУРА 1. Колмогоров А. Н. Об аналитических методах в теории вероятностей.— УМН, 1938, вып. 5, с. 5—41. 2. Doeblin W. Sur Pequation matricielle Bull. sci. math., 1938, vol. 62, p. 21—32. 3. Doob J. L. Topics in the theory of Markoff chains.— Trans. Amer. Math. Soc., 1942, vol. 52, p. 37—64. 4. Doob J. L. Markoff chains — denumerable case.— Trans. Amer. Math. Soc., 1945, vol. 58, p. 455—473.
40, Обобщение формулы Пуассона 371 40 ОБОБЩЕНИЕ ФОРМУЛЫ ПУАССОНА НА СЛУЧАЙ ВЫБОРКИ ИЗ КОНЕЧНОЙ СОВОКУПНОСТИ* Пусть в урне находится N шаров, из которых М белых и N — АГ черных. Если из урны вынуть наудачу п шаров, то вероятность получить среди них т белых равна Рп (m/N, М) = C^mM/CnN. (1) Несмотря на элементарность формулы (1), вычисления по ней затруднительны и ее заменяют приближенными соотношениями Рп (m/N, М) — Р* (m/N, М), (2> где Р* является тем или иным выражением, которое легче вычис- лить или использовать в дальнейших выводах, чем точное выраже- ние Р. Во всем дальнейшем мы будем указывать условия, при кото- рых соотношение (2) делается в пределе точным в смысле 7И=П т—0 Чаще всего используют приближение лапласовского типа Рп (m/N, М) = (3> (4) где а = пр. (5) а2 = пр (1 _ _ п)/(лг _ 1)? (6) р = М/N. (7> Наиболее широко известные нам условия применимости прибли- жения (4) таковы X = n/N Хо < 1, а = пр -> оо, п (1 — р) -> оо, (8) где Хо предполагается постоянным. Условие % < 1 не является стеснительным, так как при 1/2 можно перейти к «дополнительной» выборке из остающихся nr = N — п Шаров, для которой %' 1/2. * УМН, 1951, т. 6, вып. 3, с. 133—134. 1 Ср. для бернуллиевской схемы статью: Козуляев П, А.— Уч. зап. МГУ. Математика, 1939, вып. 15, с. 179—182.
372 40, Обобщение формулы Пуассона Поэтому из всех случаев, в которых п оо, остается рассмотреть лишь случаи ограниченного а — пр и ограни- ченного п (1 — р). Второй из этих случаев сводится к первому при помощи переименования белых шаров в черные, а черных — в бе- лые. Задачей настоящей заметки является указать, что в случае п оо,' а = пр с (9) законно следующее обобщенное пуассоновское приближение; (Ю) где = _[log (1 - Х)]/Х. (11) Приближение (10) законно и при более широких условиях. Имен- но для его применимости в смысле (3) достаточно условия р-+0. (12) При помощи легко проверяемого тождества а (а — X) (а — 2Х).. .(а — (т — 1) X) а _ „т,т ,. }\п'т ,, . w!(l-X)m V и известной двойственности Рп (m/N, М) = Рм (m/N, п) . (14) вопрос сводится к доказательству того, что биномиальное прибли- жение Рп (m/N, М) = С™рт (1 - рТ~т применимо в смысле (3) при условии Х->0. (15) (16)
41. Некоторые работы последних лет в области предельных теорем 373 41 НЕКОТОРЫЕ РАБОТЫ ПОСЛЕДНИХ ЛЕТ В ОБЛАСТИ ПРЕДЕЛЬНЫХ ТЕОРЕМ ТЕОРИИ ВЕРОЯТНОСТЕЙ* ВВЕДЕНИЕ В середине 40-х годов существовало мнение, что проблематика предельных теорем классического типа (т. е. проблематика предель- ного поведения распределений сумм большого числа независимых или связанных в цепь Маркова слагаемых) в основном закончена. Написанная мной совместно с Б. В. Гнеденко монография [1] имела в виду подведение итогов работы предшествующих лет. В действи- тельности, однако, с конца 40-х годов наблюдается значительное оживление работы именно в этих классических направлениях. Объясняется это несколькими обстоятельствами. Во-первых, стало выясняться, что с практической точки зрения точность оценок оста- точных членов, полученных до настоящего времени, далеко не доста- точна. Во-вторых, некоторые задачи, поддававшиеся ранее решению лишь при сложных и весьма ограниченных условиях, неожиданно получили весьма простое и вполне законченное (в смысле необходи- мых и достаточных условий) решение. К такого рода вопросам отно- сится, например, задача «локализации» предельных теорем, которая оказалась для случая одинаково распределенных независимых сла- гаемых и для случая распределения числа попаданий в отдельные состояния в однородной цепи Маркова допускающей исчерпываю- щее решение. Естественно, что эти успехи возбуждают желание добиться столь же окончательных результатов и в ряде других случаев. Наконец, сами постановки задач благодаря введению надлежащих расстояний между распределениями и заимствованной из теории наилучших приближений идеи вычисления точных верхних границ остаточных членов получили большую отточенность и прозрачность. В настоящей статье дается краткое изложение результатов неко- торых работ последних лет, которые могут иллюстрировать указан- ные сейчас новые тенденции. Результаты, изложенные в монографии 11], предполагаются читателю известными, хотя иногда и упоминают- ся ради связности изложения. § 1 ОЦЕНКА БЛИЗОСТИ РАСПРЕДЕЛЕНИЙ И РАЗЛИЧНЫЕ ВИДЫ СХОДИМОСТИ РАСПРЕДЕЛЕНИЙ . Если | есть случайный элемент некоторого множества X, то Распределением вероятностей случайного элемента £ называется ♦ Вести. МГУ, 1953, т. 10, с. 29—38.
374 41. Некоторые работы последних лет в области предельных теорем функция Р (А) = Р {Ее А}, определенная для надлежащей системы подмножества А множеству X и указывающая вероятность попадания g на А. В тех случаях когда X есть метрическое пространство (например, числовая прямая 51, координатное n-мерное пространство 5П), мы будем считать, что Р (А) определено для 5-множеств и только для них. При этом усло- вии, как известно, в одномерном случае Р (А) однозначно опреде- ляется соответствующей функцией распределения F (х) = Р {| < х}. Наиболее естественно считать два распределения Рг и Р2 близкими, если вероятности Рг(А) и Р2 (А) близкидля всех входящих в рассмот- рение множеств А. Этому пониманию близости соответствует рас- стояние между распределениями Pi (Рх, Р2) = sup I Рг (А) - Р2 (А) |, А где верхняя грань берется по всем А, для которых вероятности счи- таются определенными.. В одномерном случае рх (Рх, Р2) равно по?- довине полной вариации разности Fx — F2: Pi (Л, Pz) = ^z var (Pl — Pz)' Сходимость распределений Pn к распределению Р, определенную требованием Pi (Рп, Р) О, будем называть сходимостью по вариации. Эта сходимость является наиболее сильной из сходимостей, имеющих прямой вероятностный смысл: если два распределения достаточно близки в смысле расстоя- ния pi, то во всех реальных задачах, имеющих дело с ограниченным (хотя бы и весьма большим) числом испытаний, распределения Pi и Р2 практически равноценны х. В одномерном случае иногда нас могут- интересовать только ве- роятности Р (А) для интервалов. Можно было бы определить новое расстояние р' (Рх, Р2) формулой р' (Рх, Р2) = sup | Рх (А) - Р2 (А) |, д 1 Пусть Рп есть распределение системы (£х, ?2, . . ., %п) независимых случай- ных элементов каждый из которых следует распределению Р. Тогда легко доказывается неравенство рх (Р™, Р2) nPi ^2), которое показывает, что в случае, когда прх (Рх, Р2) достаточно мало, вероятность любого заданного ис- хода п независимых испытаний при действии распределения Рх мало отличается от вероятности того же исхода при действии распределения Р2..
41. Некоторые работы последних лет в области предельных теорем 375 где верхняя грань берется по всем интервалам А. Легко, однако, до- казывается, что всегда sup I л — F21 < р' (Plt Р2) < 2sup I — F2 |. Поэтому употребление расстояния р' в основном равноценно поль- зованию расстоянием р2 (Рп рг) = sup | Fx — F2 |. Очевидно, что всегда р2 (Рь Р*) < Pi (Pi, Р*)- Сходимость в смысле р2 (Рп, Р)-+0 мы будем называть сильной сходимостью распределений. Требование •сильной сходимости слабее, чем требование сходимости по вариации. Практически случайные величины обычно измеряются и бывают интересны лишь с той или иной точностью. С этой точки зрения вве- денные выше расстояния рх и р2 иногда преувеличивают практичес- кую значимость различия между двумя распределениями. Например, для вырожденных распределений z .. fl, если хЕЕА, ех(А) = п . Л v 10, если х А, при а у= Ь всегда Pi (еа, еь) = р2 (еа, еь) = 1. Между тем в случае, когда разность Ъ — а мала, практически рас- пределения 8а и 8Ь естественно считать близкими друг к другу. Можно подойти к уточнению сделанного замечания так. Обозна- чим через Р распределение величины Л = £ + 6, где величина £ подчинена распределению Р, а величина 6 (ошибка измерения) независима от £ и подчинена нормальному распределению со средним значением 0 и дисперсией о2. Введем две новые сходи- мости требованиями: а) Рп-^ Р, если при любом о > 0 Р1(Рп\ Р<а>)->0; б) Рп-+ Р, если при любом о > 0 р2(Ма), р^)-+о. Эти формально различные сходимости оказываются, однако, в дей- ствительности равносильными хорошо известной слабой сходимости распределений.
376 41. Некоторые работы последних лет в области предельных теорем Мы ограничились распределениями на прямой и несколько про- извольно ввели ошибки, подчиненные нормальному распределении» вероятностей. Можно, однако, думать, что и в более общей обстанов- ке слабая сходимость 2 хорошо соответствует идее близости распре- делений, учитывающей практическую равноценность (или неотличи- мость) близких точек множества X. . Слабая сходимость слабее сходимости по вариации (в любом мет- рическом пространстве X), а также слабее сильной сходимости в смыс- ле расстояния р2 (на числовой прямой). Слабую сходимость распре- делений в любом метрическом пространстве можно определить при помощи надлежащим образом введенного расстояния. На числовой прямой для этой цели может служить расстояние Леви L (Рп, Р) (см. И, § 9]). Однако все такие расстояния искусственны и неинва- риантны по отношению к простейшим преобразованиям простран- ства X (например, преобразованиям подобия на числовой прямой). Этим слабая сходимость отличается от сходимости по вариации и определенной выше (для случая числовой прямой) сильной сходимо- сти, которые связаны с вполне естественными определениями рас- стояния между распределениями 3. § 2 ЗАПАС ВОЗМОЖНЫХ ПРЕДЕЛЬНЫХ РАСПРЕДЕЛЕНИИ. СЕМЕЙСТВА РАСПРЕДЕЛЕНИЙ, ДОСТАТОЧНЫЕ ДЛЯ РАВНОМЕРНОЙ АППРОКСИМАЦИИ В течение долгого времени общие предельные теоремы находились ощупью. Для какого-либо частного случая удавалось рассчитать предельное распределение, и только после этого ставилась задача нахождения общих условий сходимости к этому распределению. Первым известным мне примером другого подхода к делу является теорема Леви о предельных распределениях для последовательных сумм Сп = С1 + + • • • + Сп членов последовательности С1> ?2,* • .•> %>п независимых одинаково распределенных слагаемых (см. [1, § 33])~ Теорема эта заключается в том, что распределения величин ( Сп ^-п)/Вп . 2 Будем говорить, что в произвольном метрическом пространстве X распре- деления Рп слабо сходятся к распределению Р, если для любой ограниченной непрерывной функции / (х) имеет место соотношение fdPn fdP. х х 3 Очевидно, что расстояние рх инвариантно по отношению ко всем взаимно- однозначным преобразованиям множества х в себя. Расстояние р2 инвариантно по отношению к взаимно однозначным преобразованиям прямой в себя.
41, Некоторые работы последних лет в области предельных теорем 377 могут слабо сходиться только к устойчивому распределению и при- том (при надлежащем выборе распределения слагаемых £п) к любому. Только значительно позднее В. Деблин и Б. В. Гнеденко до конца исследовали условия, при которых такая сходимость имеет место во- обще или к тому или иному определенному устойчивому закону (см. [1, § 35]). Еще большее значение имеет теорема А. Я. Хинчина, характе- ризующая класс возможных предельных законов для распределе- ний сумм Zn + ?П2 + . . . + £nmn независимых «бесконечно малых» слагаемых (см. [1, § 24]). Класс этот в силу теоремы Хинчина совпадает с классом неограниченно делимых распределений 4. В теоремах Леви и Хинчина речь идет о слабой сходимости. Ясно, что при переходе к той или иной более сильной сходимости класс возможных предельных законов мог бы только сузиться. В действительности при переходе к сильной схо- димости в смысле расстояния р2 или даже к сходимости по вариа- ции он остается одним и тем же. Существует вполне обоснованное мнение, что для случая сумм не- зависимых слагаемых теорема Хинчина указывает наиболее широ- кий класс представляющих интерес предельных распределений. Вскоре после установления этой теоремы Б. В. Гнеденко было за- кончено изучение условий сходимости к любому неограниченно де- лимому распределению (см. [1, § 25—27]), чем вопрос о предельном поведении сумм возрастающего числа независимых слагаемых, каж- дое из которых «предельно пренебрегаемо», был с точки зрения схо- димости в существенном исчерпан. Для схем с зависимыми испытаниями аналогичные вопросы изу- чены еще мало. В виде образца вполне законченного исследования для сравнительно частной схемы можно указать на недавнюю ра- боту Р. Л. Добрушина [2]. Здесь исследован случай сумм Zn == £nl + £п2 +..* + £ ПП9 где величины ^п1г принимают только два значения 0 и 1 и связаны в пределах каждой серии в простую однородную цепь Маркова с матрицей переходных вероятностей Рп Рп зависящей только от номера серии п, но не от номера к испытания в серии. Если бы величины %пк были независимы (т. е. в случае рп = <7п), в качестве предельных распределений для величин Лп = (Zn — Ап)/Вп 4 То, что мы не включаем в выражение Zn не зависящее от случая слагаемое (ср. формулу (1) на с. 119 в [1]), не меняет дела. Теорема Хинчина верна и 8 такой формулировке.
378 41. Некоторые работы последних лет в области предельных теорем могли бы появиться только вырожденное распределение еп, нор- мальное распределение, распределение Пуассона и распределения, которые могут быть получены из этих трех линейными преобразова- ниями 5. В случае произвольных рп и qn задача становится много сложнее и перечисление всех возможных предельных распределе- ний величин т)п требует для своего решения привлечения ряда новых остроумных соображений. Исследование аналогичных вопросов для случая цепей Маркова с любым конечным числом состояний (и притом не обязательно одно- родных) начато в работах Купмена (см., например, [14]). Было бы весьма интересно, хотя бы для однородного случая с любым числом состояний 5, получить столь же законченные результаты, как полу- ченные Р. Л. Добрушиным в случае s = 2. При оценке близости распределений с помощью того или иного расстояния между распределениями р (Рь Р2) может быть поставлен вопрос о сходимости не к индивидуальному распределению, а к це- лому классу распределений. Например, можно поставить вопрос о том, обязана ли сумма 5 = £1 + ^2 + • • • + независимых одинаково распределенных слагаемых при п -> оо приобретать распределение, близкое к неограниченно делимому в смысле какого-либо расстояния р. Более точно вопрос заключается в том, существует ли для каждого е > 0 такое 7V, что при N для распределения Р суммы £ непременно найдется неограниченно делимое распределение, удовлетворяющее условию S: р(Л 5)<е. Пока имеется мало работ, в которых подобного рода задачи ре- шались бы в обстановке, существенно несводимой к предельным тео- ремам обычного типа. Отметим, что в указанной выше работе Р. Л. Доб- рушина вопрос об аппроксимации распределений сумм решен для рассмотренного им случая и в смысле такого рода равномерной ап- проксимации (при п -> оо) для расстояния рх. Результат Добрушина довольно сложен из-за необходимости пе- речисления большого числа специальных распределений. Его прин- ципиальную сторону можно пояснить на частном случае неза- висимых величин который несколько ранее был рассмотрен Ю. В. Прохоровым [3]. В этом случае речь идет просто о равномер- ной аппроксимации в смысле расстояния рх биномиального распре- деления Впр, задаваемого формулой Р {С = z} = Cznp* (1 - р)™. 5 Этот результат П. А. Козуляева содержится в общих теоремах § 26 и 27 из [1].
41. Некоторые работы последних лет в области предельных теорем 379 Обозначим через Lnp приближение к Впр, употребляемое в ло- кальной теореме Лапласа, через Рпр приближение к Впр по Пуас- сону, употребляемое при значениях вероятности р, близких к нулю, 0 через приближение, которое получится, если приближать по Пуассону величину п — £ (что естественно при р, близких к едини- це). Разумно пользоваться каждым из этих приближений там, где соответствующее расстояние р1(-®пр» ^пр), Р^{Впр^ Рпр), pl {Впр, Рпр) меньше. Теорема Прохорова заключается в том, что &пр Z===' min {pi (Впр, Lnp), pl {Впр. Рпр), Pl (Впр, Рпр)} стремится к нулю при п->оо равномерно по р. Таким образом семейство распределений Lnp, Рпр и Рпр оказывается достаточным для равномерной аппроксимации распределений Впр при п->оо. В более простой обстановке, когда аппроксимирующими распре- делениями являются линейные преобразования нормального рас- пределения, задаваемого функцией распределения X Ф (ж) = —4= е-ж!/2 dx, —oo а в качестве расстояния берется расстояние р2, такого рода теоремы о равномерной аппроксимации по существу не являются новостью (см. § 4). Но сознательные поиски семейств, достаточных для равно- мерной аппроксимации в более сложных случаях, начались недавно и в этом направлении остается еще очень много сделать. § 3 ЛОКАЛЬНЫЕ ТЕОРЕМЫ И СХОДИМОСТЬ ПО ВАРИАЦИИ Любое распределение Р (А) на прямой записывается в виде Р(А)= У p(x)dx + ф(А), А где р (%) — соответствующая плотность вероятности, а ф (А) — син- гулярная часть распределения. Если ф = 0, то распределение Р непрерывно. Если хотя бы одно из распределений Рг и Р2 непрерыв- но, то имеют место неравенства оо оо 4" |Р1 —РгИж<р1(Л, Л)< Ipi — pijdx. —оо —со Поэтому сходимость по вариации рг(Рп, Р)-> 0 в случае непреры- вности предельного распределения Р равносильна сходимости
380 41. Некоторые работы последних лет в области предельных теорем в среднем плотностей: оо $ ,|Pn — p\dx-^0. —оо Локальными теоремами о сходимости плотностей вероятности к плотности вероятности предельного распределения много зани- мались 6. При этом обычно интересовались условиями равномерной сходимости плотностей. Как было отмечено выше, собственно с ве- роятностной точки зрения это излишне. В работе Ю. В. Прохорова [4] показано, что переход к сходимости по вариации (т. е. в рас- сматриваемом сейчас случае непрерывного предельного распределе- ния — к сходимости плотностей в среднем) приводит к возможности получения очень простых необходимых и достаточных условий схо- димости для случая одинаково распределенных независимых сла- гаемых. Именно им было показано, что в условиях приведенной вы- ше теоремы Леви для сходимости распределений величин (£п — Ап)/Вп к устойчивому распределению необходима и достаточ- на совокупность двух требований: 1) должна иметься слабая сходи- мость к S, 2) при каком-либо п распределение величины £п должно иметь не равную тождественно нулю непрерывную компоненту. Рядом с локальными теоремами для плотностей принято рассмат- ривать локальные теоремы дискретного арифметического типа для «решетчатых» распределений (см. [1, § 48—501). Локальные теоремы этого типа связаны с операцией перенесения непрерывного распре- деления с плотностью р (х) на «решетку» точек х% — kh + а. Операцию эту можно осуществить, например, приписывая каждой точке хк решетки вероятность Рк = $ p(x)dx. Xft—h/2 Если в обстановке теоремы Леви величины решетчаты с шагом Л, то величины Лп ~ (£п — Ап)/Вп будут решетчатыми с шагом Л>п — h/Bn. Б. В. Гнеденко [5] было показано, что в случае, если шаг h для вели- чин £п максимален и распределения величин цп слабо сходятся к устойчивому распределению S, то расстояние по вариации междУ распределением Fn величины цп и распределением 5П, получаю* 6 См. [1, § 46 и 47], а также венгерский перевод этой книги, где формуляров ки локальных теорем улучшены.
41. Некоторые работы последних лет в области предельных теорем 381 щимся при перенесении распределения S на решетку возможных значений величины цт, стремится при оо к нулю: Р (РП9 Sn) 0. Теоремы Прохорова и Гнеденко ограничиваются случаем одина- ково распределенных слагаемых. Но во всяком случае они показы- вают, что в направлении «локализации» предельных теорем возмож- ны значительно более общие и законченные результаты, чем эта казалось ранее. В заключение этого параграфа отметим еще работы по арифметическим многомерным локальным теоремам [6—10]. Пер- вые три [6—8] из них посвящены многомерному обобщению изложен- ного результата Гнеденко. Четвертая [9] исчерпывающим образом ре- шает вопрос об аппроксимации по вариации распределения числа попаданий в отдельные состояния за h шагов в случае однородной цепи Маркова с конечным числом состояний. Пятая [10] содержит весьма глубокие, хотя и менее окончательные результаты для неод- нородных цепей Маркова. § 4 ТОЧНАЯ ОЦЕНКА ОСТАТОЧНЫХ ЧЛЕНОВ И УЛУЧШЕНИЕ ПРИБЛИЖЕНИЙ В работе Ю. В. Прохорова [3], кроме величины enp ~ {pi (-®пр> Дгр)> Р1 (-®пр» Pnp)i pi (-®пр> -^пр)}> рассмотрена величина 8n == sup еПр 0<р<1 и доказано, что 8П = К?' + О где X = (А)7’ _Ы(1 + е->/. = 0,42... \ у / у 2л / Таким образом, в смысле расстояния по вариации найдена асимптоти- чески точная оценка наибольшего отклонения (при заданном п и переменном р) биномиального распределения от наиболее подходя- щего из приближений Lnp, Рпр и Рпр. Этот довольно узкий результат может служить примером наме- чающейся в работах последнего десятилетия техники оценки оста- точных членов; Для сумм произвольно распределенных независи- мых слагаемых вполне законченных результатов такого типа пока не существует. Мы рассмотрим те из возникающих здесь задач2 которые связанй с так называемым ляпуновским отношением.
-382 41. Некоторые работы последних лет в области предельных теорем Для простоты обозначений предположим, что сумма Z = L + g2 + .. . + независимых слагаемых нормирована, т. е.,имеет математическое ожидание 0 и дисперсию 1. Тогда «ляпуновское отношение» запи- шется в виде fc=l Хорошо известно, что при £ -> О для функции распределения F (z) -суммы £ имеет место предельное соотношение Z F(z)-^O(z)=^= С e-^dz. у 2л Д Введем в рассмотрение величины р (Z, z) = sup | F (z) — Ф (z) I,| L—l p(Z) = sup p (Z, z) = sup p2 (F, Ф). z L=l Крамером было показано, что £iZ р (Z) c2Z, где и е2 — положительные константы. Естественно поэтому рас- смотреть отношение p(Z)/Z, его верхнюю грань Р(П с — sup I и его верхний предел с* = lim sup . »о 1 г Оценки р2 (F, Ф) < cL, р2 (F, Ф) < c*L + о (L) будут в отношении множителей при L наилучшими из возможных» Очевидно, что с* с. После работы Берри [15], рассмотревшего более специальную за- дачу, Эссеен [16] доказал, что 1//2К < с < 15/2.
41. Некоторые работы последних лет в области предельных теорем 383’< Вопросы возможно более точной оценки или точного вычисления^ констант с и с* и особенно функций с (z) = sup Р == sup ~ Ф (г) I , d*(z) = limsup — 1 imsup И । z-o b l-*o b представляются чрезвычайно интересными. Если на характер слагаемых наложить те или иные дополни- тельные ограничения, то значения с и с* и функций c(z) и с* (z)> могут уменьшиться. В предположении симметричных распределений слагаемых и некоторых других ограничений, необходимость которых неясна, Ю. В. Линник [11] доказал, что С* = -^=, C*(z) = -4=.e'z‘/2. /2л ' ' /2 л Возможно, что эти формулы верны при единственном ограничении^ симметричности распределений слагаемых g. Что же касается пер- вой из этих формул, то возможно, что она верна и в общем случае. Не опровергнута даже гипотеза с — ИУ2п9 Было бы очень важно исследовать с той же точки зрения (полу- чения равномерно действующих точных или асимптотически точных оценок остаточных членов) также и приближения для распределений сумм большого числа независимых слагаемых, использующие поправки к нормальному распределению, зависящие от старших моментов и выражающиеся через многочлены Чебышева—Эрмита. В Этом на- правлении еще почти ничего не сделано. Зато следует отметить замечательную работу С. X. Сираждинова [13], в которой локальные теоремы с уточнениями, зависящими от старших моментов и дающими остаточные члены порядка 1/па со сколь угодно большим показате- лем а, распространены на распределение числа попаданий за п ша- гов в отдельные состояния в однородной цепи Маркова с конечным числом состояний. 3 сентября 1953 г. ЛИТЕРАТУРА 1. Гнеденко Б. В., Колмогоров А. Н. Предельные распределения для сумм не- зависимых случайных величин. М.; Л.: Гостехиздат, 1949. 264 с. 2. Добрушин Р. Л.— Изв. АН СССР. Сер. мат., 1953, т. 17, с; 285. 3. Прохоров Ю. В.— УМН, 1953, т. 8, вып. 3, с. 135—142. 4. Прохоров Ю. В.— ДАН СССР, 1952, т. 83, с. 797—800. 5. Гнеденко Б. В.— ДАН СССР, 1950, т. 71, с. 425—428. 6. Мейзлер Д. Г., Парасюк О. С., Рвачева Е. Л.— ДАН СССР, 1948, т. 60,- с. 1127-1128. 7. Мейзлер Д. Г., Парасюк О. С., Рвачева Е. Л.— Укр. мат. журн., 1949, с. 9—20.
-384 42. О сходимости А. В. Скорохода 8> Рвачева Е. Л.~ Тр. Ин-та математики и механики АН УзССР, 1953, вып* in я. 1, с, 106-121. 9. Колмогоров А. Н.— Изв. АН СССР. Сер. мат., 1949, т. 13, с. 281—300. 10. Линник Ю. В., Сапогов Н. А.— Изв. АН СССР. Сер. мат., 1949, т. 13 с. 533-566. 11. Линник Ю. В.— Изв. АН СССР. Сер. мат., 1947, т. 11, с. 111—138. *12. Прохоров Ю. В.— Изв. АН СССР. Сер. мат., 1952, т. 16, с. 281—292. 13. С up аж д инов С. X.— ДАН СССР, 1952, т. 84, с. 1143—1146. 14. Коортап В. О.~ Traps. Amer. Math. Soc., 1951, vol. 70, p. 277—290. 15. Berry A. G.— Trans. Amer. Math. Soc., 1941, vol. 49, p. 122—136. x16. Esseen C. G.— Acta math., 1945, vol. 77, p. 1—125, 42 О СХОДИМОСТИ А.В.СКОРОХОДА* При описании временнбго течения реального процесса с по- мощью функции f (t) от времени t, принимающей значения из надле- жащим образом выбранного «фазового пространства» X, часто ока- зывается естественным и законным допущение, что функция / имеет только разрывы первого рода (скачки). Для детального исследова- ния такого рода процессов оказывается полезным введение в мно- жестве D функций с разрывами первого рода (которые для опреде- ленности мы будем рассматривать на единичном отрезке 0 <1 t 1) ^соответствующей топологии. Топология равномерной сходимости, естественная при изучении непрерывных процессов, оказывается при изучении процессов с разрывами первого рода слишком сильной. Например, естественно желать, чтобы последовательность функций _ f при /<*п, П I #2 при t > tn, ?где tn-> tQ при оо, сходилась к функции //М = (Л1 При Z<^Zo’ '' ' I х2 при t ^>^0, так какчфункцияуп при большом п отличается от функции / лишь ма- лым сдвигом момента скачка из состояния хх в состояние х2. Как из- вестно, в пространстве равномерной сходимости такая сходимость при хх =/= х% не имеет места. С другой стороны, топология в D не должна быть слишком сла- бой, так как желательно, чтобы наиболее существенные свойства -функции f (= D сохранялись при предельном переходе. Например» * Теория вероятностей и ее применения, 1956, т. 1, № 2, с. 239—247. .
42. О сходимости А. В. Скорохода 385 желательно, чтобы в предположении сходимости fn к / из tn t, fn (tn + 0) — fn (tn — 0) С =/= 0 вытекало, что f (t + 0) - f (t - 0) = c. Уже соблюдение высказанных сейчас двух пожеланий требует введения в D новой топологии, специально приспособленной к по- требностям исследования процессов с разрывами первого рода. Та- кого рода топология предложена в работах [1, 2] А. В. Скороходом. В этих работах А. В. Скороход для случая действительных функций f (£) (т. е. для случая, когда X есть действительная прямая) опре- деляет в D некоторую сходимость (мы будем называть ее 5-сходи- мостью) и отмечает, что эта сходимость превращает множество D в хаусдорфово топологическое пространство. Далее в § 2 дается но- вое определение 5-сходимости, применимое в предположении, что X есть произвольное метрическое пространство, и обнаруживается, что возникающее таким образом топологическое пространство SD метризуемо. Введенное в § 2 с этой целью расстояние s (f, g) и соот- ветствующая ему равномерная топология представляются мне весьма естественными и удобными в применениях, несмотря на то что даже в случае полного пространства X метрическое простран- ство sD не полно. В конце § 2 дается одно простое необходимое и до- статочное условие 5-компактности. Результаты § 3 (как и теорема IV § 2) существенно опираются на предположение, что фазовое пространство X полно (для простоты мы егЧ> в дальнейшем принимаем с самого начала). В § 3 пополнение метрического пространства sD получает кон- кретную интерпретацию при помощи ZJ-кривых в пространстве R = == Т х Т. Эта интерпретация используется для доказательства воз- можности ввести в D другое расстояние $* (/, g), порождающее ту же самую скороходовскую сходимость и топологию, но превращаю- щее D в полное метрическое пространство s*D. При изложении ре- зультатов этой работы в семинаре по теории вероятностей в Москов- ском университете я поставил задачу возможно более простого яв- ного построения расстояния (/, g). Эта задача была решена Ю. В. Прохоровым [3]. § 1 посвящен некоторым вспомогательным рассмотрениям, поль- за которых обнаруживается в § 3. Содержание § 2 можно было бы с таким же удобством изложить и не вводя множества ©, а пользуясь обычной техникой изображения процессов с разрывами первого Рода, например при помощи непрерывных справа функций /+(0 = /(« + 0) Действительного переменного t. 13 А. н. Колмогоров
386 42. О сходимости А. В. Скорохода § 1 КЛАСС ФУНКЦИЙ D = Dx При описании реальных процессов с помощью функций / (q с разрывами первого рода обычно можно считать, что реальные яв- ления, происходящие в момент скачка t, полностью описываются предельными значениями слева и справа: / (t — 0) и / (t — 0). Только в порядке математической условности само значение f в точке скачка определяется при помощи одного из соглашений / (0 = / (t — 0) или / (0 = / (t + 0), или в случае действительных функций соглашением f(t) = V2 [/ (i-0)+/(i + 0)]. По существу логичнее вообще рассматривать функции / (0) от сим- волов 0 вида t — 0 или t + 0 и лишь в случае / (t — 0) =♦ / (t 4- 0) обозначать их общее значение через f (t), считая / (t) неопределенным в случае / (t — 0) =# / (* + 0). При изложении теории /)-кривых? излагаемой в § 3, такой подход к делу имеет и формальные преиму- щества: некоторая дополнительная затрата труда в § 1 окупается бо- лее с&атым и прозрачным изложением § 3. Будем обозначать через 0 множество символов 0 одного из двух видов: 0 = ^ — 0, 0 < t < 1, 0 = t + 0, 0<*<1. Отношения порядка между элементами 0 ЕЕ 0 устанавливаются при помощи соглашений 1) t ± 0 < t' ± 0, если t < t’, 2) t — 0 < t + 0. Будем считать, что 0П t — 0, если для любого е > 0 существует такое п (е), что при п > п (е) выполняются неравенства t — с 4* 0 <4 — о, и считать, что 0П —> t + 0, если для любого е 0 существует такое п (е), что при п п (е) выполняются неравенства t 4* 0 6п ^4 t 4“ в — 0.
42. О сходимости А. В. Скорохода 387 Определенная таким образом сходимость превращает множество 0 в бикомпактное топологическое пространство (см. [5]). То обстоятель- ство, что это пространство неметризуемо, не помешает его употреб- лению в дальнейших построениях. Классах по,определению состоит из функций / (0), определенных на © со значениями из метрического пространства X, непрерывных в том смысле, что из еп-> 0 вытекает Легко доказать, что для любой функции / ЕЕ D = Dx функция Г (0 = / а + 0) . определена при всех t из полусегмента 0 t < 1, непрерывна спра- ва и имеет в каждой точке t полусегмента 0 < t 1 предельное зна- чение слева Ясно, что соответствие между функциями f ЕЕ D и функциями /\ обладающими описанными свойствами, взаимно однозначно. Для любого множества М cz 0 определим «колебание» функции f ЕЕ D на М формулой со/ (М) = sup р (х, х'). х,х'&М Специальный интерес будут далее представлять «сегменты» простран* ства 0, т. е. множества [О', 0"] - {0; 0' < 0 < 0"}. В частности, сегмент [^ — 0, t + 0] состоит из двух точек — своих концов t — 0 и t + 0. Для него со/ И - 0, t + 0] = I / (t + 0) - / (t - 0) |. Легко доказывается Теорема I. Для того чтобы определенная на 0 функция f (9) со значениями йз X принадлежала классу D, необходимо и доста- точно существование при любом 8 0 таких 0 == tj ... === 1, что при всех к = 1, 2, . . п выполнено неравенство со/ [/fc-i + 0, — 0] < 8. 13*
388 42. О сходимости А. В. Скорохода § 2 S-СХОДИМОСТЬ И РАССТОЯНИЕ s (/, g) Определение 1. Две функции f ЕЕ D и g ЕЕ D называют- ся ^-эквивалентными, если существуют такие г и О = tQ < tx < . . . < tr = 1, 0 = t'Q < ti < . . . < tr = 1, что при k — 1, 2, . . г соблюдаются неравенства I h — К е, sup P(/(0),g(0'))<8. 0'e 0, i^-0] Е-Эквивалентность далее обозначается символом Определение 2. Последовательность функций fnED называется S-сходящейся к функции если для любого 8 О существует такое п (е), что при n п (е) /п~/. S'-сходимость далее обозначается символом /пЛ/. Это и есть сходимость, введенная в случае, когда X есть числовая прямая, А. В. Скороходом. Положим теперь (/, g) = inf 8. f ~g Теорема II. Множество D с расстоянием s (f, g) является метрическим пространством. В самом деле, легко видеть, что s (f, g) для любых / ЕЕ D и g ЕЕ D действительно и неотрицательно. Из теоремы I вытекает, что *(/, /)=о. Без большого труда можно установить, что S (/, g) = о только в случае f = g. Симметричность расстояния s (/, g) очевидна в силу его определения. Выполнение неравенства 8 (/, 8 (/, g) + 8 (g, К) вытекает из следующей легко доказываемой леммы:
42. О сходимости А. В. Скорохода 389 Лемма. Если е 8' g — h, то 8+8' /~л. Очевидна Теорема III. Для сходимости fn^f необходимо и достаточно выполнение условия s(fn, /) + 0. Если только пространство X содержит две различные точки xi х2^ то метрическое пространство sD не является полным, так как при 1» tn *0, последовательность функций /п(6) = ' xi при 0 + 0 0 tn — 0, при tn + о о <; tQ — о, kxi при £о + О^С0<3 — О удовлетворяет критерию Коши, но не является сходящейся. В связи с этим интересна Теорема IV. Для того чтобы последовательность функций fn D, удовлетворяющая критерию Коши lim sup s (fn, fn+p) = 0, n-*oo p>0 сходилась к функции fEzD, необходимо и достаточно условие: (♦) для любого 8 +> 0 существует такое 6 }> 0, что при каждом п и Г Е (0; 1) <о/п Ю + 0, 6 — 01 < е, afn [1 ~ 6 + 0, 1 - 0] < 8, (0*fn U + 0, t + 6 — 0] < 8, где со*/ [0, 0'] = inf max {со/ [0, t — 0], со/ (t + 0, 0')}- t Следует отметить, что величины со*/ сходны с величинами Уже применявшимися при изучении функций класса D Е. Б. Дын- «иным в работе [4]. К теореме IV тесно примыкает
390 42. О сходимости А. В. Скорохода Теорема V. Для того чтобы множество М с; D было ком- пактно в пространстве SD скороходовской сходимости, необходимо и достаточно одновременное выполнение двух условий: 1) существует такой компакт K^D, что все значения f (0) функции t ЕЕ М в точках 0 GE 6 принадлежат К; 2) для любого & 0 существует такое 6 0, что из / ЕЕ М вы- текают неравенства со/ [0 + 0, б — 01 < е, со/ [1 — 6 + 0, 1 — 0] < е, (О*/ [t + 0, t + 6 - 0] < 8. § 3 ГРАФИКИ ФУНКЦИЙ КЛАССА D и D-КРИВЫЕ В ПРОСТРАНСТВЕ R = Т X Т Будем обозначать буквой Т единичный сегмент Т = {t; 0< t < 1} действительной прямой и буквой R прямое произведение R = Т X Т = {(t, х)\ t(=T, х ЕЕ X}. Это прямое произведение будем рассматривать как метрическое про- странство с расстоянием Р ((^ я), Х'У) = max {| t' — t \, р(х, я')}. Графиком функции / ЕЕ будем называть множество Г/ точек пространства R любого из двух типов: (t, f (t — 0)) или (t, / (t + 0)). Легко видеть, что определенная на 0 функция <р/ (t - 0) = (t, f (t - 0)), Ф/ (t + 0) = (t, f (t + 0)) co значениями из R непрерывна в смысле, разъясненном в § 1. Она отображает 0 на Г/, причем порядок, установленный на 0 (отноше- ния неравенства 0 < 0', определенные в § 1), создает определенный порядок пробегания графика Г/. Будем теперь независимо от графиков функции / из D = Dx рассматривать непрерывные в смысле § 1 отображения 0 в простран- ство R, т. е. функции (р (0) класса Dr. Назовем две функции <р G ЕЕ Dr и ф ЕЕ Dr эквивалентными, если существуют такие монотон- ные, т. е. удовлетворяющие условию X (0') х (9)» когда 0' 0, отображения и Х2 пространства 0 на самого себя, что Ф (Xi (9)) = Ф (Х2 (0)).
42, О сходимости А. В, Скорохода 391 По этому отношению эквивалентности функции ср е Dr разби- ваются на классы ф, которые естественно называть D-кривыми в пространстве R. Между D-кривыми естественно ввести расстояние при помощи формулы Р (ф, $) = inf sup р (<р (0), (9)). ФОР Теория D-кривых вполне аналогична теории непрерывных кри- вых. Расстояние р (ф, ф) превращает множество Ф всех D-кривых пространства R в полное метрическое пространство. Имеет место Теорема VI. Функция JeD однозначно определяется соот- ветствующей ей кривой f = ф/. При этом всегда 8 (f, g) = Р (f, %)• Теорема VI доставляет нам новую интерпретацию расстояния s (f, g) и 5-сходимости: 5-сходимость последовательности функции fn к функции / оказывается равносильной сходимости в смысле рас- стояния р (ф, ф) кривых fn к кривой f. Для дальнейшего целесообразно ввести обозначения тф (0)t (0) компонент функции Ф (0) = (тФ (0), U (0))- Обозначим через Л множество D-кривых f, соответствующих функ* циям f Е D, & через Л замыкание множества Л в пространстве Ф. Легко доказать, что ф е ф е Л в том и только в том случае, если выполнены следующие условия: (^i) тф (0) отображает 0 на все множество Т; (Л2) из 0 < 0' вытекает тф (0) (0'). В силу условий (Xj), (Х2) для функции ф е ? Е А множества Тф1 (t) тех 0, для которых тф (0) = являются сегментами пространства 0: (о = [бф (о, е; (i)]. Когда параметр 0 пробегает сегмент т^1 (£), значение тф (£) остается постоянным, а (0) пробегает ту или иную последовательность то- пок фазового пространства X. Поэтому кривые ф Е Л могут рассмат- риваться как запись своеобразных обобщенных процессов с разры- вами первого рода, поведение которых в момент времени t может
392 42. О сходимости А. В. Скорохода быть, вообще говоря, более сложным, чем простой переход из со- стояния f (t — 0) в состояние / (t + 0). Такие обобщенные процессы могут естественным образом возникать в качестве предельных огра- ничений, подобных условию (*) в теореме IV, мешающих сгущению в одной точке t нескольких неисчезающе малых скачков. Возможно что введение такого рода обобщенных процессов окажется полезным в некоторых вполне конкретных исследованиях по предельным свой- ствам случайных процессов. Не развивая этой идеи дальше, я ис- пользую анализ устройства множества Л лишь как вспомогательное средство для доказательства возможности введения в пространстве SD расстояния $* (/, g), отличного от $ (/, g) и превращающего SD в полное метрическое пространство. С этой целью я докажу такую лемму: Лемма. Множество Л является в пространстве Ф множеством типа G&. Доказательство. Легко показать, что при заданных G Г и ф Е Л величина (0* [Тф1 (£)] для всех ф Е Ф одинакова, т. е. характеризует свойства кривой ф, а не ее параметрического представления <р; мы обозначим эту вели- чину через со* (t). Условие (н) (0 = 0 при всех t е Т является необходимым и достаточным для того, чтобы ф ЕЕ А при- надлежала множеству Л. Поэтому л = л\ U Лп, (1) п где Ап есть множество тех Ф ЕЕ Л, для которых sup cot а) _L t(=.T v п ‘ Множество Л замкнуто в Ф по самому определению. Можно дока- зать, что множества Л.п тоже замкнуты в Ф. Из замкнутости множеств Л и An и формулы (1) непосредственно вытекает наша лемма. Из доказанной леммы в силу известной теоремы П. С. Александ- рова вытекает, что в множестве Л можно ввести новое расстояние Р* (Д g), топологически эквивалентное расстоянию p(f, g), но пре- вращающее Л в полное метрическое пространство. Полагая S* (/, g) = Р* (Л g) и вспомнив теорему VI, мы видим, что имеет место
43. Две равномерные предельные теоремы 393 Теорема VII. В множестве D может быть введено расстояние (Л g), топологически эквивалентное расстоянию s (j, g), но превра- щающее D в полное метрическое пространство. Москва, 25 июля 1956 г. ЛИТЕРАТУРА 1. Скороход А. В.— ДАН СССР, 1955, т. 104, с. 364—367. 2. Скороход А. В.— ДАН СССР, 1956, т. 106, с. 781—784. 3. Прохоров Ю. В.— Теория вероятностей и ее применения, 1956, т. 1, № 2. с. 175-237. 4. Дынкин Е. Б.— Изв. АН СССР. Сер. мат., 1952, т. 16, с. 563—572. 5. Урысон П. С. Труды по топологии и другим областям математики. М.: Гостехтеориздат, 1951. Т. 2. 937 с. 43 ДВЕ РАВНОМЕРНЫЕ ПРЕДЕЛЬНЫЕ ТЕОРЕМЫ ДЛЯ СУММ НЕЗАВИСИМЫХ СЛАГАЕМЫХ* Во всем дальнейшем Ф W = Р {I < *}, Fk (х) = Р < х}, где £ = • + In и случайные величины взаимно независимы. Через @ обозначает- ся совокупность вырожденных распределений вида (0 при х^а. Е(х) = {, 4 (1 при х > а, а через 0 — совокупность неограниченно делимых распределений. Целью работы является доказательство следующих двух теорем. Теорема 1. Существует такая константа С, что из Ek (х — I) — е < Fk (х) < Ек (х + I) + е, где Ек ЕЕ к = 1, 2, . . ., п, при любых 8^>0, L^> 21^> 0 и 8 = С шах "|Лlog -у-, 81/5) вытекает существование W ЕЕ 0, для которого цг (х - L) - S < Ф (х) < Т (х + L) + 6. * Теория вероятностей и ее применения, 1956, т. 1, № 4, с. 426—436,
394 43. Две равномерные предельные теоремы Теорема 2. Существует такая константа С, что в случае одинаково распределенных слагаемых с произвольным распределе- нием Fk (х) = F (х) существует ¥ е 6, для которого при всех х | Т (х) - Ф (ж) 1 < СвЛ Доказательство обеих теорем использует ряд идей5 заимствованных из работ П. Леви (см. 11, § 48]), В. Деблина [2] и Ю.В. Прохорова [3], и основано на следующих леммах, в которых Ga 0(х) = -^=- \ е-^-т dx, Ga = Go 0, 1/ 2л б J - r —oo Qf(1) = sup {F (x + I + 0) — F (ж)] есть введенная П. Леви X «функция концентрации» распределения F (ж), а Сх, С2, С3, Cit С5, Св, Ст, С — абсолютные константы. Лемма 1. Если г, г2 log s, еде1 s=S[l-^(HL к то <?Ф (R) < CiR/rVT. Л е м м а 2. | F * Ga - F | < С2 Qf (о). Л е м м а 3. \Ga,s-Ga,a |<c3(s2-o2)/a2- Лемма 4. Если т) = С£-12№, то F * GGia (хI) — П < F (х) < F * Go,а (я + 0 + И- Лемма 5. Пусть п _ Пп(к) а — ГЬа) Чт^..тлп — IL к к 1 Всюду далее в суммах и произведениях П или II* индекс к пробегает к к к все целые значения в пределах 1 к п.
43. Две равномерные предельные теоремы 395 где Рт — 1—Рк пРи пг = О Рк при т=1 , О при m^>i т = ~£г е~1>к’ т ~ °’ • • • В предположении О р^ 1 справедливо неравенство 2 3 * 3 |РтП1.. к Лемма 6. Если 1, то п . т ' т—О Лемма 7. Пусть as = М£к, a2 = Dgj, «=S«k, о2 = 3°$, а* = сг2 + оо. к к Из I Ik I < I, к = 1,-2,. . ., п, вытекает, что при всех х | Ф * G<j0 (ж) — Ga,a* (х) | Доказательство леммы 1 будет опубликовано в другом месте 8. Леммы 2—5 вполне элементарны и их доказательство может быть предоставлено читателю. Лемма 6 принадлежит Ю. В. Прохорову (см. [3]). Лемма 7 легко получается из известной оценки У м I- a J* | Ф (х) - Ga>0 (ж) | < С' * ’j-—, б /г « 2 если дополнительное нормальное слагаемое с дисперсией о0 пред- ставить в виде суммы нескольких нормальных же слагаемых с доста- точно малой дисперсией каждое. 1. Доказательство теоремы!, общая часть. Достаточно доказать теорему для случая непрерывных и строго воз- растающих функций Fk (х). В самом деле, предположим, что е, I и L фиксированы так, что условия теоремы выполнены. Выберем 2 Здесь и всюду далее обозначает суммирование по всем наборам положительных целых тп1? . . ., тп. 3 См.: Kolmogorov A. Sur les proprieties des fonctions de concentrations de M. P. L4vy.— Ann. Inst. H. Poincare, 1958, vol. 16, N 1, p. 27—34.
396 43. Две равномерные предельные теоремы V и L' подчиненными неравенствам L > L' > 21' > 21 и положим в' = 2г. Легко установить, используя лишь качественное содержание леммы 4, что при достаточно малом 5 распределения F/г = Гй * Gs удовлетворяют условиям теоремы при замене 8, I, L на г', Г, L\ Функции Fk (я), как легко доказать, непрерывны и строго возрас- тают. Если для соответствующей функции Ф' = Ф*^- будет доказано неравенство Y (х — Z7) - 6' < Ф' (х) < ¥ (х + L') + 6', где S' = С' max f-rr ~\f log , 8'1/s) , \ Li f I J , то, применяя лемму 4 с о2 = ns2 и I = L — U, легко обнаружит^ что при достаточно малом s и С = 2СГ первоначальная функция Ф {х} удовлетворяет неравенству, являющемуся заключением тео- ремы. Будем в соответствии со сказанным считать функции у (х) непрерывными и строго возрастающими, что позволяет считать об- ратные функции х = Fx1 (у) однозначно определенными для всех у из интервала 0 < у < 1, непрерывными, строго возрастающими и пробегающими все действительные значения х. Положим К (Р) = Рк (1 - Р) - Г^1 (Г). Функции Xfc (Г) будут в сделанных предположениях непрерывными и строго убывающими. Они пробегают все положительные значе- ния X, 0 < % < оо, когда Р пробегает интервал 0 < Р < V2. Обрат- ные функции 8» (%) = V (%) тоже непрерывны и строго убывают: когда X меняется в пределах 0<Х<оо, они пробегают значения Г, заполняющие интервал х/2 > Р > 0. Поэтому если только 3ek(2Z)>2e-V. к (здесь I и 8 — величины, входящие в условие теоремы, причем мы будем далее считать е 1, что, конечно, не нарушает общности),
43. Две равномерные предельные теоремы 397 то уравнение Зе»(Хо)= 2е-‘/. ft имеет единственное решение Ло 2Z, Определим теперь величины Л и а0 следующим образом: А) Если ЗеИ20>28-*/., (АЛ) fc то Л = ч а0 = 2е-*/’Л. (А.2) Б) Если ЗеИ20<2е-‘/% (БЛ) то А = 21, о® = L (log 4)'V‘ • (Б.2) Чтобы определить нужное нам неограниченно делимое распре- деление Т, положим efr = efc (Л) и введем случайные величины _ ( о, если F? (efe) < ^ < F? (1 —ц), ( 1 в остальных случаях. Положим далее ак = М {^t| = 0}, о? = D | = 0), a=S(l—2efc)afc, a2 = 21 (1 — 2es) o£, к к F^ (x) = P < x | = 0), Mx) (x) = P < x | щ = 1). Легко видеть, что ф = П* [28^?’ 4- (1 — 28ft) Fg»] = М П* [|*^> + (1 - Fg»] = к к тх...тп к к
398 43. Две равномерные предельные теоремы где вероятности ртп1...тнп == Р {Hl == ^1» • • • ? Рп == ™П} выражаются формулами из леммы 5, если положить Рк = 2ек. Определив теперь через Рк = 2е& величины qmv..mn формулами из той же леммы 5, положим Т = [ехр 2 2es (F?-E9)] * Ga>o= 2 „JIW П *G<(>0., к к где oj = a2 + a?. В приведенных формулах для Ф и Y через EQ обозначено единичное распределение [ 0 при Ео (»г) ~~ । л \ л v 1 (1 при #>0, а степени понимаются в смысле свертывания: F° = Ео, F1 = F, F2 = F * F и т. д. Очевидно, что при переходе от величины к величинам %>к ~ ак величины а* заменяются на а* = 0, а функции Ф и ¥ на функции ф' (х) — Ф (х+ а), ¥' (х) = ¥ (х + а). Поэтому ясно, что можно ограничиться рассмотрением случая ак == 0, к = 1, . . ., и; а = 0. Нам понадобится еще случайная величина к и ее условные дисперсии = D | Pl = mi,..., щ = тп} при фиксированных значениях величин р^, . . ., рп. Очевидно, что Стр.-ти ==2^|(1 п к Положим теперь 4 Ф^...тя=П* [40) J1-^, aC.mn = П* [Мх> г*. к к 4 Определение функций т предполагает, что т* = 0 или 1. Опредсу ление функций т относится к любым неотрицательным тп^. *’*1 ••• •*•»»
399 43. Две равномерные предельные теоремы Отметив, что Ф ~ 3 Рт1...7ПпФ?п1...?п *ФтП1...?п ? п п п 'J* = 3 *Qst, введем распределения Ф1 ~ Ф * ^<У0 — S Pm-i... ?ппФт1...тп * Ф?П1...тп * ^а0» /»}... И1П Ф2 == S Рт1...тппФ^...п?п * G<Jm т *£<У0, Фз= 3 Рт^. Легко видеть, что в силу условия теоремы efr (21) < 8 и, так как Л 2Z, е» = £» (Л) < 8. В обоих случаях А) и Б) 38S<2e-‘\ к Из (3) и (4) вытекает, что Е8?<2еЧ к При помощи (5) и леммы 5 получим | У—Фз|< |РтП1...тип ' Ят^..тп | Gb 3 Рк === к -4С5Зе2,<8С581\ к В силу леммы 3 в предположении \От,...тп~ 02|<8*Ы имеет место неравенство l^mi...mn*Ga0-GoJ<Ge*4 Поэтому | Ф2 - Ф3 | < С3е*/5 + 22', где S' есть сумма тех ртг... тп, Для которых нарушено (7). Очевидно, что 2' = Р{|р2-а2|>8’^}- (3) (4) (5) (6) (7) (8) (9) неравенство (Ю)
400 43. Две равномерные предельные теоремы где р2 = S (1—н») о?- к Легко видеть, что МР2 = 3(l-2eft) 4= о2, к Dp2 = S2eft(l-2ek)4, к и так как о2 < Л2, е, то Dp2 < 2е 2 (1 — 2efc) <т£ < 2еА2 3(1- 2efe) о? = 2еЛ2а2. к к Из (10) — (12) по неравенству Чебышева получаем 2еЛ2з2 <2 3/5 Л2 8 °* °о Так как всегда о0 > Л, 83/з 81/з, из (9) и (13) вытекает В силу леммы 7 и того обстоятельства, что в случае имеет место неравенство (И) (12) (13) (14) Рк = 1 справедливо неравенство | Фтр..тпп * Л - из которого вытекает неравенство I Ф1 - Ф21 < С7 Л/о0. Из (6), (14) и (16) получаем | Т - Фх | < + С7Л/о0, где С* = 8С5 + С3 + 4. 2. С л у ч а й А. Окончание доказательства теоремы 1 но в случаях А) и Б). Займемся сначала случаем А). В этом случае неравенство (17) в силу (А.2) приобретает вид (15) (16) (17) различ- (18) Напомним, что теперь Л = А-р 2Z, 3 гк = 3 (^о) = 28“% к к (19) (20)
43. Две равномерные предельные теоремы 401 '------------------\ - \ Легко видеть, что 1 - 2es < (Л) < 1 - ед (21) и, следовательно, величина s=S[i-^(A)] fc=l допускает оценки 2e"4/s < s< 4e_4/s. (22) В силу 5 леммы 1 и формул (22) и (А.2) ()ф(тв)<-^<2С,16*/.. (23) Ays По лемме 2 из (23) получаем I Ф - Фг | = I Ф - Ф Ж Ga. I < С£Ф (а0)К 2 С1С2е’А. (24) Из (18) и (24) получаем, наконец, | ф - v | < (С* + С7 + 2GG) &К (25) Из (25) уже непосредственно вытекает (для случая А)) заключение теоремы, причем сдвиги на расстояние L остались неиспользован- ными: они понадобятся лишь в случае Б). 3. Случай Б. В этом случае в силу (Б.2) неравенство (17) приобретает вид |т—ФхКС^ + г’л^З-j/iogA. (2б> По лемме 4 в силу (Б.2) при n = Qe'L2/2a« = ('/« = G 4- (27> имеют место неравенства Ф! (х - L) - я < Ф (х) < Фг (х + L) 4- т). (28) Положим теперь С = C# + 23/2 Ci + 2СхС2 + C4/log 2. Так как L > 21, log (L/l) > log 2, из (26) и (28) получаем при 6 = С max jZlog -у-, e‘/s) 5 Легко подсчитать, что в силу (А. 2), (22) и принятого ограничения е 1 Дополнительное условие R2 г2 log $ для R = о0 и г = А выполнено.
402 43. Две равномерные предельные теоремы ---------------------------------------------------------------- / неравенства Т (х - L) - 6 < Ф (х) < ¥ (х + L) + б. (29) Как видно из неравенства (25), неравенство (29), доказанное сей- час для случая Б), верно и в случае А). Этим заканчивается доказа- тельство теоремы 1. 4. Доказательство теоремы 2. Доказательство теоремы 2 по существу не отличается от доказательства теоремы 1 в варианте А, причем полагается 8 = с/п. Естественно, что и р^ = 2е& теперь не зависят от к. В силу соот- ношения = 2е-*1^ к pk должны быть равны р = с'п~Ч*. Вводимое построение с переходом от Ф к Ф' = Ф * делается теперь излишним и даже несколько затруднило бы полу- чение окончательного результата. Ссылку на лемму 5 целесообраз- но заменить ссылкой на более простую лемму 6. Ввиду возможности указанных упрощений мы даем далее изложение доказательства теоремы 2, независимое от п. 1, 2. Общую функцию распределения слагаемых будем обозначать F (х) = Р {£& < х}. Условия F (у)) < у < F (F-1 (у) + 0) определяют обобщенную обратную функцию F”1 однозначно, кроме не более чем счетного множества у, соответствующих интервалам постоянства функции F. Можно без ограничения общности считать что ь = ы, где случайные величины взаимно независимы и распределены равномерно на интервале 0 < у < 1. Положим р = г12гг\ | 0, если р/2 1 — р/2, Цъ = { . I 1 в остальных: случаях, а = (1 — р) М {gk | = 0}, о2 = (1 — р) D | ик = 0}, Fo (ж) = Р < х | ц» = 0}, Ч (х) = Р < х | = 1}.
43. Две равномерные предельные теоремы 403 _ — — \______________________________________________________— Легко видеть, что ф = М П* [И,л + (1 - nJ Fo] = 2 С*р* (1 - РГ* 4 *П*- к к Искомое неограниченно делимое распределение Т зададим в виде к где = no2 + о02, а02 = 2п'лЛ, Л = F-1 (1 — р/2) — F"1 (р/2). Как и в п. 1, достаточно рассмотреть случай а = 0. Положим Ф1 = ф * G0o = £ Скпр* (1 - py-*Fl * F^* * к Ф2 = У, С*рк (1 - р)”~* 4 * GOk * (?<,„ oi = о2, к Фз = 2^У(1-рГаХ*со.. , к В силу леммы 6 | Т - Ф3 | < С.р - х/2 С6п~'\ (30) В силу леммы 3 в предположении I к — п|^п4/5 (31) I 1 — Р I имеет место неравенство | G<yk ♦ G0o — Gg* I G^~1/5, (32) и, следовательно, |Ф2-Ф3|<С3п-1а + 22', (33) где S' есть сумма тех С*рк (1 — р)п~\ Для которых нарушено не- равенство (31). Очевидно, что 2' = р {| X ~ п (! — Р) 1 > п</5>’ где % = S pfe. Поэтому в силу неравенства Чебышева X' < < п-А < и-*Л. (34) п‘ъ • п Из (33) и (34) получаем I ф2 - Фз [ < (Сз + 2)n--A. (35) В силу леммы 7 так как при = 1 при принятом предположении а = 0 имеет место неравенство | | Л, то справедливо неравенство I FV GO0 - GOk * Gao | < GA/ao =
<404 44. Случайные функции и предельные теоремы из которого вытекает I Ф1 - Ф2 I < х/2 Cin-'K Легко видеть, что Qf (Л/2) < 1 - р/2. В силу леммы 1 отсюда следует ^ф(а0)<-^Ц=-=4С1п-’А. Л у пр/2 В силу леммы 2 из (37) вытекает | Ф - Фх | < С£Ф (ст0) < 4 СХС2 п-*А. Из (30), (35), (36), (38) получаем | Ф - Т | < (Св/2 + С3 + 2 + Ci/2 + 4 СХС2) чем и заканчивается доказательство теоремы 2. Москва, 12 ноября 1956 г. ЛИТЕРАТУРА (36) (37) (38) 1. Levy Р. Theorie de 1’addition des variables aleatoires. Paris: Gauthier — Vil- lars, 1937. 2. Doeblin W. Sur les sommes d’un grand nombre des variables aleatoires inde- pendantes.— Bull. sci. math., 1939, vol. 63, p. 23—32; 35—64. 3. Прохоров Ю. В. О суммах одинаково распределенных случайных величин.— ДАН СССР, 1955, т. 105, № 4, с. 645-647. 44 СЛУЧАЙНЫЕ ФУНКЦИИ И ПРЕДЕЛЬНЫЕ ТЕОРЕМЫ** 1 * * IV Совместно с Ю. В. Прохоровым Не претендуя на полноту охвата литературы вопроса, мы на- мерены, кроме сообщения некоторых сравнительно новых резуль- татов, осветить первые шаги теории случайных функций, основные возможные способы ее систематического построения и основные воп- росы применения функциональных методов к получению предель- ных теорем. * Zufallige Funktionen und Grenzverteilungssatze.— In: Bericht iiber die Tagung Wahrscheinlichkeitsrechnung und mathematische Statistik. Berlin, 1956, S. 113—126. Перевод авторов. 1 Доклады A. H. Колмогорова и Ю. В. Прохорова, прочитанные на конфе- ренции, близки к докладам М. Фреше и Р. Форте. В докладе А. Н. Колмогорова, сделанном в последний день работы конференции, были изложены новые ре- зультаты, полученные Ю. В. Прохоровым в промежуток времени между его докладом и докладом А. Н. Колмогорова. Ввиду этого авторы сочли уместным передать для публикации объединенный текст своих докладов. § 4 (без теорем IV и V) и § 6 воспроизводят доклад Ю. В. Прохорова, а § 1—3, 5 и теоремы IV и V из § 4 составили доклад А. Н. Колмогорова. Теоремы IV и V из § 4 были до- казаны Ю. В. Прохоровым после его доклада и перед докладом А. Н. Колмо- горова.
44. Случайные функции и предельные теоремы 405 § 1 ПРЕДВАРИТЕЛЬНЫЕ ЗАМЕЧАНИЯ О СЛУЧАЙНЫХ ЭЛЕМЕНТАХ ЛЮБОЙ ПРИРОДЫ Мы будем исходить из аксиоматики теории вероятностей, изло- женной в [1]. Полем вероятностей будем называть совокупность {О, Ф, Р}, состоящую из 1) множества Q, элементы которого со называются «элементар- ными событиями», 2) оалгебры Ф подмножеств множества Q, 3) определенной на Ф меры Р (А), удовлетворяющей дополни- тельному требованию Р (А) = 1. (Терминология соответствует [2].) Иногда целесообразно при- нять еще допущение (со') Мера Р (А) полна, т. е. из Р (А) = 0, В сс А вытекает В е Ф. Целесообразно при изучении случайных величин, случайных векторов и других «случайных элементов» той или иной конкретной природы оставлять природу основного множества элементарных событий со неопределенной, а конкретные случайные элементы g считать функциями от со. Например, (действительной) случайной величиной принято называть любую действительную функцию g©, удовлетворяющую тому условию, что множество {со; < а} при любом действительном а принадлежит Ф (см. [1]). Произвольная функция go со значениями из множества X оп- ределяет поле вероятностей {X, Ф^, Р%}, где Ф^ состоит из всех 4 С I, для которых Г1 (А) е Фл и на Фа Pi (А) = р {Г1 И)}. Так как в каждой задаче теории вероятностей основное множество Q считается вполне определенным и в то же время сами его элементы со не входят явно в формулировки конкретных задач, то индекс со при go обычно не пишут, говоря просто о «случайном элементе g множества X». Заметим, что в предположении (со') автоматически будет выполнено условие (gj Если Р% (А) = 0, ВС А, то В Е Ф^. Если X является топологическим пространством, то естественно требовать от случайного элемента g Е I, чтобы некоторые простей-
406 44. Случайные функции и предельные теоремы шие с топологической точки зрения множества А cz X заведомо входили в Ф^. Если X есть метрическое пространство (этот случай будет для нас иметь основное значение далее), характер целесооб- разных требований этого рода не возбуждает сомнений. Именно целесообразно ограничиться рассмотрением случайных элементов, подчиненных условию (^) Любое открытое множество G £ X принадлежит Ф^. Как известно, из (£2) вытекает принадлежность к Ф| любого борелевского А с X. Если X есть действительная прямая, то (g2| равносильно высказанному ранее требованию, включаемому обыч- но в определение случайных величин. Ряд упрощений возникает в случае, когда, кроме того, выполнено условие (£3) Для любого А ЕЕ Ф| (Л) = inf Pg (G), G^A где нижняя грань берется по всем открытым G, содержащим А. Для того чтобы (^3) имело место для любого подчиненного (|2} случайного элемента | из сепарабельного полного метрического пространства X, необходимо и достаточно, чтобы было выполнено требование (со") Мера Р на й совершенна (см. [3]). Вопрос о целесообразности систематического построения теории вероятностей с исключительным употреблением совершенных мер может оставаться дискуссионным до тех пор, пока такое системати- ческое построение не будет осуществлено. Однако следует отметить, что это ограничение в действительности нисколько не сужает области возможных реальных применений теории вероятностей, так как имеет место такая теорема: любая полная нормированная булев- ская алгебра может быть реализована, как алгебра метрических типов совершенной меры (ср. [4]). Требования (g2) и (£з) могут обобщаться в различных направле- ниях для топологических пространств более общей природы (ср. [2, § 52-54]). § 2 СЛУЧАЙНЫЕ ФУНКЦИИ Для определенности будем рассматривать комплексные функции х (t) аргумента t GE Г, где Г, вообще говоря, произвольное множе- ство (наиболее изучены здесь «случайные процессы», когда Т есть действительная прямая). Возможны два подхода к введению поня- тия «случайной функции» такого рода. (I). Случайной функцией £ (£), определенной на называется система комплексных случайных величин g (0, определенных при каждом t ЕЕ Т. Если при этом основное поле вероятностей {Q, Ф, Р} удовлетворяет условию (со'), то распределения Р^, так же как и
44. Случайные функции и предельные теоремы 407 тг-мерные распределения Рцы, vts), %(tny удовлетворяют условиям &) и (U (II). Заранее выбирается некоторое функциональное простран- ство S, состоящее из функций х (£), определенных на Т, в котором вводится определенная метрика (расстояние, удовлетворяющее обыч- ным аксиомам метрического пространства). Случайной функцией g (f) типа S называется случайный элемент метрического простран- ства @, удовлетворяющий условиям (|х) и (g2). Систематическое изучение случайных функций в одном весьма важном частном случае было начато Н. Винером в 1923 г. (см. [5]). Первая из изложенных выше концепций с большой широтой раз- вивалась Е. Е. Слуцким начиная с 1928 г. (см. [6]). Вторая концеп- ция для произвольных банаховских пространств разрабатывалась В. И. Гливенко с 1928 г. (см. [7—9]). С обширной дальнейшей ли- тературой можно познакомиться по современным изложениям воп- роса в [10, 11]. Если пространство @ таково, что при любом tQ Т и любом от- крытом множестве G на комплексной плоскости множество {х (0 : х (t0) е G} (1) тех функций х (t), для которых х (tQ) принадлежит G, является бо- ре левским множеством пространства S, то каждой . случайной функции в смысле (II) очевидным образом соответствует случайная функция в смысле (I). Для случайной функции в смысле (I) можно поставить обратную задачу о возможности рассматривать такого рода случайную функ- цию % (£), как принадлежащую по существу к какому-либо опре- деленному функциональному пространству @ (например, в случае отрезка [а, Ь] в качестве множества Т — к пространству Q«,b] не- прерывных комплексных функций с метрикой Р (я (0, У (0) = max I х (t) — у (t) |). Можно придать этому вопросу точный смысл при помощи понятия эквивалентности случайных функций в смысле (I). Две случайные функции gj (t) и £2 (0 (в смысле (I)) называются эквивалентными, если при любом i Е Т р {11 (0 =# Ъ (*)} = 0. (2) Вопрос, поставленный выше, можно теперь интерпретировать так: Дана случайная функция (t) в смысле (I) и пространство S, удов- летворяющее требованию борелевской измеримости множеств (I); спрашивается, существует ли случайная функция £2 (i) типа @, для которой выполнено при любом t ЕН Т условие (2). С точки зрения применений такой подход к делу, развитый Е. Е. Слуцким (см. [12, 13]), является, по-видимому, вполне достаточным и позволяет обой- ти ряд теоретико-множественных сложностей, о которых будет ска
408 44. Случайные функции и предельные теоремы зано далее в § 3. Практически наиболее интересны вопросы о воз- можности считать случайную функцию: а) непрерывной, б) имею- щей разрывы только первого рода. В первом направлении давно известен (см. [12]) следующий результат А. Н. Колмогорова: для того чтобы заданная на Т — [а, &] случайная функция g (t) в смысле (I) была эквивалентна случайной функции g* (t) типа С[а,ь], До- статочно условие М | l(t + т) - ИО Г < К I т 1“ (3> при некоторых а > 0, а > 1 и К. При этом функция g* (0 оказы- вается с вероятностью единица удовлетворяющей при любом б > 0 * условию Липшица |5*(« + т)-?*(0|<л:*|т|~"в, (4) где А* есть случайная величина. (Заметим еще, это будет исполь- зовано в § 6, что для любого 8 > 0 можно найти такое К*, зави- сящее только от 8, б, а, а, К, что Р {К* > К*} < е.) Условия для возможности представить себе функцию g (t) как функцию, имеющую только разрывы первого рода, особенно сущест- венны в случае, когда g (i) есть запись хода марковского процесса. Из новых работ на эту тему укажем работы Дынкина [14] и Кин- ни [15]2. Как известно, ряд важных функциональных пространств имеет своими элементами не индивидуальные функции, а метрические типы х (t) таких функций относительно меры р,, введенной в Т (мет- рическим типом называется класс всех функций, отличающихся лишь на множестве ц-меры нуль от некоторой фиксированной функ- ции х (t)). Мы будем предполагать, что для функций х (t) разумным образом введено понятие асимптотической непрерывности в точке t0 так, что по метрическому типу х (t) однозначно определяются в поч- ти всех точках t0 ЕЕ Т «истинные значения» функции х (t) по асимп- тотической непрерывности, причем рассматриваемое пространство @ таково, что истинные значения случайной функции типа 6 в тех точках, где они определены с вероятностью единица, являются слу- чайными величинами. В такой обстановке может быть в несколько видоизмененной форме поставлена и решена та же проблема соотно- шения между двумя понятиями случайной функции (I) и (II). При подходе (I) естественно требовать теперь задания случайных вели- чин g (t) лишь почти всюду на Т и считать две случайные функции в смысле (I) gx (t) и g2 (0 эквивалентными, если при почти всех t выполняется условие (2). Тогда каждой случайной функции g* (t) в смысле (II) соответствует вполне определенная с точностью до эквивалентности случайная функция g (t) в смысле (I), равная при почти всех t с вероятностью единица истинному значению g* (t) 2 См. также более позднюю работу: Ченцов Н. Н.— Теория вероятностей и ее применения, 1956, т. 1, с. 155—161.— Примеч. ред.
44. Случайные функции и предельные теоремы 409 в точке t. Полное решение обратного вопроса об условиях, при ко- торых случайная функция в смысле (I) эквивалентна измеримой функции, было дано в работе Амброзе [16] для случая, когда Т — действительная прямая и ц — лебегова мера. Необходимое и доста- точное условие состоит здесь в том, чтобы g (t) была почти всюду (по р) асимптотически стохастически непрерывна. Если это условие выполнено, то можно перенести рассмотрения в пространство S измеримых функций (точнее, в пространство метрических типов) п уже без принципиальных затруднений вычислить вероятность суммируемости функции £ (£), ее суммируемости в квадрате, «су- щественной ограниченности», и т. п. § 3 КОНЕЧНОМЕРНЫЕ РАСПРЕДЕЛЕНИЯ ЗНАЧЕНИЙ СЛУЧАЙНОЙ ФУНКЦИИ Вернемся к случайным функциям % (t) в смысле (I), определен- ным при всех t ЕЕ Т. Каждая такая функция g автоматически опре- деляет поле вероятностей {Qy, Ф^, Р%}, где йг — множество всех комплексных функций, определенных на Т. Формула ак = х (£&), к — 1, 2, . . ., п. определяет отображение ...>tn (я) множества Йт в п-мерное комплексное векторное пространство векторов а == {аь а2, . . ., ап}. Каждой случайной функции % (t) соответствует в силу этого ото- бражения при фиксированных t2, . . ^.случайный вектор aL*2, ...» fn- Обычно в конкретных задачах о случайных функциях большую роль играют соответствующие распределения pl,i....tn(5) = P{<t2,...,fne5}. Так как Ptut2,...,tn заведомо определено для борелевских мно- жеств 5, то Р% определено для их прообразов в йг: В' = ,tn (В). Это так называемые борелевские цилиндрические множества в йг. Борелевское замыкание системы таких множеств (наименьшую содержащую их о-алгебру) обозначим через Фу. Очевидно, что для любой случайной функции % (t) имеет место включение Ф& Э Фг. Значения Р% (В) для В ЕЕ Фг определяются однозначно по ко- нечномерным распределениям. Еще в [1] было доказано, что, об-
410 44. Случайные функции и предельные теоремы ратно, произвольным «согласованным» конечномерным распредели ниям Ptu t2,t , заданным для всех конечных систем элементов t2, . . tn из Т и определенных на борелевских множествах в тг-мерных комплексных векторных пространствах, соответствует поле вероятностей {QT, Фг, Р*}. Лишь небольшим видоизменением этого результата является такая формулировка: если распределения Pi1} f2,.,.it определены для всех конечных систем элементов из Тг согласованы и удовлетворяют условиям (£2) и (£3), т0 существуют случайные функции £ (t) в смысле (I) с f2,..., tn=Ptut2,... ,tn - Существенно, однако, что за пределами Фг функция уже^ вообще говоря, ' однозначно по конечномерным распределениям Pfp е2,...л не определяется. Между тем класс Фу слишком узок для применений: в него не входит в случае несчетного Т множество функций х (t), которые при всех t—Т удовлетворяют условию | х (О к к. или в случае Т = [a, fe] множество С непрерывных функций и т. п. При переходе к концепции (II) во всех изученных, практически важных случаях однозначность определения Р$ по конечномерным распределениям Ptvt^ ...,tn восстанавливается (смысл этого утвер- ждения для пространств 6, состоящих из метрических типов £ (/), а не из индивидуальных функций, требует некоторого уточнения^ которым мы здесь заниматься не будем) и в то же время при надле- жащем выборе пространства € все нужные для конкретных задач множества оказываются принадлежащими Ф^. § 4 СЛАБАЯ СХОДИМОСТЬ РАСПРЕДЕЛЕНИЙ В настоящем параграфе мы ограничимся рассмотрением случай- ных элементов принимающих значения из полного сепарабельного метрического пространства X и удовлетворяющих условиям (£2) и (£3). При изучении последовательностей U U , Iп? • • • случайных элементов из X возникает вопрос о сходимости соответ- ствующих распределений Р^п к некоторому распределению Р в X. Под сходимостью здесь естественно понимать обычную для функцио- нального анализа «слабую сходимость» распределений. Напомним, что последовательность Рп распределений в X слабо сходится к распределению Р, если для любого непрерывного и ограниченного на X функционала / (х), х ЕЕ X, $ f(x)dPn-^ f(x)dP. X X
44. Случайные функции и предельные теоремы 411 Если X есть числовая прямая, то слабая сходимость оказывается эквивалентной хорошо известной сходимости «в основном» соответ- ствующих функций распределения. Слабую сходимость распределе- ний мы будем обозначать Рп=? Р. Смысл слабой сходимости в до- статочной степени поясняется следующими двумя теоремами, из которых первая хорошо известна, а вторая просто доказывается. I) Для сходимости Рп=? Р необходимо и достаточно, чтобы РП(Л)->Р(4) для любого множества Л, P-мера границы которого равна нулю (т. е. для любого множества непрерывности распределения Р). II) Для сходимости Рп=$Р необходимо и достаточно, чтобы для любого непрерывного почти всюду (по мере Р) функционала / (х) последовательность функций распределения F^ (а) = Рп {x:f (х) < а} сходилась к функции распределения Ff (а) = Р {*4 (*) < а} в каждой точке непрерывности этой последней. Пусть теперь & • • м • • • — последовательность случайных элементов из X, для которой Р^Р* (5) Пусть, далее, П; Яъ Пп? • • • — последовательность случайных элементов из полного метриче- ского пространства У, причем ц = f (£) и цп = fn (Ы, гДе / и fn — непрерывные отображения пространства X в пространство У. Тогда при достаточно широких предположениях (например, в предполо- жении, что fn-+ f равномерно на каждом компакте К CZ X) из (5) следует РПп ==> Р^. Это простое замечание оказывается полезным при выводе целого ряда конкретных предельных теорем. Наконец, при изучении предельных теорем для последователь- ностей случайных элементов известную пользу может принести (см. 117]) теорема: III) Для компактности семейства ® распределений в X доста- точно 3, чтобы при любом 8 > О существовал компакт Кг такой, что Для всех Р СЕ Р (Х8) >1-8. 3 Ю, В. Прохоров доказал и необходимость этого условия.
412 44. Случайные функции и предельные теоремы Рассмотрим пример, иллюстрирующий теорему III). Известно что для компактности множества К CZ С, где С — пространство непре- рывных на отрезке [0, 1] функций х (t) с х (0) = 0, необходимо и достаточно существование функции <р (т), стремящейся к нулю при т ->• 0, для которой sup I X (t + т) X (t) I < ф (т). t,x^K Используя теперь условия непрерывности случайного процесса с вероятностью единица (см. формулы (3) и (4) из § 2), мы получаем следующее достаточное условие компактности семейства SOJ распре- делений в С: Существуют постоянные а > 0, а>1, К>0 такие, что для всех Ре® МР Ц (t + т) - ИО |° < К I т 1% £(0) = 0, где через МР g обозначается с Иногда удается сравнительно просто установить, что имеет место сходимость рп (Л) р (Л), л е s, (6) для какой-либо специальной системы £ подмножеств множества X. Из сходимости (6) можно выводить слабую сходимость Рп Р, пользуясь, например, следующими теоремами. IV) Назовем систему S подмножеств X «системой однозначно- сти», если заданием на ней всякое распределение Р в X однозначно определяется. Для сходимости Рп=$ Р необходимо и достаточно, чтобы выпол- нялись следующие два условия: а) Рп (А) Р (Л) на некоторой «система однозначности» 5; б) семейство {Рп} компактно. Из этой теоремы вытекает, например, что если последовательность определенных на отрезке 1а, Ь] процессов {gn (t)} такова, что: а) конечномерные распределения процессов 1*п (t) сходятся к конечномерным распределениям некоторого процесса g (t); б) существуют не зависящие от п постоянные а, а, К {а > 0, а > 1, К >> 0) такие, что м [ In (t + т) - L (0 I* < К I т |« то для соответствующих распределений в С[а,ъ] имеет место сходи- мость р1-
44. Случайные функции и предельные теоремы 41& V) Пусть S — система открытых множеств А £ X, обладающая, свойствами: a) S есть базис в X, б) из 5 и Л2Е 5 следует Q 42Е 5. Тогда из сходи- мости Рп(А)-+Р (Л), A^S, вытекает Рп=*Р. Примеры, иллюстрирующие применение изложенных выше- общих результатов, читатель найдет в заключительном_параграфе работы. § 5 ХАРАКТЕРИСТИЧЕСКИЕ ФУНКЦИОНАЛЫ Если % есть случайный элемент из банаховых пространств4 X, то для соответствующего распределения Р% может быть определен аналог обычной характеристической функции — характеристический функ- ционал. Для любого элемента / пространства X*, сопряженного к X, определим значение характеристического функционала Н фор- мулой //(/, Р^)= \ e^^dP^. х Это определение и основные свойства характеристических функцио- налов были указаны в заметке А. Н. Колмогорова [18]. В последнее время интерес к распределениям в функциональных пространствах значительно возрос и аппарат характеристических функционалов, по-видимому, будет находить все более широкие применения как в самой теории вероятностей, так и в некоторых вопросах математи- ческой физики (см., например, работу Э. Хопфа [19]). Ввиду этого* мы считаем полезным обратить внимание на результаты заметки [181. и отметить некоторые связанные с ней нерешенные проблемы. В [18]. установлено, в частности: 1. Р^ по Н (f, Р%) определяется однозначно. 2. При сложении независимых случайных элементов со значе- ниями из X соответствующие характеристические функционалы! перемножаются. 3. Если Pn+i = $ |] я l|n+1 dP% < + оо, х 4 В дальнейшем мы ограничимся случаем сепарабельных пространств.
414 44, Случайные функции и предельные теоремы ТО я (/, р5) = 1 + м/ + X М (/,/) + ... + X М (/,...,/) + где М(/ь/2,...,/п) = $ h&...fndPt х — полилинейные функционалы, являющиеся естественным обоб- щением моментов. Очевидно, что функций м (Л, /2, ..А) однозначно определяются по Н (/, Р%). Для целей теории вероятностей существенно было бы иметь не- обходимые и достаточные условия слабой сходимости распределе- ний в терминах соответствующих характеристических функциона- лов. Однако такого рода условия пока неизвестны. Некоторые воз- можности использования характеристических функционалов для вывода тех или иных предельных теорем исследованы в работе Р. Форте и Э. Мурье (см. [20—23], а также доклад Р. Форте на настоящей конференции). Здесь мы отметим лишь следующий, вытекающий из теорем III) и IV) § 4 результат. Пусть X — сепарабельное пространство Банаха и {Рп} — по- следовательность распределений в X. Для сходимости Рп^Р необходимо и достаточно одновременное выполнение двух условий: а) Н (f, Рп) Н (/, Р) при каждом / G X*; б) для любого 8> 0 существует компакт Къ такой, что при всех п Рп (Кг) >1-8. Новые стороны приобретает в бесконечномерном случае и вопрос об условиях, достаточных для того, чтобы функционал Н (/) был характеристическим. Мы ограничимся здесь лишь следующим за- мечанием. Естественно в соответствии с [18] назвать распределение Р в X нормальным, если его характеристический функционал имеет вид где mf — линейный функционал от /, a Q (/) — квадратический. В случае пространства Гильберта это приводит к формуле где т — элемент пространства X и S — симметрический ограничен- ный линейный оператор, заменяющий матрицу вторых моментов-
44. Случайные функции и предельные теоремы 415 Однако условие неотрицательности (A Sf) > о, достаточное для получения характеристической функции в конеч- номерном случае, здесь уже не является достаточным5. В частности^ получающийся при т — 0, Sf = / функционал Н (/) = е~Ч* не является характеристическим. Отметим еще, что приведенные в [23] необходимые и достаточные условия того, чтобы функционал был характеристическим, вряд ли могут считаться окончательными вследствие их значительной сложности6. § 6 ПРИМЕНЕНИЯ К ПРЕДЕЛЬНЫМ ТЕОРЕМАМ 6.1 Переход от сумм случайных величин к процессам. Пред- ставление о том, что предельные распределения для сумм случай- ных величин являются точными для надлежаще подобранных слу- чайных процессов, сложилось уже давно (см., например, [25—29] и особенно монографию А. Я. Хинчина [30]). Здесь же будут приве- дены результаты некоторых более новых работ, примыкающих к этому кругу вопросов. Отметим при этом, что при постановке и решении задач о переходе от сумм случайных величин к процессам в наибо- лее общей форме использование методов, по существу относящихся к функциональному анализу, представляется неизбежным. Пусть L, 1? £п,2, • • •? £п,п — случайные величины с математическими ожиданиями равными нулю, и конечными дисперсиями Dgnb удовлетворяющими условию = к=1 Обозначим через = £п,1 + Вп,2 + . . . + А = 1, 2, . . ., п, (7) «накопленные суммы» случайных величин £пд и через tntn обозначим Последовательности сумм{$п<^}, k = 1, 2, . . ., n, сопоставим слу- чайный элемент пространства С непрерывных на отрезке [0, 1] и 5 Оно достаточно при условии конечности следа S (последнее условие » Необходимо).— Примеч. ред. 6 Современное состояние вопроса отражено в книге: Вахания Н. Н., Та- Риеладзе В. ИЧобанянС.А. Вероятностные распределения в банаховых Пространствах. М.: Наука, 1985.— Примеч. ред.
416 44. Случайные функции и предельные теоремы равных нулю при t = 0 функций х (t), полагая при tn^ t <Z (^) = sn, к 4~ 7-— ^п, £+1* *п,к+1 1п,к Можно показать (см. [17]), что если суммы snn подчиняются условию Линдеберга, которое встречается в обычной центральной предель- ной теореме, то при п —> оо (8) где g (t) есть так называемый винеровский случайный процесс, т. е. непрерывный с вероятностью единица процесс, удовлетворяющий условиям: 1. £ (0) = 0 с вероятностью единица. 2. Приращения £ (t) на непересекающихся интервалах независимы. 3. | (t + А) — § (t) имеет нормальное распределение со сред- ним 0 и дисперсией А. Из (8) и теоремы II) § 4 можно вывести целый ряд предельных соотношений. Так, например, рассматривая функционал / (х) = шах х (t), x(t) С, •мы получаем при а > 0 Р { max gn (t) > а} — Р {max > а} -» Р { max g (t) > a} = oo = 2 fl----^e^du], I /2 л J J а Пусть a (t) и b (t) — заданные для 0 < t 1 непрерывные •функции, для которых а (0) < 0 < Ь (0), а (/) Ь (£)• Рассматривая •функционал / (х), который равен единице, если при всех t a (t) <Z < х (t) < b (i), и который равен нулю в других случаях, мы на- ходим Р {при всех t a (i) < (t) < 6 (£)} ->• -* P {при всех t a (t) < | (£) < b (£)} л, следовательно, P {при всех к a (tn,k) < sn, k < b (tn,k)} -> P {при всех t a (t) <Z £ (t) < b (t)}. Последний результат при несколько иных предположениях был по- лучен А. Н. Колмогоровым в 1931 г. (см. [28, 29]). Сделанное заме- чание позволяет нам получить аналогичные предельные соотноше- ния для совместного распределения любого конечного числа функ- ционалов , например, Р{ minsn,fc<#, max <z/} —> Р {min max %(tXy}.
44. Случайные функции и предельные теоремы 417 Утверждение (8) содержит в себе в качестве частных случаев теоремы Эрдеша, Каца и Донскера (см. [31—33]) относительно схо- димости распределений функций от «накопленных сумм» к распре- делениям соответствующих функционалов от винеровского процесса. Метод Эрдеша и Каца в окончательной форме, приданной ему Дон- скером [33], сводится к тому, что сначала устанавливается сходи- мость Pln(A)^P^{A) (9) для «полос», т. е. для множеств А, элементы которых удовлетво- ряют при всех t неравенствам a (t) < х (t) < Ъ (i), где a (t) и Ъ (t) — ступенчатые функции (см. рисунок). Затем, аппроксимируя надлежащим об- разом непрерывные почти всю- ду по мере функционалы f характеристическими (в смысле теории множеств) функциона- лами «полос», Донскер уста- навливает сходимость функций < а} к функции распределения F< (а) = Р {/ (£) < а}, что в силу теоремы II) § 4 равносильно слабой сходимости (8). Для перехода от (9) к (8) может здесь также служить теорема V) § 4, поскольку система S всех «полос» удовлетворяет условиям этой теоремы. Дру- гой метод доказательства соотношения (8), опирающийся на тео- рему III) § 4, изложен в [17]. Замечание. Известно, что так называемый метод верхних и нижних функций (см. [30]) для случая, когда процесс (t) по- строен по «накопленным суммам» независимых или связанных в цепь Маркова слагаемых, а процесс g (t) — надлежаще подобран- ный марковский процесс, удовлетворяющий дифференциальным уравнением Фоккера—Планка, позволяет получать утверждения следующего типа: для любых кусочно гладких функций a (t) и b (t) Р {при всех t a (0 < %п (t) < b (t)} -> Р {при всех t a (t) (t) < b (t)}. (10) Очевидно, что применение теоремы III) § 4 позволяет из сходи- мости (10) заключить о слабой сходимости Pzn=?P^. Метод верх- них и нижних функций в настоящее время с успехом применяется И. И. Гихманом [34—3QJ, решившим с его помощью ряд задач, относящихся к суммам случайных величин, а также ряд задач ма- тематической статистики (см. ниже). 6.2. Приближение эмпирического распределения к теоретиче- скому. Пусть % — случайная величина с равномерным на [0, 1] 14 А. Н. Колмогоров
418 44, Случайные функции и предельные теоремы распределением вероятностей, Fn (t) — эмпирическая функция рас- пределения, построенная по п независимым наблюдениям величины I, и In (0 = (Рп (t) — t) VП, 0 < t < 1. Обозначим через £ (t) непрерывный с вероятностью единица гаус- совский процесс (т. е. процесс, у которого все конечномерные рас- пределения гауссовские) с корреляционной функцией М {| (0, | (5)} = t (1 - 5), 0 < t < s < 1. Нетрудно показать, основываясь на многомерной теореме Лап- ласа, что конечномерные распределения процесса |n (t) сходятся при п оо к конечномерным распределениям процесса % (t). Отсюда оказывается возможным вывести сходимость распределе- ний / (gn) к распределению / (|) для широкого класса функционалов. Для этой цели пригодны все методы, излагавшиеся выше в п. 6.1 (см., например, работы Донскера [45], Гихмана[38], Форте и Мурье [23]. В работе [23] используется метод характеристических функцио- налов, при этом |п и | рассматриваются как случайные элементы в пространстве L2 [0,1]. Работа Донскера [45] близка к работе того же автора, о которой шла речь в п. 6.1). Опираясь на этот результат, можно получить целый ряд новых непараметрических критериев (см., например, [46]), обобщающих известные критерии Колмогорова [42] и Смирнова [43, 44]. ЛИТЕРАТУРА 1. Колмогоров А. Н. Основные понятия теории вероятностей. М.; Л.: ОНТИ, 1936. 2. Халмош П. Теория меры/Пер. с англ. М.: Изд-во иностр, лит., 1953. 3. Гнеденко Б. В., Колмогоров Л. Я. Предельные распределения для сумм независимых случайных величин. М.: ГТТИ, 1949. 4. Kolmogoroff A. Algebres de Boole metriques completes.— In: VI Zjazd Mate- matykow Polskich. Warszawa, 1948, p. 22—30. 5. Wiener N.— Publ. Mass. Inst. Techn., 1923, vol. 2, p. 60. 6. Slutsky E. E.— C. r. Acad. sci. Paris, 1928, vol. 187, p. 370—372. 7. Glivenko V. I,— Atti Accad. naz. Lincei. Rend., 1928, vol. 8, p. 480—483. 8. Glivenko V. I.— Atti kccad. naz. Lincei. Rend., 1928, vol. 8, p. 673—676. 9. Glivenko V. I.— Atti Accad. naz. Lincei. Rend., 1929, vol. 9, p. 830—833. 10. Doob J. L. Stochastic processes. New York, 1953. 11. Blanc-Lapierre A., Fortet R. Theorie des fonctions aleatoires: Paris, 1953. 12. Slutsky E. E.— G. 1st. ital. attuar., 1937, vol. 8, p. 183—199. 13. Слуцкий E. E.— Tp. Среднеаз. ун-та, 1939, т. 31, с. 1—15. 14. Дынкин Е. Б.— Изв. АН СССР. Сер. мат., 1952, т. 16, с. 569—572. 15. Kinney J. R.— Trans. Amer. Math. Soc., 1953, vol. 74, p. 280—302. 16. Ambrose W.— Trans. Amer. Math. Soc., 1940, vol. 47, p. 66—79. 17. Прохоров Ю. В.— УМН, 1953, т. 8, вып. 3, с.**165—166. 18. Kolmogoroff A. N.— С. г. Acad. sci. Paris, 1935, vol. 200, p. 1717—1718. 19. Hopf E.— J. Rat. Meeh, and Analysis, 1952, vol. 1, p. 87—123. 20. Mourier E.— C. r. Acad. sci. Paris, 1950, vol. 231, p. 28—30. 21. Fortet R., Mourier E.— C. r. Acad. sci. Paris, 1954, vol. 238, p. 1557 —1559. 22. Fortet R., Mourier E.— Bull. sci. math., 1954, vol. 78, p. 14—30.
45. О свойствах функций концентрации П. Леви 419 23. Fortet R., Mourier Е.— Ann. Ecole norm, super., 1954, р. 267—285. 24. Mourier Е. Elements aleatoires dans un espace de Banach: These Doct. Pa- ris, 1954. 25. Bachelier L. Les nouvelles methodes du calcul des probabilites. Paris, 1939. 26. Liineburg R.— Math. Ann., 1931, Bd. 104, S. 700. 27. Petrovsky I. G.— Math. Ann., 1934, Bd. 109, S. 425—444. 28. Колмогоров A. H.—~ Изв. АН СССР. OMEH, 1931, c. 959—962. 29. Колмогоров А. Н,-— Изв. АН СССР. OMEH, 1933, c. 363—372. 30. Хинчин А. Я. Асимптотические законы теории вероятностей. М.; Л.: ОНТИ, 1936. 31. Erdos Р., Кас М.— Bull. Amer. Math. Soc., 1946, vol. 52, p. 292—302. 32. Erdos P., Kac M.~ Bull. Amer. Math. Soc., 1947, vol. 53, p. 1011—1020. 33. Donsker M.~ Mem. Amer. Math. Soc., 1951, vol. 6, p. 1—12. 34. Гихман И. И.— Укр. мат. журн., 1954, т. 6, № 1, с. 28—36. 35. Гихман И. И.— Мат. сб. Киев. гос. ун-та, 1953, № 7, с. 8—15. 36. Гихман И. И.— ДАН СССР, 1952, т. 82, № 6, с. 837—840. 37. Гихман И. И.— ДАН СССР, 1947, т. 56, с. 961—964. 38. Гихман И. И.— Укр. мат. журн., 1953, т. 5, с. 413—433. 39. Гихман И. И.— ДАН СССР, 1953, т. 91, № 4, с. 1003—1006. 40. Кас М.— In: Proc. Second Berkeley Sympos., 1951. p. 189—215. 41. Maruyama G.— Nat. Sci. Rept Ochanomicu Univ., 1953, vol. 1. 42. Kolmogoroff A. N.— G. 1st. ital. attuar., 1933, vol. 4, p. 83—91. 43. Smirnov N. V.— Rev. Math. Moscow, 1939, vol. 6, p. 3—26. 44. Смирнов H. B.— Бюл. МГУ. Сер. A, 1939, т. 2, № 2, с. 3—14. 45. Donsker М.— Ann. Math. Statist., 1952, vol. 23, p. 277—281. 46. Anderson T.. Darlong D.— Ann. Math. Statist., 1952, vol. 23, p. 193—212. 45 О СВОЙСТВАХ ФУНКЦИЙ КОНЦЕНТРАЦИИ П. ЛЕВИ ** 1 Всюду далее мы будем обозначать через I =?! + •• • + L сумму независимых случайных величин через Q (I) = sup Р {х < | < х + 1} X функцию концентрации суммы g и Qk функцию концентрации Теорему 48.2 из хорошо известной монографии П. Леви «Теория сум- мирования независимых величин» можно сформулировать следующим образом: Каковы бы ни были |3^>0, можно найти две по- стоянные б 0 1г 7V 0 такие. что. как только n > N. неравенство QAI) <1-8 * Sur les proprietes des fonctions de concentrations de M. P. Levy.— Ann. Inst. H. Poincare, 1958, vol. 16, N 1, p. 27—34. Перевод В. M. Круглова. 1 В двух выпусках «Трудов Института статистики Парижского университета» были опубликованы статьи в честь Поля Леви. Данная статья поступила слиш- ком поздно, чтобы быть включенной в эти выпуски. 14*
420 45. О свойствах функций концентрации П. Леви влечет неравенство Q < ₽. ' (1) Недавно мне понадобилось некоторое обобщение неравенства (1), Я смог удовлетвориться следующей теоремой [1]. Теорема. Существует постоянная С такая, что неравенст- ва 2 L > I, L2 I2 log s, где s=S (!-&(*)). k=i влекут неравенство Q (L) < CL/lfs. - (2) В настоящей заметке я предлагаю доказательство этой теоремы. Другое уточнение неравенства (1) опубликовано с подробным дока- зательством В. Дёблиным в его статье [2]. Соответствующее место в [2] не сформулировано в четкой форме и в формуле содержится опе- чатка 3. Тем не менее кажется очевидным, что, применяя термино- логию функций концентрации, результат В. Дёблина может быть сформулирован следующим образом: Каковы бы ни были & > 0 и р 0, существуют постоянные 6 0 u N > 0 такие, что как только выполнено условие max lk > , L = |/ 2 /с—1 так неравенство Qk Qk) 1 & влечет неравенство Q (б£) < р. (3) Было бы интересно найти такие неравенства, которые бы включа- ли (2) и (3) как естественные частные случаи. Вообще я хотел бы от- метить, что дальнейшее развитие элементарных методов прямого подсчета вероятностей, столь блестяще развитых во Франции П. Ле- ви и В. Дёблиным, как представляется, продолжает оставаться столь же актуальным, как и развитие классических методов или методов функционального анализа. Во всяком случае, мне не удалось дока- зать результаты, изложенные в моей цитированной выше статье [11, 2 Здесь и далее логарифм берется по основанию 2. 2 3 Вместо У, I2 напечатано i i
45. О свойствах функций концентрации П.Леви 421 без использования этих элементарных прямых методов. Весьма ве- роятно, что математики, которые лучше владеют тонкими свойства- ми характеристических функций, смогут рано или поздно доказать и даже обобщить теоремы из [1] с помощью чисто аналитических ме- тодов, как это уже случалось с результатами, доказанными вначале прямыми методами теории вероятностей. Кажется, однако, что мы сегодня еще находимся в том периоде^ когда соревнование этих двух направлений приводит к наиболее плодотворным результатам. Если II. Леви, который равно владеет обоими этими направлениями, реа- лизует эту параллель в своих собственных работах, то следует по- желать, чтобы после преждевременной смерти В. Дёблина вероятно- стники младшего поколения, несмотря на преклонение перед мощью (в конце концов совершенно оправданной) методов, связан- ных с распределениями в функциональных пространствах, не забы- вали бы прямых методов. Воспользуемся следующими обозначениями: F (.г) = Р {£ < х}, а = Mg, а2 = Dg. Следующая лемма известна. Лемма 1. Существует постоянная С± такая, что неравенство I | Ц где ак = Mgfe (к = 1, 2, . . ., тг), влечет неравенство |F Ga, а — нормальная функция распределения с параметрами а, а. Следующая лемма представляет собой обобщение леммы 48.2 из «Теории суммирования независимых величин». Лемма 2. Существует постоянная С2 такая, что соотношения Р {Ь = = Р {Ь = = V2, > I & = 1, 2, . . ., и), L > Zj/log п (п > 2) влекут неравенство Q (L) < С2Ь/1]Гп. Для ее доказательства необходимо различать следующие три раз- личных случая: 1°. L>Z/n; 2°. L^V\f п, кроме того, существует г 1 такое, что количест- во пг чисел лежащих в интервале 4Г~Ч < xk < 4rZ, (4) удовлетворяет неравенствам nr п/4Г, пг > п/4 log п;
422 45. О свойствах функций концентрации П. Леви 3°. L ifn и не существует числа г со свойствами, указанными в пункте 2°. В первом случае Q (L) KUlfn. Во втором случае естественно рассмотреть сумму величин удовлетворяющих условию (4). Поскольку все члены этой суммы удовлетворяют неравенствам то для соответствующей функции F* (х) по лемме 1 имеем I f. Ы «I < cjjo. < . (5) |/ ftp V п 4 [/ ft Так как функция концентрации Qa,G (L) нормальной функции распределения Ga, о удовлетворяет неравенству I/2л з мы имеем окончательно во втором случае (Q* (L) обозначает функцию концентрации £*): e(L)<^(L)<-^- + ^£<(-|/’4- + 8C1]-^= . (6) \/ 2л <5* 1у/ п \ “ л J Z у п Согласно третьему случаю для каждого г > 1 выполняется одно из двух следующих неравенств: либо nr < nl^r. (7) либо nr < nlk log n. (8) Сумма п' чисел иг, удовлетворяющих неравенству (7), не превос- ходит оо п 1ц 4Г ~ ~ • Г=1 Поскольку сумма всех пг равна гг, сумма п" тех пг, которые удов- летворяют неравенству (8), не менгше Ясно, что среди всех та- ких пг найдутся по крайней мере 2 log п отличных от нуля чисел. Поскольку количество тех г, которые удовлетворяют неравенству 4Г/ < L < I /п, меньше log /г, то существует некоторое количество, не меньшее log п» таких, что пг > 0, *4rZ>L.
45. О свойствах функций концентрации П. Леви 423 Выбрав среди этих г только четные или только нечетные числа в порядке возрастания, получим последовательность Fi < г2 < . . . <rs, s > V2 log n, ДЛЯ которой 4ГЧ > A, ri+] > rir2. Выберем члены ^ 2, . . ., tks таким образом, чтобы 4Г-Ч < xki < 44 и изучим их сумму . Поскольку I ц I < Ьгч = < I К Л (Z = 2, 3, . . ., $), то более или менее элементарные рассуждения, которые могут быть проведены читателем, показывают, что сумма может находиться в некотором отрезке длиной L при одной-единственной вполне оп- ределенной комбинации (если n 1) знаков членов другими словами, с вероятностью не больше 2“s < п~1/2. Следовательно, в третьем случае из-за условия L I имеем Q (L) < Q' (L) < l//n < L/Z/n. (9) Сравнивая неравенства (5), (6), (9) в этих трех случаях, видим, что лемма 2 доказана. Перейдем к доказательству теоремы. Соотношения Рц (“к (у)) < У < Fk (ик (у) '+ 0) (10) определяют функцию ик (г/), 0<у<1. (Fk(x), будучи функцией распределения случайной величины £к, определяет единственным об- разом значения функции ик (у) яля всех у в интервале 0 < у < 1, кроме, быть может, счетного множества точек у 4.) Ее можно рас- сматривать как обратную функцию Uk (У) = Fk (У), определение которой уточняется подходящим образом для тех точек у, которые соответствуют точкам разрыва функции Fk (х). Если предположить, что случайные величины v\k распределены равномер- но на интервале (0, 1) и что они взаимно независимы, то величины = ик (ц&) будут также взаимно независимы и подчинены распре- делениям Fk (х). Очевидно, можно предположить, не умаляя общно- 4 Единственность не имеет места для тех точек ?/, которым соответствуют интервалы постоянства функции Fk (х), но легко видеть, что функция ик (у) может быть непротиворечиво определена на всем интервале (0, 1) так, чтобы выполнялось условие (10).
424 45. О свойствах функций концентрации П. Леви сти, что первоначально заданные случайные величины выражены таким же образом. Можно предполагать, что все функции (Z) меньше единицы, по- скольку, исключив из наших рассуждений те члены, для которых Qk (Z) = 1, и получив для суммы всех остальных неравенство (2), можно вновь ввести исключенные члены, что не приводит к возраста- нию Q (L). Положим 4efe = 1 — Qk (Z), 4 = uk (efr), 4 = uk (1 — efc). Легко видеть, что 4 — 4 > Обозначим через къ к2, . . ., кт индексы к, для которых < 8fc ИЛИ > 1 — 8fr. Фиксируем величины если Zr == 4 л 1 — %, если % > 1 — е/1г. Легко видеть, что совместное условное распределение случайных величин будет таким, что они останутся взаимно независимыми и каждая из них будет иметь распределение Р “Ь ~ =: &г ’ *^г} ’ ^2» где %г — (1 Zr) ukr (^)L аг ~ ^2 ^ukr (1 Zr) ”Ь Щгг (Zr)l. Применяя (при кг и Zr фиксированных) лемму 2 к величинам & = = 1кг — аг< для которых I 1г | > Z' = 1/211 мы получим, когда L > >Z'|Alogm, неравенство Q (L) < С2Ы1'Ут = 2С2Ы1Ут- (И) Неравенство (И) доказано для условной функции Q (L) (когда kr, ar, Zr фиксированы и L V У log тп). Отсюда немедленно вы- текает неравенство Q (L) < р + 4C2A/Z Y~s для абсолютной функции Q (L), где р = 1 — Р «}•
46. Переход ветвящихся процессов в диффузионные 425- Нам остается только оценить эту последнюю вероятность. Поскольку M/re = ^2e'‘ ==Ts’ Ьт = у 2е&(1 — eft) <-|s, к а то согласно неравенству Чебышева для к = 1 — р т Д р л т __ Mm I > к} ~ • Таким образом, мы получим окончательно + ДЛЯ s> 1 ' S I ]/ 8 или; поскольку всегда Q (L) 1 и по нашим предположениям А > Zt Q (L) < CLHYs, где С = 8 + 4(72. ЛИТЕРАТУРА 1. Колмогоров А. И. Две равномерные предельные теоремы для сумм незави- симых слагаемых.— Теория вероятностей и ее применения, 1956, т. 1, № 4, с/ 426—436. 2. Doeblin W. Sur les sommes d’un grand nombre des variables aleatoires inde- pendantes.— Bull. sci. math., 1939, vol. 63, p. 23—32; 35—64. 46 ПЕРЕХОД ВЕТВЯЩИХСЯ ПРОЦЕССОВ В ДИФФУЗИОННЫЕ И ПРИМЫКАЮЩИЕ ЗАДАЧИ ГЕНЕТИКИ* (Обзорный доклад) Абстрактная теория «ветвящихся процессов» с «числом частиц», принимающих любые неотрицательные действительные значения (см. [1]), была, следует думать, развита в качестве теории, могущей охватить предельные закономерности обычных ветвящихся процес- сов при большом числе частиц. Такой реальный процесс, по-види- мому, имеет в первую очередь специальный случай диффузионных ветвящихся процессов. В простейшем однородном одномерном слу- чае соответствующее уравнение Фоккера—Планка имеет вид = V2 b (хи)хх — a (xu)x. (1) Более сложная примыкающая сюда задача была рассмотрена еще Фишером в замечательной книге [2]. В популяции из N особей * Теория вероятностей и ее применения, 1959ч т. 4, № 2, с. 233—236.
426 46. Переход ветвящихся процессов в диффузионные ген А может быть представлен в v экземплярах О < v < 2N. Для | = v/2N, 0 < £ < 1, Фишер получает уравнение Фоккера—Планка = V2 b [х (1 — х)и\хх, . (2) которое даже при больших N разумно только при х. не слишком близ- ких к 0 или 1. Зато вблизи х ~ 0 величина v подчинена закономер- ностям ветвящегося процесса, вблизи же х = 1 такой характер име- ет величина 2N — V. Аналогичные задачи могут возникнуть и в фи- зике, и в химии. Введением в весь круг вопросов может служить статья Феллера [3]. Соответствующие генетические задачи изложены (математиче- ски нестрого), кроме [2], в [4, 5]. Основные сведения по ветвящимся процессам, как известно, содержатся в обзоре Севастьянова [6]. Любопытно, что с точки зрения теории диффузионных процессов мы сталкиваемся здесь с вырожденным случаем: коэффициент диф- фузии Ъх!2 или Ъх (1 — х)!2 обращается в нуль на естественных гра- ницах. Феллер подчеркивает возникающие по этой причине трудно- сти в [3]. Он, однако (примеч. на с. 238), напрасно объявляет ли- шенными смысла некоторые результаты биологов, которые при над- лежащей интерпретации верны. Мне кажется, что в данной области есть много тем, заслуживающих дальнейшей разработки. В ниже- следующем я лишь даю примеры диффузионной трактовки некоторых простейших результатов, полученных другими методами, и указы- ваю на правильную интерпретацию некоторых результатов Фишера, отрицаемых Феллером. Пусть за один шаг процесса одна частица превращается в к час- тиц с вероятностью (А), S Рк (У) = 1> 3 крк (У) = 1 + а (У), %k(k-i) рк (У) = b (N), к к к %k(k-l)(k-2)pk(N) = c(N). к Параметр А будем стремить к бесконечности, предполагая при этом^ что Pk(N)^Pk, (3) Na (N) а, • (4) Ъ (N) Ь, (5) с (N) -+ с, (6) а, Ь, с конечны.
46. Переход ветвящихся процессов в диффузионные 427 Суть допущения (4) заключается в том, что при числе частиц порядка N и а порядка i/N роль числа частиц в ходе процесса систе- матического роста (убывания) и роль случайного рассеяния будут одного порядка. Если порядок а больше, то процесс при большом числе частиц делается почти детерминированным, если а будет мень- шего порядка, то им можно пренебречь. Изучению «пограничных» явлений при а, близком к-нулю, посвящена работа Севастьянова [7]. Именно здесь от введения диффузионной идеализированной модели и следует ожидать пользы. Если положить теперь число частиц v равным то естественным временным переменным для изучения поведения величины £ делается т, связанное с числом шагов процесса t соотно- шением t = Nx. При сделанных допущениях процесс % (т) в пределе при N -> оо дает диффузионный процесс с уравнением Фоккера — Планка (1). Уравнение (1) при а = 0 имеет решение и (т, х) — (dx2) e~2x/bT (7) с особенностью в точке т = 0, х ~ 0. Оно и описывает в известном смысле поведение потомства одной частицы, появившейся в момент времени т-0. Смысл этот таков: если при т0 4> 0 подобрать с так, что оо 5 и (то, x)dx = 1, о то условное распределение % (т) при т т0 в предположении, что В (то) 0» сходится при N оо к распределению Р {£ (т) < х} = 0, х 0, Р {В (т) < х} = Р (т) 4- § и (т, х) dx. х 0, о Р (т) = Р {£ (т) = 0} = 1 — § и (т, х) dx. о Общее решение стационарного уравнения при а = 0, т. е. урав- нения (тт/)хх = 0, имеет вид и (х) == сг!х 4- е2.
428 47. О классах ф(п) Форте и Блан-Лапъера Это не распределение вероятностей. Однако решение и (х) = с^х имеет такой статистический смысл: если стационарным образом на каждом шагу с вероятностью р возникает новая частица и р, х^ есть число этих исходных частиц, потомство которых в какой-либо фиксированный момент времени t заключено в пределах Nxr <1 v Nx* то математическое ожидание Мр, (хп х^ при N —> оо стремится к пре- делу «2 2 (* dx b J х * Аналогичную интерпретацию имеет решение сг!х + с2/(1 — х) стационарного уравнения (х (1 — х}и}ж = О и теории Фишера. Эта интерпретация была даже проверена на опыт" ном материале и оправдалась практически. 18 ноября 1958 г. ЛИТЕРАТУРА 1. Иржина М.— Чехословац. мат. журн., 1958, т. 8, с. 83. 2. Fischer R. A. The genetical theory of natural selection. Oxford, 1930. 3. Feller W.— In: Proc. Second Berceley Sympos., 1951, p. 227—246. 4. Malecot J. Les mathematiques de heredite. Paris, 1948. 5. Wrtgth S.— Bull. Amer. Math. Soc., 1942, vol. 48, p. 223—246. 6. Севастьянов Б.А.— УМН, 1951, т. 6, вып. 6, с. 37—99. 7. Севастьянов Б. А.— Теория вероятностей и ее применения, 1959, т. 4, № 2, с. 121-135. 47 О КЛАССАХ Ф(п) ФОРТЕ И БЛАН-ЛАПЬЕРА * Если для действительного случайного процесса £ (t) существу- ют непрерывные абсолютные моменты порядка м, подчиненные усло- вию М| НОГ<С(1 + I о8), • (1) то при к п моменты (h, ..м = м [g (tj, ... Л (Ml * Теория вероятностей и ее применения, 1960, т. 5, № 3, с. 373.
48. Об- условиях сильного перемешивания 429 можно представить в виде . ., tk) = J . . J . di., где р,*0 — обобщенные функции. Процесс, принадлежит классу Ф(а) (см. [1]), если все «типа конечной меры», т. е. (tt,. . tk) = J . . J е^М<^ (dk), где (Л) — конечная комплексная мера в ^-мерном пространстве. Хорошо известно, что при п = 2 для строго стационарных % (t) из существования моментов М | £ | и М j g |а вытекает принадлеж- ность к классу Ф(2\ Можно показать на примере, ^го аналогичное утверждение неверно при п > 2. ЛИТЕРАТУРА 4. Blanc-Lapierre A., Fortet R. Theorie des fonctions aleatoires. Paris, 1953. 48 ОБ УСЛОВИЯХ СИЛЬНОГО ПЕРЕМЕШИВАНИЯ ГАУССОВСКОГО СТАЦИОНАРНОГО ПРОЦЕССА* Совместно с 10. А. Розановым Две о-алгебры событий Ж' и независимы, если при любых Л' е®'и Л"е®Г Р (Л', А") = Р (А') Р (Л"). М. Розенблатом [1] была предложена естественная мера зависимости двух сг-алгебр событий: а(<,«Г) = sup I Р(А' Г) Л")— Р(Л')Р(Л")|. А'&ПР, А"<ЕАЯ1" Для стационарного случайного процесса g (t) а(<, ад (где означает а-алгебру событий, порожденную величинами | (и), s и < 0 зависит только от т и будет обозначаться а (т). Если а (т) —> О при т —» оо, то говорят, что процесс !• (t) обладает свойством сильного перемешивания. В настоящей заметке выясняется для слу- чая гауссовских процессов, какие свойства спектральной функции F, (К) процесса гарантируют наличие сильного перемешивания. * Теория вероятностей и ее применения, 1960, т. 5,‘№ 2, с. 222—227.
430 48. Об условиях сильного перемешивания 1. Для любых двух систем {£} — 91' и {т]} — 91", имеющих ко- нечные вторые моменты, введем показатель sup 1 м (^ — м^) (П — МП) I [М М?)2М (т) - Мт))2]1/2 Если 9Г и 91" являются соответственно совокупностями всех величин с конечными вторыми моментами, измеримых относительно а-алгебр Зй' и $ГО", то по определению (см. [2]) р(ЭГ, *Г) = р(9Г, 91") есть максимальный коэффициент корреляции между алгебрами Ж' и Ж". Легко видеть, что всегда а(^',®г")<р(®г',®"). (1) Пусть теперь {£} и {т]} — две совокупности случайных величин, имеющих (для любого конечного набора . . ., gm, т)1? . . ., 1%) гауссовские совместные распределения, и суть о-алгебры, порожденные соответственно событиями (£ ЕЕ Г') и (г| ЕЕ Г"), где Г' и Г" — произвольные борелевские множества на прямой, и суть замкнутые линейные оболочки (в среднеквадратичном) со- вокупностей {|} и {т]}. Теорема I1. Имеет место следующее равенство: p(^,^) = p(^,^). (2) Теорема 2. Максималъный коэффициент корреляции удов- летворяет следующим неравенствам: а (®в, «0гл) < р (®Ц, < 2лсс (% ®п). (3) Доказательство теоремы 1. Очевидно, можно ограничиться случаем, когда совокупности {£} и {ц} состоят из конеч- ного числа величин. Далее, в пространствах Н% и можно выбрать величины . . . ., и . . ., т]п таким образом, чтобы среди них были зависимы лишь величины и с одинаковыми индексами и каждая из вели- чин % е {£}, л {л) была функцией от . . ., ит]!,..., т]п со- ответственно; можно считать также, что = 0, Мт]; = 0, ~ = Dt]j = 1, k = 1, т, j — 1, п. Далее, величины / = f (glt . . |т) и g = g (rji, . . т]п) можно представить в виде ТП п I /=ЗА(Вь• • -Л)- g= S&Oh.пД 1 1 1 Теорема 1 есть многомерное обобщение результата Сарманова [2], соглас- но которому равенство (2) выполняется для любых двух величин £ и ц, имеющих гауссовское совместное распределение. -
48. Об условиях сильного перемешивания 431 где Л = М(/ I — м (/ 1 Вз, . . ., Ifc-i), вз = м (g I Пи • • -, Пз) — М (g I Ih, • • •, Пу-i)- Заметим, что при к j м [М (/ I |х, . . gfc) I Л1, • • ., nJ = = м [М (/ I I Я1, . . ni| и аналогично при / > к М [М (g | th, . . Th) I'li, ..U = ,= Ml/A(g | th,- • -, Hfc) Hi, - • •, IJ, откуда следует, что — 0 при к -ф] и, считая для определенно- сти тп <1 и, M/g = 5M/fcgft=5 М [М (/frgft ]?!,..gfc-1, П1, • • •, П/с-1)]. . 1 1 Величины и т|£, имеющие гауссовское распределение, не зависят от Л1» • • •» Л/f-i и из цитированного уже результата Сар- манова [2] выводим, что Iм (Лл I li, • •., In, П1, • • •, n»-i) I < р«Л, где р = р(^,ял), 4=М(Л|11,...,1к-1, ni,..-nw), Ъи — М (gi; | Т)1, • • •» Пк-1). Отсюда получаем, что lM/g| <pS м«А<р, 1 что и доказывает нашу теорему. Доказательство теоремы 2 2. Возьмем произволь- ное е > 0 и Ь ЕЕ Hi, ц8 G Яц с М£е = Мце = 0, Dgs = Оце = 1 такие, что г = М^ец8 р — е. Рассмотрим события Ае = {|е>О}е9»6 и 5е= {t]s > 0} G з?п. Имеем (см. 19, с. 321]) Р(АеВе) = ~ + -^-arcsinr, Р (Ае) Р (Ве)~ и, очевидно, -^-arcsinr = Р(АеВе) — Р (Л) Р (В8)<а. 2 Это простое доказательство было указано авторам К). В. Прохоровым.
432 48. Об условиях сильного перемешивания Далее, если а х/4, то неравенство р 2ла тривиально. Если же а х/4, то р — 8 г sin 2ла, р 2ла + 8, р 2ла, что вместе с соотношениями (1) и (2) и доказывает нашу теорему. Из теорем 1 и 2 вытекает, в частности, что гауссовский стацио- нарный процесс £ (t) обладает свойством сильного перемешивания тогда и только тогда, когда максимальный коэффициент корреляции p(3Rloo, 0 при т —>оо (в силу теоремы 1 он совпадает с по- казателем р (т) = р (Я1оо, Я^т), где и Я~т суть линейные за- мыкания в среднеквадратичном величин g (и), и i, и ? (0, v > t, соответственно), более того (ср. [4, введение]), а (т) р (т) 2ла (т). (3') 2. Пусть g (t) — стационарный в широком смысле процесс и р (т) = р (JZLoo, ЯГ+г) (показатель р (т) не зависит от t в силу стационарности). Если спектральная функция F (X) нашего процесса не абсолютно непрерывна, то р (т) = 1 при любых т (см. [5, 6]). Пусть F (X) абсолютно непрерывна и / (X) есть спектральная плот- ность процесса | (0, / (X) = F' (X). Теорема 3. Я случае целочисленного времени р (т) — inf vrai sup Г| / (X) — е<ктф (e~u) | 1 <р . х L / W J (4) где inf берется по всем функциям <p*(z), аналитически продолжаемым ф внутрь единичного круга; в случае непрерывного времени р (т) = inf vrai sup [| f (X) — е^<р (X) | , (4') где inf берется no всем функциям ф (z), аналитически продолжаемым ф в нижнюю полуплоскость. Доказательство этой теоремы основывается на одной общей лемме из функционального анализа. Лемма. Пусть L — некоторое банахово пространство, L* — сопряженное к нему. Пусть Я — некоторое подпространство пространства L и Н() — совокупность линейных функционалов, обращающихся на Я в нуль. Для любого h* GE L* имеет место следующее соотношение: sup й* (/г) = inf II h* — hQ\\. (5) А<=Н, ||7г||=1 - Доказательство. Поскольку (й* — h°) (h) = h* (h), то при h е Н, || Л || — 1 имеем /г* (h) || й* v- й° Д’ и потому
48. Об условиях сильного перемешивания 4 4за sup h* (h) inf || h* — hQ ||. Далее, по теореме Хана—Банаха лен, ||Л||—i л°еН° о продолжении линейного функционала существует функционал ft*r совпадающий на Н с ft*, норма || ft^ || которого не превосходит sup h* (h). Разность ft* — ft* ~ ft? Е HQ и ASH, ||Л||=1 || A* ~h°L || = К || = sup Лен, ||Л||=1 что и доказывает соотношение (5). Вернемся к нашей теореме. Очевидно, что р (т) = sup У (Х)р2 (Л) / (X) d'K, II, где рдх)= 2 <^_Ч 4>о и интегрирование производится в пределах от —л до л в случае цело* численного времени и в пределах от — оо до оо в случае непрерывно- го времени. Используя некоторые свойства граничных значений аналитических функций, можно показать, что на самом деле р (т) = sup eilx р (X)/ (X) (6) р где Возьмем в качестве пространства L пространство функций h (Х)г интегрируемых с весом / (%), || h || — [ h (X) | / (А,) б/Х, в качестве подпространства Н линейное замыкание функций р (X) вида р(Х)= 2 Каждый линейный функционал ft* на L имеет вид h* (ft) = j ft* (X) h (X) / (X) dX, причем || ft* || = vrai sup | ft* (X) |. x Подпространством HQ будет, очевидно, подпространство линей- ных функционалов ft0 с соответствующими функциями ft0 (X), для ко- торых J (X) f (X) dX = 0 при всех £ > 0. Отсюда следует, что Функция ф = hQ (X) / (X) может быть аналитически продолже-
-434 48. Об условиях сильного перемешивания на внутрь единичного круга в случае целочисленного времени, а в случае непрерывного времени ф (X) = h (X) / (X) может быть продол- жена аналитически в нижнюю полуплоскость. Взяв в качестве Л* линейный функционал, соответствующий функ- ции Д* (X) = из соотношения (5) леммы получаем равенства (4) и (4'). Теорема 4. Если существует функция ф0 (z), аналитическая внутри единичного круга в случае целочисленного времени (в нижней полуплоскости в случае непрерывного времени), имеющая граничное -значение фр (е-а) (соответственно фр (X)), такая, что отношение J!ф0 является равномерно непрерывной функцией от X, причем I //фо I > 8 О для почти всех X, то при т —» оо Р (Т) -> 0. (7) .Если существует аналитическая функция ф0 (z) такая, что | //ф0 | > 8 > 0 и производная (//ф0)(А) равномерно ограничена, то р (т) Доказательство. Пусть ф (z) есть полином степени не вы- ше [т/2] в случае целочисленного времени (аналитическая функция экспоненциального типа с показателем не выше т/2 в случае непре- рывного времени). Имеем inf vrai supFl/ — е~1хтф I . 1.. -1 inf vrai sup ГМ- ф x L,; /(X) J v=(M, к LI <Po Tl / — inf vrai sup I —-1-^0 (8) 8 X I фо I при т —> oo, так как отношение //ф0 можно равномерно приблизить функциями ф (z) описанного типа (см. [7, с. 207; 8]). Например, свойство (7) всегда выполняется, если спектральная плотность / (X) непрерывна и не обращается в нуль ни при каких X, —л X т (случай целочисленного времени) или если / (X,) равно- мерно непрерывна на всей прямой, не обращается в нуль и при до- статочно больших % удовлетворяет неравенству т/К* </(%)< M/tf-1 (9) лри некоторых положительных т, М и целом к 0 (случай непре- рывного времени). Далее, из работ [5, 6] вытекает, что если р (т) —> 0 при т —» оо, то спектральная плотность не может «очень сильно» обращаться в нуль: именно она должна быть положительна почти всюду и . (Ю) J * “Г ** Как следует из теоремы 4, более слабое обращение в нуль спект- ральной плотности / (X), совместимое с (10), само по себе не противо-
49. Случайные функции нескольких переменных 435- речит свойству сильного перемешивания (эквивалентному (7)). Если / (X) рациональна относительно eiK (при целочисленном t) или отно- сительно X (при непрерывном £), то показатель р (т) убывает экспо- ненциально быстро; например, в случае / (X) = е/(а2 + X2) (£ (t) есть марковский гауссовский процесс) р (т) = г-ат. По-видимому, свойство сильного перемешивания может не выпол- няться, если спектральная плотность /(X) терпит разрыв (даже если она всюду больше положительной постоянной в случае целочислен- ного t). Авторы выражают благодарность Ю. В. Прохорову за замеча- ния, сделанные им при просмотре рукописи настоящей заметки, не- сомненно способствовавшие ее улучшению. ЛИТЕРАТУРА 1. Rosenblatt М. A central limit theorem and a strong mixing condition.— Proc. Nat. Acad. Sci. Wash., 1956, vol. 42, N 1, p. 43—47. 2. Сарманов О. В. Максимальный коэффициент корреляции.— ДАН СССР, 1958, т. 121, № 1, с. 52—55. 3. Сарманов О. В., Захаров В. К. Максимальные коэффициенты множественной корреляции.— ДАН СССР, 1960, т. 130, № 2, с. 269—271. 4. Волконский В. А., Розанов Ю. А. Некоторые предельные теоремы для слу- чайных функций. I.— Теория вероятностей и ее применения, 1959, т. 4, № 2, с. 186—207. 5. Колмогоров А. Н. Стационарные последовательности в гильбертовом про- странстве.— Бюл. МГУ. Математика, 1941, т. 2, № 6, с. 1—40. 6. Крейн М. Г. Об одной экстраполяционной проблеме А. Н. Колмогорова.— ДАН СССР, 1945, т. 46, с. 339—342. 7. Ахиезер Н. И. Лекции по теории аппроксимации. М.; Л.: Гостехиздат, 1947. 323 с. 8. Бернштейн С. Н. О наилучшем приближении непрерывных функций на всей вещественной оси.— ДАН СССР, 1946, т. 51, с. 327—330; 485—488. 9. Крамер Г. Математические методы статистики/Пер. с англ. М.: Изд-ва иностр, лит., 1948. 49 СЛУЧАЙНЫЕ функции НЕСКОЛЬКИХ ПЕРЕМЕННЫХ, ПОЧТИ ВСЕ РЕАЛИЗАЦИИ КОТОРЫХ ПЕРИОДИЧНЫ * Репером в евклидовом пространстве Еп называется набор R - (Zi, . . In) из п линейно независмых векторов. Функция k (t) от n-мерного век- тора t называется /^-периодической, если существует репер д* - (/?, .. Й), * Теория вероятностей и ее применения, 1960, т. 5, № 3, с. 374.
436 50. Об оценке параметров гауссовского марковского процесса конгруэнтный 7?, для которого k = (2Ч? + . . . +z"Z*) = / (Д . . z”) Ti функция / периодична по каждому переменному zk с периодом 2л. Даются необходимые и достаточные условия ^-периодичности лпочти всех реализаций случайной функции g (t) в терминах «спект- ральных моментов». Отсюда, в частности, вытекает, что стационарная изотропная /Z-пе- риодичная случайная функция, не равная константе, не может быть лри п = 1 гауссовской. Изложенное может иметь интерес при иссле- довании потенциалов и решений уравнения Шредингера в кристал- лах и средах с «близким порядком». 50 ОБ ОЦЕНКЕ ПАРАМЕТРОВ КОМПЛЕКСНОГО СТАЦИОНАРНОГО ГАУССОВСКОГО МАРКОВСКОГО ПРОЦЕССА* Совместно с М.Арато и Я. Г. Синаем § 1. Мы будем рассматривать двумерный стационарный случай- ный процесс, компоненты которого £ (0 и ц (0 удовлетворяют стохас- тическим дифференциальным уравнениям dt == —— (M]dt + dcp, (1) dx\ — ay^dt — farylt + (7ф, тде ф (t) и ф (t) — два независимых винеровских процесса с ‘ Мйф = Мйф = 0, М (<7ф)2 = М’ (йф)2 — adt. Полагая £ = | + /ц, X = ф + гф,' у = X — .можно записать систему (1) в виде одного уравнения = —yt,dt + d%. (la) Комплексная корреляционная функция нашего процесса имеет ®ид С (т) = А (т) + iB (т) = М[£ (0 U* + = = о2 exp (—X | т | — шт), (2) тде о2 = а/Х. * ДАН СССР. 1962, т. 146, № 4, с. 747—750.
50. Об оценке параметров гауссовского марковского процесса 437 Если процесс наблюдается на промежутке [О, Т\, то можно опре- делить эмпирическую корреляционную функцию Т—т с(т) = а(т) + ib(T) = -jr~ U0U* + т)Л. (3) О Эмпирическая корреляционная функция с вероятностью едини- ца имеет в нуле правую производную с' (0) = — а-у si + -у s-2 — ir, где а есть введенный выше параметр, характеризующий интенсив- пость «белых шумов» <р' (t) и ф' (t), а S1 21 = V2 [ I ИО) 12 + 1 ИП 12L т т о * о Интегрирование в выражении для г производится по угловому ар- гументу 0, определяемому из £ (0 = I £ (О I На рисунке изображена эмпирическая корреляционная функ- ция для чандлеровских вариаций координат полюса Земли х. § 2. Параметр а определяется по реализации точно. Остается рассмотреть задачу оценки параметров X и <о. Обозначим через Р ве- роятностную меру в пространстве реализаций нашего процесса на отрезке [0, Т\. В том же пространстве введем стандартную меру V - L X W, где L — обычная лебегова мера на плоскости £ (0), W — двумерная винеровская мера в пространстве приращений £ (£) — £ (0) с теми характеристиками, которые были приняты для случайного процесса 1 Мгновенная ось вращения Земли перемещается относительно малой оси земного эллипсоида (так называемая свободная нутация). В этих перемещениях имеется периодическая компонента с годичным периодом. После их элиминации остаются чандлеровские перемещения, имеющие тенденцию к колебаниям с пе- риодом порядка 14 месяцев, но не строго периодические и с большими, в основ- ном плавными (волны порядка 10—20 лет) изменениями амплитуды. Рисунок по- казывает, что чандлеровская компонента перемещения полюса хорошо удовлет- воряет гипотезам, изложенным в начале нашей заметки. Рисунок получен в результате обработки данных табл. 6 работы А. Я. Ор- лова [1J. Из координат х (t), у (t) табл. 6 выделена компонента с годичным пе- риодом, остаток принят за £ (0 и ц (0. На рисунке кружками указаны точки, соответствующие приращениям т в 0,1 года. По рисунку можно сразу усмотреть, что период 2л/со равен приблизительно 14 мес. Правильный характер получен- ной спирали может привести к предположению, что параметр 1 тоже поддается очень точной оценке. Это, однако, неверно, как будет объяснено в конце заметки.
438 50. Об оценке параметров гауссовского марковского процесса X (/). Можно показать, что (ср. [2, 3]) 4^ = СХехр[-3!+^_т>::_2_ + — 7>] , (4) dV L 2а < а 1 1 1 a J ’ ' 7 где С — некоторая константа. Формула (4) показывает, что система из трех статистик $1, г является достаточной системой статистик задачи. Дифференцируя L = 10ё = с' + 108 Х Ts* - “Г + V Тг по со и X, получаем уравнения 4^ =- ——г = 0, (5) дт а ~ 1 а 1 х 7 -^•-=4------Tsl-~ + T = Q (6> дл Л а ~ а ' 7 для определения оценок наибольшего правдоподобия й и 1 Из (5) получаем = r/sl. (*) Можно показать, что (<о — о))/о (&), о2 (а>) = aJTsi т = 0,1 «п; п = 0,1, 156
50, Об оценке параметров гауссовского марковского процесса 439 распределено (0, 1)-нормально (это точный, а не асимптотический ре- зультат!). Уравнение (6) всегда имеет единственное положительное решение. Обозначая кТ = х, кТ = х, получим для х. уравнение fe2X2 + (^! — 1) X — 1 - О, где h1 = SilaT, h2 — S^jaT. Распределение статистик и Д2, а следовательно, и х зависит -только от параметра х. Так как распределение х непрерывно, то при любых а, 0 < а < 1, их, 0 < х < оо, можно найти такое к, что Р {х > к [ х } = а. (7) Обращая зависимость к — ка (х), получим зависимость х — Х(х (к) (установлено, что функция ка (х) при изменении х от 0 до оо монотон- но меняется от 0 до оо, так что обращение возможно и однозначно). Очевидно, Р {х < ха (х) I х} == а. (8) Нами организовано вычисление функции ха (х) при а = 0,1; 0,05; 0,025; 0,01; 0,005; 0,001; 0,9; 0,95; 0,975; 0,99; 0,995; 0,999. Резуль- таты будут опубликованы по окончании вычислений. При малых х (8) эквивалентно соотношению Р {х < их} = ехр (—1/и), (9) т. е. отношение х/х имеет распределение %2 с двумя степенями сво- боды. При больших х (8) эквивалентно Р{х<х + и/х e~ti/2dt, (10) — оо т. е. оценка х асимптотически нормальна с дисперсией о2 (х) ~ х. (И) § 3. Для отмеченного в начале заметки случая движения полюса Земли на основе наблюдений за Т = 60 лет получено 2 со - 5,274, х = 3,6, 2л : со = 1,191, а (2л : (о) = 0,006. 2 Введение в уравнения (1) винеровских <р и т. е. возмущений типа «бе- лого шума», является в случае движения полюсов Земли, конечно, грубой идеализацией. Более корректно было бы писать = —Ц — соц + /, ц' = со£ — Хц + g.
440 50. Об оценке параметров гауссовского марковского процесса Асимптотическая формула (11) дает о2 (х) = 3,6. Так как х заведомо положительно, а формула (10) при а <С 0,03 доставляет отрицательную оценку то ясно, что асимптотика (10^ еще непригодна. . Произведенный нами расчет доставляет оценки Хо,9о = 5,5; Хо,95 = 6,2; Хо,9?5 — 7,8; ^о,ю = _4>27; Хо,о5 ~ 0,82; Хо,о25 = 0,46, что соответствует для X оценкам ^о,9о 0,09; ^о,95 — 0,10; ^0,975 = 0,13; Чю = 0,021; Х0,05 = 0,014; Х0,025 = 0,008. МГУ, 20 февраля 1962 г. ЛИТЕРАТУРА 1. Орлов А.-Я. Служба широты. М.: Изд-во АН СССР, 1958. 2. Striebel Ch.— Ann. Math. Statist., 1959, vol. 30, N 2, p. 559. 3. Apamo M.— ДАН СССР, 1962, т. 145, № 1. 4. Федоров Е. П.— Тр. Полтав. гравиметрической обе., 1948, т. 2, № 3. 5. Панченко Н. И.— В кн.: Тр. 14-й Астрой, конф. СССР. М.: Изд-во АН СССР, 1960, с. 232. 6. Munk W. И., Macdonal G. J. F. The rotation of the Earth. Cambridge, I960, (Monographs on mechanics and applied mathematics). 7. Jeffreys H.— Mon. Notic. Roy. Astron. Soc. Geophys. Suppl., 1942, vol. 100, p. 139. 8. Walker A. M., Young A.— Mon. Notic. Roy. Astron. Soc. Geophys. Suppl., 1955, vol. 115, p. 443; 1957, vol. 117, p. 119. Однако данные из [1] показывают, что значения функций f (t) и g (t) в моменты времени t, отстоящие друг от друга на несколько лет, практически независимы между собой, так что замена функций / и g «эквивалентным белым шумом» законна. Ошибка в определении интенсивности а этого эквивалентного белого шума, по-видимому, достаточно мала, чтобы не влиять существенно на резуль- таты оценки параметра А. Значение со вычислено по дискретному аналогу фор- мулы (*), полученному по методу наибольшего правдоподобия для «схемы с дискретным временем». Об оценке параметров X и со для движения полюса Земли см. также [6]. В [6] приведены результаты, близкие к нашим: Л = 1/15, 2л : со = 1,193. Близ- кие значения были указаны Джефрисом [7], однако в работах [5, 8] указывались резко отличающиеся значения X = 0,3 и Л — 0,01.
51. О приближении распределений сумм 441 51 О ПРИБЛИЖЕНИИ РАСПРЕДЕЛЕНИИ СУММ НЕЗАВИСИМЫХ СЛАГАЕМЫХ НЕОГРАНИЧЕННО ДЕЛИМЫМИ РАСПРЕДЕЛЕНИЯМИ * ВВЕДЕНИЕ На протяжении всей статьи g = U + . . . +gn — сумма п независимых действительных слагаемых, F* (4 - Р {Ь < Я (х) = Р {£ < 4, Ga,(x)= .jL- ( e~x‘!iotdx, оЪ»0, —оо f 0 при жСО, E(z) = Gq(x) = \ . ' 7 [1 при #>0, Э = {D} — совокупность неограниченно делимых функций рас- пределения D (х); СА, С2, . . .— положительные константы. Далее будут доказаны следующие усиленные варианты двух тео- рем, более слабые формы которых даны в моей работе [1]. Теорема 1. Существует такое СА, что в случае одинаково распределенных каково бы ни было F (х) = (х), А = 1, 2, . . . . . ., п, найдется D ЕЕ ©, удовлетворяющее неравенству ID (4 - н (4 |< cira-v. (0.1) при всех х. Теорема 2. Существует такое С2, что при любых 8 0, L 21 > 0 из соблюдения для всех х и к = 17 . . ., п неравенств Е {х - Z) - 8 < F* (х) < Е (х + I) + 8 ’ . (0.2) вытекает существование Z) ЕЕ ©, для которого при всех х D {х - L) - 6 < Я (х) < Z) (х + L) + 6, (0.3) где 6 = С2 max (-4- flog -у"У/2, . (0.4) \ Lj \ L / / История вопроса такова. * Тр. Моск. мат. о-ва, 1963, т. 12, с. 437—451.
&2 51. О приближении распределений сумм, 1. Из замкнутости относительно слабой сходимости класса не- ограниченно делимых распределений, введенного Б. де Финетти [2]г непосредственно вытекает, что в случае, если распределения сумм £(te) = hi + Ьз + • • • + Ит пк = оо, (0.5) независимых и одинаково распределенных внутри каждой серии сла- гаемых слабо сходятся, то предельный закон распределения неогра- ниченно делим. Было соблазнительно понимать этот результат так: сумма боль- шого числа одинаково распределенных независимых слагаемых имеет распределение, близкое к неограниченно делимому. Однако до моей работы [1] такое толкование оставалось не вполне убедительным. Даже в случае схемы последовательности •51» • • •» Вп» • • • независимых одинаково распределенных слагаемых по В. Деблину [3] возможен «вполне расходящийся» случай, в котором ни при какой нормировке = . . . -Rn) - Вп • и ни по какой последовательности И1 < п2 < пк< . . . распределения сумм не сходятся к чему-либо, отличному от вы- рожденных распределений Е (х — а). Этого последнего, конечно, можно достигнуть, выбирая множители Ап достаточно малыми. Только в 1955 т. Ю. В. Прохоров [4] показал, что в случае после- довательности одинаково распределенных независимых величин всегда существует последовательность неограниченно делимых функ- ций распределения (х), D2 (х), . . Dn (х), . . аппроксимирующих распределения Нп (х) сумм = h + + • • • +£п в смысле sup I Нп (х) — Dn(x) [ 0 X (0.6) при п —» сю. Работа Прохорова [4] оставляла, однако, открытым воп- рос о том, будет ли сходимость в (0.6) равномерной относительно вы- бора функции распределения F (х) величин %п. В терминах равномерной метрики р (Г, F") = sup | F' (х) - F" (т) |
51. О приближении распределений сумм 443 вопрос заключается в следующем: будет ли функция 1 (n) = sup р (Я„, £>) F стремиться к нулю при п —> оо? Моя работа [1] дала ответ на этот вопрос: было доказано, что ф (п) = О (тГш). (0.7) В 1960 г. Прохоров [5] усилил этот результат, показав, что ф (п) = О (п~ш log2 * п). (0.8) Наша теорема 1 говорит, что 2 ф (п) = О (п~т). (0.9) Было естественно поставить вопрос об оценке функции ф (п) сни- зу. Такими оценками занимались ученик Прохорова И. П. Царе- градский, сам Ю. В. Прохоров и Л. Д. Мешалкин. Последний ре- зультат Л. Д. Мешалкина [6] таков: ф (/г) С3тг’2/3 (log п)“4. (0.10) 2. Для случая сумм п независимых внутри каждой серии, но различно распределенных сла- гаемых *А. Я. Хинчин в 1937 г. [71 установил достаточное условие для того, чтобы предельное распределение было неограниченно делимым. Это условие бесконечной малости слагаемых: существуют —> 0, —> 0, при которых распределения Fki величин удовлетворяют условию Е (х — 1у) — ъ1г < Fki (х) < Е (х + lk) + Наша теорема 2 является попыткой придать этому результату Хинчина равномерный характер. Качественное содержание теоре- мы 2 можно сделать более ясным при помощи «расстояния Леви»: Pl (F, F") - inf 8, где inf берется по 8, удовлетворяющим условию F' (х - 8) - 8 С F" (х) < F' (х + 8) + г. Легко видеть, что из теоремы 2 вытекает такое 1 Верхняя грань берется по всем функциям распределения F. 2 После окончания этой работы я узнал, что Ф. М. Каган в 1961 г. нашел промежуточный между (0.8) и (0.9) результат: ф (п) = О (<1/з log п). Позднее этот результат был доложен Ф. М. Каганом на Совещании по теории вероятностей и математической статистике в Фергане (сентябрь 1962 г.).
№ 51. О приближении распределений сумм Следствие. Если *suppL(Fi, £)< я, i то pL(H, £>)<С4п1/3. 3. Как известно, самым мощным средством доказательства пре- дельных теорем о распределениях сумм большого числа независимых слагаемых является аппарат характеристических функций. «Пря- мые» вероятностные методы сейчас в этой области лишь редко мо- гут выдержать конкуренцию с возможностями аналитического ап- парата характеристических функций. Наши теоремы 1 и 2 являются любопытным примером другого по- ложения вещей. Существенным элементом их доказательства являет- ся лемма 1, относящаяся к введенным Леви «функциям концентра- ции». Теоремы Леви и В. Деблина о свойствах функций концентра- ции были усилены мною (см. [8]) специально для доказательства первых вариантов теорем 1 и 2, данных в [1]. Дальнейшее продви- жение в выводе оценок для функций концентрации принадлежит Б. А. Рогозину (см. [9, 10]). Рогозин тоже пользуется элементар- ными прямыми вероятностными и теоретико-множественными (теоре- ма Эрдеша о подмножествах конечного множества) методами 3. Тем математикам, внимание которых мне удалось привлечь к на- шей задаче, пока не удалое^ доказать теоремы типа 1 и 2 без обраще- ния к указанным сейчас своеобразным средствам. Во всей данной работе, как и в работе [1], существенно исполь- зуются методы рассуждений, введенные В. Деблином (см., напри- мер, [3]). Как видно из сказанного выше, переход от показателя х/5 к показателю 1/3 в теореме 1 был осуществлен Прохоровым. Изгна- ние из оценки Прохорова (0.8) множителя log2 п потребовало: а) упо- требления бол^е точных оценок функций концентрации, полученных Рогозиным; б) некоторых изменений в доказательстве Прохорова, выразившихся во введении лемм 5 и 6 4. При доказательстве теоремы 2 переход от показателя 1/5 работы [1] к показателю х/3 осуществляется близкими приемами, заимство- ванными из работы Прохорова [5] и связанными с употреблением лемм 5 и 6. 4. Кроме расстояния р (Г, F") = sup | F' (х) - F" (х) | , X 3 Доказательство этого результата Б. А. Рогозина (известного ныне как не- равенство Колмогорова—Рогозина) методом характеристических функций было дано в 1966 г. Эссееном.— Примеч. ред. 4 Первый из этих шагов несколько раньше написания моей работы был сде- лан Ф. М. Каганом (см. примеч. 2).
51. О приближении распределений сумм 445* естественно рассмотреть «расстояние по вариации» (F, F") - V2 Var [F (х) ~ F" (х)] sup [F (Л) - F" (Л)], А где Л — произвольное измеримое по Борелю множество прямой.. Как известно, р (F', F") < р„ (F, F"). Поэтому для функции (п) = sup pv (Fn, £>) F имеем неравенство (га) > (га). (0.11) Неизвестно, стремится ли (п) при растущем п к нулю. § 1 ВОСЕМЬ ЛЕММ Следуя П. Леви, для любой функции распределения F (х) введем ее «функцию концентрации» Qf (Z) = sup [F (х + I + 0) - F (.г)]. X Лемма 1. Если при к — 1, 2, . . и, L I 0, Хк — х^'^> I р Ш < й} = Р {Ь > = Vs, то Qh (L) < Сь (L/Г) п^. Лемма 2. Если о > 0, I 0 т] = то для любой функции распределения F (х) F * Go* (х — Г) — к} F (х) F * G02 (х + I) + г]. Лемма 3. Если о 0, CFi 0, то I G 2 (#) — G& (х) | < С7 j о?/о2 — 1 I • Лемма 4. Если \xF (dx) = Q, ^x2F (dx) = o2, mo S sup |F(x)-E(x)|<C8. r=—co гЛ<х«г+1)Л
446 51, О приближении распределений сумм Лемма 5. Если = 0, | | Dg = a2, h > а 0, то У sup * Лемма 6. Если Мс^ — 0, | | <; Z, Dg — а2, сц = о2 4- то \Н * G 2 (#)G 2 (я) I < C10Z/ai. а0 Лемма 7. При любом натуральном п и 0 Р 1 00 т У, I Сп рт (1 - Р)п-т - е~п‘> I < Спр. w= 0 Лемма 8. Пусть 5 0< Рк < 1, 1- Р/с при т = о, Dm Рк (т) = - Рк при т = 1, . 0 при т > 1, Р(т)= Пра-(^а-). (7(т) = П<7АМ). к к - Тогда S|p(m) —9(m)|< CnSpt in к Леммы 2 и 3 доказываются простым подсчетом. Лемма 1 является непосредственным следствием теоремы 1 из заметки Рогозина [9]. Лемма 7 доказана в работе Прохорова [И]. Лемма 4 вытекает из оценки (£ имеет распределение F) F (х) - Е(х) < Р { | I | > | х | } < о2/х2 (неравенство Чебышева). Леммы 5 и 6 примыкают к известной оценке \Н - баз | < C13Z/o, (1.1) которая вытекает из теоремы Ляпунова в формулировке Эссеена ([12, с. 216]): JjM|gs|3. (I-2) 5 Здесь и всюду далее ш = (ттц, . . ., тп) — ??-мерный вектор, У обозначает m суммирование по всем векторам m с неотрицательными целыми компонентами.
51. О приближении распределений сумм 1АТ Лемму 6 можно получить из (1.2), если дополнительное нормаль- ное слагаемое с дисперсией оо представить как сумму большого числа, слагаемых с достаточно малыми дисперсиями. Несколько сложнее доказательство 6 леммы 5. § 2 ДОКАЗАТЕЛЬСТВО ТЕОРЕМЫ 1 1. Будем далее считать п 1. Легко видеть, что это ограничение несущественно. 2. Кроме того, будем считать, что являются неубывающими функциями Ь = Fk1 (пО от независимых между собой величин гц- с равномерным распределе- нием на отрезке [0, 1]: Р tn* < у} = У при 0 < у < 1. Легко показать, что в надлежащем расширении основного поля вероятностей (Q, Р) такие величины существуют 7. 3. Положим р = (О при р/2 < т]^ < 1 — р/2, Pfc — 1 4 ( 1 в остальных случаях, а = М | = 0), о2 = D | = 0}, А (x) = P {gfc < z | Рк = 0}, В (x) = P < x | = 1). При переходе от величин к величинам Sfc = а все эти построения сохраняются. Только вместо а появляется а' = 0ж а функции А (х) и В (х) заменяются на А' (х) = А (х + а), В’ (х) — В (х + а). 6 Лемма 5 легко выводится из следующей оценки А. Бикялиса: где С — абсолютная постоянная (см.: Литов, мат. сб., 1966, т. 6, № 3, с. 323— 346).— Примеч. ред. 2 Функции F^1 следует определить надлежащим образом. Это предостав- ляется сделать читателю.
448 51. О приближении распределений сумм Поэтому можно рассматривать лишь случай а = 0. Им мы ограничимся в дальнейшем. 4. В разложении F (х) = рВ (х) + (1 - р) А (х) распределение А сосредоточено на отрезке #+], х" = F"1 (р/2), х+ - F”1 (1 - р/2), длины X = х+ — х~, а распределение В —- вне этого отрезка, причем каждому из лучей (— оо, х~] и [я+, оо) в распределении В соответствует вероятность 1/2. И распределениям Вт (как и всюду далее, степени распределения по- нимаются в смысле свертки) можно применить лемму 1, что дает оценку ft) (2.1) 5. Распределение Н = [рВ + (1 - р) А ]п = 3 сп Рт (1 ~ р)п~тВт * А п~т т будем приближать неограниченно делимым D по-разному в двух случаях: А. В. \<^Уп(5. Случай А. Положим D = епр(в~Е) = У е прВт Z. 1 т\ ’ m По лемме 7 | D -1Ц | < С11Р = (2.2) В силу леммы 4 и оценки (2.1) при h = % имеем 8 | вт * Ап'т — Вт |< $ | Ап~т(ж — z) - Е(х - z) | Втdz< sup |Лп^(у)-В(р)|<С5С8т-’/.. (2.3) Т гк<у«г-|-1)Х Поэтому 8 Дисперсия распределения Ап^т равна (п — т) а2, так что условия леммы при h — л ifncy выполнены.
51. О приближении распределений сумм 449 | Н - Нг |< 3 С™рт (1 - р)п~т I Вт * Л"-т - Вт I < СъС9п~'/> + 22', ТП где (2.4) 2'= 3 ^pm(l-p)n-’n = P{tx<1/2«a/’}. ТП<1/2П2/з Заметив, что Мр = пр = п’/в, (2,5) Dp = пр (1 — р) п*\ (2.6) получим по неравенству Чебышева S' Р { | р — п*Ь | 1/2п /з} 4n~2/ef что вместе с (2.4) приводит к неравенству I н - Нг I < (2С5С8 + 8) п-Ч (2.7) Из (2.6) и (2.2) получаем (0.1). Случай В. Положим D = еП1.(В-Е) « б = у е'прВт * Gn(l-P)o., Нг = 3 Спрт (1 ~ РГтВт * G(n_m)a., я2 = 2 С™рт (1 - р)п~тВт * Gn(1_rto>. ?н По лемме 7 имеем | D - Н2 | < Спп-К (2.8) Разность Н — Нг оценивается при помощи леммы 5, где полагаем теперь h = У по: | „ Ап-п _ # С(п_т)ог | J | Я”-т (X - Z) - G(n-m) т (ж — z) | х X Вт (dz) < QBm (/п о) У Slip _ | Ап-т (у) — G(n-m)0,(y) | < “J r/na^y<(r4-l)/no < с5 т-^С9 -±- = с,с9т-^. У п б Эта оценка вполне аналогична оценке (2.3) случая А. Точно так жев как в случае А, получаем | Н - Нг I < СъС9п~™ 4- 22' < C15n'lz. (2.9) 1/а15 А. Н. Колмогоров
450 51» О приближении распределений сумм Разность Нг — Н2 оценивается при помощи леммы 3: |Я1~Я2 | < Ci.n'I/3 + где 2'= 3 CnPm(l-p)n-’n. | п-т | Су I п(1-р) Г С, При помощи неравенства Чебышева из (2.5) и (2.6) при п > 1 и над- лежащем выборе См можно получить оценку 2" < что приводит к I ях - Я2 I < (Си + Сц) п~™. (2.10) Из (2.8) — (2.10) получаем (0.1), чем доказательство теоремы 1 заканчивается. § 3] ДОКАЗАТЕЛЬСТВО ТЕОРЕМЫ 2J 1. Будем считать g <; 1, что не ограничивает общности результата 2. Покажем, что достаточно рассмотреть случай непрерывных и строго возрастающих функций F* (х). Предположим, что для непрерывных и строго возрастающих функ- ций теорема 2 доказана с константой С2, и рассмотрим сумму I = + . . . + I» с произвольными (х), удовлетворяющими условию (0.2). Пусть L 2Z. Выберем Г и L’ так, чтобы L > L' > 21' > 2Z, Z7Z/ > VjZ/L. (3.1) В силу леммы 2 можно выбрать столь малое о0, чтобы для любой функции распределения F (х) выполнялись неравенства F * <?2 (х - А) - е < F (х) < F * G 2 (х + А) + g, (3.2) о0 °0 F * G^ (х - Л) - 6' < F (х) < F * G , (х + Л) + б', (3.3) п°о где X - Z' - Z, Л - Л - L\ , б' = С2 п.ах £ (log /г, (2е)‘/.J . Положим Fk = Fjt * G^.
51. О приближении распределений сумм 451 По (0.2) и (3.2) получаем Е (х - V) - 2е < (х) < Е (х + V) + 2е. Так как функции непрерывны и строго возрастают, то существует неограниченно делимое распределение D', для которого D' (х - Z/) — 6' < Я (х) < D (х + L') + б'. (3.4) Замечая, что H’ = H*G 2, пао из (3.3), примененного к F (х) = Н (я), и (3.4) получим D' (х - L) - 26' < Н (х) < D' (х + L) + 26'. (3.4') Так как при надлежащем выборе С2 в силу (3.1) 26' < 2С2 max (log \ (2e)V» J С2 max (log Л, e’/s J ♦ то из (3.4') вытекает (0.3). 3. В соответствии с п. 2 будем далее считать F^ (х) непрерывны- ми и строго возрастающими. Тогда функция h (р) = F? (Г— р/2У- F»1 (р/2)' будет определенной для всех р, 0<р<1, непрерывной и строго убывающей. Она пробегает все положительные значения. Поэтому обратная функция рк (X) определена на 0 < X < оо, непрерывна, строго убывает и пробегает все значения в интервале 1 р > 0i Функция к тоже непрерывная и строго убывающая. Она пробегает все значения в пределах га > $ > 0. Поэтому при 0 < 8 < 1 существует единст- венное решение Хо уравнения а (1) = 4. Мы положим {Xq, если Хо Z, I, если Px = Pk(A), s = s(A) =2Рь к ХК = (рк/2), х+к = Р71 (1 - PS/2), _ (0 при хк < efc <УХк,: — (1 в остальных случаях, 15”
452 51. О приближении распределений сумм ак == М | = 0}, а? = О 1 = 0}, Ст2 = 2 (1 — рк) а|. к Полагая Ак (х) = Р < х | p,fc = 0}, (х) = Р {gfc < х | in = 1}, представим (х) в виде Fk (*) = РкВк (*) + (1 — Рк) А к (х), где распределение Ак сосредоточено на отрезке [х*, л£], а распреде. ление В к — вне этого отрезка, причем так, что лучам (— оо, и LeJ, оо) соответствует вероятность 1/2. Применяя обозначения леммы 8 и полагая 9 П* тъ ТТ* 1-Wr. Вкк, 4(т) = П Ак , к к получим н = П* + (1 — Pfc) Ак] = 2 Р (т) В (т)*А (т). к т Построение аппроксимирующего неограниченно делимого распреде- ления будет различно в трех случаях А, В, С. А в G 1 Хо 1 %о <С Хд <5 10<^ X = Xq К = %о X = 1 s = е-2/’ $ — 8'2/з S — 8~2/3 5. Так как всегда A Z, то Рк = Рк (А) < рк (Z) < е. (3.5) Это единственное в нашем доказательстве обращение к условию (0.2) теоремы. Так как определение р^ (А) и всех прочих существенных для наших построений величин инвариантно по отношению к сдвигам lie = Ik — ^kt 9 В (ш) определены при любых неотрицательных тп^, А (ш) — лишь в слу- чае т^, принимающих значения 0 и 1,
51. О приближении распределений сумм 453 то теперь мы можем ограничиться случаем ак = 0. 6. Сделаем еще некоторые подсчеты, которые понадобятся в даль- нейшем: fc к т равно числу величин лежащих в пределах х£ < < х*. Лег- ко подсчитать, что Мт = s, Dt = Рк (1 — Рк) < s. к Поэтому по неравенству Чебышева Р{|т — s|>C} = £ р(т)<-^. (3.6) |t(m)— s | 7. Пусть, далее, к Это сумма тех которые лежат в пределах < 5* < %к- В силу допущения ах = 0 при любых ш М^ = 0, М(^ |^ = ш) = 0. Нас далее будут интересовать условные дисперсии и2 (m) — D (£ | ц = т). Для случайной величины Р2 = a2 (g) легко подсчитать Мр2 — о2, DP2 = — Pfc) °к- к Так как У, (1 — рк)ак = о2, *к Рк = Рк (А) < рк (?) < е, Имеет место неравенство DP2 < 1/4о2Л28. 15* а. Н. Колмогоров
454 51, О приближении распределений сумм Поэтому Р{|р2_о2|>С}= у р(т)<^. (3.7) 8. Наконец, отметим, что по лемме 1 <2в(т)(Ь)<С5(ЛД0)^(ш). (3.8) Переходим непосредственно к доказательству теоремы 2 в случа- ях А, В й С. Случай А. В этом случае н = П* [ркВк + (1 - Рк) А] = 2 q (па) В (m)* А (па) к m аппроксимируется D = ехр 3 рк (Вк— Е) = ^д (ш) В (ш). к m Для перехода от Н к D рассмотрим еще ZTi = 3p(m)B(m). m По лемме 8 и (3.5) | Я - Я11 < з | Р (m) - д (m) I < С12 3 р\ < С128 3 рк < Спе’/., (3.9) т к к С другой стороны, по лемме 4 при /г = А = ?,0 > а и (3.8) | В (т)*Д (т) — В (т) | <1 § | А (па) (х — z) — Е (х — z) | В (па) (dz) < <?в<т) (U) S sup | Л (т) (у) — Е (у) К С5С8 R (т)]"’/>. г гх0<у«г4-1)ь0 (3.10) Поэтому IН — Я11 <3р(т)IВ (т)*Л (ап) — В(па)|</2С&С6ег'1> + 22', т (3.11) где S' = 3 Р(т). ЦтХ/^/з В силу (3.6), замечая, что в нашем случае 5 = е2/% имеем 2'< 8в-2/» < 4еЧ т. е. из (3.11) вытекает I н - I < (V2C6Ct + 8) еЧ (3.12)
51. О приближении распределений сумм 455 Из (3.9) и (3.12) получаем | Н - D | < Citz'i*. (3.13) Случай В. В этом случае полагаем D = ехр 2 Рп (Вк — E)*G0.= 2 3 (ш) В (m)*Go!, Их = У1 р (ш) В (m^G^m), Я2 — 2 р (п>) В (m)*G0«. т т Неравенство ID - Я2 | < С12е /. (3.14) получается так же, как (3.9) в случае А. По лемме 5 при h = o^>k — (3.8) получаем | В (ш)*А (ш) — В |< < ^|Д(ш)(а: — z) — G^^ix — z)|B(m)(dz)< <<?в(ш)(а)У, sup |A(m) —G^mjK ra<y<(r4-i)o <44* 4=ад, i* (3-15> AO О Точно так же, как в случае А было получено (3.12) из (3.10), полу- чаем из (3.15) | Н - Hi | < (С6С9 + 8) s’/».’ (3.16) Остается оценить разность Ях — Я2, По лемме 3 | Ggt — 6чр(т) | < Cies’S :' если / | о* (т)/а2 - 1 | < Cit/C,. При помощи (3.7), учитывая, что теперь А < а, получаем бцёнку 2*= У, р^ХСгов’/*. (3.17) I a2(m) I Ci. . г , I.. |~—. d / Поэтому аналогично выводу (2.10) при доказательстве теоремы 1 получаем ' < I - Я21 < (Cw + С20) s’/». ,1П , Из (3.14), (3.16) и (3.17) вытекает | Н - D |< С218*/». (3.18) Неравенства (3.12) и (3.18) показывают, что в случаях А и В оценка (0.3), составляющая содержание теоремы 2J может, быть 15*»
456 51. О приближении распределений сумм заменена более сильной: D (х) - C22eV. < Н (х) < D (х) + . (3.19) Случай С. В этом случае получить оценку типа (3.19) не удается. Мы положим ”"=75£(1<,6т-Г’ (’•«>> и введем вспомогательное распределение Hf = Н » GGo. В силу леммы 2 при Т| = Cee’L>/2<70 = l/Lt: (3.21) Н' (ж - L) - л] < Н (ж) < Н' (х + L) + П- (3.22 Далее мы покажем, что неограниченно делимое распределение D = yig(m)B(m)*G 2, а? = о2+Оо» Ш °1 удовлетворяет неравенству + 4-(log4T] • (3,23) Вместе с (3.21) и (3.22) из (3.23) получаем (0.3). Остается доказать (3.23). Для этого вводим распределения В’1 = 3 Р (“)в (m)*G г , о? (т) = о2 (т) + og, т Яа = 3 р (ш) В (m)*G 2. т а1 Доказательство неравенства |Р -Я;|<С128‘/. (3.24) таково же, как доказательство неравенств (3.9) и (3.14) в случаях А и В. Только теперь S=S/’k<8-*/>> к что приводит к оценке Ерк<в2р»<е*/.. к к В силу леммы 3 | Hi - ЯИ < + 2^ р (т), (3.25)
51. О приближении распределений сумм 457 где S'" распространена на те р (ш), для которых I ai (m)/ol - 11 > C^ICi. (3.26) При надлежащем Си из (3.25) вытекает |.О1 (т) — о? | = | а2 (т) — о2 О Охе’/». Поэтому в силу (3.7) и неравенств 10 о2 < о?, Л = I < <т0, Таким образом, из (3.25) получается I - Hl |< (См + 1) еЧ (3.27) Наконец, по лемме 6 получим в силу (3.20) | л (m).G ; -%,|<СИЛ< /2С1,4(1ог4-)’-, откуда | Я' - я; I = /2С10 4 (log 4)’/>. (3-28) Из (3.24), (3.27) и (3.28) непосредственно вытекает (3.23). Этим дока- зательство теоремы 2 заканчивается. Пароход «Сергей Киров», Красное море — Персидский залив, 13—24 марта 1962 г. ЛИТЕРАТУРА 1. Колмогоров А. Н. Две равномерные предельные теоремы для сумм незави- симых слагаемых.— Теория вероятностей и ее применения, 1956, т. 1, № 4, с. 426-436. 2. Finetti В, de. Le funzioni caratteristiche di legge instantanea.— Atti Accad. naz. Lincei. Rend., Ser. 6, 1930, vol. 12, N 7/8, p. 278—282. 3. Doeblin W. Sur les sommes d’un grand nombre des variables aleatoires inde- pendantes.— Bull. sci. math., 1939, vol. 63, p. 23—32; 35—64. 4. Прохоров Ю. В. О суммах одинаково распределенных случайных величин,— ДАН СССР,* 1955, т. 105, № 4, с. 645-647. 5. Прохоров Ю. В. О неравномерной предельной теореме А. Н. Колмогорова.— Теория вероятностей и ее применения, 1960, т. 5, № 1, с. 103—113. 6. Мешалкин Л. Д. О приближении распределений сумм неограниченно дели- мыми законами.— Теория вероятностей и ее применения, 1961, т. 6, № 3, с. 257-275. 10 Второе неравенство получается из (3.20): /= 1/^2"log <5о^<5о.
458 52. Оценки спектральных функций случайных процессов 7. Khintchine A. Zur Theorie der unbeschranktteilbaren Verteilungsgesetze.— Мат. сб., 1937, т. 2, № 1, с. 79—119. 8. Kolmogorov A. N. Sur les proprietes des fonctions de concentrations de M. P. Levy.— Ann. Inst. H. Poincare, 1958, vol. 16, N 1, p. 27—34. 9. Рогозин Б. А. Об одной оценке функции концентрации.— Теория вероят- ностей и ее применения, 1961, т. 6, К® 1, с. 103—105. 10. Рогозин Б. А. Об увеличении рассеивания сумм независимых случайных величин.— Теория вероятностей и ее применения, 1961, т. 6, К® 1, с. 106— 108. 11. Прохоров Ю. В. Асимптотическое поведение биномиального распределе- ния.— УМН, 1953, т. 8, вып. 3, с. 135—142. 12. Гнеденко Б. В.. Колмогоров А. Н. Предельные распределения для сумм независимых случайных величин. М.; Л.: Гостехиздат, 1949. 264 с. 52 ОЦЕНКИ СПЕКТРАЛЬНЫХ ФУНКЦИИ СЛУЧАЙНЫХ ПРОЦЕССОВ* Совместно с И. Г. Журбенко В статье исследуется асимптотическое поведение эффективной статистики спектральной плотности при растущем объеме выборки. Некоторая новая статистика, введенная А. Н. Колмогоровым, срав- нивается с другими, хорошо известными статистиками спектральной плотности, а также с асимптотически наилучшей статистикой с точ- ки зрения среднеквадратичного уклонения. Обсуждается влияние на различные статистики больших выбросов спектральной плотности в соседних частотах. Новый класс статистик получен за счет приме- нения оператора сдвига к периодограмме, вычисленной на основе сглаженных данных. Пусть X (t), t = 0, ±1, . . стационарный случайный процесс со средним MX (t) — 0, ковариационной функцией С (0 и спект- ральной плотностью / (X), где / (X),— оо < оо,— функция пери- ода 2л. Из соображения размерности в качестве допустимого класса статистик естественно рассмотреть все квадратичные формы N s, f=l с произвольными коэффициентами b^l- Как показали Гренандер и Розенблатт [1], асимптотическое поведение при оо первых двух моментов не ухудшится, если вместо класса статистик (1) рассмот- реть более узкий класс статистик вида к № = -2^Г У, &(N) - s) еЧ*'*Х (s)> (2) s, i—1 * Докл. на II Ёвроп. совещ. по статистике, Осло, 14—18 августа 1978 г. Публ. впервые.
52. Оценки спектральных функций случайных процессов 459 которые можно представить в виде N-1 где N-Ш ^(0=4- 2! х(*н(5+Н)- 5^1 Статистики /2у (X) можно представить также в виде л /n(M=S Фц{х)1ц(х + \)dx, (4) —Л где N л = 12. bN(t)=^N(x)e^dx. t=i —л При 7V-> оо асимптотический минимум смещения Д/n (X) = М/д (X)— — / (X) и дисперсии, а следовательно, среднеквадратичного уклоне- ния V/jv (X) — bk (fn (X) — / (Х))а по статистикам класса (2) и (3) согласно [1] не больше чем по статистикам класса (1). Функцию Фn (х) называют «спектральным окном» статистики fx (X), о которой подробнее будет сказано ниже. Асимптотические свойства оценки fN (X) зависят от гладкости спек- тральной плотности / (X). Будем говорить, что X (Z) е х (X, а, С, Сг) = х, если при любом р, и некоторых заданных X, 0< а С > 0, (\ > > 0 выполняется одно из неравенств | / (X + р) - / (X) | < С | р |\ 0 < а < 1, или если существует /' (X), | Г (X + р) - f (X) |< С I р |«-\ 1 < а < 2, а спектральная плотность четвертого порядка /< (хи х2, х31 х*) про" цесса X (t) ограничена I А (^ТЛ &21 *^3’ Х&) | Ср Будем говорить, что последовательность функций Ф# (х) принад- лежит классу Ф2у (х)€= f, если при любом целом N 0 Фдг(х) является непрерывной четной периодической с периодом 2л функ- цией такой, что при любом е 0 равномерно в области е | х | л
460 52. Оценки спектральных функций случайных процессов функция On (х) -> 0 и выполняются следующие соотношения: л л Фл(ж)йх=1, sup |Фх(ж)| dx<^ оо. —л N —л Кроме того, равномерно по классу f выполняются следующие условия гладкости: 1. Для любой интегрируемой функции / (х) такой, что | f (х) | | х |а, 0 < а 2, выполняется соотношение вида л л (^(Фк(аг + г) —Фл(а:))йа:4/2===о ( § |х[“|Ф^(ж)|dx}, ~Л —л где ядро Фейера (z) определяется следующим равенством: sin«(ATz/2) sin3 (z/2) (4а) 2. Существует последовательность чисел А = A (N) ^>0, A (N) -> оо при N оо такая, что при всех | z [ < AIN равномерно по всем у выполняется соотношение л $ Ф/V (я) Ф/V (я + I/+ z) = —Л л л = § Фм (х) Фц (х + у) dx + о ( § Ф# (х) dx}. —Л —л ’ Определим класс f (G) CZ f последовательностей функций On (х) вида лAN Фм(х) = AnG(Anx) ( У G(x)dx} \ —л^х^л, (5) —л An при некоторых An 1 и A n -> оо, An/N 0 при N -> оо. Функцию G (х), — оо х оо, будем считать четной, кусочно дифференци- руемой и удовлетворяющей условиям G(x)dx= i, § | х |а | G (x) | dx < oo (6) —CO —co при некотором a 0. Задача отыскания оптимальной с точки зрения среднеквадратич- ного уклонения статистики решается при указанных выше естествен- ных ограничениях на гладкость функции ФN (#)• При этом находит- ся не только вид асимптотики среднеквадратичного уклонения, как это было сделано Е. Парзеном [2], но и значения коэффициента при этой асимптотике, что позволяет провести численное сравнение всех
52. Оценки спектральных функций случайных процессов /61 наиболее часто используемых статистик спектральной плотности,, предлагаемых различными авторами. Существенным ослаблением используемых условий является также требование гладкости спект- ральной плотности / (X) в одной-единственной точке по сравнению с равномерным условием гладкости 3 |ф£(0<оо, t=£—co где В (t) — корреляционная функция процесса X (0. Заметим, что наименьший возможный. порядок среднеквадратич- ного уклонения оценки fa (X) есть ДМао/(1*2ао)9 где а<) есть максималь- ное а, при котором выполнено последнее условие. Но, к сожалению г а0 является характеристикой гладкости / (X) одновременно по всем частотам [3, 4, 7]. Теорема 1. Если X (t) ЕЕп (X, а, С, СД Ф^ (х) G= F, то для статистики fa (X) при N оо справедливо соотношение inf sup (X) cz> О (а) /2 (X) х X(t)ex(X, а, С, С,) / а йТм _-2“_ х ("m) у 1+2а(1+т,(Х))1+2“ (7) где 1 2ос О (а) = (1 + 2а)“ i+^ ( 1).у+2ст , причем минимум в (7) достигается при Ф# (х) = АмФ^Амх), где Ф(х) = а + 1 2а| И“ + а +1 2а- 0 11, X^O(modn), | О, А, 0 (mod л), (8) О) aNC2 \1/(1+2а) л/з (Л)(1 + а)(1+2а)У (10) Доказательство. Выделив главный член среднеквадра- тичного уклонения Vfa (X) согласно леммам 1 и 2 из [3], приходим к вариационной задаче по отысканию по всем положительным Ф/v (z)ez S & минимума функционала л * л | х (X) xj + S dx‘ —Л г . —л
462 52. Оценки спектральных функций случайных процессов Решая задачу по отысканию условного экстремума, получим, что ре- шение Ow (х) должно удовлетворять уравнению я | X |“ jj ] и |“Фл (х) dx + (<DN (х) — С) = 0, С = const, —Л из которого следует, что решение надо искать в виде (9). Учитывая начальные условия, получим (10), а вместе с ним (7) и (8). Теорема 1 дает явный вид спектрального окна, оптимального с точки зрения среднеквадратичного уклонения оценки fa (X) при заданной гладкости исследуемой спектральной плотности / (X) в точ- ке X. Сравнить между собой асимптотические свойства различных пе- риодограммных оценок вида (2) или (4) позволяет следующая Теорема 2. Пусть Фу и определяется равенством (5), а функция G (х) при некотором а таком, что 0 < a 2, удов- летворяет условиям (6). Тогда если X (t) ЕЕ х, то при N —оо вы- полняется соотношение ZX [Ci \ 1 _ 20С inf sup V7at(X)<x>/2(A,) 1+2а£(«), (И) A]V \ / W / где g (а) = (-Ц^-) (2лУ2)1^ , (12) Vi= У | х |аСг (х) dx, V2 — § G2(x)dx, —оо —оо причем асимптотический максимум достигается при . / Wd+га) н о Доказательство этой теоремы следует из лемм 1 и 2 из [3]. Функция g (а) по формуле (12) может быть вычислена для раз- личных оценок спектральной плотности: Тьюки, Парзена, Бартле- та и других (см., например, [3]), а также для оптимальной статистики, заданной формулой (10). Результаты вычислений приведены в виде таблиц в работах [3, 7]. Общим недостатком периодограммных оценок спектральной плотности fa (X) является слабое убывание (порядка €> (N"1)) зависимости от далеких частот, а также от различных не- •стационарных явлений. Эти недостатки ранее один из авторов (А. Н. Колмогоров) предложил устранить за счет применения «вре- менного окна» и последующего осреднения периодограмм по различ- ным временным интервалам. Пусть ам (0» t = 0, ±1,. . ~ неотрицательная функция, рав- ная 0 вне отрезка [О, М]. По выборке {X ((?),..., X (Q + М)} по-
52. Оценки спектральных функций случайных процессов 463 строим функцию WQM&)= 3 t=—оо Определим статистику (X) спектральной плотности / (X) случайного процесса X (t) следующим образом: Т-1 7h*)=4-£i^w- /с—О Она использует N — Т (L — i) + М + i выборочных значений процесса X (t). Рассмотрим оценку спектральной плотности. Определим «окно данных» следующим образом: ам (0 = ак< р (0 = Ц (К, Р) (^^Lyp-KCK, ₽ (t), (13) где М = К (Р — 1) и коэффициенты Ск,р определяются из соотно- шения У, ?C'Ktp(0 = (l + z + ...+zP-i)K=(-lr=±.j . t—о Так как <Рм,р(.г) = Фм(я) = 3 Лм(О^'ж, £=—оо то из выражения (13) следует, что «спектральное окно» рассматривае- мой оценки равно |ФХ.р(1)Г=^(г, Р)(-^71> (,3а) где |л (К, Р) -> 1 при К -> оо, Р -> оо (см. [3]). Из определения спектральных плотностей второго и четвертого порядков вытекают следующие равенства для оценки (X): ДММ= $ |фМ(х-MIW)-(14) —л DfN(l)==-yr 6*(xi + ... + ж4)/4(ЛГ1, ..^4)фм(ж1 + Х) X П< X фм (^2 — ^) Фм (Хз — X) фм (х4 — %) х Х sin(L(z33+xi)l2) dXldXzdXidxt + ~W x n«
4Ы 52. Оценки спектральнчх функций случайных процессов х / (у + %) I Фм (х) I* I Фм (у) I» dxdy + 4-уг J 7(^)/(У)фм(®+^)фм(—х4-Л)фм(у — Х)фм(— у — %)х П» sin»(TL(* + y)/2) sin« (£(» +у)/2) где П = [— л, л], dxdy, (15) 6*(х) = § 6(x-f-2ftn), (15а) £==—ОО 6 (х) — дельта-функция Дирака. Теорема 3. Если X (t) ЕЕ и, то для статистики fx (X) при X ф О (mod л) с коэффициентами, определяемыми равенством (13), при длине выборки N = (L (Г — 1) + К (Р — 1) + 1) -> оо спра- ведливо соотношение , Съ •___ inf sup V/n(X)ooh4(^ Р)/2(М(те)1+2а^(а)^ 1+2а’ (16) т, ь, к, р x(t)sx \ 7 W / где 1 + 2а -I / л ( аУ~24 р2 / а 4- 1 \ \1/(1+2а) 2а г 6 \ дЗ \ 2 / / причем асимптотическое равенство (14) достигается при г 7у(1-2а)/(1+2а) -^>-0(1), -------, <>(!), КРг ( Г2 / 1 \ — _\-2/(1+2«) jyi/(i+2a) ”"*0(1), —j = 0(1). (17) Доказательство. Непосредственное применение метода Лапласа оценки интеграла в правой части (14) с ядром фк,р (х), вы- численным по формуле (13а), дает равенство sup Mfr (К = р4 (К, Р) )‘“С2Г2 ) 1 + °_(g-~ • X(t)ex \ iz / \ z / л Главный же член дисперсии DfN (X) дает выражение, которое мето- дом перевала приводится к следующему виду: I = И4 (К, Р)Р(X) *) (1 + о( t L ) + о(4-)). TZ/6 \ \/ЛГ(Р2_1)/ \ к ц (18) Разность между (18) и вторым слагаемым (15) оценивается следующим образом: a< 1.
52. Оценки спектральных функций случайных процессов 465 В случае а > 1 величина 11 — 121 имеет порядок Р У К (TL)~2. Аналогичным образом показывается, что третье слагаемое форму- лы (15) имеет меньший порядок. Первое слагаемое формулы (15) в ус- ловиях теоремы оценивается следующим образом: |Л|<^(1 + О(-Г7^П7) + О(^)). Положив К (Р2 — 1) = vNv и отыскав минимум V/jy (X), получим асимптотическое равенство (16). Теорема доказана. Как показывают вычисления (см. [3, 7]), среднеквадратичное ук- лонение оказывается наиболее близким к оптимальному в случае статистики Колмогорова (X) по сравнению с оценками Тьюки, Парзена, Бартлета, Абеля и. некоторых других. Как следует из тео- ремы 3, статистика (X) по сравнению с остальными нечувствитель- на к изменению параметров, которые можно выбирать в широких пределах. Степень зависимости от далеких частот в этой статистике имеет порядок где К можно выбрать как угодно большим при оо. Это дает возможность проводить спектральный анализ в нужной полосе частот при наличии сильных шумов и нестационар- ностей, сосредоточенных в других частотах, например в присутствии тренда. Одновременно легко можно проводить проверку на стацио- нарность в исследуемой полосе частот. Рассмотрим эффект влияния сильного выброса в спектральной плотности f (х) в соседней к % частоте X + А. Предположим, что / (я) = /а (®) + /в (*)> где /а (х) — спектральная плотность процесса Ха (t) а Д (#) определяется равенством вида /6 (х) = 6-6* (х - X — А) + 66* (х + X + А)м А =£ 0 (mod 2л), (19) в котором 6 > 0 — действительное число, а функция 6* (х) дана в формуле (15а). Будем говорить, что X (0 Ex (X, А, 6), если спект- ральная плотность процесса X (t) определена равенством (19), семи- инвариантная спектральная плотность четвертого порядка ограниче- на и MX (t) = 0. Асимптотику среднеквадратичного уклонения статистик с опти- мальным выбором параметров при наличии 6-выброса в частоте X + А описывает следующая теорема (см. [5—7]). Теорема 4. Пусть X (t) ЕЕп (X, А, 6), ядра <l>w (х) е & определяются равенством (5), а функция G (х) удовлетворяет усло- вию (6) при а <1 2, параметр Aw статистики fn (X) выбран согласно равенству (12а). Тогда при N -+ оо справедливо sup V/N (X) = /2 (X) У/(1+2а)АГ2а/(1+2а) х •X(t)EX(b, A. W XlWI X (1 + n (М)2а/(1+2а)£ (а) (Г + о (1)) +
466 52. Оценки спектральных функций случайных процессов л я + 262^ Фдг(х)<ри(х 4- Д)dx + (Djv(a:)<p?f (a: + 2X+A)<fa^2+ —я —я я + О (у J (Dw (х) <р% (х + Д) dx}, (20) —Л где (1, X = 0 (mod я), nW = |o, l^O(modn), (21^ а функции флг (я) и g (а) определены равенством (4a) и (12a) соответ- ственно. Теорема 5. Пусть X (t) ЕЕп (X, А, 6) а статистика fa (X} определяется коэффициентами ам (0> вычисленными согласно (13) в условиях (16) при N = L (Т — 1) + М (Р — 1) + 1 °0- Тогда справедливо соотношение SUP = Х(#)ех(Х, д, б) \ г W / X дг2а/(1+2а) (1 + Т] (Х))2“/(1+2“> (1 + о (1)) + 2б2 (| фм (Д) I2 + + | Фм (А + 2Х) |2)2 + О (ДГ“/<1+2а) | фм (Д) |2), (22) где | фп (х) |2, К (а) и х\ (А,) определяются формулами (13a), (16a) и (21) соответственно. Доказательство теорем 4 и 5 приведено в работах [5—7) Заметим, что остаточные члены (20) для статистики (X) имеют порядок не меньше чем | Ф2У (А) I 4 = О (АГ2), ’ л (23) если А 7V-e/(i+2a)(i+e), д в случае статистики fa (А) порядок остаточных членов (22) не меньше чем 1ф^ (А)!^^2^^2^^, что может быть сделано как угодно малым по отношению к (23) при N -> оо и сравнительно небольшом к. При этом д > Р"1 ~ с /ог1/(1+2а). Статистики fa (А) согласно (23) имеют фиксированный порядок за- висимости от б-выброса, который нельзя уменьшить за счет выбора спектрального окна Ф2у {х}. ЛИТЕРАТУРА 1. Grenander U., Rosenblatt М. Statistical analysis of stationary time series. New York: J. Willey, 1957. 2. Parsen E. On asymptotically efficient consistent estimates of the spectral den- sity function of a stationary time series.— J. Roy. Statist. Soc. B, 1958, vol. 20, p. 303—322.
53. О логических основаниях теории вероятностей 467 3. Журбенко И. Г. Об эффективности оценок спектральной плотности стацио- нарного процесса.— Теория вероятностей и ее применения, 1980, т. 25, №3, с. 476-489. 4. Журбенко И. Г. Исследование статистик спектральной плотности стацио- нарного случайного процесса.— Сиб. мат. журн., 1981, т. 22, № 5, с. 40—65. 5. Журбенко И. Г. Об эффективности оценок спектральной плотности стацио- нарного процесса. II.— Теория вероятностей и ее применения, 1983, т. 28, № 2, с. 388—396. 6. Журбенко И. Г. О предельной теореме для статистик спектральной плот- ности с временным сдвигом.— Укр. мат. журн., 1980, т. 32, № 4, с. 463— 476. 7. Журбенко И. Г. Спектральный анализ временных рядов. М.: Изд-во МГУ, 1982. 53 О ЛОГИЧЕСКИХ ОСНОВАНИЯХ ТЕОРИИ ВЕРОЯТНОСТЕЙ* Говоря о случайности в обыденном смысле этого слова, мы имеем в виду те явления, в которых мы не обнаруживаем закономерностей, позволяющих нам предсказывать их поведение. Вообще говоря, нет причин предполагать, что случайные в этом смысле явления подчи- няются каким-то вероятностным законам. Следовательно, нужно различать случайность в этом широком смысле и стохастическую случайность (которая является предметом теории вероятностей). Возникает проблема описания причин применимости математи- ческой теории вероятностей к явлениям реального мира. Моей пер- вой попыткой ответить на возникающие в связи с этим вопросы была статья [1] (опубликованная в издании методологического характера). Поскольку случайность определяется как отсутствие закономер- ностей, прежде всего следует определить понятие закономерности. Естественным средством для этого служит теория алгоритмов и ре- курсивных функций. Первая попытка применить ее в теории вероят- ностей была сделана Черчем [2]. Цель моего доклада — познакомить слушателей с этой областью хотя бы в первом приближении. Отдавая дань традиции, начнем с классического определения вероятности как отношения числа благоприятных исходов к общему числу всех возможных исходов: Р = тп/п, где п — число всех возможных исходов (одного испытания), а тп — число благоприятных исходов. Это определение сводит задачу вычис- ления вероятности к комбинаторным задачам. ♦ On logical foundations of probability.— Leet. Notes Math., 1983, N 1021, p. 1—5. Перевод A. 3. Звонкина, А. А. Новикова и А. Шеня.
468 53. О 'логических основаниях теории вероятностей Однако во многих практически возникающих ситуациях это оп- ределение неприменимо. Это послужило стимулом к появлению так называемого статистического определения вероятности: Р ~ И/Л\ (1) где N — общее число испытаний, предполагаемое достаточно боль- шим, |л — число успехов. Это определение в своей первоначальной форме, строго говоря, не является математическим. По этой при- чине в формуле (1) стоит знак приближенного равенства. Первая попытка уточнить определение (1) была предпринята Р. Мизесом. Но, прежде чем описать его подход, обсудим (с точки зрения классического определения вероятности) вопрос о том, по- чему в природе так часто встречается устойчивость частот. Рассмотрим все последовательности нулей и единиц длины п, «содержащие ровно т единиц, считая их равновероятными. Пусть выбран какой-либо способ деления любой последовательности длины п на две подпоследовательности. Тогда для каждой последователь- ности важно сравнить частоты единиц в двух ее подпоследователь- ностях, вычислив разность I — ^2^2 I и п2 — длины подпоследовательностей, и р2 — число еди- ниц в них, так что + п2 = п, рх + р2 = т). Хотелось бы ожи- дать,; что эта разность будет почти всегда малой в том смысле, что при любрм е > О ^classiUr----“Г <8Н ПРИ ^2->оо. (J 7&1 П2 | J Разумеется, чтобы превратить это утверждение в теорему, необ- ходимо ограничить класс возможных правил выбора подпоследова- тельностей (например, запретить правило: поместить в одну из под- последовательностей все нули, а в другую — все единицы). Сжатья 13] содержит необходимые уточнения понятия допустимого правила выбора подпоследовательности, основанные на идеях Мизеса. По- нятие допустимого правила выбора играет решающую роль в мизе- совском частотном подходе к понятию вероятности. Согласно Ми- зесу бесконечная последовательность Хх, Х2, . . . нулей и единиц называется бернуллиевской, если: 1) существует предел Р = Ит — У 2) этот предел остается неизменным, если мы переходим от всей последовательности к ее подпоследовательности, выбранной с по- мощью допустимого правила выбора: lim — У Хп. = Р.
53. О логических основаниях теории вероятностей 469 Говоря о допустимых правилах выбора, Мизес дал лишь общую их характеристику и привел несколько примеров. Его указания сводятся к тому, что выбор очередного члена подпоследовательности не должен зависеть от его значения, а должен определяться значе- ниями предыдущих членов. Разумеется, это определение не является точным, но точного определения нельзя было и ожидать, поскольку само понятие «правила» не имело в то время математического уточ- нения. Ситуация существенно изменилась, когда появились понятия алгоритма и рекурсивной функции, с помощью которых Черч [2] уточнил определения Мизеса. В упомянутой выше статье [3] пред- ложен класс допустимых правил выбора, более широкий, чем у Чер- ча. Согласно [3] правило выбора задается алгоритмом (или, если угодно, машиной} Тьюринга). Выбор очередного члена подпоследо- вательности происходит следующим образом. Входная информа- ция состоит из конечной последовательности чисел тг19 п2, •••» и значений ХП1, ХП2, . . ., Xnit соответствующих членов исходной последовательности. Выход алгоритма состоит, во-первых, из но- мера пк+1 следующего просматриваемого элемента последователь- ности (который не должен совпадать с пъ п2, . . ., на их порядок ограничений не накладывается) *и, во-вторых, из указаний, должен ли элемент Хп/г+1гбыть выбран лишь для просмотра или он включает- ся в выбираемую подпоследовательность. На следующем шаге ра- боты алгоритма его вход состоит уже из более длинной последова- тельности пи м nfc+i; алгоритм} начинает работу с пустого входа. В сравнении с [2] расширение класса допустимых правил выбора состоит в том, что порядок членов в подпоследовательности не обязан совпадать с их порядком в исходной последовательности. Другое, более важное различие состоит в'строго финитном характере всей упо- мянутой выше концепции и в количественной оценке устойчивости частот. Переход к конечным последовательностям неизбежно приводит к необходимости накладывать ограничения на сложность выбираю- щего алгоритма. Точное определение сложности конечного объекта и примеры его применения к теории вероятностей были предложены в работах [3, 6]. Результаты частотного и сложностного подхода сравниваются в [4]. Теперь вернемся к исходной идее, согласно которой «случайность» состоит в отсутствии «закономерности», и ^посмотрим, как понятие сложности конечного объекта позволяет придать ей точный смысл. Понятию сложности посвящено большое число работ, делящихся на две группы: первые касаются сложности вычислений, а вторые — сложности определений. Мы будем говорить о последних. Воспроизведем определение сложности из [6]. Мы определяем Условную сложность конструктивного объекта относительно неко- торого алгоритма А при условии^ что известен конструктивный алго-
470 53. О логических основаниях теории вероятностей ритм У. Более точно, определим условную сложность К а (X | У) объекта X при известном У как длину наименьшей программы, с по- мощью которой алгоритм А может получить X из У: КА {X | У) = min {I (р) | А (р, У) = X}. Здесь I (р) — длина последовательности нулей и единиц, рассмат- риваемой как программы. Существует «оптимальный» алгоритм Л, т. е. такой, что для любого алгоритма А± существует такая констан- та С, что для всех X и У справедливо неравенство К А (X I У) < KAl (X I У) + С. Если Аг и А2 — оптимальные алгоритмы, соответствующие функции сложности отличаются не более чем на аддитивную константу (не зависящую от X и У). Теперь можно определить понятие случайного или, более точно, Д-случайного объекта в данном конечном множестве М (здесь Д — число). А именно: мы говорим, что X ЕЕ М является ^-случайным элементом в М, если КА (X | У) > log2 | М | - Д, где | М | — число элементов в М. Будем называть случайными в М те объекты из М, которые являются Д-случайными при сравнитель- но малых Д. Мы получаем определение случайного конечного объек- та, которое можно рассматривать как окончательное. Взяв в качестве М множество Dn всех последовательностей нулей и единиц длины п, мы приходим к условию КА (X |Dn) > п - Д. Можно доказать, что для последовательностей, удовлетворяющих этому условию при достаточно малом Д, справедливо, в частности, свойство устойчивости частот при переходе к подпоследовательно- стям. Следовательно, требования Мизеса к случайным последова- тельностям могут рассматриваться как частный случай наших требо- ваний. Дальнейшие результаты в этом направлении могут быть найдены в работах [5/ 7,-12]. ЛИТЕРАТУРА 1 Колмогоров А. Н. Теория вероятностей.— В кн.: Математика, ее содержа- Гние, методы и значение. М.: Изд-во АН СССР, 1956. 2. Church A. On the concept of a random sequence.— Bull. Amer. Math. Soc., 1940, vol. 46, N 2, p. 130—135. 3. Kolmogorov A. N. On the tables of random numbers.— Sankhya, Ser. A, vol. 25, pt. 4, p. 369—376. Рус пер.: Колмогоров A. H. О таблицах случайных чисел.— В кн.: Семиотика и информатика. М.: ВИНИТИ, 1982, вып. 18» с. 3—13. 4. Шень А. Частотный подход к определению понятия случайной последова- тельности.— В кн,: Семиотика и информатика. М,: ВИНИТИ, 1982, вып. 18» с, 14—42,
53. О логических основаниях теории вероятностей 471 5. Loveland D. A new interpretation of the von Mises concept of random sequen- ce.— Ztschr. math. Log. und Grundl. Math., 1966, Bd. 12, H. 4, S. 279—294. 6. Колмогоров A. H. К логическим основам теории информации и теории ве- роятностей.— Проблемы передачи информации, 1969, т. 5, № 3, с. 3—7. 7. Solomonoff R. J. A formal theory of inductive inference.— Inform, and Contr., 1964, vol. 7, N 1, p. 1—22. 8. Mar tin-Lof P. Algorithms and random sequences. Erlangen: Univ. Press, 1966. 9. Martin-Lof P, The definition of random sequences.— Inform, and Contr., 1966, vol. 9, N 6, p. 602-619. 10. Вьюгин В. В. Алгоритмическая энтропия (сложность) конечных объектов и ее применение к определению случайности и количества информации.— В кн.: Семиотика и информатика. М.: ВИНИТИ, 1981, вып. 16, с. 14—43. И. Chaitin G. On the length of the programs for computing finite binary sequen- ces.— J. ACM, 1966, vol. 13, N 4, p. 547—569. 12. Звонкий А. К., Левин Л. А. Сложность конечных объектов и обоснование понятий информации и случайности с помощью теории алгоритмов.— У МН, 1970, т. 25, вып. 6, с. 85—127.
КОММЕНТАРИИ К РАБОТАМ ПО ТЕОРИИ ВЕРОЯТНОСТЕЙ И МАТЕМАТИЧЕСКОЙ СТАТИСТИКЕ А. Н. Колмогоров Приведу некоторую классификацию моих работ по теории вероят- ностей с учетом как их содержания, так и времени написания. I. Предельные теоремы для независимых и слабо зависимых слу- чайных величин, получаемые методами метрической теории функ- ций. Работы № 1—6, 8. По методам эти работы, посвященные различным видам законов больших чисел и закону повторного логарифма, примыкают к моим и Д. Е. Меньшова работам по метрической теории функций и велись в тесном контакте с А. Я. Хинчиным. Из примыкающих сюда после- дующих работ других исследователей следует в первую очередь ука- зать на необходимые и достаточные условия применимости усилен- ного закона больших чисел для сумм независимых случайных вели- чин, полученные Ю. В. Прохоровым. II. Аксиоматика и логические основы теории вероятностей. Ра- бота № 7. Первым результатом моих размышлений над логической струк- турой теории вероятностей явилась работа № 19 опубликованная в 1929 г. Здесь теория вероятностей представляется в качестве одной из областей применения общей теории меры. Но развитые концепции еще не раскрывали теоретико-множественного смысла фундаменталь- ного в теории вероятностей понятия условной вероятности. Только после преодоления этой трудности и построения теории распределе- ний в бесконечных произведениях оказалось возможным говорить о теоретико-множественном обосновании всей теории вероятностей, которое было дано в моей монографии «Основные понятия теории вероятностей», вышедшей в 1933 г. на немецком языке и в 1936 г. на русском. Модернизированное изложение этих концепций, подго- товленное мною совместно с А. Н. Ширяевым, дано во втором изда- нии этой монографии (М.: Наука, 1974). III. Цепи Маркова (марковские процессы с дискретным време- нем). Работы № 21, 23, 36, Фундаментальное значение марковского процесса было понято в 1906—1907 гг. А. А. Марковым. Со строго финитной точки зрения существо дела может быть полностью охарактеризовано уже на ко- нечных дискретных цепях Маркова. Для случая однородных цепей с конечным числом состояний А. А. Марков установил фундамен- тальную теорему о существовании предела у переходных вероятно- стей. Вся примыкающая сюда проблематика живо заинтересовала В. И. Романовского (Ташкент), а затем и многих представителей московской вероятностной школы. Для случая однородной цепи
К работам по теории вероятностей и статистике (А. Н. Колмогоров) 473 с конечным число состояний наиболее исчерпывающие результаты были получены С. X. Сираждиновым — учеником В. И. Романов- ского и А. Н. Колмогорова. Именно им для этого случая полностью определена асимптотика многомерных распределений числа попада- ний в различные состояния. IV. Марковские процессы. Работы № 9, 10, 13, 14, 17, 19, 24, 39. В 1929 г. центральной областью моих интересов сделалась теория марковских процессов с непрерывным временем. В мемуаре № 9 (одномерный случай) и в работе № 17 (многомерный случай) эта тео- рия была развита в классических терминах без употребления в яв- ном виде пространств траекторий. Первые варианты современной концепции марковского процесса с непрерывным временем были по- строены Дж. Дубом и Е. Б. Дынкиным (см. по этому поводу коммен- тарий А. Д. Вентцел я). Различным применениям теории марков- ских процессов диффузионного типа посвящены работы № 14, 19, 24 (см. комментарий А. М. Яглома). Случаю дискретного множества состояний посвящена работа № 39 (см. комментарий А. А. Юшкеви- ча). V. Предельные теоремы о сходимости цепей Маркова к марков- ским процессам с непрерывным временем. Работы № 9, 12, 16, 41. Первый замысел такого рода теорем изложен в 1931 г. в § 12 ме- муара № 9. Два примера таких теорем даны в работах № 12, 16. Далее работа в этих направлениях широко развернута другими ис- следователями (принцип инвариантности). См. обзорную статью № 41. VI. Стационарные процессы. Работы № 27, 28, 47, 48, 50, 52. Мой интерес к спектральной теории стационарных случайных процессов возник в связи с работами А. Я. Хинчина и Е. Е. Слуц- кого. Первоначальные представления о проблематике читатель мо- жет получить из статьи № 34. Прошедшие почти 40 лет подтвержда- ют гипотезу о представлении колебательных процессов в виде ин- тегралов Стилтьеса (см. формулу (4) в № 34). По-видимому, следует и в преподавании (в частности, для инженеров) более смело подчер- кивать то обстоятельство, что спектральная разложимость процесса не допускает в общем случае более конкретного объяснения. VII. Ветвящиеся процессы. Работы № 25, 32, 33, 46. Частные виды «ветвящихся процессов» многократно изучались. Обзор старой литературы см. в работе Ж. Стеффенсена, указанной в статье № 25. В известной монографии Р. А. Фишера широко ис- пользуется тот факт, что эволюция численности гена в популяции, пока концентрация гена мала, происходит в соответствии со схемой ветвящегося процесса. Применение математического аппарата про- изводящих функций было предложено Р. А. Фишером. О дальней- шем развитии теории ветвящихся процессов см. монографию Б. А. Севастьянова «Ветвящиеся процессы» (М.: Наука, 1971). VIII. Различные применения. Работы № 14, 18, 22, 26, 29, 37. В работе № 14 решена задача, поставленная С. И. Вавиловым. 16 А. Н. Колмогоров
4М Комментарии Разделы 1 и 2 этой статьи написаны мной, раздел 3 — М. А. Леонто- вичем. В связи с работой № 18 отмечу, что рассматриваемое «взду. вание» эмпирических коэффициентов корреляции при небольшом числе наблюдений является довольно типичным для большого числа прикладных работ (см. также комментарии к этому циклу А. М. Яг- лома). IX. Математическая статйстика. Работы № 11, 15, 30, 31, 38, 50. См. комментарии Э. В. Хмаладзе, М. Б. Малютова, А. Н. Ширяева. АНАЛИТИЧЕСКИЕ МЕТОДЫ В ТЕОРИИ ВЕРОЯТНОСТЕЙ (к Ко 9) (А. Д. Вентцель) Название статьи, которое на современном языке звучало бы, скорее, как «Аналитические методы в теории марковских процессов», может служить назва- нием целого направления в этой теории. Суть этого направления в том, что мар- ковские процессы рассматриваются лишь до тех пор, пока задача, о которой идет речь, не переводится на язык переходных вероятностей Р (s, я, t, Е) мар- ковского процесса или других аналитических объектов, с ними связанных; а дальше задача решается, как чисто аналитическая. В самой статье (№ 9 наст, изд.) случайные процессы как ансамбли реализаций (траекторий) или как объек- ты, описываемые системой конечномерных распределений, вообще не входят в рассмотрение явно, но только в виде мотивировок некоторых определений и до- пущений. Так, после введения предложений (111), (112) говорится: «Только в этом случае, строго говоря, процесс будет непрерывным во времени». На языке современной теории марковских процессов это можно было сформулировать так: (111), (112) близки к условиям на переходную функцию, нужным для непрерыв- ности траекторий соответствующего марковского процесса (точнее, для сущест- вования его модификации с непрерывными траекториями). Основные темы статьи — общее понятие стохастически определенного (мар- ковского) процесса; дифференциальные характеристики марковских процессов и дифференциальные уравнения, связанные с этими процессами; эргодические свойства. Что касается понятия марковского процесса, то в дальнейшем, по мере на- копления методов решения конкретных классов задач, связанных с течением марковского процесса на целом отрезке времени, траектории стали все более явно входить в рассматриваемые схемы. Так, в 1933 г. были опубликованы работы Колмогорова и Леонтовича [1] и Андронова, Витта, Понтрягина [2], в которых выводились дифференциальные уравнения для функций, связанных с диффу- зионным процессом с наложенным условием отсутствия выхода в течение данно- го времени из определенной области. Общие теории, включающие не только пе- реходные функции, но и траектории в качестве явного объекта рассмотрения, были изложены в книгах Дуба [3] и Дынкина [4]. Обе теории основывались на понятиях условной вероятности и условного математического ожидания относительно с-алгебры; но в дубовской теории основной объект — случайный процесс на некотором вероятностном пространстве, удовлетворяющий условию
Аналитические методы (А.Д. Вентцель) 475 независимости будуТцего и прошлого при фиксированном настоящем, а в дын- кинской — целое семейство таких процессов, начинающихся в произвольный момент времени в произвольной точке пространства (что выражается рассмотре- нием семейства вероятностных мер Ps<)х и вероятностных пространств (Q, Р s,x))* Сначала аналитическое направление в теории марковских процессов было фактически единственно господствующим; в 50-е годы стали широко применяться прямые вероятностные методы, имеющие дело с построением реализаций одних случайных процессов, исходя из реализаций других более простых: стохастиче- ские уравнения, случайные замены времени. Аналитические и прямые методы дополняют друг друга.. Возникло направление противоположной ориентации, применяющее теорию марковских процессов к получению чисто аналитических результатов. С 70-х годов, пожалуй, нельзя говорить о чисто аналитическом на- правлении в теории марковских процессов, а лишь о сильном преобладании ана- литических методов в некоторых работах. Центральный вопрос для аналитического направления в теории марков- ских процессов с непрерывным временем — дифференциальные характеристи- ки процессов и механизмы, осуществляющие их связь с самими процессами. Да- дим обзор эволюции способов ответа на этот вопрос и некоторых достижений аналитического направлении в теории марковских процессов. В № 9 дифференциальные характеристики вводятся для процессов с диск- ретным пространством состояний формулами (50) и для непрерывных (диффу- зионных) процессов на числовой прямой формулами (114), (124), (115), (122). Существование пределов (50), (122), (124) (фактически дифференциальных ха- рактеристик при s = t) устанавливается в предположении дифференцируемости переходных вероятностей Pij (s, t), соответственно плотностей вероятностей пе- рехода / (5, х, t, у) при s < t (плюс дополнительное условие необращения в нуль определителя (119)). В обоих случаях выводятся обратные дифференциальные уравнения — с дифференцированием по первому временному аргументу s: (57). 125) — и прямые — с дифференцированием, по второму аргументу t: (52), (133), Ставится вопрос о существовании и единственности решения, удовлетворяющего естественным условиям при s = t и условиям (1), (3) (в конкретных случаях (40), (41) и (85), (86)), нужным для существования соответствующего процесса; но в непрерывном случае он решается только тогда, когда уравнение сводится к классическому уравнению теплопроводности. В § 19 выписываются также диф- ференциальные характеристики для чисто скачкообразного марковского процес- са и предположительное прямое дифференциальное уравнение (175) (также уравнение (176) для процесса с диффузией между скачками). * Задача нахождения плотности вероятностей перехода для диффузионного процесса, если ее сформулировать аналитически,— это задача нахождения фун- даментального решения параболического дифференциального уравнения. Теоре- мы существования и единственности при широких условиях были получены еще в 30-е годы (работа Феллера [5]); были получены и теоремы существования и единственности для чпсто скачкообразных процессов и процессов с диффузией между скачками. Дифференциальные характеристики марковских процессов в № 9 вводятся отдельно для разных конкретных классов процессов; эти характеристики — 16*
476 Комментарии функции от соответствующих аргументов. Следующий шаг — рассмотрение в ка- честве дифференциальной характеристики марковского процесса не набора функ- ций, а линейного (иногда неограниченного) оператора — был сделан, когда к марковским процессам была применена теория полугрупп линейных операторов. В качестве характеристики марковского процесса (говоря точнее и уже, его пе- реходной функции) вводился инфинитезимальный оператор полугруппы опера- торов, связанной с процессом. Теория полугрупп позволила установить при очень слабых ограничениях единственность переходной функции, отвечающей данному инфинитезимальному оператору, и найти необходимые и достаточные условия, которым должен удовлетворять такой оператор. Вопрос о существовании диф- ференциальных характеристик был снят: согласно общей теории инфинитези- мальный оператор имеет всюду плотную область определения. Теория полугрупп непосредственно применяется только к однородным по времени марковским процессам, т. е. процессам с переходной функцией, завися- щей только от разности моментов времени: Р ($, х, t, Е) — Ро (t — s, х, £); для применения ее к неоднородным процессам их можно при помощи введения расширенного пространства состояний свести к однородным. Первые применения теории полугрупп относились к связанной с переходной функцией полугруппе операторов, переводящих начальные распределения в рас- пределения в последующие моменты времени (ср. №9 формулу (5)), что связано с аналогами прямых колмогоровских уравнений (см. (52), (133)). Однако более плодотворным оказалось применение полугрупп операторов, действующих не на начальные распределения, а на функции: г(Нж)= Jac*,*, <w(»); 81 это связано с аналогами обратных уравнений (57), (125). Существенной для связи между марковскими процессами и их инфинитези- мальными операторами, в частности для вывода уравнений для математических ожиданий, связанных с процессом, оказалась возможность рассматривать значе- ния процесса в случайные моменты времени, такие, как момент первого выхода из множества. Эта возможность была обеспечена введением в рассмотрение стро- го марковского свойства. Используя строго марковское свойство, Дынкин ввел новый вид дифференциальной характеристики марковского процесса — харак- теристический оператор (см. [4]), т. е., скорее, не новый вид такой характерис- тики (потому что при естественных широких допущениях характеристический оператор совпадает с инфинитезимальным), а новый аспект связи этого операто- ра с марковским процессом. Новые методы дали возможность решить задачу полного описания всех од- нородных по времени одномерных диффузионных процессов (т. е. строго марков- ских процессов с непрерывными траекториями). Одновременно были найдены плодотворные постановки новых задач, в частности, о поведении марковского процесса, заданного внутри области, после выхода на ее границу (аналитическая постановка — нахождение граничных условий, сужающих данный линейный
Аналитические методы (А. Д. Вентцелъ) 477 оператор до инфинитезимального оператора полугруппы сжимающих и сохра- няющих положительность операторов; см. [6]). Дальнейшее развитие аналитических методов, последовавшее за работой Ханта [7], было связано с рассмотрением, с одной стороны, общих неотрица- тельных аддитивных функционалов от марковских процессов, а с другой, ана- литической,— эксцессивных функций (неотрицательных супергармонических относительно данной полугруппы операторов функций). С помощью рассмотре- ния крайних точек множества этих функций были найдены способы построения идеальной границы области, соответствующей данному марковскому процессу внутри области (граница Мартина). Новый подход к вопросу о дифференциальных характеристиках марковско- го процесса был начат работами Фукусимы (см. [8]). В этих работах в качестве такой характеристики рассматривается не инфинитезиальный оператор, а соот- ветствующая ему билинейная форма Дирихле. Полная и замкнутая теория здесь получается, однако, только для случая, когда полугруппа состоит из операто- ров, симметричных относительно некоторой меры (на теоретико-вероятностном языке — для обратимых во времени марковских процессов). Были получены су- щественные результаты, касающиеся возможных продолжений по выходе из об- ласти марковского процесса, заданного внутри области (в частности, построено- броуновское движение с «отражением по нормали» на сколь угодно негладкой границе). В 60—70-е годы, особенно после работ Струка и Варадана [9], стал широко» использоваться подход к связи между линейными операторами и марковскими процессами, основанный на понятии мартингала и «мартингальной задачи»» Вместо строго марковского свойства при этом подходе используется сохранение мартингального свойства в марковские случайные моменты. (Строго марков- ское свойство оказывается автоматическим следствием единственности решения мартингальной задачи.) В работах Крылова [10] и Струка и Варадана [9] по- ставленный в № 9 вопрос о существовании и единственности диффузионного про- цесса, соответствующего данным коэффициентам диффузии и переноса, был ре- шен без наложения почти никаких ограничений. Вероятно, теперь аналитическому направлению в теории марковских про- цессов предстоит подняться на новый, более высокий уровень, связанный с рас- смотрением в качестве основных аналитических объектов не переходных вероят- ностей и связанных с ними операторов, а распределений в пространстве функций; начало этому положено в работах Струка и Варадана и др. Особенно большие возможности новые аналитические методы открывают для установления различ- ных предельных теорем для случайных процессов. ЛИТЕРАТУРА 1. Kolmogoroff A. N., Leontovilch М. A. Zur Berechnung der mittleren Broun schen Flache.— Phys. Ztschr. Sow., 1933, Bd. 4, S. 1—13. 2. Андронов А., Витт А., Понтрягин Л. О статистическом рассмотрении ди- намических систем.— ЖЭТФ, 1933, т. 3, № 3, с. 165—180. 3. Дуб Дж. Л. Вероятностные процессы/Пер. с англ. М.: Изд-во иностр, лит., 1956. 4. Дынкин Е. Б. Марковские процессы. М.: Физматгиз, 1963.
478 Комментарии 5. Феллер В. К теории стохастических процессов (теоремы существования и единственности).— УМН, 1938, вып. 5, с. 57—96. 6. Феллер В. Параболические дифференциальные уравнения и соответствующие им полугруппы преобразований.— В кн.: Математика: Сб. пер., 1957, т. 1, № 4, с. 105-153. 7. Хант Дж. Марковские процессы и потенциалы. М.: Изд-во иностр, лит., 1962. 8. Fukusima М. Dirichlet forms and Markov processes. Amsterdam: North-Hol- land Publ. Co, 1980, p. 196. 9. StroockD., VaradhanS. Multidimensional diffusion processes. Berlin: Spring.- VerL, 1979. 10. Крилов H. В. О стохастических интегральных уравнениях.— Теория ве- роятностей и ее применения, 1969, т. 14, № 2, с. 340—348. ' МАРКОВСКИЕ ПРОЦЕССЫ СО СЧЕТНЫМ ЧИСЛОМ СОСТОЯНИЙ (к № 10) (Б. А, Севастьянов) Дается пример применения уравнений для марковских процессов со счет- ным числом состояний к изучению одной из первоначальных задач теории массо- вого обслуживания, а именно: изучается задача об очереди в системе обслужива- ния с п приборами при пуассоновском потоке требований с показательным вре- менем обслуживания. Этот ставший классическим результат вошел в учебную литературу (см., например: Феллер В. Введение в теорию вероятностей и ее при- ложения/Пер. с англ. М.: Изд-во иностр, лит., 1964. Т. 1). ОДНОРОДНЫЕ СЛУЧАЙНЫЕ ПРОЦЕССЫ (к № 13) (В. М. Золотарев) Необходимость деления работы на две части (первая заканчивалась форму- лой (7)) была вызвана формальным ограничением объема публикации в одном но- мере журнала «Atti della Reale Accademia...». Краткая предыстория создания работы А. Н. Колмогорова. В 1929—1930 гг, появилось несколько статей известного.итальянского математика Б. де Финетти, в которых им было начато исследование свойств случайных процессов X (X) получивших впоследствии название однородных процессов с независимыми при- ращениями. Оказалось, что при любом X > 0 имеет место равенство я|> (z, X) = Е exp {itx (X)} = [ip (t, 1)]\ В связи с этим Финетти в последней из упомянутых статей (она цитируется в работе А. Н. Колмогорова) ставит задачу описания всех распределений, харак- теристические функции которых ф (t) обладают тем свойством, что [ф (i)]^ при лю- бом X > 0 является характеристической функцией некоторого распределения. Класс @ таких распределений называетсяЧклассом безгранично делимых законов. В Той же статье приводятся факты, которые после надлежащего осмысления по-
Однородные случайные процессы (В. М. Золотарев) 479 называют, что в (35 входят все распределения, характеристические функции ко- торых имеют вид ф (/) = exp {ity — V2a2i2 + с2 S (eUx — 1) dF (x)}f % (♦) где у, о, с — вещественные постоянные и F (х) — некоторая функция распреде- ления. А. Н. Колмогоров, знавший о работах Финетти и находившийся с ним в пе- реписке, заинтересовался задачей описания класса В своей работе он дал описание лишь той части класса которая соответствует законам с конечной дисперсией. В полном объеме проблема Финетти была решена в 1934 г. фран- цуаским математиком Леви [1]. Несмотря на, казалось бы, промежуточный характер, результат А. Н. Кол- могорова сыграл фундаментальную роль в поиске полного описания класса Прежде всего представление (15), полученное А. Н. Колмогоровым, превра- тило в уверенность догадку Финетти о том, что описание класса (3) следует про- водить на языке характеристических функций. Не менее важно и то, что метод доказательства (15), использовавшийся А. Н. Колмогоровым, оказался очень перспективным. В 1937 г. этим методом, несколько его развив, известный со- ветский математик Хинчин повторил результат Леви [2]. Достоинства метода Колмогорова—Хинчина оказались выраженными настолько ярко, что в совре- менных курсах теории вероятностей каноническое представление Леви—Хинчи- на (вкупе с его модификацией — представлением Леви) доказывается именно- этим методом [3]. С успехом он используется и при описании аналогов безгра- нично делимых распределений в пространствах Банаха и на локально компакт- ных группах [4]. Стоит обратить внимание читателя также и на то обстоятельство, что- А. Н. Колмогорову были известны обе используемые ныне формы каноническо- го представления характеристических функций безгранично делимых законов.. Действительно, запись представления (15) в точности соответствует каноническо- му представлению Леви—Хинчина, а каноническое представление Леви полу- чается из него, если использовать выражения (13), (14) функции Q (х) с помощью функций Р± (х) и Р2 (х). Последние являются не чем иным, как спектральными функциями в представлении Леви. Работа А. Н. Колмогорова содержит еще один важный результат, который автор не пожелал выделить. Это — истолкование вероятностного смысла спект- ральных функций Рх и Р2- Здесь стоит, по-видимому, уточнить смысл утверж- дения о том, что «величина Р2 (х) dh представляет собой вероятность того, что за время dh имел место положительный скачок, больший чем х». Подразумевается, что dh мало и что Р2 (х) dh представляет указанную вероятность с точностью до о (dX). ЛИТЕРАТУРА 1. Levy Р. Sur les integrates do nt les elements sont des variables aleatoires inde- pendantes.— Ann. Scuola norm, super. Pisa, Ser. 2, 1934, vol. 3, p. 337—366. 2. Хинчин А. Я. Новый вывод одной формулы П. Леви.— Бюл. МГУ. Матема- тика, 1937, т. 1, вып. 1. 3. Лоэв М. Теория вероятностей/Пер. с англ. М.: Изд-во иностр, лит., 1962. 4. Хейер X. Вероятностные меры на локально компактных группах. Мс Мир, 1981.
480 Комментарии ОДНОРОДНЫЕ МАРКОВСКИЕ ПРОЦЕССЫ (к № 39) (А. А. Юшкевич) Рассматриваемая работа А. Н. Колмогорова наряду с цитируемыми ниже -статьями Дуба и Леви положила начало разделу теории марковских процессов, посвященному однородным процессам со счетным числом состояний. Возникаю- щие в таких йроцессах своеобразные эффекты выделили их в самостоятельную •главу общей теории. В то же время исследование счетного случая способствовало выработке важных концепций, имеющих более широкую область применения ч’аких, как строго марковское свойство и граничные условия для марковских про- цессов. Плотности перехода из а в р и плотности аа = —выхода из а, а также прямая и обратная системы дифференциальных уравнений Р' (t) — Р (t) А и Р' (i) = АР (t) для вероятностей перехода (i) однородного марковского про- цесса с конечным или счетным множеством состояний Е введены Колмогоровым в основополагающей работе [1] (наст, изд., № 9), где предположены дифферен- цируемость функций (t) и в случае бесконечного Е некоторые условия равно- мерной сходимости (А и Р (t) обозначают матрицы с элементами а$ и р^ (г), t 0). Если Е конечно, то легко показывается, что аа = а$ и что при началь- 0-7^ Ot ном условии Р (0) = I (I — единичная матрица) каждая из систем дифферен- циальных уравнений Колмогорова имеет единственное решение Р (t) = eAt* После того как Дёблин [2] установил, что при конечном множестве Е дифферен- цируемость переходных вероятностей вытекает из стохастической непрерыв- ности процесса, т. е. условия Р (+0) = I, случай конечного множества состоя- ний по существу был исчерпан. Процессы со счетным пространством состояний оказались значительно слож- нее. Анализ их инфинитезимальных характеристик, гладкости переходных функ- ций, поведения траекторий, возможных «патологий» и т. п. составил заметное -в свое время направление исследований. В появившихся сперва статьях Дуба [3, 4], идейно связанных с принадлежа- щим ему понятием сепарабельного процесса, изучение переходной матрицы Р (t) основано на рассмотрении скачков траектории. Допуская, что Р (+ 0) = I (это условие считается выполненным и всюду далее), Дуб: 1) доказал существование .конечных или бесконечных производных функций (t) в нуле, 2) показал, *что обратная система справедлива, когда есть первый после 0 скачок, т. е. когда еаа — аа < °0 (как говорят, матрица А консервативна), и нашел аналогич- ную связь между прямой систе^^ой и последним перед t скачком, 3) по-разному продолжая процесс пос~е накопив ия скачков, получил примеры неединствен- ности процесса с данной матрицей А. В комментируемой работе № 39 [5] Колмогоров посредством замечательных по простоте и краткости чисто алгебраических либо аналитических приемов (за которыми просматриваются вероятностные соображения) сделал следующее: 1) доказал существование конечных плотностей при р ф а, 2) доказал сущест-
Однородные марковские процессы (Л. А. Юшкевич) 48f вование плотностей ла< оо, 3) построил пример процесса, в котором == оо, 4) построил пример процесса, в котором < аа < оо (будем обозначать эти примеры К1 и К2). Далее, Колмогоров высказал в [5] гипотезу’о том, что функции (t) при t Z> 0 всегда дифференцируемы. В появившемся одновременно мемуаре [6] Леви, интересуясь более всего* асимптотикой функций р^ (t) при t—> оо, предпринял классификацию рассма- триваемых процессов с точки зрения поведения траекторий, обращаясь с послед- ними на менее формальном уровне, чем Дуб. В частности, Леви обнаружил эффекты, наблюдающиеся в примерах К1 и К2. Леви предложил называть со- стояния ас < оо устойчивыми и с аа = оо мгновенными и привел в своем мемуаре оказавшуюся затем ошибочной теорему о том, что все состояния не могут быть мгновенными. Леви продолжил свой анализ в [7, 8J. Дальнейшее изучение счетных однородных марковских процессов происхо- дило под влиянием в первую очередь работы и идей Колмогорова. В Москов- ском университете эта тема культивировалась на семинарах Колмогорова и Дынкина. Колмогоров предложил задачу о дифференцируемости функций p^(t) в качестве темы дипломной работы Юшкевичу, которому удалось с по- мощью анализа траекторий доказать непрерывную дифференцируемость р& (t) в предположении, что хотя бы одно из состояний а или р устойчиво, а также- построить пример процесса с бесконечной второй производной у функции р^ (t) при некотором t > 0 (идея примера подсказана Колмогоровым). Публи- кация этой работы растянулась на шесть лет [9]. Юшкевич же заметил пробел в доказательстве упомянутой выше теоремы Леви о мгновенных состояниях,, связанный с отсутствием определенного значения траектории в момент разрывов, второго рода (см. [28]). Рассматриваемые вопросы оказались затронутыми на математическом кон- грессе в Амстердаме, где Кендалл и Рейтер [10] выступили с подробным анализом! примеров К1 и К2 с точки зрения полугрупп. На конгрессе присутствовал Кол- могоров. Из устных бесед некоторые участники вынесли неверное представление, будто в [9] построен пример, опровергающий гипотезу о дифференцируемости функций р^ (t) [12]. Вскоре Остин [11, 12] опубликовал чисто аналитическое до- казательство непрерывной дифференцируемостир$ (t) при t > 0 в случае устой- чивого состояния а. Затем Чжун [13] доказал то же при t 0 вероятностным методом, близким к [9]. Впоследствии Остин распространил свое доказательства на случай устойчивого состояния Р [14]. Усовершенствования этих доказательств предлагались Рейтером [15], развивавшим далее полугрупповой подход, Юрка- том [16], Чжуном [17,18]. Наконец, полное, чисто аналитическое доказательства гипотезы Колмогорова нашел Орнштейн [19], Смит [20] дал отрицательный ответ на вопрос Чжуна о том, стремится ли производная функция р^ (t) при t —* (> к своему значению в точке t = 0, равному — оо, когда состояние а мгновенное. С другой стороны, Ори [21] показал, что полная вероятность ра (t) состояния а в момент t может не быть дифференцируемой при подходящих начальном распре- делении и моменте t >> 0. Тонкими вопросами строения функций р& (t) при t —> О занимались также Кендалл [22], Блекуэлл и Фридман [23], Рейтер [24]. Изуче- ние класса возможных функций / (t) = р^ (t) явилось одним из стимулов к со- зданию Кингманом теории регенеративных событий [25].
482 Комментарии Вскоре после появления работы № 39 Кендалл частично распространил результаты Колмогорова о существовании плотностей аа и а$ на скачкообразные марковские процессы с произвольным множеством состояний [26] и, комбини- руя идеи примеров К1 и К2, построил пример процесса с = оо и af = 0 при р =/= 1 [27]. Положительный ответ на интригующий вопрос о существовании процесса, все состояния которого мгновенны, дали независимо Добрушин [28] и Феллер и Мак-Кин [29]; другие примеры предложили вскоре Кендалл [30] и Блекуэлл [31]. Позднее к исследованию примера К1 вернулся Рейтер [24], показавший, что в этом примере инфинитезимальная матрица А однозначно определяет переходную матрицу Р (i). Описанию всех матриц А, соответствую- щих процессам с только мгновенными состояниями, посвящены более поздние работы Вильямса [32, 33]. Подробное изложение результатов о дифференцируемости переходных вероятностей и строении траекторий однородных марковских процессов со счет- ным числом состояний, детальное описание примеров тех или иных «патологий» имеется в книгах Чжуна [17] и Фридмана [34]. Другая книга Фридмана [35] посвящена исключительно построению примеров с мгновенными состояниями предельным переходом от процессов с конечным числом состояний. Восходящая к работе Колмогорова К® 39 тематика способствовала выработ- ке понятий марковского момента и строго марковского свойства. Это свойство формулировалось и доказывалось Дубом [4], Юшкевичем [9], Чжуном [36, 13] для тех или иных классов встречавшихся марковских моментов в однородных марковских процессах со счетным числом состояний. С другой стороны, при изу- чении марковских процессов в произвольном метрическом пространстве с по- мощью характеристических операторов строго марковское свойство потребова- лось Дынкину [37,38] и сперва было введено им в качестве весьма правдоподоб“ ного предположения [37]. Колмогоров же в устных высказываниях Юшкевичу допускал возможность марковских процессов, не являющихся строго марковски, ми, и последний построил соответствующие примеры, упоминаемые в [37] и вошедшие в [39]. Тогда Дынкин, сравнивая свои результаты с результатами Феллера, полученными чисто аналитическим путем, высказал гипотезу, что всякий феллеровский процесс без разрывов второго рода будет строго марков- ским [37]. Юшкевич доказал этот результат с заменой второго условия предпо- ложением непрерывности траекторий справа [39]. Параллельно строго марков- ское свойство для частных случаев непрерывных процессов установили Хант [40] и Рей [41], а в общем виде ввел Блюменталь [42]. Чтобы свойство строгой марковости выполнялось в полном объеме для однородного марковского про- цесса со счетным множеством состояний Е, вообще говоря, пространство Е нужно подходящим образом компактифицировать, вводя фиктивные состояния* Такая конструкция значительно позднее осуществлена Дубом [43]. работа Колмогорова № 39 явилась одним из отправных пунктов и при изучении границ и граничных условий для марковских процессов. Если матри- ца’?! консервативна, то верна обратная система дифференциальных уравнений Р' (г) ss АР (0, но решение ее при начальном условии Р (0) = I, вообще говоря, неединственно. Из общих результатов Феллера [44] следует, что вероятности ^перехода за конечное число скачков образуют минимальное решение указанной системы. Возникает задача о построении возможных продолжений минимального
Однородные марковские процессы (А. А. Юшкевич) 483 процесса за момент накопления скачков с сохранением марковского свойства и инфинитезимальной матрицы А, чтобы процесс не обрывался. Предварительный вопрос о том, когда накопление скачков (иными словами, уход в бесконечность) может произойти за конечное время, вслед за Феллером [44] специально для счет- ного случая исследовал Добрушин [45]. Дальнейшая конструкция требует по- строения границы-выхода, границы-входа (если таковая имеется) и «склеивания» выходов со входами либо с первоначальными состояниями посредством гранич- ных условий. Не касаясь обширного круга соответствующих исследований для процессов диффузионного типа и их обобщений, отметим, что для счетного про- странства состояний подобная программа была нарисована Дынкиным в докладе на Всесоюзном совещании по теории вероятностей в Ленинграде в 1955 г. Реали- зовать ее оказалось возможным, по-видимому, лишь для случая, когда число выходов конечно. Не претендуя на полноту, назовем относящиеся сюда работы Добрушина [46], Феллера [47],Рейтера [15,48], Неве [49],Чжуна [50], Вильямса [51, 52], Дынкина [53]. ЛИТЕРАТУРА 1. Kolmogoroff A, N. Ueber die analytischen Methoden in der Wahrscheinlichr keitsrechnung.— Math. Ann., 1931, Bd. 104, S. 415—457. 2. Doeblin W. Sur 1 equation matricielle = A^A^ et ses applications aux probabilites en chaine.— Bull. sci. math., 1938, vol. 62, p. 21—32; 1940,. vol. 64, p. 35-37. 3. Doob J. L. Topics in the theory of Markoff chains. — Trans. Amer. Math. Soc., 1942, vol. 52, p. 37-64. 4. Doob J. L. Markoff chains — denumerable case.— Trans. Amer. Math. Soc., 1945, vol. 58, p. 455-473. 5. Колмогоров A. H. К вопросу о дифференцируемости переходных вероятно- стей в однородных по времени процессах Маркова со счетным числом со- стояний.— Уч. зап. МГУ, 1951, т. 148. Математика, № 4, с. 53—59. 6. L6vy Р. Systemes markoviens et stationnaires. Cas denombrable.—Ann. sci. Ecole norm, super., 1951, vol. 68, p. 327—381. 7. Levy P. Processus markoviens et stationnaires du cinqueme type (infinite de- nombrable des etats possible, parametre continu).— C. r. Acad. sci. Paris, 1953, vol. 236, p. 1630—1632. 8. Levy P. Remarques sur les etats instantanes des processus markoviens et stati- onnaires, a une infinite denombrable d’etats possibles.— C. r. Acad. sci. Pa- ris, 1967, vol. 264, p. 844—848. 9. Юшкевич A. A. О дифференцируемости переходных вероятносте!! однородного марковского процесса со счетным числом состояний: Дипл. раб. МГУ, 1953.— Уч. зап. МГУ, 1959, т. 186. Математика, № 9, с. 141—159. 10. Kendall D. G., Reuter G. Е. Н. Some pathological Markov processes with a denumerable infinity of states and the associated semigroups of operators on I.— In: Proc. Intern. Congr. Math. Amsterdam, 1954, vol. 3, p. 377—415^ 11. Austin D. G. On the existence of the derivative of Markoff transition proba- bility functions.— Proc. Nat. Acad. Sci. USA, 1955, vol. 41, p. 224—226. 12. Austin D. G. Some differentiation properties of Markoff transition probabili- ty functions.— Proc. Amer. Math. Soc., 1956, vol. 7, p. 756—761. 13. Chung K. L. Some new developments in the theory of Markov chains.— Trans. Amer. Math. Soc., 1956, vol. 81, p. 195—210. 14. Austin D. G. Note on differentiating Markoff1 transition functions with stable terminal states.— Duke Math. J., 1958, vol. 25, p. 625—629. 15. Reuter G. E. H. Denumerable Markov processes and the associated contracti- on semi-groups on Z.— Acta math., 1957, vol. 97, p. 1—46. 16. Jurkat W. B. On semi-groups of positive matrics. I, IL— Scr. math., 1959^ vol. 24, p. 123—131; 207-218.
<484 Комментарии 17. Chung К. L. Markov chains with stationary transition probabilities. Berlin, 1960. 18. Chung K. L. Probabilistic methods in Markov chains.— In: Proc. Fourth Berkeley Sympos. Math. Statist. Probab. Univ. Calif. Press, 1961, vol. 2, p. 35—56. 19. Ornstein D. The differentiability of transition functions.— Bull. Amer. Math. Soc., 1960, vol. 66, p. 36—39. 20. Smith G. Instantaneous states of Markov processes.— Trans. Amer. Math, Soc., 1964, vol. 110, p. 185—195. 21. Orey S. Non-differentiability of absolute probabilities of Markov chains.— Quart. J. Math., 1962, vol. 13, p. 252—254. 22. Kendall D. G. On the behaviour of a standard Markov transition function near t = 0.— Ztschr. Wahrscheinlichkeitstheorie, 1965, Bd. 3, S. 276—278. 23. Blackwell D., Freedman D. On the local behaviour of Markov transition pro- babilities.— Ann. Math. Statist., 1968, vol. 39, p. 2123—2127. 24. Reuter G. E. H. Remarks on a Markov chain example of Kolmogorov.— Ztschr. Wahrscheinlichkeitstheorie, 1969, Bd. 13, S. 315—320. 25. Kingman J. F. C. The stochastic theory of regenerative events.—Ztschr. Wahr- scheinlichkeitstheorie, 1964, Bd. 2, S. 180—224. 26. Kendall D. G. Some analytical properties of continuous stationary Markov transition functions.— Trans. Amer. Math. Soc., 1955, vol. 78, p. 529—540. 27. Kendall D. G. Some further pathological examples in the theory of denumerab- le Markov processes.— Quart. J. Math., 1956, vol. 7, p. 39—56. 28. Добрушйн P. Л. Пример счетного однородного марковского процесса, все состояния которого являются мгновенными.— Теория вероятностей и ее применения, 1956, т. 1, с. 481—485. 29. Feller Ж, McKean Н. Р., Jr. A diffusion equivalent to a countable Markov chain.— Proc. Nat. Acad. Sci. USA, 1956, vol. 42, p. 351—354. 30. Kendall D. G. A totally unstable denumerable Markov process.— Quart. J. Math., 1958, vol. 9, p. 149—160. 31. Blackwell D. Another countable Markov process with only instantaneous sta- tes.— Ann. Math. Statist., 1958, vol. 29, p. 313—316. 32. Williams D. The (^-matrix problem for Markov chains.— Bull. Amer. Math. Soc., 1975, vol. 81, p. 1115—1118. 33. Williams D. The (J-matrix problem. 2: Kolmogorov backward equations.— Leet. Notes Math., 1976, vol. 511, p. 216—234; 505—520. 34. Freedman D. Markov chains. S. Francisco: Holden-Day, 1971. 35. Freedman D. Approximating countable Markov chains. S. Francisco, 1972. 36. Chung K. L. Foundations of the theory of continuous parameter Markov chains.— In: Proc. Third Berkeley Sympos. Math. Statist. Probab. Univ. Calif. Press, 1956, vol. 2, p. 29—40. 37. Дынкин E. Б. Бесконечно малые операторы марковских случайных процес- сов.— ДАН СССР, 1955, т. 105, с. 206—209. 38. Дынкин Е. Б. Инфинитезимальные операторы марковских процессов.— Теория вероятностей и ее применения, 1956, т. 1, с. 38—60. 39. Дынкин Е. Б., Юшкевич А. А. Строго марковские процессы,—Теория ве- роятностей и ее применения, 1956, т. 1, с. 149—155. -40. Hunt G. A. Some theorems concerning Brownian motion.— Trans. Amer. Math. Soc., 1956, vol. 81, p. 294-319. -41. RayD. Stationary Markov processes with continuous paths.—Trans. Amer. Math. Soc., 1956, vol. 82, p. 452—493. 42 Blumental R. M. An extended Markov property.— Trans. Amer. Math. Soc., 1957, vol. 85, p. 52-72. 43 . Doob J. L. Compactification of the discrete state space of a Markov process.— Ztschr. Wahrscheinlichkeitstheorie, 1968, Bd. 10, S. 236—251. >44. Feller W. On the intergo-differential equations of purely discontinuous Mar- koff processes.— Trans. Amer. Math. Soc., 1940, vol. 48, p. 488—515; Errata.— Ibid., 1945, vol. 58, p. 474.
Ветвящиеся процессы (Б. А. Севастьянов) 485 45. Добрушин Р. Л, Об условиях регулярности однородных по времени марков- ских процессов со счетным чюлом возможных состояний.— УМН, 1952, т. 7, вып. 6, с. 185—191. 46. Добрушин Р. Л. Некоторые классы однородных счетных марковских про- цессов.— Теория вероятностей и ее применения, 1957, т. 2, с. 377—380. 47. Feller W. On boundaries and lateral conditions for the Kolmogoroff differen- tial equations.— Ann. Math., 1957, vol. 65, p. 527—570. 48. Reuter G. E. H. Denumerable Markov processes. II, III.— J. London Math. Soc., 1959, vol. 34, p. 81—91. 49. Neveu J. Sur les etats d’entree et les etats fictifs d’un processus de Markoff.— Ann. Inst. H. Poincare, 1962, vol. 17, p. 324—337. 50. Chung K. L. On the boundary theory for Markov chains.— Acta math.. 1963, vol. 110, p. 19-77; 1966, vol. 115, p. 111—163. 51. Williams D. The process extended to the boundary.— Ztschr. Wahrscheinlich- keitstheorie,' 1962, Bd. 2, S. 332—339. 52. Williams D. On the construction problem for Markov chains.— Ztschr. Wahr- scheinlichkeitstheorie, 1964, Bd. 3, S. 227—246. 53. Дынкин E. Б. Общие граничные условия для марковских процессов со счетным множеством состояний.— Теория вероятностей и ее применения, 1967, т. 12, с. 222-257. ВЕТВЯЩИЕСЯ ПРОЦЕССЫ (к № 25, 32, 33, 46) (Б. А. Севастьянов)^ Общее понятие и сам термин «ветвящегося случайного процесса», сразу став- ший общепринятым, впервые были явно высказаны А. Н. Колмогоровым на руководимом им семинаре в МГУ в 1946/47 уч. г. Отдельные задачи, связанные с простыми моделями ветвящихся процессов, рассматривались и раньше. В част- ности, одна из таких задач решалась А. Н. Колмогоровым в более ранней работе № 25, однако именно с публикацией работ № 31, 32 начинается бурное разви- тие теории ветвящихся процессов. В настоящее время в мировой ( литературе имеется несколько монографий, посвященных ветвящимся процессам (книги Харриса [1], Севастьянова [2], Атрея и Нея [3] и др.). Описанные в работах № 31, 32 модели ветвящихся процессов — это марковские ветвящиеся процессы с не- сколькими типами частиц и с непрерывным и дискретным временем. Уже эта модель оказалась очень богатой как по количеству полученных результатов, так и по возможным приложениям к биологии, химии, физике, технике. Частным случаем этой модели является ветвящийся процесс с иммиграцией, в котором, кроме размножающихся частиц, появляются и иммигрирующие частицы [2]. Впоследствии появились более сложные модели ветвящихся процессов, в которых учитываются: зависимость размножения от возраста частиц (про- цесс Веллмана—Харриса), положение частицы в некотором пространстве, зави- симость частиц от энергии, зависимость от случайной среды и т. п. Полученные в № 25 асимптотические формулы вероятности продолжения процесса, а также связанные с ними предельные теоремы, доказанные Ягломом [4], в дальнейшем разными авторами обобщались на другие, в том числе и немарковские, модели. Сходимости ветвящихся процессов к диффузионным, о которой говорится в обзорной работе № 46, посвящены работы [5—7].
486 Комментарии ЛИТЕРАТУРА 1. Харрис Т. Е. Теория ветвящихся случайных процессов/Пер. с англ. М.: Мир, 1966. 2. Севастьянов Б. А. Ветвящиеся процессы. М.: Наука, 1971. 3. Athreya К. В., Ney Р. Е. Branching processes. Berlin; Heidelberg; New York: Spring.-Verl., 1972. 4. Яглом A. M. Некоторые предельные теоремы теории ветвящихся случай- ных процессов.— ДАН СССР, 1947, т. 56, № 8, с. 795—798. 5. Jirina М. On Feller’s branching diffusion processes.— Cdsop. pestov. mat., 1969, sv. 94, N 1, s. 84—90. 6. Lamperty J. The limit of sequence of branching processes. — Ztschr. Wahrschein- lichkeitstheorie, 1967, Bd. 7, N 4, S. 271—288. 7. Чистяков В. П. О сходимости ветвящихся процессов к диффузионным.— Теория вероятностей и ее применения, 1970, т. 15, № 4, с. 727—730. СТАЦИОНАРНЫЕ ПОСЛЕДОВАТЕЛЬНОСТИ (к № 27). (Ю. А. Розанов) Ставшая классической работа № 27 открыла главное направление в теории стационарных (и родственных им) случайных процессов, поставив 1 надлежащим образом задачи прогнозирования и решив их для стационарных процессов с ди- скретным временем (стационарных последовательностей). Эта работа замечатель- на своими глубокими связями с различными вопросами теории приближений, спектральной теории операторов в гильбертовом пространстве, теории анали- тических функций. Центральными в ней являются два новых понятия — регу- лярность случайного процесса и подчиненность одного процесса другому. Стационарную последовательность можно рассматривать как х (Г) = еМ, t = 0, ±1, . . в гильбертовом пространстве L2 с мерой F (d%) на отрезке —л < 1 л. Пусть Нх (п) есть замкнутая линейная оболочка всех х (s), s п, и xn (t) — наилучшее приближение для х (t) функциями из Нх (п); регулярность означает, что $п (0 —* 0 при п —> — оо. Широко известный результат работы № 27 состоит в установлении следующего критерия регулярности: F (dX) абсолютно непрерыв- на и плотность / (X) = F (dty/dk удовлетворяет условию л $ iog/(X)a> — оо. (*) —л Общей моделью стационарной последовательности является х (i) = Utx (0), t = 0, A^l, • • •» л где Ut = егМ Е (dX) — группа унитарных операторов в гильбертовом про- —л 1 Непосредственно задачи прогнозирования рассматриваются в другой ра- боте А. Н. Колмогорова: Интерполирование и экстраполирование стационарных случайных последовательностей.— Изв. АН СССР. Сер. мат., 1941, т. 5, с. 3' 14 (см. № 28 наст. изд.).
Стационарные последовательности (Ю. А- Розанов) 487 странстве. Подчиненность ей у (0, t = 0, +1» • • •» означает, что последователь- ность у получается из последовательности х линейным преобразованием у (0 = Ах (0 е оператором А = S <Р (tyE (dX) в Нх — Нх (оо). Неожиданным и удивительным здесь оказывается то, что ука- занная линейная зависимость у и х может быть выражена в терминах их кор- реляционной зависимости (ранее в этом роде был известен лишь тривиальный факт о линейной зависимости случайных величин х и у с коэффициентом корре- ляции 1). Описание спектральной структуры подчиненных последовательностей дает, в частности, спектральное описание циклических подпространств для уни- тарной группы Ut в пространстве Нх. Особую роль играют подчиненные последовательности у с условием не- упреждаемости Ну (0 G Нх (0, для которых, в частности, попутно решается вопрос о том, когда Ну (0) = Нх (0). Решение этого вопроса, например, для х (0 = eiu в L2 с F (dX) = dX следующее: равенство Hv (0) ® Нх (0) справедливо тогда и только тогда, когда у (t)'= ?М<р (%), где ф (X) есть так называемая внешняя функция известного аналитического клас- са Я2 = Нх (0) (в самой работе № 27 о <Р(Х)=3 ViU = r(e-ix) —00 определяется условием Г (z) =f= 0, | z | < 1). Нужно сказать, что многие вопро- сы для класса Я2 легко решаются в рамках предложенной в № 27 схемы подчи- ненных последовательностей (и процессов). Скажем, так обстоит дело с известным вопросом об инвариантных подпространствах в Я2, а именно: каждое инвариант- ное относительно умножения на подпространство Я С Я2 = Нх (0) есть Н — Ну (0) для надлежащей регулярной подчиненной последовательности у (0 = (X), ф е Я2, и Я = фЯ2, где так называемая внутренняя функция if- е Я2 задает фундаментальную для у последовательность и (<) = (X)
488 Комментарии со спектральной плотностью 1/2л = J ф (X) |2. Связанные с работой № 27 исследования подробно освещены, например, в монографиях [1—5]. Укажем лишь на некоторые из них. Нужно отметить, что работа № 27, по-видимому, на какое-то время остава- лась неизвестной многим специалистам, занимавшимся в 40-х годах близкими к ней вопросами, и в связи с этим прежде всего следует упомянуть работы Вине- ра по фильтрации стационарных процессов. Здесь же можно было бы упомянуть проблему Бёрлинга, касающуюся «сдвигов» в аналитическом классе Я2, и др. Непосредственное обобщение условия регулярности (*) на стационарные процессы с непрерывным временем было дано в 1949 г. Крейном в форме log/W 1 + Х2 dX> —' оо. Позднее Крейном была обнаружена связь задачи прогнозирования и обратной спектральной задачи для уравнения струны. Непосредственное обобщение кри- терия регулярности на невырожденный многомерный случай было дано в 1941 г. Засухиным в форме л log det f (X) dX > — oo. —л Важные для приложений задачи прогнозирования процессов с рациональным спектром рассматривались Ягломом. Условие регулярности в общем случае рав- носильно тому, что спектральная плотность / (X) допускает факторизацию / (X) = (1/2л) <р (X) ф (X), где ф (X) есть операторная функция соответствующего аналитического класса Н2. Задача факторизации матричных (операторных) функций / (X) решалась Розановым, Винером и Мазани, Матвеевым и др. В частности, Лакс показал, что в бесконечномерном случае даже очень сильный вариант обобщения условия (♦) в форме л log / (X) dX — cl —л (где с > 0 есть постоянная, a I — единичный оператор) еще не гарантирует тре- буемую регулярность / (X). Общий критерий регулярности был предложен Роза- новым. ЛИТЕРАТУРА 1. Розанов Ю. А. Стационарные случайные процессы. М.: Физматгиз, 1963. 2. Гофман К. Банаховы пространства аналитических функций/Пер. с аигл. М.: Изд-во иностр, лит., 1963. 3. Секефалъви-Надъ Б., Фояш Ч. Гармонический анализ операторов в гиль- бертовом пространстве. М.: Мир, 1970. 4. Розанов Ю. А. Теория обновляющих процессов. М.: Наука, 1974. 5. Dym Н., McKean Н. Р. Gaussian processes, function theory and inverse spe- ctral problems. New York: Acad. Press, 1976.
Стационарные процессы (В. А. Статулявичус) 489 СТАЦИОНАРНЫЕ ПРОЦЕССЫ (к № 48) (В. А. Статулявичус) Авторы статьи решают задачу, когда для гауссовского стационарного про- цесса X (t) выполняется введенное Розенблаттом [1] условие сильного переме- шивания (с. п.). В статье доказывается, что в данном случае функция сильного перемешивания а (т) эквивалентна максимальному коэффициенту корреляции р (т) (а (т) р (т) < 2ла (т)) и находят представление (4) для р (т) через спек- тральную плотность процесса / (X), которая в силу условия с. п. существует. Таким образом задача решается полностью. Например, в случае целочисленного времени процесс Xt обладает свойством с. п. тогда и только тогда, когда р (т) = sup II (/ (X) - е~^р (еа)) -1-1| —»О р II / ||<» при т оо, где sup берется по всем односторонним тригонометрическим полино- m мам р = У (m > 0) и || • является нормой ess sup. Отсюда сле- дует, что если / (X) непрерывная, f (—л) = / (л) и везде, кроме, может быть» нуля, ограниченная, то Xt обладает свойством с. п. Ибрагимов [2] получил даль- нейшие результаты о форме / (X), при которой для Xf выполняется условие с. п. Хельсон и Сарасон [3] заново пересмотрели эту проблему как вопрос гармониче- ского анализа. Получены также обобщения для функций Xt со значениями в пространстве матриц [6]. В случае случайного блуждания на компактной абе- левой группе Розенблатт [4] показал, что стационарный процесс обладает свой- ством с. п. тогда и только тогда, когда sup 0 “* °°)’ /±1 II /На где Т — оператор перехода случайного блуждания. А. Н. Колмогоровым также была поставлена задача о нахождении эффективного критерия полной регулярности гауссовского стационарного процесса, которая решалась Волкон- ским и Розановым [7,]. Ученик А. Н. Колмогорова Леонов [8] исследовал разные свойства перемешивания случайных процессов с помощью старших семиинва- риантов. ЛИТЕРАТУРА 1. Rosenblatt М. A central limit theorem and a strong mixing condition.— Proc. Nat. Acad. Sci. USA, 1956, vol. 42, p. 43-47. 2. Ибрагимов И,А. О спектральных функциях некоторых классов стационар- ных гауссовских процессов.— ДАН СССР, 1956, т. 137, с. 1046—1048. 3. Helson И., Sarason D, Past and future.— Math, scand., 1967, bd 21, s. 5—16. 4. Rosenblatt M. Markov processes. Structure and asymptotic behaviour. Berlin etc.: Spring.-Verb, 1971. 5. Розанов Ю.А. Стационарные случайные процессы. М.: Физматгиз, 1963
490 Комментарии 6. More I. H., Page L. В. The class w of'operator valued weight functions.— J. Math. Meeh., 1970, vol. 19, p. 1011-1017. 7. Волконский В. H., Розанов Ю. А. Некоторые предельные теоремы для слу- чайных функций. I. II.— Теория вероятностей и ее применения, 1959, т. 4, № 2, с. 186—207;’ 1961, т. 6, № 2, с. 202—214. 8. Леонов В. П. Некоторые применения старших семиинвариантов к теории стационарных случайных процессов. М.: Наука, 1964. СТАТИСТИКА ПРОЦЕССОВ (к № 50) (А. Н. Ширяев) В данной работе методом максимального правдоподобия были построены оценки и <от для параметра X (коэффициента затухания) и о (частоты) в ком- плексном стационарном гауссовско-марковском процессе. Оказалось, что нор- мированное отношение — со не зависит от (о и % и является в точности нормально распределенным с пара- метрами 0 и 1 (когда а — 1). По поводу доказательства этого интересного фак- та (не приведенного в работе) см. статью [1] и монографию [2, гл. 17, § 4]. Комментируемая работа представляет интерес и с той точки зрения, как А. Н. Колмогоров физически поставленную задачу (в данном случае задачу изу- чения перемещений оси вращения Земли) переводит на строгий язык статистики случайных процессов и, основываясь на результатах относительно плотностей одних мер по, другим для процессов диффузионного типа, находит оценки рас- сматриваемых параметров. В настоящее время статистика процессов диффузионного типа представляет большую главу статистики случайных процессов. Значительная часть моногра- фии [2] посвящена статистике именно таких процессов. В частности, в ней рассмотрена и задача комментируемой работы, а также ряд родственных задач. ЛИТЕРАТУРА 1. Новиков А. А. Последовательное оценивание параметров диффузионных процессов.— Теория вероятностей и ее применения, 1971, т. 16, Лх 2, с. 394—396. 2. Липцер Р. Ш., Ширяев А. Н. Статистика случайных процессов. М.: Наука, 1974.
Спектральная теория стационарных процессов (Л. М. Яглом) 494 СПЕКТРАЛЬНАЯ ТЕОРИЯ СТАЦИОНАРНЫХ ПРОЦЕССОВ (к № 34) (А. М. Яглом) Опубликованная в 1947 г. статья № 34 А. Н. Колмогорова представляет собой первый в мире популярный обзор спектральной теории стационарных случайных процессов — одного из важнейших разделов математической теории случайных функций, разработанного лишь незадолго до того (при активном участии самого А. Н. Колмогорова) и в то время мало кому известного за преде- лами узкого круга специалистов. Отметим, что за рубежом первый аналогичный обзор указанной теории появился лишь на два года позже (см. [1]); в настоящее же время только на русском языке этой теории посвящена научная моногра- фия [2], сравнительно элементарная книга [3] и большие разделы во множестве учебных руководств (см., например, [4—7]). А. Н. Колмогоров начинает свой обзор с изложения классических резуль- татов А. Я. Хинчина [2] \ впервые давшего определение стационарного случай- ного процеса £ (/) и доказавшего, что его корреляционная функция В (т) = = М {g (^ 4- т) § (£)} всегда может быть представлена в виде интеграла Фурье— Стилтьеса (см. формулу (5), относящуюся к несколько более, общему; случаю многомерного процесса £ (t) = {£i (£), В2 (*)> • • •» £«(*)}); однако основное вни- мание он уделяет вопросу об обосновании возможности представления в виде интеграла Фурье—Стилтьеса вида (4) самого стационарного процесса £ (t) и о физическом смысле такого представления. Автор отмечает, что спектральное представление (4) может быть легко выведено из известной теоремы функциональ- ного анализа о спектральном разложении однопараметрических групп унитар- ных операторов в гильбертовом пространстве и что впервые такой его вывод был указан в 1940 г. в работах [б, 7]; однако’ради простоты он не останавливается на том обстоятельстве, что фактически в этих работах была решена сразу более общая (и более сложная) задача о спектральном представлении не просто ста- ционарных процессов, а более широкого класса процессов со стационарными при- ращениями. Случайный процесс £ (t) называется процессом со стационарными прираще- ниями (в широком смысле), если при любых t, т, s, и т2 математические ожида- ния М {£ (t + т)— £(«)} = в (т), _ _ (1) М{[£(< + « + ъ) - Н« + 0111 («+ т2) - g«)]} = D(«; т1( Т2) существуют и не зависят от t. (Ясно, что любой-стационарный в широком смысле процесс всегда является также и процессом со стационарными приращениями, но процесс со стационарными приращениями, вообще говоря, может и не быть стационарным.) Из результатов работы А. Н. Колмогорова [d] 1 2 вытекает, в част- 1 Номера в квадратных скобках, набранные курсивом, относятся к списку литературы к статье А. Н. Колмогорова. Номера в круглых скобках, набранные курсивом, означают, что речь идет о соответствующей формуле статьи № 34. 2 Содержащиеся в [6] результаты, относящиеся к геометрии гильбертова пространства, были чуть позже независимо получены также Нейманом и Шен- бергом [8], не заметившими, однако, что эти же результаты могут быть одновремен-
492 Комментарии ности, что каждый процесс со стационарными приращениями ? (г) допускает спектральное представление вида <50 5(0 = $ (eiW-l)d®(M + 5o + ^t, (2) — ОО где ?о, Si — случайные величины, а случайная функция Ф (X) такова, что ее при- ращения Ф (Д^) = Ф (X') — Ф (X*) и Ф (А") = Ф (Х„) — Ф (Х„) на непересекаю- щихся интервалах Д^ = [X’, X’] и Д^ = [Х^, Х^] некоррелированы между собой (т. е. М {Ф (Д^) Ф (Д^)} — 0), а задаваемая равенством М {| ф (Дх) |2} = = F (Д^) вещественная монотонно неубывающая функция F (X) аргумента X при любом е > 0 удовлетворяет условию + dF(X)<oo. (3) —оо —8 8 В частном случае стационарного процесса £ (t) (рассматривавшемся, в предпо- ложении, что время t дискретно, в частности, в работах А. Н. Колмогорова [4, 5]) — 0 и, кроме] того, должно уже выполняться не только условие (3), но и более ограничительное условие dF(X)<oo. (4) —оо оо В таком случае, очевидно, § йФ (X) = — это случайная величина конечной —00 дисперсии; поэтому формулу (2) здесь можно переписать в виде 5(0 = eiwd<I>i(A.) —оо (где Фх (X) = Ф (X) + (?0 — £q) К (X), а К (X) — это «функция скачка», равная О при X < 0 и 1 при X 0). Таким образом в приложении к стационарным про- цессам мы снова приходим к формуле (4) и к результатам, изложенным (в приме- нении к многомерному процессу ? (t)) в статье № 34 А. Н. Колмогорова. Спектральная теория случайных процессов со стационарными приращения- ми, развитая в работах [б, 7], может быть перенесена также на еще более общий класс случайных процессов ? (t), имеющих стационарные приращения некото- рого порядка п > 1 (см. [9, 10], где можно найти также и точное определение этого класса случайных процессов). Для таких процессов спектральное представ- ление имеет вид оо 5(0 = С Геш-1-Лг-...-J^2ZLld®(X) + ^ + ^t+... + 5nin, J L (п — 1)* J —оо (5) но истолкованы и как некоторые факты, касающиеся случайных процессов ? (J) со стационарными приращениями.
Спектральная теория стационарных процессов (А. М. Яглом) 493 где ?©, Si, • • ~ случайные величины, и приращения случайной функции ф (X) на непересекающихся интервалах и Д^ снова некоррелированы между собой, в то время как функция F (%), определяемая равенством М {| ф (Д^) |2} = = F (Д^), при любом е > 0 удовлетворяет условию —е g оо dF (А) + b?ndF (А) + dF (А) < ео. (6) —оо —8 8 Формулы, описывающие спектральные представления процессов со стацио- нарными приращениями некоторого порядка, могут быть просто выведены, в част- ности, из результатов, относящихся к совсем другому обобщению понятия ста- ционарного случайного процесса, а именно из спектральной теории обобщенных стационарных случайных процессов. Обобщенным случайным процессом, по ана- логии с получившим широкое распространение в современном анализе понятием обобщенной функции, называется случайный линейный функционал ? (ср) (т. е. линейный функционал, значения которого являются случайными величи- нами), заданный на некотором линейном пространстве D «хороших» (т. е. доста- точно гладких) функций ср = ср (t) — скажем, на введенном Л. Шварцем про- странстве DK бесконечно дифференцируемых функций, каждая из которых тож- дественно обращается в нуль вне некоторого конечного интервала (только случай такого пространства D = будет рассматриваться ниже). Ясно, что обык- новенному случайному процессу ? (t) всегда можно сопоставить обобщенный процесс оо 5(Ф)= J 5 (0<Р 6) л; (7) —оо <с этой точки зрения обыкновенные случайные процессы могут считаться част- ными случаями процессов обобщенных. В принципе, однако, могут существовать и обобщенные процессы ? (<р), для которых не существуют «значения в точке» В (t) (т. е. такие, что? (ср) не может быть описано формулой вида (7)); типичным примером такого процесса Е, (ср) является, в частности, часто встречающийся в различных приложениях процесс «белого шума». Обобщенные случайные процессы были введены в рассмотрение в работах [11, 12] (см. также [13, гл. III]). В [11—13] было определено также понятие ста- ционарного (в широком смысле) обобщенного случайного процесса ? (ср) и была развита спектральная теория таких ? (ср). Для определения обобщенных ста- ционарных процессов надо только рассмотреть действующую в D операцию ТХ1 задаваемую равенством Тт<р (/) = ср (t + т), а затем потребовать, чтобы при любом т для ? (<р) выполнялись условия М {В (Тт<р)} = м {? (<р)}, М {I (7» I (Ттфг)} = М {! (Ф1) £ (фз)}. (8) Будем для простоты считать, что М {? (ф)} = тп (ср) = 0 при всех ср; в таком случае стационарные обобщенные случайные процессы ? (<р) будут допускать спектральное представление вида оо Цф)= J ф(А)ЙФ(А), (9) —оо
494 Комментарии со где ф (А) = еп<ф (j) dt — преобразование Фурье функции ср (0, а случайна» —со функция Ф (1) обладает теми же свойствами, что и функция Ф (Л), фигурирую», щая в спектральном разложении (4) обыкновенного стационарного случайного процесса g (t) с той лишь разницей, что теперь уже функция F (Л) такая, что- М {| Ф (Дх) | 2} « F (Дк), будет удовлетворять условию (10> при некотором целом т 0 (в случае обыкновенных стационарных процессов оо g (г) всегда dF (к) < оо, т. е. т = 0). Легко видеть, что в частном случае*. —оо когда процесс g (ср) является обыкновенным (т. е. задается формулой (7)), из фор» мулы (9) сразу же выводится и более обычное спектральное представление пре* цесса kg (0 вида (4). Обобщенные случайные процессы кое в чем являются более простыми, чем процессьГобыкновенные; в частности, в то время как обыкновенный случайный процесс I (t) будет иметь производную d% (t)/dt = g'(t) лишь при некоторых спе- циальных условиях, обобщенный процесс g (ср) всегда дифференцируем, причем его производная g' (<р) определяется равенством: g' (ф) = — g (ф') (если процесс . 00 | (ср) задается формулой (7) и g' (t) существует, то, очевидно, g' (ф) = <p(i)di)t —оо Дифференцируемость обобщенных процессов позволяет определить обобщенный случайный процесс со стационарными приращениями данного порядка п просто как процесс £ (ф) (вообще говоря, нестационарный), п-я производная g^n^ (ф) которого является уже обобщенным стационарным процессом. Это определение позволяет легко вывести из формул (9) и (10) общее спектральное представление обобщенных случайных процессов со стационарными приращениями порядка п, охватывающее формулы (5) и (6) в качестве частного случая (относящегося к про* цессам g (ф) вида (7)). Еще одно обобщение спектрального представления стационарного случай- ного процесса В (t) в виде интеграла Фурье—Стилтьеса (4) касается однородных случайных полей в многомерных пространствах Лп, т. е. родственных стационар- ным процессам случайных функций В (х), х = (х19 . » ., хп) е Rn^ многих пере- менных. Случайное поле g(x),x е Яп, называется однородным (в широком смы- сле), если при любом г е Rn (X + г) = (X), (Х1 + Г)1 (х2 4- Г) = (Х1)1 (х2) (И) (так что Mg (х) == const, Mg (xj g (х2) = В (xj — х2)); оно допускает спектраль- ное представление вида 5(х)= е’кхФ (dk), (12) Rn
Спектральная теория стационарных процессов (А. М. Яглом) 495 где Ф(Ак) —- случайная функция n-мерного интервала Ак в пространстве век- торов к, значения которой на непересекающихся интервалах Дкг и Дк2 являются некоррелированными, а функция F (Дк) = М{|Ф(Дк)|2} интегрируема по всему пространству (так что F (dk) <оо). Заметим, что, сославшись на работу Rn А. Н. Колмогорова [б], спектральное разложение (12) однородного случайного доля £ (х) еще в 1941 г. использовал Обухов [14, 15] в своих важных работах по статистической теории турбулентности; в настоящее время строгое доказательст- во этой формулы и некоторых ее обобщений (касающихся, в частности, полей с однородными приращениями, а также обобщенных однородных полей) может быть найдено, например, в [16] (см. также [13, § III.5]). Ряд дальнейших при- меров «обобщенных спектральных представлений» различных классов случай- ных функций, родственных представлению стационарных случайных процессов I (t) в виде интеграла Фурье—Стилтьеса (4), указан, в частности, в работах [17, 18]. Точная формулировка упомянутых А. Н. Колмогоровым результатов Засу- хина [75] и строгое доказательство этих результатов содержится в книге Роза- нова [2, гл. II]. По поводу современного изложения и дальнейшего развития вы- водов, содержащихся в упомянутой статье Слуцкого [74], см. Моран [19, 20], а также Кендалл и Стьюарт [21, разд. 47.15]. ЛИТЕРАТУРА 1. Doob J. L. Time series and harmonic analysis.— In: Proc. (First) Berkeley Sympos. Math. Statist. Probab., 1949, p. 303—344. 2. Розанов Ю. А, Стационарные случайные процессы. M.: Физматгиз, 1963. 284 с. 3. Яглом А. М, Корреляционная теория стационарных случайных функций. Л.: Гидрометеоиздат, 1981. 280 с. 4. Дуб Дж. Л. Вероятностные процессы/Пер. с англ. М.: Изд-во иностр, лит., 1956. 605 с. 5. Вентцель А. Д. Курс теории случайных процессов. М.: Наука, 1975. 319 с. 6. Гихман И. И., Скороход А. В. Введение в теорию случайных процессов. 2-е изд., М.: Наука. 1977. 567 с. 7. Гихман И. И., Скороход А. В. Теория случайных процессов. М.: Наука, 1971. Т. 1. 664 с. 8. Neumann J. von, Schoenberg I. J. Fourier integrals and metric geometry.— Trans. Amer. Math. Soc., 1941, vol. 50, N 2, p. 226—251. 9. Яглом A. M. Корреляционная теория процессов co случайными стационар- ными n-ми приращениями.— Мат. сб., 1955, т. 37, № 1, с. 141—196. 10. Пинскер М. С. Теория кривых в гильбертовом пространстве со стационар- ными м-ми приращениями.— Изв. АН СССР. Сер. > ат., 1955, т. 19, № 5, с. 319-345. И. Гельфанд И. М. Обобщенные случайные процессы.— ДАН СССР, 1955, т. 100, № 5, с. 853—856. 12. Ito К. Stationary random distributions.—Mem. Cull. Sci. Univ. Kyoto (A), 1954, vol. 28, N 3, p. 209—223. Рус. пер.: Математика, 1957, т. 1, № 3, с. 139-151. 13. Гельфанд И. М., Виленкин Н. Я. Некоторые применения гармонического анализа. Оснащенные гильбертовы пространства. М.: Физматгиз, 1961. 472 с. 14. Обухов А. М. О распределении энергии в спектре турбулентного потока.— ДАН СССР, 1941, т. 32, № 1, с. 22-24.
496 Комментарии 15. Обухов А. М. О распределении энергии в спектре турбулентного потока.— Изв. АН СССР. Сер. геогр. и геофиз., 1941, т. 5, № 4/5, с. 453—466. 16. Яглом А. М. Некоторые классы случайных полей в n-мерном пространст- ве, родственные стационарным случайным процессам.— Теория вероят- ностей и ее применения, 1957, т. 2, № 3, с. 292—338. 17. Karhunen К. Uberlineare Methoden in der Wahrscheinlichkeitsrechnung.— Ann. Acad. sci. fenn. A, 1947, vol. 1, N 37, p. 3—79. 18. Яглом A. M. Спектральные представления для различных классов слу- чайных функций.— В кн.: Тр. 4-го Всесоюз. мат. съезда, М.: Изд-во АН СССР, 1963, т. 1, с. 250—273. 19. Moran Р. А. Р. The spectral theory of discrete stochastic processes.— Bio- metrika, 1949, vol. 36, N 1, p. 63—70. 20. Moran P.A.P. The oscillatory behaviour of moving averages.— Proc. Cam- bridge Phil. Soc., 1950, vol. 46, N 2, p. 272-281. 21. Кендалл M. Дж., Стьюарт А. Многомерный статистический анализ и времен- ные ряды /Пер. с англ. М.: Наука, 1976. 736 с. СПЕКТРАЛЬНОЕ ПРЕДСТАВЛЕНИЕ СЛУЧАЙНЫХ ПРОЦЕССОВ (к № 47, 49) (Ю. Г. Баласанов, И. Г. Журбенко) Обозначим класс случайных процессов g (t), для которых м | U0 1р < а _ класс процессов g (t) е Т{к) и таких, что для всех 1 < I < к, — оо <С < т < оо Mg (tj, . . . g (ti) = Mg (^ + т) . . . g + t). Тогда пример, построенный в комментируемой работе, показывает, что хотя с Ф<2\ но при к >> 2 существуют процессы класса S^k\ не принадлежащие классу Вопрос о подходящем определении классов случайных процессов, для кото- рых справедливо спектральное представление высших порядков, обсуждался в целом ряде последующих работ различных авторов. Отметим в первую очередь работу [1], где по предложению А. Н. Колмогорова вводятся и изучаются клас- сы A(fe), определяемые как] некоторые подклассы классов П Ф®\ Для таких классов оказывается более естественным рассматривать не моментную спектральную меру М^ (Z1?. ., Х&) (определяемую соотношением (см. [1, 2, 9]) к (h,..tk) = (h)... 5 (<s) = J exp 2 ‘A} ’ а семиинвариантную спектральную меру . Л, (определяемую соотно- шением (см. [1, 2, 9]) к (h, ...,*&)= exp |i * * ’’ d^k)’ Rk
Спектральное представление (Ю. Г. Баласанов, И, Г. Журбенко) 497 1где -fc * k («I, •.t ) = . l .J In М exp |i У ufi (tpl I ). 6 dU1...duk 1 Zj ’ ч =o' K В частности, классы характеризуются тем, что при £ (t) е Д^> семиинвари- антные меры F^\ 1 I < /с, абсолютно непрерывны относительно меры Лебега на множествах Хх + . . . + X/ = 0 (mod 2л). Изучение классов А(^ было затем продолжено в [2]. Обобщение классов Д^) для векторных случайных процессов получено в [3]. Аналогичные вопросы для случайных полей рассматривались в [4]. Инициированные А. Н. Колмогоровым работы, в которых были определены и изучены классы Д(^\«открыли серию исследований в новом направлении, назы- ваемом теорией и статистическим анализом старших спектров стационарных слу- чайных процессов. Результаты этого направления носят в настоящее время фун- даментальный характер и, кроме того, существенно используются для решения различных прикладных задач в астрономии, геофизике, при изучении турбулент- ности жидкости и газа и т. д. (см., например [5—8J). Фундаментальный вклад в дальнейшее развитие спектрального анализа старших порядков был сделан в работе [9], где был разработан математический аппарат старших моментов и семиинвариантов, необходимый во всех дальней- ших исследованиях (см. [10, И] и др.). Спектральная теория старших порядков для однородных случайных полей рассматривалась Ягломом [12—14]. Оценки сверху для старших спектральных плотностей и их производных в условиях раз- личных видов перемешивания найдены в [11] и существенно используются при статистическом анализе. Многочисленные работы были посвящены построению и исследованию ста- тистик старших спектральных плотностей (например, [15—17] и др.). Однако до недавнего времени все статистики обладали одним и тем же существенным недо- статком; они позволяли построить оценку старшей семиинвариантной спектраль- ной плотности не для всех значений аргумента. Хотя семиинвариантная плот- ность n-го порядка определена во всех точках вида Хх + . . . + Хп = = 0 (mod 2л), предлагавшиеся статистики не давали никакого ответа на под- множествах X;. + . . . + Хь =0 (mod 2л), 1 ki < и, i = 1, . . ., р, при р < п. р Естественно, что вблизи указанных множеств возникала сильная неустойчивость статистических оценок. Недавно от этого недостатка удалось избавиться благо- даря статистике, построенной методом сдвига по времени [18]. ЛИТЕРАТУРА 1. Ширяев А. Н. Некоторые вопросы спектральной теории старших момен- тов. I.— Теория вероятностей и ее применения, 1960, т. 5, № 3, с. 293—313. 2. Леонов В. П., Ширяев А. Н. Некоторые вопросы спектральной теории стар- ших моментов. II.— Теория вероятностей и ее применения, 1960, т. 5, № 4, с. 460—464. 3. Brillinger D. R. An introduction to polyspectra.— Ann. Math. Statist., 1965, vol. 36, p. 1351-1374.
498 Комментарии к. Леоненко Н. Н. Некоторые вопросы спектральной теории старших момен- тов случайных полей.— ДАН УССР, 1975, № 9, с. 777—782. 5. Кузнецов П. И,, Стратонович Р. Л., Тихонов В. И. Прохождение некото- рых случайных функций через нелинейные системы.— Автоматика и теле- механика, 1963, т. 14, № 4. 6. Монин А. С., Яглом А. М. Статистическая гидромеханика. М.: Наука 1965. Т. 1. 7. Монин А. С., Яглом А. М. Статистическая гидромеханика. М.: Наука 1967. Т. 2. 8. Brillinger D. R. Identification of polynomial systems by polyspectra.— J Sound and Vibr.,1970, vol. 2, N 3, p. 301-313. 9. Леонов В. Л., Ширяев А. Н, К технике вычисления семиинвариантов.— Теория вероятностей и ее применения, 1959, т. 4, № 3, с. 342—355. 10. Леонов В. П. Некоторые применения старших семиинвариантов к теории стационарных случайных процессов. М.: Наука, 1964. 11. Журбенко И. Г. Спектральный анализ временных рядов. М.: Изд-во МГУ, 1982. 12. Яглом А. М. Некоторые классы случайных полей в n-мерном пространстве* родственные стационарным случайным процессам.— Теория вероятностей и ее применения, 1957, т. 2, № 3, с. 292—338. 13. Yaglom А. М. An introduction to the theory of stationary random functions. Englewood Cliffs: Prentice-Hall, 1962. 14. Yaglom A. M. Second-order homogeneous random fields.— In: Proc. Fourth Berkeley Sympos. Math. Statist. Probab., 1961, p. 593—622. 15. Rosenblatt M. A., Van Ness J. S. Estimation of the bispectrum.— Ann. Math. Statist., 1965, vol. 36, p. 1120—1136. 16. Brillinger D.R., Rosenblatt M. A. Asymptotic theory of estimates of /c-th order spectra.— In: Advances Seminar on Spectral Analysis of Time Series. New York: J. Wiley, 1967, p. 189—232. 17. Журбенко И. Г., ТрушН. Н. Об оценке спектральных плотностей стацио- нарных процессов.— Литов, мат. сб., 1979, т. 19, № 1, с. 65—82. 18. Журбенко И. Г. Статистическое оценивание старших спектров.— Теория вероятностей и ее применения, 1985, т. 30, № 1, с. 66—77. БРОУНОВСКОЕ ДВИЖЕНИЕ (к № 14, 19, 24) (А. М. Яглом) Статьи № 14, 19, 24 непосредственно примыкают к важным работам № 9, 17, в основном посвященным общей теории непрерывных марковских («стоха- стически определенных» по терминологии А. Н. Колмогорова) случайных процес- сов. Такого рода процессы, начиная с известных работ Эйнштейна и Смолухов- ского [1, 2], очень широко применяются в физике для описания броуновского движения* как отдельных частиц, так и систем со многими степенями свободы» напомним в этой связи, что к некоторым выводам работы № 9, как оказалось, еще раньше пришли физики Фоккер и Планк, исследовавшие броуновское дви- жение. Естественно было ожидать поэтому, что также и результаты работы № 17 могут быть непосредственно приложены ко многим' задачам, касающимся броу- новского движения. Некоторые" конкретные примеры таких приложений как раз и содержатся в работах № 14, 19, 24. Наиболее физический характер из трех последних работ имеет написанная в соавторстве с М. А. Леонтовичем статья № 14, напечатанная в физическом жур'
Броуновское движение (А. М. Яглом) 499 нале. В этой статье решается следующая задача теории броуновского движения, поставленная перед авторами С. И. Вавиловым: найти среднее значение Е (F) (площади F, покрываема! на плоскости (х, у) за данное время t проекцией сфери- ческой частицы фиксированного радиуса о, совершающей броуновское движение. Опираясь на уравнения в частных производных для плотности вероятности пере- хода многомерного непрерывного марковского процесса, найденные в работе № 17, авторы получают для Е (F) весьма точную асимптотическую формулу (пригодную при Dtla2, 1, где D — соответствующий коэффициент диффузии, который в силу результатов Эйнштейна [1,2] для сферической частицы радиуса и, погруженной в жидкую или газообразную среду вязкости ц, при абсолютной температуре Т задается соотношением D = /с077блор, где ко — постоянная Больцмана). Отметим, что приведенное в статье решение задачи опирается на содержа- щийся там же следующий важный результат. Обозначим через PL (х, у\ t) веро- ятность того, что частица, находящаяся в момент t = 0 в точке (х, у) и совершаю- щая броуновское движение в двумерной плоскости (случай броуновского дви- жения в n-мерном пространстве, разумеется, при любом п может быть разобран совершенно аналогично), за данное время t хоть один раз пересечет границу Г заданной области G (содержащей точку (х, у)) и прйтом так, что первое пере- сечение придется на заданную часть L всей границы Г (где L может, конечно, и совпасть с Г). В таком случае Р^ (я, у; t) будет удовлетворять определенному уравнению в частных производных («первому уравнению А. Н. Колмогорова», см. уравнение (14)), а также условиям: PL (х, у; 0) = 0 для любой внутренней точки (х, у) области G, PL (х, у; t) —♦ 1 при любом t > 0, когда точка (ж, у) стре- мится к какой-либо точке части L границы Г, и PL (я, ?/;£)—» 0 при t > 0 и точ- ке (х, у), стремящейся к точке границы Г, не входящей в L; эти уравнения и ус- ловия уже однозначно задают функцию PL (я, у; t). Ясно, что указанный общий вывод представляет значительный интерес и вне зависимости от конкретной за- дачи броуновского движения, решаемой в статье № 14; он был одновременно с авторами данной статьи получен также Понтрягиным, Андроновым и Вит- том [3], и в настоящее время этот и некоторые родственные ему результаты ши- роко используются во многих приложениях и вошли в ряд учебных руководств см., например, [4, § 30; 5, § 1.4; 6, §§ 26, 27]). Значительно более общий вопрос теории броуновского движения разбирает- ся А. Н. Колмогоровым в небольшой заметке № 19. Как хорошо известно, в клас- сической теории броуновского движения, развитой Эйнштейном и Смолухов- ским [1, 2], пренебрегается инерцией броуновской частицы, т. е. фактически предполагается, что масса этой частицы равна нулю. В связи с этим броуновская частица в теории Эйнштейна и Смолуховского не имеет конечной скорости; так, например, в частном случае броуновского движения свободной частицы Вине- ром было строго доказано (см. [7, гл. IX]), что броуновская траектория с вероят- ностью 1 является непрерывной, но нигде недифференцируемой кривой. Отме- тим еще, что в приближении Эйнштейна и Смолуховского моделью броунов- ского движения физической системы является непрерывный марковский про- цесс в пространстве ее координат (в случае движения свободной частицы — ви- неровский случайный процесс).
500 Комментарии Ясно, что недифференцируемость броуновских траекторий в теории Эйнштей- на — Смолуховского тесно связана с вводимой здесь идеализацией (пренебре- жением инерцией), делающей соответствующую теорию непригодной для ана- лиза движения на очень малых интервалах времени At В применении к простей- шему случаю броуновского движения свободной частицы уточненная теория,, учитывающая уже и инерцию частицы, была в 1930 г. развита УленбекЬм и Орнштейном [8] (см. также Дуб [9] и Чандрасекар [10, гл. II]); в этой уточнен- ной теории траектории частиц оказываются уже дифференцируемыми (но не имеющими второй производной, так что теперь бесконечным оказывается уско- рение частицы). Фактически тому же обобщению классической теории броунов- ского движения посвящена и статья № 19, где, однако, уже рассматривается не частный случай движения одной свободной частицы, а общий случай броунов- ского движения произвольной физической системы с п степенями свободы. Учет инерции, согласно А. Н. Колмогорову, достигается просто тем, что состояние системы теперь считается задающимся значениями п коодинат д1?. . ., qn и и их производных по времени (скоростей) д1? . . ., qn; в качестве же модели броунов- ского движения здесь используется непрерывный марковский процесс в 2п- мерном фазовом пространстве координат и скоростей. Основное уравнение для плотности вероятности перехода такого марковского процесса (уравнение (9) работы № 19) оказывается в данном случае вырожденным уравнением парабо- лического типа (так как его правая часть содержит только вторые производные- по скоростям, но не по двум координатам или координате и скорости); матема- тическая теория таких уравнений начала разрабатываться вскоре после по- явления работы № 19 учеником А. Н. Колмогорова Пискуновым [11]. Теория Уленбека и Орнштейна одномерного броуновского движения свободной частицы получается из общей теории Колмогорова в частном случае, когда п = 1 (так что основное уравнение теории приобретает вид (10), см. работу № 19), / = = — ад (где а — 0/тп, т — масса частицы, (3 — коэффициент при силе вязкого- трения, равный блор для сферической частицы радиуса о), а к = const = = koT/mfi. Наконец, статья № 24 посвящена интересному вопросу о смысле и условиях статистической обратимости броуновского движения. Хорошо известно, что про- цессы броуновского движения (или диффузии) в термодинамическом смысле яв- ляются необратимыми — при наличии большого числа диффундирующих ча- стиц эти процессы практически всегда приводят к выравниванию распределе- ния имеющихся частиц при возрастании времени t, в то время как при убывании t неоднородность распределения возрастает. По-видимому, Шредингер [12] пер- вым обратил внимание на то, что на самом деле существенную роль здесь играет наличие определенного начального условия в момент t — 0 и всегда принимаемо- го допущения о стремлении распределения частиц к равномерному (в общем случае — к некоторому стационарному эргодическому распределению) при t —> оо, в то время как относительно поведения процесса при t — оо обычно никаких предположений не делается. В связи с этим он рассмотрел вопрос о процессе диффузии в течение интервала времени tQ < t < tx при условии, что фиксировано и начальное распределение вероятностей в момент t = и конеч- ное распределение в момент t = и указал, что при такой постановке задачи диффузия уже будет обладать определенной обратимостью. В частности, если до-
Броуновское движение (А. М. Яглом) 501 пустить, что диффузия происходит на конечном пространственном интервале (или в конечном объеме) и что как при t —> оо, так и при t — оо распределение вероятностей стремится к одному и тому же равномерному (т. е. стационарному и эргодическому) распределению, то тогда изменения распределения вероятно- стей при tQ t < оо и при — оо < t £0, отвечающие заданному значению распределения в момент tQ, будут описываться совершенно одинаковыми соот- ношениями, т. е. диффузия здесь будет строго обратима во времени. Шредингер рассмотрел в своей статье лишь простейшую одномерную диффу- зию, описываемую уравнением диффузии с постоянным коэффициентом D. В ра- боте же 24 А. Н. Колмогорова изучен общий случай произвольного п-мерного броуновского движения, описываемого непрерывным марковским случайным процессом на некотором n-мерном многообразии R координат (гг1? . . ., хп) = х физической системы. Если для этого марковского процесса при всех t задана «аб- солютная (безусловная) плотность вероятности» р (ж), являющаяся строго поло- жительной плотностью стационарного распределения вероятностей (в случае, когда существует эргодическое распределение, именно его естественно принять за р (х)), то тогда наряду с обычной плотностью вероятности перехода из заданно- го состояния в момент t = tQ в какое-то фиксированное состояние в момент t — — h > to можно определить также и «обратную плотность вероятности пере- хода» — условную плотность вероятности состояния в момент t = t0 при усло- вии, что задано состояние в более поздний момент t = после этого есте- ственно поставить вопрос о необходимых и достаточных условиях, при которых эти две плотности вероятности перехода равны друг другу. Такие необходимые и достаточные условия и найдены в работе № 24; при их выводе используется полученная тут же инвариантная тензорная форма указанных в работе № 19 общих уравнений для плотности вероятности перехода n-мерного марковского процесса, которая может быть полезной и вне связи с рассматриваемой задачей о статистической обратимости, а сами искомые условия оказались достаточно общими и, разумеется, выполняющимися и в том частном случае, который рас- сматривал Шредингер. Заметим, впрочем, что и в статье № 24 задача о статистической обратимости броуновского движения все же исследуется не в самом общем виде, так как здесь предполагается, что матрица || Bi:! (х) || коэффициентов при вторых производных в уравнении для плотности вероятности перехода является строго положитель- но определенной при всех х. В конце § 1 автор отмечает, что случай вырожден- ной матрицы || (х) || на самом деле представляет значительный физический интерес, поскольку он возникает, в частности, при рассмотрении броуновского движения в фазовом пространстве координат и скоростей физической системы (см. статью № 19); однако тут же оговаривается, что в данной работе вырожден- ный случай рассматриваться не будет. Позже вопрос об условиях статистической обратимости броуновского движения в фазовом пространстве координат и ско- ростей был поставлен А. Н. Колмогоровым перед своим аспирантом — автором настоящего комментария. Само определение статистической обратимости в этом случае слегка отличается от определения, имеющегося в работе № 24, так как обращение движения физической системы требует изменения знака всех скоро- стей на обратный; это отличие (о котором см. [13]), однако, является достаточно простым и оно мало что меняет. Для получения необходимых и достаточных ус-
502 Комментарии ловий статистической обратимости теперь снова следует переписать основные уравнения для вероятности перехода (уравнение (9) работы № 19 и сопряженное •ему уравнение) в инвариантной тензорной форме (приобретающей особенно ясный физический смысл, если за коэффициенты метрической квадратичной -формы в координатном пространстве принять коэффициенты квадратичной фор- мы от скоростей, задающей кинетическую энергию системы). Ограничиваясь да- лее наиболее интересным случаем, когда коэффициенты при вторых производных по скоростям в уравнении для плотности вероятности перехода зависят только ют координат, а силы, воздействующие на рассматриваемую систему, линейно зависят от скоростей, удается показать (см. [13]), что фактически для того, чтобы броуновское движение в фазовом пространстве было статистически обратимым, здесь надо лишь, чтобы соответствующее стационарное распределение вероятно- стей совпадало по форме с каноническим распределением Гиббса. Таким образом, в данном случае условие статистической обратимости оказывается имеющим яс- ный физический смысл. Перейдя далее к пределу, отвечающему стремлению к нулю инерции системы (т. е. стремлению к нулю всех коэффициентов квадратич- ной формы от скоростей, задающей кинетическую энергию), мы снова придем к модели Эйнштейна—Смолуховского броуновского движения как марковского процесса в пространстве одних лишь координат системы; при этом найденные в [13] условия статистической обратимости броуновского движения в фазовом пространстве в пределе снова переходят в условия статистической обратимости, найденные в работе № 24 А. Н. Колмогорова. Последнее обстоятельство проли- вает дополнительный свет на физический смысл этих последних условий. ЛИТЕРАТУРА 1. Эйнштейн А., Смолуховский М. Броуновское движение / Сб. ст. Пер. с нем. М.; Л.: ОНТИ, 1936. 2, Эйнштейн А. Работы по теории броуновского движения.— В кн.: Эйнш- тейн А. Собр. науч, трудов. М.: Наука, 1966, т. 3, с. 75—91; 108—127; 149—151; 155-163. -3. Понтрягин Л. С., Андронов А. А., Витт А. А. О статистическом рассмот- рении динамических систем.— ЖЭТФ, 1933, т. 3, № 3, с. 165—180. 4. Свешников А. А. Прикладные методы теории случайных функций. 2-е изд. М.: Наука, 1968. .5. Тихонов В. И. Выбросы случайных процессов. М.: Наука, 1970. 392 с *6. Тихонов В. И.. Миронов М. А. Марковские процессы. М.: Наука, 1977. 7. Винер Н., Пэли Р. Преобразование Фурье в комплексной области / Пер. с англ. М.: Наука, 1964. 267 с. В. Uhlenbeck G. Е., Ornstein L. S. On the theory of the Brownian motion.— Phys. Rev., 1930, vol. 36, p. 823—841. 9. Doob J, L. The Brownian movement and stochastic equations.— Ann. Math., 1942, vol. 43, N 2, p. 351-369. 10. Чандрасекар С. Стохастические проблемы в физике и астрономии / Пер. с англ. М.: Изд-во иностр, лит., 1947. 41. Пискунов Н. С. Краевые задачи для уравнения эллиптико-параболического типа.— Мат. сб., 1940, т. 7, с. 385—424. 12. Schrodinger Е. Uber die Umkehrung der Naturgesetze.—Sitzungsber. Preuss. Akad. Wiss., phys.-math. KL, 1931, 12. Marz, S. 144—153. 13. Яглом A. M. О статистической обратимости броуновского движения.— Мат. сб., 1949, т. 24, с. 457—492.
Цепи Маркова со счетным числом состояний (А. А. Юшкевич) 5ЛЗ ЦЕПИ МАРКОВА СО СЧЕТНЫМ ЧИСЛОМ СОСТОЯНИЙ (к № 23) (А. А. Юшкевич) Краткая заметка А. Н. Колмогорова [1] и ее расширенный вариант [2J (№ 23 наст, изд.) содержат основы теории счетных однородных цепей Маркова; эти работы положили начало систематическому изучению цепей Маркова со счет- ным и вообще бесконечным множеством состояний. Установленные Колмогоро- вым классификация состояний и асимптотика вероятностей перехода Р$ при п —♦ оо составляют неотъемлемую часть любого подробного изложения счетных цепей Маркова [5, 8, 12, 31, 39, 40]. В адаптированном виде эти результаты во- шли в учебные руководства и для нематематиков. В названных работах А. Н. Колмогоров доказал, что: 1) счетное простран- ство Е состояний подразделяется на множество несущественных состояний и классы существенных (сообщающихся между собой) состояний, а классы в свою очередь на периодические подклассы; 2) в пределах класса вероятность беско- нечного числа возвращений одна и та же для всех состояний и равна либо 1 (воз- вратный класс), либо 0 (невозвратный класс); 3) в пределах класса среднее вре- мя возвращения Mjj или для всех состояний j конечно (положительный класс)» или для всех состояний бесконечно (нулевой класс); 4) в непериодическом клас- се существует lim pg) = лгу/, (1) П—оо J причем в положительном классе сумма пределов равна 1; 5) как следствие в об- щем случае зависимость Р^ от п является асимптотически периодической. В случае конечного Е все классы возвратны и положительны; для этого случая разбиение пространства Е на несущественные состояния, классы и под- классы и асимптотическую периодичность pW независимо получил Дёблин [3] (существование не зависящих от I пределов (1) для конечной цепи со строго положительными Р^, очевидно, состоящей из одного непериодического класса» установил еще Марков). Работы Колмогорова были продолжены во многих исследованиях. Эрдёш, Феллер и Поллард [4], желая «сделать более доступными результаты Колмого- рова», доказали соотношение (1) как теорему восстановления, получившую за- тем ряд обобщений (см. [5, гл. XIII]). Феллер [5] впервые на уровне для начинаю- щих изложил основы теории счетных однородных цепей Маркова, причем отметил, что в положительном классе пределы (1) образуют единственное стационарное распределение х. Он же в [6] нашел ряд уточнений формулы (1), например выра- со жение для V (PW — М-1) при конечном втором моменте времени возвра- JJ JJ JJ о щения в ;, а позднее в [7] дал новое доказательство теоремы восстановления. 1 Феллер начинает с классификации состояний на возвратные и невозврат- ные и в замечании о терминологии ошибочно приписывает тот же смысл колмо- горовским названиям существенные и несущественные состояния.
504 Комментарии Сарымсаков [8], воспроизведя классификацию Колмогорова, предложил матричный метод вычисления пределов (1), а также рассмотрел центральную предельную теорему для цепей со счетным пространством Е и с Е = [а, Ь]. В случае нулевого класса, когда пределы в (1) равны 0, интересно сравнить между собой порядки стремления к 0 переходных вероятностей для разных со- стояний, а также сравнить далекие будущие распределения при различных на- чальных состояниях. Дёблин [9] установил, что в пределах одного класса всегда существует конечный отличный от 0 предел lim 2----- (2) П-*оо п 1 (результат Дёблина в действительности важен для нулевого возвратного класса, так как в положительном классе он вытекает из (1), а в невозвратном классе — из сходимости рядов, получающихся заменой в (2) символа п на оо). Чжун [10] обнаружил, что в случае возвратного класса предел (2) равен pjixf1, где — среднее число попаданий в i на протяжении одной экскурсии из фиксированно- го состояния h в А, а Дерман [11] показал, что при тех же условиях ц = {p,J является единственной с точностью до постоянного множителя о-конечной ин- вариантной мерой на Е. Эти и примыкающие результаты подробно осветил в своей монографии [12] Чжун.] Ори [13] доказал, что в возвратном классе при разных начальных состояниях будущие распределения сближаются по вариации: lim Sl^’-Pg’kO; (3) n—ОО j J J другое доказательство дали Блекуэлл и Фридман [14] (в положительном клас- се (3) сразу следует из результата 4) Колмогорова). Существенное усиление результата Дёблина о пределе (2) получили Кинг- ман и Ори [15], доказавшие «индивидуальную» предельную теорему для отно- шений: если в непериодическом возвратном классе Vi (4) 1 при некоторых N и 8 > 0, то П^оо pg) И/ Как заметил Молчанов [16], условие (4) равносильно более простому условию: > 6 Vj. Молчанов обобщил результат (5) на а-возвратные цепи, т. е. це- пи, в которых при некотором а 1 2«n^>=oo Vi,/, п=1
Цепи Маркова со счетным числом состояний (А. А. Юшкевич) 505 но при каждом положительном Р < а аналогичный ряд сходится: если в такой цепи pffl >> ъР^ Vi при некоторых N > М и 8 > 0, то предел в (5) существует и равен ц^ср^1, где р, = арР и ср = аРср — единственные с точностью до постоянного множителя а-гармонические мера и положительная функция. Доказательство теоремы Молчанова, использующее границу Мартина, имеется в [17]. Асимптотику переходной вероятности Pij (t) однородного марковского про- цесса со счетным пространством состояний и непрерывным временем изучил Леви [18]. Для несчетного фазового пространства Ё колмогоровское разбиение Е на множество несущественных состояний, классы и подклассы проделал Дёблин [19], усовершенствованные изложения дали затем Дуб [20], Чжун [21], Ори [22]. Принимаемое в этих работах известное условие Дёблина гарантирует наличие стационарного распределения и аналогию со случаем положительных классов. Определение возвратности для случая общего пространства Е предложил Хар- рис [23]. В возвратных по Харрису цепях существует единственная с точностью до постоянного множителя инвариантная ст-конечная мера. Для них справед- лив аналог результата о существовании (при i = к) предела (2) и равенстве его Руру1 (теорема Чакона—Орнстейна [24], усовершенствованная затем рядом авторов). Данный круг вопросов подробно изложен в монографии Ревуза [25]. Работы Колмогорова [1,2] стимулировали не только дальнейшее изучение вопросов о классификации состояний и асимптотике переходных вероятностей, но в значительной мере развитие и всей теории цепей Маркова со счетным или произвольным фазовым пространством. Первое из них имеет дело с возвратным прежде всего положительным слу- чаем и состоит в распространении на аддитивные функционалы от рассматри- ваемых цепей Маркова известных результатов о суммах независимых случай- ных величин или о конечных цепях. Сюда относятся закон больших чисел и примыкающие к нему эргодические теоремы, центральная предельная теорема и ее уточнения и соответствующие асимптотические разложения, многомерная предельная теорема для чисел попаданий в заданный набор состояний, закон повторного логарифма, сходимость нормированных нарастающих сумм к ви- неровскому процессу (иначе называемая принципом инвариантности), сходи- мость к негауссовским предельным законам и т. д. Эргодическая теорема для отношения двух функционалов доказывается и для возвратных цепей, другие результаты требуют более сильных предположений эргодического характера, например конечности вторых моментов или упомянутого условия Дёблина. Первые существенные достижения в указанном направлении принадлежат Дёб- лину [19]. Далеко идущие их уточнения получены Нагаевым [26, 27]. В перене- сении результатов на неоднородные цепи ведущую роль сыграли Добрушин [28] и Статулявичус [29]. Более подробные сведения и ссылки можно найти в книге Чжуна [12] (многие указания на работы советских авторов добавлены при переводе) и недавней монографии Сираждинова и Форманова [30], содер- жащей как некоторые прежние, так и многие новые результаты. Специально для счетных цепей Маркова закон повторного логарифма, принцип инвариантно- сти, эргодические теоремы для отношений изложены в книге Фридмана [31]. 17 А. Н. Колмогоров
506 Комментарии Второе направление, возникшее при исследовании невозвратных цепей (ц процессов) Маркова,— это теория потенциала и границ Мартина. Давно известна связь задачи Дирихле для уравнения Лапласа в ограниченной области G с винеровским процессом в G, рассматриваемым до момента выхода на границу 9G области G. Эта связь позволяет ввести основные понятия классической тео- рии потенциала в терминах винеровского процесса или его переходной функции. По аналогии понятия гармонической функции, потенциала, функции Грина, эксцессивной (= положительной супергармонической) функции переносятся на другие невозвратные марковские процессы. Основная заслуга в разработке теории потенциала для марковских процессов принадлежит Ханту [32] и Дын- кину [33]. Изложение теории потенциала для счетных цепей Маркова имеется в книге Хённекена и Тортра [34]. Граница-выход невозвратной марковской цепи строится для описания возможных способов поведения траектории при п —* оо (с вероятностью 1 траек- тория притягивается к одной из точек границы). Дуальную роль играет гра- ница-вход. Для счетных цепей Маркова первым построил границу Феллер [35]. Однако признание получила другая, более тощая граница, предложенная Дубом [36] и независимо Ватанабе [37], опирающаяся на теорию потенциала и названная ими границей Мартина (в случае винеровского процесса в плоской области G конструкция Дуба совпадает с построением Мартина [38], позволяю-, щим представлять все гармонические в G функции формулой, аналогичной ин- тегралу Пуассона для круга). Вероятностное построение границы Мартина для невозвратной счетной марковской цепи осуществил Хант [39] и усовершенство- вал Дынкин [40]. Теория потенциала и граница Мартина для цепей Маркова с общим фазовым пространством представлена в книге Ревуза [25]. Новый метод изучения возвратных и невозвратных счетных цепей Маркова, основанный на понятии фундаментальной матрицы, предложили Кемени и Снелл. Они же (и независимо Ори) перенесли теорию потенциала и границ на возвратные цепи Маркова^ Эти результаты, а также эргодические теоремы и границы Мартина для невозвратных цепей обстоятельно изложены в моногра- фии [41], содержащей подробную историческую справку и библиографию. ЛИТЕРАТУРА 1. Kolmogoroff A. N. Anfangsgriinde der Theorie der Markoffschen Ketten mit unendlich vielen moglichen Zustanden.— Mat. сб., 1936, т. 1, № 4, с. 607—610. 2. Колмогоров А. Н. Цепи Маркова со счетным числом возможных состояний.— Бюл. МГУ. Математика и механика, 1937, т. 1, № 3, с. 1—16. 3. Doeblin Ж Sur les chaines discretes de Markoff. — C. r. Acad. sci. Paris, 1936, vol. 203, N 1, p. 24-26. 4. Erdos P., Feller Ж, Pollard H. A theorem on power series.—Bull. Amer. Math. Soc., 1949, vol. 55, p. 201—204. 5. Feller W. An introduction to probability theory and its applications. New York, 1950. Vol. 1. Рус. пер.: Феллер В. Введение в теорию вероятностей и ее приложения. М.: Мир, 1964, Т. 1. 6. Feller W. Fluctuation theory of recurrent events.— Trans. Amer. Math. Soc., 1949, vol. 67, p. 98—119. 7. Feller W. A simple proof for renewal theorems.— Communs Pure and АррЬ Math., 1961, vol. 14, p. 285—293. 8. Сарымсаков T. А. Основы теории процессов Маркова. М.: Гостехиздат, 1954.
Цепи Маркова со счетным числом состояний (А. А. Юшкевич) 507 9. Doeblin W. Sur deux problemes de Kolmogoroff concernant les chaines de- nombrables.— Bull. Soc. math. France, 1938, vol. 66, p. 210—220. 10. Chung K. L. An ergodic theorem for stationary Markov chains with a countab- le number of states.— In: Proc. Intern. Congr. Math. Cambridge (Mass.), •1950, vol. 1, p. 568. 11. Derman C. A solution to a set of fundamental equations in Markov chains.— Proc. Amer. Math. Soc., 1954, vol. 5, p. 332—334. 12. Chung K. L. Markov chains with stationary transition probabilities. Berlin, 1960. Рус. пер.: Чжун Кай-лай. Однородные цепи Маркова. М.: Мир, 1964. 13. Orey S. An ergodic theorem for Markov chains.— Ztschr. Wahrscheinlich- keitstheorie, 1962, Bd. 1, S. 174—176. 14. Blackwell D., Freedman D. The tail о-field of a Markov chain and a theorem of Orey.— Ann. Math. Statist., 1964, vol. 35, p. 1291—1295. 15. Kingman J. F. C., Orey S. Ratio limit theorems for Markov chains.— Proc. Amer. Math. Soc., 1964, vol. 15,. p. 907—910. 16. Молчанов С. А. Предельная теорема для отношения переходных вероятно- стей марковских цепей.— УМН, 1967, т. 22, вып. 2, с. 124—125. 17. Молчанов С. Л. Некоторые задачи теории границ Мартина для марковских процессов: Канд. дис. М.: МГУ, 1967. 18. Levy Р. Systemes markoviens et stationnaires. Cas denombrable.—Ann. sci. Ecole norm, super. Ser. 3, 1951, vol. 68, p. 327—381. 19. Doeblin W. Sur les proprietes asymptotiques de mouvement regis par certains types de chaines simples.— Bull. math. Soc. roum., 1937, vol. 39, N 1, p. 57— 115;, N 2, p. 3—61. 20. Doob J, L. Stochastic processes. New York: J. Wiley, 1953. Pyc. nep.: Дуб Дж. Л.: Вероятностные процессы. М.: Изд-во иностр, лит., 1956. 21. Chung К. L. The general theory of Markov processes according to Doeblin.— Ztschr. Wahrscheinlichkeitstheorie, 1964, Bd. 2, S. 230—254. 22. Orey S. Limit theorems for Markov chain transition probabilities. London, 1971. 23. Harris T. E. The existence of stationary measures for certain Markov proces- ses.— In: Proc. Third Berkeley Sympos. Math. Statist. Probab., 1956, vol. 2, p. 113—124. 24. Chacon R. V., OrnsteinD. S. A general ergodic theorem.— Ill. J. Math., 1960, vol. 4, p. 153—160. 25. RevuzD. Markov chains. Amsterdam, 1975. 26. Нагаев С. В. Некоторые предельные теоремы для однородных цепей Марко- ва.— Теория вероятностей и ее применения, 1957, т. 2, № 4, с. 389—416. 27. Нагаев С. В. Уточнение предельных теорем для однородных цепей Марко- ва.— Теория вероятностей и ее применения, 1961, т. 6, № 1, с. 67—86. 28. Добрушин Р. Л. Центральная предельная теорема для неоднородных цепей Маркова.— Теория вероятностей и ее применения, 1956, т. 1, № 1, с. 72— 89. 29. Статулявичус В. А. Локальные предельные теоремы и асимптотические раз- ложения для неоднородных цепей Маркова.— Литов, мат. сб., 1961, т. 1, № 1,*с. 231-314. 30. Сираждинов С. X.* Форманов Ш. К. Предельные теоремы для сумм случай- ных векторов, связанных в цепь Маркова. Ташкент: Фан, 1979. 31. Free dm цп D. Markov chains. S. Francisco: Holden-Day, 1971. 32. Hunt G. A. Markoff processes and potentials.— Ill. J. Math., 1957, vol. 1, p. 44—93; 316—369; 1958, vol. 2, p. 151—213. Рус. перл Хант Дж. А. Мар- ковские процессы и потенциалы. М.: Изд-во иностр, лит., 1962. 33. Дынкин Е. Б. Марковские процессы. М.: Физматгиз, 1963. ' 34. Хеннекен Н. Л.ч Тортра А. Теория вероятностей и некоторые ее приложе- ния. М.: Мир, 1974. 35. Feller W. Boundaries induced by non-negative matrices.— Trans. Amer. Math. Soc., 1956, vol. 83, p. 19—54. 36. Doob J. L. Discrete potential theory and boundaries.— J. Math. Meeh., 1959’, vol. 8, p. 433—458. 17*
508 Комментарии 37. Watanabe Т, On the theory of Martin boundaries induced by countable Markov processes.— Mem. Colloq. Sci. Univ. Kyoto (A), 1960, vol. 33, p. 39—108. 38. Martin R. S. Minimal positive harmonic functions.— Trans. Amer. Math. Soc., 1941, vol. 49, p. 137—172. 39. Hunt G. A. Markoff chains and Martin boundaries.— Ill. J. Math., 1960, vol. 4, p. 313-340. 40. Дынкин E. Б. Граничная теория марковских процессов (дискретный слу- чай).— УМН, 1969, т. 24, вып. 2, с. 3—42. 41. Кетепу J. G., Snell J. L., Knapp A. W. Denumerable Markov chains. Prin- ceton: Univ. Press, 1966; New York, 1976. 42. Ширяев A. H. Вероятность. M.: Наука, 1980. ТОЖДЕСТВА ВАЛЬДА (к № 35) (А. А. Новиков) Комментируемая работа во многом предвосхитила многочисленные иссле- вания по обобщениям тождеств Вальда, которые проводились впоследствии на основе аппарата теории мартингалов. Вальдом в работах [1,2] были получены, в частности, следующие соотно- шения для момента первого выхода v сумм независимых одинаково распределен- п ных случайных величин из конечного интервала (а, Ь). Пусть In = 2 u v — inf {п > 1 ; £n ф (а, b)}. Тогда Му <2 оо, и если М | | < оо, то М (|v - у (Mgfc)) = 0; (1) кроме того, если < оо, то М [5V - V (М^)]2 = (Мф Mv. (2) Эти соотношения позволили Вальду получить приближенные формулы для среднего времени наблюдения в задаче последовательного различения двух простых гипотез. В комментируемой работе была предпринята попытка освобождения от ус- ловия одинаковой распределенности случайных величин которое играло существенную роль в методе работ Вальда [1, 2]. Но гораздо более важным было продвижение, состоящее в обобщении соотношений‘(1) и (2) на произволь- ные моменты остановки v. Впоследствии такого типа результаты (с произволь- ными моментами остановки) стали играть фундаментальную роль в различных задачах статистического последовательного анализа [3], теории управляемых случайных процессов [4], граничных задачах для случайных процессов [5, 6J и др. Интересно отметить, что в комментируемой работе не использовалось по- нятие момента остановки (или марковского момента, см. [3]) для последова- тельности случайных величин и теоремы 1 и 2 справедливы на самом деле и для некоторых немарковских моментов. Однако при доказательстве теорем 3,4
Тождества Вальда (А. А. Новиков) 509 и 5 неявно предполагалось условие, близкое к марковскому свойству момента v. На указанный пробел указан» Сейц и Винкельбауер в [7] (там же приведены уточненные формулировки теорем 3, 4 и 5). Для случая, когда v — марковский момент*остановки относительно се- мейства о-алгебр Fn = о = {0, Й} (т. е. событие {v = п} Fn при любом п — 1, 2, . . . ), можно указать следующие обобщения результатов комментируемой работы. Пусть — последовательность случайных величин с п конечным математическим ожиданием = У, и пусть при некотором а е [1, 2] Тогда m(^v- 5 М(^|^_1)) = 0; (4) [V “1 у м I Fk_r) < оо, то Г v а v п L /с=1 J L k—1 J Тождество (4) при условии справедливости (3) с а = 2 доказано Бурк- хольдером и Ганди [8]; его обобщения на случай 1 а 2 приведены в книге Чоу и Тейчера [9]. Аналогичные результаты для случая непрерывного времени получены Новиковым [10, И]. В работе Холла [12], а также в [10, 11] рассмат- ривались тождества с моментами всех порядков. Тождества Вальда (1) и (2) для случая одинаково распределенных слагае- мых являются очевидными следствиями (4) и (5). Однако, как следует из (3), первое из этих соотношений справедливо лишь при выполнении условия (MvV«).M| |“< оо при некотором а е [1, 2]. ЛИТЕРАТУРА 1. Wald A. On comulative sums of random variables.—Ann. Math. Statist., 1944, vol. 15, p. 285—287. 2. Wald A. Differentiation under the expectation sing in the fundamental iden- tity of sequential analysis.— Ann. Math. Statist., 1946, vol. 17, p. 493—497. 3. Ширяев A. H. Статистический последовательный анализ. M.: Наука, 1976. 4. Гихман И. И., Скороход А. В. Управляемые случайные процессы. Киев: Наук, думка, 1977. 5. Боровков А. А. Вероятностные процессы в теории массового обслуживания. М.: Наука, 1972. 6. Новиков А, А. Мартингальный подход в задачах о времени первого пересе- чения нелинейных границ.— Тр. МИАН СССР, 1981, т. 158, с. 130—152. 7. Сейц И., Винкельбауер К. Заметка к статье Колмогорова и Прохорова «О суммах случайного числа случайных слагаемых».— Чехословац. мат. журн., 1953, т. 3, с. 89—91.
510 Комментарии 8. Burkholder D. L., Gundy R. F. Extrapolation and interpolation of quasilinear operators on martingales.— Acta math., 1970, vol. 124, p. 249—304. 9. Chow Y. Teicher H. Probability theory. New York: Spring.-Verl., 1978. 10. Новиков А. А. О моментах остановки винеровского процесса.— Теория ве- роятности и ее применения, 1971, т. 16, № 3, с. 458—465. 11. Новиков А, А. О разрывных мартингалах.— Теория вероятности и ее при- менения, 1976, т. 20, № 1, с. 13—28. 12. Hall W. J. On Wald’s equation in continuous time.— J. AppL Probab., 1971, vol. 8, N 1, p. 59-68. 5-СХОДИМОСТЬ (к № 42) (А. В. Скороход) В работе № 42 [1] была предложена следующая, более удобная метрика, эквивалентная метрике S, введенной в § 2: rD(f,g) = mi sup [р g(t)) 4-1 («) — tj, где /, g e Dx, p — метрика в X, Л — множество всех непрерывных обрати- мых отображений X [0,1] на себя, X (0) = О, X (1) = 1. В этой метрике Dx се- парабельно, если сепарабельно X, но не полно. Биллингсли [2] предложил явный вид метрики, которая, порождая ту же схо- димость, превращает Dx в полное пространство (если, естественно, полно X), Она определяется так: Ш) = inf sup Гр(/(О, g (i))4-1 In 11 ASAOCKI L I s IJ (мы приводим более’ простое эквивалентное определение). Обобщение рассматриваемой сходимости на пространство функций без раз- рывов второго рода, заданных на [0, -оо[, аналогичное равномерной сходимости непрерывных функций на всех конечных интервалах, имеется в [3]. ЛИТЕРАТУРА 1. Гихман И. И., Скороход А. В. Введение в теорию случайных процессов. М.: Наука, 1965. 2. Биллингсли П. Сходимость вероятностных мер. М.: Наука, 1977. 3. Stone С. Weak convergence of stochastic processes defined on semi-infinite time intervals.— Proc. Amer. Math. Soc., 1963, vol. 14, p. 694—696. РАВНОМЕРНЫЕ ПРЕДЕЛЬНЫЕ ТЕОРЕМЫ (к № 43, 51) (Т. В. Арак) Основные теоремы работы № 51 ныне известны как равномерные предельные теоремы Колмогорова. Согласно указанному во введении теорема 1 (или рав- носильное ей соотношение (0.9)) является уже третьим уточнением соответст- вующей теоремы из предыдущей работы (К° 43). В дальнейшем, в 1965 г., Ле
Функции концентрации (В. М. Круглов) 511 Кам [1] показал, что при подходящем центрировании в теореме 1 можно взять D = exp (n(F — Е)), С\ = 132. В 1973 г. Ибрагимов и Пресман [2] представили новое доказательство с С\ = 8. Параллельно оценкам, равномерным по множеству всех распределений, исследовались и оценки для разных более узких классов распределений слагаемых. В частности, Мешалкин доказал, что sup р (В” £)) = О где Вр — биномиальное распределение с параметрами пир. Окончательное решение было получено Араком [3, 4]: найдутся такие по- ложительные (абсолютные) постоянные Си С, что Cn~2!* if (n) СтГ*^ (ср. с (0.9) и (0.10)). Используя разработанные в [3] новые методы оценки равномерного расстоя- ния, Зайцев и Арак [5J нашли также окончательное количественное уточнение теоремы 2. Многомерные варианты равномерных предельных теорем Колмогорова ис- следовались Сазоновым, Пресманом и Зайцевым. ЛИТЕРАТУРА 1. On the distribution of sums of independent random variables.— In: Bernoul- li, Bayes, Laplace (anniversary volume) / Ed. L. Le Cam, J. Neyman. Berlin; Heidelberg; New York: Spring.-VerL, 1965, p. 179—202. 2. Ибрагимов И. А., Пресман Э.Л. О скорости сближения распределений сумм независимых случайных величин с сопровождающими законами.— Теория вероятностей и ее применения, 1973, т. 18, № 4, с. 753—765. 3. Арак Т. В. О скорости сходимости в равномерной предельной теореме Кол- могорова. I, II.— Теория вероятностей и ее применения, 1981, т. 26, № 2, с. 225—245; № 3, с. 449—463. 4. Арак Т. В. Уточнение нижней оценки для скорости сходимости в равномер- ной предельной теореме Колмогорова.— Теория вероятностей и ее приме- нения, 1982, т. 27, № 4, с. 767—772. 5. Арак Т. В., Зайцев А. Ю. Оценка скорости сходимости во второй равно- мерной предельной теореме Колмогорова.— ДАН СССР, 1982, т. 267, № 1, с. 14-18. ФУНКЦИИ КОНЦЕНТРАЦИИ (к № 45) (В. М. Круглов) Эта замечательная работа Колмогорова явилась источником многочислен- ных глубоких исследований по функциям концентрации. В настоящее время имеется монография [1], специально посвященная функциям концентрации^ Главы, в которых говорится о неравенствах типа неравенства Колмогорова, составляют ядро этой книги. В ней можно найти многочисленные обобщения и применения функции концентрации Леви, а также довольно подробную библио- графию.[О некоторых результатах, связанных с неравенством Колмогорова, мы скажем несколько подробнее ниже.
512 Комментарии Понятие функции концентрации было введено Леви в его известной моно- графии 1937 г. «Theorie de Г addition des variables aleatoires», упоминаемой в работе Колмогорова. Там же Леви привел ряд важнейших свойств этих функций. Понятие функции концентрации не сразу заслужило признание и получило достаточную известность. Этим/ по-видимому, можно объяснить тот факт, что спустя пять лет оно вновь было введено в качестве одной из характеристик вероятностных распределений Литтлвудом и Оффордом х. Исследования по уточ- нению и обобщению неравенства Колмогорова проводились по нескольким на- правлениям. Два из них были указаны самим Колмогоровым, первое— получе- ние неравенства, объединяющего неравенство Леви и его уточнение, приводи- мое Колмогоровым, и неравенство Деблина, и второе направление — анализ функций концентрации. Как пишет сам Колмогоров, его интерес к функциям концентрации и их свойствам возник в связи с задачей об аппроксимации свер- ток распределений безгранично делимыми распределениями. Ко второму направлению относится один из результатов Колмогорова, не выделенный им специально и пока что не привлекший большого внимания. Тем не менее мы его сформулируем. Пусть Q — функция концентрации. Определим величину у I Q (у) у J Если Kq — 1, то Q = рЕ + (1 — р) К, где 0 < р < 1, Е — единичное рас- пределение, сосредоточенное в нуле, R — абсолютно непрерывное распределе- ние. Первые обобщения неравенства Колмогорова были получены Рогозиным в 1961 г. В частности, в одной из своих статей он показал, что условие L2 > > Z2 log s в теореме Колмогорова можно опустить. Дальнейшим уточнением и обобщением неравенства Колмогорова занимались Зигель, Кестен, Ле Кам, Мирошников, Петров, Постникова, Рогозин, Розен, Сазонов, Севастьянов, Теодореску, Хенгартнер, Энгер, Эссеен и др. Первоначальные обобщения не- равенства Колмогорова были получены на пути, указанном Колмогоровым с привлечением комбинаторных методов. Затем наметилась тенденция к преиму- щественному использованию аналитических методов. В статье Постниковой и Юдина, опубликованной в 1978 г., было доказано одно неравенство типа нера- венства Колмогорова аналитическими методами с привлечением некоторых результатов аддитивной теории чисел; их неравенство* может быть выведено из неравенств Кестена, доказанных им в 1969 г. с существенным использованием комбинаторных методов. Последним достижением в этом направлении является неравенство, принад- лежащее Мирошникову и Рогозину [2, 3]. Обозначим Q функцию концентра- ции суммы £ = Bi + . . . + независимых случайных величин, Qj функцию концентрации и симметризацию случайной величины 1 Мы не приводим здесь точных ссылок на их статью и на ряд статей других авторов, о которых мы упомянем. Эти ссылки заинтересованный читатель может найти в монографии [1].
Функции концентрации (В. М. Круглов) 513 Существует абсолютная постоянная С такая, что Q (Д < CL ( § М (min {| |, hpfQp (I.) ) для любых положительных 11ч . . ., ln, £, 2L max lj. Доказательство этого неравенства осуществлено аналитическими методами. Более того, в той общности, в которой оно доказано, и без учета сравнения абсолютных постоянных неравенство Мирошникова и Рогозина в настоящее время наиболее сильное. Из многочисленных обобщений понятия функции концентрации Леви мы приведем только одно, указанное Энгером. Пусть Е — выпуклое множество евклидова пространства Rd. Обозначим РЕ (х) функционал Минковского, оп- ределяемый по Е. Назовем Г(1-,£)= J exp{-Pr {x)}P{dx) интегральной функцией концентрации случайного вектора где Р — распре- деление симметризации Недавно Мирошников [4] доказал неравенство для интегральной функции концентрации, аналогичное приведенному выше. Существует абсолютная постоянная С такая, что г 'П \ —*/2) и (i-,LE) < CL 2 М (min{РЕ (£<’>), (5LE)\ для любых положительных 11У . . ., ln, L, 2L max lj. Здесь под £ и пони- маются случайные векторы со значениями в Rd: выпуклое множество Е принад- лежит специальному классу множеств, в которой, в частности, входят множе- ства, удовлетворяющие условию m рЕw = SiaixI. хел<г> г=1 где Aj, . . ., Am — некоторые линейные операторы в Rd. Заметим, что определение интегральной функции концентрации имеет ту же самую природу, что и осредненная функция концентрации Каваты [5]. Над- лежаще распространенная с одномерного случая [1, с. 155] на многомерный случай, она и интегральная функция концентрации, с очевидностью, обнаружи- вают общую природу как интегральных преобразований с определенными яд- рами. ЛИТЕРАТУРА 1. Хенгаршнер В., Теодореску РЛ Функции концентрации/Пер. с англ. М.: Наука, 1980. 2. Мирошников А. Л., Рогозин Б. А. Неравенства для функции концентра- ции.— Теория вероятностей и ее применения, 1980, т. 25, № 1, с. 178—183.
514 Комментарии, 3. Мирошников А. Л,, Рогозин Б. А. Замечания к одному неравенству для функций концентрации сумм независимых случайных величин.— Теория вероятностей и ее применения, 1982, т. 27, № 4, с. 787—789. 4. Мирошников А. Л. Неравенства для интегральной функции концентра- ции.— В кн.: Предельные теоремы для сумы случайных величин: Тр. Ин-та математики СО АН СССР, 1984, т. 3, с. 159—170. 5. Kawata Т. The mean concentration function of a chance variable.— Duke Math. J., 1941, vol. 8, p. 666—677. ЭМПИРИЧЕСКИЕ РАСПРЕДЕЛЕНИЯ (к № 15) (Э. В. Хмаладзе) 1. Комментируемая статья — это та работа, в которой вводится классиче- ская статистика Колмогорова оп = уГп sup I Fn («) — F (t) I t и устанавливается ее предельное распределение — распределение Колмого- рова. К 1933 г. функция эмпирического распределения Fn представляла собой привлекательный, но мало освоенный в математической теорий объект. Точных утверждений о сходимости Fn к функции распределения F еще не существовало _(см. п. 3), и, конечно, не существовало правильных результатов относительно поведения отклонений Fn от F (см. п. 2), если не относить сюда теорему Пирсона 1900 г. о предельном распределении статистики «хи-квадрат» (см. [1]). 2. Опишем коротко две очень известные работы Крамера и Мизеса, хорошо иллюстрирующие степень, которой достигала формализация утверждений об отклонениях Fn от F к 1933 г. В книге [2], вышедшей в 1931 г., Мизес (§ 10, с. 316—32*7) ввел статистику, названную им «статистика омега-квадрат»: = SRn W - F (г)Р dt. .Обсуждая «возможный разброс» значений при больших п, Мизес пишет (см., например, с. 320 в [2]), что теоретическим интервалом значений (theore- tische Wert) для со^ является интервал Cn = (Ew2 - 0,674 Е(й2 +0,674 где, напомним, 0,674 есть квантиль уровня 0,75 стандартного нормального рас- пределения Ф, т. е. Ф(0,674) — Ф (—0,674) == 0,5. За таким утверждением, no- видимому, должно стоять представление об асимптотически нормальной рас- пределенности случайной величины (со* — Есо^)/1/ Dco^, которое, конечно, неверно. Любопытно все же заметить, что для равномерной на [0, 1] функции распре- деления lim Р {(D?2t е= Сп} = 0,60, П—оо что не так уж далеко от 0,5.
Эмпирические распределения (<9. В. Хмаладзе) 515 В статье Крамера [3] 1928 г., где также предлагалось рассматривать ста- тистику о)2 дЛЯ проверки гипотезы относительно F, вовсе не ставится вопрос о предельном распределении статистики со^, а осуществляется следующий план: предположим, что F близка к функции нормального распределения а со средним р, и дисперсией о2, т. е. F представима небольшим, но неизвестным числом членов ряда Шарлье; F ~ фи,о + + • • • + Как выяснить, сколько членов в этой сумме существенны? Для ответа на этот вопрос предлагалось рассматривать интегралы Доп = V^n(t) - ФмОТ<й, . А?п = $ 1Гп (0 - Фц,а «) - Pi (0 фц.я (t)F dt и т. д. (в статье Крамера —- до четвертого порядка). Если интеграл «силь- но» уменьшается в сравнении с п, то, значит, i-й член в разложении F «су- щественный». Такой прием применяется в статье ко многим конкретным данным, причем параметры ц и а2 оцениваются по этим же данным. 3. Из теоремы 1 комментируемой работы следует, что sup | Fn (t) — F (t) | —* О по вероятности при п —* оо. Более сильное утверждение о сходимости* sup | Fn (t) — ^(0 1 к нулю с вероятностью 1 при п оо — теорема Гливен- ко — опубликовано Гливенко одновременно со статьей Колмогорова в том же номере журнала (см. [4]),. Касаясь связи между теоремой Колмогорова и теоремой Гливенко, инте- ресно напомнить, что через 11 лет, в 1944 г., в фундаментальной работе [6] Смирнов доказал для статистики Колмогорова неравенство для больших укло- нений Р {Z>n> X} < 2е~‘Л2 [14-0 (1)], л = о (п1*), п->оо, из которого уже следует утверждение теоремы Гливенко. 4. Как видим, первая таблица значений функции распределения Колмогоро- ва опубликована самим Колмогоровым. В 1939 г. Смирнов опубликовал шестизначные таблицы функции распреде- ления Колмогорова как приложение к своей статье [7] (см. также [5, с. 117]). В последующем эти таблицы были опубликованы отдельно в 1948 г. в [8], а затем воспроизведены в [9]. Очень подробные семизначные таблицы функции распре- деления Колмогорова были вычислены в 1965 г. и опубликованы на с. 2.67—277 в [5]. Шаг в этих таблицах равномерный и равен 0,001, а наибольшее значение аргумента равно 3,000. При этом значении аргумента функция распределения Колмогорова равна 0,999 999 969 5. 5. Приведенная в статье замечательная лемма о том, что распределение ста- тистики Dn не зависит от F, направила последующее развитие теории непарамет- рических критериев согласия в соответствии со следующим принципом: выбирать в качестве статистик критериев согласия такие функционалы от Fn и от F, распре- деление которых уже от F не зависит.
516 Комментарии В связи с этим принципом стоит напомнить следующее: в 1900 г. в работе [1] при построении статистики хи-квадрат , VI [AF (i.) - AF и.)]« Хп (*) - » ^-------AF(t.)------ ’ *» <fl < • • • < ^+П> г—1 г Пирсон выбрал коэффициенты конечно, целенаправленно так, чтобы предельное распределение этой квадратичной формы не зависело от вероятно- стей &F (ti) = F — F (£$), тем самым от точек разбиения и от функции распределения F. Позже появилось много работ, в которых устанавливалась асимптотически нормальная распределенность рассматриваемых статистик. Яс- но, что такие статистики достаточно нормировать, чтобы получить случайные величины со стандартным предельным распределением. Возможно, под влияни- ем такой традиции в 1931 г. в книге [2] Мизес, рассматривая статистики (>-) = S (0 - F (0F1 (0 dt, обсудил лишь два выбора весовой функции 1: (t) — nlf (/), где f — плотность функции распределения F, и Х2 (0 = 1/Е [Fw (t) — F (t'ffdt. Выбор рассмат- ривался как аналогичный случаю статистики хи-квадрат, но неподходящий, так как интеграл со^ (2^) «обычно» оказывается расходящимся, а выбор л2 признавал- ся подходящим, так как стандартизовал среднее статистики омега-квадрат. Од- нако предельное распределение статистики со^ (2i2), конечно, зависит от F. Затем в 1933 г. была сформулирована комментируемая лемма, а в 1937 г. Смирнов в работе [10], со ссылкой на Гливенко, ввел, наконец, статистику (X), где % (t) = ф [F (t)]f (£), распределение которой от F не зависит. С этого време- ни, а можно сказать и что с 1952 г., после появления статьи Андерсона и Дар- линга [И], указанный принцип при построении непараметрических критериев согласия стал общепринятым. В случае, когда статистическая гипотеза фиксирует не конкретную функцию распределения F, а некоторое семейство F функций распределения, осуществле- ние этого принципа столкнулось с затруднениями. Краткое описание работ, по- священных этой проблеме, и библиографию, весьма неполную, к которой следует здесь присоединить статью Гихмана [12], можно найти, например, в п. 1 § 2 рабо" ты [13]. Там же [13, § 2] приведен ответ на вопрос: как строить функционалы от Fn и от F, предельное распределение которых не зависит от F. В случае, когда F — непрерывное распределение в многомерном простран- стве Rm, т^> 1, утверждение леммы уже неверно: неверно, что случайная вели- чина F (А\, . . ., Хт) имеет при всех F одно и то же распределение, если случай- ный вектор (Хх,. . ., Хт) имеет непрерывную функцию распределения F. Поэто- му столь же общепринятого способа построения непараметрических критериев согласия для распределений в многомерном пространстве, что и в одномерном пространстве, как нам кажется, сейчас нет. Укажем все же две современные ра- боты [14, 15] и одну давнюю работу [16] на эту тему. 6. Свертка (16) и рекуррентная формула (9) комментируемой статьи в после- дующем много раз использовались для вычислений при конечных п. В частно- сти, в 1950 г., по-видимому, одним из’первых Масси [17], используя формулу (16), вычислил небольшие таблицы для функций распределения статистики Кол-
Эмпирические распределения (Э. В. Хмаладзе) 517 могорова для п от 5 до довольно больших (до 80). Сравнительно недавно (см. [18]) рекуррентная формула, аналогичная формуле (9), была использована для вычисления вероятносте!! невыхода Fn за различные криволинейные границы. Говоря о табулировании Фп, заметим, что современные сборники статистиче- ских таблиц содержат обычно таблицу значений функций распределений Фп и их процентных точек для п 100. Впрочем, уже при п 30 с успехом могут быть применены известные асимптотические формулы. Эта сторона дела изложена в пояснительной части в [9], где приведены и необходимые ссылки. 7^ Введем так называемый равномерный эмпирический процесс rn, vn (t) = = п [Fn (t) — Z], и броуновский мост г, v (t) — w (t) —tw (1), где w — вине- ровский процесс, t е [0, 1], и рассмотрим следующий функционал от эмпириче- ского процесса: | v (t) | h>0- Пусть ЛЛМ) = е [0Д]: (<) - г I < Ь , I у п ) ФпК (X, К) = Р {X (РП) < М. Очевидно, что Рп (X, h) — Фп^ (Z, К), т. е. вычисление вероятностей невыхода эмпирического процесса за некоторую границу и вычисление функций распре- делений функционалов К (vn) — эквивалентные задачи. Однако пути, которыми развивалась каждая из этих задач, были различны. По поводу первой задачи — изучение вероятностей невыхода — см. обзоры Гихмана и Гнеденко [19] и Боровкова и Королюка [20]. Напомним, как шло развитие второй задачи. В комментируемой работе уста- новлен предел для функции распределения статистики Колмогорова: при h = 1 последовательность ФпК => Ф. Однако вероятностная «конструкция» функции распределения Колмогорова Ф, а именно равенство Ф(Х) = Р{Х(р)<1}, (1) долгое время оставалась многим неясной. Во всяком случае, оставалось неясным, какую пользу такая «конструкция» может принести. Однако со временем стали появляться другие статистики, которые, как позже было замечено, удобно записать в виде функционалов от эмпирического процесса. В частности, в 1939 г. в статье [22] Вальд и Вольфовитц рассматривали так называемую взвешенную статистику Колмогорова, т. е. функционал К (vn) с весовой функцией h =/= 1, а в 1937 г. в [10] Смирнов рассматривал статистику to2, т. е. функционал 1 <о2(%) = $ (2) о Стало естественным выделить факт, лежащий в основе сходимости распределе- ний различных функционалов от рп, а именно сходимость vn к v по распределе- нию.
518 Комментарии Однако прояснение того, что различные статистики естественно записывать как функционалы от эмпирического процесса, было лишь одной важной стороной дела. Требовалось и другое — требовалось предвидение, что для доказательст- ва сходимости по распределению процессов vn к процессу v и вообще для доказа- тельства слабой сходимости в функциональных пространствах могут быть выра- ботаны общие эффективные методы. И то и другое созрело к концу 40-х годов: 30 ноября 1948 г. (как сообщают «Успехи математических наук» (1949, т. 4, вып. 2, с. 173)) А. Н. Колмогоров сделал, в Московском математическом обществе доклад «Меры и распределения в функциональных пространствах», в котором обсуждались проблемы задания и слабой сходимости мер в функциональных пространствах, 29 января 1949 г. Смирнов сделал доклад «О критерии Крамера — Мизеса» [23] (см. также [5, с. 200]), в котором вновь, после 12-летнего перерыва, получил предельное рас- пределение статистики о2, на этот раз пользуясь именно представлением (2) и связанным с ним равенством Парсеваля. Наконец, в сентябре 1949 г. появилась знаменитая заметка Дуба [24]. Вместе с описанием общей точки зрения, что схо- димость Фп => Ф есть следствие сходимости vn к v по распределению, в’ этой заметке было доказано равенство (1). С этого времени началось целенаправленное развитие теории слабой сходи- мости в функциональных пространствах, которая составляет в настоящее время основу для получения предельных теорем в непараметрической статистике. Для ознакомления с состоянием этой области непараметрической статисти- ки можно предложить небольшую монографию Дурбина [25] и обзорную статью Генс л ера и Стуте [26]. - 8. Сделаем несколько заключительных замечаний, не относящихся к ка- кому-нибудь конкретному месту в тексте комментируемой работы. А. Статистика Колмогорова, так же как статистики К (vn) (см. п. 7), выде- ляются среди других статистик непараметрических критериев согласия тем, что приводят к наглядным доверительным множествам. Действительно, например, доверительное множество {F't ц J [Лп (t) — F' (t)]2dFf (t) < X}, построенное с помощью статистики (о2, ненаглядно и потому неудобно для использования. В от- личие от этого доверительное множество {F' : п 'sup|fn(t)-^' икм = F' : Fn(t) ——— < F' (t) < Fn (t) -j- —L-Д, построенное с помощью статистики п nJ Колмогорова, наглядно и очень широко используется. Такое свойство ста- тистики Колмогорова было замечено быстро — уже в 1939 г. Вальд и Вольфо- витц ввели в [22] доверительные множества : Fn (t) — —J— dn (Fn (t)) < F' (t) < I < Fn (O' + —= (F (0)1 , связанные co взвешенными статистиками; Колмо- n n ? J горова. В. В том же 1939 г. появились две статьи Смирнова (27] и [7]. В этих статьях указаны предельные распределения для статистик = ]/~n sup \Fn (t) — F (f)l и Dn^ — /n sup | Fln^ (t).— F2n* (t) [, n = n1n2/(n1 + n2) соответственно: P{Z>+<1}-1 ' ....... : (3)
Эмпирические распределения (Э. В. Хмаладзе) 519 Здесь Fln и F2n — функции эмпирических распределений, построенные по двум независимым последовательностям независимых одинаково распределенных случайных величин. Любопытно, что оба утверждения (3) — одни из наиболее известных утверж- дений непараметрической статистики — были указаны как простые следствия общих теорем о числе пересечений кривых Fn и F + V п и кривых Fln^ и F2n* 4; i соответственно. В 1944 г. Смирнов в [6] привел распределение статистики,/)^ ПРИ конечных п. В 1955 г. Королюк в работе [28] получил распределение статистики Dnin2 при конечных пх и п2, а в 1962 г. Боровков в работе [29] установил асимптотические разложения для распределений и, в частности, для вероятностей билыпих укло- нений статистик /)Л1П?. Конкретное использование некоторых результатов из [29] и [21] продемонстрировано в [9, с. 84]. По-видимому, первым табулирование распределений двухвыборочной ста- тистики Смирнова при конечных пх и и2 предпринял Мэсси [30]. Таблицы про- центных точек статистики Dnn* для пх < п2 50 опубликовали Боровков, Маркова и Сычева [31]. С. Замечательный в нескольких отношениях пример применения статистики Колмогорова для проверки гипотезы о функции распределения F привел в 1940 г. сам А. Н. Колмогоров в заметке [32]. ЛИТЕРАТУРА 1. Pearson К. On the criterion that a given system of deviations from the probab- le in the case of correlated system of variables is such that it can be reasonably supposed to have arisen from random sampling.— Phil. Mag., 1900, vol. 5, N 50, p. 157. 2. Mises R. von. Warscheinlichkeitsrechnung und ihre Anvendungen in der Statistik und theoretischen Physik. Leipzig; Wien: Franz Deuticke, 1931. 574 Sa 3. Cramer H. On the composition of elementary errors. Second paper: statistical applications.— Skand. Aktuarietidskr., 1928, h. 1/2, s. 141—180. 4. Glivenko V. Sulla determinazione empirica delle leggi di probabilita.— G. 1st. ital. attuar., 1933, vol. 4, N 1, p. 92—99. 5. Смирнов H. В. Теория вероятностей и математическая статистика: Избр. тр. М.: Наука, 1970. 290 с. 6. Смирнов Н. В. Приближение законов распределения случайных величин по эмпирическим данным.— УМН, 1944, вып. 10, с. 179—206. 7. Смирнов Н. В. Оценка расхождения между эмпирическими кривыми рас- пределения в двух независимых выборках.— Бюл. МГУ. Математика и механика, 1939, т. 2, с. 3—14. 8. Smirnov N. V. Table for estimating the goodness of fit of empirical distribu- tion.— Ann. Math. Statist., 1948, vol. 19, N 2, p. 279—281. 9. Большее Л. Н., Смирнов H.B. Таблицы математической статистики. М.: Наука, 1983. 10. Смирнов Н. В. О распределении со2-критерия Мизеса.— Мат. сб., 1937, т. 2, № 1, с. 973—993. 11. Anderson Т. W., Darling D. A. Asymptotic theory of certain «goodness of fit» criteria based on stochastic process.—Ann. Math. Statist., 1952, vol. 23, N 1, p. 193. 12. Гихман И. И. Некоторые замечания к критерию согласия А. Н. Колмого- рова.- ДАН СССР, 1953, т. 91, № 4, с. 715-718. 13. Хмаладзе Э. В. Некоторые примененйя теории мартингалов в статистике.— УМН, 1983, т. 37, вып. 6 (228), с. 194—212.
520 Комментарии 14. Bickel Р. J., Breiman L. Sums of functions of neares neighbour distances, moments bounds, limit theorems and a goodness of fit test.— Ann. Probab.’ 1983, vol. 11, p. 185—214. 15. Schilling M. F. Goodness of fit testing in Rm based on the weighted empi- rical distribution of certain nearest neighbour statistics.— Ann. Statist. 1983, vol. 11, N 1, p. 1—12. 16. Rosenblatt M. Remarks on multivariate transformation.— Ann. Math. Statist., 1952, vol. 23, N 3, p. 470—472. 17. Massey F. J., Jr. A note on the estimation of a distribution by confidence limits.— Ann. Math. Statist., 1950, vol. 21, N 1, p. 116—118. 18. Котельникова В. Ф., Хмаладзе Э. В. О вычислении вероятности невыхода, эмпирического процесса за криволинейную границу.— Теория вероятностей' и ее применения, 1982, т. 27, № 3, с. 599—607. 19. Гихман И. И., Гнеденко Б. В. Математическая статистика.— В кн.: Мате- матика в СССР за сорок лет. 1917—1957. М.: Физматгиз, 1959. Т. 1. 1002 с. 20. Боровков А. А., Королюк В. С. О результатах асимптотического анализа в задачах с границами.— Теория вероятностей и ее применения, 1965, т. 10, № 2, с. 255—266. 21. Королюк В. С. Асимптотический анализ распределений максимальных укло- нений в схеме Бернулли.— Теория вероятностей и ее применения, 1959, т. 4, № 4, с. 369—397. 22. Wald А., Wolfowitz J. Confidence limits for continuous distribution functions.— Ann. Math. Statist., 1939, vol. 10, N 2, p. 105—118. 23. Смирнов H. В. О критерии Крамера—Мизеса.— УМН, 1949, т. 4, вып. 4, с. 196—197. 24. Doob J. Heuristic approach to the Kolmogorov—Smirnov theorems.— Ann. Math. Statist., 1949, vol. 20, N 3, p. 393—403. 25. Durbin J. Distribution theory for tests based on the sample distribution fun- ction: Region, conf. Ser. in Appl. Math., 9th issue. SIAM, 1973. 64 p. 26. Gaensaler P., Stute W. Empirical processes: A survay of results for independent and identically distributed random variables.— Ann. Probab., 1979, vol. 7, N 2, p. 193-243. 27. Смирнов H. В. Об уклонениях эмпирической кривой распределения.— Мат. сб., 1939, т. 6 (48), № 1, с. 3—24. 28. Королюк В. С. О расхождении эмпирических распределений для случая двух независимых выборок.— Изв. АН СССР. Сер. мат., 1955, т. 19, № 1, с. 81— 96. 29. Боровков А. А. К задаче о двух выборках.— Изв. АН СССР. Сер. мат., 1962, т. 26, № 4, с. 605-624. 30. Massey F. J., Jr. Distribution table for the deviation between two sample cu- mulatives.— Ann. Math. Statist., 1952, vol. 23, N 3, p. 435—441. 31. Боровков А. А., Маркова H. П., Сычева H. M. Таблицы для критериев H. В. Смирнова однородности двух выборок. Новосибирск: Ред.-изд. отд. СО АН СССР, 1964, 139 с. 32. Колмогоров А. Н. Об одном новом подтверждении законов Менделя.— ДАН СССР, 1940, т. 27, с. 38-42. МЕТОД НАИМЕНЬШИХ КВАДРАТОВ (к № 30, 31) (М. Б. Малютов) Метод наименьших квадратов (МНК) — один из наиболее популярных ста- тистических методов оценивания параметров в приложениях. Достаточно ска- зать, что специалистами по геодезии, навигации, артиллерии и т. п. вплоть до настоящего времени создаются свои учебники по этому вопросу, не всегда отве- чающие стандартам математической статистики.
Метод наименьших квадратов (М, Б, Малюшов) 521 В то же время математические изложения метода вплоть до работы № 30 не были основаны на современных геометрических представлениях многомерной геометрии и по существу мало отличались от первоначального способа Гаусса. Именно в работе № 30 впервые отчетливо использована связь метода с ортого- нальной проекцией на подпространство в RN, выяснено, какие свойства метода зависят от предположения нормальности распределения измерений, а какие справедливы для ортогональных наблюдений. Для приложений важно обстоя- тельное изложение доверительных интервалов для параметров и неизвестной дисперсии измерений, снабженное таблицами распределений Стьюдента и %2. Статья № 30 сыграла важную роль в развитии математической теории МНК в нашей стране и упорядочении приложений этого метода. В частности, ее влия- ние заметно в книгах Линника [1] и Романовского [2]. В последней, в частности, воспроизведен с подробными доказательствами доклад А. Н. Колмогорова «Реальный смысл результатов дисперсионного анализа» (Труды 2-го Всесоюз- ного совещания по математической статистике), развивающий результаты работы № 30 в сторону теории дисперсионного анализа и содержащий критику некоторых недостаточно точных формулировок Фишера. За рубежом работа № 30 осталась незамеченной, и современное изложение теории метода наименьших квадратов было опубликовано только в 1959 г. Шеф- фе [3]. В работе № 31 указано уточнение одной формулы Гаусса из теории метода наименьших квадратов. Гаусс нашел формулу для дисперсии Ds2 стандартной оценки s2 дисперсии о2 независимых измерений в линейной регрессионной модели. В эту формулу входит четвертый момент/о4, поэтому Гаусс получил гра- ницы сверху и снизу для Z>s2, справедливые для любых /. Однако граница снизу была грубой (иногда даже отрицательной). В работе № 31 найдена неул у читае- мая граница снизу для Ds2. Изложение существенно опирается на развитую предварительно А. Н. Кол- могоровым в работе № 30 геометрическую теорию метода наименьших квадратов (в частности, существенную роль играет ортогональность некоторых матриц). Работа с небольшими изменениями воспроизведена в упомянутой выше книге Линника. В последующей литературе основное внимание уделено построению асимптотических доверительных интервалов для о2, в которые вместо / подстав- лена ее оценка по той же выборке [4]. ЛИТЕРАТУРА 1. Линник Ю. В. Метод наименьших квадратов и основы математико-стати- стической теории обработки наблюдений. М.: Физматгиз, 1952. 2. Романовский В. И. Математическая статистика. Ташкент: Изд-во АН УзССР, 1963. Кн. 2. 3. Шеффе Г. Дисперсионный анализ. М.: Изд-во иностр, лит., 1959. 4. Drugas Н. Asymptotic confidence intervals for the variance in the linear reg- ression model.— In: Statistics and probability: Essays in Honor of C. R. Rao Amsterdam: North Holland Publ. Co., 1982, p. 233—239.
522 Комментарии НЕСМЕЩЕННЫЕ ОЦЕНКИ . (к № 38) (Ю. К. Беляеву Я. П. Лумельский) Несмещенность оценок является одним из фундаментальных понятий ма- тематической статистики. Хотя это понятие было известно ранее, в статье 38 впервые систематически рассмотрены свойства несмещенных оценок и различ- ные методы построения таких оценок, выраженных через достаточные статистики. В комментируемой статье и работе А. Н. Колмогорова [1] выпукло пока- зано прикладное значение несмещенных оценок в задачах статистического контроля. Колмогоров впервые применил несмещенные оценки для определения эффективности реально используемых планов выборочного контроля по альтер- нативному признаку. Построение несмещенных оценок для предъявленного и пропущенного брцка, а также для априорного распределения числа дефектных изделий в контролируемых партиях рассматривалось в работах [2—4]. Были получены несмещенные оценки при контроле по качественному признаку с из- вестными ошибками классификации [5]. Вопросы построения несмещенных оце- нок при контроле по альтернативному и качественному признакам, т. е. при классификации на к групп качества, подробно рассматривались в книгах [3, 4], где приведена обширная библиография. Несмещенные оценки основных показа- телей контроля включены в ГОСТ 24660-81. Полученная А. Н. Колмогоровым несмещенная оценка плотности нормаль- ного распределения нашла широкое применение в задачах контроля по количе- ственному признаку [6]. В дальнейшем этот результат был обобщен для много- мерного нормального распределения [7—9], а также для задач статистической классификации [10]. А. Н. Колмогоров обратил внимание на статью [И],'где несмещенные оцен- ки строились для биномиальных случайных блужданий. В последующем задачи несмещенного оценивания и вопросы полноты семейств распределений, поро- жденных планами первого вхождения при различных схемах случайных блуж- даний, рассматривались в работах [12—14, 5]. Введенные А. Н. Колмогоровым верхние и нижние оценки могут быть эф- фективно использованы и в тех случаях, когда несмещенные оценки не суще- ствуют. Именно так обстоит дело при оценивании пропущенного брака при бино- миальном распределении п плане одноступенчатого контроля. Верхние и нижние оценки для различных функций от неизвестного параметра, а также оценки с минимальным смещением были получены в статьях [15—18]. ЛИТЕРАТУРА 1. Колмогоров А. Н. Статистический приемочный контроль при допустимом числе дефектных изделий, равном нулю. Л., 1951, с. 1—24. 2. Сираждинов С, X. Одинарный статистический приемочный, контроль.— Тр. Ин-та математики й механики АН УзССР, 1955, вып. 15, с. 41—56. 3. Беляев Ю. К. Вероятностные методы выборочного контроля. М.: Наука, 1975. 4. Лумельский Я. П. Статистические оценки результатов контроля качества. М.: Изд-во стандартов, 1979.
Статистическое прогнозирование (А. М. Яглом) 52& 5. Беляев Ю. К. Последующие оценки при выборочном контроле по качествен- ному признаку с ошибками классификации.— ДАН СССР, 1976, т. 231г № 3, с. 521—524. 6. Liberman G. J., Resnikoff G. J. Sampling plans for inspection by variables.— J. Amer; Statist. Assoc., 1955, vol. 50, N 270, p. 457—516. 7. Лумелъский Я. П. Несмещенные достаточные оценки вероятностей в слу^ чае многомерного нормального закона.— Вести. МГУ. Математика, 1968.,. № 6, с. 14—17. 8. Лумелъский Я. П., Сапожников П. Н. Несмещенные оценки для плотности распределений.— Теория вероятностей и ее применения, 1969, т. 14, № 2Г с. 372-380. 9. Ghurye S. G., Olkin J. Unbiased estimation of some multivariate probability densites and related functions.— Ann. Math. Statist., 1969, vol. 40, N 4^ p. 1261—1271. 10. Абусев P. А., Лумелъский Я. П. Несмещенные оценки и задачи классифика- ции многомерных нормальных совокупностей.— Теория вероятностей и ее применения, 1980, т. 25, № 2, с. 381—389. 11. Girshick М.А., Mosteller F., Sawage L. J. Unbiased estimates for certain bino- mial sampling problems with applications.— Ann. Math. Statist., 1946, vol. 17, N 1, p. 13-23. 12. Линник Ю. В., Романовский И. В, К теории последовательного оценива- ния.— ДАН СССР, 1979, т. 194, № 2, с. 270—272. 13. Лумелъский Я. П. Случайные блуждания, отвечающие обобщенным урно- вым схемам.— ДАН СССР, 1973, т. 209, № 6, с. 1281—1284. 14. Беляев Ю. К,, Мальков А, Н, Полнота семейств вероятностных мер при обследовании по планам первого вхождения.— ДАН СССР, 1975, т. 225,. № 1, с. 27—30. 15. Сираждинов С. X. Об оценках с наименьшим смещением при биномиальном распределении.— Теория вероятностей и ее применения, 1956, т. 1, № 1г с. 168—174. 16. Большее Л, Н. Об оценках вероятностей.— Теория вероятностей и ее при- менения, 1960, т. 5, № 4, с. 453—457. 17. Беляев Ю. В», Лумелъский Я. П. Оценивание полиномов на основе ограни- ченных планов в схемах случайных блужданий.— Изв. АН СССР. Техн, кибернетика, 1979, № 1, с. 61—67. 18. Беляев Ю. К., Дугина Т. Н. Об оценке суммарного числа дефектных изде- лий, проникших к потребителю при контроле с ошибками.— Электрон, тех- ника. Сер. 8, 1980, № 5(83), с. 24—29. СТАТИСТИЧЕСКОЕ ПРОГНОЗИРОВАНИЕ (к № 18) (А. М. Яглом) Попытки статистического прогнозирования будущих значений тех или иных метеорологических параметров с помощью линейных уравнений регрессии, за- дающих искомое будущее значение интересующей нас величины Sy в виде про- стой линейной комбинации некоторых известных из наблюдений величин А^, . . . . ., Axjf, относящихся к прошлому или настоящему времени, получили сравни- тельно широкое распространение в метеорологии начиная с 20-х годов этого столетия. (В дополнение к указанной А. Н. Колмогоровым статье Баура 1925 г. можно еще сослаться, например, на более поздние работы [1—6], содержащие ряд дополнительных ссылок.) Этот метод прогноза на первый взгляд кажется очень простым: он требует лишь предварительной оценки некоторого числа коэффици-
524 Комментарии ентов корреляции, от которых зависят заранее нам неизвестные коэффициенты -ах, . . а^ уравнений регрессии, и не связан с громоздкими вычислениями типа т^ех, которые приходится производить при «динамическом прогнозе погоды», опирающемся на численное решение уравнений в частных производных, прибли- женно описывающих динамику атмосферы. Вся сложность здесь заключается лишь в удачном выборе предикторов А^, . . ., А^, т. е. тех характеристик ат- мосферы в прошлом и настоящем, значения которых используются для прогноза значения Ау. Оказывается, однако, что выбор предикторов на самом деле пред- ставляет собой совсем не простую задачу. В самом деле, может казаться, что полезно брать побольше предикторов, так как тогда прогноз будет использовать очень большую исходную информацию и поэтому в большой вероятностью окажется достаточно хорошим. К сожалению, однако, используемые при расчете эмпирические значения коэффициентов корре- ляции г{ и rij между величинами Ау и A#*, i = 1, и между парами А^ и A<rj, являются неточными и зависят от объема (и качества) тех эмпирических данных, которые имеются в нашем распоряжении. Поэтому также и те значения коэффициентов а1? . . ., при которых линейная комбинация «xA^ + . . . 4-flfcA#fc согласно этим данным лучше всего аппроксимирует значе- ние Ау, не являются точными, т. е. наилучшими для всей генеральной совокуп- ности случайных величин (А^1? . . ., А^, Ау), и в применении к последующей не- зависимой выборке эти значения могут уже оказаться заметно менее удачными. Для того чтобы этого не произошло, подбор предикторов должен удовлетворять ряду специальных условий, из которых мы здесь остановимся лишь на двух са- мых важных. Прежде всего для того, чтобы точность определения коэффициентов ах, . . . . . ., а/с не была бы совсем уж низкой, общее число к предикторов должно быть достаточно малым по сравнению с объемом выборки, используемой для определе- ния коэффициентов г;, гц и так, например, если объем выборки имеет порядок одной или немногих сотен, то число к не должно превосходить нескольких еди- ниц. Это условие было интуитивно ясно уже первым исследователям в области статистического прогноза погоды (см., в частности, замечание А. Н. Колмогоро- ва о том, что при использовании выборки, включающей 30—50 среднегодовых значений, число к, как правило, выбирается в пределах от трех и до семи); поз- же известный американский метеоролог Лоренц [4] назвал его «табу статисти- ческого прогноза». Однако, помимо того, имеется еще одно очень существенное требование, разъяснению которого как раз и посвящена статья № 18 А. Н. Кол- могорова п которое тем не менее до сих пор далеко не всегда принимается во внимание. Это второе требование состоит в запрещении перебора большого числа систем предикторов (пусть даже каждая из них и содержит лишь по небольшому числу величин) с целью отбора лучшей из этих систем. Дело в том, что если мы перепробуем множество разных систем предикторов, то с большой вероятностью хотя бы для одной из них эмпирическое значение сводного коэффициента кор- реляции данных предикторов с величиной Ау окажется сильно завышенным по сравнению с его истинным значением. В таком случае весьма вероятно, что имен- но эта система предикторов и будет выбрана для целей прогноза; однако в при- менении к последующей независимой выборке эмпирический коэффициент кор- реляции величин Ау и Au = а1/\х1 . 4-а^А^ здесь почти наверное будет
Статистическое прогнозирование (А. М. Яглом) 525 уже значительно меньшим, чем в случае исходной выборки. А. Н. Колмогоров с полным основанием утверждал в своей статье, что подобное «вздувание мак- симального эмпирического коэффициента корреляции» очень часто будет иметь место при переборе большого числа систем предикторов и что оно вполне естест- венно объясняет неудачи многочисленных попыток использования линейных уравнений регрессии для целей долгосрочного прогноза погоды; в качестве «мо- дельного примера», допускающего аккуратный расчет, им был проанализирован случай, когда все рассматриваемые величины имеют многомерное нормальное распределение вероятностей, исходная выборка имеет фиксированный объем N и проверяется I независимых систем из к предикторов, для каждой из которых сводный коэффициент корреляции с принимает одно и то же значение р. При этом значение Л такое, что максимальное значение эмпирического сводного коэф- фициента корреляции для наших i групп предикторов превзойдет X с некоторой заранее заданной вероятностью (скажем, равной 1/2), быстро растет с ростом i и уже при умеренно больших значениях i оказывается значительно превосходя- щим р (см., в частности, таблицу, относящуюся’ к случаю, когда N = 42, к = == 5 и i = 14). Отметим еще, что аккуратный вывод результатов Фишера, ис- пользовавшихся А. Н. Колмогоровым в его расчетах, в настоящее время может быть найден, например, в известной монографии [7]. Соображения, приведенные в статье А. Н. Колмогорова, делают довольно проблематичными и преимущества некоторых более новых методов статистичес- кого прогноза погоды, предложенных заметно позже опубликования рассмат- риваемой статьи. Типичным примером здесь является так называемый метод про- сеивания (screening procedure), пропагандировавшийся, в частности, Миллером (см., например, [4, 8]). Метод этот состоит в том, что сперва рассматривается очень большая совокупность предикторов, которая «просеивается» следующим образом. Сперва отбирается тот из предикторов (обозначим его А^), которому отвечает наибольший эмпирический коэффициент корреляции с прогнозируемой величиной А?/; затем тот из оставшихся (скажем, Дя2), который дает наибольший вклад в сводный коэффициент корреляции парьЦДл^, Дя2) с Ду; далее тот из ос- тавшихся (скажем, Д^3), которому отвечает наибольший сводный коэффициент корреляции трех величин (Д^, Дя2, Аж3) с А/Л и т« Д* Обычно после нескольких шагов получаемая на следующем шаге добавка к сводному коэффициенту кор- реляции оказывается уже незначительной, так что процедуру вполне можно прекратить. Число к отобранных предикторов при этом, как правило, оказыва- ется достаточно малым, чтобы не вступить в противоречие с «табу»; однако в силу соображений, опубликованных А. Н. Колмогоровым еще в 1933 г., в случае большой исходной совокупности возможных предикторов весьма вероятно, что для отобранных к из них эмпирическое значение сводного коэффициента корре- ляции лишь случайно окажется сравнительно большим, так что переход к неза- висимой выборке здесь сразу же приведет к разочаровывающим результатам. Аналогично обстоит дело и в случае другого широко известного метода отбора лишь небольшого числа наиболее существенных предикторов — метода эмпирических ортогоналных функций, предложенного в работах [9, 10] (см. также [6, 11, 12]) и фактически совпадающего с методом главных компонент мно- гомерного статистического анализа (ср. [7, гл. 11]). При применениях этого ме- тода из исходного набора всевозможных «виртуальных предикторов» прежде
526 Комментарии всего отбирается их линейная комбинация иг — А^, имеющая наибольшую из- менчивость (т. е. дисперсию); далее рассматриваются лишь некоррелированные с иг линейные комбинации предикторов и из них опять отбирается та комбинация и2 = Ах2, которая имеет наибольшую изменчивость, и т. д. Как правило, после отбора небольшого числа к линейных комбинаций u1? w2, • • •, ик изменчивость всех остальных оказывается уже столь малой, что их вполне можно уже не рас- сматривать. В случаях, когда исходное число всех допустимых предикторов оказывается сравнительно небольшим (как, например, в работе Обухова [10], где это число равнялось пяти), данный метод приводит к заметному упрощению, расчетов (позволяя, например, ограничиться рассмотрением лишь двух наиболее существенных линейных комбинаций пяти переменных); если же, однако, сна- чала рассматривается очень много предикторов (например, все значения одного или нескольких метеорологических полей на большой сети станций или в узлах правильной сетки), то здесь опять оказываются уже приложимыми соображения А. Н. Колмогорова, заставляющие ожидать, что комбинации и19 . . ., будут оптимальными лишь для той выборки, по которой они рассчитывались, а при переходе к независимой выборке результаты заметно ухудшатся. Вполне воз- можно, что именно этим обстоятельством объясняются некоторые разочаровываю- щие выводы о статистическом прогнозе с помощью эмпирических ортогональных функций, содержащиеся в работе [4]. В заключение подчеркнем, что работа А. Н. Колмогорова ясно показывает, насколько необходимым при разработке любых методов статистического прог- ноза погоды является тщательное изучение выборочных свойств используемых систем предикторов. Такое изучение и было начато А. Н. Колмогоровым в 1933 г.; к сожалению, оно до сих пор еще включает очень много пока нерешенных вопро- сов. ЛИТЕРАТУРА 1. Baur F. Der gegenwartige Stand der meteorologischen Korrelationsforschung.— Meteor. Ztschr., 1930, Bd. 47, S. 42—52. .2. Baur F. Einfiihrung in die Grosswetterkunde. Wiesbaden, 1948. 3. Wadsworth G. P. Application of statistical methods to weather forecasting.— In: Compendium of meteorology. Boston, 1951, p. 849—855. 4. Lorenz E. N. Prospects for statistical weather forecasting.— Statist. Fore- casting Proj. Final Rept. Cambridge (Mass.), 1959. 5. Яглом Af. M. Статистические, методы экстраполяции метеорологических полей.— В кн.: Тр. Всесоюз. науч, метеорологического совещ. Л.: Гидроме- теоиздат, 1963, т. 2 (Динамическая метеорология), с. 221—234. 6. Белов П. II. Статистические методы численного прогноза погоды.— В кн.: Численные методы прогноза погоды. Л.: Гидрометеоиздат, 1975, с. 259, 386. 7. Андерсон. Т. Введение в многомерный статистический анализ/Пер. с англ. М.: Физматгиз, 1963. 500 с. 8. Miller R. G. Statistical prediction by discriminant analysis.— Meteorol. Mo- nogr., 1962. Vol. 4, N 25. 54 p. 9. Lorenz E. N. Empirical ortogonal functions and statistical weather predicti- on.— Statist. Forecasting Proj. Sci; Rept N 1. Cambridge (Mass.), 1976. 49 p. 10. Обухов A. M. О статистически ортогональных разложениях эмпирических функций.— Изв. АН.СССР. Сер. геофиз., 1960, № 3, с. 432—439. 11. Мещерская А. В., Руховец Л. В., Юдин М. И., Яковлева Н. И. Естествен- ные составляющие метеорологических полей. Л.: Гидрометеоиздат, 1970. 12. Фортус. М> И. Метод эмпирических ортогональных функций и его-примене-г ние в метеорологии. Метеорология и гидрология, 1980, № 4, с. 113—119.
О межслоевом размыве (А. Б. Вистелиус) 527 О МЕЖСЛОЕВОМ РАЗМЫВЕ (к № 37) ' (А. Б. Вистелиус) Задача, решенная А. Н. Колмогоровым в комментируемой статье, возникла при изучении продуктивной толщи Апшеронского полуострова и красноцветных нефтеносных отложений на Челекене. Эти толщи целиком сложены терриген- ными образованиями. Среди них на Апшеронском полуострове содержатся ред- кие слои конгломератов; на Челекене толща состоит целиком из песков, алеври- тов и глин. В указанных отложениях видны углубления в нижележащих слоях, заполненные выступами вышележащих. Кроме того, в основании мощных пес- чаных слоев очень часто присутствуют фрагменты, сложенные глинами, тождест- венными по внешнему виду глинам подстилающего песчаный слой глинистого слоя. Эти фрагменты округлены и всеми исследователями рассматривались как следы размыва нижележащего слоя при формировании вышележащего. Указан- ная картина особенно характерна для Челекена. Отмеченные особенности указанных толщ не оставляют сомнения в том, что при их формировании размыв нижележащих слоев часто имел место при обра- зовании вышележащих слоев («межслоевой размыв»). Таким образом, для поста- новки задачи, решенной А. II. Колмогоровым, действительно были серьезные основания и она полностью сохранила значение до настоящего времени. В то же время необходимо иметь в виду, что, в период публикации статьи А. Н. Колмо- горова среди некоторых геологов было сильно убеждение, что мощности слоев в разрезе не зависят от того, из какого материала эти слои сложены. В общем случае это утверждение оказалось ошибочным. К тому же в момент публикации рассматриваемой статьи в геологических науках практически отсутствовали такие понятия, как случайная величина, функция распределения вероятностей, последовательность значений случайной величины. Это был период начала соз- дания научной базы ряда геологических дисциплин на основе введения в них представления о стохастическом характере изучаемых этими науками величин. Этой принципиальной перестройке, приведшей в дальнейшем к возникновению математической геологии, сильно способствовала не только комментируемая статья, но и личные советы и высказывания А. Н. Колмогорова в период с 1945 по 1950 г. Для использования работы А. Н. Колмогорова при решении задач, связан- ных с механизмом слоеобразования, необходимо выполнение fpex условий; а) уметь находить численные решения предложенного им уравнения, б) при изучении конкретных разрезов проверять приложимость аксиома- тики, принятой А. Н. Колмогоровым и отнюдь не имеющей, с современной точки зрения, универсального характера и в) располагать моделью слоеобразования, дающей G (х). Эта модель для полноценной работы должна выводиться из условий слоеобразования и давать возможность проверки ее непротиворечивости на материале наблюдений. Условие а) не является сколько-нибудь ограничивающим. Уравнение А. Н. Колмогорова совпадает с уравнением Винера — Хопфа, по численным же методам решения последнего имеется многочисленная литература. Незави-
528 Комментарии симо от этого в конце 40-х годов уже имелось достаточное число методов для решения указанной задачи. Соответствующий алгоритм был подобран сразу же после публикации статьи А. Н. Колмогорова, и с его помощью был рассчитан целый ряд примеров. Эти данные не были опубликованы, так как было невозмож- но соответственно принять ту или иную функцию за G (х). Аксиоматика, принятая А. Н. Колмогоровым (условие б)), заключается в следующем. 1. Случайные величины 6П и <pn+i взаимно независимы и все 6П имеют один и тот же закон распределения Р{бп < х} = G (х). оо 2. Математические ожидания M6n = xdG (х) положительны. —со 3. Распределение величин 6П непрерывно, т. е. выражается через соответ- х ствующую плотность вероятности g (х) по формуле G (х) = g (х) dx. —со Напомним, что 8п это разность между мощностью накопленного осадка и последующей глубиной размыва этого осадка, непосредственно следующей за окончанием его накопления. Последовательность слоев, наблюдаемая в разрезе, может иметь отдельные слои с мощностями, содержащимися в последователь- ности 6П. Как идентифицировать слои с мощностями из последовательности бп при полевых работах (описании разреза), неясно. Положения 2) и 3) рассматриваемой аксиоматики не вызывают сомнений с геологической точки зрения. Однако при анализе положения 1) необходимо учи- тывать следующие факты, полученные после публикации работы А. Н. Колмого- рова. При этом, по-видимому, реально считать, что: 1) при изучении конкретных разрезов в них могут доминировать слои, подвергшиеся одному размыву и со- держащиеся в последовательности 6П, и 2) при отложении пачек песчаных слоев значения т|п играют решающую роль при окончательном определении мощности слоя. При отложении последовательностей глинистых слоев во многих случаях Пп = 0- Если сказанное справедливо, то путем изучения разрезов толщ при поле- вых исследованиях можно в какой-то мере оценить пункт 1) рассматриваемой ак- сиоматики. В этом направлении на основании изучения разрезов красноцвет- ной и продуктивной толщ, а также флиша северо-западного Кавказа, Кахетии и Ю. Урала можно привести следующие данные. Для слоев различного состава, как правило, средние мощности слоев раз- личны. Так, для красноцветной толщи Челекена установлено,[что песчаные слои имеют среднюю мощность 84,11 см при оценке стандарта 188,34 и асимметрии +5,0 (при числе слоев п = 318), соответственно алевриты 15,22: 16,93 и +2,7 (п = 471) и глины 27,66; 53,23 и +8,0 (п = 792). Выборочные корреляционные функции для последовательностей мощностей слоев делятся на два типа Б и Ф (Вистелиус [2]). Тип Б, у которого все коэффи- циенты автокорреляции положительны и монотонно убывают с ростом расстоя- ния s между слоями (в числе слоев). В типе Ф нечетные коэффициенты автокор- реляции отрицательны, а четные положительны. С ростом 5 последовательности как четных, так и нечетных коэффициентов автокорреляции быстро mohotofeo
О межслоевом размыве (А, Б, Виыпелиус) 529 убывают по абсолютной величине. Таким образом, если в разрезе действительно доминируют слои с мощностями из 6П, то предположение о независимости 6Л может быть поставлено под сомнение. Интересно отметить следующее. Пусть Е (^s> xs+r\as=i, as+r=^) — Е (#s|a5=i, а8-^.г^) Е (•rs-brlas=i» fls4-r=j) = где а — состав слоя, i, / — элементы множества составов слоев, х — мощность слоя, s — номер слоя от подошвы разреза иг — расстояние между слоями. В этом случае у простых цепей Маркова на двух состояниях (скажем, песок и гли- на), каждому из которых отвечает случайная величина (мощность слоя) с раз- личными математическими ожиданиями для каждого состояния (т. е. средние мощности песчаных слоев отличаются, скажем, от средних мощностей глини- стых слоев), возможны только три типа коррелограмм: либо коррелограмма от- носится к типу Б, либо к типу Ф, либо все ее значения равны нулю (Висте- лиус [4]). Последнее утверждение показывает, что в тех последовательностях слоев, в которых размыв осуществлялся после отложения слоя только один раз и при этом слой не уничтожался, последовательность состава слоев в которых была неотличима от простой цепи Маркова и коррелограмма относилась к типу Ф мож- но найти участки, в которых следующие ^руг за другом слои будут иметь одну и ту же g (х) и удовлетворять условию независимости 6П. Нечто похожее наблю- далось в разрезе флиша с 10. Урала. Здесь последовательность из 1530 слоев (описание Бежаева) близка к однородной простой цепи Маркова и имеет корре- лограмму типа Ф со следующими выборочными значениями коэффициентов ав- токорреляции —0,23 0,17 —0,19 0,07 -0,09 0,05 0,02 (Вистелиус [3]). В таблице приведены оценки коэффициентов корреляции между мощностями слоев, расположенных рядом (s + 1) и через слой (s + 2) для фик- сированных составов слоев: Значения выборочных коэффициентов автокорреляции между мощностями слоев фиксированного состава Состав слоя на s-м месте Состав слоя на s-H-м месте Состав слоя на s-J-2-м месте л а У л а • Y Л — 0,22 43 0,24 153 -0,04 46 0,09 94 0,28 57 а — — 0,17 543 0,07 125 0,18 357 0,27 61 V 0,3 -0,11 0,35 0,06 -0,01 0,19 195 502 87 21 94 667 где л — песчаные, а — алевритовые и у — глинистые слои, составы которых указаны входами в таблицу. Внутри таблицы в числителе коэффициент автокор- реляции между мощностями слоев соответствующего состава, в знаменателе —
530 Комментарии число наблюденных пар слоев. Прочерк в таблице означает, что число сравнивае- мых пар было меньше пяти. Из таблицы видно, что слои, сложенные песками и алевритами, в первом приближении дают возможность провести выборку так, чтобы обеспечить не- зависимость 6П, если они слагают подавляющую часть разреза. Резюмируя, можно отметить, что реально наблюдаемые соотношения между мощностями слоев таковы, что, приступая к анализу последовательности слоев, совершенно необходимо самым тщательным образом проверять условие 1) ак- сиоматики А. Н. Колмогорова. При этом возможны случаи, как удовлетворяю- щие аксиоматике (особенно если построить специальную процедуру опробова- ния и отнести вопрос не ко всем слоям, а только к некоторым их типам (скажем, пескам)), так и противоречащие ей. Нужны также специальные исследования робастности модели, т. е. того, как нарушение аксиоматики сказывается на окон- чательных геологических выводах. Если проблема выполнения аксиоматики в конце концов сводится к пробле- ме робастности модели и необходимости разработки специальных процедур от- бора слоев для удовлетворения условий А. Н. Колмогорова, то вопрос о выборе g (х) в конкретных исследованиях значительно сложнее. Поскольку среди могут быть ненаблюдаемые величины, g (х) может быть найдена только из мо- дели слоеобразования, построенной на соответствующих литологических (седи- ментологических) предпосылках. Пока попытки построения такой модели не привели к действительно полноценным результатам. Статья А. Н. Колмогорова опередила свое время, и только в 1962 г., когда значение математики для геологии стало пониматься и приобрела права граж- данства математическая геология, возник интерес к рассматриваемому исследо- ванию. Оно появилось в списке литературы в первой же книге, посвященной приложению статистических методов в геологии (Миллер и Кан [7]) и затем фи- гурировало во всех серьезных изданиях подобного рода (Агтерберг [1]). К со- жалению, в этих общих руководствах на рассматриваемую статью содержались только общие ссылки. Разбор ее отсутствовал. В 1975 г. вышла монография Шварцахера [8]. В ней впервые приведен разбор статьи А. Н. Колмогорова. Шварцахер рассмотрел соответствующую модель для дискретного случая, ис- пользуя методы теории случайного блуждания. Были также наложены более жесткие условия на независимость. В литературе, посвященной конкретным исследованиям, имеются два рода публикаций, базирующихся на комментируемой работе. В одних никакого ана- лиза соответствия аксиоматики А. Н. Колмогорова конкретным условиям фор- мирования разрезов не проводится. Не делается также попытки предметно обос- новать ввод плотности g (х). Иными словами, используется не постановка зада- чи, а алгоритм, вытекающий из статьи А. Н. Колмогорова. При этом забывается, что использовать этот алгоритм допустимо только после тщательных исследова- ний условий осадкообразования. Среди этих работ имеется, в частности, публи- кация, рекомендующая для оценки размыва специальный «коэффициент Колмо- горова» (Мизутани и X аттори [6]). В 1979 г. появилась первая в литературе статья, в которой обсуждается ак- сиоматика А. Н. Колмогорова и приводятся данные о типе G (х), возникающем при некоторых специальных условиях (Дасей {5]). Дасей принимает, что
О межслоевом размыве (А. Б. Вистелиус) 531 и Лп — независимые и одинаково распределенные случайные неотрицательные величины. Кроме того, и цп независимы друг от друга. При этих условиях оказывается, что при Еп и т]п, имеющих в непрерывном случае показательное (в дискретном соответственно геометрическое) распределение, остатки слоев от размывов, сохранившиеся в разрезе, также подчинены этому распределению. В статье Дасей не приводится никакого геологического материала, и важность для геологии рассмотренного им случая ничем не подтверждается. Однако эту работу следует выделить, так как она содержит сознательный разбор исследо- вания А. Н. Колмогорова. Статья А. Н. Колмогорова, как мы отмётили, сильно опередила время и еще далеко до того, чтобы широкие круги геологов осознали важность этого выдающе- гося результата, равно как и всего подхода в целом, реализованного в нем. Меж- ду тем есть целый ряд разделов седиментологии (литологии), развитие которых невозможно без разработки всего цикла проблем, поднятых рассматриваемой работой. Хотелось бы надеяться, что это будет понято и тем самым обеспечен прогресс в ряде важных разделов геологической науки. , ЛИТЕРАТУРА 1. Agterberg F. Р. Geomathematics. Amsterdam: Elsevier, 1974. 596 р. 2. Вистелиус А. Б. Материалы к литостратиграфии продуктивной толщи Азербайджана. М.: Изд-во АН СССР, 1961. 157 с. 3. Вистелиус А. Б. Красноцветные отложения полуострова Челекен (лито- логия). Л.: Наука, 1966. 304 с. 4. Вистелиус А. Б. Основы математической геологии. Л.: Наука, 1980. 389 с. 5. Dacey М. F. Models of bed formation.— Intern. Assoc. Math. Geol. J., 1979, vol. 11, iss. 6, p. 655—668. 6. Mizutani S., Hattori I. Stochastic analysis of bed-thickness distribution of se- diments.— Intern. Assoc. Math. Geol. J., vol. 4, iss. 2, p. 123—146. 7. Miller R. L., Kahn J. S. Statistical analysis in the geological sciences. New York: J. Wiley, 1962. 483 p. 8. Schwarzacher W. Sedimentation models and qualitative stratigraphy. Am- sterdam: Elsevier, 1975. 382 p.
СОДЕРЖАНИЕ От редакции................................................. 3 П, С. Александров. Несколько слов об А. Н. Колмогорове ... 4 1. О сходимости рядов, члены которых определяются случаем 7 2. О законе больших чисел................................. 16 3. Об одной предельной формуле А. Хинчина................. 18 4. О суммах независимых случайных величин............ • • • 20 5. О законе повторного логарифма.......................... 34 6. О законе больших чисел................................. 44 7. Общая теория меры и исчисление вероятностей............ 48 8. Об усиленном законе больших чисел...................... 50 9. Об аналитических методах в теории вероятностей .... 60 10. Проблема ожидания..................................... 106 11. Метод медианы в теории ошибок......................... 111 12. Одно обобщение теоремы Лапласа—Ляпунова............... 114 13. Об общей форме стохастического однородного процесса (Проблема Бруно де Финетти)............................... 117 14. К вычислению средней броуновской площади.............. 124 15. Об эмпирическом определении закона распределения . . . 134 16. О предельных теоремах теории вероятностей............. 141 17. К теории непрерывных случайных процессов.............. 149 18. К вопросу о пригодности найденных статистическим путем формул прогноза........................................... 161 19. Случайные движения (К теории броуновского движения) . 168 20. Уклонение от формул Харди при частичной изоляции . . 170 21. К теории цепей Маркова................................ 173 22. К статистической теории кристаллизации металлов ... 178 23. Цепи Маркова со счетным числом возможных состояний 183 24. Об обратимости статистических законов природы .... 197 25. К решению одной биологической задачи.................. 204 26. Об одном новом подтверждении законов Менделя .... 209 27. Стационарные последовательности в гильбертовом прост- ранстве .................................................. 215 28. Интерполирование и экстраполирование стационарных слу- чайных последовательностей................................ 255 29. О логарифмически нормальном законе распределения разме- ров частиц при дроблении............................. 264 30. К обоснованию метода наименьших квадратов.......... 267 31. .Одна формула Гаусса из теории метода наименьших квадра- тов ...................................................... 283
Содержание 533 32. Ветвящиеся случайные процессы...................... 288 33. Вычисление финальных вероятностей для ветвящихся слу- чайных процессов....................................... 294 34. Статистическая теория колебаний с непрерывным спектром 299 35. О суммах случайного числа случайных слагаемых .... 308 36. Локальная предельная теорема для классических цепей Маркова................................................ 313 37. Решение одной задачи из теории вероятностей, связанной с вопросом о механизме слоеобразования.............. 335 38. Несмещенные оценки................................ 340 39. К вопросу о дифференцируемости переходных вероятностей в однородных по времени процессах Маркова со счетным числом состояний....................................... 363 40. Обобщение формулы Пуассона на случай выборки из конеч- ной совокупности....................................... 371 41. Некоторые работы последних лет в области предельных теорем теории вероятностей............................. 373 42. О сходимости А. В. Скорохода....................... 384 43. Две равномерные предельные теоремы для сумм независи- мых слагаемых.......................................... 393 44. Случайные функции и предельные теоремы............. 404 45. О свойствах функций концентрации П. Леви........... 419 46. Переход ветвящихся процессов в диффузионные и примы- кающие задачи генетики (Обзорный доклад)............... 425 47. О классах Ф(п) Форте и Блан-Лапьера................ 428 48. Об условиях сильного перемешивания гауссовского стацио- нарного процесса....................................... 429 49. Случайные функции нескольких переменных, почти все реализации которых периодичны.......................... 435 50. Об оценке параметров комплексного стационарного гауссов- ского марковского процесса............................. 436 51. О приближении распределений сумм независимых слагае- мых неограниченно делимыми распределениями............. 441 52. Оценки спектральных функций случайных процессов . . 458 53. О логических основаниях теории вероятностей........ 467 КОММЕНТАРИИ А. Н. Колмогоров. К работам по теории вероятностей и матема- тической статистике.................................... 472 Аналитические методы в теории вероятностей (А. Д. Вентцелъ) 474 Марковские процессы со счетным числом состояний (Б. А. Сева- стьянов) .................... ......................... 478 Однородные случайные процессы (В. М. Золотарев)........ 478 Однородные марковские процессы (А. А. Юшкевич)......... 480 Ветвящиеся процессы (Б. А. Севастьянов)................ 485 Стационарные последовательности (Ю. А. Розанов)........ 486 Стационарные процессы (В. А. Статулявичус)............. 489 Статистика процессов (А. Н. Ширяев).................... 490 Спектральная теория стационарных процессов (А. М. Яглом) 491
534 Содержание Спектральное представление случайных процессов (Ю. Г. Ба- лас ан о в, И. Г. Журбенко) .......................... * 496 Броуновское движение (Л. М. Яглом) .................... 498 Цепи Маркова со счетным числом состоянии (Л. Л. Юшкевич) , 503 Тождества Вальда (Л. Л. Новиков)........................ 508 S-сходимость (Л. В. Скороход)........................... 510 Равномерные предельные теоремы (7. В. Арак) ........ 510 Функции концентрации (В. М. Круглов) ............ 511 Эмпирические распределения (<9. В. Хмаладзе) ........ 514 Метод наименьших квадратов (М. Б. Малютов).............. 520 Несмещенные оценки (Ю. К. Беляев, Я^П. Лумельский) ... 522 Статистическое прогнозирование (А. М. Яглом)............ 523 О межслоевом размыве (Л. Б. Вистелиус).................. 527
Андрей Николаевич Колмогоров ТЕОРИЯ ВЕРОЯТНОСТЕЙ И МАТЕМАТИЧЕСКАЯ СТАТИСТИКА Утверждено к печати Отделением математики Академии наук СССР Редактор В. И. Битюцков Редактор издательства Н. И. Лезнова Художественный редактор С. А. Литвак Технические редакторы 3. Б. Павлюк, Н. Н. Плохова Корректор И. А. Талалай ИБ № 31444 Сдано в набор 12.12.85 Подписано к печати 3.04.86 Т-09606. Формат бОхЭО1/^ Бумага кн.-журнальная Гарнитура обыкновенная новая Печать высокая Усл. печ. л. 33,6. Усл. кр. отт. 34,6. Уч.-изд._л. 35,5 Тираж 7000 экз. .Тип. зак. 2155 Цена 2 р. 80 к. Ордена Трудового Красного Знамени издательство «Наука» 117864 ГСП-7, Москва В-485, Профсоюзная ул., 90 2-я типография издательства «Наука», 121099, Москва, Г-99, Шубинский пер., 6
В ИЗДАТЕЛЬСТВЕ «НАУКА» ВЫШЛА ИЗ ПЕЧАТИ КНИГА: Колмогоров А. Н. ИЗБРАННЫЕ ТРУДЫ МАТЕМАТИКА И МЕХАНИКА 30 л. 3 р. 50 к. В издание включены основные работы академика А. Н. Кол- могорова по тригонометрическим и ортогональным рядам, тео- рии меры и интеграла, теории приближений, математической логике, дифференциальным уравнениям, геометрии, топологии, функциональному анализу, суперпозициям функций, дескриптив- ной теории множеств, теории турбулентности, классической ме- ханике и некоторым другим вопросам. Издание рассчитано на математиков — научных работни- ков, преподавателей, аспирантов, студентов. Книги можно предварительно заказать в магазинах «Академкнига». Для получения книг почтой заказы просим направлять по одному из перечисленных адресов: 117192 Москва, Мичуринский про- спект, 12, магазин «Кни- га — почтой» Центральной конторы «Академкнига»; 197345 Ленинград, Петрозавод- ская ул., 7, магазин «Кни- га — почтой» Северо-За- падной конторы «Академ- книга» ; 252030 Киев, ул. Пирогова, 4, магазин «Книга — почтой» Украинской конторы «Ака- демкнига» или в ближай- ший магазин «Академ- книга».