Текст
                    А.Н.КОЛМОГОРОВ
ТЕОРИЯ
ВЕРОЯТНОСТЕЙ
и
МАТЕМАТИЧЕСКАЯ
СТАТИСТИКА


АНДРЕЙ НИКОЛАЕВИЧ КОЛМОГОРОВ 30-е годы
ТЕОРИЯ ВЕРОЯТНОСТЕЙ и МАТЕМАТИЧЕСКАЯ СТАТИСТИКА Ответственный редактор академик 10. В. ПРОХОРОВ МОСКВА «НАУКА» 1986
УДК 519.2 Колмогоров А. Н. Теория вероятностей и математическая статистика: [Сб. статей].— М.: Наука, 1986.— 535 с. Настоящее издание представляет собой вторую книгу избранных трудов А. Н. Колмогорова. В ней помещены исследования по теории вероятностей (основания, предельные теоремы, случайные процессы, разнообразные приложения), математической статистике и некоторым другим вопросам. Редакционная коллегия: Η. Η. БОГОЛЮБОВ (главный редактор), С. М. НИКОЛЬСКИЙ, А. М. ОБУХОВ, Ю. В. ПРОХОРОВ, В. М. ТИХОМИРОВ, А. Н. ШИРЯЕВ Составитель А. Н. ШИРЯЕВ Рецензенты: Б. В. ГНЕДЕНКО, С. X. СИРАЖДИНОВ 1702060000—234 л п К 042(02) — 86 126-86-Ш © Издательство «Наука», 1986 г.
ОТ РЕДАКЦИИ В соответствии с постановлением Президиума АН СССР первая книга избранных трудов академика А. Н. Колмогорова «Математика и механика» (М.: Наука) вышла в свет в 1985 г. Запланированную к изданию вторую книгу трудов А. Н. Колмогорова редакционная коллегия сочла целесообразным разбить на две: в первой из них собраны труды по теории вероятностей и математической статистике, во второй — по теории информации и теории алгоритмов. В списке трудов А. Н. Колмогорова, помещенном в первой книге, отмеченные двумя звездочками работы естественным образом должны быть разделены на помещенные в настоящей второй книге и подготовленные к опубликованию в третьей книге. Подготовка второй и третьей книг избранных трудов А. Н. Колмогорова осуществлена Ю. В. Прохоровым и А. Н. Ширяевым.
НЕСКОЛЬКО СЛОВ ОБ А.Н.КОЛМОГОРОВЕ* П. С. Александров Необыкновенная широта творческих интересов А. Н. Колмогорова, огромный диапазон и разнообразие тех областей математики, в которых он работал в различные периоды своей жизни, выделяют Андрея Николаевича среди математиков не только нашей страны, но и всего мира, и можно прямо сказать, что в отношении этого свойства своего дарования он не имеет себе равных среди математиков нашего времени. При этом во многих математических дисциплинах, в которых работал А. Н. Колмогоров, им получены действительно основополагающие, принципиально важные результаты, доказательство которых часто требовало преодоления больших трудностей и поэтому было сопряжено с большим творческим напряжением. Это относится уже к результатам, полученным Андреем Николаевичем в совсем молодые годы, по теории множеств и функций, как дескриптивной, так и метрической, например к построенной им теории операций над множествами и к его знаменитому примеру расходящегося ряда Фурье. Далее последовали работы по общей теории меры, как абстрактной, т. е, «собственно общей», так и геометрической, а затем начались и фундаментальные работы А. Н. Колмогорова в различных направлениях теории вероятностей, поставившие Андрея Николаевича бесспорно на первое место среди представителей этой дисциплины во всем мире. Рано возникли и первые работы А. Н. Колмогорова, посвященные математической логике и основаниям математики. В значительно более поздние годы к этим работам присоединились исследования по теории информации. Очень велик вклад, сделанный Андреем Николаевичем, в топологию. Достаточно напомнить, что одновременно с выдающимся американским топологом Александером и совершенно независимо от него А. Н. Колмогоров пришел к понятию когомологии и основал теорию когомологических операций, т. е. получил результаты, существенно преобразовавшие всю топологию. Общеизвестны глубокие связи топологии с теорией обыкновенных дифференциальных уравнений, небесной механикой и, далее, общей теорией динамических систем. Эти связи возникли при первых же работах Пуанкаре. Идеи А. Н. Колмогорова во всей этой огромной математической дисциплине, далее развитые в работах его многочисленных учеников, в значительной степени определили ее состояние в настоящее время. Необходимо, наконец, указать на исследования А. Н. Колмогорова, относящиеся собственно к механике, в частности на его знаменитые работы в теории турбулентности, уже непосредственно переходящие УМН, 1983, т. 38, вып. 4, с. 7—8.
Несколько слов об А. II. Колмогорове 5 в область экспериментальных наук о природе. Все сказанное, а сказано далеко не все, что можно было бы сказать об А. Н. Колмогорове как об ученом, делает очевидным, что в его лице мы имеем одного из самых выдающихся представителей современной математики в самом широком смысле этого слова, включающем и прикладную математику. Это положение Андрея Николаевича в науке пользуется бесспорным признанием в международном научном мире и находит свое внешнее выражение, в частности, в том, что А. Н. Колмогорову принадлежит первое место среди всех советских математиков по числу иностранных академий и научных обществ, избравших его своим сочленом, а также университетов, сделавших его своим почетным доктором. Среди них находим: Парижскую академию наук, Лондонское королевское общество, Академию естествоиспытателей «Лео- иольдина», Нидерландскую академию наук, Польскую академию наук, Академию наук ГДР, Польское математическое общество, Лондонское математическое общество, Национальную академию наук США, основанное Б. Франклином Американское философское общество, Парижский, Берлинский, Варшавский университеты и др. А. Н. Колмогоров родился 25 апреля 1903 г. в Тамбове, в котором его мать Мария Яковлевна Колмогорова задержалась по пути из Крыма. Мария Яковлевна умерла при самом рождении ее сына, и все заботы по его воспитанию взяла на себя ее родная сестра Вера Яковлевна Колмогорова, которая действительно заменила мать Андрею Николаевичу. А. Н. Колмогоров в соответствии с этим и относился к Вере Яковлевне, как к своей матери, до самой ее смерти (В. Я. Колмогорова умерла в 1950 г. в Комаровке в возрасте 87 лет). По материнской линии А. Н. Колмогоров был дворянского происхождения: его дед со стороны матери^ Яков Степанович Колмогоров, был угличским уездным предводителем дворянства. Отец Андрея Николаевича был сыном священника. Он был агрономом с высшим специальным образованием или, по тогдашней терминологии, «ученым агрономом». Моя дружба с А. Н. Колмогоровым занимает в моей жизни совершенно исключительное, неповторимое место: эта дружба перешагнула в 1979 г. через свое пятидесятилетие и за весь.этот полувековой период не только ни разу не дала никакой трещины, но не сопровождалась даже никакой ссорой, не было у нас за все это время и какого бы то ни было взаимного непонимания по вопросам, сколько-нибудь важным для нашей жизни и миросозерцания; даже тогда, когда наши взгляды на какой-нибудь из этих вопросов бывали различны, мы относились к этим взглядам друг друга с полным пониманием и сочувствием. Как уже упоминалось, у А. Н. Колмогорова было много учеников в различных областях математики, некоторые из которых сами сделались крупными представителями своей специальности. Старшими учениками А. Н. Колмогорова являются ставшие потом действительными членами АН СССР Сергей Михайлович Никольский
Несколько слое об А. II. Колмогорове (род. 1905 г.) и ныне покойный Анатолий Иванович Мальцев (род. 1910 г.). Следующими по возрасту являются Борис Владимирович Гнеденко (род. 1912 г.), действительный член Академии наук УССР, видный всемирно признанный специалист по теории вероятностей, действительный член АН СССР Михаил Дмитриевич Миллионщиков (род. 1913 г., скончался в 1973 г.) и Израиль Моисеевич Гельфанд (род. 1913 г.), член-корреспондент АН СССР, избранный иностранным членом Национальной академии наук США и Парижской академии наук. Значительно моложе, но все же принадлежат к старшему поколению учеников А. Н. Колмогорова действительный член АН СССР Александр Михайлович Обухов (род. 1918 г.), член-корреспондент АН СССР Андрей Сергеевич Монин (род. 1921 г.). Далее идут: Владимир Андреевич Успенский, Владимир Михайлович Тихомиров, Владимир Михайлович Алексеев, Яков Григорьевич Синай, Владимир Игоревич Арнольд. Особенно обширна группа учеников Андрея Николаевича, посвятивших себя работе в теории вероятностей и математической статистике. Среди них — действительный член АН СССР Юрий Васильевич Прохоров, член-корреспондент АН СССР Логин Николаевич Большев, действительный член АН УзССР Сагды Хасанович Сираж- динов, действительный член АН УССР Владимир Сергеевич Миха- левич, Борис Александрович Севастьянов, Юрий Анатольевич Розанов, Альберт Николаевич Ширяев, Игорь Георгиевич Журбенко. Разумеется, этот список ни в какой мере не является полным, да и по самому заглавию моей статьи ясно, что она, не будучи юбилейным обзором жизни и деятельности А. Н. Колмогорова и вообще не будучи в каком бы то ни было смысле традиционной «юбилейной статьей»,; не претендует на полноту ни в каком отношении1. Март 1981 г. И.мЛе!^ Академии наук СССР избраны СССР -в/ц. Арнольд и В?а!^ ".v./». хх рильеч. ред.
i О СХОДИМОСТИ РЯДОВ, ЧЛЕНЫ КОТОРЫХ ОПРЕДЕЛЯЮТСЯ СЛУЧАЕМ* Совместно с А. Я. Хинчиным Рассмотрим ряд Ух + У* + · · · + Уп + - . ., (1) члены которого являются случайными величинами; обозначим при этом значения (их конечное или, возможно, счетное число), принимаемые уп, через \jn\ Уп, . . ., у(п\ . . ., а соответствующие вероятности через р{п\ р{п\ . . ., Рп\ ... с у[р(п) = 1. Далее, обозначим i через «η — Zj 2/w Pn г математическое ожидание величины г/п и через i математическое ожидание квадрата отклонения уп — ап. Сначала мы докажем, что в предположении сходимости рядов 2jan и ^Ьп вероятность Ρ сходимости ряда (1) равна 1. Част- п η ный случай этого утверждения (а именно когда каждое уп принимает только два значения + сп и —сп с одинаковой вероятностью 1/2) был установлен Радемахером в теоретико-функциональных терминах1. В § 1 мы дадим доказательство общей теоремы, пользуясь обобщением метода, предложенного Радемахером. В § 2 мы передокажем ее другими средствами, которые приведут быстрее к цели. В § 3 установим, что для одного важного и очень широкого класса случаев сходимость рядов Σαη, Σδη является не только достаточным, но и необходимым признаком для справедливости равенства Ρ = 1; именно таковым является случай, когда значения, принимаемые уп% ограничены в совокупности. Наконец, в § 4 укажем одновременно необходимый и достаточный признак справедливости соотношения Ρ = 1 в общем случае. § 1 принадлежит А. Я. Хинчину, § 2, 3 и 4 — А. Н. Колмогорову. I ebcr Konvergenz von Reihen, deren Glieder diirch den Zufall bestimmt \Acrcien — Мат. сб., 1925, т. 32, с. 608-677. Перевод П. Л. Ульянова. Math. Ann., 1922, Bd. 87, S. 135.
8 1* О сходимости рядов, члены которых определяются случаем § 1 Приведем задачу в более удобную для наших целей теоретико- функциональную форму. Для этого построим систему функций <Pl («), ф2 (Ж), . . ., ф?г (Я), . . . посредством следующего рекуррентного определения: допустим, не ограничивая этим общность, что n(i) Ъ> n(i+1) для всех η и ί; разделим отрезок О <Г χ <^ 1 слева направо на части длины Ρΐ τ Pi » · · ·» Pi у · · · и положим φ! (ж) равной постоянной на каждом из этих частичных интервалов, а именно <Рх (χ) = Ζι = ζ/ι — % в i-м интервале. Тогда имеем ι ι § φ! (χ) dx = 0, ξ {φι (#)}2dr = bt. о о Если функция (р,г_! (#) уже определена, то функция ц>п (х) определяется в общем случае так: каждый интервал постоянства δ функции φη_3 (х) делится на интервалы, длины которых (слева направо) пропорциональны величинам п(1) п(2) n(i) Ρ η ι Ρη ι · · ·» ρ η 7 · · · и на i-ж частичном интервале полагаем <р„ (х) = 4г) = ijn\ — anj тогда ^ φη (./;) йл = 0, § {φη (χ)}2 йг = Ьп. Значения функций <ρα (ж) в концах частичных интервалов не играют роли и могут быть взяты произвольно. В предположении, что ряд Σαη сходится, вероятность сходимости ряда (1) совпадает с вероятностью сходимости ряда Φΐ fa) + Ф2 С*) + « · · + ф/г (Ж) + . . ., . (2) которая при нашем понимании задается мерой (в смысле Лебега) того точечного множества, на котором сходится этот ряд. Следовательно, наш главный результат можно толковать так 2: сходимость 2 Очевидно, что это утверждение совпадает со сформулированным во вве-
1, О сходимости рядов, члены которых определяются случаем 9 ряда Σϋη является достаточным признаком сходимости почти всюду ряда (2). Нижеследующее доказательство обобщает данное Радемахером доказательство для частного случая 3. Положим пп(х)= Π {1 + Ф*(я)>> /n(a)= l^n{t)dt. k=l О Имеем X X | /п+1 (#) — /п (*) | = К {^η+ι (*) — яп (£)} <Й Ι = К πη (ί) φη+1 (ί) dt Пусть δ (а, Ь) — тот интервал постоянства функции φΛ (£), который определяется как о < а; < Ь. Очевидно, что α $л;я(*)(ри+1(*)Л = 0 о и? следовательно, X ' X \fnn{z) — fn(x) \=\l πη(ί)ψη+ι(0 ЛI = | πη(χ)|. К q>n+1(t)dt 'а а так как πη (t) постоянно в интервале (а, х). Из условий S^V^O (я = 1,2,...) ι получим |4^Μ=ΙΣ44Ί(«»/=1.2,...) i^ 3 и из неравенства Шварца (3) I & ρ? К ι/ Σ {^Ы0 Σ ^ < ^ Vι ■ 1/ 1 __ п^^ \#}\<ΫΚ—{~- (n,j=i,2,.··). Рп Итак, если на интервале (а, Ь) Ф* (^) - 4ifc) (fc = 1, 2, . . ., τι), TO Ιπη(*)| = < Π {ι + Уь, li=l { _ V7 k JJk) Pk Pk (h) (4) A^iiiiii. Общее рассмотрение связей такого рода мо>ьно найти у Штейнгауза ^und. math., 1923, vol.4, p. 286-310). 3 См. сноску 1.
10 1.0 сходимости рядов, члены которых определяются случаем С другой стороны, имеем § qWi (t) dt < ) Ι qw (ί) Ι-eft < ) Ι φΛ+ι (ί) I dt α α α 1 = Pxh)pih)- ■ ■ ρ№ 11 φη+ι (ί) | ti < /^ Π Ρ* 0 и еще θ"*.) (5) k=i Л, IL \ qV-i (ί) <Й I < μ - a | · J г<& | < Π P^ Yb^x У*-Р& p& где | Zn+i | — наибольшее значение | φ„+1 (ί) | на α < £ <; #. Если nV n+1) то согласно нашему предположению выполнено pKn+{L} <! Ρλ+ι> значит, тем более имеем зс η ι j1 <Πρ^Υδα+1 fc=l d<'ti+1) . ^71 + 1 Из (5) и (6) вытекает I J φη+ι (ί) ΛΙ < 2 /6Л μι ρ<^ ρψ\ . . p«») Vl - р^+г), (6) (7) так как при p^"1+l) > V2 это следует из (6), а при ρ^ι+1> < Х/'* из (^)· Теперь (3), (4) и (7) влекут за собой |Δη(*)| = |/η+ι(*) —/„(*)!< < 2 [^п+1 V1 _ р£™> ΓΙ {р^ + У&* /1 - plh)) или с подстановкой 1 — ρ{?^ = irl η Ι Δη (χ) Ι < 2 /&^юп+1 Π (1 — *4 + w* Yh) < fr=i
1. О сходимости рядов, члены которых определяются случаем 11 Если еще принять обозначения оо то η \K(x)\<BbM + 2Bvn+1'[[(l-v1i). (8) /f=l Поскольку для каждого целого положительного N и v0 = О справедливо соотношение Ν η N-fl ΐ-Σ^,ιΠ(ΐ-^;)= Π(ΐ-^»ο, то в правой части (8) стоит общий член сходящегося ряда. Следовательно, существует lim /п (х) =/ (ж). В частном случае, рассмотренном Радемахером, / (х) оказалась монотонной функцией, что не обязательно имеет место здесь в общем случае. Но монотонность служила лишь для доказательства дифференцируемое™ / (ж), поэтому достаточно обнаружить, что / (х) представляет собой функцию ограниченной вариации. Это легко получается следующим образом. Полная вариация функции / (а;) во всяком случае не превышает верхней грани полных вариаций всех функций /п (х) и, следовательно, она не больше ι Jim sup^ j πη(ί) \dt. 0 Ho 1 in η 1 l\jtn(t)\dtr=l\ Π {1 + <Р*(0>| dt= Π$|.1 + Φ*(0Ι*< 0 ϋ ' fr=i ' k=o о <ίϊ "j/ l\\ + ^{t)\4t = V Π (Ι + hXYB, где допустимость замены порядка взятия произведения и интегрирования непосредственно вытекает из специальной структуры функции φ^ (χ). Этим желаемое установлено. Итак, функция / (х) имеет почти всюду производную f (х). Если χ произвольная точка отрезка (0, 1), отличная от точек разбиения и в которой существует f (х), а через (an, bn) обозначен тот интервал постоянства функции φη (χ), в который попадает х, то в силу
12 1.0 сходимости рядов, члени которых определяются случаем f {ап) = ίη (ап), f {bn) = fn (bn) получим так как из-за постоянства функции пп (х) в (апу Ьп) справедливо 4 fn(bn)-fnK) _ , ν η η Следовательно, lim лп (л;) существует почти всюду. С другой Η—>ΌΟ стороны, ряд σο сходится почти всюду, ибо в противном случае расходится ряд σο 1 оо Σ ){4>n(x))2dx = S &fc» что противоречит предположению. Но из сходимости почти всюду последовательности хгп (#) и ряда Σ {φη (χ)}2 вытекает сходимость почти всюду ряда Σφη (χ), что и требовалось доказать. § 2 Сейчас мы собираемся установить данное утверждение другим и к тому же намного более простым путем. Положим! η Если бы ряд (2) оказался расходящимся в каждой точке некоторого множества положительной меры, то должны были бы существовать множество Ε положительной меры тЕ и положительная постоянная А, что для каждого целого положительного числа η и каждой точки χ множества Ε при подходяще выбранном ρ = ρ (χ, ή) ^> η выполнялось неравенство I sp {χ) — sn (χ) Ι > Α. Так как разность sp (χ) — sn (x) остается постоянной на каждом интервале постоянства функции φρ (χ), то отсюда в силу способа 4 Если имело бы место lim (bn — ап) > 0, то при достаточно малом ε > О П->оо /'(*) = ^г[/(* + е)-/(*-8)] = = lim _L [fn {χ + r) — fn{x — e)]= lim π (ж). 71—»эо ^Ь 7l~»oo
1. О сходимости рядов, члены которых определяются случаем 13 построения наших функций следует, что можно найти конечное число непересекающихся интервалов δ со следующими свойствами: 1) Σ δ (сумма длин всех δ) больше 1/2тЕ, 2) каждый δ является интервалом постоянства функции φΡ (#) (Р ^> п) и справедливо неравенство I sp (χ) — sn {χ) Ι > А в δ. Если теперь к — наибольшее из указанных чисел ρ (их конечное число) и δ —" интервал постоянства для sp (χ) (ρ <J &), то из способа построения наших функций вытекает \ {S* (х) — sn(x)}2dx = J {s1 (x)—sn(x)}4x + J lsk (x) —sP{%)}2dx > Α2δ Ь 6 6 и, следовательно, к Σ 7,=п-|-1 Ьр= jj {sk(x) — sn(x)}4x>A*^&>-Y-A*mE, о что влечет за собой расходимость ряда Σϋη вопреки предположению. § 3 Итак, сходимость ряда Σϋη является достаточным признаком сходимости почти всюду ряда ΣφΛ (χ). Этот признак, вообще говоря, не является необходимым, что легко можно показать на примере. Именно если ψη (χ) равняется соответственно 0, +сп> —сп на х- множествах меры 1 — τη, V2Tn, 1/2τη и ряд Στη сходится, то почти всюду срп (х) отлична от нуля только для конечного числа значений η и поэтому ряд Σφη (χ) почти всюду сходится, каковыми бы ни были числа сп. Так как Ьп = с\хП9 то после подходящего их выбора можно сделать Σϋη расходящимся. Для соответствующего ряда (1) имеем, очевидно, Ρ — 1, поэтому условие сходимости ряда Σ6η не необходимо для выполнения равенства Ρ = 1. Так же легко показывается, что условие сходимости ряда Σαη не обязательно для сохранения этого равенства. Для этого можно положить у™ = сп, у^ = О, р£> = τη, /4а) = 1 - τΛ, причем Σχη следует выбрать сходящимся, а Σοηχη расходящимся. Имеется, однако, важный частный случай, в котором наш признак будет и необходимым. Действительно,1 если функции φη (χ) по абсолютной величине ограничены в совокупности, то из сходимости почти всюду ряда ΣφΛ (χ) вытекает сходимость ряда Σbn. Соответственно обстоит дело с рядом (1): если Ρ = 1, а случайные величины У η (η = 1, 2, . . .) ограничены в совокупности, то обязательно должны сходиться оба ряда Σαη и ΣЪn. 1тобы доказать последний, общий результат, сначала установим следующее: если φη (χ) равномерно ограничены и существуют
14 /. О сходимости рядов, члены которых определяются случаем множество Ε положительной меры и константа К со свойством I sk {хг) - S* {х2) \<К, (9) выполняющимся для любого к и всех пар точек (хъ х2), принадлежащих множеству Е, то обязательно сходится ряд Σδη. Обозначим через Ек объединение тех интервалов постоянства функции q)fr (x) (и, значит, суммы sk (x)), внутри которых содержатся точки из Е. Очевидно, что Ек содержит Ε и Ек+1. Также ясно, что (9) остается справедливо для любой пары точек множества Ек. Если положить то Ек — Ек+1 — Fk, S \ {Sk+i(xi) — sk+1{x2)}2dxidx2=^ ){sk+1(xi) — Ек-П Щ+1 Ек Еь — Sft+i (x2)}2dxidx2 -2 ) \ {sk+1 (xi) — sfr+i (x2)}2 dxx dx2 — — ) \ {Skn(zi) — sk,1(x2)}2dx1dx2. Ho φ^+ι (χ) на Ек ортогональна к sk (χ) и к 1, π, следовательно, имеем ) ) {skn(x'i) — sk+1(x2)}2dx1dx2= ] ) {sk(x1)—sk(x2)}2dx1dx2+ Ek+i Ek+i Ek Ek + $ \ {9fe+i(^i) — q>k+i(x2)Y2dx1dx2 — Ek Ek -2 J \ {sk(xi) — sk(x2)+yk+1(x1) — 4)k+1(x2)}2dx1dx2 — Ek+i fk — S S isk (χι) — sk (sa) + 4>Η+ι(χι) — ФшЫ}2 dxidx2 > > ) ){sk(xi) — sk(x2)}2dx1dx2+2bk+1(mEk)2 — Ek Ek — (K + 2Mf {2mEk+1-mFk + (mFk)2}, где Μ есть верхняя грань для | φη (χ) |, а тЕ обозначает меру множества Е. В полученном неравенстве положим к = О, 1, . . ., η — 1, сложим и заметим, что S {2mEk+vmFk + (mFkf}^l.
1. О сходимости рядов, члены которых определяются случаем 15 В результате имеем п-1 J J {sn(xi) — sn(x2)}*dx1dxz>% 2bk^(mEkf-(K + 2M)*, следовательно, в силу | sn fa) -г sn fa) | < Ζ получаем η2 2ό,+1(^^)2<2(Λ: + 2Μ)2 /г-О и тем более (mEfn%bk+1<(K + 2Mf, /f=0 что, очевидно, доказывает сходимость ряда Σbn. Пусть сейчас значения случайных величин уп ограничены в совокупности и пусть выполнено Ρ = ί4 откуда вытекает сходимость почти всюду ряда Σ (ап + φη (χ)). Поскольку ап не зависит от х, то для ряда Σφη (χ) выполнены предположения только что доказанного вспомогательного утверждения 5. Следовательно, ряд Σ6η является сходящимся и согласно § 1 или 2 тогда Σφη (χ) сходится почти всюду. Но это влечет за собой сходимость ряда Σαη, чем все доказано. § 4 Рассмотрим наряду с (1) второй аналогичный ряд и± + и2 + . . . + ип + . . . % (10) обозначим через Q вероятность его сходимости и через τη вероятность события Уп Φ ип. В случае, когда Στη сходится, ряды (1) и (10) назовем эквивалентными 6. Легко видеть, что в этом случае Q = Р. Теперь мы утверждаем, что необходимое и достаточное условие справедливости равенства Q = 1 для ряда (10) состоит в существовании эквивалентного ряда (1), для которого Σαη и Σδη сходятся. Очевидно, что в доказательстве нуждается только необходимость условия. Итак, допустим, что Q = 1 и определим ряд (1) следующим образом. Положим уп = ип, если | ип | < 1, и уп = 0 в противном случае. Величина τη совпадает здесь с вероятностью выполнения соотношения | ип (х) | > 1. В силу Q = 1 это дает немедленно схо- Из равномерной ограниченности уп вытекает, конечно, равномерная ограниченность αη, значит, и φη (χ). ^то означает, что между ип и уп обнаруживается определенная взаимная •зависимость.
16 2. О законе больших чисел димость ряда Στη, так что ряды (1) и (10) на самом деле эквивалентны. Построенный таким образом ряд (1) является уже равномерно ограниченным, поэтому согласно § 3 соответствующие ряды Σαη, Σδη сходятся и все доказано. Отметим еще, что наш способ доказательства выясняет не только существование ряда (1), но и дает крайне простое правило построения этого ряда. Москва, 3 декабря 1925 г. 2 О ЗАКОНЕ БОЛЬШИХ ЧИСЕЛ* Пусть Еъ Е2, . . ., Еп, ... — последовательность независимых испытаний. Приводимые ниже рассуждения справедливы только в случае конечного числа различных возможных исходов Е$\ E)f\ . . . испытания Е^. Однако доказываемая теорема остается верной и в общем случае. Пусть Fn — величина, зависящая от первых η испытаний. Если при любом положительном ε вероятность неравенства I Fn - Dn J < ε, где Dn — математическое ожидание Fn, стремится к единице при неограниченном увеличении п, то говорят, что Fn удовлетворяет закону болъших.чисел или же что Fn устойчиво. Наиболее простые совокупности условий, достаточные для устойчивости Fn, состоят в ограничениях, налагаемых на дисперсию Fn. В качестве дисперсии Fn относительно Ек естественно рассмотреть верхнюю грань разности Ι*η (Άΐ » · · ·» Uk-i » &к , iift+i , · · ., iin ) — когда ί1? ia, . . ., ifl и ;ft независимо пробегают все возможные значения. Обозначим эту дисперсию Ωη1ί. Используя это определение, мы можем сформулировать следующую теорему. Теорема. Если сумма ι ... -ρ Ъйпп стремится чисел. СЛ К ПУЛЮ с Р°стом п, то Fn удовлетворяет закону больших l'-*i'-^ 1927} vol. 185,
2. О законе больших чисел 17 Следствие. Для устойчивости Fn достаточно также условия Йя* = о (Ι/γη). (1) Доказательство теоремы. Обозначив Вп математическое ожидание квадрата уклонения Fn — Z)n, для устойчивости Fn имеем известное условие Вп -*0. (2) Чтобы воспользоваться этим условием, нужно для Вп дать более эффективное выражение. С этой целью обозначим Dnk математическое ожидание Fn при условии, что известны результаты первых к испытаний. Обозначим также Znk разность Dnk — Dnk-i- Таким образом, Znk есть приращение математического ожидания Fn, когда становится известным результат испытания Ек, Очевидно, имеем Dn == -^ΛιΟ? *'η = *Лт> \y) Fn — Dn = Znl + Zn2 + . . . + Znn. Можно доказать, что математическое ожидание ZniZnk (i Φ к) равно пулю. Пусть к ^> ί. Предположим, что результат Еъ Е2, . . ., Ек^х известен. При этом предположении математическое ожидание Dnk равно Впк-г\ таким образом, математическое ожидание Znk равно нулю и, поскольку Zni — постоянная, математическое ожидание ZniZnk также равно нулю. Этот факт имеет место при любых результатах испытаний Ег, Е2, . . ., Ек-г. Следовательно, π само математическое ожидание ZniZnk тоже равно нулю. Итак, обозначив ftnk математическое ожидание Ζ?^, получим Вп = βηΐ + βη2 + · · ' + βηη· (4) Можно доказать, что β** < XU £&t, Βη < V4 (Ωηι + *4 + . .. + Ω2„η). (5) Неравенство (5) позволяет вывести нашу теорему в силу условия (2). Замечание. В классическом случае Чебышева испытание Ек состоит в определении величины Хк и Fk равно среднему арифметическому Хи Х2, . . ., Хп. Обозначив dk математическое ожидание Хь и Ък математическое ожидание (Хп — dn)2, будем иметь βη& = Ък1пг Qnk = (max Хк — min Xk)ln. с сл°вие (1) преобразуется в известное условие max \Xn\ = o (γη). Вышеизложенное представляет обобщение случая Чебышева в котоРом Fn является суммой независимых случайных величин
18 3. Об одной предельной формуле А. Хинчина поскольку касается сумм зависимых величин. Очень часто слагаемые этих сумм суть функции некоторых других независимых величин. Мы думаем, что в таком случае метод произвольных функций независимых величин, предложенный здесь, был бы очень естествен. 31 октября 1927 г. 3 ОБ ОДНОЙ ПРЕДЕЛЬНОЙ ФОРМУЛЕ А. ХИНЧИНА* Пусть ζ\ι 2о, . . ., Ζηι . . . (1) — последовательность независимых в совокупности случайных величин. Без ограничения общности можно предполагать, что математическое ожидание zn равно нулю. В этом случае обозначим Ъп математическое ожидание квадрата zn, a Sn и Вп обозначим суммы η η Sn== 2j zk, Bn= 2j ^/г Хинчин [1] предположил, что при широких предположениях вероятность соотношения S lim sup п = 1 (2) Y2Bn\og\ogBn равна единице. Сам Хинчин доказал эту формулу для некоторых важных частных случаев [2]. Наша цель — сформулировать достаточно общие условия, при выполнении которых эта формула остается справедливой. Вот эти условия: (I) Вп-+оо, (II) тп-ограничено сверху, |zn| = o Легко видеть, что первое условие является необходимым, если исключить случай zn = 0. Если величины zn равномерно ограничены, то второе условие вытекает ия первого и в этом случае это условие необходимо и достаточно. Если желать использовать лишь вероятностные соотношения, которые могут быть эффективно наблюдаемы, то можно пояснить смысл формулы (2) следующим образом: * Sur une formule limite de Μ. A. Khintchine.— С. г. Acad. sci. Paris, 1928, vol. 186, p. 824—825. Представлено Ж. Адамаром. Перевод О. В. Вискова. (ι/ В„ log l°g Bn
3. Об одной предельной формуле А. Хинчина 19 1°. Каковы бы ни были положительные числа η и δ, существует целое η такое, что вероятность выполнения всех неравенств SH <Y2Bk log log Bk (1 + δ) {к = #ι,' η + 1, . . ., η + ρ) не меньше 1 — η, каково бы ни было р. 2°. Каковы бы ни были η, δ и т, существует целое ρ такое, что вероятность одновременного выполнения неравенств Sk < |/2Яь log log Bk (1 — δ) (к = т, т + 1, . . ., т + р) не превзойдет η. Полное доказательство утверждений 1° и 2°, использующее только условия (I) и (II), будет опубликовано *. В задаче о повторных испытаниях из нашей теоремы можно извлечь такое следствие: пусть рп — вероятность осуществления события ε при п-м испытании, и пусть μ (η) — число осуществлений события ε за η первых испытаний. В этой ситуации вероятность соотношения hm sup п = 1 (3) равна единице при условии, что ряд %Рп (1 — Рп) расходится. ЛИТЕРАТУРА 1. ХинчинА. Я. Основные законы теории вероятностей. М., 1927. 2. KhintchineA,— Math. Ann., 1928, Bd. 99, S. 152. • работу № 5 наст, изд.— Примеч. ред.
20 4. О суммах независимых случайных величин 4 О СУММАХ НЕЗАВИСИМЫХ СЛУЧАЙНЫХ ВЕЛИЧИН* § ι ОБОЗНАЧЕНИЯ Ρ (А) — вероятность события А; Рв (А) или Ρ (А | В) — условная вероятность события А относительно В; Μ ξ — математическое ожидание случайной величины ξ; Μβξ или Μ (ξ Ι Β) — условное математическое ожидание ξ от- осительно события В; Μ (ξ; Β) = Ρ (β)·Μ (ξ | В), или то же, что интеграл Лебега по множеству β; Οξ — дисперсия случайной величины ξ, D| = Μ (ξ — Μ ξ) 2. Если !ι, . . ., ξ?ι — случайные величины, то положим λ- ^&=2Ub £ = £*; у= max |^l; к u = max | П |, Μ = sup | Cfc |, Я = MP = D52. (Предполагается, что математические ожидания M|fc и Μξ| существуют, ί ^ к ^ η,) Очевидно, что Μζ^ = 0, 2\ = 5& — MS^. Если величины |х, . . ., ξ^ взаимно независимы, то § 2 НЕСКОЛЬКО ТЕОРЕМ О КОНЕЧНЫХ СУММАХ Будем предполагать, что величины £ь . . ., ξηвзаимно независимы. Теорема 1. Пусть R ]> 0. Тогда Ρ {max Ι Γ* Ι > Д} < МГ/i?2, l<fr<n * Ueber die Summen durch den Zufall bestimmter unabhangiger Grossen.— Math. Ann., 1928, Bd. 99, S. 309—319; Bemerkungen...— Math. Ann., 1929, Bd. 102, S. 484—488. Перевод А. Н. Ширяева.
4. О суммах независимых случайных величин 21 Теорема 2. Пусть ε > О, яг — натуральное число и R = eD + М. Тогда Ρ { max Ι Ί\ | > mR} < ε~2™. Теорема 3. Пусть R ^> 0. Тогда Ρ { max I S* [ < Д} < 4 (ЛГ + Л)2//)2.* Теорема 4. г (i р> ^ ^ 1б ρ + м . Теорема 5. Р{Г> - 3Λί}> V48. Теорема 6. Ρ { | S | > R} > V48 [1-4 (4М + Д)2/£>2]. Доказательство теоремы 1. Пусть событие 4* = { | Г, | < Д, * < А, | Ϊ* | > Д> η и Л = 2j 4jt· ' Тогда η Р{тах|2-к|>Д} = />(4)=2 Р(^). Поскольку величины ζ^ с ί ^> /с не участвуют в определении события Ак, то, учитывая предположение о взаимной независимости £ь · · ·» in» находим, что М(Г2;Л,) = М(П;Л,)+ 2 Μ (ζ?; ЛЛ)>М(Г|; Л/с)> Д2^(АД г=/с—1 откуда Μ Г2 > Д2Р (Л), что и доказывает требуемое неравенство. Замечание. Доказанное неравенство превращается в равенство, например, в следующем случае: η = 1 и Ρ & = *> = _£-, Р{Ьв_д}==^1., Ρ{ζ1==0} = 1--|1. Доказательство теоремы 2. Обозначим Л^ - { | Tj I < Ш, ; <k; I Г» I > "*} и η
22 4. О суммах независимых случайных величин На множестве Aik \Tk\^iR + M. Очевидно, что P(Ai+1\Aik) = P{u^(i + l)R}^?{ max | 2 lj\> *&) · Как и в случае доказательства теоремы 1, заметим, что величины ζ,- для у > к не входят в определение событий Aik. Поэтому Ρ (Ain\Aik)^D2/e*D2 = 1/ε2 и, следовательно, Ρ μ l+1 J A ,·)< 1/ε2, Ρ {w > mi?} = P(4m) = = Ρ {Am.x | 4m) Ρ {Ат-г I Лт-,) ...Р(А)< 1/ε2"\ что и доказывает теорему 2. Доказательст во теоремы 3. Пусть Вк = { | St |< Л, ί < А}, 5 - 5U - {ι; < Л}, Очевидно, что P(B) + %P{Ck)=i. (1) Обозначим α» = Μ (Тк I J?»). На множестве Вк | Tfc - α* I = I Sk - Μ (Sk | Я») К 2Д, I a» - a*-i | = | Μ (ξ, | 5,) |< ΛΓ. Рассмотрим теперь выражение М l(Tk - akf; Bk.x] = = Μ [(Тк - akf; Вк] + Μ [(7\_х - ак-г - (ак - ak-i) + + ω2; С*] < Μ [(2\ - akf; Bk] + Ρ (Cfc)-4 (Л + Л/)2. (2) С другой стороны, Μ [{Тк - akf; Bk^] = = м [((Гц - о»-!) - (ofc - ak_1) + ζ*)2; tfit-J = = Μ [(7\_х - a^f + (ak - ak^)2 + ζ!; flMl> > Μ [(Гц - α*_χ)2; 5^] + Ρ (Β) Μ ζ2.. (3)
4. О суммах независимых случайных величин 23 Сравнивая (2) и (3), получаем Μ [(Тк-г - a,-!)2; B*-t] + Ρ (В) Μζϊ < <М [(Тк - акУ; Вк] + Ρ (Ск)Л (R + М)\ Полагая в этом неравенстве к = О, 1, . . ., η и суммируя соответствующие неравенства, получим с учетом (1), что Р(В)0*^М[(Тп-ап)*;Вп]+ 2 P(Ck)-*(R + М)*< к=1 <P(£)-4i?2 + 2 />(^)-4(Д + М)2<4(Л+ ^)2, # что и доказывает теорему 3. Замечание. Если вместо ζ^ взять zk, то утверждение теоремы будет верным с заменой ν на и. Доказательство теоремы 4. Обозначим Cm = {mR<T <:(m + 1) Л}, где i? = 8ΰ + Μ и положим оо Вт= 2 Ск- к=т Очевидно, что Я0 = {Г>0}. В силу теоремы 2 Р (Вт) < Ι/δ2"; оо оо т—О га=0 оо оо = i?]TV(5m)<i?[p(£0) + £-y< </?[>(i?0) + _L]. С Другой стороны, легко доказать, что Μ (Γ; Д0) > V2£>. Таким образом, ~D^r[p(B0) + ^]==(8D + M)[P(B0) + ±]; D i ^ i D-Μ Р(Во)< * an л-м \ - яТ< 2{SD+M) 32 ^ 16 D+M ' что и требовалось доказать.
24 4. О суммах независимых случайных величин Доказательство теоремы 5. Пусть D > 3/2М. Тогда в силу теоремы 4 Р(Г>0)>— D~~M > — Если D > 8/аМ. то по теореме 1 ρ {| τ|<зм}</)2/9м2< ν,. В обоих случаях эти оценки доказывают требуемое утверждение» Доказательство теоремы 6. Обозначим W=max\S- S £i|. Тогда из теоремы 3 Ρ {W > Д + ЗМ} > 1 - 4 (4М + R)VD* η и, применяя теорему 5 к сумме 2j L··, находим, что Ρ {5 > Я | W > R + ЗМ} > V48. Отсюда непосредственно следует требуемое утверждение. § 3 СХОДИМОСТЬ РЯДОВ Здесь будут рассмотрены необходимые и достаточные условия сходимости рядов из независимых случайных величин, ранее установленные другими методами в нашей совместной статье с А. Я. Хин- чиным (см. № 1 наст. изд.). Рассмотрим две последовательности случайных величин η = (ηι, ηζ,. · ·, ηη,. . .)> η = (%> %,..., η<η,. . .)· Будем называть последовательности η и ή эквивалентными, если * ДР{Пг¥=Чг}<оо. (4) ^ЛЛ»ТТ^УтМ предполагать, что каждая из последовательно- "' Ч " '' СОСТОПТ "3 «заимно независимых случайных величин. Uto определенно принадлежит А. Я. Хннчину.
4. О суммах независимых случайных величин 25 Теорема 7. 1) Вероятность Ρ сходимости ряда Σ Чг (5) равна единице, когда для последовательности η = (η,χ) существует эквивалентная ей последовательность η = (ηη), для которой сходятся ряды Σ Μη, (6) ί=1 и Σ Μζ?? (7) еде li = fjf — Mfjj. 2) Вероятность Ρ равна нулю, если не существует эквивалентной последовательности, для которой одновременно сходятся ряды (6) и (7). Доказательство. 1) Согласно теореме 1 для каждого положительного у ρ N оо Р{ max I VbJ>y}<4 Vm3< * VMg. (8) fc=n ft=n fc=-n Так как ряд (7) сходится, то для всякого ε ^> 0 найдется такое, быть может, большое т, что для η ^> т правая часть в (8) будет меньше ε. Согласно определению г Ρ = lira lim lim P { max | Σ Ή» I <C?/} · у—о η—οο Ν—оо п^р<ЛГ k=n Поэтому из (8) следует, что вероятность сходимости ряда оо Σ L (9) равна единице. Таккак'ряд (6) сходится, то то же верно и для ряда оо Σ η*· (10) 71=1 Поскольку в конечном счете вероятности сходимости эквивалентных рядов совпадают, то Ρ = 1. 2) Положим ηη~ίο, К|>1. (11)
26 4. О суммах независимых случайных величин Предположим сначала, что последовательности η = (ηη) и η = (ηη) эквивалентны, что равносильно тому, что оо ΣΡ{|η„Ι>ΐ)<°°· (12> В этом случае должен расходиться один из рядов (6) или (7). Если не сходится ряд (7), то по теореме 3 получим, что для любого у и всякого η при 7V->oo. Это означает, что вероятность сходимости ряда (10) равна нулю. Из эквивалентности последовательностей η = (ηη) Ηή = (ηη), отсюда следует, что Ρ = 0. Если сходится ряд (7), то вероятность сходимости ряда (9) согласно первой части теоремы равна единице. Поэтому если ряд (6) расходится, то Ρ = 0. оо Рассмотрим теперь случай, когда Σ^ίΙ^Ι^Ι}^00· 71=1 В этом случае мы непосредственно имеем, что для всякого η Р{тахЫ<1>= Π [1-Р{|Л*|>1>]-*0, Ν -> оо и, следовательно, Ρ = 0. Таким образом, наша теорема доказана для всех возможных случаев. Замечание. Если известно, что существует некоторая последовательность Т\ = (rjn), удовлетворяющая условиям теоремы, то тогда последовательность, определяемая формулой (11), также будет удовлетворять условиям этой теоремы. § 4 ОБОБЩЕННЫЙ ЗАКОН БОЛЬШИХ ЧИСЕЛ Рассмотрим систему случайных величин Ήΐΐ» ^12? · · ·» Цппц ЦИч Άΐΐι · · ·» Ц2т21 Цп1ч Лп2? · · ■» Цптпч кратко обозначаемую как || ηη^ ||. Будем предполагать, что в каждой строке величины независимы между собой, тогда как в разных строках они могут быть и зависимыми.
4. О суммах независимых случайных величин 21 Мы говорим, что средние Оп = Olnl + . . . + Чптп)1™>п, П > 1, устойчивы, если существует такая последовательность чисел du d2, . . ., что для любого ε ^> О Ρ { [ ап — dn | > ε} -> 0, . и ->оо. Дадим одно необходимое и достаточное условие для устойчивости средних. Будем говорить, что системы || г\пк || и || Т\пк || эквивалентны, если тп = Шп ж Р {<3п Φ вп} ->■ О, Л -> ОО. Очевидно, что эквивалентные системы или одновременно обладают свойством устойчивости средних, или же этим свойством не обладают. Теорема 8. Необходимое и достаточное условие для устойчивости средних ση, η ^ 1, заключается в существовании некоторой системы || f\nk ||, эквивалентной \\ ηΛ^||» для которой тп Доказательство достаточности. Из теоремы 1 следует, что для любого ε ^> О ™„ Ρ{|ση-Μσ^>ε} = ρ{|^Γζη&|>™„ε}<-^^Μζ2η;ι.. Поэтому из (13) следует, что р { Ι σΛ - Μ ап | > ε} -> 0, и из эквивалентности систем || ηη7Γ || и || г\п1{ || получаем р { Ι σ„ - Μ σ„ Ι > г} — 0, (14) что и доказывает достаточность. Доказательство необходимости. Пусть средние ση, тг ;> 1, устойчивы. Для любой случайной величины r\nk найдется константа fnk такая, что р к»* >/„*>< ν2, ρ κ,* < ы < v2. (is)
28 4. О суммах независимых случайных величин Легко доказать, что для любого положительного ε ^> О Σ Piht,*-/nfcl>^ne}^o, (16) η —>■ οο. Положим теперь Чпъ, если |ηη?; — fnk |< mn, /пь если | ηη7; — /nfc | > /тгп; ' -(ε) _ ί ΉηΛ, еСЛИ I Ήηλ- — Λι* Ι < ™гЛ ^ — i /nfc, если | r\nk — /nfc | > тпв. Согласно (16) системы || цп1с \\ \\ ^nk || и || l\nk (ε) || эквивалентны, а также устойчивы средпие ση и ап (ε). Заметим, что I Ink (ε) Ι < 2гтп. Поэтому по теореме 6 тп р {| ση (ε) — dn I > ε} = Ρ J| ^ ηη^ (ε) — mndn | > е/ип} > fr=l >± 1 — Для всякого ε^>0 левая часть этого неравенства сходится к нулю. Следовательно, тп lim sup -L V Μ (ξ,2,, (ε)) < 324ε2. (18) тп ΠΙ Для ε < 1 | Μζ2, - Μζ^ (ε) | < 8m2, Ρ (| цпк - fnli | > гтп} и согласно (16) mn 'Σι Ίί=1 -τ-/ι1Μζ^-Μζ^(β)|-ο. Поэтому условие (13) следует из (18). Замечание. Если существует некоторая система || νιτ$ ||, удовлетворяющая условию теоремы, то в качестве таковой может быть взята система, определяемая формулами (17) и (15).
4. О суммах независимых случайных величин 29* Будем говорить, что средние ση, η > 1, обладают свойством нормальной устойчивости, если для любого ε ^> О Ρ { I вп — M^n I > ε} -> О, η -> оо. Теорема 9. Необходимое и достаточное условие нормалоной устойчивости средних ση, тг > 1, состоит в существовании эквивалентной системы || цп1г ||, для которой справедливо (13) α Μση — Μση -> О, ?г -> оо. Доказательство теоремы следует непосредственно из формулы (14), установленной для любой устойчивой системы. Замечание. В случае нормальной устойчивости вместо системы || vi7lk ||, определяемой в (17), (15), можно взять систему с г]п7с, если |^.|<mn, Μηη^.. если | ζη1ί | > тп. Цпк § 5 ЗАКОН БОЛЬШИХ ЧИСЕЛ Условие устойчивости средних ση = К + · · · + У\п)/П, где η1? η2, . . . —независимые случайные величины, является сие- циальным случаем теорем 8 и 9, если полошить тп = /г, r]nZf = %. Нормальная устойчивость таких средних обычно именуется законом больших чисел. В этом случае справедлива следующая Теорема 10. Для того чтобы для каждого г ^> 0 р{ |ση-Μση |>ε}->0, тг->оо, (19> необходимо и достаточно существование такой системы || Тпк ||, что: 0. тп = п. !· ΣΡίηη*¥=ηη*}^0. 2· — ^tM:Hnfc — Μη„Λ]->0. 3· i J>I*,->q. Замечание. Если имеется система || цпк |[, удовлетворяющая вышеизложенным условиям, то в качестве таковой может быть
зи 4. О суммах независимых случайных величин взята система _ __ ί %·, ес™ | ζ}: | < тг, Чпк_ 1 Μη,, если |ζ*|>*. Теорема 11. Для того чтобы ρ { ] αη _ Μση I > ε} -> 0, и -> οο, необходимо и достаточно, чтобы: η ΐ· Σ ρ {| ζ* Ι > «> -> о. fc=l n 2. Α^Μ(ζ;ί;|ξ,|<«)->0. /ι=1 η 3. ^Γ^Μ(εϊ;|ζΠ<η)-*0. Москва, 24 декабря 1927 г. ЗАМЕЧАНИЯ Целью данных замечаний является, с одной стороны, уточнение и усовершенствование некоторых результатов (§ 1, 2), а с другой — исследование одного важного специального случая закона больших чисел (§ 3). § 1 Я обязан замечанием В. В. Немыцкому о том, что в доказательстве теоремы 4 использовалось неравенство Μ (Г; В0) > V2£>, которое неверно. На самом деле, легко доказать, что Μ (Г; В0) = V2M | Г |< V2 /Μ Γ = 42D, т. е. имеет место прямо противоположное неравенство. В этой связи теоремы 4, 5 и 6 указанной работы надо заменить на следующие. Теорема 4*. Пусть Μ < D. Тогда Теорема 5*. ΡΑί,^^Ι-ϋ^ίϋ]. Теоремы 7—11 остаются без изменения.
4. О суммах независимых случайных величин 31 Теорема 6, использованная только для доказательства теоремы 8,. должна быть заменена на теорему 6*. Доказательство теоремы 4*. Пусть Ε = {\S \> DI2) ' я Ё — дополнительное событие. Тогда если | MS\ Z> 2D, то D2 > Μ (Γ2; Ε) > Μ ((27) - £>/2)2; Я) > %Р (£)·£>2, Ρ (Я) < V2, что и доказывает требуемое утверждение. Если же | MS | < 2Z), то введем событие Ет = {SmD < | Г |< 3 (in + 1) Ζ), | 5 | > £>/2}. В силу теоремы 2 имеем Р (Ет) <-±г, Μ (J»; Em) < ;m+m1); · 25Я2. На множестве Е'= S £т имеем | Г |< 187), | S | < 207). Отсюда Μ (52; £') < 400Ζ)2Ρ (Ε). Поскольку Μ (52; £) < V4D2, то Z>2 < М£2 < Μ (£2; Ε + Ε' + У Ят) < ?П=6 оо ; 4" #2 4- 400Ζ)2Ρ (£) + JT (т'^1)2 25Z)2 < т—6 <3/4^ + 400Ζ>2/>(£), откуда что и доказывает теорему 4*. Доказательство теоремы 5*. Если Μ ^> D или -β ^> V27), то требуемое неравенство справедливо, поскольку тогда его птэавая часть отгшттятелъня.
'SI 4. О суммах независимых случайных величин Если же Μ <; D и R <^ V2£>, то требуемое неравенство следует из теоремы 4*. § 2 При доказательстве теоремы 8 я использовал формулу тп Σ Ρί|ηη*-/η*Ι>^·Λ}^ο. . (16) Для строгого доказательства этой формулы нужна следующая Теорема 6*. Пусть Ех, . . ., 2?п— последовательность независимых событий и U есть событие, состоящее в том, что Ρ (U | Ек) > и, Ρ {Ег + . . . + Еп)^и. Тогда Ρ (U) > V» а2. Доказательство. Если существует к такое, что для него Ρ (Ек) > V,a, то P(U)> P(Ek).P(U \Ек)>Ч3и\ что и доказывает требуемое утверждение. Пусть теперь для всех к Ρ (Ек) < V,«. Покажем, что тогда найдется такое к, что Vaa </>(#! + · · · +£0 <2/з^. С этой целью обозначим Ft = E1 + ...+ £,_! и пусть /^ — дополнительное событие. Поскольку Fi и £ζ· взаимно независимы, то для i <^ к Ρ (Ft \Et) = P (Ft) < Ρ (Fb) < У3и, Ρ (UFl | Et) > V,u, P.{UFtEt) > Ч3иР (Е,), к к P(U)>'£jP (UFiEi) > -1 и £ Ρ (Ei) >\uP (Fl:) > ± u\ что и требовалось доказать. Доказательство формулы (16). Обозначим U = { | (х„ - dn | > ε/2},
4. О суммах независимых случайных величин 33 1<М1* I" J tylf Очевидно, что Ρ (U | Fk) > V2. Для достаточно большого η в силу устойчивости средних Р (Щ < V, и, значит, ^ (/'V) < V2. Если событие £fc выполнено, a F^ нет, то событие U выполняется. Следовательно, Р (Fk \Ek) + P(U\ Ек) > Ι. Но события Е% и Fk независимы, поэтому для достаточно большого η P(Fk \Ek) = P(Fk)^42, Ρ (U | Ek) > V2. Согласно теореме 6* Ρ(£/)>ν3οΡ2(£ι+· ·· +EmJ и так как при η -> оо Ρ (U) -> 0, то Р(Е1 + ...+ Етп) -> О, тп Σ Ρ(Ε1:)->ο, fc=l что и требовалось доказать. § 3 Здесь мы хотим исследовать один особый случай закона больших чисел, а именно тот, в котором независимые случайные величины τ)ι, η2ι · · . имеют одно и то же распределение Ρ {ηχ < χ} = F (χ). В этом случае имеет место Теорема 12. Для устойчивости средних ση = ^ (Л1 + · · · + 4η)Ιη·> η Ξ> 1» необходимо и достаточно, чтобы п? { Ι Ήι I > ?*} -*■ 0, ft ->- оо. Доказательство. Положим ^ __ ( Чт если |ηη|< Я, Vnk-1 0, если \цп\>К. Л. Н. Колмогоров /·* = i^k — cL
Легко видеть, что при выполнении условия п? { | ηχ | ^> п} -> -> О, η —>· оо, системы (rjn/f) и (ηη) эквивалентны и что η η к=1 к=1 Следовательно, согласно теореме 8 средние ση, тг ]> 1, устойчивы. Обратно, если средние ση, η > 1, устойчивы, то, как было показано, имеет место формула (16). В рассматриваемом случае эта формула принимает вид ™ р { Ι Ήι — / I > т) ->■ О» где / — некоторая константа. Из этой формулы непосредственно следует доказываемое условие. Если случайные величины цп имеют конечное математическое ожидание оо 5 |:r|dF(x)<oo, — оо то условие теоремы 12 выполняется, поскольку тогда —η +°° »Ρ{|ηι|>η><($ + $)|z|dF-*0. — оо П Можно показать, что в этом случае устойчивость является нормальной. Итак, имеет место Теорема 13. Для нормальной устойчивости средних ап = = (^ι + · · · + Άη)Ιη, η > 1, последовательности независимых одинаково распределенных случайных величин цъ η2, . . . с собственным распределением необходимо 2 и достаточно, чтобы Μ | ηχ | < оо. Последнее утверждение ранее было установлено А. Я. Хинчи- ным (С. г. Acad. sci. Paris, 1929, vol. 188, p. 477). 8 февраля 1929 г. 5 О ЗАКОНЕ ПОВТОРНОГО ЛОГАРИФМА* Мы рассматриваем последовательность взаимно независимых случайных величин ζ1ι ζ2ι · · м ζηι · · ·» (1) 2 Необходимость тривиальна и следует из того, что определение нормальной устойчивости имеет смысл только в случае существования математического ожидания. * Ueber das Gesetz des iterierten Logarithmus.— Math. Ann., 1929, Bd. 101, S. 126—135. Перевод Ю. В. Прохорова.
5. О законе повторного логарифма όϊ) математические ожидания которых hAzn равны нулю. Пусть далее η η fr=l fc=l Вместе с А. Хинчиным скажем *, что последовательность (1) подчиняется закону повторного логарифма в том случае, когда вероятность соотношения lim sup . Г Sn = 1 (2) γ2ΒηΙη\*Βη равна единице. В одном важном частном случае этот закон был установлен самим А. Хинчиным 2; мы доказываем, что он применим при следующих условиях: I. Вп-+ оо, п. KI<^ = «(i/t^^). Легко выводится необходимость первого условия, если только исключить случай zn = 0. Если все величины zn ограничены в совокупности по абсолютной величине, то второе условие следует из первого, которое в этом случае является необходимым и достаточным. Без использования вероятностей соотношений, которые не могут быть наблюдены непосредственно, например таких, как событие (2), закон повторного логарифма может быть сформулирован следующим образом. 1°. Для произвольных положительных чисел η и δ найдется натуральное число η такое,1 что вероятность выполнения хотя бы одного из неравенств Sk > Y2Bk In In Bk (1 + δ) (k = η, η + 1, . . ., η + ρ) при любом р остается меньше- η. 2°. Для произвольных η, δ и т найдется натуральное число ρ такое, что вероятность одновременного выполнения (всех) неравенств Sk < γ2Β* In In Bk (1 — δ) (k = m, m + 1, . . , m + p) будет меньше η. § 1 ЛЕММЫ Пусть Мп= шах mk, Un= max Sk, Wn(x)=P(Sn>xh Wn(x) = P{Un>x}. См. его кн.: Основные законы теории вероятностей. М., 1927. 2 Math. Ann., 1928, Bd. 99, S. 152.
36 5. О законе повторного логарифма В нижеследующих леммах χ означает положительную величину. Так как η в этом параграфе будет предполагаться фиксированным, то в обозначениях мы будем его опускать. Лемма I. Если хМ <; В, то W (х) < e-^/2B)(i-e)f θ = хМ/2В. Лемма II. Если хМ ^ В, то 3 W (х) < е~х/*м. II. Пусть а ^> О, + · · · < Доказательство аМ< 1. Тогда Μέαζ* = Ml + Μ (azk) + Μ (- tAea <1+-/ a2bk .(1 + ■('+ η •s == Π Мб"2* < β αΜ 3 + " 2 /^ ^(-ь л е м ΐ) aW2 12 α2^ > 2 2 J Μ + M + .· ■(!+- I '(- И 6 ■)< αΜ 2 -) > (3) (4) W (χ) eax < Μ eaS. (5) Из (4) и (5) следует W(x)<e -α*+— (l+—) При #Λί <; S мы полагаем в последующей формуле а = х1В, и получаем лемму I; при хМ ^> В мы полагаем а = 1/М и получаем W (Ж) < <Г М + -ЩГ (1+1/г) ^ е~ IF. В обоих случаях условие αΜ <; 1 выполнено. Из леммы I непосредственно следует Лемма III. Если хМ <ζ В, то W (х) < <г*Ч*в. Лемма IV. Если хМ/В-= co<V256, (С) хЧВ = λ > 512, (7) 3 Ср.: Бернштейн С. Об одном видоизменении неравенства Чебышева и о погрешности формулы Лапласа.— Уч. зап. науч.-исслед. кафедр Украины. Отд. мат., 1924, вып. 1, с. 38—48. (См. также: Собр. соч., т. 4, с. 71—79).
5. О законе повторного логарифма oi то W (X) > е-<*2/2В)(1+г)? где ε означает наибольшее из чисел 32 j/^ln λ)/λ и 64 J^co. Доказательство. Пусть δ = х/8 ε, тогда 6* = max(64o;16^)f (8) λ а также вследствие (6) и (7) δ2 < V4, (9) δ < V2, (Ю) δ > 2δ2. (11) Мы полагаем далее а = х/В (1 - δ). Очевидно, χ = аВ (1 - δ), (12) χ/β < а < 2ж/Д, (13) αΛ/<2ω<1/128, (14) α2£>λ>.512. (15) Так как для каждого положительного и выполняемся неравенство 1 +'и > ^(1~г0? то наряду с формулой (3) мы имеем и следующую: Ме"**> 1 + ^(1--^- -τ?- -···)> >l + ^(l_^)>e^(1-"i—ii)>,-^(1-'^ (16) Подразумеваемое при этом условие аМ ^1 в нашем случае выполнено вследствие (4). Далее, согласно (4) мы имеем MeaS ^> £(«2В/2) (1-αΜ)# Η 7) В силу (14) и (8) аМ < δ2/4, так что окончательно мы получаем а*В ( б2 \ tAe«sye 2 V1 4 J. (18)
38 5. О законе повторного логарифма Мы имеем, с другой стороны, со со MeaS = — ^ eaydW(y) = a § eayW(y)dy = —со —оо О аВ (1-6) аВ (1+6) SaB со =*($+ S + S + S +S —со 0 αβ(1—б) оВ (1+6) 8аВ = α (/ι + Л + Л + /4 + /в). (19) Так как W(y)<Jl, то о a/i<fl J ewdy^i. (20) — со -По лемме II и формуле (14) для всех у ^> J5/M выполняется неравенство И7 (У) < е^/4М < е~2аУ. По лемме III мы имеем также при 8аВ <; у ^ J5/M W (г/) < ^2/45 ^ ^-гау. Стало быть, мы получаем со я/5<> .$ ^ауйг/<1. (21) 8аВ Так как вследствие (18), (9) и (15) Μ e«s >8,. то из (20) и (21) следует неравенство aJ1 + aJb < V4M e*s. (22) Для оценки величин aJ2 и a/4 мы применим лемму I. Вследствие (6) и (8) мы имеем при у <^ 8аВ неравенства θ<ω<ν8δ2, -JULfx-JLe.) W(y)<e 2B l 8 ;· Поэтому мы получаем аВ (1-6) SaB уШ , г \ a(/2+-/4)<a( $ + J )eay-^(l-T6s)d2/. 0 aB(l+6) В обоих интервалах интегрирования величина
5. О законе повторного логарифма 39 не превосходит границы и (aB(i + δ))= α2 5(1 + б)--^ (1 + б)2 (l 1-β2) = l_62+l_62(1+6)2j<^^1_^62^ а2Я Следовательно, мы имеем о Так как в силу (7), (8) и (15) In (32λ) < 2 In λ < νδλδ2, In (32α25)< (α25/8)δ2, (23) то в конце концов мы получаем из (18) неравенство £!£(ι_-ί1ϊ /о/\ я (Л + ЛХ ХЛ *2 l 4; < 1UM^aS. ( ' Из (19), (22) и (24) следует й/з)1^^)1/^2 ( . (25) С другой стороны, так как W (у) монотонна и не возрастает, то вследствие (12) аВ (1+6) aJs = a J e*vW (у) dy < 2а2Ве^ащц? (х). (26) аВ (1—6) Из (25) и (26) выводим Так как наряду с (23) и по аналогичным причинам имеет место формула 1η (4α2£) < (α2£/2) δ, то окончательно W («) > е- "-Τ <>+*δ> > е~ W^T? <^6> > е~ -5- <**V = e~lk <>+*>. Лемма V. TF (х) ^2W(x- γ2Β). Доказательство. Обозначим буквой Ε событие # > χ
40 5. О законе повторного логарифма и буквой Ек событие St<U, i<k, Sk = С/ > ж. Очевидно 4, Е = Е1 + Ег + ._..+Еп, W (χ) = Ρ {£}. Так как величины zt с i ^> k не входят в определение события JSfrt то мы имеем МЕ (σ«) = Μ (( 2 г,)* I Ек) = Σ М*К 5, Так как £ = С/ + σ&, то выполняются также неравенства Рвк {S>U - УЩ > V2, И/ (ж - УЩ = Р {5 > χ - γ2Β) > > W {χ) ?ε {S > U — γ2Β) > V2iF (x). Этим наше утверждение доказано. § 2 ДОКАЗАТЕЛЬСТВО ПЕРВОЙ ЧАСТИ ОСНОВНОЙ ТЕОРЕМЫ (1°) Достаточно рассмотреть случай δ < Va- (27) Очевидно, что в силу условий I и II возможно найти п0 такое, что Вщ > е, (28) уГ1п1п^По>4/б (29) и что для каждого η ^ п0 МЦВп < δ/16, .(30) Μη-\/*ψζ-<\. (31) 4 Знак + здесь употребляется вместо U с тем, чтобы подчеркнуть, что объединяемые события попарно несовместны.— Примеч. пер.
5. О законе повторного логарифма 41 После того как п0, пъ . . ., щ^ определены, мы выоираем пк так, что BnjBn^i + W, (32) 2?П;;+1/^._г>1 + б/4. (33) В силу (30) и (32) мы имеем >1 *»,-1 Ч-i ' 8 и, следовательно, по (28) В„к >(1 + δ/8)'·'. (34) Пусть далее χ (t) = γ2ί In In t. Вследствие (32) мы имеем 1{Вч)11{Впк_х)<\ + Щ. (35) Из осуществления хотя бы одного из неравенств Sn > 1 (Вп) (1 + δ) (щ.г < η < rcs) вытекает неравенство *Ч > % (Вщ^) (1 + δ). (36) Обозначим Vjf вероятность неравенства (36). Тогда очевидно, что сходимость ряда Σ V, (37) достаточна для справедливости утверждения 1°. Вследствие (35) мы имеем Ук<Р{иП][>%(Вп\)(1 + №)}, (38) а по лемме V последняя вероятность не превосходит Отметим, что из (29) следует неравенство УШГк<(Щх(вП1[), так что мы получаем ^ < 2Wn [χ (5 ) (1 + δ/4)]
42 5. О законе повторного логарифма и по лемме I %4W ( б \г h 1+4 (ΐ-θ) " 21Ч V 4; _ -Ш1пв^(1+А)г(1^) где вследствие (31) θ--2-Τ Взд <Т Отсюда следует Ffc<2e-lnln4(^i)<2(in5nfe)-(1+l)< что доказывает сходимость ряда (37). § 3 ДОКАЗАТЕЛЬСТВО ВТОРОЙ ЧАСТИ ОСНОВНОЙ ТЕОРЕМЫ (2°) Пусть, как и раньше, выполнено (27). Вследствие условий I и II и только что доказанной первой части основной теоремы возможно найти такое п01 что, во-первых, имеет место (28), во-вторых, для каждого η :> п0 MJBn < Va (39) и, в-третьих, вероятность осуществления всех неравенств | Sn |< 2χ (Дп), (л - τΐο, щ + 1, . . ., щ + р) (40) для каждого ρ больше 1 — η/2. Выберем % таким образом, что "в ^"Т^^ · (41) Тогда вследствие (27) и (39) имеем V5»*-! <32/б' Ч < 5". (32/δ)"· (42) Положим тогда из (41) следует β, > ВПк (1 - δ/4), χ (β,) > %'(ВПк) (1 - δ/4), (43) χ(β,)(1 - δ/4) > χ (5 ) (1 - δ/2). (44)
С другой стороны, из (41) следует также χ (5„k) (1 - δ/2) - 2χ (Β^) > χ (Яп>) (1 - δ). (45) Так как 5„й = oft + ^^, то в случае, когда выполняется (40)s из неравенства о* > X (Pi) ί1 - δ/4) (46) вследствие (44) и (45) вытекает неравенство Snk>%(Bnk)(l-b). (47) Мы докажем теперь, что при достаточно большом ρ вероятность осуществления хотя бы одного из неравенств (46) с к = 1, 2, . . , ρ будет больше 1 — η/2. Отсюда будет следовать, очевидно, что аналогичная вероятность для неравенств (47) будет больше 1 — η, и вторая часть основной теоремы будет доказана. Так как величины σ^ взаимно независимы, то для указанной цели достаточно доказать расходимость ряда со Σ Vb (48) вероятностей неравенств (46). Для оценки вероятностей Vk мы применим лемму IV, полагая в = ps, м = м„к, * = % (Μ (1 - δ/4). Для достаточно больших к выполняются условия (6) и (7), так как вследствие (43) β* > 7аДп* и потому /с lim^iM>lim(i-lnlnBnJ=oc. Из последних формул мы усматриваем, что ε стремится к нулю при к -> оо. Итак, для достаточно больших к мы имеем (1 + ε) (1 + δ/4) < 1
44 6. О законе больших чисел и вследствие (42) = (1ηβ*) 1 ^>(1дйп,) l *j>C& l *j, чем доказана расходимость ряда (48). Москва, 24 ноября 1927 г. 6 О ЗАКОНЕ БОЛЬШИХ ЧИСЕЛ* В математической теории вероятностей под законом больших чисел обычно понимают либо теорему Пуассона, либо теорему Чебы- шева с их обобщениями на случай зависимых испытаний. Однако этому закону можно дать более широкую интерпретацию, которая более согласуется с его натурфилософской трактовкой, если использовать это понятие всякий раз, когда можно утверждать с вероятностью, близкой к единице, что некоторая величина лишь немного отличается от некоторой априори заданной постоянной (2>. В предыдущей заметке (3> я привел теорему, которая, как мне кажется, наиболее отвечает этой интуитивной концепции. В настоящей работе я хочу вернуться к этой теме и сформулировать несколько более общее утверждение, а также пояснить некоторые возникающие здесь вопросы. § 1. Для точной постановки задачи мы рассмотрим последовательность действительных чисел (4) в которой значение Хп зависит от результата последовательных испытаний <5> win) z>(n) Ып) Условимся говорить, что Хп устойчиво № или же что Хп подчиняется закону больших чисел, если существует последовательность постоянных d\, d2, . . ., dn, ... такая, что для каждого положительного η Ρ { I Xn - dn I > η} -> 0. * (1) * Sur la loi des grands nombres.— Atti Accad. naz. Lincei. Rend., 1929, vol. 9, p. 470—474. Представлено Г. Костельнуово (1). Перевод О. В. Вискова.
6. О законе больших чисел 40 В большинстве важных случаев в качестве dn можно брать математическое ожидание Ε (Χη). Если окажется, что Рп (η) = Ρ ί Ι Χη - Ε (Χη) | > η} -> Ο (2) для каждого положительного η, то будем говорить, что устойчивость Хп нормальна. Можно доказать, что если Хп — Ε (Χη) равномерно ограничено, то соотношение (2) является следствием соотношения (1), т. е. в этом случае устойчивость может быть лишь нормальной. Согласно Чебышеву имеем Рп (η) < W. (3) где положено В\ = Ε [Χη - Ε (Xn)P. Таким образом, условие Вп -> 0 (условие Маркова) (4) является достаточным условием нормальной устойчивости Хп. Если Хп — Ε (Χη) равномерно ограничены по абсолютному значению постоянной М, то, как нетрудно доказать, ^η(η) = (^-η2)/(ΛΓ2-η2)· (5) Следовательно, в этом случае условие Маркова не только достаточно, но также и необходимо для устойчивости Хп, которая, как уже отмечалось, в рассматриваемой ситуации может быть лишь нормальной. § 2. Формулируя условие Маркова, мы касались только определения нормальной устойчивости. Однако интерес этого условия зависит от того факта, что вычисление Вп в большинстве случаев проще, чем вычисление Рп (η). В общем случае, обозначив Ек (Хп) математическое ожидание Хп в предположении, что известны результаты к первых испытаний $Г » 8ln\ · · ., Шк** будем иметь следующую фундаментальную формулу: η ^=SE[Et(4)-E*-ift)]· (6) /r=l В самом деле, очевидно, Е0 (Хп) = Ε (Хп), Е„ (Хп) = Хп, поэтому, обозначив znk = Efe (Xn) —- Efe_x (Xn), имеем &п Ε (Хп) = Ζηι + Zn2 + ... + Znn.
46 6. О законе больших чисел Вообще, обозначив Ek (Y) математическое ожидание Υ при условии, что известны результаты испытаний g{n), . . ., g^n), получим Efc-i {Znk) = Efr-i [Efe (Xn) — Εκ-ι(Χη)\ = Efc-i (-X"n) — Efr^i (Xn) = 0. Поскольку Ζηί при i < Л является константой, если фиксированы результаты к — 1 первых испытаний, то имеем также Efr-i (Zni^nk) = 0 и, наконец, E(ZniZnk) = E[Ek_1(ZniZnt)] = 0. Из этого последнего равенства немедленно следует формула (?) В2п = &* + Р42 + · · · + βηη, βΛΛ = У"Ε (ZL), (7) отличающаяся от (6) только обозначениями. Обратим внимание на смысл $пк. Это есть среднее квадратичное уклонение математического ожидания Хп, когда известен результат испытания $&η)· Поэтому $пк является естественной мерой зависимости Хп от результата испытания <8) <Ек1\ Это согласуется с формулированной в начале заметки концепцией закона больших чисел. Однако сейчас мы измеряем зависимость Хп от каждого испытания g4n) с помощью моментов $пк и доказали, что закон больших чисел эффективно применим к Хп, если сумма квадратов $пк бесконечно мала. Это имеет место, в частности, если β«* = о (i/fh). (8) § 3. Рассмотрим теперь случай, когда испытания Щ\^, определяющие значение Хп, независимы* в совокупности. Обозначим Ек (Y) математическое ожидание У, если известны результаты всех испытаний &ψ\ за исключением Щ^\ В рассматриваемом случае независимых испытаний имеем β^<θη* = Ε[Χη-Ε*(Χη)]* (9) Bl < ΑΙ - α?α + α*2 + . . . + α\η. (10) Таким образом, для нормальной устойчивости Хп достаточно условие (9> Ап-+0. (И) Доказательство формулы (9) можно провести следующим образом: Ек[Е*(АГ„)] = Ек.1(ДГп), Ек[Хп- Ε*(Χηψ> {Ей(Хп)- Ек [Е*(Хп)]}*= [Ε,(Χη)- Е,^(Хп)]\ a2n1t = Ε [Хп - Ек (Хп)]* > Ε [Ен (Хп) - Е^{Xn)f = $lk.
6. О законе больших чисел 47 В общем случае зависимых испытаний первая из этих формул неверна. Пусть MW (Хп) — верхний предел возможных значений Хп, если известны результаты всех испытаний $ψ\ за исключением &jcn\ и пусть т№ (Хп) — соответствующий . нижний предел. Обозначим Ω„* = sup I № (Хп) - тЮ (Хп) |. Таким образом Ωη1ί — максимальное уклонение Хп, если неизвестен лишь результат испытания $tn). Можно видеть, что αη1ί < V2Qnb (12) Al < V4 (Ωη1 + Ωη2 + . . . + Ωηη). (13) Отсюда следует условие для устойчивости Хп в случае независимых испытаний, приведенное в моей предыдущей работе: Qli + Ω'2 + · . . + Ωΐη -> 0. (14) В заключение отметим еще, что в случае, рассмотренном Чебы- шевым, Хп = (Х1 + Х% + · · · + Хп)/П, где хк зависит от испытания &^ и эти испытания независимы в совокупности, имеем 1 ψ*2 (* ) fa = ««* = -1-Е [Хп - Ε (Хп)Г—^ и приходим к классическому условию для устойчивости Хп: &(xi) + d*(x2) + ... + d*(xn) η3 ПРИМЕЧАНИЯ 1 Представлена 3 марта 1929 г. 2 См.: Бернштейн С. Н. Теория вероятностей, с. 142, где приводится еще более широкое определение. 3 С. г. Acad. sci. Paris, 1927, vol. 185, p. 917. 4 Можно получить аналогичные результаты, рассматривая векторы. В. Гливен- ко сообщил мне, что аналогичные рассмотрения могут быть проведены даже для векторов в функциональном пространстве Гильберта. 5 Мы постоянно предполагаем, что эти испытания независимы в совокупности. 6 Относительно этого определения устойчивости см. мою статью: Ueber die Sum- men durch den Zufall bestimmter unabhangiger Grossen.— Math. Ann., 1928, 7 Bd. 99, S. 309. В моей цитированной заметке эта формула доказана только в случае независимых в совокупности испытаний. Предполагается, что испытания <ij.n' осуществляются в соответствии с поряд- ком их индексов к. Это условие особо интересно, поскольку в определение моментов ап^ не входит порядок испытаний $ί.η).
48 7. Общая теория меры и исчисление вероятностей 7 ОБЩАЯ ТЕОРИЯ МЕРЫ И ИСЧИСЛЕНИЕ ВЕРОЯТНОСТЕЙ* Возникающий в современной математике интерес к теории вероятностей обусловлен не только растущим значением ее в математическом естествознании, но и постепенно обнаруживающейся глубокой связью этой теории со многими вопросами различных областей чистой математики. Получается впечатление, что формулы исчисления вероятностей выражают одну из основных групп наиболее общих математических закономерностей. Тем не менее было бы неосторожным утверждать, что эти факты указывают на зависимость понятий чистой математики от понятия случайности, с которым имеет дело теория вероятностей. Например, тот факт, что распределение знаков десятичного разложения ирра- ционалов может изучаться при помощи формул исчисления вероятностей, отнюдь не обязательно толковать, как указание на зависимость этого распределения от случая. Мы полагаем, напротив, что подобные факты намекают на возможность построения некоторой весьма общей и чисто математической теории, формулы которой могут быть применены как к исчислению вероятностей, так и ко многим другим областям чистой и прикладной математики. Чтобы наметить содержание такой теории, достаточно выделить из изложения теории вероятностей те элементы, которые обусловливают ее внутреннюю логическую структуру и совершенно не связаны с конкретным значением теории. Прежде всего мы приходим таким образом к общей теории меры. Общее понятие меры множества охватывает как частный случай понятие вероятности. Множество произвольных элементов, рассматриваемое с точки зрения меры его подмножеств, мы будем называть чисто метрическим пространством, хотя, быть может, это и является злоупотреблением термином «пространство». В частности, в исчислении вероятностей мы будем говорить о пространстве элементарных случаев данной проблемы и о вероятностях различных множеств этих случаев. Дальнейшим развитием общей теории меры является теория функций в чисто метрических пространствах. Эта теория занимается изучением тех свойств функций, которые зависят только от меры множеств, на которых функции принимают ту или иную совокупность значений. Таковы, например, свойства ортогональности двух функций или полноты системы ортогональных функций. Если рассматривать величины, зависящие от случаев (случайные величины), как * Тр. Коммунистической академии. Разд. мат., 1929, т. 1, с. 8—21.
7. Общая теория меры и исчисление вероятностей 4ft функции, определенные в пространстве элементарных случаев, то все относящиеся к ним предложения теории вероятностей окажутся частными следствиями предложений такой общей теории. Сила методов теории вероятностей в применении к вопросам чистой математики в значительной мере основана на употреблении понятия независимости случайных величин. Это понятие не получило до сих пор явной чисто математической формулировки, хотя дать ее и не представляет больших затруднений. Мы определяем далее «независимость» системы функций, причем независимость оказывается чисто метрическим свойством. Свойства множеств, на первый взгляд совершенно различных, когда их рассматривают только со стороны установленного для их подмножеств мероопределения, часто оказываются тождественными. Так, например, элементарно доказывается, что куб любого числа измерений может быть обратно однозначно отображен на отрезок прямой таким образом, что все измеримые (L) множества точек куба переходят в множества линейной меры, равной мере начальных множеств. Мы говорим поэтому, что куб любого числа измерений метрически эквивалентен отрезку. Кроме понятия метрической эквивалентности, мы определяем более общее понятие изометричности двух пространств. Трудно предвидеть, потребуется ли немедленное действительное развитие намеченных теорий или достаточно будет ограничиться указанием на принципиальную их возможность. Последнее во всяком случае необходимо для установления правильного взгляда на связь различных областей математики. Кроме того, это доставляет метод перенесения рассуждений из одной области в другую из числа тех, в которых могли бы найти применение предложения общей: теории. I. АБСТРАКТНОЕ МЕРООПРЕДЕЛЕНИЕ Рассмотрим множество А элементов а. Мы говорим, что для множества А дано некоторое мероопределение М, если некоторым определенным его подмножествам Ε приписана определенная мера Μ (Е). Множество А вместе с мероопределением Μ мы будем называть метрическим пространством. Мы должны дать теперь аксиомы, которым будут удовлетворять все рассматриваемые нами мероопределения. Прежде всего мы предполагаем, что мера множества является действительным числом, положительным или равным нулю. Аксиома!. Μ (Ε) > 0. Во-вторых, мы допускаем, что если два множества не пересекаются, то мера их суммы равна сумме мер.
50 7. Общая теория меры и исчисление вероятностей Аксиома II. Если Е±Х Е2 = 0, .то М (Ег + Е2)=М (Е{) + Μ (Ea). При этом предполагается, что существование мер для двух из рассматриваемых множеств влечет за собой существование меры третьего. Можно доказать на основании этой аксиомы общую формулу М (Е, + Ег) = Μ {Ех) +М(Е2- EJ. (1) Но при этом отнюдь нельзя предполагать, что существование мер .для двух множеств, если они пересекаются, влечет за собой существование меры для их суммы или разности: существуют важные мероопределения, не обладающие этим свойством. Так как произведение двух множеств может быть определено так: EVE2 = Et~ (Ег - Е2), (2) то формула (1) служит для вывода всевозможных соотношений между суммами, разностями и произведениями конечного числа множеств. Для удобства мы вводим в число рассматриваемых множеств пустое множество, которое будем обозначать через 0. Если в некотором мероопределении хотя бы одно множество имеет меру, то из аксиомы I следует, что Μ (0) = 0. (3) Наконец, третья аксиома вводит совершенно произвольное ограничение рассматриваемых мероопределений: мера всего пространства зпринимается равной единице. А к с и о м а III. Μ (А) = 1. Это сильно упрощает изложение, общий же случай легко может «быть изучен на основании этого частного. Во многих же применениях, в частности в исчислении вероятностей, это ограничение вызывается существом вопроса. Рассмотрим теперь некоторые примеры мероопределений, удовлетворяющих приведенным аксиомам. 1. Лебегово мероопределение для множеств точек ^-мерного куба со стороной, равной 1. 2. Плотность линейных множеств в точке 0 может рассматриваться как их мера. 3. Если множество А состоит из натуральных чисел, то в качестве меры множества может рассматриваться его плотность, т. е. предел отношения числа элементов множества, не превышающих п, к η при η ->■ оо.
7. Общая теория меры и исчисление вероятностей . 51 4. Если А есть множество элементарных случаев проблемы ис- г^сления вероятностей, то за меру множества элементарных случаев принимается вероятность появления хотя бы одного из них. II. ЗАМКНУТОСТЬ МЕРООПРЕДЕЛЕНИЯ § 1. Данному мероопределению Μ соответствует вполне определенная система (Е) множеств £", имеющих меру. Относительно этой системы нам известно пока только, что в нее входят пустое множество 0 и все пространство А, а также, что если Ег + Е2 = Ег, Е^Е2 = 0, то из вхождения в (Е) двух из этих множеств следует принадлежность к (Е) и третьего. Очевидно, что, в частности, дополнение множества, входящего в (Е), входит в (Е), так как Е + Е =А, Е-Е = 0. · § 2. Мероопределение называется полным, если состоит из всех подмножеств пространства А. Нам неизвестно ни одного полного мероопределения, в котором все множества из одного элемента имели бы меру, равную нулю. Доказать существование таких мероопределений без помощи принципа произвольного выбора представляется нам задачей большой трудности. § 3. Мы говорим, что мероопределение Μ заключает в себе мероопределение М\ данное для того же множества А, если (Е) заключает в себе (£"), и для множеств, принадлежащих к (£"), меры в обоих мероопределениях совпадают. Отнюдь нельзя предполагать, что всякое мероопределение заключается в каком-либо полном; противоречащие примеры элементарны. Впрочем, ни про одно из обычно употребляемых в математике мероопределений не доказана невозможность рассматривать их как заключающиеся в полных мероопределениях. Напротив, Банах доказал при помощи принципа произвольного выбора, что линейное лебегово мероопределение содержится .в некотором полном г. В силу метрической эквивалентности пространств любого числа измерений то же верно и для тг-мерного лебегова мероопределения. Но уже в трехмерном случае в полном мероопределении, заключающем в себе лебегово, не может быть выполнен принцип равенства мер конгруэнтных множеств, что доказывается данным Хаусдорфом примером разложения сферы на три множества, из которых каждое конгруэнтно сумме двух других с точностью до счетного множества. Даже в случае счетности основного множества А построение полного мероопределения наталкивается на большие трудности. Так, например, проблема обобщенной плотности последовательностей на- 1 Fund, math., vol. 4.
32 7. Общая теория мери и исчисление вероятностей туральных чисел, т. е. нахождения полного мероопределения, заключающего в себе мероопределение 3 предшествующей главы, представляет трудности, подобные построению 2 точечного множества, неизмеримого (L). § 4. Соответственно с этим и при постановке проблем исчисления вероятностей следует требовать, чтобы было указано, для каких случаев вероятности предполагаются существующими. Очевидно, например, что в случае геометрических вероятностей было бы неосторожным, предполагать существующими вероятности попадания точки на каждое множество точек пространства. § 5. Но в большинстве случаев можно предполагать систему (Е) обладающей некоторыми свойствами замкнутости. Мы будем говорить, что система (Е) конечно замкнута, если в нее входят все суммы пар принадлежащих к ней множеств. Очевидно, в силу формулы Ег-Е2 = 1Г+~Е2 (4) в замкнутую систему входят все разности, а в силу формулы (2) и произведения принадлежащих к ней множеств. § 6. Для каждой системы (Е) существует определенная минимальная система F (Е), замкнутая и содержащая в себе (Е). Если можно приписать меру всем множествам системы F (Е), совпадающую с данной для множеств системы (Е) и удовлетворяющую нашим трем аксиомам, то мы говорим, что начальное мероопределение допускает замыкание. Неизвестно, всякое ли мероопределение допускает замыкание. Если замыкание возможно, то не обязательно единственным способом; примеры последнего элементарны. Отыскание мероопределения, замыкающего данное выше под № 3, представляется нам задачей большой трудности. Точно так же спорен вопрос, обязательно ли мероопределение, связанное с каким-либо вопросом исчисления вероятностей, должно быть замкнутым. § 7. Система (Е) называется счетно замкнутой, если в нее входят всевозможные счетные суммы ее элементов. В счетно замкнутую систему входят и счетные произведения ее элементов, так как ПЕп=Шп (п = 1, 2, . . .)· (5) Но изучение счетной замкнутости тесно связано с понятием нормальности мероопределения и, собственно, только для нормальных мероопределений имеет смысл. 2 На близость обеих проблем указывают результаты, сообщенные мной в «С. г. Acad. sci. Paris», 1925.
7. Общая теория меры и исчисление вероятностей 53 III. НОРМАЛЬНОСТЬ МЕРООПРЕДЕЛЕНИЯ § 8. Мероопределение нормально, если для множеств, имеющих меру, из следует, что Л/(Я) - ΣΜ(£.) (и = 1,2, . . .)· Из приведенных выше мероопределения 2 и 3 не являются нормальными. Мероопределения, соответствующие проблемам исчисления вероятностей, также не обязательно нормальны. § 9. В случае конечно замкнутого нормального мероопределения легко доказать формулы Μ{ΣΕη)=ΣΜ{Εη-ηΣΕ,), (6) / fc-=l η Л*"(П>„) = НтМ(ПД*), η = 1,2, Λ.., (7) верные при единственном условии, чтобы множества i?n и их сумма или произведение имели меру. § 10. Кроме того, для конечно замкнутых нормальных мероопределений верно следующее предложение о счетных покрытиях: если ΕαΣΕη (τι = 1,2, ..), то Μ(Ε)·^ΣΜ(Εη) (η = 1,2, . . .). В самом деле, положим 71—1 =1 Ε'η = Ε{Εη-Σ Ek) (#1 = 1,2,...); очевидно, тогда Еп-Ет = 0, η Φ т; Ε = ΣΕ'η, ΣΜ (Εη) > ΣΜ (Εη) = Μ (Ε) (η - 1, 2, . . .). § 11. Будем называть множество Е измеримым при мероопределении Μ, если для любого наперед заданного ε существуют две последовательности множеств системы (Е) Е\, Ε2, . . ., Еп, . . . Ех, Е2, . . ., ЕП1 . . .
ί)4 7. Общая теория меры и исчисление вероятностей такие, что Ε CZ ΣΕη, Ε CZ ΣEn, ΣΜ (Εη) + Μ (En) < 1 + ε (и = 1, 2, . . .)· Будем называть обобщенной мерой измеримого множества Ε нижний предел сумм ΣΜ(Εη) (η =1,2,...) для его покрытий, состоящих из множеств системы (Е). § 12. Мы получим таким образом некоторое новое мероопределение L (М), придающее меру каждому измеримому относительно Μ множеству. Если Μ конечно замкнуто и нормально, то L (М) удовлетворяет аксиомам I—III, нормально и счетно замкнуто. Методы доказательства этих фактов совпадают с применяемыми при исследовании обычной лебеговой меры. Таким образом для всякого нормального конечно замкнутого мероопределения существует заключающее его в себе счетно замкнутое. § 13. Мероопределение L (М) не является минимальным счетно замкнутым мероопределением, заключающим М. Не составляет большого труда определить такое минимальное мероопределение В (М), которое содержится в L (М). Но мероопределение L (М) обладает другим замечательным свойством: измеримое относительно Μ множество во всяком нормальном мероопределении, заключающем в себе М, имеет ту же меруу что и в L (М). § 14. В частности, в исчислении вероятностей, если система случаев, имеющая определенные вероятности, конечно замкнута и нормальна, то можно без противоречия и единственным образом определить, что следует понимать под вероятностью счетного произведения или счетной суммы, имеющих вероятность случаев. Мы полагаем, что только после этого можно считать прочно обоснованными рассуждения о вероятностях таких событий, как сходимость ряда случайных величин и пр. IV. МЕТРИЧЕСКАЯ ЭКВИВАЛЕНТНОСТЬ И ИЗОМЕТРИЧНОСТЬ ПРОСТРАНСТВ § 15. Два метрических пространства называются метрически эквивалентными, если они могут быть поставлены в обратно однозначное соответствие таким образом, что множествам, имеющим меру, будут соответствовать множества того же рода и меры соответствующих множеств будут равны. § 16. Куб любого числа измерений со стороной, равной 1, рассматриваемый вместе с лебеговым мероопределением для его подмножеств, метрически эквивалентен отрезку длины, равной единице тоже с лебеговым мероопределением. Доказательство элементарно.
7. Общая теория меры и исчисление вероятностей . 55 § 17. Два множества Ег и Е2 в метрическом пространстве обладают одним и тем же метрическим типом, если М [(Ег - Е2) + (Е2 - Ех)} = 0. Во многих вопросах, в которых можно пренебрегать множествами меры нуль, можно вводить в рассмотрение только метрические типы, а не сами множества 3. Если мероопределение конечно замкнуто, то тип суммы, произведения или разности двух имеющих меру множеств зависит только от их типов и, следовательно, можно говорить о суммах, произведениях и разностях самих типов. Если мероопределение счетно замкнуто и нормально, то то же имеет место для счетных сумм и произведений. § 18. Два конечно замкнутых пространства называются изометрическими, если между метрическими типами их имеющих меру подмножеств можно установить обратно однозначное соответствие таким образом, чтобы суммам двух типов соответствовали суммы соответствующих типов и чтобы меры соответствующих типов были равны. Очевидно, что произведениям и разностям двух типов будут также соответствовать произведения или разности соответствующих типов. Если же оба мероопределения нормальны и счетно замкнуты, то то же будет верно и для счетных сумм и произведений. Но при этом надо заметить, что счетно замкнутое и нормальное мероопределение может быть изометрично ненормальному. § 19. Мероопределение обладает счетным базисом, если в системе (Е) имеется счетная система (/) (базис) такая, что каждое множество системы (Е) измеримо при базисе (/), т. е. и оно и его дополнение допускают покрытие множествами системы (/) с суммой мер, сколько угодно мало превышающей их меру. Конечно, это определет ние интересно только в случае нормальности пространства. Лебегово мероопределение на отрезке имеет счетный базис, состоящий из отрезков с рациональными концами. Нам неизвестно ни одного нормального пространства мощности континуума, не имеющего счетного базиса (если не считать определяемых с помощью принципа произвольного выбора). Но подобное пространство мощности 2е легко построить. § 20. Мероопределение М, нормальное, конечно замкнутое и обладающее счетным базисом, обязательно изометрично мероопределению М1, заключающемуся в лебеговом мероопределении отрезка § 21. Укажем в заключение, что так как многие свойства чисто метрических пространств зависят только от соотношений метриче- Конечно, все дальнейшее можно изложить и не вводя понятия метрического типа, как основанного на аксиоме «разбиения», пользуясь вместо этого понятием метрического «равенства» множеств.
56 7: Общая теория меры и исчисление вероятностей ских типов их подмножеств, которые могут быть тождественна у самых различных пространств, даже у пространств различной мощности, то заслуживала бы внимания попытка изложить теорию таких пространств, если рассматривать их как систему метрических типов, которые могут быть складываемы, умножаемы и т. д., и не предполагая существования «элементов» пространства. V. ЧИСТО МЕТРИЧЕСКАЯ ТЕОРИЯ ФУНКЦИЙ § 22. Мы будем рассматривать только функции, принимающие в каждой точке чисто метрического пространства определенное вещественное значение. Такая функция называется измеримой, если множество точек, в которых она принимает значения, принадлежащие какому-либо интервалу, всегда имеет меру. § 23. Очевидно, множество, на котором функция принимает определенное значение а, также имеет меру, так как Ε [b < / < а] + Ε If = а] + Ε [α < / < с] = Ε [b < / < с]. Если мероопределение в рассматриваемом пространстве счетно замкнуто, то множество, на котором измеримая функция принимает измеримое (В) множество значений,, имеет меру, так как оно может быть получено посредством счетных сложений и умножений из множеств, заведомо имеющих меру. Но, конечно, нельзя утверждать того же в случае измеримого (L) множества значений функций, даже если рассматриваемое мероопределение будет типа L (М). § 24. Множество функций [/] называется измеримым в совокупности, если множество, на котором значение каждой функции попадает в определенный соответствующий ей интервал, имеет меру при любом выборе интервалов'. В случае конечно замкнутого мероопределения конечная группа измеримых функций измерима в совокупности. В случае счетно замкнутого мероопределения то же верно для счетного множества функций. В случае счетно замкнутого мероопределения множество, на котором значения последовательности функций определяют точку измеримого (В) множества в счетномерном пространстве, имеет меру. Таково, например, множество точек сходимости ряда функций. Все сказанное непосредственно применяется к рассмотрению случайных величин в теории вероятностей. § 25. Интеграл функции / по множеству Ε может быть определен в чисто метрической теории только по Лебегу как предел выражения
7. Общая теория меры и исчисление вероятностей 57 при п ->■ °°> если входящий в него ряд абсолютно сходится и самый предел существует. При рассмотрении вопросов, связанных с понятием интеграла, мы будем предполагать пространство нормальным. § 26. Обычным методом доказывается, что для ограниченной измеримой функции интеграл существует. § 27. Для определенного таким образом интеграла имеют место следующие соотношения: 1. 5(/i + /a) = $/i + J/s. Ε ЕЕ 2. $cf = c$f. Ε Ε 3. J / = J/ + J/, если ^-^==0. 4. lim £ /n = £ /, если Д < /2 < . . . < fn . . . -* /. έ £ § 28. В теории вероятностей давно употребляется близкое к понятию лебегова интеграла понятие математического ожидания. Если рассматривать вероятность как меру множества элементарных случаев, то математическое ожидание случайной величины Ζ будет равно А а ее математическое ожидание при гипотезе Ε равно Ε По аналогии с понятием относительной вероятности введем обозначение ΜΕι(Ε2) = Μ(Ε1Ε2)/Μ(Ε\), тогда D 'ί(Ζ) = lim V -Ξ. лгя Γ-2ί-< Ζ < / "ι η \_ η ^ ^ § 29. На основе данного определения интеграла может быть развита теория ортогональных функций в чисто метрических пространствах. Так, например, для того чтобы система ограниченных ортогональных функций не могла иметь мощности выше счетной, достаточно, чтобы рассматриваемое мероопределение имело счетный базис. Интересно, в какой мере возможно изложить чисто метрическую теорию функций в терминах, инвариантных для изометричных пространств. Уже самое определение функции должно получить для этого другую формулировку.
58 7. Общая теория меры и исчисление вероятностей VI. НЕЗАВИСИМОСТЬ § 30. Два разбиения пространства А на множества непересекающихся частей А = ΣΡ', А = ΣΡ" называются независимыми, если для всяких двух измеримых множеств Е' и Ε", состоящих первое из некоторых F', а второе из некоторых F", имеет место соотношение Μ(Ε'·Ε") = М{Е'УМ(Е"). § 31. Произведением разбиений [F] в конечном или бесконечном числе называется разбиение пространства на произведения элементов данных разбиений по одному из каждого. Разбиения [F] в конечном или бесконечном числе взаимно независимы, если любые два произведения из них, не имеющие общих элементов, независимы. Из попарной независимости разбиений не следует их взаимная независимость. § 32. Установленные общие определения допускают в частных случаях ряд упрощений. Так, например, если мероопределение конечно замкнуто и разбиения (Ff) и {F") состоят из конечного числа имеющих меру элементов, то для их независимости достаточно, чтобы Μ (F'-F") =M(F')-M(F") для каждой пары F' и F". В случае нормальности мероопределения то же самое верно для разбиений на счетное множество частей. § 33. Каждая функция определяет разбиение пространства на множества, на которых она принимает то или иное значение. Функции называются взаимно независимыми, если соответствующие разбиения независимы. § 34. Точно так же определяется независимость разбиений множества (Е) и независимость функций на множестве. Для функций Д, /2, . . ., /п, независимых на множестве Е, имеет место соотношение DE (hf2 ...fn) = DE (A) DE (h) ...BE (fn).
8. Об усиленном законе больших чисел 59 8 ОБ УСИЛЕННОМ ЗАКОНЕ БОЛЬШИХ ЧИСЕЛ* Пусть — последовательность независимых в совокупности случайных величин с равными нулю математическими ожиданиями £ (χη). Следуя Кантелли и Хинчину, будем говорить, что последовательность (1) удовлетворяет усиленному закону больших чисел (у.з.б.ч.), если вероятность того, что средние а* + #2 + . . . + ; сходятся к нулю, равна единице. Мы сейчас докажем, что у. з. б. ч. имеет место, если вторые моменты Ε (χΙ) = Ьп существуют и ряд Σ (2) сходится. Это условие не может быть заменено другим, менее сильным условием: если для некоторой последовательности постоянных Ъп ряд (2) расходится, то можно построить последовательность (1) независимых случайных величин, удовлетворяющих равенствам Ε (хп) = О, Ε {х\) = Ъп и таких, что они не удовлетворяют у. з. б. ч- Для доказательства можно воспользоваться леммой, которая выражается формулой h'—n P{max|S;j5>i?}<-i-£4, (3) fc=l и которая была нами доказана в другом месте (для R ;> 0) г. Очевидно, согласно (3) Рт = Ρ {max Ι αη ζ^Ζ+1 > ε} < ??<2r' <P{max|Sn|;:<fm>2me}<(1i-)2 £ К, Sur la loi forte des grands nombres.— C. r. Acad. sci. Paris, 1930, vol. 191, p. 910—912. Перевод О. В. Вискова. л/г tTeber die Summen durch den Zufall bestimmter unabhangiger Grossen.— Math. Ann., 1928, Bd. 99, S. 310, Satz 1.
60 9. Об аналитических методах в теории вероятностей i> = P{limsup|an|>e><]g />m <-i-J7 (^-j J? fc„< m—0 m—0 ?г=1 oo oo n<2i+1 <4-ΣΣ(ι42 Σ. fe»< or ?г<2г+^ on <τΣ(τγ)" Σ «k-S-Σ^· <*> Но вероятность Р не изменится, если конечное число первых членов последовательности (1) заменить нулем. Если ряд (2) сходится, то последний член в неравенстве (4) можно сделать сколь угодно малым. Следовательно, вероятность Ρ равна нулю. Поскольку это выполняется для всякого ε^>0, то в рассматриваемой ситуации имеет место у. з. б. ч. , _ Для доказательства второй части нашего утверждения предположим, что ряд (2) расходится. Пусть в случае Ьп1п% <; 1 хп = п, хп = —п, хп = Q о, вероятностями, равными соответственно bn/2n*, bn/2n*, I - bjn2, в случае bn/n2 > 1 положим χη = ΫΚ и Хп = —УК с вероятностями V2 и 1/2. Легко проверяется, что Ε (хп) = 0, £ (χ„) = = Ъп и что у. з. б. ч. для1 построенной последовательности не имеет места.J 9 ОБ АНАЛИТИЧЕСКИХ МЕТОДАХ В ТЕОРИИ ВЕРОЯТНОСТЕЙ* ПРЕДМЕТ ИССЛЕДОВАНИЯ Физический процесс (изменение некоторой физической системы) называется стохастически определенным, если из знания состояния Х0 системы в некоторый момент времени t0 следует также знание функции распределения вероятностей для возможных состояний. X этой системы в момент t^>t0. * Ueber die analytischen Methoden in der Wahrscheinlichkeitsrechnung.— Math. Ann., 1931, Bd. 104, S. 415—458. Рус. пер.: УМН, 1938, вып. 5, с. 5-41.
Р. Об аналитических методах в теории вероятностей 61 Автор систематически рассматривает простейшие случаи стохастически определенных процессов и в первую очередь — процессы непрерывные во времени (в этом заключается существенная новизна метода: до сих пор стохастический процесс рассматривался обычно как дискретная последовательность отдельных «событий»). Если множество % различных возможных состояний системы конечно, то стохастический процесс может быть охарактеризован с помощью обыкновенных линейных дифференциальных уравнений (гл. II). Если состояние системы определяется одним или несколькими непрерывными параметрами, то соответствующий аналитический аппарат приводится к дифференциальным уравнениям с частными производными параболического типа (гл. IV). При этом мы приходим к различным функциям распределения, среди которых нормальное распределение Лапласа выступает как естественный простейший случай. ВВЕДЕНИЕ I. Желая подвергнуть математической обработке явления природы или социальной жизни, необходимо предварительно эти явления схематизировать: дело в том, что к исследованию процесса изменения некоторой системы математический анализ применим лишь в том случае, если предположить, что каждое возможное состояние этой системы мож^т быть вполне определено с помощью известного математического аппарата, например, при помощи значений, принимаемых известным числом параметров; такая математически определимая система есть не сама действительность, но лишь схема, пригодная для описания действительности. Классическая механика пользуется лишь такими схемами, при которых состояние у системы для момента времени t однозначным образом определяется ее состоянием χ в любой предшествующий момент t0; математически это выражается формулой У = f {x, t0, t). Если такая однозначная функция / существует, как это всегда предполагается в классической механике, то мы говорим, что наша схема есть схема вполне детерминированного процесса. К числу вполне детерминированных процессов можно было бы отнести, кроме того, процессы, в которых состояние у не вполне определяется заданием состояния χ для единственного момента времени £, существенным образом завися еще от характера изменения этого состояния χ перед моментом t. Однако обычно предпочитают избегать такой зависимости от предшествующего поведения системы, для чего расширяют самое понятие состояния системы в момент времени t и соответственно этому вводят новые параметры г. 1 Хорошо известный пример применения этого метода мы имеем во введении при описании состояния некоторой механической системы, кроме координат ее точек, также компонент их скоростей.
!62 9. Об аналитических методах в теории вероятностей Вне области классической механики наряду со схемами вполне детерминированных процессов часто рассматривают и такие схемы, где состояние χ системы в некоторый момент времени t0 обусловливает лишь известную вероятность для наступления возможного состояния у в некоторый последующий момент t ^> t0. Если при любых заданных £0, t ^> t0 и χ существует определенная функция рас- лределения вероятностей для состояний г/, мы говорим, что наша схема есть схема стохастически определенного процесса. В общем случае эта функция распределения представляется в виде Ρ (t0, χ, f, β), причем @ обозначает некоторое множество состояний у, а Р есть вероятность того, что в момент t окажется реализованным одно из состояний у, принадлежащих этому множеству. При этом возникает одно затруднение, заключающееся в том, что, вообще говоря, невозможно определить эту вероятность для всех множеств (£. Строгое определение стохастически определенного процесса, устраняющее указанное затруднение, дается в § 1. Как и в случае вполне детерминированного процесса, мы могли бы рассматривать здесь также схемы, в которых вероятность Ρ существенным образом зависит не только от состояния х, но и от всего предшествующего поведения системы. Однако от такого влияния предшествующего течения процесса можно освободиться при помощи того же метода, что и в случае схемы вполне детерминированного процесса. Заметим еще, что возможность применения схемы вполне детерминированного или только стохастически определенного процесса при исследовании какого-либо действительного процесса ни в какой мере не связана с вопросом о том, является ли самый этот действительный процесс в конечном счете детерминированным или случайным. II. Обычно в теории вероятностей рассматривают только такие схемы, при которых изменения состояния системы возможны лишь в определенные моменты времени ti, t2, . . ., tn, . . ., образующие дискретный ряд значений. Башелье 2 впервые, насколько нам известно, занялся систематическим изучением схем, в которых вероятность Ρ (ί0, χ, t, S) изменяется непрерывно с течением времени t. К тем случаям, которые были исследованы Башелье, мы еще вернемся в § 16 и в заключении. Здесь же мы только заметим, что построения Башелье ни в какой мере не отвечают требованиям необходимой математической строгости. В предлагаемой работе, начиная со второй главы, мы главным образом рассматриваем упомянутые выше непрерывные относитель- 2 I. Theorie de la speculation.— Ann. Ecole norm, super., 1900, vol. 17, p. 21; II. Les probabilites a plusieurs variable.—Ann. Ecole norm, super., 1910, vol. 27, p. 339; III. Galcul des probabilites, Paris, 1912.
9. Об аналитических методах в теории вероятностей 63 но времени схемы. С математической стороны такие схемы имеют то важное преимущество, что позволяют ввести в рассмотрение дифференциальные уравнения для Ρ относительно времени и приводят к простым аналитическим выражениям, которые в обычной теории получаются лишь как асимптотические формулы. Что касается приложений, то, во-первых, новые схемы могут быть непосредственно применены к реальным процессам, а, во-вторых, из решений дифференциальных уравнений непрерывных во времени процессов можно вывести новые асимптотические формулы для прерывных схем, как это будет показано в § 12. III. Мы не исходим из полной системы аксиом теории вероятностей; однако мы отметим теперь же все те предпосылки, которыми в дальнейшем нам придется пользоваться. Относительно множества 9i возможных состояний χ мы не делаем никаких специальных предположений: математически можно рассматривать % как произвольное множество, состоящее из произвольных элементов. Все предположения, касающиеся системы множеств $ и функции Ρ (t0, x, t, @), приведены в § 1. В дальнейшем вся теория развивается нами как чисто математическая. ОГЛАВЛЕНИЕ Глава первая. Общие положения: § 1. Общая схема стохастически определенного процесса. § 2. Оператор F\ (χ, (£) * F2 (x, (g). § 3. Классификация специальных случаев. § 4. Эрго- дический принцип. Глава вторая. Конечные системы состояний: § 5. Предварительные замечания. § 6. Дифференциальные уравнения непрерывного стохастического процесса. § 7. Примеры. Глава третья. Счетные системы состояний'^ § 8. Предварительные замечания. Прерывные схемы. § 9. Дифференциальные уравнения непрерывного во времени процесса. § 10. Однозначность решении и их вычисление для случая однородного во времени процесса. Глава четвертая. Непрерывные системы состояний, случай одного параметра'* § 11. Предварительные замечания. § 12. Метод Линдеберга. Переход от прерывных схем к непрерывным. § 13. Первое дифференциальное уравнение Для непрерывных во времени процессов. § 14. Второе дифференциальное уравнение. § 15. Постановка вопроса об однозначности и существовании решений Для второго дифференциального уравнения. § 16. Случай Башелье. § 17. Об одном способе преобразования функций распределения. § 18. Стационарные функции распределения. § 19. Другие возможности. Заключение
64 9. Об аналитических методах в теории вероятностей Глава I ОБЩИЕ ПОЛОЖЕНИЯ § 1 ОБЩАЯ СХЕМА СТОХАСТИЧЕСКИ ОПРЕДЕЛЕННОГО ПРОЦЕССА Пусть © — некоторая система, которая может находиться в состояниях х, г/, ζ, . . ., и J — система множеств (£, образованных жз элементов х, у, ζ, . . . Мы называем процесс изменения системы © стохастически определенным по отношению к g, если при любом выборе состояния х, множества (5 и моментов времени £х и t2 (tx <[ t2) существует определенная вероятность Ρ (t±, x, t2, S) того, что при наличии состояния χ в момент tx в момент t2 осуществится одно из состояний (£. Если вероятность P'(t±, x, t2, S) определена лишь для h ^> h ϊ> h^ мы говорим, что процесс изменения стохастичесш* определен при t^t0. Что касается системы $, то мы предполагаем, что она, во-первых, аддитивна (т. е. содержит все разности, равно как и конечные или счетные суммы своих элементов) и, во-вторых, содержит в себе нулевое множество, множество ЭД всех возможных состояний х, у, ζ, . . . ii все множества, составленные из одного элемента каждое. Если множество 9t конечно или счетно, то $ состоит, очевидно, из всех подмножеств множества 31. Но в наиболее важном случае, когда множество % несчетно, предположение, что ^ охватывает собой все подмножества из St, не выполняется ни для одной из известных в настоящее Бремя схем. Мы, разумеется, предполагаем, что />(*!, я, f2, «) ="1 (1) и для нулевого множества 9Ϊ Ρ (fb x, t2, 31) = 0. Далее мы предполагаем, что Ρ (ί1? χ, t2, (£) как функция множества (£ аддитивна, т. е. что для любого разложения множества S на конечное или счетное число слагаемых Sn без общих элементов имеет место равенство Σ ρ (*ι, χ, h, en) = ρ (tu *, *2, «). (2) η Для формулировки дальнейших предположений относительно Ρ (t±, x, t2, S) нам необходимы понятия измеримости функции / (х) но отношению к системе % и определение абстрактного интеграла Стилтьеса. Эти понятия мы дадим здесь в форме, отвечающей нашим целям 3. 3 По поводу этих понятий, а также по поводу аддитивных систем множеств и т. п. см., например:' Frechet Μ. Sur l'mtegrale d'une fonctionnelle etendu a nn ensemble abstrait,— Bull. Soc. math. France, 1915, vol. 43, p. 248.
9. Об аналитических методах в теории вероятностей 65 Мы называем функцию / (х) измеримой по отношению к системе &, если при любом выборе действительных чисел а и Ь множество С(а <С / (х) <С ^) всех х» ПРИ которых / (х) удовлетворяет указанному в скобках неравенству, принадлежит к системе g. Легко показать, что если система % аддитивна, а / (х) измерима по отношению к $, то множество S всех тех χ,ι при которых / (х) принадлежит к данному измеримому по Борелю множеству, всегда также содержится в системе g. Пусть теперь / (х) измерима по отношению к системе g и ограничена, и пусть φ (6) обозначает некоторую неотрицательную аддитивную функцию множеств, определенную на §; тогда, как известно, сумма Σ1 т I т ^ е, \ ^ т -\-1 \ m при η ->■ оо стремится к определенному пределу. Этот предел мы назовем интегралом Предлагаемое обозначение отличается от обычно употребляемого только тем, что в нем специально указана переменная интеграции и знак дифференциала стоит внутри скобок. В дальнейшем мы будем предполагать, что Ρ (ft, x, ft, S) как функция состояния х измерима по отношению к системе $. Наконец, для произвольных ft, ft, ft (ft < ft <C *з) Ρ {hi χ·> h, @) должно удовлетворять -фундаментальному уравнению Ρ («," χ, U, β) = S Ρ (ft, 2/, h, β) Ρ (ft, χ, ft, έ№). (З) Если 3t состоит из конечного или счетного множества элементов х1ш х%, · . ., хп, . . ., то S Ρ (*«, 2/, «8, β) Ρ (ft, я, ft, £«) = 2 Ρ (h, Xn, fc, ®) Ρ (ft, я, ft, sn) и в правой части мы имеем выражение полной вероятности Ρ (ft, χ, ft, S); тем самым для этого случая формула (3) доказана. В случае же, когда множество 91] несчетно, мы принимаем соотношение (3) за новую аксиому. Сформулированные выше требования вполне определяют понятие стохастически определенного процесса: элементы х, у, ζ, . . . произвольного множества 91 можно рассматривать как признаки, определяющие состояние некоторой системы, а произвольную функцию Ρ (*ι» х, Ч, @)» удовлетворяющую указанным требованиям, как соответствующую функцию распределения вероятностей. 3 А. Н. Колмогоров
66 9. Об аналитических, методах в теории вероятностей Неотрицательную функццю F (€)Л определенную на системе gf аддитивную и удовлетворяющуюг кроме того, условию *(*) = !, (4) мы будем называть нормальной функцией распределения. Все требования, наложенные нами на Ρ (£1? х, £2» S), мы можем теперь высказать следующим образом: Ρ (t±, χ, t^, (S), как функция от (S, есть нормальная функция распределения, как функция от ху измерима по отношению к системе §·, иг наконец, удовлетворяет интегральному уравнению (3). г - Пусть теперь мы для момента времени t = £0 имеем нормальную функцию распределения Q (£0, <g), дающую вероятность того, что система @ в момент t0 находится в? одном из состояний, принадлежащих к 6. Функцию' распределения Q (£, <§) для момента времени t^> t0 мы определяем с помощью второго фундаментального уравнения Q (t, С) = $ Ρ (t0i х, t, «) <? (^ο, ^). (5) Мы имеем, очевидно, Q(t,%) = lQ(to,d%) = Q(t0,M) = lt (6) = ξ Ptfi, *, ίι, β) 1 Р (to, y, h, d%)Q(t0, άΨ) = = J J Ρ (ϋ, χ, ί„ β) /> (ίρ, г/, ii, £«) Q (t0, d4') = = Ι Ρ (tor y,h, β) Q (t0, d%') = Q (t2, β). (7) Формулу (5) мы рассматриваем как определение функции Q (£, S), а не как новое требование, налагаемое на систему @; заметим, однако, что (5) содержит в себе соотношение (3) как частный случай. § 2 ОПЕРАТОР Fx (χ, ®) * F2 (x, <g) Пусть Fx (χ, (S) и F2 (x9 S) — две нормальные функции распреде- ленияг которые, рассматриваемые как функции от х, измеримы по отношению к системе %. Мы положим F (х, С) = Fx (χ, ®)*F2 (χ, Щ = Fi*F% (χ, β) = J ^2 (у, С) ^ (ж, <»); (8)
9. Об аналитических методах в теории вероятностей 67 как легко видеть, F (х, @) удовлетворяет тем же условиям измеримости и аддитивности, что и функции Ft (χ, <S) и F2 (#, β); равенство (4) также оказывается выполненным: F(x, 3i)= J А (У, ВД(я, dW)= I Fi(x, (»')= 1, следовательно, F (х, Щ также является нормальной функцией распределения. Далее, оператор Fx * F2 подчиняется сочетательному закону: Fx * (i^a * ^з) = (^i * F2) *FS, (9) в чем легко убедиться с помощью следующего несложного вычисления: Ft^F^Fs) (х, <S) = $ $ F9 (ζ, <ё) F2 (у, dW) Fx (χ, d%) = a««2 = J Fs(z, S) $ F2(y, dW)F1(x, d%) = (F1*F2)*Fs(x, €). «; «v Напротив^ переместите л ьный закон для оператора jPx * F%, вообще говоря, не имеет места. Мы определим теперь единичную функцию μ (χ, β), которая для всякой нормальной функции распределения F (x, k) удовлетворяет уравнению μ * F (χ, <S) = F * μ (χ, <S) = F (x, <g). (10) Для этой цели достаточно] положить μ (ж, 6) = 1, когда χ содержится в @, и μ (χ, g) = 0 в противном случае; тогда мы, действительно, имеем μ*Ρ(χ, <g)= $ F(y, (S) μ (χ, d%) = F{x, <S), «ν ^*μ (*, @) = $ μ (2/, β) F (χ, d%) = ^ (ж, ώδ) = ί1 (ж, в). у Вероятность Ρ (tl9 χ, ί%% @) была определена пока лишь для Ч > ίχ; примем теперь для любого £ р (*> ж* ί, β) = μ (я?, в). (11) ^то новое определение в силу формулы (10) не противоречит фундаментальному уравнению (3), поскольку это последнее может быть написано в виде Р (*ц х, *а, β) * Ρ (t2, χ, ί,,Ί) =* Ρ (*ι, af, ί„ в). (12) 3*
68 9. Об аналитических методах в теории вероятностей § 3 КЛАССИФИКАЦИЯ СПЕЦИАЛЬНЫХ СЛУЧАЕВ Если изменения состояния системы @ наступают лишь в известные моменты времени, образующие дискретный ряд *о < к < h < · · · < tn < . . . -> оо, то, очевидно, ρ (f, χ, г, e) = p (tm, x, t.n, e) (13> для всех моментов времени t' и Г, удовлетворяющих неравенствам Вводя обозначения /> (*т, Ж, *η, β) = Pmn (X, <S), (14) /Vi.» (я, β) = Ρη (χ, (S), (15) будем иметь Pmn О*, ®) = Pm+i*Pm+2* . . . *Pn (Ж, β). (16) Следовательно, в данном случае процесс изменения системы @ вполне определяется элементарными функциями распределения Рп (xt (S). Пусть теперь Рг (х, (S), Р2 (х, S), . . ., Рп (х,S) — произвольные нормальные функции распределения, которые как функции от χ мы предполагаем измеримыми; пусть, далее, t0 <[ tx <^ . . . <^ £П<С <^ . . . — некоторая последовательность моментов времени. Определяя Ртп (х, (S) и Ρ (f, χ, f, (S) посредством формул (16), (14) и (13), мы получаем также нормальные функции распределения, удовлетворяющие уравнениям Λη«(*, β)*Λι, (*,«) = Лир (*.«) (mO<p), (17) а, следовательно, и уравнению Ρ (*', χ, t", <S)*P (Г, я, Г, в) = Ρ (*', χ, Г, S) (f < t" < Г). Но это последнее представляет собой не что иное, как фундаментальное уравнение (12) или (13). Мы видим, таким образом, что всякая последовательность произвольных нормальных функций распределения Рп (х, (S), измеримых как функции от х, характеризует некоторый стохастически определенный процесс. В теории вероятностей обычно и рассматривают только определенные выше схемы с прерывным временем. Если все функции распределения Рп (х, (S) между собой тождественны: Рп (х, С) = Ρ (χ, в) J (18) то мы имеем однородную схему с прерывным временем; в этом случае мы получаем на основании (16) Рп,п+Р(х, Щ = Р(х, <S)*P(*, «)*...*/>(*, Ъ)=[Р(хш Щ]1 = Рр(х,Щ- ·< V Раз >· (19)
9. Об аналитических методах в теории вероятностей 69 Еще в 1900 г. Башелье занимался рассмотрением непрерывных во времени стохастических процессов 4, и существуют все основания к тому, чтобы схемы с непрерывным временем заняли центральное положение в теории вероятностей. Наиболее важными представляются здесь однородные во времени схемы, в которых Ρ (t, x, t + + τ, β) зависит лишь от разности t2 — tx: Ρ (*, я, t + τ, <S) * Ρ (τ2, χ, β) = Ρ (τ, χ, «). (20) фундаментальное уравнение для этого случая напишется в виде Ρ (г1? х, d) * Ρ (τ2, χ, <S) = Ρ (хг + τ2, χ, «). (21) Другой ряд специальных случаев мы получаем при введении специальных предположений относительно множества 5( элементарных состояний х. Здесь различают случаи конечных или счетных множеств 5(; в непрерывном случае классификация производится по числу параметров, определяющих состояние системы. На разграничении таких отдельных случаев и основано подразделение дальнейшего материала. § 4 ЭРГОДИЧЕСКИЙ ПРИНЦИП Не прибегая к специальным предположениям относительно множества 3t всех возможных состояний х, мы можем доказать лишь несколько общих теорем, а именно теоремы, связанные с эргодиче- ским принципом. Говорят, что стохастический процесс подчинен эргодическому принципу, если для любых £(°), х, у и (S lim [P (t(°\ x, f, «) - Ρ (f<°>, г/, t, «)] = 0. (22a) t—»oo Для схемы с прерывным временем условие (22а), очевидно, эквивалентно следующему: lim[Pmn(x,S)-Pmrl(2/,(S)] = 0; (226) П—>Х) в этом последнем случае имеет место следующая Теорема I. Если для любых х, у и (S Рп(*,е»КРп(у,ъ), λη>ο, (23) и ряд Σ К (24) 71=1 Расходится, то эргодический принцип (226) выполняется и в формуле (226) мы имеем равномерное относительно х, г/, (S приближение к пределу. См. первую из статей, указанных в сноске 2.
70 9. Об аналитических методах в теории вероятностей Доказательство. Пусть будет sup Ры (χ, β) = Мы (в), inf Ры (х, в) = ты (в). Для i<ik имеем, очевидно, Рщ{х, Щ= I Р*п(у, в)Л*(*. <г«)<мЖВ4в) J i>tt(x, d5t)=iwftn(g) (25) и аналогично Pin (χ, б) > mto (β). (26) В силу неравенства (23) для любых χ и у имеем Рь (х, S) - %kPk (у, S) > 0, Р*-1, „(*. β) = 5 /V (2, S) i>t (X, d4) = = 5 P,„ (г, β) [Pk (χ, аЩ - KkPk (y, d*)] + + Кк^Ркп(г,ЩРк(у,аЩ> «, > ты(«) Ι [Ρ, (*, d%) - XkPk(у, d%)] + λ^.χ, п(у, в) == «, = mfcn(6) (1 - λ») + λΛ-ι,»(ΐ/, в), Ръ-ЫУ, «) ~ P»-i.n(«, в)< (1 - λ») [Pk.i, „(у, β) - mftn (в)]; отсюда в силу (25) P*-i.n(y, Щ ~ Рн-1,п(х, в) < (1 - λ,) [МЛп(в) - ткп(в)]. (27) Поскольку (27) справедливо πρίΊ любых χ ж у, мы имеем также Мк_,, п(Щ - щи, „(S) < (1 - λ,) [Mkn (в) - mRn (в)], (28) Полагая в (28) последовательно к = т--\- 1, m + 2, . . ., /г и перемножая затем все полученные неравенства, находим η Мтп(Щ-ттп(Щ^ Π (1 — λ»). (29) 7c=m+l Правая часть в формуле (29) при η ->■ оо стремится к нулю; тем самым наша теорема доказана. В случае однородной схемы с прерывным временем имеет место следующая
Р. Об аналитических методах в теории вероятностей 71 Теорема П. Если для любых х, у и(£ Р{хЛ)>№{УЛ) (λ>0), (30) то Рп (#> @) равномерно сходится к некоторой определенной функции распределения Q (S). Доказательство. В настоящем случае имеем Мп, п+р (Щ = sup Рр (χ, в) = Мр (в), тп, п+р (в) = inf Рр (л:, в) = тр (в), λη = λ, и на основании неравенства (29) ^ρ(β)-^Γ(β)<(1-λ)'. (31) Но из (25) и (26) вытекает, что для q^> p имеют место неравенства Р* (х, С) = Poq (χ, С) < Мы q (β) = ΑΓρ (β), (32) Ρ' {χ, β) > тр (β); (33) поэтому Жр (β) > Mq (β) > mfl (β) > mp (β). (34) Из неравенств (31) и (34) непосредственно вытекает справедливость доказываемой теоремы. Важные частные случаи теоремы II были доказаны Гостинским и Адамаром б. Функция распределения Q (S), как показано в этих частных случаях Адамаром, удовлетворяет интегральному уравнению 0(«)= \P(x,*)Q{dX). . (35) В случае наиболее общей стохастически определенной схемы имеет место Теорема III. Если для некоторой последовательности to < h < . . . < tn < . . . ->- оо и любых х, у и (S €»^i>(i„_i,»,<n,6). λ„>0, (36 оо и ряд 2 *кп расходится, то эргодический принцип (22а) выполняет^ ся и сходимость в формуле (22а) равномерна относительно х, у, S. Б С. г. Acad. sci. Paris, 1928, vol. 186, p. 59; 189; 275.
72 9. Об аналитических методах в теории вероятностей Доказательство. Пусть при данном £(°> sup Ρ (#°>, я, ί, β) = Μ (f, β), inf Ρ (ί(°), ж, ί, g) = τη (ί, β). Бели *(0)<*m<*n<*<*n4l, то таким же путем, как при доказательстве теоремы I, мы получаем аналогичную (29) формулу η Jlf (*,€)-/»(*,€)< Π (1-λ,.)· fc==m-}-l Так как η безгранично возрастает вместе с t, то разность Μ (t, (S) — — πι (ί, (S) стремится к нулю при t. —>· οο, что и доказывает нашу теорему. Наконец, в случае однородной во времени схемы справедлива аналогичная теореме II Теорема IV. Если существует такое а, что при любых х, у, (S Ρ (σ, χ, <S) > λΡ (σ, у, β) (λ > 0), (37) то Ρ (τ, χ, β) при τ —>· οο равномерно сходится к некоторой определенной функции распределения Q (S). Глава II КОНЕЧНЫЕ СИСТЕМЫ СОСТОЯНИЙ § 5 ПРЕДВАРИТЕЛЬНЫЕ ЗАМЕЧАНИЯ Мы будем теперь предполагать, что множество % образовано из конечного числа элементов В этом случае полагают Ρ (flf хи tz, xj) = Ри {tu ί2). (38) Так как для любого множества (S будет, очевидно, P(tuxuU,V)= S Piuih.hl (39) *лсв то мы можем ограничиться рассмотрением вероятностей Рг-7- (£1? t2)· Фундаментальное уравнение (3) принимает теперь вид ΣΛ,·(*ι, fc) Р#(*а, h)=Pih (*i, t9), (40)
9. Об аналитических методах в теории вероятностей 73 тоГда как уравнение (1) представляется в форме %Pij(tut2)=i. (41) д Любые неотрицательные функции Pij (£1? t2), удовлетворяющие условиям (40) и (41), определяют некоторый стохастически определенный процесс изменения системы @. Оператор определяется в данном случае следующим образом: F№ = F^*F^ = 2F^F^, (42) 3 вследствие чего фундаментальное уравнение (40) приводится к виду Риг (*ι, ω * Pik (t2l t3) - Pilt (tu i8). (43) В случае схемы с прерывным временем полагаем Вероятности Р$ удовлетворяют при этом уравнению Σ^=1. (44) 3 и, обратно, произвольные неотрицательные величины Р^, удовлетворяющие этому последнему уравнению, можно рассматривать как соответствующие значения вероятностей в некотором стохастически определенном процессе. Вероятности Р^я) при этом вычисляются по формуле ) ^ = Р%'\Р^*...*Р^. ■ (45) В случае однородной схемы с прерывным временем имеем pip) ρ p(PQ) Г Ρ Ψ~ρ РЯ~Р Если все величины Ptj положительны, то, очевидно, выполняются условия теоремы II § 4 и, следовательно, Р% стремится к некоторому пределу Qh когда q->· оо. Интегральное уравнение (35) в нашем случае преобразуется в систему уравнений Qi=%Q}Pji (i = l,...,«). (46) 3 Эти результаты были получены Гостинским и Адамаром ^. 6 См. сноску 5.
74 9. Об аналитических методах в теории вероятностей § 6 ДИФФЕРЕНЦИАЛЬНЫЕ УРАВНЕНИЯ НЕПРЕРЫВНОГО СТОХАСТИЧЕСКОГО ПРОЦЕССА На основании формулы (11) имеем 2>„(f,i) = l, P\j(t,t)=Ot ιφ). (47) Если изменения нашей системы @ возможны в любой момент времени £, то естественным является предположить, что lim Ρ и (tf t + Δ) = 1, lim Pu (i, t + Δ) =0, i φ}, (47a) Δ—*οο Δ—>0 т. е. что для малых интервалов времени и вероятность изменения состояния системы мала. Это предположение содержится в гипотезе непрерывности функций Ptj (£1? t2) относительно £х и t2. Допустим теперь, что функции Ptj (s, t) непрерывны и при t φ s допускают производные по t и s. Дифференцируемое™ этих функций при t = s мы не требуем. Было бы неосторожным предполагать a priori существование производной в этих особых точках 7. Для t ^> s имеем 9Ра^ *>. = lim Ptt(fi,t + b)-Plt(;t) = dt д^о Δ-*0 .-^ . Если определитель s = ι j>„ (*, ί) ι отличен от нуля, то уравнения \П P.b(i, ί + Δ) Ρ^ (ί, ί + Δ) — 1 (ΐ — 1,..., η) могут быть разрешены: λ,.,. P., ii. *4-Δ^ Λ., Ρ,^,ί + Δ)-! _ Λ»* Pjk{t,t + A)} _ Ajk Так как aik на основании (48) стремятся к предельным значениям dPik (s, t)/dt, когда Δ ->■ 0, то и величины (49) будут при этом стре- 7 Ср. с рассматриваемыми в гл. IV функциями F (s, x, t, у), которые для t = s необходимо имеют точки разрыва.
9. Об аналитических методах в теории вероятностей 75 миться к определенным пределам 8 /> U, t + Δ) - 1 lim■***' / = 4tt(0, (50а) р.т (г, *4-Δ) lim-^-τ ^=^С0. /#*· (506) Что определитель Ξ при надлежащем выборе s < £ действительно может быть отличен от нуля, видно из соотношения lim S ~ 1, (51) которое выполняется в силу равенства (47) и непрерывности Ξ. Из (48) и (50) непосредственно получается первая система дифференциальных уравнений для функции Ρί1ζ (s, t): aPnu'η - Σ Α* {t) Pi*>t]=Pu & t]*Ai*{t)- (52) i При этом в силу (47) и (50) Г дР.. (t. и) 1 •M-^L· (53) АЛ>0Л ]фк, 4fcft<0, (54) а в силу (41) и (50) Σ4* = 0. (55) ) Уравнения (52) были установлены лишь при гипотезе s <^ £; однако формулы (47) и (53) показывают, что эти уравнения сохраняют силу также и для t = s. Для s <i t. мы имеем, далее, -*(S' ° = lim· ^ (S + Δ' 0 ~ Р*('* ° - А* ds δ-* Δ ΓΡ..(β, s + Δ) — l = -lim " д ' Pik(s + M) + +Ef"(a,:+|>>^(»+A,t)] <56) 8 Можно было бы поступать и наоборот: предположить a priori выполнение условий (47а) и (50) и вывести отсюда непрерывность и дифференцируемость функции Pij(s,t) по и
76 9. Об аналитических методах в теории вероятностей и получаем в силу (50) вторую систему дифференциальных уравнений = ~ ΣЛУ^ Р*к (*' ^ = — Л ** (5)*Pife (5' '>· (57) j Если функции Atj (s) непрерывны, то уравнения (57) имеют место, очевидно, и для s = t. Положим теперь, что для момента времени t0 известна функция распределения Q(to,Xid = Q*(to), 2iQn(to) = % k вероятностей того, что система @ в момент t0 находится в состоянии хк. Уравнение (5) в данном случае принимает вид Q* (0 = IlQi (h) Pik (h, t). На основании (52) функции Qk (t) будут удовлетворять дифференциальным уравнениям -^1=21^(0^(0 (Л = 1,...,л). (58) j Если функции Aik (t) непрерывны, то функции Pik (s, t) образуют единственную систему решений уравнений (52), удовлетворяющую начальным условиям (47); следовательно, рассматриваемый стохастический процесс вполне определяется заданием всех Ailt (t). Реальный смысл функций A ik (t) можно пояснить следующим образом: для i Φ k Ailt (t) dt представляет вероятность перехода из состояния Χι в состояние хк за время от момента t до момента t + dt, в то время как Akk(t) = - %Akj(t). Можно также показать, что если заданы какие угодно непрерывные функции Aik (t), удовлетворяющие условиям^ (54) и (55), то решения Pile (s, t) дифференциальных уравнений (52) при начальных условиях (47) будут неотрицательны и удовлетворяют условиям (40) и (41), т. е., другими словами, определяют некоторый возможный стохастический процесс. Действительно, в силу (52) и (55) мы имеем -ε-£*«(*. *)=Σ [ΣΑ^] Pij{s> t)=0> (59) а так как на основании (47) Те то из (59) следует соотношение (41).
9. Об аналитических методах в теории вероятностей 77 Положим, далее, для ^ < ί2 Р\к (h, t) = Ptic (h, t), если tt < t < t2, (60) P» (ii, t) = 2 ^ij (<i. *s) P# (<i, <). если h < t. (61) i функции Pat (ίχ, ί) непрерывны и удовлетворяют дифференциальным уравнениям (52), следовательно, равенство (60) справедливо для всякого t, а не только для t *ζ t2; но тогда формула (61), если положить в ней t = t3, совпадает с (40).ι Остается показать, что решения Pik (ίχ, t) неотрицательны. С этой целью полагаем, что при фиксированном s ψ (t) = min />ifc (5, f).| При надлежащем выборе i и & мы будем, очевидно1 иметь и если ψ (ί) <J 0, то на основании (54)1 А*ъ (t) Ρ* (*, t) > 0, Л Л (ί) />« (*, ί) > 4rt (ί) ψ (ί), j φ k, j Так как ψ (s) V= 0, то легко видетьг что ψ (t) будет больше любого отрицательного^решения уравнения dyldt = R (t) у, а, следовательно, само не должно быть отрицательным. § 7 ПРИМЕРЫ В схемах, однородных во времени, коэффициенты А^ (t) представляются независимыми от времени t; процесс в этом случае вполне определяется п2 постоянными величинами Aile. Уравнения (52) принимают при этом вид dP., (Л νπ —^ = Д^«*«(0; (62) j решение этих уравнений не представляет затруднений. Если все величины Aik отличны от нуля, то имеют место условия теоремы IV
78 9. Об аналитических методах в теории вероятностей § 4 и, следовательно/ Pik (t) стремится к определенному пределу Qk, когда £->■ оо. Величины Qk удовлетворяют уравнениям ΣΛ = 1. Σ^*& = 0 (ft=l л). Пусть, например, η = 2, Л12 = Л21 = А, Л ц = Л22 = —Л, т. е. вероятности перехода из состояния хг в состояние х2 и обрат* ного перехода из х2 в a?j одинаковы. Дифференциальные уравнения (62) для нашего случая дают Рп (0 = Рп (*) = V* (1 - ег*л*)ж Ри (t) = Р22 (t) = Va (1 + е-^). Мы видим, что Pik (t) при £ ->· оо стремится к предельному значеник> Qk = V2. Следующий пример показывает, что приближение к пределу может сопровождаться затухающими с течением времени колебаниями: η = 3, А12 = Л28 = ^81 = Аш А21 = ^82 = ^13 = 0,: Аг1 = Л22 = ^88 = —А; Ρ11 (t) = Р22 (t) = Р38 (ί) = -f- е"8М* C0S «* + Τ" ' Pia(0 = ^28(0 = ^si(ί) = *-*/·* (-i=-sinai J-cosai) +4-· Λί (0 = ^82 = Pi» (t) = — β-ν,Αί /* sin otf + -J" C0S °^ ) + Χ · Аналогичные затухающие колебания для схем с прерывным временем были обнаружены Романовским.
9. Об аналитических методах в теории вероятностей 79 Глава III СЧЕТНЫЕ СИСТЕМЫ СОСТОЯНИЙ § 8 ПРЕДВАРИТЕЛЬНЫЕ ЗАМЕЧАНИЯ. ПРЕРЫВНЫЕ СХЕМЫ В случае, когда % состоит из счетного множества элементов #1» #2» · · ·» *^п» · · ·» сохраняют силу все обозначения и все результаты § 5 прошлой главы. Сходимость рядов /с ft при этом предполагается, а отсюда уже выводится сходимость рядов (40), (42), (46); напротив, мы не требуем, чтобы ряд г был сходящимся. Мы сделаем теперь лишь несколько замечаний по поводу схем € прерывным временем, и именно однородных. Условия наших теорем, касающихся эргодического принципа, для схем со счетным множеством состояний в большинстве случаев не выполняются, но, несмотря на это, самый принцип зачастую оказывается выполненным. Рассмотрим, напримерг игру, исследованную недавно С. Н. Бернштейном: в каждой отдельной партии игрок выигрывает один рубль с вероятностью А и проигрывает такую же сумму с вероятностью В (В > А, А + В^1) — последнее, однако, лишь при том условии! что его денежная наличность не равна нулю; в противном случае он не проигрывает ничего. Если через хп обозначить такое состояние, в котором капитал нашего игрока составляет η — 1 рублей, то условия игры запишутся следующим образом: "п,п+1 — <"» Рп+1,п == В [П = 1, 2, 3, . . .), Р1г = 1-А, Рпп = \-А-В (га = 2, 3, 4,...), Pij = 0 во всех остальных случаях. Легко доказать, что ίϊΉ·-4)(4Γ-<!* ZQ>=i· откуда и следует выполнение для данного случая эргодического принципа.
80 9. Об аналитических методах в теории вероятностей Заметим, что из факта существования пределов lim Р% = Л, р—оо лишь в том случае вытекает эргодический принцип, если сумма Σλ,.=λ о равна единице. Можно было бы показать, что всегда Л^ 1 и что в случае Л < 1 эргодический принцип не может иметь места. Если все Aj существуют и равны нулю, то возникает вопрос об асимптотическом выражении для Р^ при ρ ->· оо. Если такое выражение возможно независимо от i: Р% = Ц + о (λ?), то говорят, что выполняется локальный эргодический принцип. Этот последний должен иметь, по-видимому, большое значение для случая счетного множества возможных состояний. Пусть теперь возможные состояния χ будут перенумерованы с помощью всех целых чисел (— оо < η < + °°)· Все обозначения и формулы § 5 при этом сохраняются с той разницей, что знаки суммирования распространяются теперь на все целые числа. Рассмотрим подробнее случай Р.. = Р? Очевидно, что в этом случае будет также р?} = PU рг1=2 pfPU РГп=Σ PTPU- i i Если ряды Тс Τι абсолютно сходятся, то возникает вопрос об условиях приложимости обобщенной формулы Лапласа (ft-yg)* Pl=—j=e ^ +0(-JL). (63) b]f2np Klip) Мы знаем только, что она имеет место для случая Бернулли, когда Р0 = 1-А, Рг = А, (64) а все остальные Рн обращаются в нули.' Теорема Ляпунова для нашей проблемы не дает ничего, как это можно заключить из следующего примера:
9. Об аналитических методах в теории вероятностей - 8Г котором формула (63) неприменима. Для действительности форму- 1Ь1 (63) вообще необходимо 9, чтобы для всякого целого т существовало такое &, при котором выполнялись бы условия кфО (mod /n), РцфО. Заметим еще, что только в случае а = 0 формула (63) при заданном к действительно дает асимптотическое выражение для Р%. В этом случае из (63) вытекает, что при заданном Χ-ΐΤεΐ + 'Ш (65)' и при заданных ί и / В силу (66) в рассматриваемом'случае мы получаем эргодический принцип. Приближенные формулы совершенно особого рода мы получаем для Р?;· в том случае, когда вероятности Piiy т. е. вероятности неизменяемости состояния системы в каждый отдельный момент, весьма близки к единице. Например, в случае Вернул ли (64) при малых значениях А может быть применена приближенная формула Пуассона ^~4г^· (67> Общий метод для вывода подобных формул получается путем применения дифференциальных уравнений непрерывных во временв процессов, как это будет показано в § 10 для формулы (67). § 9 ДИФФЕРЕНЦИАЛЬНЫЕ УРАВНЕНИЯ χ НЕПРЕРЫВНОГО ВО ВРЕМЕНИ ПРОЦЕССА Как и в^§ 6, мы предполагаем, что функции Ptj (s, t) непрерывны и при t φ s имеют производные по t и s. Формулы (48) и (56) в рассматриваемом случае счетного множества возможных состояний остаются по-прежнему справедливыми; но чтобы доказать возможность перестановки в этих формулах операций суммирования и предельного перехода и прийти таким путем к дифференциальным уравнениям (52) и (57), нам придется ввести новые ограничительные условия, а именно предположить: A. Существование предельных значений (50). B. Равномерность сходимости в (506) относительно / при заданном к. Подробнее по этому вопросу см.: Mises R. von. Wahrscheinlichkeitsrech- unS· Berlin, 1931. Глава о «локальной» предельной теореме.— Примеч. авт. К ласт. пер.
$2 9. Об аналитических методах в теории вероятностей С Равномерность сходимости ряда 2j Δ Δ (68) по отношению к Δ (что этот ряд сходится, следует непосредственно из (41)). В § 6 для случая конечного числа состояний мы доказали условие, основываясь на свойстве дифференцируемости функции Ptj (s, t) при t Φ s; напротив, в случае счетного множества состояний это условие, по-видимому,; из указанного свойства функцри Ptj еще не вытекает. По поводу условия В заметим, что равномерность сходимости в (506) по отношению к к при заданном j следует из очевидного неравенства Ρ Λ (ί, t + Δ)< 1 - Pjj (f, t + Δ). Заметим, далее, что мы не требуем равномерности сходимости в (506) для любых j и к, равно как и равномерности сходимости в (50а) по отношению к к; такие требования были бы неудобны для приложений. Поскольку множители Ptj (s, t) в формуле (48) образуют абсолютно сходящийся ряд, мы можем на основании условий А и В произвести в этой формуле перестановку знаков lim и Σ и получить таким путем дифференциальные уравнения (52). При этом, очевидно, величины Ajk (t) удовлетворяют формулам последнего условия, а также из равномерной ограниченности множителей Р$ (s -f- Δ, t) следует возможность перестановки знаков суммы и предела в формуле (56), что является достаточным для вывода дифференциальных уравнений (57). § ю ОДНОЗНАЧНОСТЬ РЕШЕНИЙ И ИХ ВЫЧИСЛЕНИЕ ДЛЯ СЛУЧАЯ ОДНОРОДНОГО ВО ВРЕМЕНИ ПРОЦЕССА В данном случае уравнения (52) принимают вид dP., (t) ¥-ι —|ll = £ Α#Ρυ (t) = Pik (0* Α№, (69) 3 причем Ajk — постоянные. Мы докажемж что в случае сходимости рядов Σ \Ajic I = ft » j Σ Bj I ^ # I = ft » \ (70).
9. Об аналитических методах в теории вероятностей 8^ BiLx\ Л=1, 2,..., |*|<θ(>0), (71> и при наличии начальных условий Ριι (0) = 1, Лу(0) = 0, i#/, (72> уравнения (69) допускают единственную систему решений Pik (t)f удовлетворяющую условиям нашей задачи. Действительно, поскольку всегда Ри (t) < 1, мы получаем из (69) и (70) неравенство следовательно, уравнения (69) можно дифференцировать почленног *Р№«) _γ JPi}(t) d Аналогичным образом получаются общие соотношения -4Лк(0|<4п), (73> at I jn+1 Ρ«(ί) = ^·^«(ί)·^«. (74) dtn+i mn N' dt Из (73) и предположенной сходимости рядов (71) следует, что» функции Ρί1ζ аналитические. Далее, на основании (69) и (74) мы находим ■£гР*У)=Рар)*[Аа]1; (75) в частности, для t = 0 имеем на основании (72) ■£nPik(0))=[Ai1c]l, (76) at ^Jy откуда следует, что аналитические функции Pik (t) определяются однозначным образом при помощи постоянных Αί1ς. Формулы (76) и (75) служат вместе с тем и для вычисления решений системы (69) с помощью рядов Тейлора. Например, если At,t+i = А,] Аи = —Л, Atj = 0 во всех остальных случаях, мы легко получаем / А*\п~т Pmn(t)= .{At) .. er*\ n^m, -Pmn (0 = 0, т > П,
S4 9. Об аналитических методах .в теории вероятностей т. е. формулу распределения Пуассона; для к = η — т, ρ = t полученная формула совпадает с формулой (67). Если имеет место эргодический принцип и Pik (t) при t ->- оо стремится к Qk, to, очевидно, постоянные (?fe будут удовлетворять уравнениям Σ& = 1, 5Uift<?i = 0 (Λ = 1, 2,...). (77) к i Если, например, Aiti+1 = A, Ahl,,=B, 5>4, Au = -A, Att = -(A+B), ί>1, A a = 0 во всех остальных случаях, то из уравнений (77) без труда найдем Оп = (1 - А/В) (Α/Β)η-Κ В качестве второго примера положим Atlt+1=*A, Ai+lti = iB, Аи = -A -(i-i)B, Atj = 0 во всех остальных случаях. Уравнения (77) дают здесь т. е. опять формулу Пуассона. Глава IV НЕПРЕРЫВНЫЕ СИСТЕМЫ СОСТОЯНИЙ, СЛУЧАЙ ОДНОГО ПАРАМЕТРА § 11 ПРЕДВАРИТЕЛЬНЫЕ ЗАМЕЧАНИЯ Пусть теперь состояние рассматриваемой системы определяется значением некоторого действительного параметра х\ в данном случае буквой χ мы обозначаем как самое состояние системы, так и соответствующее этому состоянию значение параметра. Если @у — множество всех тех состояний х, при которых χ ^ у, то мы полагаем Ρ (tlt x, t2, <£y) = F (tlt x, f8, y). F (tl9 x, t2, у) как функция от у представляется монотонной и непрерывной справа и, кроме того, удовлетворяет граничным условиям F (*!, х, *2,- оо) = О, F (tl9 χ, t2, + оо) = 1. (78)
9. Об аналитических методах в теории вероятностей 85 Для функции F (tx, х, t2J у) фундаментальное уравнение (3) преобразуется в следующее: оо F(h, х, h, z)= J F(tt, у, U, z)dF(h, χ, h, у). (79) —ОО' j\tbi возвращаемся, таким образом, к пользованию интегральными функциями распределения случайных величин и к интегралам Стил- тьеса в обычном смысле. Интеграл (79) по Лебегу 10, наверное, существует, если F (t2, ζ/, /3, ζ) измерима относительно у в смысле Бореля. В дальнейшем мы будем предполагать, что система $ (см· § 1) совпадает с системой всех борелевских множеств, откуда вытекает измеримость по Воре- лю F (tl9 #, t2, у) как функции х. При этом, как известно, аддитивная функция множеств Ρ (ίχ, χ, t2, (£) для всех борелевских множеств S однозначно определяется с помощью соответствующей функции F fo, χ, ί2, у). Мы назовем нормальной функцией распределения монотонную и непрерывную справа функцию F (у), удовлетворяющую условиям F (- оо) = О, F (+ оо) = 1.| Если F± (χ, у) и F2 (х, у) как функции χ измеримы по Борелю, а как функции у являются нормальными функциями распределения, то то же самое имеет место и для функции оо F(x, y) = F1(x, y)Q)F2(x, y)= J Ft(z, y)dF1(x, z). (80) —оо Этот оператор ©, подобно *, подчиняется сочетательному закону; пользуясь им, можно фундаментальное уравнение (79) изобразить в виде F (*ι, *, h,y) = F (tu x, t2, у) Э F (ί2> я, fs, */)· (81) Если F^x, у) = V1 (у — χ), F2 (x, у) = V2 (у — χ), то будем иметь, как легко вычислить, Ρχ (*, У) θ F2 (x, y) = V(y-x) = V1(y~x)Q V2 (у - χ), (82) где оо V(x) = Vi(x)'QVt(x)= I V2(x-z)dV1(z). (83) —оо Для оператора О также имеет место сочетательный закон, а в случае нормальных функций распределения, кроме того, и закон перемес- Лебег А, Интегрирование и отыскание примитивных функций/Пер. с
86 Р. Об аналитических методах в теории вероятностей тительный; если рассматривать Vx (χ) я V2 (х) как функции распределения для двух независимых случайных величин Хг и Х2, то V± (χ) ζ) О V2 (x), как известно, представляет функцию распределения для суммы11.* = Хг + Х2. В том случае, когда F (tl9 x, t2, у) как функция у абсолютно непрерывна, мы имеем у F{h, *, h, y)=l f(h, x, h, y)dy. (84) —oo Неотрицательная функция / (tu χ, t2, у) при этом измерима в смйсле Бореля относительно аргументов х, у и удовлетворяет уравнениям оо J f(h, х, Ь, у) = 1, (85) —оо оо /(*i, χ, t3, z)= 5 f(tu x, t2, y)f(t2, ι/, h, z)dy. (86) —oo И обратно, если указанные условия для / (tu χ, ί2, у) выполняются, то функция F (tu χ, t2, у), определяемая формулой (84), удовлетворяет соотношениям (78) и (79); следовательно, такая функция / (tlf х> ^2> У) определяет схему некоторого возможного стохастического процесса. Эту функцию / (£ь х, t2, у) мы назовем дифференциальной функцией распределения для случайной величины у. Мы отметим еще следующие смешанные формулы: оо F(h, χ, ta, z)= J F(ti7 у, is, z)f(h, x, h, y)dy, (87) —oo oo f(h, x, h, z)= 5 f(t,, y, h, z)dF(ti, x, h, y). (88) —oo В случае прерывной во времени схемы рассматривают функции Fmn (х, У) = F (tm, χ, tn, у), Fn (χ, у) = F^ljn {x, у), которые удовлетворяют уравнениям Fm,n+i fa У) = Fmn (х, У) Θ Fn+1 (x, у), (89) F*n (х, У) = Fkm (x, у) 0 Fmn (χ, у) (k<m< n). (90) Если У Fmn(x, У)= $ fmn(x, y)dy, fn(x, y) = fn-i,n(x, У), 11 См., например: Levy P. Calcul des probabilites. Paris, 1927, p. 187.
Р. Об аналитических методах в теории вероятностей 87 то имеем, кроме того, со /m>n+i(a, z)= $ fmn(x, y)fn+i(y, z)dy, (91) —CO CO Ы*. z) = § /*m(*. ytfmniy, z)dy (&<><». (92) —CO § 12 МЕТОД ЛИНДЕБЕРГА. ПЕРЕХОД ОТ ПРЕРЫВНЫХ СХЕМ К НЕПРЕРЫВНЫМ Как было отмечено в § 3, теория вероятностей обычно.занимается лишь схемами, прерывными во времени. В случае таких схем основная задача заключается в нахождении приближенных выражений для распределений Fmn (χ, у) при больших значениях разности η — — т или, что по существу одно и то же, в построении асимптотических формул для Fmn (χ, у) при п-*- оо. Важнейшим результатом, достигнутым в этом направлении, является теорема Лапласа—Ляпунова. Мы рассмотрим теперь подробнее данное Линдебергом доказательство этой теоремы 12, имея в виду выяснить в возможно более общей форме основную его мысль и получить таким путем общий метод построения асимптотических выражений для Fmn (x, у). Пусть будет Fn(*, V) = Vn(y — x), оо оо ап(х)= I (y — x)dFn(x, у) = J ydVn(y) = 0, —оо _оо оо с» ЬЦ*)= I {y-xfdFn{x, y)= J y*dVn{y) = b\, —оо —оо Втп = bm+i + Ьт+2 + ...-(- Ьп\ теорема Лапласа—Ляпунова утверждает, при известных дополнительных предположениях, что при неизменном πι и неограниченно растущем η имеет место равномерно относительно χ л у соотношение Fmn(x, У) = ф(.УЛ-\ +0(1)| \ тп ) где г —оо 12 Math. Ztschr., 1922, Bd. 15, S. 211.
88 9. Об аналитических методах в теории вероятностей Наряду со стохастическим процессом с прерывным временем, определяемым функциями Fn (χ, ζ/), мы будем рассматривать еще и другой — с непрерывным временем; пусть он характеризуется функцией Положим, далее, £0 = U, tn = -ООП» Fmn(x, y) = F(tm, z, tn, У), Fn(x, y) = Fn-itn(x, У)· Мы имеем, очевидно, оо ап{х)= ^ (y — x)dFn{x, у)=0, —оо оо b2n(x)= \ (y — xfdFn(x, у) = Ы; —со при этом первый и второй моменты ап (х) и Ъп (х) распределения Fn (#» У) совпадают с соответствующими моментами ап (х) и Ьп (х) распределения Fn (x, у). Основываясь на этом последнем обстоятельстве, Линдеберг доказывает, что разность (х, у) — Fmn (x, у) стремится к нулю, когда η ->■ оо, после чего теорема Лапласа—Ляпунова непосредственно вытекает из очевидного равенства Ртп(х, У) = Ф(1]Г±)· \ тп / В общем случае произвольных функций Fn (x, у) мы можем также применить метод Линдеберга, если только нам будет известна такая функция F (t\ χ, t", у), которая характеризует непрерывный стохастический процесс и для некоторой последовательности моментов времени t о <Ζ ίχ ^^ ?2 "^ · · · "^ ^п "^С · · · дает моменты ап (х) и Ъп (х), совпадающие с ап (х) и Ъп (х) или близкие к ним. Общий метод для построения таких функций F получается применением дифференциальных уравнений непрерывных процессов, которые будут рассмотрены в следующих параграфах. Для перехода от F к F может служить следующая __ Теорема перехода. Пусть функции Fn (x, у) и Fn (x, у) определяют два стохастических процесса с прерывным временем.
9. Об аналитических методах в теории вероятностей 89 Если оо w ^ (y — x)dFn{x, у) = ап(х), ^ (y — x)dFn(z, у) = ап(х\ (93) σο %~ ξ {y-xfdFn{x, у) = Ы(х), J (y-xfdFn(x, у) = ЪЦх), (94) ξ |ί,-*|«<Η7η(ί!, y) = cn(«), J |у-ж|»^„(ж, ») = ся(ж), | а„(ж) — о„ (ж) К рл, | Ъп (х) — Ь% {х) | < qw С-п (*) < Гп, и если существует такая функция R (χ), что R (х) = 0, когда χ <! О, О < Я (х) < 1, иогда 0 < χ < Ζ, i? (x) = 1, иогда Ζ <^ χ, и для оо Uни (х, z)= § R{z — y) dFkn {x, у) —оо выполняются неравенства (95) (96) (97) (98) (99) д* -b- ^*»ϋ*.z) I < *»" (*=°. l · · ·.w). wo имеет место соотношение Fon(x, У — 1) — гп<Рош(х, yXFonix, У + I) + εη, где (100) &Ϊ fc=l fc=l Для применения этой теоремы к тому случаю, когда моменты а \х), Ъ (х), с (х) при возрастающем χ не ограничены, часто оказывается возможным устранить эту неограниченность путем введения новой, надлежащим образом выбранной переменной х' = φ (χ).
UO 9. Об аналитических методах в теории вероятностей Доказательство теоремы перехода. На основании формулы (98) мы имеем Щ-1.п(х, y) = Fie-itn(z, y)®R{y — x) = =F*(*> йе^^ y)e...®Fn(z, y)®R(v—*)= = Fk{x, y)®Ukn(x, y) (101) и в силу (93) - (95), (99) ' OO £4-ι, η (x, У)= ] Uhn (2, у) dFk (χ, ζ) = OO OO = jj [#*n(*. y) + -^Ukn(x, y)^^- + OO + -^Ukn(x, y)^L+^Ukn(l y)i^-]dFk(x, z) = = Ukn (x, У) + -^ Ukn (x, y) ak (x) + + -gr иы (χ, у)Щ± +ΘΚ™ίψ-, Ι θ |< 1. (102) Полагая П-ι, η {х, у) = Ft (x, у) Θ Ubn (x, у), (103) получим аналогичную (102) формулу Vm-i, η {х, у) = i/fcn (х, У)+·^ Ukn (x, У) a* (*) + + -^иы(х,у)^Р-+Ш^^Р-, |θ|<1. (104) Из (102) и (104) на основании (96) и (99) следует', что | С*-ι, η (х, y)-V ,_!, п (χ, у) | < К™рь + ν^Λ + 7б^3) (г» + г»). (105) Пусть теперь Wkn (χ, у) = Fok (χ, у) φ Ukn (x, у) =] = Fi (х, У) © F2 (x, у) © . . . © Fk (x, у) ф Ukn {χ, у) = = F0, k_x (x, у) ф Vt.lt n (χ, у)·* (106) тогда в силу неравенства (105) мы будем иметь \W'jtn(x, y) — Wlc-.1,n(x, У)\ = = j F,t fc_i (χ, у) © F*_i, η (χ, у) — F0, ft_i (х, У) 0 t/*-i, η (ж, У) I <
9. Об аналитических методах в теории вероятностей 91 < jj \Vk-i, η(z, y) — Uk-Un(z, y)\dF0,k-i(z, z)< —oo <sup I V*.h n (z, y) - Uk-lt η (ζ, у) I < K(?pk + V«A#V* + + 4*K$)(rt + r]c). (107) \Wnn(x, y) = W0n{x, f/)|< Ho fc^i !c=i ϊΞϊ Wnn(x, y) = F0a(x, y)®R(y — x) = J Л(у —i)dF0„(af, z) —oo И oo W0l{x, y) = F0n(x, y)®R(y — x)= J R(y — z)dF0n(xt z); —oo принимая во внимание формулы (97), мы получаем У Wnn(x, у) < J dF0n(x, z) = FQa{x, у), —oo * У wnn (#, У + I) > 5 dF0n (χ, ζ) = F0n (ж, У) у —oo y-l Won (x, У)> I dFon (я, ζ) = Foa (х, У—I), —oo ) VV - WonWy + lX; ) dF0n{x, z) = F0n(x, y + l). Из (107) и (108) непосредственно следует формула (100). По поводу Деталей доказательства см. указанную выше работу Линдеберга. § 13 ПЕРВОЕ ДИФФЕРЕНЦИАЛЬНОЕ УРАВНЕНИЕ ?ДЛЯ НЕПРЕРЫВНЫХ ВО ВРЕМЕНИ ПРОЦЕССОВ Если для нашей системы @ изменение состояния возможно во всякий момент времени t, то естественным является предположение, что значительные изменения параметра χ в течение малых промежутков времени будут встречаться лишь очень редко или, точнее, что для
92 9. Об аналитических методах в теории вероятностей любого положительного ε будет Ρ (ί, χ, t + Δ, I у — χ Ι > ε) -*· 0, Δ -> 0. (109) По большей части можно предполагать, что и более узкое условие -f-co m»)(i, χ, Δ)= J | у —ж |р <*/■(*. ж, ί+Δ, »)->0, Δ->0, (110) — οο выполняется по крайней мере для первых трех моментов т?г(1), лтг<2> и #г(3). Общее исследование тех возможностей, которые возникают при этих предположениях, представляло бы значительный интерес; некоторые замечания по этому поводу читатель найдет ниже, в § 19. В ближайших параграфах мы, кроме того, предполагаем, что выполняется следующее важное условие: ^>(*,., Δ) д^а (111) т(2) (ί, χ, Δ) - Выполнение этого условия будет наверное обеспечено, если в определении 77г(3) (t, χ, Δ) по формуле (110) существенную роль при бесконечно малых Δ играют лишь бесконечно малые значения разности у —- χ или, точнее, если χ~\-ε J \v-x\*dF(t, χ, ί + Δ, у) χ—г J \y-x\*dF(t, x, ί + Δ, у) 1, Δ->0. (112) Только в этом случае, строго говоря, наш стохастический процесс будет непрерывным во времени. Из (111) вытекает также формула iw(2) (*, χ, Δ) *(ΐ> (ί, χ, Δ) -0, Δ-->0.] Наконец, мы будем еще предполагать, что для s Φ t существуют все частные производные функции F (s, x, t, у) до четвертого порядка и что эти производные при неизменных t, у равномерно ограничены относительно si&x для t — s ]> k ^> 0. Из формул (78) и (110) мы заключаем, что при s = t функция F (s, χ, t, у), напротив, необходимо разрывна. Функция f(s, х, t, y) = J-F{8, x, t, у), [(ИЗ) очевидно, удовлетворяет уравнениям (84)—(86) и при заданных t, у допускает для значений t — s ]> k ^> 0 равномерно ограниченные относительно s и t производные до третьего порядка. Все дальнейшие
9. Об аналитических методах в теории вероятностей 93 вычисления мы ведем применительно к этой дифференциальной функции распределения / (s, x, t, у). Положим оо a(t, χ, Δ)= J {y — x)f{t, χ, t + A, y)dy, (114) —эо оо b*{t, χ, Δ)= $ {y-xff{t, χ, t + A, y)dy = mM{t, χ, Δ), (115) —οο οο c(f, χ, Δ)= J |y_^|3/(i, χ, t + A, y)dy = mW(t, χ, Δ). (116) На основании (85) и (86) мы имеем оо /(5, #, *, #)= ^ /(5, я, s + Δ, z)/(s, Δ, ζ, *, y)cfe = — ОО оо = J /(s, χ, s + Δ, z)[/(s + A, ж, ί, у) + I 02 -C / , A * Ч (г — Я)3 дх* + + -^-/(5 + Δ, £, ί, y)^L]dz = = f(s + A, ж, ί, у) + -^-/(в + Д, χ, t, y)a(s, x, A) + + ·£/(« +Δ, χ, *, Ι/) »'<''*' Δ) +9-^1^-, |в|<С, (117) причем С дли 5 + Δ < τ < ί может быть выбрано независимо от Δ. Из (117) непосредственно находим J (s + Δ, χ, t, y)-f(s, хч t, у) __ Δ — = -У(* + Ьх^,у)^±- дх\ 92 *( ι Л * \ °2(S, Х, Δ) Ω С(*1 *, Δ) ~1^/(5 + Δ' *' f> У) 2Δ, ~θ ,6Δ ' Теперь мы предварительно докажем, что если определитель (118) Я(*. *, f, у', <·, у") = ±rf(s.x, f, У') i-f(s,x,f,y") дх д* тэт/(*. *> *. if) -эт/(». *.**./) дх* (119)
i)4 9. Об аналитических методах в теории вероятностей шри заданных χ и s не обращается в нуль тождественно для любых &'', у\ £", у'\ то отношения a (st #, Δ)/Δ и δ2 (s, χ, Δ)/2Δ стремятся к определенным предельным значениям A (s, χ) и Вг (s, χ) когда Δ ->■ 0. В самом деле, пусть £', г/', £", г/" выбраны так, что определитель «(119) отличен от нуля; в таком случае для любого достаточно малого Δ имеем также D (з + Δ, х, t\ у', *", у") φ 0, так что уравнения λ(Δ)^τ/(β + Δ, χ, f, /) + μ(Δ)^-/(5 + Δ, ж, Г, f) = 0, да яз (120) λ(Δ)-^ϊ-/(β + Δ, χ, V, у') +μ(Δ)^/(5 + Δ, χ, t", y") = l допускают единственное решение. При этом λ (Δ) и μ (Δ) при Δ ->· 0 стремятся к пределам λ (0) и μ (0). Далее, на основании (118) мы получаем λ /дч /(* + Д, *, *', ?') — /(*, х, t\ yf) + μ (Δ) /(* + Δ, *, Г, y*)-/(«, *, Г, у») = = _ »«ύ*,Δ) _(Q, + У) 'C^, Δ) . (121) Левая часть формулы (121) при Δ ->■ 0 имеет пределом Ω = λ(0)4-/(·, *, f, υ') + μ(0)-^ί($, χ, t°, yy, в правой же части в силу условия (111) второй член бесконечно мал по сравнению с первым, и, следовательно, этот член стремится к определенному пределу] ВЦ$Г s) = lim 68(%д' Δ) =-Ω. (122) Из (122) и (111) непосредственно вытекает, что с (*, χ, Δ)/Δ -> 0, Δ -> 0. (123) В силу формул (122) и (123) формула (118; при Δ = 0 переходит в следующую: Δ—0 02
9. Об аналитических методах в теории вероятностей 95^ Так как df (s, х, t, у)1дх не равно нулю тождественно при любых. / и г/ то будет существовать также предел . ,. а (s, χ, Δ) _ - df (s, χ, t, y)jd8 - В* (8, χ) δη (я, χ, t, y)jdx* fl24> -" df (5, x, t, y)/dx ' I ; Из (118), (122), (123) и (124) путем предельного перехода получается первое основное дифференциальное уравнение J--f(s, χ, ί, у) = — А (s, x)—-f(s, x,t, у) — OS -B2(s,x)-^f(s,x,t,y). (125) Когда определитель D (s, x, t\ y\ f\ у") обращается в нуль при любых значениях £', у', t", y'\ то пределы A (s, x) и В2 (s, x), вообще говоря, не существуют, как это можно видеть на следующем примере: / (*, *, t, у) = 9 Jg—- eriiWW-) (126> Δ у Τί [t — s) Здесь для х = 0 имеем Ъ2 (s, χ, Δ)/2Δ -*- + οο, Δ -* 0. Впрочем, можно было бы показать, что такие особые точки (s, x) образуют на плоскости s, x нигде не плотное множество. Реальное значение этих очень важных величин A (s, x) я В (s, х}> таково: A (s, χ) есть средняя скорость изменения параметра χ в течение бесконечно малого промежутка времени; В (s, x) есть дифференциальная дисперсия процесса. Дисперсия разности у — χ для интервала времени Δ будет b(s, χ, Δ) = 5(5, χ)γ2Κ + ο(γΈ) = 0{γΣ)\ (127) математическое ожидание этой разности таково: a (s, χ, A) =U (<?, χ,) А + о (А) = О (А). (128) Стоит еще отметить, что математическое ожидание тп(1) (£, х, А) величину \у — χ [ подобно дисперсии Ъ (s, х, А) есть величина порядка Υ А. Как будет показано в следующем параграфе, функции A (s, x) и В (s, χ) в некоторых случаях определяют однозначным образом нашу стохастическую схему. § 14 ВТОРОЕ ДИФФЕРЕНЦИАЛЬНОЕ УРАВНЕНИЕ В настоящем параграфе мы сохраняем в силе все требования, на· ложенные на функцию / (s, x, t, у) в предыдущем параграфе, и, кро- **е того, предполагаем, что / (s, xt t,y) допускает непрерывные произ-
96 9. Об аналитических методах в теории вероятностей водные до четвертого порядка. Тогда из (120) легко следует, что если определитель (119) не равен нулю, то λ (0) и μ (0) имеют непрерыв^ ные производные по s и χ до второго порядка; в силу (122) и (124) то же самое имеет место также для В2 (s, χ) и A (s, x). Пусть теперь для определенного значения t нам задан интервал а ^ У ^ b такой, что ни в одной из его точек определитель D (£, у} и\ ζ'', и", ζ") не обращается в нуль тождественно для любых и', ζ\ и", ζ". Пусть, далее, R (у) — некоторая функция, отличная от нуля лишь на отрезке а < у < δ, неотрицательная и имеющая ограниченные производные до третьего порядка. В таком случае мы имеем ь ъ S 4rf(s> *· г> y)R(y)dy= ΊΓ^^ χ> f> У)н(У)аУ = а а оо =lim4~ \ U(s,x,t + A,y)—f(s,x, t,y)]R{y)dy = —оо оо оо = Ит4"{§ R№ \ f(»,*,t,z)f{t,z,t + b,y)dzdy — —оо —оо оо — 5 /(*' х> f> y)R(y)dy} = lim— χ —оо ОО 00 x{jj f(s,x,t;z) jj f(t, z, t + А, у) [R(z) + R'(z)(y-z) + —ОО —ОО + д-(1) Jt^fiL + д*©-Ц^-] dydz- оо оо — \ f(s, χ, t, z)R(z)dz\ = \im-£- \ f{s,x,t,z)x —оо —оо X[R'(z)a(t,z,A) + R"(z)^^ + ei±^-]dz== оо =. 5 / (s, х, t, z) [R' (ζ) A (t, ζ) + R" (ζ) Β' (t, ζ)] dz = —оо b = 5 / (s, x, t, y) \R' (y) A (t, y) + R" (у) В* (t, y)] dy, (129) [ θ | < sup I IT (ξ) I. Предельный переход по Δ, совершенный нами при этом выводе, оправдывается тем, что а (£, ζ, Δ)/Δ, Ъ% (£, ζ, Δ)/2Δ и с (£, ζ, Δ)/Δ равномерно стремятся соответственно к пределам А (£, ζ), В2 (t, z) и О и что множитель /(s, x, t, z) имеет конечный интеграл по аргументу ζ.
9. Об аналитических методах в теории вероятностей 97 Интегрируя по частям, мы находим ь ь \/(s, х, *, у)R'(У) A (t, у)dy=-^-^r[f (s, х, t, у) А (*, у)]R(y)dy; а * а (130) точно так же с помощью двукратной интеграции по частям получаем ь ь J / («ρ, х91, у) R" (у) Я2 (f, y)dy=^-^[f (s, я, t, у) В* (t, у)] R (у) dy, а « (131) поскольку Д.(«) = R{b) = R' (a) = R' (b) = 0. Из формул (129)— (131) непосредственно следует равенство ? b α α + -gj- [£2 (i, i/) / (s, x, t, ?/)]} Д (г/) dy. (132) Но так как функция R (у) при соблюдении лишь указанных выше условий может быть выбрана произвольно, то мы легко убеждаемся, что для точек (£, у) с не равным тождественно нулю определителем D (t, у, и', ζ', и", ζ") имеет место также второе основное дифференциальное уравнение д г) ~etf(s,x, t,y)=, — — [A{t,y)f{s,x, t,y)] + + -^\B*(t,y)f(S,x,t,y)]. (133) Это второе уравнение мы также могли бы получить, не прибегая к первому, применяя непосредственно методы § 13; однако при этом на функцию / (s), χ, t, у) пришлось бы наложить новые, более тяжелые ограничения, которые мы здесь не будем приводить. Мы исходили бы в таком случае из аналогичной (118) формулы 1 — [f(s, х, t, y) — f{s, χ, t — Δ, y)] = οο = /(ί,ϊ,ί-Δ,ϊ)1[ jj И1-Δ, ζ, t,y)dz-i] + — °° οο + -Jff(s> x,t — Δ, !/)-i- jj f(t — A,z,t,y)(z — y)dz + —οο 4 Α. Η, Колмогоров
98 9. Об аналитических методах в теории вероятностей + -^f(s,x,t-A,y)^K- jj f(t-A,z,t,y)(z-yrdz + —оо оо + Ж J f(t-b,z,t,y)\z-y\*dz, (134) —оо затем мы доказали бы, что оо lim-i- ^ /(* — Δ, 2, f, y)|z —y|8<fe=0 *0 — ow и что существуют пределы оо lim4 ^ / С ~ Δ, г, <, у) | ζ - у |2 <Ζζ = В3 (ί, у), (135) Δ—О ^ — оо оо ' lim 4" \ f (* - Δ, ζ, ί, ?/) (ζ -y)dz — A (t, у), (136) Δ—0 J — σο оо lim 4- ( J / (t ~ Δ, ζ, t, у) άζ—ή = N (t, у), (137) — оо и таким образом получили бы наше второе уравнение в такой форме: -gf/(*> x> t> y) = N{t, y)f(s, χ, t, y) + + A(t, υ)-^ί(8, x, tsy) + B*(t, y)-^f(s, χ, t, y). (138) Чтобы обнаружить тождественность этого уравнения с найденным ранее, нам пришлось бы еще доказать, что В* (t, у) = Я2 (t, у), (139) A(t,y) = -A (t, У)+-^В* (f, у), (140) N{t, y)^-A(t, y)+^-B*(t, y). (141) § 15 ПОСТАНОВКА ВОПРОСА ОБ ОДНОЗНАЧНОСТИ И О СУЩЕСТВОВАНИИ РЕШЕНИЙ ДЛЯ ВТОРОГО ДИФФЕРЕНЦИАЛЬНОГО УРАВНЕНИЯ Для того чтобы с помощью дифференциальных уравнений (125) и (133) определить функцию / (s, x, t, у) однозначным образом, следовало бы, разумеется, установить те или иные начальные условия.
9. Об аналитических методах в теории вероятностей 99 Для второго уравнения (133) можно поступить следующим образом: согласно формуле (85) функция / (s, χ, t, у) для всякого t > s удовлетворяет условию оо 5 f(s,x,t,y)dy = i, (142) —σο а на основании (110) мы, кроме того, имеем оо 5 {y-xff(s,x, t, y)dy->0, t-*s. (143) —ос Основной вопрос относительно однозначности решений состоит в следующем: при каких условиях можно утверждать, что при заданных s и χ может существовать лишь единственная неотрицательная функция / (s, χ, t, у) переменных t, ζ/, определенная для всех значений у и t ^> s и удовлетворяющая уравнению (133) и условиям (142), (143)? В некоторых важных частных случаях на этот вопрос может быть дан положительный ответ; такими являются, например, все случаи, рассматриваемые в ближайших двух параграфах. Пусть теперь функции A (t, у) и В2, (t, у) будут нам заданы наперед; можно поставить вопрос о том, существует ли такая неотрицательная функция / (s, χ, t, ζ/), которая, с одной стороны, удовлетворяла бы уравнениям (85) и (86) (как было выяснено в § 11, эти требования необходимы для того, чтобы / (s, x, t, у) могла определять стохастическую схему), а, с другой стороны, после предельных переходов по формулам (122) и (124) приводила бы к этим заданным функциям Α (ί, у) и В2 (t, у). Для решения подобной задачи можно, например, сперва определить какое-либо неотрицательное решение нашего второго дифференциального уравнения (133), удовлетворяющее условиям (142), (143), а затем исследовать, является ли оно действительно решением нашей задачи. При этом возникают следующие два общих вопроса: i)\ при каких условиях существует такое решение уравнения 2) при каких условиях можно утверждать, что это решение действительно удовлетворяет уравнениям (85) и (86)? Существуют все основания полагать, что эти условия имеют достаточно общий характер. § 16 СЛУЧАЙ БАШЕЛЬЕ Мы примем теперь, что / (s, x, t, у) произвольным образом зависит от s и t, в остальном же является функцией разности у — х, т. е. что наш процесс является однородным относительно параметра: / (*, χ, t, у) = ν (s, t,y- x). ' (144) 4*
100 9, Об аналитических методах в теории вероятностей В этом случае, очевидно, A (s, £) и В (s, t) зависят только от s, так что дифференциальные уравнения (125) и (133) напишутся теперь в виде -зг = -.^->-зг +*"<'>-$ · (146> Для функции ν (s, t, z) из (145) и (146) получаются уравнения • -£-=^ <·>-£--*■<·>-£. <"*> -£- = -Л0)-£- + *<*)-£. (148) Уравнение (148) было найдено Вашелье 13, но, строго говоря, не было им доказано. Если имеем тождественно A (t) = 0 и В (t) = 1, то уравнение (133), соответственно (146), обращается в уравнение теплопроводности dfldt = d*fldy\ * (149) для которого единственное неотрицательное и удовлетворяющее условиям (142), (143) решение дается, как известно, формулой Лапласа / (*, х, t, у) = ' er<v-*W«t->m (150) У n(t — s) В общем случае мы полагаем s t х' = х — ^А (и) du, у'' = у — \А (и) du, а а s t ' s' = ξ В2 (и) du, *' = jj #2 {и) du. а Тогда уравнение (146) преобразуется в dfldt' =±= д2/%'2, а условия (142), (143) сохраняют дая новых переменных s', x, tr, у' тот же вид, что и для переменных s, x, t, у. Следовательно, в общем случае функция fls, X, t, //) = 1 *-<ν'-*Ύ№'-*') = —— д-(У-а)У4Р t t ($ = ^B2(u)du, a = x + ^A(u)du) (151) s s есть единственное решение уравнения (146), удовлетворяющее нашим условиям. 13 См. работы, указанные в сноске 2 за номерами I и III.
9. Об аналитических методах в теории вероятностей 101 § 17 ОБ ОДНОМ СПОСОБЕ ПРЕОБРАЗОВАНИЯ ФУНКЦИЙ РАСПРЕДЕЛЕНИЯ Пусть будет s' = φ (s), t' = φ (ί), x = Ψ С?, χ), У' = Ч(*» I/). / (s, x, t, у) = И (ί, »)%) /' (*', *', ί', У'), (152) причем мы предполагаем, что φ (t) — непрерывная и нигде не убывающая функция, в то время как ψ (£, у) относительно t произвольна, а по у допускает непрерывную положительную производную. Если / (s, х, t, у) удовлетворяет условиям (85) и (86), то то же самое имеет место, как легко проверить, и для функции /' по отношению к новым переменным s', χ', £', у'\ другими словами, наше преобразование приводит к новой функции /' (s', x\ £', yr), которая подобно / (s, χ, t, у) определяет некоторую стохастическую схему. Если φ (t) и ψ (t, у) допускают соответствующие производные, то уравнения (125) и (133) при переходе к новым переменным преобразуются к виду ^-А'&^-В*^*')-^, (153) &=-^г[А7]+^[В-П (154) где положено ,//,/ „/Х _ (д*$ (*, у)1ду*) В* (t. у) -J- (дЦ (t, у)1ду) A(t,y) + 0ф (t4 y)ldt £'2 /,' „/ν И>(*, y)ldy)*B*(t, у) (155v * "> У ' ду (t)jdt ' V ' При помощи только что рассмотренного преобразования можно получить решения уравнения (133) для многих новых типов коэффициентов A (t, у) и В2 (t, у). Пусть, например, A (f, y) = a(t)y + b (ί), В2 (t, у) = с (t); (156) (157) мы полагаем <Р(0=$с(г)е-2Ь«*"Л) ψ (t, у) = j/e- $ α(ί)Λ - $ δ (t) β' ί a;i;dt Λ и получаем для новых переменных s', χ'', t', у', f простейшее уравнение теплопроводности: dfidt' = δψ/ду'2. (158)
102 9. Об аналитических методах в теории вероятностей При этом начальные условия (142) и (143) остаются справедливыми и для /' (s\ χ', t', уг) и, следовательно, формула /' = 1 *4ν'-*')»/4</'-ο (159\ Vn(t'-s') v ; совместно с (157) и (152) дает единственное удовлетворяющее нашим условиям решение / (s, χ, t, у) уравнения (133) с коэффициентами вида (156). Легко видеть, что в этом случае функция / (s, x, t, у) необходимо будет иметь вид -* е-Ом»)»/* (160) где α и β зависят только от s, x и t, но не от у. Одной из важных задач является отыскание всех возможных типов коэффициентов A (t, у) и Вг (t, у), для которых при любых s, ΐ,.χ всегда получается функция вида (160), т. е. функция распределения Лапласа. В качестве второго примера рассмотрим случай A (t, у) = a (t) (у - с), В" (t, у) = Ъ (t) (у - с)\ (161) Полагая теперь φ (t) = J Ъ {t) dt, ψ (t) = In (у - с) + J [b {t) - a (t)] dt, (162) мы снова получаем для /' (sf, χ'', t', у') уравнение (158), решение которого (159) нам уже известно. Заметим, что здесь достаточно рассматривать лишь значения χ ^> с, у ^> с, так как при изменении χ или у в пределах от с до + оо переменная χ (и соответственно у') пробегает все значения от — оо до + оо. Некоторые затруднения, возникающие в связи с этим обстоятельством при переносе условий (142) и (143) на функцию /', легко могут быть устранены. В частности, для случая A (t, у) = 0, В* (t, у) = у* (163) мы имеем формулу "•■'•'•'>-77гЬг"р{-""+«',Г-'У"'}- <ш> Для приложений наиболее важным является случай, когда A (t,y) и В2 (t, у) зависят только от у, не завися от времени t. Ближайшим шагом в этом направлении было бы решение нашей задачи для случая коэффициентов вида А (у) = ау + 6, В' (у) = су* + dv+e. (165)
9. Об аналитических методах в теории вероятностей 103 § 18 СТАЦИОНАРНЫЕ ФУНКЦИИ РАСПРЕДЕЛЕНИЯ Если для момента времени t0 известна дифференциальная функция распределения вероятностей g (t0, у), то аналогично общей формуле (5) функция распределения g (t, у) для любого f^>t0 определяется формулой оо g(t,y)= $ g(to,x)f(to,x,t,y)dx. (166) — оо функция g (t, у), очевидно, удовлетворяет уравнению -гг = - -W[А {t'y) g] + -W[В2 {t'у) gh (167) Мы будем предполагать теперь, что коэффициенты A (t, у) и В% (£, у) зависят только от у (однородность процесса во времени), и исследуем, какие функции g (t, у) остаются в этом случае неизменными в течение времени. Ясно, что для такой функции мы имеем -Ag + (B'g)' = С. (168) Если предположить, что gn g' для у = ± оо стремятся к нулю и притом настолько быстро, что то же самое имеет место и для всей левой части равенства (168), то, очевидно, должно быть С = 0, и мы имеем g'lg = [А - (В*)']1В\ (169) Помимо того, функция g (у\ должна еще удовлетворять условию оо S gdy=l. (170) — оо В большинстве случаев оказывается возможным доказать, что если существует стационарное решение g (χ), то / (s, x, t, у) при t -* ->- оо и произвольных^ постоянных s ш χ стремится к g (у); таким образом, g (у) оказывается не только стационарным решением, но также и предельным решением. Если коэффициенты А и В2 имеют вид (165), то (169) обращается в уравнение Пирсона -£- = 1^1. (171) причем ■η d — b e d e /λπ*\\ Мы можем, следовательно, построить такие стохастические схемы, Для которых стационарным решением является любая из функций Распределения Пирсона.
104 9. Об аналитических методах в теории вероятностей § 19 ДРУГИЕ ВОЗМОЖНОСТИ Изложенная в § 13—18 теория в существенной мере обусловлена сделанным нами предположением (111). Если отказаться от этого предположения, то даже при сохранении условия (110) возникает ряд новых возможностей. В качестве примера рассмотрим схему, определяемую функцией распределения у F{s;x,t,y) = e^t^G{y-'X) + (i--e~^t-^) § u(z)dz1 (173) — оо где σ (ζ) = 0 для ζ < 0 и σ (ζ) = 1 для ζ ;> 0, а и (ζ) — непрерывная неотрицательная функция, для которой оо J u(z)dz=i и моменты оо 5 u(z)\zfdz (ϊ = 1, 2, 3) — оо конечны. Легко проверить, что функция F (s, x, t, у) удовлетворяет требованиям (78) и (79), равно как и (110). Эту схему можно истолковать следующим образом: в течение бесконечно малого промежутка времени (£, t -\~ dt) параметр у или остается неизменным с вероятностью 1 — adt, или переходит к значению у', ζ < у' < ζ + dz, с вероятностью аи (z) dtdz. Таким образом, в каждом интервале времени возможен скачок, причем функция распределения для значений параметра после скачка не зависит от предшествовавшего скачку значения этого параметра. Приведенную схему можно было бы обобщить еще следующим образом: представим себе, что за бесконечно малый промежуток времени (t, t + dt) параметр у с вероятностью 1 — a (t, у) dt сохраняет прежнее значение и с вероятностью и (t, у, z) dtdz переходит в у , ζ <Су' < ζ + dz. При этом, конечно, предполагается, что оо \ u(t,y,z)dz = a(t,y). (174) — оо В этом случае для g (t, у) должно, по-видимому, иметь место интегро- дифференциальное уравнение оо 4г$(*>У) = -аУ>У)2(1'У)+ J g(t,z)u(t,z,.y)dz. (175) —оо
9. Об аналитических методах в теории вероятностей 105 Если мы хотим рассматривать не только скачки, но и непрерывное изменение параметра ζ/, то естественно ожидать для g (t, у) уравнение -%rg(t,y)=-a(t,y)g(t,y)+ J g(t,z)u(t,z,y) dz ■ - 4f [A (t, y) g (t, y)} + -gj- \B* (t, y) g.(t, y)], (176) причем предполагается выполненным условие (174), а коэффициенты Л (£, у) и В2 (t, у) имеют значения, указанные в § 13. ЗАКЛЮЧЕНИЕ Если состояние рассматриваемой системы определяется при помощи η действительных параметров хг, х2, . . ., хп, то при известных условиях, аналогичных установленным в § 13, мы будем иметь следующие дифференциальные уравнения для дифференциальной функции распределения / (s, х1у . . ., хп, t, уг, . . ., уп): ~ОГ = — Σ Ai(s, хъ ... ,хп) -^- — 2^ Σ 5ij(5' *i> ·.. , хп) - °2 г=1 г г=г j=l дх. дх.' ι J (177) ^=~ Σ "4"[ ^(ί'Уи' ■''Уп) п η η +ΣΣί^ϊ. [Bij{t'Уъ""Уп)п' ί178) г=1 j=i г ° Для случая, когда Аг (ί, г/1? . . ., уп) и £ί7· (£, z/x, . . ., уп) зависят только от £, эти уравнения были открыты и разрешены Еашелье 14. Решения, удовлетворяющие условиям нашей задачи, в этом случае будут вида / = Ρ ехр { - -А- ^ Pij (У{ -х-,- Qi) (у, - Xj - </,)} , (179) причем Ρ, Q, ptj и qt зависят лишь от s и t. Молено было бы рассматривать также смешанные схемы, где состояние системы определяется с помощью параметров, частью прерывных, частью непрерывных. Москва, 26 июля 1930 г. См. работу, указанную в сноске 2 за номером II.
1Э6 10. Проблема ожидания 10 ПРОБЛЕМА ОЖИДАНИЯ* § 1. Цель этой статьи состоит в том, чтобы показать несколько применений общих уравнений, которые я исследовал в моем мемуаре, сданном в печать в журнал «Mathematische Annalen» х (см. № 9 наст. изд.). С этой целью я даю новое решение «проблемы ожидания», которой посвящен обширный мемуар М. Полячека 2. Суть задачи состоит в следующем. (Та же математическая задача естественно может возникнуть при изучении других реальных явлений, поэтому такие выражения, как «телефонные линии», «разговор», употребляются здесь только для наглядности изложения.) Предположим, что на телефонной станции имеется η линий, которые могут быть заняты обслуживанием телефонных разговоров. В каждый момент имеется т клиентов, ведущих телефонный разговор или же ожидающих своей очереди; последний случай имеет место только при т^> п, когда длина очереди равна т — п. Теоретически число т может принимать все целые неотрицательные значения: т - 0, 1, 2, : . . Мы обозначим Qo(*h Qi(t), Q*(t), · · .,Qm(t), ... вероятности этих значений в момент t. Очевидно,· оо Σ α»(<)=ι· (ΐ) m—о Если в момент t0 нам известно значение т, то Qm(t0) = l, &(*o) = 0, гфт. (2) Первая решаемая нами задача состоит в том, чтобы вычислить вероятности Qm (t) для t^> t0, если известны их начальные значения Qm (£о)> которые, в частности, могут иметь вид (2). Вторая задача заключается в том, чтобы определить математическое ожидание и закон распределения продолжительности ожидания для клиента% прибывающего в момент t. § 2. Мы будем исходить из следующих двух допущений относительно характера изучаемых случайных событийг^ * Sur la probleme d'attente.—Мат. сб., 1931, т. 38, № 1/2, с. 101—106. Перевод Б. А. Севастьянова. 1 Настоящая статья, впрочем, не предполагает знакомства с этим мемуаром, за исключением доказательства нескольких вспомогательных утверждений. 2 Math. Ztschr., 1930, Bd. 32, S. 64—100.
10. Проблема ожидания 107 I. Б каждый бесконечно малый интервал времени (t, t + dt) с вероятностью a (t) dt на станцию прибывает новый клиент. Более точно, в любой интервал (t, t -f- Δ) вероятность прибытия нового клиента равна α (ή Δ + ο (Δ), в то время как вероятность прибытия более одного клиента равна о (А); как обычно, о (Δ) означает здесь бесконечно малую величину, имеющую порядок малости выше Δ; мы предполагаем, что функция a (t) непрерывна по t. Вероятности, относящиеся к интервалу (t, t + Δ), не зависят от числа клиентов, прибывших ранее и от моментов их прибытия. II. Вероятность окончания разговора в интервале времени (£, t + dt), ведущегося клиентом в момента, равна $dt; она не зависит от продолжительности разговора до момента t. Это приводит к показательному закону распределения продолжительности разговора: вероятность, что эта продолжительность заключена между t и t + dt, равна ρ {ή dt - fie-Vdt. (3) В этом случае математическое ожидание продолжительности разговора равно оо D = {$te-t?>dt = -y. (4) о Вместо закона распределения (3) М. Полячек предполагает, что продолжительность разговора всегда равна некоторой константе D; это предположение столь же произвольно, что и наше. § 3. Обозначим Qmv (t, t + Δ) условную вероятность того, что в момент t + Δ на станции имеется ρ клиентов при условии, что в момент t там находилось т клиентов. Вероятность того, что в интервале времени (t, t + Δ) прибудет более одного клиента или закончится более одного ведущегося разговора, равна о (Δ). Поэтому Qmp (f, ί + Δ)< ω (Δ) = о (Δ), | ρ - πι \ > 1, (5) где ω (Δ) не зависит от πι и ρ. Для \ ρ — πι \ <^ 1 имеем Qm,m+i (f, t + Δ) - a (t) Δ + ο (Δ), (6) Qmtm-i (t, t + Δ) = Α/ιβΔ + ο (Δ), если т < п, (7) Qm,m-i (t, t + Δ) = ηβΔ + ο (Δ), если т> п, (8)
108 10. Проблема ожидания поэтому Qmm (i, t + Δ) = 1 — (α (ί) + τηβ) Δ + -ο (Δ), если т < я, (9)1 #mm (ί, ί + Δ) = 1 — (α (ί) + »β) Δ + ο (Δ), если т > τι. (10) По формуле полной вероятности имеем ос Qp(t + b)= Σ Qm(t)QmP(t + b)- (И)! т—О Подставляя в (11) значения @тр (£, ί + Δ) из формул (5) — (10), доказываем, что предел Qv(t ) = hm р д' pU (12) всегда существует и имеют место уравнения & (0 = β& (ί) - « (ί) <?ο (ί), (13) ρ,' (ί) = (i + 1) β <?m (ί) - (α (ί) + ίβ) Qt (ί) + α (ί) <?г_! (ί), 1 < ί < «, , (14*! Q'i (ί) = «β<?ί+1 (ί) - (α (ί) + »β) £, (ί) + α (ί) ρ^ (ί), ι» < L (15) Таким образом, для функций Qt (t) мы получили счетную бесконечную систему дифференциальных' уравнений. Достаточно найти решение Q[m) (t) с начальными условиями типа (2). Общее решение можно получить тогда с помощью формулы полной вероятности оо &(0=Σ Qm(to)Qim)(t). (16) 771=0 § 4. Рассмотрим наиболее простой и важный случай, когда функция a (t) константа: a (t) = α. (17) В этом случае система уравнений (13) — (15) имеет постоянные коэффициенты. В упомянутой выше работе я доказал для таких систем существование и единственность решения (в предположении, что Qm (t) неотрицательны и удовлетворяют условию (1), как это и имеет место в нашей задаче). Поэтому функции Qm (t) однозначно определяются уравнениями (13) — (15) и их начальными значениями Qm (t0). Нахождение приближенного решения таких уравнений не представляет большого труда; один метод получения такого решения дан в упомянутой выше моей работе. Но с практической точки зрения предпочтительнее прямо переходить к предельному решению.
10. Проблема ожидания 109 gT0 решение существует только в случае ηβ > α. (18) Если выполняется обратное соотношение ηβ < α, (19) то очередь на станции бесконечно растет. Случай «β = σ] (20) имеет только теоретическое значение, поэтому мы ограничимся изучением случая (18). Найдем сначала константы Qm (t) = Qm% удовлетворяющие уравнениям (13) — (15) и (1). В этом случае β<?ι - α<?0 = 0, (21) (i + 1) βρί+1 - (а + βι) Qt + (zQ^ = 0, 1 < i < Λ| (22) "β&*ι - (α + ηβ) ρ, + aQt-i = 0, /^ < /, (23) Σ £;« = !. (1) ί?ι=0 Из (21) — (23) легко получить, Qi = ω^ο, ωί = Ίτ{τΐ' °<1<п> № -ίγ)\ ^<г, (25) откуда в силу (1) имеем (2 = ωο + ωι + ... + ωη_1 + -1-(^-)" ^„-х^р) . (27) Формулы (24) -— (27) дают единственное стационарное решение нашей задачи. Можно доказать, что в любом другом решении функции Qm (t) при t -> оо стремятся к пределам Qm, т. е. стационарное решение является также предельным. Сделаем еще следующее замечание относительно формул (24) — (27). Условимся говорить, что распределение вероятностей {Qm (t)}
110 10. Проблема ожидания превосходит распределение {Qm' (t)}, если для каждого т (2) Rm} (t) > R\H (t), где (28) R„ Σα- (29) Если начальные условия {Q^ (t0)} превосходят {Q(m (ί0)}> то это отношение сохраняется в любой момент t ^> t0. Пусть Qm (t) — решение нашей задачи с начальными условиями <?о (h) = 1, Qm (tQ) = 0, т > 0. (30) Эти начальные условия превосходят все возможные другие условия. Поэтому решение Qm (t) в любой момент превосходит любое другое решение и, в частности, превосходит стационарное решение. Таким образом, мы видим, что если коэффициенты α и β достаточно долгое время остаются постоянными, то искомые вероятности даются формулами (24) — (27). Например, если η = 3, α/β — 2, то т Qm Rm 0 1/9 1/9 1 2/9 1/3 2 2/9 5/9 3 4/27 19/27 4 8/81 65/81 5 16/243 211/243 6 32/729 665/729 Мы видим, что в этом случае, когда из трех линий в среднем занято две, с вероятностью'R2 = 5/9 имеется свободная линия, в то время как вероятность т ^> 6, т. е. вероятность того, что более трех клиентов ожидают своей очереди, равна 1 — RQ = 64/729 ~ 1/11. § 5. Если принять предельное распределение за точное, то можно просто вычислить математическое ожидание Ε длительности ожидания в очереди. Для этого надо среднюю длину очереди разделить на п$: Ε = а/пр. (32) Таким образом, в нашем" примере^нри η = 3, α/β = 2 находим °=-,Е: 9·3β ~ 27β — 27 Это означает, что среднее время ожидания равно 8/27 от среднего времени разговора.
11. Метод медианы в теории ошибок 111 § 6. Для того чтобы иметь возможность вычислить закон распределения времени ожидания, нам остается только решить следующую задачу: в предположении, что в момент t0 на станции имеются т клиентов и в этот момент появился новый клиент А, вычислить для этого клиента закон распределения времени ожидания. Нас интересует только случай т !> п, так как в противном случае имеются свободные линии. Положим т = η + ρ и обозначим Pq (£), q = О, 1, . . . .. Pi вероятность того, что в интервале (t0, t) окончилось ровно q разговоров, и через Ρ (t) вероятность того, что это число больше р. В момент ΐϋ1 очевидно: Ро (ίο) = 1. Pq (*о) = 0, g > О, Ρ (t0) = 0. (33) функции P0r Ρ и . . ., Рр, Ρ удовлетворяют уравнениям PQ (t) = - п$Р0 (f), P'q (t) = *β (Pq^ (t) - Pq (f)), q = 1, 2 , Pi (34) i>' (i) - nfiPq(t). Таким образом, мы нашли конечную систему линейных уравнений, которую легко решить. Отсюда получаем вероятность Ρ (t) того, что время ожидания клиента А не более t — t0. Париж, 24 ноября 1930 г. 11 МЕТОД МЕДИАНЫ В ТЕОРИИ ОШИБОК* При допущении нормального закона распределения ошибок метод средней арифметической, как хорошо известно, является наилучшим для вычисления истинного значения наблюдаемой величины. Метод медианы в этом случае хуже, хотя, как показал Хааг, и незначительно. Однако, если гипотеза нормального распределения не удовлетворяет фактам, встает вопрос об отыскании наилучшего метода, соответствующего данному закону распределения. В частности, во многих случаях, в которых считается необходимым исключение «анормальных наблюдений», было бы методологически более правильно исследовать общий закон распределения и найти наиболее соответствующий ему метод вычисления истинного значения. В этой статье я хочу указать, как, зная закон распределения ошибок, определить степень точности метода медианы и сравнить ее с точностью метода средней арифметической. Какой из двух методов окажется предпочтительней, зависит от характера принятого закона * Мат. сб., 1931, т. 38, № 3/4, с. 47—50.
112 11. Метод медианы в теории ошибок распределения; однако в силу теоремы II при совершенно неизвестно^ и могущем сильно уклоняться от нормального законе распределения надежнее употреблять метод медианы. Метод исследования в существенных чертах принадлежит Хаагу [1], применившему его, однако, только в случае нормального закона распределения. Пусть вероятность ошибке отдельного наблюдения лежать между χ и χ + ах равна / (x)dx. Мы будем предполагать, что f(x) непрерывна и / (т) Φ О для медианы т: т \ f (x)dx——. —оо Пусть, далее, -}-оо а= ^ xf(x)dx —оо — математическое ожидание ошибки. Обозначим через хъ х2, . . . . . ., хп результаты η последовательных наблюдений, через ап их среднее арифметическое и через тп их медиану. Мы ограничимся случаем нечетного η = 2k + 1, когда тп = #fe+lT предполагая, что xt занумерованы в порядке их возрастания. Разности (ап — а) и (тп — т) будут (как это следует из дальнейшего) порядка поэтому естественно положить <*п = (ап — а) Уп, μα = (тп — т) γη и исследовать законы распределения ап и μη. Для ап% как известно, имеем непрерывный закон распределения: вероятность ап лежать между а и а + da равняется φη (a) da, где <рЛ (а) вычисляется по хорошо известным формулам. Если дисперсия +оо σ2= jj (s_ a)2f(x)dx —оо существует, то φη (а) сходится к нормальному закону распределения с дисперсией σ* Вероятность та лежать ^между t n]t -\- dt равняется
11. Метод медианы в теории ошибок 113 где1 θ(ί)=2$/(*)ώ. т Вероятность же μ„, лежать между μ и μ + ψ равна фя(и) = и»(0рДр. VL = (t-m)Y2k + it t = m+y=l== . Τ е о ρ е м"а I. tyn (μ) с увеличением η стремится к нормально- му закону распределения 1 е-№\ с дисперсией от = 1/2/ (т). В самом деле, По формуле Стирлинга У'Ак + 1 (2/с)! -|/"2~ (Λ!)«4* > Г π ' Далее ясно, что f(t)-+f(m). Остается рассмотреть множитель {1 — Θ2 (t)}4. Во-первых, имеем: где ε стремится к нулю с возрастанием п. Следовательно, {1 - θ2 (t)f = е-и·/**"»)/* (1 + ε"), гДе ε' и ε" тоже стремятся к нулю. Сопоставляя полученные выражения, получаем Ψη(μ)->|/4-/(™)*-μΙ !/2(m)/2 что и доказывает нашу теорему. См. вывод аналогичной формулы (4) в [1].
114 12. Одно обобщение теоремы Лапласа — Ляпунова Мы видим таким образом, что при неограниченном возрастании η разности тп — т и ап — а имеют бесконечно малые дисперсии. Следовательно, систематической ошибкой в методе медианы будет щ а в методе средней арифметической а. Что же касается сравнитель ной точности обоих методов, то все решается отношением λ = ат/а = 1/2/ (т) а. В случае нормального распределения / (х) отношение λ вычислено еще у Хаага и равно Kg = γΊΰ2 ~ 5/4. Легко построить примеры законов распределения, для которых λ принимает любые значения между 0 и оо. Однако имеет место следующая Теорема II. Для законов распределения с одним максимумом отношение λ может принимать любые значения в промежутке о < λ < /з; но не может быть больше |/~3. Максимальное значение |/3 достигается, если f (χ) = α, χ < 1/2α, / (х) = О, χ > 1/2α, но"этот закон распределения уже не удовлетворяет условию непрерывности: λ = 0, если σ = + оо. ЛИТЕРАТУРА 1. Haag /.— С. г. Acad. sci. Paris, 1924, vol. 179, p. 1388. 2. Borel E. Traite du calcul des probabilites et de ses applications. Paris, 1924. 12 ОДНО ОБОБЩЕНИЕ ТЕОРЕМЫ ЛАПЛАСА - ЛЯПУНОВА * Пусть хг, х2, . . . — независимые случайные величины с математическими ожиданиями М^ = 0, tAxl = 2Ъп, Μ | Хп | з = dn; при этом отношения djbn меньше некоторой фиксированной константы: djbn < μ· (ΐ) * Eine Verallgemeinerung des. Laplace—Liapounoffscheib'' Satzes.— Изв. АН СССР, OMEH, 1931, с 959—962. Представлено С. Н. Бернштейном. Перевод А. Η. Ширяева.
12. Одно обобщение теоремы Лапласа — Ляпунова 115 Положим 5П = хх + . . . + xnj tn = Ъг + . . . + bn. Одна из важных задач теории вероятностей состоит в следующем: исследовать поведение при η ->■ оо сумм 5П в зависимости от свойств величин tn при μ —>· 0. На основе уже ставшего классическим закона Ляпунова х вероятность ь ^?{a<Sn<b}=—^\e~s^nds + QR{tn^), |θ|<1, (2) a R {tn, v) стремится к нулю равномерно по μ, если tn больше некоторой константы Т. Итак, при фиксированном η имеем формулу асимптотического поведения для Sn. Рассмотрим следующую проблему. Пусть a (t) lib (t) — функции параметра t. Спрашивается, с какой вероятностью выполняются все неравенства вида a (tk) <Sk<b (fk), к = 1, 2, . . ., п. (3) Предположим, что a (t) и Ъ (t) непрерывно дифференцируемы и что a(t)<b (f), а (0)< 0 < Ъ (0). Тогда можно получить асимптотическое решение поставленной задачи, аналогичное (2). Все последовательности 51? 52, . . ., Sn (до Sn) можно разбить на следующие три класса: К содержит те последовательности, для которых выполнены все неравенства (3); Кг — такие последовательности, для которых существуют такие А:, что выполняются все неравенства a(ti)<Si<b(ti), i = l, 2, . ..,Α-1. К2 — такие последовательности, для которых существуют такие &, что выполняются неравенства a(ti)<Si<b(ti), ί = 1,2, . . ., Λ — lf b (h) < Sk. Обозначим вероятности, соответствующие этим множествам, через Рпч Рп , Рп- Наконец, обозначим через Рп (х, у) вероятность события a(h)<Sk<b(tk), к = 1, 2, . . ., п- 1, χ < sn < у. 1 Liapounoff А. М.— Bull. Acad. sci. St.-Petersb., 1900, vol. 13, p. 359.
116 12, Одно обобщение теоремы Лапласа — Ляпунова Очевидно, что Рп = Рп {α (ίη), Ъ (tn)}. Неравенства t > О, a(t)<s<b(t) выделяют в плоскости (s, t) область G. Обозначим через g (s0, t0; s, t) функцию Грина для уравнения теплопроводности dfldt = d*f/ds2 для области G и положим g (s, t) = g(0, 0; s, ί), 3g" (5, i)/ds = и (s, t), vi (0 = -*и Ь CO» th v2 (t) = u[b (t), t]. Теорема. Имеют место следующие асимптотические формулы: у Рп (*, y) = lg (*, tn) ds 4- Ш (tn, μ), (5) χ 'η Ρ^)=Ιν1(ήάί + θ1Βι(μ), (6) ο 'η /><?> = $ ι* (i)di + e8i?8 (μ), (7) ο Ι θ Ι <1, |θχ Ι <1, |θ2 Ι <1, где R, Д1? Л2 стремятся к нулю равномерно по μ; тг/ш э/тгом ^я i? (£,μ)2#ια сходимость равномерна по £, если t больше некоторой константы. Если вместо (3) имеем односторонние неравенства, например α (**)<£*, _Л = 1, 2, . . ., /г, (8) то справедлив аналогичный результат, который, впрочем, легко может быть получен из предшествующего предельным переходом. Гёттинген, 20 января 1931 г.
13. Об общей форме стохастического однородного процесса 13 ОБ ОБЩЕЙ ФОРМЕ СТОХАСТИЧЕСКОГО ОДНОРОДНОГО ПРОЦЕССА * (Проблема Бруно де Финетти) Пусть Χ (λ) — действительная переменная, которая меняется случайным образом как функция времени λ, точнее таким образом, что распределение вероятности φΔ (χ) = Ρ {Χ (λ2) - Χ (λ,) < χ} (λ2 > λχ) зависит только от Δ = λ2 — λχ и не зависит ни от λΐ7 ни от Χ (λ^, ни от поведения Χ (λ) при λ < λχ. Символ Ρ, как обычно, обозначает вероятность соотношения в скобках. Тогда, как известно, функция распределения Фд (х) удовлетворяет функциональному уравнению 1 оо —оо В настоящей работе мы дадим, обобщая некоторые результаты Бруно де Финетти 2, решение уравнения (1) при единственном предположении, что конечны первый и второй моменты оо оо шд=: J χάφ^(χ), а\= \^ (х — л?д)2йФд (#). — сю · —оо Заметим для неспециалистов, что функция Фд (х) не убывает, непрерывна слева и Фд (—оо) = О, ΦΔ (оо) = 1. Пусть оо ψΛ (t) = J e^c/Фд (χ) —оо — характеристическая функция Фд (х). На основании известных свойств характеристических функций имеем Ь/п (*) = [ψχ (t)V'n, ψ,/η (f) = [^ (f)]Vn. * Статья представлена 6 марта 1932 г. членом Итальянской академии наук 1 · Кастельнуово в журнал «Atti della Reale Accademia nazionale dei Lincei. Ser. sesta. Rendiconti» и в том же году опубликована двумя частями на итальянском языке. Первая часть носила название «Sulla forma generale di un processo stocas- 1'ico omogeneo» (vol. 15, N 10, p. 805—808). Его перевод принят в настоящем издании в качестве заголовка всей статьи. Вторая часть имела название «Апсога sulla forma generale di un processo omogeneo» (vol. 15, N 12, p. 866—869). Перевод JI. Басалыго. См., например, мою работу: Ueber die analytischen Methoden in der Wahr- scnemlichkeitsrechnung.—Math. Ann., 1931, Bd. 104, S. 415-458. См.: Finetti B. de. Le funzioni caratteristiche de legge istantanea.— Atti Accad. naz. Lincei. Rend., 1930, vol. 12, p. 278-282.
118 13. Об общей форме стохастического однородного процесса 1 Так как ψΔ (t) непрерывна по Δ, то 3 Ψδ(0-= Ιψιίί)^· (2) И поскольку распределение Фд (л;) однозначно определяется ψΔ (ί)? то для его описания достаточно найти общую форму ψχ (t). Согласно Финетти имеем 4 ψι(ί) = Ηιη^[ΨΔ(/)"11, log^(0 = lim-|-^(0~l], Δ->0. Кроме того, еж 4- γψα о - ij=4- [ J е"*йфд и - *]= —оо оо оо Γι* [ χ άΦΑ (χ) + f (eiix — 1 — ifo) ЙФД (я)1 = —-оо _oo оо = -д- [tfmA + ij (<?*'* — 1 — it χ) άΦΑ (χ)~\ = СЮ ОО = itntx + 4" ^ (eitx ~* i ~~ ίίχϊ d®A (*)· — oo Пусть теперь χ — оо Функция FA (χ) не убывает по # и обладает свойствами FA (— оо)= 0 и оо ОО Для каждого интервала (а, Ь), не содержащего нуля ни внутри, ни на концах, имеем ъ ъ JL J (eitx _ ι _ ite) ^ΦΔ (ж) = J p (ж, ί) dFA (ж), 3 В случае, когда Δ <ζ 1/и, имеем σΔ = о^д — σ^η_Δ <ζ σ^/η — (ί/η) о\. Поэтому σΔ стремится к нулю при Δ —> 0, а г|?д (г) соответственно стремится к 1. Учитывая равенство ψΔ +Δ (t) = ψΔ (ί) ψΔ (ί), заключаем, что ψΔ (ί) непрерывна по Δ. 4 [ψΔ (/) -^ΤΙ/Δ ограничено для каждого фиксированного t, следовательно, равенство ψι (0 = ϋ исключено, так что логарифм ψχ (ί) можно определить для любого t.
23. Об общей форме стохастического однородного процесса 119 где ρ (χ, t) = (eitx< - 1 - itx)/x2 при χ φ Ο, /7 (*, ί) = -*а/2 при ^ = 0. * ' Так как для каждого заданного t функция ρ (χ, t) конечна и непрерывна (в том числе и при χ = 0), то оо оо J_ С (<?«*— 1 — их) άΦΑ (χ) = \ ρ (χ, t) dF\ (χ). —сю —оо Выберем теперь последовательность положительных величин Аь Д2, . . ., Δ4, . . ., стремящихся к нулю. Из последовательности функций F^(z), FA2(x), . . ., FAn(a), · · · можно, как известно, выбрать подпоследовательность сходящуюся к некоторой функции F (х) во всех точках, в которых она непрерывна. Функция F (х) будет, конечно, неубывающей и с крайними значениями F (- оо) > lim Fh (_ оо) = 0, F (оо) < lim Fx (оо) = σ|, Δ ^U' <0' Принимая во внимание то, что функция ρ (χ, t) стремится к нулю при фиксированном t и χ-> ± оо, мы окончательно получаем ^ со S p(x, t)dF^(x)~, J p(x,t)dF(x), log ψ! (f) = lim — [ψΔ (ί) — 1] = σο = lim litrri! -f- ( (βίίΛ: — 1 — ito)ώΦΔ (χ)] = — со σο = lim itmi -f- J p(x,t)dFb(x)], Δ—0; —оо со logfl(t) = itm1+ J p(x,t)dF(x). ((>) —оо Гак как второй момент о\ конечен, то «? log ψχ (f) = imii - -f- <2 + ο (ί2).
120 13. Об общей форме стохастического однородного процесса Кроме того, из (6) имеем оо 1οβψ,(/) = «ιηι+ jj (-^· + ο(ί2))ώί(χ) = — оо — arm -Jl-[F(oo)-F(-oo)] + o (t2), откуда следует, что F (оо) - F (— оо) = ol и поэтому с учетом (5) F (- оо) = 0, F (оо) = σ?. Будем считать, что F (х) непрерывна слева (впрочем, значения! F (х) в точках разрыва несущественны). То что F (х) не убывает, мы| уже отметили. ' Формулы (6), (4) и (2) вместе с известной формулой Фд (х) - Фд (0) = -^ J l~f ψΔ (t) dt (7) J — оо дают общее решение поставленной проблемы. Функция F (х) полностью определяется функцией распределения ФЛ (х). Действительно, интеграл \ ρ (χ, t) dF (x) = log ψι (t) — Unix можно дважды продифференцировать по t и получить с учетом равенства dt ЧТО д2 —rp(x1t) = ~eux, оо {j eite dF (X) = --?L log ψ! (t) = χ (t), — oo 1 ρ 1 _ e~itx F(*)-F(0)=^r J __χ(<)Λ. Последнее равенство позволяет определить jF (#) с точностью до аддитивной константы, которая, в свою очередь, определяется условием F(—oo) = 0. Мы уже говорили, что из всякой последовательности Fs (#), когда Δη стремится к нулю, всегда можно извлечь подпоследователь-
13. Об общей форме стохастического однородного процесса 121 ность t\7 (χ)·> сходящуюся к F (х). Отсюда вытекает, что F& (х) при д _>. 0 стремится к F (х): χ ρ (χ) = limFA (χ) = lim 4- \ У2 ^ФА (у). (8) —оо Однако (8) верно вообще только в тех точках, где F (х) непрерывна. При χ < 0 из (3) следует равенство X Л-Фь(х) = \ У~2аВ\{у). Далее, в силу (8) имеем в каждой точке непрерывности χ < 0 функции F (х): X Рг (х) = lim \ Фд (х) = J у"2 dF (ι/). (9) —оо Аналогично получаем при χ ^> 0: оо _L [ι_фд {х)]=.L[фд (оо) _ фд (a.)j = J у-2 <^д (г/), оо Р, (х) = lim -i- [1 - Фа (я)] = J Г2 <*** (?)· (Ю) л; Объяснить действительный смысл функций Рх (^·) и Р2 (х) можно следующим образом. В общем случае функция Χ (λ) не обязана меняться непрерывно по времени λ, она может иметь и окачки. Величина Ρз (χ) άλ представляет собой вероятность того, что за приращение времени άλ имел место положительный скачок, больший чем х. Аналогично Рг (χ) άλ есть вероятность появления отрицательного скачка с абсолютным значением, большим чем | χ |. Из (9) и (10) следует, что χ F(x)= jj уЫР^у), *<0, (И) — оо оо σ\ ~ F (х) = F (со)-F(x)=\ у* dP2 (у), *>0. (12) X Понятно, что справедливость этих формул, как и всех других, кУДа входят Рг (х) и Р2 (х), ограничена точками непрерывности F (х). Таким образом, поведение F (х) вне точки χ ~ 0 полностью определяется распределением вероятностей скачков функции Χ (λ). Вместе с тем разрыв F (х) в начале координат связан наоборот с непре-
122 13. Об общей ферме стохастического однородного процесса рывной вариацией Χ (λ). Чтобы пролить свет на это обстоятельство положим Ω (χ) = F (χ), χ<0, Ω (χ) = F (χ) - οβ, χ > 0, где через о\ обозначен скачок F (x) в точке χ = 0. Вне окрестности начала координат очевидно, что dF (χ) = άΩ (χ). Мы можем записать формулы (11) и (12) следующим образом: χ Ω(χ)= ξ y2dP1(y), x<0, (13) — σο σο ai-Q(x) = ly2dPt(y), ж>0, . (14) Χ где о\ = σ2 — σ2). Так как Ω (χ) должна быть непрерывна в начале координат, то 02 = Ω (оо) и, следовательно, функция Ω (χ) полностью определяется функциями Рг (х) и Р2 (х). Имеем оо оо 5 p(x,t)dF(x) = cfip(0,t)-\- J ρ (ж, t) dQ (χ). — ОО —ОО Поскольку ρ (0, t) = —£2/2, то в результате получается в ее окончательном выражении следующая ОСНОВНАЯ ФОРМУЛА Ζ оо 1οβψι(ί)==ίιηιί— ^γ-ί2+ { p(x,t)dQ(x). (15) — сю Если Ω (χ) = 0, т. е. когда Χ (λ) может меняться лишь непрерывно как функция времени, то о\ = о\. Имеем Ψδ (t) = exp im-it ~- ί2 ", Λ V ' σι/2πΔ _^ r { 2Δσ2 j Покажем в заключение, что формулы (7), (6) и (2) при любом выборе функции F (х) (неубывающей, непрерывной слева и со значениями F (— оо) = 0, F (оо) = о\ <; оо) дают решение рассматгиваемой проблемы. Другими словами, речь идет о доказательстве того, что при упомянутых условиях функция ΦΔ (χ), задаваемая (7), представляет при всех Δ }> 0 настоящую функцию распределения.
13. Об общей форме стохастического однородного процесса 123 С этой целью рассмотрим прежде всего ступенчатую функцию Τ (χ), которая только в конечном числе точек хг, х2у . . ., хп имее^ скачки щ=Т{хк+0)-Т (хк), сумму которых обозначим через σ^ = ωχ + <»2 + · · · + ωη» и которая постоянна в каждом интервале, не содержащем ни одной из точек хк- Условимся также, что между точками хк нет начала координат χ = 0. Тогда 5 оо J ρ (χ, t) dT (χ) = Σρ* (eitXk - ί - i*xk), —оо к log ψχ (t) = UP + 2 pk [Xk(t) - 1], fe Ръ Pk = ~r, Xk (t) = exp (itxk); к Хк ^A(t) = lb(t)V = exp{itPA + ^^Pkhk(t)-i]}^ Функции %k (t) = exp (itxk) и exp (UPА) являются, очевидно, характеристическими функциями (это означает, что они порождают с помощью (7) функции распределения). Из результатов де Финетти следует, что в этом случае характеристическими функциями являются exp {&рк [χ/j. (t) — 1]} и функция φΔ (t), представляющая собой произведение характеристических функций. Выбрав t0 и ε ^> 0, можно всегда аппроксимировать любую функцию F (τ) посредством ступенчатой функции Τ (χ) таким образом, чтобы неравенство оо оо | J p{x,t)dF{x) — J p(x,t)dT(x)\<e (16) —оо — оо выполнялось для всех \ t \ < t0. Образуем теперь последовательность Тп (х) функций Τ (χ) таким образом, чтобы разность (16) стремилась к нулю для всех t и притом равномерно для каждого ограниченного интервала. Тогда соответствующие им функции грд* (0 сходятся к г|>Л (t), откуда следует, что ψΔ (£), будучи пределом характеристических функций, сама является характеристической функцией. 5 При замене функции F (х) функцией Τ {χ) мы пишем ψΔ вместо ψΔ.
124 14. К вычислению средней броуновской площади 14 К ВЫЧИСЛЕНИЮ СРЕДНЕЙ БРОУНОВСКОЙ ПЛОЩАДИ* Совместно с М. А. Леонтовичем В настоящей работе будет решена следующая задача, поставлен-! ная перед нами СИ. Вавиловым. Требуется определить среднее значение (математическое ожидание) площади, покрываемой за заданное время проекцией на плоскость движущейся броуновской частицы конечного размера. Элементы площади, которые эта проекция проходит несколько раз, должны засчитываться только единожды. Решение этой задачи будет нами сведено к решению следующей более общей задачи: определить вероятность того, что при броуновском движении в области G плоскости бесконечно малой частицы, находящейся в момент t — О в заданной, точке (х, у), эта частица за время t по | крайней мере один раз достигнет границы R данной области. В разделе 1 будет разъяснен метод решения этой последней задачи, а в разделах 2 и 3 она будет применена к расчету средней броуновской площади. Разделы 1 и 2 статьи принадлежат А. Н. Колмогорову, а раздел 3 — М. А. Леонтовичу. 1. Рассмотрим прежде всего движение бесконечно малой частицы в плоскости с декартовыми координатами χ ж у. (Аналогичная трехмерная задача может исследоваться точно таким же образом.) Обозначим через Ρ (ж, у; t) вероятность того, что находившаяся в момент t = 0 в точке (х, у) области G частица за время t по крайней мере один раз достигнет границы R этой области. Пусть далее PL (x, у; t) — это вероятность того, что находившаяся в точке (х, у) частица за время t по крайней мере один раз достигнет границы R и притом так, что первое достижение границы частицей будет иметь место на части L этой границы. Ясно, что при этом Pl (*, y;t)^P {x, y; t). Обозначим теперь через ρ (χ, у; ξ, η; t) άξάϊ] вероятность того, что находившаяся в момент t = 0 в точке («г, у) частица в момент t окажется в области (ξ, ξ -f- d\\ η, η + d\\), причем за время t она ни разу не достигнет границы. В таком случае, очевидно, ξ ρ (χ, у; l·, η; t) άζάη + Ρ (χ, у; t) = ί. (1) G * Zur Berechnung der mittleren Brounschen Flache.— Phys. Ztsehi4 Sow., 1933, Bd. 4, S. 1 — 13. Перевод А. М. Яглома.
14. К вычислению средней броуновской площади 125 Кроме того, легко видеть, что P(xfy\t + T)=P{x,y\T)+lp(x,y;l,j\\T)P{l,y\;t)dtd4, (2) G Pl (s, У\ t+i) = PL (x, у; τ) + J p (xy у; ξ, η; τ) PL (ξ, η; ί) dl ац. (З) G Примем теперь следующие предположения. I. функции Ρ (χ, у; t) и Pl{%, У, t) в окрестности каждой внутренней точки области G могут быть разложены в ряд Тейлора, так что т^ /*. j.\ п / л , дР (х. у. t) /с. ν . дР (х. у: t) , ч , P(l4t) = P(r,y;t)-l -ir-i-it-*) + — γ/ (i-y) + + ^^«-*)Ρ + 2·*^<ε-«χΐι-*> + + ^У'0 (Ч - 2/)2} -Ь θ {(ξ - χ)2 + (η - уу}·/., (4) , 1 ί ^. (χ, у; ί) 0V>t (*,»;*) + —ι—a?—a-xf+2—Шу—{i-ccm-y)+ д2Р (х у t) Ί + Ld:, ' (Л - ?/)2 + θ' {(ξ - xf + (η - у)2}'/-, (5) где Ι θ I < Μ, Ι θ' К М\ причем Μ и F не зависят от ξ и η (но могут зависеть от х, у и t). П. В каждой внутренней точке области G выполняется соотношение 1ш/(*.^)=0. (6) В силу неравенства PL ^ Ρ отсюда также вытекает, что Ьш = о. (7) III. Функция р^(х,у, ξ, η; ί) удовлетворяет следующим условиям: ]л К~ Sр (х'у; ^ η; τ)(ξ ~х) dl dr]\=Ai {x>y)j (8) G l^o i*^" Sp (ж' y; ξ'η; τ)(η _ y)dSdn\=A^y)' ' (9* Й {"ST S P (Г' y; ξ' η; τ) (i ~ X)2 d*<*l} = Ян (^, ?/), (10)
126 14. К вычислению средней броуновской площааи \im {"27 j р (,т' у; ^ η; τΧη "" у^d% dvi}= Б™ (r' уЬ (И)| V™ {i Sр (χ> ^ ^η; τχ£"" *χη" ^ d^dx]}=5ΐ2 ^ ^ <12) lim {4" J Ρ (■». 2/! S. 4; τ)[(ξ - ж)2 + (η - 2/)2F» dg όη} = Ο, (13) G где Л1т A2, i?n, J912, i?22 — некоторые функции, определяемые эти ми соотношениями. При условии, что справедливы предположения ί, II и III, функции Ρ (χ, г/; t) и PL (χ, у; t) будут решениями следующего дифференциального уравнения: дР D д*Р . OD дФ , D 0з/> . А дР . , дР ,.,. — -B^-^ + 2B^^^ + B^^ + A^ — + A^-W' (14) Доказательство мы приведем для функции Ρ (χ, у; t), так как в случае функции PL (x, у; t) доказательство проводится совершенно аналогично. В силу (2) и (4) мы имеем Ρ (χ, у; t + τ) Ρ (χ, у; t) τ χ Ρ (*, Γ, г) . 1 + 4- ^ ρ (■*' ?/; ε. ^; τ)ρ & ^ ο ^ *> - P(x'xy;t) = G = P(xf'x) + 4- {S ρ(*. ^; δ, η;τ)^^π -1} ρ(*\ »; 0 + . G + — )ρ (*. у> Ι η; τΧΕ - ж) dS ац —l^il-l + G + 4" Sp ^y; ^η; τχτ> —yS) ^йг) dPlxdy't] + G ι 1 f / τ· \/f \9 тг 7 dlP (x,y\ t) , + ii~)p ('r> '^; £» ^; T)(S - *)*<*£ *i—dJ + G + ^7 Jp(я,2/;ξ,η;τ)(ξ — χ)(ν\ — y)did^ дгр^:t] + G + ^ J ρ (χ, ?/; Ι η; χ)(η - у? аЫч Щ^1'^ + а + -τ- $ р к ет δ. ч;τ) <(£ - ·*)2 + (η - ?/)2}J/2^ *i, (i5)
14. К вычислению средней броуновской площади 127 ι q" | ^ М". В силу (6) и (13) первый и последний члены правой г тИ равенства (15) при τ-> Ο стремятся к нулю. Но так как в силу (1) 1 — ^ ρ (ж, у; ξ, η; t) d\ ац = Ρ (χ, у; ί), G то при τ -> 0 стремится к нулю также и второй член правой части (15). Коэффициенты при производных Ρ по χ и у имеют предельные значения Аг, А2, Вг1, 2В12, В22; поэтому правая часть (15) при τ -> О стремится к правой части (14). Левая часть (15) также имеет предельное значение, которое равно dP/dt. Тем самым справедливость уравнения (14) нами доказана. Уравнение (14), которому удовлетворяет вероятность Р, сопряжено к уравнению Фоккера. Это уравнение можно также вывести при значительно более слабых предположениях (ср. [1—4]). Допустим теперь, что, помимо условий I—III, выполняются также следующие два условия IV и V: IV. При фиксированном t (где t ^> 0) вероятность Ρ (χ, у; t) стремится к единице, когда точка (х, у) неограниченно приближается к границе области G. При t =^= 0 для любой внутренней точки области G выполняется тождество Ρ (χ, у; t) = 0. V. При фиксированном t (где t ^> 0) вероятность PL (x, у; t) стремится к единице, когда точка (х, у) стремится к какой-либо внутренней точке части L границы, но она стремится к нулю, когда (х, у) стремится к какой-либо точке границы, лежащей вне части L. При t = 0 для каждой внутренней точки (#, у) области G выполняется тождество PL (χ, у; t) == 0. Принимая во внимание, что и Р, и PL ограничены (а именно, неотрицательны и не превышают единицы), легко показать, что Ρ и PL однозначно определяются уравнением (14) и условиями IV и V. 2. Вычисление площади, описываемой броуновской частицей конечного размера. Предположим теперь, что проекция броуновской частицы может быть представлена в виде круга единичного радиуса (при соответствующем выборе единицы длины). Так как мы ниже будем рассматривать только такие проекции, мы будем именно их Для простоты называть частицами. Отметим, впрочем, что соответствующую трехмерную задачу вычисления объема, описываемого броуновской частицей, можно исследовать совершенно аналогично. Центр частицы будет подчиняться законам, сформулированным в разделе 1. Из соображений симметрии естественно принять, что Αχ = А2 = В12 = 0и Вг1 = В22 = D. При этом уравнение (14) принимает следующий вид: Jf_ _ п ι д*Р д2Р о силу (10) коэффициент диффузии D определяется соотношением г> ι · Ε (ξ — χγ _. Ε (η — у) J* = lim —^—'— = hm v ' U) τ—ο Δχ τ—ο Ζτ
128 14. К вычислению средней броуновской площади где Ε — символ математического ожидания. Нетрудно убедиться, ^ \ значение D совпадает со значением аналогичной же ^постоянной дЛя трехмерного броуновского движения. Наша задача заключается в определении математического ожидания площади7 которую покроют последовательные положения частицы за время от t = 0 и до заданного t. Выберем в качестве начала ко- ординат точку, совпадающую с центром частицы в момент t = о. Обозначим через W (х, у; t) вероятность того, что в течение времени t заданная точка (х, у) будет по крайней мере один раз покрыта частицей. В случае, когда расстояния от точки (х, у) до начала координат не превосходят единицы, очевидно, W (х, у, t) = 1. Если же это расстояние превосходит единицу, то тогда точка {х, у) будет хоть раз покрыта частицей в том и только в том случае, если путь центра частицы по крайней мере один раз достигнет окружности единичного радиуса с центром в точке (х, у). В силу соображений симметрии вероятность такого события равна также вероятности того, что центр броуновской частицы, находившийся в момент t = О в точке (х, г/), за время t по крайней мере один раз достигнет границы круга S еди яичного радиуса с центром в начале координат. Эту же последнюю вероятность можно вычислить с помощью соображений, содержащихся в разделе 1 нашей статьи. | Таким образом, внутри круга S должно выполняться равенство W (х, у; t) = 1, (16) а вне этого круга функция W (х, у; t) должна удовлетворять дифференциальному уравнению dW Л(>£-+™). (17) dt \ дх2 дуг Кроме того, на границе круга S должно выполняться граничное условие W (х, у; t) = 1 (18) и должно быть справедливым также начальное"условие W (х, у; 0) = 0. (19) При нахождении математического ожидания броуновской площа- ди'можно рассуждать следующим образом. Пусть § — область, покрытая частицей за время t, a F — площадь этой области. Примем, что δ (χ, у; g) = 1 при (χ, у), расположенном внутри $, и δ (χ, у\ %) = 0 в противоположном случае. Ясно, что Ε {б (χ, у; %)} = W (χ, у; t), а броуновская площадь F может быть определена соотношением F = И б (χ, у; %) dxdy.
14. К вычислению средней броуновской площади 129 Отсюда вытекает, что Ε (F) = И Ε {δ (χ, у; $)} dxdy = Ц W {χ, у; t) dxdy. (20) 3. Решая нужную нам задачу с граничными условиями, перейдем к полярным координатам (г, φ). Ясно, что функция W будет зависеть только от радиус-вектора г, но не от угла φ. Выберем теперь так единицу времени, чтобы D приняло значение 1. В таком случае интересующая нас задача с граничными условиями для W (r, t) принимает вид dW __ d*W l dW 9, Tt ~~^~ ^ Т~ ~дГ' I*1' W (1,0 = 1; W(oo,*) = 0; (22) W(r,0) = 0, г>1. (23) Для решения этой задачи мы воспользуемся преобразованием Лапласа. А именно умножим обе стороны (21) на e~vt и проинтегрируем результат по t в пределах от 0 до оо. Применив интегрирование по частям и используя также начальное условие (23), для величины оо U {r, v) = J W (r, t) е~ы dt (24) о можно получить следующее дифференциальное уравнение: &U , 1 dU гт л ,ок\ —+ — -ir-vU = 0· <25> Из граничных условий (22) для функции W вытекают следующие условия для U: U (ί,ν) = l/v; U(oo,v) = 0. (25') Решение уравнения (25) при условиях (25') имеет вид U(r,v) = ±K^K ' » K(\fv) где Ζ (x)=-|L #<'>(«), — первая функция Ганкеля нулевого порядка (см. [5, раздел В силу (24) для того, чтобы найти функцию W (г, £), нам надо только решить линейное интегральное уравнение первого рода 00 \W(r,t)e-«dt=± K{rVrI) . (26) ^ -A·· H. Колмогоров
130 14. К вычислению средней броуновской площади Правая часть этого уравнения при Re ν ^> 0 представляет собой це: лую функцию переменного v. В самом деле, в силу известной теоре^ (см., например, [6, раздел 15.7]) функция К (х) не имеет нулей црй I arg х I ^ я/2. Решение интересующего нас интегрального урав, нения в случае, когда правая часть удовлетворяет указанному условию, хорошо известно (см., например, [7, раздел 6.7])и имеет следующий вид: TJ7/ *v 1 С evt К (гifv ) , α—гоо χν где интегрирование проводится по прямой, параллельной мнимой оси, а а)>0. Тем самым мы нашли решение нужной нам задачи с граничными условиями. Выражение (27) справедливо при г ^> 1; если же г^1, то в силу (16) W(r,t) = l. (27') Для математического ожидания Ε (F-) в силу (20)—(23) и (27') мы получаем оо оо E(F) = 2n [W(r,t)rdr = n+ 2π \w(r,t)rdr = 0 1 оо t t оо = π -f 2π \ \ ——rdrdt = π +2π \ dt \ rdr( d*W , ί dW дг* ' г дг ι 1 о t = Jt_2n$-^iU (28) о ' причем в силу (27) a-fioo E(F)=i [ 4-I^ldv+h, (28') 4 ν1* Κ nfv ) a—гоо где a+гоо τ . . С ί Κ' (if ν ) , J ν1* Κ (if ν ) Φ) Найдем асимптотическую формулу для Е (F), справедливую длЯ больщих t. Известно (см. [5, раздел 17.71]), что К(х)=- /о (te) In -ψ + х2Р (χ), К! (χ) = iiM. -iln-f/0 (te) + x [2P (x) + xP' (x)l
14. К вычислению средней броуновской площади 131 е у = ес, С — постоянная Эйлера (так что γ = 1,7810...), а Р (χ) — целая функция. Следовательно, 1 = т—7 7пГ + XR ix)\ x\n(yxj2) ' v ' ί Ια (γ*/2) /Q (ίχ)β - 2P (χ) - Ρ' (χ) χ + Ρ (ζ)/1η (у χ β) R (χ)= ' ' /0 («?) In (yx/2) - χ*Ρ (χ) ' Так как Κ'(χ)ΙΚ(χ) не имеет особенностей при | arg χ | < π/2 (за исключением точки χ = 0), а при | # | -> оо эта функция стремится к нулю (что следует из известных асимптотических формул К (χ) ~ г* (п/2У'2е-х/хг/* и К' (χ) ~ — (п/2)Ч*е-х/хЧ*), то R (х) не имеет в этой же области других особенностей, кроме особенности в точке х = 21 у. При стремлении χ к нулю дм—-f+ л ' в 2 ' 1η(γ*/2) In (γζ/2) ' так что | R (χ) | при этом остается ограниченным. В силу (28') мы можем положить Ε (F) = /о + /ι + /а, " (29) где α+гоо а+гоо а—гоо Для того чтобы избежать особенности функции R (Yv) в точке у = 4/γ2, мы выберем в качестве пути интегрирования прямую, пересекающую вещественную ось между значениями 0 и 4/γ2; иными словами, мы примем, что а < 4/γ2. В таком случае интеграл /2 легко оценить. Полагая vt = ξ, получаем Κ+ίοΟ α£_|_|θΟ Ot—гоо а£_|оо β+гоо β—гоо ГДе β можно считать независимым от ί. Выражение №«(УЩ* при любом ί будет ограниченным. В этом легко убедиться, применяя к его вещественной и мнимой частям вторую теорему о среднем значении. 5*
132 14. К вычислению средней броуновской площади ezT dz z^lnz Таким образом, мы убедились, что I /2 = 0(1). (30) Интеграл /0 не зависит от £, так что h = 0(1). (31) Остается только оценить интеграл a-fioo vf αΗ-гоо Il = 2i I ,4n(Yt/4) =2i{-ir) [ а—гоо аг—гоо где положено ζ = vy2/4, x = 4ί/γ2, аг = γ2α/4. Преобразуя подынтегральную функцию интеграла 1г с помощью тождества л -2 Ш 2 _ л л г* л z2lnz In z ' In z J ' In ζ ' о мы получим 1 · at-fioo Οίχ+ΐοο /χ = — ίγ2 J da Jj 6?"2α in ζ+ζτ dz + i-^- { in ζ clx—гоо at—гоо В слагаемом, пропорциональном \ , , интегрирование можно вести вдоль мнимой оси. При этом легко показать (например, при-, лагая вторую теорему о среднем значении к вещественной и мнимой β D частям интеграла), что это слагаемое имеет порядок О (1). В выражении j e~2a ln z+zxdz путь интегрирования можно деформировать таким образом, чтобы он совпал с петлей ®, охватывающей отрицательную часть вещественной оси (см. рисунок), после чего можно преобразовать это выражение следующим образом: ^ е-2а In z±z% fa = Х2а-1 С ζ-2αβζ ^ζ; ζ=ΖΧ. Воспользуемся соотношением (см. [5], раздел 12.22]) в силу /ι = = 2πί r(2e)j ' которого _ 2пу* τ 1 i 0 ^2α 1η τ j-7 Γ (2a) a da + 0(1).
14. К вычислению средней броуновской площади 133 Интеграл в правой части последнего соотношения равен 2 . ι ι ы in τ __ Jt*? е~у 1η τ dy J^l ί С *~У 1η τ <* У , ΑΤφϊΓ**"" 2 ) Y(2-y) — 2 1J V(2-y) + о о о ι e (i-y)g"i/1Q'ctfyι + t) Г(2-г,) ίο Отсюда в силу (29), (30) и (31) следует, что 1 Sp-y In τ з г(2-? +<?(1>· При больших значениях 1η τ имеет место асимптотическое соотношение f е~У1ахау 1 1 J Г(2-к) In τ 1η(4ί/γ2) > ο и, следовательно, При 0 < у < 1 выполняются неравенства х^ Г (2-if) ^ 0.; Г (2 - у) ^ 0,88 · и поэтому -*lnTdy . 1 1 ^ f e^lnTdy ^ In τ ^- J Г (2 - у) ^ 0,881η т * о Желая получить асимптотическое разложение для Ε (F), мы можем при помощи последовательных интегрирований по частям представить последний интеграл в виде Ь e-y^^dy _ 1 f, 1 ψ(2) J Τ (2-у) — In τ-Γ (2) J1"1" In т Г (2) ^ о , 1 ψ8(2)-Ψ/(2)Γ(2) 1 "Оп^т Г (2) +···}» гДе ψ (а;) = Γ' (а; ~ ί)/Τ(χ — 1). Подставляя сюда числовые значения функций Г и Ψ, получаем 1 ;— In l,26f lli In 1,26* ln*l,26t "h---j + «Λ*;·
134 15. Об эмпирическом определении закона распределения В случае, когда времена и длины измеряются в произвольных ед^% ницах, t должно быть заменено на Dt/σ2, a F — на F/σ2, где о -^ радиус частицы. Таким образом, окончательно мы получаем Ε (Л inDt fl I °'423 °'467 I 1> + 0(1). Эта формула и представляет собой асимптотическое решение постав· ленной задачи. ЛИТЕРАТУРА 1. Kolmogoroff А. N. Ueber die analytischen Methoden in der Wahrscheinlich- keitsrechnung.—Math. Ann., 1931, Bd. 104, H. 3, S. 415—458. Рус. пер.: УМН, 1938, вып. 5, с. 5—41. 2. Kolmogoroff А. N. Zur Theorie der stetigen zufalligen Prozesse.— Math. Ann., 1933, Bd. 108, H. 1, S. 149—160. 3. Kolmogoroff A. N. Eine Verallgemeinerung des Laplace—Liapounoffschen Satzes.— Изв. АН СССР, OMEH, 1931, с 959—962. 4. Kolmogoroff A. N. Ueber die Grenzwertsatze der Wahrscheinlichkeitsrech- nung.— Изв. АН СССР, OMEH, 1933, с 366-372. 5. Whittaker E. Т., Watson G. N. A course of modern analysis. Cambridge: Univ. Press, 1927. 608 p. Рус. пер.: Уиттекер Э. Г., Ватсон Г. Н. Курс современного анализа. М.: Физматгиз, 1963. Ч. 1. 343 с. Ч. 2. 515 с. 6. Watson G. N. A treatise on the theory of Bessel functions. Cambridge: Univ. Press, 1922. 804 p. Рус. пер. 2-го англ. изд.: Ватсон Г. Н. Теория бесселевых функций. М.: Изд-во иностр. лит., 1949. Ч. 1. 799 с. Ч. 2. 219 с. 7. Fowler R. Η. Statistical mechanics. Cambridge: Univ. Press, 1929. 864 p. 15 ОБ ЭМПИРИЧЕСКОМ ОПРЕДЕЛЕНИИ ЗАКОНА РАСПРЕДЕЛЕНИЯ* Рассмотрен вопрос о возможности определения закона распределения на основании конечного числа испытаний. 1. Пусть Хъ Х2, . . ., Хп — результаты η взаимно независимых наблюдений, расположенные в порядке возрастания, Хг ^ Хг ^ < . . . < Хп, и пусть F (χ) = Ρ {Χ < χ} — закон распределения, соответствующий этой последовательности наблюдений. Эмпирическим законом распределения называется * Sulla determinazione empirica di una legge di distribuzione.— G. 1st. ital· attuar., 1933, vol. 4, N 1, p. 83—91. Перевод А. С. Холево.
15. Об эмпирическом определении закона распределения 135 функция Fn (χ), определяемая соотношениями Fn (χ) = °» х < χύ Fn ix) = kln* Χ*<;Χ< X^l9 к = 1, 2, . . ., η — 1; Следовательно, nFn (x) представляет собой число значений Хкг на превосходящих х. Естественно, возникает вопрос: приближается ли Fn (χ) κ F (х), когда η очень велико. Теорема, относящаяся к этому вопросу, была сформулирована фон Мизесом [1] под названием метода со2. Однако фундаментальное утверждение о том, что вероятность выполнения неравенства D = sup | Fn (χ) — F (χ) Ι < ε стремится к единице при η -> оо для любого ε, на мой взгляд, да сего времени не было ясно сформулировано, хотя его было бы можно доказать различными простыми способами. Я получу это утверждение как непосредственное следствие доказываемой ниже теоремы. Должен добавить, что постановка рассматриваемого вопроса мотивирована недавними исследованиями Гли- венко [2]. Теорема I. Вероятность Фп (λ) неравенства D = sup | Fn (χ) - F (χ) |< λ/γη стремится, при η —>- оо равномерно по % κ -f-oo Φ(λ) = 2 (—ι)**-**** (i) — оо для любой непрерывной функции распределения F (х). Ниже приводится таблица некоторых значений Φ (λ), вычисленных Η. Кожевниковым. λ 0,0 0,2 0,4 0,6 0,8 Φ (λ) 0,0000 0,0000 0,0028 0,1357 0,4558 λ 1,0 1,2 1.4 1,6 1,8 Φ (λ) 0,7300 0,8877 0,9603 0,9888 0,9969 λ 2,0 2.2 2'Λ 2,6 2,8 Φ (λ) 0,99932 0,99986 0,999973 ! 0,9999964 0,99999966 Из этой таблицы видно, что неравенство D <^ 2,4/]/" и. может Рассматриваться как практически достоверное. Кроме того, оказывается Φ (0,83) ~ 0,5.
136 15. Об эмпирическом определении закона распределения Если λ мало, то ряд (1) сходится очень медленно; в этом случае можно использовать асимптотическую формулу | φ(λ)~ J^e-*Vu\ При λ = 0,6 эта формула дает Φ (0,6) ~ 0,1327 вместо значения Φ (0,6) ~ 0,1357, вычисленного посредством точной формулы (1). 2. Лемма. Функция вероятности Фп (λ) не зависит от функции распределения F (х), если последняя предполагается непрерывной. Доказательство. Пусть X — случайная величина с непрерывным законом распределения F (х); случайной величине Υ = = F (X) соответствует, очевидно, закон распределения JW (#)? такой, что ^(0) φ = ο, χ < 0; F(° (χ) = χ, 0<χ< 1; FM(x) = l, x>l. Если Fn (χ) и F^ (x) представляют эмпирические законы распределения X и Υ по η наблюдениям, то верны следующие равенства: Fn (χ) -F(x) = FT [F (χ)] - F9) [F (χ)] = F® (у) - Л°> (у), sup I Fn (χ) - F (χ) |.= sup | Ff (y) - F& (y) |. Отсюда вытекает, что функция Фп (λ)., соответствующая произвольной непрерывной функции распределения F (х), идентична той, которая соответствует функции F^ (x). Поэтому при доказательстве нашей теоремы можно ограничиться случаем F (х) = /W (x). В дальнейшем вместо F^ (x) будем писать Fn (x) и ограничимся значениями χ в отрезке 0 <^ χ < 1, где F^ (χ) ==■ χ. Тогда наша задача сводится к нахождению вероятности Φη (λ) неравенства sup \Fn(x) — x\< λ/γη, 0 < χ < 1. (2) Пусть λ имеет вид λ = μ/Υ η, где μ — целое число. Подставляя в (2), получаем Φ„(λ) = Ρ{8πρ|^„(3;)-χ|<^.}, λ = -£Γ. (3)
15, Об эмпирическом определении закона распределения 137 функция Fn (χ) принимает лишь значения, кратные Ищ пусть^ например, Fn (χ) = iln и χ = j/n + ε (Ο < ε < ί/η). Принимая во внимание, что Fn (x), будучи функцией распределения, является монотонной функцией, получаем немедленно Fn(x)-* — ε, ?.(4·) - 4· < F«<*> - <*- ε>=-^ · '.(■4±)-Ψ->'.(*)-(*+4—)- Поэтому для выполнения неравенства 1-/-1 \Fn(x) — x\- * —7 — ε -^ η необходимо, чтобы выполнялось по крайней мере одно из следующих неравенств: n\ η ) η ^ η ^ η ' F (1±1) _ i±L Γη\ η j η η ^ η ' Отсюда следует, что формулу (3) можно заменить следующей: On(X)=p{max|Fn(4-)-4|<-r}> * = 0,1,...,/». (4) Пусть теперь Р^ — вероятность события 2?ifc, состоящего в одновременном выполнении соотношений I Fn ψη) — j/n I < μ/η, j = О, 1, . . ., k; Ι ί'η (&M) — kin \ = i/n. Заметим, что Φη (λ) = /W При k = 0, очевидно, имеем Ли> = 1, Ло = 0 (i#0). Вообще Л* = о (5) /6> (7> (8) пРи И | Ξ> μ» цоскольку в этом случае неравенства (5) противоречить Далее, Ртг = %Р*<2$\ |»|<μ, (9)
138 15. Об эмпирическом определении закона распределения где (?jr обозначает вероятность события Εί1ί+1 при условии, что выполнено событие £'д, т. е. вероятность равенства (Ю) '.(^)-'.(-г)- при условии Fn {kin) = (Л + i)ln. j-i + i η (И) Соотношение (11) означает, что из результатов η наблюдений Xl9 Х2, . . ., Хп ровно η — к — у попадают в промежуток kin <^ <^ χ <[ 1; равенство (10) может поэтому выполняться только в том случае, когда i — 7 + 1 из указанных η — к — / результатов наблюдений находятся в промежутке kin < χ <^ (к + 1)//г. При условии, что Хт имеют равномерное распределение, получаем следующее выражение для искомой вероятности: Формулы (7)—(9), (12) и (6) позволяют найти вероятность Φη(λ) в случае λ = μ/]/~η. Эти формулы можно заменить другими, более удобными. Для этого положим Д«= ^~^Z *-kp*· (13) (и—fe —i)Un- (л-Л)п"*~*л! Условия (7) и (8) переходят в следующие: . #оо = 1, Л«о = 0,. J^=0; (14) Л« = 0, | И > μ. "' . (15) Соотношение (9) после элементарных вычислений сводится к формуле (16) Игк+1 - Наконец, Φη(λ) = j из (6) и (13) = —γζ- е /f0n. η 1 е-г + 1)! · получаем (17) Формулы (14)—(17) также позволяют найти Φη (λ) в случае λ = = μ/γη. 3. Пусть теперь Уъ Υ2, . . ., Υη — последовательность взаимно независимых случайных величин с законом распределения, характеризующимся формулой
15. Об эмпирическом определении закона распределения 139 Е€ЛИ ПОЛОЖИТЬ Sk = γ, + γ2 + ... + η, легко убедиться, что вероятность Rik одновременного выполнения соотношений \Sj \< μ, / = 0, 1, . . .,&; Sk = ί/μ, V ; удовлетворяет тем же условиям (14)—(16), что и Rik; другими словами, Rut = Rut- Это позволяет дать асимптотическое выражение для Ra при η —>■ оо. Для достижения этой цели может служить следующая общая Теорема II. Пусть Yl4 Y2, . . ., Υη — последовательность взаимно независимых случайных величин, принимающих лишь кратные постоянной г значения. Пусть Ε (Yk) = О, Ε (Yi) = 2bkj E(\YU) = dk, Sk = Y1 + Y2 + ...+Y*, h = bi + b2 + · · · + bk и а (t), b (t) — непрерывно дифференцируемые функции, удовлетворяющие неравенствам a(t)<b (f), a (0)< 0 < Ъ (0). Обозначая Rin вероятность одновременного выполнения соотношений & (h) <Sk<b (tk), k = 1, 2, . . ., τι, Sn = ί& и и (σ, τ, s, t) функцию Грина уравнения теплопроводности df/dt = d2f/ds2 в области G, определяемой неравенствами a{t)<s<b (0, имеем Rin = г-{и (0, 0, ΐε, ί^) + Δ}, где Δ равномерно стремится к нулю вместе с ε, если выполняются следующие условия: a) a (t) и Ъ (t) остаются постоянными, a tn ограничены фиксированными пределами °<T1<tn<T2;
140 15. Об эмпирическом определении закона распределения b) существует постоянная С ^> 0 такая, что dk/bk < Се; c) существует постоянная К ^> 0 такая, что для любого к можно найти ifr, для которого удовлетворяются неравенства Ρ {Υ* = i*e} > К, Ρ {Ук = (ik + 1) ε} > Ζ; d) существует постоянная А такая, что a(tn) + A <i&<b (tn) — Α. В остальном величины Υ^, α также их количество η и целое i могут произвольно зависеть от ε. Эта теорема относится к тому же кругу идей, что и теорема, изложенная в моей заметке [3]. Впрочем, утверждение сформулированной выше теоремы является более точным: теорема в указанной заметке позволила бы утверждать лишь, что Σ Rin=l u(0,0,z,tn)dz + A', {=p ρε где Δ' стремится к нулю вместе с ε при выполнении условий а) и Ь). Условие с), являющееся существенной частью нашей новой теоремы, уже использовалось фон Мизесом в аналогичных рассмотрениях. В нашем случае 8 = 1/μ, Ε (Yk) = 0, Ε (У?) = 2bk = 1/μ2, Ε (У?) = dk = C/μ3, dk/bk = С/μ = С г, tn = η/2μ2 = 1/λ2, α (ί) = —1, b (t) = + lf доп=8{^0,0,0,-^) + д}, -foo (s-2k)1 "«"•"•'■^Τ^γΣ*-1'"'" " 2|/"πί φη(λ) = Ρ„„=-^ί"ί?0η = = ,/Η-η+δ,-ΐ-{7|^£(-ΐ)ν«·+Δ}= ^ —οο = V (- 1)* r«w + Λ = Φ (λ) 4- R- Остаток R в этой формуле стремится равномерно к нулю при η -*■ оо в случае, если λ больше некоторого определенного λ0 ]> 0.
16. О предельных теоремах теории вероятностей 141 Действительно, в данном случае ε = 1/μ = ί/(λγη) стремится ^лулю при п->- оо. Утверждение теоремы I, таким образом, доказано для значений % вида μ/]ίη и при условии λ ^>λ0. Поскольку предельная функция φ (λ) непрерывна и имеет предельное значение Φ (0) = 0, то легко видеть, что указанные ограничения несущественны. К вопросу доказательства теоремы II мы предполагаем вернуться в следующей заметке. ЛИТЕРАТУРА 1. Mises R. von. Wahrscheinlichkeitsrechnung und ihre Anwendung 'in der Sta- tistik und theoretischen Physik. Leipzig; Wien: Fr. Denticke, 1931. 2. Glivenko V. Sulla determinazione empirica delle leggi di probabilita.— G. 1st. ital. attuar., 1933, vol. 6, N 1, p. 92—99. 3. Kolmogoroff A. Eine Verallgemeinerung des Laplace—Liapounoffschen Sat- zes.— Изв. АН СССР, OMEH, 1931, с 959—962. 16 О ПРЕДЕЛЬНЫХ ТЕОРЕМАХ ТЕОРИИ ВЕРОЯТНОСТЕЙ* Основополагающие идеи П. Лапласа [1] и П. Л. Чебышева [2], как известно, были обобщены после работ А. А. Маркова [3] и А. М. Ляпунова [4] в весьма общем утверждении (так называемая теорема Ляпунова) о пределе распределения вероятностей для суммы большого числа малых независимых случайных величин. В дальнейшем исследования А. А. Маркова [5] и С. Н. Бернштейна [6] показали, что аналогичное утверждение во многих случаях справедливо и для сумм не полностью независимых величин. Эти обобщения в особенности важны для приложений, но принципиально они не идут много дальше: во всех случаях, исследовавшихся этими авторами, лишь мало удаленные друг от друга слагаемые сильно зависят друг °т друга, но если разложить сумму на достаточно длинные частные суммы, то последние будут уже почти независимы. Гораздо дальше идет дву- (и много-)мерное обобщение теоремы Ляпунова на случай сумм случайных векторов, впервые строго обоснованное С. Н. Берн- штейном [6]. После всех этих исследований осталось еще определить неизвестные даже в простейшем случае независимых слагаемых предельные значения вероятностей разного рода, связанных со всем набором частных сумм данной последовательности случайных величин. * Ueber die Grenzwertsatze der Wahrscheinlichkeitsrechnung.— Изв. АН СССР, OMEH, 1933, с. 366—372. Представлено С. Н. Бернштейном. Перевод К. И. Осколкова.
142 16. О предельных теоремах теории вероятностей К этой области во всяком случае относятся старые результаты П. Лапласа и С. Пуассона [7] о вероятности разорения игрока которые нашли продолжение в исследованиях П. Леви [8]. Недавно я опубликовал одно общее утверждение подобного рода [9]. Некоторые частные двумерные проблемы аналогичного типа между тем были исследованы Р. Люнебургом [10]. В обеих из последних работ выяснена связь, существующая между этими проблемами и дифференциальными уравнениями теплопроводности [И]. Несколько месяцев назад И. Г. Петровский в Москве нашел общий метод, который в весьма общей ситуации сводит к соответствующим дифференциальным уравнениям теоретико-вероятностные задачи о суммах малых случайных величин. В настоящей работе этот метод будет применен к доказательству теоремы Ляпунова (§ 1) и моей вышеупомянутой теоремы (§ 2 и 3). Приложения к задаче блуждания можно найти в еще неопубликованной работе И. Г. Петровского, существенно обобщающей постановки задач Р. Люне- бурга. По-видимому, метод может быть также применен, когда закон распределения каждого слагаемого #&+ι зависит от суммы % = хг + + х2 + . . . + Хъ всех предыдущих слагаемых. Этот случай является решающим для строгого математического обоснования теории диффузии, когда внешние силы, а также коэффициенты диффузии являются функциями точки. При этом пришлось доказать, что законы распределения сумм могут быть приближенно представлены соответствующими решениями дифференциального уравнения Фок- кера—Планка [12, 13]. § 1. Пусть — независимые случайные величины с математическими ожиданиями Ε (χ,) = 0, Ε (xl) = 2h, Ε (Ι ζ* I3) = 4," и пусть при этом отношения d^ : Ъ^ по своей величине равномерно ограничены фиксированной постоянной dklh < μ. (Ι) Из (1) в силу хорошо известного неравенства моментов Ьк ^ di вытекает, 4JTO h < μ2. (2) Положим, далее, Х\ Н~ #2 I · · · ~Г xJt == Sfc> Sn == *^t h + &2 + · · · + h = tit tn= Т.
16. О предельных теоремах теории вероятностей 143 Пусть Τ фиксировано (а п меняется); тогда теорема Ляпунова утверждает, что ?{a<S<b}=—ί=^-/4Γώ + ΘΛ(μλ (θ|<ΐί (3) α где Р обозначает вероятность выполнения неравенства в скобках, a R (μ) стремится к нулю вместе с μ. Чтобы доказать это, рассмотрим вероятность P*(s) = р & < S - sk + s < Ъ) с тем, чтобы в предположении sk = s сумма S содержалась между а и Ь. Искомая вероятность Ρ {а < S < Ь}, очевидно, совпадает с р0 (0). Pfc (s) удовлетворяет уравнению г Рк (s) = ί /Vi (^ + х) dTui (*), к = 0, 1, 2, . . ., η - 1, (4) где 7\+ι — функция распределения хк+1, а интеграл берется от — оо до + оо. Кроме того, Рп (s) — 1, если а < s < Ь, (5) Лг (s) — 0» если s <Г α или s^b. Начальные условия (5) и уравнение (4) однозначно определяют Рк (s) для всех к (0 <^ /с <^ п). Назовем Рк (s) верхней функцией, если выполнены неравенства Р* (*) > \Pli (* + *) ^1 (*), (6) Pi (s) > Pn (s). (7) Нетрудно проверить, что неравенство Pt (s) > Ρ, (s) (8) сохраняется и при k<Z п. Аналогично определяются и нижние функции. Мы хотим построить теперь функцию и* (s, t), которая для каждого достаточно малого μ приводит к верхней функции ΡΪ (8) = U* (8, Ъ). (9) С этой целью сначала мы определим четырежды непрерывно дифференцируемую функцию ν (s), которая удовлетворяет следующим неравенствам: v(s) = 0, *<α-ε, 0<y(s)<l, Ъ < s < Ъ + ε, 0 < ν (s) < 1, а — ε < s < α,, у (s) = 0, b + ε < 5. v(s) = l, α<5<6, . (10) 1 Формула^ (4) доказывается:совершенно аналогично формуле для функции распределения суммы двух независимых величин; см., например: Levy P., Calcui des probabilities. Paris, 1927, p. 187.
144 16. О предельных теоремах теории вероятностей Пусть теперь S^')=2i^rr7) ^(· + *>^м,*. (И) и* (s, ί) = в (5, ί) + ε (Γ - t). (12) При этом в (10), как и в (12), ε > 0. Функциями (s, t) удовлетворяет (при t <! Τ) дифференциальному уравнению ди/dt = —d2u/ds2 (13) и ее производные до четвертого порядка по s и второго по t ограничены. Пусть Μ — верхняя граница этих производных. Если определить функцию Рк (s) по формуле (9), то получим Рп (s) = и* (s, Т) = й (*, Г) = ν (s) > Рп (*). Таким образом, условие (7) выполнено. Поэтому достаточно доказать (6) для малых μ. С этой целью рассмотрим разность Δ = Pt (s) - J P*+i(s + x)dTk+1(x) = z(T -tk) + u (s, h) - — ε (Γ — tk+1) — Jj й (s + x, tk+1) dTk+1 (χ) = ε (tk+1 — tk) + Ид d2 x2 U (S, tk+1) + -^-Il(S, tk+1) X + -gjj- U (*, tk+1) -γ + + ΘΜ \x31} dTk+1 (x) = &bk+1 + и (s, tk) — й (s, tk+1) — -■£-»(*. **+i) b*+i + VM dk+u (14) |θ|<1, |θ'|<1. Но поскольку й (s, h) — й (s, ifc+i) == = --Lu(s, WXW - fk) + 0"ilf (ik+1 - hf = |ΘΊ<1. |ew|<i, то из (14) с учетом (1) и (13) следует, что Δ = ebk+1 + {- -ft й (s, ik+1) _ -|1 ц («, it+i)} &fc+i + Θ» W6k+Ui + + θ""Λ^+1μ2 = 6fc+i (e + B™M μ -f θ'"Λ4μ2), (15) Ι θΐν Ι < 1. Из (15) непосредственно следует, что если μ достаточно мало, то Δ>0,
16. О предельных теоремах теории вероятностей 145 что и доказывает условие (6). Поэтому для достаточно малого μ Рк (s) является верхней'функцией, и выполнено неравенство Pifl<*n<b} = ^o(0)<i>J(0) = a*(0,0) = ъ = гТ + —Цг \ v (х) er+W dx = —±=r \ ,-»·/«■ dx + R, (16) ν ν α причем R при соответствующем выборе в сколь угодно мало. Рассмотрение нижних функций дает обратное неравенство, и таким образом наша главная формула (3) полностью доказана. § 2. Пусть теперь a (t) и Ъ (t) — четырежды непрерывно дифференцируемые функции t, удовлетворяющие условиям a(t)<b (ί), а (0)< 0 < Ъ (0). (17) Спрашивается, какова вероятность Ρ выполнения всех неравенств a(tk)<sk<b(th), к = 1, 2, 3, . . ., п. (18) Неравенства 0 < t < Г, α (ί) < s < δ (ί) (19) определяют в плоскости (s, t) некоторую область G. Пусть и (s, t) — ограниченное решение уравнения duldt = —9*u/ds* (13) в этой области G с граничными условиями u(s, Τ) = 1, a(T)<s<b(T)9 и [a (i), t] = 0, 0 < t < Г, (20) м [6 (i), f] = 0, 0 < t < Г. Наша цель — установить, что Ρ = к (0, 0) + 9Л (μ), |θ |<1, (21) причем i? (μ) стремится к нулю вместе с μ. Рассмотрим для этого, общее, вероятность Рк (s) того, что неравенства а (U) <8ь-8к+8<Ь (ί,) (22) выполнены для всех г, к <[ г <^ п. Искомая вероятность равна Р0 (0) Если a(h)<s<b(tk), k<n, (23) То Рн (s) удовлетворяет тому же уравнению Р* (*) = I /Vi (* + х) dTk+1 (x), (4)
146 16. О предельных теоремах теории вероятностей что и в § 1. Вместо условий (5) теперь появляются следующие: Рп (s) = 1, если а (Т)< s < Ъ (Г), (24) рп (s) = 0, если s < а (Тк) или s > Ь (Тк). Уравнения (4) и (24) однозначно определяют Рк (s) для всех к (О < к < п). Назовем теперь Р* (s) верхней функцией, если из (23) следует неравенство Pt (s) > f Ρΐ+1 (s + χ) dTk+1 (χ) (25) и Pt (s) > 1 для~а (Г)< s < Ъ (Г), Рп {s) > 0 для s ^ а (Тк) и соответственно s > Ъ {Тк). Как и в § 1, доказывается, что при к <С η остается справедливым неравенство Pt (s) > Рк (*). Чтобы построить верхнюю функцию, нам потребуется функция и (s, ί), которая определяется в области G как решение дифференциального уравнения (13) со следующими граничными условиями: d(s, Г) = 1, а(Т)<8<Ъ(Т)9 и {α (ί), ί} = ν (ί), 0 < t < Г, (27) й {Ъ (ί), ί} = г; (ί), 0 < f < Г, причем г; (г) — четырежды непрерывно дифференцируемая функция, которая удовлетворяет условиям ν (ή = 0, 0 < t < Τ — ε, О <!>(*)< It Γ-8<*<Γ, (28) ι;(ί) = 1, г;' (Г) = if (T) = 0. Поскольку г/ (s, t) (в том числе и на границе G) имеет непрерывные производные до четвертого порядка, то можно так продолжить эту функцию вне G, что производные по s до четвертого порядка останутся ограниченными во всей плоскости (s, t) и всюду и (*. *) > — ε. (29) Теперь положим и* (*, ί) - й (5, t) + ε + ε (Τ - *), (30) /*?(*) = "*(*»**). (9)
16. О предельных теоремах теории вероятностей 147 Доказательство того, что Ρ и (s) для каждого достаточно малого является верхней функцией, остается, если не считать очевидных изменений, тем же, что и в § 1. Таким образом для указанных μ получаются неравенства Р = Р* (0) < ^о (0) = и* (0, 0). ^* (0, 0) стремится к и (0, 0) при ε -> 0. Для завершения доказательства формулы (21) остается провести в целом аналогичные оценки вероятности Ρ снизу, что достигается с помощью того же метода для нижних функций. § 3. Пусть теперь Р^ и соответственно Р(2) обозначают вероятность существования такого к, что a (tt) <Si<b (fj), i = 1, 2, . . ., к — 1, ^ % < a (tk), и соответственно a (h) <st<b (tt), i = 1, 2, . . ., к — 1, b (h) < sft, (32) и наконец, Ρ (#, ι/) — вероятность того, что выполнены все неравенства α ftt)< «it < Ь (**). А = 1, 2, 3 л — 1, (33) x<*n<Vi причем а (Г)< а; < г/ < b (T). Тогда выполнены предельные соотношения РМ = ц(Ц (0, 0) + №RV (μ), | Q'1) | < 1, (34) РЮ = „(«; (о, 0) + Θ'2>Λ(2> (μ), [ θ<2> Ι < 1, (35) Ρ (x, У) = и*.„ (0, 0) + QR (μ), Ι θ |< 1, (36) причем i?№ (μ), R 2) (μ) и i? (μ) стремятся κ нулю вместе с μ и «(1)(«, ί), и(8)(М)ии„(М) — ограниченные решения дифференциального уравнения (13), которые определены с помощью следующих граничных условий: uW (s, Τ) = 0, а < s < Ь, м(1) {« (ί), 0 = 1, 0 < ί < Τ, (37) м(1) {& (t), t} = 0, 0 < ί < Τ, u(Z)(s,T) = 0, a<s<b, u(2) {a (t), f} = 0, 0 < t < Z\ "(2) {&(*), t) = 1, 0<*<Γ,- (38)
148 16. О предельных теоремах теории вероятностей их, у (s, Τ) = 0, а < s < х, их% у {a (t), t) = О, О < t < Ту их,у (s,T) = i, x<s< у, uXtV {b (ί), t} = О, О < ί < Г. uXty(s,T) = 0, y<s<b, (39) Доказательство остается тем же, что и в § 2. В моей вышеупомянутой работе [9] для этих же величин и(1> (0, 0), и<2) (0, 0) и их,у (0, 0) получены другие выражения 2. Днепропетровск, 8 июня 1932 г. ЛИТЕРАТУРА 1. Laplace P. Theorie analytique des probabilite. 3 ed. Paris, 1886. 2. Tchebycheff P. L. Sur deux theoremes relatifs aux probabilites.— Oeuvres de Tchebycheff. St.-Petersb., 1907, vol. 2, p. 481—491. 3. Марков А. А. Закон больших чисел и метод наименьших квадратов.— Изв. физ.-мат. о-ва при Казан, ун-те, 1898, т. 8. 4. Liapounoff A. M. Sur une proposition de la theorie des probabilites.— Bull. Acad. sci. St.-Petersb., 1900, vol. 13, p. 359; Nouvelle forme du theoreme sur la limite de probabilite.— Mem. Acad, sci., St.-Petersb., 1901, vol. 12, N 5. 5. Марков А. А. Распространение предельных теорем исчисления вероятностей на сумму величин, связанных в цепь.— Зап. Акад. наук, 1910, т. 22. 6. Бернштейн С. Н. Распространение предельной теоремы теории вероятностей на суммы зависимых величин.— УМН, 1944, вып. 10, с.65—114 (рус. пер. из: Math. Ann., 1926, Bd. 97, S. 1—59). 7. Poisson S.-D. Recherches sur la probabilite... Paris, 1837. 8. Levy P. Nuove formule relative al giuoco di testa e croce,— G. 1st. ital. attuar., 1931, vol. 2, p. 3. 9 Kolmogoroff A. N. Eine Verallgemeinerung des Laplace—Liapounoffschen Satzes.—Изв. АН СССР, OMEH, 1931, с 959—962. 10. Luneburg R. Das Problem der Irrfahrt.— Math. Ann., 1931, Bd. 104, S. 700. 11. Courant R.,Friedrichs K.,Lewy H. Uber die partiellen Differenzengleichungen.— Math. Ann., 1928, Bd. 100, S. 32—74. 12. Fokker Α.— Ann. Phys., 1914, Bd. 43, S. 812. 13. Plank M,— Sitzungsber. Preuss. Akad. Wiss., 1917, 10. Mai. 14. Kolmogoroff A. N.— Math. Ann., 1931, Bd. 104, S. 415, особенно § 12-14. 2 В моих упомянутых работах [9] и [14] не предполагается многократная диф- ференцируемость a (t) и b (t). Если a (t) и Ъ (t) только один раз непрерывно дифференцируемы, то для доказательства пришлось бы в этом случае приблизить функций четырежды непрерывно дифференцируемыми. Стремление к нулю остатков в формулах (3), (21), (34) — (36) равномерно по Г, когда Τ больше фиксированной постоянной, доказывается без труда, если умножить случайную величину на \f Г0 : Τ и таким образом свести случай произвольного Τ к случаю Т^ = Г0. Дальнейшее простое исследование показывает, что в формулах (34) и (35) остатки стремятся к нулю вместе с μ и без условия Τ > Г0.
17. К теории непрерывных случайных процессов 149 17 К ТЕОРИИ НЕПРЕРЫВНЫХ СЛУЧАЙНЫХ ПРОЦЕССОВ* Пусть @ — физическая система с η степенями свободы; это значит, что допустимые состояния χ системы © образуют риманово многообразие SK размерности п. Процесс изменения системы © называется стохастически определенным, если при произвольном выборе состояния х, области (S (в 91) и моментов времени t' и t" (f < t") определена вероятность Ρ (t', x, t", (S) того, что в предположении состояния χ в момент времени t' в момент времени t" имеет место одно из состоянии из (S. Дальше предполагается, что вероятность Ρ (tr, #, t", S) может быть представлена формулой P(f,x,f,t) = $f(t;x,tr,y)dvy, (i) где dVy обозначает элемент объема. Функция / (£', х, t'\ у) при этом должна удовлетворять следующим фундаментальным уравнениям: lf(t',x,f,y)dVy = i, (2) /(ίι, л, *8, У)=1 f(h, х, h, ζ)/fa-, ζ, f8, y)dV„ h <*a < ί8. (3) Интегральное уравнение (3) было исследовано Смолуховским и затем некоторыми другими авторами г. В работе «Uber die analy- tischen Methoden in der Wahrscheinlichkeitsrechnung» 2 я доказал при определенных дополнительных условиях, что функция / (£', х, t", у) удовлетворяет определенным дифференциальным уравнениям параболического типа 3. Но в А. М. изложение проводилось полностью только для одномерного случая. Кроме того, в А. М. не был дан ответ на вопрос 4, в какой степени функция / (£', х, t", у) однозначно определяется коэффициентами A (t, x) я В (£, х). В данной работе * Zur Theorie der stetigen zufalligen Prozesse.— Math. Ann., 1933, Bd. 108 b. 149—160. Перевод П. Дитриха (ГДР). г 1 См. библиографию: Hostinsky В. Methodes generates du calcul des probabi- lites.— Mem. sci. math., 1931, fasc. 52. 2 Math. Ann., 1931, Bd. 104, S. 415—458. Дальше цитируется как Α. Μ. (см. № 9 наст. изд.). 3 Эти дифференциальные уравнения вводились Фоккером и Планком независимо от интегрального уравнения Смолуховского. См.: FokkerA.— Ann. fhys., 1914, Bd. 43, S. 812; Planck M.— Sitzungsber. Preuss. Akad. Wiss., 1917, 10· Mai. 4 Cm. A. M., § 15.
150 17. К теории непрерывных случайных процессов теория развивается в общем случае риманова многообразия ίΚ и вопрос единственности решается положительно в случае замкнутого многообразия 91. § 1 ПЕРВОЕ ДИФФЕРЕНЦИАЛЬНОЕ УРАВНЕНИЕ Итак, пусть 9t — риманово многообразие размерности п. Функция / (£', х, t", у) в силу ранее сделанных предположений определена для t' < t" и любой пары точек х, у. Предполагается, кроме того, что / (£', х, t", у) имеет непрерывные производные до третьего порядка по всем аргументам (tr, t" и координатам хг, х2, . . ., хп, уг, у2, . . . • · ·» У η точек χ и у) и удовлетворяет условию непрерывности J f(t,z,t + b,z)p{x,z)dVz 0, Δ->0, (4) J f(t,x,t+b,z)p[z,z)dVt ft где ρ (χ, ζ) обозначает геодезическое расстояние δ между χ ж ζ. Пусть в окрестности % точки χ выбрана система координат ζ = = (zl9 . . ., ζη). Мы тогда положим \ f ($, χ, s + Δ, ζ) (Zi — χι) dVz = a{ (s, χ, Δ), (5) \ f (s, x, s + Δ, ζχ*4 — χΜζ; — ^) <27г = Ъц ($, ж, Δ), (6) \f{s,x,s + [±,z)9*{x,zYdVz = $(s,x^\ (V) J / (5, χ, 5 + Δ, 2) ρ3 (χ, ζ) dVz = v(s,x, Δ). (8) ft Наша цель — доказать, что отношения at (s, χ, Δ)/Δ, Ьи (s, x, Δ)/Δ при Δ ->- 0 стремятся к независимым от окрестности 51 пределам Α ι (s, χ) и Btj (s, x). Это в дальнейшем доказывается в предположении, что все Ν = η (- η (η + 1)/2 функций от г/ и ί (при фиксированных 5 и х) линейно независимы, т. е. что tv yl9 ί2, г/2, . . ., ifc, 0Ь · · ·> *л, г/N можно выбрать так, чтобы 5 См. Λ. Μ., § 13, формула (112).
17, К теории непрерывных случайных процессов 151 определитель DN(s,x) = -eZ:f(*>x*h, Ун) дх.дх. г j f(s, r,tk,Vk) (9) был отличен от нуляь. В окрестности % имеем р2 (Х| z) = zgiJ (Z| _ х.) fa __ χ.) + Θρ3 (Χ> ζ)| ι θ |< C, а вне окрестности 9ί очевидным образом имеет место р2(Я| ζ) = Θ'ρ3(*, ζ), Ι Θ'|< С, где С", как и С,— константа, не зависящая от ζ. Следовательно, имеет место P(s,x,A) = J f(s,x,s + \z)p*{x,z)dVz = St = Σ ft j ξ / (5, χ, 5 + Δ, z)(Zi — ^)(*; — Xj) dVz + = Σ*«Μ'.*.Δ) + β·ν(*,*,Δ), Ι θ»|<С». (10) Но так как по условию непрерывности (4) β («, аг, Δ) . λ η 113 (10) вытекает соотношение v(s, ж, Δ) -4-~foO, Δ—>·0. (И) (12) Мы теперь рассмотрим при фиксированных я, г/, 5, τ, £, s < τ < £ только настолько малые Δ, чтобы было 5 + Δ < τ. Тогда функция f (s + Δ, ζ, ί, г/) и ее производные по ζ до четвертого порядка в окрестности 9t равномерно ограничены и непрерывны (предполагается, См. А. М., § 13, определитель (119).
152 17. К теории непрерывных случайных процессов что 31 компактно). Следовательно, для любой точки ζ из 31 имеет место /(* + Δ, 2, f, у) — f(s + Δ, χ, t,y) = £ (Zi - Xi) — f(s + &,x,t,y) + + -γ У, (zi — %i)(z? — Xj) дх*дХш f (s + Δ, я, t, y) + + 0p3(;r,z),|0|<C, (13) где константа С не зависит от Δ и ζ. С другой стороны, из фундаментального уравнения (3) следует равенство f(s, χ, t,y) = l /($, х, s + Δ, ζ) f(s + Δ, ζ, t, y)dVz = ft = $/(*, χ, s -Ь Δ, ζ)/(* + Δ, χ, t, y)dV2 + л + ξ / (*, χ, s + Δ, 2) {/ (5 + Δ, 2, t, у) - / (s + Δ, χ, ί, y)} <WZ + я + S /(5,χ,5 + Δ,2){/(5 + Δ,2,ί,2/)-/(5 + Δ,χ,ί,2/)}ώ7,= ft-St = 71 + 72 + 7з. (14) J По (2) /i = S /(*, x,s + A, z)f(s + Δ, x, t, y)dVz = ft = f(s + Δ, x, f, y)$ /(5, x, s + Δ, z)dFf = /(* + Δ, x, f, у). (15) ft Далее, из (13), (5) и (6) следует /ι = J /(5, а, 5 + Δ, z){f(s + Δ, ζ, *, у) _ /(* + Δ, χ, t% y)} dVz == = jj /(s, я, s + Δ, ζ){^(ζ4 —χι)-±-ί(8 + Δ, α?, ί, 2/) + + ~2j(Zi~a;i)(Zi~a:j) fafo· ^ + Δ'Χ'*'^ + + θρ3 (χ, ζ)} dFz = £ a, (s, x,A)-£-f(s + A,x,t,y)-\- + ^Zb^S'x^)-e^kjf{s + A'X't'y) + + \jf(s,x,s + A,z)ep3(x,z)dVI. (16)
17, К теории непрерывных случайных процессов 153 Наконец, так как в 31 — 5( всюду рз (*,*)>*> О, где К не зависит от ζ, то в 91 — % можно полошить / (s + Δ, ζ, t,y) — f(s+ Δ, χ, t, у) = Θ'ρ3 (χ, ζ). Тогда имеет место /s= jj /(s,z,s + A,z){/(s+A,;M,yW(s + A,;M,2/)HFz:= = J /(5)^5 + Δ)Ζ)Θ'ρ3(^ζ)^ζ, |0'|<C' = -^. (17) st-st После подстановки (15)—(17) в уравнение (14) получается, наконец, f(s, χ, t,y) = f(s + Δ, χ, t,y) + £ ai (s- x> Δ) -if(s + Δ' ж' *· У) + + — У. Ъц (s, х, Δ) -j^— f (s + Δ, χ, t, у) + + ^ί(8,χ,8 + Α,ζ)Θ"Ρ*(χ,ζ)άνζ, Ι θ" |< С\ (18) Если учесть еще очевидное равенство] \ f (*, я, s + Δ, ζ) Θ"ρ3 (s, ζ) dVz = Θ'" J / (*, я, * + Δ, ζ) ρ3 (χ, ζ) dFz = ft & = Θ'"ν(5,χ,Δ), | θ" К С", то соотношению (18) можно придать следующий вид: 1±±Ы1Ь1^П-1ЬЬШ = _ £ JM!^LJL/(S + д> ,т, ,, я) _ -Σ >М'^Д' .£, -/(» + Δ,Μ.,)-β-^^. (Ι·) Левая часть в (19) при Δ ->0 стремится к -^-/ (s, я, £, ^). Пусть для tu ylt t2, у 2, · · ., *n. У ν определитель DN (s, χ) отличен от нуля. Тогда при достаточно малом Δ также и DN (s + Δ, χ) Φ 0. Следовательно, можно найти такие λΛ (Δ), k = 1, 2, . . ., Ν, чтобы было 2]λΛ (Δ)-^- f(s + Δ, ж, fk, Ук) = а1% Ъ \ (20)
154 17. К теории непрерывных случайных процессов Если уравнение (19) для t = % и у = ук умножить на λ^ (Δ) и все N возникающих таким образом равенств сложить, получится Μ (Δ) д к Σ^(*,ζ, Δ) γΊ Ь..(8,х,Ь) уг~] /Λ4Ω·ν(*,*,Δ) α, д ^««-^А 2ϋλ&(Δ)θ7ί"^Τ^· г, д (21) Если Δ стремится к нулю, величины λ^ (Δ) как решения уравнений (20) стремятся к решению λ& (0) уравнений J[j %к ^ ~L· f (5> х> tji> Ук>> = а" λ» (0) дхдх f (s, χ, tk, yu) = Щу к г з Левая часть (21) имеет, следовательно, при Δ ->■ 0 конечный предел В частности, если положить at = 0, αί7· = gi7·, то получается Σ^'Τ,Α) +Σ λ* (Д)<* ^Γ^ - Λ* Δ - 0. (24) ЕГсилу ранее доказанного соотношения (12) второй член в (24) бесконечно мал по сравнению с первым (так как λ& (Δ) остаются ограниченными). Следовательно, имеем ЪВиЪИ (s, χ, Δ)/2Δ -+ Λ0, Δ -+ 0. (25) Но из (25) и (12) следует ν (5, χ, Δ)/Δ -* 0, Δ -* 0. (26) Если сейчас в (21) все коэффициенты at и αί7·, кроме одного, положить равными нулю, то путем аналогичного предельного перехода с использованием (26) получается, что все^ пределы Ai(s, x)=lim fl«K*'A) , Δ->0, (27)' В„{8,х)=Ит ^'(;^Δ), Δ~>0, (28)
17. К теории непрерывных случайных процессов 155 существуют и не зависят от выбора 7 окрестности 9ί. Из (27), (28), (26) и (19) уже непосредственно следует первое дифференциальное уравнение -J/(s, ж, t,y) = — ^ Л|(*, x)jzJ(s> ж, t, у) - - £ ЗД> х) -^^ /(*, ж, *, у). (29) Условие, что Dn (s, χ) не обращается тождественно в нуль, можно, конечно, заменить прямым требованием существования пределов (27) и (28), так как из (28) следует существование конечного предела (25) и тем самым соотношение (26). То, что в некоторых исключительных точках пределы (27) и (28) могут не существовать, в А. М. было показано 8 следующим примером: SR — обычная числовая прямая, и ""'•»>=5т1Ьгр[-^]; <30) для χ = О легко получаем b(s,x, Δ)/2Δ-> + оо, Δ->0, так что конечный предел В (s, x) не существует. §2 ВТОРОЕ ДИФФЕРЕНЦИАЛЬНОЕ УРАВНЕНИЕ Теперь мы предположим, что в окрестности 9ί точки у0 при заданном t пределы At (£, у) и Btj (t, у) существуют равномерно и что ν (t, у, Δ)/Δ в 91 равномерно стремится к нулю. Пусть еще R (у) — обращающаяся в нуль вне 91 неотрицательная функция с ограниченными производными до третьего порядка. Тогда для у ΕΞ 9ί, ζ ΕΞ 9ί имеем R(y) = R(z)+£(yi-zi)1^-R(z) + 1 YH д? + — >. (i/i - Zi)(2/i - zi) -вПГ R W + 1 г j + ey(y,z), j©'|<c, (3i) тогда как для у ΕΞ $ — 9ί и ζ е 9ί R (у) = Л (ζ) + Θ"ρ3 (у, ζ), Ι θ" I < С"; (32) наконец, для у ^ SR — 9ί, ζ ^ 5R — 9t имеет место Λ&) = 0. (33) ' См. Α. Μ.ν § 13, формулы (122)—(124). См. А. М., § 13, формула (126).
156 17. К теории непрерывных случайных процессов Если в соответствующих областях R (у) заменить выражениям^ (31)—(33), получим = -^ ^R(y)f(s, χ, t, y)dVy = ^fi\jR(y)f(s, χ, t, y)dVy = st к = hm-±r^R(y)[f{s,x,t + A,y) — f (s, x, t, y)] dVy = ft = lim^{J R (y) jj /(s, x, t, z)f{t, z, t + Δ, y)dV2 dVy - ft ft - J R (У) f(s,x,t,y)dVv} = at = lim4"{$ f(s, x, t,z)^R (y)f(t, z, t + Δ, y)dVydVz - № St -^R(z)f(s,x,t,z)dVz} = in = Um-±-\<\)f(S,x,t,z)(i)R(z)f(t,z,t + A,y)dVydV,+ 31 5ft 4-J/(S,a;,i,z)J[^](yf-z4)-£:i?(«) + + 4" Σ ^ - z^ - zi> -eit Λ (s)l /(«, ζ, ί + Δ, у)dVy dVt + -b J /(β, x, f, 2) 5 θ"ρ»(у, ζ)/(*, ζ, t + Δ, у)iiFy dVz - si in - J Л (г)/(в, ж, ί, z)dF2} = lim^-jjj /(*,*, <, z)i?(z)dFz + 31 31 31 г + θ J /(*, ж, ί,ζ) ν(ί, ζ, Δ)<*η - J /(β, χ, t,z)R(z)dVz\ = SI 3t = jj / (*, ж, ί, ζ) [£ Л, (ί, ζ) -А- Л (ζ) + 31 г *■"■ 2 7 J
17. К теории непрерывных случайных процессов 157 После замены в правой части этого уравнения ζ на у получается формула +ΣΒί5{*>ν)-^η{ν)]άν*· (34> Теперь пусть предполагается, что At (t, ζ) и Btj (t, z) два раза непрерывно дифференцируемы в 31. Мы тогда обозначим Q (*, У) = 1 gtj (*, у) | и получим после интегрирования по частям ^f(s,x,t,y)Ai(t,y)-£-R(y)dVy = α г = \ /(5, я, t, у) Αι (t, у) Q (*, y)-^R (y)dyidy2 ...dyn = = " S W[f{s'x"'·y)Ai{tyy)Q{t)y)]R{y)dyidy2"*dyn' (35> St г Двукратное интегрирование по частям дает (так как все производные на краю % исчезнут) \f(8,x,t,y) Ду (f, у) 155— Л (у) Й7, - = jj -^^т [/ (*. «. *, У) Bij (*. ») <? (*> »)] R (У) dyi dy2... dyn. (36) Из (34)—(36) сразу следует \R(y)Q(t,y)-fi-f(s,x,t,y)dy1dy2...dyn = St ^[R(y)U^J-[Ai(tfy)Q(t,y)f(sixJ,y)] + st г + ^ ду*душ [Bij (t, y) Q (t, y) f (s, x, t, г/)]} dyi dy%... dyn. Так как R (г/), кроме упомянутых выше условий, произвольно, отсюда легко можно заключить, что для внутренних точек 91 справедливо и второе дифференциальное уравнение
158 17. К теории непрерывных случайных процессов Если для момента времени t0 задана дифференциальная функцця распределения вероятностей, т. е. неотрицательная функцця £ (*о> У) от У-> удовлетворяющая условию \ g(to,y)dVv=l, (38) то функция распределения g (t, у) для произвольного t ]> tQ дается формулой g(t>y) = lg (*о, *) / («о, х, t, у) dVx. (39) функция g (t, у) при этом удовлетворяет уравнению 9 * г j § з ЕДИНСТВЕННОСТЬ При замене системы координат коэффициенты Лг (s, ж) и J?^ (5, χ) преобразуются следующим образом: ■>έΑ'+Στφ:Β«' (41) Принтом всегда £.. = Иш *"(^'Δ) = 1 im± {j /(*, *, s + Δ, z)(Zi - sf )a<Л%> О, (43) следовательно, квадратичная форма 2ВиЫ> (44) неотрицательна. Этот факт — решающий для доказательства следующей теоремы 10. Теорема единственности1. Если 91 замкнуто, то уравнение (40) имеет не более одного решения g (t, у) с заданным непрерывным начальным условием g (ί0, у) = g (у). 9 См. А. М., § 18, формулы (169) и (170). 10 См.: RotheЯ.ОЬег die Warmeleitungsgleichung. — Math. Ann.,1931, Bd. 104, S. 353—354 (доказательство единственности).
17. К теории непрерывных случайных процессов 15$ Доказательство. Очевидно, достаточно рассмотреть начальное условие g (ί0, 1/) = 0и доказать, что тогда g (ί, у) и для t > > t0 равняется нулю. Уравнение (40) можно преобразовать к виду Теперь положим v(t,y) = g(t,y)e-ct. функция ν (ί, г/) удовлетворяет уравнению §=Σβ«^τ + Σ5^+Γι'— <46) При фиксированных ί0Ηίχ константа с может быть выбрана настолько большой, чтобы было T(t,y)-c<0 для всех у и ί, ί0 ^ ί ^ ί1§ При этих условиях функция ν (t, у) ни в какой точке (£, у), t0 < ί << ί1? не может иметь положительного максимума, так как в таком максимуме было бы что противоречит уравнению (46). Внутри данных границ также невозможен и отрицательный минимум ν (£, у). Так как при t = t0 ν (ίο» У) = 0, то, следовательно, мы получаем для t0<C t <C t± ν (t, у) < max ν (tu у) = <Tc*i max £ (*i, y), g (*, yXe-o^-V max g (tl9 y). Так как с было произвольно большим, отсюда следует, что g(t,y) = 0. Теорема единственности II. Пусть 3ί замкнуто; тогда существует не больше одного неотрицательного непрерывного' решения f (s, χ, t, у) уравнений (2) и (3), которое удовлетворяет уравнению (29) с заданными два раза непрерывно дифференцируемыми коэФфициентами А% (t, у) и Btj (t, у) и условию непрерывности (4). Условие непрерывности (4) может быть заменено следующим, более слабым: U(si*,t,y)p2(*,y)<Wy-*0, t~*s. (47) Доказательство. Предположим, что две различные функции fx (5, χ, t9 у) и /2 (s, χ, ί, у) удовлетворяют всем нашим условиям..
160 17. К теории непрерывных случайных процессов Тогда можно было бы выбрать s и такую непрерывную функции g (χ), чтобы функции —' gi (*» У) = S g (χ) /ι (*» *,*,У) dV*> также были различными. В силу условий (2) и (47) gx (t, у) и g2 (ί? ^) при ί-> 5 стремятся к g (у). Так как функции g1 (t, у) и g2(t, у) удовлетворяют уравнению (40), это противоречит первой теореме единственности. §4 ОДИН ПРИМЕР Следующий интересный и для приложений пример показывает, что квадратичная форма (44) не обязательно должна быть положительно определенной: 9ί — обычная евклидова плоскость, и / (в, xi, хш, t, Уи У%) = п$18)% ехР { ~ 4(ί-0 _ 3 [уа - а?2 - (*-s)fai+*2)/2]2l /,cn Легко вычисляется, что Βχι = 1, #12 = 0, В22 = 0, А1 = 0, Л2 (*, я) = *р ПРЕДЕЛЬНОЕ РЕШЕНИЕ Пусть 9ί замкнуто, а / (s, x, t, у) всюду положительна и зависит только от разности t — s: f (*, х% t% у) = φ (t - 5, ж, у). (49) Тогда уже из общих эргодических теорем и следует существование предельного распределения вероятностей. Другими словами, для любого распределения g (ί, у), определенного равенствами (38) и (39), и любой области δ имеет место соотношение \g{t*vWv-*P{*l t-* + oo, (50) с где Ρ (S) не зависит от выбора функции g (£0, у). Легко доказывает- 11 См. А. М., § 4, теорема IV.
18. К вопросу о пригодности найденных формул прогноза 161 ся что g (t9 у) при больших t равномерно непрерывно. Из этого делается вывод, что 12 Р(*) = -№у)*Гу* (51) g{t,y)-ig(y), ί-> + οο. (52) При этом, очевидно, функция g (у), так же как и Ρ (δ), не зависит от g (to, У)· Пусть теперь g (у) — решение уравнений - Yi-^:[My)Q{y)g{y)\ + ^j-^7-[Bij(y)Q{y)g{y)'\ = ^ (53) ^g(y)dVy=l. (53a) ft Если положить g (ί0, у) = g (г/), то легко убедиться в том, что и для t^>t0 остается g (t, у) = g (у) (см. уравнение (40) и теорему единственности I). Из этого делается вывод, что решение уравнений (53) и (53а) (если оно вообще существует) определено однозначно и совпадает с предельной функцией g (у). Из (52) следует как частный случай f(s,x,t,y)-*g(y), t-^ + oo. (54) Клязьма под Москвой, 12 апреля 1932 г. 18 К ВОПРОСУ О ПРИГОДНОСТИ НАЙДЕННЫХ СТАТИСТИЧЕСКИМ ПУТЕМ ФОРМУЛ ПРОГНОЗА* § 1. Рядом авторов (Экснером, Бауром, Визе) делались попытки посредством статистического анализа данных за прошедшие 30— 50 лет получить формулы, связывающие уклонение Ау того или иного метеорологического фактора у, подлежащего предсказанию, °т его многолетнего среднего у с аналогичными уклонениями Axlt ^χ2ι · . ., Axk ряда факторов, которые могут быть определены заранее. При этом пока употреблялись лишь линейные формулы Δ*/ = α1Δχ1 + α2Δχ2 + . . . + α^Δχ^. (1) Надлежащим подбором факторов х19 х2, . . ., хк в числе от трех- четырех до семи и коэффициентов аг, а2, . . ., ак во многих случаях *2 См.: Hostinsky В. Methodes generales..., § 36. * Журн. геофиз., 1933, т. 3, с. 78—82. • Н. Колмогоров
162 18, К вопросу о пригодности найденных формул прогноза удается достигнуть того, что коэффициент корреляции между факти- чески наблюдающимся значением Ау и его значением,,вычисленные по формуле (1), вычисленный на основании данных за те же 30— 50 лет, которые служили для построения формулы, достигает 0,60— 0,75. Однако в тех случаях, когда была произведена проверка формулы на основе наблюдений за годы, не входящие в число тех, которые послужили для вывода формулы (Визе), коэффициент корреляции между вычисленными и наблюденными значениями Ау оказался равным 0,30—0,40. Между тем коэффициент корреляции 0,30—0,40 уже не имеет практической ценности, тем более что предсказания этой степени надежности можно получить значительно более простым путем. Теория получения уравнений регрессии типа (1) основывается на следующих допущениях. Предполагается, что у, хг, х2, . . ., хк суть случайные величины, имеющие определенный, не меняющийся из года в год закон распределения w (у, х1ч х2, . . ., #&). Предполагается далее, что вероятности тех или иных значений у, %х±, х2, . . . . . ,*хк на данный год не зависят от значений, принятых этими величинами в предшествующие годы. Без первого условия (устойчивости) задача установления уравнения регрессии вообще не имеет определенного смысла. Если это первое условие выполнено, то существуют определенные коэффициенты αχ, α2, . . ., ак, обращающие математическое ожидание Ε (и2) = Ε (Ay — α±Αχχ — а2Ах2 — . . . — акАхк)2 в минимум. Отношение Л _ Е(Дуя)-Е(ца) называется истинным коэффициентом корреляции. Второе условие (независимости) существенно для доказательства того, что коэффициенты а1ч а2, . . ., ак вычисленного на основе наблюдений за достаточно большое число лет η эмпирического уравнения регрессии (1) будут близки к теоретическим коэффициентам %, а2, . . ., ак, а эмпирический коэффициент корреляции R также при достаточно большом η будет близок к теоретическому δ. Применимость двух указанных выше условий к метеорологическим явлениям, естественно, может подвергаться сомнениям. Более того, если считать существование вековых, или периодических многолетних, колебаний климата установленным, то уже первое условие заведомо неверно. Именно этим обстоятельством и склонны объяснять указанное в начале статьи расхождение: предполагают, что уравнение регрессии (1) действительно с большой точностью отражает закономерности,- действовавшие в течение изученного периода, но что эти закономерности сами претерпевают изменения в связи с длительными колебаниями климата. Я предполагаю доказать, что появление чрезмерно высоких эмпирических коэффициентов корреля-
18. К вопросу о пригодности найденных формул прогноза 163 и вполне объяснимо и в предположении полной устойчивости и независимости изучаемых факторов от года к году, иначе говоря^ что при употребляемых указанными исследователями методах не· пзбеяшо своеобразное «вздувание» коэффициентов корреляции. Этому посвящен § 2. В § 3 разбирается вопрос о том, является ли устойчивость и независимость в метеорологических рядах достаточной для того, чтобы статистическое определение уравнений регрессии было возможным и целесообразным; в § 4 даются некоторые соображения о приемах отыскания уравнений регрессии. § 2. Математический аппарат, нужный для решения стоящей перед нами задачи, создан сравнительно недавно Фишером [1] в его исследованиях о законе распределения для коэффициента корреляции при множественной корреляции (см. также обзорную статью Райдера [2]). При этом предполагается, что закон распределения w (г/, χι, %2, . · ., Хк) нормален. Пусть имеется уравнение регрессии для некоторой величины у. Допустим, что у связано с величинами хг, х2, . . ., х% так, что истинный коэффициент корреляции равен δ. Исследования Фишера дают возможность вычислить по δ и числу наблюдений (числу лет, данные за которые предполагается использовать) η закон распределения для эмпирического коэффициента корреляции R. Однако непосредственно этот закон распределения еще не дает ответа на стоящий перед нами вопрос. В самом деле, самый выбор величин х±, х2, . · * . . ., хк совершается так, чтобы коэффициент корреляции δ оказался возможно большим; при этом, хотя в уравнение регрессии и не вводится более 5—7 величин, запас величин, из которых эти 5—7 могут быть выбраны, очень велик. Предположим поэтому, что имеется ί групп величин *~L ? ^2 ? · · · ι ХК у х,(2)' ж!2) rl2) ·*Ί » *^2 ч · · ·»; Хк » •Ί ι *2 j · · ·> хк ι из к величин каждая. Для простоты допустим, что у связано с каждой из этих групп величин с истинным коэффициентом корреляции δ. Для любого λ формулы Фишера позволяют вычислить вероятность того, что в каждом отдельном случае эмпирический коэффициент корреляции R превзойдет λ. Пусть эта вероятность будет р. Естественно допустить, что с вероятностью Ρ = ι _ (ί _ ργ (2) неравенство R ^> λ осуществится хотя бы для одной из групп: так будет в предположении независимости уклонений R от δ, coo τ-
164 18. К вопросу о пригодности найденных формул прогноза ветствующих различным группам Ч Если, например, i = 14 »| ]з = 1/20, то Ρ = l-(l- V20)14 « V,. Значения λ, соответствующие ρ = 1/20 при данных б, к и Л, могут быть вычислены при помощи таблиц, приведенных у Фишера. Для этого надо положить т = η —*к — ί% β = Ym arc th δ, найти по β и πι по таблицам Фишера 2 соответствующие В и, наконец, отыскать λ по формуле В = ]/"иг arcth λ. Положим для примера η = 42 и Л = 5. Тогда после надлежащих вычислений найдем: δ 0,20 0,30 0,40 0,50 λ 0,56 0,61 0,66 0,72 Непосредственное значение полученных результатов таково: вычисляя по 42 наблюдениям пятичленную формулу регрессии, мы при δ = 0,20; 0,30; 0,40; 0,50 в одной двадцатой доле случаев получим R, превышающее соответствующее λ. Если же из 14 формул регрессии будет выбираться та, у которой коэффициент R наибольший, то R превзойдет вычисленные нами значения λ уже с вероятностью, превышающей 1/2. В заключение укажем на общие формулы Фишера. Вероятность того, что R2 будет заключаться между ν и ν + dv по Фишеру равна ήί_ ГУ20»+ *-!)]!· il-fl«)1/,w v 1 ~ [χ/2(ΐΛ-2)]![ΐ/;(Λ-3)]Ι я * χ yVs№-2) (1 _ yW2(m-2) С dm С silX 2<pdz dv = 0 —С» Ч Т/ _ P/i(w + ft-2)]l M _ fii4i/i(m+fc) v — [V2 (m - 2)]1 [Va (Λ — 2)]! ^x ϋ> Χ X F [4-И + *)» 4"(m + *)» "Tft> δ4 ^^C1 — vf^-^dv, где F (ρ, g, г, х) обозначает гипергеометрическую функцию. Эти выражения могут быть упрощены в частных случаях и заменены асимптотическими по а/1, но даже и после упрощений они остаются достаточно сложными, чтобы сделать их непосредственное употребление затруднительным. 1 Сделанное допущение достаточно произвольно, однако в действительности число групп, из которых может быть сделан выбор, должно быть еще больше? чем принятое в примерных расчетах i = 14; этим, надо думать, искупается шроизвольность нашего допущения. 2 Таблицы на с. 665 работы [1].
18. К вопросу о пригодности найденных формул прогноза 165 .§ 3. Установленный факт «вздувания» коэффициента корреляции сам по себе не вызывает необходимости отказаться от пользования найденными статистически формулами регрессии. Необходимо только по возможности ограничить число к величин, входящих в уравнения регрессии, а также запас тех величин, из которых они будУт выбираться; в этом случае опасность получить искусственно вздутый коэффициент корреляции может быть значительно уменьшена. Более существенно для оценки дальнейших перспектив статистического установления прогностических уравнений выяснить, в какой мере метеорологические ряды могут быть признаны удовлетворяющими условиям устойчивости и независимости. Самое наличие вековых изменений, или периодических колебаний, еще не заставляет отказаться от исследований, исходящих из предположений устойчивости и независимости, если роль этих вековых, или периодических, колебаний в образовании уклонений Δι/, Ахъ Ах2, . . ., Ахк незначительна. Наиболее простым методом проверки устойчивости ряда и независимости его членов является следующий. Пусть AyW есть значение уклонения Δ у за ί-й год. Следует вычислить за длительный промежуток из η лет коэффициенты корреляции между Ау№ иДг/(г+1), между Ау№ и Δί/(ί+2> и т. д. Если эти коэффициенты корреляции уклоняются от нуля в пределах, соответствующих теоретическим расчетам, сделанным при гипотезе независимости и устойчивости, то это подтверждает названную гипотезу. В самом деле, вековое изменение, или периодическое колебание с периодом в четыре года и больше, неизбежно влечет за собой положительную корреляцию между Δι/(ί) и Δζ/<ϊ+4). Короткие же колебания в два или три года приведут к положительной корреляции между Ау№ и Δι/(ϊ42) или AyW и Ay^i+3\ В случае устойчивости и независимости математическое ожидание квадрата каждого из рассматриваемых коэффициентов корреляции равно (при не слишком малых п) приблизительно ί/(η — 3). Соответствующие вычисления были произведены для средних месячных температур в Ленинграде. Для каждого месяца были вычислены коэффициенты корреляции между Ау^ и Ay(i+1), Ay(i+2) и Дг/(г+з) на основании данных за сто лет. Среднеквадратичные этих трех коэффициентов. корреляции по двенадцати месяцам оказались равными 0,065, 0,064 и 0,110, что хорошо соответствует теоретическому значению 1/|/"^Гз = ΐ/]/"97 = 0,102. Пусть теперь рассматриваются два ряда у№ и х^\ Если у связано с χ положительной корреляцией, то произведение АуАх имеет положительное математическое ожидание. Для изучения устойчивости корреляционной связи между г/(г) и х^ следует образовать коэффициенты корреляции между AyW — Ах^ и Ax(i+V — Ay(i+1\ Д#(г+2) __ Ду(г+2) и т. д. В случае устойчивости двойного ряда и неза-
166 18. К вопросу о пригодности найденных формул прогноза висимости пар у^\ х^\ относящихся к различным годам, квадрат этого коэффициента корреляции имеет математическое ожидание равное, как и в первом случае, ί/(η — 3). Таким способом была изучена устойчивость связи между средними температурами соседних месяцев в Ленинграде (как известно, между ними имеется значительная положительная корреляция): среднеквадратичное коэффициентов корреляции между AyW — Δχ^ϊ и Ay(i+1~) — А^г+1> по двенадцати парам смежных месяцев получилось 0,071, что также хорошо согласуется с теоретическим значением 0,102. Аналогично можно исследовать устойчивость изменяемости величин у, образуя коэффициенты корреляции между (Ау^)2 и (Аг/(г'+1>)2, (Аг/'г+2>)2 и т. д. Только такое систематическое изучение устойчивости метеорологических рядов может решить вопрос. Отдельные "же замечания о том, что такой-то коэффициент корреляции оказался неустойчивым, могут создать лишь ложное представление о положении вещей. Если какой-либо изолированно взятый коэффициент корреляции между двумя метеорологическими факторами оказался для двух смежных двадцатипятилетий имеющим резко различные значения, то это вовсе еще не доказывает, что во второе двадцатипятилетие изменились общие климатические закономерности, действовавшие в течение первого. Скорее, расхождение может быть признано чисто случайным. Конечно, нескольких приведенных цифр далеко не достаточно для решения вопроса, но вполне возможно, что и дальнейшие исследования обнаружат довольно полное согласие с гипотезами устойчивости и независимости. Дело в том, что исследования, имеющие целью доказать наличие вековых изменений климата, или многолетних периодических колебаний, обычно ведутся над сильно осредненными величинами, основанными на наблюдениях многих отдельных станций, для которых абсолютные размеры уклонений Ау сравнительно малы, и поэтому более резко выступает роль длительных колебаний. § 4. Предположим теперь, что требования устойчивости и независимости для наших рядов выполнены. Если бы число лет наблюдений было достаточно велико, то при сделанном допущении сколь угодно сложные уравнения регрессии, выделенные на основании этих наблюдений, достаточно точно отражали бы закономерности, господствующие во всем ряде. Однако при п} равном 30 или 50 и даже 100, положение существенно меняется: введение чрезмерно большого числа величин, из которых делается выбор величин, входящих в это уравнение, создает опасность возникновения случайных удачных комбинаций, употребление которых для предсказаний будет совершенно необоснованным. Напротив, если на основании серьезных теоретических наблюдений устанавливается, что подлежащая предсказанию величина у должна в значительной мере определяться величинами хъ х2, х3, например, в числе трех, то вычисленная на основе 50-летних наблюдений формула регрессии вида (1), связывающая Ау с Δχχ, Ах2 и
18. К вопросу о пригодности найденных формул прогноза 167 Кх , должна считаться надежной. При этом мы имеем в виду теоретические соображения, обоснованные динамически, а не «теории», имеющие чисто статистическое происхождение. Однако и чисто статистические приемы могут помочь выяснить, в каком направлении следует искать неслучайные коррелятивные связи. Такая попытка в широком масштабе была предпринята Бауром [3]. Именно им вычислены коэффициенты корреляции между средней месячной температурой в Исландии и давлением за предшествующий месяц в различных точках земного шара. При этом обнаружилось, что для станций южного полушария коэффициенты корреляции по абсолютной величине в среднем (по различным станциям и двенадцати месяцам) не превосходят размеров, предсказываемых теорией в случае полной независимости обоих явлений (температуры в Исландии и давления на данной станции южного полушария). Это заставляет отнестись с большим недоверием и к изредка встречающимся коэффициентам корреляции, значительно превышающим общую норму. Давления на станциях северного полушария в противоположность этому обнаруживают связь с последующей температурой в Исландии, систематически превышающую размеры, которые можно было бы приписать случаю. Правда, Баур замечает, что, быть может, влияние аномалий давления в отдаленных пунктах земного шара сказывается на температурах в Исландии лишь по истечении более длительных промежутков времени, чем один месяц. Достаточных доказательств этой гипотезы Бауром не приведено. Решение вопроса возможно только посредством продолжения систематических исследований Баура над средней высотой коэффициентов корреляции, а не посредством разыскания новых отдельных случаев высокой корреляции. При этих исследованиях следует пользоваться результатом Фишера, в силу которого в случае независимости величин χ и у эмпирический коэффициент корреляции между ними г имеет закон распределения, переходящий после преобразования ζ = arctg r в нормальный закон для ζ с центром в начале и дисперсией σ = 1//η^3, где η — число наблюдений. ЛИТЕРАТУРА 1. Fischer R. A. The general sampling distribution of the multiple correlation coefficient.— Proc. London Roy. Soc. A, 1928, vol. 121, N 787, p. 654—673. 2. Rider P. R. A survey of the theory of small samples.— Ann. Math., 1930, vol. 31, N 4, p. 577-628. 3. Baur F. Statistische Untersuchungen iiber Auswirkungen und Bedingungen der groflen Storungen der allgemeinen atmospharischen Zirkulation.— Ann. Hydrogr. maritimenMeteor., 1925, Bd. 53, H. 1, S. 1-6; H. 8, S. 241—258.
168 19. Случайные движения (К теории броуновского движения) 19· СЛУЧАЙНЫЕ ДВИЖЕНИЯ* (К теории броуновского движения) В двух более ранних работах [1, 2] мною была развита общая теория непрерывных случайных процессов. В этих работах при очень общих условиях было доказано, что в случае, когда состояние физической системы в каждый заданный момент времени полностью определяется η параметрами х19 х2,. .., ха, причем эти параметры непрерывно * меняются со временем t, соответствующие функции распределения удовлетворяют дифференциальному уравнению Фоккера— Планка. В общем случае такого случайного процесса приращения Ах{ параметра xt имеют тот же порядок величины, что и (At)1^. Отсюда следует, что в общем случае отношение Axt : At неограниченно возрастает при Δί ->■ 0, так что здесь нельзя говорить ни о какой определенной скорости изменения параметра xit Сейчас мы покажем, как эта общая теория может быть приложена к случайным движениям, в отношении которых предполагается, что не только координаты системы, но и их производные по времени изменяются непрерывно. Пусть ql9 q2, . . ., qn — координаты системы с η степенями свободы. Допустим, что в случае, когда нам известны значения q ш q в момент времени t, может быть определена плотность вероятности G (£, ql9 . . ., qn9 qly . . ., §ηϊ £', q[, . . ., qn, ζί» . . ., Un) возможных значений q' и qr координат системы и их производных по времени в произвольный момент времени t' > t. Дополнительно будет также предполагаться, что G не зависит от поведения системы перед моментом t. Естественно предположить 2, что Е\Ад1-д^\ = о (At), (1) Ε (Д?г)а = о (At), (2) где At = t' — t, a E — символ математического ожидания. Из (1) и (2) вытекают соотношения Ε(Δ?<) = ίΙΔί + ο(Δί), (3) Ε (AqiAq}) < уъЩЯЁЩр = о (At). (4) * Zufallige Bewegungen (Zur Theorie der Brownschen Bewegung).— Ann, Math., 1934, vol. 35, p. 116—117. Перевод А. М. Яглома. 1 По поводу точного значения условия непрерывности случайных процессов см. [1, § 13]. 2 Поскольку Aqi должно быть того же порядка малости, что и Δί.
19. Случайные движения (К теории броуновского движения) 169 В [2] при очень общих предположениях было доказано, что, помимо (2)—(4), должны выполняться еще следующие соотношения: Ε(Δ^) = /,(*, ?, q)&t + o(At), (5) Ε (Цг? = kH (i, g, ϊ) Δί + ο (Δί), (6) Ε (Δϊ,Δ?;) = ku (ί, g, g) Δί + ο (Δί), (7) где / и & — непрерывные функции. Во многих физических задачах предположения (5)—(7) допускают также непосредственную проверку. Из (2) и (6) следует, в частности, что Ε (АдАь) < УЩКдЩШ2 = о (Δί)· (8) При физически совершенно естественных дополнительных предположениях из (2)—(8) следует, что G является фундаментальным решением следующего дифференциального уравнения типа Фоккера— Планка3: + ΣΣ^ι **««'· »'·«'>* <9> В случае η = 1 мы, таким образом, приходим к уравнению 4г = -ъ'-£г8--щг№> f> 4')g) + -$Tik{t', д', u')g}. (.10) Если / и к — это две постоянные, то фундаментальное решение уравнения (10) может быть представлено выражением 2у"3 ί [у-л-/(«'-«)]! Легко видеть, что здесь Ад имеет поядок (Δί)ί/ζ, τ. е. ведет себя как и Ах в случае общего непрерывного процесса. Однако для Aq № получаем4 Aq = qAt + 0(At)3/*. (12) Можно доказать, что последнее соотношение выполняется и в случае общего уравнения (9). 3 Доказательство этого утверждения см. в [2]. 4 Этот результат означает, что вероятность неравенства | Ад — д Δί J ^ ^ К (At) при любой сколь угодно большой постоянной К будет меньше любоге фиксированного заранее числа ε > 0 и притом равномерно по Δί.
170 20. Уклонения от формул Харди при частичной изоляции ЛИТЕРАТУРА 1. Kolmogoroff А. N. Ueber die analytischen Methoden in der Wahrscheinlich- keitsrechmmg.— Math. Ann., 1931, Bd. 104, H. 3, S. 415—458. Рус. пер. УМН, 1938, вып. 5, с. 5-41. 2. Kolmogoroff A. N. Zur Theorie der stetigen zufalligen Prozesse.— Math. Ann. 1933, Bd. 108, H. 1, S. 149-160. 20 УКЛОНЕНИЯ ОТ ФОРМУЛ ХАРДИ ПРИ ЧАСТИЧНОЙ ИЗОЛЯЦИИ* Глубокие математические исследования Р. Фишера [1] и С. Райта [2] относятся к эволюции концентрации гена в популяции, в которой господствует свободное скрещивание. Задачей настоящей заметки является указать метод, при помощи которого можно получить аналогичные результаты в случае популяции, распадающейся на большое число частичных популяций, слабо связанных между собой. Математическому анализу удалось повергнуть следующую схему: популяция с постоянным числом особей N распадается на s частичных популяций по η особей (Ν = sn); в каждой из частичных популяций происходит свободное скрещивание, кроме того, в каждом поколении из каждой популяции выделяется в среднем по к «странствующих» особей; странствующие особи независимо от их происхождения присоединяются наудачу к любой из частичных популяций, где и участвуют в создании следующего поколения. Схема эта была указана как одна из возможных Н. П. Дубининым и Д. Д. Ромашевым. Ряд других не менее интересных схем ограниченного скрещивания, к сожалению, не поддается пока математической обработке. § 1. Случай отсутгтзля отбэра. Будем обозначать через ρ концентрацию некоторого гена в большой популяции и через ρ концентрацию того же гена в частичной популяции. В этом параграфе мы предполагаем, что изучаемый ген не подвергается отбору. Приводимые далее формулы являются асимптотическими формулами, справедливыми при пр, п/к2 и s, стремящихся к бесконечности. Практически их можно считать применимыми, если величины пр, п/к2, и s достаточно велики. Обозначим через Ар приращение концентрации ρ в некоторой частичной популяции за одно поколение. Следуя Р. Фишеру и G. Райту, мы принимаем, что для математического ожидания Δρ и (Δ/?)2 справедливы формулы Α_=Ε(£φ)=Λ.{ρ-ρ), Β = Ε(£φγ=*ί, * ДАН СССР, 1935, т. 3, с. 129—132. Представлено С. Н. Бернштейном.
20, Уклонения от формул Харди при частичной изоляции 171 где q = 1 — р. Так как s велико, то изменения суммарной концентрации ρ будут протекать много медленнее, чем изменения частичных концентраций р. Поэтому можно принять на время концентрацию д постоянной. Концентрации ρ в частичных популяциях будут уклоняться в ту и другую сторону от р. По истечении достаточного промежутка времени колебания ρ вокруг ρ приведут к некоторому стационарному распределению вероятностей для концентрации р. Это стационарное распределение и (р) удовлетворяет дифференциальному уравнению 1 дШ-(Ви)-^г(Аи) = 0. 2 др2 х } др Решая это уравнение, получаем ikp-1 Jikq-1 UM = B(ikp,4k3) · ' ty Формула (1) была получена другим методом С. Райтом. Можно доказать, что (1) не только дает распределение вероятностей для концентрации р, но что при достаточно большом числе s частичных популяций фактически наблюдаемое распределение частичных популяций по концентрациям ρ будет тоже даваться формулой (1). При сделанных допущениях в каждой частичной популяции осу^· ществляется формула Харди, т. е. концентрации особей типа АА, Аа и аа равны g2, 2pq и р%. Концентрации особей типа АА, Аа и аа в большой популяции могут быть, следовательно, вычислены по формулам АА = \ g2u(p)dp, о 1 Аа=: 2 \ pgu(p)dp, о 1 аа = \ phi (p) dp. о Производя вычисления, получаем 4fc -о , 1 _ -г- о 4& _- — 4Λ _2 . 1 аа = Ж+ТР +Ж+ТР- Формулы (2) решают поставленную в заглавии настоящей заметки задачу. / В силу отсутствия отбора математическое ожидание Ε (Δρ) приращения ^суммарной концентрации ген& (в большой популяций) за одно поколение равно нулю. Интенсивность же случайных коле-
172 20. Уклонения от формул, Харди при частичной изоляции баний концентрации в большой популяции характеризуется вели» чиной Ε (Δ/?)2. Эта последняя величина вычисляется по формуле ι ι Ε (ДрУ = -i- $ Ε (Δρ)2« (ρ) dp = -^ J Piu (ρ) dp. 0 0 Результат вычисления таков: В случае свободного скрещивания мы имели бы, по Р. Фишеру и С. Райту, E(Apf = pq/2N. § 2. Действие отбора. Формула (1), формула Харди для частичных популяций и заменяющая ее формула (2) для большой популяции сохраняют силу при наличии отбора в случае, если коэффициент отбора а много меньше, чем 1/тг. Мы ограничимся рассмотрением именно этого случая: предлагаемые ниже формулы являются в соответствии с этим лишь асимптотическими формулами, справедливыми при па, стремящемся к нулю. Особенно интересен случай рецессивного гена. В этом случае приращение концентрации гена, вызванное отбором, в каждой частичной популяции в среднем равно ap2q. Для суммарной концентрации получаем поэтому г Ε (Δρ) = a\i p2ju (p) dp, о или Е т = « (tt+^+D н ^р + *)■ <4> Формула (4) может быть использована для подтверждения в случае изученной нами схемы общего положения о существовании оптимума частичной изоляции для отбора рецессивных генов, выдвинутого и обоснованного с качественной стороны А. А. Малиновским. Легко вычислить, при каком значении к отбор идет скорее всего. При малых концентрациях ρ такое оптимальное значение к равно к0 = V4 Ϋ2 = 0,35. Институт математики МГУ, 18 июня 1935 г. ЛИТЕРАТУРА 1%щ Fischer R. A. The genetical theory of natural selection. Oxford, 1930· ^WrigfhS. Genetics. London, 1931, p. 97—157,.
21. К теории цепей Маркова 173 21 К ТЕОРИИ ЦЕПЕЙ МАРКОВА* Нижеследующие рассмотрения представляются мне, несмотря на их простоту, новыми и небезынтересными для некоторых физических приложений, в особенности для анализа обратимости статисти- деских законов природы, проведенного Шредингером г в одном специальном случае. Всюду далее безразлично, какое из двух следующих предположении делается относительно временной переменной t: либо t пробегает все вещественные значения, либо ограничивается целочисленными значениями. Классическое понимание цепей Маркова соответствует второй возможности. 1 ПОНЯТИЕ ЦЕПИ МАРКОВА Рассмотрим физическую систему, которая в каждый момент времени t может находиться в одном из состояний конечного набора Elf Е2, . . ., Е$. При этом предположим, что для каждой пары состояний Е\ и Ej и каждой пары моментов времени t и s, t <ζ s, определена условная вероятность PtJ- (t, s) того, что в момент времени s наступит состояние Ej в предположении, что в момент времени t система находилась в состоянии Et. Существенное, но не всегда с достаточной ясностью акцентируемое, предположение состоит в независимости условной вероятности Ρί7· (t, s) от знания предыстории системы до момента времени t. На этом предположении основывается вывод фундаментального уравнения теории цепей Маркова pi* (s, 0 = Σ Pij (s, и) prt (и, 0» s < и < ^ (1) з с условиями Рц (t, s) > 0, (2) Σ^ϋί*. s)=i, (3) 3 *«(*,<) = ««. (4) где δυ = О или 1 в зависимости от того ί Φ j или i = /. * Zur Theorie der Markoffschen Ketten.— Math. Ann., 1936, Bd. 112, S. 155 — 160. Перевод К. И. Осколкова. 1 Berliner Berichte, 1931, S. 144.
174 21. К теории цепей Маркова 2 АБСОЛЮТНЫЕ ВЕРОЯТНОСТИ До сих пор мы рассматривали лишь условные вероятности перехода Ptj (t, s). Возникает вопрос: возможно ли по заданным вероятностям Ptj (t, s) указать и абсолютные вероятности появления различных состояний в каждый момент времени £? Если допустить, что процесс изменения нашей системы начинается в некоторый определенный момент времени to, то можно приписать различным состояниям Еъ Ε2, . . ., Εν в момент времени tQ совершенно произвольные вероятности Qx (ί0), Q2 (ί0), . . ., QN (ί0), Qb (t0) > 0, 2<?/r (t0) = l. Для каждого момента времени t ^> t0 получаются следующие выражения для вероятностей Qk (t) появления состояний Ек (к = 1, 2, ..., Ν): 0*(Ο = Σ&(<ο)^«(*ο, t). г Тогда при t0 <^ I ^ s автоматически получается также и формула Qn(s)=%Qi(t)Pi1c(t,s). (5) г Не столь тривиальным является введение абсолютных вероятностей, если не предполагать никакого определенного начала процесса и, напротив, пытаться найти абсолютные вероятности Qk (t) во все моменты времени t, —- оо < £ < + оо. Но все же и здесь справедливо следующее утверждение: По произвольно заданным при всех t и s (t <^ s) вероятностям перехода Ρικ (t, s) можно по меньшей мере одним образом для всех ty — оо <^ t <^ + оо, определить соответствующие этим вероятностям перехода Pik (t, s) абсолютные вероятности Qk (t). Чисто аналитически теорема означает следующее. При каждом выборе величин Pitt (t, s), соответствующих условиям (1)—(4), бесконечная система уравнений (5) имеет по крайней мере одно решение, которое удовлетворяет дополнительным условиям Qk(t)>0, S &(*) = !· (6) ft Для доказательства.теоремы прежде всего заметим, ^то для каждого t0, как мы уже видели, существует по меньшей мере одна система величин Qk (t), которые определены для всех t^t0 и для s^t^> > t0 удовлетворяют уравнениям (5) и (6). С помощью диагонального процесса можно извлечь из последовательности Т0 = 1, Δ9 Ο, . . · нодпоследоватёл^ность t0 — Ах, A2f λ3, . . .
21. К теории цепей Маркова 175 со свойством λη ->■ — оо, так что для каждого к и каждого целочисленного t величины Ql'n (t), определенные при каждом фиксированном t для всех достаточно больших значений п, стремятся при п _>. оо к определенному пределу Qk (t). На основе формул (6) легко доказывается, что и для всех вещественных нецелочисленных значений t существуют предельные значения Qk (t). Эти предельные значения, как это доказывается с помощью предельного перехода, удовлетворяют уравнениям (5) и (6). Тем самым теорема доказана. В особенности интересен случай, когда абсолютные вероятности единственным образом 'определяются заданием вероятностей перехода Рцг (t, s). Для подобной однозначной определенности абсолютных вероятностей необходимым и достаточным является следующее условие: Для произвольных фиксированных к и s величины Pik (t, s) при I _>. — оо стремятся κ некоторому пределу Qk (s), не зависящему от ί. Если это условие выполнено, то упомянутые пределы Qk (s) в точности составляют искомую единственную систему абсолютных вероятностей. Сначала докажем, что условие достаточно. Пусть Qk (t) — некоторые абсолютные вероятности, согласованные с вероятностями перехода Pik (i, s). Тогда <?*(*) = Σ<?ιν)Ρι*ν,8); (5) г но поскольку при t ->- — оо величины Pik (t, s) "стремятся к Qk (s), то при t ->-—оо правая часть уравнения (5) стремится к Σ Qt(s)Qi (t) =Qt(s), г откуда следует, что Qi (s) = <?* (s). Пусть теперь наше условие не выполнено. Тогда можно выбрать ^1 и i2 и две такие последовательности £ > % > . . . > in >...-> — оо, что Piik (г;, s) и соответственно Pizk (tn, s) при η ->■ + оо стремятся соответственно к пределам Qk (s) и Qk (s) для произвольных к и * и при этом Qk (s) и Qk (s) не совпадают тождественно. Тогда легкс Доказать, что Qk (s), как и Qk (s), могут быть взяты в качестве абсолютных вероятностей, откуда следует необходимость условия.
176 21. К теории цепей Маркова 3 ОБРАТНЫЕ ВЕРОЯТНОСТИ Предположим теперь, что выбрана некоторая фиксированная система абсолютных вероятностей Q^ (s) и что все Q^ (s) положительны. В этом случае наряду с вероятностями перехода Ρϊ1ζ (t9 s) можно определить и обратные условные вероятности. А именно обозначим Hifc (*» s) условную вероятность появления состояния Et для момента времени t в предположении, что в некоторый более поздний момент s, 5 ^ t, наблюдалось состояние Е^. Очевидно, что П,*(*. i) = ^i^Ptt(if s). (7) Легко вывести следующие формулы, аналогичные формулам (1)-(5): Π»(*, <) = ΣПу(s, и)Uj1c(и, t), s^u^t, (l*) i П«(*. ί)>0. (2*) Σ π,ι (*,<)=!, (а*) Π«(ί, ί) = δ», (4*) &(*)=Σ&(<)π«(ί, ο, «<*· (5*) Те Отметим при этом, что если желать обойти некоторый новый принцип «независимости от будущего», то формулу (1*) следует выводить на основе приведенных выше формул, а не доказывать непосредственно по аналогии с (1). После этого можно доказать этот последний принцип на основе формулы (1*). 4 ОБРАЩЕНИЕ ЗАКОНОВ ПРИРОДЫ Допустим теперь, что вероятности перехода Ρϊ1ζ (s, t) зависят только от разности t — s: Pilt (s, t) = Pik (t - s). В этом случае, как известно, существует по крайней мере одна система не зависящих от времени t абсолютных вероятностей Для фиксированной системы таких вероятностей (?fc обратные вероятности nift (s, t) точно так же зависят лишь от разности t — s:
21. К теории цепей Маркова 177 Возникает вопрос: при каких условиях справедливо равенство П« (г) = Ры (г)? (8> Так как П« = (Qt/Qr) Л* (г), то для справедливости равенства (8) необходимо и достаточно следующее условие: Qt Tlik (r) = ОъРп (г). (9) Следует при этом, однако, отметить, что необходимые и достаточные условия справедливости равенства (8) можно выразить и бе& использования величин Q'k чисто в терминах вероятностей перехода ра (г). В самом деле, Мизес 2 доказал, что все состояния можш> таким образом разбить на классы, что выполнены следующие условия: 1) Ры (г) могут отличаться от нуля только тогда, когда Et и Е%. принадлежат одному и тому же классу; 2) для каждых двух Et и Е%- из одного класса отношение Qt : Q^ однозначно определяется заданием вероятностей перехода PiJe (r). Из этого вытекает: если Et и Е% принадлежат одному классу, то справедливость равенства (9) не зависит от выбора абсолютных вероятностей Qj\ если же Ег и Е^ берутся из разных классов, то (9) тривиально следует из равенств Pile (r) = Pki (r) — 0. Мы также видим, что справедливость условия (9) не зависит от выбранной системы вероятностей Qk. Можно следующим образом сформулировать необходимое и достаточное условие обратимости (8), не зависящее от величин Qk: Соотношения обратимости (8) выполнены тогда и только тогдаг когда для произвольно выбранных г, q, къ к2, . . ., kq выполняется равенство Р^г (Г) P*fi. (Г) · · · /VVV* = Р**Я ^ РКЧ-* ' ' " РМЛЛ· (10) В дискретном случае (когда t пробегает только целые значения) Достаточно потребовать (10) лишь при г = 1. В частности, если вероятности перехода симметричны: pik (г) = Ры (г), (И) то условие (10) выполнено. Следовательно, условие симметрии (11) Достаточно для обратимости (8). 54 ЗАКЛЮЧЕНИЕ Эти почти тривиальные факты находят много физических приложений. Мы ограничимся здесь примером, отличающимся от первоначального примера Шредингера. Пусть окружность разбита 2 Mises R. von Wahrscheinlichkeitsrechnung. BerliD, 1931. § 16.
178 22. К статистической теории кристаллизации металлов на очень большое число Μ одинаковых интервалов. Большое число Г подвижных частиц перемещается по этой окружности и притом так ^гго каждая частица независимо от прочих на каждом шаге перехода в соседний интервал либо направо, либо налево и обеим этим возможностям соответствует вероятность 1/2. Имеется всего ML = jf различных возможных расположений L частиц на Μ интервалах, Абсолютные вероятности Qh, которые соответствуют этим N возможностям, все одинаковы и равны UN. Вероятности перехода Pik M очевидно, симметричны, и поэтому справедливо уравнение обрати- мости (8). Если рассмотреть «макроскопическое» распределение частиц на окружности, то оно с вероятностью, весьма близкой к единице -будет равномерным. Если же известно (хотя это априори очень маловероятно), что в некоторый момент времени t0 имеет место большое отклонение от этой равномерности, то с вероятностью, весьма близкой к единице, м*ожно утверждать, что эта неравномерность при t ^> t0 будет выглаживаться приблизительно в соответствии с дифференциальным уравнением диффузии. Формула обращения (8) теперь учит нас, что с равной вероятностью вытекает появление равно- мерности при t < t0 с тем же дифференциальным уравнением, но противоположным знаком.временной переменной. Институт математики МГУ, 20 мая 1935 г. 22 К СТАТИСТИЧЕСКОЙ ТЕОРИИ КРИСТАЛЛИЗАЦИИ МЕТАЛЛОВ * В настоящей работе при некоторых схематических, но все же довольно общих предположениях дается строгое решение задачи о скорости течения процесса кристаллизации. Для металлургии имеет существенное значение изучение процесса роста кристаллов при случайном образовании центров кристаллизации. Известные затруднения представляет при этом учет столкновений зерен кристаллического вещества, возникающих вокруг отдельных центров кристаллизации. Эти столкновения нарушают правильную форму зерен, прекращая их рост в некоторых направлениях. Опубликованные до настоящего времени работы Ф. Гелера и Г. Закса [1], Г. Тамманна [2], Б. В. Старка, И. Л. Миркина и А. Н. Романовского [3] и других дают лишь грубо приближенные формулы для роста кристаллической массы. В настоящей заметке я даю при некоторых довольно широких допущениях точную формулу для вероят- * Изв. АН СССР. Сер. мат., 1937, № 3, с. 355—360. Представлено €. Н. Бернштейном.
22. К статистической теории кристаллизации металлов 179* остй ρ (t), с которой наудачу выбранная точка Ρ объема, заполненного подлежащим кристаллизации веществом, попадет в течение промежутка кристаллизации внутрь уже закристаллизованной массы. С вполне достаточным приближением можно считать, что доля вещества, закристаллизовавшегося за промежуток времени t, также равна ρ (t). В заключение я определяю число центров кристаллизации, образующихся в течение всего процесса кристаллизации. Пользуюсь случаем выразить мою благодарность И. Л. Мирки- ну, заинтересовавшему меня решаемой здесь задачей и любезно предоставившему все нужные материалы. § 1 МАТЕМАТИЧЕСКАЯ ПОСТАНОВКА ЗАДАЧИ Дан некоторый объем V. Вначале (t = 0) он весь занят «маточной: фазой». Через промежуток времени t некоторая часть V± (t) объема V занимается кристаллизовавшимся веществом. Рост объема Fx (£) со временем t совершается следующим образом. 1. В свободной части V — Fx объема V возникают новые центры кристаллизации. При этом для любого объема V <^ V — V± вероятность образования в этом объеме за промежуток времени между i и t + At одного центра кристаллизации равна a (t) Г At + ο (At), а более чем одного центра равна о (Δί), где о (At) обозначает величину,, бесконечно малую по сравнению с At. Вероятности эти не зависят от распределения центров кристаллизации, образовавшихся раньше времени £, если только оно гарантирует (см. далее) свободу объема V от кристаллической массы к моменту t. 2. Вокруг новообразованных центров кристаллизации и вокруг всей закристаллизованной массы происходит нарастание этой массы с линейной скоростью с (ί, η) = k (t) с (η), зависящей от времени t. и направления п. Предполагаем, что концы векторов длины с (ή), отложенных в направлении η из начала координат, образуют выпуклую поверхность. В изложенных условиях существенным ограничением является то, что линейная скорость роста с (t, η) хотя и может зависеть ог направления п, но зависимость эта во всех точках должна быть одной и той же. Иначе говоря, выводимые далее формулы справедливы или при упрощенном предположении равномерного роста во всех направлениях, или для случая одинаково ориентированных в пространстве кристаллов произвольной формы.
180 22. К статистической теории кристаллизации металлов § 2 ОПРЕДЕЛЕНИЕ ВЕРОЯТНОСТИ ρ (t) Введем величину с, определяемую равенством 8 Ί где интегрирование производится по поверхности единичной сферь^ S с центром в начале координат. Очевидно, объем кристалла, растущего свободно вокруг центра, образовавшегося в момент времени i0, достигнет к моменту t > t0 величины -£-<*($ ft (τ) *)\ to Рассмотрим теперь произвольную точку Ρ объема Vs лежащу^ на расстоянии, большем t max с (η) ^ к (τ) dx о от краев объема V. Для того чтобы точка Ρ попала внутрь закристаллизовавшейся массы к моменту t, необходимо и достаточно, чтобы в какой-то момент t' < t в какой-то точке Р\ лежащей от Ρ на расстоянии, меньшем t с(п)^ к(т)ах, ν где η обозначает направление Р'Р, образовался центр кристаллизации. При фиксированном t! объем V (£')> занятый точками Р'9 которые удовлетворяют выдвинутым условиям, равен t V'(t)=-^c*fik(T)dx)\ ν Вероятность того, что за промежуток времени At.' в объеме V'(tr) «образуется центр кристаллизации, равна а («') V'(t')M' + о (Δί'), а вероятность того, что это не произойдет^ равна s q (t) = II {1 - «(h) V'{h) Μ'} + ο (1).
22. К статистической теории кристаллизации металлов 181 Поэтому вероятность того, что точка Ρ к моменту t не будет вклю- яа в закристаллизовавшуюся массу, равна s д (ί) = Π <i - «(к) V (ti) At'} + о (1), (1) де ι = $Δί\ ti = έΔί', а о (1) бесконечно мало при бесконечно малом М'. Логарифмируя (1), получим s t log 9 (t) = ^ «(ii) F ft) Af + о (1) = - jj α (f) F' (f') &' - i=l 0 ί f = _ J^Lcsfa^)^ k(T)dxJdf. (2) о г Для искомой вероятности ρ (f) = 1 - ? (ί) включения точки Ρ в закристаллизовавшуюся массу получим, наконец, Ρ(ί) = 1-βχρ{-4^3Ω}, (3) где 0 = $а(<')($*(т)Л)у. (4) О Г § 3 ВЫВОДЫ При достаточно большом по сравнению с размерами отдельных зерен объеме V можно положить Vx (t) = Vp (t), или в силу (3) Fi(f) = 7(l-exp{--f-c«Q})> (5) гДе Ω определяется формулой (4). Формула (5) для объема Vx (t) закристаллизовавшейся за время t массы решает первую из поставленных во введении задач. Если a (t) и с (£, п) не зависят от времени, можем положить α (ί) = α, Λ (t) = 1. β этом случае Ω = αί4/4 ' (4а) и формула (5) дает Vi (ί) = 7 (l - ехр { — -J-<Azf *}) . (5а)
182 22. К статистической теории кристаллизации металлов Для числа N (t) центров кристаллизации, образовавшихся за вреЛ1я £, справедлива при достаточно большом объеме V формула t N{t) = v\a{x)q{x)dx. (β) о При постоянном a (t) = а и к = 1 получаем из (6) t N (t) = Va С exp { — -|- с3сст4} dx, (7) или N{t)=V}/^\e-Vdl, (6a) где # = j/ лс3а/3 t* При £ = + оо формулы (6) и (6а) дают полное число центров кристаллизации, возникающих в течение всего процесса. В частности, при постоянных a (t) = а и к = 1 получим ___ °° N(+ oo) = F j/|£$e-^~(W (-f f\ (7a) 0 Отметим еще особый случай, в котором все центры кристаллизации образуются в самом начале в среднем по β на единицу объема» Соответствующие формулы получаются из общих предельным переходом. Вместо (4).получаем t Ω = β (\k(x)dx)\ (4b) о формула (5) сохраняется, а формула (6) заменяется при любом t ^> О тривиальным равенством N = Fp. Если, кроме того, допустить, что к = 1 (т. е. с (ί, ή) независимо от £), то получаем Ω = βί3, (4с) V1 (t) = Wi _ exp ί — 4р- c3$t*\). (5c) Институт математики МГУ,* 20 апреля 1937 г. ЛИТЕРАТУРА 1. Goler F., Sachs G.— Ztschr. Phys., 1932, Bd. 77, S. 281. 2. Tammann G.— Ztschr. andrg. Ghemie, 1933, Bd. 214, S. 407. 3. Старк Б. В., Миркин И. Л., Романовский Л. Н. Металловедение, и термическая обработка.— Тр. Моск. ин-та стали; 1935, т. 7, с. 5—38.
23. Цепи Маркова со счетным числом возможных состояний 183 23 ЦЕПИ МАРКОВА СО СЧЕТНЫМ ЧИСЛОМ ВОЗМОЖНЫХ СОСТОЯНИЙ * В моей статье [1] высказан ряд общих предложений, относящихся к асимптотическому поведению вероятностей перехода из одного состояния в другое при неограниченно возрастающем числе шагов для случая цепей Маркова со счетным множеством возможных состояний. Предлагаемая сейчас читателю статья содержит расширенное изложение тех же вопросов, пополненное доказательством основных теорем, высказанных мною ранее без подробного доказательства, а также сообщением некоторых новых фактов. Принятая здесь система изложения может иметь известный интерес и для цепей Маркова с конечным числом возможных состояний. На это указано в появившейся в промежутке заметке В. Дёблина [2]. Как мне известно из его письменного сообщения, В. Дёблин доказал независимо некоторые из опубликованных мною теорем о цепях Маркова со счетным числом состояний. § 1 ОБОЗНАЧЕНИЯ Различные возможные состояния изучаемой системы обозначаем через Еи где i пробегает все натуральные числа. Впрочем, все дальнейшее изложение пригодно и для случая, в котором ί принимает конечное число различных значений; в этом случае ряд дальнейших формулировок может быть очевидным образом упрощен. Вероятности pfj перехода из Et в Ej за один шаг предполагаются, как обычно, подчиненными условиям Ри > О, (1) Σρ«=1. (2) j Вероятности Pj$ перехода из Et в Ej за η шагов определяются индуктивно из равенств &« = бу, (3) ^ri}=MW (4) к 1 при ί = /, где 8и = я . 3 [0 при i φ j. * Бюл. МГУ. Математика и механика, 1937, т. 1, вып. 3, с. 1—16.
184 23. Цепи Маркова со счетным числом возможных состояний Обозначим, далее, через К\у вероятность перейти за η шагов из состояния Et в состояние Ej, не попадая за меньшее число шагов в состояние Ej. Очевидно, i±%j — jt%j iy%j jtjj . j\ij гjj ... j\ij j^jj . ^ В частности, Ки есть вероятность, отправляясь от состояния Е- впервые вернуться в то же самое состояние через η шагов, Положим еще оо Σ Kij =Lij- (6) Очевидно, Ltj <^ 1. Если Ltj = 1, то, отправляясь от состояния Еи система неизбежно рано или поздно должна попасть в состояние Е$. Математическое ожидание числа шагов, потребного в этом случае для перехода из Et в Ej, равно оо Mti = S nKif. (7) 71=1 В частности, Мц есть математическое ожидание числа шагов до первого возвращения в состояние Et при условии наличия этого же состояния Ει вначале. Mtj может быть как конечным, так и бесконечным. § 2 НЕСУЩЕСТВЕННЫЕ СОСТОЯНИЯ, КЛАССЫ И ПОДКЛАССЫ СУЩЕСТВЕННЫХ СОСТОЯНИЙ Состояние Ει называется несущественным, если существуют такие / и п, что Р$ )>0и для всех т имеет место Р{·? = О, т. е. из Е% возможен переход в Ej, не допускающий возвращения в Ех. Все остальные состояния называются существенными. Очевидно, что если состояния Еъ и Ej существенны и существует η с Р$ ]> 0, то должно существовать также т с Pffi^Q. В случае существования таких пит существенные состояния Et и Ej называются сообщающимися. Если Ει сообщается с Ej и Ej сообщается с Ek, то и Ef сообщается с Е^. Поэтому все существенные состояния распадаются на классы S^a) так, что состояния, принадлежащие одному классу,, сообщаются, принадлежащие же разным классам— не сообщаются. Очевидно, кроме того, что для существенного состояния Et и несущественного Ej всегда P\f = 0. Таким образом, изучаемая нами система, попав однажды в одно из состояний класса 5<а>, никогда уже не выйдет за пределы этого класса состояний. Рассмотрим теперь какое-либо существенное состояние Et. Обозначим через $Jlt множество тех чисел п, для которых Р$ ]> 0. Так как Et существенно, то множество 50? г не пусто. Если η яшт
23. Цепи Маркова со счетным числом возможных состояний 185 входят в 3Rj, то п + т также входит в $Иг. Пусть dt есть общий наибольший делитель всех чисел множества $КЬ. Множество Ш?г- состоит исключительно из чисел, кратных dt. Легко установить, Что все достаточно большие кратные dt входят в Ш?г. Число dt называется периодом состояния Ег. Легко доказать, что все состояния, принадлежащие к одному и тому же классу S^a\ имеют один и тот же период, который мы обозначаем через d (а) и называем периодом класса S^. В самом деле, пусть для двух состояний Et и Ej одного и того же класса SW найдены такие пит, что Р$ >0и Р($ > 0 (такие пит, как указано выше, существуют). При достаточно большом к Р\д $ ^> 0. Следовательно, при достаточно большом к и т. е. все достаточно большие числа вида kdj -\- η -\- т входят в 9J?it а это возможно только, если dj делится на dt. Так как и, обратно^ di должно делиться на dj,^ro dt = dj. Для двух состояний Et и Ej, принадлежащих одному и тому же классу S(a\ только в том случае может быть одновременно Р{$ ^> 0 и Pffi > 0, если пит сравнимы по модулю d (а). Поэтому, выбрав какое-либо определенное состояние Eio класса S^a\ для любого состояния Et того же класса получим вполне определенное число β (Ει) = 1, 2, . . ., d (а) такое, что Ρψ} ^> 0 возможно лишь для η = β (Et) (mod d (α)). Все состояния Ej с заданным числом β (Ej) отнесем к подклассу S^\ Таким образом класс 5(а) разбит на d (a) подклассов Sjp. Наша система с каждым шагом неизбежно переходит из состояний подкласса S$ в одно из состояний подкласса Sp+i» а в случае β = d (a) — в одно из состояний подкласса 5χα). Таким образом, если Et и Ej принадлежат соответственно подклассам S^ π Sy, то Р^ лишь в том случае может быть отлично от нуля, если η = γ — β (тосЫ (а)). С другой стороны, для всех достаточно больших п, удовлетворяющих последнему сравнению, действительно Р\? > 0. § з ВОЗВРАТНЫЕ И НЕВОЗВРАТНЫЕ КЛАССЫ Кроме вероятности Ltj, отправляясь из состояния Et, рано или поздно хотя бы раз попасть в состояние Ej, введем еще в рассмотрение вероятность Qtj, отправляясь от состояния Et, побывать бесконечное число раз в состоянии Ej. Очевидно, имеет место неравенство Qij < Ltj. (8) С другой стороны, мы докажем сейчас следующую лемму. Лемма I. Из La = 1 вытекает Qit = 1.
186 23. Цепи Маркова со счетным числом возможных состояний Доказательство. Обозначим через Т^) вероятность отправляясь от состояния Et, еще не менее к раз побывать в том же состоянии. Очевидно, всегда ^(i) = La, ?V+i) = T(H)LH, Qit = lim T{h). k->oo В случае Ln = 1 из этих формул явствует, что Ω^ = 1. . В этом и следующем параграфах мы будем интересоваться лишь соотношениями, господствующими внутри каждого класса сущест- венных элементов,— иначе говоря, будет предполагаться, что все индексы, относящиеся к состояниям, пробегают лишь значения, со- ответствующие состояниям одного класса. В формулировках теорем это будет отмечаться словами «в пределах одного класса». Теорема 1а. В пределах одного класса либо все Ωij < 1, либо все &ij = 1. Доказательство. Очевидно, достаточно установить, что при любых i, ;, k: 1) из Qtj = 1 следует Qik = 1, 2) из Ω л = 1 следует Ω^^ = 1. Если эти два обстоятельства будут установлены, то при любых г, ;', ϊ, ;' из Ωij = 1 будут ^следовать Ω^- — 1 и ΩίΊ> = 1. Перейдем к доказательству предложения 1). Допустим, что Ω^ = = 1, т. е. что с вероятностью единица, отправляясь от состояния Еи мы будем возвращаться в состояние Ej бесконечное число раз. Рассмотрим промежуток между s-м и (s + 1)-м возвращением в состояние Ej. Так как все рассматриваемые состояния принадлежат одному классу, то событие g)s, состоящее в заходе в промежутке между 5-м и (s + 1)"м посещением состояния Ej в некоторое фиксированное состояние Σης, имеет положительную вероятность. Легко видеть, что эта вероятность не зависит от s, а сами события §)s при различных s независимы между собой. Но из бесконечной последовательности возможных независимых событий g)s, имеющих одинаковую положительную вероятность, с вероятностью единица действительно осуществится бесконечное число, т. е. Ω^ = 1, что и требовалось доказать. Остается доказать предложение 2). Для этого мы воспользуемся формулой Ω,4 = Σ^?)Ω«, (9) к справедливой при любых ΐ, /, /с, п. Так как *Σ\Ρβ = 1, то из Ω7ί => к = 1 вытекает Ω^ = 1 для всех тех к, для которых Ρ β ]> 0. Но для любых / и к (в пределах одного класса) существует такое п. Таким образом предложение 2), а вместе с ним и теорема 1а доказаны.
23. Цепи Маркова со счетным числом возможных состояний 187 Если все Ωί<7· = 1, то в силу неравенства (8) и все Ец = 1. Если е все Ωί7· <С 1, то в силу леммы I и все L^ < 1. Отсюда получается Теорема lb. В пределах одного класса или все Ln < 1, или Следует заметить, что в случае, когда все La < 1, все же могут иметься некоторые L0· = 1 (ίφ]). Если все Ζ^7· = 1 и все Ωί7· = 1, то класс называется возвратным. Если, наоборот, все La < 1 и все Ω^·<1, то класс называется невозвратным. Легко убедиться, что в случае принадлежности состояния Ej к невозвратному классу и любого Et lim Рф = 0. § 4 ПОЛОЖИТЕЛЬНЫЕ И НУЛЕВЫЕ КЛАССЫ Рассмотрения этого параграфа относятся к явлениям, наблюдающимся внутри каждого возвратного класса. В результате этих рассмотрений возвратные классы будут разделены на положительные и нулевые. Заметим, однако, что в следующих параграфах мы будем относить к нулевым классам также и все невозвратные классы. Основное значение при изучении возвратных классов имеют математические ожидания М^ (см. (7)). В связи с ними мы будем рассматривать средние 4,=4-(JBS)+^5)+... + Pi")). (Ю) Лемма Па. Для любого Et из возвратного класса в случае конечности Μ а lim л^} - 1/Ми; П~*оо в случае же Мп = +оо lim лЙ} = 0. Доказательство. С вероятностью, равной единице, отправляясь от состояния i?j, мы вернемся в это состояние бесконечное число раз. Пусть первое возвращение в Et происходит на пГм шаге, второе — на п2-м шаге, вообще k-е — на щ-ш шаге. Разности - х1 — пъ х2 — п2 — пЪ · · ·» Хк — пк — пк-Ъ · · · образуют последовательность случайных величин, независимых между собой и имеющих одинаковый для них всех закон распределения: % = 5С вероятностью К$. Очевидно, что Мп есть не что иное как математическое ожидание каждой из величин хк. Допустим сначала, что математическое ожидание Мп случайных величин хк конечно. Тогда по теореме А. Я. Хинчина [3] последова-
188 23. Цепи Маркова со счетным числом возможных состояний тельность {хк} удовлетворяет закону больших чисел, т. е. для любо- го ε ^> 0 существует такое к0, что при к^к0 вероятность неравенства к I к 2-jXj~~ м. 3=1 к п > — ^ 2 будет меньше ε. Пусть ε < V2 и η > п0 = 2к0Мн. Положим *' = -ж:(1-8)· к"= а Mxi (1 + ε). Легко видеть, что к' ^ к0, к" ;> к0. Поэтому с вероятность»^ большей 1 — ε, можно утверждать, что | njt.IV — Мц\< ε, а из этого неравенства следует (так как Ма > 1) I Щ* — η (1 — ε) Ι < к'г <^ пг, откуда ηκ> < п. Аналогично с вероятностью, большей 1 — ε, имеем | пъф\ - Мн\ < ε/2, | пьш -п (1 + ε) |< кГг/2 < пе, ПК9 > П. Итак, в случае η ^ п0 с вероятностью, большей 1—2ε, будут выполнены неравенства т. е. число ψη возвращений в состояние £г за первые η шагов будет заключено между к' и /с". Легко видеть, что математическое ожидание частоты tyjn возвращения в Et в течение первых η шагов равно п{й\ Так как ^п1п при η ^ п0 с вероятностью, большей 1-—2ε^ заключено в пределах к'In и к"1п: ^=-4(1-ε)<^<ΐ(1 + ε)=^' и так как всегда 0 ^ tyjn ^ 1, а 1п > 1, получаем, наконец, при η ;> п0 2ε, J Hi 1 <E Μι re 1 " мн <^ + откуда и-следует, что lim ηψ = ί/Мц. Рассмотрим теперь случай Mti = +оо. В этом случае, каковы бы ни были М< + °°И8]>0, существует такое к0, что при к ^ ко
23. Цепи Маркова со счетным числом возможных состояний 18$ вероятность неравенства будет меньше ε. Для доказательства этого обстоятельства достаточна ввести новую последовательность независимых между собой случайных величин #£, меньших, чем соответствующие величины хк (х'к <; ^ %ъ при каждом к), но с математическими ожиданиями, равными,, например, 2М, и применить к этой новой последовательности закон больших чисел в указанной выше формулировке. Полагая к = [п/М] + 1 ^> п/М, мы видим, что при η > к0М будет к ]> к0 и, значит, с вероятностью, большей 1 — г1 справедливы неравенства Следовательно, при η ^ к0М Ti(n)_E(%L)<±,±,e что и приводит нас к заключению, что в этом случае lim пТ? = 0. Теорема II. В пределах одного класса или все Мц бесконечны^ или все Mij конечны. Доказательство. Для любых двух состояний Et и Ер одного и того же класса существуют такие к и т1 что Р$ ]> О, PJi ]> 0. Ясно, далее, что при любом η n(n+k+m) ^ p(m) n(n) D(k) -*■ дЗ ^ х Я rw * Ц · Из этого неравенства уже легко вывести., что Urn п$^Р$Щ? limn®. П-»оо п-»оо Следовательно, или пределы п{$ для всех i (соответствующих данному классу) равны нулю, или они для всех г положительны. Поэтому по лемме На Мн также или все бесконечны, или все конечны. Остается еще доказать, что из конечности всех Мц вытекает и конечность всех Мц. Обозначим для этого через В$ вероятность^ отправляясь от состояния Еи за η шагов попасть в состояние*
190 23. Цепи Маркова со счетным числом возможных состояний Ej (у Φ ΐ), не побывав в промежутке в Et. Тогда * Ми = S mK{? + Σ: Д^ № + п). m=l j#i Но в пределах одного класса для любых i и у можно найти тг, для которого i?jjp ]> 0. Мы видим, таким образом, что из Μ л = +оо вытекало бы Мц = + °°. Этим доказательство теоремы приводится к благополучному концу. Классы, в которых все Mtj конечны, называются положительными, а классы, в которых все Μ и = + оо, называются нулевыми. Следует заметить, что в нулевых классах некоторые Мц (ί φ j) могут быть конечны. ТеоремаШ. β нулевом классе вероятность Р'$ при η —>- -f-oo стремится к нулю, каковы бы ни были состояния Et и Ej из данного .класса. Для доказательства теоремы III нам понадобится следующая Лемма lib. В нулевом классе для любого Ej выражение «#·т)=± (Р%+1) + ^Г2) + ·. · + РТт)) (11) при т -> + оо стремится к нулю равномерно относительно п. Доказательство. Обозначим через Н№ вероятность того, что при начальном состоянии Ej начиная с (п + 1)-го шага состояние Ej появляется впервые на (п + s)-m шагу (независимо от того, происходило ли возвращение в Ej на протяжении первых η шагов). Тогда к -к) _ 33 р(п+Ъ) _ VI Tr(s)p{k-s) Г 33 jO ■" г jj » rr m m—s га m = ^ H(s) ^L nf-* + 4" ^] H(s). (12) 1 В самом деле, при г > η Поэтому С» П m—1 w=l r>n j^=i η оо η = 2 тк$)+ 24η) Σ (»+«) *# = Σ™4Γ'+ Σ л^(^4+»)· m—1 j^i s=l m=l з¥^г
23. Цепи Маркова со счетным числом возможных состояний 19f Выберем (что возможно по лемме Па) такое г0, что при г ^ 7> всегда π$ < ε; выберем ш0 > г0/е. Пусть, далее, m > m0. Тогда при m — s <^ г0 будет (пг — s)/m < ε, а при m — s > r0 будет π$*~β) <[ ε. Так как всегда \m — s)lm <; 1, π,™~δ) <ζ Ι,το для всех m^m® будет Замечая, что m мы видим из (12), что Jt}j < ε + 1/иг, как только иг ;> т0. Так: как ε ^> О произвольно и не зависит от п, то лемма доказана. Доказательство теоремы III. Заметим прежде всего, что для полного доказательства этой теоремы достаточно доказать ее в случае ί = /, т. е. доказать стремление к нулю вероятностей Р$ при η -»■ +оо. В самом деле, выберем такое т, что Р^^> О* Очевидно, р(п+т) ^ D(m)D(n) Г3d ^ *ji "ij · Будем при постоянном т стремить η к + °°; тогда из Pjj ->- О будет вытекать Р$ -> 0. Допустим теперь, что lim sup P{$ = λ>0. П-*+оо Если из этого допущения будет извлечено противоречие, то теорема III будет доказана. Выберем такое целое число аг что К%> = А > 0.' Для любого ε ]> 0 существует такое п0, что из η !> τι0 следует ^ < λ + ε. Выберем, далее, для некоторого δ ^> 0 такое т0 > а, что Σ *$°<δ. m>w0 Тогда из допущений " > 7*0 + ^0, ^·ι)>λ-η (η>0) вытекает ^Γα)>λ-(η + ε + δ)Μ.
192 23. Цепи Маркова со счетным числом возможных состояний В самом деле, λ - μ < Pjy> = Е$Р% + K^Pft + ■■· + XflPlV3 = =к$рТГ)+ Σ K^Ptm)+ Σ яМГ'Ч <АР^Ч1)+(1-А)(% + г) + 6. В'случае же η !> п0 + т0 + sa из ^? > λ - η вытекает Pta) > λ - (η + ε + δ)Μ = λ - ηΐ1 Ρ^2α) > λ - (τ)ι + ε + δ)/Α = λ - η2ι · · ^Γα) > λ> (η,-χ + ε + δ)/Α = λ - η„ игде η < % < η2 < . -. < η*. Но при любом s можно подобрать η ^> 0, ε ^> О, δ > О так, чтобы «было ύ\8 < λ/2. Подбирая соответствующие п0 и ra0, получим для всех η !> п0 + иг0 + sa и таких, что Р§ > λ — η, неравенства Р$ > λ/2, Pg"a) > λ/2» · · ·> p¥im) > λ/2,β „£-««.·«> ^ (1/5α).5.λ/2 = λ/2α. Так как λ/2α постоянно, s сколь угодно велико, а η при фиксированном s может принимать произвольно большие значения, получаем ^противоречие с леммой lib. § 5 АСИМПТОТИЧЕСКИЕ СООТНОШЕНИЯ ВНУТРИ ПОЛОЖИТЕЛЬНОГО КЛАССА Доказательством теоремы III в первом приближении заканчивается изучение нулевых классов. Что же касается положительных классов, то здесь имеет место следующая общая Теорема IVa. В положительном классе SW для любых Et из подкласса S^ и Ej из подкласса S^. вероятность P^lf стремится лг пределу Р} = d (a)/Mn, не зависящему от ί, когда η стремится к бесконечности, пробегая «значения η = γ — β (mod d (α)).
23. Цепи Маркова со счетным числом возможных состояний 193 Замечай и.е. В случае η φ у — β (mod d (α)), как уже указывалось, Рц = 0. Доказательство теоремы IV требует ряда лемм. Лемма III. В положительном классе для любых I, ] и ε > 0 существует такое т, что при любом η вероятность, отправляясь от Ei, посетить хотя бы раз Ej в промежутке между п-м и (п + т)-м шагом будет больше 1 — ε. Доказательство. Вероятность, отправившись из Еи не посетить Ej за указанный промежуток времени равна ~ оо п—1 оо р= Σ χφ+ΣΡφ Σ *W = pr=n-fw /f=i p=n-|-m—k oo n-j_m_l n—1 = Σ κ$+ Σ ε® Σ p® + p=n-\-m p=m-\-i k=n-{-m--p oo η—1 oo oo + Σ *8> Σ ^ < Σ *# + Σ /λ^»^. p=ri4-m fr=i p=m p=m-f-l Но если oo конечно, то £/<т> при иг —>· +°° стремится к нулю. Так как £Д™> не зависит от тг, то лемма доказана. Лемма IVa. В положительном классе, состоящем из одного подкласса, lim inf P\f > 0. П-И-оо Доказательство. Если класс состоит из одного подкласса, то существует такое А0, что при к > А0 всегда Р$} > 0. Выберем по лемме III такое т, что при заданных i и / число ε леммы III можно принять равным 1/2. Обозначим Очевидно, λ >> 0. Пусть теперь #г']> т + &ο· Положим га' = η + + Ατι + k0. Вероятность, отправляясь от Et, посетить между п-м и (п + т)-м шагом состояние Ej больше 1/2. Пусть в промежутке между п-м и (п + т)-м шагом первое посещение ^произошло после (n + s)-To шага (s < m). Условная вероятность при этой гипотезе вернуться в Ej по окончании η' = η + + т + к0 шагов равна Р$0+т~8) > λ. Это неравенство справедливо при любом s (1 ^ s <; т). Поэтому полная вероятность Р%} \ выйдя из Et, прийти через η' = η + т + к0 шагов в Ej удовлетворяет неравенству ЯГ > ν2λ, ι Α. Η. Колмогоров
194 23. Цепи Маркова со счетным числом возможных состояний чем в силу произвольности η и заканчивается доказательство леммы. Лемма IVb. В положительном классе, состоящем из одного подкласса, lim Р$ = ИМit. П->оо Доказательство. Сначала докажем самое существование предела Р$ при тг->■ + °°. Обозначим lim inf PP = a, lim sup i>i?> = Ь. В силу леммы IVa имеем Ъ С> а > 0. Пусть ε ^> 0. Выберем щ, удовлетворяющее условиям леммы III при / = i. Выберем, далее, такое к0, чтобы при к !> к0 имели место неравенства a- в<Р?1<Ъ + е- Пусть п^> т + к0 таково, что Pffi <α + ε, a/i'^>w+J;0 таково, что Ри'* ^> Ъ — ε (такие η и п' всегда найдутся). Обозначим п' — η = к. Тогда Р%> = Р$>Р%> + АтР[Гг) + Л(2)Р|Г2) + · ·. + А(п)Рй\ где А^ есть вероятность при условии начала в Et после &-го шага впервые попасть в Ει лишь на (к + s)-m шаге. Очевидно, ^ + ii(s)<i. Кроме того, по лемме III т PW+%Aw>t-*. ■ Из этих двух неравенств вытекает, что Σ A's)<b. s=m-f-l Заметим еще, что при s *ζ т соблюдается неравенство η — s ]> к и, следовательно, P\TS) < Ь + ε. Поэтому m n p<&') = p<U)p<iT+%A(s)p\r)+ Σ 4(8)рГ8)< s=l s=m-j-l < Pft (a + β) + (1 - />SP) (δ +» + ε = Ь,+ 2ε - JPg> (δ - a). Если же принять во внимание, что Ри > a — ε, Ρ}* > Ь —· ε и Ъ —- a ^ 1, то получаем Ъ - ε < Ь + 2ε - (а - ε) (6 - α)< Ь + 3ε - а {Ъ — а), β (6 — я) <! 4ε, Ь — я < 4ε/σ.
23. Цепи Маркова со счетным числом возможных состояний 195 Так как а ^> 0, а ε ^> О произвольно, то & — а = О, что доказывает существование предела Р$\ равного Ъ = а. Из леммы Па непосредственно вытекает, что этот предел равен 1/Мц. Доказательство теоремы IVa. Рассмотрим рядом с заданной нам цепью Маркова новую цепь, определяемую элементарными вероятностями перехода где d есть период рассматриваемого класса. Очевидно, в пределах состояний нашего класса Относительно новой цепи Маркова наш класс состояний образует один-единственный подкласс. Поэтому по лемме IVb limi>Sd)= limPS> = 4- = 17-· η__|-θθ ~ n-H-oo МЦ iV1il Таким образом теорема IVa в случае ί = j доказана. Чтобы доказать ее в общем случае, обозначим через q минимальное число шагов, в которое может совершиться переход из Ei в Ej (очевидноf q = γ — β (modd)). Тогда При этом сю m=l a pff*«*> ПрИ этого вытекает, lim P%d+q) = П-Н-оо = 1, постоянном что d/M„. nd) • 7/г и тг -> + oo стремится к d/Mjj. Из Существенным дополнением к теореме IVa является Теорема IVb. В положительном классе сумма пределов Pj по всем состояниям каждого подкласса равна единице. Теорема IVb непосредственно вытекает из следующей леммы. Лемма V. В положительном классе имеется для любого ε ]> О такая конечная система состояний Е£, Е£, . . ., Ej}(, что при любом Et из того же класса для всех достаточно больших η i^>i-8. s=l s Доказате л!ь с τ в о. Выберем произвольное ί0. По лемме III существует такое т, что при любом η вероятность, отправляясь из
196 23. Цепи Маркова со счетным числом возможных состояний Eio, посетить хотя бы раз Eio в промежутке между п-м и (п + щ)_м шагом будет больше 1 — ε/3. Очевидно, всегда можно выбрать такую систему состояний Ej Ej2, . . ., Ejk, что при любом г <[ т Мы докажем, что выбранная система состояний удовлетворяет условиям леммы. Для этого зафиксируем какое-либо i и выберем такое д, что Пусть теперь η > т + д. Доложим тг = д' + яг, д' ]> д. С вероятностью, большей 1 — ε/З, мы за первые д' шагов, отправляясь из Eh попадем в Eio. На каком бы шагу <^д' мы ни попали впервые в Eio, с вероятностью, большей 1 — ε/З, мы вернемся в Eio между q'-u и (д' + нг)-м шагом. Если же это случится на каком-либо (д' + т — г)-м шагу, то с вероятностью, большей 1 — ε/З, мы окажемся после q + т шагов в одцом из выбранных состояний i?Jft Таким образом, с вероятностью, большей (1 — ε/З)3 > 1 — ε, отправившись из Еи мы придем через η = g' + m шагов в одно из выбранных состояний Е$&. Тем самым лемма доказана, а с ней доказана и теорема IVb. (η) Замечание. Из теоремы IVa следует, что не только пи стремится к ί/Мц (лемма Па), но и nffi при любом Ej из того же класса, что и Eiy стремится к тому же пределу. В силу же теоремы IVb сумма Σ {ИМа), распространенная на состояния одного подкласса, равна Ш(где d—период класса), а распространенная на все состояния одного класса, равна единице· § 6 АСИМПТОТИЧЕСКОЕ ПОВЕДЕНИЕ ВЕРОЯТНОСТЕЙ В ДРУГИХ СЛУЧАЯХ Мы оставим в стороне такие комбинации состояний Et и Е^ для которых Pty = 0 при всех η в силу рассмотрений § 2, и заметим, что если Ej несущественно, то всегда Р$ стремится к нулю при тг-> + оо. Разберем здесь наиболее сложный случай: Et несущественно, a Ej существенно и принадлежит некоторому классу SW. Обозначим для несущественного состояния Et через вероятность, отправляясь от состояния Ε ι, рано или поздно попасть
24. Об обратимости статистических, законов природы 197 в одно из состояний класса S^aK Очевидно, а так как, попав в одно из состояний класса 5<α), уже нельзя выйти за пределы этого класса. В случае попадания при начальном состоянии Ei в класс £(а) обозначим через п0 число шагов до первого попадания в одно из состояний Ej класса №) и чзрез β0 номер подкласса S^\ к которому принадлежит это первое состояние Ej. Обозначим через N{% взроятность при начальном состоянии Ei попасть в пределы класса 5<а> так, чтобы п0 = β0 + γ (mod d (α)). Очевидно, d(a) Можно показать, что имеет место следующая Теорема V. В случае несущественного Et и существенного Ej из подкласса Sy вероятность Р% стремится к N(*l„yPj, когда η ->■ + σο, пробегая значения /г ^= β (mod d (α)). Мы видим, таким образом, что при твердых i и / зависимость вероятности Р$ от η во всех случаях (существенных или несущественных состояний) будет асимптотически периодической. Средние же зх^ всегда имеют при η -> + оо определенные пределы πί7·. Комаровка, 22 декабря 1936 г. ЛИТЕРАТУРА 1. Kolmogorojj A. Anfangsgriinde der Theorie der Markoffschen Ketten mit unend- lich vielen moglichen Zustanden.— Мат. сб., 1936, т. 1, с. 607—610. 2. Doeblin W. Sur les chaines discretes de Markoff.— C. r. Acad. sci. Paris, 1936, vol. 203, p. 24—26. 3. Khintchine A. Sur la loi des grandes nombres.— C. r. Acad. sci. Paris, 1928, vol. 188, p. 477-479. 24 ОБ ОБРАТИМОСТИ СТАТИСТИЧЕСКИХ ЗАКОНОВ ПРИРОДЫ * ι ПОСТАНОВКА ЗАДАЧИ Рассмотрим ?г-мерное дифференциально-геометрическое многообразие R. Обозначим через / (t, χ, у) аугау2. . . dyn вероятность перехода за время t ^> 0 из точки χ в какую-либо точку η с координата- * Zur Umkehrbarkeit der statistischen Naturgesetze.— Math. Ann., 1937, Bd. 113, S. 766—772. Перевод А. М. Яглома.
198 24. Об обратимости статистических законов природы ми т^, i = 1, 2, . . ., га, удовлетворяющими неравенствам yi<Z.r\i <; <С J/t + dyt. Предположим, что функция / (t, χ, у) имеет все производные вплоть до некоторого достаточно высокого порядка и, кроме того, удовлетворяет следующим условиям: / (*, Х% У) > 0,; (1) $.. . $/(*, х, y)dy1dy2...dyn=lf (2) f(s + t9z,y) = §...^f(s, χ, z)f(t, ζ, y)dz1dz2.. ,dzn, (3) §...^f(t,z,y)dyidy2...dyn-+l при*->0, (4) если χ — внутренняя точка области G (ср. [1, 2]). При заданной функции / (£, х, у) функция ρ (χ) будет определять совместное с / (£, х, у) стационарное распределение вероятностей в том и только в том случае f когда выполняются условия: р(х)>0 (5) СС... С ρ (χ) άχχ dx2. .. dxn =1, (6) p(y) = §---^P(x)f(tf x, y)dzidz2. ..dxn. (7) Стационарное распределение является эргодическим, если при любых χ и у при t -> оо имеет место соотношение / (£, ж, у) -> ρ (у). Из формулы (7) следует, что эргодическое стационарное распределение всегда является единственным стационарным распределением, т. е. что в случае, когда существует эргодическое стационарное распределение р0 (х), никакое другое, отличное от р0 (х), неэргоди- ческое стационарное распределение ρ (χ) уже не может существовать. Отметим, что в случае замкнутого многообразия R существование эр- годического (и, следовательно, единственно возможного) стационарного распределения непосредственно вытекает из одного только условия t что / (£, х, у) ^> 0 для любых χ ж у при достаточно большом t (ср. [2, § 5])J Будем считать, что функция / (£, х, г/), так же как и какое-то стационарное распределение ρ (χ), заранее заданы. Помимо того, предположим еще, что ρ (χ) ]> 0 при любом х. В таком случае, зная положение у в конце временного интервала продолжительности t, можно также определить условное распределение вероятностей (при заданном у) начального положения х. Обозначая плотность этого условного распределения вероятностей через h (t, x, у), будем иметь * («ι *, У) Ρ (У) = Р (х) f {U х, V). (8) Равенство (8), очевидно, однозначно определяет функцию h(t, x, у)·
24, Об обратимости статистических законов природы 199 Упомянутый в заглавии настоящей работы вопрос об обратимости статистических законов природы х может быть сформулирован следующим образом: при каких условиях имеет место соотношение h (f, x,y)=f (*, */, х)? (9) Настоящая работа посвящена специальному случаю, когда функция » / (ί, £» У) удовлетворяет следующим уравнениям Фоккера—Планка: (по поводу этих уравнений см. [2]). Ради простоты мы в дальнейшем ограничимся лишь случаем замкнутого многообразия R. В этом случае из (11) вытекает, что каждое стационарное распределение ρ (у) должно удовлетворять уравнению -^^•WWrt + ^-j^rUfWrt-o. (12) В дополнение к указанным выше предположениям допустим еще, что квадратичная форма Blj всюду является строго положительно определенной. Случай вырожденной формы Blj весьма интересен для многих физических вопросов (см., например, [5]), но в настоящей работе мы его не будем рассматривать. Предположение о положительной определенности формы Blj влечет за собой справедливость соотношения f (х, у, t) > О при любых ж, у и t > 0, а, следовательно, также и существование единственного стационарного распределения ρ (χ), где ρ (χ) ^> 0 при любом х. Это единственное стационарное распределение ρ (χ) представляет собой единственное решение уравнения (12) такое, что СС ... С ρ (χ) dx\ dx2... dxn = 1. (13) При сделанных предположениях необходимые и достаточные условия справедливости соотношения (9) могут быть непосредственно выражены в виде свойств коэффициентов Аг и Blj уравнений (10) и (11). А именно при указанных выше предположениях для справедливости соотношения (9) необходимо и достаточно, чтобы определенный ниже вектор a (y)9j компоненты которого выражаются через А1 (у) и Blj (у), был бы градиентом некоторого скалярного потенциала. В случае, когда В%д (у) = δ1*, это условие принимает особенно простой вид, так как здесь α (υ) — это не что [иное, как вектор с компонентами £ О/). 1 · 1 Обсуждение этой проблемы для случая марковских цепей с конечным числом состояний может быть найдено в работе [3]; ср. также [4].
200 24. Об обратимости статистических законов природы Сформулируем теперь еще раз принятые нами предположения. 1. Функция / (£, х, у) дифференцируема достаточное число раз и удовлетворяет условиям (1) — (4), (10), (11). 2. Многообразие R является замкнутым. 3. Форма Blj (у) положительно определена 2. 2 ИНВАРИАНТНАЯ ФОРМА УРАВНЕНИЙ ФОККЕРА—ПЛАНКА Рассмотрим теперь более общий случай, чем тот, с которым мы имели дело в разделе 1. А именно теперь мы предположим, что переходы из χ в у в течение промежутка, времени между моментами s ж t ^> s имеют распределение вероятностей, описываемое плотностью вероятности / (s, £, х, у). При этом функция / (s, £, х, у) должна удовлетворять следующим условиям (ср. [1, 2]): /(М,*,»)>0, (14) $$···$/ (*.. *, *> y)dy\ dy2... dyn = 1, (15) R f(s, *, x, y) = ^.. .^f(s, щ x, z)f{u, t, z, y)dz1, dz2. ..dzn, ■ (16) R §...^f(s,t,x,y)dy1dyi...dyn-+l при t-*s (17) G и x, лежащем внутри области G. Уравнения Фоккера-т-Планка в этом случае будут записываться в следующем виде: г^ = -£а*(*> *) -£г/(*.'· *· у)- ds -££*"<·· *>-irer>'<*·<·*· "»· <18) + ΣΣΐ7^'Β,ί<'·="«ί·<'1·^· (19) г J Коэффициенты 5ij (s, x) образуют контравариантный тензор второго ранга., в то время как коэффициенты A1 (s, x) преобразуются по следую- 2 Как уже отмечалось, отсюда вытекает, что ρ (χ) > 0 при любом т.
24. Об обратимости статистических законов природы 201 щему более сложному закону: А =**Λ +ιτττΒ (начиная с этого места знак суммы всегда будет опускаться). Будем считать, что квадратичная форма BlJ (s, χ) всюду и при любом значении s является положительно определенной, и выберем эту форму в качестве основной метрической формы многообразия R (заметим, что введенная нами метрика зависит от s). Положим далее, что а1 (s, х) = A1 (s, х) - Г? (s, х), (20) где Г? — символ Кристоффеля, соответствующий метрической форме Вгд (s, x). Контравариантный вектор <хг представляет собой вектор,, который в каждой геодезической системе координат (в точке х) совпадает с Аг. В выбранной в точке χ геодезической системе координат уравнение (18) может быть записано в следующем виде: dflds = - α4 (s, χ) Δ?>/ - Δ<*>/, (21) где значок (χ) указывает аргумент, по которому берется производнаяΨ Δ^ означает ковариантную производную, а Δ — оператор Лапласа, т. е. Δ = Δ,Δ\ Последнее уравнение в силу его инвариантности должно быть справедливым также в любой другой системе координат. При изменении координат χ функция / (s, t, x, у) не меняется: если, однако, изменяются координаты г/, то эта функция преобразуется как скалярная плотность. Положим теперь / (5, *, х, у) = Y\Btj(t, у)\ц) (s, ί, χ, у). (22) Ясно, что функция φ (s, t, x, у) будет уже инвариантной и относительно замены координат х, и относительно замены координат yt причем она также будет удовлетворять уравнению (2-1): дфв = —a1 (s, χ) Δ?> φ — Δ<*> φ. (23) Что касается уравнения (19), то оно теперь приобретает следующий вид: ^Р а (У) г ί/, χι. \(У) ι ! dl°S\Bij(^ У)\ 3 РЕШЕНИЕ ЗАДАЧИ (24) Вернемся теперь снова к случаю, когда выполняются условия, указанные в конце раздела 1. При этом квадратичная форма Вч (х) уже не будет зависеть от времени, а только от координат точки χ
202 24, Об обратимости статистических законов природы многообразия R. Положим а* (я) "= Л*(ж)-Г? (х), (25) / («, ж, у) = V|/?;,M | φ (f, x, »), (26) Ρ (ж) = /1^(^)1 π (*). ' (27) Λ (t, я, у) = /|5f;(x)№ (*, ж, У)· (28) В таком случае вопрос об условиях справедливости соотношения (9) сводится к вопросу об условиях, при которых имеет место эквивалентное соотношение ψ (*, х, У) = φ (*, У, ж). (29) В силу результатов раздела 2 функции φ (t, χ, у) и π (χ) удовлетворяют уравнениям ' δψ/dt = α1 (χ) Δ?> φ + Δ<*>φ, (30) дфг = -Δ^ {α* (у) φ} + Δ<ν> φ, (31) -Δ?> {α4 (χ) π} + Δ<*>π = 0. (32) Так как, кроме того, Ψ (t, x, У) = Ψ (ί, ж, г/) π (χ)/π (г/), то соотношение (29) можно переписать в виде φ (t, х, у) η (χ) = φ (ί, г/, χ) π (г/). (33) Допустим, что соотношение (29), а следовательно и (33), выполняется. Переменив местами χ ж у ж воспользовавшись уравнением (31), можно получить следующее уравнение для φ (t, г/, χ): Οφ/dt = -Δ; {οΑρ} + Δφ (34) (здесь и в дальнейшем все встречающиеся производные — это производные либо по t, либо по ж, но никогда не по у, а функции аг зависят лишь от х). Тому же уравнению должна удовлетворять функция ψ (t, χ, у), а следовательно, и ψ (ί, χ, у) зх (г/) = φ (ί, χ, ζ/)π (.г): д (yn)/dt = — Δ г (αζφπ) + Δ (φπ), (35) или π -^ = — πα*Δ4φ — φΔ| (αζπ) -f πΔφ + 2 (Δζπ) (Δ^φ) + φΔπ. (36) Умножив все члены уравнения (32) на —φ, а все члены уравнения (30) на —π и добавив оба получаемые при этсм равенства к равенству (36), будем иметь 0 = —2»α*Δ,φ + 2 (Δ^ΚΔ^φ),
24. Об обратимости статистических законов природы 203 или (Δ*φ)(—α*π + Δ*π) - 0. (37) Легко убедиться, что в любой области многообразия R выражение Δ$φ не обращается в нуль тождественно (т. е. при любом t ^> 0). Поэтому на всюду плотном множестве точек х, а значит (в силу непрерывности), и всюду —αιη + Δ*π. = 0, — atn,+ Atn = — α^π + дп/дх1 = 0, (38) т. е. а, = д (log п)1дх\ (39) Обозначая log π = Ρ, мы видим, что Ρ — это потенциал а. Тем самым мы доказали необходимость сформулированного в разделе 1 условия. Пусть теперь, наоборот, известно, что существует Ρ такоег что а. = дР/дх1; требуется доказать, что в таком случае будет справедливо и соотношение (29). Легко убедиться, что ер удовлетворяет уравнению (32). Так как, однако, π — единственное решение уравнения (32) такое, что СС. .. С π Y\Bij(x)Ι άχχ dx-ι... dxn = 1, то, очевидно, я = (1//)*р, (40) где / = fί... С ep У\ Btj (χ) I dxi dr2... dxn. Из (40) последовательно вытекают равенства (39), (38), (37), (36) и (35). Из (35) следует, что ψ (t, x, у) удовлетворяет уравнению dy/dt = — Δ* (α*ψ) + Δψ, (41) т. е. тому самому уравнению, которое выше было обозначено как уравнение (34), справедливое для φ (ί, у, χ). Начальные условия для φ (ί, у, χ) и ψ (ί, χ, у) при t = 0, очевидно, совпадают друг с другом. Следовательно, φ (ί, г/, χ) = ψ (ί, χ, г/), что и завершает доказательство нашей теоремы 3. Москва, 1 июля 1936 г. 3 Ср. доказательство теоремы единственности в [2]. Существование непрерывных производных у коэффициентов Аг и BiJ следует из существования достаточно высоких производных функции /. Условие непрерывности (29) работы 12] в случае замкнутого многообразия R эквивалентно нашему условию (4).
204 25. К решению одной биологической задачи ЛИТЕРАТУРА 1. Kolmogoroff А. N. Ueber die analytischen Methoden in der Wahrscheinlich- keitsrechnung.—Math. Ann., 1931, Bd. 104, H. 3, S. 415—458. Рус. пер · УМН, 1938, вып. 5L с. 5-41. 2. Kolmogoroff A. N. лиг Theorie der steitigen zufalligen Prozesse.— Math Ann., 1933, Bd. 108, H. 1, S. 149—160. Рус. пер.: Наст, изд., № \η\ 3. Kolmogoroff A. N. Zur Theorie der Markoffschen Ketten.— Math. Ann., 1936* Bd. 112, H. 1, S. 155-160.» 4. Hostinsky В., Potocek J. Chaines de Markoff inverses.— Bull. Intern. Acad tcheque sci., 1935, vol. 36, p. 64—67.| 5. Kolmogoroff A. N. Zufallige Bewegungen.— Ann. Math., 1934, vol. 35, N 1, p. 116—117. 25 К РЕШЕНИЮ ОДНОЙ БИОЛОГИЧЕСКОЙ 'ЗАДАЧИ* Р. А. Фишер [1] дал интересное приложение теории итераций к вопросу о законах размножения нового гена в неограниченной популяции. Ж. Ф. Стеффенсен недавно [2] дал г подробное изложение этого метода в применении к вопросу о вероятности гибели всего потомства одного индивида. Однако оба эти вопроса математически тождественны. Кратко изложив постановку вопроса и известные результаты, мы намерены дополнить результаты Фишера и Стеффен- сена в некоторых направлениях. 1 МАТЕМАТИЧЕСКАЯ ПОСТАНОВКА ВОПРОСА Следующие предположения существенны для наших математических рассуждений. Пусть F0, Fl4 . . ., Fn, . . . будет последовательность поколений. В поколении F0 имеются К0 индивидов с признаком Μ (М-индивиды). Скрещивания между М-индивидами исключаются. Всякий М-индивид из Fn+i происходит от определенного М-индивида из Fn. Даны вероятности рк, что некоторый М-индивид поколения Fn будет иметь ровно к М-потомков в Fn+X, и эти вероятности независимы от судьбы других ветвей М-потомства. Наша задача заключается в том, чтобы определить вероятности Ργ (η > 1) того, что число Кп М-индивидов в п-ж поколении равно к. При этом Р(0П) есть вероятность гибели М-потомства. Вероятность Pq*\ очевидно, вместе с сможет только возрастать. Главный результат настоящей работы состоит в определении асимптотического течения Ρ0?υ при больших п. * Изв. НИИ мат. и мех. Томск, ун-та, 1938, т. 2, вып. 1, с. 7—12. 1 У Стеффенсена можно найти указания на старую литературу.
25. К решению одной биологической задачи 205 Мы предполагаем, что три первых факториальных момента а = Pi + 2Pz + · . · + ftp» + . . · b = 2p2 + &ps + . . . + k (k — 1) pk + . . . с = 6p3 + 24p4 + . . . + k (k - 1)(A - 2) pfc + . . . конечны. 2 БИОЛОГИЧЕСКИЕ ОБЪЯСНЕНИЯ Kn означает число тех М-индивидов в п-ж поколении, которые достигли определенного возраста. В предполагаемые заданными вероятности р^ включается, следовательно, и влияние отбора. Если, например, у взрослого М-индивида всегда бывает очень большое число т Ж-потомков следующего поколения, имеющих, однако, очень небольшую вероятность а/т достигнуть возраста, намеченного для определения Кп, то получим Рн = Cm (1 - «/го)1"-* (а/т)\ или приближенно по формуле Пуассона В этом случае легко вычисляется t что Ъ = а2, с = а3. Величина, имеющая наибольшее влияние на судьбу М-поколе- ния, это первый момент а, т. е. среднее число М-потомков одного М-индивида в последующем поколении. Если Кп очень велико, то мы приближенно имеем Κη+ι = аКп. Следует различать три случая,существенно отличных друг от друга, в зависимости от того, будет ли а больше, меньше или равно единице. Если а < 1, то без всякого вычисления ясно, что в конце концов М-потомство должно исчезнуть. Мы далее доказываем, что этот результат остается в силе еще и при а = 1, Ъ ^> 0. Если а > 1, то мы имеем отличную от единицы вероятность Р0 вымирания М-потомст- ва (Р0 = lim Pq при η -> оо). Вероятность того, что потомство не погибнет, а размножится неограниченно, равняется 1 — Р0. Исключение а = 1, 6=0 возможно лишь в том случае, если Pi = 1, pk = 0 (к Φ 1). В этом случае Кп, очевидно, всегда равняется К0 и, следовательно, Р^ всегда равно нулю. Конкретная задача, которая привела к исследованиям Фишера, состоит в следующем.
206 25. К решению одной биологической задачи В очень большой стационарной популяции, состоящей исключительно из индивидов типа ВВ, появляется небольшое количество К0 индивидов типа ВЪ (поколение F0). Если в дальнейших поколениях Ρъ Fz-, · · · #Ь-потомство остается сравнительно немногочисленным, то ВЪ X #Ь-скрещения практически исключаются. При этом предположении наша схема применима к #Ь-потомству. Если а = 1, то 5Ь-индивиды обладают той же жизнеспособностью, что и ##-индивиды. Однако вследствие случайных колебаний числа Кп они непременно должны вымирать (случай а = 1, 6 = 0 здесь невозможен). Тем более исчезают 5Ь-индивиды, если α <С 1. Если а^> 1, то имеется положительная вероятность 1 — Р0, что 5Ь-ин- дивиды размножатся неограниченно (неравенство а ]> 1 соответствует предположению, что 5&-индивиды обладают большей жизнеспособностью, чем #5-индивиды). В действительности же случайные колебания Кп и при а = 1 могут оказаться столь большими, что скрещения ВЪ χ ВЪ получают неисчезающую вероятность. Тогда приходится принимать в расчет и жизнеспособность ЬЬ-индивидов. о ОБЩАЯ ТЕОРИЯ Главный результат Фишера и Стеффенсена состоит в сведении вычисления вероятностей Р£п) к определению коэффициентов известных степенных рядов. С этой целью полагают Я (х) = Ро + ΡιΧ + Р2Х2 + · · · + Ркх* + . · -ι (2) Q^ (χ) = pW + рМх + ρ ξ»χ* +... + PpV + . .. (3) Так какрк < 1, Р£п) < 1, то q (x)nQW> (χ) при | χ | < 1 — аналитические функции. Пусть будет qn (χ) п-й итерацией q (x): q1 (x) = Я (x), Qn+1 (x) = ? (f (χ))- Главной формулой всей теории является следующая 2: QW (д.) = [qn (д.)]К.в (4) В частности, р<п> = Q(n) (0) и, следовательно, Р^ = kn (О)]*·, (5) Р0 = lim Pjn) = lim [?<"> (0)]*· = λ*., η ~* οο. (6) Предел λ = limgn (0), η -> οο, 2 Ср. [2]. Впрочем, читатель сам легко воспроизведет доказательство.
25. К решению одной биологической задачи 207 определяется из общей теории итераций. Доказывается, что λ равняется наименьшему неотрицательному корню уравнения 3 g (λ) - λ = 0. (7) Такой корень существует, так как q (1) = Ро + Pi + · · · + Рн + · · · = It g (1) — 1=0. Далее доказывается, что в случае а ^> 1 искомый наименьший корень λ меньше единицы. В этом случае мы имеем, следовательно, положительную вероятность 1 _ i>0 = 1 — λ*· неограниченного размножения Λί-потомства. Если, напротив, а <^ 1 (и в случае а = 1 еще и Ь^> 0), то необходимо λ = 1 и, следовательно, Ρ о = 1. М-потомство в этом случае с необходимостью должно вымирать. Поэтому желательно исследовать асимптотический ход вероятности Д(п) = ι _ р(»> выживания до тг-го поколения. Ни Фишер, ни Стеффенсен этого не сделали при общих предположениях. 4 АСИМПТОТИЧЕСКИЙ ХОД i?(n) В СЛУЧАЕ а<1 Пусть будет гп = 1 - tf (Oh гп при /г->оо в нашем случае сходится к нулю. Следовательно, при η —> оо асимптотически имеется д(»> = i-[qn (0)j*· = 1 - (1 - rn)Ki ~ K0rn. (8) Остается исследовать асимптотический ход гп. Заметим прежде всего, что ?' (1) = а, а при 0 < χ ^ 1 0 < q" (X) < q" (1) = b, 0 < q"' (χ) < q"' (1) = С. Теперь пусть будет а< 1. Если разложить q (1 — г/) в строку Тейлора, то получится q (1 _ у) = q (1) _ ?' (1) j, + О (у2) = Ι - ац + О (г,2). 8 Ср. [2].
208 25. К решению одной биологической задачи Положим у = гп_! = 1 — q4"1 (0), тогда получится гп = 1 - 9п (0) = 1 - д [д71-1 (0)] = 1 - д (1 - гм) = агп^ + О (r«.l)t rjrn-i = αίί + О (гп-J]. (9) Из (9) после некоторых простых рассуждений следует, что асимптотически гп ~ Са\ (10) причем С — подходящая постоянная. Вследствие (8), наконец, имеет место формула Д<"> ~ С#0а\ (И) Мы, таким образом, видим, что в случае а < 1 вероятность Д(п) асимптотически убывает по геометрической прогрессии со знаменателем а. , Пусть будет α = q' (1) = 1. В таком случае q(i-y)=q(l)-q'(l)y + 1/2q"(l)y2 +Р №)= 1 - У ^Фу* + О (у% rn=l-gn(0)=l-g(l— rn^) = гп.! - 4Jbr*-i + О frti), г*/^ = 1 - Ч2Ьгп.г + О (rU). (12) Из (12) вытекает, что асимптотически (при Ъ ^> 0) rn ~ 2/пЪ. (13) Вследствие (8), наконец, будет RW ~ 2К0/пЬ. (14) Таким образом, мы видим, что в случае а = 1 Л(п) приближается к нулю существенно медленней. Формула (14) показывает, что в случае а = 1 при большом η вероятность RW выживания до га-го поколения обратно пропорциональна второму моменту Ъ. В частности, в случае применимости для вероятностей рк формулы Пуассона (1) Ъ = а? = 1 и, следовательно, #(*> ~ 2KJn. Эта формула указана у Фишера. В качестве второго примера мы рассмотрим случай, в котором каждый JSb-индивид дает после скрещивания ВЪ X В В ровно два потомка. Здесь будет р0 = V4, Ρχ = = V2, р2 = V4, Pk = 0 (к > 2), откуда Ъ = V2 и Д<"> = 4Я 0/и. 5 ПРИБЛИЖЕННАЯ ФОРМУЛА Теперь вернемся к случаю а^> 1. Но предположим, что ω = а — 1 абсолютно и шГотношению к Ъ ]> 0 мало. В этом случае и μ = 1 — λ
26. Об одном новом подтверждении законов Менделя 209 мало и можно положить приближенно g (λ) = g (1 - μ) ~ 1 - ?' (1) μ + V2g" (1) μ2 = 1 - αμ + + ν2δμ2. Уравнение (7) дает q (λ) — λ ~ 1 — αμ + 4φμ2 — 1 + μ = —ωμ + 4φμ2 = 0, μ ~ 2ω/6, * (15) λ - 1 — 2ω/6. (16) Если ω в сравнении с К0 мало, то из (15) и (16) следует приближенно i—P0~ 2Κ0ω/ϋ, т. е. вероятность 1 — Р0 неограниченного размножения Ж-потом- ства прямо пропорциональна коэффициенту отбора и обратно пропорциональна второму моменту Ъ. ЛИТЕРАТУРА 1. Fischer R. A. The genetical theory of natural selection. Oxford, 1930. 2. Steffenson J. F. Deux problcmes du calcul des probabilites.— Ann. Inst. H. Poincare, 1933, vol. 3, p. 331—334. 26 ОБ ОДНОМ НОВОМ ПОДТВЕРЖДЕНИИ ЗАКОНОВ МЕНДЕЛЯ* В происходившей осенью 1939 г. дискуссии по вопросам генетики много внималия уделялось вопросу проверки состоятельности законов Менделя. В принципиальной дискуссии о состоятельности всей менделевской концепции было естественно и законно сосредоточиться на простейшем случае, приводящем, по Менделю, к расщеплению в отношении 3: 1. Для этого простейшего случая скрещивания А а X X А а при условии доминирования признака А над признаком а мен- делевская концепция приводит, как известно, к выводу, что в достаточно обширном потомстве (безразлично, составляющем одно семейство или объединяющем много отдельных семейств, полученных от различных пар гетерозиготных родителей типа А а) отношение числа особей с признаком А (т. е. особей типа АА или Аа) к числу особей с признаком α (типа аа) должно быть близким к отношению 3:1. Иа проверке этого простейшего следствия из менделевской концепции и сосредоточили свое внимание Т. К. Енин [1, 2], Н, И. Ермолаева * ДАН СССР, 1940, т. 27, с. 38-42.
210 26. Об одном новом подтверждении законов Менделя [3] и Э. Кольман [4]. Между тем менделевская концепция не только приводит к указанному простейшему заключению о приближенном соблюдении отношения 3:1, но и дает возможность предсказать, каковы должны быть в среднем размеры уклонений от этого отношения. Благодаря этому как раз статистический анализ уклонений от отношения 3 : 1 дает новый, более тонкий и исчерпывающий способ проверки менделевских представлений о расщеплении признаков. Задачей настоящей заметки является указание наиболее рациональных, по мнению автора, методов такой проверки и их иллюстрация на материале работы Н. И. Ермолаевой [3]. Материал этот, вопреки мнению самой Н. И. Ермолаевой, оказывается блестящим новым подтверждением законов Менделя *. § 1 ОБЩИЕ ЗАМЕЧАНИЯ О РОЛИ СЛУЧАЯ В ЯВЛЕНИЯХ НАСЛЕДСТВЕННОСТИ Станем сначала на точку зрения, независимую от менделизма. Пусть в результате скрещивания двух особей α и β получается потомство из η особей. Обычно при этом каждая из двух особей α и β производит число гамет значительно большее, чем число потомков п. Пусть а производит гаметы alf a2, . . ., a*,, а β — гаметы βΐι $2, · · ·> β*ν Какие именно из весьма большого числа ки к2 возможных пар гамет будут действительно использованы для получения потомства, зависит от многих обстоятельств. Эти обстоятельства законно разделить на внутренние, определяемые биологическими свойствами особей a и β и гамет at и β^, и на внешние, независимые от этих биологических свойств. Например, при опылении у растений решение вопроса о том, какие именно из пыльцевых зерен попадут на рыльце, а какие нет, или о том, каково будет расположение на рыльце попавших на него зерен, зависит от бесчисленного множества факторов совершенно внешнего по отношению к биологическим закономерностям характера. При изучении биологических закономерностей следует считать эти внешние для них обстоятельства оплодотворения случайными и применять к ним аппарат теории вероятностей. Выбор η пар (α* h)> (ai*> β*)» · · ·> (ain> Pin) возможен falfa! S~~ n\ (*!-n)! (Λ2-λ)Ι * На работу Η. И. Ермолаевой обратил мое внимание А. С. Серебровский.
26. Об одном новом подтверждении законов Менделя' 211 различными способами. В соответствии со сказанным выше дальнейшее исследование должно исходить из предположения, что биологическими факторами определяется для каждого из этих возможных способов выбора лишь некоторая вероятность его действительного осуществления. Вывод менделевских законов основывается (см. далее § 2) на простейшем допущении, что вероятности, соответствующие любому из этих s возможных способов выбора, одинаковы (и, следовательно,, все равны Us). Биологически это допущение означает равную жизнеспособность гамет, отсутствие селективного оплодотворения и равную жизнеспособность (по крайней мере до момента подсчета потомства) особей, получающихся от любой парной комбинации ai9 β$ гамет. Назовем эту простейшую гипотезу для краткости гипотезой независимости (вероятности того или иного набора гамет, используемых для получения потомства, от их биологических особенностей). Как и всякая другая гипотеза о независимости одних явлений от других, интересующая нас гипотеза, взятая в виде абсолютной догмы, не допускающей никаких коррективов, неверна: существует целый ряд твердо установленных примеров уклонений от этой гипотезы, иногда количественно незначительных, а иногда и очень крупных. Ясно, сколь неосновательной была бы точка зрения, пытающаяся вовсе отрицать роль внешних с биологической точки зрения случайных обстоятельств в подборе гамет, участвующих в оплодотворении. Серьезный спор может идти между такими двумя точками зрения. 1. Гипотеза независимости в большинстве случаев является хорошим первым приближением к действительному положению вещей (сторонники менделевской и моргановской генетики). 2. Селективное оплодотворение и неравная жизнеспособность играют всюду столь решающую роль, что рассмотрения, опирающиеся на гипотезу независимости, для биологии бесплодны (школа акад. Т. Д. Лысенко). § 2 РАСЩЕПЛЕНИЕ В ОТНОШЕНИИ 3 : 1 Вернемся теперь к более специальным менделевским допущениям для случая скрещивания Α α χ А а и доминирования признака А. В этом случае принимается, что каждый из родителей образует столько же гамет типа А, как и гамет типа а, пары гамет типов А А и А а дают потомков, обладающих свойством Л, а пары гамет типа аа — потомков, обладающих свойством а. Из этих предположений в соединении с допущением, что кх и к2 несравненно больше, чем п, и с гипотезой независимости получается вывод: I. Вероятность того, что в группе из η потомков окажется ровно *п особей с признаком А (остальные же с признаком а) равняется d / ч »! / 3 \т( 1 \n-m //П Р«(т)=тЦп-т)1Ы (—) ' (1)
212 26. Об одном новом подтверждении законов Менделя Пусть теперь произведено большое число г скрещиваний Α α χ X А а и от каждого из них получено по семейству из п\ч Щч · · ·» пт особей, из числа которых соответственно тпъ пг2, . . ., mr обладают признаком А. Спрашивается, как возможно полнее проверить, согласуется ли такой результат опыта с менделевскими допущениями или нет? Если число особей в каждом семействе очень мало (например, меньше 10), то целесообразно непосредственно проверять формулу (1) при помощи х2-критерия Пирсона. Если каждое семейство сравнительно многочисленно, то целесообразнее другой метод. В этом случае из (1) вытекает: II. Нормированные уклонения Δ = (m/n — 8/4) : ση, где On = УШУ П, подчиняются приближенно закону Гаусса с единичной дисперсией, т. е. вероятность неравенства Δ < χ приближенно равна p^=ik I ·"*"* ■ <2) Здесь ση = j/"3/4j/w есть среднеквадратичное уклонение частоты m/n от 3/4. Мы видим, что это среднеквадратичное уклонение пропорционально 1/(/"тг. Следовательно, только в случае очень больших семейств менделевская теория предсказывает большую близость частоты m/n к 3/4. Например, чтобы с вероятностью 0,99 можно было бы утверждать, что |т/гс-3/4 |< 0,01, η должно быть больше 12 000. Зато рассмотрение большого числа семейств средней величины дает возможность гораздо более тонкой проверки менделевских допущений при помощи рассмотрения распределения уклонений Δ. В частности, из формулы (2) вытекает, что вероятность неравенства | Δ | <^ <^ 1 приблизительно равна 0,68. Следовательно, по менделевской теории среди достаточно большого числа семейств должно быть приблизительно 68% с Д^1и приблизительно 32% с | Δ | > 1. В работе
26. Об одном новом подтверждении законов Менделя 213 ц. И. Ермолаевой [3] для проверки этого следствия менделевской теории пригодны серия из 98 семейств с расщеплением по окраске цветка и пазухи листа (табл. 4 работы Ермолаевой) и серия из 123 семейств с расщеплением по окраске семядолей (табл. 6 работы Ермолаевой). Остальные серии содержат слишком мало семейств (или групп семейств) для надежной проверки. Результаты приведены в следующей таблице 2. Число семейств Общее С |Δ|< 1 С|Д|>1 * Расщепление (по окраске) цветка и пазухи листа 98 100% . 66 67 «/о 32 33 о/о Расщепление (по окраске) семядоле:": 123 100о/0 85 69 о/о 38 31 о/о Теоретически, % 100 68 32 При указанном числе семейств в серии совпадение с теорией следует признать очень хорошим. В силу странного недоразумения сама Н. И. Ермолаева утверждаете своей работе, что наличие заметного процента семейств с [ Δ О 1 опровергает менделевскую теорию. Можно было бы провести аналогичную проверку совпадения с теорией процента семейств, для которых | Δ | ^ а при каком-либо а Ф 1. Например, теория предсказывает, что приблизительно у 50% семейств должно быть | Δ | <J 0,674. Однако лучше всего сразу произвести полную проверку близости фактически наблюдаемого распределения уклонений Δ к теоретическому гауссовскому. Для этого вычерчиваем на одном и том же чертеже теоретическую кривую у = Ρ (χ) в соответствии с формулой (2) и эмпирическую ступенчатую кривую у = q (х)/г, где г обозначает общее число семейств в данной серии, a q (χ) — число семейств в серии, для которых Δ <; χ. Результаты такой проверки для двух интересующих нас серий Н. И. Ермолаевой показаны на рис. 1 и 2. Как видно, совпадение эмпирической и теоретической кривой в обоих случаях получается достаточно хорошее. Чтобы оценить, является ли наблюдаемое между ними расхождение допустимым при данной численности серий, следует воспользоваться выведенными мною ранее формулами (см. [5]). Для случаев, изображен- 2 Сводная табл. 1 работы Н. И. Ермолаевой содержит несколько отличные цифры, чем приводятся здесь, так как она учитывает некоторые семейства (2 в первой серии и 4 во второй серии), не внесенные по неизвестным нам причинам в табл. 4 и 6. Наша сводная таблица охватывает только семейства, представленные в табл. 4 и 6. Однако следующие ниже выводы остаются без изменений, если исходить из данных сводной табл. 1 Н. И. Ермолаевой.
214 26. Об одном новом подтверждении законов Менделя ных на рис. 1 и 2, находим по этим формулам λχ = 0,82, λ2 = 0,75, Φ (λχ) = 0,49, Φ (λ2) = 0,37, что вполне удовлетворительно. Мы видим, таким образом, что большей близости частот т/п по отдельным семействам к их среднему значению 3/4, чем получилось у Н. И. Ермолаевой, при данной численности семейств и нельзя было бы ожидать по менделевской теории. -J -2 -Г 0 / 2 J -J -2 -/ 0 / 2 J Гис. 1 Рис. 2 Если бы в какой-либо достаточно обширной серии семейств уклонения т/п от 3/4 были бы систематически меньше, чем требует теория, то это в такой же мере опровергало бы применимость к этой серии семейств сформулированных выше допущений, как и систематическое превышение теоретически предсказываемых размеров этих уклонений. Намек на такую' систематическую чрезмерную близость частот т/п к 3/4 имеется в материалах работы Т. К. Енина [1]. Однако материалы этой работы недостаточно обширны (25 семейств по сравнению с двумя сериями в 98 и 123 семейства у Н. И. Ермолаевой) и возбуждают ряд других сомнений (сам автор считает их не вполне однородными). Поэтому в детальное их рассмотрение мы входить не будем. Из упомянутых в начале заметки работа Э. Кольмана, не содержащая нового фактического материала, а посвященная анализу материалов Т. К. Енина, целиком основана на непонимании изложенных в нашей заметке обстоятельств. 20 февраля 1940 г. ЛИТЕРАТУРА 1. Енин Т. К.— ДАН СССР, 1939, т. 24, с. 176-178. 2. Енин Т. К.— Докл. ВАСХНИЛ, 1939, № 6. 3. Ермолаева Я. И,— Яровизация, 1939, т. 2 (23), с. 79—86. 4. Кольман Э.— Яровизация, 1939, т. 3(24), с. 70—73. 5. Романовский В. Математическая статистика. М.; Л., 1938, с. 226.
27. Стационарные последовательности в гильбертовом пространстве 215 27 СТАЦИОНАРНЫЕ ПОСЛЕДОВАТЕЛЬНОСТИ В ГИЛЬБЕРТОВОМ ПРОСТРАНСТВЕ* ВВЕДЕНИЕ Определение 1. Последовательность {х (t)} элементов комплексного гильбертова пространства Н, где t пробегает все целые значения от —оо до + °°> называется стационарной, если скалярные произведения Вхх (к) = (х (t + к), χ (t)) (0.1) не зависят от t. Определение 2. Две стационарные последовательности {х (t)} и {у (t)} называются стационарно связанными, если скалярные произведения Вух (к) = (у (t + к), x(t)) (0.2)' не зависят от t. Из определения величин] Вух (к) и Вхх (к) непосредственно вытекает, что Вху (к) = Вух (- к), (0.3) Вхх (к) = Вхх (- к). (0.4) Такого рода стационарные и стационарно связанные последовательности имеют большое значение в тео'рии вероятностей и математической статистике. В терминах теории вероятностей они подвергнуты подробному изучению в книге X. Волда [1] и в статье X. Крамера [2]. Мы излагаем основные результаты X. Волда и X. Крамера в терминах геометрии гильбертова пространства в § 3 и в § 7. Все новые проблемы, которые изучаются и решаются в настоящей работе, тоже возникли на почве теории вероятностей и математической статистики. Применения полученных нами результатов к задачам экстраполирования и интерполирования стационарных рядов случайных величин подробно освещены в моей статье [7]. Следующая теорема показывает очень простую связь, которая существует между стационарными и стационарно связанными последовательностями и унитарными операторами. Теорема 1. Пусть последовательности {хг (*)}, {х2 (*)},. . ., {хп (*)} * Бюл. МГУ. Математика, 1941, т. 2, вып. 6, с. 1—40.
216 27. Стационарные пиьледрвательности в гильбертовом пространстве стационарны и попарно стационарно связаны и пусть ΗΧίΧ2Χ есть минимальное линейное замкнутое подпространство пространства Н, содержащее все элементы этих последовательностей. Тогда равенства 17χμ (t) = ζμ (ί + 1), μ = 1,2,. . ./ τι, — οο < t < + οο, однозначно определяют унитарный оператор отображающий пространство НХхХг х на самого себя. Эта теорема позволяет получить ряд основных свойств стационарных и стационарно связанных последовательностей в качестве непосредственных следствий известных результатов спектральной теории унитарных операторов. Таков характер всех теорем § 3—6. Более своеобразными и существенно новыми представляются нам результаты § 8—10, § 1—2 имеют вспомогательный характер. Теорема 1 непосредственно вытекает из определений 1 и 2 и леммы 1, доказанной в § 1. § 1 ДВЕ ЛЕММЫ Пусть на каком-либо подмножестве Μ пространства Η определен оператор Тх = у со значениями из Н. Оператор Τ называется изометрическим, если для любых χ и у из Μ (х, у) = (Тх, Ту). . (1.1) Пусть Им есть минимальное замкнутое линейное подпространство пространства Н, содержащее М. Тогда имеет место следующая Лемма 1. Оператор Τ может быть продолжен с сохранением изометричности на все пространство Η м- Такое продолжение единственно. Для доказательства леммы выберем в Μ всюду плотную последовательность элементов ъъ ζ2, . . ., ζη, . . . (1.2) Из этой последовательности выкинем все элементы ζη, которые линейно зависят от предшествующих им zk. Получится последовательность для которой множество! R всех элементов ζ вида ζ = а^щ + α2ζη2 + . . . + αρζηρ (1.4)
27. Стационарные последовательности в гильбертовом пространстве 217 содержит все элементы последовательности (1.2) и всюду плотно на ffM. Так как элементы множества R пред ставимы в виде (1.4) единственным образом (в силу линейной независимости элементов последовательности (1.3)), то формула Γ*ζ = ajznx + a2Tzn2 + . . . + αρΤζηρ (1.5) однозначно определяет некоторый оператор Г* на R. При этом для любых ζ' и ζ* из R (Ζ\ ζ") = (Τ*ζ', Τ*ζ'), т. е. оператор Г* изометрический на R. По непрерывности его можно продолжить с сохранением изометричности на все пространство Нм· Так как все элементы последовательности (1.2) входят в Д, то из формулы (1.5) вытекает, что для всех элементов (1.2) 1 ζη = 1 ζη'9 по непрерывности это равенство соблюдается и на всем множестве Μ. Существование требуемого продолжения доказано. Любое другое изометрическое продолжение оператора Τ в силу формулы (1.5) совпадает с Г* на множестве R. По непрерывности такое совпадение сохраняется и на всем Нм- Следовательно, изометрическое продолжение Τ на все пространство Нм единственно. Лемма доказана. Лемма 2. Для того чтобы в пространстве Η существовала последовательность элементов удовлетворяющая условиям {ит% ип) = стп; т, п,= 1, 2, . . ., (1.6) необходимо и достаточно, чтобы при любых к, тъ т2, . . ., т^ матрица || cm<m.|| была эрмитовой неотрицательной, т. е. чтобы было г * S= Σ Cm.mU^O (1.7) <* 3=1 J для любых комплексных ξχ, ξ2> · · ·» L·· Чтобы доказать необходимость условия (1.7), рассмотрим элемент пространства Η и = %1итх + ^2итг + $Ъитк· Легко вычислить, что || и ||2 = (и, и) = S. - (1.8) Так как всегда || и ψ ^ О, то из (1.8) вытекает (1.7). 1 Здесь, как и во всем дальнейшем, а ]> 0 означает, что а действительно и неотрицательно.
218 27. Стационарные последовательности в гильбертовом пространстве Переходим к доказательству достаточности условия (1.7). Предположим в соответствии с этим условием, что при каждом η Найдем преобразование η % = Σ <$;%, 3=1 которое приводит форму Sn к виду т Выберем в Η ортогональную нормированную систему векторов _(П) (71) (П) * Δ1 ·> Δ2 » · · ·» ^m и положим и?0 = 2 <$Ч"» г — 1, 2,. . ., п. Легко вычислить, что тогда (иТ\ uf]) = ctj. ГГроизведя это построение для всех положительных целых п, построим последовательность Uli U2i · · ·» uni · · · следующим индуктивным процессом: 1) положим 2) предполагая иъ и2, . . ., uN уже найденными и удовлетворяющими требованию (1.6), для всех т, η <J N положим TNuS+1 = ип, η = 1, 2, . . ., TV. На множестве Mjv = {u[N+1\. . ., ^+1)} оператор TN изометричен. По лемме 1 его можно продолжить с сохранением изометричности на пространство HMn- Так как пространства HMn и TMnHmn конечномерны, то оператор Т^ можно продолжить с сохранением изометричности на все пространство Я (см., например, теорему 2.49 книги М. Стоуна [3]). Выбрав такое продолжение, положим — Т 7/(^+1) UN+1 = I nUn+1 · Очевидно, что элементы ии и2,. . ., uN+1 удовлетворяют условию (1.6) при всех иг, η < N + 1.
of. Стационарные последовательности в гильбертовом пространстве 219 § 2 ОПЕРАТОРНОЕ ИСЧИСЛЕНИЕ В ПРОСТРАНСТВЕ Я В соответствии с теоремой 1 обозначим через Нх минимальное замкнутое линейное подпространство пространства Н9 содержащее все элементы стационарной последовательности {х (t)}, и рассмотрим унитарный оператор Ux, определяемый равенствами Ux χ (t) = χ (t + 1). (2.1) Пусть π Ux= $ e*dE.(k) (2.2) —π есть спектральное представление 2 оператора Ux. Положим для — η < λ < + π Fxx (λ) = μ Ι Εχ (λ) χ (0) |2. (2.3) Следуя изложению Μ. Стоуна.([3, гл. 6, § 1]), обозначим через Ltv класс всех измеримых относительно Fxx (λ) комплексных функций, определенных на отрезке —π <^ λ ^ п, для которых интеграл π S |φ(λ)|2<^(λ) (2.4) —π конечен. Две функции <рх и φ2 класса Lx будем'считать тождественными, если Φι (λ) = φ2 (λ) почти всюду относительно Fxx (λ). Р|Каждой функции φ класса Lx соответствует (см. [3, теорема 6.1]) оператор π Τ(Ψ)= Ι ψ(λ)άΕχ(%), (2.5) 2 См. по поводу спектральных представлений линейных операторов книгу М. Стоуна [3]. Заметим здесь, что во всем дальнейшем употребляются лишь разложения единицы Ε (λ), соответствующие унитарным операторам, для которых Ε (—π) = 0 и Ε (+π) = 1. К ним применимы все теоремы книги М. Стоуна, употребляемые далее, которые сформулированы в этой книге для более общего случая разложений единицы, соответствующих спектральному представлению самосопряженных операторов в виде 4= \ λάΕ(λ).
220 27. Стационарные последовательности в гильбертовом пространстве область определения δ (φ) которого состоит из всех тех элементов ζ пространства Нх, для которых интеграл π J \φ(λ)\»ά\Ε(λ)ζ\* (2.6) —π конечен. Из конечности интеграла (2.4) вытекает, что χ (0) принадлежит δ (φ) для любой4 функции φ из класса Lx. Поэтому каждой функции φ класса Lx соответствует определенный элемент π Ζφ = Τ (φ) * (0) = Ι φ (λ) dEx (λ) χ (0) (2.7) —π пространства Ηχ. Введенные обозначения позволяют сформулировать следующие две леммы, которые являются почти непосредственными следствиями теорем 6.1 и 6.2 М. Стоуна [3]. Лемма 3. Отображение Φ -> Τ (φ) отображает класс Lx взаимно однозначно на класс £ГХ всех операторов Τ', представимых в виде (2.5), где φ принадлежит h\. При этом αφ ->■ аТ (φ), >* (За) Φι + φ2 ^ Τ (Φι) + Τ (φ2); (3b) если фхф2 принадлежит Lx, то ΦιΦ2 "+ Τ (Φι) Г (φ2) = Г (φ2) Г (Φι), (Зс) е ϋλ , £& (3d) если χλ (μ) = 1 при μ <; λ и χ^ (μ) = 0 при μ^> λ, то Ъ.~+Ех (λ). (Зе) Лемма 4. Отображение φ -^Ζφ отображает класс Lx взаимно однозначно на все пространство Нх. При этом αφ ->- αζφ, (4а) Φι + Ψ2 -► *<* + ζφ2; (4b) £&/ш фхф2 принадлежит Lx. то ψιΨζ -> Г (φι)ζ„ =[Г (φ2) ζΦι, (4с) β«· φ -* £/*ζφ- (4d) хх (φ) -»- £* (λ) «φ, (4β)
27. Стационарные последовательности в гильбертовом пространстве 221 (Ζφι, Ζφ2) = J φι(λ)φί(λ)^«(λ), (4f) —π π (Εχ (λ) ζΦι, ζφ2) = J <pi (λ) фа (λ) dFxx (λ). (4g) —π Свойства (За), (ЗЬ) и (Зс) отображения φ -> Г φ вытекают из теоремы 6.2 М. Стоуна [3]. Свойства (3d) и (Зе) можно вывести из сравнения формулы (2.5) с формулами π Ul= J eitKdEx(X), (2.8) —π λ π 2?*(λ) = Ι <1Εχ(μ)= Ι %φ)άΕχ(μ). (2.9) —π —π Взаимная однозначность отображения φ ->■ Τ (φ) вытекает из того, что при φχ Φ φ2 (в смысле определения1 тождества, принятого в L%) разность π Γ(φι)*(0)-Γ(φ,)*(0)= $ [φι<λ)-φ2(λ)]ώ£α(λ)Λ:(0) —II имеет норму| π π S Ι φι (λ) - φ2 (λ) fd\Ex (λ) * (0) |· = J .| φϊ (λ) - φ2 (λ) |2 di" χχ (λ) =£ 0 —π —π и, следовательно, Τ (Φι) χ (0) ^ Γ (φ2) χ (0). Для доказательства леммы 4 заметим следующее: множество 9fr всех элементов Нх, представимых в виде (2.7), где φ принадлежит Ас, является по теореме 6.2 М. Стоуна [3] замкнутым линейным подпространством пространства Нх\ так как] π x(t) = Uix(0) = J βίίλdEx(λ)*(0) (2.10> —π и функция^ eit% принадлежит Lx, то 2)ί содержит все ж (£), откуда вытекает, что После этого замечания лемма 4 в части однозначности соответствия ψ ->■ £φ и его свойств (4а), (4Ь) и (4f) становится непосредственным: следствием теоремы 6.2 М. Стоуна [3].
222 27. Стационарные последовательности в гильбертовом пространстве Свойства (4с), (4d) и (4е) соответствия φ -> ζφ вытекают из соответствующих свойств (Зс), (3d) и (Зе) отображения φ -> Τ (φ). Наконец, из (4е) и (4f) вытекает (4g): π (Ех (λ) ζφι, ζφ2) = J [χλ (μ) φι (μ)] φ2 (μ) dFxx (μ) = —π = $ φί(λ)φ2(λ)^α(λ). —я Таким образом, леммы 3 и 4 доказаны. § 3 ОСНОВНЫЕ СПЕКТРАЛЬНЫЕ СВОЙСТВА Теорема 2. Для любой стационарной последовательности {х (t)} величины Вхх (к) можно представить в виде я Вхх(к) = J eil!XdFxx(%), (3.1) -π где Fxx есть действительная непрерывная справа неубывающая функция, определенная на отрезке —π <^ λ <ζ π, для которой Fxx (- π) = 0. (3.2) Функция Fxx (λ), удовлетворяющая перечисленным условиям^ «определяется однозначно по величинам Вхх. Заметим здесь же, что функция Fxx (λ), которую будем называть в дальнейшем спектральной функцией последовательности {х (£)}, как явствует из дальнейшего, совпадает с функцией, определенной в § 2 формулой (2.3). Теорема 3. Если две стационарные последовательности {х (t)} и {у (t)} стационарно связаны между собой, то я Bxv{h)= I eikkdFxv(X). (3.3) —π где Fxy (λ) есть (вообще говоря, комплексная) непрерывная справа функция с ограниченным изменением, определенная на отрезке — π <^ λ ^ π, для которой Fxy (- π) = 0. (3.4) Функция Fxy (λ), удовлетворяющая перечисленным условиям,, определяется однозначно по величинам Вху. Так как каждая стационарная последовательность стационарно связана сама с собой, теорема 2, за исключением утверждения о том, что функция Fxx (λ) является действительной и неубывающей, может рассматриваться как частный случай теоремы 3.
27. Стационарные последовательности в гильбертовом пространстве 223 Для доказательства теоремы 3 рассмотрим спектральное представление π Uxy= ξ eiKdExy(%) (3.5) —π оператора Uxy, существование которого вытекает из теоремы 1 при η = 2, хг = х, х2 = у. Положим для — π <^ λ <^ π: (Еху (λ) χ (0), у (0)) = Fxy (λ). (3.6) Как известно (см. Стоун] [3, с. 177]), Fxy (λ) есть непрерывная справа функция с ограниченным изменением. Из Еху (- л) = 0 . (3.7) вытекает, что Fxv (- л) = 0. Наконец, π Бху(к) = (х(к), y(0)) = (Ukx(0),y(0)) = ( J eift^tf(X)*;(0), у(0)) = —π π π = I е^а(Е(к)х(%у(0))= I J*%dFxy{%). —π —π Таким образом, функция Fxy (λ), определенная^ формулой (3.6)tf удовлетворяет всем требованиям теоремы. В частном случае одной последовательности {х (t)} = {у (t)} функция Ржх (λ) = (Ех (λ) χ (0), χ (0)) = | Ех (λ) я (0) |2 . (3.8) будет действительной и неубывающей (см. М. Стоун [3, с. 189]). Этим оправдывается соответствующее утверждение в формулировке теоремы 2. Из элементарных свойств ряда Фурье для функций с ограниченным изменением (см., например, А. Зигмунд [4, с. 13]) вытекает, что FXy^) = -^-Wxy(K + 0) + C, (3.9) где ^(λ)=^(θ)λ-^^-β-^, · (з.ю> а константа С .вычисляется из условия ^(-я) =0. (3.11/
-224 27. Стационарные последовательности в гильбертовом пространстве Формулы (3.9) и (3.10) показывают, что функция Fxy (λ) однозначно определяется по величинам Вху. Таким образом, теоремы 2 и 3 доказаны полностью. Заметим еще, что из (3.8) непосредственно вытекает Fy* (λ) = Рху (λ). (3.12) Теорема 4(Х. Крамера). Если последовательности {xi(t)}, {Xi(t)},...t{xu(t)}- стационарны и стационарно связаны, то при любых —π «ξ^ а <; β ^ π приращения №ΧμΧν = FX)lXv (β) — FV4 (α) (3.13) образуют неотрицательную эрмитову матрицу, т. е. Σ Δ^ννξμϊν>0, (3.14) каковы бы ни были комплексные ξ1? ξ2> · · ·» ζη· Обратно, если непрерывные справа функции ^μν (λ), μ, ν = 1, 2, . . ., η, определенные на отрезке — π <^ λ <[ π, удовлетворяют условиям !=ιΔ^μν£μΙν>0, (3.15) ^μν(-π) = 0, (3.16) то в Н существует система стационарных и стационарно связанных последовательностей для которой ί,χμ«ν(λ) = ί,μν(λ). (3.17) Для доказательства первой части теоремы рассмотрим спектральное представление π £/ = J ei%dE(%) —π оператора теоремы 1 и, положив *^Σΐμ*μ(0), μ=1
27: Стационарные последовательности в гильбертовом пространстве 225 рассмотрим на отрезке — π <С λ <ζ π выражение φ (λ) = ΙΕ (λ) ζ |2 = (Ε (λ) ζ, ζ) = {Ε (λ) S ξ^μ (0), | ξνχν (0)) = μ=1 ν=1 = Σ (^(λ)*μ(0),ξν«ν(0))= S ξμΜ£(λ)Λμ(θ),*ν(θ)) = μ,ν=1 U,V=1 = Jj ^λ· χν(λ)ξμξν. μ,ν=1 Так как функция φ (λ) действительная и монотонно неубывающая (см. М. Стоун [3, с. 189]), то при α< β φ(β)-φ(α) = Δφ= Σ AF* *у|& > 0, μ,ν^ΐ μ что и требовалось доказать. Переходя к доказательству второй части теоремы, полошим π £μν(*)= J' Λ^μν(λ). —π По лемме 2, для того чтобы в пространстве Η существовали элементы χμ (£), соответствующие любому целому t и любому μ = 1, 2, . . . . . ., η, при которых (Ч (*'). *ν И) - #μν (f - *»)> достаточно, чтобы было ?· ^ = Σ #μυμ0 (*р — *«) Iplq > °> 2·, 9=1 Р Q каковы бы ни были г, μρ, tp, ξρ. Это требование всегда выполняется, так как, полагая %,(к)=<?*»%, ζμ(λ)^2(μ)ιΡ(λ), где Σ^) распространяется на все р, для которых μρ = μ, имеем в силу неравенств (3.15) г π г η в= Σ S βί(νν^μΛ(λ)ξρΙ9= Σ $Μλ)ΐ9(λ№Λ(λ) = ρ, g=l —π ρ, g-—l —Я π η = J Σ ζμ(λ)ζν(λ)^μν(λ)>0. -πμ,ν=ι Для элементов χμ (£) пространства Η, существование которых таким образом установлено, £V'v W = fa* ^ + *)' *v W = B^ W· 8 A. H. Кола лмогоров
226 27. Стационарные последовательности в гильбертовом пространстве Поэтому последовательности стационарны и стационарно связаны. Легко видеть, что при этом #>τμ*ν(λ) = ^μν(λ). Теорема 4 полностью доказана. В случае η = 1 из второй части теоремы 4 вытекает Теорема 5. Для любой действительной непрерывной справа неубывающей функции F (λ), определенной на отрезке — π <ζ λ <; π и удовлетворяющей условию F (— п) = О, существует стационарная последовательность {х (t)} с Fxx (λ) = F (λ). В случае п = 2 условие (3.15) равносильно совокупности условий Δ/^2 > О, Δ^Χ2Χ2-> 0, | Δ^Λ ρ < AFXlX£FX2X2 (см. X. Крамер [2, с. 227]). В этом случае теорема 4 дает: Теорема 6. Если последовательности {х (£)} и {у (t)} стационарны и стационарно связаны, то при любых — π ^С α < β ^ π | AFxy I * < AFXX AFyy. (3.18) Обратно, если функции Fn (λ), F22 (λ) w Fl2 (λ), определенные на отрезке — π <^ λ <^ π, непрерывны справа и удовлетворяют условиям AF1± > О, AF22 > 0, | AF12 |2 < AFX1AF22, (3.19) Fn (- π) = F22 (- π) = F12 (- π) = О, то существуют стационарные и стационарно связанные последовательности {х (£)} и {у (£)}, для которых Fxx (λ) = Fn (λ), Fyy (λ) = = F22 (λ), ^ (λ) = F12 (λ). Дальше нам понадобится следующее усиление теоремы 6. Теорема 7. Если функции Fn (λ), F22 (λ) и F12 (λ) удовлетворяют всем условиям второй части теоремы 6, стационарная последовательность {х (£)} такова, что Fxx (λ) = Fu (λ) и ортогональное дополнение Η Q Нх пространства Нх до пространства Η бесконечномерно, то в Η существует стационарная и стационарно связанная с {х (£)} последовательность {у (£)}, для которой Fm (λ) = F22 (λ), Fxy (λ) = F12 (λ). Чтобы доказать теорему 7, заметим, что по теореме 6 из принятых условий относительно функций Рг1 (λ), F22 (λ) и F12 (λ) вытекает существование стационарных и стационарно связанных последова-
27. Стационарные последовательности в гильбертовом пространстве 227 тельностей {х* (t)} и {г/* (t)}, для которых Fx*x* (λ) = Fix (λ), Fy*y*(k) = F22 (λ), Fx*y*(K) = F12 (λ). Положим для всех целых £ Гж* (ί) = χ (t). Легко проверить, что оператор Τ изометричен на множестве {ж* (t)}. По лемме 1 оператор Τ с сохранением изометричности продолжается на все пространство Нх*. Очевидно, при этом 1Η х* = лж. Так как ортогональное дополнение Η Q Нх бесконечномерно, то оператор Τ может быть продолжен с сохранением изометричности с Нх на все] пространство Нху (см. М. Стоун [3, теорема 2.49]). Выбрав такое продолжение, положим Ту* (t) = у (t). Последовательность {у (t)} обладает, как легко видеть, всеми требующимися в теореме 7 свойствами. § 4 ПОДЧИНЕННЫЕ ПОСЛЕДОВАТЕЛЬНОСТИ Определение 3. Стационарная последовательность {у (t)} называется подчиненной стационарной последовательности {х (£)}, если последовательности {х (t)} и {у (t)} стационарно связаны и все элементы последовательности {у (t)} лежат в пространстве Нх. Очевидно, если последовательность {у (t)} подчинена последовательности {х (£)}, то Нху = Нх, (4.1) Uxy = Ux. (4.2) Пользуясь понятиями, введенными в § 2, мы докажем следующую теорему. Теорема 8. Каждой последовательности {у (£)}, подчиненной {х (t)}, соответствует одна-единственная функция yf (λ) класса Аг, для которой λ Fyy{^)= S \^x)(m2dFxx(X), (4.3) —Я λ Fvx{k)=l<f?(X)dFxx(k). (4.4) —Я Отображение {У (t)} -> φ^ (λ)
228 27. Стационарные последовательности в гильбертовом пространстве отображает взаимно однозначно класс Yx всех последовательностей {у (t)}, подчиненных {х (t)}, на класс Lx функций φ (λ). При этом для двух последовательностей {ух (t)} и {у2 (£)} из Yx Ρυ,ν. (λ) = S <(λ)4>vV (λ) dFxx(λ). (4.5) —π Утверждение о единственности функций φ;,χ) (λ) понимается в тес- реме 8 в смысле, соответствующем данному в*§ 2 определению тождества для функций φ (λ) класса L\. Однозначность вытекает из формулы (4.4), в силу которой φ£> (λ) = dFyx (X)/dFxx (λ). (4.6) Существование функций φ^ (λ) для любой последовательности {у (t)} класса Yx мы докажем наосновании леммы 4 из § 2. Если {у (t)} входит в Yx то у (0) принадлежит Нх и по лемме 4 существует такая функция ц>у} (λ) класса Lx, для которой У (0) = ζ (χ). (4.7) Чу По формуле (3.6) и утверждению (4g) леммы 4 имеем, каковы бы ни были последовательности {ух (t)} и {у2 (t)} из Yx: Рщуг (λ) = (ЕУ1,Л (λ) У1 (0), у, (0)) = (Ех (λ) У1 (0), уг (0)) = λ = \ ^yMfJ^)dFxx(%), что доказывает формулу (4.5). В частном случае ух = у, у2 = χ получаем (4.4), а при ух = у2 = х формулу (4.3). Взаимная однозначность соответствия между {у (£)-} п φ(^ (λ) также вытекает из леммы 4. Существенным дополнением к теореме 8 является Теорема 9. Если последовательности {х (t)} и {у (t)} стационарны и стационарно связаны, то для того, чтобы последовательность {у (t)} была подчинена последовательности {х (£)}, необходимо и достаточно существование такой функции φ (λ) из Ll, для которой (4.8) F 1 УЬ Рух ,(λ)= ,(λ)= s —π λ 5 1<ρ(λ)|2^(λ), <p(l)dFxx(X). (4.9) Необходимость условия вытекает из теоремы 8. Докажем его достаточность. Если функция φ (λ) из L\, удовлетворяющая равен-
27. Стационарные последовательности в гильбертовом пространстве 229 ствам (4.8) и (4.9), существует, то по теореме 8 существует подчиненная последовательности {х (t)} последовательность {у* (£)}, для которой φ<*2 (λ) = φ (λ) и, следовательно, Fy*y* (λ) = Pyy (λ)> Ρ у* χ (λ) = Pyx (λ)· По лемме 1 на Нху* можно определить изометрический оператор Т, для которого при любом целом t Тх (t) = χ (ί), Ту* (t) = у (ί). Очевидно, что Г (Яад.) = Нху, Τ (Нх) = Ях. (4.10) Так как {г/* (£)} подчинена {х (t)}, то Яад* = Я*. (4.11) Из (4.10) и (4.11) вытекает что и означает, что {у (t)} подчинена 3 {х (t)}. Определение 4. Стационарные последовательности {х (t)} и {у (t)} называются эквивалентными, если каждая из них подчинена другой, т. е. если они стационарно связаны и Ηχ = Ηυ. Теорема 10. Для того чтобы последовательность {у (£)}, подчиненная {х (t)}, была эквивалентна {x(t)}, необходимо и достаточно, чтобы функция φ^α) (λ) была отлична от нуля почти всюду относительно Fxx (λ). Если это условие выполнено, то φ^(λ) = 1/φ<Τ> (λ) (4.12) почти всюду относительно Fxx (λ) и относительно Fyy (λ). 1°. Докажем необходимость условия. Допустим, что {у (t)} подчинено {х (£)}, а {х (t)} подчинено {у (t)}. Тогда из формулы (4.3) и из получающейся перестановкой индексов формулы λ Fxx(l)= J Iφ^(λ)ρ<**■,,„(λ) (4.13) —π вытекает, что функции Fxx (λ) и Fyy (λ) абсолютно непрерывны друг относительно друга. Поэтому понятия «почти всюду относительно 3 После того как этот вывод сделан, становится ясным, что в действительности последовательность {у (£)} совпадает с {х (t)}.
230 27. Стационарные последовательности в гильбертовом пространстве \ Fxx» и «почти всюду относительно Fyy» совпадают. В силу (4.3) и (4.13) λ λ *■**(*)= $ Wf(X)\4Fyy(X)= J |φ^(λ)Ρ|φ<*>(l)\*dF„(k) —Jt —Я и, следовательно, почти всюду относительно Fxx \№№\чТ(Щг = 1. (4.14) Формула (4.14) показывает, что ц)(ух) (λ) Φ О почти всюду относительно Fxx, что и требовалось доказать. 2°. Докажем достаточность условия. Допустим, что {у (t)} подчинено {х (£)} и ц)ух) (λ) Φ 0 почти всюду относительно Fxx. Так как по формуле (4.3) функция Fyy (λ) абсолютно непрерывна относительно Fxx (λ), то Ц)у (λ) также абсолютно непрерывна почти всюду относительно Fyy (λ). Поэтому законно писать С "»<*> = С I^WI'^W = \ dFxA,)=Fxx^ (4.15) -Л '^ λ = ξ φ<χ) (λ) dA',» (λ) = ΛίΙ(λ) = Jf,,, (λ). (4.16) —π Формулы (4.15) и (4.16) показывают, что функция φ (λ) = ί/ψ[χ) (λ) ' (4.17) удовлетворяет требованиям *"«*(λ)= Ι | φ (λ) Ρ dFyy (λ), (4.18) —Я λ Fxy(K) = J φ (λ) <*/·„„ (λ). (4.19) —Я По теореме 9 следует отсюда, что последовательность {х (t)} подчинена {у (£)}, что и требовалось доказать. 3°. По теореме 8 из формул (4.15) и (4.16) вытекает, что cpS0 (λ) - φ (λ) = 1/φ<*> (λ).
27. Стационарные последовательности в гильбертовом пространстве 231 § 5 РАЗЛОЖЕНИЕ СТАЦИОНАРНЫХ ПОСЛЕДОВАТЕЛЬНОСТЕЙ НА ОРТОГОНАЛЬНЫЕ СЛАГАЕМЫЕ Определение 5. Две последовательности {ух (t)} и {у2 {t)} называются ортогональными друг другу, если (Ух (t + к), у2 (*)) = 0 . (5.1) для всех целых к и t. . Очевидно, что для того, чтобы две стационарные и-стационарно связанные последовательности {уг (£)} и {у2 (0} были ортогональны друг другу, необходимо и достаточно условие Втг (к) = 0, (5.2) или равносильное ему условие Fmm (λ) = 0. (5.3) Теорема 11. Если две последовательности {уг (£)} и {у2 (t)} стационарны и ортогональны друг другу, то: a) последовательность {* (t)} = {Vi (t) + Уг (*)> стационарна: b) последовательности {уг (£)} и {у2 (t)} стационарно связаны как между собой, так и с последовательностью {х (£)}: (Cl) Ы (Сз) (di) (d2) (d.) ^хх (&) — ^Λ (А) = 51Л,(/с) = Fxx (λ) = ^ (λ) = Ругх (λ) = 5»,». (*) + #,■*, (A)' ^, (Α), ^2/27/2 W» ^ι (λ) + Flhb>2 (λ)> : Λ™ (λ). : ^7*2/, (λ). Доказательство теоремы 11 осуществляется при помощи простых вычислений на основании формул (0.2), (3.9) — (3.11). В условиях теоремы 11 в силу формулы (dj) и неотрицательности приращений AFXX, AFlhyi, &Fy2lj2 (при неотрицательных Δλ) I &FyJAFxx |<1, | AFyJAFxx |< 1. (5.4) Поэтому функции -и/*) п\— dFvM(λ) ih'*> α \ dFy>y*(K) ,*гЛ
232 27. Стационарjme последовательности в гильбертовом пространстве ограничены и однозначно определены (в смысле, принятом в [3]) равенствами λ Г (5-6) —π Теорема 12. В условиях теоремы 11 или обе последовательности {уг (t)} и {у2 (t)} подчинены {х (t)}, или обе не подчинены {х (t)}. Для того чтобы имел место первый из этих двух случаев, необходимо и достаточно соблюдение условия Φ»? (λ) № (λ) = 0 (5.7) почти всюду относительно Fxx. Доказательство. 1°. Если {ух (t)} подчинено {х (£)}, то в силу соотношения уг (t) = χ (ί) - У1 (ί) и {уг (t)} подчинено χ (t). Точно так же если {у2 (t)} подчинено {χ (ί)}, то и {г/х (t)} подчинено {χ (t)}. 2°. Если обе последовательности {уг (t)} и {г/2 (0} подчинены {χ (ί)}, то из сравнения (5.6) с (4.3) вытекает, что почти всюду относительно Fxx С = I «й? Is, № = I № I2, (5-8) если же принять во внимание равенства (d2) и (d3), то из сравнения (5.6) с (4.4) вытекает, что почти всюду относительно Fxx *£} = φ£\ № = <№- ■ (5-9) Сопоставление равенств (5.8) и (5.9) приводит к выводу, что почти всюду относительно Fxx функции \|4, и ψ^ равны нулю или единице. Так как, кроме того, почти всюду относительно Fxx ,■/«)' ι ,!,(*> — dFVM ι dFV*V* _ dFx* _\ /c 4Q\ то отсюда и вытекает справедливость условия (5.7). 3°. Пусть условие (5.7) выполнено, тогда в силу (5.10) функции if>y*} и ψ^ почти всюду относительно Fxx равны нулю или единице. Следовательно, почти всюду относительно Fxx справедливы равенства *E' = H>i?l2, Ф^ = I *£> I2· (5.И)
27. Стационарные последовательности в гильбертовом пространстве 233 Из (5.11), (5.6), (d2) и (d3) вытекает, что λ —π λ ^,*м= S <(λ)^^(λ), —π λ ^.Β,(λ)= $ |ψ£>(λ)№*(λ), (5.12) —π λ —π В силу теоремы 9 из существования функций ψ^ и ψ^, удовлетворяющих равенствам (5.12), вытекает, что последовательности {Уг (0) и {У'2 (0} подчинены {х (£)}. Теорема 13. Пусть для стационарной последовательности {х (£)} ортогональное- дополнение Η Q Нх пространства Нх до пространства Η бесконечномерно. Тогда любому представлению Fxx (λ) в виде суммы Fxx (λ) = F1 (λ) + F2 (λ) (5.13) двух действительных неубывающих непрерывных справа функций F-l (λ) и F2 (λ), для которых F1 (— π) = F2 (— я) = 0, соответствует хотя бы одно представление последовательности {х (t)} в виде . *(0 = Vi(t) + lte(0, (5.14) где последовательности {уг (£)} и {у2 (0} ортогональны друг другу и обладают спектральными функциями Fy*> (λ) = Fx (λ), Fym (λ) = F2 (λ). (5.15) Для доказательства положим Fn (λ) = Fra (λ), F22 (λ) = Fx (λ), F12 (λ) = F, (λ). Функции FX1 (λ), F22 (λ) и Fl2 (λ) удовлетворяют условиям второй части теоремы 6. Поэтому по теореме 7 в пространстве Η существует стационарная и стационарно связанная с {х (t)} последовательность {Уг (£)}, Для которой FViVl (λ) = F22 (λ) = Fx (λ), i^ (λ) = F12 (λ) = Fx (λ). Положив y2(t) = x(0 -yi(f), можно простыми вычислениями убедиться в трм, что последовательности {ух (t)} и {ι/2 (£)} ортогональны друг другу и, удовлетворяют равенствам (5.15).
234 27. Стационарные последовательности в гильбертовом пространстве В теореме 12 уже установлено, какие условия следует наложить на функции F± (λ) и F2 (λ) в представлении (5.13) для того, чтобы последовательности {уг (t)} и {у2 (t)} оказались подчиненными {#(£)}, т. е. лежащими в пространстве Нх. При этих дополнительных условиях требование бесконечномерности дополнения Η Q Нх становится излишним 4, заключени^жа теоремы 13 оказывается возможным усилить в том отношении, что представление (5.14) определяется представлением (5.13) однозначно 5, и мы получаем такую теорему: Τ е о ρ е м а 14. Какова бы ни была стационарная последователь- ностъ {х (t)}, каждому представлению спектральной функции Fxx (λ) в виде Fxx (λ) = F± (λ) + F2 (λ), ~де Fx (λ) и F2 (λ) — действительные неубываюцие непрерывные справа функции λ, для которых Рг (—я) = F2 (—я) = 0 и почти всюду относительно Fxx dF, (5.16) xx соответствует одно-единственное представление {χ (t)} в виде * (t) = Уг (t) + Уг (t), для которого последовательности {уг (t)} и {у2 (t)} ортогональны друг другу и FyiVi (λ) = F± (λ), Fmy2 (λ) = F2 (λ). При этом последовательности {у1 (£)} и {у2 (t)} подчинены {х (t)}. § 6 СКОЛЬЗЯЩЕЕ СУММИРОВАНИЕ Определение 6. Будем говорить, что последовательность {х (£)} получается скользящим суммированием из стационарной последовательности {и (£)}, если можно подобрать такие коэффициенты ап, что x(t)= Ъапи{1-п), (6.1) ОО где ряд в правой части сходится по норме. 4 В самом деле, рассмотрим расширение Я* пространства Я, для которого Я* θ Я бесконечномерно. В Я* по теореме 13 найдутся интересующие нас последовательности {ух (/)} и {//2 (ί)}, при дополнительных же условиях теоремы 12 последовательности {уг (t)}\ {у2 (t)} лежат в Нх. 5 Это вытекает из того, что по теореме 8 функции φ^ = dFx/dFxx и φ^ = = dF2ldFxx однозначно определяют последовательности {уг (i)\ и {у2 (t)}, подчиненные χ (t).
27. Стационарные последовательности в гильбертовом пространстве 235 Очевидно, что последовательность {х (£)}, получающаяся скользящим суммированием из стационарной последовательности {и (t)}x всегда стационарна и подчинена {и (t)}. Мы разберем в этом параграфе специальный случай, в котором верно и обратное утверждение. Определение 7. Последовательность {и (t)} элементов пространства Η называется фундаментальной, если она стационарна и удовлетворяет условиям Вии (0) - 1, Вии (к) = 0 при к Φ 0. (6.2) По формулам (3.9) и (3.10) легко вычислить, что для каждой фундаментальной последовательности {и (t)} Fuu (λ) = (λ + π)/2π. (6,3) Обратно, каждая стационарная последовательность {и (t)} со спектральной функцией вида (6.3) является фундаментальной. Элементы фундаментальной последовательности {и (t)} образуют полную нормированную ортогональную систему в пространстве Ни. Поэтому каждый элемент ζ пространства Ни однозначно представляется в виде +оо ζ= Σ ctu(t), (6.4) где Σ ^ = 1М1а< + оо. (6.5) Коэффициенты ct в формуле (6.4) определяются равенствами с, - (ζ, и (*)). (6.6) Теорема 15. Для трго чтобы стационарная последовательность {х (t)} могла быть получена скользя цим суммированием из фундаментальной последовательности {и (£)}, необходимо и достаточно, чтобы последовательность {х (t)} была подчинена {и (t)}. Если это условие выполнено, гт единственное представление {х (t)} в виде (6.1) дается формулой оо *(0= Σ Bxu(n)u(t-n). (6.7) П——оо Необходимость условия теоремы была уже указана выше. Если же это условие выполнено, то каждый элемент χ (t) последовательности {χ (t)} принадлежит Ни и в силу формул (6.4) и (6.6) представим в виде ЭО ' ОО *(') = Σ (x(t),u(s))u(s)= S Bxu(t-s)u(s) $ —— oo S= — oo или, полагая t — s = n, в виде (6.7).
236 27. Стационарные последовательности в гильбертовом пространстве Учитывая однозначность представления любого элемента в виде (6.4), мы убеждаемся в том, что каждое представление последовательности {х (t)} в виде (6.1) совпадает с (6.7). Заметим еще, что из сравнения (6.7) с (6.4) и (6.5) вытекает Σ \Bxu(n)\*=\\x(t)f=BxxlO). (6.8) Из (4.3), (4.4) и (6.3) вытекает F М=4г$1<р*и>№ (6·9) XX —л F*u(b) = 4r$V*}MdX· (6Л°) —π Формула (6.9) показывает, что φ^} (λ) есть функция с интегрируемым квадратом. Из (3.3) и (6.10) получается я Вхи (п) = JL jj еЫ? (λ) άλ. (6.11; Таким образом, величины Вхи (п) являются коэффициентами Фурье функции q4u) (λ), т. е. оо φ£°(λ)~ Σ Вхи{п)е-™к (6.12) Заметим по поводу приведенных сейчас формул, что в силу (6.3) «почти всюду относительно Fuu» обозначает просто «за исключением множества лебеговой меры нуль», а класс Lu совпадает с классом L2 функций с интегрируемым квадратом в обычном лебеговом смысле слова. Теорема 16. Для того чтобы стационарную последовательность {х (t)} можно было получить скользящим суммированием из какой-либо фундаментальной последовательности, необходимо, чтобы спектральная функция Fxx (λ) была абсолютно непрерывной. Если ортогональное дополнение Η Q Нх бесконечномерно, то указанное условие является и достаточным. Необходимость условия ясна из формулы (6.9). Чтобы доказать его достаточность, рассмотрим произвольную функцию у (λ) из L2, для которой почти всюду на —π ^ λ ^ π |γ(λ) |2 = 2ndFjdK (6.13) и определим функции Fn (λ), F22 (λ) и F12 (λ) формулами λ Fu (λ) = Fxx (λ), F22 (λ) = Ц^-, F12 (λ) = ± ξ γ (λ) άλ.
27. Стационарные последовательности в гильбертовом пространстве 237 Легко проверить, что эти функции удовлетворяют условиям второй половины теоремы 6. По теореме 7 при условии бесконечномерности Η θ Ηχ отсюда вытекает существование стационарной и стационарно связанной с {х (t)} последовательности {и (t)}, для которой Fuu (λ) = F22 (λ) = (λ + π)/2π, (6.14) λ Fxu (λ) = Fu (λ) = JL J γ (λ) άλ. (6.15) —π Формула (6.14) показывает, что {и (t)} есть фундаментальная последовательность. Из абсолютной непрерывности FXx (λ) и формулы (6.13) вытекает, что λ Fxx (λ) = Fu (λ) = -L· jj Ι γ (λ) |« ώλ. (6.16) Из (6.15) и (6.16) по теореме 9 заключаем, что последовательность {х (t)} подчинена последовательности {и (t)}. По теореме 15 отсюда следует, что {х (t)} получается скользящим суммированием из {и (t)}. Теорема 17. Для того чтобы стационарную последовательность {х (t)} можно было получить скользящим суммированием из какой-либо фундаментальной последовательности, подчиненной {х (t)}, необходимо и достаточно, чтобы функция Fxx (λ) была абсолютно непрерывна, а функция fxx (λ) = dFxx ΙΜ/άλ (6.17) почти всюду на —я <ζ λ ^ η положительна. Если же эти условия выполнены, то: A. Каждая фундаментальная последовательность, из которой можно получить {х (t)} скользящим суммированием, подчинена {х (t)}. B. Последовательность {х (t)} может быть получена скользящим суммированием из любой подчиненной ей фундаментальной последовательности. C. Для того чтобы последовательность {и (t)}, подчиненная {х (t)}, была фундаментальной, необходимо и достаточно, чтобы почти всюду на —π <^ λ <^ η было | φ'*> (λ) ρ = ι/2π/Μ (λ). (6.18) По поводу формулы (6.18) заметим, что при условиях абсолютной непрерывности Fxx (λ) и положительности почти всюду fxx (λ) класс множеств меры нуль относительно Fxx совпадает с классом множеств лебеговой меры нуль. Поэтому функции класса ϋχ·> в частности функция φ* , определяются с точностью до множества меры нуль в обычном лебеговом смысле слова.
238 27. Стационарные последовательности в гильбертовом пространстве Доказательство теоремы 17. 1°. Необходимость условия абсолютной непрерывности уже установлена в теореме 16. Докажем необходимость положительности почти всюду функции fxx. Если фундаментальная последовательность {и (t)} подчинена {х (£)}, то по теореме 9 λ + Я г, (λ)= 5 |<ϊ4χ)(λ)|2<^(λ), (6.ΐ9) откуда после дифференцирования по λ получается, что почти всюду 1/2π - | cp(u} (λ) \%х (λ). (6.20) Из (6.20) ясно, что fxx положительна почти всюду. 2°. Допустим теперь, что функция Fxx абсолютно непрерывна, а функция f^ почти всюду положительна. Уже из одной абсолютной непрерывности Fxx вытекает по теореме 16, что последовательность {х (t)} может быть получена скользящим суммированием из некоторой фундаментальной последовательности {и (£)}, лежащей в некотором расширении Н' пространства Нх. По формуле (6.9) имеем почти всюду | qiu) (λ) |2 = 2nfxx (λ) Φ 0. По теореме 10 отсюда следует, что последовательность {и (t)} подчинена {%> (t)} (т.е. лежит в действительности в самом пространстве Нх). Мы доказали, таким образом, достаточность условий теоремы и вместе с тем дополнительное утверждение А. Подчиненная {х (t)} последовательность {и (t)} в том и только в том случае является фундаментальной, если Fuu^)= \ |φ?)(λ)|2^χχ(λ)= $ \4(ηχ)(λ)\*ϊχχ(λ)άλ = λ +л ~ΎτΓ~ т. е. почти всюду Ι φ£° (λ) |2 fxx (λ) = 1/2п. (6.21) Таким образом, доказано утверждение С. В силу (6.21) для каждой фундаментальной последовательности {и (£)}, подчиненной {х (£)}, почти всюду | φ^} (λ) |2 Φ 0. По теореме 10 отсюда вытекает, что последовательность {х (t)} подчинена {и (t)} и, следовательно, по теореме 15 получается из {и (t)} скользящим суммированием. Этим доказано утверждение В.
27. Стационарные последовательности в гильбертовом пространстве 239 § 7 РАЗЛОЖЕНИЕ ВОЛДА Для любой стационарной последовательности {х (t)} будем обозначать через Нх (t) минимальное линейное замкнутое подпространство пространства Нх, содержащее все χ (s), для которых s <^ t, и через Sx пересечение всех Нх (t). Очевидно, что ' ulHx (t) = Hx(t + к), (7.1) U*XSX = Sx. (7.2) Определение 8. Стационарная последовательность {χ (t)} называется сингулярной, если} Sx = Нх. (7.3) Очевидно, что для сингулярной последовательности {х (t)} Нх (t) = Нх, (7.4) каково бы ни было t. Обратно, если равенство (7.4) верно для какого-либо одного £, то последовательность {х (t)} сингулярна. В самом деле, из справедливости равенства (7.4) для какого-либо одного t вытекает в силу (7.1) его справедливость и для всех других ί, откуда следует, что Sx = Нх. Обозначим через sx (t) проекцию χ (t) в пространство Sx. Легко видеть, что {sx (t)} является сингулярной стационарной последовательностью, подчиненной {х (£)}, для которой s»x=U'x=Sx- (7-5) Последовательность {sx (t)} называется сингулярной .компонентой · последовательности {х (t)}. Допустим теперь, что последовательность {х (t)} несингулярна. Тогда χ (t) однозначно представляется в виде x(t) = l (t) + Δ (f), (7.6) где ξ (t) принадлежит Нх (t — 1), а Δ (t) φ О ортогонально Η г (t — 1). Положим их (t) = Δ \t)l || Δ (f) ||. (7.7) Легко видеть, что элементы Чх (t), ux (t — 1), . . ., их (t — η), . . . образуют полную нормированную ортогональную систему в пространстве н* (t) θ sx.
240 27. Стационарные последовательности в гильбертовом пространстве Так как χ (t) принадлежит Нх (t), то χ (t) однозначно представляется в виде оо я(0 = *х(0 + Σ сп}их(t — п). (7.8) ?г=0 Так как последовательность {их (t)} стационарна и подчинена {х (£)}, то коэффициенты с£° = (ж (f), и* (ί - /г)) = Вхи (η) (7.9) в формуле (7.8) не зависят от t. Из (7.6) и (7.7) вытекает, что ■ со = II δ (0 II > о· (7-Ю) Представление несингулярной последовательности в виде (7.8) будем называть разложением Волда. Из предыдущего изложения вытекает, что i (t) = Sx (ί), U (t) = Ux (ί), Cn = <#* обладают следующими свойствами: Wi- Последовательность {s (t)} сингулярна и подчинена {х (t)}. W2. {и (t)} есть фундаментальная последовательность, подчиненная {χ (t)}. W3. и (t) лежит в пространстве Нх (t). W4. Последовательности s (t) и и (t) ортогональны между собой. WB. с0>0. Следующая теорема показывает, что разложение (7.8) однозначно определяется перечисленными пятью свойствами. Теорема 18. Если стационарная последовательность {х (t)} представлена в виде оо x(t) = s(t)+ 2 cnu{t-n), (7.11) последовательности же {s (t)} и {и (t)} и коэффициенты сп удовлетворяют условиям Wx—W5, то последовательность {х (t)} несингулярна и s (t) = sx (ί), и (t) = их (ί), cn = eg0. Доказательство. Так как х (tf) и все и (Ϊ — η) при η = 0, 1, 2, . . . (по условию W3) входят в Нх (£'), то оо 5 (£') = а; (Г) — 2j CnU (Г — /ι). тоже входит в Нх (Ϊ). Так как Нх (Ϊ) при i' < t лежит в Ях (ί), то все s (Ϊ) при f ^ t лежат в Нх (t). Следовательно, Hs (t) лежит в Нх (t). Так как по условию Wi Ss = Hs (ί), το Ss входит во все
27. Стационарные последовательности в гильбертовом пространстве 241 Их (О н> следовательно, в Sx. Отсюда вытекает, что все s (tr) принадлежат Sx и, следовательно, всем Нх (t). Перепишем формулу (7.11) в виде χ (0 = ζ (t) + c0u'(t), (7.12) где оо Так как s (t) и все и (t '— ή) при /г = 1, 2, 3, . . . лежат в Нх (t —1), то ζ (t) лежит в Нх (t — η). Так как все χ (£')при£' < t выражаются линейно через элементы s (t") и и (t") с ί' < ί, a u (t) ортогонально со всеми s (t") пси (£") при t" < ί, то и (ί) ортогонально всем тем «г (£'), для которых ϊ < ί и, следовательно, пространству ϋΓχ (ί — 1). Из того что ζ (t) лежит в Нх (t — 1), а и (t) ортогональна Нх (t — 1), заключаем, сравнивая (7.12) с (7.6), что ζ (t) = I (f), c0u (t) = Δ (f). (7.13) Из сравнения (7.13) с (7.7) в силу условия W5 вытекает, что и (i) = ux (t). (7.14) В силу W2 и W4 из (7.11) вытекает сп = [χ (ί), u(t — n)]. (7.15) Из (7.14), (7.15), и (7.9) получаем сп = сп\ (7.16) Из сравнения (7.8) с (7.11), принимая во внимание (7.15) и (7.16), получаем, наконец, s (ί) - sx (t). § 8 РЕГУЛЯРНЫЕ ПОСЛЕДОВАТЕЛЬНОСТИ Теорема 19. Для того чтобы стационарную последовательность {х (t)} можно было представить в виде оо *(0= Σ cnu(t — n), (8.1) η—0 где {и (t)} — некоторая фундаментальная последовательность, необходимо и достаточно условие sx (ί) = 0. * (8.2) Если χ (t) = 0, то условие sx (t) = 0 выполнено и представление (8.1) возможно (со всеми коэффициентами сп, равными нулю). Остается рассмотреть случай χ (t) Φ 0. Достаточность условия sx (t) =0
242 27. Стационарные последовательности в гильбертовом пространстве в этом случае также ясна: если sx (t) = О и χ (t) = 0, то последовательность χ (t) несингулярна и по формуле (7.8) предыдущего параграфа представима в виде оо x(t)= S Άχ(ί-η). (8.3) η—0 Докажем необходимость условия (8.2). Для этого заметим, что в случае существования представления (8.1) пространство Нх (t) содержится в пространстве Ни (t), а пространство Sx — в пространстве Su. Поэтому из равенства Sv = 0, (8.4) справедливого для каждой фундаментальной последовательности, вытекает, что Sx = О и, следовательно, что sx (t) = 0. Определение 9. Будем называть стационарную последовательность {х (t)} регулярной, если х (t) φ 0, sx (t) = 0. Если {u(t)} — фундаментальная последовательность, то (8.1) есть частный случай представлений, изученных подробно в § 6. Поэтому в соответствии с формулами (6.7), (6.8), (6.12) Вхи {п) = сп при η > 0, Вхи (п) = 0 при η < 0, (8.5) оо 2|сп|2 = И0|2 = Яжж(0), (8.6) ОО φ£°(λ) = J спе-™к (8.7) 71=0 В силу (8.6) ряд Г2(£)=Зс„Г (8.8) П-0 представляет в круге | ζ | < 1 аналитическую функцию. Ее граничные значения при | ζ | = 1 даются в силу (8.7) формулой Γϊ(β-*λ) = φϊι)(λ). (8.9) Из принятого нами условия χ (t) Φ 0 вытекает, что Тх (ζ) не может тождественно равняться нулю. Поэтому 6 почти всюду на Ι ζ I = 1 φϊ0 (λ) φ 0. (8.10) Так как по формуле (6.9) почти всюду ^%^- = /«(λ) = ^Γ|ς4-)(λ)Ρ, (8.11) 8 См., например, монографию И. И. Привалова [5, с. 391.
27. Стационарные последовательности в гильбертовом пространстве 243 то из (8.10) вытакет, что почти всюду и (λ) > °· (8·12> По теореме 17 отсюда заключаем, что последовательность {и (t)} подчинена {х (t)}. Теорема 20. Если регулярная последовательность {х (t)} представила в виде (8.1) через фундаментальную последовательность {и (t)}, то последовательность {и (t)} подчинена {х (£)}. Для того чтобы стационарная последовательность {х (£)}, подчиненная фундаментальной последовательности {и (£)}, представлялась через {и (t)} в виде (8.1), необходимо и достаточно, чтобы функция % (ζ), определенная при | ζ | = 1 равенством Ъ] {e~i%) = φ1η) (λ), (8.13) совпадала почти всюду на окружности \ ζ \ = 1 с граничными значениями аналитической функции Гхи) (ζ), определенной при | ζ | < 1 формулой 1*1=1 1 ί* ν\7'(ξ)άΖ Если это условие выполнено, то коэффициенты сп формулы (8.1) определяются из (8.8). Первая часть теоремы, необходимость условия второй части теоремы и утверждение о форме зависимости между коэффициентами сп и функцией Τχ (ζ) уже доказаны выше. Остается доказать достаточность условий во второй части теоремы. Если эти условия выполнены, то для граничных значений Γχν) (ζ) имеем разложение в ряд Фурье оо у'хи> (е~*) = q4u> (λ) ~ Σ cne-im: (8.15) Из сравнения (8.15) с (6.12) и (6.7) заключаем, что χ (t) представляется в виде (8.1) с коэффициентами сп, определенными из (8.15), или, что то же самое, из (8.8). Доказательство теоремы 20 закончено. Теорема 21. Для любой регулярной последовательно<йпи χ (t) функция σο Γ»(ζ) = Γ^)(ζ)=^Σ^)ζη (8.16) η=0 не имеет нулей внутри круга | ζ | < 1. Допустим, вопреки утверждению теоремы, что Тх (ζ) имеет нуль ζ0, лежащий в круге | ζ | < 1. Построим подчиненную {их (t)}
244 27. Стационарные последовательности в гильбертовом пространстве последовательность {и (t)}, для которой φ" (λ)- ΐ-ζ>-ίλ - ( 17) Такая последовательность существует в силу теоремы 8, так как функция 1 - ζο*-ίΑ ограничена и, следовательно, входит в класс Lu = L2. Легко вычислить, что для любого λ Ιφϊ^ίλ) Ι» = 1. (8.18) Так как fuxux № = U~ Fuxux № = Тх ΈΓ = ~2Н~ » то по утверждению С теоремы 17 из (8.18) вытекает, что {и (t)} есть фундаментальная последовательность. По формуле (4.5) λ λ Fxx (λ) = J φ1ν (λ) φ(„ν (λ) dFUxUx (λ) = -^- J φΓκ> (λ) φΐ"** (λ) άλ. —π —π (8.19) Из (4.6) вытекает, что почти всюду Φ^(λ)= ^^=2*J^ = №Mtf*\X). (8.20) В силу (8.18) φ^ (λ) = 1/φ^ (λ). Поэтому формула (8.20) может быть записана в виде φί° (λ) = φΤ*> (λ)/φ^ (λ). (8.21) В силу (8.9) и (8.16) имеем φ^(λ) = Γ^ (е-*) = Гж (*-*). (8.22) Из (8.21), (8.22) и (8.17) заключаем, что φ™(λ) = Γ,(^) "-^ . (8.23) е — to Легко видеть, что γ£° (*-*) = φ.^ (λ)
27. Стационарные последовательности в гильбертовом пространстве 245 совпадает почти всюду с граничными значениями при | ζ | = 1 функции r<«tt)(C)=r,(o4^· (8·24> Так как ζ0 есть нуль функции Тх (ζ), функция Г* (ζ) является аналитической при | ζ | < 1. По теореме 20 отсюда следует, что 7 4-оо x{t)= Σ cnu(i —/г), (8.25) 71=0 где коэффициенты сп определяются из формулы (8.8). Функция совпадает почти всюду на окружности | ζ | = 1 с граничными значениями аналитической в круге | ζ | < 1 функции rlv(o=-Frr· <8·26> Поэтому по теореме 20 оо »(<)= Д««('-в). (8·27) где dn суть коэффициенты ряда Тейлора функции Г[Гл) (ζ). Формула (8.27) показывает, что и (t) лежит в Ни (t). Так как по свойству W3 последовательности {их (t)} (см. § 7), Ни (t) лежит в Нх (t), то и и (t) лежит в Нх (t). Из только что сказанного вытекает, что все и (t — п) при η > 0 лежат в Ых (t — ή). Поэтому, сравнивая формулы (8.25) и (7.6), получаем с0и (t) = A (t), а в силу (7.7) и (7.10) с0 и (t) = CqX) их (t). Легко проверить, что последовательности {и (£)}, определяемой по формуле и (t) = (4x)/c0)ux(t), 7 Для применимости теоремы 20 существенно, чтобы функция Г^ (ξ) представлялась в виде интеграла Коши через свои граничные значения у^ (е )и То, что это действительно так, вытекает, например, из замечания С на с. 94 работы ф. Рисса [6], так как, очевидно, функция Γ^ι) (ζ), как и функция Г^ (ζ)? принадлежит классу Нх в смысле этой работы Ф. Рисса.
246 27. Стационарные последовательности в гильбертовом пространстве должна соответствовать функция φί>} (λ) = сР/со. (8.28) Противоречие между (8.28) и (8.17) доказывает теорему 21. Теорема 22. Для того чтобы стационарная последовательность {х (t)} была регулярной, необходимо и достаточно выполнение на — π =С λ <; π совокупности условий: 1) функция Fxx (λ) абсолютно непрерывна; 2) функция fxx (λ) почти всюду положительна; 3) функция log fxx (λ) суммируема. Если эти условия выполнены, то Гх (ζ) = VbteQ*(l\, (8.29) Λχ) ~ Qx (ζ) = -±- + £ (a(kx) + ib[x)) ζ\ (8.30) где коэффициенты ak и &fc определяются из разложения <х) °° 4" log fxx (λ) \--+ J] (ajf} cos ¥к + &f sin Щ.. (8.31) Так как каждая регулярная последовательность {х (t)} получается скользящим суммированием из подчиненной ей фундаментальной последовательности {их (£)}, то необходимость условий 1 и 2 пытекает из теоремы 17. Докажем необходимость условия 3. Если последовательность {х (t)} регулярна, то по теореме 21 функция Υχ (ζ) аналитична и отлична от нуля в круге | ζ [ < 1. Будем обозначать через Qx (ζ) то значение log (Yx (ζ)/|/Γ2π), которое получается по непрерывности из действительного значения Г (0) с<х) log —j= = log /2л ]/"2jx Благодаря отсутствию нулей у функции Υχ (ζ) функция Qx (ζ) однозначно определяется во всех точках круга | ζ | < 1. Для действительной части функции Qx (ζ) имеем в силу (8.29) Re Qx (ζ) = log I Γχ (ζ) Ι - V2 log 2π. (8.32) Обозначим через Re^Qx (ζ) функцию, равную Re Qx (ζ) при Re Qx (ζ) > 0 и равную нулю при Re Qx (ζ) <! 0. Так как из (8.32) вытекает Re+(?,(Q<log+"|rx(Q [< I Г* (С) I, то при любом ρ < 1 π π π
27. Стационарные последовательности в гильбертовом пространстве 247 Так как J KeQx(pe-^)dX = 2nReQx(Q), то jj \KeQx(pe-ix)\db= $ [2 Re^^(p^) - Ъе<2х(ре-*)] ώλ< —π . —π <2#-2лКе&,(0). Из последнего неравенства вытекает, что граничные значения Re^(e-ix) = log ")/"2л log Φχ* (λ) Ϋ2ΊΙ 1 = -o"log Φχ * (λ) |/"2π -j-log/«с (λ) (8.33) функции Re Qx (e~i%) суммируемы по λ. Таким образом необходимость суммируемости logfxx(k), т.е. условия 3 нашей теоремы, доказана. Прежде чем переходить к доказательству достаточности условий теоремы, докажем, что для любой регулярной последовательности {х (t)} функция Тх (ζ) определяется формулами (8.29) —(8.31). Так как по доказанному в случае регулярной последовательности {х (t)} функция V2 log fxx (λ) суммируема, то для этой функции существует разложение Фурье (8.31). Из (8.33) и (8.31) вытекает, что Ъе<?х(е* ,(*) + У (а[х) cos kl-b{x) sin Щ. k=l Так как Гх(0) /х) ρ, (0) = log ^- = 10^-4= У 2π у 2п (8.34) (8.35) действительно, то мнимая часть Im Qx (β'λ) выражается формулой оо Im Qx (е^) ~ S (акх) sin к% + Ь[х) соз к\). (8.36) к=1 Из (8.34) и (8.36) вытекает (8.30). Наконец, формула (8.29) вытекает из самого определения Qx (ζ). Обратимся теперь к доказательству достаточности условий тео-
248 27. Стационарные последовательности в гильбертовом пространстве ремы. Для этого предположим, что эти условия выполнены и положим (х) °° Q (ζ) = \- + JTJ (аГ + 4Ж)) ζ*. (8.37) Τ(ζ) = Υ2πβΡΜ, (8.38) где коэффициенты а^ и bP определяются из разложения (8.31). Тогда 8 оо l0g |Г(рО|» = 2 Re q (pe-i,) = ао ± 2 ^ р* (<4*> cos kK + π + bf} sin Щ = J log fxx (μ) Ρρ (μ - λ) άμ, (8.39) —π де Ρ (θ) = Λ *~f _ . (8.40) ρ ч ' 2д 1 -f Ρ2 — 2ρ cos θ ν ' Из неравенства между геометрическим и арифметическим средним9 вытекает, что |Γ(ρ*-ίλ)|* ^ ? 2л < \ /χχ(μ)/>Ρ(μ-λ)ίμ. (8.41) Так как функция fxx (λ) суммируема и Рр (μ — λ) άμ = 1, то в силу (8.41) я π π *- J |Γ(ρ**)|Μλ= J /«Ы J ^Ρ(μ-λ)ώλ<ίμ= J /ΚΛ(λ)ώλ. -я (8.42) Установленная таким образом ограниченность интеграла в левой части равенства (8.42) гарантирует 10 представимость функции Г (ξ) 8 См. [5, с. 15]. 9 Это неравенство мы употребляем в следующей форме: если ь ъ ь го = ? P(x)f(x)dx, logs= [p (x)logf(x)dx, С Ρ (χ) dx = 1, α α α Ρ(*)>0, /(*)>0, ΤΟ 5 ^ 771. 10 См. замечание С на с. 94 работы [6].
27. Стационарные последовательности в гильбертовом пространстве 249 ρ виде интеграла Коши от ее граничных значений Г (^ίλ) = φ (λ). Из (8,38) и (8.31) вытекает что [ φ (λ) |2 - I Г (е-*) Ρ = 2JU**e^-*> = 2nfxx (λ). , (8.43) Поэтому π < ) άΡχχ(λ)=ί J I φ (λ) Η ххУ } —π и, следовательно, функция 1/φ (λ) принадлежит классу Ll. Найдем подчиненную {χ (t)} последовательность {и (£)}, для которой (pf (λ) - 1/φ (λ). Из равенства ν(8.43) и теоремы 17С вытекает, что {и (t)} есть фундаментальная последовательность, эквивалентная {х (t)}. По теореме 10 № (λ) = l/q4u) (λ) = φ (λ) = Г (е-*·). Таким образом, последовательность {и (£)} удовлетворяет всем ус ловиям второй части теоремы 20. Следовательно, {х (t)} представляется через {и (t)} в виде (8.1), что и доказывает достаточность условий теоремы 22. Легко видеть, что построенная нами последовательность {и (t)} совпадает в действительности с {их (£)}, Отметим еще в заключение вытекающую из (8.30) и (8.35) формулу u (χ) π 4х) = |Л25Гед*(0)=1/"2яехр \-= f/'^Texpf^ ^ logfxx(X)dK). (8.44) СПЕКТРАЛЬНАЯ ХАРАКТЕРИСТИКА СИНГУЛЯРНЫХ ПОСЛЕДОВАТЕЛЬНОСТЕЙ * И СИНГУЛЯРНЫХ КОМПОНЕНТ В силу результатов § 7 каждая несингулярная стационарная последовательность {х (t)} представляется в виде *(t) = sx(t) + rx(t), (9.1) где оо ^(0=Σ^4(ί-η). (9.2) п=0 11 Формула эта верна не только# для регулярных, но и для любых несингулярных последовательностей, как это ясно из теоремы 23 следующего параграфа.
250 27. Стационарные последовательности в гильбертовом пространстве Последовательность {rx (t)} будем называть регулярной компонентой 12 последовательности {х (t)}. Очевидно, что она всегда подчинена {х (t)} и регулярна. Положим для любой стационарной последовательности Λχχ(λ) = S fxx&)dk, (9.3) —Л Dxx (λ) = Fxx (λ) - Αχχ (λ). (9.4) Будем различать следующих три случая: 1) fxx (λ) =0 на множестве положительной меры; 2) fXx (λ) = 0 лишь на множестве меры нуль, но функция log fxx (λ) несуммируема; 3) fxx (λ) = 0 лишь на множестве меры нуль и функция log fxx (λ) суммируема. Теорема 23. В случаях I) и 2) последовательность {х (t)} сингулярна. В случае 3) последовательность {х (t)} несингулярна, FVx (λ) = D„ (λ), F,Vx (λ) = Αχχ (λ) (9.5) и коэффициенты Cq разложения (9.2) определяются из формулы (8.16), где функция ΓΛ. (ζ) определяется формулами (8.29)—(8.31). Доказательство. Предположим, что последовательность {х (t)} несингулярна. Тогда в силу регулярности последовательности {rx (t)} по теореме 22 функция fr r (λ) почти всюду положительна и функция log fr r (λ) суммируема. Так как последовательности {sx (г)} и {rx (t)} ортогональны между собой (см. § 7), то по теореме И ^«(λ) = ΛΛ(λ) + ^χΓχ(λ) (9.6) и, следовательно, почти всюду /«, (λ) = fVx (λ) + fVx (λ). (9.7) Из (9.7) вытекает, что почти всюду /** (λ) > Uxrx (λ) > 0. · (9.8) Поэтому каждое множество положительной иеры по Лебегу имеет положительную меру и относительно Fxx (λ). Так как {sx (t)} и {rx (t)} подчинены {х (t)}, то по теореме 12 почти всюду относительно Fxx (λ), а следовательно, и в обычном 12 Так как последовательность, тождественно равная нулю, сингулярна, но не регулярна, то у регулярной последовательности сингулярная компонента равна пулю, а у сингулярной последовательности нет регулярной компоненты.
27. Стационарные последовательности в гильбертовом пространстве 251 лебеговом смысле имеем dFs s (λ) dFr r (λ) χ χ χ χ η Так как в силу (9.8) почти всюду dFr г (λ) U г (λ) X X X X -^ А то почти всюду dFxxM ίχχΜ τ. е. ί.Λ.χ (λ) = 0, (9.9) /** (λ) = frxrx (λ). (9.10) Из формулы (9.10), положительности почти всюду /ГЛ (λ) и суммируемости log fr r. (λ) вытекает, что для несингулярной последовательности всегда имеет место случай 3). Покажем, что, обратно, в случае 3) последовательность {х (t)} несингулярна. По теореме 14 в случае 3) последовательность {х (t)} однозначно разлагается в сумму x(t) = s (t) +r(t) взаимно ортогональных и подчиненных {х (t)} последовательностей, для которых F*. (λ) = Dxx (λ), F„ (λ) = Axx (λ).] По теореме 22 последовательность {г (t)} регулярна. Поэтому сю x(t) = s(t) -f Σ c^ur{t-n). (9.11) η—0 Формула (9.11) показывает, что пространство Нх (t) лежит в пространстве 13 Ss 0 Нт (t). Представив χ (t + 1) в виде χ (t + 1) = а + β, где а = c(J}ur(t + 1), β = s(t + 1) + 2 Λ·(ί-n + i), 71=1 13 ©ι θ ©2 обозначает минимальное линейное* замкнутое подпространство пространства Я, содержащее (5^ и ©2.
252 27. Стационарные последовательности в гильбертовом пространстве легко установить, что β лежит в пространстве Sx φ Ни (t)^ α α Φ 0 ортогонально этому пространству. Поэтому χ (t + 1) не по- мещается в пространстве Sx φ HUr (t) и, тем более, в пространству Нх (t). Отсюда вытекает, что последовательность {х (t)} несингу- лярна. Для любой несингулярной последовательности {х (£)} мы дока- зали выше формулу (9.10). Поэтому функция Γλ.(ζ), определяемая в соответствии с (8.29)—(8.31), совпадает с ΤΤχ (ζ). Чтобы доказать,. что коэффициенты с^ получаются из разложения (8Л6) функции Гх (ζ), остается лишь установить, что с, .<*> - Лг*> с)У. (9.12) Для этого достаточно проверить, что разложение (9.2) удовлетворяет условиям Wj— VV5 (с сингулярной компонентой, равной нулю). Выполнение условий Wl7 W2, W4 и W5 ясно непосредственно. Докажем соблюдение для разложения (9.2) свойства W3. Для этого заметим, что в силу (9.8) и теоремы 17А последовательность {их (t)} подчинена {rx (t)}. Из (9.1) и (9.2) видно, что Нх (t) содержится в> Sx ffi НГх (t). Так как их (t) содержится в Нх (t) и ортогональна Sx (см. § 7), то их (t) содержится в ΗΓχ (t), а это и значит, что разложение (9.2) удовлетворяет условию W3. Формулы (9.5) для несингулярной последовательности вытекают непосредственно из (9.1), (9.10) и абсолютной непрерывности Frx1.x (λ) (последняя обеспечивается, регулярностью последовательности {rx (t)} по теореме 16). § ю МИНИМАЛЬНЫЕ ПОСЛЕДОВАТЕЛЬНОСТИ Для любой стационарной последовательности {х (t)} будем обозначать через Нх (t) минимальное линейное замкнутое подпространство пространства Нх, содержащее все χ (s), для которых s Φ t. Так как UXHX (t) =Hx(t + к), (10.1) то возможен только один из двух случаев: или всеНх (t) совпадают с Нх, или все Нх (t) отличны от Нх. Определение 10. Стационарная последовательность называется минимальной, если Нх (t) φ Ηχ. (10.2) Каждый элемент χ (t) последовательности {χ (t)} однозначно представляется в виде суммы χ (t) = v (t) + δ (ί), (10.3)
27. Стационарные последовательности в гильбертовом пространстве 253 где v (t) лежат в Нх (£), а δ (t) ортогонально Нх (t). Положим <1Х = Ι δ (1) |. (10.4) Очевидно, условие dx > 0 (10.5) необходимо и достаточно для минимальности последовательности {fit)}· Теорема 24. Стационарная последовательность {х (t)} в том, и только в том случае минимальна, если функция fxx (λ) почти, всюду положительна и интеграл Ι ~ότ <10·6> — Jl конечен. Если эти условия выполнены, то *=<&Ч-стг· (10·7) —я Докажем сначала достаточность условий теоремы. Пусть π dk V/2 »(4-i = /-W(S-^[r)v' если fxx (λ) определена и конечна, и φ (λ) = 0, если fxx (λ) неопределенна и бесконечна. Тогда интеграл π Ι |φ(λ)№«(λ)=ι —л конечен. Следовательно, φ (λ) входит в класс Lx и равенство Ф^ (λ) = φ (λ) определяет некоторую последовательность {у (t)}, подчиненную {х (£)}, Для которой по формуле (4.4) λ π dk —я Fyx(k)= Jj φ{Τ)(λ)^ΧΪ(λ) = (λ + π): ( jj -у —π - —я По формуле (3.3) при s Φ t (y(t). cc(s)) = Byx(t-s)= J ei«->*dFvxfr)=0.
254 27. Стационарные последовательности в гильбертовом пространстве Следовательно, элемент у (t) ортогонален пространству Нх (t). Так как π π \y(t)f = Byy(0)= J dFvy(k)= Ι |φ<Τ>(λ)Ρ^^(λ)=1^υ, —π —π то пространство Нх, содержа у (t), не может совпадать с Нх (t). Минимальность последовательности {х (t)} доказана. Чтобы доказать необходимость условий теоремы, предположим, что последовательность {х (t)} минимальна. Легко видеть, что последовательность {δ (t)} стационарна и подчинена {х (£)}. При этом Βδχ (к) = (δ (t + к), χ (t)) = 0 при к φ 0, (10.8) Вбх (0) = (δ (f), x (t)) = Ι δ (t) | 2 = dl (10.9) Отсюда вытекает по формулам (3.9)—(3.11), что F6x (λ) = di (λ + π)/2π. (10.10) В то же время по формуле (4.4) я F6x(X)= l φ^(λ)^^(λ)· (10.11) —π Из (10.10) и (10.11) вытекает, что λ к + я=-%Г S ΦβΧ)(λ)^χχ(λ) (10.12) ·τ —π и, следовательно, производная ^eW A -^Φ6Χ)(λ) (10.13) конечна почти всюду относительно Fxx (λ). Так как в силу (10.12) λ абсолютно непрерывно относительно Fxx (λ), то производная dX/dFxx (λ) конечна почти всюду относительно λ, τ. е. в обычном лебеговом смысле. Следовательно, производная fxx (λ) = dFxx (λ)/άλ почти всюду отлична от нуля. После этого замечания из (10.13) получается, что почти всюду <*)ПЛ 4 dX _ 4 . dFss(X) _ d\ φβ W- 2n dFsx{X) - 2π · dk ~ 2njxx(k) ' По теореме 8 интеграл 4 ? л J |φΓ(λ)Ν^(λ)= $ \щ^\ άΕ^) = φ $ —π —я —: (10.14)
28. Интерполирование и экстраполирование последовательностей 255 конечен. Необходимость условий теоремы доказана. Заметив, что π π 4 = Ι δ(012 = ВЫ(0) = J dF66 (λ) = I I φ?>·(λ) |»dFxx (λ), (10.15) —π —π из (10.14) и (10.15) получаем формулу (10.7). ЛИТЕРАТУРА 1. Wold H. A study in the analysis of stationary time series. Uppsala, 1938. 2. Cramer #.— Ann. Math., 1940, vol. 41, p. 215—230. 3. Stone M. Linear transformations in Hubert space.— Amer. Math. Soc. Col- loq. PubL, 1932, vol. 15. 4. Зигмунд А. Тригонометрические ряды/Пер. с англ. М., Л.: ОНТИ, 1938. 5. Привалов И. И. Интеграл Cauchy. Саратов, 1919. 6. Riesz F,— Math. Ztschr., 1923, Bd. 18, S. 87—95. 7. Колмогоров А. П.— Изв. АН СССР. Сер. мат., 1941, т. 5, с. 3—14. 28 ИНТЕРПОЛИРОВАНИЕ И ЭКСТРАПОЛИРОВАНИЕ СТАЦИОНАРНЫХ СЛУЧАЙНЫХ ПОСЛЕДОВАТЕЛЬНОСТЕЙ* Устанавливаются спектральные условия для возможности экстраполировать и интерполировать стационарные случайные последовательности по достаточно большому числу членов с любой заданной точностью. • ВВЕДЕНИЕ Пусть каждому целому t (—оо < t < +ос) соответствует действительная случайная величина χ (t) с конечным математическим ожиданием квадрата. Последовательность {х (t)} случайных величин χ (t) будем называть стационарной, если математические ожидания х т = tAx (t) и В (к) = Μ [(χ (t + к) — τη) (χ (t) — m)] не зависят от t. Без ограничения общности можно положить т - tAx (t) = 0. (1) * Изв. АН СССР. Сер. мат., 1941, т. 5, с. 3-14. 1 Математическое ожидание случайной величины у обозначается далее через Μ у.
256 28. Интерполирование и экстраполирование последовательностей Тогда В (к) = Μ [χ (t + к) χ (t)]. (2) Так как В (-к) = В (к), (3) то достаточно рассматривать вторые моменты β (к) лишь для к ^> 0. Задача линейного экстраполирования стационарной последовательности, удовлетворяющей условию (1), заключается в подборе при заданных η ]> 0 и т ;> 0 таких действительных коэффициентов а6, при которых линейная комбинация L = ахх (ί —- 1) + а2х (t — 2) -f . . . + ап χ (t —л) случайных величин χ (t — 1), χ (t — 2), . . ., χ (t — η) доставляет возможно более точное приближение к случайной величине χ (t + m). За меру точности такого приближения естественно принять математическое ожидание η η η σ2 = Μ(χ(ί + m)— Lf= 5(0)—2 S B{m + s)as + J, S #(P — g)ap«g. Если вторые моменты В (к) известны, то легко решается задача разыскания таких значений коэффициентов as, при которых σ2 достигает наименьшего значения. Это наименьшее значение σ2 будем обозначать через о\ (^, т)· Очевидно, при увеличении η величина а% (п, т) не может возрастать. Поэтому существует предел lim σ% {η, т) = g\ (τη). (4) Определение этого предела и является первой из решаемых в настоящей работе задач. Что касается задачи интерполирования, то мы рассмотрим лишь случай оценки χ (t) по величинам x(t + 1), x(t + 2), . . ., x(t + η), χ (t — 1), χ (t — 2), . . ., x(t — ή). Для этого случая обозначим через о\ (п) минимальное значение математического ожидания σ2 ^ м (χ (t) - <?)2, где Q есть линейная форма Q = alX (t + i) + 02x(t + 2) + ... +anx (t + η) + + а.гх (t — 1) + а-2х (t — 2) -f . . . +ci-nx (t — n) с постоянными действительными коэффициентами as.
28, Интерполирование и экстраполирование последовательностей 257 При возрастании η величина σ| (η) не возрастает. Поэтому существует предел lim σ} (η) = о]. (5) П—σο Нашей второй задачей является определение в\. Предлагаемое далее решение двух сформулированных выше задач было сообщено без доказательства в моей заметке [I]2. Оно опирается на понятия, относящиеся к спектральной теории стационарных случайных процессов. Спектральная теория стационарных случайных процессов была построена А. Я. Хинчиным [2] для случая непрерывного изменения временного аргумента t. Для интересующего нас сейчас случая дискретной стационарной последовательности подробное изложение теории дано в книге Уолда [3]. Основное значение здесь имеет следующая теорема 3. Теорема 1. Для любой стационарной последовательности {х (t)} вторые моменты В (к) можно представить в виде я В (к) = -±- С cos kX dW (λ), (6) о где W (λ) есть неубывающая действительная функция, определяемая формулой оо W (λ) = В (0) λ + 2 JH 2ψ- sin Αλ. (7) /ί=1 Производная w (λ) = dW (λ)/άλ неубывающей функции W (λ) существует почти всюду, неотрицательна и суммируема. Так как log w (λ) < w (λ), то из суммируемости w (λ) вытекает, что интеграл π P=^L[logw(l)dl (8) 2 В формуле (1) этой заметки допущена опечатка. Правильный вид формулы (1) таков: π П—оо J S (λ) 0 3 См. [3, § 17].
258 28. Интерполирование и экстраполирование последовательностей либо конечен, либо равен 4 — оо. Далее мы доказываем следующую теорему. Теорема 2. Если Ρ = —σο, то σ| (πι) = О для всех т ;> 0. Если же интеграл Ρ конечен, то о\ (т) = е? (1 + г\ + г\ + . . . +г2т), (9) где г определяются из соотношений ^ς+α,ρκ.. = ι + Γιζ + Γ2ζ2 + β # # f (10) π αχ= — \ cosM,]ogH;(X)d?\,. (11) о Так как w (λ) ^> 0, то интеграл д = ^? ** (12) π J ιρ(λ) ν ' о либо конечен, либо равен 5 + оо. Мы докажем далее такую теорему: Теорема 3. Если R = -{-сю, то о\ = 0. Если же интеграл конечен, то ®\ = 1/Я. (13) В моей работе [4] построена теория стационарных последовательностей элементов комплексного гильбертова пространства. В § 1 настоящей статьи я показываю, что стационарные случайные последовательности в определенном выше смысле могут рассматриваться как частный случай стационарных последовательностей, рассмотренных в [4]. Это позволяет получить сформулированные выше теоремы 1, 2 и 3 в качестве простых следствий из результатов работы [4]. В дальнейшем изложении ссылки на формулы с номерами из двух чисел, разделенных точкой (например, (8.44)), относятся к формулам из [4]. 1 СТАЦИОНАРНЫЕ СЛУЧАЙНЫЕ ПОСЛЕДОВАТЕЛЬНОСТИ И ГЕОМЕТРИЯ ГИЛЬБЕРТОВА ПРОСТРАНСТВА Будем исходить из аксиоматики и построения основных понятий теории вероятностей, предложенных в моей книге [5], с тем изменением, что рассматриваемые далее случайные величины могут принимать не только действительные^ но и комплексные значения 6. 4 Если w (λ) = 0 на множестве положительной меры, то считаем Ρ = — сю. 5 Если w (λ) = 0 на множестве положительной меры, то считаем R = -f оо. 6 Комплексная функция χ (ξ), определенная на множестве Ε элементарных событий ξ, называется случайной величиной, если при любом выборе действительных чисел а и Ъ множество всех ξ, для которых действительная и мнимая части χ (t) удовлетворяют соответственно неравенствам Re χ (ξ) < a, Im χ (ξ) < < &, принадлежит системе F.
28. И н тер полирование и экстраполирование последовательностей 259 Рассмотрим множество § всех случайных величин χ какого-либо борелевского поля вероятностей (F, Р), имеющих конечное математическое ожидание квадрата абсолютной величины, считая при этом эквивалентные случайные величины (т. е. случайные величины, отличающиеся друг от друга лишь с вероятностью, равной нулю) за тождественные. Введем в ξ) скалярное произведение (х, У) = Μ (Ху). (14) Нормы в ξ) определим формулой [| xf - (ж, χ) = Μ | χ \\. (15) сложение же элементов § и их умножение на комплексные числа будем понимать в обычном смысле. Легко проверить, что множество © при установленных сейчас определениях удовлетворяет постулатам А, В и Ε книги М. Стоуна [6], т. е. всем постулатам абстрактного унитарного пространства. Пусть теперь {х (t)} есть стационарная последовательность действительных случайных величин χ (t) поля вероятностей (F, Р) в смысле, принятом во введении, удовлетворяющая дополнительному условию (1). Тогда в силу (2) и действительности χ (t) В (к) = Μ [ж (f + к)х (*)] - (х (t + к), χ (*)). Так как по определению В (к) не зависит от t, то {х (t)} является стационарной последовательностью элементов пространства ip в смысле [4]. В [4] я рассматриваю стационарные последовательности, лежащие в гильбертовом пространстве, т. е. в пространстве, удовлетворяющем, кроме постулатов А, В и Е, еще постулатам С и D книги М. Стоуна [6]. Это ограничение, однако, несущественно. В самом деле, обозначим через Нх минимальное замкнутое линейное подпространство пространства ξ), содержащее все элементы последовательности {х (t)}. Легко доказывается, что Нх сепарабельно, т. е. удовлетворяет постулату D. Сепарабельное унитарное пространство или само является гильбертовым (т. е. удовлетворяет, кроме А, В и Е, еще постулату С), или конечномерно и в последнем случае может быть расширено до некоторого гильбертова пространства Н. Таким образом, к последовательности {х (t)} можно применить, полагая В (к) = Вхх (к) = (z{t + к), χ (ί)), (16) все результаты, полученные в [4]. 2 ДОКАЗАТЕЛЬСТВО ТЕОРЕМЫ 1 В силу (3) и (16) в случае действительных случайных величин x(t) Вхх (_4) = вхх (к). (17)
260 28. Интерполирование и экстраполирование последовательностей Поэтому из формулы (3.10) получаем Wxx(l) = Bxx(0)K-£ В™ {k) P-ik% . _ ik вххМ = B„(0)X + 2Yi-J%-LsinkL· (18)' k=i Из (18) вытекает, что Wxx (-λ) = -Wxx (λ). (19) Наконец, из (3.1), (3.9) и (19) получаем В(к) = Вхх(к) = J e^dFxx(k) = —Я Η-π π =4г SeVa dw** w=4 Scos *λ ^« <λ>· (2°) —π ο Из формул (18) и (3.9) и теоремы 2 работы [4> ясно, что Wxx (λ) есть действительная неубывающая функция. Вместе с равенствами (18) и (20) это показывает, что функция W (λ) = Wxx (λ) удовлетворяет требованиям теоремы 1. 3 о2Е(т) в ОБЩЕМ СЛУЧАЕ Обозначим, следуя [4], через Нх (t — 1) минимальное линейное замкнутое подпространство пространства Нх, содержащее элементы χ (t — 1), χ (t — 2), . . ., χ (t — η), . . . Элемент х (t + m) при любом т > 0 единственным образом представляется в виде x(t + m) = l(t — l,m) + b{t — l, m), (21) где ξ (t — ί, т) принадлежит Нх (t — 1), а Δ (t — ί, т) ортогонально Нх (t — 1). Легко показать, что в случае стационарной последовательности действительных случайных величин 7 σ|(ι») = |Δ(ί-1, то) И2. (22) 7 Как известно, || Δ (t — 1, т)\\ равняется «расстоянию» точки χ (t + m) от пространства Нх (t — 1), т. е. нижней грани расстояний || χ (t -j- in) — у j| для всех у из Нх (t — 1). Так как элементы вида L = ахх (t — 1) + а2х (t —- 2) + . . . -f anx (t — η) ■
28. Интерполирование и экстраполирование последовательностей 261 В общем случае стационарных последовательностей в смысле [4] будем считать (22) за определение величины о% (т). Если последовательность {х (t)} сингулярна, то Нх (t — 1) = = Нх и, следовательно, σ| (т) = 0. (23) Если последовательность {х (£)} несингулярна, то по формуле (7.8) ею or(t + m) = sx(t + m)± Σ А,(* + го — и)· (24) Так как sx (t + πι) и μλ (ί + #ι — ή) при п^> т лежат в Нх (t — 1),, а Их (£ + Α/ι — η) при ?г <С лтг ортогональны Нх (t — 1), то сопоставление (21) с (24) дает Δ (t — 1, т) = Cq]ux (t + т) + c^Uj, (t + πι — 1) + . . . . . . +с%их (t). (25) Так как.элементы их (t + i) попарно ортогональны и нормированы, то из (25) вытекает <з% (т) = || Δ (t - 1) Ι)2 = (#})2 + (с?У + . .. + (c$). (26) 4 σ2Ε (m) В ДЕЙСТВИТЕЛЬНОМ СЛУЧАЕ Для стационарных последовательностей действительных случайных величин из формулы (26) легко вывести теорему 2. Этому выводу посвящен настоящий параграф. В силу формулы (3.9) имеем /™(λ)=-^—= ^—f—=-ΣΓ";(λ)· (2/) Из (19) вытекает, что w (-λ) - w (λ). (28) Пользуясь (27) и (28), получаем \ logfxx(l)dX=2^logiv(X)dl — 2jtlog2jt. (29) всюду плотны на #Λ (£ — 1), то || Δ (ί — 1, m) || равняется также нижней грани расстояний || х (ί + т ) — L [| = |/"М | a; (i + m) — L \2. (*) Если все χ (s) двляются действительными случайными величинами, то нижняя грань выражения (*) не изменяется при ограничении одними действительными коэффициентами ak, в этом же случае она, очевидно, совпадает с σ^ (т).
262 28. Интерполирование и экстраполирование последовательностей Формула (29) вместе с теоремой (23) из [4] показывает, что равенство π Ρ = — \ log w (λ) dk = — οο о необходимо и достаточно для сингулярности последовательности {х (t)}. Мы уже видели в § 3, что в этом и только в этом случае о\ (т) = 0. (30) Если последовательность {х (t)} несингулярна, то из (8.44) и (29) вытекает (c^f =± 2я ехр (-^- ^ log /«(λ) άλ) = exp (± J log wX dk) = е*>. —Я 0 (31) В том же предположении, что последовательность {х (£)} несингулярна 8, из (8.31), (27) и (28) заключается, что при fl4*) = -9— \ coskx logfxx(X)d% =—\ cos hh log ιν\λ)άλ 2л Α π i (32) Ь?)=-2~~ \ 8ίη&#]ο£/ΧΛ.(λ)<ίλ = -5-- \ sinkXlogw(K)dX = 0. —Л —П Из (8.16), (8.29), (8.30) и (32) вытекает, что J£ с«г=гж (ζ)=гж (0) 44г = г*(°> eQx(O'Qx<(}= оо '(1>^)· · (33) = 4Л) ехр ι Положив ехр ( Σ 4χ)ζ*) = 1 + riC + Γ2ζ? + ..., (34) имеем из сравнения (33) с (34) W = *». (35) Из (35) п (26) вытекает о% (т) = (4Х))2 (1 + г\ + г\ + . . . + rl). (36) Формулы (30), (31) и (36) полностью доказывают теорему 2. 8 Как указано в теореме 23 из [4], формулы (8.16), (8.29)—(8.31) применимы к любой несингулярной последовательности.
28. Интерполирование и экстраполирование последовательностей 263 5 ОПРЕДЕЛЕНИЕ σ| Обозначим, следуя [4], через Нх (t) минимальное линейное замкнутое подпространство пространства Нх, содержащее элементы x(t + 1), x(t + 2), . . ., x(t + η), . . ., x (t — 1), χ (t — 2), . . ., x(t — η), . . . Элемент χ (t) однозначно представляется в виде (10.3) x(t) = v (t) + δ (0, где ν (t) лежит в Hx (t), a δ (t) ортогонально Нх (t). Легко показать,, что в случае стационарной последовательности действительных случайных величин ol = || δ (о f = di. (37) По теореме 24 из [4] —ТС причем в случае бесконечности интеграла в знаменателе правой части dl = 0. Из (37), (38), (27) и (28) заключаем, что ei=dx = n:^1FW=^r, 0 что и доказывает теорему 3. МИАН СССР, 26 ноября 1940 г. ЛИТЕРАТУРА 1. Kolmogoroff A. Sur Г interpolation et extrapolation des suites stationnai res.— С r. Acad. sci. Paris, 1939, vol. 208, p. 2043—2045. 2. Khintchine A. Korrelationstheorie der stationaren stochastischen Prozesse.— Math. Ann., 1934, Bd. 109, S. 604—615. 3. Wold H. A study in the analysis of stationary time series. Uppsala, 1938. 4. Колмогоров А. Н. Стационарные последовательности в гильбертовом пространстве.— Бюл. МГУ. Математика, 1941, т. 2, вып. 6, с. 1—40. 5. Колмогоров А. Н. Основные понятия теории вероятностей. М.: ОНТИ, 6. Stone Μ. Linear transformations in Hubert space.— Amer. Math. Soc. Col- loq. Publ., 1932, vol. 15.
264 29. О логарифмически нормальном законе 29 О ЛОГАРИФМИЧЕСКИ НОРМАЛЬНОМ ЗАКОНЕ РАСПРЕДЕЛЕНИЯ РАЗМЕРОВ ЧАСТИЦ ПРИ ДРОБЛЕНИИ* В недавней заметке Н. К. Разумовского [1] указано много случаев, в которых логарифмы размеров частиц (золотин в золотоносных россыпях, частиц горных пород при их дроблении и т. п.) подчиняются приближенно гауссовскому закону распределения. Задачей настоящей заметки является указать довольно общую схему случайного процесса последовательного дробления частиц, для которой в пределе (при неограниченном продолжении дробления) гауссовский закон распределения для логарифмов размеров частиц может быть установлен теоретически. Возможно, что аналогичные соображения помогут объяснить и применимость гауссовского распределения к логарифмам содержания минералов в отдельных пробах (этому вопросу посвящена в основном цитированная заметка Н. К. Разумовского). Будем изучать общее число частиц N (t) и их распределение по размерам в последовательные моменты времени t = 0, 1, 2, 3, . . . Пусть N (г, t) обозначает число частиц с размерами ρ ^ г в момент времени t (для дальнейшего несущественно, обозначает ли ρ диаметр, вес или какую-либо иную характеристику размеров частицы, лишь бы соблюдалось условие, что размеры каждой из частиц, получившихся в результате дробления частицы размера г, не превосходят г). Обозначим через Q (к) математическое ожидание числа частиц размеров ρ <^ кг, образующихся за промежуток времени между t и t + 1 из одной частицы, имевшей в момент времени t размеры г, и положим ι A = -^-ll°ekdQ(k), (1) О 1 B2=-QjiTl(^gk-AydQ(k). (2) О При некоторых перечисленных далее допущениях можно доказать, что отношение N(exi t)IN(t) (3) * ДАН GGGP, 1941, т. 31, с. 99—101.
29. О логарифмически нормальном законе 265 при достаточно большом t с вероятностью, сколь угодно близкой к единице, будет сколь угодно мало отличаться от v —оо Наиболее существенным допущением, которое мы употребляем при выводе этого соотношения, является независимость вероятностей каждой частице раздробиться за единичный промежуток времени на то или иное число частей тех или иных относительных размеров от размеров исходной частицы. Чтобы точно сформулировать нужные нам допущения, введем некоторые обозначения. Пусть рп есть вероятность за промежуток времени между t и t + 1 из одной частицы получить при дроблении ровно η частиц, а Fn («ι, α2, . . ., α„) = Ρ {λ?ι < α1? k2 < α2, . . ., kn < αη} — условный закон распределения отношений kt — гх1т размеров получающихся при этом η частиц к размерам исходной частицы. Нумерацию η частиц, получившихся при дроблении, будем считать произведенной в порядке возрастания их размеров: тг <J r2 <^ < г3 < . . . < гп. В соответствии с этим функция Fn (α1? α2, · · ·» ап) определяется только при 0 <; аг <; а2 <^ . . . <J ап <J 1. Очевидно, что Q (*)= Σ Pn{Fn(k, 1, 1, ..., 1, 1) + Fn(k,k, 1 1,1)+·... 71=1 ... + Fn(k, к, к,..., к, 1) + Fn{k, к, к,..., к, к)}. Мы допускаем, что a) вероятности рп и распределения Fn не зависят от абсолютных размеров частицы, от ее предшествующей истории (т. е. от того, в результате каких предшествующих дроблений она возникла) и от судьбы других частиц; b) математическое ожидание Q (1) общего числа частиц, получающихся за промежуток времени между t и t + 1 из одной частицы, конечно и больше единицы; c) интеграл ι l\\ogkfdQ(k) (5) о конечен; d) в начальный момент времени t = О имеется определенное число частиц N (0) с произвольным распределением по размерам N (г, 0). При этих допущениях:
266 29. О логарифмически нормальном законе 1) математическое ожидание общего числа N (t) частиц к моменту времени t равно ff(t) = N (0) Qf (l); (6) 2) отношение (3) при достаточно большом t с вероятностью, сколь угодно близкой к единице, сколь угодно мало отличается от отношения N{e\t) _ N (еХ, t) __ N{t) -~£(0)ρ'(ΐ) [ ' } () соответствующих математических ожиданий г. В силу сказанного наша задача сводится к оценке величины Τ (χ, t). Из допущений (а) и (Ь) вытекает, что ι N(r,t-\-l)=^N(j-,t)dQ(k). (8) 0 Положив Q(k)=Q (1) S (log к), (9) получаем из (7) и (8) о T{x,t + i)= I T(x-lt)dSa). (10) —оо Из (7) и (9) легко вывести, что функции S (х) и Τ (χ, 0) == s= N (ех, 0)/Ν (0) удовлетворяют всём требованиям, предъявляемым к функциям распределения 2. В силу рекуррентного соотношения (10) то же самое справедливо и в применении к функциям 3 Τ (χ, t) при любом целом t ^> 0. Из условия (с) вытекает, что интеграл о J \x\sdS(x) (11) —σο конечен. В силу (10) и (11) по теореме Ляпунова имеем при t -> оо ■ ^-yibWb^H <12) —'ОО 1 Не следует считать это обстоятельство слишком очевидным. Для величин N (£) и N (г, t), взятых отдельно, аналогичное утверждение о близости к единице отношений N (t)/N (t) и N (г, t)lN (r, t) было бы ошибочным. 2 При этом для χ > 0 полагаем S (х) = S (0) = 1. Поэтому во всех интегралах с dS верхний предел 0 может быть заменен без изменения значения интеграла на + °°· 3 В нашей задаче S (х) и Τ (χ, t) не являются распределениями вероятностей, а выражают собой некоторые математические ожидания. Это не мешает применить к ним теорему Ляпунова, рассматриваемую как теорему чистого анализа.
30. К обоснованию метода наименьших квадратов 267 равномерно относительно х, где о о А= J xdS{x), B2= J (ж — AfdS(x) —оо —оо очевидно, совпадают с определенными формулами (1) и (2). Было бы интересно изучить математические схемы, в которых скорость дробления частиц уменьшается (или увеличивается) с уменьшением их размеров. Естественно рассмотреть при этом в первую очередь случаи, в которых скорость дробления пропорциональна той или иной степени размеров частицы. Если эта степень отлична от нуля, то, по-видимому, логарифмически нормальный закон будет уже неприменим. МИАН СССР, 17 декабря 1940 г. ЛИТЕРАТУРА 1. Разумовский Н. Я\ — ДАН СССР, 1940, т. 28, № 8. 30 К ОБОСНОВАНИЮ МЕТОДА НАИМЕНЬШИХ КВАДРАТОВ* ВВЕДЕНИЕ С чисто практической стороны общеупотребительная литература по методу наименьших квадратов страдает одним существенным недостатком: в ней не дается указаний о пользовании законами распределения Стьюдента и X2 для оценки надежности получаемых результатов (вычисления вероятности ошибок, превосходящих те или иные пределы). Употребление же вместо этих законов распределения закона Гаусса при небольшом числе наблюдений приводит к очень большой и практически весьма ощутимой переоценке этой надежности (см. далее § 9, 10). Другой методический недостаток общеупотребительных руководств по методу наименьших квадратов особенно чувствителен при преподавании в университетах и педагогических институтах, где от слушателей законно предполагать знание серьезного курса линейной алгебры. Недостаток этот заключается в том, что обычно все основные результаты теории метода наименьших квадратов получаются весьма громоздким чисто вычислительным путем, в то время как использование надлежащих общих понятий современной линейной алгебры (например, понятия ортогональности) позволяет получить * УМН, 1946, т. 1, вып. 1, с. 57—70.
2^*8 30. К обоснованию метода наименьших квадратов те же результаты значительно более прозрачным образом. Особенно наглядным получается изложение при употреблении представлений гс-мерной векторной геометрии. Задача настоящей статьи заключается в том, чтобы показать на примере простейшей задачи метода наименьших квадратов в предположении одинакового веса всех наблюдений, как могут быть устранены оба указанных недостатка. У читателя предполагается знание линейной алгебры в векторном геометрическом изложении и основ теории вероятностей. Греческие буквы, за исключением π и Г, обозначают случайные величины. I. СВОДКА ОСНОВНЫХ ПОДЛЕЖАЩИХ ОБОСНОВАНИЮ РЕЗУЛЬТАТОВ § 1 ПОСТАНОВКА ЗАДАЧИ Предполагается, что переменные Ζ/, #]_, Х%, . . ., Хп связаны однородной линейной зависимостью η у= 2 ар-г (I) Коэффициенты α7· неизвестны. Для их определения экспериментально находятся значения η yr-=^ajxjr, r=l,2, ...,ΛΓ. (11) Предполагается, что коэффициенты α7· однозначно определяются значениями Xjr и уг, т. е. что ранг матрицы II ъА не меньше п. Отсюда вытекает, что iV> п. Экспериментальное определение ут сопряжено с неизбежными ошибками. Вместо истинных значений уг мы получаем из эксперимента значения т)г == ут + ΔΓ. (Ill) Требуется по заданным xir и ηΓ определить наиболее рациональные приближенные значения at коэффициентов at.
30. К обоснованию метода наименьших квадратов 269 § 2 ДОГМАТИЧЕСКОЕ ИЗЛОЖЕНИЕ РЕЗУЛЬТАТОВ ГАУССА Пусть η т£= 2 а,·^, (IV) εΓ - ηΓ - η?. (V) По Гауссу α7· определяются из условия Ν η [ее]= Σ (Лг— Σ %>) = min. (VI) r=l j=i Здесь, как и везде в дальнейшем, принято гауссовское обозначение [ab]= 2 βΑ· [*] Требование (VI) равносильно системе уравнений Σ [x&j] a>j = [зд], ί = 1, 2, ..., /г. (VII) Из этих «нормальных уравнений» и находятся af. Полученные приближенные значения at не содержат «систематической ошибки», т. е. математическое ожидание α7· равно α7· Μα, = aj. (VIII) Оценка точности этих приближений дается формулой для среднеквадратичной ошибки—дисперсии D (α7·): D*aj = Μ {aj - atf = ?ws*t, (IX) где s — среднеквадратичная ошибка экспериментального определения величин уг (она предполагается независимой от номера г), a qir определяется из уравнений η Σ [х&з'\Ък = ек:> i,k = l,2,...,n. (X) 3=1 При этом, как обычно, 0 при i Φ k, 1 при i — Jc. Формула (IX) является частным случаем (при i = /) формулы м {(«« — а%) (aj — а,·)} => g^a. (XI) О практическом значении этой последней будет сказано в § 11.
270 30. К обоснованию метода наименьших квадратов Если s a priori неизвестно, то оно обычно принимается приближенно равным о = Υ[εε]/(Ν - η). (XII) Этот прием основан на том, что Μσ2 - s\ (XIII) Οσ2 = Μ {σ2 — s2}2 = 2sV(N - η). (XIV) Последняя формула показывает, что при больших N — η отношение σ : s действительно с вероятностью, близкой к единице, близко к единице. Это позволяет в соединении с формулой (IX) рассматривать q-jo* как приближенное значение Day. Da, ~ q„a*. (XV) Замечание. Если N = п, то система уравнений η цг = 2j OLjXjr] r = 1, 2, ..., TV = η разрешима и из (VI) вытекает, что [εε] = № В этом случае знаменатель в правой части формулы (XII) обращается в нуль, и σ становится неопределенным. § 3 ПРОДОЛЖЕНИЕ ДОГМАТИЧЕСКОГО ИЗЛОЖЕНИЯ РЕЗУЛЬТАТОВ ГАУССА Формулы (VIII), (IX), (XIII) и (XIV) дают лишь грубую ориентировку относительно размеров ошибки, происходящей от замены cij на а,- и s на σ. Окончательное решение задачи должно была бы заключаться в указании законов распределения отклонений α7· — α7· и σ — s. Этот вопрос был решен Гауссом (в предположении что ошибки ΔΓ независимы и подчинены гауссовскому закону распределения со средним, равным нулю) для отклонений α7· — α7·. Именно, он обнаружил, что величина (ау· — dj)/s подчинена нормальному распределению р( aj~uj )=*-j=- { er»/*dt = G(t). (XVI)
30. К обоснованию метода наименьших квадратов 271 § 4 БОЛЕЕ НОВЫЕ РЕЗУЛЬТАТЫ Более точная оценка отклонений α7· от а,- производится при помощи Ρ {(Ν - η) σ2/*2 < /г2} = ΗΝ_η (/г2), (XVII) где Hm(V) = 2(m-^V{mll) \ Ι****"»dh. (XV111) Таблицы функции Hm и обратной к ней функции имеют широкое употребление. В § 10 мы указываем на возможное видоизменение этих таблиц, которое кажется желательным с точки зрения практики метода наименьших квадратов. Оценка ошибки, происходящей от замены α7· на α7·, в случае неизвестного s производится на основании теоремы о подчинении отношения! τ = (а; — aj)/YqjjG закону распределения Стьюдента ?\ai~Ji <t) = SN.n(t), где х m V } \Tmn Γ (m/2) J^ \ ™ I II. ДОКАЗАТЕЛЬСТВА § 5 ФОРМУЛА VII Эквивалентность требования (VI) системе нормальных уравнений. (VII) является фактом вполне элементарным, который может быть установлен самыми различными способами. Лишь для сохранения единства стиля мы получим его векторным путем. С этой целью заметим, что гауссовские скобки [be] с точки зрения современной линейной алгебры суть не что иное, как скалярное произведение тг-мерных векторов ъ = (bi, Ь2, . . ., Ьп), с = (съ с2, . . ., сп). 1 Мы прилагаем в конце статьи таблицу функции, обратной к Sm {t), которая является сокращением таблицы, опубликованной Е. Н. Померанцевой, и, как нам кажется, удовлетворяет основным потребностям, возникающим при практическом пользовании методом наименьших квадратов (см. далее § 9). (XIX) (XX)
272 30. К обоснованию метода наименьших квадратов Считая Z/r? %iri Цгч ΔΓ, Y]r, 8r компонентами iV-мерных векторов у, хи η, Δ, η*, ε, запишем соотношения (II)—(V) в виде η η = У + Δ, (2) Π η*=Σ«Λ, (3) π η = η* -(-- ε — 2 αΛ + ε· (4) Так^как выбор α/, принадлежит нам, то (3) обозначает лишь η* ΕΞ L, (5) где L = L (хг, х2, · . ·, Жп): есть линейное подпространство, порождаемое в iV-мерном векторном пространстве VN векторами xt. Требование (VI): [εε] = min (6) в соединении с (5) на геометрическом векторном языке обозначает следующее: В разложении (4) η* есть ортогональная проекция η на L, α ε — дополнительный ортогональный к L вектор. Отсюда вытекает, что [гхг] =0, i = 1, 2, . . ., л* (7) В силу (7), умножая равенство (4) скалярно на хи получим S [Xi%j] a>j = [^η], ί = 1, 2, .. ., η. (8) i Это и есть нормальные уравнения (VII) для определения а;. Соответствующий детерминант G = | Ixtxj] | - (9) есть детерминант Грама системы векторов #i, x2, . . ., хп. Так как ио предположению § 1 матрица J| xjr || имеет ранг п, то векторы xt линейно независимы и Поэтому уравнения (8) однозначно определяют α7·.
30. К обоснованию метода наименьших квадратов 27S § 6 ФОРМУЛЫ (VIII) - (XII) Для обоснования формул (VIII)—(XII) необходимы некоторые теоретико-вероятностные предпосылки. Вот они: (A) Истинные ошибки ΔΓ суть случайные величины, (B) ΜΔΓ = О, (C) ΜΔ* - s2, где s2 конечно и не зависит от г, (D) Μ {ΔΓΔ,} = 0 при г φ г'. Определим бп-ортогональную к системе хъ х2, . . ., хп систему векторов лежащих в L: [xtuj] = eih (10) uj^L. (11> Так как каждая из систем векторов {хи х2, . . ., хп) и {иъ и2, . . . . . ., ип} является линейным базисом в L, то η η Щ~ Zl Угкхк1 хг~ 2l cikll}r k=l fc=l Умножая первое из этих равенств скалярно на Uj, а второе на Xj и пользуясь (10), получим Qij = [щи;], си = [xixj], (12> т. е. η ιιι =■ Σ $ijxj=Σ [щщ]xh (Щ 3=1 η xi= Σ lxixj]uj· (14) 3=1 В силу (13)—(14) матрица || qtj || есть обратная матрица к матрице || [xtXj] ||, т. е. величины qtj действительно определяются из уравнений (X). Умножая (1) скалярно на иь получаем di = [ущ]. (15) Аналогично из (3) вытекает «ι = Irfutl (16>
274 30. К обоснованию метода наименьших квадратов Но так как вектор ε ортогонален к L, то [ей,] = О ш из (16) вместе с (4) получается a>i = [г\щ]. (17) {15) и (17) дают вместе с (2) «ί = я« + [Ди4], (18) «откуда в силу (В), (С), (D) получаем Μα* = fl|, (19) Μ {(ai — α,)(α,· — a·)} = Μ {[Ди*] [Дм,·]} = Ν Ν щ = Σ Σ Μ {Δ3Δ^} uisujS' = s2 Σ ^is^is = I>;^j] *2, т. е. в силу (12) Μ {(at — аг·) (α, — aj)} = qiSs2. (20) *(19) и (20) суть не что иное, как формулы (VIII) и (XI). Из (XI) при Л = у, как уже было сказано, получается (IX). Обозначим Δ* = η* — у. (21) Из (2), (4) и (21) вытекает Δ = Δ* + ε. (22) Так как Δ* вместе с η* и у лежит в L, а ε ортогонально к L, то (22) .представляет собой разложение вектора Δ на его ортогональную лгроекцию в L и ортогональное дополнение к этой проекции. Выберем в нашем ^-мерном векторном пространстве ортогональ- :ный базис из векторов ъг = (Ьп, Ъг2, . . ., brN), г = 1, 2, . . ., N, [ЬгЬг'] = Сгг', так, чтобы первые η векторов лежали в L, а следующие N — η бы- ~ли ортогональны к L. Положив ΔΓ = [ДЬГ], (23) шолучим Δ = S ΔΛ. (24) Г=1 Δ* = S \br, (25)
30. К обоснованию метода наименьших квадратов 275- N 8== Σ δα. (26) r=n-hl Легко видеть, что в силу условий (С) и (D) Ν Ν Μ{ΔΓΔΓ'}=Μ(Σ Afcerfc S Δ^γ'Λ' fc=l Λ:'=1 Ν Ν = 2 Σ Μ{Δ*ΔΛ'}*,*<ν*' = Из (26) и условия (В) вытекает Με = 0. Из (26) и (27) вытекает Μ [εε] = {Ν — η) s2. Ν = s2 2 erker>k = fc=l ί s2 при г = г', _(0 при τ Φ г'. (27> (28> (29> Из (29) и (XII) (эта формула служит просто определением σ) непосредственно вытекает (XIII). § 7 ГИПОТЕЗЫ ГАУССОВСКОГО РАСПРЕДЕЛЕНИЯ И НЕЗАВИСИМОСТИ ИСТИННЫХ ОШИБОК Для дальнейших выводов допущения (В), (С) и (D), указанные- в начале § 6, должны быть заменены следующими, более сильными: (G) Ошибки ΔΓ подчинены гауссовскому распределению t 1/2π s J P.-. - где s2 не зависит от г. (U) Ошибки Δΐ7 Δ2, . . ., Δ^ν образуют систему взаимно независимых случайных величин. Хорошо известно, что из (G) вытекает (В) и (С), а из (В) в соединении с (U) вытекает (D). Из (G) и (U) вытекает, что система случайных величин Δ1? Δ2, . . ., ΔΝ подчинена ^-мерному закону распределения, характеризующемуся плотностью вероятности Ν 9 / (*ь *«,.. · , tN) = Π (-j^- e~t;/2s°) , (30) или в векторном обозначении / (0 = (/2Jw)-w e-[«l/»·. (31)
-276 30. К обоснованию метода наименьших квадратов Формула (31) выражает плотность вероятности случайного вектора А, взятую при элементе объема dv = dtxdti. . .dtjsr. (32) В системе координат tr = ltbr], (33) ΔΓ - [Δ6Γ], . (34) тде базисные векторы Ът подчинены обычному условию ортогональности [ЪГЪГЛ = егг, (35) элемент объема (32) сохраняет вид dv = dt1dt2. . .dtN. (32') Поэтому / (t) можно рассматривать как плотность вероятности вектора Див этой новой системе координат. Иначе говоря, плотность ^вероятности случайных величин Аь Δ2, . . ., Δ# имеет вид N f (?ь ?· Гдг) = П Г -г?— ^W) · (30') Формула (30') показывает, что случайные величины ΔΓ взаимно (независимы и подчинены каждая тому же закону распределения t Ρ {Δ, < t} = -±=- \ e-**» dt, (36) — oo что и величины ΔΓ. Важно отдавать себе отчет в том, что взаимная независимость величин ΔΓ выведена нами из совокупности допущений (G) и (U). При замене гауссовского распределения первичных ошибок ΔΓ на жакое-либо иное этот вывод теряет силу. § 8 ДОКАЗАТЕЛЬСТВО ФОРМУЛ (XIV) — (XX) . В силу формулы (18) at есть линейная функция (с неслучайными ^коэффициентами) от случайных величин ΔΓ. Поэтому из (G) и (U) вытекает, что at подчиняется гауссовскому распределению вероятностей. Нормируя это распределение в соответствии с (VIII) и (IX), аюлучим формулу (XVI). Выведем теперь закон распределения величины χ2 = [εε]/*2 = (Ν — η) aVs\ (37)
30. К обоснованию метода наименьших квадратов 277 Для этого заметим, что в силу (26) N [вг] = 2 2?, (38) г—п-\-1 N / Τ ч2 *■= Σ (4-) ■ m r=n-\-l Из независимости случайных величин ΔΓ вытекает независимость случайных величин Ar/s. В силу (36) каждая из этих последних величин подчинена нормальному закону распределения с плотностью вероятно сти ΐ/"2π Поэтому их (Ν — ?г)-мерный закон распределения характеризуется плотностью вероятности N (2я)-<*-")/2ехр{--4" ^ й}. г=п+1 Вероятность неравенства Х< А получается интегрированием этой плотности по (Ν — тг)-мерному объему, в котором N Г—n-f-1 Таким образом получаем 2 Ρ {X < h) = (2n)-W^№ J J ... $ е-Щ2 *n+i *η* 2 ...dtN = = ^ „ ,1/9 1 ^ hN-n-le-hV2 fa (40) Это и есть формула (XVIII). Из (40) можно вычислить, что MX2 = Ν - η, (41) Dxa = Μ {χ2 _ (TV — rc)}2 = 2 (ΛΓ — л). (42) В силу (37) формулы (41) и (42) равносильны (XIII) и (XIV). 2 При выводе формулы (40) следует заметить, что поверхность сферы радиуса R в т-мерном пространстве равна 2л. /?т~1 Г (т/2)
278 30. К обоснованию метода наименьших квадратов Нам остается рассмотреть закон распределения величины τ7 = (<*/ — ajVV^jjG· (43) Для этого целесообразно представить τ7· в виде отношения Ъ = ΥΑ (44) где γ. = ΥΝ— п (aj - aj)/Yq^jS. (45) Заметим теперь, что в силу (15), (16), (21) и (25) η а. — uj = [Д*и7·] = Σ £jA, (46) где %jr = lujbT]. (47) Сравнивая (46) с (37)—(38), мы видим, что в выражение α7· — а} входят только те ΔΓ, которые отсутствуют в выражении для X2. Поэтому из взаимной независимости величин Аг вытекает независимость О/ — α7· от X. В силу (45) γ7 и X тоже независимы. В соответствии с (XVI) плотность вероятности для γ7 есть 1 . e-c*/2(N-n)e γ2η (Ν — η) В соединении с (40) получаем отсюда, что двумерная плотность вероятности γ7· и % есть /я^-п).^-^1)/2 Г ((JV - Л)/2) Р 1 2 (/V - п) 2 ] · Интегрируя эту плотность вероятности по области, где c/k<^t, получим Р{тК0=р{-^<*} = 1 X ~^π (iv- η) 2^Ν-η'^2Τ ((Ν- η)/2) Χ 55 A*-«exp{- ^^ - £) dedh. (48) Произведем теперь замену переменных с и /г из S—~' U~~ 2(N—n) + 2 * Так как *(*,«) _ л , s2 i.a_ 2а . β (с, Л) ~~ 1"ί" Ν-η ' — 1 + 52/(ЛГ-.г) '
30. К обоснованию метода наименьших квадратов 279 t0 из (48) получается P{t3<t} = σο N_n _j t _ Ц-П+l = r 1 C«~~«~ e-ndaifl+TsA-) 2 ds±= \fn (JV - η) Γ {{Ν — η)β) J J V ' ЛГ - *.' = y r«*-n + D/2) ((ι + *ϊ_\^-«/«Λ. (49) ΐΛι(ΛΤ-κ)Γ((ΛΤ—7i)/2)J\ l N-nJ ч ' Формулы (XIX) и (XX) являются не чем иным, как другой записью равенства (49). III. ЗАМЕЧАНИЯ О ПРАКТИЧЕСКОМ ЗНАЧЕНИИ УСОВЕРШЕНСТВОВАНИЯ ОБЩЕПРИНЯТОГО ИЗЛОЖЕНИЯ ТЕОРИИ МЕТОДА НАИМЕНЬШИХ КВАДРАТОВ § 9 О ПОЛЬЗОВАНИИ ЗАКОНОМ РАСПРЕДЕЛЕНИЯ СТЬЮДЕНТА В соответствии с общими принципами современной математической статистики 3 будем называть «доверительными границами» для ajf соответствующими «коэффициенту доверия» ω, такие две величины а] и а], что при любых допустимых гипотезах о неизвестных величинах Ρ {aj < aj < a"j} > ω. (50) Если s известно, а неизвестными являются только аъ а2, . . ., anf то этому требованию удовлетворяют в силу (XVI) a'j = α, — tYqjjS, а- - о,- + i|/"g^s, (51) где t определяется из G (t) - (1 + ω)/2. (52) Значения I, соответствующие различным ω, приведены в предпоследней строке (т = оо) табл. 1, приложенной в конце статьи. Если s известно, то в соответствии с (XV) принято считать σ за приближенное значение s. Однако, для того чтобы доверительные границы а· - aj — f j/g^a, a- = ау + tfq^a (53) 3 См. статью Неймана [1] или мою статью [2].
280 30. К обоснованию метода наименьших квадратов удовлетворяли требованию (50), t следует определять не из (52) а в соответствии с (XIX), (XX) из SN-n (ή = (1 + ω)/2. (54) Значения t, соответствующие различным «ω при различных N — п = = m по формуле (54), приведены в той же табл. 1. При m —> оо t, определенные из (54), сходятся к ί, определенным из (52) с заменой s на σ, но сходимость эта довольно медленная^ особенно при ω, близких к единице. Например, при ω = 0,998 по (52) t =' 3,090, что примерно соответствует классическому правилу «трех сигма*, а по (54), например, при m = 6 t = 5,959. § Ю ОБ ОЦЕНКЕ s ПО σ Удовлетворить равенству Ρ {кго <; s <; к2о} = ω (55) проще всего, подобрав к1 и Аг2 так, чтобы Ρ {5 < V) = (1 - ω)/2, Ρ {&2σ < s} = (1 + ω)/2. (56) В соответствии с (XVII), (XVIII) это будет достигнуто, если определить кг и к2 из Μτΐ-ΐ·' Мпс1·)-^· (57> С точки зрения интересов метода наименьших квадратов, по-видимому, было бы желательно иметь таблицу, которая непосредственно давала бы кг и к2 по m = N — п и со. Это сделано в нашей табл. 2 для ω = 0,98. Заслуживает внимания резкая асимметрия верхней и нижней границ в оценке кго <С s <J к2о. Например, при ω = 0,98 и m = 3 кг = 0,514, к2 = 5,111, т. е. σ, более чем вдвое превышающие s, встречаются лишь с вероятностью 0,01, но s превышает σ с вероятностью 0,01 в 5 раз. Поэтому употреблять при небольших m доверительные границы для s вида (1 + к') а было бы нецелесообразно, нижнюю границу часто при-
30. К обоснованию метода наименьших квадратов .281 ООсХ?ОО^С5СЮтНтН^1^аОтНОСОЮЮСЧ|еООЪСЭС^ОСЮЮ^0^05С0005 0^0«00005Si<©I^WNf«GOCVjTH©©oaOaOOOCOOt^t^L^I>-!>«0«0€G«OC410i СО 0i!>4f<00C000iO'^'I>Si<lOOC41t^00«D^O05C4|t«-m«0t>-Ol0'*-iXC0«DO00 0(^^1^С^ОСХ)ОО^х^^С010СХ)СООО^^^ьОС\!ОСХ)010СС^ОО^ООО^О^ •^H0i00t^0Ql>0i00O'^'t^XC4|«DC0C41CNIt^Si<C0lOO**CSI00I>t^l>O0Ot^»ft Μ 00 Ю Οϊ N,rH M GO ΟΙ Χ 05 M''t>- МООЮСЮ^^ЮСОгнОФ^СОЮЧ^ООССООТ С0Ох^ЮЕ^С0ОСХ)<^ЮХ^Х^а^С0(^(^С^^^^-^-'^н-!нООООООО0005 IQMN^OCOOQlilllOiDOlOrHNstiCVJQNWsffOO^CClXNl^CDiOUOOQ OO^OOiDOt>iS^COC>3-r4^000i050iCX)CX)OOCOGOCX)CX)[>.l>-t^C^l^t^t^l005 СО Oi Ю s* VT1 CO CO OQ 00*00 СО со" СО eici cic<I C^^'^OiCNlCN^O^CSlCSlC^CSJCSJ CsfcT ^Ю^Е^ЮС0СХ)С0^Х^СХ)^О^^с0Е^С^С^0С0000ОС^Ю05СО1--^1>-^0 (^^^^С'^ФФс<1со^ооюсх|Оооф1Лгос\1'Нооа5оо^^ооэюсдоо адО5Ю^^гнО50000^^СОСОСО1ЮЮЮЮЮЮЮЮЮ^^^ч}<ч}<^^С0О5 СО СО^^Ср'Н^ЮСОС<100т-(ф010'НООгнсОсОО^С. ^ООС^ООЮ^Ф OCO^MOsficOCO(NM(NrHrHrHrHrHTHrHJOOOCCOOOOOQ(35(D5 тНСЧЮСО^^СЛСОС0^0500 1^0Ю^х^СОС\1С^<^^^т--0 СО CSJ Сч! (Ν (Ν * ООСОсОСОСООЮ1>-СО<^СОСООЮ^н[>.оООООЮСО'^О^СХ)СОЮ^СО-^О^н С ООСОЮ^4 s^cocococococococococococococococococococococococ^ ОСОЮ-^t— 00-^COCOOt^ Х^ОЗ^Н00500001>-СОСО»ЛЮ^Х^Х^СОСОСОХ^ 0^wc04fHC^-^'^OOOC^0505C5a5050000000000C50000.XOOCXDGOOOOOt^ ooot^^^t^r^^t>-t>-cocococococococococococococoococ^ τη о о о о о сГо оооооооооооооооооооооооо тН<^а0^ЮсО^ХОЭ©тНСЧ1а0^ЮСО1^а0ОЭ©тНСЧ100,УР»Л:О^-ХОЭ© О _ ггНггНтгн^^тПггн^тП^С-аСЧСЧГ^СМС^СЧС^С^С^СО О 3
282 30. К обоснованию метода наименьших квадратов Таблица 2. Значения к, удовлетворяющие уравнению Нт(гп/к) = Р{к~ *ζ sj = р> т 1 2 3 4 5 6 7 I 0,01 0,388 0,466 0,514 0,549 0,576 0,597 0,615 ι 0,99 79,750 9,975 5,111 3,669 3,003 2,623 2,377 m 8 9 10 15 20 25 30 Ρ 0,01 0,631 0,644 0,657 0,708 0,730 1,751 0,768 0,99 j 2,204 2,076 1,977 1,694 1,556 1,473 1,416 m 40 50 60 70 80 90 100 Ρ 0,01 0,792 0,810 0,824 0,835 0,844 0,852 0,858 ■ 0,99 1,343 1,297 1,265 1,241 1,222 1,207 1,195 ходилось бы принимать отрицательной! Только при очень больших т можно считать А?! — 1 — t/\f2m, к2 ~~ 1 + ί/γ2τή, (58) где t определяется по гауссовскому закону из (52).. § И ЗАМЕЧАНИЕ О ЗНАЧЕНИИ МАТРИЦЫ qij Значение дисперсионной матрицы Stj = Μ {(otf — at) (aj — aj)} = qus* (59) дает значительно более полную информацию о характере ошибок а* — а>и чем знание одних ее диагональных элементов D («,) = Sit. (60) Например, для определения среднеквадратичной ошибки, совершаемой при замене at через 0Cj в выражении Ъ = схах + с2а2 + . . . + спап, где коэффициенты Cj заданы, недостаточно знания^ дисперсий D (at)f но вполне достаточно знания дисперсионной матрицы Stj. Полагая β = сгаг + с2а2 + . . . + спап, имеем
31. Формула Гаусса из теории метода наименьших квадратов 283 Обычно диагональные элементы матрицы ςί}· вводятся в рассмотрение в виде обратных значений «весов» Ра = 1/?ϋ· Это маскирует существенную роль всей матрицы qijt ЛИТЕРАТУРА 1 Нейман Ю. Статистическая оценка в проблеме классической теории вероятностей.— УМН, 1944, вып. 10, с. 207. 2. Колмогоров А. Н. Определение центра рассеяния и меры точности по ограниченному числу наблюдений.-^- Изв. АН СССР. Сер. мат., 1942, т. 6, с. 3-32. 31 ОДНА ФОРМУЛА ГАУССА ИЗ ТЕОРИИ МЕТОДА НАИМЕНЬШИХ КВАДРАТОВ * Совместно с А. А. Петровым и Ю.М.Смирновым Статья содержит уточнение некоторых оценок из гауссовской теории метода наименьших квадратов. В § 39 гауссовской «Theoria combinationis observationum erro- ribus minimis obnoxiae» вычисляется среднеквадратичная ошибка^ совершаемая при замене μμ на м _ λλ + λλ' + λ "λ" + ... зх — ρ л — ρ Гаусс устанавливает, что эта среднеквадратичная ошибка равна ^f-i^lP-^^ + ^ + су^...П (1) В § 40 Гаусс извлекает из формулы (1) более простые оценки интересующей его среднеквадратичной ошибки. Эти оценки он основывает на неравенствах Рр/я < 2 (act + δβ + су + . . .)2 < π. (2) По какому-то недосмотру Гаусс не заметил, что верхняя из оценок (2) может быть заметно усилена и неравенства (2) могут быть заменены неравенствами ρρ/π < 2 (аа + δβ + су + . . .)2 < р. (3) Из-за этого недосмотра выводы § 40 оказались неожиданно слабыми: нижняя оценка, предлагаемая Гауссом для исследуемой им * Изв. АН СССР. Сер. мат., 1947, т. 11, № 6, с. 561-566.
284 31, Формула Гаусса из теории метода наименьших квадратов среднеквадратичной ошибки, оказывается в некоторых случаях даже отрицательной. Нашей задачей является доказательство неравенств (3) и установление того обстоятельства, что они не могут быть усилены. § 1 ПОСТАНОВКА ЗАДАЧИ Мы начнем с краткого изложения задачи в современных обозначениях, примыкающих к статье А. Н. Колмогорова [1]. Пусть величины г/г, at и xir, где г = 1, 2, . . ., N; i = 1, 2, . . . η; η <^ Ν, удовлетворяют N уравнениям η yr=2i aixiv ' (4) г=1 Величины xir предполагаются известными точно, вместо же величин уТ предполагаются заданными величины ηΓ - уг + ΔΓ, (5) где ΔΓ — взаимно независимые случайные величины, для которых Μ (ΔΓ) = 0, Μ (Δ2Γ) = Л Μ (Δ*) = /4 (6) (Μ есть знак математического ожидания). Матрица ||'#ίΓ ]] предполагается имеющей ранг п. В указанных предположениях метод наименьших квадратов рекомендует принимать в качестве приближенных значений неизвестных величин di значения аи определяемые из условия Ν η 2 Σ (Лг— Σ αϊχΐτ) =min. (7) Решение поставленной таким образом задачи, как известно, однозначно и имеет вид N Яг = Σ Uirt]r. (8) Коэффициенты uir в формулах (8) имеют следующий геометрический смысл: в TV-мерном пространстве векторы ui = (uiii ui2> · · ·» ^*iv), i = 1A 2, . . ., n, образуют биортогональную систему к векторам Xl = (Хц, %iZi · · ·» %iis)i ί = 1, <ώ, . . ., 72. Это значит, что векторы и±, и2, . . ., ип однозначно определяются следующими условиями: они лежат в линейном /2-мерном подпространстве L, определяемом векторами хг, х2, . . ., хП1 и удовлетворяют
31. Формула Гаусса из теории метода наименьших квадратов 285* условиям биортогональности: V - -J l ПРИ ί = /' (Q\ £**"* —*ν — \0 при {фи W Полагая где ε, = Лг— Σ а^»гэ (И> имеем Μσ2 - s2. (12) Задача Гаусса, указанная в начале нашей статьи, заключается в определении Οσ2 = Μ {σ2 - s2}2. (13) Гауссова формула (1) в наших обозначениях записывается так: где Ω=Σ(Σ^Λ,Γ. (15) r=l г=1 § 2 ОЦЕНКА Ω Выражение (15) имеет простой геометрический смысл. Именно- если обозначить через сг — \ег1, ег2, . . ., егм) проекцию единичного координатного вектора ег в пространство Lr то Q=^\e^=i[i(e%f}\ (16) В самом деле, проекция ζ* любого вектора 2 в пространство L может быть записана в виде η ζ* = S <ч^·
286 31. Формула Гаусса из теории метода наименьших квадратов * ег : жли в — ΔΔ uirxii г=1 координатной η = 2л uir%ili· г=1 Бполне аналогично ег~- егк г г=1 = 2л £iruik· форме получим Вычисляя скалярное произведение (zui)1 получим в силу (9) (zut) = (z*ut) = ct. Если ζ = еГ1 то последняя формула дает сг = uir. Поэтому η (17) (18) (19) (20) Из (18) и (20) вытекает Ν Ν η η η \е*|2= Σ (<&)2 = Σ Σ Σ Клл>^д)= Σ щ^гг- (21) /,·=1 fr=i г=1 у=1 г=1 Равенство (21) в соединении с (15) непосредственно приводит к (16). Введем теперь в нашем iV-мерном пространстве новую ортогональную систему координат, расположив первые η осей в пространстве L, а остальные N — η выбрав ортогональными к этому пространству. Пусть в новой системе координат векторы ег представляются в виде еТ = (ΩΓΐ, Ωγ2, . . ., ΩΓ]ν). Очевидно, что в этой системе координат ег = (ΩΓΐ, Ω^», . . ., ΩΓη, 0, 0, . . ., 0). Поэтому Ω=3(ΣΩ?»)\ (22) r=l fc=l Матрица || ΩΓ& || ортогональна. Легко заметить, что никаких других ограничений на вид этой матрицы общая постановка нашей задачи не накладывает: при надлежаще подобранной матрице || xir || ранга η можно достигнуть того, что матрица || ΩγΛ || будет произвольной ортогональной матрицей. Таким образом, проблема оценки возможных значений может быть поставлена так: какие значения может принимать при η <^ Ν выражение (22) для ортогональной матрицы N-го порядка!
31. Формула Гаусса из теории метода наименьших квадратов 28? Так как то всегда λ·=ι λ·=ι Поэтому из (22) вытекает iV n Ω<ΣΣ Ω*, = >ζ. В установленном таким образом неравенстве Ω < η (23) знак равенства достигается, если матрица || ΩΓ]ζ || единичная: С другой стороны, так как всегда Ν Ν то из (22) вытекает r=l fc=i В полученном неравенстве Ω > ^2/iV (24) знак равенства тоже достижим при любых N и η <^ Ν, как это было установлено по нашей просьбе А. И. Мальцевым [2]. § 3 ВЫВОДЫ В § 2 установлено, что η2/Ν < Ω < η (25) и обе указанные в (25) границы достигаются. Для оценки D2a2 отсюда получаются в силу (14) 4=£-*(4=£)<«*<-£е*-. «-/■-*■><>, 26
288 32. Ветвящиеся случайные процессы причем указанные в (26) границы достигаются при любых N ж η <* <^ N в некоторых частных случаях. Если /4 — 3s4 = 0, то из (26) получается известная для случая нормального гауссовского распределения ошибок ΔΓ формула Da2 = 2s4(N - η). (27) Если отношение η/Ν стремится к нулю и /4 — s4 ^> 0, то асимптотически Οσ2 ~ (/4 - 8*)/(Ν - л). (28) В мемуаре Гаусса вместо этого при η/Ν, стремящемся к нулю, указаны для Da2 лишь асимптотические оценки (2/* - 4s4)/(iV — л) и 2sV(N - τι). Заметим еще, что в вырожденном случае /4 = s4 (случай /4 <^ s4, как хорошо известно, невозможен) из (26) получается Da2 < 2ns4N (N — η). (29) 5 мая 1947. г. ЛИТЕРАТУРА 1. Колмогоров А. Н. К обоснованию метода наименьших квадратов.— УМН, 1946, т. 1, вып. 1, с. 57—70. 2. Мальцев А. И. Замечание к работе А. Н. Колмогорова, А. А. Петрова и Ю. М. Смирнова «Одна формула Гаусса из теории наименьших квадратов».— Изв. АН СССР. Сер. мат., 1947, т. 11, с. 567—568. 32 ВЕТВЯЩИЕСЯ СЛУЧАЙНЫЕ ПРОЦЕССЫ* Совместно с Н.А.Дмитриевым § 1 ПОСТАНОВКА ВОПРССА Будем рассматривать совокупность объектов (например, молекул) каких-либо η типов Тъ Т2, . . ., Тп и предположим, что один объект типа Тк за промежуток времени (i1? t2) превращается с вероятностью -Ρ% (h, t2) = Ρ (Tk -» Sa I ii, h) в совокупность Sa = a1T1 + α2Γ2 + . . . + anTnl состоящую из αλ объектов первого типа, а2 объектов второго типа и вообще at объектов ϊ-го типа. Случайный процесс, состоящий из такого рода превращений, называется ветвящимся, если вероятности -Р™ (*ъ h) однозначно определяются заданием моментов времени * ДАН СССР, 1947, т. 56, № 1, с. 7-10.
32. Ветвящиеся случайные процессы 289 f <^2> номера исходного типа к = 1, 2, . . ., η и ^-мерного вектора α = (α1? α2, · · ·, αη) с целочисленными компонентами α$ = = 0, 1, 2, ... Существенным здесь является допущение, что вероятности независимы от: 1) способа и времени возникновения исходного объекта типа 7\, про который лишь предполагается, что он существует в момент времени ti, 2) судьбы могущих входить в рассмотрение других объектов типов Тъ Тг, · · ·, Тп, отличных от данного в момент времени t1 объекта типа Τ]ς и объектов, возникающих из него при t ^> tv Изложенная сейчас теоретико-вероятностная схема может иметь разнообразные применения в биологии, химии и физике элементарных частиц. В частности, в химии под нее могут быть подведены начальные стадии самых разнообразных химических реакций. В самом деле, в начальной стадии химической реакции обычно можно считать концентрации одних типов молекул Тг, Т2, . . ., Тт большими, ι о приближенно постоянными, концентрации же других типе в 7Ί, Т2, . . ., Тп переменными, но весьма малыми. В этих предположениях встреча двух молекул типов Т" практически невозможна, результаты же встреч одной молекулы одного из типов Г" с одной или несколькими молекулами типов Ί" в отношении числа возникающих молекул типов Т" приближенно подчиняются сформулированным выше требованиям. В химических и физических вопросах естественно применять вариант нашей схемы с «непрерывньгл<(Хвременем», предполагая вероятности Р% (tu tz) дифференцируемыми по t1 и t%. Дифференциальные уравнения, которые мы получаем в этом предположении в § 3 этой работы для частного случая «мономолекулярных» реакций (Р% (ίχ, h) ^> 0 только при аг + ос2 + . . . + ап = 1), были ранее указаны М. А. Леонтовичем [1]. В биологических вопросах естествен другой подход с «дискретным временем», где «время» t принимает лишь целые значения и обозначает номер поколения. В этом варианте излагаемые далее результаты были для случая η = 1 получены Р. А. Фишером [2]. Исследования Фишера были продолжены Ж. Ф. Стеффенсеном [3] и одним из авторов настоящей заметки [4]. §2 ОСНОВНОЕ ФУНКЦИОНАЛЬНОЕ УРАВНЕНИЕ В силу общих принципов теории вероятностей Р% (£χ, t2) подчинены условиям Я (h, h) > 0,; (I) 2P*(ti,t,)=l. (И) а 10 А. Н. Колмогоров
290 32. Ветвящиеся случайные процессы Считая эти вероятности определенными при любых t1 ^ tz, для t1 = t% естественно принять „11, если ак = 1, щ = 0, 1Ф к, I U во всех остальных случаях. х ' Наконец, в силу сделанных выше допущений вероятности Р% (ΐΐΊ t2) удовлетворяют при любых ti ^ t% <ζ t3 уравнению Pi (/ь и)=Σ Ρΐ (h, h) Pi (им, (iv) α где Pi (ίι, ί2) = Ρ (Sa -> 5* I flf ί2) означает вероятность превращения за промежуток времени (ί1? £2) совокупности 5α - αιΓχ + α2Γ2 + . . . + αηΤη в совокупность Sp = βιΖΊ + β2772 + · · · + βΛ· Вероятности Р^ (ί1? ί2) допускают выражение через вероятности Ή (*х, ί2): ^ (<ь ί.)=ΣΠΐί if*· ·} («ι,*.), (IVa) i=l s=l где суммирование распространяется на все такие наборы векторов β (U s) = (βι (U s), β2 (i, *), · · ., βη (i, *)) с целыми неотрицательными компонентами β^ (i, s), для которых * Σ Σ β(*,*) = β. (ivb) i=l s=l Формулы (I) —(IV) заключают в себе полный перевод понятия «ветвящегося случайного процесса», определенного в § 1 на языке теории вероятностей, на язык чистого анализа. Из (IV) и (IVa) вытекает, что вероятности Pi (ΐΐΊ t%) удовлетворяют основному уравнению марковских процессов 1 В формулах (IVa) и (IVb) в случае аъ = 0 соответствующее произведение полагается равным единице, а соответствующая сумма равной нулю.
32. Ветвящиеся случайные процессы 291 Уравнение (1) вытекает непосредственно из теоретико-вероятностных предпосылок § 1. Уравнение (IV) по существу является лишь частным случаем уравнения (1). Это замечание показывает, что наши «ветвящиеся случайные процессы» по существу являются лишь частным случаем марковских процессов со счетным множеством состояний. Для этого частного случая мы получим, однако, аналитический аппарат, значительно более эффективный, чем тот, который может быть развит для общего случая марковских процессов со счетным числом состояний. С этой целью мы введем производящие функции Fk (*i, t2; хи х2, .. ., хп) = Σ Ρϊ (h, h) х?я%*... хапп. (2) α Целесообразно η функций Fk записывать как одну векторную функцию F (tl9 t2, χ) = (Fx (ί1? t2; я), Fz (tl9 t2\ x), . . ., Fn (tl9 t2; x)) векторного аргумента Χ — (Χι, Χ2, . · ., Хп)- Смысл введения производящей функции F (tl9 t2\ x) заключается ш том, что при ее помощи соотношения (IV) записываются в следующей форме: F (i1? f8; х) = F (h, ί2; F (f2, ί3; x)). (Α) Кроме основного функционального уравнения (А), из (III) для функции F (tl9 t2; x) получается еще граничное условие F (t, t; χ) = »: (В) Естественно, что функция F (tl9 t2\ x) считается определенной лишь для tx <; t2. Что касается аргумента #, то он имеет чисто формальное значение, однако из (I) и (II) во всяком случае вытекает, что Fk (tl9 t2; χ) определены и аналитичны по аргументам хъ х2, . . . . . ., хп при \xt |< 1, s = 1, 2, . . ., п. Особенно интересен случай процессов, однородных во времени,; т. е. удовлетворяющих.условию Pk (h, h) = ρ? (tz - tj. (3) В этом случае для F1,{P,x) = ^P<i(t)x'?x'?...xy (4) а получаем вместо (А) и (В) F (t + τ; χ) = F (t; F (τ; χ)), (Аг) F (0; χ) = χ. (Вг) to*
292 32. Ветвящиеся случайные процессы § 3 ДИФФЕРЕНЦИАЛЬНЫЕ УРАВНЕНИЯ ДЛЯ СЛУЧАЯ НЕПРЕРЫВНОГО ВРЕМЕНИ Допустим теперь, что П (t, t + Δ) = Et + Αρΐ (t) + ο (Δ), (V) где о (Δ) бесконечно мало по сравнению с Δ. В этом случае естественно ввести производящие функции /Πί;^)=Σρ*(0^2αι...<η. (5) а Тогда при 1 xt 1 < г < 1, ί = 1, 2, ... ., га, получим F (t, t + Δ; χ) = * + Δ/ (ί; *) + ο (Δ). (6) Полагая в (Α) tx = t', t2 = t' + Δ, £3 = t" и переходя к пределу при Δ ->■ 0, получим для F (f, ί"; я) при ί' < Г дифференциальное уравнение 3F/3i' - -/ (ί'; F). (С) Это дифференциальное уравнение вместе с граничным условием (В) и может быть положено в основу расчета процессов занимающего нас сейчас типа. В самом деле, р% (t) обычно могут быть определены непосредственно из условий задачи, целью же математической теории является определение вероятностей Р% [tl9 t2), иногда же их асимптотического поведения при £2->+оо. Так как функции % легко находятся по заданным р%, а искомые Р% получаются из разложения функций Fk по степеням переменных хи то определение вероятностей Р% и исследование их асимптотического поведения сводится к решению уравнения (С) при граничном условии (В) и исследованию асимптотического поведения решений. В однородном во времени случае плотности вероятностей р% постоянны и функции Fjc {t\ хъ х2, . . ., хп) связаны с функциями /*(хъХ2,...,χη)=ΣΡ*χ?χ¥..·χαηη (?) уравнениями dFx dF2 dFn dt, (С) Λ {FU F2,..., Fn) h (FU F2,...,Fn) · · · fn(Fu F2,..., Fj' которые следует решать для t ^> О, считая х% постоянными при начальных условиях Fk (0; хъ х2, . . ., хп) = хк. (В') Часто этот метод значительно эффективнее, чем непосредственное обращение к бесконечным системам дифференциальных уравнений
32. Ветвящиеся случайные процессы 293 марковских процессов со счетным множеством состояний, получающихся из (1) при допущениях, подобных (V). Мы ограничимся здесь одним простым примером применения метода (решение той же задачи методом бесконечных систем см. у Н. Ар лея [5]). η = 1: р{ = α, р\ = —(α + b), pi = b, pi = 0 при г > 2, / (s) = a — {a + b) χ + to2 = (1 — x) {a — bx). (l-F)(a-bF) "' 6 +<*<«-** '№*>- :!I::!iir":!.C:: -и(о+*т.+*м«ч-. 6 (1 - Ж) + (&я _ a) *(a-b)* Ρϊ(ί) Λ "' b i _ (a/b) e(a-b)i ». ,(a-b)tvfr-i где А; = 1, 2, . . . 20 февраля 1947 г. ЛИТЕРАТУРА 1. Леокт&еич М. А. Основные уравнения кинетической теории газов с точки зрения теории случайных процессов.— ЖЭТФ, 1935, т. 5, с. 211—231. 2. Fischer R. A. The genetical theory of natural selection. Oxford, 1930. 3. Steffenson J. F. Deux problemes du calcul des probabilites.— Ann. Inst. H. Poincare, 1933, vol. 3, p. 331—334. 4. Колмогоров Α. Η. К решению одной биологической задачи.— Изв. НИИ мат. и мех. Томск, ун-та, 1938, т. 2, № 1, с. 7—12. 5. Arley N. On the theory of stochastic prosesses and their application to the theory of cosmic radiation: Diss. Copenhagen, 1943.
294 33. Вычисление финальных вероятностей 33 ВЫЧИСЛЕНИЕ ФИНАЛЬНЫХ ВЕРОЯТНОСТЕЙ ДЛЯ ВЕТВЯЩИХСЯ СЛУЧАЙНЫХ ПРОЦЕССОВ* Совместно с Б, А. Севастьяновым Настоящая заметка примыкает в отношении терминологии и обозначений к [1]. Мы рассматриваем далее однородную по t дискретную схему: t пробегает только значения 1, 2, 3, ... и может трактоваться как «номер поколения» рассматриваемой частицы. В соответствии с этим Р? (t) = P(Ti-> агТг + α2Γ2 + . . . + апТп | t) (1) есть вероятность того, что одна частица типа 7\ даст через t поколений по аъ а2, . . ., αη частиц типов 7\, Г2, . . ., Тп. В основе всех дальнейших подсчетов лежат производящие функции f* (I; *)=h (*)=Σ ρ№£" . .. <п (2) α вероятностей Р'=РЩ) (3) различных переходов за одно поколение. Через них по индукции определяются производящие функции П-М = М(0«г...<" (4) а для всех натуральных значений t: F* (t + 1; χ) = h {Fx (ί; *), F2 (t; χ), . . ., Fn (ί; χ)}. (5) В соответствии с общей теорией, изложенной в [1], р£'0'"0) =/„(о,о,. ...о) (6) обозначает вероятность того, что частица типа Т^ за одно поколение исчезнет, не произведя никаких новых частиц рассматриваемых типов 2\, Г2, . . ., Тп. Для дальнейшего целесообразно избавиться от этой возможности и рассматривать только схемы, в которых fk (0, 0, . . ., 0) = 0. (7) Если условие (7) не выполняется в какой-либо схеме, то всегда можно ввести дополнительный фиктивный тип Тп+1 и считать, что исчезновение частицы любого другого типа обозначает превращение ее в частицу типа Гп+1, частицы же типа Тп+1 остаются далее неиз- * ДАН СССР, 1947, т. 56, № 8, с. 783-786.
33. Вычисление финальных вероятностей 295 менными. Аналитически это равносильно переходу от первоначальной системы производящих функций /ь /2, . . ., /п к новой системе /fc \χ1ι · · ·» #n» #n+l) = J к \%Ъ · · ·» #п) "Г + (хп+1 - 1) Л (0, 0, . . .,0), к = 1, 2, . . ., п, (8) п+1 \χ1ι · · ·» ^η? #η+1/ ~ #η+1· Во всем дальнейшем мы предполагаем условие (7) выполненным уже для первоначальной системы типов Тъ Т2, . . ., Тп и функций /1? /2? ' ' ·» /η· Группа типов TV,, TV2, . . ., TVTO называется замкнутой, если частица любого типа группы производит только частицы, принадлежащие типам той же группы. Система всех типов Т1Ш Г2, . . ., Тп разложима, если ее можно разбить на две замкнутые группы. Естественно ограничиться рассмотрением неразложимых систем типов. Так мы и делаем во всем дальнейшем. Группа типов называется финальной, если: а) она замкнута; б) каждая частица любого из типов группы всегда производит ровно одну частицу; в) она не содержит в себе никакой меньшей группы, обладающей свойствами а) и б). Легко видеть, что две финальные группы не имеют общих элементов. Поэтому вся система типов Тъ Г2, . . ., Тп состоит, вообще говоря, из некоторого числа финальных групп ΨΓ = {Тг1, Гг2, . . . • · ·» ТГПг}, г = 1, 2, . . ., s и некоторого числа типов Т01, Т02, . . . . . ., Тощ, не принадлежащих финальным группам. При этом по + пх + . . . + ns = п. МыСбудем считать процесс закончившимся, когда остались лишь частицы типов, входящих в финальные группы. Такое понимание естественно, так как потомство частицы типа, принадлежащего к финальной группе, в любом дальнейшем поколении будет состоять из одной частицы типа, принадлежащего к той же финальной группе, переходы же из одного типа в другой тип в пределах финальной группы управляются хорошо изученными законами так называемых цепей Маркова в их простейшей форме, соответствующей предположению, что все «состояния» «существенны» и образуют один «класс» (см., например, [2]). Будем обозначать $ = Ρ {Tk -+ βχΨχ + β2ψ2 + . . . + β,Ψ3 | οο } (9) вероятность того, что эволюция всего потомства одной частицы типа Т* рано или поздно закончится на том, что останется по βΓ частиц, принадлежащих типам финальных групп ΨΓ; е* = 3-??<1 (ίο) f
296 33. Вычисление финальных вероятностей есть полная вероятность того, что процесс развития потомства одной частицы рано или поздно закончится (в указанном выше смысле). Введем производящие функции Ф& (Hi, wt, . .., иш) = S qlul'uf ... uss. (11) В соответствии с двойным обозначением типов частиц функцию <pfct соответствующую типу 2\ = Ггт, будем иногда обозначать φΓ7η. Так как д$ > 0, то в силу (10) функции (11) во всяком случае определены и аналитичны по всем переменным при 0<иг<1, г = 1,2, ,,.,5. (12) Когда некоторые из переменных достигают значения 1, то аналитичность может потеряться, но непрерывность сохраняется. В частности, φ, (1, 1 1) = <?*. (13) Из вероятностных соображений легко вывести следующее основ- жое для нас соотношение: <Р* = h (Фъ фа, · · ·, Фп), к = 1, 2, . . ., п. (14) Кроме того, из определения финальных групп можно вывести, что Фгт = Щ, гп = 1, 2, . . ., пг, г = 1, 2, . . ., s. (15) Уравнения системы (14),для которых номера соответствует типу какой-либо финальной группы, являются следствием уравнений (15). Поэтому окончательно для*определения φ^ имеем систему уравнений Фот =* /от (фь Ф2> · · ·»; <Pn)j ГП = \% 2, . . ., П0\ (16) Фгт = иг, т = 1, 2, . . ., nri г = 1, 2, . . ., s. Младшим из авторов настоящей заметки доказана следующая теорема относительно однозначности решения уравнений (16). Теорема. Система (16) вместе с ограничениями 0 <^ φ& < 1, к = 1, 2, . . ., га, однозначно определяет значения функций Φι» Фг> · · ·» Фп при любых заданных 0 <Ξ иг < 1, г = 1, 2, . . ., s. Замечание 1. Доказательство теоремы будет опубликовано в другом месте. Оно опирается на свойства функций Д, вытекающие из предположения о неразложимости системы типов и из определения финальных групп, на допущение (7) и на соотношения Р*>0, Σρ*=1. (17) α Последние ссо!ношения, впрочем, используются не полностью аналитичность функций Д- несущественна для доказательства.
33. Вычисление финальных вероятностей 297 Замечание 2. Все изложенное применимо и к вычислению финальных вероятностей q® для ветвящихся процессов с непрерывным временем. Для этого достаточно вести счет не по времени в буквальном смысле слова, а по «поколениям» частиц. Только для типов,. не допускающих совсем дальнейших превращений, надо ввести дополнительные фиктивные превращения частиц этих типов самих в себя (с вероятностью единица). Это замечание будет пояснено на примере в конце настоящей заметки. Замечание 3. В большинстве применений к химическим цепным реакциям каждая финальная группа состоит из одного типа (конечные продукты реакции). Изложенная теория в этом случае· упрощается. Пример. Пусть в схеме с непрерывным временем и двумя типами 7\ и Τ2 заданы положительные плотности вероятностей перехода (см. [1, § 3]) ρ?·0) = ρ(7ϊ-*2Γι), p?-" = p{Ti~>T*)9 остальные же переходы запрещены (в частности, частица Т2 ни во что не превращается). Переходя к счету по поколениям, полагаем Р?'0) = Р{Тг->2Т1}= &* =р, &» = Р{Тг-+2Ы= ®" =1-Р, и дополнительно PTL) ^Р{Т2-+ T2} = 1 (здесь pi имеют уже смысл вероятностей, введенных в настоящей заметке). Финальная группа в нашем примере одна из одного типа Ψ ι = {Т2}. Для функций φχ (щ), φ2 (иг) получаем уравнения Φι = ρφΐ + (1 — ρ) φ2, φ2 = щ- Решая эти уравнения, получим формально Φι = -^- (1 ± >"1 — 4р (1 - р) их). (18) При ограничениях 0<^Μ1<1,0<^φ1<1 остается только одна ветвь кривой (18) (со знаком минус). Проведем до конца расчеты для случая ρ = V2. Для коэффициентов разложения <рх (иг) = gi0) + qii)u1 + qi)u\+ . . . получим в этом случае а\0) — 0 па) — 1/ „<2> ι/ jm)__ 1-3-5. ..{2m — 3) 9 vi —и, qx — /2, дг =λ/8,..., дг = -=—- , m > Zt 2 -ml
298 33. Вычисление финальных вероятностей т. е> асимптотически дТ} ~ (1/2\/π) m-*f*. (19) Отметим, что хотя «pi(i)=S?im) = ^=i, т т. е. процесс непременно заканчивается, математическое ожидание Mj_ = 2 /^?1Я) числа получаемых из одной частицы Тг частиц Т2 m бесконечно. С этим связано своеобразное явление неустойчивости числа частиц Г2, производимых заданным, хотя бы и очень большим числом частиц Тг. Чтобы разобраться в этом, обозначим μη число частиц Г3, производимых η частицами Тг. Очевидно, μη = κχ -f- + κ2 + · · · + кп, где %ι обозначает число частиц Т2, производимых i-й частицей типа Тг. Величины κ t взаимно независимы и подчинены распределению вероятностей Ρ {κ^ = к} = q[}. Отсюда и из (19) вытекает (см. [3]), что величины Ъп = Vjn2 (20) имеют закон распределения Sn (χ) = Ρ {ξη < #}, который при η -►■ οο стремится к вполне определенному непрерывному предельному закону распределения X S(x) = ^s(x)dz. (21) о Предельный закон распределения (21) может быть найден по логарифму своей характеристической функции оо оо logX(t) = log[s(x)eitxdx=T±={(e™t-l)^-. (22) J ΔΛ/ П t) и1г о v о Таким образом, при больших η число μη будет порядка тг2, но отношение \\п/п2 будет колебаться от случая к случаю. Москва, 12 апреля 1947 г. ЛИТЕРАТУРА 1. Колмогоров А. Н., Дмитриев Н. А. Ветвящиеся случайные процессы.— ДАН СССР, 1947, т. 56, № i? c. 7—10. 2. Kolmogoroff A. M. Anfangsgrunde der Theorie der Markofischen Ketten mit unendlich vielen moglichen Zustanden.— Мат. сб., 1936, т. 1, № 4, с. 607—610. 3. Гнеденко Б. В. То the theory of the domains of attraction of stable leaws.— Уч. зап. МГУ, 1939, т. 30, с. 61—82.
34. Статистическая теория колебаний с непрерывным спектром 299 34 СТАТИСТИЧЕСКАЯ ТЕОРИЯ КОЛЕБАНИЙ С НЕПРЕРЫВНЫМ СПЕКТРОМ* 1. Предмет, которому посвящен настоящий очерк, может быть охарактеризован в весьма общих терминах, не связанных с какой- либо специальной областью механики или физики. Для простое мы ограничимся рассмотрением изменения во времени какого-либо конечного числа величин Ъ (i), l, (t), ...A* it). Аргумент t (время) будет, естественно, предполагаться действительным, а величины £г (t), вообще говоря, комплексными. Если величины ξΓ (t) изменяются периодически с периодом ω, то процесс1 их изменения изучается обычно при помощи математического аппарата рядов Фурье tr(t)~'2><4n)ei"tnt'*. (1) η Благодаря этому колебательный процесс изменения величин |r (t) с периодом ω разлагается на гармонические колебания периодов ω, ω/2, ω/3, ω/4, . . . Естественным обобщением периодических колебаний являются почти периодические колебания вида M*)-~2XnW. (2) η Здесь периоды ωη = 2π/1 λη Ι , вообще говоря, несоизмеримы между собой. Естественно, дальнейшим обобщением представляется переход в формуле (2) от сумм по последовательности специально выделенных частот λη к интегрированию по непрерывно меняющейся частоте λ оо МО- J ψΓ(λ)β^άλ, (3) — оо или в совсем общей форме, объединяющей дискретный случай (2) и непрерывный случай (3), к представлению колебательных процессов * Юбилейный сборник, посвященный тридцатилетию Великой Октябрьской социалистической революции. М.; Л.: Изд-во АН СССР, 1947, т. 1, с. 242—252.
300 34. Статистическая теория колебаний с непрерывным спектром в виде интегралов Стилтьеса оо Ь(0~ I β™άΦτ(λ). (4) —оо Однако если ограничиться арсеналом средств классического анализа, то на намеченном сейчас пути встретится существенная трудность. Классические интегралы Фурье вида (3) способны представлять лишь функции, которые при t ->· оо стремятся в среднем к константам. Интегралы вида (4) тоже способны представлять лишь функции, которые разлагаются на две компоненты Б W = η (0 + ζ W, еде η (t) — почти периодическая (т. е. имеет дискретный спектр), а ζ (t) при ί->οο в среднем стремится к константе. Таким образом, классический аппарат интегралов Фурье для случаев непрерывного спектра приводит лишь к затухающим колебаниям. Так и говорится ш учебниках физики, желающих сохранять математическую строгость г. Тем не менее идея о том, что и в случае незатухающих колебаний возможны колебания с непрерывным спектром и что их можно изображать интегралами вида (3), культивируется многими, иногда очень крупными представителями механики и физики. Такого рода исследования, несмотря на отсутствие в них математической строгости, во многих случаях приводят к правильным и полезным результатам. Предпосылки для строгого математического обоснования теории незатухающих колебаний с непрерывным спектром по существу содержатся в спектральной теории операторов 2. Математически строгая спектральная теория функций ξ (t) действительного аргумента t, непосредственно ориентированная на математическое обоснование физических представлений о незатухающих колебаниях с непрерывным спектром, была впервые создана Норбертом Винером 3 в 1925 г. Концепция Винера, однако, не приводит ни к представлениям вида (3), ни к представлениям вида (4). Полную ясность IB весь рассматриваемый круг вопросов внесла лишь спектральная теория стационарных случайных процессов, предложенная А. Я. Хинчиным в 1934 г. [1]. Она, в частности, приводит к математически строгому и в то же время физически осмысленному обоснованию представления незатухающих статистически стационарных колебаний в виде (4). Это обоснование обладает, по-видимому, вполне достаточной для применений общностью. Представление же незату- 1 См., например, [15, § 54]. 2 См. изложение этой теории в статьях А. И. Плеснера и В. А. Рохлина 116, 17]. f Систематическое изложение теории Винера можно найти в четвертой главе его книги [18]; см. также [19].
34. Статистическая теория колебаний с непрерывным спектром 301 хающих колебаний в виде (3) и в концепции А. Я. Хинчина не получает строгого математического обоснования. Автору этой статьи представляется, что такое положение вещей следует считать окончательным: в случае непрерывного спектра функциям Фг (λ), по- видимому, никаким разумным способом нельзя приписать определенные производные φΓ (λ). Целью настоящего очерка и является рассмотрение некоторых советских и иностранных исследований, развивающих концепцию А. Я. Хинчина. 2. Все очень простые и законченные результаты, излагаемые далее, получаются благодаря радикальному изменению точки зрения: величины ξΓ (t) рассматриваются как случайные величины в смысле, принятом в теории вероятностей. Таким образом, основным предметом изучения делается не индивидуальный вполне определенный колебательный процесс, а закон распределения вероятностей в функциональном пространстве различных возможных вариантов течения такого процесса. Формальное изложение теории может исходить из таких определений 4: 5-мерным случайным процессом называется совокупность комплексных случайных величин ξΓ (t), заданных для всех действительных t и для г = 1, 2, . . ., s. Предполагается, что математические ожидания м Ι ξΓ (*) I 2 конечны и процесс стохастически непрерывен в том смысле, что м \ir(t + A)-ir(t) |а-*о при Δ -^ 0. Случайный процесс {ξχ (t), ξ2 (£), . . ., ξ8 (t)} называется стационарным, если, каковы бы ни были £, £ь t2, . . ., tn, ш-мерный закон распределения sn случайных величин ξι (t + h), Ιλ (t + ί2), . . ., l± (t + tn), h (t + h), ξ2 (t + *a),..., i2 (t + tn), L· {t + h), i8 (t + *a),.. ., ι, (t + tn) не зависит от сдвига t. Из стационарности вытекает, в частности, что математические ожидания 5 _ вяг (τ) = Μ {lq (t + τ) i (t)} (5) 4 Употребляемые далее понятия теории вероятностей строго вводятся, например, в моей книге_ [20]. 5 В равенстве (5) ξ обозначает величину, комплексно-сопряженную с ξ.
3)2 34. Статистическая теория колебаний с непрерывным спектром не зависят от t. Само по себе требование независимости от t математических ожиданий (5) называется стационарностью в широком смысле. Все дальнейшее изложение этого и следующего параграфов основано лишь на гипотезе стационарности в широком смысле. ι Основной результат А. Я. Хинчина в форме, приданной ему Харальдом Крамером [2], таков: Функции Bqr (τ) допускают представление сю Bqr(x)= J e^dFqr(ty, (6) —оо где при любых λλ < λ2 матрица II Fqr (Δλ) || приращений Fqr (Δλ) = Fqr (λ2) - Fqr (λχ) является эрмитовой неотрицательной. Чтобы понять смысл хинчиновских спектральных функций FQr (λ), следует обратиться к дискретному случаю,, в котором интегралы (6) превращаются в суммы £9Γ(τ) = Σ<νλ»τ· (7) Этот случай был исследован Ε. Ε. Слуцким [3]. Оказалось, что в предположении (7) имеет место разложение U0~5X'Vv (8) η где αί·η) — некоторые случайные величины, однозначно6 определяемые по заданным ξΓ (£).f При этом <#> = Μ {af4n)}. (9) В частности, а™ = Μ | α?ι) |2. (9') Естественно было предположить, что и в общем случае Fqr(A,) = f*{(t>q(A,)Or(Ax)}, (10) FTr (Δχ) = Μ I фг (Δλ) |·, (10') где Фг (Δχ) суть приращения спектральной функции, входящей в представление величин |r (t) вида (4). Это предположение оказывается правильным. Соответствующее углубление хинчиновской теории стационарных случайных процес- 6 Однозначность здесь имеет место с точностью до эквивалентных величин, т. е. до величин, совпадающих с вероятностью единица.
34. Статистическая теория колебаний с непрерывным спектром 303 сов является почти автоматическим следствием ее сведения к спектральной теории однопараметрических групп унитарных операторов, которое указано в работах [4—7] и излагается в следующем параграфе настоящего очерка. 3. Случайные величины ξΓ (t) можно рассматривать как элементы гильбертового пространства, в котором скалярное произведение определено формулой (Ι, η) = Μ (ξη). (И) Легко устанавливается, что любой стационарный процесс- {ξχ (£), £г ОО» ···»£* 00} в соответствующем гильбертовом пространстве порождает однопараметрическую группу унитарных операторов {Ux}, которые удовлетворяют соотношению U4r (0 = lr(t + τ) (12) для всех действительных t и τ и всех г = 1, 2, # . ., s. Операторы [/τ, как известно, допускают представление оо Ux= J e^dE(X), (13) —оо где Ε (λ) — «разложение единицы». Положив Фг (λ) = Ε (λ) ξΓ (0), "(14) мы и получим (при надлежащем понимании знака интегрирования) основную формулу (4). Теоретико-вероятностная интерпретация ^формулы (4) более широко, чем в [6] и [7], изложена в новейших работах X. Крамера [8], М. Лоэва [9], А. Блан-Лапьера и Р. Форте 110, И]. Чтобы понять реальный смысл основных спектральных функций Фг (λ), естественно рассмотреть их приращения Фг (Δλ) = Фг (λ2) - Фг (λχ) и скачки ατ (λ) = Фг (λ + 0) - Фг (λ - 0) в отдельных точках λ. Естественно, что Фг (Δ*,) и αΓ (λ), как и £г (t), случайные величины, однако в отличие от ξΓ (t) они не зависят от времени t. Если при каком-либо λ скачок аг (λ) отличен от нуля, то в £г (0 содержится строго периодическая компонента Ь (*, λ) = аг (λ) еш. (15) В частности, аг (0) есть среднее (по времени) значение τ ar(0)=lim-^r jj lr(t)dt (16)
304 34. Статистическая теория колебаний с непрерывным спектром Аналогичен реальный смысл приращений Фг (Αχ) для достаточно коротких отрезков Αχ. Именно компонента lr(t, Αχ) = 1^άΦ(λ)9 (17) соответствующая участку спектра Δλ, на любом конечном участке — Τ <J t <ζ + Τ временной оси в случае достаточно короткого Δλ сколь угодно хорошо аппроксимируется выражением Фг (Δλ) е*\ (17') где λ — любая точка из Δλ. Естественно, однако, что в случае непрерывного спектра компоненты lr (t, Δλ) ни для какого конечного фиксированного интервала Δ^ не являются строго периодическими (если только они не равны тождественно нулю). Их временное поведение в случае коротких интервалов Δλ аналогично колебаниям маятника со слабым затуханием, возбуждаемого хаотически распределенными малыми случайными толчками. Компоненты ξΓ (t, Δλ) для непересекающихся интервалов Δλ и Αχ между собой не коррелированы, т. е. Μ {^ (ί, Δλ) Ir (t, ΔΙ)} = 0, (18) если Δλ и Δλ не пересекаются. Для одного интервала Δλ Μ {ξ, (t, Δλ) 1г (t, \)} = Fqr (Δλ). В частности, Μ Ι ξΓ (t, Δλ) I 2 = FTT (Δλ), (19') τ. e. Frr (А%) есть не что иное, как среднее значение (по вероятности) квадрата спектральной компоненты ξΓ (t, A%) величины ξΓ (t). 4. Использование абстрактного аппарата операторов в гильбертовом пространстве могло создать у читателя впечатление, что спектральные компоненты ξΓ (t, Δλ) являются какой-то математической фикцией, далекой от возможностей непосредственного эксперимента. В действительности это не так: с любым заданным приближением они могут быть выделены из любого статистически стационарного колебательного процесса при помощи надлежащим образом устроенных фильтров. Именно в принципе с любым желательным приближением можно осуществить прибор, связывающий с любой заданной случайной стационарной функцией ξχ (t) случайную стационарную функцию оо ξ2(0 = $£ι(*-τ)5(τ)ί2τ, (20) о С^(19)
34. Статистическая теория колебаний с непрерывным спектром 305» где s (τ) подчинено единственному условию оо [\s(t)\4t<oo. о Если положить 1 βίλ2(τ-Γ) _ gibtix-T) *(τ) = 1ΗΓ ϊΊΓγ ' (21> то при достаточно большом положительном Т ΐλ2τ _ JlkxX будет с вероятностью, сколь угодно близкой к единице4 сколь угодна мало отличаться от А (* J-HX „Ίλ,ίΐ Заметим еще, что приближенно зависимость (20) можно осуществить в виде LU=lu (22) где L=c°+ci4-+c2-S-+---+c»^- (23> и характеристические числа L все имеют отрицательные действительные части. При сделанных предположениях, если ξχ (t) статистически стационарно, то и ξ2 (t) будет при t ->■ +°° стремиться к статистической стационарности. Это предельное статистически стационарное поведение ξ2 (t) определяется формулой оо . 12 (ί) = S |ХЩ <*Φι (λ)' * (ζ) = со + ciz + .. P. + cnz». (24) —оо Формула (24) имеет самостоятельный интерес независимо от вопроса об экспериментальном определении спектральных компонент lr (t, Δλ). Из нее вытекает, что **>=$-*$-. (25) — оо ^Hiw- (26)
306 34. Статистическая теория колебаний с непрерывным спектром Формулы (24), (25) и (26) содержат в себе обобщение обычной теории резонанса на случай произвольной статистически стационарной внешней силы. Обычное, не статистическое, изложение этой теории применимо лишь к случаю дискретного спектра внешней силы, т. е. к случаю ξχ (t) вида (2). Впрочем, естественно, что без строгого математического обоснования соответствующие рассмотрения для случая непрерывного спектра широко употребляются в физической литературе. 5. В приложениях в случае непрерывного спектра обычно λ *VW= 5 ίν(λ)άλ, (27) — оо т. е. формула (6) может быть заменена формулой оо Bqr(T)= l β^%Γ(λ)άλ. (28) — оо Этот переход к спектральным плотностям fqr (λ) позволяет в той части теории, которая не связана с функциями Фг (λ), обходиться без интегралов Стилтьеса. Самым простым и наиболее важным в применениях является случай, когда законы распределения любого конечного числа величин ξΓ (t) являются гауссовскими. В этом случае величины Фг (Δ*) тоже подчиняются гауссовским законам распределения. Как раз в этих простейших и типичных для случая непрерывного спектра предположениях (применимость формул (27) и (28) и гауссовских распределений) случайные функции Фг (λ) оказываются заведомо недифферен- цируемыми и переход от формул (4) к формулам типаР(3) представляется безнадежным. На тех участках оси λ, на которых спектральная плотность /гг (λ) непрерывна и отлична от нуля, функция Фг (λ) имеет тот же характер изменения, какой имеет зависимость от времени координат частицы, подверженной броуновскому движению в случае пренебрежения силами инерции, т. е^ для малых Δ == = λ2 — λχ приращения Фг (λ) имеют порядок ~|/"Δ. Мы имеем здесь новый случай вторжения в математическую физику непрерывных, нигде недифференцируемых функций вейерштрассовского типа. Если в случае броуновского движения более тонкие рассмотрения с учетом сил инерции вновь возвращают нас к дифференцируемым функциям, то здесь недифференцируемость неразрывно связана € самой идеей непрерывного спектра. За пределами механики и физики колебаний идеи спектрального анализа статистически стационарных процессов находят себе применение (например, в метеорологии) по преимуществу в слегка отличной форме спектральной теории стационарных последовательностей. Этой теории, помимо уже цитированных работ [4, 5], посвящена книга шведского математика Германа Волда [12]. Существенные допол-
34. Статистическая теория колебаний с непрерывным спектром 307 нения к теории Волда были сделаны В. Н. Засухиным [13]. Ясное понимание того обстоятельства, что существование спектра является автоматическим следствием статистической стационарности и вовсе не обязательно указывает на реальное возникновение изучаемого процесса из наложения строго периодических компонент, имело большое значение для критической переоценки так называемой периодографии, претендовавшей на основное значение в метеорологии и даже экономике. Ставшие классическими в статистической: литературе работы в этом направлении принадлежат Ε. Ε. Слуцкому (особенно [14]). ЛИТЕРАТУРА 1. Khintchine A. Korrelationstheorie der stationaren stochastischen Prozesse.— Math. Ann., 1934, Bd. 109, H. 4, S. 604—615. Рус. пер.: УМН, 1938, вып. 5,- с. 41-51. 2. Cramer Η. On the theory of stationary random processes.— Ann. Math., 1940 r vol. 41, N 1, p. 215-230. 3. Sluisky E. Sur les functions aleatoires presque periodiques et sur la decomposition des functions aleatoires stationnaires en composantes.— Actual. sci.r 1938, N 738, p. 35—55. Рус. пер. в кн.: Слуцкий Ε. Ε. Избр. труды. Μ.: Изд-во АН СССР, 1960, с. 252—268. 4. Колмогоров А. Н. Интерполирование и экстраполирование стационарных случайных последовательностей.— Изв. АН СССР. Сер. мат., 1941, т. 5 № 1, с. 3—14. 5. Колмогоров А. Н. Стационарные последовательности в гильбертовом пространстве.— Бюл. МГУ. Математика, 1941, т. 2, № 6, с. 1—40. 6. Колмогоров А. Н. Кривые в гильбертовом пространстве, инвариантные по отношению к однопараметрической группе движений.— ДАН СССР, 1940,. т. 26, № 1, с. 6—9. 7. Колмогоров А. Я. Спираль Винера и некоторые другие интересные кривые в гильбертовом пространстве.— ДАН СССР, 1940, т. 26, № 2, с. 115—118. 8. Cramer Η. On harmonic analysis in certain functional spaces.— Ark. mat.r astron., fys. B, 1942, vol. 28, N 12, p. 1—7. 9. Loeve M. Analyse harmonique generale d'une fonction aleatoire.— С. г. Acad^ sci. Paris., 1945, vol. 220, N 12, p. 380—382. 10. Blanc-Lapierre Α., Fortet R. Sur la decomposition spectrale de fonction aleatoire stationnaire d'ordre deux.— С. г. Acad. sci. Paris, 1946, vol. 222,. N 9, p. 467—468. 11. Blanc-Lapierre Α., Fortet R. Resultats sur la decomposition spectrale des functions aleatoires stationnaires d'ordre 2.— С. г. Acad. sci. Paris, 1946r vol. 222, N 13, p. 713-714. 12. Wold H. A study in the analysis of stationary time series. Uppsala, 1938. 214 p.; 2nd ed. 1954. 236 p. 13. Засухин В. Н. К теории многомерных стационарных случайных процессов.— ДАН СССР, 1941, т. 33, № 5, с. 435-437. 14. Слуцкий Ε. Ε. Сложение случайных причин как источник циклических процессов.— Вопросы конъюнктуры, 1927, т. 3, вып. 1, с. 34—64. Доп. авт. англ. пер. см.: Econometrica, 1937, vol. 5, № 2, p. 105—146. См. также: Избр. тр. М.: Изд-во АН СССР, 1960, с. 99-132. 15. Шполъский Э. В. Атомная физика. М.; Л.: Гостехиздат, 1944. 675 с. lb. Ллеснер А. И. Спектральная теория линейных операторов.— УМН, 1941,, вып. 9, с. 3—124. *'. Ллеснер А. И., Рохлин В. А. Спектральная теория линейных операторов.— УМН, 1946, т. 1, вып. 1, с. 192—216.
308 35. О суммах случайного числа случайных слагаемых 18. Wiener N. The Fourier integral and certain of its applications. New York 1933. 201 p. Рус. пер.: Винер Н. Интеграл Фурье и некоторые его приложения. М.: Физматгиз, 1963. 256 с. 19. Wiener N. The harmonic analysis of irregular motion.— J. Math. Phvs 1926, vol. 5, p. 99—122, 158—191. 20. Колмогоров А. Н. Основные понятия теории вероятностей. М.; Л.: ОНТИ 1936. 80 с; 2-е изд. М.: Наука, 1974. 119 с. * 35 О СУММАХ СЛУЧАЙНОГО ЧИСЛА СЛУЧАЙНЫХ СЛАГАЕМЫХ* Совместно с Ю. В. Прохоровым В работах Вальда и ряда других американских авторов установлены некоторые интересные теоремы относительно сумм ζν = ξι + ξ2 + . . . + lv ν первых случайных величин из бесконечной последовательности где само число слагаемых ν есть случайная величина (см. [1—3]* где можно найти ссылки на более раннюю литературу). По методу доказательства эти теоремы восходят к работе одного из авторов настоящей заметки [4], где для оценки вероятности Ρ {max Ι εη — Αη | > h} 1<η<Ν рассматривались суммы ζν с индексом ν, равным первому номеру η·> для которого ^У~ | ζη - Ап I > h. Доказанное в [4] неравенство (см. о нем также [5, с. 154]) легко выводится из теоремы 5 настоящей заметки. Мы даем далее очень простые доказательства теорем вальдовско- го типа, относящихся к первым и вторым моментам. Условия применимости основных тождеств у нас несколько шире, чем у Вальда и Вольфовица. Достигнутое нами обобщение условий применимости этих тождеств важно для некоторых применений. Во всем дальнейшем ν будет обозначать случайную величину, способную принимать лишь целые неотрицательные значения η = 0, 1, 2, 3, . . . 'Событие, заключающееся в том, что ν = η, будет обозначаться Sn = {ν = η}, * УМН, 1949, т. 4, вып. 4, с. 168—172.
35. О суммах случайного числа случайных слагаемых 309 вероятность этого события Рп = Ρ (Snh Положим, кроме того, оо Pn=P{V = n}= 2 Рт- т—п Математические ожидания случайных величин Μ (η) = \ η dP и будут пониматься в смысле абстрактного интеграла Лебега по множеству U элементарных событий. В соответствии с этим математические ожидания, когда они существуют, всегда конечны и из существования Μ (η) вытекает существование Μ ( | η | ). Условные распределения вероятностей и условные математические ожидания понимаются в смысле, объясненном в [6]. Основное значение для всех теорем вальдовского типа имеет допущение (w) При п^> т случайная величина ξη и событие Sm независимы. В соответствии с [6] условие (w) означает, что при п^> т условное распределение ξη при условии Sm совпадает с безусловным распределением ξη: Pln{A\Sm) = Pln(A). Теорема 1. Если выполнено условие (w) и существуют математические ожидания Μ (ν) и Μ (ξ ) = α, Μ ( |ξη| ) = с, где а и с не зависят от п, то математическое ожидание ζν существует и равно Μ(ζν) = αΜ(ν). (1) Так как оо оо M(V)= Σ ΡηΠ = Σ Рп, n=l n=l то теорема 1 является очевидным следствием следующего более общего предложения: Теорема 2. Если выполнено условие (w), существуют математические ожидания м (L) = ап, м ( ι ιη ι) = cn
310 35. О суммах случайного числа случайных слагаемых и ряд ОО Σ Рпсп (I) п=1 сходится, то математическое ожидание ζν существует и равно оо м (ζν) = Σ ΡηΑη, Αη = Μ (ζη) = αι + а2 + . . . + ап. (II) п=1 Доказательство теоремы 2. В силу условия (I) ряд в правой части (II) абсолютно сходится. Применяя к нему преобразование Абеля, получим S рпАп= Σ ρη0<η· (2) n=l n=l Вспомним, что Рп = Ρ {V > 7l). Событие {ν > η) является дополнительным к событию {ν < η}, от которого в силу (w) случайная величина ξη независима. Но из независимости от некоторого события вытекает независимость от дополнительного событий. Поэтому, обозначая М(т||Л) условное математическое ожидание η при условии А, получим оо ' оо оо 2 РпАп = 2 р О > п) ап = 2 Ρ {ν > и} Μ (ξη| vn >n) = n=l n=l n=l оо оо оо = Σ S ε»<*ρ=Σ 2 S p- (3) n=l {V>n} n=l m=n Sw Так как из независимости от событий {ν ;> ?г} величины ξη вытекает независимость от этого события и величины | ξη |, то в силу (I) ОО ОО ОО ОО Г] ОО Σ Σ Ι $Εη<*ρ|<2 Σ $iSn|*p=S S Ι^μρ- n=i m=n Sm n=l m=n Sm n=l {V>n} oo = Sp{v>"}M(|Sn||vA« = n=l oo oo = 2ρ{ν>«}Μ(|ξ„|)=Σ^ν„<°°. (4) n=l n=l Конечность выражения (4) гарантирует законность следующей замены порядка суммирования: оо оо · оо m оо Σ Σ J L·dP= Σ Σ I i^p= Σ S u&. (5) m=l n=l Sm wi=l Sm
35. О суммах случайного числа случайных слагаемых 311 Так как на Sm имеет место равенство ζ™ = ζν, то со 2 Ι ζ„^Ρ = $ζν<ΖΡ = Μ(ζν). (6) По поводу последнего равенства заметим, что «необходимое событие» U является соединением событий Sm, включая S0, однако пропуск члена с т = О в левой части (6) несуществен, так как в соответствии с установившимся обычаем мы считаем сумму ζ0 пустого множества слагаемых равной тождественно нулю. Из сопоставления (3), (5) и (6) получается равенство (II), которое м требовалось доказать. При рассмотрении вторых моментов мы будем считать Ъп == (6™» Ьп) векторами с двумя компонентами ξη и ξη· Условие (w) будет теперь пониматься в том смысле, что при п^> т двумерное условное распределение вектора ζη при условии Sm совпадает с безусловным распределением того же вектора. В дополнение к (w) мы примем еще условие (z) Векторы ξχ, ξ2» ^з» · · · взаимно независимы. Зависимость между компонентами одного и того же вектора, наоборот, может быть произвольной. Далее мы рассмотрим частный случай, когда ξη = ξ*. Теорема 3. Если выполнены условия (w) и (z) и существуют математические ожидания Μ (ν'Α), Μ (Ιί), Μ {(Ιί - a1) {t - aj)} = bij; i, j = 1, 2, где аг и Ъг^ не зависят от п, то существует Μ {(ζν - να1) (ζ* - να2)} = Ь12 Μ (ν). (III) Естественно, что в (III) ζν обозначает ' ζν = & + й + . . . + lv; i = l, 2. Теорема 3 легко выводится из более общей теоремы 4, если заметить, что конечность оо оо Μ (ν·/.) = S рпп''* = 2 Рп{п>'г -(η- 1)3Л) п=1 п=1 оо равносильна сходимости ряда 2 Ρηγη- п=1 При формулировке теоремы 4 мы употребляем обозначения л i i , i , ι г Ап = аг + а2 + . . . + ап, ва = ь? + ъ? + ... + ъг1
312 35. О суммах случайного числа случайных слагаемых Теорема 4. Если выполнены условия (w) и (ζ), существуют математические ожидания Μ (&) = al Μ {{t - a*n) (& - aJn)} = b£ £,/=1,2, и ряд оо Sf./W + fW) (7) n=l сходится, то существует μ {(& _ 4) (й - Αξ)} = S р„Й2. (IV) n=l Доказательство теоремы 4. Переходя от величин ζη к величинам *ξ„ = ξη — #п> можно свести общий случай к случаю Μ (&) = 4 = 0. (8) Его мы и будем далее рассматривать. Положив Ψη = ЪгЛп + ζ>ηζη-1 + Snbn-l» (9) имеем тождественно In = ίηίΐ = <Pl + Ψ2 + · · · + φη· (10) Из (8), (9) и независимости ξη от ζη_χ (которая вытекает из условия (z)) получаем Μ (φη) = Μ (££) = bf, M (χη) = Bf. (11) Подлежащее же доказательству равенство (IV) при условии (8) переходит в оо Μ(χν)=Σρ»#8. (12) 71=1 Сравнивая (10), (И) и (12) с формулировкой теоремы 2, мы видим, что (12) есть не что иное, как равенство (II), примененное к суммам %ν = φι + ψ2 + · · · + Φν-Ϊ Остается проверить, выполнены ли условия теоремы 2. Специальных вычислений требует лишь проверка условия (I), которое в применении к суммам χν пишется в виде оо Σ Л/Л(|<Р„|)0· (13)
36. Локальная предельная теорема 313 При помощи неравенства Буняковского получаем из (9) для Μ (| φη I) оценку Μ (Ι φη I) <M(| fnfn |) + M (I a£!L-i|)< < У#Ж + УьЖ + УЬ*Ж<2 (УьЖ +}/ ьЖ). (14) Сопоставляя (7) и (14), убеждаемся в том, что требование (13) выполнено, чем и заканчивается доказательство теоремы 4. В частном случае ζη = ζη можно, отказавшись от векторных обозначений, писать ζη = ζη = ζηι An = а1 + α2 + · · · + dm Вп = δι + b2 + ... + К- Тогда из теоремы 4 получается Теорема 5. Если для последовательности случайных величин ξη выполнены условия (w) и (ζ), существуют математические ожида- оо ния Μ (ξη) = αη, Μ (ξΛ — αη)2 = Ьп и ряд 2 PnYbnBn сходится, η=1 mo существует Μ(ζν-Λν)2=§ ρηβ„. (V) η=1 ЛИТЕРАТУРА 1. H^Zd Л. On cumulative sums of random variables.— Ann. Math. Statist., 1944, vol. 15, p. 283-296. 2. Walk A. Differentiation under the expectation sign of the fundamental identity in sequential analysis.— Ann. Math. Statist., 1946, vol. 17. 3. Wolfowitz /. The efficiency of sequential estimates and Wald's equation for sequential processes.—Ann. Math. Statist., 1947, vol. 18, p. 215—2 31. 4. Kolmogoroff A. N. Ueber die Summen durch den Zufall bestimmter unab- hangiger Grossen.— Math. Ann., 1928, Bd. 99, S. 309—319. 5. Бернштейн С. Н. Теория вероятностей. 4-е изд. М.; Л.: ГТТИ, 1946. 6. Колмогоров А. Н. Основные понятия теории вероятностей. М.; Л.: ОНТИ, 1936. 36 ЛОКАЛЬНАЯ ПРЕДЕЛЬНАЯ ТЕОРЕМА ДЛЯ КЛАССИЧЕСКИХ ЦЕПЕЙ МАРКОВА* В работе проводится исследование предельных распределений числа попаданий в различные состояния для цепи Маркова с постоянной матрицей вероятностей перехода. * Изв. АН СССР. Сер. мат., 1949, т. 13, с. 281—300.
314 36. Локальная предельная теорема § 1 ПОСТАНОВКА ЗАДАЧИ И ОБЗОР РЕЗУЛЬТАТОВ Мы будем рассматривать классическую цепь Маркова, т. е. марковский случайный процесс с дискретным временем, конечным числом s ^> 1 состояний и неизменными вероятностями перехода ή = Ρ{β(ί + 1) = βρ|β(ί) =еа} (1.1) из состояния ε (t) = еа в момент времени t в состояние ε (t -j- 1) = е$ в момент времени t + 1. Естественно, что при этом .будут предполагаться выполненными обычные условия р£>о, 2p£=i. (1.2) (5 Если считать состояния еа единичными векторами в1 = (1,0, . . .,0), в2 = (0, 1, ...,0), (1.3) es = (0,0,. . .,1) 5-мерного координатного векторного пространства, то компоненты μ1, μ2, . . ., μ8 вектора μ(ί) = ε(1) + ε(2) + ., . + ε(ί) (1.4) будут равны числу попаданий соответственно в состояния е\ч e2i · · ··> es в моменты времени *' = 1,2, . . .,*. Таких векторных представлений мы будем придерживаться далее. При t = 0 будем считать μ (t) равным нулевому вектору μ.(0) = 0 = (0,0, ...,0). О^ (1.5) Возможными частными значениями вектора μ (t) являются исключительно векторы т = (т1, т2, . . ., т8) с целочисленными компонен тами, удовлетворяющими условию m = ^mP = t. (1.6) β Для любого целочисленного вектора т с т > 0 мы положим Wa (т) = Ρ {μ (т) = т | ε (0) = еа}. (1.7)
36. Локальная предельная теорема 315 Таким образом, функция Wa (m) от векторного аргумента т содержит в себе условные распределения при ε (0) = еа всех векторов μ (£) для t = 1, 2, 3, . . . Это возможно потому, что в силу соотношения Ρ(<) = Σμρ(ί) = ί (1-8) β распределения эти по существу не более чем (s — 1)-мерны. Естественно, что сумма вероятностей Wa (m), относящихся к одной и той же величине μ (t), равна единице: JiWa(m) = i. (1.9) В существенном все дальнейшее исследование будет посвящено выяснению предельного поведения вероятностей Wa {пг) при Ш ->■ сх>. К этой задаче сводится без труда исследование предельных распределений сумм случайных величин, «связанных в цепь» (по терминологии А. А. Маркова). Основным заслуживающим внимания случаем является тот, когда все состояния еа образуют в терминологии [1] один класс, т. е. когда выполнено условие (А) Для любых двух состояний еа и е$ существует последовательность состояний (еа, eVl, еУ2, . . ., еУк, е$), вдоль которой все вероятности перехода р%, ру\, . . ., Py%_v Pyk положительны. Самый общий случай может быть редуцирован к случаю (А). Это сделано в § 7. Следующие далее леммы 1—3 верны лишь при условии (А). При их формулировке мы будем обозначать знаком Ма условные математические ожидания при гипотезе ε (0) = еа. Доказательство этих лемм можно найти в [1—3]. Леммы 2 и 3, впрочем, заново доказываются в § 2 этой работы. Лемма 1. Система уравнений Σ^ = ?» (P = l, 2.....S), ?=2<7а=1 (1.10) а а имеет единственное решение. Лемма 2. При /->оо Л? (t) = Μγμ<* (t) = f?« 4- О (1). (1.11) Лемма 3. Вторые моменты Bf (t) Ξ Μν {(μ« (<)-4?(ί))(μΡ {t)-A\(t))} (1.12) при t -*- οο имеют вид Bf (t) = tifi» + О (1), (1.13) где постоянные Ь°# определяются исключительно матрицей исход· них вероятностей ра.
316 36. Локальная предельная теорема Из общих свойств вторых моментов любой системы случайных величин вытекает, что матрица || Ьа$ || симметрична, а сопутствующая квадратичная форма Ь(х)=%Ь^хах$ (1.14) α, β неотрицательна. Из тождества (1.8) легко далее вывести, что 2&αΎ = Σ^ = 0. (1.15) У Υ Из (1.15) вытекает, что Ъ(х) = Ъ(х — х). (1.16) Поэтому форму Ъ (х) достаточно рассматривать в (s — 1)-мерном пространстве N векторов χ с χ = 0. (1.17) Общим «невырожденным» случаем для нашей задачи естественно считать случай, когда (В) Форма Ъ (х) положительна в пространстве N векторов х> для которых χ = 0. В силу (1.15) определитель формы Ъ (х) всегда равен нулю: Ьа& 0, а все главные миноры матрицы Ъ<*Ъ\ равны друг другу: ж11 Δοο = = Аяя = Δ. (1.18) (1.19) Из неотрицательности Ъ (х) вытекает, конечно, что всегда Δ > 0; (1.20) условие же (В) равносильно требованию Δ>0. (1.21) При условии (В) форма Ъ (х) имеет в пространстве N обратную форму с(х), которую можно записать, например, в виде Ь11 Ь12 с(*) = —"Г Ь21 ^22 Ь1»5"Х J2,s-1 fcs-1, 1 &S-1, 2 X* frs-1, s-1 xs-l xs-i 0 (1.22) или аналогичным образом, выделив вместо индекса s — 1 какой- либо другой индекс γ.
36. Локальная предельная теорема 31? Положив ρ (χ) = - 1 e-f/.c<*)f (1.23) Ш = Ш-*9)/У~Ь (1.24) мы можем формулировать «невырожденную» интегральную предельную теорему. Теорема 1. При условиях (А) и (В) для любого γ ц любой квадрируемой области G пространства N при t ->■ оо P{g(OeC|e(0) = eY}-*$p(*)uef (1.25) G где ώ = jAscfo^cfcg . · · dxs-x (1.26) обозначает объем в пространстве N. Эта теорема доказана в § 4. Однако, чтобы сформулировать наиболее простую локальную предельную теорему, мы должны еще произвести некоторый дополнительный анализ возможных направлений перехода из состояния в состояние. Будем называть цепочкой последовательность состояний (eYo» еУп · ·. ·' вук'' (1.27) для которой все вероятности перехода Ύι Ύ2 Υ» ^к Ру»1 Pyti Рун · · ·» РУк-! положительны. Цепочку (1.27) будем называть циклом, если То = V*· (1-28) Назовем, далее, 5-мерный вектор ζ циклическим, если существует такой цикл (1.27), что ζ = eyt + еъ + . . . + еУг (1.29) Назовем, наконец, основной решеткой множество всех векторов тг представимых в виде т = αχζχ + α2ζ2 + . . . + αηζη, (1.30) где ζ1, ζ2, . . ., ζη — циклические векторы, а αχ, α2, . . ., αη — произвольные целые числа (число слагаемых η тоже произвольно). Основную решетку будем обозначать через Ζ. Очевидно, что Ζ состоит исключительно из векторов с целочисленными компонентами и образует группу относительно сложения. Нужное нам дополнительное условие формулируется теперь так:
318 36. Локальная предельная теорема (С) Основная решетка Ζ совпадает с множеством Q всех целочисленных векторов s-мерного векторного координатного пространства. Из результатов § 6 и 7 вытекает, что совокупность условий (А) и (С) необходима для того, чтобы предельное поведение вероятностей Wy [m) не зависело, от индексов γ. Таким образом, случай соблюдения обоих этих условий является единственным, в котором можно рассчитывать на получение идеально простой по формулировке локальной предельной теоремы. Это заставляет считать в известном смысле вполне окончательными результаты § 3 и 5: Следствие 3 леммы 10 (§3). Из условий (А) и (С) вытекает условие (В). Теорема 3(§ 5). Если г выполнены условия (А) и (С), то при Ш -»■ оо независимо от выбора индексов γ Wy(m)~ r 1 g-y*.<«>t (1.31) где χ = (т — frig)/γ Ш. (1.32) Представляется крайне интересным вопрос, на" который мы не имеем пока ответа: не являются ли в предположении, что условие (А) выполнено, условия (В) и (С) равносильными? Если бы ответ на этот вопрос был положительным, то условия применимости локальной теоремы 3 и приведенной выше интегральной теоремы совпадали бы 2. В § 6 полностью разобраны осложнения, возникающие при сохранении условия (А) от нарушения условия (С). Как уже упоминалось выше, в § 7 рассмотрен случай нарушения условия (А). Формулировки результатов этих параграфов несколько сложнее, однако 1 В формуле (1.31) в отличие от (1.23) нет множителя s под знаком корня, так как в (s — 1)-мерном пространстве векторов т с заданным ΐη (напри- .мер, в пространстве N) целочисленные точки распределены с плотностью l/\fs. Заметим еще, что в самом тексте § 5 формулировка теоремы 3 отличается от приведенной здесь более точным указанием характера приближения вероятностей Wy (m) к их асимптотическому выражению. 2 Пусть L есть линейное замыкание основной решетки Z, т. е. множество всех векторов, представимых через циклические в виде (1.30) с произвольными действительными коэффициентами %. В § 3 (см. следствие 2 леммы 10) доказано, что при условии (А) требование (В) равносильно требованию (B'WlpocTpaHCTBo L совпадает со всем 5-мерным векторным пространством R· Остающийся нерешенным вопрос о равносильности (В) и (С) был бы решен, если бы было показано, что (*) При условии (А) основная решетка Ζ всегда совпадает с множеством всех целочисленных точек из L. Весьма вероятно, что предложение (*) верно. Если бы оно было доказано, то это привело бы и к некоторому усовершенствованию результатов § 6. Позднее предложение (*) было доказано Розенкнопом в Москве и Чуланов- «ским в Ленинграде.
36. Локальная предельная теорема 319 вопрос о предельном поведении вероятностей Wy (m) по существу разрешен в них в самом общем случае с той же полнотой, как и для случая соблюдения условий (А) и (С). § 2 МЕТОД ДЕБЛИНА Локальные теоремы, составляющие основное содержание настоящей1^ аботы, будут получены в § 5 и 6 при помощи некоторого усиления метода, который был развит Деблином для доказательства интегральной предельной теоремы в случае бесконечного числа состояний [4]. Для того чтобы сделать ясным развитие метода, мы выделяем в этом параграфе краткое изложение метода Деблина в той его* первоначальной форме, в которой он годен лишь для доказательства интегральных теорем. Изложение в этом параграфе будет кратким, так как излагаемые здесь результаты можно считать в существенном известными. Условие (А) здесь, как и в § 3 —6, будет предполагаться выполненным без особых о том упоминаний. Кроме того, во всем этом параграфе индекс γ будет считаться фиксированным и будет предположено, что ε (0) = еу. (2.1) Условные вероятности и математические ожидания при этой гипотезе будут обозначаться через Ρ {А | ε (0) - еу} = Ру (Α), Μ {ξ | ε (0) = еу) = Μ, (Ε). Пусть 0 = τ (0)< τ (1)< τ (2)< . . . < τ (η)< . . . — последовательность всех тех моментов времени t, в которые наблюдается состояние еу. Будем обозначать при η ^> 1 δ (η) = μ (τ (η)) -μ (τ (η- 1)), (2.2> λ (л) = δ (1) + δ (2) + . . . + δ (л) = μ (τ (τι)). (2.3) При η ~ 0 положим λ(0)·=0. (2.4) Компоненты δα (η) вектора δ (η) обозначают число попаданий в состояние еа в моменты времени t, удовлетворяющие неравенствам τ {η — 1) < t < τ (τι), т. е. между (η — 1)-м и тг-м возвращением в исходное состояние еу (включая самый момент тг-ro возвращения). Очевидно, что всегда δν (η) = 1, (2.5> а для сумм λ (η) λγ(") - л. (2.6)
320 36, Локальная предельная теорема В основе метода Деблина лежит простое замечание: случайные векторы δ (?г) взаимно независимы и одинаково распределены. Благодаря этому обстоятельству к суммам λ (η) можно применять предельные теоремы, установленные для сумм независимых слагаемых. Соотношение же (2.3) позволяет переходить от сумм λ {η) к суммам μ (t). Мы изложим далее два варианта этого перехода: один опирается на лемму 6 и дает наиболее точные результаты при оценке вторых моментов; By (t), второй опирается на лемму 7 и удобен при вы· воде интегральных предельных теорем. В [1] доказана Лемма 4. Величины δα (η) имеют конечные математические ожидания а* = Μγδα (η) = q<*/qv. (2.7) В силу независимости слагаемых δ (η) Μγλα (η) = nay, (2.8) >а в силу тождества τ (η) = λ (η) (2.9) тз (2.7) и (2.8) получается /VV(rc) = JLjry=.IL. (2.10) Методами [1] легко доказывается Лемма 5. Существуют такие постоянные С и D ^> 0, что при .любом к для δ (η) = τ (η) — τ (η — 1) выполняется неравенство Ρ {δ {η) > к} < Се"™. (2.11) Из леммы 5 вытекает Следствие. Вторые моменты bf = Μγ {(δ<* {η) - α?) (δΡ {η) - αξ)} (2.12) конечны. Подобно (2.8) для вторых моментов λα (η) получаем Μγ{(λ<*(η) — nay){№(n)--na?y)} = nbf. (2.13) Пусть xt обозначает наименьшее из чисел τ (η), которое ^ t, a ν (t) — соответствующий номер п. Положив vt λ (t) = λ (ν,) = μ (τ,) = 2 δ (η), (2.14) жюлучим λΐ = ν„ (2.15) λ, = τ,. (2.16)
36. Локальная предельная теорема 321 Вполне аналогично лемме 5 доказывается Лемма 6. Существуют такие постоянные С и D ^> 0t что при любом к выполняется неравенство Ργ {| Ъ - t | > &}< Cer*D. (2.17) Так как всегда |μ«(*)-μ«(0 ΚΙί-ί' !, (2.18) то из (2.17) вытекает, что Ργ{|λ? —ц«(<)|>*><Се-м>. (2.19) К суммам со случайным индексом ν< vt λ,= Σ β(») η=1 применимы известные тождества В а льда (об условиях их применимости см. [5]), в силу которых справедливы соотношения Μγλ? = α?Μγ(ν,), (2.20) Μν {(λ? — vf α?) (λ? - ν,αξ)} = bf Μγ (ν,). (2.21) Из (2.16) и (2.20) получаем Μγτ< = Μγ (V() £ α? = -^-. (2.22) α В силу леммы б при t ->■ оо Μγτ, = ί + О (1). (2.23) Из (2.22) и (2.20) получаем поэтому, что при Μγν, = qvt + О (1), (2.24) Μγλ? = qf + О (1). (2.25) Неравенство (2.19) позволяет из (2.25) извлечь Μγμα (t) = q4 + 0 (1). (2.26) Мы получаем новое доказательство леммы 2, сформулированной в § 1. Заметив, что тождественно λ? - τί?«=(λ? - ν,α?) - <Г Σ (λ?- ν, ανΦ). (2·27) φ получаем далее при помощи (2.21) Μν{(λ?-τί3«)(λ?-τ#)} = = Mv (V/) [6f - 2 (gPJ?» + g«bf) + Σ «V*?*] · (2·28) φ Φ, Ψ
322 36. Локальная предельная теорема Лемма 6 позволяет в (2.28) при £-*- οσ с точностью до О (1) заменить левую часть равенства на Bf(t) = My{№(t) - 4«(*))(|*(<)-4?('))> (1.12) Вместе с (2.24) это приводит к формулам Bf (t) = № + О (1), (1.13) где δ«β = gv [bf - 2 (g&C + q«bf) + S д«дР6?*]. (2.29) Φ φ» Ψ Мы доказали, таким образом, лемму 3 из § 1, выяснив дополнительно связь коэффициентов Ьа& с моментами Ьу^ (содержащееся в лемме 3 утверждение о независимости Ъа§ от индекса γ надо доказать отдельно, но это в силу принятого нами условия (А) не представляет затруднений). Отметим здесь, хотя оно и не понадобится нам далее, обращение s формул (2.29): bf = -1 (6*3 - a?bvf> - afyw + α?αξδνγ). - (2.30) Введем в рассмотрение векторы г 71 r\{n)=Y lL[%{n)-l{n)q\=-^=^(k), (2.31) где Δ (η) = Ϋψ [δ (η) - δ (τι) q]. (2.32) При помощи (2.7), (2.12) и (2.29) получим ΜγΔα (η) ■= Μνη«(Λ) = 0, (2.33) ΜγΔα (η)Δ? (η) = Μγη<* (η) ηΡ (η) = &«&. (2.34) Так как Δ (η) независимы и одинаково распределены, то в силу (2.33) и (2.34) векторы η (η) в пределе при η -> оо подчиняются гаус- совскому распределению, соответствующему матрице вторых моментов || Ъа$ ||. Применяя к суммам ΣΔ(Λ) известное усиление неравенства Чебышева (см. [2, с. 154]), легко доказать такое предложение. s (2.30) можно доказать непосредственно аналогично приведенному в тексте доказательству (2.29), исходя вместо (2.27) из тождества λ? - ν, .« = (λ? - tf),- α« (λ?- *«*), которое очевидно в силу (2.15).
36, Локальная предельная теорема 323 Лемма. Если при η -> оо случайная величина vm принимающая только натуральные значения, удовлетворяет условию | Vn — л |< СУп, где £ — некоторая постоянная^ то при любом h ^> О Ργ{|η(νη)-η(Λ) 1>М-*0, (2.35) когда п-> оо. Для перехода от векторов η (ft) к векторам l (t) = (μ (t) - tq)/YJ, (1.24) введенным в § 1, служит теперь Лемма 7. Если щ есть целая часть от tqy, то при любом Я>0 Py{\l{t)-i\(nt)\>H}-+0, (2.36) когда t —>- оо. При доказательстве леммы 7 можно совершить переход от ξ (£) к η (t) через посредство векторов ξ (τ<) и η(ν<) = /^7νΓξ(τί). (2.37) Для оценки vt следует при этом использовать соотношение MY (V| — xtqyf = bm + О (1), (2.38) которое получается из (2.24) и (2.28), если в (2.28) положить а = В силу леммы 6 из (2.28) вытекает, что при достаточно больших С и t вероятность ру{\ъ — ъ\>СУщ) делается сколь угодно малой. Это позволяет применить соотношение (2.35), положив в нем h = г/3Н, и написать ру ί Ι η (νι) ~ η (щ) I > У3Щ -+ О при t -> оо. (2.39) Из леммы 6, (2.38), определения щ и (2.37) вытекает, что Ру (Ι £ (τι) ~ η (ν,) Ι > V3#} -* 0 при t -> оо. (2.40) Наконец, в силу леммы б ρν ί I 6 W - 6 Ы i > Ч*В} -^ 0 при t -+ оо, (2.41) Соединяя (2.39)—(2.41), получаем (2.36). Применение леммы 7 к выводу интегральных предельных теорем бУДет изложено в § 4.
324 36. Локальная предельная теорема И?(0) = {| § з ЦИКЛИЧЕСКИЕ ВЕКТОРЫ И ОСНОВНАЯ РЕШЕТКА Кроме вероятностей Wy (m), нам понадобятся еще вероятности Wy{m)==Py{\b{m) = m, e(m) = ea}. (3.1) W% (т) есть условная вероятность при гипотезе ε (0) = еу совмеще- ния двух событий: 1) в моменты времени t = 1, 2, . . ., Ш попасть по т$ раз соответственно в состояния е§х (β = 1, 2, . . ., s) и 2) в заключительный момент t = Ш попасть в состояние еа. Для нулевого вектора т = 0 положим 1 при V = a, (3.2) 0 при у Φ α. ; Очевидно, что вероятности Ρ7Υ (га) выражаются через вероятности W% (m) по формуле Wy{m) = 2iW%(m). (3.3) a Специальный интерес имеют вероятности Wy (m) с совпадающими верхним и нижним индексами. Через них можно выразить распределения вероятностей векторов λ (га), рассмотренных в предыдущем параграфе: Ργ {χ (ту) = т) = WI (т). (3.4) Так как всегда λΥ (η) = л, (3.5) то распределение λ {η) при гипотезе ε (0) = еу полностью определяется значениями W% (т) с т^ = η и при любом η ^> 0 2 ту?н=1. (3.6) τηΎ=η Очевидно, что для любого циклического вектора ζ, для которого zy > 0, имеет место неравенство W? (2) > 0. (3.7) Легко видеть, что и обратно: если при каком-либо γ имеет место неравенство (3.7), то вектор ζ циклический 4. Особое значение имеют для нас циклические векторы с zy = 1* Они и только они являются значениями векторов δ (η), которые (естественно, при гипотезе ε (0) = еа) имеют положительную вероятность. К ним относится 4 Отметим еще здесь, хотя оно нам и не понадобится, любопытное тождество *РИ£ (*) = z«Wl (ζ).
36. Локальная предельная теорема 325 Лемма 8. Минимальная аддитивная группа векторов, содержащая все циклические векторы с zy = 1, совпадает со всей основной решеткой Z. Для доказательства леммы достаточно установить, что любой циклический вектор ζ может быть представлен в виде линейной комбинации с целыми коэффициентами циклических векторов ζ с zy = 1. С этой целью рассмотрим три случая: 1) если zy = 1, то наше утверждение уже доказано; 2) если zy > 1, то порождающий вектор ζ цикл можно разбить на zy циклов от попадания в еу до ближайшего (вдоль по циклу) следующего попадания в еу и вектор ζ представится в виде Ζ = Ζχ + Ζ2 + . . . + Zzy, где векторы z^ соответствуют частным циклам; 3) если zy = 0, т. е. порождающий ζ цикл (eYo» eYi> · · ·> еУо) совсем не содержит еу, то в силу допущения (А) можно найти цепочки (еу, βαι, *?а2, ..., ещу еУо), (еУо, ePl> e^ ..., e3j, ey). Можно выбрать эти цепочки так, чтобы они содержали еу, только первая — в виде первого элемента, а вторая — в виде последнего.; Тогда цепочки (eYo> eYi> · · "> ^Υο» ^βι> ' · ·» е$р еУ> e(Xi> · · ·> еЩ* eyQ)j \^Yo> ebxi * · ·» ^3j> ^Y» £<Χι> · · ·» ^α^ι ^Υο) будут циклами, а для соответствующих им циклических векторов ζ± и ζ2 получим *1 — ζ2 = ζ, ζ[ = 1, 4 = 1. Доказательство леммы, таким образом, закончено. Обозначим через β минимальное линейное подпространство 5-мерного векторного пространства, содержащее все циклические векторы (а следовательно, и всю основную решетку Ζ). Размерность г этого пространства будем называть рангом рассматриваемой цепи Маркова. Пересечение £ с (s -— 1)-мерным пространством N векторов χ с £ = 0 обозначим через £0. Так как £ заведомо не содержится в N (существуют циклические векторы ζ с ζ > 0), то размерность β равна г — 1. Лемма 9. Пространство £ совпадает с линейной оболочкой значений векторов δ (η), имеющих (при гипотезе ε (0) = еу) положительную вероятность, а пространство £0 — с такого же рода
326 36. Локальная предельная теорема линейной оболочкой возможных значений векторов Δ (η) = YJy [δ (η) - δ (η) q]. (2.32) Первая часть леммы 9 непосредственно вытекает из леммы 8. Доказательство второй части можно осуществить так: 1. Из леммы 4 и первой части леммы 9 вытекает, что вектор q принадлежит пространству £. , 2. Легко проверить, что Δ (η) = 0. Поэтому возможные значения Δ (η) входят в £. 3. Так как возможные значения в(и) = -1=.А(*) + 3(Л)'д У г порождают все пространство £, получающееся присоединением к £0 не лежащего в £0 вектора q, то возможные значения Δ (η) порождают все пространство Q0. Так как ΜνΔ (η) = 0, (2,33) ΜνΔα {η) Δβ (η) = 6°*, (2.34) то из леммы 9 почти непосредственно вытекает Л е м м а 10. ί "> 0 для χ ΕΞ So* Ь(х) η я о (3·8) (= (J для х, ортогональных к So· Лемма 10 приводит нас к следующим выводам (некоторые из них уже упоминались в § 1): Следствие 1. Ранг матрицы || Ъа$ || равен г — 1. Следствие 2. Условие (В) равносильно условию (Βχ) г = s. Следствие 3. ifs условия (С) вытекает условие (В). В заключение этого параграфа мы покажем, что определение основной решетки Ζ и проверка условия (С) являются чисто арифметическими задачами, допускающими простое алгоритмическое решение. Легко видеть, что при определении циклов достаточно рассматривать вместо матрицы || ра || матрицу || Θ& ||, где θ,= ιΐπρ„Ρ5>ο, [0 при ра = 0. Последойательность (еУо, еъ, ..., #Yft_lf £γ#)
36. Локальная предельная теорема 327 будет циклом в том и только в том случае, если nVi flVa — βΥο Λ (a ίο) Цикл будем называть простым, если он содержит каждое состояние не более одного раза. Соответствующие простым циклам простые циклические векторы характеризуются тем, что для них всё компоненты не превосходят единицы: 2а<1. (3.11) Так как простых циклов конечное число и все они могут быть легко найдены, то следующая лемма делает определение основной решетки вполне эффективным. Лемма 11. Все векторы т из Ζ представимы в виде (1.30) с простыми циклическими векторами ζ\. Для доказательства достаточно заметить, что любой цикл, в котором какое-либо состояние встречается более одного раза, может быть разбит на два цикла. Повторяя такое разбиение, можно любой цикл разбить на простые циклы. Пусть /l» /2i · · ·» fh есть система всех простых циклических векторов. Из сказанного выше непосредственно вытекает Лемма 12. Решетка Ζ есть минимальная аддитивная группа, порождаемая векторами Д, /2, . . ., Д, а пространство β есть линейное замыкание этой системы векторов. Ранг г марковского процесса равен рангу матрицы \\т а условие (С) равносильно условию (Cj) Ранг матрицы || /g || равен s, а оСщий наибольший делитель определителей s-го порядка, которые можно образовать из ее строк (fgi fgj · · ., fg), равен единице. Пример . Пусть s = 5 и 0 10 11 1 0 0 1 1* Легко проверить, что простые цгклы здесь имеются только из трех или четырех состояний. Вот полная их таблица: (*ι. Ч, е5, ег), U = (11100) (*ь *в. е3, ег) /2 = (10101)
328 36. Локальная предельная теорема h h h h h = 1 1 0 0 0 1 0 1 0 1 1 1 1 1 1 0 0 1 1 1 0 1 0 1 1 (β„ β«, e4, <?3) /з = (OHIO) (β„ β4, еь, e3) /4 = (00111) (ex, e4t e„ e„ <?ι) /, = (11110) (elt е., β„ β„ βϊ) /β = (10111) (βι, β», ej, β„ <?!)* /7 = (11101) * (e3, β», β4, β6, «a) * Η = (ОНИ) * Справа приведены соответствующие циклам векторы fg. Так как определитель = -1, то г = 5 и условие (С) выполнено. Если в матрице || θα || этого примера θ§ = 1 заменить на Θ5 = 0t то из простых циклов fg сохранятся только первые шесть и можно будет подсчитать, что ранг понизится до г = 4. § 4 ИНТЕГРАЛЬНЫЕ ПРЕДЕЛЬНЫЕ ТЕОРЕМЫ В силу леммы 10 распределение векторов Δ (η) и η (ή) полностью сосредоточено на пространстве £. Так как форма Ъ (х) на этом пространстве положительна, то при η —>· оо в пределе η (η) подчиняется соответствующему форме Ъ(х) невырожденному на £0 гауссовскому распределению. Плотность вероятности этого гауссовского распределения мы обозначим через р(х). В силу леммы 7 из сказанного вытекает Теорема 2. При условии (А) для любого γ и любой области в пространстве G, у которой пересечение границы с пространством S0 имеет в £0 меру нуль, при t -> 00 Pv{S(0eC>-* 5 p(x)dx, (4.1) GD£0 где dx — элемент объема б S0. В частном случае соблюдения условия (В) пространство £0 совпадает с N и из теоремы 2 получается теорема 1, сформулированная в § 1.
36. Локальная предельная теорема 329 § 5 ОСНОВНОЕ ТОЖДЕСТВО И ЛОКАЛЬНАЯ ПРЕДЕЛЬНАЯ ТЕОРЕМА В НЕВЫРОЖДЕННОМ СЛУЧАЕ Видоизменение метода Деблина, позволяющее сводить локальные предельные теоремы для цепей Маркова к локальным предельным теоремам для независимых слагаемых, основано на следующем тождестве: Wy(m)= S W](m — l)Wy(l). (5.1) ιγ=ο Суммирование в правой части распространяется на все целочисленные векторы I с неотрицательными компонентами, удовлетворяющими условиям Ζα < ma, (5.2) Ρ = 0. (5.3) Тождество (5.1) с вероятностной точки зрения очевидно. Легко подсчитать, что сумма вероятностей Wy (l) по всем векторам Z, удовлетворяющим условию (5.3), равна £ Wy(l) = My6(n)=±. (5.4) При дополнительном ограничении (5.2) эта сумма может сделаться несколько меньше, но в силу абсолютной сходимости ряда (5.4) такая урезанная сумма стремится к l/gY, когда все пга неограниченно возрастают. Если выполнены условия (А) и (С), то в силу леммы 8 минимальная аддитивная группа, порождаемая имеющими положительную вероятность (при гипотезе ε (0) = еу) значениями векторов δ (га), состоит при любом γ из всех целочисленных векторов. Что касается разностей возможных с положительной вероятностью значений векторов δ (га), то для них всегда ту = 0 (так как для самих возможных значений δ (га) всегда ту = 1), т. е. они содержатся в группе vy всех целочисленных векторов т с ту = 0. Легко видеть, что на самом деле они порождают всю эту группу: если бы векторы mi — т0, т2 — т0,.. ., тк — т0, . . ., гДе т0, щъ . . ., т^, . . .— все возможные значения δ (га), порождали не всю группу Qy, а лишь ее собственную подгруппу, то после присоединения одного вектора т0 они не могли бы породить всю гРУппу QJ между тем группа, порождаемая векторами иг, о» тг — 7п0, т2 — т0, . . .а тк — т0,
330 36. Локальная предельная теорема очевидно, совпадает с группой, порождаемой векторами TTio, ТПЪ ГП2, . . ., /ttfr, ...» т. е. в силу допущения (С) с полной группой целочисленных векторов Q. В силу сказанного имеет место Лемма 13. При условиях (А) и (С) минимальная группа, порождаемая разностями возможных значений векторов δ (η), совпадает с группой Qy всех целочисленных векторов т с ту = 0. Из леммы 4, следствия из леммы 5 и леммы 13 при помощи локальной предельной теоремы [6], примененной к суммам λ (л) = 6(1)+ 6 (2) + . . . +6 (л), получается Лемма 14. Если выполнены условия (А) и (С), то при ту ->- оо (7ΛΥ)<«-ΐ)Λ^ (т) = ρν (у) + о (1), (5.5) где ' 9=^^, , - (5.6) Ру (у) — гауссовская плотность вероятностей в пространстве Qy, соответствующая нулевым средним значениям и матрице дисперсий | by ||, а оценка остаточного члена действует равномерно при \та — тУд<*/дч | < С У~тУ (5.7) с любым фиксированным С. . Если обратить внимание на то, что при условии (5.7) и тУ —>оо то (5.5) можно записать в виде (mf^W^(m)=:(gyfS~py(y) + o(l). (5.8) Эту оценку следует теперь применить к Wy (т — I) в формуле (5.1)# Т$к как в силу сходимости ряда (5.4) в правой части (5.1) можно щщ Ш -> оо ограничиться членами, для которых отношения (τηα -ν la)/ma сколь угодно близки к единице, то из (5.1), (5.4) и (5.8) получаем при т ->- оо '^mfrWy (m) = (ff T> (у) + о(1), (5.9) где ограничение (5.7) можно заменить ограничением | m« _ m<f. |< С Ум. · (5.10)
36. Локальная предельная теорема 331 Так как при m ->- оо и ограничении (5:10) У ж Vtf4* - xvq/qv), (5.12) то (5.9) можно переписать в виде rn^Wy (m) = (pyf ~pv [f φ (х- хУд/дУ)] + о (1). (5.13) формула (5.13) действует равномерно при ограничении (5.10). Этого достаточно, чтобы из сопоставления с интегральной теоремой 1 получить 5 Рч [У^ (* - *W)] = V~SP (*)* (5.14) Окончательно результат проведенных в этом параграфе рздсуж- дений формулируется так: Теорема 3ι Если выполнены условия (А) и (С), то при Шг-* оо> для любого γι (m)(s-»/*Wy (m) = Y~sp (χ) + о (1) (5.15) равномерно при условии (5.10). § 6 СЛУЧАЙ НАРУШЕНИЯ УСЛОВИЯ (С) В этом параграфе мы сохраняем условие (А), но отбрасываем условие (С). Так как теперь основная решетка Ζ не совпадает с полнрй решеткой Q всех целочисленных векторов, то естественно рассмотреть вычеты Q по Ζ. Более подробно это означает следующее. Два" вектора тх и т2 будем считать.сравнимыми по модулю Ζ, если Щг — m2^Z. (6.1) Все векторы с целочисленными компонентами разбиваются на классы векторов, сравнимых по модулю Z. Эти .классы и будут вычетами по Z. ' ' Лемма 15. Векторы т, для которых при фиксированных! а и β Wi(m)>0, ν , (6.3h сравнимы между собой по модулю Z. Можно высказать лемму 15 и так: 5 Равенство (5.13) можно, конечно, доказать непосредственно из соотношений между моментами Ь^ и Ъа$. Тогда доказательство формулируемой ниже лоте кальной теоремы 3 сделалось бы независимым от, интегральных теорем. Такое более последовательное с алгебраической стороны изложение было бы, однако, несколько громоздко. Множитель ]fs в (5.14), как уже было указано в § 1,- связан с тем, что Целочисленные1 Точки в iV расположены ύ пло^нос^ьй1!/]/^.
332 36. Локальная предельная теорема Лемма 15'. Все векторы т, для которых имеет место неравенство (6.2), входят в один и тот же вычет по модулю Z. Вычет этот мы будем обозначать через /?&. Для доказательства леммы 15 допустим, что Wa (тг) ^> 0 и Wa (m2) ]> 0. Тогда существуют цепочки (#αι £фх1 ^φ2> · · ·» eq>i = е$)ч \eai £ψ1? £ψ2? · · ·> £ψ.= £β)» для которых *Φι + еФа + · * · + *<Pj = ^ь **ι + е% + · · · + % = т* · В силу условия (А) существует цепочка е$, е%1, егг, . . ., е%к = = еа. Легко видеть, что (^а> ^фх> ^φ2> · · ·> e^i = е§ч e%xi ex2i · · ·> е%К = eah \eai е\ч ety2i · · ·> etyj = е$* е%1ч е%2' ' ' *' вЦ ~ в°^ суть циклы. Соответствующие циклические векторы обозначим через гх и ζ2. Так как тг — т2 = ζλ — z2 ΕΞ Ζ, то лемма доказана. Легко видеть, что всегда 6 D] = Z, (6.3) д£+ /# = /& (6.4) Из общей локальной предельной теоремы [6] вполне аналогично лемме 14 получается Лемма 16. Если выполнено условие (А) и г ]> 1, «го тгри тч -+ оо (тУ) *W*(m) = \ , , , //lN ' (6.5) ν ' γ ν ; 1 ωγργ (ί/) + о (1) >гри /д е Ζ, ν ' т-тУд1д* (5 6) оценка остаточного члена действует равномерно при | т« — mYga/gY | < С j/TraY, (5.7) Ργ (У) £сигъ гауссовская плотность, соответствующая в пространстве £γ векторов у ΕΞ β с г/у = 0 нулевым средним значениям и матрице вторых моментов \\ by ||, α ωγ т?гь плотность расположения точек из Ζ в пространстве βγ. Формулу (6.5) можно, подобно тому как формула (5.5) была заменена формулой (5.8), переписать в виде ' (m)~W* (т) = (gyf Т~ ру (у) + о (1). (6.6) 6 Вычеты складываются по обычным в алгебре правилам.
36. Локальная предельная теорема зза Для каждого вычета D в группе Q по модулю Ζ обозначим через /Y (D) сумму всех Wy (I) с Ρ = 0 и / е D: /ДО= Σ W\(i). (6.7) Б соответствии с (5.4) Так как ИЧ(9=2ИЗД. (33> α то в силу леммы 15 /Y (D) положительно лишь для тех D, которые совпадают с каким-либо Ζ)γ, т. е. лишь для конечного числа вычетов D. Из (6.6), (5.1) и (6.7) подобно формуле (5.9) выводится, что при mY->ooH условии (5.7) для иг, принадлежащих вычету Z), (m)r~VY (m) = (gyf ^ωγ/γ (D) ру (у J + о (1), (6.9) где у,= « *" , (6.10) Ρ 771Ύ m* = /тг — ив, (6.11) wd — некоторый фиксированный вектор D. Легко проверить, что у% ΕΞ SY. Замена вектора у на этот вектор у^ необходима, так как у может не принадлежать £γ и для него плотность ρ (у) будет тогда не определена. Из (6.9) вполне аналогично выводу теоремы 3 в § 5 получается Теорема 4. Если выполнено условие (А) и г ^> 1, то при т -> оо для т из вычета D (m)(-D/2 Wy (m) = ω/γ (D) ρ (*„) + о (1), (6.12) где7 х* = (™* — *М)/У^, (6ЛЗ) «*> есть плотность расположения точек решетки Ζ в пространства £о> ρ {χ) есть гауссовская плотность в β0, соответствующая нулевым средним значениям и матрице вторых моментов || Ьа& ||, а оценка о (I) действует равномерно при условии I т<* — т(р | < С γ т. (5.10) 1 Определение х* зависит от выбора векторов uD в (5.7), но, так как /γ φ)> > 0 лишь для конечного числа вычетов D, этот произвол никак не отражается на предельных теоремах.
334 36. Локальная предельная теорема J7 · СЛУЧАЙ НАРУШЕНИЯ УСЛОВИЯ (А) В самом общем случае множество состояний ех, е2, . . ., es распадается на некоторое число «классов» Къ К2, . . ., Кп «существенных» состояний и на множество R «несущественных» состояний (см. [1]); В пределах каждого класса К^ выполнено условие (А); переходы из состояния еа ΕΞ Kt в состояние е§ ΕΞ Kj при i Φ j невозможны, так же как и переходы из состояния, принадлежащего одному из Κι, в состояние из R; из состояний £а €= R всегда существует возможный переход за какое-либо число шагов в состояние хотя бы одного из классов Κι. Переходы последнего ряда, очевидно, безвозвратны: попав в состояние класса К\, рассматриваемая система уже не может выйти из состояний этого класса. Пусть К есть соединение всех классов К%. Для еа Ег К обозначим через Ωα множество целочисленных векторов m с неотрицательными компонентами, удовлетворяющими условиям та = 1, nfi = 0 при β φ αχ β <= Κ. (7.1) Так как из любого состояния eY^i? рано или поздно происходит переход в какое-либо состояние е$ €= К, то имеет место Лемма 17. Если еу е= R% то Σ Σ Щ(т)=1. (7.2) Рассмотрим следующие разновидности векторов т с неотрицательными целочисленными компонентами: Μг — у вектора т все компоненты та с еа Ег К равны нулю; Μ" — у вектора т имеются компоненты гпа ]> 0 с еа$ принадлежащими более чем рдному классу К$ Μι — у вектора m имеются компоненты та > О с еа ΕΞ Кь но не компоненты та > 0 с еа ЕЁ KjJ Φ i. Подобно леммам 5 и 6 доказывается Лемма 18. Существуют такие постоянные С и D ]> 0, что при любом у и любом т ΕΞ Μ' Wy(m)<Ce^D. (7.3) Исследование предельного поведения: Wy (т) при т -»- оо заканчивается Теперь без труда: (I) Если т ΕΞ М'щ то применима лемма 18» (II) Если т Е= М% то при любом у Wy (m) = 0. (7.4) (III) Если т Е= М(% το т однозначно представляется в виде т = тг + т2г (7.5).
37. Решение одной задачи из теории вероятностей 335 где т1 ΕΞ М\ а т2 имеет компоненты т% ^> 0 лишь при еа ΕΞ Kim Тогда Wy (т) = S ^? 0*i + *<*) ^α (m, - еа), (7.6) a£Kf, ma>0 исследование же предельного поведения вероятностей Wa (пг2 — еа) осуществляется при помощи теоремы 4, так как в пределах класса К выполнено условие (А). 15 марта 1949 г. ЛИТЕРАТУРА 1. Колмогоров Л. Я. Цепи Маркова со счетным числом возможных состояний. — Бюл. МГУ. Математика и механика, 1937, т. 1,вып. 3,с. 1—16. 2. Бернштейн С. Н. Теория вероятностей. 4-е изд. М.; Л.: ГТТИ, 1946. 3. Frechet Μ. Recherches theorique modernes sur la theorie des probabilites. Paris, 1937. 4. Doeblin W. Sur deux problemes de M. Kolmogoroff concernant les chaines denombrables.— Bull. Soc. math. France, 1938, vol. 66, p. 210—220. 5. Колмогоров A. H., Прохоров Ю. В. О суммах случайного числа случайных слагаемых.— УМН, 1949, т. 4, вып. 4, с. 168—172. 6. Мейзлер Д. Г., Парасюк О. С, Рвачева Е. Л. Многомерная локальная предельная теорема теории вероятностей.— ДАН СССР, 1948, т. 60, с. 1127— 1128. 37 решение одной задачи из теории вероятностей, связанной с вопросом о механизме слоеобразования* А. Б. Вистелиус и О. В. Сарманов обратили мое внимание на одну математическую задачу, которая им встретилась при статистическом изучении мощностей слоев в геологических отложениях. Рассматривавшаяся ими схема слоеобразования может быть понята из примера, изображенного на рис. 1. По горизонтальной оси здесь откладывается время, а по вертикальной — мощность накоплений и размывов. Слой с номером η откладывается в промежуток времени {tn-\, sn) и имеет (до последующих размывов) мощность ζπ = gn — ~- ^η-ι· В промежутки времени (sn\ tn) происходят размывы на глубину ηη = gn _ hn. В результате такого чередования накоплений и размывов некоторые слои могут размываться несколько раз (слой 1 размывается два раза — при первом и втором размывах), а некоторые могут и совсем * ДАЦ СССР, 1949, т, 65, J4s 6„ с, 793—796.
336 37, Решение одной задачи из теории вероятностей W Рис. 1 исчезнуть (слой 2 полностью смывается при втором размыве). Если считать, что в среднем мощности накоплений больше, чем глубины размывов, то каждый слой будет подвергаться значительному риску быть размытым лишь в течение небольшого числа следующих за его образованием чередований накоплений и размывов. Это позволяет говорить о вероятности «окончательного» сохранения слоя и об условном распределении вероятностей «окончательных» мощностей сохранившихся слоев. Именно эти условные распределения и следует сопоставить с фактически наблюдаемыми статистическими распределениями имеющихся в каком-либо разрезе слоев по мощности. По данным А. Б. Вистелиуса, эти последние часто имеют типичную форму распределений резко асимметричных и как бы «урезанных» слева на нулевой абсциссе. ' Обозначим δη = ξη — ηη = hn — кп-г разность между первоначальной мощностью тг-го слоя и глубиной непосредственно следующего за его возникновением размыва. При дальнейших математических построениях мы будем предполагать заданной бесконечную последовательность случайных величин δ1? δ2, . . ., δη, . . . и сделаем следующие допущения: 1) случайные величины δη взаимно независимы и имеют один и тот же закон распределения Ρ {δη < χ} = G(x); 2) математическое ожидание Μ = Μδη = ^ xdG (χ) положительно; —οο 3) распределение величин δη непрерывно, т. е. выражается через соответствующую плотность вероятности g (x) по формуле G (х) = ^ g (x) dx. Третье допущение могло бы быть совсем снято за счет некоторого усложнения дальнейшего аналитического аппарата. Но ввиду при-
37. Решение одной задачи из теории вероятностей 337 кладного значения задачи мы не сочли уместным загромождать изложение употреблением интегралов Стилтьеса. Второе допущение гарантирует \ что суммы ζη] = δη + δη+1 + · . . + бп+г при неограниченном возрастании второго индекса будут стремиться к + <*> и поэтому нижние грани φη = inf (ζ£0), ζ£\ . . ., $Γ\ . . .) будут конечны и будут достигаться при каком-либо (зависящем от случая) конечном номере г. Легко видеть, что слой с номером η в случае φη <; 0 полностыа размывается, в случае же φη ^> Ο от него сохраняется окончательная мощность φη. Поэтому задача сводится к определению вероятности ρ = Ρ {φη ]> 0} и условного распределения величины φη при гипотезе φη ]> 0. Из допущения 1) ясно, что как вероятность/?, так и указанное сейчас распределение не зависят от. номера п. Из допущения 3) можно вывести, что распределение случайных величин φη непрерывно, т. е. может быть охарактеризовано некото- оо рой плотностью вероятности / (х). Очевидно, что ρ = \ / (х) dx, a о условное распределение φη при гипотезе φη ^> 0 задается плотностыо вероятности /* (х) = f (х)/р при χ > 0, /* (х) = 0 при χ < 0. (1) Чтобы найти /* (х) и р, достаточно знать функцию s (χ) = / (х)/р+ /* определится тогда формулами (1), ар вычислится по формуле ' оо р = 1: 5 s{x)dx. (2) —°о Теорема. При допущениях 1), 2), 3) функция s (h) — / (х)/р (— оо <; χ <; -\- оо) является единственным решением интегрального уравнения о s(x) = g(x)+ I g(x-y)s(y)dy. (3) —оо Уравнение (3) очевидным образом равносильно уравнению о f(z) = pg(*)+ I g{x-y)f{y)dy. (4) »оо Доказательство равенства (4) осуществляется следующим образом. Из определения величин φη легко вывести, что Фп = δη, если фп+1 > 0; φη = δη + <Ρη+ι, если φη+1 < 0. (5) 1 В силу известной теоремы А. Я. Хинчина из 1) и 2) вытекает, что наши суммы подчиняются усиленному закону больших чисел, т. е. Pflim J£=m} = 1. ^Г—ооГ-f-l J
338 37. Решение одной задачи из теории вероятностей В силу допущения 1) величины δη и φη+1 взаимно независимы» Поэтому, представив / (х) в виде /(4 = p/iW+ti-p)/2(4 (6) тде /j (χ) и /2 (х) суть условные плотности для φη соответственно при типотезах φη+Ι )>0и <рп+1 <0и заметив, что условная плотность для φη+1 при гипотезе φη+1 < 0 есть 2 /** (х) = / (х)/(1 — р) при χ <0; /** (х) = 0 при χ > 0f (7) лолучим /ι (*) = ЙГ (х), (8) оо 0] /«(*) = $ £(*-У)/**(!/)# = t4j J g(x-y)f(y)dy. (9) —оо —оо Из (6), (8) и (9) непосредственно вытекает (4). Для полного доказательства теоремы остается установить единственность решения уравнения (3). Рассмотрим итерированные ядра Кг (х, у) = g(x — y) при у < 0; Кг (х, у) = 0 при у > 0; Кг(х,у)= $ Ki(x,z)Kr-1(z,y)dz. —оо Все эти ядра, как и функции *о (х) = g (я), оо 5r(x)= J Kr{x,.y)g{y)dy = —оо = $· · · § £(Μι) · · -g(ur)g(x — ui — .. . — ur)dui...durt itj+u2+...-Hbfe«> fc=l, 2,..., r неотрицательны. Формальное решение уравнения (3) записывается в виде *(*)=Σ*γ(*)· (10) г=0 Чтобы установить, что оно действительно является решением и к тому же единственным, достаточно доказать сходимость ряда ОО ОО. " i ' 2 /п ГД£ It =. J $r (x) dx = 55 * ..) g{ui).. * g (ur) d^i... dur. r=o —oo u1+u2+...+ufe<0 ft¥=l, 2,...,r (H) 2 Здесь мы принимаем ρ < 1. В случае р=Л, £ (χ) = О при ><£0 /(#) = # (χ) и равенство (4) тривиальным образом кыполняется.
37. Решение одной задачи ив теории вероятнфстей 339> 4S — е— -^ j 1 ' 1 -ff·2 ^>^^ Aj I . . ._ I. I 1 - Ι ί -tf/' -Г,О ■-%<? J- #f 7,0 /f J- 2,0 2, J JO J, J Pric. 2 Сходимость ряда (11) можно вывести из вероятностного смысла его членов. Обозначим через Апг) событие {φη = ζ^}, которое может быть записано иначе в виде (r) f δη+ъ + δη+fe+i + .. . + 8n+r < 0, к =t I, 2,. фп+r+l > 0. Легко видеть, что = Р {(pn+r+i > 0} Ρ {δη+1ί + δη+Ίς+1 + . Λ" + Sn+r < 0; к = 1,.; .,г} =- = ΡΛ·· Так как события Апг\ г = 1, 2, . . ., образуют (с точностью да вероятности, равной нулю) полную систему попарно несовместных событий, то оо (12) Поставленная в начале заметки задача в принципе решена: формула (10) доставляет нам функцию $ (х). По этой функции вычисляется /* (х) = s (х) при χ > 0; /* {х) = 0 при χ < 0, (13) а вероятность ρ находится по формуле (12). Остаточные члены рядов (10) и (12) можно оценить. Использование этих рядов для получения числовых результатов довольно громоздко, но вполне возможно. На рис. 2 изображены функции / (х) и /* (х) для случая g (χ) = φ (χ - α), φ (χ) = ~4=- е-*г1* У 2π при а = 1 (этому значению α соответствует ρ = 0,82). Получение Функции /*(#) «урезанием» функции 5 (ж) подформуле (13) объясняет отмеченные в начале заметки качественные особенности набйюд&е^ мых в действительности распределений. 2 марта 1949 г.
340 38. Несмещенные оценки 38 НЕСМЕЩЕННЫЕ ОЦЕНКИ* В статье рассматривается ряд задач на нахождение несмещенных оценок φ (хг, х%, . . ., хп) для различных функционалов / (Р), зависящих от закона распределения Ρ наблюдаемых величин хъ χ2ί . . . ♦ . ., хп. Некоторые из этих задач связаны с вопросами статистического контроля и браковки массовой промышленной продукции. § 1 ОБЩИЕ ОПРЕДЕЛЕНИЯ И ТЕОРЕМЫ Пусть дана система ф «допустимых» распределений вероятностей Ρ (А) = Р{же4} для случайной точки χ в некотором пространстве X и определенный на ф функционал / (Р). Определение 1. Заданная на X функция φ (χ) называется несмещенной оценкой для / (Р), если при любом распределении Ρ из ίβ выполняется равенство г ΜΡφ = / (Ρ). (Ι) Например, если X есть га-мерное пространство точек X = \Χ\ι Χ%ι · · ·» %η)ι а. ф состоит из распределений Р, задаваемых плотностями вероятностей η ρ(χ\α) = (2π)-/2exp{- \- J? (xk - α)2} , то общеизвестной несмещенной оценкой для f(P) = a является среднее арифметическое Я = (#ι + хг + · · · + #η)Μι для / (Р) = а* ■ * Изв. АН СССР. Сер. мат., 1950, т. 14, № 4, с. 303—326. 1 В формуле (1) и далее Мр есть знак математического ожидания, соответствующего распределению Р: Мр = С φ (χ) Ρ (dx). Χ
38. Несмещенные оценки 341 несмещенной оценкой может служить φ = £2 — ί/η м т. Д. Мы увидим далее, что во многих важных случаях несмещенные оценки не существуют. В этих случаях полезно Определение 2. Функции φ+ (χ) и φ_ (χ) называются соответственно верхней и нижней оценкой для / (Р), если при любом распределении Ρ из ф выполняются неравенства Μ*φ+ > / (Ρ), (2) MP<p_</(i>). (3) С другой стороны, в большинстве задач, в которых несмещенные оценки существуют, их имеется не одна, а много. Так, в рассматриваемом выше примере несмещенной оценкой для а может служить любая линейная форма φ = сгхг + сгхг + . . . + спхп с коэффициентами, подчиненными условию с± + сг + . . . + сп = 1. Чрезмерное разнообразие несмещенных оценок может быть значительно сокращено, если ограничиться несмещенными оценками, которые выражаются через надлежащим образом выбранные достаточные статистики задачи. Чтобы сформулировать относящиеся сюда общие теоремы, мне придется привести несколько обобщенное определение достаточной статистики. Так как в этом определении достаточная статистика может быть не только скалярной, но и векторной величиной, то отпадает необходимость отдельно вводить понятие «достаточной системы статистик»: при нашем общем определении такая система статистик (χΐ7 χ2, . . ., χδ) может считаться одной статистикой Нижеследующие несколько абстрактные формулировки будут конкретизированы в § 2 и 3, куда и следует обратиться читателю, которому эти формулировки покажутся трудными. Пусть χ (χ) — заданная на X функция со значениями из некоторого другого пространства Н. Рассмотрим условные распределения вероятностей P(A\h) = P{x^A\X(x)=h} (4) я условные математические ожидания 2 Μ£φ== ^(x)P(dx\h) (5) χ Интеграл (5) надо понимать в смысле формул (10)п(11)в§4 главы 5 моей
342 38. Несмещенные оценки при фиксированном значении χ (χ) = h. Определение 3. Функция χ (χ) называется достаточной статистикой для системы распределений ф, если условные распределения вероятностей Ρ (A \h) не зависят от выбора Ρ из ф. Так как условные вероятности Ρ (Α \ К) в соответствии с fl] определены лишь с точностью до множества значений Л, на которое χ (х) попадает (при распределении Ρ для ж) с вероятностью нуль^ то точный смысл определения 3 таков: χ (χ) называется достаточной статистикой для ф, если существует такая функция Q (А \Ь) от А С1 X и h ΕΞ Н, которая при любом Ρ из φ может быть принята за Ρ (А | /г). Теорема 1. /?о/ш χ (х) есть достаточная статистика для ф, то для любой функции φ (χ) б конечными при всех Ρ ΕΞ ф матема^ тическими ожиданиями Мр, условные математические ожидания ρ ΜΛφ we зависят от Ρ ΕΞ ф. Как и в случае определения 3, точный смысл теоремы 1 нуждается в пояснении. Он заключается в следующем: для любой функции φ (χ) с конечными при всех Ρ из ф математическими ожиданиями Μρφ, существует такая функция Μ (h), которая при любом Ρ 6Ξ 6Ξ ф может быть принята за ΜΛφ. Для доказательства теоремы 1 достаточно положить M(h)=^{x)Q{dx\h)i (6) χ где функция Q (A \ h) взята из пояснения к определению 3, а интеграл понимается в смысле примечания к формуле (5). Следующие две теоремы являются некоторым обобщением результатов Блеквелла [3]. Теорема 2. Если φ (χ) является несмещенной оценкой для f (Ρ), α χ (χ) — достаточной статистикой для ф, то 3 φ* (χ) = Мх(ж) φ (χ) =ΜΙ% (χ)] (7) тоже является несмещенной оценкой для f (P). Теорема 3., Для любого ?Е^ для которого дисперсия Dpcp существует^, в условиях теоремы 2 имеет место неравенство Ορφ*<Ρρφ. (8) Для доказательства теорем 2 и 3 достаточно воспользоваться тождествами Μ(Μχφ) = Μφ, (9) >Dcp=D(M0Ccp) + M(cp_MJccp)2> (10) ; t3 Верхний индекс Ρ црй Μ в формуле (7) опущен* так как в силу* теоремы I функция φ* может быть выбрана независимой от Р.
38. Несмещенные оценки 343 которые справедливы при любых функциях φ (χ) и χ (χ), если только Μφ и Οφ существуют. Теоремы 2 и 3 можно рассматривать как обоснование и без того «естественной тенденции употреблять только несмещенные оценкив выражающиеся через достаточные статистики задачи: теорема 2 доказывает, что при этом мы не суживаем круга задач, в которых несмещенные оценки существуют, а теорема 3 — что при переходе ют произвольной несмещенной оценки φ к осредненной оценке <р% выражающейся через статистику χ, мы можем только уменьшить дисперсию. Можно было бы показать, что оценка φ* всегда бывает «не хуже» порождающей ее оценки φ и при других способах сравнения «качества» оценки. Теорема 2, кроме того, как мы увидим, дает сильное средство для нахождения несмешанных оценок с малыми дисперсиями: часто осреднением «плохих», но легко обнаруживаемых оценок φ можно получить «хорошие» оценки φ*. В довольно широком классе случаев несмещенные оценки, выражающиеся через надлежаще выбранную достаточную статистику, оказываются однозначно определенными оцениваемым функционалом / (Р). По этому поводу см. интересную работу Халмоша [4], которая является одной из немногих попыток подойти к изучению несмещенных оценок с достаточно общей точки зрения. Некоторые результаты Халмоша будут приведены в § 10 настоящей статьи. § 2 ОСНОВНЫЕ ФОРМУЛЫ ДЛЯ ДИСКРЕТНОГО СЛУЧАЯ Если множество X возможных значений χ конечно: X = {аг, а2, . . ., αη}, а распределения Ре системы ф определяются однозначно заданием одного или нескольких параметров Θ, то естественно ввести в рассмотрение вероятности 4 Λ(Θ) = ΡΘ{* = ^}, Функционал / (Р) записывать в виде функции / (Θ) и ввести обозначение Для возможных значений оценки φ. Условие того, чтобы φ являлось несмещенной оценкой / (Θ), запишется тогда в виде η Σ<ρ*ρ*=/(Θ). (ΐ) 4 В случае нескольких параметров θ1τ θ2, . . ., θη мы обозначаем через В вектор (ΘΧ, θ2, . . ., θη).
344 38. Несмещенные оценки Формула (1) показывает, что в случае, когда θ пробегает бесконечное множество значений, лишь немногие функции / (Θ), а именно те, которые выражаются линейными формами вида (1), допускают несмещенные оценки φ. Если функции рк (Θ) линейно независимы, то для каждой функции / (Θ), которая допускает несмещенную оценку, такая оценка существует только одна. Если возможные значения χ занумерованы парами индексов: X = W/J, 1 < h < тж 1 < k < nh% то естественно нумеровать аналогичным образом вероятности ph1t (θ) и значения щ% оценки φ. Первый индекс h будет при этом достаточной статистикой задачи в том и только том случае, если phlc (θ) могут быть записаны в виде Ръ* (Θ) - ph (Θ) дш (2) где qnii не зависят от Θ, nh m Ы6)>0, 3?λ(Θ)=1. В случае (2) из несмещенной оценки φ (ял*) = Фл* для / (Θ) можно получить в соответствии с теоремами 2 и 3 несмещенную оценку nh ψ* (ahk) = φ* = Σ ghkVhk , (3) с дисперсией Οθφ* < ϋθφ при любом θ. Доказательство теорем 2 и 3, которое в общем случае, хотя ш было чрезвычайно просто и кратко, опиралось на несколько трудную общую теорию условных вероятностей и математических ожиданий,; в рассматриваемом частном случае делается чисто арифметическим, так как входящие в рассмотрения математические ожидания и дисперсии выражаются общеизвестными формулами т nh m М% = Σ Σ Phic (θ) φ», Μθφ* = £ ph (θ) φ*, Λ==1 fr=l /ι=1 m nh οθφ=Σ Σρ»(θ)(Φ»-Μν, j m DV=S^(9)(9t-MV)i· Λ=1
38. Несмещенные оценки 345 § 3 ОСНОВНЫЕ ФОРМУЛЫ В НЕПРЕРЫВНОМ СЛУЧАЕ Пусть распределения PQ из φ заданы плотностями вероятностей ρ (* Ι θ). В этом случае условие того, чтобы φ (χ) являлось несмещенной оценкой для / (Θ), записывается в виде $Ф(*)р(*Гв)**=/(в), (1) X т. е. нахождение несмещенной оценки φ (χ) для заданной функции / (Θ) сводится к решению интегрального уравнения. Пусть, далее, задана функция X (х) со значениями из пространства Н. Эта функция порождает разбиение пространства X на подмножества Vh, на которых X имеет постоянное значение X (х) = h. Допустим, что элемент объема dx может быть выражен в виде dx = dxxdh, где dh — элемент объема в Я, a dxx — надлежащим образом определенный элемент объема в Vh. Тогда X является достаточной статистикой задачи в том и только том случае, если плотности вероятностей ρ {χ Ι θ) могут быть записаны в виде p(x\Q)=p(h (χ) Ι θ) q (x), (2) где q (x) не зависит от θ и д{х)>0, J g(x)dx! = i, P(h)>0, §p(h\Q)dh=l. Ή В случае (2)' из несмещенной оценки Φ = Φ (χ) для / (θ) можно получить в соответствии с теоремами 2 и 3 несмещенную оценку φ* = φ*(*)= J <p(z)g(x)dxi (3) с дисперсией D «φ· «ς ρθφ (4) при любом θ, которая зависит только от χ (χ): <*>* = s [χ (χ)].
346 38. Несмещенные оценки § 4 НЕСМЕЩЕННЫЕ ОЦЕНКИ СЛУЧАЙНЫХ ВЕЛИЧИН В этом параграфе мы укажем дальнейшее обобщение задачи § 1 которое будет использовано в § 5. Пусть дана система φ допустимых распределений вероятностей Ρ (А) = Ρ {(χ, у) ЕЕ А) для пар, состоящих из «наблюдаемой» точки χ ΕΞ Η и ненаблюдаемой непосредственно случайной величины у. Функция φ (χ) называется несмещенной оценкой для г/, если при всех Ρ из ф Μ^φ = №у. (1) Вопрос о нахождении таких несмещенных оценок для случайных величин не связан с какими-либо новыми трудностями, так как он равносилен нахождению несмещенных оценок для / (Р) = М^. Только вместо дисперсии ϋρψ в качестве характеристики точности оценки φ для у естественно рассматривать выражение М*(<р-у)а. В случае, когда хш у при любом Ρ из ф независимы^ МР(ф-г/)2,= Ор<р + Орг/, (2) и так как Dpy не зависит от выбора φ, то задача нахождения несмещенной оценки φ для у с наименьшим значением Мр (φ — ζ/)2 равносильна задаче нахождения несмещенной оценки для Мрг/ с минимальной дисперсией Ορφ. §5 БРАКОВКА ПО КАЧЕСТВЕННОМУ ПРИЗНАКУ НА ОСНОВАНИИ ОДНОКРАТНОЙ ВЫБОРКИ. СЛУЧАЙ РАЗРУШЕНИЯ ИЗДЕЛИЯ ПРИ ИСПЫТАНИИ Чтобы показать на достаточно конкретном примере значение теории нахождения несмещенных оценок в вопросах браковки массовой продукции по выборочным данным, мы рассмотрим в этом параграфе и в § 7 две задачи из этой области. В детали, связанные с практическим применением предлагаемого метода, мы в настоящей публикации входить не будем. В этом параграфе будет предположено, что испытание изделий приводит к их разрушению и поэтому принципиально может быть только выборочным. Подлежащая нашему рассмотрению система браковки состоит в следующем. Из партии, содержащей N изделий, производится случайндя выборка объема п. Выбранные η изделий испытываются и устанавливается число χ «дефектных» изделий в выборке. Если χ <! с, то
38, Несмещенные оценки 347 у —\ О при χ > d. j\r -— и- изделий, не вошедшие в выборку, принимаются. Если χ ^ ^ d = с + 1·» то вся партия бракуется, Если в цартии до испытания имелось у дефектных изделий, то число принятых дефектных изделий будет равно у — χ при χ <^ с, Положим q = yIN, , q* = y*/N. Задача браковки состоит в том, чтобы гарантировать достаточна малые значения д*, не вызвав в, та же время без надобности т. е. при малых д, чрезмерно частого забракования всей партии и! яЪ увеличивая чрезмерно объем выборки п. Чтобы удовлетворить этим требованиям, выбирают надлежащие η и с. Основной характеристикой системы браковки с данными η и с является условная вероятность L(q) = P{x<c\q) при заданном q получить χ <^ с, т. е. принять партию. Для вычисления L (q) служат условные вероятности / \ d . ι > ri\ (N -n)\Nn ( 1 \ >ψ-4)···(*-^)(ΐ-*)(*-*-^)··· ...(i-y- -;-1) (1) появления при заданном q значений χ = т. Легко видеть, что Ня)= Ъ рт(д)- (2) Если признано целесообразным браковать партии с q <^ q0 и принимать партии с q > q0, то идеальной оперативной характеристикой L (q) была бы функция Чя) = [ 1 при g<g0, О при g>g0, изображенная на рис. 1. Такой вид функции L (q) мог бы быть достигнут лишь при η = N, что в случае испытания разрушительного характера лишило бы операцию смысла. Однако можно приблизиться к идеальной характеристике рис. 1, если выбрать достаточно большое с и взять η ~ c/g0,
348 38. Несмещенные оценки Если N очень велико, то это еще не приведет к чрезмерному увеличению отношения η/Ν, которое, конечно, должно оставаться достаточно малым. На рис. 2 приведена5 оперативная характеристика для случая N = Ю 000, η = 1000, с = 20, q0 ~ с/п = 0,02. К сожалению, получение вполне удовлетворительной оперативной характеристики даже при N порядка 1000—10 000 часто оказывается возможным только за счет чрезмерного увеличения отношения η/Ν. Поэтому часто применяются системы браковки с недостаточна круто падающей при возрастании q оперативной характеристикой» to Рис. ! f 0 /7,0/ /7,02 0,0J 0,04 $ Рис. 2 В этих случаях приобретает основное значение вопрос о последующей оценке по результатам испытаний доли фактически принятых дефектных изделий. При хорошо налаженном производстве она часто бывает значительно меньше, чем та доля дефектных изделий q0, исходя из которой рассчитана система браковки. Последующая оценка по результатам испытаний доли дефектных изделий в предъявленной на проверку продукции и доли пропущенных в результате применения данной системы браковки дефектных изделий имеет, конечно, большое значение и при вполне удовлетворительной оперативной характеристике. К решению этой задачи мы и переходим. Предположим, что система браковки с данными η ж с применена к большому числу партий s. Введенные выше отношения q я q* для партии с номером г будем] обозначать через qr и д*. Кроме того, обозначим через sm число партий, при проверке которых число дефектных изделий χ оказалось равным т. Очевидно, что s = s0 + зг + . . . + sn, so + h + · · · + se 6 Sampling inspection. Statistical research group. Columbia Univ., 194&.
38. Несмещенные оценки 349> обозначает число принятых партий. Общее число изделий в s партиях, равно R = «ЛГ, число же принятых изделий равно R' =s' (N - п). Общее число дефектных изделий равно r=i r=i число же принятых дефектных изделий равно s' s r=l r=l Успешность всей браковочной процедуры определяется тем1 насколько отношение ftp = меньше, ?ср = Так ?ср = где ?ср = = Υ L чем У " R '' как ti' отношение _ 1 S = q%RIR\ У = R '' __ 1 S S -Σι9*· ■Σ*. Г=1 а отношение RIR' после приемки становится известным и к тому же? при сколько-либо нормальном ходе производства близко к единице^ то мы можем считать, что наша задача состоит в оценке qcp и д*р. Если число партий s достаточно велико, а φ (а;) и φ* (χ) являются несмещенными оценками q и соответственно д* по х, то в силу закона больших чисел для оценки дср и дср можно пользоваться приближенными формулами s ?ср~фСр = -^^<р(*г), (3> г==1 S 9*ρ~φ*ρ = — jT<p*(;rr). (4>
350 38, Несмещенные оценки Точность этих формул определяется обычными стандартными мето-г дами, так как слагаемые в правых частях равенств S ?сР — <Рср=—Σ [дг - φ (*г)], S д% — ФсР =—Σ lg* ~~φ* ^ взаимно независимы. По этому поводу см. конец следующего параграфа. Несмещенная оценка для q хорошо известна: φ (χ) = χ/η. (5) Она приводит к оценке η ?ср~ФсР = —^]msm (6) m=l для gcp. Так как всегда 6 ?*р < 9ср, (7) то φ0ρ может служить также и верхней оценкой (см. определение 2 -§ 1) для д*р. Этот общеизвестный способ оценки д^, однако, совсем нечувствителен к уменьшению числа дефектных изделий в результате браковки. Чтобы ориентироваться в возможностях более эффективной оценки <7*р, рассмотрим общий вопрос о том, какие функции / (х) допускают несмещенную оценку по числу дефектных изделий χ в выборке объема п. Вопрос этот решается очень просто в соответствии с § 2. Для любой функции φ (χ) Ш = М»<р(*)= S ФНРт(?) (8) есть многочлен от q степени не выше п. Так как при этом η + 1 многочленов рт (q) линейно независимы, то любой многочлен / (q) степени не выше η единственным образом записывается в виде (8). Иначе говоря, многочлены f (q) степени не выше η и только они допускают несмещенные оценки по χ и оценки эти определяются многочленом f (q) однозначно. Легко проверить, что Q (g) = Μ V =Σ(9—Τ)Ρ^ Μ <9) даже более точно д*р < дср — _ V *>·
38. Несмещенные оценки 35i является многочленом (п + 1)-й степени. Поэтому точной несмещенной оценки φ* (χ) для g* по χ не существует. Мы увидим, однако^ в следующем параграфе, что поставленная нами задача нахождения такой оценки допускает при довольно широких допущениях очень простое приближенное решение. Кроме того, представляют интерес следующие два замечания. 1. При любом п' <^п существует несмещенная оценка по числу дефектных изделий χ в выборке объема η для q*, которое получилось бы при браковке по выборке объема п' (с любым с). 2. Аппроксимируя Q (q) многочленами Q+ (q) и Q_ (q) степени не? выше п, удовлетворяющими неравенствам Q. (?) < Q (?) < <?+ (?), можно получить для д* верхнюю и нижнюю оценки φ* (χ) и φι (χ). Этот метод обещает дать вполне приемлемые практические результаты для многих случаев, в которых приближенные формулы следующего параграфа неприменимы. СЛУЧАЙ с<ζ η<^ N Если η мало по сравнению [с Ν, то можно с достаточно хорошим* приближением положить ^\д при χ < с, — 1 0 при χ :> d, а формулы (1), (2), (9) § 5 заменить формулами Р«М=тЦп!-п»<ГЦ-91Г*, (1> Ня)= Σ рт(д), (2) Mqg* = Q(g) = gL(g). (3> В предположении законности пользования формулой (1) для дисперсии D\ (χ) = D* (χ/η) = q (1 - q)ln оценки (5) из предшествующего параграфа получается несмещенная оценка
352 55. Несмещенные оценки найденная Гиршиком, Мостеллером и Сэвиджем [5]. Из нее получается несмещенная оценка п—1 Да=^(»-1) Y*m{n~m)Sm (5) для дисперсии фср. При т, малых по сравнению с п, вероятности рт (q) сколько- либо заметно отличаются от нуля лишь при малых д и формула (1) может быть заменена еще более простой приближенной формулой т Рт(д) = ^гдте-"(*. (6) Так как в силу (6) ЯРт (я) = W* Pm+i (д)9 то в предположении, что с мало по сравнению с п, из формул (2) и (3) получается Таким образом, в случае законности применения формул (3), ^6) и (7) функция Q (q) является линейной комбинацией функций Рт (я) и мы получаем возможность в соответствии с § 2 сформировать несмещенную оценку для Q (q) (а следовательно, и для #*) по х. Оценка эта имеет вид Ф*(Х)ЦФ °РИ *<* = е + *> (8) φ (Х)-\ О при x>d + i. Для д*р отсюда получается несмещенная оценка * * 1 ΓΙ * /0ч 9ср ~ Фср = — 2j ms™· (9) rn<d Поучительно сравнить формулу (9) с формулой (6) § 5. Из их сопоставления получается, что разность Фср — Фср = — ^ rnsm (10) m>d при больших s приближенно равна разности дСр — <$р или (в случае отношения RIR\ близкого к единице) разности qcp — gap, т. е. сокращению доли дефектных изделий, достигнутому в результате браковки. Точность приближенного соотношения (9) может быть достаточно эффективным образом оценена. Из независимости выборок из различных партий (такая независимость входит в понятие «случайной»
38. Несмещенные оценки 353 выборки) вытекает, что s Μ (д% - q4)2 = 4" Σ М \£ - Ψ* (*г)Р. г=1 Так как (д% — Ф?р)2 = (д — х/п)* при # <^ с, (я/га)2 при а; = d = с + 1, О при хР* d + 1, (") (12) ТО α ее мв (?*р — φ*ρ)? = ^г Σ m2pm ^ + ΊΓ JC mpm ^ + ^2 Σ Рго ^· m=l m=l m=0 или после надлежащих преобразований d М* (?ср — Фср)2 = "р- [£ ™Рт (?) +.rf (d + 1) Pd+l (g)] · m=l Поэтому несмещенной оценкой AV7 (g* — φ*)2 является Г я/тг2^ при x^d, ψϊ(*) = \d(d+ 1)/тг2 при # = d+l, ( 0 при χ^ά-\-2, а несмещенной оценкой Μ (q$9 — φ*ρ)2 может служить s d £=-г Σ r {Xr)=w [Σ m$m+d {d+i] Sd+i]= (13) (14) d(d+l) ns ' (ns); При больших 5 Μ (<$> - Фс*р)2 ~ Δ2 и по теореме Ляпунова (15) τ (16) Рассмотрим в заключение численный пример на употребление Формул (6) § 5 и формул (4), (9), (15) и (16) этого параграфа. Пусть ΛΓ = 1000, η = 50, * = 200, с = 1, d = 2.
354 38. Несмещенные оценки т sm 0 143 1 27 2 12 . 3 9 4 3 5 1 6 2 7 1 8 1 9 — 10 — И 1 2ср (Рср = 0,0133, Δ -0,0011, φ?Ρ = 0,0051, или при 3σ-χ пределах I 2ср — <Рср I < 3Δ, /7* - 0,0010, 0,0133 ±0,0011, - 0,0051 ± 0,0010, I q*v - φ*Ρ Κ 3Δ, 0,0100 < gCp < 0,00166, 0,0021 < g*p < 0,0081. Я думаю, что при выбранных для примера значениях s, Ν, η, с употребление формул, введенных в предположениях c^tk^N и большого 5, уже законно. Но этот вопрос заслуживает более подробного исследования. § 7 БРАКОВКА ПО КАЧЕСТВЕННОМУ ПРИЗНАКУ НА ОСНОВАНИИ ОДНОКРАТНОЙ ВЫБОРКИ. СЛУЧАЙ ИСПЫТАНИЙ, НЕ НАНОСЯЩИХ ВРЕДА ИЗДЕЛИЯМ Если испытание изделий не наносит вреда изделиям, то может быть принята система браковки, отличная от рассмотренной в § 5. Из партии, состоящей из N изделий, производится случайная выборка объема п. Выбранные η изделий испытываются и устанавливается число «дефектных» изделий в выборке. Если χ <ζ с, то χ обнаруженных дефектных изделий заменяются заведомо годными (не «дефектными») и вся партия принимается. Если а; ^> d = с + 1, то проверяется вся партия, все обнаруженные при этом дефектные изделия заменяются заведомо годными и только после этого вся партия принимается. Как и в § 5, — χ/Ν при χ <^ с, 0 при x^d, но теперь величина д* получает более простой смысл: это доля дефектных изделий, остающаяся в партии после описанной выше процедуры. Формулы (1)—(9) § 5 сохраняются. При этом Q (q) получает новый смысл математического ожидания доли дефектных изделий в принятой продукции в предположении, что до браковки в каждой партии доля дефектных изделий была равна q. Поэтому теперь оказывается осуществимой априорная оценка наихудшего возможного среднего качества принятой при данной системе браковки продук- д* =
38. Несмещенные оценки 355 Д004 ЦООА ции: каково бы ни было распределение дефектных изделий по партиям до браковки, в среднем в принятой после браковки продукции дефектные изделия будут составлять долю, не превышающую <?L=max Q(g). (1) [0<<7<1 В обстановке § 5 такая априорная оценка невозможна. На рис. 3 7 дан график функции Q (q) для N = ЮОО, с = 1, η = 100, d = 2. Максимум Ql = 0,0035 достигается здесь при q = 0,009. Кроме числа дефектных изделий х, в выборке в новой обстановке становится доступным для наблюдения число ί 0 при #<>, 1 qN — χ при χ !> d дефектных изделий, обнаруженных при сплошной проверке не Рис. 3 вошедших в выборку N — η из- делий,'если такая проверка производится. Это доставляет новые возможности для получения несмещенных оценок q и д*. Легко обнаружить, что достаточной статистикой задачи является сумма (х при χ <^ с, AT ^ J qN при χ ^ α. Мы увидим сейчас, что при 0 < с <^ тг для любой функции f (q) существует несмещенная оценка φ (и) и притом она единственная. В самом деле, требование *'<р (и) = Σ φ (да) Pm (?) + φ (з^О [ί - l (<?)] = / (?) (2) заключает в себе N + 1 уравнений в соответствии с возможными значениями ? = 0, 1/ЛГ, 2/ΛΓ, 1. Так как при q = 0, 1/АГ, . . ., c/ΛΓ множитель 1 — L (g) в (2) равен нулю, то φ (и) для и ^ с однозначно определяется системой d Уравнений £фНр„(^) = /(-£-), т = 0,1....,с Grant Statistical quality] control, 1946, p. 353. (3)
356 38. Несмещенные оценки При и > d, положив q = u/N, получаем из (2) f(ulN)- 2 <p(m)pm(ulN) - 'M = ВьШ) ' <4> В частности, при / (q) = Q (q) формулы (3), (4) приводят к несмещенной оценке для Q (д), т. е. для д*. § 8 ОЦЕНКА / (а) В СЛУЧАЕ НОРМАЛЬНОГО РАСПРЕДЕЛЕНИЯ С ЗАДАННЫМ σ Пусть хг, х2, . . ., хп независимы и подчинены нормальному распределению с плотностью вероятности ρ(χ\α,σ) = -jL·- 6>-(*-«)2/2σ*# (1) у 2л; σ Будем считать σ известным. Тогда χ = (хг + х2 + . . . + хп)1п (2) является достаточной статистикой задачи. Плотность вероятности для χ может быть записана в виде ρ (χ | а, а) = G (ζ —а, Г), (3) где вЬ* = 1?ше*'*' (4) Т = а2/2п. (5) Основное уравнение (1) § 3 в нашем случае (для несмещенных оценок вида φ (χ) функции / (а)) может быть записано в форме оо J <p(x)G{i — a,T)dx = f{a). - (6) Положим при t^>—T оо φ (z,0= J ψ(ζ)0(ζ-ζ,Τ-ήάζ. (7) —оо Очевидно, что φ (z, 0) = / (ζ). (8) Без потери каких-либо решений задачи, имеющих практический интерес, можно ограничиться такими функциями φ (ζ), что: 1) функция φ (z, t) аналитична при всех действительных z и t ]> —Τ по обоим переменным z и t; 2) почти всюду по ζ у функции φ (ζ, t) существуют предельные значения φ (zt -T) = φ (ζ). (9)
38. Несмещенные оценки 357 Как известно, при ί > —Τ функция φ (ζ, t) удовлетворяет тепловому уравнению θψ/dt = d2y/dz2 (10) и при сделанных допущениях однозначно определяется для t ^> —Т своими значениями / (ζ) при t = 0. В силу (9) это приводит к тому, что φ (ζ) однозначно определяется 8 по / (ζ). Таким образом, если задача нахождения несмещенной оценки для f(a) разрешима, то при ограничениях 1) и 2) ее решение единственно. В силу уравнений (8)—(10), задача нахождения несмещенных оценок для / (а) сводится- к «обратной задаче теплопроводности»^ которой посвящены, например, работы [6—8]. Мы отметим для дальнейшего лишь следующее связанное с этим обстоятельство. Если при некотором Т0^> Τ функция / (ζ) уже представлена в виде оо /(z)= j G (ζ ~z,T0)dF(l), (11) —оо то несмещенная оценка φ (со) дается формулой оо <p(z)= $ G{l-z,T0-T)dF&). (12) —-ОО В частности, для самой плотности вероятности р(х\а, а) = G (χ - α, σ2/2) (13) в какой-либо фиксированной точке χ мы получаем несмещенную оценку при п^> ί в виде Интегрируя (14), получим при любом фиксированном множестве I, расположенном на числовой прямой ж, для Ρ(Α)=Ρ{ζ^Α\α,σ}=ϊ *-&-«№* dx (15) *«-arc-'**wi· <*-(«-4-)-· ("> несмещенную оценку9 -(χ-χ,2/2σ2 - \ У2лв0 Уа(%) = —7= \е °dx. (16) 1/ 2π σ0 J 8 Так как в силу (3) χ попадает на множество меры нуль с вероятностью, равной нулю, то возможная неопределенность φ (ζ) на множестве меры нуль не мешает делу. Во всех подобных случаях однозначность решения законно понимать в смысле однозначности с точностью до случаев, имеющих (при всех допустимых распределениях Р) вероятность нуль. 9 На оценку (14) и возможность получить из нее интегрированием оценку (16) обратил мое внимание Ю. В. Линник. До этого замечания Ю. В. Линника я выводил оценки вида (16) для частных видов множества Л непосредственно из Уравнения (6).
358 38. Несмещенные оценки , Формула (16) применима в случае η > 1. В случае η = 1 вместо нее действует несмещенная оценка для Ρ (А) по Ж = а^ вида ( 1 при a;iE A, <pA(xi) = \ п _ . (17) ΎΑΚ 1; [0 при a;iEi v ' По аналогии с (17) можно и в случае η ^> 1 дать для Ρ (Л) несмещенную ©пенку η Ψ*(*ϊ, #2,..., χη) = — ^Ψλ(^), (18) m=l равную 1/ιζ от числа точек хт, попавших на множество А. Эта оценка имеет то преимущество, что она является несмещенной оценкой Ρ (А) и в том случае, если класс φ допустимых распределений Ρ (Α) =Ρ {ΧΕΞΑ} расширить до класса всех одномерных распределений Ρ (А). Однако в случае нормальных распределений с неизвестным а и заданным σ оценка ψ! значительно менее эффективна, чем φ^. § 9 ОЦЕНКА / (α, σ) В СЛУЧАЕ НОРМАЛЬНОГО РАСПРЕДЕЛЕНИЯ С НЕИЗВЕСТНЫМИ а и σ Будем исходить из формулы (1) § 8 и сохраним допущение о независимости хъ х2, . . ., хп между собой, но предположим, что оба параметра неизвестны. Из формулы Ρ (*1, *2, · · ·, Хп | «, σ) = w б 2σ» (1) (у ζπ <з) для га-мерной плотности вероятности видно, что достаточных статистик задачи две: X и η i о2 = ~У(хт-х)\ (2) η Двумерная плотность вероятности для χ и s выражается формулой где Αη"2~Τ((η-1)/2) ν4; есть (п — 2)-мерный объем сферы единичного радиуса в (п — 1)- мерном пространстве. Основное уравнение (1) § 3 приобретает теперь
38. Несмещенные оценки 359 ВИД ОС <Х> \ \ φ(£, s)p (£, s |α, G)dsdx = f(a, σ). (5) —οο —οο Мы ограничимся тем, что при помощи теоремы 2 § 1 найдем решение уравнения (5) для случая f(a9o) = P(A)=$p(x\a,o)dz. (6) А Как уже было указано в § 8, для Ρ (А) существует несмещенная оценка Ψα(*ι)={ о 1 при ΧιΕΞΑ, при ΧιΕζΑ. Чтобы получить несмещенную оценку для Ρ (А) вида φ (£, s),} нам остается вычислить интеграл Ψα (£.*)= J Ψα(*ι)^, (7) где Fjc, 8 обозначает подмножество ^-мерного пространства точек (хъ х2, . . ., хп), определяемое равенствами *1 + Х2 + . · · + Хп которое является (п — 2)-мерной сферой радиуса ρ = Yns; (8) dv обозначает элемент объема в Vxt s, а множитель q имеет постоянное значение (9) При η> 2 Фа(ж,«)= ^φχώ, (10) А гДе Фх является несмещенной оценкой по χ и s для плотности вероятности ρ (χ Ι α, σ) в точке х. Для определения φα рассмотрим объем ψχάχ/q кольца, высекаемого из сферы V%% 8 плоскостями χι = х, хг = χ -\- dx.
360 38. Несмещенные оценки В случае это кольцо исчезает и <Р* = 0. В случае же -j^jix — xf<92 интересующее нас кольцо имеет радиус р'= yp2 — ~j(x--x)2 ширину (И) г η / 71 р 1 ρ 7-йя: и объем -^ = ϋΤ„_3 (ρ')»"» δ = Ζη_3 ]/' -^j ρ (Ρ' )""* d». Пользуясь формулами (9)—(И), получаем теперь окончательно п—4 жп-з ι if, .ι f*-*\'l 2 φ* = 0, если если | ж — χ 1 s ж — χ \ S < //г - 1,' (12) Вводя функцию п—4 /.(0=^(1-^*·)· при μ К Y*=l. I 0 при \t\^Yn — 1, где Сп = Я *п-2 ""Ι п-3 Г((п-1)/2) уг2яГ((п-2)/2)уг?г-1 ' можно записать φχ в виде 1 , / χ — £ \ При /г -> оо функции /η (£) сходятся к пределу (13) (14) (15) (16)
38. Несмещенные оценки 361 НЕСМЕЩЕННЫЕ ОЦЕНКИ ХАРАКТЕРИСТИК ПРОИЗВОЛЬНОГО РАСПРЕДЕЛЕНИЯ ПО НЕЗАВИСИМЫМ НАБЛЮДЕНИЯМ Рассмотренные нами примеры дали читателю некоторое представление о разнообразии конкретных задач, связанных с нахождением несмещенных оценок. Мне представляется, что эта область математической статистики заслуживает большего внимания, чем ей уделяется. В заключение этой статьи, которая и не претендует на большее, чем на демонстрацию на примерах недостаточной разработанности этой области, я хочу указать на связь общего подхода к несмещенным оценкам и достаточным статистикам, изложенного в § 1¥ с результатами уже цитировавшейся работы Халмоша [4]. Пусть в некотором пространстве Х0 задана система распределений ф0. Допустимыми распределениями в пространстве X упорядоченных систем X = (Χι, #2» · · ·» %η)χ где хт ΕΞ Хо {т = 1,2,. . ., п), будем считать те и только те распределения, которые получаются обычным образом из предположения, что все хт независимы и подчиняются одному и тому же распределению Θε$ο· Вопрос о том, какие функционалы / (Θ), заданные на фо, допускают несмещенную оценку вида Φ \Χ1ι χ2ι - · ■» Χγι)ι равносилен вопросу о том, какие заданные на ф0 функционалы /(Θ) могут быть представлены в виде / (Θ) = J J .. . $ φ (хъ V- - ·, *η) θ (dxr) θ (dx2)... θ (dxn). (1) Χ 0 Xq Xq Функционалы вида (1) естественно называть функционалами степени <^тг. Они10 во многом аналогичны многочленам степени <^>. Например, легко видеть, что они обладают следующим свойством: (*) при любых θχ и θ2 выражение ^ Ρ(λ) =f [λθχ + (l - λ)θ2] для всех тех λ, для которых θ = λθχ + (1 — λ) θ2 принадлежит ф0, может быть выражено в виде многочлена степени </гот λ. 10 Легко видеть, что всякий функционал / (Θ), представимый в виде (1) при п = пъ представим в виде (1) при η = п2>п1. Функционалы / (Θ), представимые в виде (1) при η = п0 и не представимые в виде (1) при любом меньшем п, естественно называть функционалами степени п0.
362 38. Несмещенные оценки При некоторых ограничениях на систему $0 верно и обратное: из свойства (*) вытекает представимость в виде (1), т. е. свойство (*) может быть принято за определение функционала степени ^ η (по этому поводу см. определение полиномиальных операций, данное в [9]). Изложенный очевидный критерий существования несмещенных оценок для / (Θ) привел Халмоша к некоторым интересным следствиям. Например, если ф0 состоит из всех распределений θ на числовой прямой, для которых абсолютный момент оо β.(θ)= $ \t\'d& — оо конечен, где s — натуральное число, то центральный момент оо оо μ,(θ)= $ [t — m(Q)]sdQ, m(0)= j tdQ, —oo —oo имеет несмещенную оценку вида φ (Χι, %чч . . ., хп) в том и только том случае, когда s <^ η (несмещенные оценки в случае s ^ η хорошо известны, см. [2, 27.6]). Легко видеть, далее, что в соответствии с общим определением § 1 для рассматриваемой нами задачи оценки / (Θ) по значениям хъ хг, . . ., хп существует достаточная статистика χ в виде системы значений (хг, хг, . . ., хп), рассматриваемой независимо от порядка нумерации входящих в нее точек хт (но с учетом кратностей в случае, если некоторые хт совпадают). Функции φ (хг, х%, . . ., хп), выражающиеся через эту достаточную статистику χ, суть не что иное, как симметрические функции от1 хъ х2, . . ., хп. Это очевидное замечание приводит нас в силу теорем 2 и 3 § 1 к одному из результатов Халмоша: если для / (Θ) имеется несмещенная оценка вида φ (хг, хг, . . . . . ., хп), то для / (Θ) имеется и симметрическая несмещенная оценка φ* (хг, х2, . . ., х<п) с дисперсией, не превосходящей дисперсию φ (χι, ж2, . . ., Хп)· Халмошу удалось, однако, пойти и несколько дальше этих очевидных результатов и доказать при некоторых не слишком стеснительных ограничениях на систему ф0 единственность симметричной несмещенной оценки. (По этому поводу см. непосредственно его статью [4].) 30 марта 1950 г.
39. О дифференцируемости переходных вероятностей 363 ЛИТЕРАТУРА 1. Колмогоров А. Н. Основные понятия теории вероятностей. М.; Л.: ОНТИ, 1936. 2. Крамер Г. Математические методы статистики/Пер. с англ. М.: Изд-во иностр. лит., 1948. 3. Btackwell D. Conditional expectation and unbiased sequential estimation.— Ann. Math. Statist., 1947, vol. 18, p. 105—110. 4. Halmos P. The theory of unbiased estimation.— Ann. Math. Statist., 1946, vol. 17, p. 34-43. 5. Girshick Μ. Α., Mosteller F., Savage L. J. Unbiased estimates for certain binomial sampling problems with applications.— Ann. Math. Statist., 1946, vol. 17, p. 13—23. 6. Тихонов А. Н. Теоремы единственности для уравнения теплопроводности.— ДАН СССР, 1935, т. 1, с. 294-300. 7. Тихонов А.Н. Теоремы единственности для уравнения теплопроводности.— Мат. сб., 1935, т. 42, с. 199—216. 8. Levy P. Sur un probleme decalcul des probabilites lieacelui du refroidis- sement d'une barre homogene.— Ann. Scuola norm, super. Pisa. Ser. 2, 1932, vol. 1, p. 283—296. 9. Mazur S., Orlicz W. Grundlegende Eigenschaften der polynomischen Opera- tionen.— Stud, math., 1934, vol. 5, p. 50—68, 179—189. 10. Halmos P., Savage L. J. Application of the Radon—Nikodim theorem to the theory of sufficient statistics.— Ann. Math. Statist., 1949, vol. 20, p. 225-241. 39 К ВОПРОСУ О ДИФФЕРЕНЦИРУЕМОСТИ ПЕРЕХОДНЫХ ВЕРОЯТНОСТЕЙ В ОДНОРОДНЫХ ПО ВРЕМЕНИ ПРОЦЕССАХ МАРКОВА СО СЧЕТНЫМ ЧИСЛОМ СОСТОЯНИИ* Интересующие нас переходные вероятности р^% (t) определены для всех действительных ί>0π удовлетворяют соотношениям: ή (*) > о, (ΐ) Σ $(<)=*. (ΐΐ) β к - й ί 0 при α =1= β, **<°> = Hi присД (Ш) 2pUt)pl(t')=pUt + t'). (iv) Кроме этих соотношений алгебраического характера, мы будем считать выполненным условие непрерывности pi(t) -> pi (0) = 4 при ί -* 0. (V) * Уч. зап. МГУ, 1951, т. 148. Математика, № 4, с. 53—59.
364 39. О дифференцйруемости Переходных вероятностей Хотя в условии (V) требуется непрерывность функций р^ (t) только при t = О, легко видеть, что из совокупности условий (I)—(IV) вытекает непрерывность этих функций при всех t j> 0. В случае конечного числа состояний, т. е. в случае, когда α, β и γ в формулах (I) —(V) пробегают лишь значения 1, 2, . . ., тг, из (I)—(V) вытекает (см. [2]) дифференцируемость функций р& (t) при всех t ;> 0 (при t = 0, естественным образом, только справа), т. е., в частности, существование пределов pS(i)| -lim^^., (1) pi(t)\ =Hm-^- при β^α. (2) .л«= — а dt al = -J dt Пределы эти удовлетворяют соотношениям аа= Σ а1 (3) и имеют хорошо известный вероятностный смысл плотностей вероятности выхода из состояния с номером а (в случае аа) и плотностей вероятности перехода из состояния с номером а в состояние с номером β (в случае а&). Сами вероятности перехода р%, (t) однозначно определяются плотностями перехода ad (по которым аа вычисляются в соответствии с формулой (3)) как решения любой из двух систем дифференциальных уравнений -^Р&(0=-«аР&(О+£в&>?(0, (4) ^fPi{t) = -pl{t)H + Y)Pl{t)a^ (5) удовлетворяющих начальным условиям (III). После моей работы [1] системы уравнений (4) и (5) сделались основным аппаратом изучения переходных вероятностей р^ (t) и в случае счетного множества состояний, т. е. в случае, когда индексы α, β, γ в формулах (I)—(V) пробегают все натуральные значения 1, 2, 3, . . . Однако в общей форме даже предварительные вопросы о существовании пределов (1) и (2), дифференцйруемости переходных вероятностей р% (t) при t > 0 и применимости к ним соотношения (3) и дифференциальных уравнений (4) и (5) долго оставались без ответа^ По-видимому, если ограничиться допущениями (I)—(V) и не вводить никаких дополнительных ограничений, дело обстоит в случае счетного числа состояний так: (А) Пределы аа всегда существуют, но имеются примеры, в которых они равны оо.
39. О дифференцируемо emu переходных вероятностей 365 (Б) Пределы аа при β φ а всегда существуют и конечны. (В) Всегда 2 *«<*«■ (6) яо даже при конечных аа существуют примеры, в которых Σ 4 О*. (7) β^α (Г) При t > О функции pa {t) всегда имеют конечные производные. (Д) Если все аа конечны, то для справедливости системы уравнений (4) необходимо и достаточно соблюдение всех равенств (3). (Έ) Существуют примеры, где система уравнений (5) не имеет места, несмотря на то что все аа конечны и все равенства (3) выполнены. (Ж) Существуют примеры двух различных систем функций ра (£), удовлетворяющих требованиям (I)—(V) с одинаковыми и конечными ла и α», удовлетворяющими соотношениям (3). Из перечисленных утверждений остается гипотетическим утверждение (Г). Остальные были частично доказаны Дубом (см. [3, 4]) и полностью устанавливаются в настоящей работе. Доказательство предложения (А). Существование конечных или бесконечных пределов было доказано Дубом. Мы приведем другое вполне элементарное доказательство (доказательство Дуба использует меры в функциональных пространствах). Положим аа = lim ιηι - . (о) Очевидно, что аа ^ 0. Если аа = оо, то 1-р»(0 aa=hm (9) и аа = аа является искомым пределом. g[ Если аа <^ оо, то при любом t > 0 (1 - Pa (t))/t < аа. (10) В самом деле, возьмем произвольное £>0и8>0и выберем такое й, что (1 - Pa (h))/h < «a + 8/2, (И) pi (s) > l _ («j/2)i при s < h. (12) Представим t в виде t — nh + s,
366 39. О дифференцируемости переходных вероятностей где η > 0 целое и s < fe. Тогда ^(0>{р^(/г)}>^(^)>{1-(5а+^)/г}П(1^4-^)> X (l — -|-^) > 1 — (аа + ε) ί, (1-р£(*))/*<Яа + *. (13) Так как ε> Ο произвольно, то из (13) вытекает (10). Из (10) и (8) вытекает (9). Таким образом, существование предела а£ = »= —-аа = —-аа доказано и в случае конечности аа. Вопрос о возможности случая αα = оо был оставлен в работах Дуба открытым. Положительный ответ на этот вопрос дает Лемма. Пусть аа^> 0 при α ^ 2 конечны и таковы, что £■£-<- <14> а=2 Тогда существует процесс Маркова, удовлетворяющий условиям (I)—(V), для которого аа имеют заданные значения аа при а > 2, #а = #а I ai = oo9 <2i = l при β!>2, R I при а>2, α^=β>2# «а = 0 J Отвечающие этим требованиям /?α (£) можно построить следующим образом. Положив р\ (t) = φ (t), (15) допустим, что при β > 2 -згйв(0 = ф(*)-«вр?(<), что вместе с ρ? (0) = о дает t pl(t) = ^(s)e^a^s)ds. (16) ί о Требование Σρ?(0 = ρϊ(ί)+Σρ5(0=ι β β>2
39. О дифференцируемо emu переходных вероятностей 367 приводит к уравнению t оо Ψ(ϊ) + Ιψ(β)Σ^">)^=1. (17) О β=2 Условие (14) приводит к тому, что ядро к{х)= Σ е 6=2 -αβτ имеет конечный интеграл О β=2 1 Поэтому * уравнение (17) имеет непрерывное при t > О решение <р (t), которое может быть вычислено обычным методом при помощи преобразования Фурье. Легко установить, что это решение непрерывно и удовлетворяет условиям φ(0) = 1, φ'(0) = -οο. Для окончания нашего построения остается к (15) и (16) присоединить при α > 2 значения pa (t), удовлетворяющие уравнениям г 4-pS(*) = a«P?(f)-««pS(<). -lrP%(t) = pUt)-aapZ(t), 4rpUt)--=pUt)~azpi(t), которые легко интегрируются одно за другим (с начальными условиями (III)). Построенные вероятности pS, (t) удовлетворяют всем требованиям (I)—(V). Доказательство предложения (Б). Лемма. Пусть при t <^ Η l-p£(*)<e, 1-ρβ (*)<*. (18) Тогда при nh < t < #„ где η > 0 целое, A (t) > npl (fc)(l - 3ε). (19) 1 См.: Титчмарш Е. К. Введение в теорию интегралов Фурье/Пер. с англ. М.; Л.: Изд-во иностр. лит., 1948, § 11.5. 2 Второе и третье уравнения здесь взяты из системы (5), а первое из системы (4).
368 39. О дифференцируемости переходных вероятностей Доказательство. Пусть 3 Рк= Σ ρϊ (h) pi (h)... p^1 (ft)... pvVx (A), i=l,2,...f fr—1 Q,= Σ ρ?(Λ)ρ?:(Α)···ΛΓ(Λ)···Λ-ι(Α)· l<i<fe-l Легко установить, что 1 - pi (t) > pi (t) > Σ Μ (ί - Щ > (1J- ε)Τ. (20) Из (18) и (20) вытекает Ρ < ε/(1 - ε). (21) С другой стороны, <?* > PS (**) - Σ' Λ > Р° (Щ - Λ (22) что вместе с (18) и (21) дает Qk > 1 - ε - ε/(1 - ε). (23) Наконец, Ρ»(ί)>Σ^_1Ρ&(Α)ρ|(ί-ΛΑ), (24) откуда вместе с (18) и (23) получается Ρ^(0>ηρ|(Λ)(ΐ-έ-Γ^)(1-ε)>ηρβ(Λ)(1-36), что и требовалось доказать. Предположим теперь условия леммы выполненными для данного Η и рассмотрим h < Я. Пусть я есть целая часть Я/Λ и t = nh. Тогда η > H/2h и в силу (19) 1 > р£ (0 > np& (fc)(l - 3ε), 3 Для понимания неравенств (20), (22) и (24) читатель должен восстановить для себя теоретико-вероятностный смысл P^nQ^. Впрочем, эти неравенства легко доказываются и чисто алгебраически на основе (I)—(IV).
39. О дифференцируемости переходных вероятностей 369* Т. в. pUh) ^ ι <:w/ ^<" h ^ nh (1 — 3ε) ^ Η (1 — 3ε) # Следовательно, a£ = limsup^^<oo. (25) Для любого £ <; Η выберем такое h, чтобы pi (h)/h > ai (1 - ε), (26) /*/* < ε, (27) и обозначим через η целую часть t/h. Тогда nh > t (1 — ε) и в силу (19) при ε < 1 ^ο>_^^(1_3ε)>^_(1_3ε){1_ε)> >αΡ(1 —4ε)(1-ε). (28) При любом ε, удовлетворяющем условиям 1 ]> ε ^> 0, неравенство (28) доказано, если t «ζ Η, где Я достаточно мало. Отсюда вместе с (25) вытекает, что imn—7— = «£=«&· г -» 0 Доказательство предложения (В) в части неравенства (6) вполне элементарно и может быть найдено в работах Дуба [3, 4]. Вот пример, в котором для α = 1 имеет место неравенство (7)г хотя все аа конечны. 1) При α > 3 вероятности р% (i), pi (t) для 3 < β < α и р2а (t) определяются из дифференциальных уравнений (с обычными начальными условиями (III)), где аа^> 0 подобраны так? что оо Σ.' — <оо. (29)
370 39. О дифференцируемости переходных вероятностей 2) При а > 2 и β = 1 или β > α pi (ί) = 0. 3) pi (t) = 1. 4) p\ (i) = e-K 5) При β > 1 t Р?(*)=$Т5(*)Л. о где ρ J (ί) = lim Д (ί). α-»οο Так как для построенных р^ (t) ^ —[¥Р1Р)]мв1· а?=[-й-р?(')]|-в==0 при всех р>1· то Можно проверить, что условия (I)—(V) в построенном примере выполнены. Предложение (Д) доказано Дубом (см. [4, VIII]). На только что рассмотренном примере можно непосредственно убедиться, что в нем уравнения (4) неприменимы. В самом деле, в этом примере аг = 1 и а? = 0 при β Φ 1. Поэтому при а = 1 уравнения (4) имеют вид dpl(t)/dt = -ρ? (ί) ή вместе с pi (0) = 0 приводят к абсурдному выводу, что pi (t) = о при всех β Φ Ι. Доказательство предложений (Е)и(К) дано Дубом (см. [4, теорема 2.2]). ЛИТЕРАТУРА 1. Колмогоров А. Н. Об аналитических методах в теории вероятностей.— УМН, 1938, вып. 5, с. 5—41. 2. Doeblin W. Sur l'equation matricielle A(t+s) = A{t)A{s\— Bull. sci. math., 1938, vol. 62, p. 21—32. 3. Doob J. L. Topics in the theory of Markoff chains.— Trans. Amer. Math. Soc, 1942, vol. 52, p. 37—64. 4. Doob J. L. Markoff chains — denumerable case.— Trans. Amer. Math. Soc, 1945, vol. 58, p. 455—473.
40. Обобщение формулы Пуассона 37* 40 ОБОБЩЕНИЕ ФОРМУЛЫ ПУАССОНА НА СЛУЧАЙ ВЫБОРКИ ИЗ КОНЕЧНОЙ СОВОКУПНОСТИ* Пусть в урне находится N шаров, из которых Μ белых и N — Μ черных. Если из урны вынуть наудачу η шаров, то вероятность получить среди них т белых равна Рп (m{N, Μ) = C%CnNZmMICnN. (1> Несмотря на элементарность формулы (1), вычисления по ней затруднительны и ее заменяют приближенными соотношениями Рп (m/N, Μ) ~ Pi (πι/Νχ Μ), (2> где Р* является тем или иным выражением, которое легче вычислить или использовать в дальнейших выводах, чем точное выражение Р. Во всем дальнейшем мы будем указывать условия, при которых соотношение (2) делается в пределе точным в смысле Σ \ρ-ρ·\-+ο. (3> m=o Чаще всего используют приближение лапласовского типа Pi (m/ΛΓ, Μ) = -yL- r(«"W, (4) у 2π<5 где а = пр, (5) σ2 = пр (1 _ р) (# _ n)i(N _ i)f (6) ρ = Μ/Ν. (7) Наиболее широко известные нам условия применимости приближения (4) таковы ь. λ = η/Ν < λ0 < 1, а = пр ->■ оо, тг (1 — р) ->■ ооА (8) где λ0 предполагается постоянным. Условие λ<^λ0<[1 не является стеснительным, так как при А ;> 1/2 можно перейти к «дополнительной» выборке из остающихся тг' = N - и шаров, для которой λ' < V2. * УМН, 1951, т. 6, вып. 3, с. 133—134. ж. г Ср. для бернуллиевской схемы статью: Козуляев П. Α.— Уч. зап. МГУ. Математика, 1939, вып. 15, с. 179—182.
372 40. Обобщение формулы Пуассона Поэтому из всех случаев, в которых Ίι ->■ оо, остается рассмотреть лишь случаи ограниченного а = пр и ограниченного тг (1 — р). Второй из этих случаев сводится к первому при помощи переименования белых шаров в черные, а черных — в белые. Задачей настоящей заметки является указать, что в случае η ->■ оо, а = пр <; с (9) законно следующее обобщенное пуассоновское приближение; Pt (m/N, M) = a{a-%){a-2X)^.{a^{m-l)%) ^ (1Q) где со = _[log (1 - λ)]/λ. (11) Приближение (10) законно и при более широких условиях. Именно для его применимости в смысле (3) достаточно условия р-+0. (12) При помощи легко проверяемого тождества а (а — λ) (а — 2λ).. .(а — (т — 1) λ) ^_ωα _ Qm^m , j χ\η~™ fi оч т\(1-Х)т М К } [ίό) и известной двойственности Рп (m/N, Μ) = Рм {mlΝ, η) (14) вопрос сводится к доказательству того, что биномиальное приближение Рп (τη/Ν, Μ) = С?рт (1 - РГт (15) применимо в смысле (3) при условии λ -»- 0. (16)
41. Некоторые работы последних лет в области предельных теорем 373 41 НЕКОТОРЫЕ РАБОТЫ ПОСЛЕДНИХ ЛЕТ В ОБЛАСТИ ПРЕДЕЛЬНЫХ ТЕОРЕМ ТЕОРИИ ВЕРОЯТНОСТЕЙ* ВВЕДЕНИЕ В середине 40-х годов существовало мнение, что проблематика предельных теорем классического типа (т. е. проблематика предельного поведения распределений сумм большого числа независимых или связанных в цепь Маркова слагаемых) в основном закончена. Написанная мной совместно с Б. В. Гнеденко монография [1] имела в виду подведение итогов работы предшествующих лет. В действительности, однако, с конца 40-х годов наблюдается значительное оживление работы именно в этих классических направлениях. Объясняется это несколькими обстоятельствами. Во-первых, стало выясняться, что с практической точки зрения точность оценок остаточных членов, полученных до настоящего времени, далеко не достаточна. Во-вторых, некоторые задачи,- поддававшиеся ранее решению лишь при сложных и весьма ограниченных условиях, неожиданно получили весьма простое и вполне законченное (в смысле необходимых и достаточных условий) решение. К такого рода вопросам относится, например, задача «локализации» предельных теорем, которая оказалась для случая одинаково распределенных независимых слагаемых и для случая распределения числа попаданий в отдельные состояния в однородной цепи Маркова допускающей исчерпывающее решение. Естественно, что эти успехи возбуждают желание добиться столь же окончательных результатов и в ряде других случаев. Наконец, сами постановки задач благодаря введению надлежащих расстояний между распределениями и заимствованной из теории наилучших приближений идеи вычисления точных верхних границ остаточных членов получили большую отточенность и прозрачность. В настоящей статье дается краткое изложение результатов некоторых работ последних лет, которые могут иллюстрировать указанные сейчас новые тенденции. Результаты, изложенные в монографии [1], предполагаются читателю известными, хотя иногда и упоминаются ради связности изложения. § 1 ОЦЕНКА БЛИЗОСТИ РАСПРЕДЕЛЕНИЙ И РАЗЛИЧНЫЕ ВИДЫ СХОДИМОСТИ РАСПРЕДЕЛЕНИЙ Если ξ есть случайный элемент некоторого множества X, то распределением вероятностей случайного элемента ξ называется * Вести. МГУ, 1953, т. 10, с. 29—38.
374 41. Некоторые работы последних лет в области предельных теорем функция Р(А) = Р{1(=А}, определенная для надлежащей системы подмножества А множества X и указывающая вероятность попадания ξ на А. В тех случаях, когда X есть метрическое пространство (например, числовая прямая Л1, координатное ^-мерное пространство Дп), мы будем считать, что Ρ (А) определено для ^-множеств и только для них. При этом условии, как известно, в одномерном случае Ρ (А) однозначно определяется соответствующей функцией распределения F (χ) = Ρ {ζ < х]. Наиболее естественно считать два распределения Рг и Р2 близкими, если вероятности Рх( А) и Р2 (А) близки для всех входящих в рассмотрение множеств А. Этому пониманию близости соответствует расстояние между распределениями Pi (Ръ Ръ) = sup | Рг (А) - Р2 (А) |, А где верхняя грань берется по всем А, для которых вероятности считаются определенными. В одномерном случае рг (Рх, Р2) равно половине полной вариации разности F± — F2: Pi (Λ, Ρ*) = V2 var (Fx - F2). Сходимость распределений Рп к распределению Рг определенную требованием Ρι(Ρη, Ρ)-* О, будем называть сходимостью по вариации. Эта сходимость является наиболее сильной из сходимостей, имеющих прямой вероятностный смысл: если два распределения достаточно близки в смысле расстояния р1? то во всех реальных задачах, имеющих дело с ограниченным (хотя бы и весьма большим) числом испытаний, распределения Pi и Р2 практически равноценны 1. В одномерном случае иногда нас могут интересовать только вероятности Ρ (Δ) для интервалов. Можно было бы определить новое расстояние р' (Р19 Р2) формулой ρ' (Λ, Рг) = sup | Рг (Δ) - Р2 (Δ) |, 1 Пусть Рп есть распределение системы (ξΐ7 ξ2> · · ·> In) независимых случайных элементов ξ&, каждый из которых следует распределению Р. Тогда легко доказывается неравенство pj (Ρ™, Р2) < прх (Р1? Р2), которое показывает, что в случае, когда прг (Р1? Р2) достаточно мало, вероятность любого заданного исхода η независимых испытаний при действии распределения Рг мало отличается от вероятности того же исхода при действии распределения Р2.
41. Некоторые работы последних лет в области предельных теорем 375 где верхняя грань берется по всем интервалам Δ. Легко, однако, доказывается, что всегда sup | Fx - F, |< Ρ' (Plt Р2) < 2sup \FX-Ft |. Поэтому употребление расстояния р' в основном равноценно ноль· зованию расстоянием ρ,(Λ. ^ι) = в<ч> I Pi - F* Ι· Очевидно, что всегда р2 (Ρι, Ρ*) < Pi (*ι. Λ)· -Сходимость в смысле р2 (Р», Р)-+0 мы будем называть сильной сходимостью распределений. Требование сильной сходимости слабее, чем требование сходимости по вариации. Практически случайные величины обычно измеряются и бывают интересны лишь с той или иной точностью. С этой точки зрения введенные выше расстояния рх и р2 иногда преувеличивают практическую значимость различия между двумя распределениями. HanpnMept для вырожденных распределений , .ν Г1, если х^А, Βχ(Λ)-\0, если хфА, при афЪ всегда Ρι (εα, Ч) = Р2 (во» еь) = 1. Между тем в случае, когда разность Ъ — а мала, практически распределения га и &ь естественно считать близкими друг к другу. Можно подойти к уточнению сделанного замечания так. Обозначим через Ρ α) распределение величины η = ξ + δ, где величина ξ подчинена распределению Р, а величина δ (ошибка измерения) независима от ξ и подчинена нормальному распределению со средним значением 0 и дисперсией σ2. Введем две новые сходимости требованиями: а) Рп-^ру если при любом σ ^> О Ρι (Ρ(η\ Ρ<σ>)-^0; б) Рп -> р? если при любом σ ]> О Р2 (Р(п\ РЮ)->0. Эти формально различные сходимости оказываются, однако, в действительности равносильными хорошо известной слабой сходимости распределений.
376 41. Некоторые риботы последних лет в области предельных теорем Мы ограничились распределениями на прямой и несколько произвольно ввели ошибки, подчиненные нормальному распределению вероятностей. Можно, однако, думать, что и в более общей обстановке слабая сходимость 2 хорошо соответствует идее близости распределений, учитывающей практическую равноценность (или неотличимость) близких точек множества X. Слабая сходимость слабее сходимости по вариации (в любом метрическом пространстве Z), а также слабее сильной сходимости в смысле расстояния р2 (на числовой прямой). Слабую сходимость распределений в любом метрическом пространстве можно определить при помощи надлежащим образом введенного расстояния. На числовой прямой для этой цели может служить расстояние Леви L (Рп, Р) (см. [1, § 9]). Однако все такие расстояния искусственны и неинвариантны по отношению к простейшим преобразованиям пространства X (например, преобразованиям подобия на числовой прямой). Этим слабая сходимость отличается от сходимости по вариации и определенной выше (для случая числовой Прямой) сильной сходимости, которые связаны с вполне естественными определениями расстояния между распределениями 3. § 2 ЗАПАС ВОЗМОЖНЫХ ПРЕДЕЛЬНЫХ РАСПРЕДЕЛЕНИЙ, СЕМЕЙСТВА РАСПРЕДЕЛЕНИЙ, ДОСТАТОЧНЫЕ ДЛЯ РАВНОМЕРНОЙ АППРОКСИМАЦИИ В течение долгого времени общие предельные теоремы находились ощупью. Для какого-либо частного случая удавалось рассчитать предельное распределение, и только после этого ставилась задача нахождения общих условий сходимости к этому распределению. Первым известньш мне примером другого подхода к делу является теорема Леви о предельных распределениях для последовательных сумм ζη = ξΐ + ?2 + · · · + ζη членов последовательности независимых одинаково распределенных слагаемых (см. [1, § 33])» Теорема эта заключается в том, что распределения величин (ζη-Αη)/Βη 2 Будем говорить, что в произвольном метрическом пространстве X распределения Рп слабо сходятся к распределению Р, если для любой ограниченной непрерывной функции / (х) имеет место соотношение \ fdPn —»\ fdP. XX 3 Очевидно, что расстояние рх инвариантно по отношению ко всем взаимно однозначным преобразованиям множества χ в себя. Расстояние р2 инвариантно* по отношению к взаимно однозначным преобразованиям прямой в себя»
41» Некоторые работы последних лет в области предельных теорем 377 могут слабо сходиться только к устойчивому распределению и притом (при надлежащем выборе распределения слагаемых ξη) к любому. Только значительно позднее В. Деблин и Б. В. Гнеденко до конца исследовали условия, при которых такая сходимость имеет место вообще или к тому или иному определенному устойчивому закону (см. [1, § 35]). Еще большее значение имеет теорема А. Я. Хинчина, характеризующая класс возможных предельных законов для распределений сумм Ъп == feral Т~ ъп2 ~т~ · · · т~ bnmn независимых «бесконечно малых» слагаемых (см. [1, § 24]). Класс этот в силу теоремы Хинчина совпадает с классом неограниченно делимых распределений 4. В теоремах Леви и Хинчина речь идет о слабой сходимости. Ясно, что при переходе к той или иной более сильной сходимости класс возможных предельных законов мог бы только сузиться. В действительности при переходе к сильной сходимости в смысле расстояния р2 или даже к сходимости по вариации он остается одним и тем же. Существует вполне обоснованное мнение, что для случая сумм независимых слагаемых теорема Хинчина указывает наиболее широкий класс представляющих интерес предельных распределений. Вскоре после установления этой теоремы Б. В. Гнеденко было закончено изучение условий сходимости к любому неограниченно делимому распределению (см. [1, § 25—27]), чем вопрос о предельном поведении сумм возрастающего числа независимых слагаемых, каждое из которых «предельно пренебрегаемо», был с точки зрения сходимости в существенном исчерпан. Для схем с зависимыми испытаниями аналогичные вопросы изучены еще мало. В виде образца вполне законченного исследования для сравнительно частной схемы можно указать на недавнюю работу Р. Л. Добрушина [2]. Здесь исследован случай сумм Ьп — bnl ~Т~ Ьп2 "Т" · · · ~Т~ Ъппч где величины ξη^ принимают только два значения 0 и 1 и связаны в пределах каждой серии в простую однородную цепь Маркова с матрицей переходных вероятностей \Рп ί-ρ„\ зависящей только от номера серии п, но не от номера к испытания в серии. Если бы величины %пк были независимы (т. е. в случае ρ = = qn), в качестве предельных распределений для величин _% = (ζη - АЛ/Вп 4 То, что мы не включаем в выражение ζη не зависящее от случая слагаемое An (ср. формулу (1) на с. 119 в [1]), не меняет дела. Теорема Хинчина верна и в такой формулировке.
378 41. Некоторые работы последних лет в области предельных теорем могли бы появиться только вырожденное распределение εη, нормальное распределение, распределение Пуассона и распределения, которые могут быть получены из этих трех линейными преобразованиями 5. В случае произвольных рп и qn задача становится много сложнее и перечисление всех возможных предельных распределений величин ηη требует для своего решения привлечения ряда новых остроумных соображений. Исследование аналогичных вопросов для случая цепей Маркова с любым конечным числом состояний (и притом не обязательно однородных) начато в работах Купмена (см., например, [14]). Было бы весьма интересно, хотя бы для однородного случая с любым числом состояний 5, получить столь же законченные результаты, как полученные Р. Л. Добрушиным в случае s = 2. При оценке близости распределений с помощью того или иного расстояния между распределениями ρ (Pl9 Р2) может быть поставлен вопрос о сходимости не к индивидуальному распределению, а к целому классу распределений. Например, можно поставить вопрос о том, обязана ли сумма 5 — Ь1 ~Г Ь2 ~Г · · · + ζη независимых одинаково распределенных слагаемых ξ& при η —>· оо приобретать распределение, близкое к неограниченно делимому в смысле какого-либо расстояния р. Более точно вопрос заключается в том, существует ли для каждого ε ]> О такое JV, что при η > Ν для распределения Ρ суммы ζ непременно найдется неограниченно делимое распределение, удовлетворяющее условию S: Ρ(Λ 5)<ε. Пока имеется мало работ, в которых подобного рода задачи решались бы в обстановке, существенно несводимой к предельным теоремам обычного типа. Отметим, что в указанной выше работе Р. Л. Доб- рушина вопрос об аппроксимации распределений сумм ζη решен для рассмотренного им случая и в смысле такого рода равномерной аппроксимации (при η —>· оо) для расстояния рх. Результат Добрушина довольно сложен из-за необходимости перечисления большого числа специальных распределений. Его принципиальную сторону можно пояснить на частном случае независимых величин ξη&, который несколько ранее был рассмотрен Ю. В. Прохоровым [3]. В этом случае речь идет просто о равномерной аппроксимации в смысле расстояния рх биномиального распределения Впр, задаваемого формулой Ρ {ζ = 2} = СгпРг (1 - р)п-\ 5 Этот результат П. А. Козуляева содержится в общих теоремах § 26 и 27 яз [1].
41. Некоторые работы последних лет в области предельных теорем 379 Обозначим через Lnp приближение к Впр, употребляемое в локальной теореме Лапласа, через Рпр приближение к Впр по Пуассону, употребляемое при значениях вероятности /?, близких к нулю, и через Рпр приближение, которое получится, если приближать по Пуассону величину η — ζ (что естественно при р, близких к единице). Разумно пользоваться каждым из этих приближений там, где соответствующее расстояние pi(Bnpi Lnp), pi{Bnp, Pnp), pi(Bnp, Pnp) меньше. Теорема Прохорова заключается в том, что enp = min{Pi(#np> Lnp), Pi(Bnp, Pnp), Pi(Bnp, Fnp)} стремится к нулю при η ->- оо равномерно по р. Таким образом семейство распределений Lnp, Pnp и Рпр оказывается достаточным для равномерной аппроксимации распределений Впр при п-^оо. В более простой обстановке, когда аппроксимирующими распределениями являются линейные преобразования нормального распределения, задаваемого функцией распределения ф<*>=тйг !τ~"'ώ· ΐ/2π а в качестве расстояния берется расстояние р2, такого рода теоремы о равномерной аппроксимации по существу не являются новостью (см. § 4). Но сознательные^поиски семейств, достаточных для равномерной аппроксимации в более сложных случаях, начались недавно и в этом направлении остается еще очень много сделать. § 3 ЛОКАЛЬНЫЕ ТЕОРЕМЫ И СХОДИМОСТЬ ПО ВАРИАЦИИ Любое распределение Ρ (А) на прямой записывается в виде Р(А)= §p(x)dx + q(A), А где ρ (χ) — соответствующая плотность вероятности, а ψ (А) — сингулярная часть распределения. Если ψ = 0, то распределение Ρ непрерывно. Если хотя бы одно из распределений Рх и Р2 непрерывно, то имеют место неравенства σο оо Τ \ [Pi —P2|^<pi(Pi, Р2)< ^ \pi-P2\dx. Поэтому сходимость по вариации р1(Рп,Р)-*0 в случае непрерывности предельного распределения Ρ равносильна сходимости
380 41. Некоторые работы последних лет в области предельных теорем в среднем плотностей: оо I \Рп~p\dx-*0. —оо Локальными теоремами о сходимости плотностей вероятности к плотности вероятности предельного распределения много занимались 6. При этом обычно интересовались условиями равномерной сходимости плотностей. Как было отмечено выше, собственно с вероятностной точки зрения это излишне. В работе Ю. В. Прохорова [4] показано, что переход к сходимости по вариации (т. е. в рассматриваемом сейчас случае непрерывного предельного распределения — к сходимости плотностей в среднем) приводит к возможности получения очень простых необходимых и достаточных условий сходимости для случая одинаково распределенных независимых слагаемых. Именно им было показано, что в условиях приведенной выше теоремы Леви для сходимости распределений величин (ζη — Λη)/Βη к устойчивому распределению необходима и достаточна совокупность двух требований: 1) должна иметься слабая сходимость к 5, 2) при каком-либо η распределение величины ζη должно иметь не равную тождественно нулю непрерывную компоненту. Рядом с локальными теоремами для плотностей принято рассматривать локальные теоремы дискретного арифметического типа для «решетчатых» распределений (см. [1, § 48—50]). Локальные теоремы этого типа связаны с операцией перенесения непрерывного распределения с плотностью ρ (χ) на «решетку» точек Хк = kh + α. Операцию эту можно осуществить, например, приписывая каждой точке хк решетки вероятность Ρ к = j p(x)dx. Xft—h/2 Если в обстановке теоремы Леви величины ξη решетчаты с шагом А, то величины ηη = (ζη — Αη)/Βη будут решетчатыми с шагом hn = h/Bn. Б. В. Гнеденко [5] было показано, что в случае, если шаг h для величин ξη максимален и распределения величин ηη слабо сходятся к устойчивому распределению 5, то расстояние по вариации между распределением Fn величины ηη и распределением Sn, получаю- 6 См. [1, § 46 и 47], а также венгерский перевод этой книги, где формулировки локальных теорем улучшены.
41. Некоторые работы последних лет в области предельных теорем 381 щимся при перенесении распределения S на решетку возможных значений величины r]m, стремится при w->oo к нулю: Р (F», $п) -> 0. Теоремы Прохорова и Гнеденко ограничиваются случаем одинаково распределенных слагаемых. Но во всяком случае они показывают, что в направлении «локализации» предельных теорем возможны значительно более общие и законченные результаты, чем эта казалось ранее. В заключение этого параграфа отметим еще работы по арифметическим многомерным локальным теоремам [6—10]. Первые три [6—8] из них посвящены многомерному обобщению изложенного результата Гнеденко. Четвертая [9] исчерпывающим образом решает вопрос об аппроксимации по вариации распределения числа попаданий в отдельные состояния за h шагов в случае однородной цепи Маркова с конечным числом состояний. Пятая [10] содержит весьма глубокие, хотя и менее окончательные результаты для неоднородных цепей Маркова. § 4 ТОЧНАЯ ОЦЕНКА ОСТАТОЧНЫХ ЧЛЕНОВ И УЛУЧШЕНИЕ ПРИБЛИЖЕНИЙ В работе Ю. В. Прохорова [3], кроме величины гпр = min {pi (Впр, Lnp), pi (Впр, Pnp\ pi (Bnv, РПр)}, рассмотрена величина &п == sup εηρ 0<ρ<1 и доказано, что εη = λη1* + О (и-'/з), где λ = (AJA y== (1 + 4eJ/·)·/. e-V. = 0,42 ... Таким образом, в смысле расстояния по вариации найдена асимптотически точная оценка наибольшего отклонения (при заданном η и переменном р) биномиального распределения от наиболее подходящего из приближений Lnp, Pnp и Рпр. Этот довольно узкий результат может служить примером намечающейся в работах последнего десятилетия техники оценки остаточных членов. Для сумм произвольно распределенных независимых слагаемых вполне законченных результатов такого типа пока не существует. Мы рассмотрим те из возникающих здесь задач, которые- связаны с так называемым ляпуновским отношением.
382 41. Некоторые работы последних лет в области предельных теорем Для простоты обозначений предположим, что сумма ζ = ξι + ξ2 + . . . + U ήθ38βηοημηχ слагаемых £fe нормирована, т. е. имеет математическое ожидание 0 и дисперсию 1. Тогда «ляпуновское отношение» запишется в виде ^=ΣΜ|ξΛ-Μ^|3. Хорошо известно, что при L ->· О для функции распределения F (ζ) «суммы ζ имеет место предельное соотношение —оо Введем в рассмотрение величины ρ (Ι, ζ) = sup I F (ζ) - Φ (z) 1,1 ρ (Ζ) = sup ρ (Ζ, ζ) = sup 'p2 (F, Φ). ζ L=l Жрамером было показано, что сх1 < ρ (Ζ)< c2lr где сг я сЛ — положительные константы. Естественно поэтому рассмотреть отношение ρ(Ζ)/Ζ, его верхнюю грань Ρ (О с = sup -t-j-1· и его верхний предел c* = limsup-^-у-^-. Оценки р2 (Ft Φ) < cL, Pa (f, Φ) < c*L + ο (L) -будут в -отношении множителей при L наилучшими из возможных· Очевидно, что с* < с. Шосле работы Берри [15], рассмотревшего более специальную задачу, Эссеен [16] доказал, что 1//2я < с < 15/2.
41. Некоторые работы последних лет в области предельных теорем 383 Вопросы возможно более точной оценки или точного вычисления констант с и с* и особенно функций * / \ τ ρ (*,ζ) τ ΙF (z) — φ (ζ) I c*(z) = limsup-i--^—^ = limsup ~—^-j i-LL i-*o l l->o ь представляются чрезвычайно интересными. Если на характер слагаемых £fe наложить те или иные дополнительные ограничения, то значения с и с* и функций c(-z) и с* (ζ} могут уменьшиться. В предположении симметричных распределений слагаемых и некоторых других ограничений, необходимость которых неясна, 10. В. Линник [И] доказал, что с* = -4=, с* (*) = -4= <г*а/2. Возможно, что эти формулы верны при единственном ограничении симметричности распределений слагаемых ξ. Что же касается первой из этих формул, то возможно, что она верна и в общем случае» Не опровергнута даже гипотеза с = 1//2π. Было бы очень важно исследовать с той же точки зрения (получения равномерно действующих точных или асимптотически точных оценок остаточных членов) также и приближения для распределении? еумм большого числа независимых слагаемых, использующие поправки к нормальному распределению, зависящие от старших моментов и выражающиеся через многочлены Чебышева—Эрмита. В этом направлении еще почти ничего не сделано. Зато следует отметить замечательную работу С. X. Сираждинова [13], в которой локальные теоремы с уточнениями, зависящими от старших моментов и дающими остаточные члены порядка ί/ηα со сколь угодно большим показателем а, распространены на распределение числа попаданий за η шагов в отдельные состояния в однородной цепи Маркова с конечным числом состояний. 3 сентября 1953 г. ЛИТЕРАТУРА 1. Гнеденко Б. В., Колмогоров А. Н. Предельные распределения для сумм независимых случайных величин. М.; Л.: Гостехиздат, 1949. 264 с. 2. Добрушин Р. Л,— Изв. АН СССР. Сер. мат., 1953, т. 17, с. 285. 3. Прохоров Ю. В.— УМН, 1953, т. 8, вып. 3, с. 135—142. 4. Прохоров Ю. В.— ДАН СССР, 1952, т. 83, с. 797—800. 5. Гнеденко Б. В.— ДАН СССР, 1950, т. 71, с. 425—428. 6. Мейзлер Д. Г., Парасюк О. С, Рвачееа Е. Л".— ДАН СССР, 1948, т. 60,, с 1127—1128. 7. Мейзлер Д. Г., Парасюк О. С, Рвачееа Е. Л,— Укр. мат. журн., 1949г. с. 9—20.
384 ' 42. О сходимости А. В. Скорохода 8. Рвачева Е. Л.— Тр. Ин-та математики и механики АН УзССР, 1953, вып. 10 ч. 1, с. 106—121. 9. Колмогоров А. Н.— Изв. АН СССР. Сер. мат., 1949, т. 13, с. 281—300. 10. Линник Ю. £., Сапогов Η. Α.— Изв. АН СССР. Сер. мат., 1949, т. 13 с. 533—566. 11. Линник Ю. В.— Изв. АН СССР. Сер. мат., 1947, т. 11, с. 111—138. 12. Прохоров Ю. В.— Изв. АН СССР. Сер. мат., 1952, т. 16, с. 281—292. 13. Сираждинов С. X.— ДАН СССР, 1952, т. 84, с. 1143—1146. 14. Коортап В. О.— Trans. Amer. Math. Soc, 1951, vol. 70, p. 277—290. 15. Berry A. G.— Trans. Amer. Math. Soc, 1941, vol. 49, p. 122—136. 16. Esseen C. G.— Acta math., 1945, vol. 77, p. 1—125. 42 О СХОДИМОСТИ А.В.СКОРОХОДА* При описании временного течения реального процесса с по- гмощью функции / (t) от времени £, принимающей значения из надлежащим образом выбранного «фазового пространства» X, часто оказывается естественным и законным допущение, что функция / имеет только разрывы первого рода (скачки). Для детального исследования такого рода процессов оказывается полезным введение в множестве D функций с разрывами первого рода (которые для определенности мы будем рассматривать на единичном отрезке 0 ^ t <^ 1) соответствующей топологии. Топология равномерной сходимости, естественная при изучении непрерывных процессов, оказывается при изучении процессов с разрывами первого рода слишком сильной. Например, естественно желать, чтобы последовательность функций (#1 при t<tn, Mi)~U при *>*„, где tn ->- t0 при η -> оо, сходилась к функции Χι при t < to, [х2 при t^>to, так как'функцияУп при большом η отличается от функции / лишь малым сдвигом момента скачка из состояния хх в состояние х2> Как известно, в пространстве равномерной сходимости такая сходимость при хх Φ хг не имеет места. С другой стороны, топология в D не должна быть слишком слабой, так как желательно, чтобы наиболее существенные свойства ^функции / ΕΞ D сохранялись при предельном переходе. Например, * Теория вероятностей и ее применения, 1956, т. 1, № 2, с. 239—247.
42. О сходимости А. В. Скорохода 385 желательно, чтобы в предположений сходимости /п к / из hi ~*" ^"1 U (tn + 0) - fn (tn-0)-+c=£0 вытекало, что / (f + 0) - / (f - 0) = с Уже соблюдение высказанных сейчас двух пожеланий требует введения в D новой топологии, специально приспособленной к потребностям исследования процессов с разрывами первого рода. Такого рода топология предложена в работах [1, 2] А. В. Скороходом. В этих работах А. В. Скороход для случая действительных функций / (t) (т. е. для случая, когда X есть действительная прямая) определяет в D некоторую сходимость (мы будем называть ее 5-сходи- мостью) и отмечает, что эта сходимость превращает множество D в хаусдорфово топологическое пространство. Далее в § 2 дается новое определение ^-сходимости, применимое в предположении, что X есть произвольное метрическое пространство, и обнаруживается, что возникающее таким образом топологическое пространство SD метризуемо. Введенное в § 2 с этой целью расстояние s (/, g) и соответствующая ему равномерная топология представляются мне весьма естественными и удобными в применениях, несмотря на то что даже в случае полного пространства X метрическое пространство sD не полно. В конце § 2 дается одно простое необходимое и достаточное условие /^-компактности. Результаты § 3 (как и теорема IV § 2) существенно опираются на предположение, что фазовое пространство X полно (для простоты мы е?о в дальнейшем принимаем с самого начала). В § 3 пополнение метрического пространства sD получает конкретную интерпретацию при помощи /^-кривых в пространстве R — = Τ χ Т. Эта интерпретация используется для доказательства возможности ввести в D другое расстояние s* (/, g), порождающее ту же самую скороходовскую сходимость и топологию, но превращающее D в полное метрическое пространство s*D. При изложении результатов этой работы в семинаре по теории вероятностей в Московском университете я поставил задачу возможно более простого явного построения расстояния &·* (/, g). Эта задача была решена К). В. Прохоровым [3]. § 1 посвящен некоторым вспомогательным рассмотрениям, польза которых обнаруживается в § 3. Содержание § 2 можно было бы с таким же удобством изложить и не вводя множества Θ, а пользуясь обычной техникой изображения процессов с разрывами первого Рода, например при помощи непрерывных справа функций Г (*) = / (t + 0) Действительного переменного t. ^3 Α. Ή. Колмогоров
386 42. О сходимости А. В. Скорохода КЛАСС ФУНКЦИЙ D = Dx При описании реальных процессов с помощью функций / [t) с разрывами первого рода обычно можно считать, что реальные явления, происходящие в момент скачка t, полностью описываются предельными значениями слева и справа: / (t — 0) и / (t — 0). Только в порядке математической условности само значение / (t) в точке скачка определяется при помощи одного из соглашений f(t) = f(t- 0) или /(*) = /(« + 0), или в случае действительных функций соглашением /(ί) = 1/ϊ[/(ί-0)+/(ί + 0)]. По существу логичнее вообще рассматривать функции / (Θ) от символов θ вида t — 0 или t + 0 и лишь в случае / (t — 0) = / (t 4- 0) обозначать их общее значение через / (£), считая / (t) неопределенным в случае / (t — 0) Φ f (t + 0). При изложении теории /)-кривых? излагаемой в § 3, такой подход к делу имеет и формальные преимущества: некоторая дополнительная затрата труда в § *1 окупается более сжатым и прозрачным изложением § 3. Будем обозначать через θ множество символов θ одного из двух видов: θ -= t — 0, 0<f <1, . θ = t + 0, 0 <ί< 1. Отношения порядка между элементами θ ΕΞ θ устанавливаются при помощи соглашений 1) t ± 0 < t' ± 0, если t < t\ 2) t- 0<t + 0. Будем считать, что θη -> t - 0, если для любого ε ^> 0 существует такое η (ε), что при η > η (ε) выполняются неравенства £-ε + 0<θη<ί-0, и считать, что если для любого ε ]> 0 существует такое η (ε), что при п^ η (ε) выполняются неравенства * + 0<θη<£ + ε-0.
42. О сходимости А. В. Скорохода 387 Определенная таким образом сходимость превращает множество Θ в бикомпактное топологическое пространство (см. [5]). То обстоятельство, что это пространство неметризуемо, не помешает его употреблению в дальнейших построениях. Класс Όχ по определению состоит из функций / (θ), определенных на θ со значениями из метрического пространства X, непрерывных в том смысле, что из θ?1->θ вытекает / (θ„) -»/ (θ). Легко доказать, что для любой функции / ΕΞ D = Όχ функция Г (t) = / (t + 0) определена при всех t из полусегмента 0 <^ t < 1, непрерывна справа π имеет в каждой точке t полусегмента 0 < t <^ 1 предельное значение слева Г (t - 0) = / (t - о). Ясно, что соответствие между функциями / ΕΞ D и функциями /% обладающими описанными свойствами, взаимно однозначно. Для любого множества ¥С0 определим «колебание» функции / ΕΞ D на Μ формулой ω/ (Μ) — sup ρ (χ, χ'). Специальный интерес будут далее представлять «сегменты» пространства Θ, т. е. множества [θ\ θ"] - {θ; θ' < θ < θ"}. В частности, сегмент [t — 0, t + 0] состоит из двух точек — своих концов t — 0 и t + 0. Для него со/ [t - 0, t + 0] = I / (t + 0) - / (t - 0) |. Легко доказывается Теорема I. Для того чтобы определенная на Θ функция / (θ) со значениями из X принадлежала классу D, необходимо и достаточно существование при любом ε ^> 0 таких 0 = f0< *ι< - - - <fft=.l, что при всех к = 1, 2, . . ., η выполнено неравенство со/ Ufc-1 + 0, h ~ 0] < ε.
388 42. О сходимости А. В. Скорохода § 2 ^-СХОДИМОСТЬ И РАССТОЯНИЕ s (/, g) Определение 1. Две функции f ΕΞ D и g ΕΞ D называются s-эквивалентными, если существуют такие г и 0 = i0 < h < . . . < tr = 1, 0 = to < ii < . . . < t'r = 1, что при Л = 1, 2, . . ., г соблюдаются неравенства 1 h — ft I < ε, sup ρ(/(θ),*(θ'))<β. ee[ift-i+of *ft-o] ε-Эквивалентность далее обозначается символом Определение 2. Последовательность функций /η ΕΞ /> называется S-сходящейся к функции /ED, если для любого ε ^> О существует такое η (ε), что при η Ξ> τι (ε) /»~Α ^-сходимость далее обозначается символом Это и есть сходимость, введенная в случае, когда X есть числовая прямая, А. В. Скороходом. Положим теперь s (/, g) = inf ε. Теорема П. Множество D с расстоянием s (/, g) является метрическим пространством. В самом деле, легко видеть, что s (/, g) для любых f ΕΞ D m g ΕΞ D действительно и неотрицательно. Из теоремы I вытекает, что s (/, /) = 0. Без большого труда можно установить, что * (/, g) = о только в случае / = g. Симметричность расстояния s (/, g) очевидна в силу его определения. Выполнение неравенства 8 (/, h) < S (/, g)+S (g, h) вытекает из следующей легко доказываемой леммы:
42. О сходимости А. В. Скорохода 389 Лемма. ε f~g, то ε+ε' Если ε' Очевидна Теорема III. /«Д/ необходимо и s (/„, /) -> Для достаточно 0. сходимости выполнение условия Если только пространство Ζ содержит две различные точки хгф х2, то метрическое пространство &D не является полным, так как при tn "^ to "С. 1, 1п —>■ ίο, последовательность функций (xi при 0 + 0 < θ < tn —.0, /η(θ)= *а при ίη + 0 < θ < ί0 — 0, [xi при ί0 + 0<θ<1—0 удовлетворяет критерию Коши, но не является сходящейся. В связи с этим интересна Теорема IV. Для того чтобы последовательность функций /nGl), удовлетворяющая критерию Коши lim sup s (/n, /n+p) - 0, сходилась к функции /Gfl, необходимо и достаточно условие: (*) <9л«я любого ε ^> 0 существует такое δ ^> 0, что тфи каждом η и t е (0; 1) ω/η [0 + 0, δ - 0] < ε, ω/η [1 - δ + 0, 1 - 0] < ε, ω*/η [ί + 0, ί + δ - 0] < ε, где ω*/ [θ, ΘΊ = inf max {ω/ [θ, ί - 0], ω/ (ί + 0, θ')}. t Следует отметить, что величины ω*/ сходны с величинами γ/? уже применявшимися при изучении функций класса D Е. Б. Дын- киным в работе [4]. К теореме IV тесно примыкает
390 42. О сходимости А. В. Скорохода Теорема V. Для того чтобы множество Μ cz D было компактно в пространстве SD скороход овской сходимости, необходимо и достаточно одновременное выполнение двух условий: 1) существует такой компакт К cz Ζ), что все значения f (θ) функции t Ε! Μ в точках θ ΕΞ θ принадлежат К\ 2) для любого ε > 0 существует такое δ ^> 0, что из f ΕΞ Μ вытекают неравенства со/ [0 + 0, δ - 0] < ε, ω/ [1 - δ + 0, 1 - 0] < ε, ω*/ [t + 0, ί + δ - 0] < ε. § 3 ГРАФИКИ ФУНКЦИЙ КЛАССА D и Я-КРИВЫЕ В ПРОСТРАНСТВЕ i? = Τ Χ Γ Будем обозначать буквой Г единичный сегмент Τ = {t; 0< f < 1} действительной прямой и буквой R прямое произведение R = Τ Χ Τ = {(*, ^ίΕΓ,^Ε Χ}. Это прямое произведение будем рассматривать как метрическое пространство с расстоянием ρ ((ί, χ), (t\ χ')) = max {| ί' — t |, ρ (ж, х')}. Графиком функции f ΕΞ D будем называть множество Г/ точек пространства R любого из. двух типов: (t, f (t - 0)) или (t, f (t + 0)). Легко видеть, что определенная на θ функция φ, (t - 0) = (t, f (t - 0)), φ, (ί + 0) = (t, f (t + 0)) со значениями из R непрерывна в смысле, разъясненном в § 1. Она отображает θ на Г/, причем порядок, установленный на θ (отношения неравенства θ < θ', определенные в § 1), создает определенный порядок пробегания графика Г/. Будем теперь независимо от графиков функции / из D = Οχ рассматривать непрерывные в смысле § 1 отображения θ в пространство /?, т. е. функции φ (θ) класса Dr. Назовем две- функции φ ΕΞ ΕΞ Dr и ψ ΕΞ Dr эквивалентными, если существуют такие монотонные, т. е. удовлетворяющие условию X Ю > Χ (Θ), когда θ' > Θ, отображения χ и χ2 пространства θ на самого себя, что φ (%г (θ)) = Ψ (χ2 (θ)).
42. О сходимости А. В. Скорохода 391 По этому отношению эквивалентности функции φ ΕΞ Dr разбиваются на классы φ, которые естественно называть D-кривымы в пространстве R. Между D-кривыми естественно ввести расстояние при помощи формулы Ρ (Φ, Ψ) = mf sup ρ (φ (θ), ψ (θ)). Теория D-кривых вполне аналогична теории непрерывных кривых. Расстояние ρ (φ, φ) превращает множество Φ всех D-кривых пространства R в полное метрическое пространство. Имеет место Теорема VI. Функция f ΕΞ D однозначно определяется соответствующей ей кривой Ϊ = Ф/. При этом всегда s (/, g) = Ρ (/, f). Теорема VI доставляет нам новую интерпретацию расстояния s (/, g) и /S-сходимости: /S-сходимость последовательности функции fn к функции / оказывается равносильной сходимости в смысле расстояния ρ (φ, .φ) кривых fn к кривой /. Для дальнейшего целесообразно ввести обозначения τφ (θ),; ξφ (θ) компонент функции φ (θ) = (τφ (θ), |φ (θ)). Обозначим через Л множество D-кривых /, соответствующих функ" циям / ΕΞ D, а через Л замыкание множества Л в пространстве Ф. Легко доказать, что ФЕФЕЛ в том и только в том случае, если выполнены следующие условия: (λχ) τφ (θ) отображает θ на все множество Т; (λ2) из θ < θ' вытекает τφ (θ) <ζ τφ (θ'). В силу условий (λχ), (λ2) для функции φΕψΕΛ множества τ<ρ (t) тех θ, для которых τφ (θ) - ί, являются сегментами пространства θ: Τφ' (ί) = [θφ (ί), θ; (*)]. Когда параметр θ пробегает сегмент Τφ1 (t), значение τφ (£) остается постоянным, а ξφ (θ) пробегает ту или иную последовательность точек фазового пространства X. Поэтому кривые φ ΕΞ Λ могут рассматриваться как запись своеобразных обобщенных процессов с разрывами первого рода, поведение которых в момент времени t может
392 42. О сходимости А. В. Скорохода быть, вообще говоря, более сложным, чем простой переход из состояния / (t — 0) в состояние / (t + 0). Такие обобщенные процессы могут естественным образом возникать в качестве предельных ограничений, подобных условию (*) в теореме IV, мешающих сгущению в одной точке t нескольких неисчезающе малых скачков. Возможно, что введение такого рода обобщенных процессов окажется полезным в некоторых вполне конкретных исследованиях по предельным свойствам случайных процессов. Не развивая этой идеи дальше, я использую анализ устройства множества Л лишь как вспомогательное средство для доказательства возможности введения в пространстве SD расстояния s* (/, g), отличного от s (/, g) и превращающего SD в полное метрическое пространство. С этой целью я докажу такую лемму: Лемма. Множество А является в пространстве Φ множеством типа 6?б· Доказательство. Легко показать, что при заданных ίΕ Τ и φ ΕΞ Λ величина ω* [τφ1 (£)] для всех φ ΕΞ φ одинакова, т. е. характеризует свойства кривой φ, а не ее параметрического представления φ; мы обозначим эту величину через ω| (t). Условие (μ) % № = о при всех t e τ является необходимым и достаточным для того, чтобы φ £= А принадлежала множеству Λ. Поэтому л=л\илп, ' (1) η где Λη есть множество тех φ ΕΞ Λ, для которых supa>*(j)>JLe Множество Λ замкнуто в Ф по самому определению. Можно доказать, что множества Λη тоже замкнуты в Ф. Из замкнутости множеств Λ и Λη и формулы (1) непосредственно вытекает наша лемма. Из доказанной леммы в силу известной теоремы П. С. Александрова вытекает, что в множестве Λ можно ввести новое расстояние Р* (f> g)> топологически эквивалентное расстоянию p(f, g), но превращающее Λ в полное метрическое пространство. Полагая s* (/, g) = Ρ* if, g) и вспомнив теорему VI, мы видим, что имеет место
43. Две равномерные предельные теоремы 393 Теорема VII. В множестве D может быть введено расстояние 5* (/> g), топологически эквивалентное расстоянию s (/, g), но превращающее D в полное метрическое пространство. Москва, 25 июля 1956 г. ЛИТЕРАТУРА 1. Скороход А. В.— ДАН СССР, 1955, т. 104, с. 364—367. 2. Скороход А. В.— ДАН СССР, 1956, т. 106, с. 781—784. 3. Прохоров Ю. В.-— Теория вероятностей и ее применения, 1956, т. 1, № 2, с 175 237. 4. Дынкин Е. Б.— Изв. АН СССР. Сер. мат., 1952, т. 16, с. 563—572. 5. Урысон П. С. Труды по топологии и другим областям математики. М.: Гостехтеориздат, 1951. Т. 2. 937 с. 43 ДВЕ РАВНОМЕРНЫЕ ПРЕДЕЛЬНЫЕ ТЕОРЕМЫ ДЛЯ СУММ НЕЗАВИСИМЫХ СЛАГАЕМЫХ* Во всем дальнейшем Φ (х) = Ρ {I < *}, Fk (χ) = Ρ «* < ζ), где ξ = ξΐ + ξ2 + · · · + In и случайные величины ξ^ взаимно независимы. Через (S обозначается совокупность вырожденных распределений вида ί 0 при χ <Γ α, Ε(χ) = \. ^ [1 при χ > а, а через Θ — совокупность неограниченно делимых распределений. Целью работы является доказательство следующих двух теорем. Теорема 1. Существует такая константа С, что из Ek(x-l)-&^Fk (x) ^Ek(x + l) + ε, где Ek e β, k = 1, 2, . . ., rc, при любых ε > 0, Ζ, > 2Z > 0 и δ = С max (-^ ΐΛ°S Τ"' eV5) вытекает существование ΨεΘ, Зля которого ψ (д. __ £) __ δ < Φ (*)< Ψ {χ + L) + δ. * Теория вероятностей и ее применения, 1956, т. 1, № 4, с. 426—436·
394 43. Две равномерные предельные теоремы Теорема 2. Существует такая константа С, что в случае одинаково распределенных слагаемых ξ^ с произвольным распределением Fk (χ) = F (χ) существует Ψ ΕΞ θ, для которого при всех χ Ι Ψ {χ) - Φ (χ) |< Сп-Ч>. Доказательство обеих теорем использует ряд идей1 заимствованных из работ П. Леви (см. [1, § 48]), В. Деблина [2] и Ю. В. Прохорова [3], и основано на следующих леммах, в которых χ Ga> а (х) = -JL- J e-c-Wuo» dx, Ga = G0t ff, " — oo Qf(1) = sup [F (x + I + 0) — F (x)] есть введенная П. Леви χ ^функция концентрации» распределения F (х), а Съ С2, С3, С4, С5, С6, С7, С" — абсолютные константы. Лемма 1. Ес/ш i? > г, Д2 > г2 log 5, mo СФ Л е 1* Л е \Ga fe (Л) < CiRlrYJ. м м а 2. *Ga-f|<C2fe м м а 3. i,s — ""α,σ Ι ^ ^з (5 " Лемма 4. Если η = то F * Л е Рггц.. = С^'^, (σ). - σ2)/σ2. <?0,σ (ж - I) - η < F (ж)< F * G0,c м м а 5. Пусть .mn — ilfOiji </m, ...mn — LL<Jmk, k (x + I) + η 1 Всюду далее в суммах ^ и произведениях Π или II* индекс & пробегает к к к все целые значения в пределах 1 ^ к ^ д.
43. Две равномерные предельные теоремы 395 где ( 1 — ри при т = 0 т Рт = \ Рк при 711=1, g%>= ^-e'\ m = 0,l,... [ 0 при т^>1 В предположении О <^ рк ^ 1 справедливо неравенство 2 mi...mn fc Лемма 6. £Ъш 0<p< 1, mo 71 ι m £ | om (i-p)"-m - -^r <rn*> I < c6p. m—о Лемма 7. Пусть ak = MEfc, σ? = Dgb α= 2 afc, σ2 = 25 <$, σ| = σ2 + σ§. /ι· ft Из \lk \< h fc = 1, 2, . . ., л, вытекает, что при всех χ | Φ * (?σο (Ж) - <?α,σ, (s) | < C7 Ζ/σ#. Докавательство леммы 1 будет опубликовано в другом месте 3, Леммы 2—5 вполне элементарны и их доказательство может быть предоставлено читателю. Лемма 6 принадлежит Ю. В. Прохорову (см. [3]). Лемма 7 легко получается из известной оценки |Φ(*}-£α,σ(*)|<£'ΣΜ|ξ*~α*'3. если дополнительное нормальное слагаемое с дисперсией al представить в виде суммы нескольких нормальных же слагаемых с достаточно малой дисперсией каждое. 1. Доказательство теоремы 1, общая часть, Достаточно доказать теорему для случая непрерывных и строго возрастающих функций Fk (x). В самом деле, предположим, что Fbt ε, I и L фиксированы так, что условия теоремы выполнены. Выберем 2 Здесь и всюду далее 2j обозначает суммирование по всем наборам т1...тп положительных целых т1? . . ., тп. 3 См.: Kolmogorov A. Sur les proprietes des functions de concentrations de M. P. Levy.— Ann. Inst. H. Poincare, 1958, vol. 16, N 1, p. 27—34.
396 43. Две равномерные предельные теоремы V и V подчиненными неравенствам L > V > 2V > 21 и положим ε' = 2ε. Легко установить, используя лишь качественное содержание леммы 4, что при достаточно малом s распределения F'k = Fk* Gs удовлетворяют условиям теоремы при замене ε, Ζ, L на ε', Ζ', L\ Функции F'k (χ), как легко доказать, непрерывны и строго возрастают. Если для соответствующей функции Φ' = Φ * G,vn будет доказано неравенство Ψ (χ - L') - б' < Φ' (χ) < Ψ (χ + V) + δ', где 6'=C'max(-^-|/log-^, e'V.) , то, применяя лемму 4 с σ2 = ns2 и Ζ = L — Ζ/, легко обнаружить, что при достаточно малом s и С = 2С первоначальная функция Φ (χ) удовлетворяет неравенству, являющемуся заключением теоремы. Будем в соответствии со сказанным считать функции у = F^ (x) непрерывными и строго возрастающими, что позволяет считать обратные функции χ = F^1 (у) однозначно определенными для всех у из интервала 0 < у < 1, непрерывными, строго возрастающими и пробегающими все действительные значения х. Положим λ* (Ρ) = Fi (1 - Ρ) - Ή1 (Ρ). Функции λ& (Ρ) будут в сделанных предположениях непрерывными и строго убывающими. Они пробегают все положительные значения λ, 0 < λ < оо, когда Ρ пробегает интервал 0 < Ρ < V2. Обратные функции ε* (λ) = λ*-1 (λ) тоже непрерывны и строго убывают: когда λ меняется в пределах 0<λ<(χ>, они пробегают значения Р, заполняющие интервал V2 > Р> 0. Поэтому если только (здесь Ζ и ε — величины, входящие в условие теоремы, причем мы будем далее считать ε ^ 1, что, конечно, не нарушает общности),
43. Две равномерные предельные теоремы 397 То уравнение 2ε*(λο)=2ε-ν. к имеет единственное решение λ0 > 21. Определим теперь величины Л и σ0 следующим образом: А) Если Σε,(20>2ε-4/3, (Α.1) то к то Л = λ0, σ0 - 2ε-ν»Λ. (Α.2) Б) Если Σε,(2Ζ)<2ε-ν% (Б.1) Л = 21, ^=-^L(log^)'1/2. (Б.2) Чтобы определить нужное нам неограниченно делимое распределение Ψ, положим ε* = гк (Л) и введем случайные величины О, если ^(ε,)<^<^(1-4 { 1 в остальных случаях. Положим далее ак - Μ {Ιβ μχ = 0}, at = D Цк [ μ* = 0}, Λ=Σ(1-2ε*)ΛΛ> σ»=2(1-2ε*)σϊ, Μ0) (χ) = ρ {L· < χ Ι μ* = θ}, 4υ (χ) = Ρ {ξ* < χ Ι μ* = 1}· Легко видеть, что Φ = Π* [2ε,4υ + (i - 2ε,) П°>] = Μ Д* [μΧ> + (1 - μ,) П°>] = к к = Σ ^...^nVn^nVfr1*, mi...mn к
398 43. Две равномерные предельные теоремы где вероятности Рт1...тп = Ρ {μι = mu . .., μη = mn} выражаются формулами из леммы 5, если положить Рк = 2efo. Определив теперь через ρ к = 2г^ величины Qmi...m формулами из той же леммы 5, положим Ψ=[βχρ22ε*(^1)-^·)]·β!β.σ.= Σ ^...mjFlFfT^G^, k mx...mn k где σ| = σ2 + 0l В приведенных формулах для Ф и Ψ через Е0 обозначено единичное распределение ( 0 при х^О, ν ' { 1 при #>0, а степени понимаются в смысле свертывания: F0 = Е0, F1 = F, F2 = F * F и т. д. Очевидно, что при переходе от величины ξ^ к величинам ζ>Κ = %к — ак величины αχ заменяются на αί = 0, а функции Φ и Ψ на функции Ф' (х) = Φ (χ + α), Ψ' (χ) = ψ (χ + #). Поэтому ясно, что можно ограничиться рассмотрением случая Як = 0» & = 1, . . ., га; α = 0. Нам понадобится еще случайная величина ζ = Σ(ΐ-μ»)δ* /г и ее условные дисперсии σ£ιχ...!Λη = D ίζ Ι Ηί = ™ь · ·., μη = mJ при фиксированных значениях величин μ1? . . ., μη. Очевидно, что 71 к Положим теперь 4 /с 4 Определение функций Ф^ предполагает, что т^ = 0 или 1. Опреде' ление функций Ф^' # m относится к любым неотрицательным τηχ.
43. Две равномерные предельные теоремы 399 Отметив, что ч(0) Φ— ΔΔ Рт,...тг)Фщ1...ти *Фт!...ти, тх...тп η η η m1...mn введем распределения m1...mn mt...mn >in Фз = S Р?п1...тпФт1...тп*С[а<!. Легко видеть, что в силу условия теоремы ε*(2/)<ε . и, так как Λ ^> 2Ζ, ей = гк (Λ) < ε. (3) В обоих случаях А) и Б) Σε*<2ε-".. (4) к Из (3) и (4) вытекает, что Sefc<2eVb. (5) При помощи (5) и леммы 5 получим |^~Фз|< Σ \Pml...mn-gm1...mn\<C5^pl = тх...тп к = 4C5 5X<8Cb8V5. (6) В силу леммы 3 в предположении Κ..,ηη-^Κ^σΙ (7) имеет место неравенство \G0 *G0„ — G„ |<C8eV.. (8) Поэтому |Ф2_Ф3| <C3s1/5 + 22', (9) где Σ' есть сумма тех pmi...m , для которых нарушено неравенство (7). Очевидно, что Σ' = Ρ{!ρ2-σ2|>ε,.4}, (10)
400 43, Две равномерные предельные теоремы (И) где ρ» = Σ(1-μ*)σϊ· к Легко видеть, что Μρ2 = Σ(1-2εΛ)σ|=σ2, к Ορ2 = 2 2ε*(1-2εΛ)σί, к и так как σ| <^ Λ2, ε^ <ζ ε, то 0ρ2<2ε3(1-2ε,)σ^<2εΛ22(1-2ε,)σ|=:2εΛ2σ2. (12) Тс к Из (10) — (12) по неравенству Чебышева получаем 2'<-^<2*/.-£. (13) Так как всегда σ0 > Л, ε"/5 <^ ε'/», из (9) и (13) вытекает | Ф2 - Ф3 |< (С, + 4) еЧ · (14) В силу леммы 7 и того обстоятельства, что в случае μ^ = 1 имеет место неравенство \h\<A, справедливо неравенство | С, ·<?*- G0m< тп*вСТо|< С7 А , (15) из которого вытекает неравенство |Ф1-Ф2|<С,Л/а0. (16) Из (6), (14) и (16) получаем | Ψ - Фх |< C,eV. + С7Л/а„, (17) где С* = 8С5 + С3 + 4. 2. С л у ч а й А. Окончание доказательства теоремы 1 различно в случаях А) и Б). Займемся сначала случаем А). В этом случае неравенство (17) в силу (А.2) приобретает вид |Ψ-Φι|<(^+07)βν.. (18) Напомним, что теперь Λ = λ0 > 21, (19) Sek = Se»(M = 2e-4/·. (20) к к
43. Две равномерные предельные теоремы 401 Легко видеть, что 1 - 2sfc < <?,fc (Λ)< 1 - efc (21> и, следовательно, величина *=Σ[ΐ-0^(Λ)] допускает оценки 2ε-4/5<5<4ε-4^. (22> Б силу 5 леммы 1 и формул (22) и (А.2) <?ф (τ0) < -^ < 2dkv.. (23) Ays По лемме 2 из (23) получаем Ι Φ — Фх | = | Φ - Φ * GoJ < С2(?Ф (σ0)Χ 2 С3С2еЧ (24) Из (18) и (24) получаем, наконец, | Φ - Ψ I < (^ -f C7 + 2СгС2) ъ\ (25) Из (25) уже непосредственно вытекает (для случая А)) заключение теоремы, причем сдвиги на расстояние L остались неиспользованными: они понадобятся лишь в случае Б). 3. С л у ч а й Б. В этом случае в силу (Б.2) неравенство (17) приобретает вид | Ψ - Фх |< С>* + 2V.C7 4- У bg -f · <26> По лемме 4 в силу (Б.2) при η = Cie-Lm^ = C4«?i«>e<W = С* +- (27) L· имеют место неравенства Фх [х - L) - η < Φ (χ) < Φχ (ж + L) + η. (28) Положим теперь С = С* + 23/* С7 + 2С1С2 + C4/log 2. Так как L > 2Z, log (L/l) > log 2, из (26) и (28) получаем при δ == С max (-i- ]/log -у-, eVe) 5 Легко подсчитать, что в силу (А. 2), (22) и принятого ограничения ε Дополнительное условие R2 ^ r2 log s для R = σ0 и г = А выполнено. О
402 43. Две равномерные предельные теоремы ^неравенства Ψ (χ - L) - δ < Φ (ж)< Ψ (ζ + L) + δ. (29) Как видно из неравенства (25), неравенство (29), доказанное сейчас для случая Б), верно и в случае А).. Этим заканчивается доказательство теоремы 1. 4. Доказательство теоремы 2. Доказательство теоремы 2 по существу не отличается от доказательства теоремы 1 в варианте А, причем полагается ε = cln. Естественно, что г^ и р^ = 2&к теперь не зависят от к. В силу соотношения Σβ* = 2β-ν. ft Ρις должны быть равны ρ = с'п"х1ь. Вводимое построение с переходом от'Φ к Φ' = Φ * GsV- делается теперь излишним и даже несколько затруднило бы получение окончательного результата. Ссылку на лемму 5 целесообразно заменить ссылкой на более простую лемму 6. Ввиду возможности указанных упрощений мы даем далее изложение доказательства теоремы 2, независимое от п. 1, 2. Общую функцию распределения слагаемых ξ^ будем обозначать F (χ) = Ρ {l·,^ < χ}. Условия F (F-1 (у)) <y<F (F"1 (у) + 0) определяют обобщенную обратную функцию F"1 однозначно, кроме не более чем счетного множества г/, соответствующих интервалам постоянства функции F. Можно без ограничения общности считать^ что где случайные величины η/f взаимно независимы и распределены равномерно на интервале 0 < у < 1. Положим Р = %п-\ _ J 0, если р/2 < % < 1 — ρ β, \ 1 в остальных1 случаях, а = (1 - ρ) Μ {& | μ* = 0}, . , σ2 = (1 - ρ) Ό Цк | μ, =, 0}, F0 (*) = Ρ iL· < χ Ι μ* = 0}, Ft (χ) = Ρ {h < χ Ι μ* = 1>·
43. Две равномерные предельные теоремы Ша Легко видеть, что Ф = Μ Π* [μ^ + (1 - μ,) F0] = Σ <V (1 - р)п~к F\ *Κ~*· к к Искомое неограниченно делимое распределение Ψ зададим в виде где σ| = по2 + σ02, σ02 = 2η1'*Α, А = F'1 (1 - р/2) - F'1 (р/2). Как и в п. 1, достаточно рассмотреть случай а = 0. Положим Φι = φ * GCe = 2 С*р* (1 - pf-*F\ * Ft* * G0o, A: ф2 = £ CnPh' (1 - Pf-k F\ * G4 * Gao, oi = J£±. a», Фз = Σ СУ (1 - ρ)"-*/ΐ * G*,. к В силу леммы 6 | Ψ - Ф3 | < Сер = V2 С/г».·. (30) В силу леммы 3 в предположении и|<в*/. (31) I 1-Р имеет место неравенство |6^*<?σ,_6σφ|<ί78»-ν., (32) и, следовательно, I Ф2 — Ф8 К ^_1/5 + 22', (33) где 2' есть сумма тех dpk (1 — р)п~к% для которых нарушено неравенство (31). Очевидно, что Σ' = Ρ{Ιχ-τΐ(1-ρ) \>П^}, где χ — 2j μ/f. Поэтому в силу неравенства Чебышева Σ' < _ζ* = JuHi_^> ^ n-v. < n-v.. (34) Λ /6 w /5 Из (33) и (34) получаем |Φ2.-Φ3Κ(ί?8 + 2)7ΐ-ν.. (35) В силу леммы 7 так как при μ^ = 1 при принятом предположении a = 0 имеет место неравенство | ξ& | < Λ, то справедливо неравенство I Fo~k * Ga0 - G0k * Gao I < С,Λ/σ0 = Ve^"1'5,
404 44, Случайные функции и предельные теоремы из которого вытекает Ι Φι ~ Ф2 |< V2 C77i-V.. (36) Легко видеть, что QF (Λ/2) < 1 - р/2. В силу леммы 1 отсюда следует В силу леммы 2 из (37) вытекает | Φ - Φχ |< С£Ф (σ0) < 4 dC2 7i-vs. (38) Из (30), (35), (36), (38) получаем | Φ - Ψ |< (Се/2 + С3 + 2 + Ст/2 + 4 dCg) л-1/·, чем и заканчивается доказательство теоремы 2. Москва, 12 ноября 1956 г. ЛИТЕРАТУРА 1. Levy P. Theorie de l'addition des variables aleatoires. Paris: Gauthier — Vil- lars, 1937. 2. Doeblin W. Sur les sommes d'un grand nombre des variables aleatoires inde- pendantes.— Bull. sci. math., 1939, vol. 63, p. 23—32; 35—64. 3. Прохоров Ю. В. О суммах одинаково распределенных случайных величин.— ДАН СССР, 1955, т. 105, № 4, с. 645—647. 44 СЛУЧАЙНЫЕ ФУНКЦИИ И ПРЕДЕЛЬНЫЕ ТЕОРЕМЫ*1 Совместно с Ю. В. Прохоровым Не претендуя на полноту охвата литературы вопроса, мы намерены, кроме сообщения некоторых сравнительно новых результатов, осветить первые шаги теории случайных функций, основные возможные способы ее систематического построения и основные вопросы применения функциональных методов к получению предельных теорем. * Zufallige Funktionen und Grenzverteilungssatze.— In: Bericht aber die Tagang Wahrscheinlichkeitsrechnung und mathematische Statistik. Berlin, 1956, S. 113—126. Перевод авторов. 1 Доклады Α. Η. Колмогорова и Ю. В. Прохорова, прочитанные на конференции, близки к докладам М. Фреше и Р. Форте. В докладе А. Н. Колмогорова, сделанном в последний день работы конференции, были изложены новые результаты, полученные Ю. В. Прохоровым в промежуток времени между его докладом и докладом А. Н. Колмогорова. Ввиду этого авторы сочли уместным передать для публикации объединенный текст своих докладов. § 4 (без теорем IV и V) и § 6 воспроизводят доклад Ю. В. Прохорова, а § 1—3, 5 и теоремы IV и V из § 4 составили доклад А. Н. Колмогорова. Теоремы IV и V из § 4 были доказаны Ю. В. Прохоровым после его доклада и перед докладом А. Н. Колмогорова.
44. Случайные функции и предельные теоремы 405 § 1 ПРЕДВАРИТЕЛЬНЫЕ ЗАМЕЧАНИЯ О СЛУЧАЙНЫХ ЭЛЕМЕНТАХ ЛЮБОЙ ПРИРОДЫ Мы будем исходить из аксиоматики теории вероятностей, изложенной в [1]. Полем вероятностей будем называть совокупность {Ω, Φ, Ρ}, состоящую из 1) множества Ω, элементы которого ω называются «элементарными событиями», 2) σ-алгебры Φ подмножеств множества Ω, 3) определенной на Φ меры Ρ (А), удовлетворяющей дополнительному требованию R (А) = 1. (Терминология соответствует [2].) Иногда целесообразно принять еще допущение (ω') Мера Ρ (А) полна, т. е. из Ρ (А) — 0, В cz А вытекает Целесообразно при изучении случайных величин, случайных векторов и других «случайных элементов» той или иной конкретной природы оставлять природу основного множества элементарных событий ω неопределенной, а конкретные случайные элементы ξ считать функциями от ω. Например, (действительной) случайной величиной принято называть любую действительную функцию ζω* удовлетворяющую тому условию, что множество {ω; ξω<α} при любом действительном а принадлежит Φ (см. [1]). Произвольная функция ξω со значениями из множества X определяет поле вероятностей {Χ, Φξ, Ρξ}, где Φξ состоит из всех A cz X, для которых Г (А) €= Ф, и на Ф| Р% (Α) = Ρ {Γ1 (А)}. Так как в каждой задаче теории вероятностей основное множество Ω считается вполне определенным и в то же время сами его элементы ω не входят явно в формулировки конкретных задач, то индекс со ПРИ ξω обычно не пишут, говоря просто о «случайном элементе ξ множества X». Заметим, что в предположении (ω') автоматически будет выполнено условие (ξι) Если Ρξ (A) = 0,Bc4,toBg Φξ. Если X является топологическим пространством, то естественно требовать от случайного элемента ξ ΕΞ Χ, чтобы некоторые простей-
406 44, Случайные функции и предельные теоремы шие с топологической точки зрения множества 4сХ заведомо входили в Φξ. Если X есть метрическое пространство (этот случай будет для нас иметь основное значение далее), характер целесообразных требований этого рода не возбуждает сомнений. Именно целесообразно ограничиться рассмотрением случайных элементов подчиненных условию (ξ2) Любое открытое множество G cz X принадлежит Φξ. Как известно, из (ξ2) вытекает принадлежность к Ф| любого борелевского 4CI Если X есть действительная прямая, то (ξ2) равносильно высказанному ранее требованию, включаемому обычно в определение случайных величин. Ряд упрощений возникает в случае, когда, кроме того, выполнено условие (ξ3) Для любого Α ΕΞ Φξ Pl(A) = miPl(G)i где нижняя грань берется по всем открытым G, содержащим А. Для того чтобы (ξ3) имело место для любого подчиненного (ξ2) случайного элемента | из сепарабельного полного метрического пространства X, необходимо и достаточно, чтобы было выполнено требование (ω") Мера Ρ на Ω совершенна (см. [3]). Вопрос о целесообразности систематического построения теории вероятностей с исключительным употреблением совершенных мер может оставаться дискуссионным до тех пор, пока такое систематическое построение не будет осуществлено. Однако следует отметить, что это ограничение в действительности нисколько не сужает области возможных реальных применений теории вероятностей, так как имеет место такая теорема:1 любая полная нормированная булевская алгебра может быть реализована, как алгебра метрических типов совершенной меры (ср. [4]). Требования (ξ2) и (ξ3) могут обобщаться в различных направлениях для топологических пространств более общей природы (ср. 12, § 52-54]). § 2 СЛУЧАЙНЫЕ ФУНКЦИИ Для определенности будем рассматривать комплексные функции χ (t) аргумента t ΕΞ Γ, где Г, вообще говоря, произвольное множество (наиболее изучены здесь «случайные процессы», когда Τ есть действительная прямая). Возможны два подхода к введению понятия «случайной функции» такого рода. (I). Случайной функцией ξ (t), определенной на Г, называется система комплексных случайных величин ξ (£), определенных при каждом t ΕΞ Т. Если при этом основное поле вероятностей {Ω, Φ, Ρ} удовлетворяет условию (ω'), то распределения Рцц, так же как и
44. Случайные функции и предельные теоремы 407 7г-мерные распределения Putj, ξ(*2),..., utn), удовлетворяют условиям βι) * (6а)· (II). Заранее выбирается некоторое функциональное пространство β, состоящее из функций χ (£), определенных на Г, в котором вводится определенная метрика (расстояние, удовлетворяющее обычным аксиомам метрического пространства). Случайной функцией £ (t) типа S называется случайный элемент метрического пространства 6, удовлетворяющий условиям (ξχ) и (ξ2). Систематическое изучение случайных функций в одном весьма важном частном случае было начато Н. Винером в 1923 г. (см. [5]). Первая из изложенных выше концепций с большой широтой развивалась Е. Е. Слуцким начиная с 1928 г. (см. [6]). Вторая концепция для произвольных банаховских пространств разрабатывалась В. И. Гливенко с 1928 г. (см. [7—9]). С обширной дальнейшей литературой можно познакомиться по современным изложениям вопроса в [10, 11]. Если пространство (S таково, что при любом ^еТи любом открытом множестве G на комплексной плоскости множество {х (t) : χ (t0) e G) (1) тех функций χ (t), для которых χ (t0) принадлежит G, является бо- релевским множеством пространства ё, то каждой случайной функции в смысле (II) очевидным образом соответствует случайная функция в смысле (I). Для случайной функции в смысле (I) можно поставить обратную задачу о возможности рассматривать такого рода случайную функцию ξ (£), как принадлежащую по существу к какому-либо определенному функциональному пространству S (например, в случае отрезка [а, 6] в качестве множества Τ — к пространству С|>,ь] непрерывных комплексных функций с метрикой Ρ {х (*), У (*)) = max \x (t) - у (t) |). α<ί<6 Можно придать этому вопросу точный смысл при помощи понятия эквивалентности случайных функций в смысле (I). Две случайные функции ξ] (t) и ξ2 (t) (в смысле (I)) называются эквивалентными, если при любом t е= Τ ραι(ί)Φΐ*(ί)} = 0. (2) Вопрос, поставленный выше, можно теперь интерпретировать так: Дана случайная функция ξχ (t) в смысле (I) и пространство S, удовлетворяющее требованию борелевской измеримости множеств (I); спрашивается, существует ли случайная функция ξ2 (0 типа 6, для которой выполнено при любом t ΕΞ Τ условие (2). С точки зрения применений такой подход к делу, развитый Ε. Ε. Слуцким (см. [12, 13]), является, по-видимому, вполне достаточным и позволяет обойти ряд теоретико-множественных сложностей, о которых будет ска-
408 44. Случайные функции и предельные теоремы зано далее в § 3. Практически наиболее интересны вопросы о возможности считать случайную функцию: а) непрерывной, б) имеющей разрывы только первого рода. В первом направлении давно известен (см. [12]) следующий результат А. Н. Колмогорова: для того чтобы заданная на Τ = [α, b] случайная функция ξ (t) в смысле (I) была эквивалентна случайной функции ξ* (t) типа С[а,ь^ Достаточно условие М | I (t + τ) - ξ (ί) |β < Κ | τ |« (3) при некоторых а > 0, а > 1 и К. При этом функция ξ* (ί) оказывается с вероятностью единица удовлетворяющей при любом δ > 0 условию Липшица |ξ*(ί + τ)-ξ*(<)|<£*|τ|« ~б, (4) где i£* есть случайная величина. (Заметим еще, это будет использовано в § 6, что для любого ε>0 можно найти такое К0} зависящее только от ε, δ, α, α, Κ, что Р {К* > Zi} < ε.) Условия для возможности представить себе функцию ξ (t) как функцию, имеющую только разрывы первого рода, особенно существенны в случае, когда ξ (t) есть запись хода марковского процесса. Из новых работ на эту тему укажем работы Дынкина [14] и Кин- ни [15]2. Как известно, ряд важных функциональных пространств имеет своими элементами не индивидуальные функции, а метрические типы χ (t) таких функций относительно меры μ, введенной в Τ (метрическим типом называется класс всех функций, отличающихся лишь на множестве μ-меры нуль от некоторой фиксированной функции χ (t)). Мы будем предполагать, что для функций χ (t) разумным образом введено понятие асимптотической непрерывности в точке t0 так, что по метрическому типу χ (t) однозначно определяются в почти всех точках t0 ΕΞ Τ «истинные значения» функции χ (t) по асимптотической непрерывности, причем рассматриваемое пространство € таково, что истинные значения случайной функции типа (S в тех точках, где они определены с вероятностью единица, являются случайными величинами. В такой обстановке может быть в несколько видоизмененной форме поставлена и решена та же проблема соотношения между двумя понятиями случайной функции (I) и (II). При подходе (I) естественно требовать теперь задания случайных величин ξ (t) лишь почти всюду на Г и считать две случайные функции в смысле (Ι) ξχ (t) и ξ2 (t) эквивалентными, если при почти всех t выполняется условие (2). Тогда каждой случайной функции ξ* (t) в смысле (II) соответствует вполне определенная с точностью до эквивалентности случайная функция ξ (t) в смысле (I), равная при почти всех t с вероятностью единица истинному значению ξ* (t) 2 См. также более позднюю работу: Чепцов Н. #.— Теория вероятностей и ее применения, 1956, т. 1, с. 155—161.— Примеч. ред.
44. Случайные функции и предельные теоремы 409 в точке t. Полное решение обратного вопроса об условиях, при которых случайная функция в смысле (I) эквивалентна измеримой функции, было дано в работе Амброзе [16] для случая, когда Τ — действительная прямая и μ — лебегова мера. Необходимое и достаточное условие состоит здесь в том, чтобы ξ (t) была почти всюду (по μ) асимптотически стохастически непрерывна. Если это условие выполнено, то можно перенести рассмотрения в пространство (S измеримых функций (точнее, в пространство метрических типов) и уже без принципиальных затруднений вычислить вероятность суммируемости функции ξ (t), ее суммируемости в квадрате, «существенной ограниченности», и т. п. § 3 КОНЕЧНОМЕРНЫЕ РАСПРЕДЕЛЕНИЯ ЗНАЧЕНИЙ СЛУЧАЙНОЙ ФУНКЦИИ Вернемся к случайным функциям ξ (t) в смысле (I), определенным при всех tEz Т. Каждая такая функция ξ автоматически определяет поле вероятностей {Ω^, Φξ, ί*ξ}, где Ω^ — множество всех комплексных функций, определенных на Г. Формула а* = χ (tic), k = 1, 2, . . ., п, определяет отображение Щиг2,...,г (я) множества Ω^ в ^-мерное комплексное векторное пространство векторов а == {α1? α2, . . ., ап}. Каждой случайной функции ξ (t) соответствует в силу этого отображения при фиксированных £1? ί2, . . ., tn случайный вектор <4л,..., *я- Обычно в конкретных задачах о случайных функциях большую роль играют соответствующие распределения plh «»(Я)=Р{«и,....*„ед>. Так как Ptut2, ...,* заведомо определено для борелевских множеств 5, то Pi определено для их прообразов в Ω^: Это так называемые борелевские цилиндрические множества в ΩΓ. Ворелевское замыкание системы таких множеств (наименьшую содержащую их σ-алгебру) обозначим через Фг. Очевидно, что для любой случайной функции ξ (t) имеет место включение Φξ S Фг- Значения Р% (В) для В ΕΞ Фг определяются однозначно по конечномерным распределениям. Еще в [1] было доказано, что, об-
410 44. Случайные функции и предельные теоремы ратно, произвольным «согласованным» конечномерным распределениям Ptli t2i ...,t , заданным для всех конечных систем элементов ^i» t2i . . ., tn из Τ и определенных на борелевских множествах в тг-мерных комплексных векторных пространствах, соответствует поле вероятностей {Ωγ, Фг> Р*}. Лишь небольшим видоизменением этого результата является такая формулировка: если распределения Ptut2,...,t определены для всех конечных систем элементов из Г, согласованы и удовлетворяют условиям (ξ2) и (ξ3), то существуют случайные функции ξ (t) в смысле (I) с ptut2i.. .ttn = Ptuttt. ..,tn. Существенно, однако, что за пределами Фг функция Р% ужел вообще говоря, однозначно по конечномерным распределениям Ptvt2,...,t не определяется. Между тем класс Фг слишком узок для применений: в него не входит в случае несчетного Τ множество функций χ (£), которые при всех t ΕΞ Τ удовлетворяют условию | χ (ή Ι < К, или в случае Τ = [α, Ь] множество С непрерывных функций и т. п. При переходе к концепции (II) во всех изученных, практически важных случаях однозначность определения Р% по конечномерным распределениям Ptvt2 , г восстанавливается (смысл этого утверждения для пространств S, состоящих из метрических типов χ (t), а не из индивидуальных функций, требует некоторого уточнения, которым мы здесь заниматься не будем) и в то же время при надлежащем выборе пространства 6 все нужные для конкретных задач множества оказываются принадлежащими Ф|. § 4 СЛАБАЯ СХОДИМОСТЬ РАСПРЕДЕЛЕНИЙ В настоящем параграфе мы ограничимся рассмотрением случайных элементов ξ, принимающих значения из полного сепарабельного метрического пространства X и удовлетворяющих ^ условиям (ξ2) и (ξ3). При изучении последовательностей случайных элементов из X возникает вопрос о сходимости соответствующих распределений Р- к некоторому распределению Ρ в X. Под сходимостью здесь естественно понимать обычную для функционального анализа «слабую сходимость» распределений. Напомним, что последовательность Рп распределений в X слабо сходится к распределению Р, если для любого непрерывного и ограниченного на X функционала / (χ), χ ΕΞ Χ, I f(z)dPn-+$ f(x)dP. Χ Χ
44. Случайные функции и предельные теоремы 411 Если X есть числовая прямая, то слабая сходимость оказывается эквивалентной хорошо известной сходимости «в основном» соответствующих функций распределения. Слабую сходимость распределений мы будем обозначать Рп =$ Р. Смысл слабой сходимости в достаточной степени поясняется следующими двумя теоремами, из которых первая хорошо известна, а вторая просто доказывается. I) Для сходимости Рп =Ф Ρ необходимо и достаточно, чтобы Рп(А)-+Р(А) для любого множества Л, Р-мера границы которого равна нулю (т. е. для любого множества непрерывности распределения Р). II) Для сходимости Рп =Ф Ρ необходимо и достаточно, чтобы для любого непрерывного почти всюду (по мере Р) функционала / (х) последовательность функций распределения Ff (α) = Рп {x:f (x) < α} сходилась к функции распределения Ff (α) = Ρ {x:f (x) < a} в каждой точке непрерывности этой последней. Пусть теперь S» Si? &2> · · ·ι ЪП1 · · · — последовательность случайных элементов из X, для которой Pln^Pl- (5) Пусть, далее, η; ηι, η2> · · ·» Лт ... — последовательность случайных элементов из полного метрического пространства Г, причем η = f (ξ) и ηη = fn (gn), где / и fn — непрерывные отображения пространства X в пространство Y. Тогда при достаточно широких предположениях (например, в предположении, что fn —>- / равномерно на каждом компакте К d X) из (5) следует Ρηη=ΦΡη. Это простое замечание оказывается полезным при выводе целого ряда конкретных предельных теорем. Наконец, при изучении предельных теорем для последовательностей случайных элементов известную пользу может принести (см. [17]) теорема: III) Для компактности семейства 53? распределений в X достаточно 3, чтобы при любом ε > О существовал компакт Кг такой, что Для всех Ρ е $& Ρ (Кг) > 1 - ε. Ю, В. Прохоров доказал и необходимость этого условия.
412 44. Случайные функции и предельные теоремы Рассмотрим пример, иллюстрирующий теорему III). Известно, что для компактности множества К (Z С, где С — пространство непрерывных на отрезке [0, 1] функций χ (t) с χ (0) = 0, необходимо и достаточно существование функции φ (τ), стремящейся к нулю при τ -> 0, для которой sup | χ {t + τ) — χ (t) I < φ (τ). Используя теперь условия непрерывности олучайного процесса с вероятностью единица (см. формулы (3) и (4) из § 2), мы получаем следующее достаточное условие компактности семейства 50Ϊ распределений в С: Существуют постоянные α > 0, α > 1, К > 0 такие, что для всех РеЖ МР | I (t + τ) - I (t) \α < К I τ |«, ξ(0) = 0, где через МР ξ обозначается с Иногда удается сравнительно просто установить, что имеет место сходимость Рп (А) -> Ρ (A), AGS, (6) для какой-либо специальной системы S подмножеств множества X. Из сходимости (6) можно выводить слабую сходимость Рп .-=Ф Р% пользуясь, например, следующими теоремами. IV) Назовем систему S подмножеств X «системой однозначности», если заданием на ней всякое распределение Ρ в Ζ однозначно определяется. Для сходимости Ρη =Φ Ρ необходимо и достаточно, чтобы выполнялись следующие два условия: а) Рп (А) -> Ρ (А) на некоторой «система однозначности» S; б) семейство* {Рп} компактно. Из этой теоремы вытекает, например, что если последовательность определенных на отрезке [а, Ъ] процессов {ξη (t)} такова, что: а) конечномерные распределения процессов ξη (t) сходятся к конечномерным распределениям некоторого процесса ξ (£); б) существуют не зависящие от η постоянные а, а, К (а > 0, а > 1, К > 0) такие, что ΛΛ|ξ„(ί + τ)-ξη(ί)|β<*Μα, то для соответствующих распределений в С[а,ь] имеет место сходимость Ръп^Р*
44. Случайные функции и предельные теоремы 413» V) Пусть S — система открытых множеств A cz Ху обладающая свойствами: а) S есть базис в X, б) из Аг ΕΞ S и А2 ΕΞ S следует Аг f) A2Ei S. Тогда из сходимости Рп(А)-+Р(А), A^S, вытекает Рп =* Р. Примеры, иллюстрирующие применение изложенных выше общих результатов, читатель найдет в заключительном_параграфе работы. § 5 ХАРАКТЕРИСТИЧЕСКИЕ ФУНКЦИОНАЛЫ Если ξ есть случайный элемент из банаховых пространств4 X, то» для соответствующего распределения Р| может быть определен аналог обычной характеристической функции — характеристический функционал. Для любого элемента / пространства X*, сопряженного к X, определим значение характеристического функционала Η формулой Η (/, Рг) = MeW Б) = J eW *> ώΡξ. Это определение и основные свойства характеристических функционалов были указаны в заметке А. Н. Колмогорова [18]. В последнее время интерес к распределениям в функциональных пространствах значительно возрос и аппарат характеристических функционалов,, по-видимому, будет находить все более широкие применения как в самой теории вероятностей, так и в некоторых вопросах математической физики (см., например, работу Э. Хопфа [19]). Ввиду этого- мы считаем полезным обратить внимание на результаты заметки [18] и отметить некоторые связанные с ней нерешенные проблемы. В [181 установлено, в частности: 1. Pi по Η (/, Pi) определяется однозначно. 2. При сложении независимых случайных элементов со значениями из X соответствующие характеристические функционалы перемножаются. 3. Если Лп+1 = 5 ||*||η+1ίΡξ< + οο, X В дальнейшем мы ограничимся случаем сепарабельных пространств.
414 44. Случайные функции и предельные теоремы ТО Ж/, Pg) = ι + м/4- 4М(/. /) + ··· + ^-м(/. ···./) + где M(/i,/.,...,/„) = S/i/t.../nd?t — полилинейные функционалы, являющиеся естественным обобщением моментов. Очевидно, что функции м (h, и, ..., /„) однозначно определяются по Η (/, Ρξ). Для целей теории вероятностей существенно было бы иметь необходимые и достаточные условия слабой сходимости распределений в терминах соответствующих характеристических функционалов. Однако такого рода условия пока неизвестны. Некоторые возможности использования характеристических функционалов для вывода тех или иных предельных теорем исследованы в работе Р. Форте и Э. Мурье (см. [20—23], а также доклад Р. Форте на настоящей конференции). Здесь мы отметим лишь следующий, вытекающий из теорем III) и IV) § 4 результат. Пусть X — сепарабельное пространство Банаха и {Рп} — последовательность распределений в X. Для сходимости необходимо и достаточно одновременное выполнение двух условий: а) Η (/, Рп) -+ Η (/, Ρ) при каждом / е X*; б) для любого ε> 0 существует компакт Кг такой, что при всех η Рп (Кв) > 1 - ε. Новые стороны приобретает в бесконечномерном случае и вопрос -об условиях, достаточных для того, чтобы функционал Η (/) был характеристическим. Мы ограничимся здесь лишь следующим замечанием. Естественно в соответствии с [18] назвать распределение Ρ в X нормальным, если его характеристический функционал имеет вид H(f) = eimf-1/>Q(f), где mf — линейный функционал от /, a Q (/) — квадратический. В случае пространства Гильберта это приводит к формуле где т — элемент пространства X и S — симметрический ограниченный линейный оператор, заменяющий матрицу вторых моментов.
44. Случайные функции и предельные теоремы 41S Однако условие неотрицательности (/, Sf) > О, достаточное для получения характеристической функции в конечномерном случае, здесь уже не является достаточным5. В частности, получающийся при т = 0, Sf = / функционал Η (/) = е~г^ (-Л/> не является характеристическим. Отметим еще, что приведенные в [23] необходимые и достаточные условия того, чтобы функционал был характеристическим, вряд ли могут считаться окончательными вследствие их значительной сложности6. § 6 ПРИМЕНЕНИЯ К ПРЕДЕЛЬНЫМ ТЕОРЕМАМ 6.1 Переход от сумм случайных величин к процессам. Представление о том, что предельные распределения для сумм случайных величин являются точными для надлежаще подобранных случайных процессов, сложилось уже давно (см., например, [25—29] и. особенно монографию А. Я. Хинчина [30]). Здесь же будут приведены результаты некоторых более новых работ, примыкающих к этому кругу вопросов. Отметим при этом, что при постановке и решении задач о переходе от сумм случайных величин к процессам в наиболее общей форме использование методов, по существу относящихся- к функциональному анализу, представляется неизбежным. Пусть fen, I» fen, 2j · · ·» Ъп,п — случайные величины с математическими ожиданиями MEnftr равными нулю, и конечными дисперсиями D|nJt, удовлетворяющими условию η ZJ E£n, k = 1· k=l Обозначим через Ч* = £η,ι + ξη,2 + . . . + In,*, k = 1, 2, . . ., /г, (7) «накопленные суммы» случайных величин ξη>Λ и через in>ftобозначим к Последовательности сумм{5п,^}, к = 1, 2, . . ., /г, сопоставим случайный элемент ξη пространства С непрерывных на отрезке [0, 1] и 5 Оно достаточно при условии конечности следа S (последнее условие и необходимо).— Примеч. ред. 6 Современное состояние вопроса отражено в книге: Бахания Н. #., Та- риеладзе В. И., ЧобанянС.А. Вероятностные распределения в банаховых пространствах. М.: Наука, 1985.— Примеч. ред.
416 44. Случайные функции и предельные теоремы равных нулю при t = О функций χ (ί), полагая при in>fc ^ t < ^д+ι ёп W== $п, к ~г т 1— =n> fc+i· Можно показать (см. [17]), что если суммы snn подчиняются условию Линдеберга, которое встречается в обычной центральной предельной теореме, то при η -*■ оо рЪп^рь (8) где ξ (t) есть так называемый винеровский случайный процесс, т. е. непрерывный с вероятностью единица процесс, удовлетворяющий условиям: 1. ξ (0) = 0 с вероятностью единица. 2. Приращения ξ (£)на непересекающихся интервалах независимы. 3. ξ (t + Δ) — ξ (£) имеет нормальное распределение со средним 0 и дисперсией А. Из (8) и теоремы II) § 4 можно вывести целый ряд предельных соотношений. Так, например, рассматривая функционал / (х) = max χ (ί), x(t) e С, 0<*<1 .мы получаем при a Z> 0 Р{ max ln(t)>a} = Ρ {max sn /c>a} ->P { max ξ 00 > «} = 0^ί<1 1</C<n 0^ί<1 2 i'-WS ""**}■ 1^2π Пусть α (ί) и b (t) — заданные для 0 < t < 1 непрерывные функции, для которых а (0) < 0 < Ъ (0), α (£) < Ъ (ί). Рассматривая «функционал / (#), который равен единице, если при всех t a (t) <. < х (t) <i b (£), и который равен нулю в других случаях, мы находим Ρ {при всех t a(t)< ln (t) < b (t)} -> -^ Ρ {при всех ί α (ί) < ξ (ί)< Ь (*)} и, следовательно, Ρ {при всех Λ a (tn, k) < sn, k < 6 (ίη> ^)} -> ->■ Ρ {при всех t a (t) < I (t) < b (t)}. Последний результат при несколько иных предположениях был получен А. Н. Колмогоровым в 1931 г. (см. [28, 29]). Сделанное замечание позволяет нам получить аналогичные предельные соотношения для совместного распределения любого конечного числа функционалов , например, P{minsn,fcO, max Sn,k <»}-* p (min £(*)<s, max £(*)<»}·
44. Случайные функции и предельные теоремы 417 Утверждение (8) содержит в себе в качестве частных случаев теоремы Эрдеша, Каца и Донскера (см. [31—33]) относительно сходимости распределений функций от «накопленных сумм» к распределениям соответствующих функционалов от винеровского процесса. Метод Эрдеша и Каца в окончательной форме, приданной ему Дон- скером [33], сводится к тому, что сначала устанавливается сходимость Рг (А)-^Р1(А) (9) ΰ \ 1 1^^^^ ι^~ 4^У 1 1/ £ | *П) \ для «полос», т. е. для множеств А, элементы которых удовлетворяют при всех t неравенствам a (t) <x(t)<b (f), где a (t) и Ъ (t) — ступенчатые функции (см. рисунок). Затем, аппроксимируя надлежащим образом непрерывные почти всюду по мере Р% функционалы / характеристическими (в смысле теории множеств) функционалами «полос», Донскер устанавливает сходимость функций распределения F/1 (а) = Ρ {/ (ξη) < <α} к функции распределения Ff (а) = Ρ {/ (ξ) < α}, что в силу теоремы II) § 4 равносильно слабой сходимости (8). Для перехода от (9) к (8) может здесь также служить теорема V) § 4, поскольку система S всех «полос» удовлетворяет условиям этой теоремы. Другой метод доказательства соотношения (8), опирающийся на теорему III) § 4, изложен в [17]. Замечание. Известно, что так называемый метод верхних и нижних функций (см. [30]) для случая, когда процесс ξη (t) построен по «накопленным суммам» независимых или связанных в цепь Маркова слагаемых, а процесс ξ (t) — надлежаще подобранный марковский процесс, удовлетворяющий дифференциальным уравнением Фоккера—Планка, позволяет получать утверждения следующего типа: для любых кусочно гладких функций a (t) и Ъ (t) Ρ {при всех t a{t)< ξη (t) < Ъ (t)} -> [-*- Ρ {при всех t a (t) < ξ (ί) < Ъ (t)}. (10) Очевидно, что применение теоремы III) § 4 позволяет из сходимости (10) заключить о слабой сходимости Ρι =Φ Ρ ξ. Метод верхних и нижних функций в настоящее время с успехом применяется И. И. Гихманом [34—39], решившим с его помощью ряд задач, относящихся к суммам случайных величин, а также ряд задач математической статистики (см. ниже). 6.2. Приближение эмпирического распределения к теоретическому. Пусть ξ — случайная величина с равномерным на [0, 1] 14 А. Н, Колмогоров
418 44. Случайные функции и предельные теоремы распределением вероятностей, Fn (t) — эмпирическая функция распределения, построенная по η независимым наблюдениям величины ξ, и ln{t)=(Fn(t)-t)Vn, 0<f<l. Обозначим через ξ (t) непрерывный с вероятностью единица гаус- совский процесс (т. е. процесс, у которого все конечномерные распределения гауссовские) с корреляционной функцией Μ {Ι (ί), I (s)} = * (1 _ *), 0 < t < s < 1. Нетрудно показать, основываясь на многомерной теореме Лапласа, что конечномерные распределения процесса ξη (t) сходятся при п-^оо к конечномерным распределениям процесса ξ (ί). Отсюда оказывается возможным вывести сходимость распределений / (|п) к распределению / (ξ) для широкого класса функционалов. Для этой цели пригодны все методы, излагавшиеся выше в п. 6.1 (см., например, работы Донскера [45], Гихмана[38], Форте и Мурье [23]. В работе [23] используется метод характеристических функционалов, при этом ξη и ξ рассматриваются как случайные элементы в пространстве L2 [0,1]. Работа Донскера [45] близка к работе того же автора, о которой шла речь в п. 6.1). Опираясь на этот результат, можно получить целый ряд новых непараметрических критериев (см., например, [46]), обобщающих известные критерии Колмогорова [42] и Смирнова [43, 44]. ЛИТЕРАТУРА 1. Колмогоров А. Н. Основные понятия теории вероятностей. М.; Л.: ОНТИ, 1936. 2. Халмош П. Теория меры/Пер. с англ. М.: Изд-во иностр. лит., 1953. 3. Гнеденко Б. В., Колмогоров А. Н. Предельные распределения для сумм независимых случайных величин. М.: ГТТИ, 1949. 4. Kolmogoroff A. Algebres de Boole metriques completes.— In: VI Zjazd Mate- matykow Polskich. Warszawa, 1948, p. 22—30. 5. Wiener N.~ Publ. Mass. Inst. Techn., 1923, vol. 2, p. 60. 6. Slutsky E. E.~ C. r. Acad. sci. Paris, 1928, vol. 187, p. 370—372. 7. GlivenkO V. I.— Atti Accad. naz. Lincei. Rend., 1928, vol. 8, p. 480—483. 8. Glivenko V. I.— Atti Accad. naz. Lincei. Rend., 1928, vol. 8, p. 673—676. 9. Glivenko V. I.— Atti Accad. naz. Lincei. Rend., 1929, vol. 9, p. 830—833. 10. Doob J. L. Stochastic processes. New York, 1953. 11. Blanc-Lapierre Α., Fortet R. Theorie des functions aleatoires. Paris, 1953. 12. Slutsky E. E.~ G. 1st. ital. attuar.7 1937, vol. 8, p. 183—199. 13. Слуцкий Ε. Ε.— Тр. Среднеаз. ун-та, 1939, т. 31, с. 1—15. 14. Дынкин Е. Б.- Изв. АН СССР. Сер. мат., 1952, т. 16, с. 569—572. 15. Kinney J. R.— Trans. Amer. Math. Soc, 1953, vol. 74, p. 280—302. 16. Ambrose W.— Trans. Amer. Math. Soc, 1940, vol. 47, p. 66—79. 17. Прохоров Ю. В.— УМН, 1953, т. 8, вып. 3, с. 165—166. 18. Kolmogoroff A. N.— С. г. Acad. sci. Paris, 1935, vol. 200, p. 1717 — 1718. 19. Hopf E.— J. Rat. Mech. and Analysis, 1952, vol. 1, p. 87—123. 20. Mourier E,— С r. Acad. sci. Paris, 1950, vol. 231, p. 28—30. 21. Fortet #., Mourier E.— С. г. Acad. sci. Paris, 1954, vol. 238, p. 1557 — 1559. 22. Fortet i?., Mourier E.— Bull. sci. math., 1954, vol. 78, p. 14—30.
45. О свойствах функций концентрации П. Леей 419 23. Fortet #., Mourier Е.— Arm. Ecole norm, super., 1954, p. 267—285. 24. Mourier E. Elements aleatoires dans un espace de Banach: These Doct. Paris, 1954. 25. В ache Her L. Les nouvelles methodes du calcul des probabilites. Paris, 1939. 26. Luneburg J?.—Math. Ann., 1931, Bd. 104, S. 700. 27. Petrovsky T. G.~ Math. Ann., 1934, Bd. 109, S. 425—444. 28. Колмогоров Α. Η.— Изв. АН СССР. ОМЕН, 1931, с. 959—962. 29. Колмогоров А. #.— Изв. АН СССР. ОМЕН, 1933, с. 363—372. 30. Хинчин А. Я. Асимптотические законы теории вероятностей. М.; Л.: ОНТИ, 1936. 31. Erdos Р., Кае М.— Bull. Amer. Math. Soc, 1946, vol. 52, p. 292—302. 32. Erdos P.. Kac M.— Bull. Amer. Math. Soc, 1947, vol. 53, p. 1011—1020. 33. Donsker M.— Mem. Amer. Math. Soc, 1951, vol. 6, p. 1—12. 34. Гихман И. И.~ Укр. мат. журн., 1954, т. 6, № 1, с 28—36. 35. Гихман И. И.— Мат. сб. Киев. гос. ун-та, 1953, № 7, с. 8—15. 36. Гихман И. И.— ДАН СССР, 1952, т.' 82, № 6, с 837—840. 37. Гихман И. И.— ДАН СССР, 1947, т. 56, с. 961—964. 38. Гихман И. И.~ Укр. мат. журн., 1953, т. 5, с 413—433. 39. Гихман И. И.— ДАН СССР, 1953, т. 91, № 4, с 1003—1006. 40. Кае М.— In: Proc. Second Berkeley Sympos., 1951, p. 189—215. 41. Maruyama G.— Nat. Sci. Rept Ochanomicu Univ., 1953, vol. 1. 42. Kolmogoroff A. N.— G. 1st. ital. attuar., 1933, vol. 4, p. 83—91. 43. Smimov N. V.— Rev. Math. Moscow, 1939, vol. 6, p. 3—26. 44. Смирнов Η. В.— Бюл. МГУ. Сер. А, 1939, т. 2, № 2, с 3—14. 45. Donsker Μ.— Ann. Math. Statist., 1952. vol. 23, p. 277—281. 46. Anderson Т., Darlong D.— Ann. Math. Statist., 1952, vol. 23, p. 193—212. 45 О СВОЙСТВАХ ФУНКЦИЙ КОНЦЕНТРАЦИИ П. ЛЕВИ *1 Всюду далее мы будем обозначать через I = 1г - · · · +L· сумму независимых случайных величин ξ^, через 0 (I) = sup Ρ {χ < I < χ + 1} Χ функцию концентрации суммы ξ и Qk ^'функцию концентрации \k. Теорему 48.2 из хорошо известной монографии П. Леви «Теория суммирования независимых величин» можно сформулировать следующим образом: Каковы бы ни были 1>ε)>0 ΐί β^>0? можно найти две постоянные δ ]>0 и N > 0 такие, что, как только п^ Ν, неравенство Q* (I) < 1 - ε * Sur les proprietes des functions de concentrations de M. P. Levy.— Ann. Inst. H. Poincare, 1958, vol. 16, N 1, p. 27—34. Перевод В. М. Круглова. 1 В двух выпусках «Трудов Института статистики Парижского университета» были опубликованы статьи в честь Поля Леви. Данная статья поступила слишком поздно, чтобы быть включенной в эти выпуски.
420 45. О свойствах функций концентрации П. Леей влечет неравенство Q W]fn) < β. (1) Недавно мне понадобилось некоторое обобщение неравенства (1), Я смог удовлетвориться следующей теоремой [1]. Теорема. Существует постоянная С такая, что неравенства 2 L^l, L2 > Ζ2 log st где η *= Σ (i-&(*)), влекут неравенство Q (L) < CLIlY~s. (2) В настоящей заметке я предлагаю доказательство этой теоремы. Другое уточнение неравенства (1) опубликовано с подробным доказательством В. Дёблиным в его статье [2]. Соответствующее место в [2] не сформулировано в четкой форме и в формуле содержится опечатка 3. Тем не менее кажется очевидным, что, применяя терминологию функций концентрации, результат В. Дёблина может быть сформулирован следующим образом: Каковы бы ни были ε ^> 0 и β ^> 0, существуют постоянные δ ^> О и N ^> 0 такие,. что как только выполнено условие L так неравенство Q* (h) < 1 — ε влечет неравенство Q № < β. (3) Было бы интересно найти такие неравенства, которые бы включали (2) и (3) как естественные частные случаи. Вообще я хотел бы отметить, что дальнейшее развитие элементарных методов прямого подсчета вероятностей, столь блестяще развитых во Франции П. Ле- ви и В. Дёблиным, как представляется, продолжает оставаться столь же актуальным, как и развитие классических методов или методов функционального анализа. Во всяком случае, мне не удалось доказать результаты, изложенные в моей цитированной выше статье [1], 2 Здесь и далее логарифм берется по основанию 2. 2 3 Вместо ^ Ζ2· напечатано VZ.
45. О свойствах функций концентрации П. Леей 421 без использования этих элементарных прямых методов. Весьма вероятно, что математики, которые лучше владеют тонкими свойствами характеристических функций, смогут рано или поздно доказать и даже обобщить теоремы из [1] с помощью чисто аналитических методов, как это уже случалось с результатами, доказанными вначале прямыми методами теории вероятностей. Кажется, однако, что мы сегодня еще находимся в том периоде, когда соревнование этих двух направлений приводит к наиболее плодотворным результатам. Если П. Леви, который равно владеет обоими этими направлениями, реализует эту параллель в своих собственных работах, то следует пожелать, чтобы после преждевременной смерти В. Дёблина вероятыо- стники младшего поколения, несмотря на преклонение перед мощью (в конце концов совершенно оправданной) методов, связанных с распределениями в функциональных пространствах, не забывали бы прямых методов. Воспользуемся следующими обозначениями: F (χ) = Ρ {ξ < χ), а = Μξ, σ2 = Οξ. Следующая лемма известна. Лемма 1. Существует постоянная Сг такая, что неравенство I L· - at\ < I, где ак = Μξ^ (к = 1, 2, . . ., п), влечет неравенство \F(x) -Ga,0(x)\^C1l/a, Ga, σ — нормальная функция распределения с параметрами α, σ. Следующая лемма представляет собой обобщение леммы 48.2 из «Теории суммирования независимых величин». Лемма 2. Существует постоянная С2 такая, что соотношения р {L· = **} = Ρ {L· = -**} = V2, xk > I (k = 1, 2, . . ., л), L > ΙΫΙ^η' {η > 2) влекут неравенство Q(L)^C2L/lYn. Для ее доказательства необходимо различать следующие три различных случая: 1°. L>lYn; 2°. L^lYn, кроме того, существует г > 1 такое, что количество пТ чисел #fe, лежащих в интервале ¥-4 < *к < 4% (4) удовлетворяет неравенствам пг ;> п/¥, nr > n/A log n;
422 45. О свойствах функций концентрации Π. Леей 3°. L ^lyn и не существует числа г со свойствами, указанными в пункте 2°. В первом случае Q (L) ^ ί < L/ΐγη. Во втором случае естественно рассмотреть сумму ξ^ величин Еь удовлетворяющих условию (4). Поскольку все члены этой суммы удовлетворяют неравенствам | ξ, | < /* = 44, σ* = УЩ > 4'-Ч γ!ζ > 4" 1^' то для соответствующей функции F% (χ) по лемме 1 имеем | F, (х) - <?„,„, (х) | < d Ι./σ, < -^ < 8Cl^ < ^ · (5) ]/ пг γη ι γ η Так как функция концентрации Qa, σ (L) нормальной функции распределения Ga,G удовлетворяет неравенству ρα,σ(£)<—^-,. мы имеем окончательно во втором случае ((^ (L) обозначает функцию концентрации ξ^): <?<ί)«?·^<τέϊ:+τ^'<(^:=:+*:ι)ϊ7Γ· <6) Согласно третьему случаю для каждого г > 1 выполняется одно из двух следующих неравенств: либо пг <С п/4г, (7) Либо Пг < tt/4 log 72. (8) Сумма η' чисел пГ1 удовлетворяющих неравенству (7), не превосходит оо ΣΙ Π Поскольку сумма всех пг равна п, сумма п" тех тгг, которые удовлетворяют неравенству (8), не меньше 1/2п. Ясно, что среди всех таких пг найдутся по крайней мере 2 log n отличных от нуля чисел. Поскольку количество тех г, которые удовлетворяют неравенству 4rZ < L < I }глш меньше log n, то существует некоторое количество, не меньшее log ?г, таких, что /гГ > 0, 4r/ > L.
45. О свойствах функций концентрации Π. Леей 423 Выбрав среди этих г только четные или только нечетные числа в порядке возрастания, получим последовательность гг < г2 < . . . <rs, s > V2 log и, для которой Выберем члены ξ/(1, ξ/·2, . . ., ikg таким образом, чтобы 4Г'-У < xhi < 44 и изучим их сумму ξ'. Поскольку | Ь. | < 4ГЧ = L{ > L, 4£Ь1 < | ^ ! < Li (i = 2, 3, . . ., 5), то более или менее элементарные рассуждения, которые могут быть проведены читателем, показывают, что сумма ξ' может находиться в некотором отрезке длиной L при одной-единственной вполне определенной комбинации (если η ^> 1) знаков членов ξ/4, другими словами, с вероятностью не больше 2~s <C п~^2. Следовательно, в третьем случае из-за условия L ^ I имеем Q (L) < Q' (L) < 1/ )Гп < L/l\/H. (9) Сравнивая неравенства (5), (6), (9) в этих трех случаях, видим, что лемма 2 доказана. Перейдем к доказательству теоремы. Соотношения F* {Щ (у)) <y<Fk (щ (у) + 0) (10) определяют функцию щ (г/), 0 < у < 1. (Fk (x), будучи функцией распределения случайной величины |fr, определяет единственным образом значения функции ик (у) для всех у в интервале 0 < г/ < 1, кроме, быть может, счетного множества точек г/ 4.) Ее можно рассматривать как обратную функцию и* (У) = F11 (у), определение которой уточняется подходящим образом для тех точек г/, которые соответствуют точкам разрыва функции ί\ (%)· Если предположить, что случайные величины % распределены равномерно на интервале (0, 1) и что они взаимно независимы, то величины ^ = Щ (%) будут также взаимно независимы и подчинены распределениям Fk (χ). Очевидно, можно предположить, не умаляя общно- 4 Единственность не имеет места для тех точек т/, которым соответствуют интервалы постоянства функции Fk (χ), но легко видеть, что функция щ (у) может быть непротиворечиво определена на всем интервале (0, 1) так, чтобы выполнялось условие (10).
424 45. О свойствах функций концентрации П. Леей сти, что первоначально заданные случайные величины J-fc выражены таким же образом. Можно предполагать, что все функции Qk (l) меньше единицы, поскольку, исключив из наших рассуждений те члены, для которых Qk (I) = 1, и получив для суммы всех остальных неравенство (2), можно вновь ввести исключенные члены, что не приводит к возрастанию Q (L). Положим 4ε* = 1 - Qk (Ζ), х* = Щ (ε*), x'k = щ (1 — гк). Легко видеть, что х'к — Хк > Ζ. Обозначим через къ к2, . . ., кт индексы к, для которых % < гк или % > 1 — ε*. Фиксируем величины | %>, если %r<e7l>, г — [ 1 — %v, если цкг > 1 f- 8Д>. Легко видеть, что совместное условное распределение случайных величин £fr. будет таким, что они останутся взаимно независимыми и каждая из них будет иметь распределение Ρ {ξκΓ = ar + xr} = Ρ {ξ*Γ = αΓ — xr} = V2, где ^г = Va [afcr (1 — ΖΓ) — wfcr (Zr)]f «г = Va К (1 - Zr) + akf (Zr)]. Применяя (при kr и Zr фиксированных) лемму 2 к величинам £г = = 1кг — ari Для которых | ξί | > Ζ' = 72Ζ, мы получим, когда Ζ/ ^ > Z'jAog а/1, неравенство ρ (L) < C2L/l'fm = 2C2L/lYm. (11) Неравенство (И) доказано для условной функции Q (L) (когда тх кГ1 ar, Zr фиксированы и L>1' T^log m)· Отсюда немедленно вытекает неравенство Q (L)< ρ + AC2L/l Y's для абсолютной функции Q (L), где ρ = 1 _ Ρ {i/s < m < 5}.
46. Переход ветвящихся процессов в диффузионные 425 Нам остается только оценить эту последнюю вероятность. Поскольку М/?г = Zj2ε^, = Τ5' Dm = 2^2ε*ί1 ™ε*) < Τ5' то согласно неравенству Чебышева для к = 1/^s l-P{|s<m<S}<P{|m~Mm|>/i}<^<4. Таким образом, мы получим окончательно <?(L)<4 + -^ для*>1 или, поскольку всегда Q (L) ^ 1 и по нашим предположениям L !> 1% Q (L) < Cb/Z/^ где С = 8 + 4С2. ЛИТЕРАТУРА 1. Колмогоров Л. В. Две равномерные предельные теоремы для сумм независимых слагаемых.— Теория вероятностей и ее применения, 1956, т. 1, № 4, с. 426—436. 2. Doehlin W. Sur les sommes d'un grand nombre des variables aleatoires inde- pendantes.— Bull. sci. math., 1939, vol. 63, p. 23—32; 35—64. 46 ПЕРЕХОД ВЕТВЯЩИХСЯ ПРОЦЕССОВ В ДИФФУЗИОННЫЕ И ПРИМЫКАЮЩИЕ ЗАДАЧИ ГЕНЕТИКИ* (Обзорный доклад) Абстрактная теория «ветвящихся процессов» с «числом частиц», принимающих любые неотрицательные действительные значения (см. [1]), была, следует думать, развита в качестве теории, могущей охватить предельные закономерности обычных ветвящихся процессов при большом числе частиц. Такой реальный процесс, по-видимому, имеет в первую очередь специальный случай диффузионных ветвящихся процессов. В простейшем однородном одномерном случае соответствующее уравнение Фоккера—Планка имеет вид их = V2 Ъ {хи)хх — а (хи)х. (1) Более сложная примыкающая сюда задача была рассмотрена еще Фишером в замечательной книге [2]. В популяции из N особей * Теория вероятностей и ее применения, 1959, т. 4, № 2, с. 233—236.
426 46. Переход ветвящихся процессав в диффузионные ген А может быть представлен в ν экземплярах О < ν < 2Ν. Для ξ = ν/2ΛΓ, ^ 0<ξ<1, Фишер получает уравнение Фоккера—Планка их =. V2 Ь [я: (1 — х)и]хх, (2) которое даже при больших N разумно только при х, не слишком близких к 0 или 1. Зато вблизи χ = О величина ν подчинена закономерностям ветвящегося процесса, вблизи же χ = 1 такой характер имеет величина 2./V — v. Аналогичные задачи могут возникнуть и в физике, и в химии. Введением в весь круг вопросов может служить статья Феллера [3]. Соответствующие генетические задачи изложены (математически нестрого), кроме [2], в [4, 5]. Основные сведения по ветвящимся процессам, как известно, содержатся в обзоре Севастьянова [61. Любопытно, что с точки зрения теории диффузионных процессов мы сталкиваемся здесь с вырожденным случаем: коэффициент диффузии Ьх/2 или Ъх (1 — х)/2 обращается в нуль на естественных границах. Феллер подчеркивает возникающие по этой причине трудности в [3]. Он, однако (примеч. на с. 238), напрасно объявляет лишенными смысла некоторые результаты биологов, которые при надлежащей интерпретации верны. Мне кажется, что в данной области есть много тем, заслуживающих дальнейшей разработки. В нижеследующем я лишь даю примеры диффузионной трактовки некоторых простейших результатов, полученных другими методами, и указываю на правильную интерпретацию некоторых результатов Фишера, отрицаемых Феллером. Пусть за один шаг процесса одна частица превращается в к частиц с вероятностью р^ (N)> Σρ*(Λ0 = 1, Σ*Ρ*(Λ0=1+ «(#). %k{k-l)Pk{N) = b(N)t к к к %k(k-l)(k-2)Ph(N) = c(N). к Параметр N будем стремить к бесконечности, предполагая при этом4 что Ръ (N) -> рь (3) Να (Ν) -► α, (4) b (N) -* b, (5) с (Ν) — с, (6) a, b, с конечны.
46.. Переход ветвящихся процессов в диффузионные 427 Суть допущения (4) заключается в том, что при числе частиц порядка N и а порядка ΪΙΝ роль числа частиц в ходе процесса систематического роста (убывания) и роль случайного рассеяния будут одного порядка. Если порядок а больше, то процесс при большом числе частиц делается почти детерминированным, если α будет меньшего порядка, то им можно пренебречь. Изучению «пограничных» явлений при а, близком к нулю, посвящена работа Севастьянова [7]. Именно здесь от введения диффузионной идеализированной модели и следует ожидать пользы. Если положить теперь число частиц ν равным то естественным временным переменным для изучения поведения величины ξ делается τ, связанное с числом шагов процесса t соотношением t - Ντ. При сделанных допущениях процесс ξ (τ) в пределе при N —> оо дает диффузионный процесс с уравнением Фоккера — Планка (1). Уравнение (1) при а = О имеет решение и (τ, χ) = (c/τ2) е-^1Ъх (7) с особенностью в точке τ = 0, χ — 0. Оно и описывает в известном смысле поведение потомства одной частицы, появившейся в момент времени τ — 0. Смысл этот таков: если при τ0 ^> 0 подобрать с так» что оо \ и (т0, x)dx— 1, о то условное распределение ξ (τ) при τ > τ0 в предположении, что £ (το) !> 0, сходится при iV-> оо к распределению Ρ {Ι (τ) < χ} = 0, χ < 0, χ Ρ {ξ (τ) < χ} = Ρ (τ) + J и (τ, χ) dx, χ > 0, ο οο ^(τ) = Ρ{ξ(τ) = 0} = 1— J u-(r,x)dx. ο Общее решение стационарного уравнения при а = 0, т. е. уравнения {хи)хх = 0, имеет вид и (х) = сг1х + с2.
428 47'. О классах ф(») Форте и Блан-Лапъера Это не распределение вероятностей. Однако решение и (х) = сх1х имеет такой статистический смысл: если стационарным образом на каждом шагу с вероятностью ρ возникает новая частица и μ (хг, х2) есть число этих исходных частиц, потомство которых в какой-либо фиксированный момент времени t заключено в пределах Nx± < ν < Νχ2, то математическое ожидание Μμ (хъ х2) при N —> оо стремится к пределу Χι 2 Г dx Ъ ) χ' Аналогичную интерпретацию имеет решение cjx + с2/(1 — х) стационарного уравнения {х (1 — х)и)хх = О и теории Фишера. Эта интерпретация была даже проверена на опыт" ном материале и оправдгщась практически. 18 ноября 1958 г. ' ЛИТЕРАТУРА 1. Иржина М.— Чехословац. мат. журн., 1958, т. 8, с. 83. 2. Fischer R. A. The genetical theory of natural selection. Oxford, 1930. 3. Feller W.~ In: Proc. Second Berceley Sympos., 1951, p. 227—246. 4. Malecot /. Les mathematiques de heredite. Paris, 1948. 5. Wrigth £.— Bull. Amer. Math. Soc, 1942, vol. 48, p. 223—246. 6. Севастьянов Б. Α.— УМН, 1951, т. 6, вып. 6, с. 37—99. 7. Севастьянов Б. А.— Теория вероятностей и ее применения, 1959, т. 4, № 2, с. 121-135. 47 О КЛАССАХ Ф<*> ФОРТЕ И БЛАН-ЛАПЬЕРА * Если для действительного случайного процесса ξ (ή существуют непрерывные абсолютные моменты порядка п, подчиненные условию м|Н0Г<с(1 + И*), (1) то при k <^ η моменты mfih, ·..,**) = Μ [ξ (Ο, · · ., I (f*)l * Теория вероятностей и ее применения, 1960, т. 5, № 3, с. 373.
48. Об условиях сильного перемешивания 429 можно представить в виде mf (h, . . ., tk) = I . . . I e*'*y.f (λν . . ., λ,-) άλ, . . . d%k, где μ| — обобщенные функции. Процесс принадлежит классу Φ(λΐ) (см. [1]), если все μψ «типа конечной меры», т. е. mfih,. . .,fk) = ί...ϊ e*<*.»Jff (<Щ, где Μι ) (А) — конечная комплексная мера в ^-мерном пространстве. Хорошо известно, что при η = 2 для строго стационарных ξ (t) из существования моментов Μ | ξ | и Μ | ξ |2 вытекает принадлежность к классу ф(2>. Можно показать на примере, чго аналогичное утверждение неверно при η > 2. ЛИТЕРАТУРА 1. Blanc-Lapierre A., Fortet R. Theorie des functions aleatoires. Paris, 1953. 48 ОБ УСЛОВИЯХ СИЛЬНОГО ПЕРЕМЕШИВАНИЯ ГАУССОВСКОГО СТАЦИОНАРНОГО ПРОЦЕССА* Совместно с Ю. А. Розановым Две σ-алгебры событий $$' и W независимы, если при любых А' <= «R' и 4ffGf Ρ (Л', Л*) - Ρ {Α') Ρ [Α"). Μ. Розенблатом [1] была предложена естественная мера зависимости двух σ-алгебр событий: а (в»', Щ = sup | Ρ (Л' П 4") — Ρ (Α') Ρ {Α") |. Для стационарного случайного процесса ξ (£) (где 3R* означает σ-алгебру событий, порожденную величинами ξ (и), s *ζ и <^ ί) зависит только от τ и будет обозначаться α (τ). Если α (τ) —» 0 при τ —>· оо, то говорят, что процесс ξ (£) обладает свойством сильного перемешивания. В настоящей заметке выясняется для случая гауссовских процессов, какие свойства спектральной функции F (λ) процесса гарантируют наличие сильного перемешивания. * Теория вероятностей и ее применения, 1960, т. 5, № 2, с. 222—227.
430 48. Об условиях сильного перемешивания 1. Для любых двух систем {ξ} = St' и {η} = St", имеющих конечные вторые моменты, введем показатель ρ (*', Г) = SUp |Μ(ξ-Μξ)(η-Μη)| 6,ή [Μ (ξ-Μζ)*Μ (η-Μη)*]/* Если St' и St" являются соответственно совокупностями всех величин с конечными вторыми моментами, измеримых относительно σ-алгебр $?' и 5R", то по определению (см. [2]) р(д»',8Г) = р(«\ЗГ) есть максимальный коэффициент корреляции между алгебрами $Г -и №. Легко видеть, что всегда a(f,r)<p(f,»'). (1) Пусть теперь {ξ} и {η} — две совокупности случайных величин> имеющих (для любого конечного набора ξ1? . . ., ξ7η, ηχ, . . ., η^) гауссовские совместные распределения, $ίξ и $ϊη суть σ-алгебры, порожденные соответственно событиями (ξ Ε Г) и (η ΕΞ Γ"), где Г' и Г" — произвольные борелевские множества на прямой, Hi и #η суть замкнутые линейные оболочки (в среднеквадратичном) совокупностей {ξ} и {η}. Теорема I1. Имеет место следующее равенство: Р(ай6,а»ч)=р(я6,ял). (2) Теорема 2. Максимальный коэффициент корреляции удовлетворяет следующим неравенствам: α (*% $?η) < ρ (% 3Κη) < 2πα (% ί»η). (3) Доказательство теоремы 1. Очевидно, можно ограничиться случаем, когда совокупности {ξ} и {η} состоят из конечного числа величин. Далее, в пространствах Н% и ΗΆ можно выбрать величины ξχ, . . . . . ., £m и η1? . . ., ηη таким образом, чтобы среди них были зависимы лишь величины ξ1{ и%с одинаковыми индексами и каждая из величин ξ е {ξ}, η ΕΞ {η} была функцией от ξχ, . . ., Sm и η1? . . ., ηη соответственно; можно считать также, что Μξ^ = 0, Mrjj = 0, Οξ^ = = Οη;· = 1, k = 1, m, у = 1, тг. Далее, величины / = / (ξχ, . . ., lm) и g = g (η1? . . ., ηη) можно представить в виде т η 1 Теорема 1 есть многомерное обобщение результата Сарманова [2], согласно которому равенство (2) выполняется для любых двух величин ξ и η. имеющих гауссовское совместное распределение.
48. Об условиях сильного перемешивания 431 где Л = м (/1 glf . . ., ξ,)_Μ(/|ξ2, ..., ξ,.,), gj = Μ (gr I ηχ, . . ., η,·) — Μ (gr I ηχ η^). Заметим, что при А: > / Μ[Μ(/|ξ1; .. ., Ι,) |η1; . . ., η;·] = = Μ[Μ(/|ξ1; . ... 1}) |η„ ..., η;| ж аналогично при j ^ к Μ[Μ(?|ηΐι .. .,η,) |glf . . .,ξ,] = = Μ [/Α (£ | ηΐί. . ., щ) |ξ1?. . ., ^], откуда следует, что Μ/^· = 0 при Л --^=7 и> считая для определенности т ^ п, т т 1 1 Величины ξΛ и η^,, имеющие гауссовское распределение, не зависят от ξ1? . . ., ξ^, η1τ . . ., η^-χ и из, цитированного уже результата Сар- манова [2] выводим, что I M (fkgk \lu · · ·> Sft-i, ηι» · · ·> %-ι) Ι < рМь где р^р(Я|,ял), 4 = Μ(^|ξι,.. .,ξ/c-i, ль · . ·,%-ι), bl = Μ (g| | ξχ, . . ., ξΛ_1? η„ . . ., η^). Отсюда получаем, что πι |Mfe|<p2jMafcbk<p, 1 что и доказывает нашу теорему. Доказательство теоремы 2 2. Возьмем произвольное ε > 0 и ξ6 (Ξ Щ, Щ<=Нцс Μξε = Μηβ = 0, Οξε = Οη8 = 1 такие, что г = Μξ8ηβ ^> ρ — ε. Рассмотрим события Лг = (1г>0}(^Щ И 58={ηε>0}(Ξ$Β?η. Имеем (см. [9, с. 321]) P(AEBe) = ^ + ^-avcsmr, Р(Аг)Р{Вг) = \ ж, очевидно, ~RYcsmr = P(A8BQ) — Р(А8)Р(Ве)^а. 2 Это простое доказательство было .указано авторам Ю. В. Прохоровым.
432 48. Об условиях сильного перемешивания Далее, если а ^> V4, то неравенство ρ <^ 2па тривиально. Если же а <С V4, то ρ — ε <С г <^ sin 2πα, ρ <; 2πα + ε, ρ <; 2πα, что вместе с соотношениями (1) и (2) и доказывает нашу теорему. Из теорем 1 и 2 вытекает, в частности, что гауссовский стационарный процесс ξ (t) обладает свойством сильного перемешивания тогда и только тогда, когда максимальный коэффициент корреляции ρ(3Κ!_οο, $Ά?+τ) —> 0 при τ—>оэ (в силу теоремы 1 он совпадает с показателем ρ (τ) = ρ (Я_оо, НГ+τ), где Н-оо и Них суть линейные замыкания в среднеквадратичном величин ξ (и), и <^ t, и ξ (ν), ν > t, соответственно), более того (ср. [4, введение]), α (τ)< ρ (τ) < 2πα (τ). - (3') 2. Пусть ξ (t) — стационарный в широком смысле процесс и ρ (τ) = ρ (#*_„, #Γ+τ) (показатель р (τ) не зависит от ί в силу стационарности). Если спектральная функция F (λ) нашего процесса не абсолютно непрерывна, то ρ (τ) = 1 при любых τ (см. [5, 6]). Пусть F (λ) абсолютно непрерывна и / (λ) есть спектральная плотность процесса ξ (t), f (λ) = F' (λ). Теорема 3. В случае целочисленного времени ρ (τ) = inf vrai sup Γ| / (λ) — βίλτφ (έΗλ) | -т^— 1 , (4) φ λ L /(Л) J где inf берется по всем функциям φ (ζ), аналитически продолжаемым φ внутрь единичного круга; в случае непрерывного времени ρ (τ) =± 'inf vrai sup [ | / (λ) - e<«q> (λ) | -^-J , (4') где inf берется по всем функциям φ (ζ), аналитически продолжаемым φ β нижнюю полуплоскость. Доказательство этой теоремы основывается на одной общей лемме из функционального анализа. Лемма. Пусть L — некоторое банахово пространство, L* — сопряженное к нему. Пусть Η — некоторое подпространство пространства L и Н° — совокупность линейных функционалов, обращающихся на Η в нуль. Для любого h* ΕΞ Ζ/* имеет место следующее соотношение: sup h*'Ah)= inf II λ* —Α° II. (5) лея, №=i h°^H» Доказательство. Поскольку (А* — h°) (h) = h* (h), то при h е Я, || h || — 1 имеем /г* (/г) < || /г* — h° \[ и потому
48, Об условиях сильного перемешивания 433* sup fc* (h) <; inf || h* — h°\\. Далее, по теореме Хана—Банаха ЛеЯ, ||/ι||=1 h°tEH° о продолжении линейного функционала существует функционал h19. совпадающий на Η с /г*, норма || hi || которого не превосходит sup fc* (/г). Разность /г* — /^ = /&J ΕΞ Я0 и ЛеН,||Л||=1 II Л* -/г? || = || А? || = sup /г* (/г), Лея, ||лц=1 что и доказывает соотношение (5). Вернемся к нашей теореме. Очевидно, что ■ ρ (τ) = sup ]' e^Pl {λ)ρ2 (λ) / (λ) άλ, /ι, is где ρ,.(λ)= 2 с{е-шК $|Ρ;|2/(λ)<*λ<1 и интегрирование производится в пределах от —π до π в случае целочисленного времени и в пределах от —оо до оо в случае непрерывно· го времени. Используя некоторые свойства граничных значений аналитических функций, можно показать, что на самом деле ρ (τ) - sup ]' e** ρ (λ)/ (λ) άλ, (6) ρ где Ρ(λ)= Σ c*e-ix\ 5|ρ(λ)|/(λ)^λ<1. tk>o Возьмем в качестве пространства L пространство функций h (λ), интегрируемых с весом / (λ), || h || = ] | h (λ) | / (λ) άλ, в качестве подпространства II линейное замыкание функций ρ (λ) вида Ρ(λ)= Σ ске-™К Каждый линейный функционал /г* на L имеет вид /г* (h) = J /г* (λ) h (λ) / (λ) dk, причем || /г* || = vrai sup | /г* (λ) j. λ Подпространством Н° будет, очевидно, подпространство линейных функционалов h° с соответствующими функциями h° (λ), для которых j e~it%h0 (λ) / (λ) dX = О при всех t > 0. Отсюда следует, что функция φ (β~ιλ) = h° (λ) / (λ) может быть аналитически продолже-
434 48. Об условиях сильного перемешивания на внутрь единичного круга в случае целочисленного времени, а в случае непрерывного времени φ (λ) = ft (λ) / (λ) может быть продолжена аналитически в нижнюю полуплоскость. Взяв в качестве ft* линейный функционал, соответствующий функции ft* (λ) = е~ъхх, из соотношения (5) леммы получаем равенства (4) и (4'). Теорема 4. Если существует функция φ0 (ζ), аналитическая внутри единичного круга в случае целочисленного времени (в нижней полуплоскости в случае непрерывного времени), имеющая граничное •значение φρ (erix) (соответственно φρ (λ)), такая, что отношение jf/φο является равномерно непрерывной функцией от λ, причем I //фо ! > ε ^> 0 для почти всех λ, то при τ —> оо ρ(τ)->0. (7) Если существует аналитическая функция φ0 (ζ) такая, что | //φ0 | ;> ]> ε ^> 0 и производная (//φ0)(/ι) равномерно ограничена, то ρ (τ) < cx~k. Доказательство. Пусть φ (ζ) есть полином степени не выше [τ/2] в случае целочисленного времени (аналитическая функция экспоненциального типа с показателем не выше τ/2 в случае непрерывного времени). Имеем inf vrai sup Ι / — <Ηλτφ Ι . .. ч <Γ inf vrai sup Ι Μ βίλτψ φ b*lU Τ1 /(λ) J %=φόψ /LI ΦΟ φο| / ^ 1 8 ψ λ f φο < — inf vrai sup - <?ίλτψ —► О (8) при τ —> оо, так как отношение //φ0 можно равномерно приблизить -функциями ψ (ζ) описанного типа (см. [7, с. 207; 8]). Например, свойство (7) всегда выполняется, если спектральная плотность / (λ) непрерывна и не обращается в нуль ни при каких λ, —π <; λ <ζ τ (случай целочисленного времени) или если / (λ) равномерно непрерывна на всей прямой, не обращается в нуль и при достаточно больших λ удовлетворяет неравенству m/kk < / (λ)< Μ/λ*"1 (9) лри некоторых положительных т, Μ и целом к ^> 0 (случай непрерывного времени). Далее, из работ [5, 6] вытекает, что если ρ (τ) —» 0 при τ —»оо, то спектральная плотность не может «очень сильно» обращаться в нуль: именно она должна быть положительна почти всюду и JJftigL^-oo. (Ю) Как следует из теоремы 4, более слабое обращение в нуль спектральной плотности / (λ), совместимое с (10), само по себе не противо-
49. Случайные функции нескольких переменных 435 речит свойству сильного перемешивания (эквивалентному (7)). Если f (λ) рациональна относительно βιλ (при целочисленном t) или относительно λ (при непрерывном t), то показатель ρ (τ) убывает экспоненциально быстро; например, в случае / (λ) = с/(а2 + λ2) (ξ (t) есть марковский гауссовский процесс) ρ (τ) = е~ах. По-видимому, свойство сильного перемешивания может не выполняться, если спектральная плотность /(λ) терпит разрыв (даже если она всюду больше положительной постоянной в случае целочисленного t). Авторы выражают благодарность Ю. В. Прохорову за замечания, сделанные им при просмотре рукописи настоящей заметки, несомненно способствовавшие ее улучшению. ЛИТЕРАТУРА 1. Rosenblatt M. A central limit theorem and a strong mixing condition.— Proc. Nat. Acad. Sci. Wash., 1956, vol. 42, N 1, p. 43—47. 2. Сарманов О. В. Максимальный коэффициент корреляции.— ДАН СССР, 1958, т. 121, № 1, с. 52—55. 3. Сарманов О. В., Захаров В. К. Максимальные коэффициенты множественной корреляции.— ДАН СССР, 1960, т. 130, № 2, с. 269—271. 4. Волконский В. Α., Розанов Ю. А. Некоторые предельные теоремы для случайных функций. I.— Теория вероятностей и ее применения, 1959, т. 4, № 2, с. 186—207. 5. Колмогоров А.Н. Стационарные последовательности в гильбертовом пространстве.— Бюл. МГУ. Математика, 1941, т. 2, № 6, с. 1—40. 6. Крейн М. Г. Об одной экстраполяционной проблеме А. Н. Колмогорова.— ДАН СССР, 194.5, т. 46, с. 339—342. 7. Ахиезер Н. И. Лекции по теории аппроксимации. М.; Л.: Гостехиздат, 1947. 323 с. 8. Бернштейн СИ. О наилучшем приближении непрерывных функций на всей вещественной оси.— ДАН СССР, 1946, т. 51, с. 327^-330; 485—488. 9. Крамер Г. Математические методы статистики/Пер. с англ. М.: Изд-ва иностр. лит., 1948. 49 СЛУЧАЙНЫЕ ФУНКЦИИ НЕСКОЛЬКИХ ПЕРЕМЕННЫХ, ПОЧТИ ВСЕ РЕАЛИЗАЦИИ КОТОРЫХ ПЕРИОДИЧНЫ * Репером в евклидовом пространстве Еп называется набор υ = (Llf . . ., ίη) из п линейно независмых векторов. Функция k (t) от /г-мерного вектора t называется jR-периодической, если существует репер ■К = ('ι> · · ·» In), * Теория вероятностей и ее применения, 1960, т. 5, № 3, с. 374.
436 50. Об оценке параметров гауссовского марковского процесса конгруэнтный R, для которого к = (z4? + . . . +znl*) = f (z\ . . ., ζ") и функция / периодична по каждому переменному zk с периодом 2π. Даются необходимые и достаточные условия Л-периодичности почти всех реализаций случайной функции ξ (t) в терминах «спектральных моментов». Отсюда, в частности, вытекает, что стационарная изотропная Л-ие- риодичная случайная функция, не равная константе, не может быть при η = 1 гауссовской. Изложенное может иметь интерес при исследовании потенциалов и решений уравнения Шредингера в кристаллах и средах с «близким порядком». 50 ОБ ОЦЕНКЕ ПАРАМЕТРОВ КОМПЛЕКСНОГО СТАЦИОНАРНОГО ГАУССОВСКОГО МАРКОВСКОГО ПРОЦЕССА* Совместно с М. Арато и Я. Г. Синаем § 1. Мы будем.рассматривать^ двумерный стационарный случайный процесс, компоненты которого ξ (t) и η (t) удовлетворяют стохастическим дифференциальным уравнениям dl = —%ldt — ωηώ + dq>, (1) dr\ = ωξώ — Kx\dt + <ΐψ, где φ (ί) и ψ (t) — два независимых винеровских процесса с ΛΛ^φ = Μ<ίψ = 0, Μ {dyf = Μ ЩУ = adt. Полагая ζ = ξ + ΐη, Χ = φ + *ψ, γ = λ — ίω, лможно записать систему (1) в виде одного уравнения άζ - -yldt + dl. (la) Комплексная корреляционная функция нашего процесса имеет жид С (τ) = Α (τ) + IB (τ) = Μ [ζ (ί) ζ (ί + τ)] - = σ2 exp (—λ | τ | — ίωτ), (2) где σ2 = α/λ. * ДАН СССР, 1962, т. 146, № 4, с. 747—750.
50. Об оценке параметров гауссовского марковского процесса 437 Если процесс наблюдается на промежутке [О, Г], то можно определить эмпирическую корреляционную функцию Г—τ φ) = α(χ) + ΐδ(τ) = Ύ±-τ J ζ(ΐ)ζ(Γ+Τ)άί. (3) о Эмпирическая корреляционная функция с вероятностью единица имеет в нуле правую производную / /г\\ 1 2 . 1 2 С (0) = — а — Ύ Sl + -ψ S2 — 1Г, где а есть введенный выше параметр, характеризующий интенсивность «белых шумов» φ' (t) и ψ' (£), a *? = ν8 [ ι ζ (θ) ι2 + ι ζ (Τ) ι«], Τ Τ о о Интегрирование в выражении для г производится по угловому аргументу Θ, определяемому из ζ (ί) = | ζ (t) I **<*>. На рисунке изображена эмпирическая корреляционная функция для чандлеровских вариаций координат полюса Земли *. § 2. Параметр α определяется по реализации точно. Остается рассмотреть задачу оценки параметров λ и ω. Обозначим через Ρ вероятностную меру в пространстве реализаций нашего процесса на отрезке [0, Т]. В том же пространстве введем стандартную меру V = L X W, где L — обычная лебегова мера на плоскости ζ (0), W — двумерная винеровская мера в пространстве приращений ζ (t) — ζ (0) с теми характеристиками, которые были приняты для случайного процесса 1 Мгновенная ось вращения Земли перемещается относительно малой оси земного эллипсоида (так называемая свободная нутация). В этих перемещениях имеется периодическая компонента с годичным периодом. После их элиминации остаются чандлеровские перемещения, имеющие тенденцию к колебаниям с периодом порядка 14 месяцев, но не строго периодические и с большими, в основном плавными (волны порядка 10—20 лет) изменениями амплитуды. Рисунок показывает, что чандлеровская компонента перемещения полюса хорошо удовлетворяет гипотезам, изложенным в начале нашей заметки. Рисунок получен в результате обработки данных табл. 6 работы А. Я. Орлова [1]. Из координат χ (t), у (ή табл. 6 выделена компонента с годичным периодом, остаток принят за ξ (ί) и η (t). На рисунке кружками указаны точки, соответствующие приращениям χ в 0,1 года. По рисунку можно сразу усмотреть, что период 2π/ω равен приблизительно 14 мес. Правильный характер полученной спирали может привести к предположению, что параметр λ тоже поддается очень точной оценке. Это, однако, неверно, как будет объяснено в конце заметки.
438 50. Об оценке- параметров гауссовского марковского процесса χ (ί). Можно показать, что (ср. [2, 31) dP }βψθ)*. CXexpl - 'Тш; Tsl— — si + \T ± — 1 L 2α Δ α α Tr (4) где С — некоторая константа. Формула (4) показывает, что система из трех статистик si, si, r является достаточной системой статистик задачи. Дифференцируя . . dP L = ^g^nr=c,+ logl dV λ2 + ω2τ4- 2α ±.81 + λΤ + —Tr по ω и λ, получаем уравнения dL όω dL ΰλ Τ si 2 I ■г = 0, Τ si- I a + τ = ο (5) (6) для определения оценок наибольшего правдоподобия ώ и λ. Из (5) получаем ω = r/4. r ; (*) Можно показать, что (6> — ω)/σ (ω), σ2 (ώ) = alTs\ JfrJ ;Т~0,Ьи; η = 0,1, ..., 156
50. Об оценке параметров гауссовского марковского процесса 439 распределено (0, 1)-нормально (это точный, а не асимптотический результат!). Уравнение (6) всегда имеет единственное положительное решение. Обозначая λΤ = κ, λΤ = κ, получим для κ уравнение /г2й2 + (Й! — 1) κ — 1 = О, где hx = Si/aT', h2 — s?JaT. Распределение статистик йа и /г2, а следовательно, и κ зависит только от параметра κ. Так как распределение κ непрерывно, то при любых а, 0 < а < 1, и κ, 0<κ<ο°, можно найти такое &, что Ρ {κ > k I κ } = α. (7) Обращая зависимость А = ka (κ), получим зависимость κ = κα (Λ) (установлено, что функция ka (κ) при изменении κ от 0 до оо монотонно меняется от 0 до оо, так что обращение возможно и однозначно). Очевидно, Ρ {κ < κα (κ) Ι κ} = α. (8) Нами организовано вычисление функций κα (κ) при а = 0,1; 0,05; 0,025; 0,01; 0,005; 0,001; 0,9; 0,95; 0,975; 0,99; 0,995; 0,999. Результаты будут опубликованы по окончании вычислений. При малых κ (8) эквивалентно соотношению Ρ {κ < ик} = ехр.(—Ни), (9) т. е. отношение χ/κ имеет распределение χ2 с двумя степенями свободы. При больших π (8) эквивалентно и Р {« < х + и У%) » ^=r J e-'Va Λ, (10) т. е. оценка κ асимптотически нормальна с дисперсией σ2 (κ) ~κ. (11)" § 3. Для отмеченного в начале заметки случая движения полюса Земли на основе наблюдений за Τ = 60 лет получено 2 ώ = 5,274, κ - 3,6, 2π : ώ = 1Д91, σ (2π : ω) = 0,006. 2 Введение в уравнения (1) винеровских φ и ψ, т. е. возмущений типа «белого шума», является в случае движения полюсов Земли, конечно, грубой идеализацией. Более корректно было бы писать V = —λξ — ωη + /, η' = ωξ — λη + g.
440 50. Об оценке параметров гауссовского марковского процесса Асимптотическая формула (11) дает σ2 (κ) = 3,6. Так как κ заведомо положительно, а формула (10) при а <С 0,03 доставляет отрицательную оценку ка, то ясно, что асимптотика (10) еще непригодна. Произведенный нами расчет доставляет оценки κο,θο = 5,5; κο,95 — 6,2; κο,975 — 7,8; κ0,ιο = 1,27; κ0,05 = 0,82; κ0>ο25 = 0,46, что соответствует для λ оценкам λο,9ο — 0,09; λο,95 = 0,10; λο,975 = 0,13; λ0,10 = 0,021; λ0>05 = 0,014; λ0,025 = 0,008. МГУ, 20 февраля 1962 г. ЛИТЕРАТУРА 1. Орлов А. Я. Служба широты. М.: Изд-во АН СССР, 1958. 2. Striebel Ch.— Ann. Math. Statist., 1959, vol. 30, N 2, p. 559. 3. Apamo M.— ДАН СССР, 1962, т. 145, № 1. 4. Федоров Ε. П.— Тр. Полтав. гравиметрической обе, 1948, т. 2, № 3. 5. Папчепко Н. И.~ В кн.: Тр. 14-й Астрон. конф. СССР. М.: Изд-во АН СССР, 1960, с. 232. 6. Munk W. Я., Macdonal G. J. F. The rotation of the Earth. Cambridge, 1960, (Monographs on mechanics and applied mathematics). 7. Jeffreys H.— Mod. Notic. Roy. As/ron. Soc. Geophys. SuppL, 1942, vol. 100, p. 139. 8. Walker A.M., Young Α.— Mon. Notic. Roy. Astron. Soc. Geophys. Supply 1955, vol. 115, p. 443; 1957, vol. 117, p. 119. Однако данные из [1] показывают, что значения функций / (ί) и g (t) в моменты времени ί, отстоящие друг от друга на несколько лет, практически независимы между собой, так что замена функций fug «эквивалентным белым шумом» законна. Ошибка в определении интенсивности а этого эквивалентного белого шума, по-видимому, достаточно мала, чтобы не влиять существенно на результаты оценки параметра λ. Значение ω вычислено по дискретному аналогу формулы (*), полученному по методу наибольшего правдоподобия для «схемы с дискретным временем». Об оценке параметров λ π ω для движения полюса Земли см. также [6]. В [6] приведены результаты, близкие к нашим: λ = У1Ъ, 2я : ω = 1,193. Близкие значения были указаны Джефрисом [7], однако в работах [5, 8] указывались резко отличающиеся значения λ=0,3 и λ = 0,01.
51. О приближении распределений сумм 441 51 О ПРИБЛИЖЕНИИ РАСПРЕДЕЛЕНИЙ СУММ НЕЗАВИСИМЫХ СЛАГАЕМЫХ НЕОГРАНИЧЕННО ДЕЛИМЫМИ РАСПРЕДЕЛЕНИЯМИ * ВВЕДЕНИЕ На протяжении всей статьи •ξ = ξχ + ... +L· сумма η независимых действительных слагаемых, F* (х) = Ρ {h < χ}, Η (χ) = Ρ {Ι < χ}, Go.(*) = -4=- [ e^'**dx, σ>0, Γ 0 при £<^0, E{x) = G0(x)={ ί при я>0, S3 = {D} — совокупность неограниченно делимых функций распределения D (х); Сг, С2, . . .— положительные константы. Далее будут доказаны следующие усиленные варианты двух теорем, более слабые формы которых даны в моей работе [1]. Теорема 1. Существует такое Сх, что в случае одинаково распределенных ξλ·, каково бы ни было F (х) = I\ (х), к = 1, 2, . . . . . ., п, найдется D FE S, удовлетворяющее неравенству | в (х) - Η (χ) |< C^-Va (0.1) ?г/ж всех χ. Теорема 2. Существует такое С2, что при любых ε ^> 0, L ^> 21 ^> 0 £гз соблюдения для всех χ и к — 1, . . ., ?г неравенств E(x — l) — E^Fk(x)*CE(x + l) + e (0.2) вытекает существование D ΕΞ ©, для которого при всех χ D (χ - L) - δ ϊς Η (χ) ^ D (χ + L) + δ, (0.3) δ = С2 шах (4 (log A)72» *,/β) · (°·4) История вопроса такова. * Тр. Моск. мат. о-ва, 1963, т. 12, с. 437—451.
442 51. О приближении распределений сумм 1. Из замкнутости относительно слабой сходимости класса неограниченно делимых распределений, введенного Б. де Финетти [2]„ непосредственно вытекает, что в случае, если распределения сумм 1{Ю = hi +1к2 + ·'· + 1кпк, Ит Щ = оо, (0.5) независимых и одинаково распределенных внутри каждой серии слагаемых слабо сходятся, то предельный закон распределения неограниченно делим. Было соблазнительно понимать этот результат так: сумма большого числа одинаково распределенных независимых слагаемых имеет распределение, близкое к неограниченно делимому. Однако до моей работы [1] такое толкование оставалось не вполне убедительным. Даже в случае схемы последовательности независимых одинаково распределенных слагаемых по В. Деблину [3] возможен «вполне расходящийся» случай, в котором ни при какой нормировке ξ<"> = Ап (ξχ + . . . +Ы - Вп и ни по какой последовательности пх < щ < . . . < щ < . . . распределения сумм ξμ]ί не сходятся к чему-либо, отличному от вырожденных распределений Ε (χ ~ а). Этого последнего, конечно, можно достигнуть, выбирая множители Ап достаточно малыми. Только в 1955 г. Ю/В. Прохоров [4] показал, что в случае последовательности одинаково распределенных независимых величин ξ™ всегда существует последовательность неограниченно делимых функций распределения £>! (х), D2 (χ), . . ., Dn (x), . . ., аппроксимирующих распределения Нп (χ) сумм ξ(,,) = lx + L· + · · · +ln в смысле sup 1 Hn (χ) - Dn (χ) |-*0 (0.6) Χ при η —> оо. Работа Прохорова [4] оставляла, однако, открытым вопрос о том, будет ли сходимость в (0.6) равномерной относительно выбора функции распределения F (х) величин ξη. В терминах равномерной метрики ρ {F', F") = sup I F' (χ) - F" (χ) \
51. О приближении распределений сумм 443 вопрос заключается в следующем: будет ли функция г ψ (η) = sup ρ (#η, £)) F стремиться к нулю при η —.> оо? Моя работа [1] дала ответ на этот вопрос: было доказано, что ψ (и) = О (тГ1/б). (0.7) В 1960 г. Прохоров [5] усилил этот результат, показав, что ψ (η) = О (η'113 log2 η). (0.8) Наша теорема 1 говорит, что 2 ψ (/г) = О (#г-1/3). (0.9) Было естественно поставить вопрос об оценке функции ψ (η) снизу. Такими оценками занимались ученик Прохорова И. П. Царе- градский, сам Ю. В. Прохоров и Л. Д. Мегаалкин. Последний результат Л. Д. Мешалкина [6] таков: ψ (η) > Сгп~2ГЗ (log ή)~Κ (0.10) 2. Для случая сумм независимых внутри каждой серии, но различно распределенных слагаемых А. Я. Хинчин в 1937 г. 17] установил достаточное условие для того, чтобы предельное распределение ξ('"> было неограниченно делимым. Это условие бесконечной малости слагаемых: существуют ε/г -* 0, h -> 0, при которых распределения Fm величин ξ/)4 удовлетворяют условию Ε [χ — k) — ε/, < Fki (χ) < Ε (χ + lk) + ek. Наша теорема 2 является попыткой придать этому результату Хинчина равномерный характер. Качественное содержание теоремы 2 можно сделать более ясным при помощи «расстояния Леви»: pL (F\ F") = inf ε, где inf берется по ε, удовлетворяющим условию F' (х — ε) - ε < F" (χ) < F' {χ + ε) + ε. Легко видеть, что из теоремы 2 вытекает такое 1 Верхняя грань берется по всем функциям распределения F. 2 После окончания этой работы я узнал, что Ф. М. Каган в 1961 г. нашел промежуточный между (0.8) и (0.9) результат: ψ (η) = О (zT^log n). Позднее этот результат был доложен Φ. Μ. Каганом на Совещании по теории вероятностей и математической статистике в Фергане (сентябрь 1962 г.).
444 51. О приближении распределений сумм Следствие. Если sup pL {Fu Ε) < η, г πιο pL (Я, £)<C4r,1/3. 3. Как известно, самым мощным средством доказательства предельных теорем о распределениях сумм большого числа независимых слагаемых является аппарат характеристических функций. «Прямые» вероятностные методы сейчас в этой области лишь редко могут выдержать конкуренцию с возможностями аналитического аппарата характеристических функций. Наши теоремы 1 и 2 являются любопытным примером другого положения вещей. Существенным элементом их доказательства является лемма 1, относящаяся к введенным Леви «функциям концентрации». Теоремы Леви и В. Деблина о свойствах функций концентрации были усилены мною (см. [8]) специально для доказательства первых вариантов теорем 1 и 2, данных в 11]. Дальнейшее продвижение в выводе оценок для функций концентрации принадлежит Б. А. Рогозину (см. [9, 10]). Рогозин тоже пользуется элементарными прямыми вероятностными и теоретико-множественными (теорема Эрдеша о подмножествах конечного множества) методами 3. Тем математикам, внимание которых мне удалось привлечь к нашей задаче, пока не удалось доказать теоремы типа 1 и 2 без обращения к указанным сейчас своеобразным средствам. Во всей данной работе, как и в^работе [1], существенно используются методы рассуждений, введенные В. Деблином (см., например, [3]). Как видно из сказанного выше, переход от показателя V5 к показателю V3 в теореме 1 был осуществлен Прохоровым. Изгнание из оценки Прохорова (0.8) множителя log2 n потребовало: а) употребления более точных оценок функций концентрации, полученных Рогозиным; б) некоторых изменений в доказательстве Прохороваг выразившихся во введении лемм 5 и 6 4. При доказательстве теоремы 2 переход от показателя 1/5 работы [1] к показателю V3 осуществляется близкими приемами, заимствованными из работы Прохорова [5] и связанными с употреблением лемм 5 и 6. 4. Кроме расстояния ρ (*",*") = sup \F'(x)-F"(x) I, Χ 3 Доказательство этого результата Б. А. Рогозина (известного ныне как неравенство Колмогорова—Рогозина) методом характеристических функций было дано в 1966 г. Эссееном.— Примеч. ред. 4 Первый из этих шагов несколько раньше написания моей работы был сделан Φ. Μ. Каганом (см. примеч. 2).
51. О приближении распределений сумм 445> естественно рассмотреть «расстояние по вариации» Pv (p\ F") = Va Var [F' (x) - F" (x)] = sup IF' (A) - F" (Л)], A где А — произвольное измеримое по Борелю множество прямой. Как известно, ρ (f, F") < р„ (F', F"). Поэтому для функции ψυ (η) - sup pv (Fn, ©) F имеем неравенство ^v(n) >Ψ(λ). (0.11> Неизвестно, стремится ли ψν (?г) при растущем η к нулю. § 1 ВОСЕМЬ ЛЕММ Следуя П. Леви, для любой функции распределения F (х) введем ее «функцию концентрации» QF (I) = sup [F (χ + I + 0) - F (χ)]. χ Лемма 1. Если при к = 1, 2, . . ., η, L > I ^> 0, xt- — хн P- l Ρ {h <χϊ} = Ρ {h > xt) = V2, mo QH (L) < C5 (L/l) rT\ Лемма 2. £Ьш σ ]> 0, Ζ ]> 0 η = C6e~Z2/2(J2, mo для любой функции распределения F (х) F *G0*(x— I) — η < f (xXF * Ga2 (ж + Ζ) + i]. Лемма 3. Если σ ^> 0, σχ ^> 0, то I G 2 (ж) - GQ2 (ж) |< С7 | σϊ/σ2 - 1 | . υι Лемма 4. Если I xF {dx) = 0, J x2F (dx) = σ2, /г > σ > 0, mo с» 2 sup |F(*) —Я(*)|<£7в. Г=—оо r/i<5C<(?'+l)/l
446 51. О приближении распределений сумм Лемма 5. Если Щк = О, | ξ* |< Z, Dl = в2, Λ > σ > О,; то сю Σ sup \H(x)— G02 (χ) |< С9 — _ v<(r-fl)/i Л e μ м а 6. Если Μξ/? = Ο, | tk | <^ Ζ, Dg = σ2, σ* — σ2 + Oq, mo Л е м м а 7. 77/щ любом натуральном η и 0 <^ ρ ζζ, ί £ I Cp"1 (i - ρ)"-'1 - -^ *-*1 < cltP. Ϊ71—0 Л e μ μ a 8. Пусть 5 0 <I p^ <^ 1, Г 1 — pfc при т = 0, •Ы™) = | Pfc >?PW m=l, 7/r (™) = -^re~^» I 0 при m^>i, Ρ (m) = Π Ρ* (wfr), </ (m) = Π Як (тк). к к Тогда Σ Ι Ρ (m) — ί Η |< Ci2 S Pa-· - in fc Леммы 2 и З доказываются простым подсчетом. Лемма 1 является непосредственным следствием ^теоремы 1 из заметки Рогозина [9]. Лемма 7 доказана в работе Прохорова [11]. Лемма 4 вытекает из оценки (ξ имеет распределение F) F (х) - Ε (ж)< Ρ { | ξ I > J χ t } < σ2/*2 (неравенство Чебышева). Леммы 5 и 6 примыкают к известной оценке \Н - Go* Κ^/σ, (1.1) ^которая вытекает из теоремы Ляпунова в формулировке Эссеена .([12, с. 216]): |Я-~Со2|<4гХм1Ы3· (1.2) 5 Здесь π всюду далее m = (тг, . . ., тп) — гс-мерный вектор, ^ обозначает 111 суммирование по всем векторам m с неотрицательными целыми компонентами.
51. О приближении распределений сумм ЧТ Лемму 6 можно получить из (1.2), если дополнительное нормальное слагаемое с дисперсией σ0 представить как сумму большого числа слагаемых с достаточно малыми дисперсиями. Несколько сложнее доказательство 6 леммы 5. § 2 ДОКАЗАТЕЛЬСТВО ТЕОРЕМЫ 1 1. Будем далее считать п^> I. Легко видеть, что это ограничение несущественно. 2. Кроме того, будем считать, что Εχ· являются неубывающими функциями h = Fh1 (η*) от независимых между собой величин щ с равномерным распределением на отрезке [0, 1]: р Ы < у} = У при 0 < у < 1. Легко показать, что в надлежащем расширении основного поля вероятностей (Ω, $fty P) такие величины η^ существуют 7. 3. Положим ρ = п-\ ( О при ρ/2<η*<1-ρ/2, Pic = \ ι I 1 в остальных случаях, а = Μ {ξ, ! μ, = 01, σ2 = D {ξ, | μ, = 0}, Α(χ)= Ρ {ξ, < χ | μ* = 0}, Β (χ) - Ρ {ξ, < * | μ* = 1). При переходе от величин ξ^ к величинам U = L· — α все эти построения сохраняются. Только вместо β появляется а' == 0t а функции Л (х) и 5 (ж) заменяются на 4' (ж) = Л {χ + α), 5' (ж) = В (х + а). 6 Лемма 5 легко выводится из следующей оценки А. Бикялиса: |gW-Gg2HKg3(1+^|/s)3^M|^J3; πι где С — абсолютная постоянная (см.: Литов. мат. сб., 1966, т. 6, № 3, с. 323— 346).— Примеч. ред. 1 Функции F^1 следует определить надлежащим образом. Это предоставляется сделать читателю.
448 51. О приближении распределений сумм Поэтому можно рассматривать лишь случай α = 0. Им мы ограничимся в дальнейшем. 4. В разложении F (х) = рВ (х) + (1 - р) Л (х) распределение А сосредоточено на отрезке [х~, х+], х~ = /г-1 (р/2), х+ = ρ-1 (1 _ р/2)г длины λ = х+ — af, а распределение В — вне этого отрезка, причем каждому из лучей (— оо, х~] и [х+, оо) в распределении В соответствует вероятность V2, К распределениям Вт (как и всюду далее, степени распределения понимаются в смысле свертки) можно применить лемму 1, что дает оценку QBm (λ) < <>-'/.. (2.1) 5. Распределение H = [pB + (i — p)A Г = 2 Om (I - p)"-m5m * Ап'т να будем приближать неограниченно делимым D по-разному в двух случаях: Α. λ>|/7Γσ. . В. λ<]/Λτζσ. Случай А. Положим \пУ) 0-ηρβπι т\ ' т Ях-2Срт(1-рГт5т. Но лемме 7 | D - Нг |< Спр = Cun-'/.. (2.2) В силу леммы 4 и оценки (2.1) при h = λ имеем 8 | вт * Л"-т — Вт |< J | Л""™ (ж -z) — E{x — z)\Bmdz^ <(?Βί»(λ)2 sup |J"-m0/)-£(i/)|<C5Oi-Vs. (2.3) r Γλ<ν<(Γ-{-1)λ Поэтому 8 Дисперсия распределения Л71""771 равна (п — т) о2, так что условия леммы 4 лри h = λ^ ]/~ησ выполнены.
51. О приближении распределений сумм 449 \Н -Нг|< 2СРт(1 - рГт 1 #т* ^n~w- Вт|<C5C8w-V3 + 2Σ', т где (2.4) 2'= Σ ^,η(1-ρΓ",= Ρ{μ<1/2^}. m<V2n2/3 Заметив, что Μμ = пр = η9/*, (2.5) Ομ = пр (1 - ρ) < л1/., (2.6) получим по неравенству Чебышева 2' < Ρ { | μ - л'/» | > V2w z·} < 4rc-2/»f что вместе с (2.4) приводит к неравенству | Я - Нх |< (2С5С8 + 8) n-V.. (2.7) Из (2.6) и (2.2) получаем (0.1). Случай В. Положим D = епЯВ-Е) # с^^^ = ^ J»e£- <Г"*>Я™ * βη(1_ρ)σ!, m H\=ziCnP™(1 — p)n~mBm * G(n_m)cj2, m # 2 = 2 Cpm (1 - р)"-тБт * Gn(1-P)c, m По лемме 7 имеем I Я - tf2 |< C^-V,. (2,8) Разность Η — Η1 оценивается при помощи леммы 5, где полагаем теперь h = У по: | вт * Ап~т - Вт * G{nHm)* |< J | ^n~m (ж - ζ) - G(n_w) σ* (я — ζ) | χ Χ Bm (dz) < QBm (У η О) У Slip _ I Лп~т (Г/) - е(М1)а.(у) | < λ У /г σ Эта оценка вполне аналогична оценке (2.3) случая А. Точно так же, как в случае А, получаем | Η - Нх | < СъС9п^ + 2Σ' < С1ЬпГ". (2.9) !/215 А, Н. Колмогоров
450 51. О приближении распределений сумм Разность Нх — Η2 оценивается при помощи леммы 3: |Я1-Я2 | < СцпГ1'* + Σ", где Σ"= S Срт(1-рГт. I п-т. 1 Ci* -1 > 7Г- I n(l-p) J ^ C7 При помощи неравенства Чебышева из (2.5) и (2.6) при η ]> 1 и надлежащем выборе Си можно получить оценку Σ* < СигГ1'*, что приводит к I #! - Я2 | < (Cie + Cit) гс'1'3. (2.10) Из (2.8) — (2.10) получаем (0.1), чем доказательство теоремы 1 заканчивается. § 3 ДОКАЗАТЕЛЬСТВО ТЕОРЕМЫ 2 1. Будем считать ε <С 1, что не ограничивает общности результата 2. Покажем, что достаточно рассмотреть случай непрерывных и строго возрастающих функций F^ (х). Предположим', что для непрерывных и строго возрастающих функций теорема 2 доказана с константой С2, и рассмотрим сумму 6 =&!+... + ξη с произвольными Ffr (#), удовлетворяющими условию (0.2). Пусть L ]> 21. Выберем /' и L' так, чтобы L > V > 2V > 2/, VIU > 42l/L. (3.1) В силу леммы 2 можно выбрать столь малое σ0, чтобы для любой функции распределения F (х) выполнялись неравенства F * G 2 (х - λ) - ε < F (я) < F * G , (ж + λ) + ε, (3.2) ^ * <W (* - Λ) - δ' < F (χ) < F * fi^ (s + Λ) + δ', (3.3) где ησο λ=1' -Ι, Λ = Λ - Ζ/, δ' = С2шах Положим ft· = F* * G -£-(i*4f. w]
51. О приближении распределений сумм 451 По (0.2) и (3.2) получаем Ε (х- V) - 2ε < F* (χ) < Ε (χ + V) + 2ε. Так как функции Fjz непрерывны и строго возрастают, то существует неограниченно делимое распределение Z)', для которого D' (х - ГУ) - δ' < Я (*)< D (х + L') + δ'. (3.4) Замечая, что Н' = H*G 2, по*' из (3:3), примененного к F (х) = Η (χ), и (3.4) получим D' (x — L)- 2δ' < Η (ж)< Ζ)' (ж + L) + 26'. (3.4Л) Так как при надлежащем выборе С2 в силу (3.1) 26' < 2С2 max [-£ (log ψ}\ (2е)'/.] < С2 max [-£- (log -y-)Vef e1/.], то из (3.4') вытекает (0.3). 3. В соответствии с п. 2 будем далее считать F^ (x) непрерывными и строго возрастающими. Тогда функция λ* (ρ) = Ft (1 - ρ/2) - Fl1 (p/2) будет определенной для всех р, 0<р<1, непрерывной и строго убывающей. Она пробегает все положительные значения. Поэтому обратная функция ръ (λ) определена на 0 < λ < оо, непрерывна, строго убывает и пробегает все значения в интервале 1 ]> ρ ^> 0. Функция *(λ)=3ί>*(λ) тоже непрерывная и строго убывающая. Она пробегает все значения в пределах η > s > 0. Поэтому при 0 < ε < 1 существует единственное решение λ0 уравнения s (λ) = ε~2'3. 4. Мы положим λ0, если λ0 Ξ> Ζ, Ζ, если λο <^ /, р* = ръ (Л), 5 = s (Ау= S Р*> /г а£ = Я1 (Pfc/2), 4 - Fl1 (l - pk/2), 0 при #ί < ε* < a£t ^ \l в остальных случаях,
452 51. О приближении распределений сумм ак = Μ {lk Ι μ^ = 0}, ' oi = D {ξ, Ι μ, = 0}, σ* = Σ(1-Ρ*)σϊ. Тс Полагая ^fe (ж) = Ρ {ξ* < χ | μΛ - 0}, Вк {χ) - Ρ {Ε* < ж Ι μ* - 1}, представим Ffe (ж) в виде Fn (χ) = Р/А (ж) + (1 — рк) Ак (χ), где распределение Ак сосредоточено на отрезке [χχ, χχ], а распреде. ление Вь — вне этого отрезка, причем так, что лучам (— оо, #£] и [хк, сх>) соответствует вероятность 1/2. Применяя обозначения леммы 8 и полагая 9 *(m) = l№, Л(ш) = 1ГаГ\ к к получим Η = Π* [Pfc5fc + (1 - ρ,) 4,] = 2 Ρ (m) Β (m)*Л (m). fc , m Построение аппроксимирующего неограниченно делимого распределения будет различно в трех случаях А, В, С. А λ0>/ λ9>σ Λ = Kq S = 8~2/з В λ0>/ λο<? Λ = Λ-ο -2/ s = ε /з G λ0'</ λ = / -2/„ 5 = ε /з 5. Так как всегда Λ ]> ί, то Ρ* = ρ* (Λ) < ρ* (Ζ) < ε. (3.5) Это единственное в нашем доказательстве обращение к условию (0.2) теоремы. Так как определение ръ (Λ) и всех прочих существенных для наших построений величин инвариантно по отношению к сдвигам 1к = 1к — Скш 9 В (ш) определены при любых неотрицательных т%, А (ш) — лишь в случае т%, принимающих значения 0 и 1.
51. О приближении распределений сумм 453 то теперь мы можем ограничиться случаем а, = 0. б. Сделаем еще некоторые подсчеты, которые понадобятся в дальнейшем: /с к τ равно числу величин ξ&, лежащих в пределах xi < ξ& < #&· Легко подсчитать, что Μτ =s, Dt = S Ρ^ (1 - Р/с) < 5. Поэтому по неравенству Чебышева Р{|т-*|>С>= £ ^X-i. (3.6) |f(m)-s|>C 7. Пусть, далее, ε = Σ(ΐ-μ*)δ*· Это сумма тех ξ*·, которые лежат в пределах χκ < ξ* < #£. В силу допущения aft = 0 при любых m Μζ = 0, Μ (ζ |μ = ιη) = 0. Нас далее будут интересовать условные дисперсии o2(m) = D(C |μ = ιη). Для случайной величины Р2 = σ2 (μ) легко подсчитать Мр8 = σ2, /С Так как V (1 — ρ*) σϊ = σ2, о\ < -j- , /Γ Р/с = Р/с (Λ) < р/с (0 < ε, имеет место неравенство DP2 < ν4σ2λ2ε.
454 51. О приближении распределений сумм Поэтому Р{|р>-о?|>С>=' £ p(m)<-£gL. (3.7) |σ2(ιη)-σ2|>(? 8. Наконец, отметим, что по лемме 1 (?B(m)(^)<C5(L/X0)i(m). (3.8) Переходим непосредственно к доказательству теоремы 2 в случаях А, В и С. Случай А. В этом случае Η = Π* [РкВъ + (1 - ρ») Л»] = 2 9 Η 5 (т)*Л (т) к т аппроксимируется Z) = ехр2Р*(Я*- #) = Σ?(m)*Ή· № m Для перехода от Η κ D рассмотрим еще #i=2p(m)fl(m). т По лемме 8 и (3.5) I /> - ^ | < Σ| Ρ Η - g (т) |< Си 2 ΡΪ < Ciae 2 Ρ* < Ci2e'/.. (3.9) т fc fr С другой стороны, по лемме 4 при ^=Λ = λ0>σπ (3.8) | 5 (m > A(m) — B(m)\^[\A(m)(x — z) — E(x — z)\B(m)(dz)^ <^Β(η,)(λο)2 sup Μ(ηι)(ί/)-Ε(ι/)|<6^8ίίΗ]-ν2. г rt,<y<(r-J-l)X, (3.10) Поэтому ΙЯ - #i |< 2 ρ (m) 15 (m)*4 (m) - Б (m) |< уЗс^в-1/. + 2Σ', m (3.11) где Σ'= S P(m). *(т)<уя8?/· В силу (3.6), замечая, что в нашем случае s = е2/з, имеем т. е. из (3.11) вытекает | Я - Нг |< (V2CbCs + 8) ε1/.. (3.12)
51. О приближении распределений сумм 455 Из (3.9) и (ЗЛ2) получаем | Η - D |< CW/.. (3.13) СлучайВ. В этом случае полагаем D = ехр 2 Ръ (Вк — E)*G&= 2 2 (m) 5 (m)*Gg2, № m /Л = 2 Ρ (m) 5 (ni)*G(J2(m), #2 = S Ρ (m) ^ (m)*6<j·- m m Неравенство \D-Ht |<C„eV. (3.14) получается так же» как (3.9) в случае А. По лемме 5 при & = σ]>λ = λ0Η (3.8) получаем | В (т)*Л (т) - В (m)*Gaa(m) J < <^|Л(т)(ж —ζ) —Сочт)(л?—г)|-В(т)(&)< < (?в(т) (σ) V sup \А (т) — G^^ | < -^г1 ?·σ<2/<(Γ+ΐ)σ <-^[Г(т)]-,/2с9^- = С5С9^(т)]-,/2. (3.15) Точно так же, как в случае А было получено (3.12) из (3.10), полу чаем из (3.15) I # - #х К (сьс9 + 8) в·/·.: (3.16) Остается оценить разность Нг — Я2. По лемме 3 | GGz — G<ji(m) Ι <Ξ Ci№%/*9 если Ι σ2 (m)/a2 - 1 | < Ci9/C7. При помощи (3.7), учитывая, что теперь Λ <^ σ, получаем оценку Σ"= £ p(m)<C208r/.. (3.17) Поэтому аналогично выводу (2.10) при доказательстве теоремы 1 получаем I Hi - Н2 | < (Ci9 + С20) β1/.. Из (3.14), (3.16) и (3.17) вытекает | # - Л |< C21eV·. (3.18) Неравенства (3.12) и (3.18) показывают, что в случаях А и В оценка (0.3), составляющая содержание теоремы 2Я может быть
456 51. О приближении распределений сумм заменена более сильной: D (х) - C22eV. <#(*)</) (χ) + C22eVa. (3.19) Случай С. В этом случае получить оценку типа (3.19) не удается. Мы положим σ· = 7Γ^(ΐ0*τ-Γ' <3·20) и введем вспомогательное распределение Я' = Я * <?σ0. В силу леммы 2 при η = C6<fL2/2a<> = II L% (3.21) Я' (я - L) - η < Я (я)< Я' (ж + L) + η. (3.22 Далее мы покажем, что неограниченно делимое распределение D = ^ig(m)B(m)*G 2, σ? = σ2 +σ20, m σ1 удовлетворяет неравенству |/>-Я'|<С2з[е'/> + ^-(log4-)V!] · (3-23) Вместе е (3.21) и (3.22) из (3.23) получаем (0.3). Остается доказать (3.23). Для этого вводим распределения Н'г = Σ Ρ (ш) В (m)*G , σ2 (m) = σ2 (ю) + σ2., Я;=Ер(т)5(т)*С2. πι σ1 Доказательство неравенства I D - Н'г I < Cue*/· (3.24) таково же, как доказательство неравенств (3.9) и (3.14) в случаях А и В. Только теперь что приводит к оценке 5jPfc<eSPfc<eV3· В силу леммы 3 | Я; - Я; [ < С248'/з + Σ'" ^ (m), (3.25)
51. О приближении распределений сумм 457 где Σ'" распространена на те ρ (m), для которых | σ? (m)/ai2 - 1 f > Си/С7. (3.26) При надлежащем С24 из (3.25) вытекает | σ? (m) - σ? | = | σ2 (m) - σ21 > σϊβ1/.. Поэтому в силу (3.7) и неравенств 10 σ2 < σ?, Λ = Ι < σ0, ^ 4e /»σ* 4 Таким образом, из (3.25) получается I H[ - Hi |< (C24 + 1) ε1/.. (3.27) Наконец, по лемме 6 получим в силу (3.20) откуда | Я' - Я! | = f 2С10 4 (1о£ 4Г- (3'28) Из (3.24), (3.27) и (3.28) непосредственно вытекает (3.23). Этим доказательство теоремы 2 заканчивается. Пароход «Сергей Киров», Красное море — Персидский залив, 13—24 марта 1962 г. ЛИТЕРАТУРА 1. Колмогоров А. Н. Две равномерные предельные теоремы для сумм независимых слагаемых.— Теория вероятностей и ее применения, 1956, т. 1, № 4, с. 426—436. 2. Finetti В. de. Le funzioni caratteristiche di legge instantanea.— Atti Accad. naz. Lincei. Rend., Ser. 6, 1930, vol. 12, N 7/8, p. 278—282. 3. Doeblin W. Sur les sommes d'un grand nombre des variables aleatoires inde- pendantes.— Bull. sci. math., 1939, vol. 63, p. 23—32; 35—64. 4. Прохоров Ю. В. О суммах одинаково распределенных случайных величин.— ДАН СССР,* 1955, т. 105, № 4, с. 645-647. 5. Прохоров Ю. В. О неравномерной предельной теореме А. Н. Колмогорова.— Теория вероятностей и ее применения, 1960, т. 5, № 1, с. 103—113. 6. Мешалкин Л. Д. О приближении распределений сумм неограниченно делимыми законами.— Теория вероятностей и ее применения, 1961, т. 6, № 3, с. 257-275. 10 Второе неравенство получается из (3.20): Z=|/"2"^/log£V/2a0<ao.
458 52. Оценки спектральных функций случайных процессов 7. Khintchine A. Zur Theorie der unbeschranktteilbaren Verteilungsgesetze.— Мат. сб., 1937, т. 2, № 1, с. 79—119. 8. Kolmogorov A. N. Sur les proprietes des functions de concentrations de M. P. Levy.-» Ann. Inst. H. Poincare, 1958, vol. 16, N 1, p. 27—34. 9. Рогозин Б. А. Об одной оценке функции концентрации.— Теория вероятностей и ее применения, 1961, т. 6, № 1, с. 103—105. 10. Рогозин Б. А. Об увеличении рассеивания сумм независимых случайных величин.— Теория вероятностей и ее применения, 1961, т. 6, № 1, с. 106— 108. 11. Прохоров Ю. В. Асимптотическое поведение биномиального распределения.— УМН, 1953, т. 8, вып. 3, с. 135—142. 12. Гнеденко Б. В., Колмогоров А. Н. Предельные распределения для сумм независимых случайных величин. М.; Л.: Гостехиздат, 1949. 264 с. 52 ОЦЕНКИ СПЕКТРАЛЬНЫХ ФУНКЦИЙ СЛУЧАЙНЫХ ПРОЦЕССОВ* Совместно с И. Г. Журбенко В статье исследуется асимптотическое поведение, эффективной статистики спектральной плотности при растущем объеме выборки. Некоторая новая статистика, введенная А. Н. Колмогоровым, сравнивается с другими, хорошо известными статистиками спектральной плотности, а также с асимптотически наилучшей статистикой с точки зрения среднеквадратичного уклонения. Обсуждается влияние на различные статистики больших выбросов спектральной плотности в соседних частотах. Новый класс статистик получен за счет применения Сддаратора сдвига к периодограмме, вычисленной на основе сглажешшх данных. Пусть X (t), t = 0, ±1, . . .,— стационарный случайный процесс со средним MX (t) = 0, ковариационной функцией С (t) и спектральной плотностью / (λ), где / (λ),— оо <^ λ<] оо,— функция периода 2зх. Из соображения размерности в качестве допустимого класса статистик естественно рассмотреть все квадратичные формы ^£г№(*)Х(0 (1) с произвольными коэффициентами &£, *. Как показали Гренандер и Розенблатт [1], асимптотическое поведение при N ->■ оо первых двух моментов не ухудшится, если вместо класса статистик (1) рассмотреть более узкий класс статистик вида N f» w=-2Ш- Σb(N) {t -s) e4t's)kX {t) x (s)· (2) * Докл. на II Европ. совещ. по статистике, Осло, 14—18 августа 1978 г. Публ. впервые.
52. Оценки спектральных функций случайных процессов 459 которые можно представить в виде 2V-1 ?»^=-ш Σ еШМ№(0, (3) *=—ZV-+-1 где N-\t\ Β»(*) = ΊΓ Σι χ(*)χ(8 + \*\)· 5=1 Статистики /лг (λ) можно представить также в виде я ]Ν (λ) = J ΦΝ (χ) ΙΝ (χ + λ) dx, (4) —Jt где N я Ιν Μ = -sir IΣeitxX W Γ· δ" W = S ф* (*> *iix dx· f=i -π При N ->■ оо асимптотический минимум смещения Δ/ν (λ) = Μ/ν (λ)— — / (λ) и дисперсии, а следовательно t среднеквадратичного уклонения V/n (λ) = Μ Qn (λ) — / (λ))2 по статистикам класса (2) и (3) согласно [1] не больше чем по статистикам класса (1). Функцию Φν (χ) называют «спектральным окном» статистики /ιν (λ), о которой подробнее будет сказано ниже. Асимптотические свойства оценки /# (λ) зависят от гладкости спектральной плотности / (λ). Будем говорить, что Χ(ί)Εκ (λ, α, С, Сг) = κ, если при любом μ и некоторых заданных λ, 0 <^ α <^ 2, С > 0, Сг Ξ> > 0 выполняется одно из неравенств I / (λ + μ) - / (λ) к с Ι μ Iе» ο < α < ι, или если существует /' (λ), I /' (λ + μ) - /' (λ) |< С | μ |"Λ 1 < α < 2, а спектральная плотность четвертого порядка /4 (хъ я2> хъ-> х*) ПР°~ цесса X (t) ограничена I /4 \%li %2i X3i Х&) Ι ^ ^1· Будем говорить, что последовательность функций Φν (χ) принадлежит классу f, Φν (х)^ f, если при любом целом N ^> О Φν{χ) является непрерывной четной периодической с периодом 2зх функцией такой, что при любом ε > О равномерно в области ε <^ | χ | < я
460 52. Оценки спектральных функций случайных процессов функция Φν (х) —>· 0 и выполняются следующие соотношения: π π \ Q>N(z)dx=l, sup \ \ΦΝ(χ)\άχ<^ οο. Кроме того, равномерно по классу *F выполняются следующие условия гладкости: 1. Для любой интегрируемой функции / (х) такой, что | / (х) | ^ ^ Ι χ |°S 0 <^ α ^ 2, выполняется соотношение вида π π $ f(x) Ψν (ζ) (Φλγ (я + ζ) — ΦΝ (χ)) dxdz = o[\ | s |α | ΦΝ (#) | dx)y —я —я где ядро Фейера срдг (ζ) определяется следующим равенством: 2. Существует последовательность чисел А — A (N) ^> 0, Л (TV) -> оо при iV —>- оо такая, что при всех | ζ | < ΑΙΝ равномерно по всем у выполняется соотношение π I Фх{х)Фх{х + у -\-z)dx = —я я я = 5 ®ν{χ)Φν{χ + y)dx + о ( § Φ%(χ)άχ). —я —я Определим класс f (G) d f последовательностей функций Φν (χ) вида JtAjv φΝ(χ) = ANG(ANx) ( ^ G(x)dx) , — π<><π, (5) —jiA]y при некоторых 4jv>1 h4jv->oo, Αν/Ν -> 0 при Ν -> оо. Функцию (?(#), — оо <^ χ <^ оо, будем считать четной, кусочно дифференцируемой и удовлетворяющей условиям оо оо 5 G(*)Ac = i, $ μ|α|6(χ)μ«<οο (6) — σο —оо при некотором а > 0. Задача отыскания оптимальной с точки зрения среднеквадратичного уклонения статистики решается при указанных выше естественных ограничениях на гладкость функции Φ ν (χ)- При этом находится не только вид асимптотики среднеквадратичного уклонения, как это было сделано Е. Парзеном [2], но и значения коэффициента при этой асимптотике, что позволяет провести численное сравнение всех
52. Оценки спектральных функций случайных процессов ^61 наиболее часто используемых статистик спектральной плотности* предлагаемых различными авторами. Существенным ослаблением используемых условий является также требование гладкости спектральной плотности / (λ) в одной-единственной точке по сравнению с равномерным условием гладкости оо 2 μ|α5(ί)<οο, t=i— оо где В (t) — корреляционная функция процесса X (t). Заметим, что наименьший возможный порядок среднеквадратичного уклонения оценки/ν (λ) есть N-2a«H1+m»\ где α0 есть максимальное а, при котором выполнено последнее условие. Но, к сожалению,, а0 является характеристикой гладкости / (λ) одновременно по всем частотам [3, 4, 7]. Теорема 1. Если Χ (ή ΕΞ κ (λ, α, С, С2), Фдг (х) ΕΞ JF, то для статистики /^ (λ) при N -> оо справедливо соотношение inf sup V/лг (λ) со О (α) f (λ) χ ΦΝ(χ)<=& Χ(ί)<=κ(λ, α, С, С,) χ (т^гГ*" лг" ^ ί1 + ч W)1"^ (7> где —— ι ч(пА~\\ \ϊ+2α ί 1» λ == 0(modπ),. 0(«) = (1 + 2α) 1+-(ϋΐ2±1))+ , η(λ) = {0; ^0;modn); <8> причем минимум в (7) достигается при ΦΝ (χ) = ΑΝΦ{ΑΝχ), (9), где U А _ I aNC* \ι/(ΐ+2α) . ΛΝ-[πΡ(λ)(ί + α)(ί + 2α)) ' <Ш)* Доказательство. Выделив главный член среднеквадратичного уклонения V/jv (λ) согласно леммам 1 и 2 из [3], приходим к вариационной задаче по отысканию по всем положительным Φν (χ)ΕΞ~ ΕΞ ,f минимума функционала
462 52. Оценки спектральных функций случайных процессов Решая задачу по отысканию условного экстремума, получим, что решение Флг {х) должно удовлетворять уравнению π μ|« jj \u\*d>N(x)dx+ 2%2£] (Фу(ж)-С) = 0, C = const, —Я из которого следует, что решение надо искать в виде (9). Учитывая начальные условия, получим (10), а вместе с ним (7) и (8). Теорема 1 дает явный вщ спектрального окна, оптимального «с точки зрения среднеквадратичного уклонения оценки /дг (λ) при заданной гладкости исследуемой спектральной плотности / (λ) в точке λ. Сравнить между собой асимптотические свойства различных пе- риодограммных оценок вида (2) или (4) позволяет следующая Теорема 2. Пусть Φ ν (χ) ΕΞ & и определяется равенством {5), а функция G (х) при некотором а таком, что 0 < а <^ 2, удовлетворяет условиям (6). Тогда если X (t) ΕΞ κ, то при N ->■ оо выполняется соотношение inf sup ν/Ν(λ)οο/»(λ)(^5ΓΓ)^«ΛΓ 1"H»g(a)l (И) еде ^(a) = (J4^_)(2aF1)i+^(2nF2)i+^ , (12) Vi= j |*|«G(s)Ac, Fa= ξ G2(*)cto, — oo —oo причем асимптотический максимум достигается при ^ = №^τ) · (1^а) Доказательство этой теоремы следует из лемм 1 и 2 из [3]. Функция g (а) по формуле (12) может быть вычислена для различных оценок спектральной плотности: Тьюки, Парзена, Бартле- та и других (см., например, [3]), а также для оптимальной статистики, заданной формулой (10). Результаты вычислений приведены в виде таблиц в работах [3, 7]. Общим недостатком периодограммных оценок спектральной плотности /ιν (λ) является слабое убывание (порядка О (iV"1)) зависимости от далеких частот, а также от различных нестационарных явлений. Эти недостатки ранее один из авторов (А. Н. Колмогоров) предложил устранить за счет применения «вре- менногоАокна» и последующего осреднения периодограмм по различным временньгм интервалам. Пусть ам (£)> t = 0, ±1*. . ., — неотрицательная функция, равная 0 вне отрезка [0, М]. По выборке {X (<?),..., X {Q + М)} по-
52. Оценки спектральных функций случайных процессов 463 ам строим функцию оо W%(k)= S aM(t-Q)X(t)e™. ί=-οο Определим статистику Jn (λ) спектральной плотности / (λ) случайного процесса X (t) следующим образом: /Ν(λ)=4-Σ'^'(λ)ΐ2· fc=0 Она использует N = Τ (L — I) + Μ + 1 выборочных значений процесса X (t). Рассмотрим оценку спектральной плотности. Определим «окно данных» следующим образом: (t) = ак, ρ (0 = μ (Κ, Ρ) (К(Р?2~1))'/1Р-КСк, ρ (ί), (13) где Μ = Κ (Ρ — 1) и коэффициенты Ск,р определяются из соотношения ί=0 Так как оо φΜί ρ (х) = Фм (χ) = Σ <*M(t)eitx, ί=—οο то из выражения (13) следует, что «спектральное окно» рассматриваемой оценки равно Ι,^ΜΡ-μ^, 4(£l^iL)*(^^.)«. (И,, где μ (К, Р) ->- 1 при К -> oof Ρ -+ оо (см. [3]). Из определения спектральных плотностей второгои четвертого порядков вытекают следующие равенства для оценки Jn (λ): π Δ/w (λ) = S I φΜ (χ - λ) Ι» (/ (χ) - f (λ)) dx, (14) ϋ/Ν(λ) = -γΓ \ δ* (xi 4- — + ж4)/4(а:ь ···, ^)фм(а;1 + λ) χ Π4 Χ φΜ(*2-λ)φΜ(*3-λ)φΜ(*4-λ) "^[L^+ffff X χ i^(i:v+^?^^^^+TrS ><*-λ) χ
464 52. Оценки спектралънчх функций случайных процессов Χ/0/ + λ)|φΜ(*)ΝφΜθ/)|2 ^Vff^ff dxdy + +γϊ ) /(*)/(У)<РмОИ-Я)(рм(—x+h)q>M(y — λ)φΜ(— У — λ) χ sin«(r£(» + y)/2) , , Χ sin*(^(* + y)/2) У' (15) где Π = [— π, π], οο 6·(χ)= S б(ж+2йя), (15а) fc=—oo δ (χ) — дельта-функция Дирака. Теорема 3. Если X (t) ΕΞ κ, то для статистики /ν (λ) при λ φ 0 (mod π) с коэффициентами, определяемыми равенством (13), и/ж дл1ше выборки N = (L (Т — 1) + if (Ρ — 1) -f 1) -> оо с/гра~ ведливо соотношение inf sup ν/Ν(λ)^μ4(^, Ρ)/Μλ)(7^7)1*+^^(α)^~ϊ+έ, (16) где *<.>_-ЦЬ |/|(^p(^+i)l2f»-', причем асимптотическое равенство (14) достигается при г лг(1-2а)/(1+2а) ρ ^j^sg—0(1), ρ >0(1), —^ -0(1), № f *?/Я ρ ( «+i) 12^)"2/(1+2а)=:0(1). (17) Доказательство. Непосредственное применение метода Лапласа оценки интеграла в правой части (14) с ядром срк)Р (#), вычисленным по формуле (13а), дает равенство ^uLAW = μ*(Κ, P)(^^lL)->p(-^+i) '+ *<*-'> . Главный же член дисперсии D/*N (λ) дает выражение, которое методом перевала приводится к следующему виду: (18) Разность между (18) и вторым слагаемым (15) оценивается следующим образом: Ι'-'Ί^ϊί^ + 'Μ-^τ^Η + 'ίτ)). α<1.
52. Оценки спектральных функций случайных процессов 465 Б случае а ^> 1 величина \ I — 12\ имеет порядок Ρ Υ К (TL)~2. Аналогичным образом показывается, что третье слагаемое формулы (15) имеет меньший порядок. Первое слагаемое формулы (15) в условиях теоремы оценивается следующим образом: |Λ|<3£(ι + ο(τϊ£πγ) + <>(τ))· Положив К (Р2 — 1) = νΝν и отыскав минимум VfN (λ), получим асимптотическое равенство (16). Теорема доказана. Как показывают вычисления (см. [3, 7]), среднеквадратичное уклонение оказывается наиболее близким к оптимальному в случае статистики Колмогорова /дг (λ) по сравнению с оценками Тьюки, Парзена, Бартлета, Абеля и некоторых других. Как следует из теоремы 3, статистика /ιν (λ) по сравнению с остальными нечувствительна к изменению параметров, которые можно выбирать в широких пределах. Степень зависимости от далеких частот в этой статистике имеет порядок Л^-2й7(1+2а\ где К можно выбрать как угодно большим при N -+· оо. Это дает возможность проводить спектральный анализ в нужной полосе частот при наличии сильных шумов и нестационар- ностей, сосредоточенных в других частотах, например в присутствии тренда. Одновременно легко можно проводить проверку на стационарность в исследуемой полосе частот. Рассмотрим эффект влияния сильного выброса в спектральной плотности / (х) в соседней к λ частоте λ + Δ. Предположим, что / (х) = U (х) + /е (х), где fa (χ) — спектральная плотность процесса Ха (t) Ex, а /β (χ) определяется равенством вида /δ (χ) = δ·δ* (χ - λ - Δ) + δδ* (χ + λ + Δ), Δ φ 0 (mod 2n), (19) в котором δ ^> 0 — действительное число, а функция δ* (χ) дана в формуле (15а). Будем говорить, что X (t) ΕΞ κ (λ, Δ, δ), если спектральная плотность процесса X (t) определена равенством (19), семи- инвариантная спектральная плотность четвертого порядка ограничена и MX (t) = 0. Асимптотику среднеквадратичного уклонения статистик с оптимальным выбором параметров при наличии δ-выброса в частоте λ + Δ описывает следующая теорема (см. [5—7]). Теорема 4. Пусть X (t) ΕΞ κ (λ, Δ, δ), ядра ΦΝ (χ) e= f определяются равенством (5), а функция G (χ) удовлетворяет условию (6) при а <^ 2, параметр An статистики /ν (λ) выбран согласно равенству (12а). Тогда при N ->■ оо справедливо sup V/N λ) = /2 λ) -Й-Щ-) Ν Χ Χ (1 + η (λ))2«/α+**)£ (α) (1 + ο (1)) +
466 52. Оценки спектральных функций случайных процессов + 2б2(С Φν(χ)((>ν(χ + Δ)(1χ+ { ΦΝ(χ)<?%(χ + 2λ+Δ)άχΥ+ —π —π π + О (ff J ΦΝ (χ) ψ% (χ + Δ) <te) , (20) где η(λ)==(θ, λ ^ 0 (mod π), (21) л функции флг (#) и g (α) определены равенством (4а) w- (12а) соответственно. Теорема 5. Пусть Χ(ί)Εκ (λ, Δ, δ) α статистика Jn (λ) определяется коэффициентами ам (£), вычисленными согласно (13) β условиях (16) ту?и N = L (Г — 1) + Μ (Ρ — 1) + 1 ->■ оо. Тогда справедливо соотношение sup ν/Ν(λ) = Ζ(α)/2(λ)( * Υ/α+2α)χ Χ(ί)εκ(λ, Δ, β) V / W ' Χ ΛΓ2α/(1+2α) (1 + η (λ))2α/(1+2α) (1 + ο (1)) + 2δ2 (| φΜ (Δ) |2 + + | ΨΜ (Δ + 2λ) Ρ)2 + Ο (ΛΓα/(1+2α) | φΜ (Δ) |2), (22) где | φη (#) |2, if (α) гг η (λ) определяются формулами (13а), (16а) и (21) соответственно. Доказательство теорем 4 и 5 приведено в работах [5—7] Заметим, что остаточные члены (20) для статистики /лг (λ) имеют порядок не меньше чем | т (Δ) | 4 = О (ЛГ«), ^ (23) если Δ ;>> ΛΓ-ε/α+2α)(ΐ+ε) д в случае статистики /ν (λ) порядок остаточных членов (22) не меньше чем что может быть сделано как угодно малым по отношению к (23) при N ->■ оо и сравнительно небольшом /с. При этом A>i>-1~C/ZiV1/(1+2a). Статистики /ιν (λ) согласно (23) имеют фиксированный порядок зависимости от δ-выброса, который нельзя уменьшить за счет выбора спектрального окна Φν (я). ЛИТЕРАТУРА 1. Grenander £/., Rosenblatt M. Statistical analysis of stationary time series. New York: J. Willey, 1957. 2. Parsen E. On asymptotically efficient consistent estimates of the spectral density function of a stationary time series.— J. Roy. Statist. Soc. B, 1958, vol. 20, p. 303-322.
53. О логических основаниях теории вероятностей 467 3. Журбенко И. Г. Об эффективности оценок спектральной плотности стационарного процесса.— Теория вероятностей и ее применения, 1980, т. 25, № 3^ с. 476—489. 4. Журбенко И. Г. Исследование статистик спектральной плотности стационарного случайного процесса.— Сиб. мат. журн., 1981, т. 22, № 5, с. 40—65^ 5. Журбенко И. Г. Об эффективности оценок спектральной плотности стационарного процесса. П.— Теория вероятностей и ее применения, 1983, т. 28^ № 2, с. 388—396. 6. Журбенко И. Г. О предельной теореме для статистик спектральной плотности с временным сдвигом.— Укр. мат. журн., 1980, т. 32, № 4, с. 463— 476. 7. Журбенко И. Г. Спектральный анализ временных рядов. М.: Изд-во МГУ* 1982. 53 О ЛОГИЧЕСКИХ ОСНОВАНИЯХ ТЕОРИИ ВЕРОЯТНОСТЕЙ* Говоря о случайности в обыденном смысле этого слова, мы имеем в виду те явления, в которых мы не обнаруживаем закономерностей, позволяющих нам предсказывать их поведение. Вообще говоря, нет причин предполагать, что случайные в этом смысле явления подчиняются каким-то вероятностным законам. Следовательно, нужна различать случайность в этом широком смысле и стохастическую случайность (которая является предметом теории вероятностей). Возникает проблема описания причин применимости математической теории вероятностей к явлениям реального мира. Моей первой попыткой ответить на возникающие в связи с этим вопросы была статья [1] (опубликованная в издании методологического характера). Поскольку случайность определяется как отсутствие закономерностей, прежде всего следует определить понятие закономерности. Естественным средством для этого служит теория алгоритмов и рекурсивных функций. Первая попытка применить ее в теории вероятностей была сделана Черчем [2]. Цель моего доклада — познакомить слушателей с этой областью хотя бы в первом приближении. Отдавая дань традиции, начнем с классического определения вероятности как отношения числа благоприятных исходов к общему числу всех возможных исходов: Ρ = m/n, где η — число всех возможных исходов (одного испытания), а тп — число благоприятных исходов. Это определение сводит задачу вычисления вероятности к комбинаторным задачам. * On logical foundations of probability.— Lect. Notes Math., 1983, N 1021, p. 1—5. Перевод A. 3. Звонкина, А. А. Новикова и А. Шеня.
468 53. О логических основаниях теории вероятностей Однако во многих практически возникающих ситуациях это определение неприменимо. Это послужило стимулом к появлению так называемого статистического определения вероятности: Ρ « μ/Ν, (1) где N — общее число испытаний, предполагаемое достаточно большим, μ — число успехов. Это определение в своей первоначальной форме, строго говоря, не является математическим. По этой причине в формуле (1) стоит знак приближенного равенства. Первая попытка уточнить определение (1) была предпринята Р. Мизесом. Но, прежде чем описать его подход, обсудим (с точки зрения классического определения вероятности) вопрос о том, почему в природе так часто встречается устойчивость частот. Рассмотрим все последовательности нулей и единиц длины /г, содержащие ровно т единиц, считая их равновероятными. Пусть выбран какой-либо способ деления любой последовательности длины η на две подпоследовательности. Тогда для каждой последовательности важно сравнить частоты единиц в двух ее подпоследовательностях, вычислив разность Ι μΑι — μ2/^2 Ι (щ и п2 — длины подпоследовательностей, μι и μ2 — число единиц в них, так что щ + Щ = η, μχ + μ2 = т). Хотелось бы ожидать, что эта разность будет почти всегда малой в том смысле, что при любом ε > О -Pclass {| -j£ — -~- ) < ε| -> 1 При пи П2-+эо. Разумеется, чтобы превратить это утверждение в теорему, необходимо ограничить класс возможных правил выбора подпоследовательностей (например, запретить правило: поместить в одну из под- лоследовательностей все нули, а в другую — все единицы). Статья [3] содержит необходимые уточнения понятия допустимого правила выбора подпоследовательности, основанные на идеях Мизеса. Понятие допустимого правила выбора играет решающую роль в мизе- совском частотном подходе к понятию вероятности. Согласно Ми- зесу бесконечная последовательность Хх, Х2, . . . нулей и единиц .называется бернуллиевской, если: 1) существует предел ρ = Hm Λ У χ.; г<?г 2) этот предел остается неизменным, если мы переходим от всей последовательности к ее подпоследовательности, выбранной с помощью допустимого правила выбора: Пш — Υχη. = ρ. J<rn
53. О логических основаниях теории вероятностей 469 Говоря о допустимых правилах выбора, Мизес дал лишь общую их характеристику и привел несколько примеров. Его указания сводятся tt тому, что выбор очередного члена подпоследовательности не должен зависеть от его значения, а должен определяться значениями предыдущих членов. Разумеется, это определение не является точным, но точного определения нельзя было и ожидать, поскольку само понятие «правила» не имело в то время математического уточнения. Ситуация существенно изменилась, когда появились понятия алгоритма и рекурсивной функции, с помощью которых Черч [2] уточнил определения Мизеса. В упомянутой выше статье [3] предложен класс допустимых правил выбора, более широкий, чем у Чер- ча. Согласно [3] правило выбора задается алгоритмом (или, если угодно, машиной] Тьюринга). Выбор очередного члена подпоследовательности происходит следующим образом. Входная информация состоит из конечной последовательности чисел пи п2, ..., щ и значений ХП1, Хщ, . . ., Χηΐζ соответствующих членов исходной последовательности. Выход алгоритма состоит, во-первых, из номера rifr+i следующего просматриваемого элемента последовательности (который не должен совпадать с пъ п2, . . ., щ; на их порядок ограничений^не накладывается)* и, во-вторых, из указаний, должен ли элемент Хщп быть выбран лишь для просмотра или он включается в выбираемую подпоследовательность. На следующем шаге работы алгоритма его вход состоит уже из более длинной последовательности nlf гг2, . · », nk+i; алгоритм] начинает работу с пустого входа* В сравнении с [2] расширение класса допустимых правил выбора состоит в том, что порядок членов^в подпоследовательности не обязан совпадать с их порядком в исходной последовательности. Другое, более важное различие состоит в'строго финитном характере всей упомянутой выше концепции и в количественной оценке устойчивости частот. Переход к конечным последовательностям неизбежно приводит к необходимости накладывать ограничения на сложность выбирающего алгоритма. Точное определение сложности конечного объекта и примеры его применения к теории вероятностей были предложены в работах [3, 61. Результаты частотного и сложностного подхода сравниваются в [4]. Теперь вернемся к исходной идее, согласно которой «случайность» состоит в отсутствии «закономерности», и гпосмотрим, как понятие сложности конечного объекта позволяет придать ей точный смысл. Понятию сложности посвящено большое число работ, делящихся на две группы: первые касаются сложности вычислений, а вторые — сложности определений* Мы будем говорить о^последних. Воспроизведем определение сложности из [6]. Мы определяем условную сложность конструктивного объекта относительно некоторого алгоритма А при условиих что известен конструктивный алго-
470 53. О логических основаниях теории вероятностей ритм Y. Более точно, определим условную сложность КА (Χ \ Υ) объекта X при известном Υ как длину наименьшей программы, с помощью которой алгоритм А может получить X из Υ: КА (X | Υ) = min {Ι (ρ) Ι Α (ρ, Υ) = Χ}. Здесь Ι (ρ) — длина последовательности нулей и единиц, рассматриваемой как программы. Существует «оптимальный» алгоритм А, т.е. такой, что для любого алгоритма Аг существует такая константа С, что для всех 1и7 справедливо неравенство КА (X | У)< ΚΑί (Χ\Υ) + С. Если Аг и А2 — оптимальные алгоритмы, соответствующие функции сложности отличаются не более чем на аддитивную константу (не зависящую от X и Υ). Теперь можно определить понятие случайного или, более точно, Δ-случайного объекта в данном конечном множестве Μ (здесь Δ — число). А именно: мы говорим, что Χ ΕΞ Μ является А-случайным элементом в Μ, если КА (X\Y)> log2 I M ! - Δ, где Ι Μ I — число элементов в Μ. Будем называть случайными в Μ те объекты из М, которые являются Δ-случайными при сравнительно малых Δ. Мы получаем определение случайного конечного объекта, которое можно рассматривать как окончательное. Взяв в качестве Μ множество Dn всех последовательностей нулей и единиц длины п, мы приходим к условию KA(X\Dn)>n- Δ. Можно доказать, что для последовательностей, удовлетворяющих этому условию при достаточно малом Δ, справедливо, в частности, свойство устойчивости частот при переходе к подпоследовательностям. Следовательно, требования Мизеса к случайным последовательностям могут рассматриваться как частный случай наших требований. Дальнейшие результаты в этом направлении могут быть найдены в работах [5, 7,-12]. ЛИТЕРАТУРА 1. Колмогоров А. Н. Теория вероятностей.— В кн.: Математика, ее содержание, методы и значение. М.: Изд-во АН СССР, 1956. 2. Church A. On the concept of a random sequence.— Bull. Amer. Math. Soc, 1940, vol. 46, N 2, p. 130-135. 3. Kolmogorov A. N. On the tables of random numbers.— Sankhya, Ser. A, vol. 25, pt. 4, p. 369—376. Рус пер.: Колмогоров А. Н. О таблицах случайных чисел.— В кн.: Семиотика и информатика. М.: ВИНИТИ, 1982, вып. 18, с. 3—13. 4. Шенъ А. Частотный подход к определению понятия случайной последовательности.— В кн.: Семиотика и информатика. М,: ВИНИТИ, 1982. вып. 18, с. 14-42,
53. О логических основаниях теории вероятностей 471 5. Loveland D. A new interpretation of the von Mises concept of random sequence.— Ztschr. math. Log. und Grundl. Math., 1966, Bd. 12, H. 4, S. 279—294. 6. Колмогоров Л. Н. К логическим основам теории информации и теории вероятностей.— Проблемы передачи информации, 1969, т. 5, № 3, с. 3—7. 7. Solomonoff R. /. A formal theory of inductive inference.— Inform, and Contr., 1964, vol. 7, N 1, p. 1-22. 8. Martin-Lof P. Algorithms and random sequences. Erlangen: Univ. Press, 1966. 9. Martin-Lof P. The definition of random sequences.— Inform, and Contr., 1966, vol. 9, N 6, p. 602-619. 10. Въюгин В. В. Алгоритмическая энтропия (сложность) конечных объектов и ее применение к определению случайности и количества информации.— В кн.: Семиотика и информатика. М.: ВИНИТИ, 1981, вып. 16, с. 14—43. 11. Chaitin G. On the length of the programs for computing finite binary sequences.— J. ACM, 1966, vol. 13, N 4, p. 547—569. 12. Зеонкин А. К., Левин Л. А. Сложность конечных объектов и обоснование понятий информации и случайности с помощью теории алгоритмов.— УМН, 1970, т. 25, вып. 6, с. 85—127.
КОММЕНТАРИИ К РАБОТАМ ПО ТЕОРИИ ВЕРОЯТНОСТЕЙ И МАТЕМАТИЧЕСКОЙ СТАТИСТИКЕ А* Н. Колмогоров Приведу некоторую классификацию моих работ по теории вероятностей с учетом как их содержания, так и времени написания. I. Предельные теоремы для независимых и слабо зависимых случайных величин, получаемые методами метрической теории функций. Работы № 1—6, 8. По методам эти работы^ посвященные различным видам законов больших чисел и закону повторного логарифма, примыкают к моим и Д. Е. Меньшова работам по метрической теории функций и велись в тесном контакте с А. Я. Хинчиным. Из примыкающих сюда последующих работ других исследователей следует в первую очередь указать на необходимые и достаточные условия применимости усиленного закона больших чисел для сумм независимых случайных величин, полученные Ю. В. Прохоровым, II. Аксиоматика илогическиеосновы теории вероятностей. Работа № 7. Первым результатом моих размышлений над логической структурой теории вероятностей явилась работа № 7, опубликованная в 1929 г. Здесь теория вероятностей представляется в качестве одной из областей применения общей теории меры. Но развитые концепции еще не раскрывали теоретико-множественного смысла фундаментального в теории вероятностей понятия условной вероятности. Только после преодоления этой трудности и построения теории распределений в бесконечных произведениях оказалось возможным говорить о теоретико-множественном обосновании всей теории вероятностей, которое было дано в моей монографии «Основные понятия теории вероятностей», вышедшей в 1933 г. на немецком языке и в 1936 г. на русском. Модернизированное изложение этих концепций, подготовленное мною совместно с А. Н. ШиряевымА дано во^втором издании этой монографии (М.: Наука, 1974), III. Цепи Маркова (марковские процессы с дискретным временем). Работы № 21, 23, 36, Фундаментальное значение марковского процесса было понято в 1906—1907 гг. А. А. Марковым, Со строго финитной точки зрения существо дела может быть полностью охарактеризовано уже на конечных дискретных цепях Маркова. Для случая однородных цепей с конечным числом состояний А. А, Марков установил фундаментальную теорему о существовании предела у переходных вероятностей. Вся примыкающая сюда проблематика живо заинтересовала В. И. Романовского (Ташкент), а затем и многих представителей московской вероятностной школы, Для случая однородной цепи
К работам по теории вероятностей и статистике (Α. Η. Колмогоров) 473 с конечным число состояний наиболее исчерпывающие результаты были получены С. X. Сираждиновым — учеником В. И. Романовского и А. Н. Колмогорова. Именно им для этого случая полностью определена асимптотика многомерных распределений числа попаданий в различные состояния. IV. Марковские процессы. Работы № 9, 10, 13, 14, 17, 19, 24, 39. В 1929 г. центральной областью моих интересов сделалась теория марковских процессов с непрерывным временем. В мемуаре № 9 (одномерный случай) и в работе № 17 (многомерный случай) эта теория была развита в классических терминах без употребления в явном виде пространств траекторий. Первые варианты современной концепции марковского процесса с непрерывным временем были построены Дж. Дубом и Е. Б. Дынкиным (см. по этому поводу комментарий А. Д. Вентцеля). Различным применениям теории марковских процессов диффузионного типа посвящены работы № 14, 19, 24 (см. комментарий А. М. Яглома). Случаю дискретного множества состояний посвящена работа № 39 (см. комментарий А. А. Юшкевича). V. Предельные теоремы о сходимости цепей Маркова к марковским процессам с непрерывным временем. Работы № 9, 12, 16, 41. Первый замысел такого рода теорем изложен в 1931 г. в § 12 ме- муара № 9. Два примера таких теорем даны в работах № 12, 16. Далее работа в этих направлениях широко развернута другими исследователями (принцип инвариантности). См. обзорную статью № 41. VI. Стационарные процессы. Работы № 27, 28, 47, 48,- 50, 52. Мой интерес к спектральной теории стационарных случайных процессов возник в связи с работами А. Я. Хинчина и Ε. Ε. Слуцкого. Первоначальные представления о проблематике читатель может получить из статьи № 34. Прошедшие почти 40 лет подтверждают гипотезу о представлении колебательных процессов в виде интегралов Стилтьеса (см. формулу (4) в № 34). По-видимому, следует и в преподавании (в частности, для инженеров) более смело подчеркивать то обстоятельство, что спектральная разложимость процесса не допускает в общем случае более конкретного объяснения. VII. Ветвящиеся процессы. Работы № 25, 32, 33, 46. Частные виды «ветвящихся процессов» многократно изучались. Обзор старой литературы см. в работе Ж. Стеффенсена, указанной в статье № 25. В известной монографии Р. А. Фишера широко используется тот факт, что эволюция численности гена в популяции, пока концентрация гена мала, происходит в соответствии со схемой ветвящегося процесса. Применение математического аппарата производящих функций было предложено Р. А. Фишером. О дальнейшем развитии теории ветвящихся процессов см. монографию Б. А. Севастьянова «Ветвящиеся процессы» (М.: Наука, 1971). VIII. Различные применения. Работы № 14, 18, 22, 26, 29, 37. В работе № 14 решена задача, поставленная С. И. Вавиловым,
474 Комментарии Разделы 1 и 2 этой статьи написаны мной, раздел 3 — М. А. Леонто- вичем. В связи с работой № 18 отмечу, что рассматриваемое «вздувание» эмпирических коэффициентов корреляции при небольшом числе наблюдений является довольно типичным для большого числа прикладных работ (см. также комментарии к этому циклу А. М. Яг- лома). IX. Математическая статистика. Работы № 11, 15, 30, 31, 38, 50. См. комментарии Э. В. Хмаладзе, М. Б. Малютова, А. Н. Ширяева. АНАЛИТИЧЕСКИЕ МЕТОДЫ В ТЕОРИИ ВЕРОЯТНОСТЕЙ (к № 9) (А. Д. Вентцелъ) Название статьи, которое на современном языке звучало бы, скорее, как «Аналитические методы в теории марковских процессов», может служить названием целого направления в этой теории. Суть этого направления в том, что марковские процессы рассматриваются лишь до тех пор, пока задача, о которой идет речь, не переводится на язык переходных вероятностей Ρ (s, χ, £, Ε) марковского процесса или других аналитических объектов, с ними связанных; а дальше задача решается, как чисто аналитическая. В самой статье (№ 9 наст, изд.) случайные процессы как ансамбли реализаций (траекторий) или как объекты, описываемые системой конечномерных распределений, вообще не входят в рассмотрение явно, но только в виде мотивировок некоторых определений и допущений. Так, после введения предложений (111), (112) говорится: «Только в этом случае, строго говоря, процесс будет непрерывным во времени». На языке современной теории марковских процессов это можш) было сформулировать так: (111), (112) близки к условиям на переходную функцию, нужным для непрерывности траекторий соответствующего марковского процесса (точнее, для существования его модификации с непрерывными траекториями). Основные темы статьи — общее понятие стохастически определенного (марковского) процесса; дифференциальные характеристики марковских процессов и дифференциальные уравнения, связанные с этими процессами; эргодические свойства. Что касается понятия марковского процесса, то в дальнейшем, по мере накопления методов решения конкретных классов задач, связанных с течением марковского процесса на целом отрезке времени, траектории стали все более явно входить в рассматриваемые схемы. Так, в 1933 г. были опубликованы работы Колмогорова и Леонтовича [1] и Андронова, Витта, Понтрягина [2], в которых выводились дифференциальные уравнения для функций, связанных с диффузионным процессом с наложенным условием отсутствия выхода в течение данного времени из определенной области. Общие теории, включающие не только переходные функции, но и траектории в качестве явного объекта рассмотрения, были изложены в книгах Дуба [3] и Дынкина [4]. Обе теории основывались на понятиях условной вероятности и условного математического ожидания относительно σ-алгебры; но в дубовской теории основной объект — случайный процесс на некотором вероятностном пространстве, удовлетворяющий условию
Аналитические методы (А. Д. Вентцелъ) 475 независимости будущего и прошлого при фиксированном настоящем, а в дын- кинскоп — целое семейство таких процессов, начинающихся в произвольный момент времени в произвольной точке пространства (что выражается рассмотрением семейства вероятностных мер PSiX и вероятностных пространств (Ω, Mst Р8,х))' Сначала аналитическое направление в теории марковских процессов было фактически единственно господствующим; в 50-е годы сталд широко применяться прямые вероятностные методы, имеющие дело с построением реализаций одних случайных процессов, исходя из реализаций других более простых: стохастические уравнения, случайные замены времени. Аналитические и прямые методы дополняют друг друга. Возникло направление противоположной ориентации, применяющее теорию марковских процессов к получению чисто аналитических результатов. С 70-х годов, пожалуй, нельзя говорить о чисто аналитическом направлении в теории марковских процессов, а лишь о сильном преобладании аналитических методов в некоторых работах. Центральный вопрос для аналитического направления в теории марковских процессов с непрерывным временем — дифференциальные характеристики процессов и механизмы, осуществляющие их связь с самими процессами. Дадим обзор эволюции способов ответа на этот вопрос и некоторых достижений аналитического направлении в теории марковских процессов. В № 9 дифференциальные характеристики вводятся для процессов с дискретным пространством состояний формулами (50) и для непрерывных (диффузионных) процессов на числовой прямой формулами (114), (124), (115), (122). Существование пределов (50), (122), (124) (фактически дифференциальных характеристик при s = t) устанавливается в предположении дифференцируемости переходных вероятностей P\j (s, £), соответственно плотностей вероятностей перехода / (s, я, t, у) при s < t (плюс дополнительное условие необращения в нуль определителя (119)). В обоих случаях выводятся обратные дифференциальные уравнения — с дифференцированием по первому временному аргументу s: (57). 125) — и прямые — с дифференцированием по второму аргументу t: (52), (133), Ставится вопрос о существовании и единственности решения, удовлетворяющего естественным условиям при s = t и условиям (1), (3) (в конкретных случаях (40), (41) и (85), (86)), нужным для существования соответствующего процесса; но в непрерывном случае он решается только тогда, когда уравнение сводится к классическому уравнению теплопроводности. В § 19 выписываются также дифференциальные характеристики для чисто скачкообразного марковского процесса и предположительное прямое дифференциальное уравнение (175) (также уравнение (176) для процесса с диффузией между скачками). Задача нахождения плотности вероятностей перехода для диффузионного процесса, если ее сформулировать аналитически,— это задача нахождения фундаментального решения параболического дифференциального уравнения. Теоремы существования и единственности при широких условиях были получены еще в 30-е годы (работа Феллера [5]); были получены и теоремы существования и единственности для чисто скачкообразных процессов и процессов с диффузией между скачками. Дифференциальные характеристики марковских процессов в № 9 вводятся отдельно для разных конкретных классов процессов; эти характеристики —
476 Комментарии функции от соответствующих аргументов. Следующий шаг — рассмотрение в ка- честве дифференциальной характеристики марковского процесса не набора функций, а линейного (иногда неограниченного) оператора — был сделан, когда к марковским процессам была применена теория полугрупп линейных операторов. В качестве характеристики марковского процесса (говоря точнее и уже, его переходной функции) вводился инфинитезимальный оператор полугруппы операторов, связанной с процессом. Теория полугрупп позволила установить при очень слабых ограничениях единственность переходной функции, отвечающей данному инфинитезимальному оператору, и найти необходимые и достаточные условия, которым должен удовлетворять такой оператор. Вопрос о существовании дифференциальных характеристик был снят: согласно общей теории инфинитезимальный оператор имеет всюду плотную область определения. Теория полугрупп непосредственно применяется только к однородным по времени марковским процессам, т. е. процессам с переходной функцией, зависящей только от разности моментов времени: Ρ (ό·, χ, t, Ε) = P0(t — s, χ, Ε); для применения ее к неоднородным процессам их можно при помощи введения расширенного пространства состояний свести к однородным. Первые применения теории полугрупп относились к связанной с переходной функцией полугруппе операторов, переводящих начальные распределения в распределения в последующие моменты времени (ср. № 9 формулу (5)), что связано с аналогами прямых колмогоровских уравнений (см. (52), (133)). Однако более плодотворным оказалось применение полугрупп операторов, действующих не на начальные распределения, а на функции: 2У(*)= lPo(t,x,dy)t(y); это связано с аналогами обратных уравнении (57), (125). Существенной для связи между марковскими процессами и их инфинитези- мальными операторами, в частности для вывода уравнений для математических ожиданий, связанных с процессом, оказалась возможность рассматривать значения процесса в случайные моменты времени, такие, как момент первого выхода из множества. Эта возможность была обеспечена введением в рассмотрение строго марковского свойства. Используя строго марковское свойство, Дынкин ввел новый вид дифференциальной характеристики марковского процесса — характеристический оператор (см. [4]), т. е., скорее, не новый вид такой характеристики (потому что при естественных широких допущениях характеристический оператор совпадает с инфинитезимальным), а новый аспект связи этого оператора с марковским процессом. Новые методы дали возможность решить задачу полного описания всех однородных по времени одномерных диффузионных процессов (т. е. строго марковских процессов с непрерывными траекториями). Одновременно были найдены плодотворные постановки новых задач, в частности, о поведении марковского процесса, заданного внутри области, после выхода на ее границу (аналитическая постановка — нахождение граничных условий, сужающих данный линейный
Аналитические методы (А. Д. Вентцелъ) ΑΊ7 оператор до инфинитезимального оператора полугруппы сжимающих и сохраняющих положительность операторов; см. [6]). Дальнейшее развитие аналитических методов, последовавшее за работой Ханта [7], было связано с рассмотрением, с одной стороны, общих неотрицательных аддитивных функционалов от марковских процессов, а с другой, аналитической,— эксцессивных функций (неотрицательных супергармонических относительно данной полугруппы операторов функций). С помощью рассмотрения крайних точек множества этих функций были найдены способы построения идеальной границы области, соответствующей данному марковскому процессу внутри области (граница Мартина). Новый подход к вопросу о дифференциальных характеристиках марковского процесса был начат работами Фукусимы (см. [8]). В этих работах в качестве такой характеристики рассматривается не инфинитезиальный оператор, а соответствующая ему билинейная форма Дирихле. Полная и замкнутая теория здесь получается, однако, только для случая, когда полугруппа состоит из операторов, симметричных относительно некоторое меры (на теоретико-вероятностном языке — для обратимых во времени марковских процессов). Были получены существенные результаты, касающиеся возможных продолжений по выходе из области марковского процесса, заданного внутри области (в частности, построено- броуновское движение с «отражением по нормали» на сколь угодно негладкой границе). В 60—70-е годы, особенно после работ Струка и Варадана [9], стал широка использоваться подход к связи между линейными операторами и марковскими процессами, основанный на понятии мартингала и чшартингальной задачи»- Вместо строго марковского, свойства при этом подходе используется сохранение1 мартингального свойства в марковские случайные моменты. (Строго марковское свойство оказывается автоматическим следствием единственности решения^ мартингальной задачи.) В работах Крылова [10] и Струка и Варадана [9] поставленный в № 9 вопрос о существовании и единственности диффузионного процесса, соответствующего данным коэффициентам диффузии и переноса, был решен без наложения почти никаких ограничений. Вероятно, теперь аналитическому направлению в теории марковских процессов предстоит подняться на новый, более высокий уровень, связанный с рассмотрением в качестве основных аналитических объектов не переходных вероятностей и связанных с ними операторов, а распределений в пространстве функций;, начало этому положено в работах Струка и Варадана и др. Особенно большие возможности новые аналитические методы открывают для установлени я различных предельных теорем для случайных процессов. ЛИТЕРАТУРА 1. Kolmogoroff A. N., Leontovitch M. A. Zur Berechnung der mittleren Broun schen Flache.— Phys. Ztschr. Sow., 1933, Bd. 4, S. 1—13. 2. Андронов Л., Витт Л., Понтрягин Л. О статистическом рассмотрении динамических систем.— ЖЭТФ, 1933, т. 3, № 3, с. 165—180. 3. Дуб Дж. Л. Вероятностные процессы/Пер. с англ. М.: Изд-во иностр. лит.„ 1956. 4. Дынкин Е, Б. Марковские процессы. М.: Физматгиз, 1963.
478 Комменщарии 5. Феллер В. К теории стохастических процессов (теоремы существования и единственности).— УМН, 1938, вып. 5, с. 57—96. 6. Феллер В. Параболические дифференциальные уравнения и соответствующие им полугруппы преобразований.— В кн.: Математика: СЪ. пер., 1957, т. 1, № 4, с. 105—153. 7. Хаит Дж. Марковские процессы и потенциалы. М.: Изд-во шостр. лит., 1962. 8. Fukusima M. Dirichlet forms and Markov processes. Amsterdam: North-Holland Publ. Go, 1980, p. 196. 9. Stroock D., VaradhanS. Multidimensional diffusion processes. * erlin: Spring.- Verl., 1979. 10. Крылов Η. В. О стохастических интегральных уравнениях.— Теория вероятностей и ее применения, 1969, т. 14, № 2, с. 340—348. МАРКОВСКИЕ ПРОЦЕССЫ СО СЧЕТНЫМ ЧИСЛОМ СОСТОЯНИЙ (к № 10) (Б. А. Севастьянов) Дается пример применения уравнений для марковских процессов со счетным числом состояний к изучению одной из первоначальных задач теории массового обслуживания, а именно: изучается задача об очереди в системе обслуживания с η приборами при пуассоновском потоке требований с показательным временем обслуживания. Этот ставший классическим результат вошел в учебную литературу (см., например: Феллер В. Введение в теорию вероятностей и ее приложения/Пер. с англ. М.: Изд-во иностр. лит., 1964» Т. 1). ОДНОРОДНЫЕ СЛУЧАЙНЫЕ ПРОЦЕССЫ (к № 13) (В. М, Золотарев) Необходимость деления работы на две части (первая заканчивалась формулой (7)) была вызвана формальным ограничением объема публикации в одном номере журнала «Atti della Reale Accademia...». Краткая предыстория создания работы А. Н. Колмогорова. В 1929—1930 гг» появилось несколько статей известного итальянского математика Б. де Финетти, в которых им было начато исследование свойств случайных процессов Χ (λ) получивших впоследствии название однородных процессов с независимыми приращениями. Оказалось, что при любом λ > 0 имеет место равенство -ψ (ί, λ) = Ε exp {itX (λ)} = [ψ (ί, 1)]\ В связи с этим Финетти в последней из упомянутых статей (она цитируется б работе А. И. Колмогорова) ставит задачу описания всех распределений, характеристические функции которых ψ (t) обладают тем свойством, что [ψ (ί)]λ при любом λ > 0 является характеристической функцией некоторого распределения. Класс © таких распределений называется^классом безгранично делимых законов. В той же статье приводятся факты, которые после надлежащего осмысления по-
Однородные случайные процессы [В. М. Золотарев) 479 называют, что в ($ входят все распределения, характеристические функции которых имеют вид ψ (t) = exp {ity - ν2σ2ί2 + с2 \ (eitx - 1) JF (ж)}, (*) где γ, σ, с — вещественные постоянные и F (х) — некоторая функция распределения. А. Н. Колмогоров, знавший о работах Финетти и находившийся с ним в переписке, заинтересовался задачей описания класса ©. В своей работе он дал описание лишь той части класса (55, которая соответствует законам с конечной дисперсией. В полном объеме проблема Финетти была решена в 1934 г. французским математиком Леви [1]. ^Несмотря на, казалось бы, промежуточный характер, результат А. Н. Колмогорова сыграл фундаментальную роль в поиске полного описания класса ®. Прежде всего представление (15), полученное А. Н. Колмогоровым, превратило в уверенность догадку Финетти о том, что описание класса @ следует проводить на языке характеристических функций. Не менее важно и то, что метод доказательства (15), использовавшийся А. Н. Колмогоровым, оказался очень перспективным. В 1937 г. этим методом, несколько его развив, известный советский математик Хинчин повторил результат Леви [2]. Достоинства метода Колмогорова—Хинчина оказались выраженными настолько ярко, что в современных курсах теории вероятностей каноническое представление Леви—Хинчина (вкупе с его модификацией — представлением Леви) доказывается именно этим методом [3]. С успехом он используется и при описания аналогов безгранично делимых распределений в пространствах Банаха и на локально компактных группах [4]. Стоит обратить внимание читателя также и на то обстоятельство, что А. Н. Колмогорову были известны обе используемые ныне формы канонического представления характеристических функций безгранично делимых законов. Действительно, запись представления (15) в точности соответствует каноническому представлению Леви—Хинчина, а каноническое представление Леви получается из него, если использовать выражения (13), (14) функции Ω (χ) с помощью функций Рг (х) и Ρ2 (х). Последние являются не чем иным, как спектральными функциями в представлении Леви. Работа А. Н. Колмогорова содержит еще один важный результат, который автор не пожелал выделить. Это — истолкование вероятностного смысла спектральных функций Рг и Р2. Здесь стоит, по-видимому, уточнить смысл утверждения о том, что «величина Р2 (χ) άλ представляет собой вероятность того, что за время άλ имел место положительный скачок, больший чем х». Подразумевается, что d% мало и что Р2 (χ) άλ представляет указанную вероятность с точностью до о (дХ). ЛИТЕРАТУРА 1. Levy P. Sur les integrates dont les elements sont des variables aleatoires inde- pendantes.— Ann. Scuola norm, super. Pisa, Ser. 2, 1934, vol. 3, p. 337—366. 2. Хинчин А. Я. Новый вывод одной формулы П. Леви.— Бюл. МГУ. Математика, 1937, т. 1, вып. 1. 3. Лоэв М. Теория вероятностей/Пер. с англ. М.: Изд-во иностр. лит., 1962. 4. Хейер X. Вероятностные меры на локально компактных группах. М.: Мир, 1981.
Коммен тарии ОДНОРОДНЫЕ МАРКОВСКИЕ ПРОЦЕССЫ (к № 39) (А. А. Юшкевич) Рассматриваемая работа А. Н. Колмогорова наряду с цитируемыми ниже статьями Дуба и Леви положила начало разделу теории марковских процессов, посвященному однородным процессам со счетным числом состояний. Возникающие в таких процессах своеобразные эффекты выделили их в самостоятельную главу общей теории. В то же время исследование счетного случая способствовало выработке важных концепций, имеющих более широкую область применения таких, как строго марковское свойство и граничные условия для марковских процессов. Плотности а^ перехода из α в β и'плотности аа = —а^ выхода из а, а также прямая и обратная системы дифференциальных уравнений Р' (t) = Ρ (t) A и Pr (t) = АР (t) для вероятностей перехода р^ (t) однородного марковского процесса с конечным или счетным множеством состояний Ε введены Колмогоровым <в основополагающей работе [1] (наст, изд., № 9;, где предположены дифферен- цируемость функций р^ (t) и в случае бесконечного Ε некоторые условия равномерной сходимости (А и Ρ (t) обозначают магргщы с элементами'^ и р^ (г), t ^ ^> 0). Если Ε конечно, то легко показывается, что аа = 2 аа и что ПРИ началь- β* ос 1Ном условии Ρ (0) = I (I — единичная матрица) каждая из систем дифференциальных уравнений Колмогорова имеет единственное решение Ρ (t) = eAi* После того как Дёблин [2] установил, что при конечном множестве Ε дифферен- цируемость переходных вероятностей вытекает из стохастической непрерыв- . жости процесса, т. е. условия Ρ (+0) = Λ случай конечного множества состояний по существу был исчерпан. Процессы со счетным пространством состояний оказались значительно слож- Oee. Анализ их инфинитезимальных характеристик, гладкости переходных функций, поведения траекторий, возможных «патологий» и т. п. составил заметное в свое время направление исследований. В появившихся сперва статьях Дуба [3, 4], идейно связанных с принадлежащим ему понятием сепарабельного процесса, изучение переходной матрицы Ρ (t) ^основано на рассмотрении скачков траектории. Допуская, что Ρ (+ 0) = / (это условие считается выполненным и всюду далее), Дуб: 1) доказал существование конечных или бесконечных производных а^ функций р^ (t) в нуле, 2) показал, ^то обратная система справедлива, когда есть первый после 0 скачок, т. е. когда *аа ~ Σ αα ^ °° (как Г0В0РЯТ» матрица А консервативна), и нашел аналогична шую связь между прямой системой и последним перед t скачком, 3) по-разному «продолжая процесс пос-е накопле-ия скачков, получил примеры неединственности процесса с данной матрицей А. В комментируемой работе № 39 [5] Колмогоров посредством замечательных но простоте и краткости чисто алгебраических либо аналитических приемов (за которыми просматриваются Еероятностные соображения) сделал следующее: 1) доказал существование конечных плотностей а^ при β ψ. α, 2) доказал сущест-
Однородные марковские процессы (А. А. Юшкевич) 481 вование плотностей аа ^ оо, 3) построил пример процесса, в котором а± = оо, 4) построил пример процесса, в котором ^j αα < аа < °° (^УДем обозначать эти примеры К1 и К2). Далее, Колмогоров высказал в [5] гипотезу'о том, что функции р^ (t) при t >> 0 всегда дифференцируемы. В появившемся одновременно мемуаре [6] Леви, интересуясь более всего» асимптотикой функций pg (t) при t —* со, предпринял классификацию рассматриваемых процессов с точки зрения поведения траекторий, обращаясь с последними на менее формальном уровне, чем Дуб. В частности, Леви обнаружил эффекты, наблюдающиеся в примерах К1 и К2. Леви предложил называть состояния ас аа < оо устойчивыми и с аа = оо мгновенными и привел в своем мемуаре оказавшуюся затем ошибочной теорему о том, что все состояния не* могут быть мгновенными. Леви продолжил свой анализ в [7, 8J. Дальнейшее изучение счетных однородных марковских процессов происходило под влиянием в первую очередь работы и идей Колмогорова. В Московском университете эта тема культивировалась на семинарах Колмогорова и Дынкина. Колмогоров предложил задачу о дифференцируемое™ функций р^ (t) в качестве темы дипломной работы Юшкевичу, которому удалось с по^ мощью анализа траекторий доказать непрерывную Дифференцируемость р^ (t) в предположении, что хотя бы одно из состояний α или β устойчиво, а также- построить пример процесса с бесконечной второй производной у функции ρβ (t) при некотором £>0 (идея примера подсказана Колмогоровым). Публикация этой работы растянулась на шесть лет [9]. Юшкевич же заметил пробел в доказательстве упомянутой выше теоремы Леви о мгновенных состояниях,, связанный с отсутствием определенного значения траектории в момент разрывов* второго рода (см. [28]). Рассматриваемые вопросы оказались затронутыми на математическом кон^ грессе в Амстердаме, где Кендал л и Рейтер [10] выступили с подробным анализом, примеров К1 и К2 с точки зрения полугрупп. На конгрессе присутствовал Кол·*- могоров. Из устных бесед некоторые участники вынесли неверное представлениег будто в [9] построен пример, опровергающий гипотезу о диффереицируемостиг функцийpj* (ί) [12]. Вскоре Остин [И, 12] опубликовал чисто аналитическое доказательство непрерывной дифференцируемости р^ (t) при t > 0 в случае устой-' чивого состояния а. Затем Чжун [13] доказал то же при t ^ 0 вероятностным методом, близким к [9]. Впоследствии Остин распространил свое доказательство на случай устойчивого состояния β [14]. Усовершенствования этих доказательств предлагались Рейтером [15], развивавшим далее полугрупповой подход, Юрка- том [16], Чжуном [17, 18]. Наконец, полное, чисто аналитическое доказательства гипотезы Колмогорова нашел Орнштейн [19], Смит [20] дал отрицательный ответ на вопрос Чжуна о том, стремится ли производная функция р^ (t) при t —» 0* к своему значению в точке t = 0, равному — оо, когда состояние а мгновенное.. С другой стороны, Ори [21] показал, что полная вероятность ра (t) состояния ое в момент t может не быть дифференцируемой при подходящих начальном распределении и моменте t > 0. Тонкими вопросами строения функций р^ (t) при ί —> О занимались также Кендалл [22], Блекуэлл и Фридман [23], Рейтер [24]. Изучение класса возможных функций / (t) = р^ (t) явилось одним из стимулов к со^ зданию Кингманом теории регенеративных событий [25].
482 Комментарии Вскоре после появления работы № 39 Кендалл частично распространил результаты Колмогорова о существовании плотностей аа и а^ на скачкообразные марковские процессы с произвольным множеством состояний [26] и, комбинируя идеи примеров К1 и К2, построил пример процесса с аг = сю и а^ = 0 при β φ Ι [27]. Положительный ответ на интригующий вопрос о существовании процесса, все состояния которого мгновенны, дали независимо Добрушин [28] и Феллер и Мак-Кин [29]; другие примеры предложили вскоре Кендалл [30] и Блекуэлл [31]. Позднее к исследованию примера К1 вернулся Рейтер [24], показавший, что в этом примере инфинитезимальная матрица А однозначно определяет переходную матрицу Ρ (t). Описанию всех матриц Л, соответствующих процессам с только мгновенными состояниями, посвящены более поздние работы Вильямса [32, 33]. Подробное изложение результатов о дифференцируемости переходных вероятностей и строении траекторий однородных марковских процессов со счетным числом состояний, детальное описание примеров тех или иных «патологий» имеется в книгах Чжуна [17] и Фридмана [34]. Другая книга Фридмана [35] посвящена исключительно построению примеров с мгновенными состояниями предельным переходом от процессов с конечным числом состояний. Восходящая к работе Колмогорова № 39 тематика способствовала выработке понятий марковского момента и строго марковского свойства. Это свойство формулировалось и доказывалось Дубом [4], Юшкевичем [9], Чжуном [36, 13] для тех или иных классов встречавшихся марковских моментов в однородных марковских процессах со счетным числом состояний. С другой стороны, при изучении марковских процессов в произвольном метрическом пространстве с помощью характеристических операторов строго марковское свойство потребовалось Дынкину [37,38] и сперва было введено им в качестве весьма правдоподоб" ного предположения [37]. Колмогоров же в устных высказываниях Юшкевичу допускал возможность марковских процессов, не являющихся строго марковски, ми, и последний построил соответствующие примеры, упоминаемые в [37] и вошедшие в [39]. Тогда Дынкин, сравнивая свои результаты с результатами Феллера, полученными чисто аналитическим путем, высказал гипотезу, что всякий феллеровский процесс без разрывов второго рода будет строго марковским [37]. Юшкевич доказал этот результат с заменой второго условия предположением непрерывности траекторий справа [39]. Параллельно строго марковское свойство для частных случаев непрерывных процессов установили Хант [40] и Рей [41], а в общем виде ввел Блюменталь [42]. Чтобы свойство строгой марковости выполнялось в полном объеме для однородного марковского процесса со счетным множеством состояний Е, вообще говоря, пространство Ε нужно подходящим образом компактифицировать, вводя фиктивные состояния- Такая конструкция значительно позднее осуществлена Дубом [43]· работа Колмогорова № 39 явилась одним из отправных пунктов и при изучении границ и граничных условий для марковских процессов. Если матрица ЧА консервативна, то верна обратная система дифференциальных уравнений Р' (t) = АР (£)> но решение ее при начальном условии Ρ (0) = /, вообще говоря, ;,неединственно. Из общих результатов Феллера [44] следует, что вероятности ^перехода за конечное число скачков образуют минимальное решение указанной .системы. Возникает задача о построении возможных продолжений минимального
Однородные марковские процессы (А. А. Юшкевич) 483 процесса за момент накопления скачков с сохранением марковского свойств .* инфинитезимальной матрицы Л, чтобы процесс не обрывался. Предварите"1 иый вопрос о том, когда накопление скачков (иными словами, уход в бесконечность) может произойти за конечное время, вслед за Феллером [44] специально для счетного случая исследовал Добрушин [45]. Дальнейшая конструкция требует построения границы-выхода, границы-входа (если таковая имеется) и «склеивания» выходов со входами либо с первоначальными состояниями посредством граничных условий. Не касаясь обширного круга соответствующих исследований для процессов диффузионного типа и их обобщений, отметим, что для счетного пространства состояний подобная программа была нарисована Дынкиным в докладе на Всесоюзном совещании по теории вероятностей в Ленинграде в 1955 г. Реализовать ее оказалось возможным, по-видимому, лишь для случая, когда число выходов конечно. Не претендуя на полноту, назовем относящиеся сюда работы Добрушина [46], Феллера [47],Рейтера [15,48], Неве [49],Чжуна [50], Вильямса [51, 52], Дынкина [53]. ЛИТЕРАТУРА 1. Kolmogoroff А. N. Ueber die analytischen Methoden in der Wahrscheinlich- keitsrechnung.— Math. Ann., 1931, Bd. 104, S. 415—457. 2. Doeblin W. Sur 1 equation matricielle A^i+S^ = A^A^ * et ses applications aux probabilites en chaine.— Bull. sci. math., 1938, vol. 62, p. 21—32; 1940, vol. 64, p. 35—37. 3. Doob J. L. Topics in the theory of Markoff chains.— Trans. Amer. Math. Soc.,. 1942, vol. 52, p. 37—64. 4. Doob J. L. Markoff chains — denumerable case.— Trans. Amer. Math. Soc.,. 1945, vol. 58, p. 455-473. . : < ν м& 5. Колмогоров Α. Η. Κ вопросу о дифференцируемости переходных вероятностей в однородных по времени процессах Маркова со счетным числом, состояний.— Уч. зап. МГУ, 1951, т. 148. Математика, № 4, с. 53—59. 6. Levy P. Systemes markoviens et stationnaires. Gas denombrable.—Ann. scL Ecole norm, super., 1951, vol. 68, p. 327—381. 7. Levy P. Processus markoviens et stationnaires du cinqueme type (infinite denombrable des etats possible, parametre continu).— G. r* Acad. sci. Paris, 1953, vol. 236, p. 1630-1632. 8. Levy P. Remarques sur les etats instantanes des processus markoviens et stationnaires, a une infinite denombrable d'etats possibles.— G. r. Acad. sci. Paris, 1967, vol. 264, p. 844—848. 9. Юшкевич А. А. О дифференцируемости переходных вероятностей однородного марковского процесса со счетным числом состояний: Дипл. раб. МГУ, 1953.— Уч. зап. МГУ, 1959, т. 186. Математика, № 9, с. 141—159. 10. Kendall D. G., Reuter G. Ε. Η. Some pathological Markov processes with a denumerable infinity of states and the associated semigroups of operators ,on L— In: Proc. Intern. Gongr. Math. Amsterdam, 1954, vol. 3, p. 377—415. ii/Austin D.G. On the existence of the derivative of Markoff transition probability functions.— Proc. Nat. Acad. Sci. USA, 1955, vol. 41, p. 224—226. 12. Austin D. G. Some differentiation properties of Markoff transition probability functions.— Proc. Amer. Math. Soc, 1956, vol. 7, p. 756—761. 13. Chung K. L. Some new developments in the theory of Markov chains.— Trans. Amer. Math. Soc, 1956, vol. 81, p. 195—210. 14. Austin D. G. Note on differentiating Markoff transition functions with stable terminal states.— Duke Math. J., 1958, vol. 25, p. 625—629. 15. Reuter G. Ε. Η. Denumerable Markov processes and the associated contraction semi-groups on I.— Acta math., 1957, vol. 97, p. 1—46. 16. Jurkat W. B. On semi-groups of positive matrics. I, II.— Scr. math., 1959, vol. 24, p. 123-131; 207-218.
484 Комментарии 17. Chung К. L. Markov chains with stationary transition probabilities. Berlin, 1960. 18. Chung K. L. Probabilistic methods in Markov chains.— In: Proc. Fourth Berkeley Sympos. Math. Statist. Probab. Univ. Calif. Press, 1961, vol. 2, p. 35—56. 19. Ornstein D. The differentiability of transition functions.— Bull. Amer. Math. Soc, I960, vol. 66, p. 36—39. 20. Smith G. Instantaneous states of Markov processes.— Trans. Amer. Math. Soc, 1964, vol. 110, p. 185—195. 21. Orey S. Non-differentiability of absolute probabilities of Markov chains.— Quart. J. Math., 1962, vol. 13, p. 252—254. 22. Kendall D. G. On the behaviour of a standard Markov transition function near t = 0.— Ztschr. Wahrscheinlichkeitstheorie, 1965, Bd. 3, S. 276—278. 23. Blackwell D., Freedman D. On the local behaviour of Markov transition probabilities.— Ann. Math. Statist., 1968, vol. 39, p. 2123—2127. 24. Reuter G. Ε. Η. Remarks on a Markov chain example of Kolmogorov.— Ztschr. Wahrscheinlichkeitstheorie, 1969, Bd. 13, S. 315—320. 25. Kingman J. F. C. The stochastic theory of regenerative events.—Ztschr. Wahrscheinlichkeitstheorie, 1964, Bd. 2, S. 180—224. 26. Kendall D. G. Some analytical properties of continuous stationary Markov transition functions.— Trans. Amer. Math. Soc, 1955, vol. 78, p. 529—540. 27. Kendall D. G. Some further pathological examples in the theory of denumerab- le Markov processes.— Quart. J. Math., 1956, vol. 7, p. 39—56. 28. Добру шин P. Л. Пример счетного однородного марковского процесса, все состояния которого являются мгновенными.— Теория вероятностей и ее применения, 1956, т. 1, с. 481—485. 29. Feller W., McKean H. P., Jr. A diffusion equivalent to a countable Markov chain.— Proc. Nat. Acad. Sci. USA, 1956, vol. 42, p. 351—354. 30. Kendall D. G. A totally unstable denumerable Markov process.— Quart. J. Math., 1958, vol. 9, p. 149—160. 31. BlackwellD. Another countable Markov process with only instantaneous states.—Ann. Math. Statist., 1958, vol.29, p. 313—316: 32. Williams D. The (^-matrix problem for Markov chains.— Bull. Amer. Math. Soc, 1975, vol. 81, p. 1115—1118. 33. Williams D. The (^-matrix problem. 2: Kolmogorov backward equations.— Lect. Notes Math., 1976, vol. 511, p. 216—234; 505—520. 34. Freedman D. Markov chains. S. Francisco: Holden-Day, 1971. 35. Freedman D. Approximating countable Markov chains. S. Francisco, 1972. 36. Chung K. L. Foundations of the theory of continuous parameter Markov chains.— In: Proc. Third Berkeley Sympos. Math. Statist. Probab. Univ. Calif. Press, 1956, vol. 2, p. 29—40. 37. Дынкин Ε. Б. Бесконечно малые операторы марковских случайных процессов.— ДАН СССР, 1955, т. 105, с. 206—209. 38. Дынкин Е. Б. Инфинитезимальные операторы марковских процессов.— Теория вероятностей и ее применения, 1956, т. 1, с. 38—60. 39. Дынкин Е. Б., Юшкевич А. А. Строго марковские процессы.— Теория вероятностей и ее применения, 1956, т. 1, с. 149—155. 40. Hunt G. A. Some theorems concerning Brownian motion.— Trans. Amer. Math. Soc, 1956, vol. 81, p. 294—319. 41. Ray D. Stationary Markov processes with continuous paths.— Trans. Amer. Math. Soc, 1956, vol. 82, p. 452—493. 42. Blumental R. M. An extended Markov property.— Trans. Amer. Math. Soc, 1957, vol. 85, p. 52-72. 43. Ooob J. L. Compactification of the discrete state space of a Markov process.— Ztschr. Wahrscheinlichkeitstheorie, 1968, Bd. 10, S. 236—251. 44. Feller W. On the intergo-differential equations of purely discontinuous Mar- koff processes.— Trans. Amer. Math. Soc, 1940, vol. 48, p. 488—515; Errata.— Ibid., 1945, vol. 58, p. 474.
Ветвящиеся процессы (Б. А. Севастьянов) 485 45. Добрушин Р. Л. Об условиях регулярности однородных по времени марковских процессов со счетным чес лом возможных состояний.— УМН, 1952, т. 7, вып. 6, с. 185—191. 46. Добрушин Р. Л. Некоторые классы однородных счетных марковских процессов.— Теория вероятностей и ее применения, 1957, т. 2, с. 377—380. 47. Feller W. On boundaries and lateral conditions for the Kolmogoroff differential equations.— Ann. Math., 1957, vol. 65, p. 527—570. 48. Reuter G. E. H. Denumerable Markov processes. II, III.— J. London Math. Soc, 1959, vol. 34, p. 81—91. 49. Neveu J. Sur les etats d'entree et les etats fictifs d'un processus de Markoff.— Ann. Inst. H. Poincare, 1962, vol. 17, p. 324—337. 50. Chung K. L. On the boundary theory for Markov chains.— Acta math., 1963, vol. 110, p. 19—77; 1966, vol. 115, p. 111—163. 51. Williams D. The process extended to the boundary.— Ztschr. Wahrscheinlich- keitstheorie, 1962, Bd. 2, S. 332—339. 52. Williams D. On the construction problem for Markov chains.— Ztschr. Wahr- scheinlichkeitstheorie, 1964, Bd. 3, S. 227—246. 53. Дынкин Ε. Б. Общие граничные условия для марковских процессов со счетным множеством состояний.— Теория вероятностей и ее применения, 1967, т. 12, с. 222—257. ВЕТВЯЩИЕСЯ ПРОЦЕССЫ (к № 25, 32, 33, 46) (Б. А. Севастьянов)i Общее понятие и сам термин «ветвящегося случайного процесса», сразу ставший общепринятым, впервые были явно высказаны А. Н. Колмогоровым на руководимом им семинаре в МГУ в 1946/47 уч. г. Отдельные задачи, связанные с простыми моделями ветвящихся процессов, рассматривались и раньше. В частности, одна из таких задач решалась А. Н. Колмогоровым в более ранней работе № 25, однако именно с публикацией работ № 31, 32 начинается бурное развитие теории ветвящихся процессов. В настоящее время в мировой, литературе имеется несколько монографий, посвященных ветвящимся процессам (книги Харриса [1], Севастьянова [2], Атрея и Нея [3] и др.). Описанные в работах № 31, 32 модели ветвящихся процессов — это марковские ветвящиеся процессы с несколькими типами частиц и с непрерывным и дискретным временем. Уже эта модель оказалась очень богатой как по количеству полученных результатов, так и по возможным приложениям к биологии, химии, физике, технике. Частным случаем этой модели является ветвящийся процесс с иммиграцией, в котором, кроме размножающихся частиц, появляются и иммигрирующие частицы [2]. Впоследствии появились более сложные модели ветвящихся процессов, в которых учитываются: зависимость размножения от возраста частиц (процесс Беллмана—Харриса), положение частицы в некотором пространстве, зависимость частиц от энергии, зависимость от случайной среды и т. п. Полученные в № 25 асимптотические формулы вероятности продолжения процесса, а также связанные с ними предельные теоремы, доказанные Ягломом [4], в дальнейшем разными авторами обобщались на другие, в том числе и немарковские, модели. Сходимости ветвящихся процессов к диффузионным, о которой говорится в обзорной работе № 46, посвящены работы [5—7].
486 Комментарии ЛИТЕРАТУРА 1. Харрис Т. Е. Теория ветвящихся случайных процессов/Пер. с англ. М.: Мир, 1966. 2. Севастьянов Б. А. Ветвящиеся процессы. М.: Наука, 1971. 3. Athreya К. В., Ney P. E. Branching processes. Berlin; Heidelberg; New York: Spring.-Verl., 1972. 4. Яглом А. М. Некоторые предельные теоремы теории ветвящихся случайных процессов.— ДАН СССР, 1947, т. 56, № 8, с. 795—798. 5. Jifina Μ. On Feller's branching diffusion processes.— Casop. pestov. mat., 1969, sv. 94, N 1, s. 84—90. 6. Lamperty J. The limit of sequence of branching processes.— Ztschr. Wahrschein- lichkeitstheorie, 1967, Bd. 7, N 4, S. 271—288. 7. Чистяков В. П. О сходимости ветвящихся процессов к диффузионным.— Теория вероятностей и ее применения, 1970, т. 15, № 4, с. 727—730. СТАЦИОНАРНЫЕ ПОСЛЕДОВАТЕЛЬНОСТИ (к № 27) (Ю. А. Розанов) Ставшая классической работа № 27 открыла главное направление в теории ртационарных (и родственных им) случайных процессов, поставив г надлежащим образом задачи прогнозирования и решив их для стационарных процессов с дискретным временем (стационарных последовательностей). Эта работа замечательна своими глубокими связями с различными вопросами теории приближений, спектральной теории операторов в гильбертовом пространстве, теории аналитических функций. Центральными в ней являются два новых понятия — регулярность случайного процесса и подчиненность одного процесса другому. Стационарную последовательность можно рассматривать как χ (t) = еЫ, ί = 0, ±1, . . ., в гильбертовом пространстве L2 с мерой F (άλ) на отрезке —π <ζ λ ^ π. Пусть Нх (ή) есть замкнутая линейная оболочка всех χ (s), s ^ п, ихп (t) — наилучшее приближение для χ (t) функциями из Нх (п); регулярность означает, что £п (0 -* 0 при η -* — оо. Широко известный результат работы № 27 состоит в установлении следующего критерия регулярности: F (άλ) абсолютно непрерывна и плотность / (λ) = F (άλ)/άλ удовлетворяет условию π \ log / (λ) άλ> - с». (*) —π Общей моделью стационарной последовательности является s(i)= Utx{% ί=0,±1,.· ., π где Ut = \ e Ε (άλ) — группа унитарных операторов в гильбертовом про- —π 1 Непосредственно задачи прогнозирования рассматриваются в другой работе А. Н. Колмогорова: Интерполирование и экстраполирование стационарных случайных последовательностей.— Изв. АН СССР. Сер. мат., 1941, т. 5, с. 3— 14 (см. № 28 наст. изд.).
Стационарные последовательности (Ю. А- Розанов) 487 странстве. Подчиненность ей у (i), t = 0, +1, . . ., означает, что последовательность у получается из последовательности χ линейным преобразованием У № = ^χ(ί) с оператором Л = С, φ (λ)Ε (άλ) в Ях = Ηχ (οο). Неожиданным и удивительным здесь оказывается то, что указанная линейная зависимость у и χ может быть выражена в терминах их кор· реляционной зависимости (ранее в этом роде был известен лишь тривиальный факт о линейной зависимости случайных величин χ и у с коэффициентом корреляции 1). Описание спектральной структуры подчиненных последовательн@стей дает,- в частности, спектральное описание циклических подпространств для унитарной группы Ut в пространстве Нх. Особую роль играют подчиненные последовательности у с условием не- упреждаемости Ну (ί) С Нх (ί), для которых, в частности, попутно решается вопрос о том, когда Ну (0) = Нх (0). Решение этого вопроса, например, для χ (ί) = еш в L2 с F (άλ) = άλ следующее: равенство Ну (0) = Нх (0) справедливо тогда и только тогда, когда v w;= «шч> (λ), где φ (λ) есть так называемая внешняя функция известного аналитического класса Я2 = Нх (0) (в самой работе № 27 φ(λ)=3 viU = r(e-*) —οο определяется условием Г (ζ) φ 0, | ζ | < 1). Нужно сказать, что многие вопросы для класса Я2 легко решаются в рамках предложенной в № 27 схемы подчиненных последовательностей (и процессов). Скажем, так обстоит дело с известным вопросом об инвариантных подпространствах в Я2, а именно: каждое инвариантное относительно умножения на е подпространство Я С Я2 = Нх (0) есть Я = Ну (0) для надлежащей регулярной подчиненной π оследовательности у (t) = *ш<р (λ), φ s Я2, и Я = я|)Я2, где так называемая внутренняя функция ψ е Я2 задает фундаментальную для г/ последовательность и (ί) = ^ψ (λ)
488 Комментарии со спектральной плотностью 1/2π = | ψ (λ) |2. Связанные с работой № 27 исследования подробно освещены, например, в монографиях [1—5]. Укажем лишь на некоторые из них. Нужно отметить, что работа № 27, по-видимому, на какое-то время оставалась неизвестной многим специалистам, занимавшимся в 40-х годах близкими к ней вопросами, и в связи с этим прежде всего следует упомянуть работы Винера по фильтрации стационарных процессов. Здесь же можно было бы упомянуть проблему Бёрлинга, касающуюся «сдвигов» в аналитическом классе Я2, и др. Непосредственное обобщение условия регулярности (*) на стационарные процессы с непрерывным временем было дано в 1949 г. Крейном в форме С lQg/W ,ft>~oo. J 1 + λ* —оо Позднее Крейном была обнаружена связь задачи прогнозирования и обратной спектральной задачи для уравнения струны. Непосредственное обобщение критерия регулярности на невырожденный многомерный случай было дано в 1941 г. Засухиным в форме π log det / (λ) άλ ]> — οο. —π Важные для приложений задачи прогнозирования процессов с рациональным спектром рассматривались Ягломом. Условие регулярности в общем случае равносильно тому, что спектральная плотность / (λ) допускает факторизацию / (λ) = (1/2π) φ (λ) φ (λ), где φ (λ) есть операторная функция соответствующего аналитического класса Н2. Задача факторизации матричных (операторных) функций / (λ) решалась Розановым, Винером и Мазани, Матвеевым и др. В частности, Лаке показал, что в бесконечномерном случае даже очень сильный вариант обобщения условия (*) в форме π [ log / (λ) άλ > - с/ —π (где с > 0 есть постоянная, а / — единичный оператор) еще не гарантирует требуемую регулярность / (λ). Общий критерий регулярности был предложен Розановым. ЛИТЕРАТУРА 1. Розанов Ю. А. Стационарные случайные процессы. М.: Физматгиз, 1963. 2. Гофман К. Банаховы пространства аналитических функций/Пер. с англ. М.: Изд-во иностр. лит., 1963. 3. Секефалъви-Надъ Б., Фояш Ч. Гармонический анализ операторов в гильбертовом пространстве. М.: Мир, 1970. 4. Розанов Ю. А. Теория обновляющих процессов. М.: Наука, 1974. 5. Dym Я., McKean H. P. Gaussian processes, function theory and inverse spectral problems. New York: Acad. Press, 1976.
Стационарные процессы (В. А. Статулявичус) 489 СТАЦИОНАРНЫЕ ПРОЦЕССЫ (к № 48) (В. А. Статулявичус) Авторы статьи решают задачу, когда для гауссовского стационарного процесса X (t) выполняется введенное Розенблаттом [1] условие сильного перемешивания (с. п.). В статье доказывается, что в данном случае функция сильного перемешивания α (τ) эквивалентна максимальному коэффициенту корреляции ρ (τ) (α (τ) <ζ ρ (τ) <ζ 2πα (τ)) и находят представление (4) для р (τ) через спектральную плотность процесса / (λ), которая в силу условия с. п. существует. Таким образом задача решается полностью. Например, в случае целочисленного времени процесс Xt обладает свойством с. п. тогда и только тогда, когда ρ (τ) = sup ν ν(λ)-6-**ρ(θ*·)) -L.1 -ο / (Α) ||οο при τ —» οο, где sup берется по всем односторонним тригонометрическим полино- т мам ρ (ί?ιλ) = 2 cte%tlt (*ra > 0) и || · Ц^ является нормой ess sup. Отсюда сле- *=о дует, что если / (λ) непрерывная, / (—π) = / (π) и везде, кроме, может быть, нуля, ограниченная, то Xt обладает свойством с. п. Ибрагимов [2] получил дальнейшие результаты о форме / (λ), при которой для Xf выполняется условие с. п> Хельсон и Сарасон [3] заново пересмотрели эту проблему как вопрос гармонического анализа. Получены также обобщения для функций Xt со значениями в пространстве матриц [6]. В случае случайного блуждания на компактной абе- левой группе Розенблатт [4] показал, что стационарный процесс обладает свой* ством с.п. тогда и только тогда, когда supli^-O (η-, οο), /11 II/На где Τ — оператор перехода случайного блуждания. А. Н. Колмогоровым также была поставлена задача о нахождении эффективного критерия полной регулярности гауссовского стационарного процесса, которая решалась Волконским и Розановым [7,]. Ученик А. Н. Колмогорова Леонов [8] исследовал разные свойства перемешивания случайных процессов с помощью старших семиинвариантов, ЛИТЕРАТУРА 1. Rosenblatt Μ. A central limit theorem and a strong mixing condition.— Proc Nat. Acad. Sci. USA, 1956, vol. 42, p. 43-47. 2. Ибрагимов И. А. О спектральных функциях некоторых классов стационарных гауссовских процессов.— ДАН СССР, 1956, т. 137, с. 1046—1048. 3. Helson Я., SarasonD. Past and future.— Math, scand., 1967, bd 21, s. 5—16. 4. Rosenblatt M. Markov processes. Structure and asymptotic behaviour. Berlia etc.: Spring.-Verl., 1971. 5. Розанов Ю. А. Стационарные случайные процессы. М.: Физматгиз, 1963.
490 Комментарии 6. More I. H., Page L. В. The class w of operator valued weight functions.— J. Math. Mech., 1970, vol. 19, p. 1011—1017. 7. Волконский В. #., Розанов Ю. А. Некоторые предельные теоремы для случайных функций. I. П.— Теория вероятностей и ее применения, 1959, т. 4, № 2, с. 186-207;' 1961, т. 6, № 2, с. 202-214. 8. Леонов В. П. Некоторые применения старших семиинвариантов к теории стационарных случайных процессов. М.: Наука, 1964. СТАТИСТИКА ПРОЦЕССОВ (к № 50) (А. Н. Ширяев) ' В данной работе методом максимального правдоподобия были построены оценки %Т и сог для параметра λ (коэффициента затухания) и ω (частоты) в комплексном стационарном гауссовско-марковском процессе. Оказалось, что нормированное отношение ωτ — ω не зависит от ω и λ и является в точности нормально распределенным с параметрами 0 и 1 (когда а = 1). По поводу доказательства этого интересного факта (не приведенного в работе) см. статью [1] и монографию [2, гл. 17, § 4]. Комментируемая работа представляет интерес и с той точки зрения, как А. Н. Колмогоров физически поставленную задачу (в данном случае задачу изучения перемещений оси вращения Земли) переводит на строгий язык статистики случайных процессов и, основываясь на результатах относительно плотностей одних мер по, другим для процессов диффузионного типа, находит оценки рассматриваемых параметров. В настоящее время статистика процессов диффузионного типа представляет большую главу статистики случайных процессов. Значительная часть монографии [2] посвящена статистике именно таких процессов. В частности, в ней рассмотрена и задача комментируемой работы, а также ряд родственных задач. ЛИТЕРАТУРА 1. Новиков А. А. Последовательное оценивание параметров диффузионных процессов.— Теория вероятностей и ее применения, 1971, т. 16, *« -, с. 394—396. 2. Липцер Р. Ш., Ширяев А. Н. Статистика случайных процессов. М.: Наука, 1974.
Спектральная теория стационарных процессов (А. И. Яглом) 49$ СПЕКТРАЛЬНАЯ ТЕОРИЯ СТАЦИОНАРНЫХ ПРОЦЕССОВ (к № 34) (А. М. Яглом) Опубликованная в 1947 г. статья № 34 А. Н. Колмогорова представляет «собой первый в мире популярный обзор спектральной теории стационарных случайных процессов — одного из важнейших разделов математической теории случайных функций, разработанного лишь незадолго до того (при активном участии самого А. Н. Колмогорова) и в то время мало кому известного за пределами узкого круга специалистов. Отметим, что за рубежом первый аналогичный обзор указанной теории появился лишь на два года позже (см. [1]); в настоящее же время только на русском языке этой теории посвящена научная монография [2], сравнительно элементарная книга [3] и большие разделы во множестве учебных руководств (см., например, [4—7]). А. Н. Колмогоров начинает свой обзор с изложения классических результатов А. Я. Хинчина [1] х, впервые давшего определение стационарного случайного процеса ξ (t) и доказавшего, что его корреляционная функция В (τ) = = Μ {ξ (t + τ) ξ (£)} всегда может быть представлена в виде интеграла Фурье— Стилтьеса (см. формулу (£)/ относящуюся к несколько более^ общему j случаю многомерного процесса ξ (t) = {ξχ (ί), ξ2 Μι · · ·» £s (t)}); однако основное внимание он уделяет вопросу об обосновании возможности представления в виде интеграла Фурье—Стилтьеса вида (4) самого стационарного процесса ξ (t) и о физическом смысле такого представления. Автор отмечает, что спектральное представление (4) может быть легко выведено из известной теоремы функционального анализа о спектральном разложении однопараметрических групп унитарных операторов в гильбертовом пространстве и что впервые такой его вывод был указан в 1940 г. в работах [£, 7]; однако ради простоты он не останавливается на том обстоятельстве, что фактически в этих работах была решена сразу более общая (и более сложная) задача о спектральном представлении не просто стационарных процессов, а более широкого класса процессов со стационарными приращениями. Случайный процесс ξ (ή называется процессом со стационарными приращениями (в широком смысле), если при любых £, τ, s, τχ и τ2 математические ожидания Μ{ξ(ί + τ)- ξ(ί)}=α(τ), _ _ (1) Μ {[ξ (t + * + %г) -l(t+ s)][l (t + τ.) - ξ (t)]} = D (,; χΐ9 τ2) существуют и не зависят от t. (Ясно, что любой стационарный в широком смысле процесс всегда является также и процессом со стационарными приращениями, но процесс со стационарными приращениями, вообще говоря, может и не быть стационарным.) Из результатов работы А. Н. Колмогорова [6] 2 вытекает, в част- 1 Номера в квадратных скобках, набранные курсивом, относятся к списку литературы к статье А. Н. Колмогорова. Номера в круглых скобках, набранные курсивом, означают, что речь идет о соответствующей формуле статьи № 34. 2 Содержащиеся в [6] результаты, относящиеся к геометрии гильбертова пространства, были чуть позже независимо получены также Нейманом и Шенбергом [8], не заметившими, однако, что эти же результаты могут быть одновремен-
492 Комментарии ности, что каждый процесс со стационарными приращенжями ξ (t) допускает спектральное представление вида оо 5(f) = ξ (βΛ'-1)ίΦ(λ) + ξο + ξι*, (2) — ОО где ξο, ίι — случайные величины, а случайная функция Φ (λ) такова, что ее при5- ращения Φ (Δ^) = Φ (λ^) — Φ (λ^) и Φ (Δ^) = Φ (λ^) — Φ (λ^) на непересекающихся интервалах Δλ = [λ^, λ^] и Δλ = [λ^, λχ] некоррелированы между собой (т. е. Μ {Φ (Δ^) φ (Δ^)} = 0), а задаваемая равенством Μ {| Φ (Δλ) |2} = = F (Δλ) вещественная монотонно неубывающая функция F (λ) аргумента λ при любом ε >» 0 удовлетворяет условию -ε ε оо С dF (λ) + \ λ2^ (λ) + [ dF (λ) < оо. (3) —оо —ε ε В частном случае стационарного процесса ξ (t) (рассматривавшемся, в предположении, что время t дискретно, в частности, в работах А. Н. Колмогорова {4, 5\) ξχ = 0 и, кроме" того, должно уже выполняться не только условие (3), но и более ограничительное условие оо . ξ «№(λ)<οο. (4) —оо оо В таком случае, очевидно, \ άΦ (λ) = ξ^ — это случайная величина конечной —оо дисперсии; поэтому формулу (2) здесь можно переписать в виде оо ξ(ί)= £ ешаФг(Х) ОО (где Фх (λ) = Φ (λ) + (ξ0 — Iq) Κ (λ), а К (λ) — это «функция скачка», равная 0 при λ < 0 и 1 при λ ;> 0). Таким образом в приложении к стационарным процессам мы снова приходим к формуле (4) и к результатам, изложенным (в применении к многомерному процессу ξ (*)) в статье № 34 А. Н. Колмогорова. Спектральная теория случайных процессов со стационарными приращениями, развитая в работах [#, 7], может быть перенесена также на еще более общий класс случайных процессов ξ (ί), имеющих стационарные приращения некоторого порядка η > 1 (см. [9, 10], где можно найти также и точное определение зтого класса случайных процессов). Для таких процессов спектральное представление имеет вид оо ξ(ί)= J j>( -1 _ ш - ... - {^1 ] <*φ(Μ + ξο + Ы + ... + lntn, —оо (5) но истолкованы и как некоторые факты, касающиеся случайных процессов ξ (t) со стационарными приращениями.
Спектральная теория стационарных процессов (А. М. Яглом) 493 где ξα, ξΐ7 . . ., ξη — случайные величины, и приращения случайной функции φ (λ) на непересекающихся интервалах Αχ и Δ^ снова некоррелированы между собой, в то время как функция F (λ), определяемая равенством Μ {| φ (Δλ) |2} = = F (Δλ), при любом ε > 0 удовлетворяет условию —ε ε οο С dF (λ) + С K2ndF (λ) + [ dF (λ) < οο. (6) —οο —ε ε Формулы, описывающие спектральные представления процессов со стационарными приращениями некоторого порядка, могут быть просто выведены, в частности, из результатов, относящихся к совсем другому обобщению понятия стационарного случайного процесса, а именно из спектральной теории обобщенных стационарных случайных процессов. Обобщенным случайным процессом, по аналогии с получившим широкое распространение в современном анализе понятием обобщенной функции, называется случайный линейный функционал ξ (φ) (т. е. линейный функционал, значения которого являются случайными величинами), заданный на некотором линейном пространстве D «хороших» (т. е. достаточно гладких) функций φ = φ (t) — скажем, на введенном Л. Шварцем пространстве D^ бесконечно дифференцируемых функций, каждая из которых тождественно обращается в нуль вне некоторого конечного интервала (только случай такого пространства D = D^ и будет рассматриваться ниже). Ясно, что обыкновенному случайному процессу ξ (t) всегда можно сопоставить обобщенный процесс оо ξ(φ)= J ξ(ί)φ(ί)Λ; (7) —οο с этой точки зрения обыкновенные случайные процессы могут считаться частными случаями процессов обобщенных. В принципе, однако, могут существовать и обобщенные процессы ξ (φ), для которых не существуют «значения в точке» ξ (t) (т. е. такие, что ξ (φ) не может быть описано формулой вида (7)); типичным примером такого процесса ξ (φ) является, в частности, часто встречающийся в различных приложениях процесс «белого шума». Обобщенные случайные процессы были введены в рассмотрение в работах [И, 12] (см. также [13, гл. III]). В [11—13] было определено также понятие стационарного (в широком смысле) обобщенного случайного процесса ξ (φ) и была развита спектральная теория таких ξ (φ). Для определения обобщенных стационарных процессов надо только рассмотреть действующую в D операцию Τχι задаваемую равенством Τχ(ρ (t) = φ (t + τ), а затем потребовать, чтобы при любом τ для ξ (φ) выполнялись условия Μ{ξ(2-τφ)}_=Μ{ξ(φ)}, Μ{ξ(ΓτΦι) Ι (Γτφ2)} = Μ {ξ (Φι) ξ(φ2).}. <8) Будем для простоты считать, что Μ {ξ (φ)} = τη (φ) = 0 при всех φ; в таком случае стационарные обобщенные случайные процессы | (φ) будут допускать снектральное представление вида оо ξ(φ)= ξ ψ(λ)άφ(λ), (9)
494 Комментарии где φ (λ) = V eiKtcp (t) dt — преобразование Фурье функции φ (ί), а случайная» —оо функция Φ (λ) обладает теми же свойствами, что и функция Φ (λ), фигурирую* щая в спектральном разложении (4) обыкновенного стационарного случайного процесса ξ (t) с той лишь разницей, что теперь уже функция F (λ) такая, что Μ {| Φ (Δλ) 12} = F (Δλ), будет удовлетворять условию при некотором целом т ^ 0 (в случае обыкновенных^стационарных процессов оо ξ (t) всегда \ dF (λ) < оо, т. е. т = 0). Легко видеть, что в частном случае,. —оо когда процесс ξ (φ) является обыкновенным (т. е. задается формулой (7)), из фор* мулы (9) сразу же выводится и более обычное спектральное представление прс» цесса {l (t) вида (4). Обобщенные случайные процессы кое в чем являются более простыми, чем процессьГобыкновенные; в частности, в то время как обыкновенный случайный процесс ξ (t) будет иметь производную dl·, (t)ldt = \' (ή лишь при некоторых специальных условиях, обобщенный процесс ξ (φ) всегда дифференцируем, причем его производная ξ' (φ) определяется равенством: ξ' (φ) = — ξ (φ') (если процесс со ξ (φ) задается формулой (7) и ξ' (t) существует, то, очевидно, ξ' (φ) = \ l'(t) <p(t)dt)9 —со Дифференцируемость обобщенных процессов позволяет определить обобщенный случайный процесс со стационарными приращениями данного порядка п просто как процесс ξ (φ) (вообще говоря, нестационарный), п-я производная &п^ (φ) которого является уже обобщенным стационарным процессом. Это определение позволяет легко вывести из формул (9) и (10) общее спектральное представление обобщенных случайных процессов со стационарными приращениями порядка пу охватывающее формулы (5) и (6) в качестве частного случая (относящегося к процессам ξ (φ) вида (7)). Еще одно обобщение спектрального представления стационарного случайного процесса ξ (ή в виде интеграла Фурье—-Стилтьеса (4) касается однородных случайных полей в многомерных пространствах i?n, т. е. родственных стационарным процессам случайных функций ξ (χ), χ = (xl9 . » ., xn) e Rn^ многих переменных. Случайное поле ξ (χ), χ s F, называется однородным (в широком смысле), если при любом г e|i?n Μξ (χ + г) = Μξ (χ), Μξ (Χι + г) ξ (χ2 + г) = Μξ (Χ])ξ (хг) (И) (так что Μ ξ (χ) = const, Μξ (χ2) ξ (χ2) = В (хг — χ2)); оно допускает спектральное представление вида ξ (χ) = J eikx<b (Λ), (12) Rn
Спектральная теория стационарных процессов (А. М. Яелом) 495 :где Φ (Ак) — случайная функция n-мерного интервала Ак в пространстве векторов к, значения которой на непересекающихся интервалах Акх и Ак2 являются некоррелированными, а функция F (Ак) = Μ {| Φ (Δк) |2} интегрируема по всему пространству (так что \ F (dk) <oo). Заметим, что, сославшись на работу А. Н. Колмогорова [6], спектральное разложение (12) однородного случайного поля ξ (χ) еще в 1941 г. использовал Обухов [14, 15] в своих важных работах по статистической теории турбулентности; в настоящее время строгое доказательство этой формулы и некоторых ее обобщений (касающихся, в частности, полей с однородными приращениями, а также обобщенных однородных полей) может -быть найдено, например, в [16] (см. также [13, § III.5]). Ряд дальнейших примеров «обобщенных спектральных представлений» различных классов случайных функций, родственных представлению стационарных случайных процессов | (t) в виде интеграла Фурье—Стилтьеса (4), указан, в частности, в работах ?{17, 18]. Точная формулировка упомянутых А. Н. Колмогоровым результатов Засу- хина [13] и строгое доказательство этих результатов содержится в книге Розанова [2, гл. II]. По поводу современного изложения и дальнейшего развития выводов, содержащихся в упомянутой статье Слуцкого [14], см. Моран [19, 20], «а также Кендалл и Стьюарт [21, разд. 47.15]. ЛИТЕРАТУРА 1. Doob J. L. Time series and harmonic analysis.— In: Proc. (First) Berkeley Sympos. Math. Statist. Probab., 1949, p. 303—344. 2. Розанов Ю. А. Стационарные случайные процессы. М.: Физматгиз, 1963. 284 с. 3. Яглом А. М. Корреляционная теория стационарных случайных функций. Л.: Гидрометеоиздат, 1981. 280 с. 4. Дуб Дж. Л. Вероятностные процессы/Пер. с англ. М.: Изд-во иностр. глит., 1956. 605 с. 5. Вентцелъ А. Д. Курс теории случайных процессов. М.: Наука, 1975. 319 с. 6. Гихман И. И., Скороход А. В. Введение в теорию случайных процессов. 2-е изд. М.: Наука. 1977. 567 с. 7. Гихман И. И., Скороход А. В. Теория случайных процессов. М.: Наука, 1971. Т. 1. 664 с. 8. Neumann J. von, Schoenberg I. J. Fourier integrals and metric geometry.— Trans. Amer. Math. Soc, 1941, vol. 50, N 2, p. 226—251. 9. Яглом А. М. Корреляционная теория процессов со случайными стационарными гс-ми приращениями.— Мат. сб., 1955, т. 37, № 1, с. 141—196. 10. Пинскер М. С. Теория кривых в гильбертовом пространстве со стационарными д-ми приращениями.— Изв. АН СССР. Сер. ъ ат., 1955, т. 19, № 5, с. 319-345. 11. Гелъфанд И. М. Обобщенные случайные процессы.— ДАН СССР, 1955, т. 100, № 5, с. 853—856. 12. Но К. Stationary random distributions.— Mem. Coll. Sci. Univ. Kyoto (A), 1954, vol. 28, N 3, p. 209—223. Рус. пер.: Математика, 1957, т. 1, № 3, с. 139—151. 13. Гелъфанд И. М.у Виленкин Н. Я. Некоторые применения гармонического анализа. Оснащенные гильбертовы пространства. М.: Физматгиз, 1961. 472 с. 14. Обухов А. М. О распределении энергии в спектре турбулентного потока.— ДАН СССР, 1941, т. 32, № 1, с. 22-24.
496 Комментарии 15. Обухов Л. Μ. О распределении энергии в спектре турбулентного потока.— Изв. АН СССР. Сер. геогр. и геофиз., 1941, т. 5, № 4/5, с. 453—466. 16. Яглом А. М. Некоторые классы случайных полей в д-мерном пространстве, родственные стационарным случайным процессам.— Теория вероятностей и ее применения, 1957, т. 2, № 3, с. 292—338. 17. Karhunen К. Uber lineare Methoden in der Wahrscheinlichkeitsrechnung.- Ann. Acad. sci. fenn. A, 1947, vol. 1, N 37, p. 3—79. 18. Яглом А. М. Спектральные представления для различных классов случайных функций.— В кн.: Тр. 4-го Всесоюз. мат. съезда, М.: Изд-во АН СССР, 1963, т. 1, с. 250—273. 19. Moran P. A. P. The spectral theory of discrete stochastic processes.— Bio- metrika, 1949, vol. 36, N 1, p. 63—70. 20. Moran P. A. P. The oscillatory behaviour of moving averages.— Proc. Cambridge Phil. Soc, 1950, vol. 46, N 2, p. 272—281. 21. Кендалл М. Дж., СтъюартА. Многомерный статистический анализ и временные ряды /Пер. с англ. М.: Наука, 1976. 736 с. СПЕКТРАЛЬНОЕ ПРЕДСТАВЛЕНИЕ СЛУЧАЙНЫХ ПРОЦЕССОВ (к № 47, 49) (Ю. Г. Баласанову И. Г. Журбенко) Обозначим Т^ класс случайных процессов ξ (£), для которых Μ | ξ (t) |P < Ck < оо, а £^) __ класс процессов ξ (t) e T^k) и таких, что для всех 1 ^ I < ку — оо <С < τ < оо Μξ fo), ... ξ (Η) = Μξ ft + τ) . . . ξ (tt + τ). Тогда пример, построенный в комментируемой работе, показывает, что хотя £(2) с: Ф(?), но при к > 2 существуют процессы класса S(k\ не принадлежащие классу ф^. Вопрос о подходящем определении классов случайных процессов, для которых справедливо спектральное представление высших порядков, обсуждался в целом ряде последующих работ различных авторов. Отметим в первую очередь работу [1], где по предложению А. Н. Колмогорова вводятся и изучаются классы Δ(/Γ), определяемые как некоторые подклассы классов S(1i) Г) Ф№)· Для таких классов оказывается более естественным рассматривать не моментную спектральную меруЛ/^) (λ^. ., λκ) (определяемую соотношением (см. [1, 2, 9]) rhf (*i, . . ., tk) = Μξ (h). . .fjr(*fc) = J exp h 2 t3\\ Mf (d%u . . d\)} , а семиинвариантную спектральную меру F^^, . Λ, λ&) (определяемую соотношением (см. [1, 2, 9]) к ik) («ι,. · ·, h) = J exp U 2 t.\X if > (<Ulf .. ., ΛΛ), ~fr ^ о'—1 J
Спектральное представление (Ю. Г. Баласанов, И. Г. Журбенко) 497 тде •р " ■·> - & 1°м - {■ Σ * Ч L -„J В частности, классы Δ^ характеризуются тем, что при Η (t) e Δ(/ι") семиинвари- антные меры ^1г), 1 «ζ I < /с, абсолютно непрерывны относительно меры Лебега на множествах λχ + . . . + λ/ = 0 (mod 2π). Изучение классов Δ^) было затем продолжено в [2]. Обобщение классов Δ^) для векторных случайных процессов получено в [3]. Аналогичные вопросы для случайных полей рассматривались в [4J. Инициированные А. Н. Колмогоровым работы, в которых были определены и изучены классы Δ^, открыли серию исследований в новом направлении, называемом теорией и статистическим анализом старших спектров стационарных случайных процессов. Результаты этого направления носят в настоящее время фундаментальный характер и, кроме того, существенно используются для решения различных прикладных задач в астрономии, геофизике, при изучении турбулентности жидкости и газа и т. д. (см., например [5—8]). Фундаментальный вклад в дальнейшее развитие спектрального анализа старших порядков был сделан в работе [9], где был разработан математический аппарат старших моментов и семиинвариантов, необходимый во всех дальнейших исследованиях (см. [10, 11] и др.). Спектральная теория старших порядков для однородных случайных полей рассматривалась Ягломом [12—14]. Оценки сверху для старших спектральных плотностей и их производных в условиях различных видов перемешивания найдены в [11] и существенно используются при статистическом анализе. Многочисленные работы были посвящены построению и исследованию статистик старших спектральных плотностей (например, [15—17] и др.). Однако до недавнего времени все статистики обладали одним и тем же существенным недостатком; они позволяли построить оценку старшей семиинвариантной спектральной плотности не для всех значений аргумента. Хотя семиинвариантная плотность п-то порядка определена во всех точках вида λχ + . . . + λη = = 0 (mod 2π), предлагавшиеся статистики не давали никакого ответа на подмножествах λ}. + . . . + Kh„ =0 (mod 2л), 1 <ζ ki < η, i = 1, . . ., ρ, при ρ < п. 1 ρ Естественно, что вблизи указанных множеств возникала сильная неустойчивость статистических оценок. Недавно от этого недостатка удалось избавиться благодаря статистике, построенной методом сдвига по времени [18]. ЛИТЕРАТУРА 1. Ширяев А. Н. Некоторые вопросы спектральной теории старших моментов. L—Теория вероятностей и ее применения, 1960, т. 5, № 3, с. 293—313. 2. Леонов В. П., Ширяев А. Н. Некоторые вопросы спектральной теории старших моментов. II.— Теория вероятностей и ее применения, 1960, т. 5, № 4, с. 460—464. 3. Brillinger D. R. An introduction to polyspectra.— Ann. Math. Statist., 1965, vol. 36, p. 1351-1374.
498 Комментарии 4. Леоненко Η. Η. Некоторые вопросы спектральной теории старших моментов случайных полей.— ДАН УССР, 1975, № 9, с. 777—782. 5. Кузнецов П. И., Стратонович Р. Л., Тихонов В. И. Прохождение некоторых случайных функций через нелинейные системы.— Автоматика и телемеханика, 1963, т. 14, № 4. 6. Монин А. С, Яелом А. М. Статистическая гидромеханика. М.: Наука 1965. Т. 1. 7. Монин А. С, Яелом А. М. Статистическая гидромеханика. М.: Наука 1967. Т. 2. 8. Brillinger D. R. Identification of polynomial systems by polyspectra.— J Sound and Vibr., 1970, -vol. 2, N 3, p. 301—313. 9. Леонов В. П., Ширяев Α. Η. Κ технике вычисления семиинвариантов.— Теория вероятностей и ее применения, 1959, т. 4, № 3, с. 342—355. 10. Леонов В. П. Некоторые применения старших семиинвариантов к теории стационарных случайных процессов. М.: Наука, 1964. 11. Журбенко И. Г. Спектральный анализ временных рядов. М.: Изд-во МГУ, 1982. 12. Яглом А. М. Некоторые классы случайных полей в д-мерном пространстве,, родственные стационарным случайным процессам.— Теория вероятностей и ее применения, 1957, т. 2, № 3, с. 292—338. 13. Yaglom A. M. An introduction to the theory of stationary random functions. Englewood Cliffs: Prentice-Hall, 1962. 14. Yaglom A. M. Second-order homogeneous random fields.— In: Proc. Fourth. Berkeley Sympos. Math. Statist. Probab., 1961, p. 593—622. 15. Rosenblatt Μ. Α., Van Ness J. S. Estimation of the bispectrum.— Ann. Math. Statist., 1965, vol. 36, p. 1120—1136. 16. Brillinger D.R., Rosenblatt M.A. Asymptotic theory of estimates of &-th order spectra.— In: Advances Seminar on Spectral Analysis of Time Series. New York: J. Wiley, 1967, p. 189—232. 17. Журбенко И. Г., Труш Η. Η. Об оценке спектральных плотностей стационарных процессов.— Литов. мат. сб., 1979, т. 19, № 1, с. 65—82. 18. Журбенко И. Г. Статистическое оценивание старших спектров.— Теория вероятностей и ее применения, 1985, т. 30, № 1, с. 66—77. БРОУНОВСКОЕ ДВИЖЕНИЕ (к № 14, 19, 24) (А. Μ. Яглом) Статьи № 14, 19, 24 непосредственно примыкают к важным работам № 9, 17, в основном посвященным общей теории непрерывных марковских («стохастически определенных» по терминологии А. Н. Колмогорова) случайных процессов. Такого рода процессы, начиная с известных работ Эйнштейна и Смолухов- ског [1, 2], очень широко применяются в физике для описания броуновского движения как отдельных частиц, так и систем со многими степенями свободы; напомним в этой связи, что к некоторым выводам работы № 9, как оказалось, еще раньше пришли физики Фоккер и Планк, исследовавшие броуновское движение. Естественно было ожидать поэтому, что также и результаты работы № 17 могут быть непосредственно приложены ко многим; задачам, касающимся броуновского движения. Некоторые" конкретные примеры таких приложений как раз и содержатся в работах № 14, 19, 24. Наиболее физический характер из трех последних работ имеет написанная в соавторстве с М. А. Леонтовичем статья Яг 14, напечатанная в физическом жур-
Броуновское движение (А. М. Яглом) 499 нале. В этой статье решается следующая задача теории броуновского движения, поставленная перед авторами С. И. Вавиловым: найти среднее значение Ε (F) площади F, покрываемой на плоскости (х, у) за данное время t проекцией сферической частицы фиксированного радиуса σ, совершающей броуновское движение. Опираясь на уравнения в частных производных для плотности вероятности перехода многомерного непрерывного марковского процесса, найденные в работе № 17, авторы получают для Ε (F) весьма точную асимптотическую формулу (пригодную при Dt/ο2 ^> 1, где D ■— соответствующий коэффициент диффузии, который в силу результатов Эйнштейна [1, 2] для сферической частицы радиуса «σ, погруженной в жидкую или газообразную среду вязкости μ, при абсолютной температуре Τ задается соотношением D = kQT/6nou, где к0 — постоянная Больцмана). Отметим, что приведенное в статье решение задачи опирается на содержащийся там же следующий важный результат. Обозначим через PL (x, у; t) вероятность того, что частица, находящаяся в момент t = 0 в точке (я, у) и совершающая броуновское движение в двумерной плоскости (случай броуновского движения в д-мерном пространстве, разумеется, при любом η может быть разобран совершенно аналогично), за данное в^емя t хоть один раз пересечет границу Г заданной области G (содержащей точку (#, у)) и притом так, что первое пересечение придется на заданную часть L всей границы Г (где L может, конечно, и совпасть с Г). В таком случае PL (x, у; t) будет удовлетворять определенному уравнению в частных производных («первому уравнению А. Н. Колмогорова», см. уравнение (14)), а также условиям: PL (χ, у; 0) = 0 для любой внутренней точки (х, у) области G, PL (χ, у; t) —> 1 при любом t > 0, когда точка (х, у) стремится к какой-либо точке части L границы Г, и PL (χ, у; t) —» 0 при ί>0π точке (χ, у), стремящейся к точке границы Г, не входящей в L; эти уравнения и условия уже однозначно задают функцию PL (x, у; t). Ясно, что указанный общий вывод представляет значительный интерес и вне зависимости от конкретной задачи броуновского движения, решаемой в статье № 14; он был одновременно с авторами данной статьи получен также Понтрягиным, Андроновым и Вит- том [3], и в настоящее время этот и некоторые родственные ему результаты широко используются во многих приложениях и вошли в ряд учебных руководств см., например, [4, § 30; 5, § 1.4; 6, §§ 26, 27]). Значительно более общий вопрос теории броуновского движения разбирается А. Н. Колмогоровым в небольшой заметке №19. Как хорошо известно, в классической теории броуновского движения, развитой Эйнштейном и Смолухов- ским [1, 2], пренебрегается инерцией броуновской частицы,, т. е. фактически предполагается, что масса этой частицы равна нулю. В связи с этим броуновская частица в теории Эйнштейна и Смолуховского не имеет конечной скорости; так, например, в частном случае броуновского движения свободной частицы Винером было строго доказано (см. [7, гл. IX]), что броуновская траектория с вероятностью 1 является непрерывной, но нигде недифференцируемой кривой. Отметим еще, что в приближении Эйнштейна и Смолуховского моделью броуновского движения физической системы является непрерывный марковский процесс в пространстве ее координат (в случае движения свободной частицы — ви- неровский случайный процесс).
5СЮ Комментарии Ясно, что недифференцируемость броуновских траекторий в теории Эйнштейна — Смолуховского тесно связана с вводимой здесь идеализацией (пренебрежением инерцией), делающей соответствующую теорию непригодной для анализа движения на очень малых интервалах времени Δί. В применении к простейшему случаю броуновского движения свободной частицы уточненная теория?, учитывающая уже и инерцию частицы, была в 1930 г. развита Уленбеком и Орнштейном [8] (см. также Дуб [9] и Чандрасекар [10, гл. II]); в этой уточненной теории траектории частиц оказываются уже дифференцируемыми (но не имеющими второй производной, так что теперь бесконечным оказывается ускорение частицы). Фактически тому же обобщению классической теории броуновского движения посвящена и статья № 19, где, однако, уже рассматривается не частный случай движения одной свободной частицы, а общий случай броуновского движения произвольной физической системы с η степенями свободы. Учет инерции, согласно А. Н. Колмогорову, достигается просто тем, что состояние системы теперь считается задающимся значениями η коодинат qly. . ., qn и η их производных по времени (скоростей) qx, . . ^ qn; в качестве же модели броуновского движения здесь используется непрерывный марковский процесс в 2п- мерном фазовом пространстве координат и скоростей. Основное уравнение для плотности вероятности перехода такого марковского процесса (уравнение (9) работы № 19) оказывается в данном случае вырожденным уравнением параболического типа (так как его правая часть содержит только вторые производные по скоростям, но не по двум координатам или координате и скорости); математическая теория таких уравнений начала разрабатываться вскоре после появления работы № 19 учеником А. Н. Колмогорова Пискуновым [11]. Теория Уленбека и Орнштейна одномерного броуновского движения свободной частицы получается из общей теории Колмогорова в частном случае, когда η = 1 (так что основное уравнение теории приобретает вид (10), см. работу № 19), / = = — ocq (где а — β/m, т — масса частицы, β — коэффициент при силе вязкого трения, равный 6πσμ для сферической частицы радиуса σ), а к = const = = koT/mfi. Наконец, статья № 24 посвящена интересному вопросу о смысле и условиях статистической обратимости броуновского движения. Хорошо известно, что процессы броуновского движения (или диффузии) в термодинамическом смысле являются необратимыми — при наличии большого числа диффундирующих частиц эти процессы практически всегда приводят к выравниванию распределения имеющихся частиц при возрастании времени £, в то время как при убывании t неоднородность распределения возрастает. По-видимому, Шредингер [12] первым обратил внимание на то, что на самом деле существенную роль здесь играет наличие определенного начального условия в момент t = 0 и всегда принимаемого допущения о стремлении распределения частиц к равномерному (в общем случае — к некоторому стационарному эргодическому распределению) при t —* оо, в то время как относительно поведения процесса при t —* — оо обычно никаких предположений не делается. В связи с этим он рассмотрел вопрос о процессе диффузии в течение интервала времени i0 < t < ίχ при условии, что фиксировано и начальное распределение вероятностей в момент t = f0, и конечное распределение в момент t = tly и указал, что при такой постановке задачи диффузия уже будет обладать определенной обратимостью. В частности, если до-
Броуновское движение (А. М. Яглом) 501 пустить, что диффузия происходит на конечном пространственном интервале (или в конечном объеме) и что как при t —» оо, так и при t —> — оо распределение вероятностей стремится к одному и тому же равномерному (т. е. стационарному и эргодическому) распределению, то тогда изменения распределения вероятностей при t0 <ζ t < оо и при — оо < t *ζ £0, отвечающие заданному значению распределения в момент ί0, будут описываться совершенно одинаковыми соотношениями, т. е. диффузия здесь будет строго обратима во времени. Шредингер рассмотрел в своей статье лишь простейшую одномерную диффузию, описываемую уравнением диффузии с постоянным коэффициентом D. В ра_ боте же № 24 А. Н. Колмогорова изучен общий случай произвольного гс-мерного броуновского движения, описываемого непрерывным марковским случайным процессом на некотором гс-мерном многообразии R координат (хг, . . ., хп) = χ физической системы. Если для этого марковского процесса при всех t задана «абсолютная (безусловная) плотность вероятности» р (х), являющаяся строго положительной плотностью стационарного распределения вероятностей (в случае, когда существует эргодическое распределение, именно его естественно принять за ρ (χ)), то тогда наряду с обычной плотностью вероятности перехода из заданного состояния в момент t = t0 в какое-то фиксированное состояние в момент t = = h > *о можно определить также и «обратную плотность вероятности перехода» — условную плотность вероятности состояния в момент t = t0 при условии, что задано состояние в более поздний момент t = ίχ> ί0; после этого естественно поставить вопрос о необходимых и достаточных условиях, при которых эти две плотности вероятности перехода равны друг другу. Такие необходимые и достаточные условия и найдены в работе <Ν° 24; при их выводе используется полученная тут же инвариантная тензорная форма указанных в работе № 19 общих уравнений для плотности вероятности перехода гс-мерного марковского процесса, которая может быть полезной и вне связи с рассматриваемой задачей о статистической обратимости, а сами искомые условия оказались достаточно общими и, разумеется, выполняющимися и в том частном случае, который рассматривал Шредингер. Заметим, впрочем, что и в статье № 24 задача о статистической обратимости броуновского движения все же исследуется не в самом общем виде, так как здесь предполагается, что матрица || В10 (х) || коэффициентов при вторых производных в уравнении для плотности вероятности перехода является строго положительно определенной при всех х. В конце § 1 автор отмечает, что случай вырожденной матрицы || Вг3 (х) || на самом деле представляет значительный физический интерес, поскольку он возникает, в частности, при рассмотрении броуновского движения в фазовом пространстве координат и скоростей физической системы (см. статью № 19); однако тут же оговаривается, что в данной работе вырожденный случай рассматриваться не будет. Позже вопрос об условиях статистической обратимости броуновского движения в фазовом пространстве координат и скоростей был поставлен А. Н. Колмогоровым перед своим аспирантом — автором настоящего комментария. Само определение статистической обратимости в этом случае слегка отличается от определения, имеющегося в работе № 24, так как обращение движения физической системы требует изменения знака всех скоростей на обратный; это отличие (о котором см. [13]), однако, является достаточно- простым и оно мало что меняет. Для получения необходимых и достаточных ус-
502 Комментарии ловий статистической обратимости теперь снова следует переписать основные уравнения для вероятности перехода (уравнение (9) работы № 19 и сопряженное «му уравнение) в инвариантной тензорной форме (приобретающей особенно ясный физический смысл, если за коэффициенты метрической квадратичной формы в координатном пространстве принять коэффициенты квадратичной формы от скоростей, задающей кинетическую энергию системы). Ограничиваясь далее наиболее интересным случаем, когда коэффициенты при вторых производных по скоростям в уравнении для плотности вероятности перехода зависят только от координат, а силы, воздействующие на рассматриваемую систему, линейно зависят от скоростей, удается показать (см. [13]), что фактически для того, чтобы броуновское движение в фазовом пространстве было статистически обратимым, здесь надо лишь, чтобы соответствующее стационарное распределение вероятностей совпадало по форме с каноническим распределением Гиббса. Таким образом, в данном случае условие статистической обратимости оказывается имеющим ясный физический смысл. Перейдя далее к пределу, отвечающему стремлению к нулю инерции системы (т.е. стремлению к нулю всех коэффициентов квадратичной формы от скоростей, задающей кинетическую энергию), мы снова придем к модели Эйнштейна—Смолуховского броуновского движения как марковского процесса в пространстве одних лишь координат системы; при этом найденные в [13] условия статистической обратимости броуновского движения в фазовом пространстве в пределе снова переходят в условия статистической обратимости, найденные в работе № 24 А. Н. Колмогорова. Последнее обстоятельство проливает дополнительный свет на физический смысл этих последних условий. ЛИТЕРАТУРА 1. Эйнштейн Л., Смолуховский Μ. Броуновское движение / Сб. ст. Пер. с нем. М.; Л.: ОНТИ, 1936. 2. Эйнштейн А. Работы по теории броуновского движения.— В кн.: Эйнштейн А. Собр. науч. трудов. М.: Наука, 1966, т. 3, с. 75—91; 108—127; 149—151; 155-163. -3. Понтрягин Л. С, Андронов Α. Α., ВиттА. А. О статистическом рассмотрении динамических систем.— ЖЭТФ, 1933, т. 3, № 3, с. 165—180. 4. Свешников А. А. Прикладные методы теории случайных функций. 2-е изд. М.: Наука, 1968. 5. Тихонов В. И. Выбросы случайных процессов. М.: Наука, 1970. 392 с. 6. Тихонов В. И., Миронов М. А. Марковские процессы. М.: Наука, 1977. 7. Винер Η., Π эли Р. Преобразование Фурье в комплексной области / Пер. с англ. М.: Наука, 1964. 267 с. 8. Uhlenbeck G. Е., Ornstein L. S. On the theory of the Brownian motion.— Phys. Rev., 1930, vol. 36, p. 823—841. 9. Doob J. L. The Brownian movement and stochastic equations.— Ann. Math., 1942, vol. 43, N 2, p. 351—369. 10. Чандрасекар С. Стохастические проблемы в физике и астрономии / Пер. с англ. М.: Изд-во иностр. лит., 1947. ■11. Пискунов Ε. С. Краевые задачи для уравнения эллиптико-параболического типа.— Мат. сб., 1940, т. 7, с. 385—424. 12. Schrodinger E. Uber die Umkehrung der Naturgesetze.— Sitzungsber. Preuss. Akad. Wiss., phys.-math. Kl., 1931, 12. Marz, S. 144—153. 13. ЯгломА. Μ. О статистической обратимости броуновского движения.— Мат. сб., 1949, т. 24, с. 457—492.
Цепи Маркова со счетным числом состояний (А. А. Юшкевич) 503 ЦЕПИ МАРКОВА СО СЧЕТНЫМ ЧИСЛОМ СОСТОЯНИЙ (к № 23) (А. А. Юшкевич) Краткая заметка А. Н. Колмогорова [1] и ее расширенный вариант [2] (№ 23 наст, изд.) содержат основы теории счетных однородных цепей Маркова; эти работы положили начало систематическому изучению цепей Маркова со счетным и вообще бесконечным множеством состояний. Установленные Колмогоровым классификация состояний и асимптотика вероятностей перехода PW при η —» оо составляют неотъемлемую часть любого подробного изложения счетных цепей Маркова [5, 8, 12, 31, 39, 40]. В адаптированном виде эти результаты вошли в учебные руководства и для нематематиков. В названных работах А. Н. Колмогоров доказал, что: 1) счетное пространство Ε состояний подразделяется на множество несущественных состояний и классы существенных (сообщающихся между собой) состояний, а классы в свою очередь на периодические подклассы; 2) в пределах класса вероятность бесконечного числа возвращений одна и та же для всех состояний и равна либо 1 (возвратный класс), либо 0 (невозвратный класс); 3) в пределах класса среднее время возвращения Mjj или для всех состояний у конечно (положительный класс), или для всех состояний бесконечно (нулевой класс); 4) в непериодическом классе существует Km р№ = Mjl (1) причем в положительном классе сумма пределов равна 1; 5) как следствие в общем случае зависимость р№ от η является асимптотически периодической. В случае конечного Ε все классы возвратны и положительны; для этого случая разбиение пространства Ε на несущественные состояния, классы и подклассы и асимптотическую периодичность р№ независимо получил Дёблин [3] (существование не зависящих от ί пределов (1) для конечной цепи со строга положительными Р^, очевидно, состоящей из одного непериодического класса, установил еще Марков). Работы Колмогорова были продолжены во многих исследованиях. Эрдёш, Феллер и Поллард [4], желая «сделать более доступными результаты Колмогорова», доказали соотношение (1) как теорему восстановления, получившую затем ряд обобщений (см. [5, гл. XIII]). Феллер [5] впервые на уровне для начинающих изложил основы теории счетных однородных цепей Маркова, причем отметил,, что в положительном классе пределы (1) образуют единственное стационарное распределение1. Он же в [6] нашел ряд уточнений формулы (1), например выра- оо жение для ^ [Р{$ - Mjf) при конечном втором моменте М^$ времени возвра- о щения в /, а позднее в [7] дал новое доказательство теоремы восстановления. 1 Феллер начинает с классификации состояний на возвратные и невозвратные и в замечании о терминологии ошибочно приписывает тот же смысл колмо- горовским названиям существенные и несущественные состояния.
504 Комментарии Сарымсаков [8], воспроизведя классификацию Колмогорова, предложил матричный метод вычисления пределов (1), а также рассмотрел центральную предельную теорему для цепей со счетным пространством Ε и с Ε = [а, Ъ]. В случае нулевого класса, когда пределы в (1) равны 0, интересно сравнить между собой порядки стремления к 0 переходных вероятностей для разных состояний, а также сравнить далекие будущие распределения при различных начальных состояниях. Дёблин [9] установил, что в пределах одного класса всегда существует конечный отличный от 0 предел lim I (2) П-*оо п 1 (результат Дёблина в действительности важен для нулевого возвратного класса, так как в положительном классе он вытекает из (1), а в невозвратном классе — из сходимости рядов, получающихся заменой в (2) символа η на оо). Чжун [10] обнаружил, что в случае возвратного класса предел (2) равен μ^μ^1, где щ — среднее число попаданий в i на протяжении одной экскурсии из фиксированного состояния h в h, а Дерман [11] показал, что при тех же условиях μ = {μ$} является единственной с точностью до постоянного множителя σ-конечной инвариантной мерой на Е. Эти и примыкающие результаты подробно осветил в своей монографии [12] Чжун.] Ори [13] доказал, что в возвратном классе при разных начальных состояниях будущие распределения сближаются по вариации: n—oo ■ другое доказательство дали Блекуэлл и Фридман [14] (в положительном классе (3) сразу следует из результата 4) Колмогорова). Существенное усиление результата Дёблина о пределе (2) получили Кинг- ман и Ори [15], доказавшие «индивидуальную» предельную теорему для отношений: если в непериодическом возвратном классе 2^"'>ε Vi (4) 1 при некоторых N и ε > 0, то lim р{п+т) п-оо p'ff μ. Как заметил Молчанов [16], условие (4) равносильно более простому условию: pW > б Vt. Молчанов обобщил результат (5) на α-возвратные цепи, т. е. цепи, в которых при некотором а ^ 1 оо
Цепи Маркова со счетным числом состояний (А. А. Юшкевич) 505 но при каждом положительном β < α аналогичный ряд сходится: если в такой цепи Р'гЧ- * > εΡ^) Vt при некоторых iV > Л# и ε > 0, то предел в (5) существует и равен α-^^φίμ^φ^1, где μ = αμ^ и φ = αΡφ — единственные с точностью до постоянного множителя α-гармонические мера и положительная функция. Доказательство теоремы Молчанова, использующее границу Мартина, имеется в [17]. Асимптотику переходной вероятности Pij (t) однородного марковского процесса со счетным пространством состояний и непрерывным временем изучил Леви [18]. * Для несчетного фазового пространства Ε колмогоровское разбиение Ε на множество несущественных состояний, классы и подклассы проделал Дёблин * [19], усовершенствованные изложения дали затем Дуб [20), Чжун [21], Ори [22]. Принимаемое в этих работах известное условие Дёблина гарантирует наличие стационарного распределения и аналогию со случаем положительных классов. Определение возвратности для случая общего пространства Ε предложил Xар- рис [23]. В возвратных по Харрису цепях существует единственная с точностью до постоянного множителя инвариантная σ-конечная мера. Для них справедлив аналог результата о существовании (при ί = к) предела (2) и равенстве его μ^μ^1 (теорема Чакона—Орнстейна [24], усовершенствованная затем рядом авторов). Данный круг вопросов подробно изложен в монографии Ревуза [25]. Работы Колмогорова [1, 2] стимулировали не только дальнейшее изучение вопросов о классификации состояний и асимптотике переходных вероятностей, но в значительной мере развитие и всей теории цепей Маркова со счетным или произвольным фазовым пространством. Первое из них имеет дело с возвратным прежде всего положительным случаем и состоит в распространении на аддитивные функционалы от рассматриваемых цепей Маркова известных результатов о суммах независимых случайных величин или о конечных цепях. Сюда относятся закон больших чисел и примыкающие к нему эргодические теоремы, центральная предельная теорема и ее уточнения и соответствующие асимптотические разложения, многомерная предельная теорема для чисел попаданий в заданный набор состояний, закон повторного логарифма, сходимость нормированных нарастающих сумм к ви- неровскому процессу (иначе называемая принципом инвариантности), сходимость к негауссовским предельным законам и т. д. Эргодическая теорема для отношения двух функционалов доказывается и для возвратных цепей, другие результаты требуют более сильных предположений эргодического характера, например конечности вторых моментов М^ или упомянутого условия Дёблина. Первые существенные достижения в указанном направлении принадлежат Дёб- лину [19]. Далеко идущие их уточнения получены Нагаевым [26, 27]. В перенесении результатов на неоднородные цепи ведущую роль сыграли Добрушин [28] и Статулявичус [29]. Более подробные сведения и ссылки можно найти в книге Чжуна [12] (многие указания на работы советских авторов добавлены при переводе) и недавней монографии Сираждинова и Форманова [30], содержащей как некоторые прежние, так и многие новые результаты. Специально для счетных цепей Маркова закон повторного логарифма, принцип инвариантности, эргодические теоремы для отношений изложены в книге Фридмана [31].
506 Комментарии Второе направление, возникшее при исследовании невозвратных цепей (и процессов) Маркова,— это теория потенциала и границ Мартина. Давно известна связь задачи Дирихле для уравнения Лапласа в ограниченной области G с винеровским процессом в (т, рассматриваемым до момента выхода на границу dG области G. Эта связь позволяет ввести основные понятия классической теории потенциала в, терминах винеровского процесса или его переходной функции. По аналогии понятия гармонической функции, потенциала, функции Грина, эксцессивной (= положительной супергармонической)* функции переносятся на другие невозвратные марковские процессы. Основная заслуга в разработке теории потенциала для марковских процессов принадлежит Ханту [32] и Дын- кину [33]. Изложение теории потенциала для счетных цепей Маркова имеется в книге Хеннекена и Тортра [34]. Граница-выход невозвратной марковской цепи строится для описания возможных способов поведения траектории при η —> оо (с вероятностью 1 траектория притягивается к одной из точек границы). Дуальную роль играет граница-вход. Для счетных цепей Маркова первым построил границу Феллер [35]. Однако признание получила другая, более тощая граница, предложенная Дубом [36] и независимо Ватанабе [37], опирающаяся на теорию потенциала и названная ими границей Мартина (в случае винеровского процесса в плоской области G конструкция Дуба совпадает с построением Мартина [38], позволяющим представлять все гармонические в G функции формулой, аналогичной интегралу Пуассона для круга). Вероятностное построение границы Мартина для невозвратной счетной марковской цепи осуществил Хант [39] и усовершенствовал Дынкин [40]. Теория потенциала и граница Мартина для цепей Маркова с общим фазовым пространством представлена в книге Ревуза [25]. Новый метод изучения возвратных и невозвратных счетных цепей Маркова, основанный на понятии фундаментальной матрицы, предложили Кемени и Снелл. Они же (и независимо Ори) перенесли теорию потенциала и границ на возвратные цепи Маркова. Эти результаты, а также эргодические теоремы и границы Мартина для невозвратных цепей обстоятельно изложены в монографии [41], содержащей подробную историческую справку и библиографию. ЛИТЕРАТУРА 1. Kolmogoroff А. N. Anfangsgrunde der Theorie der Markoffschen Ketten mit unendlich vielen moglichen Zustanden.— Mat. сб., 1936, т. 1, № 4, с. 607—610. 2. Колмогоров А. Н. Цепи Маркова со счетным числом возможных состояний.— Бюл. МГУ. Математика и механика, 1937, т. 1, № 3, с. 1—16. 3. Doeblin W. Sur les chaines discretes de Markoff.— G. r. Acad. sci. Paris, 1936, vol. 203, N 1, p. 24-26. 4. Erdos P., Feller W., Pollard H. A theorem on power series.— Bull. Amer. Math. Soc, 1949, vol. 55, p. 201—204. 5. Feller W. An introduction to probability theory and its applications. New York, 1950. Vol. 1. Рус. пер.: Феллер В. Введение в теорию вероятностей и ее приложения. М.: Мир, 1964, Т. 1. 6. Feller W. Fluctuation theory of recurrent events.— Trans. Amer. Math. Soc, 1949, vol. 67, p. 98—119. 7. Feller W. A simple proof for renewal theorems.— Communs Pure and Appl. Math., 1961, vol. 14, p. 285—293. 8. Сарымсаков Т. А. Основы теории процессов Маркова. М.: Гостехиздат, 1954.
Цепи Маркова со счетным числом состояний (А. А. Юшкевич) 507 9. Doeblin W. Sur deux problemes de Kolmogoroff concernant les chaines de- nombrables.— Bull. Soc. math. France, 1938, vol. 66, p. 210—220. 10. Chung K. L. An ergodic theorem for stationary Markov chains with a countable number of states.— In: Proc. Intern. Gongr. Math. Cambridge (Mass.), 1950, vol. 1, p. 568. 11. Derman C. A solution to a set of fundamental equations in Markov chains.— Proc. Amer. Math. Soc, 1954, vol. 5, p. 332—334. 12. Chung K. L. Markov chains with stationary transition probabilities. Berlin, 1960. Рус. пер.: Чжун Кай-лай. Однородные цепи Маркова. М.: Мир, 1964. 13. Orey S. An ergodic theorem for Markov chains.— Ztschr. Wahrscheinlich- keitstheorie, 1962, Bd. 1, S. 174—176. 14. Blackwell D., Freedman D. The tail σ-field of a Markov chain and a theorem of Orey.— Ann. Math. Statist., 1964, vol. 35, p. 1291—1295. 15. Kingman J. F. C, Orey S. Ratio limit theorems for Markov chains.— Proc. Amer. Math. Soc, 1964, vol. 15, p. 907—910. 16. "Молчанов С. А. Предельная теорема для отношения переходных вероятностей марковских цепей.— УМН, 1967, т. 22, вып. 2, с. 124—125. 17. Молчанов С. А. Некоторые задачи теории границ Мартина для марковских процессов: Канд. дис. М.: МГУ, 1967. 18. Levy P. Systemes markoviens et stationnaires. Gas denombrable.— Ann. sci. Ecole norm, super. Ser. 3, 1951, vol. 68, p. 327—381. 19. Doeblin W. Sur les proprietes asymptotiques de mouvement regis par certains types de chaines simples.— Bull. math. Soc. roum., 1937, vol. 39, N 1, p. 57— 115;, N 2, p. 3—61. 20. Doob J. L. Stochastic processes. New York: J. Wiley, 1953. Рус. пер.: Дуб Дж. Л.: Вероятностные процессы. М.: Изд-во иностр. лит., 1956. 21. Chung К. L. The general theory of Markov processes according to Doeblin.— Ztschr. Wahrscheinlichkeitstheorie, 1964, Bd. 2, S. 230—254. 22. Orey S. Limit theorems for Markov chain transition probabilities. London, 1971. 23. Harris Т. Е. The existence of stationary measures for certain Markov processes.— In: Proc. Third Berkeley Sympos. Math. Statist. Probab., 1956, vol. 2, p. 113-124. 24. Chacon R. F., OrnsteinD. S. A general ergodic theorem.— 111. J. Math., 1960, vol. 4, p. 153—160. 25. RevuzD. Markov chains. Amsterdam, 1975. 26. Нагаев С. В. Некоторые предельные теоремы для однородных цепей Маркова.— Теория вероятностей и ее применения, 1957, т. 2, № 4, с. 389—416. 27. Нагаев С. В. Уточнение предельных теорем для однородных цепей Маркова.— Теория вероятностей и ее применения, 1961, т. 6, № 1, с. 67—86. 28. Добру шин Р. Л. Центральная предельная теорема для неоднородных цепей Маркова.— Теория вероятностей и ее применения, 1956, т. 1, № 1, с. 72— 89. 29. Стпатпулявичус В. А. Локальные предельные теоремы и асимптотические разложения для неоднородных цепей Маркова.— Литов. мат. сб., 1961, т. 1, № 1, с. 231—314. 30. Сираждинов С. X., Форманов Ш. К. Предельные теоремы для сумм случайных векторов, связанных в цепь Маркова. Ташкент: Фан, 1979. 31. Freedman D. Markov chains. S. Francisco: Holden-Day, 1971. 32. Hunt G. A. Markoff processes and potentials.— 111. J. Math., 1957, vol. 1, p. 44—93; 316—369; 1958, vol. 2, p. 151—213. Рус. пер.: Хант Дж. А. Марковские процессы и потенциалы. М.: Изд-во иностр. лит., 1962. 33. Дынкин Е. Б. Марковские процессы. М.: Физматгиз, 1963. 34. ХеннекенП. Л., Тортра А. Теория вероятностей и некоторые ее приложения. М.: Мир, 1974. 35. Feller W. Boundaries induced by non-negative matrices.— Trans. Amer. Math. Soc, 1956, vol. 83, p. 19—54. 36. Doob J. L. Discrete potential theory and boundaries.— J. Math. Mech., 1959, vol. 8, p. 433—458.
508 Комментарии 37. Watanabe Т. On the theory of Martin boundaries induced by countable Markov processes.— Mem. Golloq. Sci. Univ. Kyoto (A), 1960, vol. 33, p. 39—108. 38. Martin R. S. Minimal positive harmonic functions.— Trans. Amer. Math. Soc, 1941, vol. 49, p. 137—172. 39. Hunt G. A. Markoff chains and Martin boundaries.— 111. J. Math., 1960, vol. 4, p. 313-340. 40. Дынкин Ε. Б. Граничная теория марковских процессов (дискретный случай).— УМН, 1969, т. 24, вып. 2, с. 3—42. 41. Кетепу J. G., SnellJ. L., Knapp A. W. Denumerable Markov chains. Princeton: Univ. Press, 1966; New York, 1976. 42. Ширяев А. Н. Вероятность. М.: Наука, 1980. ТОЖДЕСТВА ВАЛЬДА (к № 35) (А. А. Новиков) Комментируемая работа во многом предвосхитила многочисленные иссле- вания по обобщениям тождеств Вальда, которые проводились впоследствии на основе аппарата теории мартингалов. Вальдом в работах [1, 2] были получены, в частности, следующие соотношения для момента первого выхода ν сумм независимых одинаково расиределен- п ных случайных величин ξχ из конечного интервала (а, Ъ). Пусть ?п — 2 ^ и ν = inf {η > 1 ; ln φ. (a, b)}. Тогда Mv < oo, и если М | ξ^ | < оо, то Μ (ξν - ν №k)) = 0; (1) кроме того, если Μξ£ < оо, то Μ [ξν ~ ν (Μξ&)]2 = (Μφ Mv. (2) Эти соотношения позволили Вальду получить приближенные формулы для среднего времени наблюдения в задаче последовательного различения двух простых гипотез. В комментируемой работе была предпринята попытка освобождения от условия одинаковой распределенности случайных величин ξ^·, которое играло существенную роль в методе работ Вальда [1, 2]. Но гораздо более важным было продвижение, состоящее в обобщении соотношений (1) и (2) на произвольные моменты остановки v. Впоследствии такого типа результаты (с произвольными моментами остановки) стали играть фундаментальную роль в различных задачах статистического последовательного анализа [3], теории управляемых случайных процессов [4], граничных задачах для случайных процессов [5, 6] и др. Интересно отметить, что в комментируемой работе не использовалось понятие момента остановки (или марковского момента, см. [3]) для последовательности случайных величин и теоремы 1 и 2 справедливы на самом деле и для некоторых немарковских моментов. Однако при доказательстве теорем 3,4
Тождества Валъда (А. А. Новиков) 509 и 5 неявно предполагалось условие, близкое к марковскому свойству момента v. На указанный пробел указа ί и Сейц и Винкельбауер в [7] (там же приведены уточненные формулировки теорем 3, 4 и 5). Для случая, когда ν — марковский момент~остановки относительно семейства σ-алгебр Fn = σ (%lt ..., ξη), F0 = {0, Ω} (т. е. событие {ν = η} е Fn при любом η = 1, 2, . . . ), можно указать следующие обобщения результатов комментируемой работы. Пусть ξ/c — последовательность случайных величин с η конечным математическим ожиданием ςν = ^j £fc и пусть при некотором as[l, 2] Г V Ί1/α -MS Md^n^,) <oo. . (3) L fc=l J Тогда Μ(ξν-Σ M^l^jUo; (4) кроме того, если Μξ| <οο и Μ ^j Μ (^ I ^fc-i) ^ °°» mo Μ Γξν - J M (ξ/; I Vl)l 2= M Γ Σ Μ Κϊ Ι **-!> 1 · <5> L *=1 J Lfc=l J Тождество (4) при условии справедливости (3) с a = 2 доказано Бурк- хольдером и Ганди [8]; его обобщения на случай 1 ^ a <! 2 приведены в книге Чоу и Тейчера [9]. Аналогичные результаты для случая непрерывного времени получены Новиковым [10, 11]. В работе Холла [12], а также в [10, 11] рассматривались тождества с моментами ξη всех порядков. Тождества Вальда (1) и (2) для случая одинаково распределенных слагаемых являются очевидными следствиями (4) и (5). Однако, как следует из (3), первое из этих соотношений справедливо лишь при выполнении условия (Μν1/α)·Μ ] Ik |a< oo при некотором a e [1, 2]. ЛИТЕРАТУРА 1. WaldA. On cumulative sums of random variables.—Ann. Math. Statist., 1944, vol. 15, p. 285-287. 2. WaldA. Differentiation under the expectation sing in the fundamental identity of sequential, analysis.— Ann. Math. Statist., 1946, vol. 17, p. 493—497. 3. Ширяев А. H. Статистический последовательный анализ. М.: Наука, 1976. 4. Гихман И. И., Скороход А. В. Управляемые случайные процессы. Киев: Наук, думка, 1977. 5. Боровков А. А. Вероятностные процессы в теории массового обслуживания. М.: Наука, 1972. 6. Новиков А. А. Мартингальный подход в задачах о времени первого пересечения нелинейных границ.— Тр. МИАН СССР, 1981, т. 158, с. 130—152. 7. Сейц И., Винкельбауер К. Заметка к статье Колмогорова и Прохорова «О суммах случайного числа случайных слагаемых».— Чехословац. мат. журн., 1953, т. 3, с. 89—91.
510 Комментарии 8. Burkholder D. L., Gundy R. F. Extrapolation and interpolation of quasilinear operators on martingales.— Acta math., 1970, vol. 124, p. 249—304. 9. Chow Y. S., Teicher H. Probability theory. New York: Spring.-Verl., 1978. 10. Новиков А. А. О моментах остановки винеровского процесса.— Теория вероятности и ее применения,1 1971, т. 16, № 3, с. 458—465. 11. Новиков А. А. О разрывных мартингалах.— Теория вероятности и ее применения, 1976, т. 20, № 1, с. 13—28. 12. Hall W. J. On Wald's equation in continuous time.— J. Appl. Probab., 1971, vol. 8, N 1, p. 59—68. ^-СХОДИМОСТЬ (к № 42) (А. В. Скороход) В работе № 42 [1] была предложена следующая, более удобная метрика, эквивалентная метрике S, введенной в § 2: rD (/, g) = inf sup [ρ (/ (ί), g (ί)) + λ (ί) - ί], λί=Λ 0<ί<1 где /, g s Dx, ρ — метрика в X, Λ — множество всех непрерывных обратимых отображений λ [0,1] на себя, λ (0) = 0, λ (1) = 1. В этой метрике Dх се- парабельно, если сепарабельно X, но не полно. Биллингсли [2] предложил явный вид метрики, которая, порождая ту же сходимость, превращает Dх в полное пространство (если, естественно, полно X). Она определяется так: rfo (/,g)= inf sup Γρ(/(ί), S(i)) + |ln λ(')-λ(«) 0<s<l (мы приводим более" простое эквивалентное определение). Обобщение рассматриваемой сходимости на пространство функций без разрывов второго рода, заданных на [0, оо[, аналогичное равномерной сходимости непрерывных функций на всех конечных интервалах, имеется в [3]. ЛИТЕРАТУРА 1. Гихман И. И., Скороход А. В. Введение в теорию случайных процессов. М.: Наука, 1965. 2. Биллингсли П. Сходимость вероятностных мер. М.: Наука, 1977. 3. Stone С. Weak convergence of stochastic processes defined on semi-infinite time intervals.— Proc. Amer. Math. Soc, 1963, vol. 14, p. 694—696. РАВНОМЕРНЫЕ ПРЕДЕЛЬНЫЕ ТЕОРЕМЫ (к № 43, 51) (Т. В. Арак) Основные теоремы работы № 51 ныне известны как равномерные предельные теоремы Колмогорова. Согласно указанному во введении теорема 1 (или равносильное ей соотношение (0.9)) является уже третьим уточнением соответствующей теоремы из предыдущей работы (№ 43). В дальнейшем, в 1965 г., Ле
Функции концентрации (В. И. Круглое) 511 Кам [1] показал, что при подходящем центрировании в теореме 1 можно взять D = exp (n(F — Ε)), Сх = 132. В 1973 г. Ибрагимов и Пресман [2] представили новое доказательство сС1= 8. Параллельно оценкам, равномерным по множеству всех распределений, исследовались и оценки для разных более узких классов распределений слагаемых. В частности, Мешалкин доказал, что sup ρ (££, £)) = О (η"1'·), где В™ — биномиальное распределение с параметрами η и р. Окончательное решение было получено Араком [3, 4]: найдутся такие положительные (абсолютные) постоянные Си С, что Г/Г1'» < ψ (τι)< Сп^и (ср. с (0.9) и (0.10)). Используя разработанные в [3] новые методы оценки равномерного расстояния, Зайцев и Арак [5] нашли также окончательное количественное уточнение теоремы 2. Многомерные варианты равномерных предельных теорем Колмогорова исследовались Сазоновым, Пресманом и Зайцевым. ЛИТЕРАТУРА 1. On the distribution of sums of independent random variables.— In: Bernoulli, Bayes, Laplace (anniversary volume) / Ed. L. Le Gam, J. Neyman. Berlin; Heidelberg; New York: Spring.-Verl., 1965, p. 179—202. 2. Ибрагимов И. Α., Пресман Э. Л. О скорости сближения распределений сумм независимых случайных величин с сопровождающими законами.— Теория вероятностей и ее применения, 1973, т. 18, № 4, с. 753—765. 3. Арак Т. В. О скорости сходимости в равномерной предельной теореме Колмогорова. I, II.— Теория вероятностей и ее применения, 1981, т. 26, № 2, с. 225—245; № 3, с. 449—463. 4. Арак Т. В. Уточнение нижней оценки для скорости сходимости в равномерной предельной теореме Колмогорова.— Теория вероятностей и ее применения, 1982, т. 27, № 4, с. 767—772. 5. Арак Т. В., Зайцев А. Ю. Оценка скорости сходимости во второй равномерной предельной теореме Колмогорова.— ДАН СССР, 4982, т. 267, № 1, с. 14—18. ФУНКЦИИ КОНЦЕНТРАЦИИ (к № 45) (В. М. Круглое) Эта замечательная работа Колмогорова явилась источником многочисленных глубоких исследований по функциям концентрации. В настоящее время имеется монография [1], специально посвященная функциям концентрации* Главы, в которых говорится oj неравенствах типа неравенства Колмогорова, составляют ядро этой книги. В ней можно найти многочисленные обобщения и применения функции концентрации Леви, а также довольно подробную библиографию^ О некоторых результатах, связанных с неравенством Колмогорова, мы скажем несколько подробнее ниже.
512 Комментарии Понятие функции концентрации было введено Леви в его известной монографии 1937 г. «Theorie de l'addition des variables aleatoires», упоминаемой в работе Колмогорова. Там же Леви привел ряд важнейших свойств этих функций. Понятие функции концентрации не сразу заслужило признание и получило достаточную известность. Этим, по-видимому, можно объяснить тот факт, что спустя пять лет оно вновь было введено в качестве одной из характеристик вероятностных распределений Литтлвудом и Оффордом г. Исследования по уточнению и обобщению неравенства Колмогорова проводились по нескольким направлениям. Два из них были указаны самим Колмогоровым, первое— получение неравенства, объединяющего неравенство Леви и его уточнение, приводимое Колмогоровым, и неравенство Деблина, и второе направление — анализ функций концентрации. Как пишет сам Колмогоров, его интерес к функциям концентрации и их свойствам возник в связи с задачей об аппроксимации сверток распределений безгранично делимыми распределениями. Ко второму направлению относится один из результатов Колмогорова, не выделенный им специально и пока что не привлекший большого внимания. Тем не менее мы его сформулируем. Пусть Q — функция концентрации. Определим величину Если Kq = 1, то Q = рЕ + (1 — р) R, где 0 < ρ <; 1, Ε — единичное распределение, сосредоточенное в нуле, R — абсолютно непрерывное распределение. Первые обобщения неравенства Колмогорова были получены Рогозиным в 1961 г. В частности, в одной из своих статей он показал, что условие L2 > > I2· log s в теореме Колмогорова можно опустить. Дальнейшим уточнением и обобщением неравенства Колмогорова занимались Зигель, Кестен, Ле Кам, Мирошников, Петров, Постникова, Рогозин, Розен, Сазонов, Севастьянов, Теодореску, Хенгартнер, Энгер, Эссеен и др. Первоначальные обобщения неравенства Колмогорова были получены на пути, указанном Колмогоровым с привлечением комбинаторных методов. Затем наметилась тенденция к преимущественному использованию аналитических методов. В статье Постниковой и Юдина, опубликованной в 1978 г., было доказано одно неравенство типа неравенства Колмогорова аналитическими методами с привлечением некоторых результатов аддитивной теории чисел; их неравенство может быть выведено из неравенств Кестена, доказанных им в 1969 г. с существенным использованием комбинаторных методов. Последним достижением в этом направлении является неравенство, принадлежащее Мирошникову и Рогозину [2, 3]. Обозначим Q функцию концентрации суммы ξ = ξι + « . . + ?η независимых случайных величин, Qj функцию концентрации ξ;· и ξψ симметризацию случайной величины ξ;. 1 Мы не приводим здесь точных ссылок на их статью и на ряд статей других авторов, о которых мы упомянем. Эти ссылки заинтересованный читатель может найти в монографии [1].
Функции концентрации (В. М. Круглое) 513 Существует абсолютная постоянная С такая, что Q (Ц < CL ( 2J Μ (min {| if |, Л .})*ρτ2 (/.) ) для любых положительных 1г, . . ., lni L, 2L ^ max Z;. Доказательство этого неравенства осуществлено аналитическими методами. Более того, в той общности, в которой оно доказано, и без учета сравнения абсолютных постоянных неравенство Мирошнпкова и Рогозина в настоящее время наиболее сильное. Из многочисленных обобщений понятия функции концентрации Леви мы приведем только одно, указанное Энгером. Пусть Ε — выпуклое множество евклидова пространства Rd. Обозначим РЕ (х) функционал Минковского, определяемый по Е. Назовем U (ξ, Ε) = С ехр {-Рв (*)} Ρ (rfat) ά интегральной функцией концентрации случайного вектора ξ, где Ρ — распределение симметризации E/s). Недавно Мироншиков [4] доказал неравенство для интегральной функции концентрации, аналогичное приведенному выше. Существует абсолютная постоянная С такая, что U (ξ, LE) < CL i 2 Μ (min {PB {if), l.})*U-* (ξ., LE)\ для любых положительных Z1? . . ., Zn, L, 2L ^ max lj. Здесь под ξ и ξ, понимаются случайные векторы со значениями в i?d: выпуклое множество Ε принадлежит специальному классу множеств, в которой, в частности, входят множества, удовлеаворяющие условию m ρ ε (*) = Σ ι λϊχ ι. * s Rd< где Лj, . . ., Am — некоторые линейные операторы в Rd. Заметим, что определение интегральной функции концентрации имеет ту же самую природу, что и осредненная функция концентрации Каваты [5j. Надлежаще распространенная с одномерного случая [1, с. 155] на многомерный случай, она и интегральная функция концентрации, с очевидностью, обнаруживают общую природу как интегральных преобразований с определенными ядрами. ЛИТЕРАТУРА 1. Хенгартнер В., Теодореску Ρ J Функции концентрации/Пер. с англ. М.: Наука, 1980. 2. Мирошников А. Л., Рогозин Б. А. Неравенства для функции концентрации.— Теория вероятностей и ее применения, 1980, т. 25, № 1, с. 178—183.
514 Комментар ии 3. Мирошников А. Л., Рогозин Б. А. Замечания к одному неравенству для функций концентрации сумм независимых случайных величин.— Теория вероятностей и ее применения, 1982, т. 27, № 4, с. 787—789. 4. Мирошников А. Л. Неравенства для интегральной функции концентрации.— В кн.: Предельные теоремы для сумм случайных величин: Тр. Ин-та математики СО АН СССР, 1984, т. 3, с. 159—170. 5. Kawata Т. The mean concentration function of a chance variable.— Duke Math. J., 1941, vol. 8, p. 666—677. ЭМПИРИЧЕСКИЕ РАСПРЕДЕЛЕНИЯ (к № 15) (Э. В, Хмаладзе) 1. Комментируемая статья — это та работа, в которой вводится классическая статистика Колмогорова Dn = γΊΙ sup I Fn (t) -F(t)\ t и устанавливается ее предельное распределение — распределение Колмогорова. К 1933 г. функция эмпирического распределения Fn представляла собой привлекательный, но мало освоенный в математической теории"объект. Точных утверждений о сходимости Fn к функции распределения F еще не существовало (см. п. 3), и, конечно, не существовало правильных результатов относительно поведения отклонений Fn от F (см. п. 2), если не относить сюда теорему Пирсона 1900 г. о предельном распределении статистики «хи-квадрат» (см. [1]). 2. Опишем коротко две очень известные работы Крамера и Мизеса, хорошо иллюстрирующие степень, которой достигала формализация утверждений об отклонениях Fn от F к 1933 г. В книге [2], вышедшей в 1931 г., Мизес (§ 10, с. 316—327) ввел статистику, названную им «статистика омега-квадрат»: toi = \[ln(t)-F(t)]*dt. Обсуждая «возможный разброс» значений ω^ при больших п, Мизес пишет (см., например, с. 320 в [2]), что теоретическим интервалом значений (theore- tische Wert) для ω^ является интервал Сп = (Εω* - 0,674 ΥΈ^, Εα>* + 0,674 Υ 5<), где, напомним, 0,674 есть квантиль уровня 0,75 стандартного нормального распределения Ф, т. е. Ф(0,674) — Φ (—0,674) = 0,5. За таким утверждением, по- видимому, должно стоять представление об асимптотически нормальной распределенности случайной величины (ω^ — EofylV Οω^, которое, конечно, неверно. Любопытно все же заметить, что для равномерной на [0, 1] функции распределения lim Ρ {ωΐ е= Сп} = 0,60, что не так уж далеко от 0,5.
Эмпирические распределения (Э. В. Хмаладзе) 515 В статье Крамера [3] 1928 г., где также предлагалось рассматривать статистику ω^ для проверки гипотезы относительно F, вовсе не ставится вопрос о предельном распределении статистики ω^, а осуществляется следующий план: предположим, что F близка к функции нормального распределения Φμ σ со средним μ и дисперсией σ2, т. е. F представима небольшим, но неизвестным числом членов ряда Шарлье; **=φμ,σ+^Ψμ,σ+ · ■ · + ^Τμ,σ· Как выяснить, сколько членов в этой сумме существенны? Для ответа на этот вопрос предлагалось рассматривать интегралы Δ;Λ= ^[^η(ί)-Φμ,σ(0]2^ Δ\η = \ IFn (t) - Φμ>σ (ί) - Рг (ί) φμ,σ (ί)Ρ dt и т. д. (в статье Крамера — до четвертого порядка). Если интеграл Δ$η «сильно» уменьшается в сравнении с Δ|_χ η, то, значит, ί-ΐι член в разложении F «существенный». Такой прием применяется в статье ко многим конкретным данным, причем параметры μ и σ2 оцениваются по этим же данным. 3. Из теоремы 1 комментируемой работы следует, что sup \Fn(t) — F (t) \ —* О по вероятности при η -* оо. Более сильное утверждение о сходимости sup | Fn (t) — F (t) \ к нулю с вероятностью 1 при η —» оо — теорема Гливен- ко — опубликовано Гливенко одновременно со статьей Колмогорова в том же номере журнала (см. [4]). Касаясь связи между теоремой Колмогорова и теоремой Гливенко, интересно напомнить, что через 11 лет, в 1944 г., в фундаментальной работе [6] Смирнов доказал для статистики Колмогорова неравенство для больших уклонений Ρ {Dn> Ц < 2*~2λί [1 + о (1)], λ = о (η'·), η -> оо, из которого уже следует утверждение теоремы Гливенко. 4. Как видим, первая таблица значений функции распределения Колмогорова опубликована самим Колмогоровым. В 1939 г. Смирнов опубликовал шестизначные таблицы функции распределения Колмогорова как приложение к своей статье [7] (см. также [5, с. 117]). В последующем эти таблицы были опубликованы отдельно в 1948 г. в [8], а затем воспроизведены в [9]. Очень подробные семизначные таблицы функции распределения Колмогорова были вычислены в 1965 г. и опубликованы на с. 267—277 в [5]. Шаг в этих таблицах равномерный и равен 0,001, а наибольшее значение аргумента равно 3,000. При этом значении аргумента функция распределения Колмогорова равна 0,999 999 969 5. 5. Приведенная в статье замечательная лемма о том, что распределение статистики Dn не зависит от F, направила последующее развитие теории непараметрических критериев согласия в соответствии со следующим принципом: выбирать в качестве статистик критериев согласия такие функционалы от Fn и от F, распределение которых уже от F не зависит.
516 Комментарии В связи с этим принципом стоит напомнить следующее: в 1900 г. в работе [1J при построении статистики хи-квадрат τπΓΔ/^ (t.)-AF(t.)]2 χη^ = ηΣ AF(t.) ' «o<*i<...<W i=l г Пирсон выбрал коэффициенты 1/AF (г$), конечно, целенаправленно так, чтобы предельное распределение этой квадратичной формы не зависело от вероятностей AF (ti) = F (Ц+1) — F (t{), тем самым от точек Ц разбиения и от функции распределения F. Позже появилось много работ, в которых устанавливалась асимптотически нормальная распределенность рассматриваемых статистик. Ясно, что такие статистики достаточно нормировать, чтобы получить случайные величины со стандартным предельным распределением. Возможно, под влиянием такой традиции в 1931 г. в книге [2] Мизес, рассматривая статистики ω* (λ) = \ [Fn (t) - F (ΟΡλ (Ζ) dt, обсудил лишь два выбора весовой функции λ: λχ (t) = nil (t), где / — плотность функции распределения F, и λ2 (t)-= 1/E \ [Fn (t) — F (t)]2dt. Выбор /ч рассматривался как аналогичный случаю статистики хи-квадрат, но неподходящий, так как интеграл со?2г (λχ) «обычно» оказывается расходящимся, а выбор λ2 признавался подходящим, так как стандартизовал среднее статистики омега-квадрат. Однако предельное распределение статистики со^г (λ2), конечно, зависит от F. Затем в 1933 г. была сформулирована комментируемая лемма, а в 1937 г. Смирнов в работе [10], со ссылкой на Гливенко, ввел, наконец, статистику ω^ (λ), где λ (t) = φ IF (t)] / (/), распределение которой от F не зависит. С этого времени, а можно сказать и что с 1952 г., после появления статьи Андерсона и Дар- линга [11], указанный принцип при построении непараметрических критериев согласия стал общепринятым. В случае, когда статистическая гипотеза фиксирует не конкретную функцию распределения F, а некоторое семейство F функций распределения, осуществление этого принципа столкнулось с затруднениями. Краткое описание работ, посвященных этой проблеме, и библиографию, весьма неполную, к которой следует здесь присоединить статью Гихмана [12], можно найти, например, в п. 1 § 2 рабо" ты [13]. Там же [13, § 2] приведен ответ на вопрос: как строить функционалы от Fn и от F, предельное распределение которых не зависит от F. В случае, когда F — непрерывное распределение в многомерном пространстве Rm, m > 1, утверждение леммы уже неверно: неверно, что случайная величина F (Хг, . . ., Хт) имеет при всех F одно и то же распределение, если случайный вектор (Х17 . . ., Хш) имеет непрерывную функцию распределения F. Поэтому столь же общепринятого способа построения непараметрических критериев согласия для распределений в многомерном пространстве, что и в одномерном пространстве, как нам кажется, сейчас нет. Укажем все же две современные работы [14, 15] и одну давнюю работу [16] на эту тему, 6. Свертка (16) и рекуррентная формула (9) комментируемой статьи в последующем много раз использовались для вычислений при конечных п. В частности, в 1950 г., по-видимому, одним из первых Масси [17], используя формулу (16), вычислил небольшие таблицы для функций распределения статистики Кол-
Эмпирические распределения (Э. В. Хмаладзе) 517 могорова для η от 5 до довольно больших (до 80). Сравнительно недавно (см. [18]) рекуррентная формула, аналогичная формуле (9), была использована для вычисления вероятностей невыхода Fn за различные криволинейные границы. Говоря о табулировании Фп, заметим, что современные сборники статистических таблиц содержат обычно таблицу значений функций распределений Фп и их процентных точек для η ^ 100. Впрочем, уже при η ^ 30 с успехом могут быть применены известные асимптотические формулы. Эта сторона дела изложена в пояснительной части в [9], где приведены и необходимые ссылки. 7. Введем так называемый равномерный эмпирический процесс vn, vn (t) = = У η [Fn (t) — f], и броуновский мост ν, ν (t) = ιν (t) — tw (1), где w — вине- ровский процесс, is [0, 1], и рассмотрим следующий функционал от эмпирического процесса: \v (01 Пусть ^„ (λ, Ό = Ρ {νί е [0,1]: Ι ί·η (<) - ί К-^= МО} ; ΦηΚ (λ, Κ) = Ρ{Κ Ы < λ}. Очевидно, что Ρη (λ, h) — ®ηΚ (^' J^' ^* ®· вычисление вероятностей невыхода эмпирического процесса за некоторую границу и вычисление функций распределений функционалов К (νη) — эквивалентные задачи. Однако пути, которыми развивалась каждая из этих задач, были различны. По поводу первой задачи — изучение вероятностей невыхода — см. обзоры Гихмана и Гнеденко [19] и Боровкова и Королюка [20]. Напомним, как шло развитие второй задачи. В комментируемой рабюте установлен предел для функции распределения статистики Колмогорова: при h = 1 последовательность ФпК =¥ Ф. Однако вероятностная «конструкция» функции распределения Колмогорова Ф, а именно равенство Φ(λ) = Ρ{£(ι;)<λ}, ' (1) долгое время оставалась многим неясной. Во всяком случае, оставалось неясным, какую пользу такая «конструкция» может принести. Однако со временем стали появляться другие статистики, которые, как позже было замечено, удобно записать в виде функционалов от эмпирического процесса. В частности, в 1939 г. в статье [22] Вальд и Вольфовитц рассматривали так называемую взвешенную статистику Колмогорова, т. е. функционал К (νη) с весовой функцией /& =£ 1, а в 1937 г. в [10] Смирнов рассматривал статистику ω2, τ. е. функционал ι ω*(»η)= S KW2dt- (2) о Стало естественным выделить факт, лежащий в основе сходимости распределений различных функционалов от ι?η, а именно сходимость νη κ ν по распределению.
518 Комментарии Однако прояснение того, что различные статистики естественно записывать как функционалы от эмпирического процесса, было лишь одной важной стороной дела. Требовалось и другое — требовалось предвидение, что для доказательства сходимости по распределению процессов ип к процессу ν и вообще для доказательства слабой сходимости в функциональных пространствах могут быть выработаны общие эффективные методы. И то и другое созрело к концу 40-х годов: 30 ноября 1948 г. (как сообщают «Успехи математических наук» (1949, т. 4, вып. 2, с. 173)) А. Н. Колмогоров сделал в Московском математическом обществе доклад «Меры и распределения в функциональных пространствах», в котором обсуждались проблемы задания и слабой сходимости мер в функциональных пространствах, 29 января 1949 г. Смирнов сделал доклад «О критерии Крамера — Мизеса» [23] (см. также [5, с. 200]), в котором вновь, после 12-летнего перерыва, получил предельное распределение статистики ω2, на этот раз пользуясь именно представлением (2) и связанным с ним равенством Парсеваля. Наконец, в сентябре 1949 г. появилась знаменитая заметка Дуба [24]. Вместе с описанием общей точки зрения, что сходимость ФП4Ф есть следствие сходимости νη к у по распределению, в этой заметке было доказано равенство (1). С этого времени началось целенаправленное развитие теории слабой сходимости в функциональных пространствах, которая составляет в настоящее время основу для получения предельных теорем в непараметрической статистике. Для ознакомления с состоянием этой области непараметрической статистики можно предложить небольшую монографию Дурбина [25] и обзорную статью Генслера и Стуте [26]'. 8. Сделаем несколько заключительных замечаний, не относящихся к какому-нибудь конкретному месту в тексте комментируемой работы. A. Статистика Колмогорова, так же как статистики К (νη) (см. п. 7), выделяются среди других статистик непараметрических критериев согласия тем, что приводят к наглядным доверительным множествам. Действительно, например, доверительное множество {F': n J [F n (t) — F' (t)]2dF' (t) < λ}, построенное с помощью статистики ω2, ненаглядно и потому неудобно для использования. В отличие от этого доверительное множество {F': \fn sup | Fn (t) — F' (t) | < λ} = {λ λ 1 F* : Fn(t) ——— < F' (t) < Fn (t) -f- L, построенное с помощью статистики Колмогорова, наглядно и очень широко используется. Такое свойство статистики Колмогорова было замечено быстро — уже в 1939 г. Вальд и Вольфо- витц ввели в [22] доверительные множества JF' iFn(t)— —— &п {^п (*)) <Р' (0 < Ι γη <С Ρ η (0 + —= δη (Fn (t)) L , связанные со взвешенными статистиками Колмо- Ϋη J горова. B. В том же 1939 г. появились две статьи Смирнова [27] и [7]. В этих статьях указаны предельные распределения для статистик Dn = ]/~n sup [Fn (t) — F (t)] и пщп2 = V"n sup | Flrh (t) - F2ri2 (i) |, n= wJfa + zia) соответственно: Ρ {D+ < λ} - 1 - e~^\ Ρ {ΌηιΉ2 < λ} -> Φ (λ). (3)
Эмпирические распределения (Э. В. Хмаладзе) 519 Здесь Fln и F2n — функции эмпирических распределений, построенные по двум независимым последовательностям независимых одинаково распределенных случайных величин. Любопытно, что оба утверждения (3) — одни из наиболее известных утверждений непараметрической статистики — были указаны как простые следствия общих теорем о числе пересечений кривых Fn и F -f- λ/|/"π и кривых Fln и F2n 4; -\- λ/]/~η соответственно. В 1944 г. Смирнов в [6] привел распределение статистики D^ при конечных п. В 1955 г. Королюк в работе [28] получил распределение статистики Dntn при конечных пг и д2, а в 1962 г. Боровков в работе [29] установил асимптотические разложения для распределений и, в частности, для вероятностей больших уклонений статистик Dn п?. Конкретное использование некоторых результатов из [29] и [21] продемонстрировано в [9, с. 84]. По-видимому, первым табулирование распределений двухвыборочной статистики Смирнова при конечных пг и п2 предпринял Мэсси [30]. Таблицы процентных точек статистики Dnnz для пг < п2 < 50 опубликовали Боровков, Маркова и Сычева [31]. С. Замечательный в нескольких отношениях пример применения статистики Колмогорова для проверки гипотезы о функции распределения F привел в 1940 г. сам А. Н. Колмогоров в заметке [32]. ЛИТЕРАТУРА 1. Pearson К. On the criterion that a given system of deviations from the probable in the case of correlated system of variables is such that it can be reasonably supposed to have arisen from random sampling.— Phil. Mag., 1900, vol. 5, N 50, p. 157. 2. Mises R. von. Warscheinlichkeitsrechnung und ihre Anvendungen in der Statistikund theoretischen Physik. Leipzig; Wien: Franz Deuticke, 1931. 574 S, 3. Cramer H. On the composition of elementary errors. Second paper: statistical applications.— Skand. Aktuarietidskr., 1928, h. 1/2, s. 141—180. 4. Glivenko V. Sulla determinazione empirica delle leggi di probabilita.— G. 1st. ital. attuar., 1933, vol. 4, N^ 1, p. 92—99. 5. Смирнов Η. В. Теория вероятностей и математическая статистика: Избр. тр. М.: Наука, 1970. 290 с. 6. Смирнов Н. В. Приближение законов распределения случайных величин по эмпирическим данным.— УМН, 1944, вып. 10, с. 179—206. 7. Смирнов Н. В. Оценка расхождения между эмпирическими кривыми распределения в двух независимых выборках.— Бюл. МГУ. Математика и механика, 1939, т. 2, с. 3—14. 8. Smirnov N. V. Table for estimating the goodness of fit of empirical distribution.— Ann. Math. Statist., 1948, vol. 19, N 2, p. 279—281. 9. Большее Л. Н., Смирнов Н. В. Таблицы математической статистики. М.: Наука, 1983. 10. Смирнов Н. В. О распределении со2-критерия Мизеса.— Мат. сб., 1937, т. 2, № 1, с. 973—993. 11. Anderson Т. W., Darling D. A. Asymptotic theory of certain «goodness of fit» criteria based on stochastic process.— Ann. Math. Statist., 1952, vol. 23, N 1, p. 193. 12. Гихман И. И. Некоторые замечания к критерию согласия А. Н. Колмогорова.- ДАН СССР, 1953, т. 91, № 4, с. 715-718. 13. Хмаладзе Э. В. Некоторые применения теории мартингалов в статистике.— УМН, 1983, т. 37, вып. 6 (228), с. 194-212.
520 Комментарии 14. Bickel P. /., Breiman, L. Sums of functions of neares neighbour distances, moments bounds, limit theorems and a goodness of fit test.— Ann. Probab., 1983, vol. 11, p. 185—214. 15. Schilling M. F. Goodness of fit testing in Rm based on the weighted empirical distribution of certain nearest neighbour statistics.— Ann. Statist., 1983, vol. 11, N 1, p. 1-12. 16. Rosenblatt M. Remarks on multivariate transformation.— Ann. Math. Statist., 1952, vol. 23, N 3, p. 470-472. 17. Massey F. /., Jr. A note on the estimation of a distribution by confidence . limits.— Ann. Math. Statist., 1950, vol. 21, N 1, p. 116—118. 18. Котелъпикова В. Ф., Хмаладзе Э. В. О вычислении вероятности невыхода эмпирического процесса за криволинейную границу.— Теория вероятностей и ее применения, 1982, т. 27, № 3, с. 599—607. 19. Гихман И. И., Гнеденко Б. В. Математическая статистика.— В кн.: Математика в СССР за сорок лет. 1917—1957. М.: Физматгиз, 1959. Т. 1. 1002 с. 20. Боровков Α. Α., Королюк В. С. О результатах асимптотического анализа в задачах с границами.— Теория вероятностей и ее применения, 1965, т. 10, № 2, с. 255—266. 21. Королюк В. С. Асимптотический анализ распределений максимальных уклонений в схеме Бернулли.— Теория вероятностей и ее применения, 1959, т. 4, № 4, с. 369—397. 22. Wald А., Wolfowitz J. Confidence limits for continuous distribution functions.— Ann. Math. Statist., 1939, vol. 10, N 2, p. 105—118. 23. Смирнов Η. В. О критерии Крамера—Мизеса.— УМН, 1949, т. 4, вып. 4, с. 196-197. 24. Doob J. Heuristic approach to the Kolmogorov—Smirnov theorems.— Ann. Math. Statist., 1949, vol. 20, N 3, p. 393—403. 25. Durbin J. Distribution theory for tests based on the sample distribution function: Region, conf. Ser. in Appl. Math., 9th issue. SI AM, 1973. 64 p. 26. Gaensaler P., Stute W. Empirical processes: A survay of results for independent and identically distributed random variables.— Ann. Probah., 1979, vol. 7, * N 2, p. 193—243. 27. Смирнов Η. В. Об уклонениях эмпирической кривой распределения.— Мат. сб., 1939, т. 6 (48), № 1, с. 3—24. 28. Королюк В. С. О расхождении эмпирических распределений для случая двух независимых выборок.— Изв. АН СССР. Сер. мат., 1955, т. 19, № 1, с. 81— 96. 29. Боровков А. А. К задаче о двух выборках.— Изв. АН СССР. Сер. мат., 1962, т. 26, № 4, с. 605—624. 30. Massey F. J., Jr. Distribution table for the deviation between two sample cu- mulatives.— Ann. Math. Statist., 1952, vol. 23, N 3, p. 435—441. 31. Боровков Α. Α., Маркова Η. #., Сычева Η. Μ. Таблицы для критериев Н. В. Смирнова однородности двvx выборок. Новосибирск: Ред.-изд. отд. СО АН СССР, 1964, 139 с. 32. Колмогоров А. Н. Об одном новом подтверждении законов Менделя.— ДАН СССР, 1940, т. 27, с. 38-42. МЕТОД НАИМЕНЬШИХ КВАДРАТОВ (к № 30, 31) (М. Б. Малютов) Метод наименьших квадратов (МНК) — один из наиболее популярных статистических методов оценивания параметров в приложениях. Достаточно сказать, что специалистами по геодезии, навигации, артиллерии и т. п. вплоть'^до настоящего времени создаются свои учебники по этому вопросу, не всегда отвечающие стандартам математической статистики.
Метод наименьших квадратов (М. Б. Малюпгов) 521 В то же время математические изложения метода вплоть до работы № 30 не были основаны на современных геометрических представлениях многомерной геометрии и по существу мало отличались от первоначального способа Гаусса. Именно в работе № 30 впервые отчетливо использована связь метода с ортогональной проекцией на подпространство в R , выяснено, какие свойства метода зависят от предположения нормальности распределения измерений, а какие справедливы для ортогональных наблюдений. Для приложений важно обстоятельное изложение доверительных интервалов для параметров и неизвестной дисперсии измерений, снабженное таблицами распределении Стьюдента и χ2. Статья № 30 сыграла важную роль в развитии математической теории МНК в нашей стране и упорядочении приложений этого метода. В частности, ее влияние заметно в книгах Линника [1] и Романовского [2]. В последней, в частности, воспроизведен с подробными доказательствами доклад А. Н. Колмогорова «Реальный смысл результатов дисперсионного анализа» (Труды 2-го Всесоюзного совещания по математической статистике), развивающий результаты работы № 30 в сторону теории дисперсионного анализа и содержащий критику некоторых недостаточно точных формулировок Фишера. За рубежом работа № 30 осталась незамеченной, и современное изложение теории метода наименьших квадратов было опубликовано только в 1959 г. Шеф- фе [3]. В работе № 31 указано уточнение одной формулы Гаусса из теории метода наименьших квадратов. Гаусс нашел формулу для дисперсии Ds2 стандартной оценки s2 дисперсии σ2 независимых измерений у\ в линейной регрессионной модели. В эту формулу входит четвертый момент /о4, поэтому Гаусс получил границы сверху и снизу для Ds2, справедливые для любых /. Однако граница снизу была грубой (иногда даже отрицательной). В работе № 31 найдена неулучшае- мая граница снизу для Ds2. Изложение существенно опирается на развитую предварительно А. Н. Колмогоровым в работе № 30 геометрическую теорию метода наименьших квадратов (в частности, существенную роль играет ортогональность некоторых матриц). Работа с небольшими изменениями Воспроизведена в упомянутой выше книге Линника. В последующей литературе основное внимание уделено построению асимптотических доверительных интервалов для σ2, в которые вместо / подставлена ее оценка по той же выборке [4]. ЛИТЕРАТУРА 1. Линник Ю. В. Метод наименьших квадратов и основы математико-стати· стической теории обработки наблюдений. М.: Физматгиз, 1952. 2. Романовский В. И. Математическая статистика. Ташкент: Изд-во АН УзССР, 1963. Кн. 2. 3. Шеффе Г. Дисперсионный анализ. М.: Изд-во иностр. лит., 1959. 4. Driigas H. Asymptotic confidence intervals for the variance in the linear regression model.— In: Statistics and probability: Essays in Honor of С R. Rao Amsterdam: North Holland Publ. Co., 1982, p. 233-239.
522 Комментарии НЕСМЕЩЕННЫЕ ОЦЕНКИ (к № 38) (Ю. К. Беляев, Я. П. Лумелъский) Несмещенность оценок является одним из фундаментальных понятий математической статистики. Хотя это понятие было известно ранее, в статье № 38 впервые систематически рассмотрены свойства несмещенных оценок и различные методы построения таких оценок, выраженных через достаточные статистики. В комментируемой статье и работе А. Н. Колмогорова [1] выпукло показано прикладное значение несмещенных оценок в задачах статистического контроля. Колмогоров впервые применил несмещенные оценки для определения эффективности реально используемых планов выборочного контроля по альтернативному признаку. Построение несмещенных оценок для предъявленного и пропущенного брака, а также для априорного распределения числа дефектных изделий в контролируемых партиях рассматривалось в работах [2—4]. Были получены несмещенные оценки при контроле по качественному признаку с известными ошибками классификации [5]. Вопросы построения несмещенных оценок при контроле по альтернативному и качественному признакам, т. е. при классификации на к групп качества, подробно рассматривались в книгах [3, 4], где приведена обширная библиография. Несмещенные оценки основных показателей контроля включены в ГОСТ 24660-81. Полученная А. Н. Колмогоровым несмещенная оценка плотности нормального распределения нашла широкое применение в задачах контроля по количественному признаку [6]. В дальнейшем этот результат был обобщен для многомерного нормального распределения [7—9], а также для задач статистической классификации [10]. А. Н. Колмогоров обратил внимание на статью [И], где несмещенные оценки строились для биномиальных случайных блужданий. В последующем задачи несмещенного оценивания и вопросы полноты семейств распределений, порожденных планами первого вхождения при различных схемах случайных блужданий, рассматривались в работах [12—14, 5]. Введенные А. Н. Колмогоровым верхние и нижние оценки могут быть эффективно использованы и в тех случаях, когда несмещенные оценки не существуют. Именно так обстоит дело при оценивании пропущенного брака при биномиальном распределении и плане одноступенчатого контроля. Верхние и нижние оценки для различных функций от неизвестного параметра, а также оценки с минимальным смещением были получены в статьях [15—18]. ЛИТЕРАТУРА 1. Колмогоров А. Н. Статистический приемочный контроль при допустимом числе дефектных изделий, равном нулю. Л., 1951, с. 1—24. 2. Сираждинов С. X. Одинарный статистический приемочный контроль.— Тр. Ин-та математики и механики АН УзССР, 1955, вып. 15, с. 41—56. 3. Беляев Ю. К. Вероятностные методы выборочного контроля. М.: Наука, 1975. 4. Лумелъский Я. П. Статистические оценки результатов контроля качества» М.: Изд-во стандартов, 1979.
Статистическое прогнозирование (А. М. Яглом) 523 5. Беляев Ю. К. Последующие оценки при выборочном контроле по качественному признаку с ошибками классификации.— ДАН СССР, 1976, т. 231 у № 3, с. 521—524. 6. Liberman G. /., Resnikoff G. J. Sampling plans for inspection by variables.— J. Amer. Statist. Assoc, 1955, vol. 50, N 270, p. 457—516. 7. ЛумеЛъский Я. П. Несмещенные достаточные оценки вероятностей в случае многомерного нормального закона.— Вестн. МГУ. Математика, 1968г № 6, с. 14—17. 8. Лумелъский Я. П., Сапожников П. Н. Несмещенные оценки для плотности распределений.— Теория вероятностей и ее применения, 1969, т. 14, № 2, с. 372—380. 9. Ghurye S. G., Olkin J. Unbiased estimation of some multivariate probability densites and related functions.— Ann. Math. Statist., 1969, vol. 40, N 4, p. 1261—1271. 10. Абусев P. Α., Лумелъский Я. П. Несмещенные оценки и задачи классификации многомерных нормальных совокупностей.— Теория вероятностей и е& применения, 1980, т. 25, № 2, с. 381—389. И. Girshick Μ. Α., Mosteller F., Sawage L. J. Unbiased estimates for certain binomial sampling problems with applications.— Ann. Math. Statist., 1946, vol. 17, N 1, p. 13-23. 12. Линник Ю. Ζ?., Романовский И. В. К теории последовательного оценивания.— ДАН СССР, 1979, т. 194, № 2, с. 270—272. 13. Лумелъский Я. П. Случайные блуждания, отвечающие обобщенным урно- вым схемам.— ДАН СССР, 1973, т. 209, № 6, с. 1281—1284. 14. Беляев Ю. К., Мальков А. Н. Полнота семейств вероятностных мер при обследовании по планам первого вхождения.— ДАН СССР, 1975, т. 225, № 1, с. 27—30. 15. Сираждинов С. X. Об оценках с наименьшим смещением при биномиальном распределении.— Теория вероятностей и ее применения, 1956, т. 1, № 1, с. 168—174. 16. Большее Л. Н. Об оценках вероятностей.— Теория вероятностей и ее применения, 1960, т. 5, № 4, с. 453—457. 17. Беляев Ю. if., Лумельский Я. П. Оценивание полиномов на основе ограниченных планов в схемах случайных блужданий.— Изв. АН СССР. Техн. кибернетика, 1979, № 1, с. 61—67. 18. Беляев Ю. К., Дугина Т. Н. Об оценке суммарного числа дефектных изделий, проникших к потребителю при контроле с ошибками.— Электрон, техника. Сер. 8, 1980, № 5(83), с. 24—29, СТАТИСТИЧЕСКОЕ ПРОГНОЗИРОВАНИЕ (к № 18) (А. М. Яглом) Попытки статистического прогнозирования будущих значений тех или иных метеорологических параметров с помощью линейных уравнений регрессии, задающих искомое будущее значение интересующей нас величины Ау в виде простой линейной комбинации некоторых известных из наблюдений величин Δ#1? . . . . ., Ахк, относящихся к прошлому или настоящему времени, получили сравнительно широкое распространение в метеорологии начиная с 20-х годов этого столетия. (В дополнение к указанной А. Н. Колмогоровым статье Баура 1925 г. можно еще сослаться, например, на более поздние работы [1—6], содержащие ряд дополнительных ссылок.) Этот метод прогноза на первый взгляд кажется очень простым: он требует лишь предварительной оценки некоторого числа коэффици-
524 Комментар ии ентов корреляции, от которых зависят заранее нам неизвестные коэффициенты ап · · ·? ак уравнений регрессии, и не связан с громоздкими вычислениями типа тех, которые приходится производить при «динамическом прогнозе погоды», опирающемся на численное решение уравнений в частных производных, приближенно описывающих динамику атмосферы. Вся сложность здесь заключается лишь в удачном выборе предикторов Δ^1? . . ., Αχχ, т. е. тех характеристик атмосферы в прошлом и настоящем, значения которых используются для прогноза значения Δ у. Оказывается, однако, что выбор предикторов на самом деле представляет собой совсем но простую задачу. В самом деле, может казаться, что полезно брать побольше предикторов, так как тогда прогноз будет использовать очень большую исходную информацию и поэтому с большой вероятностью окажется достаточно хорошим. К сожалению, однако, используемые при расчете эмпирические значения коэффициентов корреляции г{ и i'ij между величинами Ау и Ах\, ί = 1, . . ., &, и между парами Ах\ и Axj, ί, i = 1, . . ., к, являются неточными и зависят от объема (и качества) тех эмпирических данных, которые имеются в нашем распоряжении. Поэтому также и те значения коэффициентов я1? . . ., %, при которых линейная комбинация а1Ах1 + . . . -{-α^Αχίί согласно этим данным лучше всего аппроксимирует значение Ау, не являются точными, т. е. наилучшими для всей генеральной совокупности случайных величин (Ахг, . . ., Δ#&, Ay), и в применении к последующей независимой выборке эти значения могут уже оказаться заметно менее удачными. Для того чтобы этого не произошло, подбор предикторов должен удовлетворять ряду специальных условий, из которых мы здесь остановимся лишь на двух самых важных. Прежде всего для того, чтобы точность определения коэффициентов а1? . . . . . ., а\ не (шла бы совсем уж низкой, общее число к предикторов должно быть достаточно малым но сравнению с объемом выборки, используемой для определения коэффициентов-ri, τ^ π сц; так, например, если объем выборки имеет порядок одной или немногих сотен, то число к не должно превосходить нескольких единиц. Это условие было интуитивно ясно уже первым исследователям в области статистического прогноза погоды (см., в частности, замечание А. Н. Колмогорова о том, что при использовании выборки, включающей 30—50 среднегодовых значений, число к, как правило, выбирается в пределах от трех и до семи); позже известный американский метеоролог Лоренц [4] назвал его «табу статистического прогноза». Однако, помимо того,, имеется еще одно очень существенное требование, разъяснению которого как раз и посвящена статья № 18 А. Н. Колмогорова и которое тем не менее до сих пор далеко не всегда принимается во внимание. Это второе требование состоит в запрещении перебора большого числа систем предикторов (пусть даже кажрая из них и содержит лишь по небольшому числу величин) с целью отбора лучшей из этих систем. Дело в том, что если мы перепробуем множество разных систем предикторов, то' с большой вероятностью хотя бы для одной из них эмпирическое значение сводного коэффициента корреляции данных предикторов с величиной Ау окажется сильно завышенным по сравнению с его истинным значением. В таком случае весьма вероятно, что именно эта система предикторов и будет выбрана для целей прогноза; однако в применении к последующей независимой выборке эмпирический коэффициент корреляции величин Ау и Аи — агАхг + . . . -{-а^Ах^ здесь почти наверное будет
Статистическое прогнозирование (А. М. Яглом) 525 уже значительно меньшим, чем в случае исходной выборки. А. Н. Колмогоров с полным основанием утверждал в своей статье, что подобное «вздувание максимального эмпирического коэффициента корреляции» очень часто будет иметь место при переборе большого числа систем предикторов и что оно вполне естественно объясняет неудачи многочисленных попыток использования линейных уравнений регрессии для целей долгосрочного прогноза погоды; в качестве «модельного примера», допускающего аккуратный расчет, им был проанализирован случай, когда все рассматриваемые величины имеют многомерное нормальное распределение вероятностей, исходная выборка имеет фиксированный объем N и проверяется i независимых систем из к предикторов, для каждой из которых сводный коэффициент корреляции с Ау принимает одно и то же значение р. При этом^значение λ такое, что максимальное значение эмпирического сводного коэффициента корреляции для наших i групп предикторов превзойдет λ с некоторой заранее заданной вероятностью (скажем, равной 1/2), быстро растет с ростом i и уже при умеренно больших значениях i оказывается значительно превосходящим ρ (см., в частности, таблицу, относящуюся] к случаю, когда N = 42, к = = 5 и i = 14). Отметим еще, что аккуратный вывод результатов Фишера, использовавшихся А. Н. Колмогоровым в его расчетах, в настоящее время может быть найден, например, в известной монографии [7]. Соображения, приведенные в статье А. Н. Колмогорова, делают довольно проблематичными и преимущества некоторых более новых методов статистического прогноза погоды, предложенных заметно позже опубликования рассматриваемой статьи. Типичным примером здесь является так называемый метод просеивания (screening procedure), пропагандировавшийся, в частности, Миллером (см., например, [4, 8]). Метод этот состоит в том, что сперва рассматривается очень большая совокупность предикторов, которая «просеивается» следующим образом. Сперва отбирается тот из предикторов (обозначим его Δ^), которому отвечает наибольший эмпирический коэффициент корреляции с прогнозируемой величиной Ау; затем тот из оставшихся (скажем, Ах2), который дает наибольший вклад в сводный коэффициент корреляции пары (Δ^, Ах2) с Ау; далее тот из оставшихся (скажем, Ах3), которому отвечает наибольший сводный* коэффициент корреляции трех величин (Δ^ΐ7 Ах2, Ах3) с Ау, и т. д. Обычно после нескольких шагов получаемая па следующем шаге добавка к сводному коэффициенту корреляции оказывается уже незначительной, так что процедуру вполне можно прекратить. Число к отобранных предикторов при этом, как правило, оказывается достаточно малым, чтобы не вступить в противоречие с «табу»; однако в силу соображений, опубликованных А. Н. Колмогоровым еще в 1933 г., в случае большой исходной совокупности возможных предикторов весьма вероятно, что для отобранных к из них эмпирическое значение сводного коэффициента корреляции лишь случайно окажется сравнительно большим, так что переход к независимой выборке здесь сразу же приведет к разочаровывающим результатам. Аналогично обстоит дело и в случае другого широко известного метода отбора лишь небольшого числа наиболее существенных предикторов — метода эмпирических ортогоналных функций, предложенного в работах [9, 10] (см. также [6, 11, 12]) и фактически совпадающего с методом главных компонент многомерного статистического анализа (ср. [7, гл. 11]). При применениях этого метода из исходного набора всевозможных «виртуальных предикторов» прежде
526 Комментарии всего отбирается их линейная комбинация иг = Δ#ΐ7 имеющая наибольшую изменчивость (т. е. дисперсию); далее рассматриваются лишь некоррелированные с их линейные комбинации предикторов и из них опять отбирается та комбинация и2 = Ах2, которая имеет наибольшую изменчивость, и т. д. Как правило, после отбора небольшого числа к линейных комбинаций иг, и2, . . ., щ изменчивость всех остальных оказывается уже столь малой, что их вполне можно уже не рассматривать. В случаях, когда исходное число всех допустимых предикторов оказывается сравнительно небольшим (как, например, в работе Обухова [10], где это число равнялось пяти), данный метод приводит к заметному упрощению расчетов (позволяя, например, ограничиться рассмотрением лишь двух наиболее существенных линейных комбинаций пяти переменных); если же, однако, сначала рассматривается очень много предикторов (например, все значения одного или нескольких метеорологических полей на большой сети станций или в узлах правильной сетки), то здесь опять оказываются уже приложимыми соображения А. Н. Колмогорова, заставляющие ожидать, что комбинации и1? . . ., щ будут оптимальными лишь для той выборки, по которой они рассчитывались, а при переходе κ независимой выборке результаты заметно ухудшатся. Вполне возможно, что именно этим обстоятельством объясняются некоторые разочаровывающие выводы о статистическом прогнозе с помощью эмпирических ортогональных функций, содержащиеся в работе [4]. В заключение подчеркнем, что работа А. Н. Колмогорова ясно показывает, насколько необходимым при разработке любых методов статистического прогноза погоды является тщательное изучение выборочных свойств используемых системЪредикторов. Такое изучение и было начато А. Н. Колмогоровым в 1933 г.; к сожалению, оно до сих пор еще включает очень много пока нерешенных вопросов. ЛИТЕРАТУРА 1. Baur F. Der gege nwartige Stand der meteorologischen Korrelationsforschung.— Meteor. Ztschr., 1930, Bd. 47, S. 42-52. 2. Baur F. Einfiihrung in die Grosswetterkunde. Wiesbaden, 1948. 3. Wadsworth G. P. Application of statistical methods to weather forecasting.— In: Compendium of meteorology. Boston, 1951, p. 849—855. 4. Lorenz E. N. Prospects for statistical weather forecasting.— Statist. Forecasting Proj. Final Rept. Cambridge (Mass.), 1959. 5. Яглом А. M. Статистические методы экстраполяции метеорологических полей.— В кн.: Тр. Всесоюз. науч. метеорологического совещ. Л.: Гидроме- теоиздат, 1963, т. 2 (Динамическая метеорология), с. 221—234. 6. Белое II. Н. Статистические методы численного прогноза погоды.— В кн.: Численные методы прогноза погоды. Л.: Гидрометеоиздат, 1975, с. 259, 386. 7. Андерсон Т. Введение в многомерный статистический анализ/Пер. с англ. М.: Физматгиз, 1963. 500 с. 8. Miller R. G. Statistical prediction by discriminant analysis.— Meteorol. Mo- nogr., 1962. Vol. 4, N 25. 54 p. 9. Lorenz E. N. Empirical ortogonal functions and statistical weather prediction.— Statist. Forecasting Proj. Sci. Rept N 1. Cambridge (Mass.), 1976. 49 p. 10. Обухов Α. Μ. О статистически ортогональных разложениях эмпирических функций.— Изв. АН СССР. Сер. геофиз., 1960, № 3, с. 432—439. 11. Мещерская А. В., Руховец Л. В., Юдин М. И., Яковлева Н. И. Естественные составляющие метеорологических полей. Л.: Гидрометеоиздат, 1970. 12. Фортус М. И. Метод эмпирических ортогональных функций и его применение в метеорологии. Метеорология и гидрология, 1980, № 4, с. 113—119.
О межслоевом размыве (А. Б, Вистелиус) 527 О МЕЖСЛОЕВОМ РАЗМЫВЕ (к № 37) (А. Б. Вистелиус) Задача, решенная А. Н. Колмогоровым в комментируемой статье, возникла при изучении продуктивной толщи Апшеронского полуострова и красноцветных нефтеносных отложений на Челекене. Эти толщи целиком сложены терриген- яыми образованиями. Среди них на Апшеронском полуострове содержатся редкие слои конгломератов; на Челекене толща состоит целиком из несков, алевритов и глин. В указанных отложениях видны углубления в нижележащих слоях, заполненные выступами вышележащих. Кроме того, в основании мощных песчаных слоев очень часто присутствуют фрагменты, сложенные глинами, тождественными по внешнему виду глинам подстилающего песчаный слой глинистого слоя. Эти фрагменты округлены и всеми исследователями рассматривалась как следы размыва нижележащего слоя при формировании вышележащего. Указанная картина особенно характерна для Челекена. Отмеченные особенности указанных толщ не оставляют сомнения в том, что при их формировании размыв нижележащих слоев часто имел место при образовании вышележащих слоев («межслоевой размыв»). Таким образом, для постановки задачи, решенной А. Н. Колмогоровым, действительно были серьезные основания и она полностью сохранила значение до настоящего времени. В то же •время необходимо иметь в виду, что в период публикации статьи А. Н. Колмогорова среди некоторых геологов было сильно убеждение, что мощности слоев в разрезе не зависят от того, из какого материала эти слои сложены. В общем случае это утверждение оказалось ошибочным. К тому же в момент публикации рассматриваемой статьи в геологических науках практически отсутствовали такие понятия, как случайная величина, функция распределения вероятностей, последовательность значений случайной величины. Это был период начала создания научной базы ряда геологических дисциплин на основе введения в них представления о стохастическом характере изучаемых этими науками величин. Этой принципиальной перестройке, приведшей в дальнейшем к возникновению математической геологии, сильно способствовала не только комментируемая статья, но и личные советы и высказывания А. Н. Колмогорова в период с 1945 по 1950 г. Для использования работы А. Н. Колмогорова при решении задач, связанных с механизмом слоеобразования, необходимо выполнение трех условий; а) уметь находить численные решения предложенного им уравнения, б) при изучении конкретных разрезов проверять приложимость аксиоматики, принятой А. Н. Колмогоровым и отнюдь не имеющей, с современной точки зрения, универсального характера и в) располагать моделью слоеобразования, дающей G (х). Эта модель для полноценной работы должна выводиться из условий слоеобразования и давать возможность проверки ее непротиворечивости на материале наблюдений. Условие а) не является сколько-нибудь ограничивающим. Уравнение А. Н. Колмогорова совпадает с уравнением Винера — Хопфа, по численным же методам решения последнего имеется многочисленная литература. Незави-
528 Комментарии симо от этого в конце 40-х годов уже имелось достаточное число методов для решения указанной задачи. Соответствующий алгоритм был подобран сразу же после публикации статьи А. Н. Колмогорова, и с его помощью был рассчитан целый ряд примеров. Эти данные не были опубликованы, так как было невозможно соответственно принять ту или иную функцию за G (х). Аксиоматика, принятая А. Н. Колмогоровым (условие б)), заключается в следующем. 1. Случайные величины δη и φη+χ взаимно независимы и все δη имеют один и тот же закон распределения Ρ{δη < χ}:'= G (χ). οο 2. Математические ожидания Μδη = \ xdG (χ) положительны. —οο 3. Распределение величин δη непрерывно, т. е. выражается через соответ- χ ствующую плотность вероятности g (χ) по формуле G (х) = \ g (x) dx. —οο Напомним, что δη это разность между мощностью накопленного осадка и последующей глубиной размыва этого осадка, непосредственно следующей за окончанием его накопления. Последовательность слоев, наблюдаемая в разрезе, может иметь отдельные слои с мощностями, содержащимися в· последовательности δη. Как идентифицировать слои с мощностями из последовательности δη при полевых работах (описании разреза), неясно. Положения 2) и 3) рассматриваемой аксиоматики не вызывают сомнений с геологической точки зрения. Однако при анализе положения 1) необходимо учи* тывать следующие факты, полученные после публикации работы А. Н. Колмогорова. При этом, по-видимому, реально считать, что: 1) при изучении конкретных разрезов в них могут доминировать слои, подвергшиеся одному размыву и содержащиеся в последовательности δη, и 2) при отложении пачек песчаных слоев значения ηη играют решающую роль при окончательном определении мощности слоя. При отложении последовательностей глинистых слоев во многих случаях Лп = 0. Если сказанное справедливо, то путем изучения разрезов толщ г/ри1 полевых исследованиях можно в какой-то мере оценить пункт 1) рассматриваемой аксиоматики. В этом направлении на основании изучения разрезов красноцвет- ной и продуктивной толщ, а также флиша северо-западного Кавказа, Кахетии и Ю. Урала можно привести следующие данные. Для слоев различного состава, как правило, средние мощности слоев различны. Так, для красноцветной толщи Челекена установлено,|что песчаные слои имеют среднюю мощность 84,11 см при оценке стандарта 188,34 и асимметрии +5,0 (при числе- слоев η = 318), соответственно алевриты 15,22: 16,93 и +2,7 (п = 471) и глины 27,66; 53,23 и +8,0 (п = 792). Выборочные корреляционные функции для последовательностей мощностей слоев делятся на два типа Б и Φ (Вистелиус [2]). Тип Б, у которого все коэффициенты автокорреляции положительны и монотонно убывают с ростом расстояния s между слоями (в числе слоев). В типе Φ нечетные коэффициенты автокорреляции отрицательны, а четные положительны. С ростом s последовательности как четных, так и нечетных коэффициентов автокорреляции быстро мопотонго
О межслоевом размыве (А. Б. Вистелиус) 529 убывают по абсолютной величине. Таким образом, если в разрезе действительно доминируют слои с мощностями из бп, то предположение о независимости δη может быть поставлено под сомнение. * Интересно отметить следующее. Пусть Е (*β, *θ+1Κ=ΐ» as+r==j) - Ε (z8\a8=i, as+r==ij) Ε (^+r|a8=si, as+r==j) = 0, где a — состав слоя, ί, / — элементы множества составов слоев, χ — мощность слоя, s — номер слоя от подошвы разреза иг — расстояние между слоями. В этом случае у простых цепей Маркова на двух состояниях (скажем, песок и глина), каждому из которых отвечает случайная величина (мощность слоя) с различными математическими ожиданиями для каждого состояния (т. е. средние мощности песчаных слоев отличаются, скажем, от средних мощностей глинистых слоев), возможны только три типа коррелограмм: либо коррелограмма относится к типу Б, либо к типу Ф, либо все ее значения равны нулю (Вистелиус [4]). Последнее утверждение показывает, что в тех последовательностях слоев, в которых размыв осуществлялся после отложения слоя только один раз и при этом слой' не уничтожался, последовательность состава слоев в которых была неотличима от простой цепи Маркова и коррелограмма относилась к типу Φ можно найти участки, в которых следующие друг за другом слои будут иметь одну и ту же g (χ) и удовлетворять условию независимости δη. Нечто похожее наблюдалось в разрезе флиша с Ю. Урала. Здесь последовательность из 1530 слоев (описание Бежаева) близка к однородной простой цепи Маркова и имеет корре- лограмму типа Φ со следующими выборочными значениями коэффициентов автокорреляции —0,23 0,17 —0,19 0,07 —0,09 0,05 0,02 (Вистелиус [3]). В таблице приведены оценки коэффициентов корреляции между мощностями слоев, расположенных рядом (s + 1) и через слой (s + 2) для фиксированных составов слоев: Значения выборочных коэффициентов автокорреляции между мощностями слоев фиксированного состава Состав слоя на s7u месте π a Τ Состав слоя на s-f-1-м месте π 0,3 195 a 0,22 43 -0,11 502 Υ 0,24 153 0,17 543 0,35 87 Состав слоя на s-f-2-м месте π -^0,04 46 0,07 125 0,06 21 а 0,09 94 0,18 357 -0,01 94 У 0,28 57 0,27 61 0,19 667 где π — песчаные, а — алевритовые и γ — глинистые слои, составы которых указаны входами в таблицу. Внутри таблицы в числителе коэффициент автокорреляции между мощностями слоев соответствующего состава, в^знаменателе —
530 Комментарии число наблюденных пар слоев. Прочерк в таблице означает, что число сравниваемых пар было меньше пяти. Из таблицы видно, что слои, сложенные песками и алевритами, в первом приближении дают возможность провести выборку так, чтобы обеспечить независимость δη, если они слагают подавляющую часть разреза. Резюмируя, можно отметить, что реально наблюдаемые соотношения между мощностями слоев таковы, что, приступая к* анализу последовательности слоевг совершенно необходимо самым тщательным образом проверять условие 1) аксиоматики А. Н. Колмогорова. При этом возможны случаи, как удовлетворяющие аксиоматике (особенно если построить специальную процедуру опробования и отнести вопрос не ко всем слоям, а только к некоторым их типам (скажем, пескам)), так и противоречащие ей. Нужны также специальные исследования робастности модели, т. е. того, как нарушение аксиоматики сказывается на окончательных геологических выводах. Если проблема выполнения аксиоматики в конце концов сводится к проблеме робастности модели и необходимости разработки специальных процедур отбора слоев для удовлетворения условий А. Н. Колмогорова, то вопрос о выборе g (χ) в конкретных исследованиях значительно сложнее. Поскольку среди δη могут быть ненаблюдаемые величины, g (χ) может быть найдена только из модели слоеобразования, построенной на соответствующих литолотических (седи- ментологических) предпосылках. Пока попытки построения такой модели не привели к действительно полноценным результатам. Статья А. Н. Колмогорова опередила свое время, и только в 1962 г., когда значение математики,для геологии стало пониматься и приобрела права гражданства математическая геология, возник интерес к рассматриваемому исследованию. Оно появилось в списке литературы в первой же книге, посвященной приложению статистических методов в геологии (Миллер и Кан [7]) π затем фигурировало во всех серьезных изданиях подобного рода (Агтерберг [1]). К сожалению, в этих общих руководствах на рассматриваемую статью содержались только общие ссылки. Разбор ее отсутствовал. В 1975 г. вышла монография Шварцахера [8]. В ней впервые приведен разбор статьи А. Н. Колмогорова. Шварцахер рассмотрел соответствующую модель для дискретного случая, используя методы теории случайного блуждания. Были также наложены более жесткие условия на независимость. В литературе, посвященной конкретным исследованиям, имеются два рода публикаций, базирующихся на комментируемой работе. В одних никакого анализа соответствия аксиоматики А. Н. Колмогорова конкретным условиям формирования разрезов не проводится. Не делается также попытки предметно обосновать ввод плотности g (x). Иными словами, используется не постановка задачи, а алгоритм, вытекающий из статьи А. Н. Колмогорова. При этом забывается, что использовать этот алгоритм допустимо только после тщательных исследований условий осадкообразования. Среди этих работ имеется, в частности, публикация, рекомендующая для оценки размыва специальный «коэффициент Колмогорова» (Мизутани и Хаттори [6]). В 1979 г. появилась первая в литературе статья, в которой обсуждается аксиоматика А. Н. Колмогорова и приводятся данные о типе G (я), возникающем при некоторых специальных условиях (Дасей [5]). Дасей принимает, что ζη
О межслоевом размыве (А. Б. Вистелиус) 531 и % — независимые и одинаково распределенные случайные неотрицательные величины. Кроме того, ξη и т)п независимы друг от друга. При этих условиях оказывается, что при ξη и ηη, имеющих в непрерывном случае показательное (в дискретном соответственно геометрическое) распределение, остатки слоев от размывов, сохранившиеся в разрезе, также подчинены этому распределению. В статье Дасей не приводится никакого геологического материала, и важность для геологии рассмотренного им случая ничем не подтверждается. Однако эту работу следует выделить, так как она содержит сознательный разбор исследования А. Н. Колмогорова. Статья А. Н. Колмогорова, как мы отметили, сильно опередила время и еще далеко до того, чтобы широкие круги геологов осознали важность этого выдающегося результата, равно как и всего подхода в целом, реализованного в нем. Между тем есть целый ряд разделов седиментологии (литологии), развитие которых невозможно без разработки всего цикла проблем, поднятых рассматриваемой работой. Хотелось бы надеяться, что это будет понято и тем самым обеспечен прогресс в ряде важных разделов геологической науки. ЛИТЕРАТУРА i. Agterberg F. P. Geomathematics. Amsterdam: Elsevier, 1974. 596 p. 2. Вистелиус А. Б. Материалы к литостратиграфии продуктивной толщи Азербайджана. М.: Изд-во АН СССР, 1961. 157 с. 3. Вистелиус А. Б. Красноцветные отложения полуострова Челекен (литология). Л.: Наука, 1966. 304 с. 4. Вистелиус А. Б. Основы математической геологии. Л.: Наука, 1980. 389 с. 5. Dacey Μ. F. Models of bed formation.— Intern. Assoc. Math. Geol. J., 1979, vol. 11, iss. 6, p. 655—668. 6. Mizutani S., Hattori I. Stochastic analysis of bed-thickness distribution of sediments.— Intern. Assoc. Math. Geol. J., vol. 4, iss. 2, p. 123—146. 7. Miller R. L., Kahn J. S. Statistical analysis in the geological sciences. New- York: J. Wiley, 1962. 483 p. 8. Schwarzacher W. Sedimentation models and quatitative stratigraphy. Amsterdam: Elsevier, 1975. 382 p.
СОДЕРЖАНИЕ От редакции $ П. С, Александров. Несколько слов об А. Н. Колмогорове ... 4 1. О сходимости рядов, члены которых определяются случаем 7 2. О законе больших чисел 16 3. Об Одной предельной формуле А. Хинчина 1& 4. О суммах независимых случайных величин 20 5. О законе повторного логарифма 34 6. О законе больших чисел 44 7. Общая теория меры и исчисление вероятностей 48- 8. Об усиленном законе больших чисел .... 59' 9. Об аналитических методах в теории вероятностей .... 60 10. Проблема ожидания - 106 11. Метод медианы в теории ошибок Ш 12. Одно обобщение теоремы Лапласа—Ляпунова 114 13. Об общей форме стохастического однородного процесса (Проблема Бруно де финетти) 117 14.. К вычислению средней броуновской площади 124 15. Об эмпирическом определении закона распределения . . . 134 16. О предельных теоремах теории вероятностей 141 17. К теории непрерывных случайных процессов 149 18. К вопросу о пригодности найденных статистическим путем формул прогноза 161 19. Случайные движения (К теории броуновского движения) . 168 20. Уклонение от формул Харди при частичной изоляции . . 170 21. К теории цепей Маркова 173 22. К статистической теории кристаллизации металлов . . . 178 23. Цепи Маркова со счетным числом возможных состояний 183 24. Об обратимости статистических законов природы .... 197 25. К решению одной биологической задачи 204 26. Об одном новом подтверждении законов Менделя .... 209 27. Стационарные последовательности в гильбертовом пространстве 215 28. Интерполирование и экстраполирование стационарных случайных последовательностей 255 29. О логарифмически нормальном законе распределения размеров частиц при дроблении 264 30. К обоснованию метода наименьших квадратов 267 31. Одна формула Гаусса из теории метода наименьших квадра- ' 283
Содержание 533 32. Ветвящиеся случайные процессы 288 33. Вычисление финальных вероятностей для ветвящихся случайных процессов 294 34. Статистическая теория колебаний с непрерывным спектром 299 35. О суммах случайного числа случайных слагаемых ..... 308 36. Локальная предельная теорема для классических цепей Маркова 313 37. Решение одной задачи из теории вероятностей, связанной с вопросом о механизме слоеобразования 335 38. Несмещенные оценки 340 39. К вопросу о дифференцируемости переходных вероятностей в однородных по времени процессах Маркова со счетным числом состояний. 363 40. Обобщение формулы Пуассона на случай выборки из конечной совокупности 371 41. Некоторые работы последних лет в области предельных теорем теории вероятностей 373 42. О сходимости А. В. Скорохода 384 43. Две равномерные предельные теоремы для сумм независимых слагаемых 393 44. Случайные функции и предельные теоремы 404 45. О свойствах функций концентрации П. Леви 419 46. Переход ветвящихся процессов в диффузионные и примыкающие задачи генетики (Обзорный доклад) 425 47. О классах Ф(п) Форте и Блан-Лапьера 428 48. Об условиях сильного перемешивания гауссовского стационарного процесса 429 49. Случайные, функции нескольких переменных, почти все реализации которых периодичны 435 50. Об оценке параметров комплексного стационарного гауссовского марковского процесса 436 51. О приближении распределений сумм независимых слагаемых неограниченно делимыми распределениями 441 52. Оценки спектральных функций случайных процессов . . 458 53. О логических основаниях теории вероятностей 467 КОММЕНТАРИИ А. Н. Колмогоров; К работам по теории вероятностей и математической статистике 472 Аналитические методы в теории вероятностей (А. Д. Вентцелъ) 474 Марковские процессы со счетным числом состояний (Б. А. Севастьянов) 478 Однородные случайные процессы (В. М. Золотарев) 478 Однородные марковские процессы (А. А. Юшкевич) 480 Ветвящиеся процессы (Б. А. Севастьянов) 485 Стационарные последовательности (Ю. А. Розанов) 486 Стационарные процессы (В. А. Статулявичус) 489 Статистика процессов (А. Н. Ширяев) 490 Спектральная теория стационарных процессов (А. М. Яглом) 491
534 Содержание Спектральное представление случайных процессов (Ю. Г. Ба- ласанов, И. Г. Журбенко) 496 Броуновское движение (А. М. Яглом) 498 Цепи Маркова со счетным числом состояний (А. А. Юшкевич) . 503 Тождества Вальда (А. А. Новиков) 508 S-сходимость (А. В. Скороход) 510 Равномерные предельные теоремы (Т. В. Арак) 510 Функции концентрации (В. М. Круглое) 511 Эмпирические распределения (Э. В. Хмаладзе) 514 Метод наименьших квадратов (М. Б. Малютов) 520 Несмещенные оценки (Ю. К. Беляев, Я. П. Лумельский) . . . 522 Статистическое прогнозирование (А. М. Яглом) 523 О межслоевом размыве (А. Б. Вистелиус) 527
Андрей Николаевич Колмогоров ТЕОРИЯ ВЕРОЯТНОСТЕЙ И МАТЕМАТИЧЕСКАЯ СТАТИСТИКА Утверждено к печати Отделением математики Академии наук СССР Редактор В. И. Битюцков Редактор издательства Н. Н. Лезнова Художественный редактор С. А. Литвак Технические редакторы 3. Б. Швлюк, Н. Н. Плохова Корректор И. А. Талалай И Б № 31444 Сдано в набор 12.12.85 Подписано к печати 3.04.86 Т-09606. Формат бОХЭО*/™ Бумага кн.-журнальная* Гарнитура обыкновенная новая Печать высокая Усл. печ. л. 33,6. Усл. кр. отт. 34,6. Уч.-изд. л. 35,5 Тираж 7000 экз. Тип. зак. 2155 Цена 2 р. 80 к. Ордена Трудового Красного Знамени издательство «Наука» 117864 ГСП-7, Москва В-485, Профсоюзная ул., 90 2-я типография издательства «Наука», 121099, Москва, Г-99, Шубинский пер., 6
В ИЗДАТЕЛЬСТВЕ «НАУКА» ВЫШЛА ИЗ ПЕЧАТИ КНИГА: Колмогоров А. Н. ИЗБРАННЫЕ ТРУДЫ МАТЕМАТИКА И МЕХАНИКА 30 л. 3 р. 50 к. В издание включены основные работы академика А. Н. Колмогорова по тригонометрическим и ортогональным рядам, теории меры и интеграла,* теории. приближений, математической логике, дифференциальным уравнениям, геометрии, топологии, функциональному анализу, суперпозициям функций, дескриптивной теория множеств, теории турбулентности, классической механике и некоторым другим вопросам. Издание рассчитано на математиков — научных работников, преподавателей, аспирантов, студентов. Книги можно предварительно заказать в магазинах «Академкнига». Для получения книг почтой заказы просим направлять по одному из перечисленных адресов: 117192 Москва, Мичуринский проспект, 12, магазин «Книга — почтой» Центральной конторы «Академкнига»; 197345 Ленинград, Петрозаводская ул., 7, магазин «Книга — почтой» Северо-Западной конторы «Академкнига» ; 252030 Киев, ул. Пирогова, 4, магазин «Книга — почтой» Украинской конторы «Академкнига» или в ближайший магазин «Академкнига».