Текст
                    ТЕОРИЯ ВЕРОЯТНОСТЕЙ
И МАТЕМАТИЧЕСКАЯ СТАТИСТИКА
С. М. ЕРМАКОВ
МЕТОД
МОНТЕ-КАРЛО
И СМЕЖНЫЕ
ВОПРОСЫ
ИЗДАНИЕ 2-е, ДОПОЛНЕННОЕ
ИЗДАТЕЛЬСТВО «НАУКА»
ГЛАВНАЯ РЕДАКЦИЯ
ФИЗИКО-МАТЕМАТИ ЧЕСКОЙ ЛИТЕРАТУРЫ
МОСКВА 1975


517.8 Е 72 УДК 519.21 Метод Монте-Карло и смежные вопросы, изд. 2-е, С. М.Ермаков, Главная редакция физико-математической литературы изд-ва «Наука», 1975. Книга охватывает круг вопросов, связанных с методом Монте-Карло и его многочисленными приложениями. В ее основу положен курс лекций, который читался автором в течение ряда лет на матема- тико-механическом факультете Ленинградского университета. Второе издание существенно дополнено. Заново написаны главы, связанные с моделированием процессов Маркова. Впервые подробно излагаются методы решения многомерныхднелинеиных интегральных уравнений и некоторые вопросы повышения эффективности моделирования систем^массового обслуживания. Остальные главы частично переработаны и дополнены. Илл.—16. Библ.—724 назв. 1? 20203—136 пп (ф Главная редакция П^Ч (П9\ 7е; '3-75 физико-математической литературь V06 (UZJ-7J) ИЗд-ва «Наука», 1975 г-
ОГЛАВЛЕНИЕ Предисловие 5 Из предисловия к 1-му изданию 6 Глава 1. Введение 7 § 1. Определение метода. Предыстория 7 § 2. Некоторые определения и факты из теории вероятностей 10 § 3. Некоторые сведения из математической статистики. Общая схема метода Монте-Карло 25 Глава 2. Моделирование распределений 38 § 1. Независимые равномерно распределенные случайные величины 38 § 2. Общие методы моделирования неравномерных распределений 49 § 3. Специальные методы моделирования неравномерных распределений 62 Глава 3. Имитация 81 § 1. Прохождение излучения через вещество 81 § 2. О моделировании систем массового обслуживания 96 § 3. Другие примеры. Замечания о постановке задач и структуре моделей 106 Глава 4. Методы приближенного вычисления интегралов 120 § 1. Квадратурные формулы в классах функций и метод Монте-Карло 121 § 2. Некоторые общие методы уменьшения дисперсии. Случайные интерполяционно-квадратурные формулы 137 § 3. Общая постановка задачи и понятие допустимости 162 § 4. Случайные квадратурные формулы с одним свободным узлом 171 § 5. Другие квадратурные формулы. Последовательные процедуры 189 Глава 5. Приближение средних значений случайных функций 202 § 1. Постановка задачи. Результаты относительно приближений в метрике непрерывных функций . . . 202 § 2. Приближение неизвестной плотности в метрике Li (\i) 208 1*
ОГЛАВЛЕНИЕ § 3. Планирование эксперимента. Связь со случайными квадратурными формулами 215 § 4. Сведение к задачам линейного программирования 233 § 5. Стохастическая аппроксимация и экстремальные задачи 241 Глава 6. Цепи Маркова и интегральные уравнения . . . 258 § 1. Цепи Маркова с конечным числом состояний . . 258 § 2. Схема Неймана — У лама и ее обобщения ... 271 § 3. Повышение эффективности метода Монте-Карло при решении интегральных уравнений 293 § 4. Некоторые приложения 308 Глава 7. Другие задачи, связанные с моделированием цепей Маркова 321 § 1. Методы решений нелинейных уравнений 321 § 2. Стационарные распределения и собственные функции линейных операторов 340 § 3. Методы решения дифференциальных уравнений . . 360 Глава 8. Вопросы, связанные с теорией чисел .... 373 § 1. Равномерно и вполне равномерно распределенные последовательности. Понятие об арифметическом моделировании случайных процессов 373 § 2. О линейных рекуррентных процедурах получения псевдослучайных чисел 390 § 3. Приближенное интегрирование и метод Монте- Карло. Метод «квази-Монте-Карло» 412 Литература (основная) 418 Литература (дополнительная) 438 Предметный указатель 469
ПРЕДИСЛОВИЕ Настоящее второе издание существенно дополнено. Главы 6 и 7 написаны заново. Главы 3, 5 и 8 частично переработаны и дополнены. Некоторые добавления сделаны и в остальные главы. Приятно отметить, что за время, прошедшее с момента выхода в свет 1-го издания, появилось значительное число оригинальных работ, развивающих вероятностные методы в вычислительной математике. Возникли также новые приложения метода Монте-Карло. К сожалению, прикладные работы публикуются в большом количестве разрозненных ведомственных изданий и реферируются различными реферативными журналами. По этой причине ряд работ может быть не упомянут ни в основном, ни в дополнительном списке литературы. Можно отметить определенное уточнение основных концепций метода Монте-Карло, которое нашло отражение в настоящем издании. Вместе с тем возможности метода еще явно не исчерпаны, и круг задач, где целесообразно его применение, еще не вполне очерчен. В ближайшем будущем можно ожидать в этой области появления значительного числа интересных работ как теоретического, так и прикладного характера. Я благодарен всем лицам, замечания которых содействовали улучшению изложения и устранению неточностей. В особенности это относится к сотрудникам лаборатории теории вероятностей НИИ математики и механики Ленинградского университета
ИЗ ПРЕДИСЛОВИЯ К 1-му ИЗДАНИЮ Книга представляет собой несколько расширенный курс лекций, который был прочитан автором на матема- тико-механическом факультете Ленинградского государственного университета. Как известно, метод Монте-Карло слагается из трех составных частей. Это, во-первых, моделирование случайных величин с заданным законом распределения, во-вторых, построение вероятностных моделей реальных процессов (систем) и, наконец, задачи статистической теории оценивания. Непосредственное моделирование реального процесса далеко не всегда приводит к успеху, и в этих случаях возникает задача создания некоторой «фиктивной» модели, которая позволила бы решить поставленную задачу более эффективно. Основное внимание в книге уделяется ятой последней задаче, а также специальным задачам статистической теории оценивания, которые возникают в методе Монте-Карло. Книга не является ни в коей мере исчерпывающим трактатом по методу Монте-Карло. Ряд вопросов затронут бегло, и часть материала имеет форму обзора. Автор надеется, однако, что вопросы, связанные с ролью статистической теории оценивания в методе Монте-Карло, и задача уменьшения дисперсии охвачены достаточно полно. Параграф 4 главы 4 написан совместно с Б. Л. Грановским. Беседы с Г. А. Михайловым, И. М. Соболем, Н. Н. Ченцовым оказали существенное влияние на трактовку автором многих вопросов метода Монте-Карло. Автор глубоко признателен всем перечисленным лицам и в особенности Н. Н. Ченцову, замечания которого позволили устранить ряд недостатков рукописи. Автор глубоко благодарен Ю. В. Линнику и Г. И. Мар- чуку, которые оказали непосредственное влияние на формирование научных интересов автора, нашедших отражение в данной книге.
ГЛАВА 1 ВВЕДЕНИЕ § 1. Определение метода. Предыстория Метод Монте-Карло можно определить как метод моделирования случайных величин с целью вычисления характеристик их распределений. Как правило, предполагается, что моделирование осуществляется с помощью электронных вычислительных машин (ЭВМ), хотя в некоторых случаях можно добиться успеха, используя приспособления типа рулетки, карандаш и бумагу. Определение метода можно сделать более общим, говоря не о случайных величинах, а о случайных функциях. Такого рода обобщение несущественно при цифровом моделировании, где моделирование случайных функций сводится тем или иным путем к моделированию последовательности случайных величин, но может быть необходимым при рассмотрении моделирования с помощью специализированных или гибридных вычислительных машин. Идея моделирования случайных явлений, как известно, очень стара и, по мнению некоторых авторов (например, Холтон [3]), восходит ко временам Древнего Вавилона и Ветхого Завета. Что же касается использования такого рода явлений для целей приближенных вычислений, то первой работой в этой области принято считать работу Холла [1] A873 г.) о вычислении числа п с помощью случайных бросаний иглы на разграфленную параллельными линиями бумагу. Задача эта широко известна, и ее описание можно найти в руководствах по еории вероятностей (например, Прохоров, Розанов [1], стр. 17). Существо дела заключается в том, чтобы экспериментально воспроизвести событие, вероятность которого выражается через число п, и приближенно
8 ВВЕДЕНИЕ [ГЛ. 1 оценить эту вероятность. Можно назвать также ряд более поздних работ, в которых до появления ЭВМ использовались по существу идеи метода Монте-Карло. (Довольно подробно об этом сказано в книге Хаммерсли и Хэнд- скомба [1].) Идеи эти не получили заметного развития вплоть до 1944 г., когда в связи с работами по созданию атомной бомбы Дж. фон Нейман предложил широко использовать аппарат теории вероятностей для решения прикладных задач с помощью ЭВМ. Первая раоота, где этот вопрос систематически излагался, принадлежит Мет- рополису и У ламу [1]. Первые отечественные работы по методу Монте-Карло появились в 1955 году (Чавчанидзе [1], [2], Шрейдер [1]). В настоящее время имеется более двух тысяч работ, где исследуются теоретические основы метода или рассматриваются его применения к конкретным задачам. Полная библиография даже за ограниченный период времени вряд ли существует. Это объясняется гем, что метод используется для решения прикладных задач из большого числа областей науки и техники, и соответствующие работы, выполненные на очень разном уровне, рассеяны по многочисленным отраслевым журналам и изданиям. Первоначально метод Монте-Карло использовался главным образом для решения задач нейтронной физики, где традиционные численные методы оказались малопригодными. Далее его влияние распространилось на широкий круг задач статистической физики, очень разных по своему содержанию. К разделам науки, где все в большей мере используется метод Монте-Карло, следует отнести задачи теории массового обслуживания, задачи теории игр и математической экономики, задачи теории передачи сообщений при наличии помех и ряд других. Метод Монте-Карло оказал и продолжает оказывать существенное влияние на развитие методов вычислительной математики (например, развитие методов численного интегрирования) и при решении многих задач успешно сочетается с другими вычислительными методами и дополняет их. Его применение оправдано в первую очередь в тех задачах, которые допускают теоретико-вероятностное описание. Это объясняется как естественностью получения ответа с некоторой заданной вероятностью в зада-
§ 1] ОПРЕДЕЛЕНИЕ МЕТОДА. ПРЕДЫСТОРИЯ чах с вероятностным содержанием, так и существенным упрощением процедуры решения. Трудность решения той или иной задачи на ЭВМ определяется в значительной мере трудностью переложения ее на «язык» машины. Создание языков автоматического программирования существенно упростило один из этапов этой работы. Наиболее сложными этапами в настоящее время следует считать математическое описание исследуемого явления, необходимые упрощения задачи, выбор подходящего численного метода, исследование его погрешности и запись алгоритма. В тех случаях, когда имеется теоретико-вероятностное описание задачи, использование метода Монте-Карло может существенно упростить упомянутые промежуточные этапы. Впрочем, как будет следовать из дальнейшего, во многих случаях полезно и для задач детерминированных строить вероятностную модель (рандомизовать исходную задачу) с тем, чтобы далее использовать метод Монте-Карло. Несмотря на то, что определение метода Монте-Карло было нами сформулировано, содержание метода, как обычно, будет выяснено при дальнейшем изложении. Нами всюду будет употребляться термин «метод Монте- Карло», который равнозначен термину «метод статистических испытаний», также принятому в отечественной литературе. В зарубежной литературе обычно говорят о методах Монте-Карло, имея в виду то обстоятельство, что подлежащие вычислению величины могут быть оценены, исходя из различных вероятностных моделей (например, случайные величины с различными законами распределения могут иметь одинаковое среднее значение). Представляется, однако, более последовательным говорить о различных моделях и их преобразованиях в рамках одного метода. Часто, когда речь идет об изучении некоторых реальных явлений, то моделирование связанных с ними случайных величин процессов называют имитацией (simulation). Мы также будем иногда употреблять термин «имитация», чтобы подчеркнуть связь соответствующей модели с некоторым реальным явлением, хотя создание вероятностной модели явления неизбежно предшествует моделированию, и речь может идти лишь о большей или меньшей тщательности описания.
10 ВВЕДЕНИЕ ttJl. 1 § 2. Некоторые определения и факты из теории вероятностей Ниже формулируются определения и факты из теории вероятностей, которые либо имеют большое значение для излагаемого далее материала, либо сравнительно редко встречаются в распространенной литературе. Метод Монте- Карло в той же мере базируется на теории вероятностей и математической статистике, в какой другие вычислительные методы базируются на классическом (и функциональном) анализе. По этой причине очень трудно ограничиться определенным кругом фактов из теории вероятностей, сосредоточив их в одном параграфе. Здесь приводятся факты, имеющие общий характер, а другие будут сообщаться далее в связи с конкретными их приложениями. Для дальнейшего очень важно подчеркнуть, что возможности метода Монте-Карло в полной мере проявляются при вычислении интегралов по сложным вероятностным мерам. Именно через такого рода интегралы выражается решение очень многих прикладных задач. И хотя при первом чтении читатель, не имеющий соответствующей подготовки, может вместо интеграла ^ / (х) [г (dx) мысленно подставлять \ / (х) р (х) dx или ^ f(xi)P(xi)i « i=i считая / (х) и р (х) > 0 непрерывными функциями на конечном промежутке [а, Ь], для полного овладения предметом необходимо понимание элементарных фактов, приводимых ниже. 1. Вероятностное пространство. Как обычно, будем исходить из задания вероятностного пространства (Q, 91, Р), где: 1) Q — некоторое заданное множество, называемое пространством элементарных исходов; его элементы называют также точками; 2) 91 — непустое множество подмножеств Q, являющееся в-алгеброй, т. е. замкнутым относительно операции суммирования (объединения) счетного числа своих элементов, счетного пересечения и дополнения множеством; предполагается, что Q (и, следовательно, пустое множество) является элементом %;
§ 2] ФАКТЫ ИЗ ТЕОРИИ ВЕРОЯТНОСТЕЙ И 3) Р — вероятностная мера, т. е. неотрицательная функция множеств из 3t такая, чтоТ(й) =[1 и Р|( 2 ^г I = оо = 2 Р(^г)> где Л* —последовательность попарно непере- секающихся множеств из 91. Кроме вероятностной меры, часто полезно рассматривать конечную меру jl, отличающуюся от вероятностной лишь нормировкой {Г (Q) = = const < + оо, и в-конечную меру fx, для которой |Х (Q) может иметь бесконечное значение, но все пространство ?} допускает представление в виде суммы счетного числа Гмножеств \Аг, обладающих конечной мерой (li D,) < + <*>> i = 1,2, ...). Стандартная схема определения меры на сг-алгебре состоит в том, что мера первоначально определяется непосредственно на более узкой совокупности множеств — полукольце, а затем распространяется на а-алгебру, которая содержит это полукольцо. Полукольцом называют совокупность множеств А, которая вместе с любыми двумя множествами, входящими в А, содержит их пересечение. При этом любое множество из А может быть представлено суммой не более чем счетного числа непересекающихся множеств А1У А2, ... из А. В частности, Q представимо в виде Q = []Аг. Существует минимальная г а-алгебра, содержащая данное полукольцо множеств А, т. е. такая, которая содержится в пересечении всех су-алгебр, содержащих А. Если iG^l — произвольное множество из 9(, A. S \}Аи где Аъ А*,, ... — множества из А, то, полагая i i где inf берется по всевозможным счетным наборам множеств Аг из А, для которых A cz \JAh получим продол- i жение меры fx с полукольца А на с-алгебру %. Такое продолжение единственным образом определяет ^-конечную меру на о-алгебре 91. Простейшим примером полукольца может служить совокупность интервалов [х'9 х") вещественной прямой.
12 ВВЕДЕНИЕ ЕГЛ. 1 Минимальная cr-алгебра, содержащая полукольцо указанных интервалов, носит название а-алгебры борелевских множеств прямой. Меру на полукольце интервалов можно задать равенством Р {[*', х")} = F (х") - F (*'), где F (х) (— оо < х < + оо) — произвольная неотрицательная непрерывная слева монотонно неубывающая функция такая, что = 0 и () Любая функция F, обладающая перечисленными свойствами, определяет вероятностную меру на борелевских множествах прямой. Далее в качестве^пространства Q будет, как правило, фигурировать либо 5-мерное евклидово пространство (s может быть бесконечным), либо линейное нормированноеУпространство функций, и будут рассматриваться сг-алгебрь\, порожденные полукольцом открытых множеств этих пространств. Такие а-алгебры носят названия а-алгебры борелевских множеств, а их элементы — борелевских множеств. Если (Qv 9(lf Pj) и (Q2, 212, P2) — два вероятностных пространства, то прямое (декартово) произведение QxxQ2 есть множество всех упорядоченных пар (со^ со2) (сох ЕЕ Qx, ю2 е Q2). Определим также произведение сг-алгебр %а, а = 5(х х 5{2 как наименьшую а-алгебру, содержащую полукольцо всевозможных прямоугольных множеств вида Ах х А.г (Ах €=9^, А2 е 9t2). Меру на указанном полукольце можно определить равенством и распространить на о-алгебру 9tA> 2\ Определенная таким образом мера Рг х Р2 носит название произведения мер Рх и Р2. Вероятностное пространство (пг х Q2, 5tx X 912, Рг X Р2) называют произведением вероятностных пространств (Qlf 9tx, Рх) и (Q2, 2i2, P2). Произведение произвольного числа вероятностных пространств может быть определено по индукции. 2. Измеримые функции, интеграл, производная. Введение меры на а-алгебре 91 позволяет сразу же определить интеграл на пространстве Q от измеримой вещественной
§ 2] ФАКТЫ ИЗ ТЕОРИИ ВЕРОЯТНОСТЕЙ 13 функции по схеме, вполне аналогичной схеме определения интеграла Лебега. Функцию g (со), (со е Q) называют ^-измеримой (или просто измеримой, когда ясно, о какой а-алгебре идет речь), если множество {со : ? (со) < х} принадлежит % для любого вещественного числа х. Измеримую функцию называют простой, если она принимает на Q не более счетного числа различных значений. Если множество {со : g (со) < х) является борелевским для всех х, что, как правило, предполагается, то ? (со)^называют борелев- ской функцией. Заметим, что класс борелевских функций в случае, когда Q есть линейное нормированное пространство R, совпадает с классом бэровских функций. Последний состоит из функций, определенных на i?, и содержит все функции, непрерывные на Л, а также все пределы последовательностей непрерывных функций, сходящихся в метрике R. Пусть Аг — последовательность непересекающихся множеств, на которых простая функция г\ (со) имеет постоянные значенияr\t. Можно показать, что эти множества измеримы, т) (со) называют интегрируемой, если ряд оо 2 | % IP {^i} сходится, и величину т|(<о)Р(*о)= & г=1 называют интегралом простой функции г\ по пространству Q. Произвольную измеримую функцию ? (со) можно представить как предел сходящейся [последовательности простых функций для всех со, за исключением лишь, может быть, некоторого множества со, имеющего меру [нуль, т. е. | (оо) = lim rjn (со) (со е О (mod P)). П->оо Здесь и далее обозначение (mod P) будет употребляться, когда некоторое свойство выполняется для всех элементов некоторого множества, за исключением множества Р-меры нуль, где Р — вероятностная или а-конечная мера. В этом случае, как обычно, будем говорить, что свойство выполняется для почти всех со относительно
14 ВВЕДЕНИЕ [ГЛ. 1 меры Р или выполняется с вероятностью 1, если Р — вероятностная мера. Интегрируемыми называются все измеримые функции \ (о), для которых конечна верхняя грань sup \ | т] (со) | Р (dco) \ по всем простым функциям т), для которых | т) | < | | |, Интеграл \ ? (со) Р {day) определяется далее как предел интегралов от простых функций т]п таких, что т)п (со) сходятся для всех (mod Р) со к ? (со) и | г\п | <^ | ? |. Интеграл по произвольному множеству А из 31 (неопределенный интеграл) существует, если интегрируема функция ?«Фа, где фл — индикатор множества А, т. е. о Для определенного таким образом интеграла выполняются обычные свойства интеграла Лебега по конечному промежутку, которые будут использоваться нами далее без подробного обоснования со ссылками на соответствующую литературу. Если ог-конечная мера |х (А) (А е Щ допускает представление в виде \ A.2.1) где / — неотрицательная интегрируемая функция, то / (со) называют производной Радона — Никодима меры \i по мере Р и употребляют обозначение /(ш) = -*й-(ш). A.2.2) Согласно теореме Радона — Никодима для заданных а-конечных мер \i и Р производная / (со) существует, т. е. имеет место представление A.2.1), в том и только в том слу-
§ 2] ФАКТЫ ИЗ ТЕОРИИ ВЕРОЯТНОСТЕЙ 15 чае, если |х абсолютно непрерывна по отношению к Р (и <^ Р), т. е. и$ равенства Р (А) = О, ie5(, следует ,1 (А) = 0. 3. Случайные величины и функции распределения. Пусть (Q, 9t, P) — вероятностное пространство. Множества А из Ч называют событиями, а величины Р (А) их вероятностями. [Случайной величиной, определенной на эхом пространстве, называется произвольная ^-измеримая вещественная функция I (со), принимающая конечные (mod P) значения. Случайные величины, отличающиеся на множестве Р-меры нуль, считаются равными. Для каждой случайной величины § (со) однозначно определяется функция распределения F% (х) = Р {© : g (©) < *}, A.2.3) представляющая собой монотонно неубывающую, неотрицательную, непрерывную слева функцию такую, что lim Ft (х) = 0, lim F* (х) = 1. Как указывалось ранее с помощью F% (x) также однозначно определяется вероятностная мера Р на борелевских множествах прямой. Последнюю называют также распределением случайной величины ? (со). Аналогично, если S = (!*!, . . ., ?s) — совокупность случайных величин, определенных на (Й, 3(, Р), т. е. векторная случайная величина, то функция Fe (х19 . . ., х8) = Р ( n называется совместной функцией распределения^величин 2i» •••»?• или функцией распределения векторной случайной величины S. Она однозначно определена в 5-мерном евклидовом пространстве, монотонно не убывает и непрерывна слева по каждой из переменных. Кроме того, lim Fa(*i, ...,*.) = 0 и lim FE (zl9 . . ., хь . . ., xs) = FEi (x±, . . ., zt), где в, = (ll9. . ., Б,),
16 ВВЕДЕНИЕ [ГЛ. 1 так что FEi (хг, . . ., xt) представляют собой функции распределения векторной случайной величины Sf. С помощью функции Fe (#i, • • .» xs) ПРИ некоторых дополнительных условиях (см. Прохоров, Розанов [1]) также можно определить меру на борелевских множествах 5-мерного евклидова пространства. Если имеет смысл интеграл то его называют математическим ожиданием случайной величины ? и обозначают М?. Если[|л — а-конечная мера, абсолютно непрерывная по отношению к вероятностной мере Р, то производную Радона — Никодима dP/d|x (со) называют плотностью распределения Р по отношению к мере \i. В частности, если [д, — мера Лебега и почти dF() dFz(x) всюду существует обычная производная —j— = р% (х), то ее называют плотностью распределения или плотностью вероятности случайной величины ?. Для многомерной случайной величины плотность совместного распределения определяется равенством ..,*,)- dxi...dxg для почти всех хг, . . ., xs. С помощью введенного ранее понятия неопределенного интеграла по множеству А из 91 определяется условное математическое ожидание и условная вероятность. Пусть 95 — сг-алгебра, содержащаяся в 91. Условным математическим ожиданием М (^ | 95) случайной величины \ относительно 85 называется всякая ^-измеримая функция, которая при любом В из 95 удовлетворяет равенству Используя теорему Радона — Никодима, можно показать, что такие функции всегда существуют. Они совпадают для всех (mod P) со. Условной относительно о-ал- гебры 95 вероятностью события В (В ЕЕ 95) называют
§ 2] ФАКТЫ ИЗ ТЕОРИИ ВЕРОЯТНОСТЕЙ 17 функцию М (фб| 95) (фв — индикатор В). Последняя 95-из- мерима, при любом А ЕЕ 95 удовлетворяет соотношению P(Af)B)= и определяется этим соотношением с точностью до множества из 93, имеющего Р-меру нуль. В рассматриваемом нами случае, когда случайные величины принимают вещественные значения из (—оо, -foo), среди эквивалентных функций множеств, определяющих условную вероятность, найдется такая, которую можно рассматривать как вероятностную меру, что позволяет определить (с вероятностью 1) условную функцию распределения Пусть U — множество с определенной с-алгеброй его подмножеств % (измеримое пространство), и функция g определяет измеримое отображение Q -> U. Условным математическим ожиданием (условной вероятностью) относительно функции g называется условное математическое ожидание (условная вероятность) относительно сг-ал- гебры g'1^. Аналогично для семейства функций gt (i = = 1, . . ., п) со значениями в измеримых пространства %t условное математическое ожидание М (g |gi, . . ., gn) определяется как условное математическое ожидание относительно минимальной cr-алгебры, содержащей все gr1(et. Как и выше, вводится понятие условной функции распределения относительно заданной функции g или системы функций. 4. Моменты случайных величин, закон больших чисел и центральная предельная теорема. Величину М?г (г]>0), если она существует, называют г-м моментом случайной величины ?.|Величину М (? — М?)г называют г-м центральным моментом. Второй центральный момент D? = = М (? — М|J называется дисперсией g. Важную роль в дальнейшем будут играть вторые центральные моменты компонент векторных случайных величин — дисперсии
18 ВВЕДЕНИЕ [ГЛ. и ковариации cov (?к, 1д cov (gZf ?z) = Oh. Матрицу 3) = || cov (gfe, ?г) || J, i=1 называют ковариационг ной матрицей. Со вторыми моментами случайных величин связано нормальное распределение. Случайная величина ? называется нормально распределенной на (—оо, + оо), если ее функция распределения есть ф (-?=*-) = {УШ)"* jj e^'^dx, A.2.4) где а = М^ и а2 = DJ. Векторная случайная величина 2 = (?i> • • •» Ss) называется нормально распределенной в s-мерном евклидовом пространстве, если ехр (— -^ЯГ1»). A-2-5) где Ж — вектор-столбец с компонентами ^ — alf . . • • • •, xs —asi ak ^ M|ft и 25 — ковариационная матрица вектора S. Большинство схем метода Монте-Карло опирается на закон больших чисел для независимых случайных величин. Пусть Sj» • • •» 6п — независимые и одинаково распределенные случайные величины. Предположим, что существует Mgfe = а < оо и Dgfe = а2 < оо (к = 1, . . ., /г), п и обозначим *Sn = 2 ?/е- Для любого е ]> 0 имеет в этом случае место неравенство Чебышева Р (| 5п/п - а | < е) > 1 - а2/ (дге2), A.2.6) что равносильно неравенству Р (| SJn - а | > в)< <т2/(и82). A.2.7) Отсюда при указанных предположениях вытекает простейший вариант закона больших чисел. Для любых г ^> О и б>0 при достаточно большом п среднее арифметическое SJn с вероятностью, меньшей чем 1 — 6, будет отличаться от а не более чем на ег В действительности за-
§ 2J ФАКТЫ ИЗ ТЕОРИИ ВЕРОЯТНОСТЕЙ 19 кон больших чисел справедлив при значительно более слабых предположениях. В частности, закон больших чисел в форме Хинчина (Феллер [Ц) утверждает, что при условии существования конечного математического ожидания случайной величины ?. Таким образом, имеет место сходимость по вероятности среднего арифметического**^/^ к математическому ожиданию при весьма широких предположениях. Если дисперсия D?fe бесконечна, то неравенства A.2.6)'и A.2.7) лишены смысла, однако справедливо неравенство (Бар, Эссеен [1]) п М|?п/п--аГ<Л-2м|?*--а|г A<г<2), A.2.8) п k=i *Дв \>ъ, — независимые случайные величины, не обязательно одинаково распределенные, но имеющие одинаковое математическое ожидание а. В общем случае константа в неравенстве A.2.8) улучшена быть не может. Наконец, нами будет использоваться в дальнейшем усиленный закон больших чисел, который утверждает, что среднее арифметическое SJn независимых одинаково распределенных случайных величин сходится к их общему математическому ожиданию с вероятностью единица. Для нас будет представлять интерес не только сходимость величины SJn к математическому ожиданию М?, но и ее распределение Если а2 < + оо и существует третий момент C3 — М[ ?fe— а|3< + оо, то центральная предельная теорема утверждает, что распределение SJn асимптотически нормально с дисперсией о2/п и средним а. Более точно, имеет место неравенство оо П - an > о УУпГ) - -y=r ^ e'u2l2du y= <з3 A.2.9) где с0 — абсолютная константа, относительно которой известно, что 0,9051 > с^ > l/]/2!jt. И. А. Ибрагимовым (Ибрагимов, Линник [1]) указаны также необходимые и достаточные условия для того, чтобы имела место сходимость к нормальному закону порядка о (п v«). В общем
20 ВВЕДЕНИЕ 1ГЛ. 1 случае предельными распределениями среднего арифметического независимых случайных величий являются так называемые устойчивые распределения; которые достаточно подробно изучены (Гнеденко, Колмогоров [1]). Мы не останавливаемся на их свойствах, так как до сих пор они сравнительно мало использовались в методе Монте-Карло. 5. Случайные процессы. Понятие случайного процесса является непосредственным обобщением понятия случайной величины. Пусть 0 — некоторый параметр, принимающий значения из множества в. Функция ? (в, со), определенная на 9 как функция 0 и на вероятностном пространстве (Q, 3f, P) как функция со, такая, что при каждом фиксированном значении 0 из G ? (со, 0) является случайной величиной, называется случайным процессом. Обычно предполагается, что в есть множество вещественной прямой. Если 0 — множество более сложной при роды, то ? @, со) называют случайной функцией или случайным полем. Для наших целей будет достаточно рассматривать случай, когда значения ? @, со) принадлежат вещественной прямой. Всевозможные совместные распределения случайных величин g @i,со), . . ., | @П, со) называют конечномерными распределениями вероятностей случайного процесса. Согласно теореме Колмогорова (Колмогоров [1]) для любого набора функций Fn (хг, 0Х; . . .; хп, 0П), являющихся при произвольных фиксированных п и 0lf . . ., 0П функциями распределения, существует вероятностное пространство (Q, 9t, P) и семейство измеримых функций 5 @, со) (со е Q) таких, что Fn (xi> вх; . . ¦ ; хп, Qn) = = р {I (в* со) < хц. . .; I (вя, со) < хп}, если выполнены условия согласованности lim Fn(xv 0i; ... ; хп, 0n) = Fn-i (хъ 0Х; ... ; Яп-i, 0n-i). Таким образом, случайный процесс может быть определен заданием функций Fn при всевозможных п, и такое определение может быть взято в качестве исходного. Функция параметра 0, равная при каждом фиксированной 6 величине М? @, со), называется математическим
§ 2] ФАКТЫ ИЗ ТЕОРИИ ВЕРОЯТНОСТЕЙ 21 ожиданием или средним значением случайного процесса, а функция двух переменных R @, t) = М (g F, (о) ? (*,со)) — ковариационной функцией. Ниже даются определения важных частных случаев случайных процессов. Процессы определяются в узком смысле (см. Дуб [1], стр. 71). 3 Случайный процесс ? @) = | @, со) называется стационарным, если связанные с ним распределения вероятностей не зависят от сдвига параметра 6. Если все конечномерные распределения процесса нормальны, то процесс называется гауссовским случайным процессом. Марковским случайным процессом называется процесс, для условных конечномерных распределений которого с вероятностью 1 выполняются равенства Р {I (вп) < х | I (вг), . . ., 6 (в.,-0} = = Р {I (в„)< х | | (в»-!» A.2.10) Для любых значений параметра 0Х <^ . . . -^ 8П из 0. Условие A.2.10) эквивалентно также следующему: для любых tx <^ t2 из в и любого х с вероятностью 1 р {? (О < * 16 «)t * < к) - р {| (д < * 16 fc)>. A.2.11) Марковский случайный процесс может быть задан переходными вероятностями и начальным распределением вероятностей. В этом случае предполагается, что в имеет минимальный элемент 00, при котором заданы начальное распределение вероятностей р0 случайной величины I (Эо) и функция] (переходная вероятность) Р (со, t; В, 8) (со, со' Efi; ty 9 G6 > ВееЩ, удовлетворяющая для почти всех со равенству Р(со, t; В, 0) = §Р(со", т; 5, 0)Р(со, *; dco", т) (уравнение Чепмена — Колмогорова). Последнее обеспечивает выполнение условий согласованности конечномерных распределений процесса. Пусть | — стационарный марковский процесс (Р (со, t; В, 0) = Р (со, В')) и %в — индикатор борелев- ского множества Яе51. Для любых 0О <^ 02 < . . . <^0П совместное распределение случайных величин 5о = = I @о» ю), . . м ?п =5 @П, со) определяется выражением Ро («о) S P (Sol «i) • • • S ХвР (Sn-i, *.). A.2.12)
22 ВВЕДЕНИЕ 1ГЛ. 1 Важным частным случаем марковского процесса является марковская цепь с конечным числом состояний т. В этом случае функция | (9, со) может принимать лишь конечное число т значений. Цепь в стационарном случае при 0 = 80 определяется дискретным начальным рас- предолением. Роль переходной вероятности играет переходная (стохастическая) 'матрица $> = \\ри р=1, элементы которой удовлетворяют условиям р^ > О, ii В основном' в последующих главах мы будем рассматривать марковские случайные процессы и даже их^частные случаи — скачкообразные процессы и цепи с конечным числом состояний. Более сложным объектом, с которым мы будем иметь дело, является процесс броуновского движения — гауссовский марковский процесс с непрерывным временем. Строгое введение интеграла и меры Винера, связанных с процессом броуновского движения, достаточно сложно, и мы ограничимся лишь пояснением этих понятий. Подробное формальное изложение читатель найдет в ряде учебников (например, Шилов, Фан Дык Тинь [1]). В книге Каца [1] содержится превосходное изложение применений, которые интеграл и мера Винера находят в физике. Одномерный Процесс броуновского движения можно описать как процесс движения (броуновской) частицы. Если частица начинает движение в момент времени t = О в точке х = О, то вероятность того, что в моменты времени *i» *г» • • •» *п @ < h <С • • • < *п) она будет находиться в промежутках!^, fej, . . ., [ап, Ьп] соответственно, определяется равной а?,; *2 — *х) ... р (дгп-i, хп) tn — tn-x) dxx... dxn, A.2.13) где Pi** У1 0 = Bjtf)-V-exp[—g-(y -*)«]. A.2.14)
§ 2] ФАКТЫ ИЗ ТЕОРИЙ ВЕРОЯТНОСТЕЙ 23 Тем самым, очевидно, определяются конечномерные распределения процесса броуновского движения. Если в качестве пространства Q выбрать пространство непрерывных на [0,оо) функций х (t) (xt = x (tt)j i= 1, ... . . ., п; х @) = 0), то формула A.2.13) определяет вероятностную меру на полукольце множеств вида [ах < х (tt) < Ьг;. . .; ап < х (tn) < hn] (выполнение условий согласованности легко проверить.) и может быть распространена на все пространство й непрерывных функций. В соответствии с общей схемой введения интеграла можно далее определить интеграл Винера. Пусть / (х) — непрерывная неотрицательная функция х е (— оо , + оо ). Интеграл Винера t J = J exp [- J / (х (х)) dx] P (Ad), A.2.15) о где Р — мера Винера, также можно рассматривать как предел / = lim ^ ••• $ exp Г— -^2 №д]рф1х1>*1)--- ... р (xn-i, xn\ tn — tn-i) aXi... dxn, который с учетом A.2.14) может быть также записан в виде -|-оо -f0 п / = lim (Zntri*1)-*!* \ ..A expf— tn-1 —оо n +4- s & - x^'tr что позволяет записать / в форме t exp [- j {4- (|j-J + / (x(т))}dx]d(траектория). 0 В дальнейшем такая символическая форма записи интеграла будет нам полезна. Таким образом, в случае
24 Введение 1гл. 1 процесса броуновского движения точки выборочного пространства отождествляются с непрерывными функциями. Функцию ? @, со) при фиксированном со называют реализацией случайного процесса. Реализации случайного процесса могут рассматриваться как элементы некоторого функционального пространства. При определенных условиях в функциональном пространстве траекторий может быть также введена метрика. Для установления непрерывности траекторий процесса используется критерий непрерывности траекторий Колмогорова для сепа- рабельных случайных процессов. Если в принадлежит вещественной прямой и 51 — некоторая система борелев- ских множеств, то процесс ? называется сепарабельным тносительно 91, если существует последовательность 8i, J2, . . . значений параметра 8 и множество Qx €E ?2 Р-меры нуль такое, что если A GE 31 и / — любой открытый интервал, то множества {со : ? (8) G А, 8 е /} и {со : I (87) ЕЕ А, Qj ЕЕ /} отличаются друг от друга лишь на подмножество множества Qx. В частности, процесс броуновского движения является сепарабельным. Критерий непрерывности траекторий утверждает следующее. Пусть ? (9) F GE ta» Ь]) — сепарабельный случайный процесс. Если при некоторых Р^>0, е^>0и0<^С<[оо имеет место неравенство М | ? (8) — g (8 + Д6)р I *ч ^ С | Д6 |1+^, то почти все реализации процесса g являются непрерывными функциями 8. Пусть далее g (ttJ cof) = ^, i = 1, 2, . . .,— реализации случайного процесса при t — tt. Последовательность значений ^ будем называть стационарной, если исходный процесс является стационарным. Случайные величины 1-г являются зависимыми случайными величинами. При некоторых предположениях о слабой зависимости случайных величин, составляющих стационарную последовательность, предельное распределение среднего арифметического является устойчивым. Подробную теорию вопроса можно найти в монографии Ибрагимова, Линника II], где также формулируются условия, при которых предельное распределение является нормальным. Мы ограничимся формулировкой предельной теоремы лишь для частного случая /с-зависймых случайных величин. Случайные величины стационарной последовательности . . .?_!, lOj gj, . . . называются к-зависимымиг
3] ОБЩАЯ СХЕМА МЕТОДА МОНТЕ-КАРЛО 25 если случайные векторы вида (?g_r, ?g-r+i» . • •> lQ) и (Sp» lp+n • • •» ?p+e) независимы, как только р — ? > й\ Обозначим i-i Тогда, если 0 < а2 < оо, то IimP (гтг2 1><х) = vk S r**lB- A-2Л6) Предельные теоремы теории вероятностей играют важную роль при разработке вычислительных схем метода Монте-Карло. Некоторые предельные теоремы будут приведены в последующих главах в связи с их конкретными приложениями. § 3. Некоторые сведения из математической статистики. Общая схема метода Монте-Карло 1. Оценивание параметров распределений. Как правило, при использовании метода Монте-Карло моделируются случайные величины с известными законами распределения, и из этих величин по известным правилам конструируются существенно более сложные, распределение которых уже не может быть найдено аналитически (или полуаналитически). Эти результирующие распределения могут быть известны с точностью до параметров — в этом случае используется аппарат математической статистики для оценивания этих параметров. В других случаях, когда вид результирующего распределения неизвестен, используются непараметрические методы. О непараметрических методах в связи с оцениванием неизвестной плотности речь будет идти в главе 5. Ниже приводятся некоторые элементарные сведения об оценивании параметров распределений. Для оценивания параметра 0 распределения случайной величины ? используется некоторая функция ее выборочных значений ?i» • • •» ?w (статистика). Эту функцию 9 (?i> • • •» In) называют также оценкой параметра Э. При этом |i, . . ., ?лг рассматриваются как случайные величц-
26 ВВЕДЕНИЕ [ГЛ. 1 ны, точнее, как векторная случайная величина, определенная на вероятностном пространстве, конструкция которого зависит от способа реализации величин ?х, ..., ?лг. ^Если (Q, 91, P) — исходное вероятностное пространство, на котором определена ?, и ?х, . . ., %N — ее независимые реализации (повторная выборка), то выборочное вероятностное пространство (QN, %N, PN), на котором определена S = (|i, . .. ?#), есть произведение N экземпляров исходных пространств, т. е. Q^ = Q х .. • X Q, ' N %n __ ог-алгебра множеств вида AN = АгХ А2 X . . . XAN, где Aj e 91, / = 1, . . ., N, и Ps (Ль . . ) Пусть 0— некоторый параметр из параметрического пространства в. Оценку §(?1,...,?я)*которая предполагается измеримой функцией на (QN, 9tN, PN), называют несмещенной оценкой 0, если существуетМ0 (?lf ..., g^v) и М0 (|lf ... . . ., ^2v) = 0. Говорят, что 0 асимптотически несмещена, если М0 (gi, . . ., In) ->0. Если 0 (%и . . ., %N) сходится N-*oo по вероятности к 0 при N -> оо, то оценку 0 называют состоятельной для 0. Когда 0 — несмещенная оценка с конечной дисперсией, и при этом не существует никакой другой несмещенной оценки с меньшей дисперсией, 0 называют эффективной оценкой 0. В данном случае дисперсия оценки является показателем ее качества. В общет случае могут быть введены другие критерии^ Пусть теперь 0 — числовой параметр и Q~(%u . . .T?iv)» 9 (?i> • • •» ?n) — Две числовые функции выборочных значений такие, что 0 <^ 0. Если при некотором 0 <^ у <^ 1 0 и 0 могут быть выбраны так, что Р @ < 0 < 0) = у, то интервал @, 0) называется доверительным интервалом для 0, соответствующим уровню у, или ЮОу-процентным доверительным интервалом. Предположим, что существует плотность совместного распределения выборки ?1? ..., \N, равная р& (хи ... xN; 0). Эту плотность принято называть функцией правдоподобия выборки по отношению к параметру 0. Если существует такая, функция 0=0 (xv . . ., х^), что р& (хи ..., xN; 0)
§ 3] ОБЩАЯ СХЕМА МЕТОДА МОНТЕ-КАРЛО 27 имеет максимальное значение при 6 = 6, то статистику 0 (?, . . ., ?jv) называют оценкой максимального правдоподобия для 9. Оценки максимального правдоподобия являются одними из основных оценок, используемых в статистике. При определенных условиях эти оценки являются асимптотически несмещенными, асимптотически нормальными и асимптотически эффективными. Оценки максимального правдоподобия могут быть определены и без предположения о существовании плотности рз- Подробную теорию вопроса читатель может найти, например, в книге Уилкса [1]. Поскольку среднее арифметическое независимых случайных величин является традиционной оценкой математического ожидания в методе Монте-Карло, то уместно привести некоторые факты, относящиеся к этой оценке, хотя они достаточно широко известны. Пусть | распределена нормально со средним а и известной дисперсией а2 и gl9 . . ., In — ее независимые выборочные значения. Функция правдоподобия по отношению к параметру а в этом случае есть Р (ь, ... ^П Ее максимум достигается при условии Q = 2 (xi — аJ =* == min. Легко видеть, что 0 достигает минимума тогда и толь- N ко тогда, когда а = а (хи . . ., xn) = N^S x\- Таким об- i==l разом, среднее арифметическое (выборочное среднее) iN 1 = -TV^VS ^ является оценкой максимума правдоподо- бия для а = М?. Легко проверить, что ? распределено нормально со средним а и дисперсией O2/N. Используя X 1 Г таблицы значений интеграла ¦ /—_ \ е~иг1Мщ можно
28 ВВЕДЕНИЕ [ГЛ. 1 указать доверительный интервал для а, соответствующий уровню у. Так, Р {| а — а\ > За/уТУ} = 0,003. Среднее арифметическое обладает некоторыми оптимальными свойствами и при более общих предположениях. Рассмотрим всевозможные линейные несмещенные оценки, т. е. оценки вида N 3=2 *&. A-3.2) где сг — неопределенные постоянные, среднего значения случайной величины g с конечной дисперсией а2 и произвольным в остальном распределением. Легко показать, что в классе несмещенных оценок вида A.3.2) среднее арифметическое имеет наименьшую дисперсию. Действительно, для несмещенности оценки необходимо выполнение равенства N и дисперсия X равна DX = а2 2 ci- При условии A.3.3) и% имеет единственный минимум, который достигается при сх = с2 = . . . = cN = UN. Приведенные факты дают основания для оценки математического ожидания случайной величины ? с помощью среднего арифметического ее выборочных значений \. В качестве несмещенной оценки дисперсии обычно используется статистика л4л г=1 Имеет место следующий факт (Уилкс [1], стр. 292). Если Si» • • м &v — независимые выборочные значения случайной величины g, имеющей среднее значение а, дисперсию or2, а также конечные третий и четвертый моменты, N то среди несмещенных оценок D ? вида 2 си (Jk ~ I) (Ь — 1) i. i—х
§ Si ОБЩАЯ СХЕМА МЕТОДА МОНТЁ-КАРЛО 29 оценка имеет наименьшую дисперсию. Интервальная оценка выборочной дисперсии для нормально распределенной случайной величины ? связана с распределением %2. Говорят, что случайная величина г) имеет распределение %2 с к степенями свободы, если плотность вероятности р^(х) есть р<* > (Х) = —-! 2к<2Т(к/2) .3 6) где Г (г/) есть гамма-функция. Сумма квадратов N незави симых нормально распределенных случайных величин с нулевым средним и единичной дисперсией имеет распределение х2 с N степенями свободы. Отсюда следует т = ?{а <lfiL=»)f!<b} = \ p^^dx. A.3.7) Значения интеграла в правой части A.3.7) затабули- рованы. Равенство A.3.7) эквивалентно равенству Г (TV — 1M2 (N-l)s*l откуда следует, что \-—, ' ,- — является доверительным интервалом для а2, соответствующим уровню у. В тех случаях, когда дисперсию нельзя считать известной с достаточной степенью точности, доверительный интервал для математического ожидания строится с помощью распределения Стьюдента (Уилкс [1], стр. 404, Линник Ю. В. [1], стр. 98). 2. Эмпирическая функция распределения и критерии согласия. Пусть далее | — случайная величина с функцией распределения F% (х) и gi, . . ., ?jv — ее независимые реализации. Обозначим vn (%) число величин ?ft, для которых %k ^ х. Функция Fn (х) = vn(x)/N называется эмпирической функцией распределения случайной величины ?. Известно (Гнеденко [1]), что эмпирическая функция распределения сходится по вероятности к F% (х) при N ->¦ оо
30 ВВЕДЕНИЕ |ГЛ. 1 в каждой гючке х. Нас будет интересовать распределение погрешности, возникающей при замене F^ (x) эмпирической функцией распределения. В математической стати стике имеется ряд критериев, которые позволяют судить о близости F*n (х) к F% (х). 1. Критерий А. Н. Колмогорова. Для всех у ^> 0 — +со limP{ sup \Fl(x)-F*N(x)\<:'t/^N)= 2 (-1)V^\ .Y-XX) —OO<0C<OO fc=—OO A.3.8) 2. Критерий со2. Для всех 7 ]> 0 lim P Я [F% (x) - F*N (x)f dF (x) < -U = G (T), A.3.9) где (? (z) — функция распределения, характеристическая функция которой M?i?oc равна оо Д A — 2Л/А*я8)-* как известно, функция распределения однозначно определяется своей характеристической функцией). 3. Критерий Н. В. Смирнова. Для всех у lim Р { sup (F*N (x) - Fz (x)) < Т//ЛГ} = 1 - er**. N-*oo зсе[—oo, +00] A.3.10) Функции в правых частях равенств A.3.8), A.3.9) и A.3.10) затабулированы. f. 4. Критерий %2 (К. Пирсона). Согласно этому критерию величина 1 2 / = ЛГ 2 {Ц ^И- S АР(*)] / J dF(x)}, A.3.11) * А Д / А где Д1? А2, . . ., Д; — непересекающиеся интервалы, на которые разбивается вещественная прямая, при N -+ оо имеет х2 распределение с I — 1 степенью свободы при условии, что интегралы по каждому из А г от dF* и dF не слишком малы. Практически критерий используется при
§ 3] ОБЩАЯ СХЕМА МЕТОДА МОНТЕ-КАРЛО 31 N \ dF(x)^> 10. Если сделано некоторое предположение (высказана гипотеза) о виде функции F, то далее на основании N выборочных данных составляется статистика, соответствующая данному критерию: sup \F(x) — F* (х)\ для критерия Колмогорова, —оо<я<+оо [р (Ж) _ p*N (х)]2 dF (х) Для критерия со" и т. д. Далее, поскольку распределение этих статистик при правильном выборе F известно, то используется аппарат проверки статистических гипотез, т. е. гипотеза о близости F* к F принимается, если соответствующая статистика не превосходит установленный предел, и отвергается в противном случае. Применительно к ряду задач метода Монте-Карло практическая сторона использования описанных критериев подробно освещена в монографии Голенко [1]. 3. Метод Монте-Карло. Моделирование случайной величины (процесса), которое является основным содержанием метода Монте-Карло, предполагает возможность ее конструирования при помощи некоторого случайного механизма. Например, мы можем конструировать случайную величину, подбрасывая симметричную монету. В результате таких бросаний можно получить наборы нулей и единиц (случайные числа!), если ноль соотнести одной стороне монеты, а единицу — другой. Рассматривая такие наборы как двоичную кодировку старших разрядов некоторого числа из промежутка [0, 1], можно в результате последовательности простейших экспериментов получить с любой заданной точностью реализацию случайной величины^ равномерно распределенной на промежутке [0, 1]. (Более подробно об этом будет сказано в § 1 гл. 2.) Подобный способ задания случайной величины мы будем далее называть конструктивным. Идея конструктивного задания случайных величин и процессов восходит к основоположникам теории случайных процессов Н. Винеру и П. Леви. Последний в своей книге «Случайные процессы и броуновское движение» требует, чтобы задание процесса позволяло его моделировать, исходя из счетной последовательности случайных
32 ВВЕДЕНИЕ [ГЛ. 1 экспериментов, и описывает несколько конструкций такого рода. Ранее моделирование броуновского движения было описано Н. Винером (см. Пэли, Винер [1]). Соответствующие алгоритмы приводятся в главе 2. В дальнейшем идея конструктивного задания случайных процессов была развита в ряде работ. В частности, ее связь с методом Монте-Карло была рассмотрена в работе Гельфанда, Фролова и Ченцова [1]. Достаточно подробное описание проблематики, связанной с конструктивным заданием случайных процессов, и библиографические ссылки читатель сможет найти во введении к монографии Ченцова [4]. Далее естественно требовать, чтобы рассматриваемые вероятностные пространства были конструктивными. Под конструктивным вероятностным пространством мы будем понимать такое вероятностное пространство (Q, 3(, Р), для которого существует измеримое отображение со = = ф (#), х е [0, 1], со Ег ?2, отрезка [0, 1] в Q такое, что для любого А е $1 [х{А} = § dx, где В = {х : ф (х) ЕЕ А} в (см. Ченцов [2], [4]). Таким образом, требование конструктивности вероятностного пространства означает, что случайная величина, определенная на нем, должна выражаться через равномерно распределенные на [0, 1] случайные величины. Последние же, как уже отмечалось, могут быть заданы конструктивно. Методы построения отображения со = ф (х), т. е. методы, с помощью которых реализации случайных величин с различными законами распределения выражаются через реализации а, подробно обсуждаются в главе 2. Во многих конкретных случаях они могут быть достаточно сложными в вычислительном отношении. Задача метода Монте-Карло после получения ряда реализаций интересующей нас случайной величины ? заключается в получении некоторых сведений о ее распределении, т. е. является типичной задачей математической статистики. При этом наиболее распространенной вычислительной задачей является задача оценки среднего значения некоторой случайной величины, т. е. задача вычисления интеграла типа Лебега по некоторой (конструктивной) вероятностной мере. Последняя, как уже
3] ОБЩАЯ СХЕМА МЕТОДА МОНТЕ-КАРЛО 33 отмечалось, может иметь весьма сложную природу и задаваться как композиция более простых мер. Наиболее изучен случай, когда существует конечный второй момент случайной величины (задача А, как мы ее будем условно называть). Наиболее простая вычислительная схема при этом заключается в следующем. Вычисляется N независимых реализаций случайной величины, и ее математическое ожидание оценивается с помощью среднего арифметического этих реализаций. Основанием для этого может служить тот факт, что среди линейных несмещенных оценок среднее арифметическое имеет наименьшую дисперсию. Оценка погрешности может быть получена с помощью неравенства Чебышева A.2.6) и имеет вероятностный характер. Если мы зададим некоторое достаточно малое у и положим у = e2/(Ns2) (т. е. в = olYNy), то получим |^}1-Т, A-3.12) т. е. с вероятностью 1—у среднее арифметическое независимых реализаций ? отличается от М^ не более чем на а/]/~Ny. При фиксированных у и а погрешность убывает, таким образом, как iV~1/2. Если для оценки погрешности используется центральная предельная теорема, то при достаточно большом N N величину -дг2 ^ можно считать распределенной нор- мально со средним М? и дисперсией O2/N, что дает возможность построить доверительный интервал и оценить погрешность, как это было сделано в п. 1 данного параграфа. При этом, строго говоря, необходимо, чтобы распре- N деление величины-^-2 ?t отличалось от нормального не более чем на величину порядка N"^k Величина дисперсии, которой определяется погрешность, может быть также оценена в процессе вычислений. Таким образом, имеется возможность определить в процессе вычислений число N, гарантирующее необходимую точность с заданной вероятностью (надежностью). Эта особенность метода 2 С. М. Ермаков
34 ВВЕДЕНИЕ 1ГЛ. 1 представляется весьма важной в практическом отношении. Таким образом, задача А тесно связана с задачей оценки параметров нормального распределения. При этом оценка математического ожидания дает решение задачи, а оценка дисперсии обеспечивает оценку погрешности. Хотя порядок убывания погрешности О (N~4*) представляется недостаточно высоким для точных вычислений, имеются различные приемы преобразования случайных величин, сохраняющие их среднее значение, но изменяющие дисперсию. Нас, естественно, будут интересовать приемы уменьшения дисперсии. Изложение таких приемов составляет значительную часть этой книги. Возможность указанного преобразования случайных величин вытекает хотя бы из представления A.2.1), т. е. равенства М? = \l(со) Р(dco) = J I(со)^ (со) ji (dco), где \х ^> Р. Это представление дает возможность вычислять вместо среднего значения i по мере Р среднее значение ?-т- по мере |л. Если D? = jj ?2 (со) Р (dco) — (M?J, то S-J-) • С вычислительной точки зрения недостаточно выбрать \х таким образом, чтобы ? — 1 была меньше, чем D?, так как моделирование слу- о „ о d? чайной величины §-г- может оказаться значительно сложнее, чем моделирование исходной. Поэтому следует использовать преобразования, уменьшающие вычислительную работу, необходимую для достижения заданной точности при данной надежности. Мы будем далее называть преобразования, сохраняющие математическое ожидание случайной величины, но изменяющие ее дисперсию, модификациями метода Монте- Карло. Класс модификаций, как мы увидим в дальней-
§ з1 ОБЩАЯ СХЕМА МЕТОДА MbtttE-KAPtfd 36 шем, не исчерпывается преобразованиями вида A.3.13). Следуя работе Фролова, Ченцова [1], введем понятие эффективности модификации (в рамках схемы А). Пусть г — время, необходимое для вычисления на ЭВМ одной реализации случайной величины tj. Будем называть эффективностью модификации величину (tDtj)", т. е. приписывать большую эффективность той модификации, для которой величина хЬц меньше. При этом следует сделать некоторые оговорки. Во-первых, критерий эффективности, безусловно, применим лишь в рамках схемы А. Об этом мы скажем подробнее при рассмотрении других схем. Во-вторых, следует оговорить одинаковое качество программ, по которым производятся вычисления при различных модификациях метода, ибо время т зависит существенно от того, хорошим или плохим программистом была написана программа для ЭВМ, или от качества транслятора, который используется. Наконец, иногда менее эффективная модификация может оказаться более предпочтительной по той причине, что для нее имеется уже разработанный алгоритм и программа расчета. Пусть теперь требуется вычислить математическое ожидание случайной величины при условии, что ее второй момент бесконечен (задача Б). Из соотношения A.3.13) следует, что можно, вообще говоря, свести задачу Б к задаче А, т. е. построить случайную величину с тем же математическим ожиданием, но конечной дисперсией. Иногда, однако, такое преобразование трудно или почти невозможно выполнить ввиду его сложности. Может также оказаться, что объем вычислительной работы при заданной погрешности возрастет несмотря на достигнутую конечность дисперсии. (Критерий эффективности модификации, определенный выше, в этом случае неприменим.) Вопрос о конструкции оценок математического ожидания в случае задачи Б исследован недостаточно. Использование среднего арифметического в качестве оценки в известной степени оправдано, так как обеспечивается сходимость оценки по вероятности к математическому ожиданию (оценка не смещена и состоятельна). Вопрос о порядке сходимости при вычислении конечномерных интегралов исследовался Н. С. Бахваловым [3]. Более поздним, но и более общим является результат, сформулированный в § 2 главы 1 в виде неравенства A.2.8). Из этого
36 ВВЕДЕНИЕ [t Jl. 1 неравенства следует N A.3.14) т. е. можно утверждать, что среднее значение модуля погрешности оценки убывает как j/V1*. Распределение погрешности тоже может быть получено, однако форма его достаточно сложна и в литературе нет готовых рецептов, позволяющих в удобной форме строить доверительный интервал для погрешности оценки. В случае существования r-го момента A < г < 2) могут быть, по-видимому, построены лучшие, чем среднее арифметическое, оценки математического ожидания. Таким образом, использование закона больших чисел является лишь одной из возможностей при применении метода Монте-Карло. Другой возможностью является использование средств математической статистики для конструирования различных оценок. Имеется небольшое число примеров решения задачи Б. Они обсуждаются в последующих главах. Критерий эффективности модификации метода, сформулированный в общей форме ранее, очевидно, можно распространить и на случай задачи Б, однако точная формулировка такого критерия представляется преждевременной ввиду недостаточной исследованности проблемы. Мы будем в дальнейшем рассматривать также задачу оценки математического ожидания зависимых случайных величин (задачу В). Некоторые факты, относящиеся к этой задаче, —приведены в § 2 данной главы. В большинстве случаев общая схема оказывается, как и в случае А, схемой оценки параметров нормального распределения. Определенную трудность в вычислительном отношении представляет здесь оценивание дисперсии. Подробнее на этом вопросе мы остановимся в последующих главах. Можно выделить также задачу Г оценивания среднего значения зависимых случайных величин, когда предельное распределение среднего арифметического является устойчивым законом, отличным от нормального. Автору, однако, неизвестны примеры практического решения такой задачи.
§ 3j ОБЩАЯ СХЕМА МЕТОДА МОНТЕ-КАРЛО 37 Перечисленные задачи, естественно, не исчерпывают всех задач, решаемых методом Монте-Карло, хотя, в известном смысле, другие задачи к ним сводятся. Так, например, задача оценивания математического ожидания случайной функции ? (9, со) может быть сведена к оцениванию ее математического ожидания при некоторых фиксированных значениях параметра 0 и последующего приближенного восстановления функции М? @, со) с помощью аппарата интерполирования. Возможны и другие подходы, которые далее нами рассматриваются. Из изложенного следует, что метод Монте-Карло тесно связан с задачами теории вероятностей, математической статистики и вычислительной математики. В связи с задачей моделирования случайных величин (в особенности равномерно распределенных) существенную роль играют также методы теории чисел. Вопросы, связанные с теорией чисел, сосредоточены главным образом в заключительной главе книги. Среди других вычислительных методов, метод Монте- Карло выделяется своей простотой и общностью. Медленная сходимость является существенным недостатком метода, однако, как мы увидим в дальнейшем, могут быть указаны его модификации, которые обеспечивают высокий порядок сходимости при определенных предположениях. Правда, вычислительная процедура при этом усложняется и приближается по своей сложности к другим процедурам вычислительной математики. Сходимость метода Монте-Карло является сходимостью по вероятности. Это обстоятельство вряд ли следует относить к числу его недостатков, ибо вероятностные методы в достаточной мере оправдывают себя в практических приложениях. Что же касается задач, имеющих вероятностное описание, то сходимость по вероятности является даже в какой- то мере естественной при их исследовании.
ГЛАВА 2 МОДЕЛИРОВАНИЕ РАСПРЕДЕЛЕНИЙ § 1. Независимые равномерно распределенные случайные величины Как уже отмечалось, исходной случайной величиной при использовании метода Монте-Карло является одномерная равномерно распределенная на промежутке [0, 1] случайная величина а, т. е. случайная величина с плотностью распределения 1, *€=[0,1], , *ёпо,1]. {2ЛЛ) Отметим некоторые простые свойства а. 1. Если а распределена с плотностью B.1.1), то а' = (Ь — а) а -\- а равномерно распределена на промежутке [a, b] (b^> а), т. е. имеет плотность распределения [а,Ъ\. B.1.2) *'(*)-{ 0, 2. Случайная величина ЛГ-1 где р^ (i = 1, . . ., N) независимы в совокупности, Р$ для i = l,...,iV — 1— дискретные случайные величины, принимающие значения 0 и 1 с равными вероятностями Р {$i = 0} = Р {Р,- = 1} = V2, a p равномерно распределена на [0, 1], является равномерно распределенной на [0, 1] случайной величиной. Рассмотрим случай QI = 2.
I 1) РАВНОМЕРНЫЕ РАСПРЕДЕЛЕНИЯ 39 Имеем Р (Pi/2 + Р*/2 < х) = Р {рх = 0} Р (ра/2 < х} + + Р {Р, = 1} Р (V8 + р2/2 < *} = V.P {(У2 < 4 + + 7.Р<рУ2<*-7.>. но О, [0,1], Общий случай легко получить с помощью индукции. 3. Пусть Fa {x) — функция распределения, соответствующая плотности ра (х); $г (i = 1, . . ., N — 1) — независимые в совокупности дискретные случайные величины, принимающие значения 0 или 1иР{р^=1}== N—1 = Р {р\ = 0} = V,. Тогда Р{ 2 Pi/2* <x} - Fa (x) < 1/2^. Действительно, при любом фиксированном значении р# лг-х {2 где а' равномерно распределена на [0, 1] согласно предыдущему пункту. Но тогда Р {а' < х + р^^} < х + + 1/2ЛГ~1 = F<t {%) + Vj^, откуда и следует требуемое. 7V-1 Таким образом, lim 2 Pi/2* равномерно распределен на промежутке [0, 1], причем имеет место равномерная сходимость на [0, 1] соответствующих функций распределения.
40 МОДЕЛИРОВАНИЕ РАСПРЕДЕЛЕНИЙ [ГЛ. 2 4. Если а — случайная величина, равномерно распределенная на промежутке [0, 1], и 0, 71?27з- • • — ее представление в виде двоичной дроби G1 = 0, 1; i — 1,2,...), то Yi — независимые случайные величины, принимающие значение 0 и 1 с одинаковыми вероятностями. Очевидно, для доказательства этого утверждения достаточно показать следующее: если а = у + а/2, где у может принимать значения 0 и 1 с положительными вероятностями рг и р2 (pi +р2 = 1),то рг = /?2,а а равномерно распределена на [0,1] и не зависит от у. Дальнейшее легко следует по индукции. Из равенства а = у + -у и очевидных неравенств 0 <^ а <^ 1 следует: а) при 7 = 0 а = 2а, что может быть лишь при 0 < а < V8, б) при у — XU Зс = 2а — 1, что может быть лишь при 72 < а < 1. ТаккакР {0 < а< V2} = P {V2 < а < 1) = = х/2, то отсюда и следует требуемое, потому что а не зависит от у. Легко также обобщить полученные результаты на случай представления а в виде 0, TiTViV-- —дроби по основанию г, где ?* независимы и принимают значения 0, 1, . . ., г — 1с вероятностями 1/г. Рассмотренные свойства равномерно распределенной случайной величины а обосновывают ее моделирование с помощью эксперимента с бросанием монеты, кратко описанного в главе 1. Очевидно, что мы можем также использовать рулетку (метод Монте-Карло), т. е. вращать диск с нанесенными на нем делениями и, имея неподвижный указатель, считывать полученное число после остановки диска. Такого рода эксперименты принципиально пригодны для реализации а, однако при этом возникает ряд вопросов, которые заключаются в следующем: 1. Как обеспечить идеальное проведение указанных экспериментов, исключая влияние неизбежных погрешностей выбранных «экспериментальных устройств»? 2. Если речь идет о равномерном распределении на [0, 1], то имеются в виду реализации а с бесконечным числом значащих цифр. Это предполагает либо сколь угодно большую точность отсчета при использовании рулетки, либо бесконечно большое число бросаний моне-
§ 1J РАВНОМЕРНЫЕ РАСПРЕДЕЛЕНИЯ 41 ты для получения одной реализации а. Каковы последствия неизбежных округлений в этом случае? 3. Наконец, вопрос о том, как организовать подобный идеальный эксперимент с помощью вычислительной машины, отнюдь не является тривиальным. Обсуждению этих вопросов и посвящен в основном данный параграф. Остановимся прежде всего на конечно- значности реализаций а. Этот вопрос возникает при использовании любых численных методов и связан даже не столько с невозможностью постановки бесконечно продолжительного или сколь угодно точного эксперимента, сколько с возможностями соответствующих вычислительных устройств. При этом можно исходить из двух точек зрения. Первая из них состоит в том, что мы заранее отказываемся от рассмотрения случайной величины, равномерно распределенной на промежутке [0, 1], и рассматриваем случайную величину а, равномерно распределенную по отношению к некоторой дискретной мере. Так, если машина имеет постоянную длину слова в ячейке памяти — п двоичных разрядов для помещения чисел из [0, 1], то можно считать, что а принимает с вероятностью, равной 2~п, значения к-2~п (к = О, . . ., 2П — 1), и рассматривать задачу получения реализаций такой случайной величины. Другая точка зрения состоит в том, что мы можем при желании получить а со сколь угодно большим конечным числом знаков и ограничиваемся п знаками только потому, что дальнейшие знаки не влияют заметно на результат. Разумно придерживаться второй из этих точек зрения, ибо первая налагает ограничения, аналогичные требованию использовать в расчетах значения величины 1^2 лишь с п значащими цифрами, в то время как результат вычислений может существенно зависеть от ее последующих знаков. Далее мы будем считать, что реализации а могут быть получены с любым необходимым числом значащих цифр. При этом очевидно, что получение необходимого числа реализаций а решает задачу о получении реализации а с необходимой точностью. Достаточно поло- m жить а = 2 2~mai при соответствующем выборе т и г=0 произвести необходимое округление. Вопрос о выборе
42 МОДЕЛИРОВАНИЕ РАСПРЕДЕЛЕНИЙ [ГЛ. 2 необходимого числа знаков зависит от конкретной задачи и должен исследоваться средствами вычислительной математики. Таким образом, наша задача свелась^к^необходимости получения реализаций дискретных, равномерно распределенных случайных величин. Если такие реализации получены в необходимом количестве, то их можно поместить в память вычислительной машины и составлять из них реализации с необходимым числом значащих цифр. Иными словами, можно использовать таблицы случайных чисел. Таблицы случайных чисел составлялись задолго до возникновения метода Монте-Карло в его современной трактовке. Надобность в них возникла в связи с развитием процедур случайного выбора при планировании экспериментов в биологии, медицине, сельском хозяйстве и других областях. Имеется ряд изданий таких таблиц, которые обычно содержат десятичные цифры, расположенные группами. Первые таблицы такого рода были составлены Типпетом [1]. При этом использовались таблицы данных при переписи населения. Такого же типа таблицы были составлены Кадыровым [1]. При их составлении очень трудно исключить влияние факторов, нарушающих равномерность распределения и случайность. Кендаллом и Бабингтон-Сми- том [1] для составления таблиц случайных чисел использовались рулетка, представляющая собой диск, разделенный на 10 равных секторов, соответствующих цифрам 0, 1, . . ., 9. Ими были приняты различные меры предосторожности, обеспечивающие беспристрастность эксперимента. Однако, как сообщают авторы, помогавший в работе ассистент питал антипатию к нечетным цифрам (в особенности к цифрам 1, 3 и 9) и симпатию к цифрам 0 и 6. Поэтому результаты экспериментов, которые он регистрировал, пришлось исключить. Фирмой РЭНД в 1947 году были составлены таблицы случайных чисел, содержащие 1 000 000 десятичных цифр. При этом использовалось специальное быстродействующее устройство «электронная рулетка», которая представляла собой датчик случайных чисел, основанный на физическом принципе (генерация случайных импульсов). Полученные данные подвергались тщательному анализу с помощью статистических
§ 1] РАВНОМЕРНЫЕ РАСПРЕДЕЛЕНИЯ 43 тестов. Некоторая часть данных проверки не выдержала, и потребовалась определенная корректировка полученного материала. Мы не будем приводить конкретные результаты проверки указанных таблиц. Эти результаты можно найти в уже цитировавшейся литературе. Важно отметить, что об идеальности эксперимента в конечном счете приходится судить на основании статистических тестов. Обычно используется достаточно сложная система тестов, которые применяются как ко всей последовательности в целом, так и к отдельным ее участкам. Если рх, . . ., Рлг— последовательность реализаций случайной величины р, принимающей значения 0 и 1, то, разбивая ее на независимые группы длины п и предполагая, что распределение р близко к дискретному распределению Р {р = 0} = Р {р = 1} = х/2> можно считать, что полученные группы служат приближенным двоичным представлением равномерно распределенной случайной величины. Проверка гипотезы о равномерной распреде- ленности и независимости полученных чисел также осуществляется с помощью тестов. В частности, критерии согласия (§ 3 гл. 1) позволяют судить об отклонении эмпирической функции распределения данной последовательности от теоретической. Эти критерии и используются чаще всего на практике. Мы не будем останавливаться подробно на конкретных тестах и технике их использования применительно к равномерным последовательностям. Этот материал содержится, например, в монографии Голенко [1]. Отметим только, что выбор уровня доверия при указанном подходе трудно обосновать теоретически и приходится прибегать к утверждениям типа «обычно принято считать» и т. п. Если мы имеем дело с фиксированной последовательностью & из N нулей и единиц: & — е1? г2, . . ., елг, то утверждать с достоверностью, что она получена в результате независимых экспериментов с двумя равновероятными исходами, можно лишь при N ->- оо. При этом нужно исследовать частоты появления нулей и единиц, которые должны стремиться к равным пределам, затем частоты появления в последовательности сочетаний 00, 01, 10, 11, которые должны стремиться к 1/i1 и т. д. Иначе говоря, при произвольном фиксированном п и фиксированном
44 МОДЕЛИРОВАНИЕ РАСПРЕДЕЛЕНИЙ [ГЛ. 2 наборе Yi, . . ., Yn нулей и единиц должны выполняться соотношения Г—1 L п J п Пт у 2 П ? (e(ft-i)iHi, Tf) = Р {Pi = Ti. • • •. Pn = Tn), B.1.3) где [Z] означает целую часть числа I, 1 При X = 2/, а рх, . . ., Piv — независимые случайные величины, принимающие значения 0 и 1 с равными вероятностями. Очевидно, что проверка таких соотношений при всевозможных п неосуществима. Критерии согласия и другие статистические тесты, формально применяемые к последовательности^, призваны обеспечить приближенное в каком-то смысле выполнение соотношений B.1.3), но их использование связано с отмечавшейся уже неопределенностью. Строгая постановка задачи для случая конечного N принадлежит А. Н. Колмогорову [2], который ввел понятие (п, е) случайных таблиц объема N и доказал их существование. Упрощенное определение такой таблицы состоит в следующем. Таблица & = (elf . . ., sn) (efe есть О или 1) называется случайной, если при выборе различными способами из множества натуральных чисел {1, 2, . . ., N} подмножества А с достаточно большим числом п элементов будет наблюдаться приближенная с точностью до 8 стабильность частот я (А): Очевидно, что при использовании метода Монте-Карло, как и при реальном эксперименте, мы имеем дело с ограниченным объемом выборки, и идеи, связанные с (тг, г) случайными таблицами, имеют первостепенное значение. Однако для обоснования метода Монте-Карло как вычислительного метода на базе этих идей практически ничего еще не сделано и мы ограничимся лишь ссылкой на упомянутую работу Колмогорова.
§ 1] РАВНОМЕРНЫЕ РАСПРЕДЕЛЕНИЯ 45 Таким образом мы будем считать далее, говоря о независимых реализациях а случайной величины, равномерно распределенной на промежутке [0, 1], что они были получены в результате достаточно хорошо поставленного эксперимента и проверены с помощью достаточно обширной системы статистических тестов. Такого соглашения, однако, мало, ибо речь идет не о теоретической стороне дела, а о реализации вычислительного алгоритма с помощью ЭВМ. Если имеется достаточно обширная таблица случайных чисел, то вопрос об источнике независимых реализаций а можно считать принципиально решенным. Практически, однако, хранение обширной таблицы в памяти вычислительной машины представляется крайне неудобным, и таблицы случайных чисел не используются в расчетах, за очень редкими исключениями. (По существу таблицы такого рода использовались Франклином [2].) Более удобный метод получения реализаций а заключается в создании специального устройства — «физического датчика случайных чисел» типа упомянутой электронной рулетки. Такой датчик выдает при каждом такте работы машины случайное число в одну из ячеек памяти. Хотя подобные устройства практически используются, их недостаток состоит в невозможности повторного воспроизведения вычислений и, что более важно, в возможности разладки устройства в процессе работы. Строго говоря, необходима параллельная проверка с помощью тестов последовательности, которая выдается датчиком. Эти причины также обусловили редкую применяемость физических датчиков. В практических расчетах наиболее удобно получать реализации а при помощи некоторого алгоритма. Числа, получаемые таким путем, называют псевдослучайными. Доказать теоретически, что тот или иной алгоритм (генератор случайных чисел) дает последовательность с нужными нам свойствами, обычно довольно трудно. Поэтому строгое доказательство часто заменяется некоторыми интуитивными соображениями или теоретически обосновываются лишь некоторые свойства алгоритма. Далее применяются уже упоминавшиеся тесты, на основании которых алгоритм либо признается годным к употреблению, либо отбрасывается. Дополнительным требованием является требование, чтобы получение случайного числа
46 МОДЕЛИРОВАНИЕ РАСПРЕДЕЛЕНИЙ [ГЛ. 2 осуществлялось за достаточно малое число тактов работы вычислительной машины. Подавляющее большинство используемых псевдослучайных последовательностей получают на основе рекуррентных соотношений следующим путем. Пусть xi+k = a (zi+k-u . . ., xt), B.1.4) где к фиксировано, i = 1, 2, . . ., а — целочисленная функция целочисленных аргументов, 0 ^ а < Р, Р — целое положительное число и #0, хг, . . ., хк-х — целые положительные числа, не превосходящие Р, которые должны быть заданы в начале счета. Псевдослучайная последовательность а0, а2, . . . чисел из [0, 1] определяется равенствами а, = х,/Р, i = 0, 1, . . . B.1.5) В большинстве конкретных случаев а задается в виде к-1 ;=о 9) (mod P), B.1.6) где bj и 0 — целые числа, т. е. в качестве xi+k берется остаток от деления значения целочисленной линейной функции на число Р. Метод получения псевдослучайных последовательностей с помощью формул B.1.6) носит название метода сравнений. Он был предложен Леме- ром[1]. Имеется обширная литература, в которой обсуждаются свойства последовательностей, полученных таким путем (см. Янссон [1]). Наиболее простой вид B.1.6) приобретает при к = 1 и 0 = 0. В этом случае метод получения псевдослучайной последовательности носит название мультипликативного. При 0^0 употребляется название «смешанный метод». Легко видеть, что последовательности, получаемые по формулам B.1.4), B.1.5), являются периодическими, так как функция а принимает конечное число значений и комбинация начальных значений, которыми последовательность определяется полностью, рано или поздно повторится. Мультипликативный метод был предложен на основе теоретико-числовых соображений. К его обоснованию
§ 1] РАВНОМЕРНЫЕ РАСПРЕДЕЛЕНИЯ 47 мы вернемся в заключительной главе, где также приводятся результаты относительно длины периода соответствующих последовательностей. На ряде других методов, предложенных для получения псевдослучайных чисел, и некоторых специальных вопросах, связанных с поведением псевдослучайных последовательностей, мы не останавливаемся. Их подробное изложение читатель найдет, например, в монографиях Гол енко[1],Янссона[1] иСоболя[9]. Имея в виду указанные монографии, мы остановились лишь на общей проблематике, связанной с задачами получения независимых реализаций равномерно распределенной случайной величины. Резюмируя сказанное, можно заметить, что естественно выделяется два подхода к описанной задаче. Один из них можно условно назвать «экспериментальным» подходом. Он состоит в том, что производится некий эксперимент, о котором есть основания полагать, что он дает величины требуемой последовательности, и характер которого может быть произвольным. Затем статистические тесты позволяют судить об обоснованности наших предположений. Система тестов должна быть достаточно обширной, если мы хотим рассматривать нашу последовательность действительно как последовательность назависимых реализаций случайной величины а. Отметим, впрочем, тот факт, что иногда для решения данной задачи или даже некоторого класса задач достаточно проверки последовательности с помощью некоторых специальных тестов. Другой возможный подход, которого мы по существу не касались и который естественно назвать конструктивным, заключается в указании теоретического способа построения последовательности с необходимыми свойствами. Эта задача весьма сложна, и мы рассмотрим ее в последней главе. Далее постулируется наличие последовательности реализаций случайной величины, равномерно распределенной на промежутке [0, 1], и при получении теоретических результатов (вплоть до главы 8) мы будем исходить из этого предположения. Буквой а с различными индексами будут обозначаться упомянутые реализации. При описании алгоритмов удобно, однако, иметь в виду некоторый конкретный способ получения последова-
48 МОДЕЛИРОВАНИЕ РАСПРЕДЕЛЕНИЙ 1ГЛ. 2 тельности реализаций о^, <х2, . . . Таким способом мы будем считать линейную рекуррентную процедуру B.1.5), B.1.6) и предполагать параметры в выражении B.1.6) подобранными таким образом, что период получаемой последовательности достаточво велик и выбранные статистические тесты дают удовлетворительный результат. При этом отметим следующее. Если псевдослучайные числа, получаемые на машине, работающей в двоичной системе счисления, имеют п двоичных разрядов р$ (обычно Р = 2П), то распределение младших разрядов может существенно отличаться от дискретного Р {Рг = 1} = = Р {р* = 0} = 72- Более того, последний разряд этих чисел всегда равен единице. Статистические тесты, применяемые к псевдослучайным числам как к реализациям равномерно распределенной на [0,1] случайной величины, могут давать тем не менее удовлетворительные результаты, так как вклад младших разрядов соответственно мал. Это следует иметь в виду при использовании отдельных разрядов псевдослучайных чисел и при получении псевдослучайных чисел с увеличенным числом разрядов. Указанный эффект может быть также весьма существенным при получении реализаций случайной величины, закон распределения которой отличен от равномерного. Особенно явно это проявляется при таких преобразованиях равномерно распределенной случайной величины, где существенную роль играют малые по величине ее реализации. Иначе говоря, при преобразованиях псевдослучайных чисел имеют место обычные в численном анализе эффекты «исчезновения значащих цифр». Получение векторных случайных величин с равномерным распределением в некоторой области s-мерного пространства не представляет труда, если область проста. Так, если а — (а*1), . . ., a<s)) — векторная случайная величина, равномерно распределенная в единичном 5-мерном гиперкубе, то в качестве ее реализаций можно взять любые независимые наборы s независимых реализаций <x<fc) случайной величины а, равномерно распределенной на [0, 1]. Аналогично получают реализации случайной величины а', распределенной равномерно в 5-мерном параллелепипеде {а* <я* < &j}J=i, полагая, например, «/с = К + (&i — «i) «*, ...,«•+ (b8 — а8) *k+8-i). При этом, если для проверки качества последовательности
§ 2] ОБЩИЕ МЕТОДЫ МОДЕЛИРОВАНИЯ 49 используются критерии согласия, то необходимо, по меньшей мере, использовать их соответствующий 5-мерный аналог, что обеспечивает близость эмпирического и теоретического распределения (но не независимость отдельных реализаций). Для сложных областей задача конструирования равномерного распределения может оказаться трудной. Очевидный для ограниченных областей алгоритм состоит в том, что область помещают в параллелепипед и из последовательности реализаций случайной величины, равномерно распределенной в этом параллелепипеде, отбирают лишь те, которые попали в рассматриваемую область. Если отношение объема области к объему параллелепипеда мало, то нужно разрабатывать специальные методы моделирования. Некоторые сведения о таких методах содержатся в следующем параграфе. § 2. Общие методы моделирования неравномерных распределений Считая, что в нашем распоряжении имеется способ получения независимых реализаций равномерно распределенной на промежутке [0, 1] случайной величины а, рассмотрим общие методы получения независимых реализаций случайных величин с заданным законом распределения. Теоретические основы этих методов достаточно просты, и мы будем формулировать их в виде предложений с доказательствами или ссылками на соответствующую литературу. Кроме того, будет рассматриваться алгоритм, который во всех случаях имеет немаловажное значение. Пусть случайная величина ? задана функцией распределения F% (х) и соответственно векторная случайная величина S = (?1? . . ., gs) — функцией совместного распределения F& (х±, . . ., xs). Далее будут сделаны следующие предположения: а) Для простоты предполагаем, что F% имеет только непрерывную и дискретную составляющую. Автору неизвестны случаи, когда возникла бы необходимость моделирования распределений, имеющих в своем составе сингулярную составляющую.
50 МОДЕЛИРОВАНИЕ РАСПРЕДЕЛЕНИЙ [ГЛ. 2 б) Пусть G (х) — монотонно возрастающая непрерывная слева функция 0 <; G («г) <Г 1 и а — константа 0 < а < 1. Если G (х0 + 0) - G (х0 — 0) > 0 и G {xq + 0) ]> а > G (х0 — 0), то х0 считаем решением уравнения G (х) = а. Бели х0 — точка непрерывности G (х), то решение этого уравнения понимаем в обычном смысле. в) В многомерном случае предполагаем определенными однозначно все условные вероятности вида где к <J s и /j, . . ., fk — не совпадающие между собой натуральные числа 1 ^ ft <^ s (I = 1, . . ., к). Считаем, что они также не имеют в своем составе сингулярной компоненты. Заметим, впрочем, что неоднозначность (с точностью до множества меры нуль) в определении условной вероятности практически затруднений не вызывает. Алгоритм должен быть построен так, чтобы события, соответствующие указанному множеству меры нуль, не имели места. При этих предположениях справедливы следующие предложения: Предложение 1 (преобразование Н. В. Смирнова). Если g удовлетворяет уравнению iFz(t) = a E = F^(a))? B.2.1) где a — величина, распределенная равномерно на [0, 1) то g распределена по закону F^ (x). 5 х dF^(t) < ^ dFz(tn, —оо —оо так как F^ (t) — неубывающая функция. Так как g есть решение B.2.1), то Р {I < #} = P{a < F% (x)}. Поскольку а распределена равномерно на [0, 1) и 0^F^(i)^l, то F% (x) —?{& < F^ (#)}, что и требовалось доказать. Для векторной случайной величины имеет место аналогичный результат. Предложение 2. Пусть случайные величины gi, . . ., ge имеют функцию совместного распределения
2] ОБЩИЕ МЕТОДЫ МОДЕЛИРОВАНИЯ 51 s (хг, . . ., х8) и ) —ОО —ОО [ —оо —оо —оо —оо xs) Тогда величины ?1э . . ., |s, являющиеся решениями последовательности уравнений: F1, У = *2, B.2.2) ^s (?H • • м Se) = asi имеют Fz (x^ ..., .rs) совместной функцией распределения. Уравнения B.2.2) носят название формул обращения. Доказательство аналогично доказательству в одномерном случае. Алгоритм. При наших предположениях уравнения B.2.1) и B.2.2) всегда имеют единственное решение, определение которого принципиальных затруднений не вызывает. Вычислительные трудности, однако, могут быть значительными. Поскольку обычно интегралы Лебега— Стилтьеса в уравнениях B.2.1) и B.2.2) представляют в виде суммы двух слагаемых интеграла Лебега и дискретной суммы, то далее мы остановимся подробно на двух случаях моделирования одномерной случайной величины с помощью формулы B.2.1): а) Существует плотность dFt(x) ft<*)- dx '
52 МОДЕЛИРОВАНИЕ РАСПРЕДЕЛЕНИЙ [ГЛ< Z Тогда B.2.1) имеет вид § a. B.2.3) Если возможно аналитическое вычисление интеграла, то для определения ? получаем трансцендентное, вообще говоря, уравнение. Без конкретного рассмотрения свойств функции ?>? трудно указать эффективный способ решения. Использование метода Ньютона, например, если р% мала по величине для некоторых х, может привести к медленно сходящейся процедуре. Еще более сложной оказывается задача, если интеграл нужно вычислять при помощи приближенного интегрирования. Поэтому можно утверждать, что формула B.2.1) дает эффективный результат лишь в достаточно простых случаях. Например, при е-*х, х > О, о, »<о, из B.2.3) получаем e~*z = 1 — а. Так как величина 1 — a распределена равномерно на [0, 1], то, заменяя ее на а, получаем i=_JLloga. B.2.5) Следует заметить, однако, что при затрате дополнительного труда формулы B.2.1), B.2.2) могут служить источником весьма эффективных алгоритмов моделирования. Большая затрата вычислительного труда вызывается необходимостью решать уравнения B.2.1) и B.2.2) в процессе расчета многократно, при различных значениях а из [0,1]. Если F% — достаточно гладкая функция, то можно заранее решить это уравнение для некоторого конкретного набора значений а и составить таблицу значений обратной функции F^1 (a). Значения же ее при всех а можно затем находить с помощью процедуры интерполирования. Аналогичные соображения справедливы, разумеется, и в многомерном случае. Однако с ростом числа измерений резко растет объем таблиц. Вообще повышение эффективности моделирования ведет, как правило, либо к резкому увеличению используемой памяти ЭВМ, либо к усложнению логической структуры программы и увеличению ее объема. Исключение представляет случай, когда F^1 (a) удается прибли-
§ 2] ОБЩИЕ МЕТОДЫ МОДЕЛИРОВАНИЯ 53 зить достаточно простыми функциями, например полиномом умеренной степени или дробно-рациональной функцией. Особенно эффективны такие процедуры в многомерном случае, хотя имеется не так много конкретных примеров их использования. Примеры будут приведены далее. б) 5 — дискретная случайная величина, принимающая значения t/ с вероятностями pj (/ = 1,2,...). Тогда из B.2.1) следует,что ?=Т/в, где/0 определяется неравенствами jo—1 U U—1 0<<х-2д<Д.- B-2-6) Неравенства B.2.6) имеют простой геометрический смысл. Если [U, 1J разбить на интервалы длины PjBA'== в порядке нумерации pj, то выбирается / = /0, соответствующее отрезку, в который попадает а (отрезок длины а откладывается от нуля). Алгоритм в этом случае не требует пояснений. В большинстве случаев более простым в вычислительном отношении оказывается метод, предложенный фон Нейманом [1]. Он основан на следующем утверждении. Предложение 3. Пусть ф (х) (х = (хи ..., xs)) — неотрицательная функция, определенная и интегрируемая в s-мерном параллелепипеде 33 = {at <^ хг <^ Ьг}1=1 и ф (х) ^ М для х ЕЕ 3), где М — константа. Если а' = (ах, . . . , as) и а — независимые случайные величины, распределенные равномерно в 3) и на [0, 1], соответственно, то плотность условного распределения Р {оц <^; i = 1, . . . , 5 | ф (а') > Mcl) совпадает с с(р(х), где с—константа нормировки. Доказательство. ?{х{ < а- < х{ + Ахг; i = 1,..., s \ ф (а7) > Ма} =
54 МОДЕЛИРОВАНИЕ РАСПРЕДЕЛЕНИЙ [ГЛ. 2 Здесь % (tu . . . , ts: ф (tL, . . . , ts) > Af?) означает индикатор множества переменных tu . . . , ?8, для которых выполнено неравенство ф (tu . . . , ?5) > Мt. Аналогично Отсюда и следует наше утверждение. Алгоритм. Метод вычислений достаточно очевиден. Пусть аи а2, ... — исходная последовательность независимых реализаций а. Выбираем последовательно (например) группы из s + 1 числа a/c(s+i)+i> • • •»fl(fc+i)(«+D» А = 0,1,... B.2.7) Отбрасываем группы, соответствующие тем значениям А:, для которых не выполнено неравенство Ф К + Ф\ — di) 0Cfc(s+1)+1,..., as + (bs — as ). B.2.8) Если Al5 /c2, ... — значения /с, для которых B.2.8) выполнено, то полагаем г = 1, 2,..., s компонентами независимых реализаций случайной величины Е, распределенной с плотностью вероятности сф (х). Пусть N — число групп B.2.7), для которых проверялось неравенство B.2.8), и оказалось, что для Nx групп оно выполнено. Величину lim (NJN), равную, очевидно, ЛГ-юо $ сМ Д (Ьг — а$) , называют эффективностью метода Ней- мана. Она равна отношению полезной работы ко всей работе в среднем на одну реализацию случайной величины S. Способы повышения эффективности метода Неймана обсуждаются ниже. Справедливо также следующее обращение
§ 2] ОБЩИЕ МЕТОДЫ МОДЕЛИРОВАНИЙ 55 предложения 3 (см. Михайлов [1]), которое может быть полезным в ряде случаев. Обозначения соответствуют обозначениям предложения 3. Предложение 4. Если S — случайная величина, распределенная с плотностью вероятности су (х), и ? при каждом В = х распределена равномерно на промежутке [О, сф (ас)], то случайный вектор (S, ?) распределен равномерно es + 1-мерной области, определяемой неравенствами ..., as < Если ф (х) > е > 0 в 2), то доказательство подобно доказательству предложения Зи проводится элементарно. Если ф (х) обращается в нуль, то следует исключить множество точек области 3), где это имеет место. Предложение может быть полезно при моделировании равномерных распределений в области сложного вида. Соответствующий алгоритм не требует пояснений. Во многих случаях оказываются также полезными различные обобщения метода Неймана (Романовский [2], Бат- лер [1]). В частности, справедливо Предложение 5. Пусть S — векторная случайная величина с функцией распределения F (хи . . . , х8), ц — одномерная случайная величина, значения которой принадлежат промежутку [О, М], с непрерывной функцией распределения G (у) и г (хи . . . , xs) — непрерывная неотрицательная функция такая, что sup г (х) = М. X Тогда функция условного распределения S при условии r\ ^ ^ г (S) определяется равенством = с\ ..Л G(r(x))dF(x), B.2.9) -» i. где с — константа нормировки с = 11 \ ... I G(r(x))dF(x). —оо —оо
56 МОДЕЛИРОВАНИЕ РАСПРЕДЕЛЕНИЙ [ГЛ. 2 Доказательство. V (x) I %(x:r(x)>y)dG(y) = —оо —оо —оо X г(х) .. $ dF(x) S dG(y) —оо —оо О Отсюда утверждение следует непосредственно, если учесть, что с полагалось равным l/ $ ... S dF(x) $ %(x:r(x)>y)dG(y). —ОО —ОО Алгоритм аналогичен при очевидных усложнениях алгоритму метода Неймана. Подробнее мы остановимся на некоторых частных случаях предложения 5 и соответствующих алгоритмах. a) S = ? — одномерная случайная величина с дискретным распределением и принимает конечное число значений xt (i; = 1, . . . , т) с вероятностями 11т. Требуется моделировать случайную величину, принимающую те же значения с вероятностями/?,. Выберем в качестве г(х) функцию, определенную для х = xt равенством г {хг) = pt, ив качестве ц случайную величину, равномерно распределенную на [0, max/?*]. Так как в этом случае G(x) =—-— а с = = j7i«max/?2, то из B.2.9) следует dH = mr (x) dF (x). i Алгоритм. Моделирование случайной величины, принимающей с равными вероятностями т заданных значений т^, сводится к реализации номера ц и сопоставлению ему соответствующего xiQ. В данном случае i0 определяется следующим образом. Реализация а умножается на т, и целая часть полученного числа полагается равной i0. Коль скоро iQ определено, проверяется неравенство piQ > > a max ^,ив случае его выполнения реализация ? считается равной xiQ. В случае невыполнения неравенства определяется новое значение а и вычисления повторяются.
§ 2] ОБЩИЕ МЕТОДЫ МОДЕЛИРОВАНИЯ 57 Полученная процедура является дискретным аналогом метода Неймана. Ее эффективность, определяемая как и для непрерывного случая, равна 1//тг»тах pt. б) Fs (х) имеет плотность ф (х). Тогда Н также имеет плотность h (ас), определяемую равенством h(x) =c-<p(x)G(r(x)). B.2.10) В одномерном случае, если г (х) = х на промежутке [0, а] и t] также принимает значения из [0, а], получаем h{x) = c.y(x)G(x). B.2.11) Если предположить, что а = 1 и rj распределена равномерно на [0, 1], а г — произвольная функция, удовлетворяющая условиям предложения 5, то h{x)= Ф(«)г(«) B.2.12) l4(x)r(x)dx при условии J ф (х) г (х) dx <[ оо. В этом случае легко определить, какой должна быть г (#), чтобы равенство B.2.12) определяло заданную функцию h. r (х) определяется с точностью до постоянного множителя сг равенством [0, если либо h(x) = 0, либо ф(ж) = 0. Если max (h (x)lq> (x)) = 1, то с1 = 1. Если это не так, но X h (х) предполагается ограниченной и ф (х) !> е ]> 0 для всех х в рассматриваемой области, то сх выбирается с учетом того, что г) ^ 1, и следовательно, г (х) должно не превосходить единицы. Очевидно, достаточно положить сх = = min (ф (x)lh (x)). Эффективность метода определяется х отношением 1 I \у(х)г(z) dx. Число частных случаев использования формулы B.2.9) легко может быть умножено. Очевидно, что метод Неймана можно комбинировать с формулами обращения. Решение одного или нескольких уравнений можно заменить моделированием соответствую
58 МОДЕЛИРОВАНИЕ РАСПРЕДЕЛЕНИЙ [ГЛ. 2 ющих одномерных распределений по методу Неймана. Формулы обращения могут быть в свою очередь полезны при использовании обобщений метода Неймана. В качестве своеобразного обобщения метода Неймана можно также рассматривать «метод постоянной ординаты», одномерный вариант которого предложен в работе Романовского [1]. Он основан на формулируемом ниже предложении 6 и может привести к алгоритмам с высокой эффективностью для моделирования некоторого класса распределений. Предложение 6. Пусть г (х) — неотрицательная непрерывная функция s переменных, заданная в s-мер- ной области 3) ограниченного объема и такая, что max г(ж)=1. Если а равномерно распределена на 10,1], i с^, ... — последовательность равномерно распределенных в 3) случайных величин, независимых в совокупности и от а, то при выборе первого щ из этой последовательности такого, что выполняется неравенство г(а!)><х, B.2.13) плотность р (х) распределения сц есть г(х) тез {х:) о Доказательство. Вероятность того, что а\ принадлежит элементарному объему dv = dxx ... dxs при фиксированном а = у, есть dv/mes {х : г (х) > у), если г (х) > у, и нуль в остальных случаях. Отсюда получаем гE) : dv) — dv тез {х: i о что и доказывает предложение. Алгоритм. Очевиден. Привлекательно то обстоятельство, что функция г вычисляется один раз на одну реализацию случайной величины. Частный случай. В одномерном случае, когда 3) есть отрезок [а, Ь], если р (х) монотонна, то монотонной
§ 2J ОБЩИЕ МЕТОДЫ МОДЕЛйРОЙАЙИЙ 59 должна быть и г(х). Пусть обе они убывают. Тогда Г(Х) о При условии дифференцируемости р (х) и г (х) получаем р' (х) = г' (х)/г~* (г (х)). Так как г~г (г (х)) = х — а, то Р'(*)=-т=7" и г(яг) Так как г (#) монотонно убывает и max г (ж) = 1, то пола- х гаем г (а) = 1, т. е. С = 1, и после интегрирования по частям г (х) = [(* - а) р (ж) - F (ж)] + 1, B.2.16) где F (х) — функция распределения, соответствующая плотности р (х). В отдельных случаях формула B.2.14) может быть источником удобных алгоритмов, хотя в общем случае необходимость использования F (х) делает ее применение практически неудобным. Легко указать класс функций распределения F (х), для которых г (х) имеет достаточно простой вид. Пусть а — О, Ъ = I и g (х) — дифференцируемая функция, значения которой вычисляются довольно просто, г (х) будет легко вычисляться, если хр (х) — F (х) = = г(х) — 1 будет равно g (х). В этом случае F (х) должна удовлетворять дифференциальному уравнению xF' (x) — — F(x) = g(x), формальным решением которого служит F (х) = х \ gp ' dt + C. Моделирование распределений такого вида не является тривиальным. В общем случае, когда не предполагается монотонность р (х), вводится функция А* (у) = mes {х : р (х) > ^> у]. Обратную к ней функцию h (у) можно рассматривать как плотность распределения некоторой случайной величины. Так как h(x) монотонна, то по ней можно построить функцию р (х), используя формулу B.2.14). Из р-1 (у) = mes {х : г (х) > у) следует г (х) = р (/г1 (р (х))).
60 МОДЕЛИРОВАНИЕ РАСПРЕДЕЛЕНИЙ [ГЛ. 2 Дальнейшее обобщение описанного приема состоит во введении произвольного распределения абсциссы. Если абсцисса распределена с плотностью fi(x), то для монотонных функций формула B.2.15) будет иметь вид ПХ) (х) - ^ -^ B.2.17) fi(t)dt а а формула B.2.16) — вид X г{х) = р (х) F1(x) + i-\p (x) U (х) dx, B.2.18) О где Fx (x) — функция распределения, соответствующая плотности Д (х). Остановимся далее на методе композиции, не формулируя, ввиду крайней простоты, соответствующего предложения. Метод композиции, предложенный Батлером [1], является методом, позволяющим повысить эффективность моделирования распределений за счет введения многостадий- ности моделирования и расчленения моделируемого распределения на более простые. Приведем его одномерный вариант. Обобщение на многомерный случай трудности не представляет. Пусть т) — случайная величина с функцией распределения G (у) и я|) (х, у) — семейство нормированных по х при любом у плотностей. Предположим, что интересующую нас плотность ф (х) можно представить в виде Тогда, выбирая тH — реализацию случайной величины т] и моделируя затем плотность г|) (х, т]0), получаем реализацию случайной величины I, распределенной с плотностью вероятности ф (х). Батлер использовал этот метод для моделирования плотности, заданной рядом с неотрицательными коэффициентами: оо Ф (х) = 2 <ц«* («i > 0, 0 < х < 1). B.2.19) 1=0
i 2J [ОЁЩИЁ МЕТОДЫ МОДЕЛИРОВАНИЙ 61 Так как ф (х) нормирована, то 2 аг/(* + 1) = 1- Если fibril брать в качестве г\ дискретную случайную величину, принимающую значения i = О, 1,... с вероятностью #$/(?-[-1), и положить if (х, у) = (у + 1) ху (О ^ х <^ 1), то, очевидно, i=0 Процедура моделирования состоит, таким образом, в определении i — реализации случайной величины т] и затем в моделировании плотности (i + 1) #*• Часто метод композиции применяется следующим образом, ф (х) представляют в виде суммы двух слагаемых где фх (х) и ф2 (х) — нормированные плотности, рг > О, р2 ^> 0 и рх + р2 = 1- Если фх (х) — плотность, которую можно просто моделировать, а ф2 (х) требует для моделирования большой затраты труда и р±^> р2, то достигается большой выигрыш в вычислительной работе, так как алгоритм состоит в частом моделировании фх (х) (с вероятностью рх) и редком — ф2 (х). Эти соображения и используются для повышения эффективности метода Неймана. В этом случае плотность <р(х), эффективность моделирования п которой мала, представляют в виде 2 АФ{(Х)> гДе Pi п0~ п ложительны, 2 Р% = 1» а Фг (х) ~ плотности такие, что ли- г=1 бо эффективность моделирования каждой из них по методу Неймана достаточно велика, либо плотностям с малой эффективностью соответствуют малые pt. Ряд подробностей относительно повышения эффективности метода Неймана читатель может найти в работе Голенко [1]. Упомянем еще в связи с композиционным методом работу Батлера [1], где плотность ф (х) представлялась в виде ф (х) = п = 2 агФ| (х) tyi (x)i <Pi(x) и 4>t (x) tyt (x) предполагались
62 МодеЛироёание Распределений ЕРл. г нормированными плотностями. Номер i плотности tyi (х) Ф* (х) находился, как это описано выше, а произведение ф^ (х) tyi (x) моделировалось с помощью обобщенного метода Неймана (см. B.2.9)). § 3. Специальные методы моделирования неравномерных распределений Разделение методов моделирования на общие и специальные в известной мере условно. Преобразование И. В. Смирнова (формулы обращения), метод постоянной ординаты и другие методы, обсуждавшиеся в предшествующем параграфе, целесообразно применять с учетом особенностей распределений, и удачное применение того или иного общего метода к данному распределению можно рассматривать как специальный метод. К числу общих методов нами отнесены методы, позволяющие по крайней мере теоретически моделировать произвольное распределение или весьма широкий класс распределений. Специальными методами мы считаем методы, применимые к достаточно узкому классу или к конкретному распределению. Разумеется, имеет смысл рассматривать лишь те конкретные распределения, которые очень часто встречаются в реальных задачах (например, пуассоновское, нормальное и связанные с ним распределения). При моделировании распределений частного вида широко используются известные в теории вероятностей соотношения между распределениями случайных величин, а также предельные теоремы и некоторые формулы численного анализа. В частности, нами будут далее использоваться известные (см., например, Прохоров, Розанов [1]) соотношения. 1. Если случайная величина х\ является функцией случайных величин ?i, . . . , Б,, Ц = / (?х, . . . , Is) и Ф (хи . . . , xs) есть плотность совместного распределения h L, то P{c<T!<d}= $. ..$ <f(xl9...,Xi)dx1...dxg. B.3.1) 2. Если случайные величины ?1? . . . , ?s и т)г, ... . . . , T)s имеют плотности совместного распределения Ре (#i> • • • > х8) и рн (уи • • • » Уз) соответственно и т|* =
§ 3] СПЕЦИАЛЬНЫЕ МЕТОДЫ МОДЕЛИРОВАНИЯ 63 = ft (lu . . . , ls) (i = 1, . . . , s) — преобразование с от- личным от нуля якобианом Ф = —г г— , то плотности о Ре и />н связаны соотношением рн (Уи •-••»•) = = Pa (A (*i, • • • , ««), ..-,/• («1, • • • , «•)) I Ф |. B.3.2) 3. Если ^ и ^2 — независимые случайные величины с плотностями рх (х) и р2 (х) соответственно, то плотность р (у) распределения суммы ?х + ?2 равна Р(у) == j Pi(y — x)Pi(x)dx (формула свертки). B.3.3) —оо Эти и некоторые другие соотношения часто позволяю- получить для реализации случайной величины \ явное выражение вида 5 = / («1, . . . , о„). B.3.4) Такое представление реализаций ? очень удобно в вычислительном отношении. Приведем сначала простейшие примеры представления 5 формулой вида B.3.4). Пример 1. Из B.3.3) непосредственно следует, что I = а± — а2 имеет плотность распределения 0, яё[-1, +1]. Пример 2. Для |(n> = max (а1? . . . , ап) же[0,1], Действительно, если |2 = max (а1? а2), то XI X {y\y>x)dx = \ 2xdx. 0 Аналогичные рассуждения могут быть приведены в случае произвольного п и для случая ?(w> = min (<хь ..I. , ап).
64 МОДЕЛИРОВАНИЕ РАСПРЕДЕЛЕНИЙ [ГЛ. 2 Если ?(n> = min (ax, . . . , осп), то n(i-x)n-\ же[0,1], о, *е[0,Ц. Г. А. Михайловым [1] изучались отдельные классы случайных величин, для моделирования которых можно указать удобные формулы вида B.3.4). Приведем некоторые из его результатов. Предложение 7. Пусть ф (х) — плотность распределения, непрерывная и монотонно убывающая при х ^> ^> 0 и равная нулю при х <Т0, и существует не обязательно конечный предел lim ф (х) = М. Если случайная величина т] распределена с плотностью вероятности г|) (у) = ф (у), 0 < у < М, а а распределена равномерно на [0, 1], то случайная величина | = оф-i (л) B.3.5) распределена с плотностью вероятности ф (д:). Доказательство. Очевидно, \р (у) является плотностью. (Замена осей не меняет площади, ограниченной осями координат и кривой у = ф (х).) При фиксированном г) = г/о ? распределена равномерно на отрезке [0, ф*1 (уо)Ь Но тогда случайная точка ?, г] равномерно распределена в области @ < у < М; 0 < х < ф-1 (»)) (см. предложение 4) и, следовательно, в области А это, на основании упомянутого предложения, и означает что ? распределена с плотностью ф (х). Примеры. 1. ф (х) = — log х, 0 < х < 1, | = а 2. ф (х) = arccosa:, 0 <; а: ^ 1, g = а j Аналогичный характер носит Предложение 8 (Михайлов [2]). Пусть ф (х) — непрерывно дифференцируемая плотность, равная нулю
§ 3] СПЕЦИАЛЬНЫЕ МЕТОДЫ МОДЕЛИРОВАНИЯ] 65 при х ^ О и ф (х) + ф' (х) ^> 0 при х ^> 0. Тогда * (У) = Ф (У) + Ф' (У) = [Ф (?) «*]' е-" является плотностью, и если т] — случайная величина, распределенная с плотностью ty (у), то % = — log а + г) пределена по закону ф (ж). Доказательство. (у) АУ = lim $ [ф (У) + У B/)] dy = lim Предел существует, так как \р (у) > 0, ф — плотность, и равен единице. Таким образом, -ф является плотностью. Плотность распределения для — log а есть e~z (z^> 0). По формуле свертки B.3.3) плотность распределения Pz (t) случайной величины g есть t t что и требовалось доказать. Пример, ф (х) = се~х sh B Yх), ф (г/) = с [е-У sh /y^]' erv = се~У Такую плотность распределения имеет величина т] = = {и + ]Л2J/2, где г/ распределена нормально со средним 0 и дисперсией 1 и I = Ци + /2)а/2 - log a]. B.3.6) Принципиальную возможность исследовать представление случайных величин в виде B.3.4) дает формула B.3.1). Однако ее непосредственное использование требует обычно весьма сложных выкладок. Поэтому предложения, аналогичные предложениям 7 и 8, могут представлять значительный интерес в конкретных случаях. Далее рассмотрим методы моделирования некоторых конкретных распределений, которые часто встречаются на практике, 3 С. М. Ермаков
66 МОДЕЛИРОВАНИЕ РАСПРЕДЕЛЕНИЙ [ГЛ. 2 1. Показательное распределение. Соответствующая плотность есть (*)* о ' *>0' B.3.7) 0 , я<0, где / (х) — неотрицательная, интегрируемая на любом конечном промежутке [О, А] функция, такая, что lim\ f(t)dt = + 00. С показательным распределением тесно связано распределение Пуассона и пуассоновский случайный процесс. Распределение Пуассона является дискретным. Соответствующая случайная величина принимает значение i (i = О, 1, ...) с вероятностью рг = -ту- е~х. Процесс Пуассона является марковским процессом с переходной плотностью вероятностей: I О т. е. разность у — х распределена по показательному зако- НУ- / (х) называют параметром пуассоновского процесса. Если начальное распределение также является показатель- п ным с параметром / (#), то последовательность сумм 2 ?i* г=1 п = 1, 2, ..., где %i независимы и распределены по показательному закону B.3.7), образует реализацию пуассоновского процесса с параметром / (х). Если/ (х) == X постоянна, то моделирование плотности B.3.7) не представляет труда (см. B.2.5)). Если/ (х) — достаточно сложная функция, то применение любых общих методов приводит к трудоемким вычислительным процедурам. В этом случае полезен метод (Колеман [1], Михайлов [8]), который состоит в следующем.
§ 3] СПЕЦИАЛЬНЫЕ МЕТОДЫ МОДЕЛИРОВАНИЯ 67 Пусть / (х) <^ А = Const, ? — случайная величина, распределенная с плотностью р^ (х) = А ехр (— Ах), i х > 0, ?15 ?2, ... — независимые реализации ? и & = 2 §*> 1 = 1,2, ... Получаем последовательность а1? а2, ... и проверяем выполнение неравенства at <^ g (?г). Здесь и далее положено g (х) = / (х)/А. Если г0 — первое из значений i, для которого выполняется это неравенство, то ?ie является реализацией случайной величины, распределенной с плотностью B.3.7). Действительно, функция распределения ?г- определяется равенством где ^g есть событие, заключающееся в выполнении ряда неравенств При фиксированных g4 : gx = лгх, . . . , ls = xs и, следовательно, фиксированных ?г, ? = 1, . . . , б*, имеем в силу независимости а1? . . . , as S—1 = П PK X Так как ^ независимы и одинаково распределены с плотностью вероятности А ехр (— Axt), то, полагая 3*
68 МОДЕЛИРОВАНИЕ РАСПРЕДЕЛЕНИЙ [ГЛ. 2 h (х) = 1 — g (x), получим s—1 Р {Es} = С d^ С 0 0 s— • • • h B *i) 8 (S *i) ^ exp (- Л 2 *J . B.3.9) i i i 0 0 О s—1 s Обозначим yj = 2 ^i» / = 1»...»s. Так как ^i меняются i-l в пределах O^^^x— 2 ^ь» т0 Для Уз получаем z/j-i^ Уз<^х. Меняя порядок интегрирования в B.3.9), получим Р{Es} = As^g(ys) exp(- Ayt) J h(y 0 0 Легко проверить последовательным дифференцированием, что У* Уг V$ -1 Л (г/0 йг/г = (g^t)| [ J h (у) dy] . 0 0 О Отсюда х = S / B/) ехр (- 4у) • exp что и требовалось доказать. 2. Одномерное нормальное распределение. Имеется значительная библиография но вопросу моделирования нормального распределения и распределений, связанных с
§ 3] СПЕЦИАЛЬНЫЕ МЕТОДЫ МОДЕЛИРОВАНИЯ ($ ним. Мы остановимся ниже на основных методах. Более подробный обзор можно найти в монографиях Голенко [1], Янссона [1], Бусленко и др. [1], Михайлова [12]. Ряд методов связан с использованием центральной пре- п дельной теоремы. Рассмотрим сумму 2 °Ч- Ее среднее зна- чение равно п/2 и дисперсия /г/12. Следовательно, случайная величина имеет среднее нуль, дисперсию единица и при п -» оо ее распределение стремится к нормальному. Практически считают, что при п = 12, когда B.3.10) имеет особенно простой вид 12 г=1 получается достаточно хорошее приближение к нормальному закону (Янссон [1]). Разумеется, при решении конкретных задач нужно учитывать, что в области достаточно больших уклонений ^12> не может дать хороших результатов. (При х ^> 6 плотность р (х) случайной величины |A2) тождественно равна нулю.) Хороший пример задачи, где это обстоятельство весьма существенно, содержится в работе Кутая и Файнштейна [1]. В ряде случаев используется Цп) с еще меньшим числом слагаемых, но применяются специальные преобразования, уточняющие результат. Такого типа преобразования изучались Болыпевым [1]. Простейшее из них дает формулу -JL B.3.12) где ?(п) определяется формулой B.3.10). В книге Голенко [1] утверждается, что распределение т](п) достаточно близко 5 к нормальному при п — 5. B310)B31 ру р Формулы B.3.10)—B.3.12) имеют вид B.3.4). К формулам этого вида относятся и формулы, которые, по-видимому, впервые рассматривались Винером (см. также Бокс и Мюллер [1], Кропмаль [1]). Они основаны не на централь-
70 МОДЕЛИРОВАНИЕ РАСПРЕДЕЛЕНИЙ [ГЛ. S ной предельной теореме, а на соотношении B.3.2) и имеют вид I = Y — 2 log <хг cos 2л;а2, ч\ = У — 2 log <хг sin 2пс^. B.3.13) Величины | и г] независимы и распределены нормально. Действительно, если х = г cos 6, у = г sin 6 и ср (х, у) — плотность совместного распределения х и г/, то, согласно B.3.2), гиб распределены с плотностью г ф (rcosB, r sin 0). Поэтому, если ф(#, г/) = 1/2 я ехр [— 1/2 (х2 + г/2)], то г распределено с плотностью г ехр (— г212) (г ^> 0), а 0 равномерно на [0,2 я]. Отсюда с учетом B.2.1) следует наше утверждение. Разумеется, случайную величину, распределенную с плотностью г ехр (— г72), не обязательно моделировать с помощью формул обращения, представляя ее в виде ]/— 2 log ax. Вычисление корня квадратного и логарифма — довольно трудоемкая операция. Можно использовать, например, различные модификации метода Неймана. Аналогично cos2jtoc2 и sin2jxa2 являются проекциями единичного вектора, направление которого равномерно распределено на плоскости. Ниже рассматриваются методы моделирования такого вектора. Моделированию нормально распределенной случайной величины посвящено значительное число работ. Кроме уже перечисленных методов, изучались также различные кусочные аппроксимации функции, обратной к интегралу вероятностей. Краткий обзор можно найти в книге Янссона [1]. Задача о наиболее экономичном в смысле числа операций ЭВМ алгоритме моделирования нормального распределения обсуждается в книге Михайлова [12]. Следует указать также недавнюю работу Дитера и Аренса [2], посвященную моделированию нормального распределения. 3, Многомерное невырожденное нормальное распределение случайных величин с нулевыми средними определяется ковариационной матрицей С = \\ ctJ || |>;-=1, det С Ф Ф 0; его плотность есть Ф ('1. .-.,*.) = ^|!?ехР (- V,»7^-1*), B-3.14) где хт = {х±, . . . , xs) — вектор-строка, а х — соответствующий вектор-столбец. Согласно B.3.2) невырожденное
§ 3] СПЕЦИАЛЬНЫЕ МЕТОДЫ МОДЕЛИРОВАНИЯ 71 линейное преобразование случайных величин переводит плотность B.3.14) в плотность того же вида с другой ковариационной матрицей. Так как С положительно определена и симметрична, то с помощью метода квадратных корней (Фаддеев, Фаддеева [1], стр. 165) ее можно представить в виде С = SST, где S — треугольная матрица, a ST — транспонированная к ней. При этом С = (SS7)'1 = = (S7)-1 (Sy1 и хтС~хх = (S^xO S-Xx. Положим далее у = S^x, что соответствует линейному с матрицей S'1 преобразованию случайных величин |A), . . . , ?(s\ распределенных с плотностью B.3.14). Очевидно, Ф (х1У. . . , та) = Ф (у19 ...,уа) = B я)-/« ехр (- 1/2 у* у). B.3.15) Отсюда следует, что случайные величины rjA), . . . , r](s\ имеющие <р плотностью распределения, независимы и распределены нормально с нулевым средним и единичной дисперсией. Таким образом, для получения реализации многомерной нормальной случайной величины ?A>, . . . , ?(s) следует получить независимые реализации s одномерных нормальных случайных величин т^1), . . . , r](s> и затем воспользоваться соотношенпем S = S Н, где S и Н — векторы с компонентами ?(i> и г)(|> соответственно. Треугольный вид матрицы S избавляет нас от необходимости хранения полной матрицы ковариации и приводит к значительной экономии памяти ЭВМ при больших s. 4* Распределения, связанные с нормальным. Для ряда случайных величин, которые непосредственно выражаются через нормально распределенные случайные величины, естественным образом могут быть указаны алгоритмы моделирования. Такими случайными величинами являются, например, случайные величины, имеющие Г-, C-, х2"Рас~ пределения при определенных ограничениях, налагаемых на параметры этих распределений. Соотношения между указанными распределениями и нормальным приводятся во многих руководствах по математической статистике (например, Уилкс [1], стр. 169 и далее). Мы ограничимся рассмотрением двух конкретных примеров. Более полно вопрос освещен в работах Романовского [1], Михайлова 112], Япссона [1J.
72 МОДЕЛИРОВАНИЕ РАСПРЕДЕЛЕНИЙ [ГЛ. 2 а) ^-распределение обсуждалось выше (см. A.3.6)). s Величина у% = 2 Й (s > 0, целое), где ^ — независимые, нормально распределенные с параметрами @, 1) случайные величины, распределена по закону %2 с s степенями свободы. Метод ее моделирования не требует особых пояснений. Заметим, что если для моделирования ^ используются формулы B.3.13), то при s четном получаем X? = -21og(a1aa... as/2). B.3.16) При s нечетном Xl> — 2 log (axa2... a(8_1)/2) — 2 log a(s+1)/2. cos2 2jtoc(s+3)/2. б) Случайная величина pr?s, имеющая ^-распределение с параметрами г ж s (г^> 0, s^> 0 — целые), связана со случайными величинами, имеющими ^-распределение, соотношением 4- Y2 __« г" л2з откуда следует, согласно B.3.16), формула для получения реализаций |5r,s: Плотность распределения C^s есть ^.W^JT^^t1-^^^^ B.3.18) 1 0, же [0,1]. 5, Моделирование равномерного распределения на поверхности сферы. Довольно часто возникает необходимость в моделировании равномерно распределенного изотропного направления в пространстве или (что то же самое) векторной случайной величины, равномерно распределенной на поверхности сферы единичного радиуса. Очевидно, имея точку, равномерно распределенную внутри шара, легко решить поставленную задачу: нужно просто найти пересечение с поверхностью шара луча, исходящего из центра
§ 3] СПЕЦИАЛЬНЫЕ МЕТОДЫ МОДЕЛИРОВАНИЯ 73 шара и проходящего через эту точку. Из этих соображений следует такой Алгоритм (для 5-мерной сферы). Получаем реализацию величины ее (ScW = at — 1/2), равномерно распределенной в гиперкубе {— 1/2 <; х® <^ l/2}t=r Проверяем, попала ли точка а внутрь шара (х^J + {х^ J + ... ... + (x(s)J <^ 1/4. Если попала, то компоненты Т/, ; = 1,. . . . . . , s, единичного вектора, проходящего через точку, равномерно распределенную внутри сферы, вычисляются по формулам S / B ДО))«IЛ. B.3.19) Если полученная реализация й не попадает внутрь сферы, то нужно получить новую ее реализацию и повторить описанные вычисления. Заметим, что выбор 1/2 в качестве радиуса сферы несколько уменьшает вычислительную работу. Возможны, как обычно, различные модификации алгоритма. Так, при 5 = 2 удобно проверять попадание точки в верхнюю половину круга. Проведенное через эту точку направление составит с осью х угол |3, равномерно распределенный на промежутке [0, зх]. Очевидно, тг = cos 2 C , т2 = sin 2 |3. Отсюда следует (Бусленко и др. [1], стр. 115,) алгоритм, согласно которому следует выбирать пары а3 = = 2 ах — 1, а2, для которых выполняется неравенство (ос2J + а! <^ 1, и полагать B.3.20) Подобная модификация позволяет избежать извлечения квадратного корня, что может быть существенным при реализации алгоритма на ЭВМ. При больших s процедуры подобного рода оказываются, однако, малоэффективными. Так, при 5 = 6, лишь около 0,02 от общего числа проб дают желаемый результат (а оказывается внутри сферы), а при 5 = 20 лишь 0,25-10. Алгоритм, который мало усложняется с ростом 5, изложен в работах Мюллера [1], [2]. Он основан на том, что плотность совместного распределения 5 независимых случайных величин, распределенных нормально с нулевым
74 МОДЕЛИРОВАНИЕ РАСПРЕДЕЛЕНИЙ [ГЛ. 2 средним, сферически симметрична. Если ^, i = = 1,2, . . . , — независимые реализации нормально распределенной случайной величины с нулевым средним, и рассматриваются непересекающиеся наборы из .9 таких реализаций, как точки в 5-мерном пространстве, то легко усмотреть из сферической симметрии плотности, что их количество в любом 5-мерном телесном угле пропорционально объему этого угла. Таким образом, следует положить j = l,-..,s. B.3.21) Здесь при больших s следует использовать наиболее экономичные методы получения нормально распределенных случайных величин. Еще один подход, приводящий к рекуррентным по s процедурам, изложен в работе Хикса и Уилинга [1]. Перечисление различных приемов моделирования конкретных распределений легко продолжить. Мы ограничимся наиболее характерными приемами для моделирования весьма распространенных на практике распределений. Моделирование случайных процессов тесно связано со специальными методами моделирования случайных величин. Выше уже обсуждался вопрос о получении реализаций пуассоновского процесса. Он относится к числу скачкообразных марковских процессов, моделирование которых состоит в последовательном моделировании случайных величин, определяемых переходной функцией распределения. Относительно моделирования случайного процесса в общем случае можно заметить лишь следующее. Для получения реализации случайного процесса, строго говоря, необходимо моделировать всевозможные совместные распределения его значений. Практически мы не можем получить реализацию бесконечномерного случайного вектора и вынуждены ограничиться конечномерным с достаточно большим числом компонент. Вызываемая этим погрешность зависит от характера конкретной задачи и в каждом случае подлежит исследованию. Если моделирование осуществляется для вычисления некоторых средних по траекториям процесса, то переход к конечномерным распределениям эквивалентен приближенной замене интеграла бесконечной кратности интегра-
§ 3] СПЕЦИАЛЬНЫЕ МЕТОДЫ МОДЕЛИРОВАНИЯ 75 лом конечной кратности и погрешность зависит от вида интегрируемой функции. Погрешность оказывается малой, если эта функция достаточно слабо зависит от переменных с большим номером. После проведения соответствующего исследования и определения размерности подлежащего моделированию вектора задача принципиально может быть решена одним из методов, описанных выше. Алгоритм моделирования при этом может, естественно, оказаться очень сложным. В настоящее время разработан ряд специальных приемов моделирования некоторых классов случайных процессов. На отдельных приемах такого рода мы остановимся ниже, сделав предварительно некоторые общие замечания. Один из методов моделирования конечномерных распределений гауссовского процесса был уже рассмотрен (многомерное нормальное распределение). Этот метод может оказаться неудобным не только из-за вычислительных трудностей, связанных с моделированием вектора данной размерности, но и по той причине, что правильно определить необходимую размерность без предварительных вычислений не всегда возможно. Если выбранная размерность недостаточна, то необходимы дополнительные вычисления, связанные с разложением на две треугольные соответствующие матрицы большего порядка. Если увеличение размерности связано с добавлением одной лишней точки на временном интервале, то в некоторых случаях удобно использовать прием, описанный в работе Шойера и Стол- лера [1]. Прием этот основан на последовательном моделировании условных распределений многомерной нормальной плотности. Пусть S = (l^1), . . ., ^s>) — моделируемый нормальный вектор с нулевым средним и ковариационной матрицей С = || си j ||i. Компоненты S могут быть выражены через независимые реализации r\W, i = 1, . . . , s, нормальной случайной величины с нулевым средним и единичной дисперсией следующим образом. Обозначая через mk = = М (?<*> | ?<*+», . . ., ?(-)) и oi = D (g*> j ?<*+«, . . ., ?<¦>) условные при фиксированных ?(/с+1\ . . ., ?(s) математическое ожидание и дисперсию, получим к = 1, . . . , s. B.3.22)
76 МОДЕЛИРОВАНИЕ РАСПРЕДЕЛЕНИЙ [ГЛ. 2 Опуская сравнительно простые выкладки, приведем следующие выражения для а? и тк: Щ = ек (С^Ггх1г, el = см - ск (CW) el = = det (C<*>)/det (C<fc+1)), A < s, B.3.23) где ch = (cfe, fe+1, . . . , cfe, s), xh+1 = (lk+1, . . ., Is) и C(fc) = I cu j Ji, j^fc — подматрица ковариационной матрицы С. Очевидно, что формулы B.3.22), B.3.23) удобны, если С имеет простой вид и увеличение размерности S связано с ее окаймлением. Вычислительные преимущества, связанные с последовательным увеличением размерности моделируемого вектора, очень хорошо прослеживаются на примере конструирования траектории броуновского движения (Винер [1], Гельфанд, Фролов, Ченцов [1]). Пусть I (t) —- траектория броуновской частицы иО< ^ t <^ 1, | @) = 0. Будем приближать ? (t) посредством ломаных, вершины которых поместим в точках tt = i/2n (i = 0, 1, . . . , 2П). Заметим прежде всего, что при п = 1 случайная величина ? A) распределена нормально со средним нуль (? @) = 0) и дисперсией единица, и ее реализация может быть получена одним из обсуждавшихся ранее способов. Увеличение числа п не влечет пересчета полученных ранее реализаций. При п = 2 ? A/2) распределена нормально со средним (? @) + ? A))/2 и дисперсией 1/4. Вообще, если получены реализации g (?') и ? (О (Г > *'), то —Y—) имеет нормальное со средним (| (*') + ? (i"))/2 и дисперсией (?" — ^)/2 распределение. Это позволяет дробить последовательно промежуток [0, 1] на части, кратные 2П, строить ломаные с соответствующим числом звеньев и следить за сходимостью интересующего нас функционала на траекториях к своему предельному значению. В работе Гельфанда и др. [1] приводится пример оценки погрешности конкретного функционала. Легко понять, что рассмотренная возможность увеличения размерности связана с марковостью моделируемого процесса. Если процесс можно точно или приближенно заменить векторным марковским процессом, то его также можно моделировать с помощью рекуррентных соотношений. В работе Сраговича [1] обсуждается использование
3] СПЕЦИАЛЬНЫЕ МЕТОДЫ МОДЕЛИРОВАНИЯ 77 такого рода соотношении; в случае, когда процесс — стационарный гауссовский и имеет дробно-рациональную спектральную плотность *) Л (к) где B.3.24) выбирается некоторое At и рассматриваются значения процесса ?fe = | (^) в точках ?fe = А:Д^ При достаточно малом Д? реализация стационарной последовательности |к сколь угодно близка к реализации случайного процесса. Для этой последовательности спектральная плотность имеет вид / (X) = | А (еа)/Б (eiX) |. Для вещественных процессов А (X) и Л (А-) — многочлены с вещественными коэффициентами вида B.3.24). Можно показать, что если корни Б (К) по модулю меньше единицы, то ?& удовлетворяет разностному уравнению ls+l + #s-l?SH-l + ' - - + В& - = Жгх\1+Г + ... + Лгг\1+Х + ЯоЧь B.3.25) где Аи i = 0, 1, . . . , г, и Bj, j = 0, 1, . . . , s — 1,— коэффициенты полиномов А и В соответственно, а т] независимы и распределены нормально со средним 0 и дисперсией 2 я. Справедливо и обратное утверждение: Если стационарная последовательность |ь удовлетворяет разностному уравнению B.3.25) и корни полинома *) Спектральная плотность g (к) стационарного случайного процесса связана с его корреляционной функцией R (t) = = М (g (I) g (t + т)) соотношением + ОО
78 МОДЕЛИРОВАНИЕ РАСПРЕДЕЛЕНИЙ [ГЛ. 2 s—1 Xs + 2 ^к^к до модулю меньше единицы, то существует fc=0 спектральная плотность последовательности вида / (X). Так, если корреляционная функция процесса К (т) = = се~&№ (р ^> 0), то соответствующая спектральная плотность g (к) = л 2 , о2 » где ^4 = (Зс/л:. Корреляционная функция последовательности 5л где — оо в* Легко найти, что / (X) = —г-п » уравнение B.3.25) имеет вид lk+1 _ p?fc = Вцк. B.3.26) Моделирование состоит в получении независимых реализаций нормально распределенных с параметрами (О, У 2л) случайных величин т] &и вычислении по рекуррентной формуле B.3.26). Если разложить спектральную плотность на простейшие дроби, то соотношения B.3.25) можно заменить рядом рекуррентных соотношений вида B.3.26). В работе Сраговича [1] указаны также рекуррентные соотношения для моделирования диффузионных процессов. В работе Франклина [2] для получения соотношений вида B.3.25) в случае процесса с дробно-рациональной спектральной плотностью используется аппарат стохастических дифференциальных уравнений. Главное отличие этой работы от работы Сраговича [1] состоит в том, что в ней исключается ошибка дискретизации и находится распределение начального вектора, в то время как Срагович рекомендует отбрасывать начальный отрезок конструируемой последовательности до тех пор, пока она не станет стационарной. Различным модификациям описанных методов и практическим рекомендациям по их использованию посвящено много работ. Мы упомянем дополнительно лишь о группе методов, связанных с неопределенными коэффициентами, а также о методах, связанных с представлением Каруне- на — Лоэва.
§ 3] СПЕЦИАЛЬНЫЕ МЕТОДЫ МОДЕЛИРОВАНИЯ 79 Если реализации стационарной случайной последовательности в целых точках к = 1, 2, ... временной оси пытаться получить в виде lh = CiHfr-i + c2iU-2 + ... + cNr\H-N, B.3.27) где Mr]fe = 0, Dr)fe = 1> & = 0, + 1, + 2, . . . , iV фиксировано, то, вычисляя значения ковариационной функции M(U 1ы) =Ri, 1 = 0, 1, . . . , TV, получим iV 2V—1 — систему нелинейных уравнений относительно ct, i — = 1, . . . , N. Решение этой системы может представить определенные трудности. Следующей группой методов являются методы, где в представление |ь, кроме неопределенных коэффициентов, входят некоторые известные с точностью до параметра функции времени. Здесь можно сослаться, например, на работы Миркина, Рабиновича и Ярославского [1]. С представлением Карунена — Лоэва связана работа Пиранашвили [1], где рассматривалась задача моделирования процесса ? (?, со), а ^ ? <^ Ь, с заданной одномерной функцией распределения / (ж, I) и корреляционной функцией R (t, s). Пусть у = f {x, t) — абсолютно непрерывная функция и х = ft1 (у) — обратная к / функция при фиксированном t. Для широкого класса гауссовских случайных процессов имеет место представление I (t, со) - ft1 (Ф (Л (*, «))), а < t < b, B.3.29)
80 МОДЕЛИРОВАНИЕ РАСПРЕДЕЛЕНИЙ [ГЛ. 2 где x ^ft (со) — независимые нормально распределенные случайные величины со средним 0 и дисперсией единица, a Xh и Фк — собственные значения и собственные функции интегрального уравнения Ядро этого уравнения связано с корреляционной функцией R (?, s) процесса 5 (?» со) довольно сложным соотношением^ а именно г (t, s) есть корень уравнения ? (г (*, 5)) = 0, B.3.30) где X exp |— Y f } — m(t)m (s) - Л (t, s) a (t) б (s), B.3.31) a m (i) и a2@ — среднее значение и дисперсия процесса I (t, со). Представление B.3.29) восшожно,, если уравнение B.3.30) имеет решение, которое является неотрицательно определенной функцией. Оно дает возможность моделировать гауссовский процесс с заданной одномерной плотностью и корреляционной функцией, однако предварительная работа, связанная с получением этого представления,, может оказаться весьма сложной. Ряд дополнительных сведений о моделировании случайных процессов читатель может найти в работе Левина [1] к монографиях Быкова [1] и Полляка [1], где уделяется много внимания вычислительной стороне вопроса и содержится достаточно подробная библиография.
ГЛАВА 3 ИМИТАЦИЯ § 1. Прохождение излучения через вещество Располагая сведениями, изложенными в двух предшествующих главах, можно решить ряд практических задач путем имитации вероятностной модели некоторого реального явления. В этой главе мы сознательно будем избегать выводов и исследования уравнений, описывающих то или иное явление. Существенно подчеркнуть особенность метода Монте-Карло, состоящую в том, что его применение не требует, вообще говоря, формулировки интегро-диф- ференциального уравнения, описывающего прохождение излучения, или системы дифференциальных уравнений, описывающей систему массового обслуживания. На практике могут возникнуть ситуации, когда формулировка подобных уравнений представляет значительные трудности, и желательно решить задачу без аналитического исследования вероятностной модели. Однако использование аналитического аппарата, как мы увидим в дальнейшем, позволяет строить более эффективные алгоритмы решения задач. Как уже отмечалось, метод Монте-Карло своим возникновением во многом обязан задачам расчета прохождения излучения через вещество. Многие теоретические вопросы метода возникли и получили свое развитие именно в связи с этими задачами. Поэтому представляется полезным в первую очередь изложить вероятностные модели, связанные с прохождением излучения через вещество. По необходимости это изложение будет неполным, так как автор далек от цели изложить в сколько-нибудь значительном объеме вопросы физики нейтронов и у-квантов. Будет изложена, по существу, схема моделирования, которая отражает, однако физическую суть явления.
82 ИМИТАЦИЯ [ГЛ. 3 Будем употреблять термин «частица» в собирательном смысле, имея в виду нейтрон, у-квант или протон, и изло- жихМ сначала схему моделирования в весьма общей идеализированной форме. Пусть имеется некий объем 3), заполненный атомами вещества и окруженный вакуумом. Частица характеризуется своим положением в пространстве г = (х, г/, z), временной координатой t, направлением движения — единичным вектором Q = (u, v, w) и скоростью v (или энергией Е). Таким образом, величины, характеризующие частицу, представляют собой точку в семимерном фазовом пространстве (и, v и w связаны соотношением и2 + v2 + w2 = 1). Будем предполагать (Фролов, Ченцов [3]): а) концентрация частиц в объеме мала, так что можно пренебречь их взаимодействием друг с другом; б) частицы взаимодействуют с веществом таким образом, что вероятности различных видов взаимодействия не зависят от предыстории частицы; в) вещество находится в стационарном состоянии, т. е. плотность вещества и его состав не меняются в зависимости от времени. При сформулированных предположениях процесс слагается из независимых «историй» частиц. Прослеживая эти истории, можно получить различные характеристики процесса прохождения излучения. История частицы начинается ее рождением. В области Т фазового пространства координат частицы задается функция распределения источников / (г, й, Е, t). Моделируя это распределение в момент времени tQ, получим начальные координаты г0, Яо» Ео, t0 частицы. Далее частица движется прямолинейно и равномерно до столкновения с ядром атома вещества (с электроном для у-квантов). Вероятность столкновения на пути dl равна 2 (г, Е) dl. Величина 2 (г, Е) определяется эксперименталглю (иногда возможен теоретический расчет этой величины) для данного элемента и данного типа частицы. При этом 2 (г, Е) = 2 г=1 где pi (r) есть плотность элемента с номером i (число ядер (электронов) в 1 см3), at (E) — микроскопическое сечение взаимодействия для элемента с номером ?, а ш — общее число изотопов химических элементов, участвующих в
§ 1] ПРОХОЖДЕНИЕ ИЗЛУЧЕНИЯ ЧЕРЕЗ ВЕЩЕСТВО 83 расчете. Для нейтронов at = &г1п, где dt — число нейтронов, взаимодействующих с данным элементом при условии, что п нейтронов падает по нормали к одноатомному слою. 2 (г, Е) называют также полным макроскопическим сечением взаимодействия для данного вещества. Таким образом, расстояние Z, которое частица проходит не взаимодействуя с веществом при заданном направлении движения ft, распределено по показательному закону с параметром 2 (г, Е) i НA) = 1 — ехр (— ^ 2(г0 + *О, Е) dl), C.1.1) о где г0 — начальное положение частицы. Моделируя пока зательное распределение, находим длину пути частицы Может оказаться при этом, что частица покинет область 33, не взаимодействуя с веществом. Тогда ее историю, очевидно, следует считать оконченной. Если же точка с координатами Xi = х0 -f~ UqI, 0i = У о + vol, C.1.2) принадлежит области 2), то с различными вероятностями возможны, вообще говоря, различные типы взаимодействий (нейтрон может столкнуться с ядрами различных элементов и т. п.). Располагая этими вероятностями, моделируем дискретное распределение и определяем конкретный вид взаимодействия, которое имело место. Типы взаимодействия в простейших случаях разделяют на три группы — рассеяние, поглощенней деление — образование новых частиц. При рассеянии, вообще говоря, изменяется направление движения частицы и ее энергия. При поглощении частица поглощается веществом и ее история прекращается. При делении возникает одна или несколько новых частиц, т. е. возникает новый (вторичный) источник. 1. Рассеяние. Вероятность рассеяния равна 2раСс/2. 2 расе — микроскопическое сечение рассеяния определяется аналогично полному сечению взаимодействия 2. Оно представляет собой сумму сечений всевозможных типов рассеяния. Для каждого конкретного типа рассеяния задается плотность вероятности изменить направление
84 ИМИТАЦИЯ [ГЛ. 3 движения й на Q' и энергию Е на Е' — функция g (Q,?->Q', ?"), которая называется индикатрисой рассеяния. Моделирование этой плотности дает возможность определить новое направление движения и новую энергию частицы. Далее снова определяется путь, пройденный частицей согласно C.1.1), т. е. расчет истории состоит из однотипных операций. Он оканчивается выходом частицы из области 2), ее поглощением или делением. Иногда расчет прекращают, если энергия частицы становится меньше некоторого допустимого значения Ет\п. 2. Поглощение. Его вероятность есть 2ПОгл/2. Физическая природа поглощения также может быть различной, но для нас существенно, что с поглощением оканчивается история частицы. 3. Деление. Вероятность деления определяется величиной 2дел/2. В результате деления возникает одна или несколько новых частиц. Задается функция распределения фазовых координат возникающих частиц; в процессе моделирования эти координаты вычисляются. При возникновении нескольких частиц процесс ветвится, т. е. возникает необходимость моделирования истории каждой возникшей частицы. Если вторичные частицы снова могут вызвать процесс дслепия, то возникает «дерево», все «ветви» которого должны быть просмотрены. Специальные методы просмотра такого «дерева» описаны в литературе (например, Голенко [1], Фролов [1]). Отметим, что определение координаты t (времени) по известным скорости движения и пройденному пути труда не представляет. Такова в общих чертах картина, возникающая при непосредственном моделировании процесса прохождения излучения через вещество. Результатами расчета обычно являются некоторые средние значения — например, среднее число частиц, покинувших область 25, среднее число частиц, поглотившихся в некотором объеме, и т. п. Более сложим по своей реализации задачи, в которых требуется определить распределение частиц в зависимости от каких- -либо характеристик (энергии, направления и т. п.). Остановимся более подробно на конкретных примерах. II р и м е р 1. Прохождение ^"Квантов через вещество. Пусть область 3) представляет собой пластинку однородного вещества, которую считаем достаточно большой (бесконечной) по двум измерениям и имеющей конечную толщину Н вдоль оси z. Источник будем считать точечным,
1] ПРОХОЖДЕНИЕ ИЗЛУЧЕНИЯ ЧЕРЕЗ ВЕЩЕСТВО 85 Рис. 3.1. моноэнергетическим и изотропным, помещенным внутри пластинки. Иными словами, у-кванты рождаются в одной и той же точке г0 с постоянной энергией Ео и имеют равную вероятность двигаться в любом направлении (рис. 3.1). Сечения взаимодействия могут быть заданы в виде таблиц (полное сечение 2 (Е) и сечение рассеяния 2расс (Е)). Промежуточные значения находятся интерполированием. (Различные процессы взаимодействия у-кванта с веществом мы разбиваем на две группы — процессы __ _ // рассеяния и процессыпоглощения. о Маловероятными процессами пренебрегаем, считая, в частности, что рассеяние есть рассеяние у-квантов электронами вещества.) Алгоритм полностью определяется заданием правила перехода от точки хп = (rn, Qn,En) к точке хп+1 — (rn+v Qn+1, En+l) фазового пространства и заключается в следующем: 1. По Еп находим 2 (Еп) и 2расс (Еп). 2. Находим 1п+1 = — log а/2 (Еп) — длину, проходимую у-квантом без взаимодействия с электронами вещества. U. lLji + i Usji —(— lji + iU/ fi , if 7| + 1 Ул -j— ln+\Uji) Z»72,+ l = zn + ln+lwn. Если zn+i ^> H либо гпЛ1 <С О, то регистрируется выход у-кванта из пластинки. 4. Если 0 <^ zn+1 <; Н, то определяем тип взаимодействия. С вероятностью 2расс/2 имеет место рассеяние. С вероятностью 1 — 2расс/2 — поглощение и тем самым окончание истории у-кванта. 5. Плотность вероятности распределения Еп+1, измеряемой в единицах тс2, где т — масса покоя электрона, а с — скорость света, определяется формулой Кляйпа — Мишины — Тамма (Лейпунский и др. [1]) D- - -г?—J при Еп > Еп+1 > ~^~ , (З-1-3) \ п п+1 / n+i для остальных
86 имитация И1 л. з С — константа нормировки — зависит от Еп. Отметим, что в работе Ишии и др. [1] приведена замечательно простая формула, дающая с погрешностью около 5% в большом диапазоне Еп значения величины Еп+1, распределенной с плотностью C.1.3): ~ ^С/ 1+0,5625^* *& # 6. Определяем косинус угла рас- п* сеяния Рис. 3.2. cos 9п+1 = 1 + 4" - "Л" • Угол отклонения от первоначального направления однозначно определяется энергией. Азимутальный угол распределен равномерно. 7. По углу Qn+1 и распределенному изотропно азимутальному углу рассеяния определяют пп+1 (рис. 3.2). Вывод формул можно найти, например, в руководстве Бусленко и др. [1] un+1 = (bcwnun — bdvn)/(l — wlf2 + aun, vn+1 = (bcwnvn — bdun)/(l — wlf/z + avn, C.1.4) wn+1 = — be A — wlL2 + awn, где a = cos 0n+i, b = sin 6n+1, с = cos 2яа, d = sin 2na, что и завершает описание алгоритма. Таблицы сечений для у-квгштеш имеют сравнительно небольшой объем. Они приведены, например, в книге Лейпунского и др. [1]. Угловые и энергетические характеристики могут быть получены по теоретическим формулам, имеющим сравнительно простой вид. Иным является положение в случае нейтронов. Моделирование прохождения нейтронов через вещество требует помещения в память машины большого числа констант. При этом угловые распределения, определяемые экспериментально, не всегда известны достаточно точно. Можно считать, что средние величины, которые, как правило, получают в результате расчета, сравнительно мало зависят от погрешностей в угловых распределениях и учета эффектов, имеющих ма-
§ 1] ПРОХОЖДЕНИЕ ИЗЛУЧЕНИЯ ЧЕРЕЗ ВЕЩЕСТВО 87 лую вероятность. Эти соображения, однако, требуют в конкретных случаях дополнительного обоснования — дополнительных расчетов или постановки эксперимента. При описанном способе моделирования нет принципиальных препятствий для определения любой средней характеристики процесса. Однако определение, например, среднего числа частиц, попавших в достаточно малый объем фазового пространства, может оказаться практически неосуществимым. Поскольку вероятность попадания в этот объем мала, то число историй, необходимое для регистрации хотя бы одной частицы, попавшей в объем, будет очень большим. Для вычисления малых вероятностей приходится прибегать к построению «фиктивных» моделей. Простейшим примером фиктивной модели может служить следующий. Пусть у-кванты проходят через пластинку, которая их сильно поглощает, и нас интересует вероятность их выхода. Представим, что по одной и той же траектории движется не один у-квант, а группа из N частиц. В точке взаимодействия iV2paCc/2 частиц в среднем рассеется, а остальные поглотятся. Вводя для у-кванта так называемый «статистический вес» Рп, который при его рождении равен единице Ро = 1, будем в точке гг-го взаимодействия полагать Рп = Pn^1ItvSiCC(En)/I,(En) и при выходе из пластинки подсчитывать не количество вышедших у-квантов, а сумму весов вышедших частиц (выйдут все у-кванты, но с разным весом). Таким образом, все у-кванты внесут вклад в сумму вышедших, и априори следует ожидать, что эта сумма будет вычислена более точно. Рассуждения наши, однако, нуждаются в более строгом доказательстве. Введение подобных усовершенствований без строгого обоснования может привести к грубым ошибкам. Пример 2. Моделирование ядерного каскада. Сравнительно простым примером модели, в которой первичная частица, взаимодействуя с веществом атомного ядра, вызывает образование вторичных частиц, является модель каскадной стадии ядерной реакции. Существуют различные теоретические модели атомного ядра, которые, как правило, включают некоторые неопределенные параметры. Считается, что модель удовлетворительно описывает ядерные реакции, если этих параметров не очень много и они
88 ИМИТАЦИЯ [ГЛ. 3 могут быть подобраны таким образом, что обеспечивается достаточно хорошее совпадение с экспериментом. Для подбора параметров необходимо провести большое количество расчетов. Модель, параметры которой определены, используется затем при решении различных задач, связанных с ядерными реакциями (например, при расчетах защиты от излучений.) Следует отметить, что метод Монте-Карло является в настоящее время единственным методом, позволяющим получить характеристики ядерных реакций при достаточно общих физических предположениях. Опуская ряд подробностей, относящихся к физической стороне явления (об этом см. Бернардини, Бут, Линдебаум[1]),мы опишем моделирование методом Монте-Карло процессов, происходящих в атомном ядре-мишени при бомбардировке его легкими частицами (протон, нейтрон и т. д.) с энергией свыше 100 миллионов электрон-вольт. Будем исходить при этом из одной из простейших моделей ядра. Предполагается, что ядро представляет собой сферу радиуса R (R — один из параметров модели). Нуклоны, составляющие ядро, образуют вырожденный ферми-газ, и плотность ядерного вещества является вообще говоря, неравномерной. Налетающая частица, войдя в ядро, сталкивается с нуклонами ядра, рассеивается на них и, передавая им часть своей энергии, может вызвать их выход за пределы ядра. Необходимо проследить траектории налетающего нуклона (нуклона рассеяния) и вторичных нуклонов (нуклонов отдачи). Каждый нуклон характеризуется импульсом р и вектором г = (#, г/, z), где х, г/, z — пространственные координаты нуклона. Моделирование состоит из следующих этапов: 1. Определяются координаты входа налетающего нуклона, энергия которого задана, в ядро. Например, полагают х0 случайной величиной, распределенной с плотностью \ *0е=[0, Д], 0, *ё[0,Я], Zq = УR2 — #5, г/0 = 0, w0 = — 1, v0 = uQ = 0 (начало координат считают совпадающим с центром ядра).
§ 1] ПРОХОЖДЕНИЕ ИЗЛУЧЕНИЯ ЧЕРЕЗ ВЕЩЕСТВО 89 2. Длину пути I любого нуклона (рассеяния или отдачи) без столкновения с другими нуклонами считают распределенной по показательному закону. Параметр показательного закона постоянен, если постоянна плотность ядерного вещества. Если это пе так, то закон распределения может быть довольно сложным. Например, X ?{1 <ж} = 1 - ехр (- lf(t) dt), где О / @ = с {1 + ехр (й-1 [((/i?2 - г2 - tf + г2)'/. - Л])}-1; C.1.5) а я с — константы, с зависит от энергии и типа нуклона, а г = | г | , где г — радиус-вектор точки, из которой вышел нуклон. Моделирование случайной величины с такой плотностью можно осуществить методом, описанным в главе 2, § 3. 3. Если имело место (и — 1)-е столкновение в точке rn-i (г0 определяется в п. 1) и известен импульс рп-.и то координата гг-го столкновения нуклона определяется, как обычно, Гп = Гп-! + Qn-iL- При этом производится проверка условия |гп|<Д. Если оно не выполнено, то это означает, что нуклон покинул ядро. 4. Далее определяется, между какими частицами произошло столкновение. Если налетающая частица протон, то определяются вероятности столкновения с нейтроном и протоном и определяется, с какой именно частицей произошло столкновение (сравните розыгрыш типа взаимодействия для у-квантов). Если налетающая частица нейтроп, то поступают аналогично, но соответствующие вероятности имеют, вообще говоря, другое значение. Все эти вероятности задаются таблично или с помощью некоторой эмпирической формулы. Они зависят от относительной скорости v сталкивающихся нуклонов. Последняя определяется формулой V = | Р. - Р, | /( | Рг ~ Р, | 2 + т*)Ч., где т — масса покоя, средняя для протона и нейтрона, р± — импульс налетающего нуклона, а р2 — импульс нуклона отдачи до столкновения. Считается, что направление
90 ИМИТАЦИЯ [ГЛ. 3 полета нуклона отдачи до столкновения изотропно — равновероятно во всех направлениях (см. гл. 2, § 3), а р2 = = |р|2 имеет функцию распределения х2 exp (x2/po) dx, р2 е [О, ЕФ ], О, ^2<0, где р0 иЕф —заданные константы (Еф — энергия Ферми). 5. Угол разлета частиц определяется заданием индикатрисы рассеяния Д (fi), где |х — косинус полярного угла в системе центра масс. Азимутальный угол считается распределенным равномерно. Вид Д зависит от принятой модели взаимодействий. Например, полагают Д (\i) = = ^2 (^i^4 + а2 D — Н*2)*^ + 1)' гДе С2 — константа нормировки, а величины ах и а2 зависят от импульсов налетающего нуклона и нуклона отдачи, точнее, от величины и задаются таблично или в виде эмпирической формулы. 6. Далее на основании законов сохранения (подробнее об этом см. Барашенков и др. [1], и Бернардини и др. [1]) определяется энергия и направление полета (импульсы) обеих столкнувшихся частиц в лабораторной системе координат, и можно определить направление полета й относительно неподвижной системы (см. формулы C.1.4)). Если s = (\Рх — р2 | 2 + /тг2I/*, то Ег = s — тг^-.—;—f A — it), E2 = m I + гз—т—;—ч A — IJt) ^ 1 2m(m + 5) v rn l L 2m(m + 5)v r/J ' где i?! — энергия налетающего нуклона, i?2 — энергия нуклона отдачи. Если 0х и 62 — соответствующие углы отклонения от первоначального направления полета, то cos 9Х = (qqi)'1 [Ег (s — т) + sm — m2], cos 92 = {qq2)-x (s + m) (E2 — m), где q = | qx — g2 j, ^ = (El — ?n2)^ и q2 = (?2 — m2)V? — новые импульсы нуклонов. Азимутальный угол
§ 11 ПРОХОЖДЕНИЕ ИЗЛУЧЕНИЯ ЧЕРЕЗ ВЕЩЕСТВО 91 в простейших моделях для обеих частиц принимают равным фь 2 = фх -(- Фг> гДе Ф1 и Фг — азимутальные углы частиц до столкновения. В действительности, так как картину можно предполагать цилиндрически симметричной относительно первоначального направления налетающего нуклона, можно использовать более простые формулы, чем C.1.4). Мы не будем останавливаться на этом подробно. Принцип Паули, который запрещает столкновения, ведущие к занятым состояниям, учитывается проверкой условий Ei — т ]> Еф и Е2 — — т ^> Еф. При невыполнении этих условий столкновение считается несостоявшимся. Хотя приведенные формулы без их должного физического обоснования могут показаться читателю излишними, полезно уяснить себе степень сложности алгоритма Рис. 3.3. расчета. Без такого уяснения трудно говорить о различных методах повышения эффективности расчета. Следует отметить, что мы рассматривали, как и в случае расчета у-квантов, простейшие задачи. Вернемся к моделированию ядерного каскада. На рис. 3.3 жирной линией схематически изображен путь налетающего нуклона внутри ядра. Пунктирные линии изображают направления движения нуклонов отдачи. Нуклоны отдачи могут столкнуться в свою очередь с нуклонами ядра и образовать вторичные нуклоны отдачи, хотя вероятность этого мала. Каскад быстро «затухает». Как налетающий нуклон, так и нуклоны отдачи могут не выйти из ядра (поглотиться ядром), если их энергия до выхода из ядра станет достаточно малой. В процессе моделирования обычно сначала просматривается траектория налетающего нуклона и запоминаются характеристики всех образовавшихся нуклонов отдачи. Они располагаются в памяти машины в определенном порядке. Затем возвращаются к первому из нуклонов отдачи и просматривают его траекторию. Если имеется возможность образования вторичных нуклонов отдачи, то их характеристики запоминаются и мы возвращаемся к первому из вторичных нуклонов после просмотра основной
92 ИМИТАЦИЯ [ГЛ. 3 траектории и т. д. Таким образом просматривается все дерево траекторий до окончания каждой из ветвей. В памяти машины необходимо отвести соответствующее место для запоминания характеристик «ветвей дерева» (подробно об этом см. Голенко [1]). Моделирование ядерного каскада позволяет получить характеристики нуклонов, покинувших ядро. После того как нуклоны покинут ядра, оно остается, вообще говоря, в возбужденном состоянии. Наступает новая стадия (испарительная стадия) ядерной реакции. На моделировании этой стадии мы не будем останавливаться (по этому поводу см., например, Беляев, Царицына [1]). 4. Некоторые замечания о реализации алгоритмов. Модели прохождения излучения через вещество базируются на вероятностной модели явления и экспериментальных данных относительно различных констант, входящих в эти модели. Программы расчета, как правило, состоят из независимых блоков. Одни и те же блоки используются при решении различных задач, и удобно иметь не какую-либо универсальную программу, а систему блоков или процедур, из которых путем компилирования можно получить соответствующую программу. Большую роль играет удобное представление констант, характеризующих процессы взаимодействия излучения с веществом. С этой целью полезно провести предварительную работу по получению эмпирических формул для расчета сечений и параметров индикатрис рассеяния. Удобное представление таких зависимостей может резко сократить время вычислений. Многое также зависит от искусства программиста, от правильного распределения памяти при программировании и т. п. Так, если все данные относительно сечений не могут быть помещены в оперативной памяти машины, то следует вызывать в оперативную память данные для некоторого интервала энергий и прослеживать траектории не одной частицы, а группы по возможности большого числа части в данном энергетическом интервале. После выхода их из этого интервала вызывается группа сечений, соответствующая смежному интервалу энергий, и т. д. Значительную сложность может представить составление программы геометрического блока, в котором определяется длина пробега частицы между двумя точками взаимодействия с веществом,
§ il ПРОХОЖДЕНИЕ ИЗЛУЧЕНИЯ ЧЕРЕЗ ВЕЩЕСТВО 93 если объем, в котором рассматривается перенос излучения, имеет сложную геометрическую форму и состоит из подобъемов, заполненных различными веществами. В числе задач, связанных с методом Монте-Карло, точная формулировка и исследование подобных алгоритмов занимает не последнее место. Хотя данная книга посвящена в основном статистическим аспектам метода Монте-Карло, мы остановимся в качестве примера подробнее на задаче конструирования достаточно общего геометрического блока для задач прохождения излучения через вещество (Ермаков, Прокофьева [1], Куропатенко, Огибин [1]). Предположения относительно геометрической конфигурации тела, через которое проходит излучение, состоят в следующем. Тело ограничено замкнутой выпуклой поверхностью S. Строго внутри S располагаются замкнутые поверхности Si, которые ограничивают объемы У\у состоящие из различных материалов. При i ф / Si и Sj не имеют общих точек. В остальном их расположение внутри S произвольно. Каждый из материалов характеризуется соответствующим номером. Назовем поверхности, находящиеся внутри S, но пе находящиеся внутри какой-либо ипой поверхности, поверхностями первого ранга. Поверхностями ранга к назовем такие, которые находятся внутри какой-либо поверхности ранга к — 1, но не находящиеся внутри поверхностей с рангом, превосходящим к — 1. Рассмотрим некую поверхность S^ ранга т. Будем считать, что номер материала, сопоставленный этой поверхности, приписывается обьему, ограниченному s[m^ и теми поверхностями ранга т + 1, которые находятся внутри S[m^ Легко видеть, что, задавая характеристики материала, сопоставленного S, близкими к характеристикам вакуума, мы можем снять, по существу, требование выпуклости внешней поверхности. Если учесть далее, что различные Si не могут пересекаться, но могут находиться сколь угодно близко одна от другой, то очевидно, что описанная геометрическая конфигурация является произвольной. Задача блока состоит в следующем. Пусть имеется частица, движущаяся из точки с координатами хп, уп, zn в направлении единичного вектора unJ vn, гоп. Предполагается, что точка хп, уп, zn находится внутри S. Прямая ?, задаваемая уравнениями х = хп + untt вдоль которой движется частица, пересекает поверхности S^ При этом могут изменяться свойства среды. Требуется найти длины pijif отрезков [TV, гу, где Tft — точка пересечения поверхности St прямой 5?, а Г?в — точка пересечения поверхности ^ прямой 5? (г2 предполагается таким, что у прямой X между ГР и Г? нет других точек пересечения с какими бы то ни было поверхностями), и приписать величине р^ j2 номер той
94 ИМИТАЦИЯ [ГЛ. 3 среды, которой принадлежит отрезок [71?, JT9J. Роль индексов р и q будет ясна из дальнейшего. Будем называть сформулированную задачу общей. Для ее решения остановимся сначала на случае, когда внутри S имеется единственная поверхность S{^ которая описывается уравнениями /(>io) (*, 1/, *) = 0, Х = 0, 1, . . „Л, и неравенствами Чтобы найти точки пересечения прямой с? с *У. , нужно решить уравнение /хо) <*„ + ' V "„ + •'V 2„ -Ь ""„) = 0 C.1.6) и взять те значения вещественных t, для которых выполнены неравенства Полученные значения t^ (р = 1,2, . . ., Лу — координаты точек пересечения прямой X с Sio, отсчитываемые от точки хп, уп, zn вдоль прямой X* Иначе говоря, величины t\^ есть расстояния от точки хп, ут zn до точек пересечения X с S{q, и если соответствующая точка пересечения находится в направлении движения частицы, то /^) ^ 0, в противном случае 4^< ^* Будем предполагать, что: а) если поверхность S^q касается прямой и некий корень t уравнения C.1.6) является корнем более чем первой кратности, то мы заносим его в список значении tKf' дважды, так что Nio обязательно четно; б) случай, когда часть прямой X принадлежит поверхности ^ исключается из рассмотрения. Чтобы исключить последний случай, как правило, достаточно изменить одну из величин хп, уп, zni un, vn, wn на пренебрежимо малую. При этих предположениях задача о приписывании различных номеров отрезкам прямой Хл лежащим внутри и вне Sio, решается тривиально. Предположим теперь, что нами составлена программа, которая для данной поверхности Si находит величины tW (р = 1, 2, . . .,^0) и сопоставляет им некий номер тг^. Обозначим эту программу П (i0). Покажем далее, как из программ П (i) может быть составлена программа, которая решает общую задачу. Расположим программы П (i) в некотором произвольном, но фиксированном порядке (например, в порядке нумерации поверхностей Siy причем S = So). Будем считать, что в результате их рабо-
§ 1] ПРОХОЖДЕНИЕ ИЗЛУЧЕНИЯ ЧЕРЕЗ ВЕЩЕСТВО 95 ты величины t^ заполняют одномерный массив ячеек памяти машины и одновременно заполняется другой массив — массив номеров, так что каждому t(^ соответствует номер щ, сопоставляемый поверхности St. Следующий этап вычислений состоит в том, что массив величин располагается в порядке их возрастания. Соответствующие перестановки одновременно производятся и над номерами г?\ так что соответствие между t^ и щ сохраняется. После изменения нумерации элементы полученных массивов будем обозначать t [/] и п [/] (/ = 1, 2, . . ., т), причем t [m] есть максимальное значепие t [/]• Интересующие нас расстояния р^ i будем теперь обозначать pj» Они равны разности между двумя соседними t [/']. Процедура сопоставления величинам pj соответствующих номеров не столь тривиальна, если учесть, что поверхности St могут быть вложены одна в другую. Нужно просмотреть массивы t [/] и n[f] в порядке убывания / до первого отрицательного t [/] и помнить при этом номера, соответствующие всем поверхностям, внутри которых находится в данный момент частица. Рассмотрим алгоритм получения расстояний pj и сопоставления им соответствующих номеров, описанный на языке АЛГОЛ-60 в виде процедуры. Параметрами процедуры являются размерность т массивов п [/] и t [f] и размерность R массива г [i], отведенного для запоминания номеров поверхностей, внутри которых находится в данный момент частица. Предполагается, что поверхности S = So сопоставлен номер 0, что не умаляет общности алгоритма. procedure Geometry (иг, R)\ integer га, Л; begin integer i, j; real array t [1 : m]; integer array n [1 : m], r [1 : R]; r[l]: = 0; for j: = m, j — 1 while t [j] > 0 do begin if t [j — 1] < 0 then t [j — 1]:= 0; t[jJ: = t'[j]-t[j-l]; if r [1] = 0 Д n [j] = 0 then g3 to A; if n[j] = r [1] then begin for i: = 1 step 1 until R — 1 do r [i]: = r [i + 1] end else begin for i: = 1 step 1 until R — 1 do r[R _ i]: = r[R _ i _ 1]; r[l]: = n[j] end; n[j]: = r[l]; A: end end Geometry; После работы программы расстояния ру будут находиться на месте t [f] и соответствующие им номера на месте п [/]. Количество найденных pj не определено. Они располагаются от / [т] в порядке убывания / до первого отрицательного значения t [/]. Такое значение обязательно имеется, так как точка хп, уп, zn находится внутри S.
96 ИМИТАЦИЯ [ГЛ. 3 § 2. О моделировании систем массового обслуживания Как и в предыдущем параграфе, мы ограничимся описанием достаточно простых примеров. Задачи массового обслуживания формулируются на языке теории вероятностей, и поэтому математическое описание любой задачи содержит в неявной форме метод ее моделирования. Аналитический аппарат теории массового обслуживания позволяет решить далеко не все задачи, представляющие практический интерес, и поэтому развитие методов моделирования применительно к этим задачам имеет важное значение. Система массового обслуживания характеризуется: а) Потоком заявок. Природа этих заявок во внимание не принимается. Поток задается функцией совместного распределения интервалов времени между поступлениями двух последовательных заявок. б) Наличием некоторого количества обслуживающих приборов. Каждый прибор характеризуется временем обслуживания. Последнее является случайной величиной, и должна быть указана функция ее распределения. Заявки, которые поступают в момент, когда приборы заняты, образуют очередь. в) Дисциплиной ожидания и дисциплиной обслуживания. Последние также характеризуются некоторыми распределениями вероятностей. Множество систем массового обслуживания образует сеть, если выходящие заявки одних систем поступают на вход других. Простейшим, хорошо изученным примером системы массового обслуживания может служить система с одним прибором, для которой времена xt между двумя последовательно поступающими заявками независимы и распределены экспоненциально с параметром А,, время обслуживания также распределено экспоненциально с параметром [X и заявки образуют очередь в порядке поступления. Система характеризуется вероятностями рп (t) того, что в системе (т. е. в очереди и в процессе обслуживания) находится п заявок в момент времени t. Если X/\i <; 1, то при t->- оо вероятности рп (t) стремятся к пределу, который не зависит от t (стационарный режим). В описываемом случае аналитические методы полностью решают задачу. Для стационарного случая могут быть
§ 2] ЗАДАЧИ МАССОВОГО ОБСЛУЖИВАНИЯ 97 получены очень простые формулы для рп. Если же t = t0 не слишком велико и требуется определить рп (t0) до установления стационарного режима, то аналитические формулы оказываются достаточно сложными и может возникнуть вопрос о выгодности моделирования даже для такой простой задачи. Моделирование сводится, очевидным образом, к получению реализаций случайных величин с показательным распределением и подсчету числа требований в системе в момент t0. Проводя моделирование N раз по независимым последовательностям случайных чисел, можем оценить вероятности pn(t0) — построить гистограмму распределения числа требований в системе в момент t0. Поскольку п принимает значения от нуля до бесконечности, то получить таким образом все рп (t0) (или даже достаточно большое их число) с хорошей относительной точностью практически невозможно. Относительная точность, как обычно, будет тем большей, чем больше значение рп (t0). Как правило, при моделировании систем массового обслуживания вычисляются не рп (t), а другие характеристики, например среднее время ожидания в очереди на отрезке времени [0, t0] и т. п. В этих случаях также просматривается N независимых «историй» системы, начиная с момента времени 0 до момента t0. Если требуется определить характеристики, связанные со стационарным режимом, то достаточно проследить одну историю достаточно большой длины. В пределах одной истории случайные величины, средние значения которых вычисляются, являются зависимыми (задача В), что необходимо принимать во внимание при оценке погрешности моделирования и построении оценок интересующих нас средних. Остановимся несколько подробнее на этом вопросе. Пусть имеется система с к приборами, пуассоновским потоком требований (т. е. время между поступлениями двух последовательных требований распределено экспоненциально и распределение времени обслуживания каждым прибором также является экспоненциальным). Относительно дисциплины обслуживания предполагается, что каждый свободный прибор с равной вероятностью обслуживает очередное требование (если имеется несколько свободных приборов в момент поступления требования). Требования образуют очередь в порядке поступления. 4 СМ. Ермаков
ИМИТАЦИЯ [ГЛ. 3 Типичная картина изменения числа требований в системе изображена на рис. 3.4. Будем интересоваться вероятностью требованию не быть обслуженным немедленно (вероятностью блокировки). На рис. 3.4 требования над пунктирной линией блокированы. Можно показать (Кокс, Смит [1]), что при сделанных предположениях относительно системы Рис. 3.4. весь интервал времени ее функционирования может быть разбит на независимые этапы от момента выхода системы из состояния с номером п до выхода ее в аналогичное состояние. Случайные величины — числа блокированных заявок за данный этап — являются независимыми. Если обозначить Nt число заявок, поступивших на этапе с номером i и nt число блокированных заявок на этом же этапе, то частота блокировки на i-м этапе есть pt = ~ ntlNi (i = 1, . . ., М), где М — число выбранных этапов. Для простейшего случая одного обслуживающего прибора можно показать, что при М -> оо оценка м i смещена, хотя оценка (см. гл. 1) М М C.2.1) является асимптотически несмещенной. Вероятность блокировки для системы с параметром входящего потока X и функцией распределения времени обслуживания 1 — ехр (— х) равна %/A + ^)> однако Мр, = 1 _ Х-1 (log A + К)). Соответствующие аналитические выкладки приведены, например, в работе Кэбэка [1]. Там же получено прибли-
§ 21 ЗАДАЧИ МАССОВОГО ОБСЛУЖИВАНИЯ 99 женное выражение дисперсии оценки C.2.1). Разлагая дробь nIN в ряд Тейлора в окрестности Мгг/MiV, можно получить D (n/N) « (М (п)J D (iV)/(M (TV)L + D (тг)/(М (N)J - — 2М (л) cov (л, ВДМ (W- C-2-2) Здесь п— 2^г> ^V" = 2^г* Поскольку пг и YVj — уже независимые случайные величины, то процедура оценивания величин, входящих в C.2.2), затруднений не вызывает. Подробно вопрос об оценивании погрешности для широкого класса систем массового обслуживания обсуждается в§ 2 главы 7. Сейчас мы отметим только, что хотя разбиение на независимые этапы полезно для исследования погрешности, но при построении оценок использование различных соображений о независимости этапов может привести к неверным результатам. Полезно также заметить, что вероятность блокировки за время Т при моделировании определяется как среднее значение случайной величины 1, если i-я заявка не поступает немедленно на обслуживание, О в противном случае. Если поступило N заявок, то несмещенная и состоятель- N ная оценка вероятности блокировки есть-^г 2 ?i> чт0 падает с оценкой C.2.1). Здесь lt — зависимые случайные величины. Изложенные соображения призваны обратить внимание читателя на специфику проблемы и не относятся, строго говоря, к структуре моделирующих алгоритмов. Структура же эта может быть различной и часто зависит от вкуса исследователя. Мы обсудим далее вопросы, связанные со структурой, на простейших примерах при следующих предположениях и обозначениях (Климов [1]). Пусть t±, t2, . . . — моменты поступления заявок. Величины хп = tn — tn-x (n = 1, 2,..., t0 = 0) предполагаются 4*
100 имитация ivn. з независимыми и одинаково распределенными с функцией распределения Ап (т) = А (т). Поступающие заявки обслуживаются приборами, каждая заявка одним из приборов. Если в момент поступления имеется I свободных приборов, то заявка может, вообще говоря, отдать предпочтение одному из них (например, прибору с наименьшим средним временем обслуживания). Мы будем считать, что длительности времени обслуживания z всех заявок каждым прибором независимы и одинаково распределены с функцией распределения В (z), и при I > 0 заявка немедленно и с равной вероятностью занимает один из приборов. Если I — 0, заявка становится в очередь. Могут рассматриваться различные правила образования очереди. Некоторые заявки могут обладать приоритетом в обслуживании. Может также рассматриваться случай, когда некоторые заявки прерывают обслуживание одной из ранее поступивших заявок и занимают прибор. В данных примерах мы предполагаем, что заявки образуют очередь в порядке их поступления. Обслуженные заявки покидают систему, образуя выходящий поток. Моделирование основывается на получении реализаций случайных величин с функциями распределения А (т) и В (z). Получаем последовательно моменты поступления заявок tx = Tjl, t2 = tx + т2 и т. д., tn = tn+x + xn и длительности времени обслуживания zt, z2, . . . Обозначим ип длительность времени ожидания начала обслуживания заявки с номером п. Тогда tn + un есть момент начала ее обслуживания и tn + ип + zn — момент времени, когда она покидает систему. Пусть к = 1. Если в качестве исходных величин взять моменты г>п = tn + un начала обслуживания заявки с номером 7г, то считая, что время обслуживания заявки с номером 0 есть zlf получим vx = max (zx, t^. Очевидно, что vn = max (vn^ + zn, tn). Здесь, как в известном интегральном методе исследования систем массового обслуживания, мы прослеживаем судьбу каждого требования. Очевидно, что можно использовать другие соотношения между временами в системе массового обслуживания и получить другие модификации алгоритмов. Так, например, при к > 1 обозначим через wn, t отрезок времени от tn до окончания обслуживания i-м прибором
§ 21 ЗАДАЧИ МАССОВОГО ОБСЛУЖИВАНИЯ 101 требований, поступивших до момента tn. Тогда ип = = min (wnt х,..., wn, й). Вектор wn = (wn, ъ . . ., wn, k) описывает картину, складывающуюся в процессе обслуживания на каждом из приборов. В начальный момент w1 известен (обычно это нулевой вектор). Далее в процессе работы системы требование с номером п обслуживается одним из приборов с номером i0, для которого wn, io = = min (wntl, . . ., wn% k). Учтем это, добавив к компоненте с номером iQ величину zn. Следующее изменение наступает через отрезок времени хп+1, когда поступит следующее требование. Мы получим wn+l, вычитая из всех компонент wn величину тп+1. Компонента с номером i0 предполагается увеличенной на величину zn. Отрицательные компоненты заменяются нулями. Одна из минимальных компонент ivn+1 (может быть несколько компонент с равными значениями) выбирается в качестве величины wn+1. Прослеживая таким образом работу системы, можно определить различные интересующие нас характеристики. Так, N если поступило N требований, то N'1 2 ип может служить оценкой среднего времени ожидания требования начала обслуживания. Аналогично конструируются оценки других величин (функционалов). Обычно представляют интерес такие величины, как среднее число требований, ожидающих обслуживания, среднее число свободных приборов, среднее время пребывания требования в системе и т. п. Читатель, знакомый со способами записи алгоритмов на каких-либо алгоритмических языках, без труда может теперь осуществить запись алгоритма моделирования системы массового обслуживания описанного выше типа. Легко видеть, что характерной чертой рассматриваемой задачи является изменение состояний системы в дискретные моменты времени, когда происходят некоторые события — заканчивается обслуживание требования, поступает новое требование и т. п. Существенно иной подход, упрощающий моделирование, но вносящий, как правило, дополнительные погрешности, состоит в том, что систему наблюдают через равные достаточно малые промежутки времени А*. Так, если А (х) и В (х) — показательные законы распределения с
102 имитация 1гл. з параметрами X и \i соответственно (к = 1), то вероятность того, что за промежуток времени от t до t + At поступит требование, приближенно равна XAt, а вероятность того, что закончится обслуживание требования, — |ыД?. Через каждый промежуток At мы «спрашиваем» систему, что с ней произошло и фиксируем происшедшие изменения. Подобный подход близок к дифференциальному методу исследования системы. Приведем теперь один из простейших примеров реальной системы, где моделирование представляется полезным. Пример 1. Обслуживание станков мостовым краном. Мостовые краны являются основным видом транспорт- ных средств в машиностроении. Их ра- бота организуется следующим образом. Вдоль пролета цеха по «подкрановым Рис. 3.5. путям», укрепленным на высоте 5—7 м> перемещается один или несколько мостовых кранов. Мост крана, перекрывающий пролет, может перемещаться только вдоль него. Грузовая тележка крана перемещается вдоль моста, т. е. поперек пролета. Заштрихованные квадратики на рис. 3.5 изображают станки. Станки обслуживаются кранами. Кран должен подойти к станку и затратить некоторое время на обслуживание, когда это требуется по условиям производства. Очевидно, что когда кран 2 обслуживает станок Б, то кран / не может обслуживать станок А, т. е. краны могут мешать друг другу. Таким образом, станки являются источником заявок, а краны обслуживающими приборами. Прибор не всегда доступен для обслуживания заявки, т. е. система обслуживания неполнодоступна. В данной задаче представляет интерес выбор дисциплины обслуживания и оптимальное число кранов, которые следует установить в пролете цеха. Попытки решить такие задачи на основе «здравого» смысла приводят обычно к грубым просчетам. Аналитическое решение задачи массового обслуживания для неполнодоступной системы даже при простейшем (пуассоновском) потоке заявок и экспоненциальном времени обслуживания представляет значительные трудности. Модель явления достаточно проста. Определяем дисцип-
§ 2] ЗАДАЧИ МАССОВОГО ОБСЛУЖИВАНИЯ ЮЗ лину обслуживания, например обслуживается ближайший доступный станок, от которого поступила заявка или данным краном обслуживаются определенные станки. Задаем число кранов и координаты станков. Если поток заявок от каждого станка пуассоновский, то пуассоновским является и суммарный поток. (В простейшем случае поступление очередной заявки от каждого станка равновероятно.) Схема алгоритма достаточно проста и читатель легко ее воспроизведет. Если решается задача об оптимальном числе кранов, то необходимо указать критерий оптимальности, учитывающий стоимость простоя станков и работы кранов. Если к — число станков, а I — число кранов, то в качестве такого критерия можно взять где гг — затраты, связанные с простоем одного станка, а z2 — затраты, связанные с эксплуатацией одного крана, а / — среднее число работающих станков. Особенность расчета состоит в том, что необходима уверенность в выполнении неравенства ф (/х) > ср (/2),т. е. нужно обеспечить достаточно узкий доверительный интервал для оценки ф (/). Здесь вопросы оценки дисперсии имеют первостепенное значение. Методы теории массового обслуживания и соответствующие методы моделирования часто находят применение в областях, далеких на первый взгляд от собственно массового обслуживания. В этом отношении интересен следующий пример. Пример 2. Применение в задачах сейсмической разведки. В работе Золотухиной и др. [1] описывается вероятностная модель прохождения взрывной волной слоистой среды. Модель имеет важное значение для сейсмической разведки, где по характеру отраженной волны судят о структуре залегания ископаемых. Пусть на поверхности земли вдоль прямой расположены источник взрыва и приемники. (Поверхность земли считается плоскостью.) Проведем через указанную прямую плоскость перпендикулярно поверхности земли и рассмотрим полученное сечение. Ось z направлена в глубь земли, И — точка источника взрыва, П — точка, где расположен приемник. Предпола-
104 ИМИТАЦИЯ [ГЛ. 3 гается, что слои, отражающие волну, перпендикулярны плоскости сечения и их границы параллельны оси х. Такого рода среды встречаются в геологической практике в виде осадочных пород. Основной интерес представляют обычно один или два слоя достаточно большой протяженности (они не изображены на рис. 3.6). Отраженная от них волна считается И ^ *4 Рис. 3.6. полезным сигналом. Кроме этих слоев, имеется ряд других, которые служат источником помехи. Проекции их границ на плоскость сечения изображены отрезками AkBk. Выяснение характера помехи имеет важное значение для выделения полезного сигнала. Будем характеризовать далее отрезок AkBk длиной lk, глубиной залегания zk и проекцией хк точки Ак на ось х и предполагать: 1. Начала границ хк образуют некоторый случайный поток (заявок) и S (х) равно числу точек хк на отрезке [0, х\. 2. Величины 1к случайны и одинаково распределены с функцией распределения Fj(x) = Р {I <d х}. 3. Величины zk@ < zk <; Н) случайны и имеют функцию распределения G (х) = Р {zk <^ х). 4. Отражение происходит по правилам геометрической оптики и отраженная волна описывается известной функцией времени, определяемой формулой
§ 2] ЗАДАЧИ МАССОВОГО ОБСЛУЖИВАНИЯ 105 где т — время вступления волны, а А — случайная амплитуда с заданной функцией распределения. Предполагается также, что величины zk, lk, А независимы в совокупности и от xk и конечен второй момент соответствующих функций распределения. Если считать, что xh образуют пуассоновский поток, lk имеют экспоненциальное распределение, a zk равномерно распределены на [0, Я], то рассматриваемая задача И Рис. 3.8. оказывается очень близкой к традиционным задачам массового обслуживания, причем роль обслуживающих приборов играют отражающие слои. Практические вычисления на основе аналитических результатов, полученных в работе Золотухиной и др. [1], однако, трудно осуществимы, и оказывается удобным непосредственное моделирование прохождения волны. Схема моделирования состоит в следующем: в соответствии с заданными функциями распределения составляется структурная карта земной коры, т. е. получают реализации величин Далее определяется длина пути и, следовательно, время запаздывания волн, отраженных от различных границ. При этом скорость распространения волны и коэффициент преломления считаются заданными постоянными величинами. Рассмотрим однократно отраженные волны. Если CD — линия, параллельная оси z и проходящая через середину отрезка ИП (рис. 3.7), то длины ломаных, изображенных пунктиром, проходящих через точки пересечения CD с отрезками AkBk, и являются длинами пути со-
106 ИМИТАЦИЙ [ГЛ. 3 ответствующих волн. Если отрезок Ako Bko не имеет точки пересечения с линией CD, то отраженная им волна не попадет в точку //. Поскольку границы частично прозрачны для волн, что учитывается заданием коэффициента преломления д, то после отражения амплитуда волны домно- жается на q @ ^ q <^ 1); прошедшая через слой волна продолжает свой путь, но, очевидно уже не может попасть в точку П. Слой АгВъ который пересекает пунктирная ломаная, лишь ослабляет интенсивность волны. Несколько более сложные условия прихода в точку П могут быть получены для двукратно отраженных волн и волн с большей кратностью отражения (рис. 3.8). Хотя процесс отражения и преломления является сложным ветвящимся процессом, условия прихода волны в точку П позволяют последовательно и сравнительно просто выделять однократно, двукратно и т. д. отраженные волны. Наложение пришедших с запаздыванием и измененными амплитудами волн в точке П и определяет форму помехи, налагаемой на основной сигнал в точке //. Многократные реализации структуры земной коры и определение формы сигнала помехи позволяют выделить общие свойства помехи, определяемые функциями распределения величин х, z, l и А. Объем расчетов обычно очень велик, и требуется определение зависимости результатов от параметров указанных распределений. Вопросы сокращения объема вычислений в подобных случаях обсуждаются в главе 5. § 3. Другие примеры. Замечания о постановке задач и структуре моделей Пример 1. Моделирование танкового сражения. Описанный ниже пример заимствован из работы Андерс- сона [1]. Работа выполнялась для вооруженных сил Швеции. Авторы считают (видимо, не без оснований), что на территории Швеции невероятно сражение, в котором принимали бы участие более чем 10 или 15 танков с каждой стороны. Предполагается, что ввиду высокой скорострельности и большой вероятности поражения на расстояниях менее 1,5 км сражение происходит столь быстро, что можно
§ 3] ДРУГИЕ ПРИМЕРЫ 107 пренебречь передвижением танков за время сражения. Поэтому рассматривалась модель, в которой танки ведут огонь с фиксированных позиций и движение разрешено лишь в начальный период. Весь интервал времени разделяется на интервалы равной длины, за каждый интервал «поле сражения» просматривается полностью и учитываются все изменения, вызванные деятельностью отдельных сражающихся единиц модели (танков). Предполагается, что каждая единица модели может быть в одном из следующих состояний: 1. Неповреждена. 2. Может только вести огонь. 3. Может только двигаться. Пр. Промежуточное. 4. Выведена из строя. В промежуточном состоянии находится пораженная, но не выведенная из строя единица. Через некоторое время она может перейти в одно из трех предыдущих состояний. Кроме состояний каждая единица имеет другие свойства. Некоторые из них постоянны, как, например, скорость, другие могут изменяться в процессе сражения, например тип оружия, используемый в данный момент, скорострельность и некие специальные характеристики — контрольные времена, например, время выхода из промежуточного состояния. Активность стороны А против стороны Б описывается матрицей активности Маб = | шаб (i, j) ||- Элементы ее могут принимать целые значения от 0 до 4. Если Аг обозначает ?-ю единицу стороны A, а 25;- — ;'-ю единицу стороны Б, то ШАБ(и ]) имеют следующие значения: тАБ (i, 0 = 0 12 3 4 Обнаружила ли Ai единицу Б. нет да да да да Выбрала ли А{ в качестве цели Б- нет нет да да да Произвела ли А^ по крайней мере один выстрел1 по Б- нет нет нет Да Да Движется ли в данный момент снаряд, направленный А{ к Б. нет нет нет нет да Так, шаб (h /) — 3 означает, что At готовит следующий выстрел по J5^.
108 имитация [гл. з Начальная фаза сражения обычно весьма важна для его исхода, в частности, очень важно, как быстро стороны обнаружат друг друга. На открытой местности обнаружение происходит почти немедленно — достаточно танкам приблизиться до расстояния прямой видимости. При других обстоятельствах вероятность обнаружения зависит от многих факторов. КЕсли, например, танк замаскирован на стационар- - -s^f | ной позиции, то его трудно } ¦ J обнаружить, пока он не t J 1 выстрелит. Для создания Л ' .. feu- >- адекватной модели обнару- % % # жения требуются серьезные исследования физиче- Рис- 39> ского и психологического характера. В данной модели вводилась вероятность обнаружения ptj в интервале времени (t — At, t) при условии, что At не обнаружила Ej за время @, t — At), Ра (*) = —— i d\ h Здесь 0 при t<^xuj, 1 при *>тм-; %t,j есть момент времени, когда возникла прямая видимость между At и Ej\ ht(t) — функция активности наблюдения At. Эта функция равна константе до и после момента t — t2, где она скачкообразно возрастает. t2 есть момент времени, в который становится известно о появлении вражеских танков. Оно слагается из времени ^ первого обнаружения стороной А противника и некоторого случайного времени оповещения. Sj,h(t) — функция, характеризующая эффект обнаружения в момент tk к-то выстрела Ej. Рис. 3.9 соответствует случаю, когда выстрелы происходят в моменты t3 и t4. Величина Kj учитывает эффект маскировки и dit j — расстояние между At и Ej. Матрица %и j заполняется в начальной фазе движения танков. При этом учитываются условия местности, наличие тумана и т* п >
§ 33 ДРУГИЕ ПРИМЕРЫ Ю9 Таким образом, вопрос обнаружения единицы Ej единицей At решается положительно, если окажется, что Правила выбора цели были в данной модели детерминированными. Использовались два вида тактики: открытие огня немедленно по обнаружении цели и открытие огня по команде командира. Первая тактика использовалась при внезапном контакте, вторая при заблаговременной подготовке атаки. Если цель поражена или находится в промежуточном состоянии, то, согласно установленным правилам, происходила смена цели. При этом, в связи со взаимным расположением противников, вводились различные приоритеты. Характер таких приоритетов легко себе представить, и мы не будем подробно на них останавливаться. Вероятность поражения цели вычислялась как функция расстояния между танками. Кроме того, она зависела от типа вооружения, точности в определении расстояния и размеров видимой цели. Если цель поражалась, то происходил переход из одних состояний в другие. При этом вычислялась таблица вероятностей перехода следующего вида: 1_П 2->2 3->3 в зависимости от перечисленных выше факторов. Точность в определении расстояния могла варьироваться на двух уровнях, размер видимой цели зависел от отрезка времени, прошедшего от момента возникновения прямой видимости цели. Этот фактор возрастал скачкообразно и имел три различных значения. Промежуток времени между двумя выстрелами определялся как сумма двух случайных величин, которые имели заданные законы распределения, и постоянного слагаемого, которое зависело от типа оружия. Для описанной модели была составлена программа на языке Фортран — II для машины IBM 7090. Предусматривалось участие не более 15 танков с каждой стороны. Входные данные составляли около 1000 чисел* Время
110 ИМИТАЦИЯ Игл. з расчета составило 18 сек на проигрывание одного сражения 15 танков против 9, что соответствовало продолжительности сражения 100 сек с шагом А* = 1 сек. Для того чтобы составить определенное представление о результатах, требовалось провести около 50 проигрываний сражения. Описанный пример весьма показателен как пример решения задачи из области теории игр. Легко уяснить себе, что аналитическое описание и исследование подобной задачи практически неосуществимо. Пример 2. Отыскание плана загрузки оборудования. Рассмотрим конвейер, предназначенный для отливки деталей. На рис. 3.10 Ф — формовочная машина, на Произбодительность Рис. 3.11. которой подготавливаются формы для отливки. Готовые формы, предназначенные для отливки одной или большего числа деталей, поступают на тележки, движущиеся в направлении, указанном стрелкой. Буквой В обозначена вагранка. Металл из вагранки заливается в формы, которые затем снимаются с тележки и поступают на дальнейшую обработку. В течение смены может производиться отливка деталей разных типов. Обозначимm^i = 1, . . .,тг) количество деталей ?-го типа, рг — металлоемкость (вес) одной детали ?-го типа, р — производительность вагранки за смену и tt — время формовки детали г-готипа* Необходимо, чтобы производительность вагранок и производительность формовочных машин были согласованы. В противном случае может произойти непроизводительный простой формовочных машин или нехватка металла. При этом следует учесть, что допускается некоторый недорасход металла вагранкой (т. е. может храниться R кг
§ 3] ДРУГИЕ ПРИМЕРЫ 111 металла) и переход с одного типа деталей при формовке на другой требует некоторого времени t. Предположим, что выполнены условия и 2 *^ + л* < А7\ C.3.1) г=1 г=1 где к — количество формовочных машин, а Т — время работы каждой. Требуется выбрать такую последовательность формовки партий деталей на каждой машине, чтобы: 1) не было простоя формовочных машин; 2) не было нехватки металла, т. е. не происходило скопления форм у вагранки; 3) недорасход металла был бы минимальным и, во всяком случае, не превосходил бы R в любой момент времени. Рис. 3.11 представляет ситуацию, которая возникает при работе одной формовочной машины. Первая партия содержит детали повышенной металлоемкости, и расход металла превышает средний уровень. Следующие партии, наоборот, имеют пониженную металлоемкость, и когда они поступают на заливку, создается некоторый запас металла. Когда формовочная машина одна, то следует начинать работу с деталей малой металлоемкости, и когда накопится достаточно металла, могут заливаться формы повышенной металлоемкости. Когда формовочных машин несколько, то перерасход металла, вызванный партиями одной из формовочных машин, может компенсироваться за счет малой металлоемкости партий других. При большом количестве партий и формовочных машин задача оказывается достаточно сложной. Можно попытаться решить ее методом Монте-Карло, который сводится в данном случае к построению случайных последовательностей партий и проверке приемлемости данной последовательности. Случайную последовательность можно формировать следующим образом. Выбирается случайное число а1? и целая часть числа пах служит номером партии, которую следует взять первой для первой формовочной машины. Затем выбираем а2, и целая часть числа (п — 1) а2 будет номером партии (среди оставшихся партий), которая выбирается первой для второй формовочной машины, и т. д. Производя
112 ИМИТАЦИЯ [ГЛ. 3 таким образом упорядочение партий, получаем некий план. Уже после выбора первых партий для каждой^из машин можно судить о его допустимости и прекратить дальнейшую выборку, если условия 1—3 не выполняются на некотором отрезке времени. При таком способе действий может быть достигнут успех, если среди всего множества расположений партий имеется достаточно много расположений, удовлетворяющих нашим требованиям, т. е. если сравнительно велика вероятность встретить допустимый план среди всего множества планов, каждый из которых выбирается с равной вероятностью. Легко видеть, что равновероятный выбор заведомо не является лучшим способом действий. Если имеются две формовочные машины и на первой выбрана партия с большой металлоемкостью, то в то же время на второй, очевидно, следовало бы выбрать партию с малой металлоемкостью. Это соображение, как и различные другие соображения такого рода, можно учесть, приписывая некоторым комбинациям партий большие вероятности и организуя выборку последовательностей в соответствии с этим распределением вероятностей. Наиболее простой способ заключается в том, что в случае двух машин на первую машину отправляются партии преимущественно с большей металлоемкостью, а на вторую — с малой. Предельным случаем является случай, когда мы точно знаем, как построить допустимый план, и строим его с вероятностью единица. Описанная задача строго не формализована. Метод Монте-Карло в данном случае не может гарантировать успех во всех случаях. Тем не менее, если удается найти удовлетворяющее нас решение, то его пригодность не вызывает сомнения. Возможность учета интуитивных соображений при описанном способе действий представляет особую ценность. Очевидно, картина приложений метода Монте-Карло не была бы полной, если бы мы опустили описание приложений такого рода. Примеры моделирования достаточно сложных систем легко умножить. Мы ограничились описанием сравнительно простых, но достаточно разнообразных структур, ибо имитация и структура моделей не является главным предметом книги. Кроме того, имеется обширная и доступная литература, посвященная имитации реальных явлений и
§ 3] ДРУГИЕ ПРИМЕРЫ ИЗ ситуаций. Хотя почти все модели такого рода включают отдельные блоки, моделирующие случайные величины или процессы, многие из них являются в основном детерминированными. Подсистемы для такой (детерминированной) системы описываются, например, дифференциальными уравнениями или просто достаточно сложными функциями времени и параметров. Отсюда следует, что понятие моделирование (на цифровой ЭВМ) шире понятия метод Монте-Карло. Впрочем, всякую детерминированную систему можно рассматривать как вырожденную случайную, и тогда соотношение между этими понятиями изменится. Легко заметить, что переход к новой мере при статистическом моделировании (см. A.2.1)) имеет много общего с использованием методов теории подобия при создании детерминированных моделей (например, Клайн [1]). С помощью моделирования в таком широком смысле решено в настоящее время очень большое число разнообразных задач. Моделировалось уличное движение, движение самолетов, работа аэропорта, морского порта, работа химического завода, текстильное производство, нефтеперерабатывающий завод, мартеновское производство и ряд других производственных процессов. Модели такого рода принципиально близки к моделям массового обслуживания, но существенно сложнее упрощенных задач, изучаемых аналитическими методами. Приведенный список легко дополнить моделями распределения ресурсов. Имеются работы, описывающие моделирование распределения водных ресурсов, денежных средств, планирования развития города и др. Моделируются системы разделения времени, сложные вычислительные системы и вычислительные центры. Более экзотичны модели психического поведения животных или человека, модели судопроизводства, международных отношений и конфликтных ситуаций разного рода. К числу подобных моделей следует отнести и так называемые «деловые игры», получившие значительное развитие для обучения персонала и исследования различных вопросов, связанных с управлением производством. Привести более или менее полную библиографию здесь очень трудно. Мы ограничимся ссылкой на библиографию, составленную Найлором [1], в которой, к сожалению, не
114 ИМИТАЦИЯ [ГЛ. 3 отражены работы советских авторов, и некоторые монографии. Общая методология моделирования и ряд примеров ее использования описаны в монографиях Буслен- ко [1], [2]. В главе XVII первой из них содержится превосходный пример моделирования работы порта, заимствованный из статьи Стара и Пейджа [1]. Этот пример можно рекомендовать в качестве типичного тем, кто хочет начать изучение приемов моделирования. В монографии Климова [1] довольно подробно обсуждается вопрос о моделировании сложных реальных систем массового обслуживания. Моделированию систем такого рода посвящена также глава X монографии Кофмана и Крюона [1]. Метод Монте-Карло для моделирования сложных телефонных систем отражен в монографии Башарина, Харке- вича и Шнепса [1]. Можно указать обширную монографию Хорофаса [1], посвященную общим вопросам моделирования, а также монографии Полляка [1], Майзеля и Нюньоли [1] и Фишмана [1], где много внимания уделяется алгоритмическим языкам моделирования. Имеется ряд книг, посвященных частным вопросам моделирования. Среди них можно назвать книгу Ткачен- ко, Куцева, Мещерякова, Чавкина и Чебыкина [1], посвященную специально моделированию боевых действий, книгу Горского [1], посвященную статистическому моделированию в теории надежности, сборник «Водноэнергети- ческие расчеты методом Монте-Карло», книги Быкова [1] и Голенко [1]. Приходится отметить, что даже при перечислении книг трудно претендовать на полноту, ибо они могут относиться к очень специальным вопросам и их легко упустить из вида. Широкое использование моделирования при решении прикладных задач вызывает необходимость выработки средств общего описания систем. Очевидно, что при имитации прежде всего нужно создать формальное описание системы, а для системы типа железнодорожной станции или мартеновского цеха это не слишком простая задача. Здесь возникают своеобразные задачи создания удобного языка, классификации моделей и т. п. Важную роль при решении этих вопросов играют алгоритмические языки моделирования, на которых мы остановимся далее лишь очень кратко. Очевидно, что к языку для описания моделей, кроме требований общности и удобства, должно
§ 3] ДРУГИЕ ПРИМЕРЫ 115 предъявляться требование быть формализованным языком. Описание модели на таком языке при наличии соответствующего транслятора является программой, с помощью которой может осуществляться моделирование. Структура алгоритмических языков моделирования очевидным образом отражает структуру моделей, которые могут быть описаны на этом языке. Каждый язык моделирования имеет средства для описания структурной и динамической части моделей. Структура системы слагается из объектов, связанных между собой. Объекты имеют характеристики (описатели), которые также могут находиться в связи. Объекты системы разделяются на классы (группы), и имеются средства для того, чтобы: а) определить классы внутри системы, б) выделить ряд объектов, рассматривая их в качестве внешних условий, в) определить характеристики, с помощью которых можно выделить класс объектов или разделить классы, г) устанавливать соотношения между объектами и внешними условиями. После трансляции описания классов объектов и их свойств порождают массивы данных, как правило, с достаточно сложной структурой, и задача динамической части модели состоит в организации преобразований структур и обработки данных. Языковые средства должны позволять следить за ходом времени в системе. При этом изменения в системе (изменения количества объектов в классах, изменение свойств объектов и т. д.) происходят в дискретные моменты времени. Эти моменты времени могут быть равноотстоящими (с шагом А ?), распределенными случайно в соответствии с некоторым законом или указываться в специальном массиве данных. Этот массив играет роль расписания, где указывается момент времени, когда произойдет некоторое изменение в структуре системы (событие) и какого рода будет это изменение. Это расписание также может меняться в дискретные моменты времени, когда происходят события. Для нас важно это последнее обстоятельство, ибо если предположить (что необходимо) конечность массива данных, отведенных для расписания, то события будут зависеть от поведения системы на ограниченном участке времени ее предыстории. (Как уже отмечалось, детерминированное событие всегда можно считать случайным, но происходящим с вероятностью
116 ИМИТАЦИЯ [ГЛ. 3 единица.) Если же при изменении времени с шагом At рассматривать массив-расписание как вектор, то такие векторы в последовательные моменты времени будут связаны в цепь Маркова. Таким образом, исследования цепей Маркова, которые будут проведены далее, имеют непосредственное отношение к моделям, описываемым алгоритмическими языками моделирования. Связи такого рода, однако, не всегда достаточно прозрачны. Специализированные алгоритмические языки являются мощным средством решения прикладных задач, но они не должны (во всяком случае при моделировании недетерминированных систем) заслонять от исследователя вероятностную структуру задачи в целом. Подробности об алгоритмических языках моделирования, которых насчитывается в настоящее время более двух десятков, можно найти, например, в книгах Фиш- мана [1] иМайзеля и Нюньоли [1]. Наиболее употребительными языками являются: 1. SIMULA — язык, тесно связанный с языком АЛГОЛ-60 (см. Дал, Мюрхауг и Ньюгорд [1]). 2. СИМСКРИПТ II (см. Кивиат, Вилланева, Марковичи] и Марковиц, Хауснер, Карр [1]). 3. GASP II — язык, тесно связанный с языком Фортран и использующий ряд программ, написанных на Фортране. Широко распространены компилирующие и интерпретирующие программы в совокупности с наборами стандартных подпрограмм, предназначенных для моделирования того или иного класса систем. (См., например, Глуш- ков, Калиниченко, Марьянович, Москаленко, Соснюк [1], Ионин и Седол [1] и описание интерпретирующей программы GPSS/360 в книге Фишмана [1]). Заметим, что к числу языков моделирования следует отнести разработанный Н. П. Бусленко [2] язык аггрегативных систем, но в настоящее время неизвестно, является ли он в должной степени формализованным, чтобы быть алгоритмическим языком* В заключение главы рассмотрим некоторые общие вопросы исследования моделей. При моделировании достаточно сложных реальных систем необходимым первым этапом является изучение функционирования системы и обработка данных о распределениях случайных величин»
§ 3] ДРУГИЕ ПРИМЕРЫ Ц7 При этом неизбежны упрощения и допущения, справедливость которых трудно проверить. В любом случае полезно сделать ряд упрощений и построить сначала модель, которую можно исследовать аналитически. Затем, когда станет ясно, что аналитическая модель непригодна или пригодна лишь при определенных областях изменения параметров, следует пытаться создать имитационную модель. Система, как правило, имеет некоторую иерархическую структуру и распадается на ряд подсистем. Прежде всего нужно понять, не существует ли для некоторых подсистем модели, допускающей аналитическое исследование. В любом случае нужно остановиться на разумном уровне, заменить подсистемы этого уровня хотя бы очень грубыми моделями и провести моделирование системы в целом, пытаясь определить роль каждой из подсистем в общей структуре. При этом большую пользу может принести аппарат дисперсионного анализа (Шеффе [1]), позволяющий проверять гипотезы о зависимости оцениваемого среднего от определенных групп параметров. Иначе говоря, нужно разделить существенные и несущественные факторы (существенные и несущественные подсистемы) и только после этого строить модель в целом, учитывая детально структуру существенных подсистем и очень грубо структуру несущественных. Далее, нужно понять, велика ли роль статистической погрешности, неизбежной при статистическом моделировании. Для ее исключения нужно добиться статистической воспроизводимости результатов с необходимой точностью. Для оценки ее роли первостепенное значение имеет понимание того, со случайными величинами какого типа мы имеем дело. Задачи типа А, Б, В и Г, сформулированные в главе 1, требуют различного подхода к оцениванию погрешности^ хотя часто довольствуются просто получением ряда близких результатов при воспроизведении модели. В связи с оценкой погрешности в задаче В, которая достаточно широко распространена при исследовании систем массового обслуживания, заметим следующее. Ряд частных случаев этой задачи, когда исследуемые случайные величины связаны в цепь Маркова, обсуждается нами в § 2 главы 7. Общий случай сводится к исследованию случайного процесса (или поля), реализация которого строятся в результате моделирования, и следует обратиться к
118 имитация [гл. з соответствующей специальной литературе. Когда результатом является последовательность реализаций процесса в дискретные моменты времени, могут использоваться методы анализа временных рядов (Хеннан [1], [2]). В частности, можно пытаться описать получаемый процесс с помощью схемы авторегрессии. Сведения об использовании схемы авторегрессии при анализе результатов моделирования можно найти у Фишмана [1]. Погрешность модели, если исключена погрешность моделирования, требует, строго говоря, для своей оценки сравнения с экспериментом. Может случиться, что такие эксперименты ранее не проводились и не могут быть проведены ввиду своей сложности и дороговизны, хотя экспериментальные данные, необходимые для приближенного описания элементарных распределений, имеются. В таких случаях, поскольку результирующая погрешность складывается из погрешностей отдельных распределений, следует по крайней мере проверить экспериментально устойчивость модели по отношению к погрешности распределений. Эта проверка осуществляется обычно методом Монте-Карло, т. е. отдельные распределения или их параметры снабжаются некоторыми случайными ошибками, после чего проводится моделирование. Очевидно, что здесь, как и при исследовании значимости отдельных подблоков, также применим аппарат дисперсионного анализа. Нередко возникает интересная ситуация, когда данных эксперимента бывает недостаточно, чтобы сделать обоснованные выводы о характере некоторого элементарного распределения, но тем не менее интересующий нас результат может быть получен с необходимой точностью. Конечно, возможен и противоположный случай неустойчивости модели по отношению к некоторым параметрам или ошибкам в определении данных. К сожалению, среди многочисленных моделей, перечисленных ранее, очень мало таких, где вопросам устойчивости уделялось необходимое внимание. Дополнительные исследования бывают также необходимы в тех случаях, когда модель используется для целей экстраполяции (прогноза). Имеется в виду распространенный случай, когда на модели проверяется предварительно эффект некоторых изменений, планируемых для реальной системы в будущем. Если хорошее согласие с
§ 3] ДРУГИЕ ПРИМЕРЫ 119 экспериментом имело место при одних значениях параметров, то при других такого согласия может и не быть. Здесь обязательно необходимо исследование устойчивости модели и дополнительные исследования, обосновывающие сохранение характера элементарных распределений при изменении параметров. Наконец, как мы уже отмечали, оценивание вероятностей редких событий требует специальных исследований. Малый порядок убывания погрешности метода Монте- Карло может не позволить оценить малую вероятность с приемлемой относительной погрешностью при разумной затрате времени работы вычислительной машины» В этих случаях необходимо использование некоторой фиктивной модели, простейший пример которой применительно к задачам переноса излучения обсуждался в § 1. Не для всякой реальной задачи легко указать и обосновать фиктивную модель с нужными свойствами. Поскольку при использовании любой модели вычисление различных средних значений является по существу оцениванием математических ожиданий, т. е. интегралов типа Лебега по некоторой а-конечной мере, то источником фиктивных моделей могут служить некоторые специальные методы интегрирования. Способы уменьшения дисперсии, которые обсуждаются в последующих главах, имеют непосредственное отношение к ;>тому вопросу.
ГЛАВА 4 МЕТОДЫ ПРИБЛИЖЕННОГО ВЫЧИСЛЕНИЯ ИНТЕГРАЛОВ § 1. Квадратурные формулы в классах функций и метод Монте-Карло Как отмечалось в главе 1, метод Монте-Карло является по существу методом приближенного интегрирования. Оценивая математическое ожидание некоторой случайной величины, определенной на вероятностном пространстве (Ж, $1, fi), мы оцениваем интеграл типа Лебега — Стилтьеса /=$/(*) |х(*в). D.1.1) Если используется метод Монте-Карло в узком смысле (задача А), то необходима по меньшей мере интегрируемость квадрата функции В данной главе будут обсуждаться главным образом методы, либо не налагающие иных ограничений, кроме конструктивности, на вид меры [i, либо относящиеся к случаю существования плотности вероятностей р (х) относительно меры Лебега. При этом речь будет идти о задаче А, т. е. методе Монте-Карло в узком смысле, что не будет специально оговариваться в каждом конкретном случае. Переменная х рассматривается всюду как векторная величинах = (хи . . ., х8). Теоретически пространство Ж можно считать бесконечномерным (конечность s будет оговариваться, когда это необходимо), однако для построения вычислительных процедур в бесконечномерном случае
§ 1] КВАДРАТУРНЫЕ ФОРМУЛЫ В КЛАССАХ ФУНКЦИЙ 121 необходимы дополнительные исследования и предположения (Ченцов [1], Соболь [3]). Если существует плотность р (х), s конечно и / (х) принадлежит достаточно узкому классу функций (например, имеет частные производные достаточно высокого порядка по всем переменным), то для вычисления интеграла / может быть использован классический аппарат квадратурных (кубатуриых) формул. Для дальнейшего представляется необходимым кратко остановиться на некоторых определениях и фактах теории механических квадратур, причем отнюдь не преследуется цель дать сколько-нибудь подробный обзор различных весьма глубоких исследований по этому вопросу. Пусть р (х) отлична от нуля в некоторой области 3) 5-мерного евклидова пространства, фх (х) — заданная, определенная в 3) функция, и / (х) Е-Р — некоторому классу функций, определенных в области 25, для которых существует и конечен интеграл Формулу п \ ф1 (х) р (х) f (х) dx^S AJ (x,) D.1.2) принято называть квадратурной (в многомерном случае часто кубатурной) формулой с весом р (х). Числа At, не зависящие от вида функции /, принято называть коэффициентами (весами) квадратурной формулы, a xt — ее узлами. Обычно принято считать, что хг G? 3), что и будет нами предполагаться в дальнейшем. Будем называть сумму квадратурной суммой, а величину п S) D.1.4)
122 ПРИБЛИЖЕННОЕ ВЫЧИСЛЕНИЕ ИНТЕГРАЛОВ [ГЛ. 4 остатком квадратурной формулы. Если для /= /0 Rnlfo] = = 0, то говорят, что квадратурная формула D.1.2) точна для / = /0. Легко видеть, что для каждой конкретной функции / (х) можно построить квадратурную формулу с одним узлом, для которой Rn[f] = О, что предполагает, однако, знание априори величины интеграла / и не может служить предметом содержательной теории. Обычно ставится задача выбора узлов и коэффициентов (всех или некоторых из них) так, чтобы остаток Rnlf] был достаточно мал для всех функций / из F. Важную роль играет понятие сходимости последовательности квадратурных формул. Рассмотрим последовательность квадратурных сумм Говорят, что последовательность соответствующих им квадратурных формул сходится для функций класса F, если lim Кп [/] = J ф1 (х) f (х) р (х) dx. При этом для каждого п строится своя, вообще говоря, последовательность узлов ае?п) и коэффициентов Л*п). Ниже кратко рассматриваются три подхода к задаче построения квадратурных формул. 1. Задан набор функций {фг}Г, определенных и линейно независимых в области 3) (<pi, фигурирующая в D.1.2) и далее, включается в этот набор), и предполагаются известными интегралы \ фх(х) (pi(x)p(x)dx(i = 1, ..., /г). Тогда, не умаляя общности, можно считать, что cpi (x) нормирована ^ ф?(х)р(х)dx = 1 и ф*(х), i = 1, . . ., п ортогональны к фх (х) с весом р (х), т. е. Это предположение относительно ф* (х) будет в дальнейшем предполагаться выполненным.
§ 1] КВАДРАТУРНЫЕ ФОРМУЛЫ В КЛАССАХ ФУНКЦИЙ 123 Выберем теперь п узлов х7- ЕЕ 25, / = 1, . . ., гг, и поставим задачу выбора коэффициентов A t так, чтобы квадратурная формула была точна для любой функции из набора {<Pj}i. Если такие At найдутся, то формула D.1.2) будет, тем самым, точна для всех линейных комбинапий функций фг(х) в силу линейности задачи. Записывая условия точности формулы D.1.2) для ф*(х), приходим к системе линейных алгебраических уравнений ' = 2 п <4Л-5) , ] = ?> . . ., П для определения Аи которая допускает решение во всяком случае, если ее определитель А (хи . . .,хп) = = det || (pj (xt) ||T (i считаем номером строки) отличен от нуля. Это налагает определенные ограничения на расположение узлов квадратурной формулы. Ограничения эти, впрочем, являются весьма слабыми. Действительно, обозначим 3)п = 3) X . . X 3) — декартово произведение п экземпляров области 3D на себя, так что Q = (х19 . . .,жд) G2)n. Тогда легко показать, что мера Лебега в 3)п множества {Q: A(Q) Ф 0} положительна. Это следует из того факта, что определитель Грама det м q>i(x)(f)j(x)p(x)dx I си- s> стемы ортонормированных функций равен единице, и леммы 4.1, которая содержится в следующем параграфе. Для соответствующей квадратурной суммы, используя формулы Крамера, легко выписать явное выражение Кп\П = А(/, <?)/Д @, D.1.6) где А (/, (?) - det || / (ху), ф2 (Xj), . . . , фп(жу) ИГ и A (Q) = = А (ф1, Q). Формулы, соответствующие суммам вида D.1.6), принято называть интерполяционно-квадратурными. Если мы хотим добиться, чтобы интерполяционно- квадратурная формула была точна для набора функций {ф*}Г ПРИ N > п, то необходимы более жесткие ограничения на расположение узлов Ху В этом случае в
124 ПРИБЛИЖЕННОЕ ВЫЧИСЛЕНИЕ ИНТЕГРАЛОВ |ГЛ. 4 предположении, что ф7- (х) ортогональны к фх (х), j = 2,... . . ., N, из D.1.5) следует необходимость выполнения равенств det || фг (xj), ф2 (xj), . . ., q>n(xj) || i = 0 для гс < г < N. D.1.7) Эти равенства представляют собой, вообще говоря, систему нелинейных уравнений, которым должны удовлетворять координаты точек Xj. Наиболее полно теория таких систем развита для случая, когда ц>г (х) являются многочленами (квадратурные формулы типа Гаусса). Общий случай произвольной системы функций cpt (x), определенной и ор- тонормированной в произвольной области ф^(х),мало исследован. По-видимому, в каждом конкретном случае требуются специальные исследования, которые представляются достаточно сложными, особенно для многомерных областей. В общем случае трудно также дать какие-либо достаточно простые рекомендации о выборе узлов интерполяционно-квадратурной формулы, обеспечивающие малость ее остатка для функций класса F. Остаток интерполяционно-квадратурной формулы обычно представляют через производные подынтегральной функции (если последние существуют). Соответствующие формулы имеются, например, в руководстве В. И. Крылова [1]. 2. Второй подход связан с построением оптимальных квадратурных формул в классах дифференцируемых функций. Проще всего этот подход может быть проиллюстрирован на конкретном примере. Пусть функция одной переменной / (х) имеет на промежутке [а, Ь] производную, которая принадлежит некоторому банахову пространству В функций. Функцию / (х) на [а, Ь] можно тогда представить в виде / (х) = / (а) + ^ df (t). Если формула D.1.2) а точна для константы, то ее остаток при ф2 (х) = 1, р(х) = I / (Ъ -а) Ъх a a i==l a является элементом сопряженного к В пространства
§ lj квадратурные формулы в классах функций 125 функционалов и можно вычислить его норму. Так, если /' (t) — непрерывная функция, то х/2, t-=x, D.1.8) О, где Q(t-x) = и знак равенства достигается для некоторой /, имеющей непрерывную первую производную. Если выбирать At и xt из условия минимизации величины Ь п г=1 то получим квадратурную формулу, которую принято называть наилучшей в классе функций, имеющих непрерывную первую производную на [а, 6]. Можно сказать также, что она является наилучшей для «наихудшей» функции этого класса. Аналогичный подход возможен для других классов дифференцируемых функций. В частности, полезно отметить, что в классе функций ограниченной вариации точная оценка остатка Rn [/] имеет вид (*). sup Во всех случаях мы приходим к задаче нахождения минимума функции многих переменных достаточно сложного вида. Для некоторых простейших классов функций одной переменной задача такого типа решена полностью. Особенно трудной является задача нахождения оптимальной квадратурной формулы в классах функций многих переменных. Она получила значительное развитие в работах С. Л. Соболева [2], для функций малой гладкости ряд результатов получен И. М. Соболем [7], однако сколько- нибудь подробное изложение этих результатов выходит далеко за рамки этой книги.
126 ПРИБЛИЖЕННОЕ ВЫЧИСЛЕНИЕ ИНТЕГРАЛОВ [ГЛ. 4 3. Третий подход связан с изучением асимптотического поведения остатка Rn[f] квадратурной формулы при стремлении п к бесконечности для данного класса функций и построением формул, для которых убывание остатка близко к оптимально возможному. Этот подход тесно связан с двумя предыдущихлш и выделение его в определенной мере условно. Хорошо известен следующий результат (Соболев [2]). Если / — функция одной переменной, определенная на промежутке [0, 1] (другие промежутки линейным преобразованием сводятся к [0,1]), и имеет на [0, 1] т производных, то существует такая последовательность квадратурных формул, что для их остатка Rn справедлива оценка \Rn[f]\<AmMmn~m, D.1.10) где п — число узлов, Мт = sup | /<w) (x) |, а Ат— константа, зависящая лишь от свойств функции /. Если / (х) определена в единичном 5-мерном гиперкубе 3)s (или прямоугольном параллелепипеде), то интеграл / (х) dx можно свести к повторному и для его вычисления использовать одномерные квадратурные формулы по каждой из переменных. Тогда, если функция / имеет в 3)s всевозможные частные производные порядка тип — общее число узлов повторной квадратурой формулы, то можно найти такую последовательность.формул, что для их остатка Rn имеет место оценка \ R [/] I ^ A M п~"т/$ D.1.11) где мга= sup -^m- а Am.s — константа, зависящая от s и свойств функции /. При этом можно указать такие функции /, для которых в D.1.10) и D.1.11) достигается знак равенства. Таким образом, использование повторных квадратурных формул ведет с ростом s к резкому замедлению порядка убывания остатка. В 1957 г. Н. С. Бахваловым было показано, что этот результат не может быть улуч-
§ 1] КВАДРАТУРНЫЕ ФОРМУЛЫ В КЛАССАХ ФУНКЦИЙ 127 шен при любом способе интегрирования, использующем лишь информацию о принадлежности функции / к данному классу и информацию о значениях функции / и ее производных в отдельных точках. Точнее, им было показано, что если / е Н (т, а, X) — классу функций, у которых частные производные до порядка т включительно ограничены по модулю постоянной а, а производные порядка т удовлетворяют условию Гельдера с показателем X (О < X < 1) dmf <а 2К-4|Х> D.1.12) <2=1 то при любом способе вычисления интеграла \ f(x)dx т+Х sup \Rn[f)\>A-as,m^n"^~. D.1.13) , А, Ъ) Убывание порядка сходимости с ростом числа измерений объясняется широтой класса функций, а не недостатками способа конструирования квадратурной формулы. Естественно, что при вычислении интегралов счетной кратности (конкретные задачи, где требуется вычислить интегралы такого рода, рассматриваются в последующих главах) оценки, использующие свойства гладкости подынтегральной функции, приводят к плохим результатам. В работе Ченцова [1] показано, что для любой квадратурной формулы вида D.1.2) среди аналитических периодических функций вида sin2(^ — Xj) найдется такая, для которой значение квадратурной суммы будет давать относительную ошибку интеграла более 50%. Таким образом, для получения квадратурных формул с более хорошими свойствами необходимо выделять более узкие классы функций, которые следует характеризовать иными свойствами, чем гладкость или даже аналитичность. Такой подход был развит в работах Н. М. Коробова, а затем Н. С. Бахвалова. Один из результатов Н. М. Коробова состоит в следующем.
128 ПРИБЛИЖЕННОЕ ВЫЧИСЛЕНИЕ ИНТЕГРАЛОВ [ГЛ. 4 Пусть 3) s — единичный гиперкуб 0^xt ^ l,i = I,... . . ., s, и / (х) — определенная в 23 я и периодическая по каждой из переменных х{ функция. Будем предполагать, что почти всюду в 25 s f(x) представима своим рядом Фурье где с(т) = с(т1У ..., ms) = \ f(x)e2ni(™> хЫх; (т, х) = = т^х + • • • + ^s^s- Так как ^ f(x)dx = с@, ..., 0), то остаток квадратурной формулы п $/(*)**« л 2/(**) D.1.14) может быть записан в виде -j-oo п ' -^е-2*^, D.1.15) m1,...,mg=—оо /с=1 где штрих у знака суммы обозначает отсутствие слагаемого, соответствующего тх = т2 = ...== ms = 0, и можно надеяться обеспечить малость остатка Rnlf] за счет малости тригонометрических сумм п S (т) = гГ1 2 е2Щш' *к) • D-1 -16) Пусть / (#) EH E1 — классу периодических по каждой из переменных Xj функций, для которых выполняется оценка с (т) = где у — действительно число, большее единицы, константа в знаке О не зависит от %,..., w8 и _ f 1, если mt = 0, f 11 mz|, если r
§ 1] КВАДРАТУРНЫЕ ФОРМУЛЫ В КЛАССАХ ФУНКЦИЙ 129 Выберем точки xk = (x(i\ . . ., х[к)), полагая ^>= где {а} обозначает дробную часть числа а. Целые числа a>i<, а2 , . . ., а8 взаимно простые с п назовем оптимальными коэффициентами, если существуют константы р = Р (s) и с0 = co(s) такие, что для некоторой последовательности значений п выполняется неравенство . • + am) am) D.1.17) где 1, если т делится на п, если А?г не делится на п. {1, п и, Число Р называют индексом оптимальных коэффициентов. Справедлива Теорема (Коробов [3]). Пустьп> 2 иах 9 . . ., as — оптимальные коэффициенты (at = at (п)), а Р — их индекс. Тогда для погрешности квадратурной формулы , • • •» ocs)dx1 выполняется оценка D.1.19) гйв С — константа, зависящая только от у и s. Отметим, что, суммируя геометрическую прогрессию, легко получить равенство 2*"г п /С=1 5 С. М. Ермаков
•130 ПРИБЛИЖЕННОЕ ВЫЧИСЛЕНИЕ ИНТЕГРАЛОВ [ГЛ. 4 Из D.1.15), D.1.17) и D.1.20), таким образом, вытекает -he» Dly, .. ., Ж === ОС + ОО < с 2 бп (а> wiii • ••> ms=—с» а = (ai , . . ., as), и оптимальность коэффициентов «! , . . ., as состоит в том, что для достаточно большого числа значений тх , . . ., ms 8n (а, т) обращается в,нуль, так что главная часть остатка оценивается с помощью неравенства D.1.17), а вклад остальных слагаемых оказывается малым по сравнению с главной частью. Более подробное изложение фактов, связанных с оптимальными коэффициентами, можно найти в монографии Коробова [3], где, в частности, имеются таблицы оптимальных коэффициентов. Для класса El оценка D.1.19) близка к оценке снизу остатка интегрирования. Бахвало- вым было показано, что для этого класса где Сх от п не зависит (см. также Шарыгин [1]). 4. Метод Монте-Карло в его простейшем виде, когда интеграл ] f(x) \i(dx) оценивается при помощи среднего арифметического г=1 где xt независимы и их распределение определяется мерой \i, обладает очевидным формальным сходством с описанными выше методами вычисления интегралов. По существу, однако, эти методы отличаются в том отношении, что метод Монте-Карло основан на теоретико-вероятностном подходе и характер его сходимости вероятностный. За счет этого обеспечивается: а) Независимость порядка убывания остатка N i=l
1] КВАДРАТУРНЫЕ ФОРМУЛЫ В КЛАССАХ ФУНКЦИЙ от размерности s пространства X. Как уже отмечалось в главе 1, если / — фиксированная функция из L2(\x), то остаток убывает как N~1/2 при фиксированном доверительном- уровне у. Такой же порядок убывания остатка, впрочем, имеет место для любой / из класса функций F, если F a L2 (Ю- Характер класса F при F a L2 (Ц<) может отразиться лишь на скорости сходимости распреде- N ления среднего-^-2/(^г)к нормальному закону. Если г=1 L2 (\i) a F, то остаток убывает, вообще говоря, медленнее, чем N'1*, и предельное распределение среднего арифметического отлично от нормального. б) Последовательный характер оценивания интеграла. При увеличении N естественным образом используются вычисленные ранее значения функции- Детерминированные квадратурные формулы далеко не всегда обладают таким свойством. в) Простая процедура оценки погрешности параллельно с основными вычислениями. Так, если сходимость распределения среднего арифметического к нормальному* закону имеет порядок О (N~1>2), то, вычисляя среднее арифметическое квадратов значений функций в точках хи мы можем оценить дисперсию среднего арифметического и построить доверительный интервал, соответствующий заданному уровню доверия. Практически оценка погрешности детерминированных квадратурных формул, когда вид / достаточно сложен, в подавляющем большинстве случаев оказывается безнадежно трудной задачей, ибо требует оценки супремума производных функции. Даже определение класса дифференцируемых функций, к которому принадлежит /, дело далеко не простое. Использование метода Монте-Карло, строго говоря, требует также сведений о принадлежности/ к определенному классу функций. Желательно, чтобы интеграл ]|/3 (х) | |ш (dx) имел конечное значение, что обеспечивает- асимптотическую нормальность распределения среднего арифметического и достаточную для практических' целей точность оценки дисперсии. Требование конечности третьего момента, однако, менее ограничительно, чем ограниченность производных и может контролироваться в процессе вычислений. 5*
132 ПРИБЛИЖЕННОЕ ВЫЧИСЛЕЙИЕ ИНТЕГРАЛОВ [ГЛ. Далее мы будем рассматривать в основном случай F с: L2 (|л). Случай F = Lp (\i)> I < р < 2, существенно менее изучен. Он рассматривался, например, в работах Калоса [1], Тёрна [1], Бахвалова [3] (см. также неравенство A.3.4.) гл. 1). Как уже отмечалось, при использовании среднего арифметического D.1.21) для оценки интеграла порядок убывания погрешности в случае достаточно узкого класса функций F (F с ^2 (М1)) остается N~xl*. Можно стать, однако, на иную точку зрения и рассматривать случай, когда имеется некоторое множество детерминированных квадратурных формул, приспособленных для интегрирования функций класса F, и конкретная формула выбирается случайно из этого множества. Этот подход был предложен Н. С. Бахваловым в ряде работ, из которых мы сошлемся на работы [1], [2], [3], а затем исследовался другими авторами. Рандомизация такого рода доставляет определенные преимущества, связанные с увеличением скорости сходимости квадратурного процесса. Ниже приводится пример (Бахвалов [2]) оценки среднего значения остатка простейшей квадратурной формулы \-Rn\f]. D.1.22) Относительно функции / (х) предположим, что ее коэф- фициенты Фурье с (т) (/ (х) — 2 е (т) е2Мтх) подчинены неравенству Определенный таким образом класс функций / обозначим Fy (с). Квадратурная сумма Kn[f], соответствующая формуле D.1.22), как легко проверить, обладает свойством . ж, ъпь . О, т не делится на я, т делится на п. п . Ьп г 0 -JLVp n — Я (т\ — \ '
§ 1] КВАДРАТУРНЫЕ ФОРМУЛЫ В КЛАССАХ ФУНКЦИЙ 133 Отсюда следует оо оо Rn [/] = 2 [С (П)) + С (- П])\ = S Cni, где cnj- = с (nj) + с(— nj). Легко видеть, что функция п~ус ]f2 cos Bлпх) ЕЕ Fy (с) и, следовательно, sup \RnW\>n-<cV2. D.1.23) Пусть теперь п и N — целые положительные числа N -\- 1 ^ п^ 2N и y>1- Лп [/] можно представить в виде оо оо Неравенство Буняковского дает следующую оценку для I Rn\f\ I2: » [/] |2 < »-2Y SI c«i I2 ("Л"/ • S Z1^- Сумма 2/12v есть значение ^-функции в точке 1—2у и, следовательно, оо I Rn [/] |2 < ir"G A - 2т) Si ^ I2 (^TT1. D.1.24) ii Будем считать теперь, что п принимает значения от N + 1 Д° 2iV с равной вероятностью р = 1/ЛГ, и оценим среднее значение квадрата модуля остатка м|л![/]|=лг S 1^п Из D.1.24) следует, что 2N l 2iV oo
134 ПРИБЛИЖЕННОЙ ВЫЧИСЛЕНИЕ ИНТЕГРАЛОВ [ГЛ. 4 Обозначим п] = к. Тогда ;=1 /с=п где два штриха у суммы обозначают, что в ней присутствуют лишь слагаемые, для которых к делится на п, и можно получить оценку n=N+l te=n оо < 2 \ск\%к где т(/с; N + l,2iV) —число делителей числа к среди чисел от N + 1 Д° 2iV. Очевидно, равенство (/г, т) = т равносильно равенству (гг, п/т) = (п/т), где(л,т) обозначает общий наибольший делитель чисел га и иг, и т(A; 7V + 1, 27V) = т(A; A:/2iV, Отсюда ^v-1 2 1)с2ЛГ\ D.1.25) так как оо -f-oo Таким образом, М | Rn[f] | 2 < N-b-Wt&y - 1), D.1.26) т. е. дисперсия модуля остатка есть величина порядка О (iV7), в то время как для супремума модуля имеет место неравенство D.1.23). Можно получить также неко-
1] КВАДРАТУРНЫЕ ФОРМУЛЫ В КЛАССАХ ФУНКЦИЙ 135 торые результаты, относящиеся к распределению величины | Rn[f] |. Зафиксируем некоторое е > 0. Если для г значений п имеет место неравенство п? \ Rn[f] | > е, то 2N rN'^^N'1 2 ^\Rn[f]\\ Tl=:iV+l Но при г ;> е~26?Bу— 1)с2 это противоречит D.1.26). При равновероятном выборе п (N + 1 ^ п <J 2N) и при Nq = г целом (q < 1) с вероятностью 1 — g = 1 — rIN выполняется неравенство I Rnlfl \< cq-M12? BY - l)]1/.^-1/.. Это один из простейших результатов, относящихся к случайному выбору квадратурной формулы из некоторого множества квадратурных формул. Ряд других результатов можно найти в работах Бахвалова [2], [3], Шарыгина [1], а также Тсудо [1]. В последней работе интеграл по единичному гиперкубу заменяется приближенно многократной суммой с помощью повторного применения интерполяционно-квадратурной формулы, узлы которой выбираются в корнях многочлена Чебышева, наименее уклоняющегося от нуля, а затем интеграл оценивается с помощью среднего арифметического случайно отобранных слагаемых этой суммы. Оценка снизу для математического ожидания остатка квадратурных формул в классе функций Н (т, а, К) и ряде других классов получена Бахваловым [3]. В частности, при любом способе рандомизации имеет место неравенство sup M | Rn I(, a, X) Рандомизация квадратурных формул Н. М. Коробова методом, аналогичным описанному выше, позволяет получить оценки математического ожидания, близкие к оптимальным. Такой подход, как мы видели, не предполагает, что соответствующая квадратурная сумма является несмещенной оценкой интеграла. Кроме того, множество квадратурных формул, из которого производится случайный выбор, предполагается заданным.
136 ПРИБЛИЖЕННОЕ ВЫЧИСЛЕНИЕ ИНТЕГРАЛОВ [ГЛ. 4 В данной книге рассматриваются, как правило, несмещенные оценки интеграла и классы функций не определяются явно. Поэтому мы ограничились изложением простейшего примера, в котором случайно выбирается число узлов. Несмещенные квадратурные суммы для функций из L2 (\i) подробно рассматриваются в последующих параграфах. В заключение следует отметить наличие непосредственной связи между статистическими тестами, примененными к конечной последовательности чисел хх, х2 , . . . .. ., #лг(О^>;<;1, i = 1 , . . ., N), и погрешностью простейшей квадратурной формулы 1 N &«-^2/(*!)• D.1.27) Результаты, полученные в этом направлении И. М. Соболем [4], [6], позволяют более четко уяснить роль статистических тестов при проверке равномерной распределен- ности последовательности узлов формулы D.1.27). Так, если f (х) имеет ограниченную вариацию на [0, 1], то, как уже отмечалось (см. D.1.9)), N г=1 N var / sup 1 —- х — N~l 2 9 (х — хд • []l Если трактовать последовательность гп...,^ как последовательность реализаций некоторой случайной величины ?, то легко видеть, что функцию N Gn (%) = 1 — N~l 2 6 (я — #t) можно трактовать как ее эмпирическую функцию распределения. Но тогда N 11 — х — N'12 6 (х — Ч) | = Ix ~ Gn (x) |. Если же предполагать, что теоретическое распределение § есть равномерное распределение для [0, 1], то выражение Г1/. supla —
§ 2] ОБЩИЕ МЕТОДЫ УМЕНЬШЕНИЯ ДИСПЕРСИИ 137 есть статистика Колмогорова последовательности хх , . . . . . ., хи. Таким образом, если / (х) имеет ограниченную вариацию, то остаток интегрирования можно выразить непосредственно через статистику Колмогорова. Аналогичную связь можно установить и со статистикой Мизеса — Смирнова (Соболь [4]), если предполагать у / (х) наличие интегрируемой с квадратом производной. В многомерном случае аналогичные результаты могут быть получены, если предположить, что / (х) обладает ограниченной, в смысле Витали, вариацией или смешанной по каждой из переменных производной, интегрируемой с квадратом. Развитие этих идей и результаты относительно связи остатка интегрирования с критерием Колмогорова содержатся в работе Соболя [6]. К истолкованию этих результатов мы вернемся в главе 8. § 2. Некоторые общие методы уменьшения дисперсии. Случайные интерполяционно-квадратурные формулы Располагая определенным набором преобразований случайной величины, сохраняющих ее математическое ожидание, но изменяющих дисперсию, можно, вообще говоря, строить модификации метода Монте-Карло более эффективные, чем исходная. Повышение эффективности связано, как правило, с учетом дополнительной информации о подынтегральной функции и мере, относительно которой производится интегрирование. Ниже рассматривается ряд простых модификаций метода Монте-Карло применительно к задаче вычисления интеграла и обсуждаются их особенности. 1, Метод выделения главной части. Пусть требуется вычислить интеграл / = lf(x) \i (dx) и имеется достаточно близкая к / (х) функция g (х) такая, что интеграл Jx = = I 8 (х) Н» {^х) может быть легко вычислен аналитически или с помощью простой квадратурной формулы. Тогда и достаточно оценить \ [/ (х) — g (x)] \i (dx) методом N Монте-Карло с помощью суммых' = -^-2 U(xi)
138 ПРИБЛИЖЕННОЕ ВЫЧИСЛЕНИЕ ИНТЕГРАЛОВ [ГЛ. 4 где хг независимы и распределены по закону \i. Если обозначить 8 (х) = / (х) — g (х), то Dx' = ± Ц 8* (ж) [г (to) - [Je (x) |i (to)]*}. D.2.1) Условия, при которых этот прием выгодно использовать, просто установить для каждой конкретной задачи. Для этой цели достаточно оценить дисперсию Ом' аналитически или экспериментально на основе выборки умеренного объема. Если в качестве g (x) выбрать линейную комбинацию некоторых заданных функций ф^ (х): то может быть поставлена задача о выборе констант аь при которых Dx' достигает минимума. Ответ в данном случае хорошо известен: g (ас) должна быть отрезком ряда Фурье по системе функций, полученной из системы {ф*}Г процессом ортогонализации. Если предположить, что фг (#) ортонормированы в L2 (|х), то at должны быть коэффициентами Фурье функции /, т. е. Яг = S / (х) Ф4 (ас) |i (to), J ^ (х) %• (х) \i (to) = { ^ ! = ].[ 2. Метод существенной выборки. Пусть интеграл N оценивается с помощью суммы х = N^ f (x{), где xt — не- г=1 зависимые случайные величины с распределением вероятностей \л (dx). В этом случае дисперсия случайной величины х есть Пусть X — произвольная вероятностная мера такая, что \i абсолютно непрерывна по отношению к ней. Тогда J =
§ 2] ОБЩИЕ МЕТОДЫ УМЕНЬШЕНИЯ ДИСПЕРСИИ 139 У и может быть использована оценка Хх — N'12 f(Vi) -тр (У\)* г=1 где yt распределены по закону X. Дисперсия н\ есть Dxx = N^[f(x)-&-W-jJx(dx). D.2.2) Таким образом, мы получили семейство несмещенных оценок для интеграла /, зависящих от меры X. Заметим теперь, что согласно неравенству Коши — Буняковского Легко видеть, что знак равенства в этом неравенстве и3 следовательно, наименьшее значение D.2.2) получим, полагая 7'/|/(х)|, |/(*)|> о, где 7' = J Таким образом, оптимальная мера X = Хо определяется равенством K(dx) = jr\f{x)\p(dx). D.2.3) Для ее построения нужно знать величину /', т. е. решить исходную задачу при / (х) > 0 или не менее сложную задачу интегрирования функции |/(х)|. Тем не менее мы получаем указание, что «хорошая» мера X должйя! быть похожа на | / (х) | |ы (dx), и можем им воспользоваться. Пусть / (х) > 0 (минимальное значение дисперсии D.2.2) в этом случае есть нуль) и |х (dx) = р (х) dx, т. е. существует плотность по лебеговой мере. В этом случав ^о (dx) = —f(x)p (x) dx Если Хо (dx) известно с погрешностью Хг (dx) — = =г- (/ (х) р(х) + г (х)) dx, причем предполагается J + г /()() ^()d и е(ж) = 0 при
140 ПРИБЛИЖЕННОЕ ВЫЧИСЛЕНИЕ ИНТЕГРАЛОВ 1ГЛ. 4 ( = 0, то D х (/+5)С *<?*<»> ,*И-Л, 1 V ' J / (ж) /> (ж) + s (х) g //-*»\ Пусть 80 = sup 77TTT • Легко показать, что при е0 -> 0 х t Ух) Р \Х) Dxxt — /so- Этот результат, устанавливающий устойчивость Dxx в окрестности X = Хо, в некоторых случаях может оказаться полезным. Существенная выборка часто используется в тех случаях, когда дисперсия х бесконечна. Из D.2.3) следует, что всегда можно подобрать такое X, что D.2.2) будет иметь конечное значение, лишь бы интеграл / = \ | / (х) \ \i (dx) был конечен. В частности, при вычислении интеграла \ f(x)dx, где 3) — область евклидова пространства, &> а / (х) имеет особенность такую, что \^f2(x)dx pac- ходится, можно подобрать неотрицательную функцию Ф (х) такую, что ^ ф (х) dx = 1 и при X (dx) = ф (х) dx хх имеет конечную дисперсию. Можно положить, например, О при что дает Dxx = \1 |/(х)|dxj- К /(х)dx? = Р - J\ Обычно, когда расходится интеграл ^ /2 (х) dx, функцию / (х) разбивают на два сомножителя / = gh так, что g особенностей не имеет, а интегрирование h > 0 может быть выполнено аналитически. Должным образом нормированная функция h выбирается в качестве плотности распределения, по которому производится интегрирование. Прием носит название включения особенности в плотность. Ряд примеров его использования можно найти в книгах Бус- ленко и др. [1] и Соболя [9].
§ 2] ОБЩИЕ МЕТОДЫ УМЕНЬШЕНИЯ ДИСПЕРСИИ 141 Иногда возникает также следующая задача (Эванс [1]). Требуется вычислить п интегралов/* = \/г(х)\1 (dx). Выбирается, как и выше, некоторое распределение вероятностей X (dy) и /, оценивается с помощью средних Зададимся вещественными константами at (i = 1,. . . , п) и подберем к таким, чтобы обратить в минимум сумму Ее минимум достигается, когда достигается минимум выражения п Если обозначить 1 = (S «t/J(У)) ' ($) (v)> то D| = .5 - - Л > 0, где 7 = J ( 2 a?/?)VV {dx), т. е. 5 >(S(S«W)% (*»))'• D>25) Знак равенства в D.2.5), согласно D.2.3), достигается при Таким образом, минимум D.2.4) достигается при и равен п /2 — ^J сц/j.
142 ПРИБЛИЖЕННОЕ ВЫЧИСЛЕНИЕ ИНТЕГРАЛОВ [ГЛ. А Последнее выражение обращается в нуль, если постоянна сумма 2 ai/i 0*0- В частности, если все ft (х) У 0 иостояег- г=1 ны, то выражение D.2.4) обращается, в нуль. Эти соображения позволяют учесть априорную информацию об интегрируемых функциях и повысить эффективность метода Монте-Карло. К обоим описанным методам мы будем возвращаться в дальнейшем в связи с конкретными задачами. Очевидно, их можно комбинировать, выделяя, например, сначала из подынтегральной функции главную часть, а затем применяя метод существенной выборки. В качестве примера использования этих приемов приведем описанный в работе Розенберга [1] способ интегрирования, основанный на применении полиномов Берн- штейна подынтегральной функции. 1 1 Пусть / = §<йгу. . . 5J dx8f(x1, . .,, xs) = ^ f(x) dx, где о о &s f (x) — непрерывная функция в 25S. Полиномом Берн- штейна функции / называют полином Blnu..., ms (X) = В'ш (X) = где т — (тг, . . ., m8), PUm (x) = Clmxl A — х)ш'1. При mly . . » , ms —* oo Bfm (x0) сходится к / (х{)) в каждой точке х0 непрерывности функции /. Если / илшет непрерывную частную производную порядка к в точке х0, то соответствующая частная производная полинома Берн- штейна в точке х0 также сходится к значению этой производной (Натансой [1]). Таким образом, В{п(х) достаточно хорошо учитывает особенности поведения функции / (х). Предположим теперь, что / (х) >0 в единичном гиперкубе i/s, no которому производится интегрирование. Так как прибавление к / (х) константы не усложняет задачи интегрирования, то можно считать, что inf / (х) >
§ 2J ОБЩИЕ МЕТОДЫ УМЕНЬШЕНИЯ ДИСПЕРСИИ 143 Тогда так как каждая из сумм есть сумма вероятностей биномиального распределения и, следовательно, равна единице. Заметим также, что где Обратимся к методу существенной выборки и положим К (dx) = Л^ (ас) dx, ГДР X так что Л*) L (ж) dx. D.2.7) Приятной особенностью такого выбора к является сравнительная простота моделирования соответствующей случайной величины. Плотность Bfm (x) связана со сле^ дующей вероятностной моделью. Пусть имеется М = S = Ц (тк -f-l)ypH, помеченных индексами /1?. . ., /а, т. е. 4=1 ра битых на группы по mk +1 урне в каждой (Z^ = 0,. . . . . . , mk; к — 1, . . ., s). .Положим вероятность извлечения из урны с индексами /1? . . ., ls равной / ^~j- , ..., -^-) I S. После выбора урны. т. е. значений индексов /1? . . ., /в,
144 ПРИБЛИЖЕННОЕ ВЫЧИСЛЕНИЕ ИНТЕГРАЛОВ [ГЛ. 4 в соответствии с этим распределением вероятностей, получаем s независимых случайных величин ук с ^-распределением, параметры которого есть 1к и тк — 1к. При 1к = тк или lk = О получаем вырожденные Р-распределения, которым соответствуют плотности (mk + 1) х™* и (тк +1) A — хк)ть соответственно (см. 2.3.17)). Компоненты вектора (у1У . . . ,г/5) имеют совместную плотность распределения Bfm (х). Полином Бернштейна, естественно, может быть выбран и в качестве функции g (х) в методе выделения главной части. Можно также при оценивании среднего значения разности / (х) — Bfm (x) использовать существенную выборку с плотностью Вт (x)j что, как правило, не приводит к существенному выигрышу (разность / (х) — Вш (х) может иметь другие особенности поведения чем / (х)). Описанный способ интегрирования по существу является способом уточнения с помощью метода Монте- Карло простейшей квадратурной формулы / ^ S, получаемой в результате повторного использования квадратурной формулы прямоугольников. При вычислении интегралов большой кратности его использование связано с трудностями, которые вообще имеют место при использовании равномерных сеток. Тем не менее он представляет принципиальный интерес как способ сочетания классических методов интегрирования с методом Монте-Карло. 3. Понижение порядка интегрирования (Бусленко и др. [1]). Пусть х = (у, г), т. е. переменные х19..., xs разбиты на две группы: у = (хг,..., хг) и * = (xt+1, •.., xs), t<$, и ^ ^ j j/(V* *0ji(dyd«). Допустим, что аналитически (у) (•) можно вычислить v (dy) = \ [I (dy dz) и f (у) = () j/( ) = j/(У* z)& (^*)» ГДе1 Д №z) определяется соотношением Р (dz) I И- (dV dz) = V> (АУ dz\ так чт0 J = I f (У)v (dV)- __ (•) (у) При оценке последнего интеграла с помощью суммы N 1=1
§ 2] ОБЩИЕ МЕТОДЫ УМЕНЬШЕНИЯ ДИСПЕРСИИ 145 где yt распределены по закону v, дисперсия будет разве лишь меньше, чем при оценке / при помощи суммы N г=1 Действительно, Dx - Dx" =^! U $ /2 (у, z) fi (dy dz)llii (dy dz) - (v) l(*) / (*) \ \i(dydz)Y\ так как выражение в фигурных скобках есть дисперсия случайной величины / (у, г) при фиксированном $/. (Распределение г есть ji (dy dz) \ \i (dy dz)). I (*) 4. Расслоенная выборка. Представим пространство 3?t по которому производится интегрирование, в виде суммы конечного числа т непересекающихся подмножеств At. Получим m J / (х) |i (dx) = 2 S / (*) I* (d*)- D-2-8) Каждый из интегралов в правой части D.2.8) может быть оценен с помощью обычного метода Монте-Карло или одной из его модификаций, рассмотренных ранее. Предположим, что интеграл / (х) \i (dx) = [х (Аг) J ft (x) |i (dx)/\i (A{) Ai ni оценивается с помощью суммы щг\л(Аг) 2 e(pk^ гДе О, ; a х^. (ki = 1, . . . , rii\ i = 1, . . . , яг) — реализации независимых случайных величин xt с распределением вероятностей |Л (dx)/\i (At), x ЕЕ At.
146 ПРИБЛИЖЕННОЕ ВЫЧИСЛЕНИЕ ИНТЕГРАЛОВ 1.ГЛ. 4 Таким образом, т п{ \ i (уЛ II (ri^*\ ¦ ' ^ n~\i /J \ V rt (по \ v Г/1 Очевидно, Мх [/J = ^/(ac)|i(dac). Дисперсию суммы х легко вычислить. Она равна Dx = 2 »rV (А) \ /2 (я?) И (^ав) - S 141Г S / (ж) I* (dx)?. D.2.9) Пусть т = 2, /?! = |x(i4x), р2 = и D2), »! + /га = iV. Будем считать рх, р2, /гх и п2 такими, что пг — pxN и гг2 = p2N — целые числа. Тогда D* = iV {^ f (х) |i (dx) - -i- [ J / (х) [i (d^)]2 - }- D-2.10) Для обычного метода Монте-Карло, примененного для оценки интеграла по всему множеству Ж, имеем D*=4 [ \ f {х) * {dx)J ~ -\\f(x)\i{dx)J-2\\f(x)\i(dx)] Так как \lpx > 1и l/p2 ^> 1, легко видеть, что для любой / из L2 (u) Dx ^ Dx. При этом знак равенства имеет место, лишь если ГИ- (^)Г1 $ / (х) \х (dx) = Таким образом, любое разбиение при выборе числа точек, пропорциональном мере множеств Ах и А2, ведет kj уменьшению дисперсии по сравнению с обычным методом Монте-Карло. Иными словами, нет такой функции из L2 (\i),
§ 2] ОБЩИЕ МЕТОДЫ УМЕНЬШЕНИЯ ДИСПЕРСИИ 147 для которой расслоение с пропорциональным числом точек дало бы худший результат, чем обычный метод Монте- Карло. Если число точек выбирается не пропорционально мерам Ах и А2 соответственно, то этот факт, вообще говоря, не имеет места. Действительно, полагая т = 2, /гх = /г2, \х (А^ — •=•3/4 и \i (А2) = 1/4, получаем Dk = ~к {г \ ** <х) |* № + 4- А, Сравнивая полученное выражение с дисперсией обычного метода Монте-Карло с числом испытаний 2пг, убеждаемся, что есть функции, для которых такая расслоенная выборка дает худший результат, чем оценка при помощи рбычнрго метода Монте-Карло (например, функция, отличная от нуля лишь на Аг). Располагая, однако, некоторыми дополнительными сведениями о функции /, можно распорядиться выбором пг и гс2 так, чтобы Dx была минимальной (Гельфанд, Фролов, Ченцов [11). Из D.2.10) легко получить Dk = -At- Ц2 L !, при котором Dx минимально, равно [X (А{\ УЩп и минимальная дисперсия есть 5. Случайные квадратурные формулы. Одним из универсальных приемов уменьшения дисперсии метода Монте- Карло является использование случайных квадратурных формул. В этом параграфе будут рассматриваться интер- пошщионно-квадратурные формулы, узлы которых имеют функцию распределения специального вида. Будут получены также вспомогательные результаты, которые будут использоваться далее.
148 ПРИБЛИЖЕННОЕ ВЫЧИСЛЕНИЕ ИНТЕГРАЛОВ [ГЛ. 4 Случайной квадратурной формулой будем называть формулу п \), D.2.11) где At я xt являются случайными величинами, а фх и / — заданные функции такие, что произведение фх/ |1-ин- п тегрируемо. Сумму xnf/]= 2 ^г/0*Ч)> соответствующую формуле D.2.11), будем называть случайной квадратурной суммой. В дальнейшем будем предполагать, не оговаривая особо, что сумма хп [/ ] Является несмещенной оценкой интеграла " i(x)f(x)n(dx) и коэффициенты Аг являются заданными функциями случайных величин х-ъ Ах = Аг (xv . . ., хп). Простейшим примером случайной квадратурной суммы может служить сумма являющаяся несмещенной оценкой интеграла /, когда xv . . ., хп независимы и имеют распределение |i (dx). Если для / = /0 с вероятностью единица имеет место равенство п 2 A{f0 (х{) = J фх (х) /о (х) \i (dx), i=l то будем говорить, что квадратурная формула точна для функции /0. В дальнейшем нам понадобится лемма, которая является обобщением на случай произвольной о -конечной *) *) Далее удобно считать, что мера [i конечна или а-конечна. Это, как правило, не оговаривается особо. Должно быть ясно, что употребление выражения ц (BE) предполагает конечность меры.
2] ОБЩИЕ МЕТОДЫ УМЕНЬШЕНИЯ ДИСПЕРСИИ 149 меры хорошо известного интегрального тождества (Андреев [1]). Лемма 4.1. Пусть {(pj? и (ф;}Г — два набора функций из jC2 (\х), тогда имеет место интегральное тождество =lvn(dQ) det||ф1 (xt)|? = , D.2.12) Доказательство. Разложим определитель det || фг (Xj) \\i(j — номер строки) по элементам первого столбца, обозначая А7- соответствующий минор: Получим (ж,) ||iv = X X ( — Домножим строку определителя del |i|?ft (жг) ||i с номером / на фх (Xj) и проинтегрируем ее элементы. Перестановка проинтегрированной строки на первое место вызовет появление множителя (—IO'. Если теперь изменить нумерацию первых / — 1 переменных интегрирования во всех ела гаемых, начиная со второго, обозначая х2 вместо хх
150 ПРИБЛИЖЕННОЕ ВЫЧИСЛЕНИЕ ИНТЕГРАЛОВ [ГЛ. х3 вместо х2, . . . , Xj вместо л^г, то получим / - п \ \i (dx2). . . 5 |i (dxn) det 1 ф| (xj) |? X 1, *l) (ф1, *2) ... (ф1, %) i (a?2) фг (x2) . • . t|>n @52) Таким образом, мы понизили на единицу порядок одного из определителей и проинтегрировали строку второго. Буквальное повторение этой операции, очевидно, приведет нас к желаемому результату. Лемма доказана. Непосредственно из леммы вытекает следующий результат, полученный в работе Ермакова и Золотухина [1] и уточненный Хэндскомбом [1]. Теорема 4.1. Если: 1 • {фг }i — линейно независимые для почти всех (mod \i) x функции, фх ортогональна к фг U = 2, . . . , п) и нормирована*, 2. распределение W0(dQ) узлов квадратурной суммы *„[/] = Д(/;<?)/Д«?) D.2.13) определяется равенством Wo^Q) ~ c^2 (Q)^11 (dQ)> г^е с — константа нормировки, равная 1/тг!, когда (pt opmo- нормированы, то хп[/] является несмещенной оценкой интеграла 1 \i (dx) = (ф1? /). Доказательство. Предположим сначала, что {Wi}i ортонормированы. В этом случае, полагая % = = (р{, i =-- i, . . . , п, и используя лемму 4.1, получаем \ Д"'((?)ц«(й(?) = п\ det||((Pi, cPj) ||il = п\ т. е. с = 1/тг!. Далее используем лемму 4.1 для вычисления Мхп [/], полагая я|)г (х) = f (х) и i|)f = фь j = 2,. . , . . ., п. Тогда Д (/;
§ 2] ОБЩИЕ МЕТОДЫ УМЕНЬШЕНИЯ ДИСПЕРСИИ 151 что и доказывает теорему в случае ортогональности функций. Случай, когда фх (х) ортогональна к остальным ф; (х) и все фг линейно независимы (mod \i) (т. е. на носителе меры jx), легко сводится к предыдущему. Достаточно заметить, что умножение на константу и сложение любых соответствующих столбцов определителей, стоящих в числителе и знаменателе выражения D.2.13), не меняет значения кп [/]. Таким путем все фг- могут быть ортонор- мированы, причем величины Д (/; Q) и A (Q) домножат- ся на одну и ту же константу, а хп [/] не изменится. Та- кцм образом, мы приходим к рассмотренному ранее случаю ортонормированных ф^. Последнее рассуждение и доказывает теорему. Будем далее различать регулярные и нерегулярные на Ж системы функций {фг}Г. Назовем {ф*}Г регулярной на Ж системой относительно меры (и,, если мера \in множества {Q : A (Q) = 0} равна нулю, и нерегулярной на Ж в противном случае. Очевидно, функции регулярной на Ж системы линейно независимы (mod \i) на любом подмножестве Ж положительной [х-меры. Для нерегулярной системы найдется такое множество d ^ Ж положительной меры, на котором ф^ линейно зависимы. Имеет место Теорема 4.2 (Ермаков, Золотухин [1], Ермаков [4]). Если {фг}Г — система ортонормированных функций, то в предположениях теоремы 4.1 справедливо неравенство п - 2 (Л Vi)%(xtfp(dx). D.2.14) J При этом для регулярных систем {ф/}^ D.2.14) имеет место строгое равенство. Доказательство. В случае регулярной системы получаем <р8
152 ПРИБЛИЖЕННОЕ ВЫЧИСЛЕНИЕ ИНТЕГРАЛОВ [ГЛ. 4 Или, согласно лемме 4.1, Dxn [/] = 8п — (<р1э /J, где ,/) (Ф«,/) •• (/, Ф2) 1 .. О 1 Раскрывая определитель бп по элементам последней строки, получаем 8п = бп_х — (/, фпJ. Так как бх = (/, /), то легко получить равенство г=1 - S что и доказывает теорему в случае регулярной системы {<Pi}". Если {ф|}Г нерегулярна, то обозначим Жп (А) — = {Q : А (<?) ^= 0}. Тогда !I $ А2 (/, - 2 (/. Ф«J- что и доказывает теорему. Замечание. Если не предполагать ортонорми- рованности фг, то теорема 4.2 остается справедливой, если в D.2.14) заменить ф^ на%, гдея|^ — функции, которые могут быть получены из ф^ процессом ортогонализации и нормировки. Это утверждение может быть доказано теми же рассуждениями, что и при доказательстве теоремы 4.1. Пусть теперь/(х) = МоЦзс, со), где ? (ас, со) — гильбертова случайная функция со е й и (Q, 5, X) — вероятностное пространство. Предположим, что мы хотим с помощью квадратурной формулы оценить интеграл J = j^ <Pi (аО / (#) ^ (d#)> располагая реализациями случайной функции ? при выбранных нами значениях х.
§ 2] ОБЩИЕ МЕТОДЫ УМЕНЬШЕНИЯ ДИСПЕРСИИ 153 Пусть, как и ранее, совокупность выбранных значений х есть Q = (xv . . . , хп). Будем различать два случая. Случай А. При х = xt получены реализации & = I (XU (Of), i = 1, . . . , Л, И © = (©!, . . . , ©п), причем со^ — независимые реализации случайной величины to, © G fin и (Qn, Bn, Хп) — выборочное вероятностное пространство. Случай В. При х = хг получены реализации ? при одной и той же реализации со, т. е. получены t& =¦- = ? (ась со), t = 1, . . . , п (более подробно об этом см. гл. 5, § 1). п Образуем теперь квадратурную сумму %п [?] = 2 ^i?i n или xn[?']= 2 ^i и будем, как и ранее, Q выби- рать случайно в соответствии с плотностью вероятности wo (Q) = ^Д2 (Q) по отношению к fxn. Справедливы следующие теоремы (Ермаков [3], Грановский, Ермаков [1]). Теорема 4.3. Пусть {<р$}Г — система линейно независимых на носителе меры (х функций, <р2 нормирована и ортогональна к уь i = 2, ..., п. Если хп [?] определяется равенством %п [?] = А (?; 0/А (Q) и Q распределена с плотностью вероятности w0 (Q) по отношению к \in, то имеют место равенства Мо>, Qxn [?'] = ^ Фг (х) f (x) \i (dx) и Mo,, qxn [51 = $ ф1 (ас) / (х) vl (dx). D.2.15) Доказательство следует из измеримости хп [^'1 и хп [?1 относительно мер X, [хп и Кп и (гп соответственно и теоремы Фубини. Более сложно доказывается Теорема 4.4. Если [ф*]Г — ортонормированная система функций, то в предположениях теоремы 4.3: в случае А п О», Qxn [?l < S Г/ И - S (/' Ф|) Ф< («Я I* (dac) + L i=l J ), D.2.16)
154 ПРИБЛИЖЕННОЕ ВЫЧИСЛЕНИЕ ИНТЕГРАЛОВ [ГЛ. 4 в случае В J Г/ (ж) - L (x) JX (dx) - 2 S Д (Xl > *2> Фг (*l) Фг i=2 где a2 (x) = AAW [^ (x, со) — / (ас)]2 и /? (xx, x2) — корреляционная функция t (x, со). Я/?и зтоле для регулярных систем {(fi}i в указанных неравенствах имеет место знак равенства. Доказательство. Рассмотрим случай регулярной системы {фг}Г- Нерегулярный случай рассматривается так же, как и при доказательстве теоремы 4.2. Случай А. и х Idet I &, Ф, (х,),..., Фп (х,)HI1 ]2 - (ф1, /J Разлагая определитель в подынтегральном выражении по элементам первого столбца и меняя нумерацию переменных, получаем Dxn It) = $ ^ (do) J |i»(dQ) ((n - I)!) ИД? («,, ..-,«») - J X» (d(o) ^ |xn (d^) ((» - 2)!) Z&Ai (»2i • • - О X X где А* (хх, . . . , Xj_!, Xf+i, . . . , xn) = Af — минор г-го элемента первого столбца определителя А (С, (?). С учетом результатов леммы 4.1 получаем ]=$*, (dco) ^ [i (dx) ?2 (х, со) - (ф1, /J - ((/г - где ./2 = j' A,n(d(o){ (xn (d(>) ^SgA^g. Разлагая определитель Ax по элементам строки, зависящей от х2, а А3
§ 21 ОБЩИЕ МЕТОДЫ УМЕНЬШЕНИЯ ДИСПЕРСИИ 155 по элементам строки, зависящей от xv получаем /2 = J № (da») $ |i» (d0 S (я?1, сох) ? (ха. «2) X X 2 2(- i=2 j=2 где Дь j и А2, i — соответствующие миноры. При этом Аь i — А2, i i — 1, . . . , тг — 1 и Аь | не зависят от хх и х2. Из леммы 4.1 легко получить, что J [г (d»3) • • • $ И (dacn) Д1.4Д1. i = {(Л _ 2),j l. ^ |.' Поэтому J2 = (n — 2)! ^ X (йсох) § A, (dco2) ^ fx (dxx) ^ [A (d«2) С (Жц o)j) x X ? (#2, С02) 2j Фг (#l) Фг (Х2)- D.2.17) г=2 Далее достаточно произвести интегрирование по сох и со2, чтобы получить требуемый результат в случае А. Легко видеть, что случай В может быть исследован аналогично, но вместо D.2.17) приходим к J2 = (п — 2)! § К (dco) § \i (dxj § \i (dx2) ? {х1У со) ? (x2, со) х n x 2( откуда на основании леммы 4.1 непосредственно следует D.2.16). Теорема доказана. Теоремы 4.3 и 4.4 позволяют, в частности, применять построенные нами квадратурные формулы со случайными узлами для интегрирования функций, значения которых вычислены методом Монте-Карло. Остановимся теперь на некоторых частных случаях и примерах. Примером регулярной по отношению к мере Лебега на промежутке [0, 1] системы может служить система многочленов Лежандра, ортонормированных на [0,1], cpi (х) = /Vi (х) степени i — 1. Легко показать, что А @ в этом случае является с точностью до константы
156 ПРИБЛИЖЕННОЕ ВЫЧИСЛЕНИЕ ИНТЕГРАЛОВ [ГЛ. 4 определителем Вандермонда A (<?) = с det || х? ||, i = 1, . . ., п\ к = 0, . . . , лг — 1, который, как известно, равен i,;=l,..., n—i Из D.2.18) непосредственно вытекает, что [д,п-мера множества {Q : A (Q) = 0} есть нуль. Другими примерами регулярных по отношению к мере Лебега в некоторой области 3) 5-мерного евклидова пространства систем могут служить системы многочленов от многих переменных и системы тригонометрических многочленов одной и многих переменных. Читатель без труда может увеличить число подобных примеров. Примерами нерегулярных в евклидовом пространстве систем по отношению к заданной вероятностной мере |я могут служить системы кусочно-постоянных функций. В частности, нерегулярную систему образуют функции Хаара, которые находят многочисленные приложения в вычислительной математике (см. Соболь [7J). Они определяются следующим образом. Разобьем Ж на 2т непересекающихся подмножеств d (m, im), im = 1, . . ., 2m, равной fi-меры. (Считаем, что \i (Ж) = 1.) Подмножества d(s, is) (I <^ s <^ m, i8 = 1,... . . ., 2s") определим равенством d E, is) = d (s + 1, 2is - 1) U d (s + 1, 2is) и положим ^ > x ^— a yS —j" i, *^s ~~~~ -*•/» - 2S/2, x e d (s + 1, 2is), D.2.19) I 0, x&d(s, is); ф1 (x) = 1, ер, (зс) = Xv 7 = 2s + is, s = 1,..., m. Легко проверить, что функции системы {<р7-}Г ортогональны и нормированы. Если (х — лебегова мера, то функции Хаара легко построить. Вид первых функций Хаара приводится на рис. 4.1. В данном случае отрезок [0, 1] делится на равные части.
§ 2] ОБЩИЕ МЕТОДЫ УМЕНЬШЕНИЯ ДИСПЕРСИИ 157 Д (Q) обращается в нуль, если хотя бы две точки xt, Xj, i Ф ] попадают в одно и то же множество d (m, im). Легко построить также аналог функций Хаара в случае, когда множества d (m, im) имеют неравную меру. Интересно отметить, что по отношению к дискретной мере любая система функций при п ]> 2 нерегулярна. Действительно, в этом случае всякая функция задается набором своих значений в дискретных точках, каждой из 1 1/2 1 х -1 V2 \1/2 1 X -V2 Рис. 4.1. \Г2 1/41/23/41 X -V2 которых соответствует ненулевая мера. Легко подобрать две такие не равные нулю одновременно константы сх и с2, что схф, + с2ф2 = 0 в данной точке. Но точка является подмножеством X с ненулевой мерой. Это доказывает нерегулярность любой системы функций по отношению к дискретной мере. Рассмотрим далее несколько простых примеров конкретных квадратурных формул. Пример 1. Пусть дс = [0, 1], fx — мера Лебега, п = 2, ф1 (х) = 1 и ф2 (х) = 2 /3 (х - V2). Тогда Плотность w0 совместного распределения хх и х2 есть w0 (xv ж2) = 6 (х± — х2J, т. е. вероятность получения пары хх и х2 тем больше, чем больше квадрат расстояния между ними. Дисперсия х2 [/] выражается равенством
158 ПРИБЛИЖЕННОЙ ВЫЧИСЛЕНИЯ ИНТЕГРАЛОВ ?гл. Для обычного метода Монте-Карло дисперсия на одно 1 1 испытание равна в нашем случае \ /2 (х) dx — \у (х) dx , Г2 1 т. е. больше для всех функций /, которые не ортогональны к х — 1/а. Использование х2 [/] требует, однако, более чем удвоенной работы на одно испытание по сравнению с обычным методом Монте-Карло. Вопрос о выгодности применения квадратурной формулы, таким образом, зависит от величины 1 интеграла ^ / (х) (х — 7г) dx, т. е. о может быть решен лишь при наличии дополнительной информации о функции /. Аналогичное положение имеет место и в других случаях регулярных систем. Иначе может обстоять дело для систем нерегулярных. Пример 2. Пусть 1иц — те же, что и в примере 1, но фх (х) и ф2 (х) — две первые функции Хаара. Тогда 1/2 о 1/2 1 Рис. 4.2. = 72 и w0 (хг, х2) = 2, (xv 0^ где S — множество точек единичного квадрата, заштрихованное на рис. 4.2 (безразлично, включается ли при этом граница или нет). Таким образом, маргинальное распределение хх и х2 равномерно на [0, 1], но хх и х2 обязаны находиться в различных половинах отрезка [0, 1]. Легко видеть, что мы пришли к случаю расслоенной выборки, рассматривавшемуся ранее. Дисперсию полученной квадратурной суммы легко также выразить через функции Хаара 1 1 1 Dx2 [/] = ± Ц /• (.г) dx - [J / (х) dx] - [J / (х) ф2 (х) dx\ } . 0 0 0 D.2.21) Это выражение особенно наглядно иллюстрирует тот факт, что расслоение может быть выгодным, какую бы функцию
§ 2] ОБЩИЕ МЕТОДЫ УМЕНЬШЕНИЯ ДИСПЕРСИИ 159 из L2 (|я) мы ни интегрировали. Очевидно, что при п = 2W интерполяционно-квадратурные формулы, точные для первых 2т функций Хаара, приводят к частному виду расслоенной выборки, когда Ж разбивается на 2т подмножеств равной меры и все nt равны между собой. Сделаем некоторые дополнительные замечания об интерполяционно-квадратурных формулах со случайными узлами. С теоретической точки зрения нами получены некоторые сведения о разумном выборе узлов интерполяционно-квадратурных формул (указана функция распределения узлов) при самых общих предположениях относительно / (х), системы Ц)г (х) и меры |ы. Доказанная лемма и теоремы допускают также простое обобщение на случай комплексных функций / и {(pj}i. Такого рода обобщения рассматривались Хэндскомбом [1]. Там же приводятся численные примеры. Вопрос о том, является ли И70 единственной функцией распределения узлов, обеспечивающей несмещенность, или наилучшей в некотором смысле, будет обсуждаться в последующих параграфах. Не вызывает, однако, сомнения, что результаты могут быть полезны при вычислении интегралов, если мы располагаем некоторой дополнительной информацией относительно функции /. Моделирование случайной величины Q с плотностью w0 связано с определенными трудностями. В каждом конкретном случае можно, по-видимому, упростить процедуру, но в общем случае трудно предложить что-либо, кроме метода Неймана. При больших п первая возникающая трудность состоит в оценке максимума модуля определителя, вторая в его вычислении. При небольших п (в зависимости от характера функций ф; (x) примерно до п <; 15) можно надеяться получить эффективный алгоритм без подробных специальных исследований. В следующей главе мы вернемся к этому вопросу в связи с интерполированием. Существенно также, что функции ф* произвольны. Это позволяет учесть разнообразную информацию о функции /. Исследователь же всегда располагает информацией такого рода: «функция / «похожа» на некоторые простые функции ф, (ас)». Полезно привести несколько иллюстративных примеров, связанных с вычислением конкретных интегралов.
160 ПРИБЛИЖЕННОЕ ВЫЧИСЛЕНИЕ ИНТЕГРАЛОВ [ГЛ. 4 Пример 1 (Хэндскомб [1]). Для вычисления интеграла 1 1 / = $...$ [ехр (хг... х20) — l]dxx... dx20 ж 9,538.КГ7 о о с точностью 1 % обычным методом Монте-Карло требуется около трех миллионов испытаний (дисперсия на одно испытание имеет величину З-ДО-10). Если положить п = 1, фх = 1, ф2 = хх. . . #20, то не представит большого труда моделирование плотности С А2 ((?). Дисперсия же полученной квадратурной суммы уменьшается на 3-10~15. Это означает, что для достижения точности 1 % требуется уже около 30 испытаний. Это, разумеется, пример очень удачного выбора функций фх и ф2. Однако он в какой-то мере иллюстрирует возможности метода. Пример 2 (Ермаков, Илюшина [1]). Вычислялся интеграл liiii где х = = (xl> • • 13/16 0 3 /2/16 0 3/16 0 0 0 0 0 0 13/16 0 3 /3/16 0 — 3 /2/16 0 5/8 0 3 /2/16 0 3 /3/16 0 7/16 0 3/16 0 - 3 /2/16 0 13/16 А = Полагалосьфх = 1, ф2 = хтАх — с19 ф8 = (хтАхJ — с2. Расчеты проводились для п = 1, 2 и 3. Моделирование плотности С А2 осуществлялось методом Неймана. Результаты вычислений представлены в следующей таблице: 71 1 2 3 о 0,045 0,0053 0,0004 J 0,321026 0,292069 0,287409
§ 2] ОБЩИЕ МЕТОДЫ УМЕНЬШЕНИЯ ДИСПЕРСИИ \fi{ Здесь указано о на одно испытание, число испытаний было равно 10, / есть среднее арифметическое 10 значений соответствующих кубатурных сумм. Пример 3. (Ермаков [1]). 1 / = у (х) «in 2клх dx,~ о к — целое фиксировано. Положим (рг(х) = 1, ф2 (х) = sign'sin 2fcrt?. Система ф1? ф2 является нерегулярной, и легко проверить, что она есть система функций Хаара в смысле определения D.2.19). Промежуток [0, 1] разбит на два непересекающихся подмножества точек. Первое — подмножество тех х, для которых sin 2кпх > 0, и второе — для которых sin 2ктсх < 0. А (хъ х2) есть нуль, когда sin 2кпхг и sin 2кпх2 имеют одинаковые знаки, и постоянна (| А (хг, #2) | = 2), когда знаки sin 2кпхг и sin 2кпх2 различны. Квадратурная сумма х2 \f] весьма проста: Щ [/1 = -у [/ (#i) sin 2кпхг + /(х2) sin 2клх2], где хг и х2 моделируются следующим образом. Выбираются <*! и а2, и если ф2 (хг) ф2 (х2) = 1, то полагаем хх = аи х2 = а2. В противном случае берем другой набор аг и а2 до выполнения указанного равенства Dx2 [/] = 4- \\ f {A sin2 2Ыхdx—(\f(x) sin 2Аяхdx) — Обычный метод Монте-Карло при вычислении двух значений / (х) дает 1 А V й ==-«-[/ (<*i) sin 2кпаг -f / (#2) sin 1 / (х) sin ' ' ' \ j о о 6 СМ. Ермаков
162 ПРИБЛИЖЕННОЕ ВЫЧИСЛЕНИЕ ИНТЕГРАЛОВ [ГЛ. 4 Для неотрицательных функций / получаем таким образом некоторый выигрыш. В отдельных случаях он может быть значительным. Так, при / (х) = х имеем и при любом к > 1 отношение дисперсий —— > 2. Про- верка равенства ф2 (#i)ep2 (#2) ^ 1 может быть, очевидно, заменена проверкой различной четности целых частей чисел 2кпаг и 2&яа2. § 3. Общая постановка задачи и понятие допустимости В предыдущем параграфе нами рассматривались различные несмещенные оценки интеграла. С точки зрения математической статистики метод выделения главной части и понижение кратности интегрирования являются приемами, использующими несмещенные оценки различного вида. Отличие же задач, возникающих в методе Монте-Карло, от задач конструирования статистических оценок состоит в том, что мы имеем возможность распоряжаться распределением вероятностей. Это наглядно проявляется в методе существенной выборки и при использовании интерполяционно-квадратурных формул. В данном параграфе мы продолжим изучение случайных квадратурных формул. Прежде всего возникает естественный вопрос, является ли Wo единственной функцией распределения узлов интерполяционно-квадратурной суммы, которая обеспечивает ее несмещенность. Легко видеть, что это не так. Хорошо известен, например, результат Хаммерсли и Мортона [1] (antithetic variate method или, как мы его будем далее называть, метод антисимметричной выборки). В простейшей форме он состоит в применении случайной квадратурной формулы для вычисления интеграла от функции / (х) по промежутку [0, 1] x)], D.3.1) где х распределен равномерно на [0, 1].
§ 3] ПОНЯТИЕ ДОПУСТИМОСТИ 163 Формула D.3.1) была первой случайной квадратурной формулой, рассмотренной в литературе. Ее изучение во многом способствовало развитию работ, связанных с уменьшением дисперсии метода Монте-Карло. Она точна для единицы и любой симметричной относительно точки 1/2 функции и значительно проще, чем формула вида D.2.13), точная для Ihl Очевидна также ее несмещенность. В отличие от формул, рассмотренных в § 2, лишь один узел этой формулы выбирается случайно, а второй однозначно определяется этим выбором. (Функция распределения узлов вырождена.) Мы подробно рассмотрим формулы такого типа в § 4, а сейчас остановимся на общих условиях, которым должна удовлетворять функция распределения узлов, чтобы обеспечивалась несмещенность квадратурной суммы (не обязательно интерполяционной) . п Будем рассматривать суммы вида кп [/] = 2 ^г (Q) / (xi)i где Q = (хи. . . , хп) — случайная величина, распределенная по закону U (Q), а Аг (Q) — некоторые заданные функции, и сопоставлять им / = j фх (х) f (x)\i (dx). Наряду с обозначением кп (/) будем употреблять обозначения и» I/I = Kn I/; Q] = и» I/; xi, . . . , хп]. Критерием качества несмещенной в L2 (\i) суммы будем считать ее дисперсию, которая предполагается конечной. При этом ограничимся рассмотрением сумм, которые симметричны относительно переменных х1У . . . , хп и для которых U (Q) — также симметричная функция указанных переменных. Это ограничение, с точки зрения выбранного критерия, не умаляет общности, что следует из общих теорем математической статистики. Действительно, вариационный ряд наблюдений образует достаточную статистику и согласно теореме Рао — Блеквелла симметризация может лишь уменьшить квадратичный (и вообще выпуклый) ущерб. Можно дать и прямое доказательство этого утверждения. Если Хд и U (Q) не обладают указанной симметрией и сумма >сд является несмещенной, то построим сим- 6*
164 ПРИБЛИЖЕННОЕ ВЫЧИСЛЕНИЕ ИНТЕГРАЛОВ [ГЛ. 4 метризованные кп и U (Q) следующим образом. Положим 4г 2 G(xk,...,xin) D.3.2) п^п [/; «м..., acin] -j^- («it, • • •, acin) (легко проверить, что U абсолютно непрерывна относительно U). Опуская, для простоты, обозначения переменных и индексы суммирования, получаем т. е. и является несмещенной оценкой /. Далее, Dxn = Ми2 — /2, но л так как A dU ~~ dU ~~ П" Отсюда получаем Dxn [/] < Dxn[/] для всех / е L2 ((х). Таким образом, симметризованная квадратурная сумма оказывается не хуже, с точки зрения величины дисперсии, чем исходная. Совокупность (иЛ [/], U (Q)) такую, что %п I/] является несмещенной для всех / G F и Dxn [/] < + оо для f^F, будем далее называть процедурой метода Монте-Карло (ПММК) (в узком смысле) для класса функций F. Таким образом, для того чтобы (хп [/], U (Q)) была ПММК (название «в узком смысле» далее будем опускать), необходимо выполнение следующих условий: Условие А (несмещенность). \ х„ [/] U {dQ) = J ф1 (х) / (х) |i (das) D.3.3) для любой / ЕЕ F.
§ 33 ПОНЯТИЕ ДОПУСТИМОСТИ 165 Если U имеет плотность и по мере \х и F — достаточно широкий класс функций, например F = L2 (\x), то D.3.3) может быть записано в форме и (Q) = = Щ1 (Щ) (mod V)- D.3.4) Условие Б (конечность дисперсии). Dxn[/] < + оо для любой f ЕЕ F. Займемся далее сравнением качества различных процедур метода Монте-Карло. В предыдущем параграфе в связи с функциями Хаара мы встретились с тем обстоятельством, что можно построить процедуру метода Монте- Карло, «лучшую» в некотором смысле, чем обычный метод Монте-Карло, для всех функций из L2 (fx). Очевидно, такого рода явление заслуживает более подробного изучения. Для случайной квадратурной суммы кп [/] далее используется обозначение х [/, Q]. п считаем фиксированным, но подчеркиваем зависимость от случайной величины Q. Когда существенно указать закон распределения Q, здесь и далее будет использоваться обозначение Qw» где W — функция распределения Q, или QW1 если w — плотность, соответствующая W. Зададимся некоторым классом процедур З5 = {Ж, U), к^Х, П^и,и классомFфункций /, FczL2(\i). Если р' = (х\ U') е № такова, что Dx' [/, Qv.] < Dx [/, Qv\ для любой fueF ив F найдется Д для которой Dx' If, Qu>\ <^ <; Dx [f, Qu], то будем говорить, что р' доминирует р = = (x, U) в S5 для F. Назовем р недопустимой в $> для jF, если в 3й существует р', доминирующая р для jF, и допустимой в противном случае. Введенное понятие допустимости вполне аналогично понятиям допустимости процедур решения и оценок, широко используемым в статистике (см., например, Леман [1]). Допустимую для F процедуру можно также назвать неулучшаемой для класса функций F процедурой в классе процедур ^. Понятие допустимости относится к классу функций. Для некоторой конкретной, достаточно просто вычисляемой функции / недопустимая процедура может привести к меньшей затрате вычислительной работы, чем допустимая (за счет необходимости реализации Q и вычисления
166 ПРИБЛИЖЕННОЕ ВЫЧИСЛЕНИЕ ИНТЕГРАЛОВ 1ГЛ. 4 и!/» (?])• Однако очевидно, что в достаточно широком классе F найдутся функции, для которых будет иметь место обратное утверждение, ибо затраты труда на вычисление значений функции будут основными затратами. Прежде всего, из результатов предыдущего параграфа следует, что обычный метод Монте-Карло недопустим для L2 (|i) даже в классе процедур, где квадратурные суммы имеют равные коэффициенты, но узлы не обязательно независимые случайные величины. Таким образом, можно утверждать, что обычный метод Монте-Карло — один из простейших методов интегрирования — даже для столь широкого класса функций, как L2 (|x), далеко не самый лучший. Зафиксируем теперь систему функций {фг}Г и F = = L2 (|л), считая, что х [/] определяется формулой D.1.6): х[/] = Д(/, Q)/A(Q) и рассмотрим класс процедур ^0 = (х [/], Z7), где U — множество вероятностных мер на Ж таких, что х [/] является несмещенной. Справедлива Теорема 4.5 (Ермаков [5]). Если {<pt}i регулярна по отношению к вероятностной мере [i, срг- с вероятностью 1 ограничены и найдется функция яр (х), ограниченная с вероятностью 1 и ортогональная ко всем произведениям Фг (х) Ф; (х) и ко всем Фг (#)» *> 7 ^ 1> • • м п, то процедура (х [/], Wo) недопустима в Фо для L2 (jx). Доказательство. Рассмотрим распределение V (dQ), определяемое равенством где if (x) — функция, определенная в формулировке теоремы, а р ^> 0 — константа такая, что 0 (mod jin) в Хп. Существование такой р следует из ограниченности г|) (ас). Таким образом, V (dQ) неотрицательна. Доказательство разобьем на два этапа.
§ 3] ПОНЯТИЕ ДОПУСТИМОСТИ 167 1. Покажем, что V (Ж) = 1 и Мх [/; Qv] = J- Согласно определению х [/] и Wo (dQ) S ^ Так как М# [/; QWq] = «/" (теорема 4.1), то достаточно показать, что [ Д (/, (?) Д (<?) ф (хр) ф (»e) |i» ДО) - О (/?, g = 1,..., n; p ^= q) D.3.5) и что F (дсп) = 1. Докажем сначала первое из этих утверждений. Каждый определитель под знаком интеграла D.3.5) представляет собой сумму произведений своих элементов по одному из каждой строки и каждого столбца, снабженных соответствующим знаком. Их произведение — сумма слагаемых, в каждое из которых входит в качестве зависящего от xv сомножителя либо фг-0 (хр) q>j9(xQ), либо / (хр) фго (хр) при некоторых i0 и /о (*о ?= Jo) ^о> /о == li • • ч п)- Так как / (хр) входит в каждое слагаемое лишь один раз, то в слагаемое, содержащее /(зср) ф/0(хл), в качестве сомножителя обязательно войдет фг1 (хя) ц>и (xq) (h ф ju iu h = 1> • • •» 'О и не будет других сомножителей, зависящих от xq. Таким образом, после интегрирования произведения определителей, до- множенного на \р (хр) ty(xq), получаем 0 в силу ортогональности if> (х) к попарным произведениям фг- (х) фу (х). Отсюда следует последнее утверждение. В частности, при / = ф1, х [/] = 1 и J х [/] V (dQ) = J V (dQ) = 1, т. е. V — вероятностная мера и D.3.5) означает, что т. е. Мх [/; Qv) = /•• 2. Вычислим дисперсию х [/]. Легко видеть в силу регулярности {ер*}?, что Dx [/, Qv] = Dx[/; (?iy,l +
168 ПРИБЛИЖЕННОЕ ВЫЧИСЛЕНИЕ ИНТЕГРАЛОВ [ГЛ. 4 где R --= S \Д2 (/; Q) ¦ to Покажем, что i? <^ О для любой / из L2 (\i). Я = 2 ^ 2 P<q J U to) Г где Д,- — минор г-го элемента первого столбца определителя в подынтегральном выражении. Легко проверить на основании соображений, изложенных на первом этапе доказательства, что ряд слагаемых в последнем выражении под интегралом после интегрирования оказываются нулями, и для R получаем выражение ) (x" (dQ) = = J {det|/(ас4) ф (ж,). Фг(ast), • • •, Ф»D Используя лемму D.1) и теорему 4.2, получим {det 1/ (ял) ф (ач), ф2 (ж4),..., фп (^) ||Г}2 \in (dQ) = = nl {^ /2 (ас) гр2 (ас) |i (dx) - 2 (\ f (ж) ф| (ж |^« (ас,) ,х» (d(?) = (re - 1)! Окончательно получаем n Dx [/; Qv] = Dx [/; (?WJ - P 2 ([ f (*) 44 (* Для f = ярф,-, которая принадлежит ?2 (\i) в силу ограниченности г}?, с вероятностью 1 получаем Dx [f, (?WeJ ^> ]>Dx[f, Qy], что и завершает доказательство теоремы. Замечание 1. Использование F вместо Wo является способом уменьшения дисперсии случайной квад-
§ 3j ПОНЯТИЕ ДОПУСТИМОСТИ 169 ратурной суммы. Очевидно, что если найдется т линейно независимых функций opx, if>2, . . . , o|;m со свойствами, аналогичными свойствам яр, и т неотрицательных констант рг таких, что для всех хр и xq (mod Wo), то аналогичным способом можно построить F<m) такую, что Qv(m)] = ГЫ [/; QWo\ - Вопрос о том, можно ли получить таким способом допустимую процедуру, остается открытым. Однако справедлива Теорема 4.6. Если х [/] определяется равенством D.1.6), где {<Pi}1 — первые п из функций Хаара, a 3*i = = (и I/], U) — класс процедур таких, что U ЕЕ U имеет плотность по отношению к мере [х, то процедура (х [/], и) допустима для любого U из U. Доказательство. Для простоты докажем теорему в случае п = 2т, т — целое. Общий случай (см. Грановский [1]) доказывается аналогично, п первых функций Хаара постоянны на каждом из множеств d (m, im) (im = 1, . . . , 2m). Следовательно, определитель Д (Q) и все его миноры будут постоянны на каждом из п\ множеств <С (/i, ¦ . . > К) вида <№ (lu • • • , In) = d (m, h) X . . . X d К Zn), где 1г ф l2 ф . . . ф ln — любая перестановка чисел 1,.. . . . . , n, и А ((?) = 0 только вне этих множеств. Поскольку х [/; Q] определена лишь для тех Q, для которых Д (Q) ф Ф 0, то любая u{Q) отлична от нуля также только для этих Q. Сумма х [/] в силу ее симметрии имеет вид п * [/! = «¦* 2
170 ПРИБЛИЖЕННОЙ ВЫЧИСЛЕНИЯ ТШТЕГРАЛОВ [ГЛ. 4 где xt <=d (m, im) и условие D.3.3) несмещенности может быть записано в виде 2 \ *"{dQ) = \f {x) •*{dx) D>3>6) для любой / из L2 (\i). Далее = /Г2 S [ 1 («О / (»»)и И вследствие симметрии, n - 1) тг1 J / («0 / (»0 a (<?) |i» Предположим, что процедура /?' = (x, С/') доминирует р- Тогда и (С) - и' (<?)] |i» (d(?) > 0 D.3.7) для всех / из L2 (\х). Но и и и' отличны от нуля лишь в областях d7^ (ll9 . . . , ln). Отсюда сразу следует возможность такого выбора /, что неравенство D.3.7) нарушается. Это и доказывает теорему. Следствие. Для случая функций Хаара процедура (х [/], Wo) допустима в $>х для L2 (\i). Таким образом, нами приведены примеры недопустимых (когда в качестве критерия качества выбрана дисперсия при фиксированном числе узлов) и допустимых процедур метода Монте-Карло. Представляет значительный интерес получение условий допустимости процедур, которые были бы легко проверяемыми. Ряд результатов в этом направлении получен в работах Грановского [4] и Грановского и Столярова [1].
§ 4] ФОРМУЛЫ С ОДНИМ СВОБОДНЫМ УЗЛОМ 171 Следует отметить далее еще один аспект рассматриваемого вопроса. Уже отмечалось, что квадратурные формулы со случайными узлами могут использоваться для интегрирования случайных функций. Для этого случая аналогичным образом вводится понятие допустимости. Пусть ? (х, со) — гильбертова случайная функция, ? Е= ЕЕ 6г — пространству гильбертовых функций, определенных на (Q, 35, Я). Обозначим ?г, i = 1, . . . , п, реализации ? (х, со) при х = xt и % = х [?]. Тогда, если (я, С/) — процедура метода Монте-Карло, то McoMQx[?] = /, и в качестве меры качества процедуры р можно выбрать величину DcDqI^]. Таким образом, определение допустимости отличается от сформулированного лишь заменой класса функций F на конкретный класс G гильбертовых случайных функций. Справедлива Лемма 4.2. Для того чтобы процедура р была допустима для б?, необходимо и достаточно, чтобы она была допустима для L2 (\i). Доказательство. Так как L2 (|л) CZ С?? то достаточность леммы очевидна. Ее необходимость вытекает из того, что при каждом фиксированном со ? (х) е L2 (\х). Таким образом, «неулучшаемые» процедуры для широкого класса детерминированных функций оказываются неулучшаемыми и для случайных функций. Данное обстоятельство указывает на близость рассматриваемых нами задач к задачам планирования эксперимента. Для допустимых процедур U дает информацию о расположении «хороших» в смысле неулучшаемости дисперсии узлов квадратурной суммы. В главе 5 эта связь будет прослежена более подробно. § 4. Случайные квадратурные формулы с одним свободным узлом В предыдущем параграфе было показано, что существует бесконечно много функций распределения узлов квадратурной суммы, обеспечивающих ее несмещенность. Кроме того, возможна определенная редукция задачи оценивания интеграла — выделение допустимых процедур. При этом следует еще раз подчеркнуть, что в методе Монте-Карло недопустимость процедуры, в смысле предыдущего параграфа, еще не означает невыгодности ее
172 ПРИБЛИЖЕННОЕ ВЫЧИСЛЕНИЕ ИНТЕГРАЛОВ [ГЛ. 4 использования при вычислениях. Объем вычислительной работы при использовании недопустимой процедуры может оказаться меньшим, чем при использовании допустимой. Правда, если рассматриваемый класс функций достаточно широк, то в этом классе всегда есть функция такая, что объем вычислений, необходимый для получения ее значения, превзойдет объем вычислений, необходимый для построения соответствующей квадратурной формулы. Этим, с одной стороны, и объясняется необходимость изучения допустимых процедур. С другой стороны, как мы увидим в дальнейшем, допустимые процедуры не обязательно во всех случаях сложнее недопустимых. Ниже изучается один из классов допустимых процедур метода Монте-Карло — случайные квадратурные формулы с одним свободным узлом. Эти формулы, как обобщение метода антисимметричной выборки, было предложено рассматривать в работе Ермакова [2]. Систематическое их изучение было осуществлено Грановским [1] — [3]. Общий ход рассуждений, приводящих к квадратурным формулам с одним свободным узлом, применительно к интерполяционно-квадратурным формулам состоит в следующем. Пусть хп [/] — интерполяционно-квадратурная сумма для функции / из L2 (\x): r/1 _ A(f;Q) /4 4 4ч точная для ортонормированных функций {фг}Г из L2(\x). Если следовать общим идеям построения детерминированных квадратурных формул типа Гаусса, то следует добиваться, чтобы квадратурная формула / ж Кп [/] была точна также для функций <pn+i, . . • , Фп+m, входящих в полную ортонормированную систему {ф|}Г- При этом, как уже отмечалось в § 1, узлы х1? . . . , хп должны лежать на гиперповерхности, определяемой равенствами Д (фп+г; (?) = det Iфп+г (хг), ф2 (хг), ..., фп (хг)||? = 0. D.4.2) Таким образом, мы приходим к задаче построения случайной квадратурной формулы, узлы которой распределены на гиперповерхности D.4.2). Эта задача оказывается
§ 4] ФОРМУЛЫ С ОДНИМ СВОБОДНЫМ УЗЛОМ 173 значительно более трудной, чем соответствующая детерминированная задача. Дело в том, что нам требуется выбрать связи между случайными узлами, не только исходя из уравнений D.4.2), но и из условия несмещенности получающейся при этом квадратурной суммы кп [/]. Поэтому случайная квадратура может быть построена только в том случае, если уравнения D.4.2) оставляют свободным по крайней мере один узел. Итак, пусть (Э?, 3(, fi) — измеримое пространство и — 2 Ai(Q)f(xi) — квадратурная сумма (не обяза- г=1 тельно интерполяционная), все узлы которой есть функции одного узла, скажем хг: xt = Г,.! («О, i = 2, . . . , п. D.4.3) Узел Xi при этом пусть выбирается случайно. Будем предполагать также, что преобразования Tt имеют якобианы |Фг-|, т. е. что существует производная Радона — Нико- дима меры v по мере \i, где v (A) = \i (T (А)), А ЕЕ 5f. Таким образом, если узел хг распределен в Ж с плотностью и относительно меры \i, то совместное распределение узлов хг, . . . , хп в пространстве ЭРП) = Ж X... X дс (п раз) является вырожденным: эти узлы распределены на гиперповерхности в ЗЕ(П), определяемой связями Тг (в частности, для интерполяционно-квадратурных формул со случайными узлами это будет гиперповерхность ви- да D.4.2)). Случайные квадратурные формулы, узлы которых связаны соотношениями D.4.3), мы и будем называть случайными квадратурными формулами с одним свободным узлом. Руководствуясь соображениями § 3, мы ограничимся рассмотрением симметричных квадратурных формул, считая при этом, что связи D.4.3), налагаемые на узлы, симметричны (т. е. все узлы хх, . . ., хп равноправны). Такого рода симметрия узлов приводит нас к следующим требованиям, налагаемым на Тг: Г. = 2-t (i = 0, . . ., п - 1), где D.4.4) Т = Тх и Тп = Т° ф Ti (i < n),
174 ПРИБЛИЖЕННОЕ ВЫЧИСЛЕНИЕ ИНТЕГРАЛОВ [ГЛ. 4 т. е. мы будем] предполагать, что преобразования Т{ образуют циклическую группу порядка п, порожденную преобразованием Т. Тогда справедлива следующая Теорема 4.7. Если симметричная случайная квадратурная формула с одним свободным узлом D.4.5) точна для ортонормированных функций ф1?. . ., фдг и свободный узел хг имеет плотность распределения и (хг) по отношению к мере [х, то для того, чтобы сумма хп [/] была несмещенной оценкой интеграла /, необходимо и достаточно, чтобы преобразования Тг пространства Ж удовлетворяли системе уравнений п *i) Ф1 (*i) I °i-i! = ° (mod Ю, ? = 2,..., N. D.4.6) При этом коэффициенты квадратурной суммы определяются равенствами] Лг (Q) = и 1J— » I = 1, . . . , П, D.4.7) S<p?K)i<Vii а м (Xi) имеет вид ^р-2 <р1(хг)\Фг-х\, D.4-8) г5^ g (х) произвольная измеримая неотрицательная функция, удовлетворяющая условию п n^ig(xi)=l (mod[x). D.4.9) Доказательство. Необходимость. Из симметрии суммы хп [/] и связей Т{ имеем Аг (хх) = Аг (хг) = Л2 (Г^ (xj), i = l, . . . ,. п, и 71 \ в (ж,) / (Г*-
§ 4] ФОРМУЛЫ С ОДНИМ СВОБОДНЫМ УЗЛОМ 175 Но (ad)) / (Г" (х$ и (a*) |i (dan) = (Z) / (Z) tf (Г1-* B)) | Ф Следовательно, условие несмещенности для кп [/] выглядит таким образом: = \ Аг (x)f(x) S ц(,Гф"(^)} fx (dx) = для любой / из L2 (ji). Отсюда получим (mod^). D.4.10) Но так как в силу D.4.4) Г1"* = Т™-1, то последнее равенство равносильно следующему: п—1 Ах (х) 2 и (Т™ (х)) I ®гп | = ф1 {ж) (mod \i). D.4.11) Из формулы для якобиана сложного преобразования имеем г \ФЛх)\=Т[\Ф(Т*-1(х))\' k,i = l,...,n-l. D.4.12) Следовательно, Далее \ и(х) \i (dx) =\'и(Г(ас)) \i {dx), i = 0,..., п — 1,
176 ПРИБЛИЖЕННОЕ ВЫЧИСЛЕНИЕ ИНТЕГРАЛОВ [ГЛ. 4 откуда П—1 U (X) [А (dx) = 7Г1 2 U (Tl О»)) I ^i 11* (d«) = i=0 n—l n = U- 2 Следовательно, нужное нам условие нормировки функции и (х) выполнено. Наконец, 2 И) (mod t1)- D-4-14) Из D.4.10) и D.4.14) следует V к (х) | Л = 0,. .., /г —1. Таким образом, 2=1 Из условия точности квадратурной формулы для функций фх (х), . . . , фдг (ас) и ортогональности этих функций к фх (ас) теперь следует справедливость D.4.6), а из условия точности для функции ф! (х) вытекает, что Подставляя это выражение для Ах (xi) в D.4.14), получим п— 1 п 2 и (тт (х,)) | ф„, | = 2 Ф1 («о I ф*-1 I- D-4-i6) т=о г=1 Представим теперь ^ (^^ в виде
§ 4] ФОРМУЛЫ С ОДНИМ СВОБОДНЫМ УЗЛОМ 177 Тогда ^Q^ Фх to) I ф« I- На основании D.4.16) отсюда следует, что функция g (х) должна удовлетворять условию п-1 4 которое равносильно D.4.9). Достаточность. Пусть преобразования Tt1 переводящие ЭЕ в себя, удовлетворяют D.4.4.), квадратурная сумма определяется равенствами D.4.7), а плотность распределения узла хх равенством D.4.8). Тогда из D.4.7) непосредственно следует f = 1 1 — 2 N что равносильно точности квадратурной формулы для функций фх, . . . , флг. Наконец, = \ S Фх («,) I Фи | / (яв.) -^ (#i) Ф1 (^i) я S Теорема доказана. Таким образом, для построения случайной квадратурной формулы с одним свободным узлом, точной для заданных функций {фг}^, необходимо найти такие решения xt = Tt-i (xx), i = 2, . . . , п, системы уравнений D.4.6), которые преобразуют пространство Ж в себя. При этом отметим, что в качестве функции g (x) с указанными в теореме свойствами можно выбрать, в частности, ф«-1
178 ПРИБЛИЖЕННОЕ ВЫЧИСЛЕНИЕ ИНТЕГРАЛОВ [ГЛ. 4 Тогда, согласно D.4.8), соответствующая этому выбору g (x) плотность распределения и (х) имеет независимо от конкретного вида преобразований Tt следующий стандартный вид:] и (х) = фх (х). Ниже на основании теоремы 4.7 приводятся некоторые примеры построения случайных квадратурных формул с одним свободным узлом, точных для заданной системы функций {(pi}. Мера здесь всюду есть мера Лебега, так что требование существования якобианов преобразования Тг равносильно в этом случае требованию кусочной гладкости этих преобразований; таким образом, D.4.6) будет системой нелинейных, вообще говоря, дифференциальных уравнений. Кроме того, мы всюду полагаем, что ф! (х) = const и, соответственно этому, и (х) = = ф? (х) = const. __ 1. Ж = [- 1, + 1], ф1 (х) = 1//2, ф2 (х) = /372*, п = 2. Система D.4.6) здесь сводится к следующему дифференциальному уравнению: __— ~ . D.4.17) dx\ | xi v ' Найдем кусочно-гладкие решения уравнения D.4.17). Три семейства таких решений даются формулами г (^^, ^ei-cO), ^ I / _9. I -2\I/_ -. ^ ГУ \ • * / z2 = ^ У% D-4-20) где с ]> 0 — произвольная константа. Решениями D.4.17) являются, кроме того, различные кусочно-гладкие и кусочно-непрерывные кривые, составленные из отдельных частей кривых этих семейств так, чтобы полученное отображение было взаимнооднозначно.
41 ФОРМУЛЫ С ОДНИМ СВОБОДНЫМ УЗЛОМ 179 Например, 2 I Выбирая с = 1 для D.4.18) и с == 0 для D.4.19) и D.4.20), получим следующие два решения D.4.17): f (l_a?)%, а?е[—1,0), -A- которые определяют взаимно однозначные отображения отрезка [—1, +1] на себя и удовлетворяют условия симметрии D.4.4). Соответствующие квадратурные суммы имеют вид ?}II|/() + |1/(%)] D.4.21) где х\ -{- х\ = 1, жхж2 < 0 и /(-*i). D-4.22) т Квадратурная формула \ f(x)dxxf (xi) + / (— #i), co- —i ответствующая квадратурной сумме D.4.22), идентична формуле D.3.1). Как уже отмечалось в предыдущем параграфе, использование этой формулы и ее обобщений (Хаммерсли и Мортон [1], Мортон [1]) составляет содержание метода антисимметричной выборки (antithetic va- riate). В монографии Хаммерсли и Хэндскомба [1] имеется подробный обзор работ, связанных с этим методом и соответствующая библиография. Формула, соответствующая сумме D.4.21), впервые была получена в работе Грановского [2]. Как уже отмечалось, обе формулы точны для / = 1 и / = х. Сравнивая соответствующие суммы с D.2.20), легко заметить, что они (особенно D.4.22)) существенно более просты для использования, чем D. 2.20). 2. Ж = [—1, +1], фг- (х) (i = 1, 2, 3, 4) — нормированные многочлены Лежандра степени i — 1, п = 4. Так как
180 ПРИБЛИЖЕННОЕ ВЫЧИСЛЕНИЕ ИНТЕГРАЛОВ [ГЛ. 4 Ф2 и ф4 — нечетные функции, то, полагая х1 = — х2 = х и х3 = — #4 = г/, мы удовлетворим первому и третьему уравнению системы D.4.6) при любой зависимости между х и у. Система D.4.6) сведется, таким образом, к одному дифференциальному уравнению dx Одним из его решений является A/2(х } \1/2 (х- /4 -За;2), же [0,1]- D.4.23) Соответствующая квадратурная сумма имеет вид 1 + I/ (У) + / (- У)] [Зх + |/4 — D.4.24) 1/2(ж+/4 — где у определяется согласно D.4.23). Преобразование D.4.23) не удовлетворяет, однако, условиям симметрии D.4.4). Чтобы обеспечить выполнение этих условий, можно определить соответствующее преобразование Т следующим образом: *е[-1/УТ,0), - 1/2 (х - У4-За2), х е [О, 1/1/Т), 1/2 (х — /4 — Зя2), ж е [1/ УТ, 1). Тогда Г2 = — Т° и, следовательно, Г4 = Г°. Но, как нетрудно видеть, симметричная квадратурная сумма, построенная на основе этого преобразования, совпадает с точностью до порядка нумерации узлов, с квадратурной суммой D.4.24). Так что обе квадратурные формулы эквивалентны. Отметим также, что при х = 1 D.4.24) сводится к известной классической квадратурной сумме Симпсона. 3. Ж — область s-мерного евклидова пространства, симметричная относительно начала координат. Если | Ж |— объем области Ж, то случайная квадратурная формула f(x)dx D-4.25)
§ 4] ФОРМУЛЫ С ОДНИМ СВОБОДНЫМ УЗЛОМ Ш где хх распределен равномерно в области ЭЕ0, точна для константы и всех многочленов первой степени относительно s переменных. Она является очевидным 5-мерным аналогом формулы D.3.1) (Мортон [1]). 4. Ж — круг х\ + х\ = 1. Функции (pi, i = 1, 2, 3, 4, таковы: сх, с2#х, с3^2» ?&\%ъ, где Cj — константы нормировки. Будем строить простейшую симметричную случайную квадратурную формулу с одним свободным узлом: 4 \ f (х) dx « i|L2 / (Г" (*)). D.4.26) В работе Грановского [1] показано, что поставленную за дачу решает ортогональное преобразование Г, матрица которого имеет следующий вид (мы обозначим ее той же буквой Т)\ т. е. Т есть вращение на угол 120°. При этом, как нетрудно видеть, /3/2 -1/2 / и, таким образом, | Ф^ | = 1, i = 1, 2. Можно показать, что случайная квадратурная формула, соответствующая этому преобразованию Т, является единственным решением данной задачи в классе формул вида D.4.25). В этой же работе получено обобщение изложенного результата на случай 5-мерного шара. Изучим теперь более подробно случайные квадратурные формулы с одним свободным узлом, точные для Фо (х) = 1. Согласно D.4.7) и D.4.8) такие формулы имеют следующий вид: п—1 i-0
182 ПРИБЛИЖЕННОЕ ВЫЧИСЛЕНИЕ ИНТЕГРАЛОВ [ГЛ. 4 где узел х распределен в 36 с плотностью вероятности D.4.28) относительно меры [х. Преобразование Т при этом удовлетворяет условиям D.4.4), а функция g (х) > 0, х?=Ж,— условию D.4.9). Чтобы построить преобразование Т с нужными нам свойствами, воспользуемся следующей конструкцией. Пусть подмножества dt d 91, i = 1, . . ., п, таковы, что (jx ) = I* B) D.4.29) (*=?=/; t,/ = l,...,rc), и? — такое преобразование множества Ж, которое отображает каждое из множеств &-ъ на одно из множеств d.k (к ф Ф 1\ к, I = 1, 2, . . ., п) в соответствии с некоторой циклической подстановкой '1 2 ...п длины п. Тогда преобразования Т1 (i = 0, . . ., п — 1) образуют циклическую группу ,М порядка п. При этом для якобианов | Ф^ | справедливы формулы D.4.12) и D.4.13). Из этих формул следует, что квадратурная сумма кп 1/J, соответствующая D.4.27), инвариантна относительно преобразования Т: *п Г/; х] = хп [/, Т (х)] (mod \x). D.4.30) Для всякой измеримой функции g величину п—1 г=0 будем называть средним по группе .// значением в точке х функции g. Условие D.4.9), таким образом, может быть переписано в виде >* = 1 (mod |i). D.4.31) Из D.4.30) и D.4.31) следует, что моменты М Ып [/, хи ]]q, q = 1, 2, ... одинаковы для всех плотностей ug вида
§ 4] ФОРМУЛЫ С ОДНИМ СВОБОДНЫМ УЗЛОМ 183 D.4.28). В частности, можно положить Выполнение условия D.4.31) следует при этом непосредственно из D.4.12). При таком выборе функции g имеем и (х) = —т^т- , так что свободный узел х всегда можно считать распределенным равномерно на Ж относительно меры |л. Это и предполагается в дальнейшем. Рассмотрим далее заданные наЭЕ функции ф вида п Ф(ж) = А(жJ|ф|Ь D.4.32) г=1 h — любая функция, для которой <А>^ = const (mod \i). Тогда на основании D.4.12) п—1 ; х] = [г (Ж) <fe>^ = const (mod jx). D.4.33) Равенство D.4.33) означает, что квадратурная формула D.4.27) точна для всех функций ф вида D.4.32) ii3L1 (\i). Легко доказать и обратное утверждение: всякая функция из L1(\i), для которой точна квадратурная формула D.4.27), представима в виде D.4.32). Таким образом, справедлива Теорема 4.8. Симметричная квадратурная формула D.4.27) с одним свободным узлом точна для тех и только тех функций из Lx {[i), которые представимы в виде D.4.32). Теорема 4.8 устанавливает непосредственную связь между заданной циклической группой преобразований Т1 и набором функций, для которых точна квадратурная формула D.4.27). Результат этой теоремы положен в основу доказательства приводимой далее теоремы 4.9. Важным качеством случайных квадратурных формул с одним свободным узлом является допустимость соответ-
184 ПРИБЛИЖЕННОЕ ВЫЧИСЛЕНИЕ ИНТЕГРАЛОВ [ГЛ. 4 ствующих им процедур интегрирования в достаточно широком классе процедур интегрирования. Для упрощения изложения мы будем также употреблять термин «допустимость квадратурной формулы». Имеет место Теорема 4.9. Случайная квадратурная формула D.4.27) с одним свободным узлом допустима в классе всех случайных квадратурных формул для класса функций L% (ц,). Доказательство. Предположим противное. Тогда, согласно определению допустимости, существует процедура (хп [/], и), которая доминирует данную процедуру (кп [/1и> ) на всем классе функций Х2 (|х) и которая, следовательно, точна для всех же функций / из L2 (\i), что и рассматриваемая. а) Покажем сначала, что в таком случае кп [/] ж J должна быть точна для всех тех функций ф вида D.4.32), у которых (mod (А). D.4.34) (Заметим, что такие функции ф принадлежат Lx ([г), но при этом не обязательно принадлежат ?2 (ji).) Рассмотрим следующую последовательность функций {} D.4.35) -N, где ф — любая из функций вида D.4.32). Из D.4.34), D.4.35) следует, что (*) (mod|i), D.4.36) (|х), iV = 1,2,... D.4.37) Отсюда на основании теоремы Лебега заключаем, что \ ф^^ (dx) —- [ ф|х (dx). D.4.38) А поскольку при этом | ф# | ^ N, то ф^^^г (и-)» и по" этому, в соответствии со сделанным нами предложением относительно (нп [/], и), должно выполняться М [хп [ф1У; х7]] = J ф^у (ос) \i (dx) D.4.39)
§ 4] ФОРМУЛЫ С ОДНИМ СВОБОДНЫМ УЗЛОМ 185 и D [хп[<Р*; ж~И < D [хп [Флг; »-]], N = 1, 2,... D.4.40) Далее из D.4.27), D.4.37) и D.4.32) — D.4.34) вытекает, что Кп1Ы<Кп1\<р\] = п\х(Х)<\к\>вМ^С\1(Щ (modn), D.4.41) ^п [флг] ^ хп [ф] (mod \i) D.4.42) и *п [<Ы ^ хп [Ф] (mod U), D.4.43) где ?7 — закон распределения узлов случайной квадратурной суммы кп [/]. Таким образом, на основании D.4.41), D.4.42), используя опять теорему Лебега, получим М [Хп [флг; хи]] -* М А так как квадратурная формула хп I/] я^ / точна для функции ф, то отсюда и из D.4.38) следует, что при N ->¦ оо D [хЛ [флг, «[/]] ~> 0. На основании D.4.40) это дает Dnn [флг, х~\ ->¦ 0 при 7V -> с», откуда в соответствии с D,4.39) вытекает существование такой последовательности функций {фп }, что хЛ [фпд] — — \ фп^|я(dx)-*0 (mod |х) при rcQ -> оо. Это в сочетании с D.4.43), D.4.38) позволяет заключить, что кп (ф) = = [<p\i(dx) (mod jx). Утверждение данного пункта доказано. б) Положим в D.4.32) h (x) = ht (x), где Так как <й*>ле = 1/п и функции ht удовлетворяют условию D.4.34), то, согласно п. а), формула хп [/] ж / должна быть точна для функций ф^ вида D.4.32), соответствующих этим hi. А отсюда следует, что закон распределения О должен быть таким, чтобы в каждое из множеств dt,
186 ПРИБЛИЖЕННОЕ ВЫЧИСЛЕНИЕ ИНТЕГРАЛОВ [ГЛ. 4 i= 1, . . ., п, с вероятностью! попадал один из п случайных уэлов xt, ибо иначе для некоторого «?» с положительной вероятностью будет выполняться Поэтому в силу D.4.32) и D.4.3) из условия точности квадратурной формулы для функций фг получим п—1 Iq (хг, ..., хп) B I ®i \)x=-xq = ^ ($) (mod \i), г=0 откуда вытекает, что квадратурная сумма хп [/] должна иметь следующий вид: *« [/1 = И*) S nJ{Xq) • D.4.45) i—0 где, не умаляя общности, можно считать, что xq e dq = Г*" (dx), 5 = 1, . . ., п. D.4.46) Поэтому, если ф — любая из рассмотренных в п. а) функций, то, согласно D.4.32), должно выполняться п кп[ф] = ц(ж) 2 h(xq) - const = гц1(Ж)'(к)л. D.4.47) Пусть теперь hhq (x) = h(x), 0, где | А (ж) |< с < oo, ж e 3f. Тогда <A>^ = 0 и из D.4.47) и D.4.46) следует, что должно выполняться hhq (Хг) + hhq (xq) = А (хг) - А (Г*-* (ас,)) = 0 (mo для всех ограниченных функций h. А это возможно только в том случае, если xq = Tq~x (xx), g = 2, . . ., п. Отсюда на основании D.4.45) и D.4.31) следует, что кп If] и нл [/]
§ 4] ФОРМУЛЫ С ОДНИМ СВОБОДНЫМ УЗЛОМ 187 должны совпадать. Так как и можно представить в виде где g {х) измеримая функция (g (x) > 0), то из условия несмещенности, как и при доказательстве теоремы 4.7, следует, что g должна удовлетворять условию <g>j* = 1. Теорема доказана. Предположим далее, что h {x) — произвольная функция из L2 (\i). Положим hx (х) = h(x) — </г (х)}^ и й2 (x) = = (h)ji. Тогда h (х) представима в виде h (x) = hx (x) + + Н2(х), щефгУм = 0» afe2 (x) инвариантна относительно преобразования Т: h2(T {x)) = h2 {x) (mod \i). Так как П—1 |Ф0| = 1, то 2|Фг|>1 (mod|i). Поэтому любая функция / (х) из L2 (\i) представима в виде где hx +h2^L2 (\i). Отсюда на основании теоремы 4.8 и инвариантности функции h2 получим Из этого равенства и вытекает непосредственно Т е о р е м а 4.10. Дисперсия квадратурной суммы с одним свободным узлом вида D.4.27) равна произведению меры множества $ на расстояние в метрике L2(\i) функции /г2(х), входящей в представление D.4.32) подынтегральной функции /, до подпространства тех функций из />2 {у), для которых точна соответствующая формула. Действительно, Dxn [/; х] = М (й2 (х) |А (Ж)J - Ц2 (Ж) М2 (h2 (х)) = Кроме того, справедливо равенство (h2, ср) = 0, где ф ^= =7^= const — любая функция из L2 (jx), для которой точна
188 ПРИБЛИЖЕННОЕ ВЫЧИСЛЕНИЕ ИНТЕГРАЛОВ |ГЛ. 4 квадратурная формула. Это равенство следует непосредственно из определения функций h2 и ср. Теорема доказана. Следствие. Если | Фо | = | Фх | = . . . = | Фп-г \ (mod |л), то дисперсия квадратурной суммы с одним свободным узлом равна {\[f (х) - S гдеа{ = \ / (х) ifo (ж) jx (dx), a ^t — ортонормированные функции, для которых точна соответствующая формула. Возвращаясь к квадратурной сумме D.4.22), заключаем, что ее дисперсия есть квадрат расстояния функции / до подпространства всех нечетных интегрируемых с квадратом функций в метрике ?2 ([ — 1» +11). Что касается суммы D.4.21), то описание всех функций, для которых соответствующая квадратурная формула точна, технически более сложно. Укажем, что она точна, например, для функции / (х) = х2 — | х | У~1 — х2, которая является четной. Подводя итог полученным результатам, отметим следующее. В п. 1 данного параграфа установлена зависимость между свойством квадратурной формулы с одним свободным узлом быть точной для некоторого набора функций {фг}1~т и преобразованиями Tt, с помощью которых задается связь между узлами этой формулы. Результаты п. 2 дают возможность установить обратную связь между преобразованием Т и свойством квадратурной формулы быть точной для некоторых функций. Практически как задача определения преобразования Т по заданным функциям фь так и задача фактического построения всех функций, для которых точна квадратурная формула, если задано преобразование Т, являются достаточно сложными. В реальных ситуациях проще всего комбинировать эти подходы — выбирать такое количество уравнений D.4.2), что система имеет достаточно много решений и выбирать одно из них, пользуясь соображениями инвариантности. Возможен случай, когда выбранные нами функции таковы, что точность квадратурной формулы для них можно обеспечить с помощью преобразования Т\ образующего цик-
§ 5] ДРУГИЕ КВАДРАТУРНЫЕ ФОРМУЛЫ 189 лическую группу с показателями m{m<Z п). Тогда п — т якобианов тождественно обращается в нуль. В этом случае число слагаемых в квадратурной сумме следует взять равным т. Представляет также некоторый интерес сопоставление процедуры введения интеграла по абстрактной мере (гл. 1), квадратурных формул, точных для функций Хаара, и квадратурных формул с одним свободным узлом. Во всех случаях в рассмотрении участвуют разбиения исходного множества Ж на непересекающиеся подмножества. Очевидна также связь случайных квадратурных формул с одним свободным узлом с эргодической теорией. Легко указать другие связи и аналоги. Хорошо известна роль, которую играет в математической статистике инвариантность относительно групп преобразований. С другой стороны, свойство инвариантности использовалось для построения классических квадратурных формул (Соболев [1]). Наконец, очевидно, что процедуру интегрирования с помощью случайных квадратурных формул с одним свободным узлом следует рассматривать как прямое обобщение метода антисимметричной выборки. § 5. Другие квадратурные формулы. Последовательные процедуры Точка зрения, которой мы придерживаемся при изучении случайных квадратурных формул, отлична от классической точки зрения в том отношении, что основная цель применения случайной квадратурной формулы состоит в уменьшении дисперсии. Класс функций L2 (ji), где формулы используются, очень широк. Говорить в этом случае об оптимальности некоторой квадратурной формулы, как мы видели, нельзя, и естественной характеристикой формулы является допустимость. Если о подынтегральной функции ничего не известно до начала вычислений, то никаких рекомендаций, кроме рекомендации использовать допустимую процедуру, дать, вообще говоря, нельзя. Среди допустимых процедур при этом следует, очевидно, выбрать ту, которая может быть наиболее просто реализована на ЭВМ. Если же затраты труда на вычисление значения функции очень малы, то можно пренебречь требованием допустимости и оставить лишь требование простоты
190 ПРИБЛИЖЕННОЕ ВЫЧИСЛЕНИЕ ИНТЕГРАЛОВ [ГЛ. 4 реализации, что и приводит нас к обычному методу Монте-Карло. Что же реально означает утверждение «о подынтегральной функции ничего неизвестно»? Оно имеет определенный смысл, если значения функции получены в результате эксперимента. Если же составляется программа вычисления значений функций / (х), то дополнительная информация всегда имеется. Случай, когда имеется информация о гладкости функции / (х), мы не рассматриваем. Этому вопросу посвящена обширная литература, и мы останавливались на нем кратко в § 1. Иного сорта информация, как уже отмечалось, сводится обычно к утверждению, что подынтегральная функция похожа на одну или несколько достаточно простых по своей конструкции функций. Эта информация может быть учтена достаточно хорошо соответствующей интерполяционно-квадратурной формулой. При этом обычно строится формула с небольшим числом узлов, но функции, для которых она должна быть точной, могут быть самыми разнообразными. Эта точка зрения и проводились в предшествующих параграфах. Мы стремились указать множество достаточно простых квадратурных формул, которые могли бы использоваться в классе L2 (ji). Такой подход, как уже отмечалось, естественно связан с задачами планирования эксперимента, Более подробно об этом сказано также в главе 5. Ниже мы остановимся на некоторых подходах к задачам приближенного интегрирования, которые не освещались ранее в этой главе. 1. Квадратурные формулы с частично фиксированными узлами. Пусть / (»)eL2 (\i), фх (х) = const и ср2 (х) ортогональна к фх (х) и нормирована. Квадратурная формула Ж точна дляфх (х) и ф2 (х). Множество {х : ф2 {х) > 0}, очевидно, имеет ненулевую меру. Предположим, что х* е ЕЕ ЭЕ — точка, в которой достигается супремум функции Фг (#)> [л (х : ф2 (х)) =ф2 (х*) = 0 и / (х) определена в
§ 5] ДРУГИЕ КВАДРАТУРНЫЕ ФОРМУЛЫ 191 этой точке. Положим х2 = х*. Легко видеть, что соответствующая D.5.1) квадратурная сумма и2 [/], где х2 = х* и хг распределен с плотностью вероятности и относительно меры (л,, U {Xl) = Ф2( является несмещенной оценкой интеграла /. Действительно, и (xj) > 0 для а^е Ж и \ u(x)\i(dx) = 1. Далее {dx) = Таким образом, мы получили квадратурную формулу, один узел которой фиксирован, а другой выбирается случайно. Ее можно рассматривать как некоторую комбинацию методов существенной выборки и выделения главной части. Главная часть / (х) здесь оценивается выражением / (х*) Ф2 (х). Анализ дисперсии х2 [/], который проводится элементарно, показывает, однако, что для успешного использования построенной формулы необходима определенная гладкость функций/(х) и ф2 (х) в окрестности точек, где достигается супремум Ф2(#)> чтобы интеграл ф1И[/(х)/(х)] Ф2(х)--ф2(х*) У(*»)имел конечное значение. Достаточно просто могут быть построены и интерполяционно-квадратурные суммы с п узлами, когда п—1 узлов фиксировано, а один выбирается случайно. Мы приведем, без подробных доказательств соответствующие результаты, так как они представляют сравнительно частный интерес. Подробное изложение имеется в работе Грановского, Ермакова [2]. Считаем хх случайным узлом, a xt = х\, i = 2, ..., п, фиксированными, и построим интерполяционно-квадратурную сумму хп [/] = AA(/(^} , где Q = (хг, х\, . . ., х*п) для оценки интеграла \ ф! (х) / (х) [X (dx). Коэффициент
192 ПРИБЛИЖЕННОЕ ВЫЧИСЛЕНИЕ ИНТЕГРАЛОВ [ГЛ. 4 A (Q) (Q) = д соответствует значению функции в точке хг. Остальные коэффициенты А*г (Q) = д 0) значениям функции в фиксированных точках. Здесь, как и ранее, Д|1} обозначает алгебраическое дополнение элемента фх (xt) определителя Д. Будем предполагать далее, что ЭЁ есть область 25 s-мерного евклидова пространства и ц-мера Лебега. Теми же методами, что и при изучении случайных квадратурных формул с одним свободным узлом, можно получить вид плотности распределения узла хг. Из условия несмещенности %п If] вытекает, что хх должен иметь плотность распределения м(ЗС1)==^§гф1(Ж1)- D-5'2) Последняя должна быть неотрицательной, что налагает определенные ограничения на расположение фиксированных узлов. Нормировка и (хг) проверяется достаточно просто. Заметим, что Д^ не зависит от хх. Тогда u(x1)dx1 = ^ в предположении ортонормированности функций Аналогично дA) 4 Г ^ А С = \ -5- • -^1у Ф1 (^i) / (a?i) dxx = J ф! (х) f (x) dx. id 1 ^> Наиболее обременительным условием является в данном случае условие неотрицательности функции и, определяемой равенством D.5.2). Поскольку при фиксированных х% знаменатель выражения D.5.2) есть константа, то х\ должны быть расположены так, чтобы не меняло знак в области
§ 5] ДРУГИЕ КВАДРАТУРНЫЕ ФОРМУЛЫ 193 3) выражение q>! (х±) Л («!, х*2, . . ., х*п). D.5.3) Если фх (х) = const и фх (х), i = 2, . . ., га,— алгебраические многочлены, то легко показать, что D.5.3) может сохранять знак в некоторой области 3) лишь в том случае, когда все Х\ лежат на ее границе. Некоторые достаточные условия знакопостоянства D.5.3) получены в работе Грановского и Ермакова [2]. Для отрезка легко привести примеры указанных квадратурных формул, точных для многочленов. Например, формула и{хг) = 3/4A -а?), %е[- 1, + 1], точна для многочленов второй степени. Она была первоначально получена Хаммерсли и Хэндскомбом [1]. Приведем также вид некоторых квадратурных формул указанного типа в случае большего числа измерений, обозначая через т суммарную степень многочленов, для которых формула точна. Все приводимые формулы могут быть видоизменены за счет другого выбора фиксированных узлов на границе области 3) при 5 = 2, т = 1 + (У1 + *0/(-1.-1I. . ч 1 + XI и{хУ) =X Не представляет труда построение аналога формулы D.5.4) в случае большего числа измерений. Число привлекаемых фиксированных точек, однако, при этом равно s и соответственно растет. Так, при s = 3, т = 1 получаем, 7 С. М. Ермаков
194 ПРИБЛИЖЕННОЕ ВЫЧИСЛЕНИЕ ИНТЕГРАЛОВ [ГЛ. k например, + + \ -i —1 -1 - 2(z1-x1)f(- 1,0,0) + (Zl + yi)/(- 1,-1,-1) + + (zi + yi)f(- 1, + 1.-1I, Для 5 = 2, m = 2 формула с пятью фиксированными точками на границе квадрата имеет вид - [2ух A - хх + [2У1 (l-хг- 2У1) + A + xl))f (+ 1, —1) — -8(^ —г/?)/(—1,0) B(si,yi) = 3/8(l-s>). Формулы эти не представляют, однако, большого интереса, за исключением тех случаев, когда подынтегральная функция имеет особенно простой вид на границе (например, равна нулю). Можно также комбинировать приемы наложения связей на узлы и фиксации отдельных узлов. Таким способом можно получить, например, формулу при 5 = 1, т = 5 1 „ 2 1 ¦О , 1/5-1/3*? „,.. , tl ,., , 4/3*?-4/15 —
§ 5] ДРУГИЕ КВАДРАТУРНЫЕ ФОРМУЛЫ 195 2. Другие квадратурные формулы. Квадратурные формулы с т свободными узлами 1 < т < п систематически не изучались, хотя среди них могут быть формулы, представляющие практический интерес. Примером может служить следующая формула с двумя свободными узлами: J D.5.5) где 33 8 — единичный 5-мерный гиперкуб {0 <; ж<*> ^ 1; i = l,..., s}, координаты точек хх, х2 и xs связаны соотношениями Di}J + D'V + Di}J = 1, хх и х2 считаются свободными, и их координаты имеют совместную плотность распределения и (хь х2) = -^- ТТ г 1 =¦ , D.5.6) что равносильно равномерному распределению величин x{i\ x^\ х^ на сфере единичного радиуса. Формула точна для константы и вторых степеней х№. Привлечение симметричных относительно начала координат узлов дает для гиперкуба 338 = {—1 <; х^^ 1, к = 1, . . ., s} формулу с шестью узлами, точную для всех первых и вторых степеней переменных х^, а также для некоторых их попарных произведений. Привлекательно то обстоятельство, что число узлов не увеличивается с ростом s. Дисперсия квадратурной суммы, соответствующей формуле D.5.5), исследовалась в работе Ермакова [2]. Узлы симметризованной квадратурной формулы D.5.5) использовались в качестве псевдослучайных чисел в расчетах прохождения излучения через вещество методом Монте-Карло. Для этой цели выбирались значения s от 50 до 100. 6s координат узлов хранились в памяти машины. История частицы разыгрывалась с помощью чисел, соответствующих координатам одного из узлов. Если s чисел было недостаточно для реализации одной истории, то далее использовались обычные псевдослучайные числа. Средние значения соответствующей величины по шести историям, очевидно, являлись реализацией квадратурной суммы. 7*
196 ПРИБЛИЖЕННОЕ ВЫЧИСЛЕНИЕ ИНТЕГРАЛОВ |ГЛ. 4 Если прослеживать параллельно траектории шести частиц, то предварительное запоминание координат узлов квадратурной формулы не обязательно, их можно получить по мере движения частицы и величина s не играет существенной роли. Расчеты проводились с предварительным запоминанием узлов. Рассчитывалось прохождение 7~квантов через пластинку, когда на одну ее стенку падал плоскопараллельный поток частиц. Отношение дисперсии $1 оценки на одну траекторию вероятности выхода у-кваита через стенку, противоположную той, на которую падал поток частиц при обычном методе Монте-Карло, к дисперсии о\ при использовании формулы D.5.5) приводится в таблице {I означает толщину пластинки в длинах свободного пробега). Значения <з^1<з\ 60 100 1 6,6 6,5 2 6,1 6,0 3 5,0 5,1 4 3,4 4,1 5 2,1 3,2 6 1,8 2,5 Квадратурные формулы, точные для многочленов второй степени при вычислении интеграла по гиперкубу 3)'8> изучались Хабером [1]. Ниже приводятся некоторые его результаты. Справедлива, в частности, следующая Теорема 4.11. Пусть || а^ ;-1| вещественная C s + 1) X п (п > 3 s + 1) матрица такая, что 1. a^j = 1/ ]fs для всех /, 1. * = *'. 3. а?, j + a?+i,j + a?+2,j = З/n для всех j и i = 2,5, . . . . . . , 35 — 1, и через Vi (I = 1, . . ., s) обозначено подпространство, натянутое на CZ — 1)-ю, 31-ю и C/ + 1)-ю строку || at, j ||, а через Qt — сфера радиуса C/пI^ в Vi с центром
§ si Другие Квадратурные формулы 197 в начале координат. Тогда, если Xj = (х^\ . . ., х^р), 7 = 1, . . ., w, — случайные величины такие, что для I = = 1, . . ., 5 (xi\ . . ., ж}?) равномерно распределены в п Qh то суммак [/] = — 2 / (xi) является несмещенной оцен- 0=1 г» кой интеграла \ f(x)dx , а случайная квадратурная фор- с) точна для многочленов суммарной степени s от независимых переменных. Теорему эту нетрудно доказать, если существует матрица at, j с указанными свойствами. Последнюю же можно построить, если существует матрица Адамара порядка п ;> 35 + 1- Матрицы Адамара порядка к построены по крайней мере для к = 4г, г = 1, 2, . . ., 29, что дает возможность использовать на практике сформулированную нами теорему. В цитированной работе Хабера [1] рассматривается также вопрос об асимптотике остатка случайной квадратурной формулы, когда гиперкуб 3I разбивается на М конгруэнтных частей и к каждой из них применяется случайная квадратурная формула (например, точная для многочленов второй степени). Показано, что при этом может быть реализован в классах дифференцируемых функций наилучший возможный порядок убывания остатка. 3. Последовательные процедуры и смещенные оценки. Представляется заманчивым построение процедур интегрирования последовательного типа, в которых сведения о функции, полученные на некотором этапе, использовались бы затем для улучшения качества оценки. Такого рода задачи обсуждались, например, в работах Маршалла [1], Холтона [2], Пуха [1], Балдини-Челио и др. [1]. Идеи построения последовательных процедур метода Монте- Карло для вычисления интеграла близки, в общем, к идее использования полиномов Бернштейна в методе существенной выборки (§ 2 гл. 4).
198 ПРИБЛИЖЕННОЕ ВЫЧИСЛЕНИЕ ИНТЕГРАЛОВ [ГЛ. 4 Так, можно разбить вычисления на последовательные этапы и наряду с оценкой интеграла /0 = ^ / (х) \л (dx) при N помощи суммы с0 = N2 / (Xi) оценивать на первом этапе г=1 коэффициенты Фурье Ij = \f (x) q)j (x) \x (dx), / = 1,.. ., тг. с IV ПОМОЩЬЮ СУММ ^ = Л^ 2 / (^г) Ф^" (^г)^ ГДе Хг НвЗаВИСИМЫ и распределены в соответствии с вероятностной мерой |х, ф^е Z/2([x) ортонормированы, фо = 1. Затем можно считать что линейная комбинация / (х) = 2 *i<Pi О») j=o достаточно хорошо приближает функцию /, и использовать /, при соответствующих предположениях, в методе существенной выборки или в методе выделения главной части на втором этапе, где величины //, / = 0, . . ., п, оцениваются более точно и, кроме того, оцениваются величины /п+1, . . ., /n+m, т > 0, и т. д. Читатель без труда может построить различные модификации последовательных процедур такого рода после знакомства с материалом главы 5. В связи с этими процедурами, возникает ряд теоретических вопросов, которые почти не исследовались. Поскольку их использование существенно усложняет программы расчета и нет четких рекомендаций по их конструированию, то и расчеты проводились в весьма небольшом числе случаев. Теория вопроса наиболее полно освещена в работе Холтона [2], где был получен, в частности, следующий результат. Пусть Д, /2, ... —последовательность несмещенных оценок величины /0. Назовем эти оценки первичными и составим вторичные оценки F±, F2, . . . по правилу Fm = a<mfm + A ~ 0>т) f m-U <*1 = 1, W = 1, 2, . . . , так, что
§ 5] ДРУГИЕ КВАДРАТУРНЫЕ ФОРМУЛЫ 199 где т = <Ц П (l-ar)(i<m), 0<б|т)<1. Справедлива Теорема 4.12. Если max ^m) ->- 0 и существует г оо 8 ]> 0 такое, что сходится ряд 2 #й~е> w D fu ^ c(/H1+2e>), где с — константа, то Fm сходится с вероятностью 1 к 10 при т ->- оо. К числу последовательных процедур, рассматривавшихся в литературе (Пух [1]), относится также следующая. Пусть /0 = I f (x) \i (dx) и v (х, у) — семейство вероятностных мер, зависящих от параметра у, причем у — = (Уи - • • » Уп)*У €=33 — некоторой области ^-мерного евклидова пространства и при любом у из 3) мера ^ абсолютно непрерывна относительно меры v. Тогда величина /0 может быть при любом у = Уо оценена суммой (§ 2 гл. 4) N где v0 = v(x, y0), а х\ независимы при различных i и распределены в соответствии с мерой v0. Дисперсия оценки /о(Уо) есть D/оЫ = N-*\[r (х) (¦%-)*ъ (dx) - /1 D.5.7) и требуется выбрать у0 так, чтобы минимизировать выражение D.5.7), что равносильно требованию минимизации величины я)? (у) = \./2(зс) (-гЦ^)) v(^)« Подбор величины у можно попытаться осуществить градиентным методом. При этом определяют последовательность у0, у1У ... и соответствующую им последовательность мер v0, v1? ... следующим образом: Ун+г = Уи + -р
200 ПРИБЛИЖЕННОЕ ВЫЧИСЛЕНИЕ ИНТЕГРАЛОВ [ГЛ. 4 гДв vk+i — оценка градиента vH+1 величины if, т. е. векто- ра с компонентами ( — -~- ,..., ~— ) , a h — выбранная константа (длина шага). При этом следует иметь в виду, что ) = IF И (i^-)' v«« <**) = и оценка градиента i|) может быть проведена по выборочным значениями, распределенным в соответствии с мерой vfe. В работе Пуха [1] имеется численный пример использования описанного приема в одной из задач массового обслуживания. В главе 5 рассматривается вопрос об оценке производных математического ожидания случайной функции по ее выборочным значениям в отдельных точках. Описанные там алгоритмы принципиально позволяют осуществлять последовательный подбор параметров, минимизирующих дисперсию. Успех, однако, существенно зависит от удачного выбора семейства распределений и, во многих случаях, от удачного выбора начальных значений, ибо поведение дисперсии в зависимости от параметра может быть довольно сложным. В заключение этой главы заметим, что нами изуча лись лишь несмещенные оценки интегралов, хотя асимптотическая несмещенность может быть достаточной для получения результата. Асимптотически несмещенные оценки используются систематически при вычислении методом Монте-Карло характеристик стационарных распределений в системах массового обслуживания, при оценке собственных чисел линейных операторов и решении ряда других задач. Вопрос этот затронут далее в § 2 главы 7. Здесь мы отметим лишь, что асимптотическая несмещенность может возникнуть при построении вторичных (в терминологии Холтона) оценок по первичным несмещенным. Для использования оценок такого рода полезно использовать асимптотическую теорию выборочного метода для
§ 51 ДРУГИЕ КВАДРАТУРНЫЕ ФОРМУЛЫ 201 больших выборок. В частности, может быть полезна следующая теорема об асимптотическом распределении функции от выборочных средних значений (Уилкс [1], стр. 271). Теорема 4.13. Пусть х?\ . . ., z®, i = 1, ... . . . , п, — выборочные значения случайного вектора, математическое ожидание которого а = (а1У .. . , as) конечно, а ковариационная матрица ||cr^fef положительно определена. Пусть также g (хг, . . ., xs) — функция, имеющая первые производные -^- = gj, / ¦= 1, . . ., s, во всех точках некоторой окрестности точки а и g^ --= gi(a). Тогда, если по крайней мере одна из величин g^ не равна нулю, то g (^i> • • м %s) имеет для больших п асимптотически нормальное распределение со средним g (а) и дисперсией — Ss^gfgf- (ЧерезХх обозначено среднее —^ х?\ 1 = -1,.. .,5.) Теорема позволяет, очевидно, строить доверительные интервалы для функций от математических ожиданий. Величину смещения можно оценить, разлагая функцию g в ряд Тейлора. Обычно оно убывает как с/п и им можно пренебречь при большом п. Константа с может быть тем не менее большой, и необходимы дополнительные исследования в каждом конкретном случае. Заметим, что теорема 4.13 уже использовалась нами в главе 3. В работе Пауэлла и Свэтша [1] также рассматривалось отношение выборочных средних для оценки интеграла, причем проводилась оценка смещения.
ГЛАВА 5 ПРИБЛИЖЕНИЕ СРЕДНИХ ЗНАЧЕНИЙ СЛУЧАЙНЫХ ФУНКЦИЙ § 1. Постановка задачи. Результаты относительно приближений в метрике непрерывных функций Очень часто задача, которую нужно решить методом Монте-Карло, поставлена так, что результатом ее решения должна быть функция. Очевидно, значительный прикладной интерес может представить изучение зависимости некоторой вероятностной модели от параметра (или группы параметров), а также определение значения параметра, при котором некоторое среднее достигает экстремального значения. Во многих задачах бывает важным проведение «сравнительных экспериментов», т. е. решение вопроса, при каком из двух выбранных значений параметра получается лучший по отношению к некоторому критерию результат. Перечисленные задачи объединяются общими подходами к их решению, развитыми в вычислительной математике и математической статистике. К числу этих задач нужно добавить также задачи определения корня уравнения / (х) = а, где а — число и / (х) может быть определена в каждой точке области своего определения со случайной погрешностью, а также некоторые другие задачи и их обобщения. Своеобразие этих задач состоит в том, что при их решении играет роль как статистическая погрешность, так и детерминированная. Кроме того, при решении этих задач бывает необходима дополнительная априорная информация, без учета которой соответствующая задача может оказаться некорректно поставленной. Достаточно ясно, что о поведении функции можно составить представление по ее значениям в отдельных точках или по коэффициентам ее разложения в ряд Фурье. Однако, как
§ 1] ПРОСТРАНСТВО НЕПРЕРЫВНЫХ ФУНКЦИЙ 203 известно, конечным набором функционалов охарактеризовать с достаточной степенью точности функцию можно лишь при условии справедливости априорного предположения о принадлежности ее некоторому классу. Если же этот конечный набор функционалов определен со случайной погрешностью, то возникают дополнительные проблемы, требующие подхода с позиций математической статистики. С нашей точки зрения, удобно подразделять задачи (или методы решения задач) этой главы на три категории. Первая — это задачи, где статистическая погрешность играет незначительную роль. Это классические задачи вычислительной математики — задачи интерполирования, наилучшего приближения функций или решения уравнений. Мы не будем далее ими заниматься. Вторая категория — это задачи, где статистическая погрешность играет значительную роль, но используются методы математической статистики без какого-либо учета специфики метода Монте-Карло (например, возможности специального выбора распределений моделируемых случайных величин). Хотя методы решения таких задач описаны в руководствах по математической статистике, мы уделим им определенное внимание (в основном их алгоритмическому аспекту). Кроме того, имеются примеры нетривиального использования общих результатов при решении конкретных задач методом Монте-Карло, и эти примеры представляют для нас значительный интерес. Третья категория задач (методов) — это задачи, где статистическая погрешность играет значительную роль и существенно используются методы, связанные с моделированием случайных величин. Примером задач второй категории являются задачи классического регрессионного анализа, когда априори известно, что функция / (х) является линейной комбинацией линейно независимых функций ф^ (хO i = 1, . . ., п: г=1 и требуется определить набор параметров с;, когда значения/ (х) вычисляются при фиксированном х с помощью метода Монте-Карло. Если при каждом сделается несколько десятков испытаний, то при обычных достаточно
204 ПРИБЛИЖЕНИЕ ФУНКЦИЙ LrJL 5 слабых предположениях относительно распределения случайной ошибки результирующая ошибка среднего арифметического будет иметь распределение, близкое к нормальному, и аппарат регрессионного анализа можно использовать во всей его полноте. Примером методов, которые мы отнесли к третьей категории, является метод, который получил название «метода зависимых испытаний». Строгое обоснование и развитие он получил в работе Фролова и Ченцова [1], где было показано, что он связан с аппроксимацией функциональной зависимости в метрике непрерывных функций. Хотя, строго говоря, зависимые испытания являются содержанием ряда других методов (квадратурные формулы со случайными узлами имеют зависимые узлы), мы сохраним название «метод зависимых испытаний» за излагаемым ниже приемом, ибо это название прочно вошло в литературу. Пусть ? (х, со) — функция случайного аргумента со и параметра х. Обозначим через / (х) = Мш? (х, со) = == J ?(#, со) P(dco). Для получения графика f(x) на некотором промежутке [а, Ъ] изменения х можно выбрать ряд значений xt переменной х а^д:1<...<^т^Ьи при этих значениях х оценить методом Монте-Карло интеграл I ? {хи со) Р (dco), i = 1, . . ., т. Из-за статистического разброса значения интеграла при различных xt не лягут, вообще говоря, на гладкую кривую, даже если / (х) — гладкая функция. Можно использовать различные методы сглаживания, чтобы получить гладкую кривую, в том числе методы регрессионного анализа или другие методы, которые мы отнесли ко второй категории: Наиболее простой прием, однако, состоит в том, чтобы использовать при оценивании интеграла \ ? {хи со) Р (dco) для различных xt одну и ту же последовательность наблюдений со;-. В этом случае график ЛГ12 ? (^» Щ) будет близок по форме к гра- фику Мо> ? (#, со) даже при наличии сравнительно большого статистического разброса, и представление о поведении функции / (х) можно получить при небольшом числе испытаний. Эти наводящие соображения могут быть строго обоснованы.
§ f] ПРОСТРАНСТВО НЕПРЕРЫВНЫХ ФУНКЦИЙ 205 Обозначим через е (х, со) разность 8 (х, со) = ? (я, со) — — / (х) и будем говорить, что ? (#, со) ЕЕ 1\, если выполняются условия дк& (х, со) дх* и <G,(co) E.1.1) 'fc<°°» P<2- Имеет место Теорема 5.1. Если функция ? (#, со) принадлежит i П Ffc, w. е. каждому ГА, А: = 1, ...,/, то случайная вектор-функция сходится к некоторой случайной непрерывной гауссовской вектор-функции. Следствие 5.1. -ЕЪш для ? выполнены все условия E.1.1) при к = 0,1, . . ., /, то уклонение эмпирической средней N и ее первых I — 1 производных от истинной средней и ее производных имеет по вероятности порядок l/|/"iV. Доказательство теор е^м ы. Так как N то из E.1.2) следует, что БфгР^ Сн < оо. По формуле конечных приращений получаем q4fe) (^") — ф(г!° (ж') = = (p(fe+D @) (ж* — л;'), где 0 лежит между х' и х" и М | Ф^ {х") - ф^} (^) |р < | хп - х' |р СЛ+1. Отсюда следует, что для (fn\k = 0, . . ., Z — 1) выполнен равномерно по & критерий непрерывности траекторий Колмогорова (гл. 1, § 2) и, согласно Прохорову [1], непрерыв-
206 ПРИБЛИЖЕНИЕ ФУНКЦИЙ [ГЛ. 5 ная случайная вектор-функция флг(я) слабо сходится к предельной случайной непрерывной гауссовской вектор- функции фд (х) со средним тождественно равным нулю и корреляционной функцией Bhh (*',*') = = М {[pi> (*', со) - fS) (*')] [?<*> (х", со) - /<*) (ж1')]}, что и доказывает теорему. Максимум модуля вектор-функции траектории является непрерывным функционалом на траекториях процесса и, следовательно, также сходится к некоторому предельному распределению. В силу непрерывности траекторий предельного процесса они ограничены по вероятности. Отсюда следует, что уклонения эмпирических средних от теоретических, умноженные на "[Л/У, ограничены по вероятности и, следовательно, сами уклонения убывают по вероятности как 1/Y~N. Последнее рассуждение доказывает следствие теоремы 5.1. Доказанная теорема дает, таким образом, возможность приближать неизвестный график в непрерывной метрике (гарантируется убывание по вероятности порядка 1/Y~N для максимума модуля уклонения). С приближением в метрике L2 (\i) мы встретимся ниже. Если вычисляется интеграл ^ f(x, у) dy, где 33У — об- ласть 5-мерного евклидова пространства (не зависящая от х) и / (х, у) гладко зависит от х, то алгоритм не требует пояснений. Нужно использовать при вычислении значений / (х, у) при различных х одни и те же случайные числа. Теорема 5.1 дает также возможность получать существенный выигрыш в работе при вычислении производных функции / (х). Пусть требуется вычислить производную /' (х) в точке х0. При точном задании функции / можно было бы, выбрав достаточно малое h и производя вычисления с необходимой точностью, получить значение /' (х0) по приближенной формуле Предположим, что мы решили использовать эту же формулу, оценивая / (х0 + h) и / (xQ — h) методом Монте-Карло
§ 1] ПРОСТРАНСТВО НЕПРЕРЫВНЫХ ФУНКЦИЙ 207 П0 двум сериям независимых реализаций величины со. N / (аг0 + h)« TV 2 I («о + h, щ), E-1.4) Тогда ошибка в вычислении /' (xQ) будет складываться из систематической ошибки формулы E.1.3) и ошибки, возникающей при оценке значений функции при помощи формул E.1.4). При достаточно малом h можно оценить указанную ошибку величиной Щ E.1.5) где у определяется уровнем доверия оценки, а Если h убывает при возрастании N медленнее, чем JV'2, то выражение E.1.5) стремится к нулю. Можно найти оптимальное значение h, которое доставляет минимум выражению E.1.5): а сам минимум равен 2 [9у2 | /'" (хо)\ D0]V. BN)~ll; т. е. ошибка убывает как N~1'8. При использовании метода зависимых испытаний шаг h можно брать сколь угодно малым (при соответствующей точности вычислений). Систематическая составляющая ошибки отсутствует, а доверительная ошибка равна VD^W-1'*, где N — число испытаний в серии, а Аналогичные выкладки могут быть проделаны для^ более сложных способов аппроксимации производной и для производных более высокого порядка. При аппроксимации первой производной более сложными формулами и использовании обычного метода Монте-Карло можно добиться,
208 ПРИБЛИЖЕНИЕ ФУНКЦИЙ [ГЛ. 5 вообще говоря, более высокого, чем N~xl\ порядка убывания погрешности, однако количество вычислительной работы при этом существенно возрастает и требуется большая гладкость функций. § 2. Приближение неизвестной плотности в метрике L2 (jw) Задачи,^изучаемые далее, и методы их решения типичны для непараметрических методов математической статистики и должны быть отнесены, согласно нашей классификации, ко второй категории. Тем более интересно отметить, что одни из первых работ по непараметрическому оцениванию неизвестной плотности в метрике L2 (\i) были вызваны нуждами метода Монте-Карло (Ченцов [31, Фролов, Ченцов [2]). В настоящее время имеется много работ, посвященных этому вопросу, однако для нужд метода Монте-Карло использовались в основном результаты Фролова и Ченцова [21 (см., например, Сизова [1]). Мы изложим поэтому подробно лишь упомянутые результаты и очень кратко остановимся на других подходах к непараметрическому оцениванию плотности. Читателя, интересующегося проблематикой в целом, мы отсылаем к монографии Ченцова [4] и списку дополнительной литературы. Пусть ? — случайная величина и [i (dx) — мера в пространстве ее значений. Обозначимр (х) = --.— плотность распределения | относительно меры \л и {фг}Г — систему ортонормированных с весом г (х) (г (х) ^> 0) функций. Предполагаем, что р (х) принадлежит пространству L2 (г, \х) функций, интегрируемых с квадратом с весом г (х) относительно меры [х. Располагая реализациями случайной величины Е-, мы можем оценить коэффициенты Фурье (р, фг) функции р по системе {(р*}". Действительно, легко видеть, что (р, ф^) = М [ф^ (ё) г (|I и, как обычно, N 3=1 где ? — независимые реализации |. Располагая оценками
§ 2] МЕТРИКА А, 0*) 209 я?лг коэффициентов Фурье функции р (ас), можно построить многочлен кт(х) = 2 о1,^(х) VFffi, E.2.1) г=1 который служит оценкой отрезка ряда Фурье функции р (х). Некоторые оценки приближения функции р (х) с помощью многочлена содержит Теорема 5.2. Пусть задана последовательность весов гт (х) и ортоноржированных с весом гт (х) систем {q>i,m}iLi таких, что \\Р(*) turm) = S Р* (х)гт (х) \i (dx) < Н < ос. E.2.2) Тогда: А. Если j р (х) - пт (х) р < Сг п-\ E.2.3) E.2.4) по при т т п&, р = 1/A + у) р{цр(х) - п;(х) 1 > (С1+2С«у/'я-'М1-ю} < б, . е. R(b) = (—^-t—~J 2 'П'1'^1'^ является доверительной т оценкой нормы разности || /? (х) — я!ц (х) ||, соответствующей уровню доверия 1— б, 0^6<^1. Б. .Бсди ^1^"Т < II Р (X) - ПШ (X) || 2, E.2.5) ), E.2.6) E.2.7) п, как бы ни подбиралось , всякая доверительная оц R (б) то, начиная с некоторого п, как бы ни подбиралось т при всех достаточно малых б, всякая доверительная оценка
210 ПРИЁЛИЖЕНИЕ ФУНКЦИЙ [ГЛ. 5/ где В — некоторая комбинация констант Вг и Б2, т. е. Р {\\Р (*) - Ят (х) | > Вп-Ш-Щ > б. E.2.8) При этом условии E.2.7) можно ослабить, заменив Съ на Csm^\ Доказательство. Разность р (х) — Пт (х) можно интегрировать по мерам [i (dx) и Р (do) в любом порядке, так как она измерима по этим мерам. Эта разность состоит из двух компонент: компоненты, обусловленной несовпадением р (х) с пт (х), и тем, что а*т уклоняются случайным образом от aiiTn = (р, ф*,т). Имеем || р (X) - Пш (X) f - J [р (X) - Лт (X)]2 Гт (X) |i (dx) - - J \Р (X) - Пт (X)]2 Гт (X) \l (dx) + т (X) \l (dx) = - ят (х) f + 2 D т - aif wJ, г=1 так как р (х) — пт (х) ортогональна к каждому ф^,т. || р (х) — пт (х) || по условию теоремы имеет порядок w~Y. Обозначим М (Ф?,т (I) г2т (?)) - 2 (Фьт, ^т i=l Из условия теоремы следует, что первое слагаемое в фигурных скобках — величина порядка т. Из E.2.2) следует т 2 (Фг,т*гтJ<С^' Поэтому условия E.2.4) и E.2.6) можно г=1 переписать в виде = М 2 («г!,m ~ «г,т? < С^т/2, E.2.9) 2В2т/2 < М S Km - aj,mJ < Сът12 при m E.2.10)
2J МЕТРИКА ?2 (НО 211 Докажем первую часть теоремы: Полагая т равным увеличенной на единицу целой части д3> Р = i+T » получаем М || р (ас) - я; (х) | < (d + 2С2) л-1+э. Отсюда по неравенству Чебышева Р {|р (х) - пт (х) || > (Сх + 2С*I/2 в-м-й) < б. Для доказательства второй части оценим сначала Мт]4. После преобразований находим Мл4 < rt!n^ [С8 + 4С2 /3 + 6С*] + 3 (го/и)* С? т. е. m М 2 Km-^^Kr.n-a,^)^^^/^J, E.2.11) где С4 = Далее воспользуемся неравенством Р {г]2 > 0Mrf } > [Mrf]2 [Mr]4] A - Э)9- •). E.2.12) *) Это неравенство является следствием неравенства для моментов { \ | х \dG (х)? < \ x4G (x). Действительно, пусть | — случайная величина и0>О фиксировано. Тогда, полагая ( 0, если G (х) = ' получаем Неравенство E.1.18) является следствием этого последнего неравенства и неравенств х) < J ЛР {| ^ | > *} О OMJFJ
212 ПРИБЛИЖЕНИЕ ФУНКЦИЙ [ГЛ. 5 Согласно этому неравенству с вероятностью, отличной от нуля, гJ имеет тот же порядок, что и Мт]2. Полагая 9 = 1/2, Г 1 ) 1 4В2 из E.2.10) и E.2.12) получаемР\rf > -^- Mr]2j >-|- . -?. . В2 Следовательно, с вероятностью, большей чем 1, С* \\р(х) - ят(хЦ* = \р(х) - nm{x)f + тJ > Г ^i IP причем знак равенства достигается лишь при m = T -g~ra Поэтому при б < 5г/С4 имеем т. е. является доверительной оценкой, соответствующей уровню 1 -б. Следствие5.2. Уклонение гистограммы случайной величины \ (a <^\*^b) от графика плотности при числе ступеней т ~ п1^ в лучшем случае имеет по вероятности порядок гг~1/з. Доказательство. Будем считать шаг гистограммы постоянным h = —^-2- . В этом случае г (х) = 1, fi (dx) = dr, 1 0, где d (i) = ta + iA, a + (i + 1)Л], i = 0, 1, . . ., m — 1. Условия теорем E.2.3), E.2.6) и E.2.7) выполнены.
2] МЕТРИКА it (ix) 213 Действительно, m "T-jrS 2 [фг, b 1 При x ее d(i) л (x) = — \ p(x)dx. Предполагая ничейной, получаем b Отсюда р = 1/3. По теореме 5.2 случайное уклонение || р (х) — я* (х) \\ по порядку величины не менее п/з. Эта оценка достигается при т ~ ftVs и только хуже в других случаях. Последний результат имеет многомерный аналог, который мы сформулируем без доказательства. Следствие 5.3. Уклонение гистограммы векторной случайной величины ? = {?®К' а$ <; Qj) ^ bj от графика плотности при постоянных шагах по каждой координате в лучшем случае при числе ступеней т ~ ns^s+2^ имеет по вероятности порядок w~1<B+s>. Следствие 5.4. Пусть задана полная система ортонормированных с весом г (х) функций {ф*}. Если выполнены условия \\р{х)ф|(х)г (х)\i(dx) то при выборе т = те1/2г уклонение многочлена я* (х) от р {х) в норме L2 (г, \х) имеет по вероятности порядок Л-1/2+1/Dг)в
214 ПРИБЛИЖЕНИЕ ФУНКЦИЙ [ГЛ. 5 Доказательство. Согласно равенству Парсе- валя откуда у = 2г — 1, Сг = А B г — 1) и С2 = С по условию. Применяя теорему 5.2, получаем искомое. Теорема 5.2 и ее следствия позволяют представлять результаты расчетов методом Монте-Карло в виде приближенных аналитических зависимостей. При этом существенна простота вычислительных алгоритмов. Применение описанных методов требует некоторых априорных сведений о гладкости приближаемых функций. Иногда исходную задачу оказывается выгодным преобразовать даже к более сложному виду, но таким образом, чтобы интересующие нас зависимости оказывались гладкими функциями параметра. Является очевидным, что для нужд метода Монте- Карло могут быть использованы и другие результаты, относящиеся к описанной выше проблематике, о наличии которых упоминалось в начале этого параграфа. Так, например, при приближении неизвестной плотности р (х) ЕЕ L2 (— со, оо) можно использовать подход, развитый Розенблаттом [1] и Парзеном [1] (см. также Надарая [1] — [3]), где агрегат, приближающий плотность, выбирается в виде N Рм (a, *n) = ^ff- 2 К (xN (x - g,)), E.2.13) причем I;* независимые реализации случайной величины |, имеющей р (х) своей плотностью распределения, К (х) — функция, удовлетворяющая некоторым условиям регулярности, a {xn} — последовательность положительных чисел такая, что Tjv -> + оо при N -*¦ оо и xN = о (N). Изучались различные меры расхождения между р (х) и Pn (x, xn), но наиболее часто используется метрика Z/2 (— оо, оо), т. е. М \ \p(x)-pN{x,xN)\*dx. E.2.14) —ОО Простейшим примером выбора К (х) является рассматри-
§ з] планйрованиё1,эксперим:ёнта 215 вавшийся в цитированной выше работе Розенблатта. Полагалось, что 1/2 приИ<1, 0 при \х\>1. При этом возможно определить Tjv, оптимальное в смысле E.2.14). Оно оказывается функционалом от неизвестной р (х). Подобная ситуация уже встречалась нам при изучении метода существенной выборки и, очевидно, может быть использована в алгоритмах метода Монте-Карло, когда имеется априорная информация относительно р (х). Имеются работы (например, Дмитриев, Тарасенко [1]), где на базе аппроксимации неизвестной плотности выражением вида E.2.13) строятся оценки производных от нее и различных функционалов, в которые эти производные входят. Подобные методы приводят, однако, к большей погрешности, чем метод зависимых испытаний, описанный в § 1. Заметим в заключение, что непараметрические методы, в том числе и методы, рассмотренные нами, с небольшими изменениями (или совсем без изменения) могут применяться для оценивания кривой или поверхности регрессии (например, Конаков [1], Надарая [1]). § 3. Планирование эксперимента. Связь со случайными квадратурными формулами Применение методов планирования эксперимента оказывается естественным при решении различных задач методом Монте-Карло. Следует еще раз подчеркнуть, что в подавляющем большинстве случаев метод Монте-Карло можно трактовать как имитацию некоторого реального эксперимента, и методы обработки экспериментальных данных и планирования эксперимента имеют по этой причине непосредственное отношение к методу Монте-Карло. Как мы уже отмечали, факторный анализ и дисперсионный анализ могут оказать большую пользу при изучении статистических моделей реальных явлений. Имеется, конечно, и определенное своеобразие, присущее методу Монте-Карло. Реальный эксперимент, как правило, связан с большим числом ограничений, налагаемых природой. При использовании метода Монте-Карло эти ограни-
21b ПРИБЛИЖЕНИЕ ФУНКЦИЙ tWL_5 чения менее ощутимы, хотя может иметь место и обратное. Так, в задачах переноса излучения природа доставляет гораздо большую статистику, чем метод Монте-Карло. Число частиц, реально участвующих в эксперименте, существенно больше, чем число «историй» частиц, прослеживаемых при моделировании. Тем не менее возможность активного изменения модели и в этом случае дает методу Монте-Карло определенные преимущества (подробнее об этом см. гл. 6). 1. Планирование регрессионных экспериментов оказывается возможным при наличии априор'ной информации относительно функции регрессии. Наиболее развитая часть теории относится к случаю, когда априори известно, что функция регрессии / (х) имеет вид п /(*) = 2 ciVi(x). E.3.1) г=1 Основные задачи для этого случая были поставлены Боксом и Кифером, а также их сотрудниками и учениками. Им и их школам принадлежит также и большинство результатов. Изложение и развитие (в особенности в области численных методов планирования) этих результатов можно найти в монографии Федорова [1]. Рассмотрим далее подробно одну из простейших задач планирования регрессионного эксперимента, когда имеет место параметрическое задание функции регрессии E.3.1). Пусть в некоторой области 3) изменения переменной х, значение которой может быть задано достаточно точно, в результате эксперимента получают реализации функции ? (х) = / (х) + е (х), где г(х) — случайная погрешность. Предположим, что полученные при каждом х из данного числа N экспериментов значения е (х) — независимые в совокупности случайные величины, не зависящие от х, е (х) = 8, и распределенные нормально с параметрами (О, о2). Выбирая некоторые значениях!,. . ., Xn (xj G 25, / = 1, . . ., АО, получаем значения ? (Xj) = / (Xj) + 8j. Если известно, что в области 3) функция / точно (или с пре- небрежимой погрешностью) представляется в виде E.3.1), то задача сводится к задаче оценивания параметров ct{i = = 1, . . ., /г). Очевидно также, что фг(х) можно, не умаляя общности, считать ортонормированными.
§ 3] ПЛАНИРОВАНИЕ ЭКСПЕРИМЕНТА 217 Пусть N ^> п. Применим для оценивания ct метод наименьших квадратов, который при сделанных предположениях является оптимальным (во многих смыслах), т. е. оценку ct найдем из условия N 2 r&-S^Pi(^)l2 = mm. E.3.2) J Обозначим с, с, S — векторы с компонентами с{ сг, и t,t (i = 1, . . ., п) соответственно и Ф — прямоугольную матрицу Ф = || ф1 (Xj), . . ., Фп (xj) IJLi. Тогда из E.3.2) следует с = (ФГФ)-1ФГ S. При сделанных предположениях относительно ее — распределенная нормально векторная величина со средним с и ковариационной матрицей В = о2(ФтФ)~1 (Линник [1], стр. 145). Таким образом, распределение погрешности вектора с зависит от выбора точек Xj, и можно поставить задачу об их оптимальном выборе. Матрицу N называют информационной матрицей. Она связана с матрицей В очевидным соотношением В — No2А'1. Отметим, что рассматривающаяся далее плотность распределения узлов случайного интерполирования по методу наименьших квадратов с точностью до константы совпадает с определителем информационной матрицы. Максимальному значению этого определителя соответствует, очевидно, минимальное значение определителя ковариационной матрицы. Последний носит название обобщенной дисперсии и равен объему эллипсоида рассеяния оценок параметров. Наиболее часто используемые критерии оптимальности выбора точек Xj состоит в следующем: 1. Выбрать Xj так, чтобы обобщенная дисперсия оценок была минимальной. Набор точек Xj (не обязательно различных), удовлетворяющих этому требованию, называют D-оптимальным планом. 2. Планы, минимизирующие длину максимальной оси эллипсоида рассеяния (максимальное собственное число ковариационной матрицы) и сумму длин осей эллипсоида
218 ПРИБЛИЖЕНИЕ ФУНКЦИЙ [ГЛ. 5 (след ковариационной матрицы), носят название ^Е-опти- мальных и А -оптимальных соответственно. 3. Пусть / = 2 ^Фг (х)- х г=1 D/ (X) = 2 °^Ф* (Х) + 2 2 COV (cv Cj) ф| (х) ф,' (X) - где фг = (фх (х), . . ., фл (ас)). Если 2) — область, где производится эксперимент, (Xj е 25) и 5 (х1? . . ., х^) ^ = supD/(x), то план, минимизирующий 5 (хх, . . ., Xn), называют С-оптимальньтм. Перечисленные критерии оптимальности планов можно считать наиболее распространенными и наиболее исследованными в математической статистике, хотя большинство ситуаций, возникающих при проведении конкретного эксперимента, требует формулировки своего индивидуального критерия оптимальности. В связи с D-оптимальными планами Кифером [1] было введено понятие непрерывного плана. Как мы уже отмечали, при использовании метода наименьших квадратов в качестве аппарата приближения и N ^> п некоторые из точек Xj могут совпадать, что соответствует повторным наблюдениям в одной и той же точке. Будем рассматривать только различные точки х^ из множества точек Xj и соотнесем каждой из них число повторных наблюдений mk или долю наблюдений mJN = рк. Таким образом, мы можем каждой точке х из 3) сопоставить некоторое (может быть, равное нулю) значение р (х) и получим непрерывный план, представляющий некоторую вероятностную меру на множестве 25. Обсудим теперь вопрос о применении /^-оптимальных планов в методе Монте-Карло. Пусть значения ? (х) могут быть получены в результате решения некоторой задачи методом Монте-Карло, и известно, что п = 2 Ci<Pi<*)- E-3-3) »=х
§ 3] ПЛАНИРОВАНИЕ ЭКСПЕРИМЕНТА 219 Будем предполагать, что при каждом х t,(x) оценивается по независимым сериям испытаний. Если таких испытаний произведено достаточно много, то погрешность 8 (х) — = ? (х) —• / (х) распределена нормально и 8 (х) и 8 (xf) независимы при х Ф х'. Величину De(x) можно считать независящей от х, если при вычислениях соответствующим образом выбирать число испытаний при каждом х. Задача сводится, таким образом, к сформулированной выше задаче и оправдано применениеD-оптимального плана. Пусть х ЕЕ [—1, +1] и <Pi(x) = Рг_г(х) — нормированные многочлены Лежандра степени i — 1, i = 1, . . ., п. Задача построения /^-оптимального плана при N Ф кп (к > О, целое) полностью не решена (наиболее общие результаты в этом отношении получены в работе Шалаевского [1]). Мы обсудим исследованный полностью случай N = кп. При использовании метода Монте-Карло это предположение не является обременительным. В этом случае имеет место следующий результат, ^-оптимальный план сосредоточен в п точках, число повторений эксперимента в каждой точке одинаково и равно к. Точки хг, х.2, . . ., Хпч в которых сосредоточен D-оптималь- ный план, расположены следующим образом: хг = —1, хп — +1, а остальные являются корнями производной полинома Лежандра степени п — 1. Имеется также ряд результатов, относящихся к случаю, когда / представима п в виде f(x) = 2 г (х) iVi (ж), где г (х) > 0 и Р^г (х) — г=1 полиномы, ортогональные с весом г2 (х). Их, как и результаты при г (х) = 1, можно получить в предположении N = = кп из электростатической интерпретации нулей ортогональных многочленов. (См., например, Сеге [1], стр. 148.) l2()(^1 1U 1] >* ()()(^, U , ?,>. />-оптимальный план сосредоточен в точках, являющихся корнями многочлена Якоби Р{пй с параметрами q и t. 2. г2 (х) = е~х, х €= [0, оо), план сосредоточен в точках, являющихся корнями многочлена xL{n (x), где Ln} (x) — полиномом Лагерра с параметром q степени п. 3. г2 (х) = х<*+1е-х, х е [0, оо), q > — 1, ?-оптималь- ный план сосредоточен в нулях полинома Lnli (x)- 4. г2 (#) = е~х\ ig(~oo, + оо), D-оптимальный план сосредоточен в нулях полинома Эрмита Нп+г сте-
Й20 ПРИЁЛИЖЕНИЕ ФУНКЦИЙ [ГЛ. 5 пени п + 1. Для случая тригонометрической регрессии требование /^-оптимальности приводит к равноотстоящим на [0, 2 л] точкам интерполирования. Многомерный случай, как обычно, существенно более сложен, хотя отдельные результаты, относящиеся к частному виду функции /, можно найти в литературе. Разработаны также численные процедуры построения /^-оптимальных планов (Федоров [1], Уинн [1]). В связи с трудностью задачи в многомерном случае часто делаются дополнительные предположения относительно расположения точек плана. Распространенным требованием является требование инвариантности плана относительно некоторых преобразований переменных, например поворота осей координат (ротатабельность) (см. § 4 гл. 4). Предполагается при этом, что область 3) обладает некоторой центральной симметрией и начало координат помещено в центре области. Эти дополнительные предположения упрощают вид ковариационной матрицы и, следовательно, задачу максимизации ее определителя. Остановимся далее подробнее на случае, когда / (х) есть линейная комбинация многочленов Лежандра n-j-i n-j-i / (*) = 2 'Л-i (*) = S **м- E-3-4) i=i i=i Если производится оценивание коэффициентов d^ и TV = w, то | A | есть квадрат определителя Вандермонда. Легко п показать, что|-4| = Д Pn(xj), где Рп — полином, имею- ;=1 щий корнями хх, . . ., хп, со старшим коэффициентом, равным единице. Величина max | A \ для произвольного значения п = 2, 3, ... вычислена (Шур [1]). Она равна Мп= max \A = v 9П_„; , E.3.5) М2 = 4. Значения ^ (г = 1, . . ., гс), соответствующие D-оптималь- ному плану, для некоторых значений п приводятся ниже: П = 1 Я1,2 = ±1» ^=2 ^,8=±1, ^2 = 0,
31 ПЛАНИРОВАНИЕ ЭКСПЕРИМЕНТА 221 п = 4 ^,, = ±1, жа, 4 = ± /3/7, х3 = О, и = 5 «i,. = ±l, *2,з,4,5 = ±/1/3A ±2/1/7), «,,,,5,, = ±/1/35A5 ±2/15), Простейший пример позволяет убедиться в пользе /^-оптимальных планов, если имеются сведения о виде функции / (х). Пусть, например, известно, что / (х) = ах + Ъ и область проведения эксперимента 3) =¦ [— 1, +1]. Положим N = 10 и проведем в первом случае по пять измерений ? в точках —1 и +1 в соответствии с рекомендациями /^-оптимальности, а во втором случае по одному измерению в равноотстоящих точках ±1/9, ±3/9, ±5/9, ±7/9, ±1. Легко видеть, что в обоих случаях cov (а, Ъ) = = 0, но в первом случае Da = Dfc = a2/10, а во втором D# = -щ- б2 ж 0,245а2 и Dfe = a2/10. При использовании метода Монте-Карло во втором случае, таким образом, понадобилось бы увеличить число испытаний в 1,7 раза, чтобы добиться погрешности функции ах+Ъ на [—1, +1], соответствующей D-оптимальному плану. Легко привести примеры еще менее разумного расположения точек, особенно в многомерном случае. Мы остановились на наиболее известных результатах из области планирования регрессионных экспериментов, чтобы пояснить на простых примерах их пользу. При решении же практических задач следует иметь в виду всю совокупность методов планирования эксперимента. Так, важную роль может играть планирование эксперимента при нелинейной параметризации, т. е. в случае, когда о функции регрессии известно, что она точно или с достаточной степенью точности имеет вид /(#) = g(n, cv . . .,cn), E.3.6) где зависимость g по крайней мере от одного из параметров с1% . . ., сп не является линейной. Если относительно погрешности е (х) выполняются предположения, сделанные в начале этого параграфа, и для оценивания парамет-
Ill ПРИЁЛИЖЁНИЁ ФУНКЦИЙ tl\JI, 5 ров используется метод наименьших квадратов, то оказывается, что информационная матрица зависит от искомых значений параметров. В этом случае для построения плана можно использовать два основных подхода. Первый — последовательный (например, Федоров [1]) — состоит в том, что эксперимент начинают с некоторым начальным планом, оценивают параметры, подставляют эти оценки вместо искомых параметров в информационную матрицу, определяют новый план эксперимента и повторяют эту процедуру снова, пока погрешность в определении параметров не станет достаточно малой. Второй подход использует априорную информацию относительно значений или распределения параметров (Ермаков, Ме- лас [1]). Имея информацию относительно значений параметров в виде (сг, . . ., cn) G S, где 85 — некоторая область в и-мерном пространстве параметров, мы можем ставить задачу об определении узлов плана из условия максимизации величины sup ФТФ или некоторого среднего функции от ФТФ по априорному распределению. Разумеется, априорная информация может уточняться в процессе эксперимента, и тогда оба эти подхода оказываются близкими. Важную роль при исследовании статистических моделей могут играть планы, предназначенные для проведения дискриминирующих экспериментов, а также планы, сокращающие число экспериментов при проверке статистических гипотез, латинские, греческие квадраты и блок схемы более общего вида (о них хорошо написано у Дюге [1]). Аппарат блок-схем, как известно, связан с дисперсионным анализом, важность которого нами неоднократно отмечалась. Примеры его использования при имитации сложных систем можно найти у Фишмана [1]. 2. Непараметрический подход к задачам планирования регрессионных экспериментов. Интерполяционные формулы со случайными узлами. В предшествовавшем параграфе коэффициенты Фурье неизвестной плотности оценивались по результатам наблюдений и эксперимент не планировался. Если коэффициенты Фурье оценивать с помощью случайных квадратурных формул, рассматривавшихся в главе 4, выбирая их узлы случайно в соответствии с некоторой плотностью распределения, то тем самым мы бу-
§ 3] ПЛАНИРОВАНИЕ ЭКСПЕРИМЕНТА 223 дем планировать регрессионный эксперимент. Простая ссылка на главу 4 здесь недостаточна, ибо указанным задачам присуща специфика, состоящая в том, что нужно одновременно оценивать п коэффициентов Фурье функции. Рассмотрим прежде всего интерполяционно-квадратурные формулы, обсуждавшиеся в п° 5 § 2 главы 4, т. е. формулы, для которых квадратурная сумма имеет вид D.2.13) хп[/] = А(/; Q)/A(Q), а распределение Wo (dQ) определяется равенством Wo (dQ) = сД2 (Q)\in (dQ), E.3.7) где с — константа нормировки. Оказывается, что их одновременное использование для вычисления п коэффициентов Фурье функции / вытекает естественным образом из рассмотрения задачи интерполирования, в которой узлы выбираются случайно. Пусть, как и ранее, ?(ж, со) — случайная функция, х ЕЕ Ж, а со — случайная величина, о)?Й, Считаем также, что Мсо^х, со) = / (х), и мы хотим приблизить / (х) линейной комбинацией функций ф^ (i = 1, . . ., п) при условии, что известны реализации функции ? при некоторых значениях параметра х. Существенным предположением, которое будет принято нами и будет отличать задачи этого параграфа от задач предшествующего, является предположение, что мы можем по своему усмотрению распоряжаться выбором значений параметра х, при которых производится вычисление (измерение) ? (х). Относительно ? (х) будет предполагаться дополнительно, что / (х) ЕЕ е L2 (pi) и М (t (х) — / (х)J = а2 (х) < + оо для всех xe=D, относительно ф,,? = 1,2, . . ., п,— что они линейно независимы и принадлежат L2(\x). Обозначим ?7- реализацию функции ? при х = Xj и рассмотрим следующую задачу интерполирования. Определить ах так, чтобы выполнялись равенства (х-) = ^(modjx), / = 1,..., л. Решая эту систему уравнений при условии, что ее определитель A (Q), где Q = (Хг,. . ., хп), отличен от нуля, находим at. Использование формул Крамера приводит нас
224 ПРИБЛИЖЕНИЕ ФУНКЦИЙ [ГЛ. 5 к известной форме записи интерполяционного многочлена А@) О ... фп(ос1) Sn Ф1Ю ... ФПЮ E.3.8) При этом #j оказываются равными (— II E.3.9) Легко видеть, что ах = кп [/] (в обозначениях предыдущей главы), а остальные ах превращаются в хп [/], если заменить фх в их выражении на фг и произвести соответствующую перестановку столбцов. Из формулы E.3.8) следует также, что ф^ можно считать, не умаляя общности, ортонормированными. Образование одинаковых линейных комбинаций столбцов определителей в числителе и знаменателе E.3.8) не меняет величины X [?, Q]. Так как мы можем распоряжаться выбором значений Xj и можем выбирать их, в частности, случайно, то справедлива Теорема 5.3. Если {(pt}i — ортонормированная система функций и случайная величина Q распределена с плотностью вероятности w0 (Q) = — А2 ((?), то полное математическое ожидание X I ?, Q] равно отрезку ряда Фурье функции f no системе {ф^}?: Q] = S (/. Ф|) <Pi И- г==1 (о обозначает совокупность значений (о1ч . . . , соп, которых получены реализации функции ?. Доказательство теоремы следует из предшествовавших рассуждений и теоремы 4.3. Аналогичным образом из теоремы 4.4. следует
? Я] ПЛАНИРОВАНИЕ ЭКСПЕРИМЕНТА 225 Теорема Ь А. Дисперсия случайной величины X\t>,Q] удовлетворяет неравенству ? Q] <S <Pi («) ! ff/(ж) (i $}» E-3.11) причем для регулярных систем {(р*}™ имеет место знак равенства. Случай, когда реализации ? (ас/, со) получены при одном значении (о (случай зависимых испытаний), нами не рассматривается. Можно показать, что дисперсия интерполяционного многочлена в этом случае уменьшается. Таким образом, описанный алгоритм интерполирования равносилен одновременному вычислению п коэффициентов Фурье функции /. Допустим, что мы осуществляем его, получая значения Q с помощью метода Неймана. Пусть Ж есть область 25 в 5-мерном евклидовом пространстве единичного объема и \i — мера Лебега. Тогда алгоритм состоит в следующем: 1. Выбираем^, . . ., <хп равномерно распределенными в области 33 и вычисляем А (ось . . ., ап), разлагая, например, матрицу || ц>г (<xj) fl i на две треугольные. Если окажется, что |Д (аи . . ., an)| > oAf, где а не зависит от #ъ • • •» <*п» &М — максимум модуля определителя А ((?), то набор ах, . . ., ссп можно взять в качестве реализации Q, в противном случае нужно повторить процедуру вычислений с новыми <Xj и а. 2. Когда требуемое Q найдено, то вычисляются ?7- и поскольку разложение матрицы || q>t (о/) ||i на две треугольные получено, то легко решается система п S Vi{v<i)ai = ii (/= 1,...,гс). г=1 При этом фг не обязаны быть ортонормированными. Сред- п нее значение линейной комбинации 2 агФг (^) все равно г=1 будет отрезком ряда Фурье функции / по системе, которая 8 С. М. Ермаков
226 ПРИБЛИЖЕНИЕ ФУНКЦИЙ [ГЛ. 5 может быть получена ортогонализацией и нормировкой функций фг (х). Другая интересная особенность алгоритма заключается в том, что благодаря структуре дисперсии E.3.11) может быть легко проверена гипотеза адекватности. Поясним это утверждение подробнее. Пусть имеется модель, в смысле главы 3, которая зависит от параметра х. Например, пусть это будет модель прохождения излучения через пластинку толщины Н. Считаем, что ось х направлена перпендикулярно пластинке и положение точечного источника вдоль оси х является параметром (играет роль х). Предполагается, что 0 <; х <; Н. Если нас интересует вероятность выхода излучения из пластинки при х = Н и мы оцениваем ее методом Монте-Карло, то результат вычислений при N реализациях и фиксированном положении источника х можно рассматривать как реализацию некоторой случайной функции ?N (x, со). Пусть мы приближаем истинную зависимость / (х) вероятности выхода излучения из пластинки линейной комбинацией п ^j а^рг(х) функций ер;, которые в данном случае считаем i=l ортонормированными. Получив, согласно описанному алгоритму, значениеQ = {хи . . ., хп), вычисляем^ (#*, со), i = 1, . . ., п, и определяем значения параметров at. Процедура может быть проделана многократно (N можно выбрать небольшим) и проведена оценка дисперсий at. Последняя состоит из двух слагаемых: н п и н — N'1^ e*(x)dx. о Очевидно, что если все вычисления проводятся при одних и тех же значениях Q, но с удвоенным, например, числом реализаций при каждом Q (вычисляется ?2лг (х, со)), то второе слагаемое уменьшится в два раза. Это дает возможность разделить слагаемые и определить, насколько точно выбранная линейная комбинация приближает интересующую нас функцию / (х). Во многих физических задачах,
§ 3J ПЛАНИРОВАНИЕ ЭКСПЕРИМЕНТА 22? где может быть априори высказано предположение о характере интересующей нас зависимости, такой прием, являющийся аналогом дисперсионного анализа в непрерывном случае, может оказать большую услугу. Понятие допустимости, введенное в связи с процедурами интегрирования, может быть естественным образом введено и для процедур случайного интерполирования. Здесь, однако, имеется большой произвол, поскольку оценивается векторная величина — совокупность параметров аг, и могут рассматриваться различные критерии качества оценки. Остановимся на одном из них. Зафиксируем, как и ранее, X [?, Q] и будем рассматривать всевозможные функции распределения W (Q) случайной величины Q. Совокупность п = (?[?,, Q], W (Q)) назовем процедурой случайного интерполирования, если ?, Q] =-- 2 («ft, /) % (X) и DX [?,<?]<+ оо. г=1 Функции распределения W(Q), для которых выполняется E.3.10), естественно называть также рандомизован- ным планом эксперимента. Вводимое далее понятие допустимости (Грановский, Ермаков [1]) позволяет упорядочить такие планы в соответствии с определенным критерием качества. Будем говорить, что я = (X [?, Q], W) доминирует я в заданном классе процедур З5 для класса функций J5T (пред- п полагается, что в классе ?Р X [?» Q\ имеет вид 2 ^Фг(^))» любой функции ?ЕЕ Л" и/ = 1, ... . . ., п, причем по крайней мере для одной ? = ?0 ?Е II и хотя бы при одном значении j = /0 имеет место строгое неравенство, я называется допустимой в классе процедур 3й для Н, если в &> нет доминирующей ее для Н процедуры. При таком определении понятия допустимости имеют место теоремы, аналогичные теоремам 4.5 и 4.6 (§ 3 гл. 4). Теорема. Если система {cpj}i регулярна по отношению к мере \i и функции {ф^ (x)*q)j(x)}ij=1 не образуют полной системы в L2 (|л), то процедура (X If, Q], Wo) недопустима для класса Н — гильбертовых случайных функций. 8*
228 ПРИБЛИЖЕНИЕ ФУНКЦИЙ [ГЛ. 5 Теорема. Для системы функций Хаара всякая процедура случайного интерполирования {X [/, Q], W) допустима для Н. Доказательства этих теорем аналогичны доказательствам теорем 4.5 и 4.6 соответственно, и мы не будем их приводить. Остановимся далее на связи случайного интерполирования с методом наименьших квадратов. В дальнейшем нам понадобится известная формула Вине — Коши, которая, как легко видеть, является частным случаем утверждения леммы 4.1. Действительно, пусть {фь}™ и {tyi}i — две системы функций, линейно независимых на носителе меры [л, а [х — мера, сосредоточенная на конечном множестве точек Xi, . . ., Xn и равная pt, i = 1, . . ., N, для каждой из этих точек. Применение леммы 4.1 в этом случае приводит к равенству N nldel 2 А N N - 2 Ри • • • 2 Pin d^ IФ* К) It • det || if, (xiq) I». При этом следует учесть, что при совпадении значений iq (q = 1, . . ., п) соответствующие определители обращаются в нуль, что дает N a^pdetlifcta,)!? или, если учесть, что перестановки одних и тех же столбцов (строк) в определителях, стоящих под знаком суммы, не меняют их произведения, то п и! det 2 — и! 2 А, • • • Pi det II ф,, (Хл ) С det || яЬ/ (х,- ) Ц!1 . ^-J ^ ^г1 г-гп IJ Т/С V гр/ill II т< \ г^, /1|1 E.3.12)
§ 3] ПЛАНИРОВАНИЕ ЭКСПЕРИМЕНТА 229 При pi = 1, i = 1, . . ., TV, формула E.3.12) совпадает с формулой Бине — Коши для определителя произведения двух прямоугольных матриц. Пусть теперь вместо процедуры интерполирования для приближения функции / (х) используется метод наименьших квадратов, т. е. по реализациям функции ? (ас, со) в N точках (реализации считаем для простоты независимыми) ищется приближение функции / (х) с помощью линейной п комбинации 2 агФг (х) (N > п) из условия 1=1 N п 2 Pohj — 2 ааФч (xi)J = min* E.3.13) L J При pj = 1 соответствующие а9, как известно (Линник [1]), определяются формулами aq = (- l)«+i x (*еЧ1 [g, 9^,192, Ф^, . . . , [cp^, Ф^, [ф,+1, Ф^, , . . , [фп, <р.] f ЙОЬЦГф!^.], [ф2, ф.],. . . , [фп,ф|]||Г E.3.14) где[ф,ф] = 2 Ф^О'Ф^г)- Если воспользоваться равенст- г=1 вом E.3.12), то легко получить следующий результат: Величины aq, удовлетворяющие E.3.13), являются средними значениями величин aq (j\, . . ., /п), удовлетворяющих уравнениям п 2 а^ (/и • • • Jn) = фа C%) = Sjfc, A = 1,... } тг, 4=1 по всевозможным наборам /х, . . ., /п. При этом осреднение производится с весом А2 (/х, . . ., //г), где a ••• 2 ji=i j'=i
230 ПРИБЛИЖЕНИЕ ФУНКЦИЙ [ГЛ. 5 Действительно, пусть для простоты q = 1. Тогда (t.i,,,i) и так как —r-r- —-2- = аг (]ъ ..., ;п), то отсюда и следует требуемое. Аналогичный результат справедлив при отличных от единицы pj. Отсюда следует, что теоремы 5.3, 5.4 описывают бесконечномерный аналог метода наименьших квадратов. Возможно также «двойное осреднение» или рандомизация метода наименьших квадратов, когда точки ж1? ... . . ., Хм выбираются случайно. Чтобы рассмотреть этот случай, докажем сначала простую лемму. Лемма 5.1. Справедливо тождество ^ E.3.15) где Q = (хи . . ., xN). Доказательство сформулированной леммы следует из леммы 4.1 предыдущей главы, если вместо det J [cpfe, г|^] Ц1 подставить его выражение E.3.6) и произвести интегрирование. При этом интегралы от каждого из слагаемых полученной суммы равны между собой и их число равно С]}. Это и дает нужную константу в E.3.9). Из леммы 5.1 сразу следует Теорема 5.5. Если aq определяются из условия E.3.13), где {фй}Г — ортоноржированные функции, хи . . . ..., Xjv распределены с плотностью вероятности 77. п X X det [| [фл, фг] ||^ дго отношению к мере \iN (dQ) и ?г — независимые реализации функции ?, то A. M«,Qaq = (/, cpq), q = 1,..., п, E.3.16) Б. Dw, Qaq < \\f (x) - 2 (/, Фг) <Pi (авI И (dx) + $ о2 (ас) ц (dx), E.3.17) где о2 (ж) _= \ 1г (х, ю) Р (da>) - f (x). В. cov (aq, аТ) = 0, g^r.
§ 3] ПЛАНИРОВАНИЕ ЭКСПЕРИМЕНТА 231 Доказательство утверждений А и В вполне аналогично доказательствам теорем 4.3 и 4.4, только вместо леммы 4.1 следует сослаться на лемму 5.1. Остановимся на утверждении Б. Знак <^ имеет место в неравенстве независимо от того, является ли система {(pk}i регулярной или нет. Последнее обстоятельство связано с отмечавшимся уже фактом нерегулярности любого набора функций относительно дискретной меры. Формально E.3.15) также легко доказать. Пусть q = 1; тогда т "•>' ч w detj] ГФХ, Ф^ [ф^Ф^С X {«!.<?<** 2 'хп xi ) A (aj^ , а? ) Применяя к числителю неравенство Буняковского (для сумм) и производя сокращения, получаем - (А ФхJ = (/, /) - 2 (А ФгJ + I & (х) |i (<te), E.3.18) г=1 что равносильно E.3.17). Для других значений q могут быть проведены аналогичные выкладки. Заметим также, что условие ортонормированности {ф^}^может быть ослаблено в том же смысле, что и в теоремах 4.3 и 4.4. Таким образом, имеется тесная связь метода наименьших квадратов со случайным интерполированием. Эта связь будет важна для нас в дальнейшем, хотя следует сразу оговорить, что непосредственное практическое использование результатов теоремы 5.5 не приводит к оптимальным в каком-либо смысле процедурам. Резюмируя приведенные результаты относительно случайного интерполирования, заметим следующее. Случайное интерполирование является
232 ПРИБЛИЖЕНИЕ ФУНКЦИЙ [ГЛ. 5 методом приближения функций в среднем в отличие от метода зависимых испытаний. Доказанные теоремы содержат информацию о положении узлов интерполирования, разумный выбор которых, особенно в многомерном случае, представляет очень трудную задачу. Эта задача решена классическими методами в очень ограниченном числе случаев. Практически при моделировании методом Монте-Карло чаще всего интересуются именно некоторыми зависимостями. При этом во многих случаях может быть высказана разумная гипотеза о характере этой зависимости. Тогда аппарат случайного интерполирования позволяет оценить параметры и при некоторой дополнительной затрате труда проверить гипотезу. Алгоритмы, связанные с использованием плотности w0, сводятся к процедуре решения систем линейных алгебраических уравнений одновременно с вычислением их определителя, т. е. к достаточно простой, при разумном числе параметров, процедуре. Разумеется, w0 является недостаточно «хорошей» плотностью и требуется дальнейшее изучение плотностей, удовлетворяющих условию несмещенности. Коротко остановимся на других результатах, связанных со случайным интерполированием. Вопросы, аналогичные рассмотренным выше, применительно к нелинейной параметризации обсуждались в работе Ермакова [3]. Попытка использовать для одновременной оценки многих коэффициентов Фурье случайные квадратурные формулы с одним свободным узлом была предпринята Ермаковым и Седуновым [1]. Оказывается, что нельзя подобрать, в отличие от рассмотренного случая, общей плотности распределения узлов для случайных квадратурных сумм, оценивающих различные коэффициенты Фурье. Наконец, следует отметить, что не очень точный термин «случайное интерполирование» может иметь иной смысл, чем тот, который вкладывался в пего нами. Иными словами, существует иной подход, связанный с применением метода Монте-Карло для вычисления значения интерполяционного многочлена в некоторой точке. Случай линейного интерполирования рассматривался Хаммерсли [1]. Более общий случай интерполирования с помощью алгебраических многочленов изучался Тсудой [2] и Тсудой и Ишидой [1]. Существо дела здесь состоит в том, что при
§ 4] ЗАДАЧИ ЛИНЕЙНОГО ПРОГРАММИРОВАНИЯ 233 использовании повторною интерполирования в 6-мерном гиперкубе значение интерполяционного многочлена в точке при больших s может быть представлено суммой очень большого числа слагаемых (ms, если т — число узлов интерполирования, одинаковое по каждой из переменных). Если узлы интерполирования расположены в корнях многочлена Чебышева, наименее уклоняющегося от нуля, то эти слагаемые вычисляются достаточно просто и можно предложить разумную процедуру случайного выбора слагаемых для оценивания упомянутой суммы. § 4. Сведение к задачам линейного программирования Дальнейшее является формализацией задачи планирования регрессионного эксперимента в ее непараметрической постановке. Материал этот выделен в отдельный параграф, хотя он является прямым продолжением исследований, связанных со случайным интерполированием. Это обусловлено тем, что задача оптимального выбора плотности распределения узлов случайной квадратурной формулы оказывается естественным образом связанной с рассматриваемой задачей, и можно сделать определенные выводы о природе оптимизационных задач, возникающих в методе Монте-Кардо. Как и ранее, будем обозначать Q = (хи . . ., хт) (т > ]> п) и считать Q случайной величиной, распределение которой есть W (Q). Когда это существенно, будет употребляться также обозначение^^, указывающее, о каком распределении идет речь. Полагаем далее для простоты М = = MqwMw. Пусть теперь / (х) и MX lx, ?, Qw\ принадлежат линейному нормированному пространству функций F и на носителе меры \i задана некоторая функция h (ас, Qw)- Считаем далее, что либо ас фиксировано, либо h (ас, Q) = h (Q) не зависит от ас. Задача, которой мы будем заниматься в дальнейшем, заключается в следующем. Выбрать некоторое распределение U (описать все V) из некоторого множества U распределений, для которого (которых): А. |/(х)-МЯ[ж, ?,<?u]|f = = тП/И - MS?[ас, S, Qv]\\f E.4.1)
234 ПРИЁЛИШЕЙИЕ ФУЙКЦЙЙ itjl. 5 при любой / е F. Б. Mq-A(«, <?„) = inf NdifcQu), E.4.2) где U — множество функций из U, для которых выполняется E.4.2). Может оказаться, разумеется, что U пусто. Существует, однако, ряд случаев, для которых сформулированная задача оказывается содержательной. Пусть, как п и ранее, X lx, ?, Q] — линейная комбинация 2 а1Фг (#)» где фг — линейно независимые на носителе дс0 меры \i функции. Считаем, что где ^ — независимые реализации случайной функции ? п при х ~ xqnlq (х) = 2 а19)фг (^)и удовлетворяются усло- ВИЯ Я lx, <pt (ж), <?] = ф, (х), * = 1, 2, . . ., л. E.4.4) Рассмотренные нами ранее конкретные функции 5? [х, ?, Q] имеют, очевидно, вид E.4.3), и для них выполнены условия E.4.4). Сделаем некоторые дополнительные предположения. Будем предполагать, что ЗЕ0 — носитель меры \i есть компакт / (х0) G С$о—пространству непрерывных на Жо функций, фу- (х) ?Е Ся0, / = 1, . . . га, и, следовательно, ф7- ЕЕ L2 (jx). Положим в E.4.1) F = L2 (\l). Так как M«S? [ас, ?, (?] = = X [ж, /, 0, то П II Поэтому E.4.1) будет выполнено для всех U, для которых MQt7ag = (/, фв) для всех / &Сэе0 и ? = 1, . . ., га, E.4.5)
§ 4] ЗАДАЧИ ЛИНЕЙНОГО ПРОГРАММИРОВАНИЯ 235 и задача сводится к нахождению и0, для которой п 2 Ф; (х) { $ аящ (dQ) - \ / (х) Ф;- (х) |i (dx)} = О E.4.6) И $ Л (х, Quo) uo(dQ) = inf $ Л (х, Qu) U (dQ). E.4.7) Пусть т = п и ад определяются по формулам E.3.3) (случай интерполирования). Тогда естественным является требование абсолютной непрерывности и0 по отношению к Wo* Для точной формулировки задачи линейного программирования и двойственной к ней введем следующие функциональные пространства. 1. Пространство W мер ограниченной вариации абсолютно непрерывных по отношению к Wo. 2. Пространство С%0 вектор-функций / = (/ (хх) . . . • • • / fan)) c нормой max! / (xi) I. 3. Пространство FWqфункций g (Q) таких, что A2 (Q) g(Q) непрерывны на Жо с нормой max | A2 (Q)g (Q) |. 4. Пространство V векторных мер v = (vx Cd), . . . . . ., vn (xn)) ограниченной вариации, сопряженное к С^. Очевидно, что Fw0 сопряжено к W. Обозначим А операцию, сопоставляющую / из С%0 функцию X [х, /, Q] е ^ jPV0 и предположим, что h (x, Q)EE Fw0» Тогда задача E.4.4) — E.4.5) есть задача об определении и, доставляющей inf функционалу Jfe (x, Qu) и (dQ) = (h, и) при условии (Af,u) = (f, lAu) = (/,1?0)>где v0 — фиксированный элемент F, а гА — двойственная (сопряженная) к А операция. Двойственной к этой задаче является задача об определении функции я = (я (асх), . . ., л; (хп)) ^С$о, доставляющей супремум функционалу 2 <Pj (х) ] л (х) ф,- (х) и> (dx) E.4 8)
236 ПРИБЛИЖЕНИЕ ФУНКЦИЙ [ГЛ. 5 при условии п X [х, я, Q] = 2 Ф; (х) 0} (/, <?)< h(х, (?) (mod Wo). E.4.9) Таким образом, двойственной к задаче E.4.6) — E.4.7) является задача о нахождении функции л, отрезок ряда Фурье которой максимален, при условии, что ее интерполяционный многочлен ограничен при почти любом mod Wo расположении узлов интерполирования. Как прямая, так и двойственная задачи имеют допустимые (в смысле линейного программирования) решения, т. е. решения, удовлетворяющие E.4.6) и E.4.9) соответственно. Действительно, теорема 4.3 утверждает, что Wo является допустимым решением прямой задачи. Из теоремы 4.5 следует, что допустимое решение можно указать в любой достаточно малой окрестности Wo. Для двойственной задачи допустимое решение легко непосредственно построить. Таким решением будет линейная комбинация функций ер7- (х), / = 1, . • ., п. Очевидно, при соответствующем выборе констант этой комбинации E.4.9) выполняется, так как h (х, Q) ограничена снизу почти всюду mod Wo. Докажем существование решений сформулированных задач. Доказательство может быть проведено на основе различных соображений. Мы воспользуемся теоремой 7 работы Фан Цзы [1] при несколько измененных обозначениях. Теорема. Пусть Е, F — два локально выпуклых топологических векторных пространства и А: Е —» F — непрерывное преобразование такое, что А (Е) замкнуто в F. Пусть К — замкнутый выпуклый конус в JF, T)i ?Е F и v0 6E J^*. Предположим, что существует 10 <Е Е и uQ ?z F* такие, что Л^о - По е т - Int Я, E.4.10) moGT- Int2?°, 1ЛЩ — г;0 = 0. E.4.11) Тогда максимум (г;0, ^), когда ^ изменяется при условии -1? —т]ое Я, E.4.12) и минимум (и, т]0), когда и изменяется при условии и е #°, %Ли — vo= 0, E.4.13) оба существуют и равны. (Здесь К° обозначает поляру К.) В нашем случае полагаем Е=С^, F = FWo- В силу непрерывности на ЗВ0 функций фу (х) линейная операция А ограпичена и, следовательно, непрерывна. Замкнутость А (Е)в Fw^ очевидна. Замкну-
§ 4] ЗАДАЧИ ЛИНЕЙНОГО ПРОГРАММИРОВАНИЯ 237 тый выпуклый конус Kb FWo определяется неравенством г]0 — т] ^ ^ 0, где т]0 = h (ж, Р) и E.4.12) следует из E.4.9). Обозначения для v0 и т]0, введенные ранее, соответствуют обозначениям теоремы. Легко также проверить, что функции и, образующие множество допустимых решений прямой задачи (которое не пусто), принадлежат поляре К, если выполнено E.4.9). Отсюда следует Теорема 5.6. Если фу (as), / = 1, ..., /г, непрерывны на ЗВо и h (а?, Р) е Fw как функция Р(Ре ЭЁ0)> то существует и G Fw0> для которой вы полнено E.4.7) при условии E.4.6). При этом существует я (Р) 6Е С^°> доставляющая супремум функциона^гу E.4.8) при условиях E.4.9) и h (х, Р) п (dP) = ^ Ф; (ж) 5 " ^) ^j <х) Х ^х)' E.4.14) Функцию й, существование которой доказано, будем называть h-оптимаъъной. Случай приближения функции / с помощью метода наименьших квадратов, очевидно, ничем не отличается от рассмотренного и имеет место аналогичный результат. Существование допустимого решения прямой задачи при этом гарантируется теоремой 5.5. Если ? — гильбертова случайная функция, то объектом минимизации естественно избрать величину = М[? (ж)-МЖ (х, I <?U)]+M [X (х, ?, Qu) -MS? (x, ^ W]2- В силу условия несмещенности E.4.5) первое слагаемое не зависит от выбора и, и задача сводится к минимизации величины DX (х, ?, Qu) - М [Ж (ж, ?, Qu) - М55 (ж, С, Qu)]2- E.4.15) Если задать некоторую ? = ?0> то можно положить ^ (зс» W = ^ (х, Со. 9«) — МЯ? (ас, С, #„). А-оптимальная функция и существует согласно теореме 5.6. Если она единственна, то процедура интерполирования (X, п) будет допустимой в смысле определений предыдущего параграфа. Это очевидно, ибо у любой доминирующей ее процедуры и обязано быть ^-оптимальной функцией, а, по предположению, ^-оптимальная функция единственна. Если существует много А-оптимальных м, то они образут выпуклое
238 ПРИБЛИЖЕНИЕ ФУНКЦИЙ [ГЛ. 5 множество, и можно выбрать среди них некоторое множество /^-оптимальных. Их существование доказывается буквальным воспроизведением доказательства теоремы 5.6. Этот процесс может быть продолжен, и если он окончится выбором единственной функции распределения, то мы придем тем самым к допустимой процедуре. Остановимся теперь на задаче вычисления интеграла. Постановка задачи линейного программирования в этом случае мало чем отличается от сформулированной выше задачи. Пусть — интерполяционно-квадратурная формула, точная для п Г и А (?»(?) = 2 ^г ((?) ?%- Задача выбора ^-оптимальной il функции распределения формулируется следующим образом. Найти такую цо> что lh(Q)uo(dQ) = mi\h(Q) и(dQ). E.4.16) При условии несмещенности 0. E.4.17) г=1 VV; И двойственная к ней задача — найти функцию доставляющую супремум функционалу [n(x)<h(x)P(dx) E.4.18) при условии 2 * я (хг) <; А (<?). E.4.19) г=1 Предполагаются выполненными все предположения, сделанные в связи с задачей интерполирования. Существование решения сформулированных прямой и двойственной задач доказывается вполне аналогично теореме 5.6. Для этих решений имеет место равенство? аналогичное
§ 4] ЗАДАЧИ ЛИНЕЙНОГО ПРОГРАММИРОВАНИЯ 239 E.4.14): h (Q) u0 (dQ) = )л{х) ф1 (х) (x (dx). Как обычно, вместо фх можно рассматривать любую из ср;- (/ = 2, . . ., п). Не представляет труда также рассмотрение более широкого класса квадратурных формул, чем класс интерполяционно-квадратурных. В этом случае требуется, однако, определить некую меру, играющую роль меры Wo в рассмотренном случае. Соображения о связи fe-оптимальных функций распределения с допустимыми процедурами интегрирования аналогичны высказанным выше в связи с интерполированием. Очевидно, результаты § 4 главы 4 могут трактоваться в этом смысле, если в качестве h выбирать Dx [/] для некоторых фиксированных функций /. h (Q) можно связывать с классом функций. Пусть, например, х ЕЕ [0, 1], фх (х) = 1 и / (х) имеет непрерывную производную на [0, 1]. Тогда (см. § 1 гл. 4) остаток квадратурной формулы R [/] допускает точную оценку в классе дифференцируемых функций м\\\-1-У^-Ъх -t О г И МОЖНО ПОЛОЖИТЬ dt dt. Соответствующая и0 (Q) будет оптимальной функцией распределения узлов для класса дифференцируемых функций. Отличие от классического случая состоит в том, что задача определения щ является линейной задачей. Впрочем, по мнению автора, излагаемая теория имеет большую перспективу в связи с задачами приближения случайных функций и планирования эксперимента. Обсудим далее вопросы приближенного решения сформулированных задач линейного программирования. Задачи такого рода и методы их приближенного решения обсуждались в литературе и в этом направлении имеется ряд результатов (Вершик, Теммельт [1]). Мы не будем, однако,
240 ПРИБЛИЖЕНИЕ ФУНКЦИИ [ГЛ. 5 приводить какие-либо теоремы и оценки, а ограничимся общим обсуждением вопроса. 1. Если [х — дискретная мера, сосредоточенная в конечном числе точек, то задачи E.4.6) — E.4.7), E.4.8) — E.4.9) и E.4.16) — E.4.17), E.4.18) - E.4.19) оказываются конечномерными задачами линейного программирования, методы решения которых достаточно хорошо разработаны. Имеются универсальные программы, позволяющие решать эти задачи при очень большом числе переменных. Случай дискретной меры может рассматриваться как приближение к непрерывному случаю. 2. Другой метод заключается в следующем. Как и при доказательстве теоремы 4.5, выбираются некие «добавки» к функции распределения Wo так, чтобы выполнялось условие несмещенности, но уменьшалось среднее значение выбранного критерия h (x, Q). Более подробно задача формулируется так. Выбирается некий набор ограниченных mod \i функций vx(Q), ... • • •» vm{Q)-> симметричных относительно переменных Xi, x2, . . ., хп и рассматривается функция Требуется выбрать константы bt так, чтобы: a) W (Q) была плотностью распределения, относительно меры |хп, т. е. г=1 и г=1 б) $ ft (я, Q)W(Q)\in{dQ) = mm. При фиксированных vt (Q) сформулированная задача представляет собой задачу полубескоиечпого программи* рования. 3. Наконец, можно учитывать приближенно условия несмещенности. Например, можно считать, что / принадлежит конечномерному пространству линейных комбинаций
§ 5] СТОХАСТИЧЕСКАЯ АППРОКСИМАЦИЙ 241 функций гр7- (х), / = 1,..., /тг. Предположим, что \pj (х) ортонормированы, и рассмотрим X (х, /, Q). Так как значения / входят в X линейно, то X (х, /, Q) как функция Q также принадлежит конечномерному пространству с базисом X (х, %, Q) = Xj (<?), / = 1, . . ., т. Легко показать при этом, используя лемму 4.1, что Xj (Q) попарно ортогональны с весом Wo (Q). Условия несмещенности выглядят в этом случае следующим образом: п j (Q) W (dQ) = 2 Фг (х) (ф,, ^), } = 1,..., т, E.4.20) г=1 и может существовать дискретная мера W, для которой равенства E.4.20) имеют место. Задача определения точек, в которых сосредоточена дискретная мера, доставляющая минимум функционалу ] h (x, Q)W (dQ), оказывается, очевидно, задачей об определении точки экстремума нелинейной, вообще говоря, функции при ограничениях E.4.20) и неотрицательности меры W. В частности, если условия E.4.20) вообще отсутствуют, то мы приходим к задаче о минимуме функционала \h (x, Q) W (dQ) при единственном ограничении, налагаемом неотрицательностью меры в точке экстремума. Легко видеть, что это и есть классическая постановка задачи планирования эксперимента, обсуждавшаяся в п° 1 третьего параграфа, а описанные приближенные постановки являются ее обобщениями. Случай, когда / принадлежит различным конечномерным функциональным пространствам, рассматривался Седуновым [1]. Им было получено обобщение результатов Бокса и Дрейпера [1] относительно планов, минимизирующих систематическую ошибку, и установлена связь между задачами планирования эксперимента в этом случае и теорией кубатурных формул с наименьшим числом узлов. § 5. Стохастическая аппроксимация и экстремальные задачи 1. Метод стохастической аппроксимации. Этот метод, сформулированный впервые в работе Роббинса и Монро [1], имеет непосредственное отношение к проблематике планирования эксперимента и предмету данной главы.
242 ПРИБЛИЖЕНИЕ ФУНКЦИЙ [ГЛ. 5 В отличие от рассмотренных задач планирования регрессионных экспериментов, процедура метода стохастической аппроксимации носит последовательный характер и эффективно используется для получения сведений локального характера о математическом ожидании случайной функции. Пусть / (х) = М? (х), где ? (х) — случайная функция, реализации которой в некоторых фиксированных точках могут быть получены в результате эксперимента. Сведения о расположении экстремума функции/ (х) или в одномерном случае значения ж, при котором f (х) есть заданная константа, можно получить, приближая / (х) с помощью методов, изложенных в этой главе ранее. Такой подход, однако, не всегда эффективен в вычислительном отношении и, кроме того, можно ожидать, что определение локальных характеристик кривой или поверхности у = = / (х) потребует меньшего числа экспериментов,] чем приближение ее в некоторой области. Решение задачи о локальных характеристиках зависимости у = / (х) может быть получено при определенных условиях методом стохастической аппроксимации, на котором мы далее кратко остановимся. Пусть каждому значению х (— оо <^ х <^ + оо) отвечает случайная величина ? (х) с функцией распределения F {у \ х) = + = Р(?(*)<у), так что f(x)= J ydF(y\x). —оо Рассмотрим задачу об оценивании корня 0 уравнения / (х) = а по наблюденным значениям случайных величин 1>(хк) при условии, что мы можем распорядиться выбором величин хн. Для решения задачи строится последовательность случайных величин хк, к = 1, 2, . . ., следующим образом: х* + Г* (? Ы - я), E.5.1) где хг — произвольное число, a {yfc} — некоторая последовательность чисел, удовлетворяющая условиям оо оо 2т* = °с, 2т2*<оо. E.5.2) При достаточно большом к хк может служить оценкой 0-
§ 5] СТОХАСТИЧЕСКАЯ АППРОКСИМАЦИЯ 243 Таким образом, как отмечалось выше, процедура определения хк носит последовательный характер и является по существу методом планирования эксперимента, который ставит своей целью определение 9 по реализациям случайной величины ? (х). В качестве ук можно, очевидно, выбрать последовательность ук = ilk. Условия сходимости последовательности ^кбв среднем и с вероятностью 1, установленные Блюмом [1] и Дворецким [1], состоят в следующем: 1. Для всех х и некоторых фиксированных А и В \f(x)\<?A\x\ + В. 2. ма(*)-/(*)J<а2<оо. 3. inf | / (х) — а | > 0 при любом е @ < 8 < 1). l/e>|ac-9|>? Гладышевым [1] условие 2 было заменено условием 2'. М (? (х) — аJ < А A + я2) Для всех х, которое является менее ограничительным, чем условие 2. Аналогичную процедуру можно построить и в многомерном случае. Пусть ?х (хг, ..., х8), ..., ?s (xl9 ..., xs)— семейство s случайных величин и ft (хг, . . .,xs) = = M^f (^, . . ., х8), i = 1, . . ., 5,— соответствующие функции регрессии. Обозначим х = (х1? . . ., жв), 1/ (х) = (?i (х), • • ., Ss (х)), а = (а1? . . ., а8) и рассмотрим задачу об оценивании корня в = (9Х, . . ., 6S) системы уравнений fi (xl9 . . ., xs) = au i = 1, . . ., 5. Векторный аналог равенства E.5.6) определяет многомерную процедуру Роббинса — Монро хк+1 = хк + чк (у (хк) - а), к = 1, 2,..., E.5.3) где Х\ — произвольный вектор, a {7^} — последовательность констант, удовлетворяющих условию E.5.7). Достаточные условия сходимости в среднем и с вероятностью 1 нормы разности хк — в к нулю также аналогичны перечисленным выше и составляют содержание следующей теоремы. Теорема 5.7. Для того чтобы Р {lim хк = 6} = 1 U М || хк — в ||2 > 0, достаточно выполнения следующих условий:
244 ПРИБЛИЖЕНИЕ ФУНКЦИЙ [ГЛ. 5 1. Для всех х и некоторых фиксированных А и В || / (х) I] < А | х |] + В, где f (ж) = (Д (ж), . . ., /в (ж)) и И / (х) I обозначает некоторую норму вектора f (ж). 2. inf (х — в, / (х) — а))^> О при любом положи- /0|| 1/>0||> тельном s <; 1, где (а, 6) обозначает, скалярное произведение векторов а и Ь. 3. М || у (ж) - / (ж) |2 < а2 < оо. Чжун, Бэркхольдер и Сакс (см. Сакс [1]) изучали асимптотическое распределение процессов стохастической аппроксимации. Используя предельную теорему для мартингалов, Сакс доказал следующее утверждение (рассматривается одномерный случай). Теорема 5.8. Если выполнены условия: 1. (я _в) (/(х)-а)<0. 2. Для всех ж и некоторой константы А I / {х) - а |< А | ж - 9 | inf |/(.*)-а |>0 г//ж некоторых tx, t2 @ < ?х < ^2 < °°)« 3. / (ж) = а0 + ах (х — 9) + б (ж, 0) и б (ж, 9) = = 0 (| ж — 81 ), когда ж -> в, % < 0. 4. supM [^ (ж) -/(.х)]2< оо,НтМ — 52 < ОО. 5. lim Jim sup \ R^ ,^0 |x-ei<.|?(xj |?(xj>R где 8 (ж) = t, (ж) — / (ж), a F — функция распределения случайной величины е (ж). 6. 7fe = Ak'1, где А таково, что 2Ааг > 1. где и _0)<м}_>_1 С *-*• /i->oo а к 2л; J а2 - Л2 {2агА - lfV. Условие 5 последней теоремы выполняется, в частности, если величины г (х) при различных х независимы и
§ 5] СТОХАСТИЧЕСКАЯ АППРОКСИМАЦИЯ 215 одинаково распределены или если выполняется условие sup М I &2 (х) |2+г < с < оо |х-В|<5 при некоторых г ^> 0 и 8 ) 0. Дворецким [1] для процесса Роббинса — Монро рассматривалась также задача о выборе последовательности констант ук, минимизирующей М (хк — 0J после некоторого фиксированного числа наблюдений. Полученные им результаты составляют содержание следующей теоремы. Теорема 5.9. Пусть случайная величина ? {х) удов лстопряет условию М [?(*) -/(*)Р< О2< оо, / (х) такова, что 0 < т < (/ (х) - а) {х - 0) < М < оо, и известно, что 1. г;2 = м (хг — бJ < 2aVm (M — т). Тогда, если то з. а выбор констант ук оптимален в том смысле, что если ук не удовлетворяет условию 2, то существует процесс, удовлетворяющий условию 1, для которого условие 3 не выполнено. Оценки быстроты сходимости последовательности хк к 0 для процесса Роббинса — Монро в среднем дает следующая Теорема 5.10. Пусть удовлетворяются условия 1. / (х) > а, х < 0; / (х) < а, х > 0. 2. сх | ж — 0 | <; | / (х) — а | ^ с2 | х — 0 | для некоторых сг и с2 и всех х. 3. М lf(x) - ?(.*)]2<s2< оо. 4. yk = Ak~x, где А — некоторая константа.
246 ПРИБЛИЖЕНИЕ ФУНКЦИЙ [ГЛ. 5 Тогда М( справедливы хк+1 __ 0J = . оценки 0(к-*Ас>) 0 (к'1) 0 (Г1 log к) при 2А при 2А при 2А С2>1, са = 1. Эти оценки позволяют утверждать, что при определенных условиях применение метода стохастической аппроксимации может быть более эффективным в отношении затраты вычислительной работы, чем процедуры, где строится агрегат, приближающий функцию / (х). Процедура, сходная во многих отношениях с описанной выше, была предложена Кифером и Вольфовицем [1] для нахождения точки экстремума функции регрессии. Если ? (х) = ? (хг, . . ., xs) — случайная функция, / (х) = М? (ж) и 0 = @J, . . ., 8S) — точка экстремума функции /, то процесс Кифера — Вольфовица для нахождения максимума определяется равенством хк+1 = хк + -^ где у (х, а) = (С (х + aej, . . ., ? (» + яе8)), ef (i = 1, . . ., s) — орт, у которого i-я координата равна единице, а остальные равны нулю. Последовательности констант \\ и % при этом должны удовлетворять условиям Условия сходимости последовательности E.5.4) к точке экстремума в можно найти также в книге Уайлда [1]. Мы не будем их формулировать. Укажем только, что процесс Роббинса — Монро и процесс Кифера — Вольфовица являются частными случаями более общего процесса, построенного Дворецким [1]. Им доказана следующая Теорема 5.11. Пусть Р& (гх,..., гк), ук (г2,..., гк) — неотрицательные измеримые функции аргументов 7*1> •••> Пс> функции Pfc(r1?..., rk) равномерно ограничены
§ 5] СТОХАСТИЧЕСКАЯ АППРОКСИМАЦИЯ 24? и pfc (ги . . ., гк) -> 0 равномерно для любой последователь- ности г1У . . . гк. Сумма 2 Т/с (гъ • • •»г&) равномерно огра- к=1 ничена и равномерно сходится для любой последовательности г1? . . ., гк. Для любого L^> 0 существует неотрицательная функция бк (гх, . . ., гк), удовлетворяющая условию оо 2 S/C (ГЬ • • • , Гк) = ОО fc=l равномерно для всех последовательностей г1? . . ., rk, i/ яо- sap |rk|<L. fc=l, 2,... Пусть G — вещественное число и Tk, k = 1, 2, . . .,— из- меримое преобразование, удовлетворяющее условию I У* (rlt .-, г») - е | < шах (р„ A + %) | гк - 9 | - в») для всех вещественных rt1 . . ., гк, г5в 5ля краткости Рк (г1э . . ., гк) и 7л (ri? •••>'"*) обозначены через рк w 7л соответственно. Пусть хги ух — случайные величины и определена последовательность = У* fax, . . ., xk) + г/к, /с = 1, 2, ... E.5.5) Предположим, что tAx\<^ оо, 2 Mi/k<(oo в г вероятно- стггью 1 М(г/к | жь ..., жк)]= 0. Гог5а lim M {xk — 9J == 0 и Р{Ню rck ^ S} = 1. fc-»oo fc-*oo Применительно к задаче поиска экстремума разульта- ты этой теоремы подробно обсуждаются в работе Кифера и Вольфовица [1]. 2. Приложения метода. Процедура Роббинса — Монро в сочетании с методом Монте-Карло рассматривалась в работе Бочека [1]. На примере этой работы можно судить о некоторых преимуществах, доставляемых методом стохастической аппроксимации. Пусть функции / (х) и фх (х),. .., фп. {х) являются элементами L2 ([x), где |л— вероятностная мера. Рассмотрим
248 ПРИБЛИЖЕНИЕ ФУНКЦИЙ [ГЛ. 5 уравнение La = /, E.5.6) где L — линейный оператор и ф1? . . ., ц>п принадлежат области его определения. Предполагается, что E.5.6) имеет единственное решение. Будем искать приближенное peri шение этого уравнения в виде ип = 2с?Фг(х)- Коэффици- г=1 енты ct могут быть определены из условия минимума некоторого функционала. Например, таким функционалом может быть §[Lun — f]2\i(dx) (метод наименьших квадратов). Полагая i|)j {x) = Lcpj, получаем для определения ct (i = 1, . . ., п) систему линейных алгебраических уравнений п 2 Ok, %) Ъ = (*i, /), i = I, • • • ,п. E.5.7) 3=1 Обозначим с = (q, . . ., сп) и ^ = (г|)х (х), . . ., г|?л (х)). Скалярные произведения (г|)г, -ф^) и (г|5г, /) являются средними значениями случайных величин г|)г (со)г|р7- (со) и ^г@))/(^)? где распределение случайной величины со определяется мерой \i. В соответствии с методом стохастической аппроксимации для определения корней системы уравнений E.5.3) последовательность случайных векторов А Г где cofc — независимые реализации со, сходится в среднем и с вероятностью 1 к решению системы E.5.7). Если ih > ]> 1, где X — минимальное по модулю собственное значение матрицы системы E.5.7), то порядок сходимости есть 1//<\ Вычислительная процедура оказывается очень простой и требующей небольшого объема памяти ЭВМ. (Нет необходимости хранить матрицу системы.) Вместо произведений г|эг(со)г|?7- (со) и г|зг(со)/ (со), очевидно, можно взять любые более сложные несмещенные оценки величин (г|зг, г^-) и (г|эг, /). Это дает возможность подавить в большей степени случайную компоненту в E.5.8). Интересной особенностью описанного алгоритма является то, что здесь одновременно уточняются элементы матрицы
§ 5] СТОХАСТИЧЕСКАЯ АППРОКСИМАЦИЯ 249 системы линейных уравнений и ее решение. Мы не имеем каких-либо детерминированных аналогов такой процедуры. Метод стохастической аппроксимации является теоретической основой многочисленных методов случайного поиска, которые широко используются на практике для решения прикладных задач. Очевидно, что процедуру Ки- фера — Вольфовитца можно применять непосредственно для оптимизации систем, которые моделируются с помощью метода Монте-Карло и зависят от некоторого числа параметров. В действительности процедуры такого типа используются на практике, но для оценки градиента используются более совершенные средства, чем в формуле E.5.4) (см., например, Стратонович [1]). Имеется обширная литература по этому поводу. Если число переменных, по которым производится оптимизация, очень велико (s = = 10 — уже это довольно много для экстремальных задач), то более выгодной может оказаться процедура, в которой на каждом шаге случайно (например, изотропно) выбирается несколько направлений (меньше, чем 5). В каждом из этих направлений делается пробный шаг и движение происходит в том направлении, где получено наибольшее (если ищется максимум) значение функции. Известно очень много модификаций такого алгоритма (например, Расстригин [1]). Для нас существенно отметить, что при использовании таких алгоритмов моделируется равномерное распределение на поверхности сферы. Заметим также, что широкий класс подобных алгоритмов укладывается в общую схему, рассмотренную Дворецким (теорема 5.11). Об этом см., например, работу Рубинштейна [1]. Интересные сочетания метода стохастической аппроксимации и метода Монте-Карло содержатся в работе Антонова и Катковника [1]. Один из простейших методов поиска экстремума, рассмотренных в этой работе, удобен, когда функция имеет много «малых» локальных экстремумов, таких, что глобальный экстремум легко найти, сглаживая эту функцию. Например, можно вместо экстремума функции / одной переменной искать экстремум функции }(х, р), где / (г. В) = —i^ J /(в) ехр (- (.г - кL/23) du. E.5.9)
250 ПРИБЛИЖЕНИЕ ФУНКЦИЙ [ГЛ. 5 Для любой непрерывной / (х) при р -> 0 / (х, Р) —> /(#). Предлагается сначала найти с некоторой степенью точности экстремум «сглаженной» функции / (х, р) при некотором р ]> 0. При этом интеграл в правой части E.5.9) оценивать с помощью метода Монте-Карло и применять процедуру стохастической аппроксимации. Затем можно Р уменьшить и так постепенно найти экстремум самой / (х) (абсолютный при некоторых специальных предположениях относительно /). Следует заметить, что процедуры типа случайного поиска больше приспособлены к задачам определения глобального экстремума, чем детерминированные процедуры. Здесь можно сослаться на работу Вайсборда и Юдина [1], где строится процесс Маркова для поиска глобального экстремума. Заметим, наконец, что нет принципиальных препятствий к применению процедуры Роббинса — Монро для решения системы нелинейных уравнений в условиях, когда значения функций, определяющих систему, вычисляются с помощью метода Монте-Карло. В действительности такие задачи сводятся обычно к экстремальным. Так, если система имеет вид П (я1? . . ., ха) = 0, i = l,..., s, E.5.10) то ее решения будут доставлять минимум функции и далее используются процедуры случайного поиска (например, Лисицын, Юдаев [1]). Мы не касались экстремальных задач с ограничениями, которые либо сводятся к задачам определения безусловного экстремума, либо используют описанные выше методы с некоторыми модификациями. 3. Другие методы. Если рассматриваемые ранее методы решения уравнений и поиска экстремума были связаны с градиентным методом, то ниже мы обратимся к методам, которые условно можно назвать интегральными. При их использовании дифференцируемость соответствующих функций в случае систем уравнений и функции, экстремум которой ищется, не предполагается.
§ 5J СТОХАСТИЧЕСКАЯ АППРОКСИМАЦИЯ 251 Наиболее простая процедура, которая обычно первой приходит на ум, когда функция не предполагается дифференцируемой, состоит в следующем (Зилински [1]). Пусть функция / (х) задана в области 3) евклидова пространства. Объем 33 предполагается ограниченным. Построим последовательностьх±, х2, . . . реализаций равномерно распределенных в 3) случайных векторов. Положим / / (я*), если / (Xi) > **-!, | ,, ч^ . E.5.11) (Si-ъ если /(ж4)<^1 v ; Функцию / (х) будем предполагать измеримой в смысле Лебега. Если s0 = sup / (х) (случай инфимума рассма- 3) тривается аналогично) и mes {x: f (х) — <?0} = 0, то вероятность того, что один из xt совпадает с точкой, где достигается супремум / (х), равна нулю. Поэтому, строго говоря, процедура E.5.11) не дает возможности найти точку супремума. Задача приобретает смысл, если речь идет о том, чтобы найти одну из точек множества 2?* = = {x:f (xX>s* }, которое имеет положительную меру. В этом случае процедура может привести к успеху. К такого рода задачам относится, например, задача о плане загрузки оборудования ( гл. 3 § 3). Легко привести примеры других задач, где требуется обеспечить достаточно большое (или малое) значение / (х), но не обязательно найти с заданной точностью точку, где / {х) достигает наибольшего (или наименьшего) значения. Правда, если / (х) непрерывна, то при достаточно малом г из неравенства mes {x: f (x) ^> ]>s*}<^ е вытекает, что точки множества ?* лежат достаточно близко к точке супремума / (х). Обозначим через А (т = п\ N) событие, состоящее в том, что в результате N испытаний п значений функции / {хь) превзойдут 5*, и через |л* меру 2?*. Тогда Р {A(m>0;N) \ \i* = г} = =1 —Р {А(т = 0; 7V)| ^ = е} = 1 — A — г)". Если мы хотим, например, с вероятностью, не меньшей чем 1 — 8, получить значение х из множества ?*, для которого ix* <^ 8, то можно указать необходимое для этого число N, которое удовлетворяет неравенству A—&)N ^ 8
252 ПРИБЛИЖЕНИЕ ФУНКЦИЙ ivn. 5 Отсюда получаем N log A — в) ж log 8, N я^ В табл. 5.1 приводятся значения 7V в зависимости от 8. Таблица 5.1 е N 0,5 1 0,2 8 0,1 22 0,05 58 0,02 194 0,01 458 U,005 1057 0,002 3104 0,01 G903 Для целей практических приложений разработан ряд модификаций описанного метода. Существо их обычно заключается в том, что область поиска постепенно сжимается около точки, которую на предыдущем этапе мы признали наиболее перспективной. Иными словами, учитывается информация, полученная в результате предшествующих испытаний. Информация такого рода может учитываться и введением неравномерного распределения точек xt в алгоритме E.5.11). В частности, если / неотрицательна и может сама после надлежащей нормировки быть выбрана в качестве плотности, то xt будут чаще, вообще говоря, появляться около наибольшего значения / (х) (если экстремум не слишком «острый»). Более того, если / (х) положительна и ограничена, то плотность E.5.12) будет при п -*- оо сходиться к б-фуыкции, сосредоточенной в точке, где / (х) имеет наибольшее значение. Было бы интересно использовать этот факт при поиске экстремума, но это возможно лишь в тех редких случаях, когда можно указать простые алгоритмы моделирования плотности E.5.12) при достаточно большом п или близкой к ней плотности. В процессе применения алгоритма E.5.11) может быть полезным оценивание матрицы ковариаций В случайной величины, имеющей с/ (х) плотностью распределения (/ ^> ^> 0), с — константа нормировки — также оценивается
§ 5] СТОХАСТИЧЕСКАЯ АППРОКСИМАЦИЯ 253 в процессе вычислений. После проведения такого оценивания точки хг выбираются в соответствии с плотностью ^ехр(-жЛкТ), E.5.13) (detS) где В есть оценка матрицы В. Далее оценивается матрица ковариаций В1 случайной величины, имеющей плотность и процесс этот может повторяться многократно. При этом все время запоминается наибольшее значение / (процедура E.5.11)). Описанный алгоритм удобен для программирования, и получаемая в процессе вычислений последовательность плотностей имеет сходство с E.5.12). Очевидно, что матрица ковариаций в определенной степени отражает структуру функции /. Ряд примеров применения этого алгоритма содержится в работе Ермакова и Митиогло- вой [1]. Для решения системы нелинейных алгебраических уравнений подход, который также можно назвать интегральным (вычисляется среднее по траекториям случайного процесса), был предложен Тсудой и Кионо [1]. Хотя этот подход был предложен исходя из физических соображений без строгого обоснования, мы остановимся на нем, ибо он связывает с задачей решения системы нелинейных уравнений некоторые факты из области статистической физики, что представляет несомненный интерес. Пусть исходная система уравнений имеет вид /jfo, . . ., жв) =0, i = l,..., s. E.5.14) Обозначим s г=1 Модель, рассматриваемая в дальнейшем, связана с задачами статистической физики (ср. гл. 7 § 2) и состоит в следующем. хх, . . ., xs рассматриваются как пространственные координаты некоторых частиц, движущихся в поле потенциала U. В процессе движения возможны сто л к-
254 ПРЙЁЛЙЖЕНИЁ ФУНКЦИЙ iTfl. Ь новения чаотиц с аналогичными частицами. Модель соударений может быть в достаточной мере произвольной, но задается некоторая средняя длина пути, на котором соударений нет (длина свободного пробега). Если в системе установилось статистическое равновесие, то плотность распределения координат частиц в фазовом пространстве координат и скоростей имеет вид с-ехр(—?УР), где с и р — константы, а энергия Е есть сумма потенциальной и кинетической энергии Е = U (х1У ..., хп)-{-Т (х1,...,хп), где xt обозначает производную х-ъ по времени. Отсюда, как и ранее, следует, что плотность совместного распределения пространственных координат хх, . . ., хп равна р (ъ, . .., хп) = exp (-$/lx l p) E.5.15) Из E.5.15) вытекает, что р {х1У . . ., хп) имеет точки максимума, совпадающие с корнями системы E.5.14), и крутизна в окрестности максимума может регулироваться за счет подбора констант at (i — 1, . . ., 72). Это означает, что при прослеживании траекторий частиц в течение достаточно большого промежутка времени можно получить представление о локализации корней системы E.5.14). Одна из простейших моделей, приводящих к желаемому результату, состоит в следующем. Уравнения движения частиц dpi _ ла_ - и' (х х) 1Г - дх. - — Ucci ^ь • • • ' Xnh E.5.16) dXi л L 1 заменяются их разностными аналогами. Выбирается некоторая ограниченная область в пространстве координат, например 7г-мерный гиперкуб с достаточно большой стороной, который удобно разбить на некоторое число подобластей. Начальное положение частиц системы считается равномерно распределенным в выбранном гиперкубе. Выбирается также некоторое Гтах — максимально возможное значение кинетической энергии. Направление движения в начальный момент выбирается равновероятно и начальная энергия полагается Т = аГтах, где а, как обычно,—
§ 5] СТОХАСТИЧЕСКАЯ АППРОКСИМАЦИЯ 255 равномерно распределенная на [0, 1] случайная величина. Скорости в начальный момент оказываются равными, таким образом, xt = p{ —YTvu где vt — компоненты единичного вектора с равновероятным в пространстве направлением. Шаг по времени связывается с длиной свободного пробегаХ и вероятностью s соударения частицы; At выбирается равным At = sklY T (путь, деленный на скорость). В соответствии с уравнениями E.5.16) вычисляются новые положения частиц и новые составляющие скорости, сумма квадратов которых равна новой кинетической энергии системы. Далее опять последовательно определяется шаг по времени и т. д. На каждом шаге проверяется, имело ли место соударение. Вероятность соударения полагается равной s< 1 при Т < Гщах и равной единице, если Т превысило Гтах- После соударения энергия выбирается равной с^Гщах» а направление равновероятным, как в начале движения частицы. Таким образом, кинетическая энергия не превышает Tm3iX, что способствует установлению стационарного распределения. Если частицы покидают данную подобласть, то есть основания заключить, что в ней не содержится корней системы. Такие подобласти исключаются из рассмотрения. Пусть локализована некоторая подобласть, в которой происходит концентрация частиц. Если стационарное распределение имеет место, то вычисляем [dxi.. . [dx пх ехр (- =Л =L уXI.. .yxnexp(-U/$) — среднее по траекториям (среднее значение в вершинах ломаной) в пределах данной подобласти. Это среднее при соответствующем выборе констант at приближенно равно г-й компоненте корня, если в пределах подобласти содержится один корень, или сумме i-x компонент корней, когда их несколько. При этом все Dxt —>¦ 0 при Г-^оо, если корень один. Если их несколько, то по крайней мере одна из Dxt стремится к отличной от нуля константе. Подобласть следует разделить в этом случае по той переменной .7*1, для которой Dxt максимальна. Путем таких делений можно добиться, очевидно, локализации корней. При этом следует иметь в виду, что значения х^ в вершинах
256 ПРИБЛИЖЕНИЕ ФУНКЦИЙ [ГЛ. 5 ломаных — зависимые случайные величины (задача В гл. 1). По мере прояснения картины можно уменьшать Гтах, X и увеличивать аи что дает возможность определить корни с большей точностью. Такова основная идея метода решения систем нелинейных уравнений, предложенного Тсудой и Кионо [1]. Разумеется, требуются дальнейшие исследования, в результате которых можно будет дать конкретные рекомендации о выборе параметров Ггаах, X и at. Остается открытым вопрос о том, с какого момента времени распределение можно считать стационарным и как эффективно оценивать дисперсии величин xt в процесе вычислений. В указанной работе приводится численный пример. Решалась система Г жу —3/16 = О, (а*+ 2,»-5/8=0. После двух тысяч шагов по времени было произведено отделение корней, уменьшены в 410 раз Гтах, в 10 раз X и увеличены в 10 раз величины at. Первоначально было выбрано Гтах = 4; s = 0,1; X = 0,1; at — 1. Последующие 5000 шагов по времени позволили определить корни с погрешностью около 5%. Хотя использование методов решения дифференциальных уравнений для нахождения корней системы нелинейных уравнений можно и не связывать с методом Монте- Карло, нерандомизованные процедуры исключают возможность оценки дисперсии и, следовательно, разделения корней. Близкие к описанным результаты для решения системы можно получить, обобщая на нелинейный случай результаты Шрейдера [1]. Обобщение такого рода было выполнено Клейзой [1], [2], который исходил из соотношения dx = lim -5 ^ , E.5.17) dx
§ 5 СТОХАСТИЧЕСКАЯ АППРОКСИМАЦИЯ 257 a>i > 0, i = l, . . ., s, х° = (#J, . . ., x°s) — решение системы, а б — некоторая область, в которой содержится лишь одно решениех0. Если интегралы в E.5.17) заменить их оценками по методу Монте-Карло, то полученная таким путем оценка при а ^> 0 будет смещенной. Вопросы оценки величины смещения и некоторые способы вычисления интегралов, входящих в E.5.17), рассматривались в цитированных работах Клейзы. При использовании соотношения E.5.17), очевидно, не требуется дифференцируемости функций ft. Возможно также осуществить процедуру отделения корней, аналогичную описанной выше. Отметим в заключение, что эти методы решения систем нелинейных уравнений очевидным образом применимы для поиска экстремума функции и, что очень важно, разделения экстремумов. 9 С. М. Ермаков
ГЛАВА 6 ЦЕПИ МАРКОВА И ИНТЕГРАЛЬНЫЕ УРАВНЕНИЯ § 1. Цепи Маркова с конечным числом состояний Моделирование цепи Маркова с конечным числом состояний сводится к моделированию последовательности случайных величин с дискретным распределением. Процедура моделирования при этом выглядит следующим образом. Пусть {р, З5} — однородная цепь Маркова с п состояниями, где р = (рг, . . ., рп) — распределение вероятностей начальных состояний, а ?Р = J /?*,/ Щ! — переходная стохастическая матрица. Для элементов матрицы 3* выполняются соотношения п 2/^ = 1, 1 = 1,..., и, А,;>0' так что ее строка с номером i представляет собой распределение вероятностей. Объект, который может находиться в п состояниях и описывается цепью Маркова, обычно рассматривается в дискретные моменты времени. Чтобы получить номер состояния в начальный момент времени, моделируют распределение вероятностей р. Затем, если объект находится в состоянии с номером i, то выбирается строка с номером i матрицы 5s и моделируется распределение, определяемое этой строкой. Таким путем строится последовательность реализаций случайных номеров состояний, образующих траекторию данной цепи Маркова. Обобщение такой процедуры моделирования на случай неоднородной цепи Маркова, когда элементы матрицы <р зависят от момента времени, не представляет труда, хотя непосредственная реализация модели, связанной с неоднородной цепью, на ЭВМ при больших п может представить определенную трудность.
§ 1] КОНЕЧНОЕ ЧИСЯО СОСТОЯНИЙ 259 Моделирование цепей Маркова оказывается естественным образом связанным с решением большого числа прикладных задач и, в первую очередь, с решением систем линейных алгебраических уравнений. В этом параграфе обсуждается простейшая вычислительная схема для решения систем линейных алгебраических уравнений, которая была впервые предложена Дж. фон Нейманом и Уламом и обсуждалась в связи с решением конкретных задач Форсайтом и Ляйблером [1]. По поводу некоторых ее модификаций см. также Вазов [2]. Задачи, связанные со стационарными распределениями марковских цепей, обсуждаются позже. Простейшая схема, связанная с асимптотически несмещенной оценкой решения, состоит в следующем: Пусть система линейных алгебраических уравнений задана в виде х =Ах +/, F.1.1) где х = (#!, . . ., хп) — вектор-столбец неизвестных, / = (/i> • • •> /п)—вектор правых частей и А = | a^j | J — матрица системы. Предположим, что наибольшее по модулю собственное число А меньше единицы, так что сходится метод последовательных приближений х<*> = Лж<к-« +/. F.1.2) Если положить^0) = /, что и будет далее предполагаться, то Ф) = (Л* + А*-1 + . . . + А + E)f, F.1.3) и точное решение системы есть х = Иш (Е + А + ...+ Ак) f =(E - А)/. fc->oo Сопоставим системе F.1.1) цепь Маркова (не обязательно однородную) с п состояниями. Начальное распределение р и матрицу перехода 5\ (к — номер перехода) подчиним некоторым дополнительным условиям, связанным с системой F.1.1), которые сформулируем в дальнейшем, и рассмотрим задачу о вычислении скалярного произведения^, х), где Л — заданный вектор. Очевидно, что задача о вычислении одной из компонент решения х 9*
260 ЦЕПИ МАРКОВА И ИНТЕГРАЛЬНЫЕ УРАВНЕНИЯ [ГЛ. 6 является частным случаем этой задачи. Если одновременно вычисляется некоторое количество т скалярных произведений (hjy х), j = 1, . . ., т, то решение системы х может быть также получено при соответствующем выборе т и и ht. Мы будем связывать с системой F.1.1) и вектором h некоторую фиксированную цепь Маркова из множества цепей {р, 5\}, р = (ри . . ., рп), г=1 (* = 1 л; *= 1,2,...). для которых выполнены условия: 1. ft > 0, если ht ф 0, F.1.4) 2. />[*) > 0, еслиа^, Зф 0, i,j = 1, . . ., n;fe = 1, 2,... Положим (о) gi "I 0, Зададимся некоторым целым N ^> 0 и будем рассматривать траектории цепи Маркова длины iV. Объект, описываемый цепью Маркова, мы будем часто в дальнейшем именовать частицей и считать, что эта частица изменяет свои состояния (движется) в соответствии с траекторией цепи. Движущейся частице припишем «вес» Qk, который изменяется при движении ее по траектории ?0 -*¦ h~+~ • • • ...->?# следующим образом. В начальный момент, когда частица находится в состоянии ?0, она имеет вес (?0 = = q?\ при переходе из состояния i0 в состояние 1г ее вес становится равным Qx = д^Яи, и и т. д., т. е. Введем случайную величину ?лг, определенную на траекториях марковской цепи длины N: N En= S Qmfim- F.1.6)
§ 1] КОНЕЧНОЕ ЧИСЛО СОСТОЯНИЙ 261 Каждой траектории длины N соответствует вероятность {- • • i°iiv-i»iiv и математическое ожидание In есть = 2 • • • 2 i = 2-2 we,-4w 2 io=l i^y = l Подставляя вместо q^ и ?^lfi их значения из F.1.5) и меняя порядок суммирования, получим N п п = 2 2 • • • 2 Mio,ii • • • aim-injim* По определению произведения матриц п n n =12- s 1 Отсюда следует hAlN = (h, 2 ^w/)- При7У->оо М^ стремится к (Л/, х). Такова одна из возможных схем метода Монте-Карло, связанных с системами линейных алгебраических уравнений, которая заключается в вычислении средних значений случайной величины ?# по траекториям цепи Маркова. Сделаем несколько замечаний, относящихся к приведенной схеме. 1. Как известно, (й,, х) = (х*, /),гдех* есть решение уравнения х* =4гх* + Л, F.1.7) а Ат — матрица, транспонированная к А. Равенство, впрочем, легко проверяется непосредственно. Выражая h и / через х* их из равенства F.1.1) и F.1.7) соответственно,
262 ЦЕПИ МАРКОВА И ИНТЕГРАЛЬНЫЕ УРАВНЕНИЯ [ГЛ. 6 получаем (х* —Атх*, х) == (х*, х — Ах), что равносильно известному равенству (Атх:?^'х) = (х*, Ах). Отсюда следует, что при вычислении скалярного произведения (fo, х) можно исходить из уравнения х* = Атх* + h. Марковские цепи, соответствующие обоим уравнениям, могут совпадать, если для них одновременно выполнены условия F.1.4). Схема, связанная с уравнением F.1.7) (сопряженная схема), более удобна, если нужно вычис- лять_одновременно несколько скалярных произведений (hj, х), / = 1, ..., яг, так как в этом случае марковская цепь остается неизменной для всех /, а изменяется лишь случайная величина ?# и возможна оценка ее среднего по одним и тем же траекториям. 2. Для получения решения системы F.1.1) достаточно взять в качестве hj n векторов, у которых /-я компонента равна единице, а остальные равны нулю. Как известно, r-й столбец матрицы (Е — А)'1 может быть получен как решение системы х = Ах + hr, гдеЛг — вектор-столбец с единичной г-ж компонентой и нулевыми остальными компонентами. Поэтому при / = hris.h = hj схема, связанная с уравнением F.1.1), дает в качестве среднего значения ?лг элемент матрицы (Е — AJr1 с номером столбца г и номером строки /, а схема, связанная с уравнением F.1.7),— элемент той же матрицы с номером строки г и столбца/. Разность Mgw+1 — Mgw есть (h,AN+1f) для первой из схем и (/, (AT)N+1h) — для второй. Оценки этих скалярных произведений могут быть использованы для определения собственных чисел матрицы А, коэффициентов характеристического многочлена и т. п. в соответствии с известными вычислительными схемами линейной алгебры (см., например, монографию Фаддеев и Фаддеева [1]). Вопросы оценки статистической погрешности при этом, однако, нуждаются в дополнительном исследовании. 3. Из равенства lim M?>n — (h, x) следует, что несме- N-*oo щенность оценки %н имеет место для траекторий марковской цепи бесконечной длины. В действительности из сходимости (имеется в виду сходимость по некоторой норме) 00 ряда 2 ^т следует, что, начиная с некоторого номера N = N09 вклад добавочных слагаемых в М^о> появляющихся в результате увеличения N, становится пренебре-
и КОНЕЧНОЕ ЧИСЛО СОСТОЯНИЙ 263 У жимо малым. Практически No — номер звена траектории, на котором ее следует обрывать, может быть своим для каждой траектории и выбираться в результате оценки вклада следующих членов ряда F.1.3). При этом необходима определенная осторожность. Если auj = О, хотя бы для одной пары номеров i, /, то, так как qti 7- = 0, вес частицы после перехода ее из состояния с номером i в состояние с номером / обращается в нуль. Очевидно, все ее вклады при последующих переходах будут нулевыми (это следует из F.1.4)). Такого рода переходы оказываются лишенными смысла. Можно считать, что частица при переходе из состояния гв состояние/ «поглощается» и происходит обрыв ее траектории. В этом случае можно не прибегать к искусственному обрыву траекторий. Далее уместно привести описание вычислительной процедуры для конкретной системы уравнений. Примером системы уравнений, где процедура метода Монте-Карло выглядит особенно простой, является разностный аналог краевой задачи для уравнения Пуассона. Этот пример довольно часто рассматривается в литературе по методу Монте-Карло (например, Бусленко и др. [1], Бусленко, Шрейдер [1]), и мы очень кратко остановимся на простейшем его варианте, чтобы проиллюстрировать излагавшиеся выше методы. Рассмотрим случай первой краевой задачи для уравнения О х Рис. 6.1. д2и f(x,y) F.1.8) в единичном квадрате. Не умаляя общности, можно считать, что граничное условие задается в виде и\г = 0, где Г — граница квадрата. Построим в квадрате сетку с шагом I = 1/L (рис. 6.1). Заменяя приближенно частные производные в уравнении F.1.8) вторыми разделенными разностями с учетом граничных условий, получим систему (L — IJ линейных алгебраических уравнений вида Z7i,i> F.1.9)
264 ЦЕПИ МАРКОВА И ИНТЕГРАЛЬНЫЕ УРАВНЕНИЯ [ГЛ. 6 где ut, j есть приближенное значение и в точке (И, Ц) сетки, f 1/4. i=?l, 1/4, ]ф1, _ f 1/4, J^L-1, 0, / = 1, c«-\ 0, i-L-1, 1/4, j=f=L — l, 0, ) = L-1. (в'1'10) В тех случаях, когда коэффициенты равны нулю, нам, в сущности, безразлично, к каким неизвестным они относятся. Можно считать, что они относятся к некоторому одному фиктивному неизвестному v, соответствующему граничным точкам сетки. При сплошной нумерации неизвестных по правилу uk = ut, 7-, где к — j -\- (L — 1) X X (i — 1), матрица А имеет вид, представленный на табл. 6.1. Таблица 6.1 ^¦^.^^ Неизвестные Уравнения ^^*>^ 1 2 3 4 5 6 7 8 9 10 (v) Вид матрицы А 1 2 V4 V* V* 3 V4 4 V4 У* У* 1(L = 5 V4 V4 У* У* = 4) в V4 V4 V4 7 Х/4 V4 8 У* У* ч* 9 V* V4 10 (г) 1
§ 1] КОНЕЧНОЕ ЧИСЛО СОСТОЯНИЙ 265 Матрице А естественно сопоставить стохастическую матрицу S5 (см. табл. 6.2). Величины g^jB этом случае равны единице (кроме случая перехода в состояние 10, когда они равны нулю). Конструкция вектора h зависит от того, какую величину мы хотим определить в результате решения задачи. Используя сопряженную схему для нахождения решения системы F.1.1) и выбирая в качестве р вектор, все компоненты которого равны l/(L — IJ, приходим к следующему алгоритму. Частица рождается с равной вероятностью в любой внутренней точке сетки и с равной вероятностью переходит в любую соседнюю. При переходе в граничную точку траектория обрывается. Для получения решения отводится (L — IJ ячеек памяти. Если частица родилась в точке с номером /с0, то при посещении ею точки с номером к (рождение также считается посещением) в к-ю ячейку памяти добавляется величина /2/&0. Прослеживается М независимых траекторий частицы и среднее Таблица 6.2 Вид матрицы "*^^^ Неизвестные Уравнения ^***^«^ 1 2 3 4 5 6 7 8 9 10(iO 1 V4 V* 2 V4 V4 V4 3 V4 V4 4 V4 V4 V4 5 V4 V4 V4 V4 6 V4 V4 V4 7 V4 V4 8 V4 V4 V4 9 V4 V4 10 (v) V2 V4 Х/2 V4 0 V4 ъ V4 1
266 ЦЕПИ МАРКОВА И ИНТЕГРАЛЬНЫЕ УРАВНЕНИЯ [ГЛ. 6 по траекториям содержимого каждой из ячеек, отведенных для компонент вектора решения системы, служит оценкой соответствующей компоненты. Эта простая схема была специально изложена нами с общей точки зрения и поэтому довольно сложным образом. Читатель может без особого труда рассмотреть теперь схемы решения разностных уравнений, соответствующих другим задачам для уравнений в частных производных. В общем случае, разумеется, частица может переходить не только в соседние точки сетки, веса вычисляются в соответствии с общей формулой F.1.5) и могут менять знак при переходах частицы. Из изложенного следует, что имеется значительный произвол в конструировании схемы метода Монте-Карло. Мы исходили, в частности, из произвольного выбора марковской цепи (р, З5). Очевидно, что можно выбрать эту цепь плохой для оценки интересующей нас величины. Так, если нас интересует компонента решения системы с номером к0 — ?feo, а вероятности перехода в состояние к0 выбраны очень малыми, то частица редко будет посещать точку с номером /с0, но при каждом посещении вклад, вносимый в результате ее «весом» может быть очень большим. Это приводит к тому, что дисперсия D xko оценки $ko окажется большой. Соображения такого рода могут быть полезны при выборе цепи (р, ?F>). Оценки, связанные с поглощающим состоянием. Изложенные выше соображения об естественном обрыве траектории и конструкция переходной матрицы в рассмотренном выше примере показывают, что можно с самого начала (что, собственно, и предлагалось в статье Форсайта и Ляйблера) системе п уравнений сопоставлять цепь Маркова сй + 1 состоянием, вводя дополнительно вероятность обрыва траектории. Расширенная стохастическая матрица в однородном случае имеет вид Д>= ' ' ' F.1.11) \ О О ... О 1 /
1] КОНЕЧНОЕ ЧИСЛО СОСТОЯНИЙ 267 2 Puj = 1 — A,n+i, i = 1, •. •, n + 1. Ее структура такова, что после перехода ъ п + 1-е состояние траектория остается в нем (переход из п + 1-го состояния в любое другое невозможен). Известно (например, Феллер [1], стр. 282), что при наличии хотя бы одного положительного pt,n+1 с вероятностью единица все траектории оканчиваются в п + 1-м состоянии. (Условия piyj ^> 0 при a^j^> О обеспечивают отсутствие замкнутых состояний, если система F.1.1) не распадается на независимые подсистемы.) Если обозначить pif п+1 = gtj i = = 1, ..., тг, то траектории i0 ->¦ i± ->¦ ... -> ik будет соответствовать вероятность РиРи, и ... Ргк_г1к^ giU- Это означает, что математическое ожидание функции | траектории цепи Маркова, равной ?W на траектории длины /к, можно вычислить до формуле S ••• и легко видеть, что М? = (Л, зс), если положить ^> = <?^. F.1.13) (Достаточно подставить F.1.13) в F.1.12) и сравнить полученное выражение с F.1.3).) Очевидно, что исходя из системы F.1.7) мы можем получить оценку, аналогичную F.1.13) и сопоставляющую траектории длины к величину g«eA^i ****** hi« Fii4) (gh > 0, если hik ф 0, pu > 0, если fu ф 0). В качестве нетрудного упражнения читателю можно предложить доказать несмещенность оценок, сопоставляющих
268 ЦЕПИ МАРКОВА И ИНТЕГРАЛЬНЫЕ УРАВНЕНИЯ 1ГЛ. 6 траектории длины к величины ?к и ?fc, Е' - У ^о gio,ii gim-i^m , ,\(, k^Q F.1.15) ЬО = -Т1" /io F.1.16) Таким образом, нами указаны различные способы представления (h, x) в виде математического ожидания некоторой случайной величины, т. е. задача сведена к вычислению интеграла по мере, определяемой выбранной нами цепью Маркова. При этом выбор различных цепей соответствует различным вариантам метода существенной выборки. Вместе с тем специальная структура меры, связанной с цепью Маркова, позволяет получить и некоторые специальные результаты относительно дисперсии оценок. В основном эти результаты будут получены нами, с более общих позиций, при изучении интегральных уравнений в § 2, и лишь один из результатов такого рода, имеющий непосредственное отношение к процедуре решения систем линейных алгебраических уравнений, приводится ниже. Пусть рассматривается задача о вычислении всех компонент вектора решений системы линейных алгебраических уравнений; тогда могут быть полезны следующие соображения (Холтон [2]). Предположим, что матрица А системы х = Ах + f F.1.17) симметрична, что является не слишком ограничительным условием, ибо, по крайней мере теоретически, любую систему с несимметричной матрицей легко заменить равносильной системой, матрица которой симметрична.
§ 1] КОНЕЧНОЕ ЧИСЛО СОСТОЯНИЙ 269 При прямой схеме решение можно получить, сопоставив системе F.1.17) п цепей Маркова {pj, 35}, / = 1, ... ..., /г, где Pj — вектор, имеющий все нулевые компоненты, за исключением компоненты с номером /, которая равна единице, a 5s не зависит от /. Однако экономичнее, как это делалось выше, не строить независимые траектории, соответствующие каждой из цепей при оценке каждого неизвестного, но использовать одну и ту же, считая, что частица появилась в состоянии с номером ?, когда она переходит в это состояние на каком-либо этапе блужданий. Это оказывается возможным сделать благодаря специальному виду начальных распределений pj. Если при принятом способе вычислений |$ обозначает оценку %i, i-& компоненты решения системы, соответствующую траекториям цепи длины N, то имеет место соотношение №)SU, F-1.18) когда последнее звено траектории есть переход из состояния с номером / в состояние с номером i. Положим |(г) = = lim |(#. Справедлива JV-H» Лемма 6.1. Если норма матрицы || (Ujlpt, j || i меньше единицы, то дисперсии D|(l), i = 1, ..., п, конечны и удовлетворяют уравнению п / n Доказательство. 6f«> = М (&«)• -х\= lim М (ШУ - 4» N-*oo и, согласно F.1.18), D|i) = lim {ft + 2ДМ [ U N-+oo - /i + 2/« 2 «hi*) + S
270 ЦЕПИ МАРКОВА И ИНТЕГРАЛЬНЫЕ УРАВНЕНИЯ [ГЛ. 6 Справедливость F.1.19) вытекает из последнего равенства и F.1.17). Легко видеть теперь, что если положить формально / Phi = PiJ = ahfij / 2 ahkxk = af,jSj/(Si — A), F.1.20) 1 то правая часть уравнения F.1.19) обращается в нуль. Отсюда вытекает Теорема 6.1. Если A) матрица З5* = \p\,j ||, определяемая равенством F.1.20), является стохастической, выполнены условия F.1.4), связывающие ЗР* с А, и норма матрицы Л = || rit j || , где riy у определяется равенством п rhi = 4i S *uflkfa = 45 («i - fdl4 F.1.21) меньше единицы, то имеет место равенство D|(i) = 0, i = l, ..., п. Если же B) для каждого i <1, F.1-22) mo ^ ^ жг- «а всех траекториях цепи. Условие F.1.22), очевидно, выполнено,'если все ft и аи j положительны. Доказательство. Первое из утверждений теоремы очевидно. Обозначим гг = 1 — аг1$ь. Тогда, согласно F.1.17) и F.1.20), N Отсюда и следует второе утверждение теоремы. Полученный результат позволяет, в частности, учитывать априорные сведения о решении для уменьшения дисперсии оценок |^г). В работе Холтона [2] этот результат использовался для построения последовательных процедур решения линейных алгебраических уравнений.
§ 2] СХЕМА НЕЙМАНА — УЛАМА И ЕЕ ОБОБЩЕНИЯ 271 В заключение отметим, что практически метод Монте- Карло в описанной выше форме может конкурировать с классическими вычислительными методами при следующих условиях: 1. Порядок п матрицы А очень велик, элементы ее могут быть достаточно просто вычислены и требуется оценить решение системы или элементы обратной матрицы с небольшой точностью. Величина п практически зависит от характеристик вычислительной машины, на которой решается задача. Для современных машин п zz 103—104 должно считаться достаточно большим. 2. Использование метода Монте-Карло представляется особенно удобным, если требуется оценить одно или небольшое количество скалярных произведений вида (Ji, х) с небольшим числом значащих цифр, ибо при этом нет необходимости в предварительном нахождении решения х. 3. Метод Монте-Карло можно применять, безусловно, к системе с матрицей | atij ||1^=*1, если норма матрицы ll aii}\l ?,i=i меньше единицы. Если это не так, то, как будет показано далее, оценки, построенные в этом параграфе, могут при любом выборе марковской цепи иметь бесконечную дисперсию, и требуются специальные исследования, чтобы сделать приемлемым время решения задачи. § 2. Схема Неймана—Улама и ее обобщения Имеется обширная литература, посвященная решению интегральных уравнений методом Монте-Карло. Как известно, задачам такого рода (решению интегрального уравнения переноса излучения) метод Монте-Карло обязан в основном своим развитием. Одной из первых работ, где обсуждалась общая схема решения интегральных уравнений, следует считать работу Альберта [1], а в отечественной литературе — работу Владимирова и Соболя [1]. Предыстория вопроса в связи с задачами переноса излучения через вещество изложена в монографии Спанье и Гелбарда [1]. Ряд дополнительных сведений, относящихся к предмету этого параграфа, читатель найдет также в монографиях Соболя [9] и Михайлова [12]. Мы ограничимся далее изложением круга вопросов, связанных с вычислительной схемой, предложенной
272 ЦЕПИ МАРКОВА И ИНТЕГРАЛЬНЫЕ УРАВНЕНИЯ [ГЛ. 6 Дж. фон Нейманом и Уламом. Схема эта применительно к системам линейных алгебраических уравнений была впервые опробована и изложена Форсайтом и Ляйблером [1], а затем изучалась и обобщалась в ряде работ, ссылки на которые имеются в тексте далее. Последующее изложение во многом следует работам Ермакова и Скворцова [1] и Ермакова и Нефедова [1]. Нами будет рассмотрен весьма широкий класс интегральных уравнений и связанных с ними цепей Маркова. При построении конкретных алгоритмов, как правило, будет необходимо налагать дополнительные ограничения на вид операторов и класс переходных плотностей. Вопрос этот обсуждается в конце параграфа. С другой стороны, возможны некоторые обобщения, связанные с выбором цепи Маркова, о чем также будет упомянуто. 1. Класс интегральных уравнений и связанных с ними цепей Маркова. Пусть Ж есть локально компактное хаусдорфово пространство и [х — or-конечная мера Радона на Ж. Через Lr (Ж, \i), 1 <; г < оо, или просто Lr, если это не вызывает недоразумений, далее обозначается пространство вещественных функций, r-я степень которых интегрируема относительно меры \х. Через CfC обозначим интегральный оператор из Lr в LT ЯГф = Jtf (х,.)Ф (x)\i (dx). F.2.1) Относительно CfC предположим: а) Вещественная функция К (ядро оператора Ж), определенная на декартовом произведении Ж X Ж, такова, что оператор с ядром | К | также действует из 2/в I/ (регулярность CfC). оо б) Ряд Неймана 2 ^Ч (/ ?= Lr) сходится в метрике Lr. Класс ядер, для которых эти условия выполнены, обозначим Жг. Пусть далее ф есть решение интегрального уравнения Ф = CfCy + / (/ е Щ F.2.2) и А ЕЕ L1 (Ж, [г), где ilr + ilt = 1. В этом случае для любых h и ф определено скалярное произведение (h, ф) = оо = J h (х) ф (х) \i (dx) и (h, ф) = 2 (^А Л). Поскольку
2] СХЕМА НЕЙМАНА — УЛАМА И ЕЕ ОБОБЩЕНИЯ 273 то (ф, h) можно представить в виде (ф, К) = 2 \ /o#o,i. • • Кг-глЬр1 (dSi). F.2.3) Здесь и далее обозначено 2< = {хи ..., xt)y /о = / (а>о), ht = h (ас,), Далее введем цепь Маркова, определяемую начальным распределением с плотностью р0 > 0, для которой l, F.2.4) и переходной плотностью р > 0 такой, что \, хг) \i (dXi) = 1 — g(x) (mod jx) F.2.5) и 0 ^ ^ < 1 [л-почти всюду. В случае, если g (x) положительна на множестве положительной меры, то условие F.2.5) трактуется как условие наличия некоторого фиктивного множества {а} (аЁ Ж) такого, что в него возможен переход из точки х с вероятностью g (x), но переход из него в Ж невозможен (поглощающее состояние, рассматривавшееся ранее в связи с решением систем линейных алгебраических уравнений). Для дальнейшего полезно воспроизвести процедуру моделирования цепи в каком-либо частном случае, предполагая, например, р0 up непрерывными функциями, $ — евклидовым пространством и \х — мерой Лебега. В соответствии с общими методами моделирования (гл. 2) выборочная траектория цепи строится следующим образом. Моделируя случайную величину с плотностью распределения ро (х), находим точку х0. Последнюю рассматриваем как начальную координату некоторой частицы, движущейся вдоль траектории цепи. Далее с вероятностью g (х0) частица поглощается. Если поглощение не про- *) Это следует из а-конечности меры jut, регулярности Ж и теоремы Тонелли.
274 ЦЕПИ МАРКОВА И ИНТЕГРАЛЬНЫЕ УРАВНЕНИЯ [ГЛ. 6 изошло, то моделируется случайная величина хи плотность распределения которой есть р (х0, хх)/A — g (x0)). Вообще, если известно ac,--i, то с вероятностью g (х^г) траектория обрывается, а с вероятностью 1 — g (#i-i) она продолжается и определяется xt — реализация случайной величины, распределенной с плотностью Р (xt -1, xt)l{\ — giXi-J). На множестве траекторий й цепи Маркова может быть введена вероятностная мера Зь. Если g (x) равна нулю ji-почти всюду, то она первоначально определяется на конечных отрезках траекторий длины N (цилиндрических множествах) так, что траектории х0 ->- х± ->...-> Xn сопоставляется плотность р0, /?0,1 ... Pn-i,n, а затем в соответствии с теоремой Колмогорова распространяется на все пространство траекторий. Здесь и далее обозначается ро = ро (»<>), Pi-i,i = P (Xi-i, xt), i = 1, 2, ... Случай, когда g отлична от нуля на множестве положительной jx-меры, может быть сведен к предыдущему. В этом случае при достаточно широких предположениях относительно р почти все траектории конечны и траектории длины к сопоставляется плотностьрорОу1 ... Ph-иъ gh* Множество траекторий в этом случае обозначим U', а меру на нем 3d'. Более точно (см. Дынкин [1], стр. 108, ИЗ) 36 пополняется уже упоминавшимся множеством {а} и строится вспомогательная цепь Маркова с вероятностью перехода, определяемой равенством Р (я, xi) у, (An) + хв (а) 8 И ПРИ х Ф а> В\{а} %в (а) при х — а. Здесь В ^ ?5 — а-алгебре подмножеств ЗЕ. Обозначим также ЗВ' = = ЗВ U {а} и S3' — наименьшая а-алгебра подножеств ^', содержащая {а}. Начальное распределение вероятностей может быть очевидным образом продолжено с (ЗВ, $5) на C6', ?$'). Соответствующую плотность обозначим р0. Этим определяется цепь Маркова, оо пространство траекторий которойf ТТЗЕ', 0 $5'\ мы обозначим через (Q', Л'), а вероятность на этом пространстве через 0>'. Рассмотрим далее в Q' подмножества вида Q и Qk = 38 ХЗЕ. . .ЗЕ X {а} X {а} X ... Л = 0, 1, 2,. . .,
2] СХЕМА НЕЙМАНА — УЛАМА И ЕЕ ОБОБЩЕНИЯ 275 которые измеримы и попарно не пересекаются. Из теоремы Ионеску Тулчи (Неве [1], стр. 228) следует: а) Если функция F определена и интегрируема относительно меры &>' на множестве траекторий (F €Е L1 (" , &>')) и F | Q'\o. = = О ?Р'-почти всюду, то = $ F (xoS. . •, хк) рощ. . . рй.х> kgkd[?+\ F.2.6) где F определяется равенством f (х0, . . ., хк) = F (xOt . . ., а, а, . . .)> a c?fife+1 есть сокращенное обозначение для (ifc+1(<?Efc б) ^'[QUU^] = 1' В частпости, при сделанных предположе- оо ниях всегда S = 2 в) Если р ее 2V1, что будет далее предполагаться, то с учетом F.2.4) и F.2.5) получаем &'[ U Йк] = 1, т. е. 5 = 1. F.2.7) 2. Линейные оценки и условия несмещенности. Пусть Qfe есть множество траекторий цепи Маркова длины к при условии, что почти все траектории конечны, и %пк — характеристическая функция (т. е. %ой есть функция траектории, равная 1, если траектория имеет длину /с, и О в противном случае). На множестве траекторий определим следующие функции (оценки) /. Если g ^> 0 на множестве положительной |х-меры, то положим J = 2 %ок7к, где Jk = 2 QP (жо, . •., ж») Л (ж,), F.2.8) и если g = 0 [л-почти всюду, то оо / = 2 &(хо>Xi,...)h(Xi). F.2.9) 2=1 В обоих случаях предпЬлагается, что / интегрируема на множестве траекторий введенной цепи Маркова.
276 ЦЕПИ МАРКОВА И ИНТЕГРАЛЬНЫЕ УРАВНЕНИЯ [ГЛ. 6 В соответствии со схемой Неймана — Улама будем далее предполагать фиксированным интегральное уравнение F.2.2), а цепь Маркова произвольной, удовлетворяющей наложенным ранее ограничениям, а также следующему условию. Если для некоторого набора (х0, ..., Хк) из Жк+1 ^1), F.2.10) то для него же PnPo,i Положим далее 9° П. (v <* -Ph-i,k /o/Po» Sh > qtt»t 0 = ?i }(s (», (mod » Жг, • lAfc+1). ж*). F F F .2. .2. .2. 11) 12) 13) и потребуем, чтобы оценка / была несмещенной оценкой функционала (ф, Л), т. е. М/ = (ф,Л). F.2.14) Заметим, что выполнение F.2.10) необходимо для несмещенности /, что следует непосредственно из теоремы Радона — Никодима (см. стр. 14). Изучим далее условия, налагаемые на o4fe) требованием несмещенности, предполагая, что g ]> 0 на множестве положительной |1-меры, оо К S Xak S I $% IS i1 (О', 5»') F.2.15) ft=0 2=0 (интегрируемость на множестве траекторий). Условие F.2.15) совместно с теоремами Фубини и То- нелли позволяет менять порядок суммирования, а также суммирования и интегрирования при вычислении М/.
§ 2] СХЕМА НЕЙМАНА — УЛАМА И ЕЕ ОБОБЩЕНИЯ 277 Таким образом, оо оо к м/= 2 S У**д* = 2 2 = 2 2 Очевидные преобразования и изменение порядка суммирования дают i=0 зсг+1 Приравнивая полученное выражение и выражение F.2.3) для (ф,А), получаем условие несмещенности 2 г=0 — 2 \ @<fc)pif i+i... рА_, kfodix*"} dui+1 = 0. F.2.16) Если теперь приравнять нулю выражение в фигурных скобках, то получаем достаточные условия несмещенности, впервые изучавшиеся Хисамутдиновым [3] *) ^!. F-2.17) = 0,1,2,... *) Можно считать, что это функциональное равенство, как и ряд следующих равенств такого типа, выполняется для А,-почти всех значений аргумента, где X есть степень меры [i, которую читатель легко определит. Как правило, указанное обстоятельство в тексте особо оговариваться не будет.
278 ЦЕПИ МАРКОВА И ИНТЕГРАЛЬНЫЕ УРАВНЕНИЯ [ГЛ. 6 Оценки, которые удовлетворяют этим условиям, были названы в упомянутой работе оценками «единичного» класса. Вопрос о необходимости условий F.2.17) при выполнении F.2.15) изучался в работе Ермакова и Скворцова [1]. Там же рассматривались условия несмещенности при g = О [х-почти всюду. Постановка вопроса о необходимости F.2.17) оказывается содержательной, если требовать выполнения F.2.16) при всех / из U, К из Nr и h из L1 (универсальная несмещенность). Из универсальной несмещенности следует прежде всего, что с необходимостью должно быть равно нулю каждое слагаемое в F.2.16). Дальнейшая редукция оказывается возможной лишь в отдельных случаях. Так, например, условия F.2.17) оказываются необходимыми для универсальной несмещенное- (к) ти, если (Di ; зависят лишь от двух аргументов, в число которых входит либо х0, либо хг. Отсюда, впрочем, вытекает, что в достаточно широком классе оценок, используемых при решении практических задач, условия F.2.17) оказываются необходимыми и достаточными для универсальной несмещенности. Если g = О jx-почти всюду, то разумно рассматривать сог-, которые зависят лишь от первых s (i) аргументов, где s (i) 7> i — целочисленная функция i. В этом случае легко получить аналог условий F.2.16) г=0 X {l - $ ЩРи М. . . Л(|)-1, з(г)Ф*(И ФМ = 0 F.2.18) 1 J и, приравнивая к нулю фигурные скобки, аналог условий F.2.17). Замечание 1. Пусть оценка вида F.2.8) 2 %лЛ2 Qik)hi является оценкой единичного класса для функционала (ф, h). Тогда, если положить для некоторого фиксированного N о(Л) = ' 0, i
§ 2J СХЕМА НЕЙМАНА — УЛАМА И ЕЕ ОБОБЩЕНИЯ 279 то оценка J [N] = 2 Как 2 Qik)h будет несмещенной г=о N оценкой функционала (h, 2 Wlf) • Это утверждение легко получить при выводе условий несмещенности, если учесть при этом обращение в нуль Q[k) при i > N. Замечание 2. Пусть Jf(j\ / = I, 2,..., — операторы из Lp(dc,\i) в Lp(?,\i) с ядрами Kij) и для некоторых /е?р, h^Lq, сходится ряд где Тогда, если цепь Маркова такова, что условие F.2.10) выполняется, если в нем Khi+1 заменить на Я^\+1, i — 0,1,..., в F.2.12) также Ki4 i+1 заменить на / а со(гй) удовлетворяют F.2.17), то 2 Х^ 2 оо / ^ у/)» будет несмещенной оценкой для (h, 3. Частные случаи и примеры несмещенных оценок. Упоминавшиеся ранее исследования необходимости выполнения условий F.2.17) дают основание для более подробного их изучения. При этом оказывается, что в наиболее простых и важных для практики случаях F.2.17) оказываются необходимыми и достаточными условиями универсальной несмещенности. Для того чтобы ясно представить себе структуру этих условий, полезно составить
280 ЦЕПИ МАРКОВА И ИНТЕГРАЛЬНЫЕ УРАВНЕНИЯ [ГЛ. 5 следующую таблицу: со<» I I 1 > <0 >f . • . F.2.19) 1 1 up) <№ Ц3)- • • Здесь стрелочками соединены (о[к\ соответствующие одной и той же траектории данной длины, а строку составляют (й[к\ входящие в одно и то же уравнение. При этом следует помнить, что со{^ есть функция к + 1 переменного #о, ..., xk. Как уже отмечалось, нашей задачей в первую очередь должно быть изучение наиболее простых оценок. Остановимся на некоторых частных случаях. Случай А. Система F.2.17) очевидно упростится, если положить °***я)(х0,..., xl+s) = (o(ol)(x0,..., хг) - со, (яво,.. м хг) F.2.20) при / = 0, 1, ..., к = 0, 1, ... При этих условиях F.2.17) переходит в +1- • -Pi+Z-1, г+^г+гФ?= 1» 1 = 0,1,..., F.2.21) где g (х) при Z = 0, при I > 0. х) = j F.2.22) Если, далее, предположить, что 5j (x0, ..., flc^ = cof (х{) |х'+1-почти везде, то получим условие несмещенности (необходимое и достаточное, если fi>j s J^00 (Ж, ji),
§ 2] СХЕМА НЕЙМАНА — УЛАМА И ЕЕ ОБОБЩЕНИЯ 281 / = 0, 1, 2, ...) оо 2 Щ(х)g(l)(х) = 1 для [х-почти всех acG$, оо 2 (о, (зс) g(l) (у) = 1 для }12-почти всех (зс, у) из Ж2. Напомним, что предполагалось р ЕЕ -ЛГ1, и из F.2.7) следует равенство оо 2^ (*) = !• F.2.23) Случай Б. Пусть Z = 0, 1, ..., 5 = 0, 1, ... В этом особенно простом случае F.2.17) принимает вид оо «о 0*0 ?0*0+ 2 5 coj(#>#i> ...,xi)p(x, »i)... .. -р(я5М1 flB,)g(»i) V = 1. F.2.24) Если же coz зависит лишь от первого аргумента «г (Xi, ..., X/+l) =сог (xi), то F.2.24) выглядит следующим образом: оо 2^@=1. F.2.25) г=о Возвращаясь к старым обозначениям, заметим (см. таблицу F.2.19)), что первый аргумент o5z есть xh т. е. та точка, в которой вычисляется значение функции к при движении по траектории. Наиболее употребительные на практике оценки удовлетворяют предположениям, при которых получено F.2.25), и могут быть выведены из этого соотношения. Исторически, конечно, дело обстояло не так. Сначала простейшие оценки употреблялись в расчетах, а затем изучались условия несмещенности. Приведем теперь конкретные примеры несмещенных оценок: Л= SXM*?, F-2.26) /?=0 НЬ
282 ЦЕПИ МАРКОВА И ИНТЕГРАЛЬНЫЕ УРАВНЕНИЯ [ГЛ. 6 т. е. на траектории х0 -> Xi-> ...->х& вычисляется величина t± Po Po,i Для этого случая coz = | n ' 7^n (см. таблицу F.2.19)) и выполнение F.2.25) тривиально. oo к Jz= 2j 5ta/c 2л Qfiii (o.z.z/) на траектории х0 ->¦ Xi ->- ... ->• xfe вычисляется величина /с VI /о /1Го,1 i—I» i -к г^0 Ро />о,1 ' ' * рг_1у { г (считаем, что при появлении отрицательного индекса соответствующая величина есть единица). В этом случае (oz = ^ 1, / = 0, 1, ... и выполнение F.2.25) вытекает из F.2.23). Остановимся теперь очень коротко на случае, когда g = 0 jx-почти всюду. Легко показать для этого случая, что оценка /3, для которой ог- = 1, ? = 0, 1, ..., является несмещенной. Это можно сделать непосредственно или используя F.2.18). Легко видеть, что приведенные оценки являются аналогами оценок, рассмотренных в предшествующем параграфе. Ряд других несмещенных оценок рассматривался в работах Михайлова [6] и Хисамутди- нова [3]. Некоторые из этих оценок (точнее, семейств оценок, зависящих от целочисленного параметра I или двух таких параметров 1ит (I, т^> 0)) приводятся ниже (проверка их несмещенности предоставляется читателю): (9 = F.2.28) о , iyt, к ~ё,+, F-2-29)
§ 2] СХЕМА НЕЙМАНА — УЛАМА И ЕЕ ОБОБЩЕНИЯ 283 к О, 1<т. F.2.30) Любая линейная комбинация несмещенных оценок с коэффициентами, сумма которых равна единице, очевидным образом является несмещенной оценкой. В частности, один из многих способов уменьшения дисперсии состоит в подборе этих коэффициентов на основе эмпирической оценки дисперсий и ковариаций оценок в процессе расчета. 4. Дисперсия оценок. Ниже будут выведены формулы, упрощающие изучение дисперсий оценок F.2.8) (Ермаков, Нефедов [1]). Из этих формул, в частности, сравнительно просто можно получить ряд более ранних результатов, полученных в работах Золотухина и Ермакова [1], Золотухина и Деева [1], Михайлова [4], а также некоторые результаты работы Майорова и Франк-Каменецкого [1]. Запись выражения дисперсии оценок вида F.2.8) в форме интеграла по мере З5', очевидно, не представляет труда. В ряде случаев, однако, оказывается возможным получение более простых выражений. Предположим, что оценка F.2.8) такова, что функция с» к траектории 2 %nfc ( 2 I Qf^i \) * интегрируема по мере S5', что эквивалентно условию интегрируемости с квадратом по мере $>' (принадлежности пространству оо к L* (Д\ #')) функции 2 XQ, 2 I Q{i\ I- Тогда /С=О i=0 2 $ ( 2 ( /с=о $k+i i=o PoPo,i- i=0 оо к i-i 2 $ S S y=i i=o
284 ЦЕПИ МАРКОВА И ИНТЕГРАЛЬНЫЕ УРАВНЕНИЯ [ГЛ. 6 Меняя в обоих слагаемых порядок суммирования и интегрирования, получим S * г, i+i- • • *м, A Таким образом, если обозначить + 2 то верна теорема: Теорема 6.2. Если оценка F.2.8) несмещена и оо к 2 %П/с 2 I (^i^il ?= ?2(Q', 55/), то ее дисперсия конечна и /с=0 г=0 равна F.2.32) Обсудим теперь структуру полученного выражения для дисперсии оценки / в некоторых частных случаях.
§ 2] СХЕМА НЕЙМАНА — УЛАМА И ЕЕ ОБОБЩЕНИЯ 285 Если o)i(z+1) (х0,..., Xi+t) = Sz (х0, ..., xi) (i, I = 0, 1, ...), то выражение F.2.31) для аг (х0, ..., хг) можно переписать в виде а{ (х0,..., хг) = афцд + Л» 2 оо m=l oo s=i ) Ют+stosPi+m, i+m+1' • • A+m+s-1, г+тп+з^г+т+зф8 d\lm. F.2.33) (Здесь для краткости опущены аргументы у всех 5; = ( )) Если со^г+о (х0, ..., xi+z) == (о/ (ac?f ..., aci+z), то (^2.31) имеет вид (здесь неудобно опускать аргументы у coz) й{ 2 S »?(asii • • м aci+г) a,i+i- • • A+i-i,i ОО oo I <0m (Xt, . . ., Xi+m) 0H (Xi+m) fcm + 2 J e=i %s X I <0m (Xt, . . ., Xi+m) 0H (Xi+m) fcm + 2 J «m+e^i» —>3Ci+m+8) X e=i %s X O)s('X{4.m9 . . ., Xj+m+s)/?j+m, i+m+i- • • A+m+s-1, i+m+s X т. F.2.34) Наконец, рассмотрим самый простой и весьма важный случай, когда сог зависит лишь от первого аргумента со/ {xt, ..., Xi+i) = со; (х^). После несложных
286 ЦЕПИ МАРКОВА И ИНТЕГРАЛЬНЫЕ УРАВНЕНИЯ [ГЛ. 6 преобразований получаем из F.2.34) оо .., хг) = а (хг) = hx 2 Ц F.2.35) где через К^т) обозначено т-е интегрированное ядро ядра К. Как следует из полученных результатов, структура дисперсии в общем случае тесно связана с рядом Неймана для интегрального уравнения Ш (mod(X)- F-2-36) М/2 есть, как следует из F.2.32), «осредненный» ряд Неймана для этого уравнения. С другой стороны, в состав «осредняющей» функции аг входит также осредненный ряд Неймана, связанный с двойственным для уравнения F.2.2) уравнением Ф* (х) = I К (х, у) Ф* (у) [х (dy) + h (x) (mod \i)y F.2.37) х что особенно легко видеть на примере формулы F.2.35). В случае, когдаat (x0, ..., xt) = a (xt), что имеет, например, место в формулах F.2.34) и F.2.35), выражение для дисперсии при некоторых дополнительных условиях оказывается непосредственно связанным с решением уравнения F.2.36), причем может быть получено и двойственное выражение для дисперсии. Этот результат, который просто следует из теоремы 6.2 и известных свойств сопряженных операторов, составляет содержание следующей теоремы. Теорема 6.3. Если выполнены условия теоремы 6.2, ai(xOi ..., xt) = a(xt) \11-почти везде и при некотором я > 1 f/Po е ?*, к*/р е 2?q, ha e Lq' (l/g + W = 1), то D/ = J ф (x) h(x) a (x) [x (dx) — (q>, h)\ F.2.38) зе
§ 2] СХЕМА НЕЙМАНА — УЛАМА И ЕЕ ОБОБЩЕНИЯ 287 где г|) (х) есть решение уравнения F.2.36), или в двойственной форме Dy=\v и ?Щ и (**) - (я>.feJ' F-2-39) где г|э* — решение уравнения а EС) й (зс)- F-2<40) Сделаем далее ряд дополнительных замечаний, связанных с условиями несмещенности и вычислением дисперсии оценок вида F.2.8). Замечание 3. Связь изложения с пространством Lr (Ж, |х) не слишком существенна. Полученные результаты (кроме, может быть, условий необходимости принадлежности оценок к единичному классу, о которых мы лишь упоминали) сравнительно легко можно сформулировать для других не слишком экзотических функциональных пространств. Мы исходили из того, что очень общее изложение там, где обобщения достаточно просты, вряд ли уместно. В этой связи заметим, что сравнительно просто, хотя и не вполне тривиально, обобщение полученных результатов на случай интегральных операторов вида где К (А, у) является при каждом у обобщенной мерой множеств А из некоторой сг-алгебры % подмножеств Ж. Здесь в случае неотрицательности К при выборе переходной вероятности Р (dx, у) цепи Маркова вместо выполнения F.2.11) следует требовать существования производной Радона — Никодима dK/dP, которую и следует использовать в формулах F.2.12). Если К знакопеременно, то следует попытаться выделить множитель, включающий эту знакопеременность, или использовать, как обычно, разбиение Ж на множества, где К знакопостоянно. Замечание 4. Использованные методы вычисления ДА/2 очень простыв идейном отношении, хотя и утомительны. Небольшая их модификация позволяет вычислить ковариации двух оценок вида F.2.8). Мы ограничимся тем, что приведем окончательный результат для
288 ЦЕПИ МАРКОВА И ИНТЕГРАЛЬНЫЕ УРАВНЕНИЯ [ГЛ. 6 М (/ /') в случае, когда сога+г) (х0, ..., xl+i) = 6>i(Xi): с i2K2 к2 ') = 2 ) ^"'.'.'Ci^^*'' {6'2'41) где F.2.42) Здесь штрихованные 6Z отвечают оценке /' и предполагается, что для каждой из оценок / и /' выполняются условия теоремы 6.2. Замечания 5. Если обсуждается вопрос о конечности дисперсии для некоторого множества функций h при фиксированном уравнении F.2.2), то легко заметить, что этот вопрос тесно связан со сходимостью ряда Неймана для уравнения F.2.36). Если же h2lg есть элемент некоторого пространства Я* (например, I/ C?, jx)), f2/p Ez -ff* (например, L1 (Ж, \х) — пространству, сопряженному Я), а оператор U с ядром ¦ действует из Я" в JET и ставится задача о конечности дисперсии для всех h2lg из Я, то можно сделать более определенные выводы. Например, в этом случае из теоремы 6.2 следует, что для оценок, удовлетворяющих условиям этой теоремы, необходимым и достаточным условием конечности дисперсии является выполнение неравенства 1ип||и*|IД<1. F.2.43) (См. Канторович и Акилов [1].) Легко привести примеры множеств уравнений F.2.2) и связанных с ними цепей Маркова, для которых F.2.43) выполнено. Можно, однако (что менее тривиально) привести и пример противоположного свойства. В работе Холтона [3] приводится пример такого оператора Ж, что при любом выборе цепи Маркова F.2.43) не выполняется.
§ 2] СХЕМА НЕЙМАНА — УЛАМА И ЕЕ ОБОБЩЕНИЯ 289 'а -~а 0\ Пусть CfC — матричный оператор К = \а —а ° » \0 О Я,/ | А, | < 1, а ^> 1. Легко проверить, что наибольшее по модулю собственное число К есть X. Соответствующий же оператор 91 определяется матрицей a2/pi ,2 0 \ I Л I V о' О Wpsfi) Ад+А,2<1; Ргд + А,2<1» среди собственных чисел которой имеются превосходящие единицу при любых допустимых ри j. 5, Дисперсии некоторых конкретных оценок. Рассмотрим некоторые наиболее употребительные оценки. 1. Оценка /х (см. F.2.26)), для которой coz(x) = l 0 jl/g(x), « = 0, = I n ; \ п выражение для ее дисперсии дается теоремой 6.2 и а (ас) выражается формулой F.2.35). Легко вычислить, что а (х) =h (x)/g(x). И при выполнении условий теоремы 6.2 \f$x-to,hF, F.2.44) гдеяр есть решение уравнения F.2.36). Или ^\Щх-^,И)\ F.2.45) где я|э* есть решение уравнения 2. Оценка /2 (см. F.2.27)), для которой fi>z = 1, Z 0,1,... Как и ранее, вычисляем а (ас) по формуле F.2.35): 2 S S 1=0 m=i s=o 10 СМ. Ермаков
290 ЦЕПИ МАРКОВА И ИНТЕГРАЛЬНЫЕ УРАВНЕНИЯ [ГЛ. 6 Или, с учетом F.2.23), получим во а (х) = h (х) + 2 2 $*<m) (ж, у) Л (у) Ц (<*у) = V (х) - А (х), тп=1# F.2.47) где ф* есть решение уравнения F.2.37). Запись аналога формул F.2.44) — F.2.46) не представляет труда. Используя формулы F.2.42) и F.2.41), легко также найти ковариацию оценок Jx и /2 в предположении, что они вычисляются при моделировании одной и той же цепи Маркова. Подставляя соответствующие fx и /2, S>i и и; соответственно, получаем Ъ (х) = ф* (х) и М (/i/2) ~ = (г|), <p*h) и cov (Л, Л) = (Ь Ч>Щ - (Ф, Щ\ 3. Оценка /5 (см. F.2.29)), для которой щ (xj+k) = I l/gi+K I = mo, rn0 > 0 — целое число. I 0, Z>m0, Подставляя coj в F.2.35) и используя равенство получим а (#j) = Л| + fe| ^ А, {+!• . . Pi+mo-l, г+гг>0 (l/?i+m0 — зегпо m0 + 22 ((#ТЛ) («О- гп=1 Но ТПф 77lo TTIq m=l Отсюда a (acO = fe{ ^ Pi, — A{ + 2<p* — 2 (ЛГ')т<>+1 ф*. F.2.48)
§ 2] СХЕМА НЕЙМАНА - УЛАМА И EEJ ОБОБЩЕНИЯ 291 4. Рассмотрим теперь оценку, которая вряд ли использовалась при практических расчетах, но представляет определенный методический интерес. Это оценка, у которой со^) знакопеременны: Если р €= Л^1, то из F.2.22) следует, что b(x) s(x) = 1 [Л-почти всюду, где s (x) есть решение интегрального уравнения F.2.49) Как и ранее, нетрудно получить выражение для а (х): a(x) = h{x)b2(x) + ^\ () (*, у) h (у) Ъ (у) [х (dy). Или, если ввести в рассмотрение интегральное уравнение Ф; (х) = - \ К {х, у) Ф; (у) |x {dy) + h(x)b (x), то при некоторых дополнительных предположениях относительно Ъ{х) (например, ограниченности ц-почти всюду) получим а (х) = 26 (х) <pl (х) - h (x) b2 (х). ^6.2.50) Полученное выражение свидетельствует, что знакопере- менность щ не приводит к резкому возрастанию дисперсии оценки во всех случаях (сравните F.2.50) и F.2.47)). 5. Легко убедиться, что при g (х) = 0 (х-почти всюду оценка J3, у которой все сог = 1, имеет выражение для дисперсии в точности то же, что и оценка F.2.27). Мы очень коротко воспроизведем выкладки, приводящие к этому результату (интегрируемость квадрата оценки на
292 ЦЕПИ МАРКОВА И ИНТЕГРАЛЬНЫЕ УРАВНЕНИЯ [ГЛ. 6 множестве траекторий предполагается): Л )* dSf> = 2 \ Я^РоРол • • • ft-i. i Ф*1 + г=0 %г+1 оо г—1 + 2 2 2 } WfiifyPoPoA • • • Pi-1, г = i—1 iO i - Ро?О 1 • • • Р\-\ г ?1 *-Ь Ъ Р0Р0 ! . . . /? • х • у r J г=1 j=o xj+l ' ' $i-j Те же приемы, что при вычислениях а (х) в предыдущих случаях, приводят к выражению D/3 = B/кр* - А2, г|)) - (ф, ЛJ. F.2.51) Или, в двойственной форме, (Ф, h)\ F.2.52) где гр (х) есть решение уравнения F.2.36), a if>* — решение уравнения S f^vfh {х) Bф*(х) -h {x))- F.2.53) Замечание 6. Сравнительно общий подход, развитый в данном параграфе, был осуществлен нами для уравнения F.2.2). Схема, связанная с «сопряженным» уравнением (где /, h и аргументы ядра К меняются местами), исследуется вполне аналогично. В результатах же имеются некоторые тонкие отличия, о которых кое-что будет сказано в следующем параграфе.
§ 3] ПОВЫШЕНИЕ ЭФФЕКТИВНОСТИ МЕТОДА МОНТЕ-КАРЛО 293 § 3. Повышение эффективности метода Монте-Карло при решении интегральных уравнений Очевидно, что методы главы 4 применимы для повышения эффективности вычислительных процедур, коль скоро задача вычисления функционала (h, ф) сведена к задаче вычисления интеграла по некоторой вероятностной мере. Так, например, если некоторые члены ряда Неймана могут быть вычислены аналитически, то это, как правило, приведет к уменьшению дисперсии оценки и вычислительной работы (последнее не всегда справедливо). Вместе с тем, как уже отмечалось, специальный вид меры, с которой связано вычисление (ср, К) в нашем случае, позволяет получить и нркоторые специальные результаты. Как следует из постановки задачи в § 2 для оптимизации вычислительной процедуры мы можем распоряжаться выбором марковской цепи и выбором оценки (набора о)?Л)). При этом мы фиксировали вид несмещенных оценок и не доказывали, что нет других более удачных оценок. Оправданием для принятой в § 2 точки зрения служит то обстоятельство, что рассмотренный там класс оценок включает все используемые на практике несмещенные оценки. Мы начнем с того, что выберем несколько простейших оценок и решим для них задачу об оптимальном выборе цепи Маркова, имея в виду, что простота является несомненным достоинством оценки. Задача оптимального выбора меры при оценивании интеграла \jd^' может быть решена методами § 2 главы 4. Как и в общем случае, если ЗР' абсолютно непрерывна по отношению к мере SPy, то Очевидно, что оценка / г F.3.1) является линейной оценкой (т. е. имеет вид F.2.8)). В соответствии с D.2.3) мера 3^ такая, что минимум дисперсии оценки F.3.1) достигается при ?РХ = SPq, выражается
294 ЦЕПИ МАРКОВА И ИНТЕГРАЛЬНЫЕ УРАВНЕНИЯ |ГЛ. 6 равенством F-3.2) Следует заметить, однако, что не для всякой оценки / можно найти пару (р(о\ jd@)) — начальное распределение и переходную вероятность такие, что мера ^о индуцирована этой парой (строится по р@0) и р@> таким способом, как это сделано в начале § 2). В этих случаях процедура моделирования, определяемая мерой ЗР'О, не будет процедурой моделирования марковской цепи, она будет значительно сложнее. О моделировании подобных немарковских процессов см. Хисамутдинов [4]. Мы остановимся лишь на случаях, когда мера SP'o связана с марковской цепью. Рассмотрим прежде всего оценку Jx (см. F.2.26)). Из F.3.2) легко видеть, что мера dS^ определяется на траектории длины к плотностью вероятности относительно меры \хн, где с — (| h |, ф), а ф является решением интегрального уравнения Ф (х) = \^\К (у, х) | ф (у) \х (dp) + \f(*M (mod \i). F.3.4) Введем в рассмотрение сопряженное к F.3.4) уравнение (х, у)| ф*(у)\i(dy) + \h(x)\. F.3.5) Предполагая h (x) отличным от нуля на носителе меры \х (из чего следует положительность Ф* на этом носителе), преобразуем F.3.3) к виду I f I CD* CD* CD* (D* I h I (| h I, ф ) ф0 фх ' Ф/t-i Ф/с Далее, очевидно, что ф ^>п и можно положить -=— = g. Ф*
§ 3. ПОВЫШЕНИЕ ЭФФЕКТИВНОСТИ МЕТОДА МОНТЕ-КАРЛО 295 Кроме того, ф*(у) — |h(у)\ =\\К(?Л ^)I ф*(») dx и i | JT (», x) | ф (ж) |i т. е. можно положить p(o) (у, х) = IК (у, х) I -t^L. F.3.7) Ф (У) Если заметить далее, что можно положить '^!^' F-3-8) поскольку выполняется условие нормировки (|/г |, ф) = = (I / I» Ф*)» т0 видно, что своего минимального значения дисперсия Jx достигает, когда мера, в соответствии с которой осуществляется моделирование, индуцирована цепью Маркова с переходной плотностью F.3.7) и начальной плотностью F.3.8). Вычислим это минимальное значение. Подставляя р = р<°> иро= р^ в F.2.36), с учетом F.3.7) и F.3.8) получаем ($,\\) (mod|i). ф i'*5^ Домножая обе части этого уравнения на Ф* (х) (которое положительно, ибо | h \ ^> 0 (mod (x)), замечаем, что 'Ф^Ф (а>) = ф ^^ Находим отсюда г|э (ас) и подставляем по- (ф| I h I) лученное значение, а также^значение g (x) в F.2.38). Находим, что минимальное значение^О/! есть (ф, | h |J — (ф, АJ. Если fy h и К положительны (mod (x), то это выражение очевидно равно нулю. Таким образом, нами доказана Теорема 6.4. Дисперсия оценки Jx при h Ф О (mod у) минимальна, когда мера F.3.2) индуцирована
296 ЦЕПИ МАРКОВА И ИНТЕГРАЛЬНЫЕ УРАВНЕНИЯ [ГЛ. 6 цепью Маркова с начальной плотностью F.3.8) и переходной плотностью F.3.7). Ее минимум равен (Ф, | h |J - (Ф, h)\ F.3.9) Замечание 7. Выражение F.3.9) для минимальной дисперсии очевидным образом следует также из формулы D.2.3). Замечание 8. Нами рассматривается уравнение Ф (х) = \^К (у, х) ф (у) \i (dy) + f (x) (mod (x). Если рассматривать уравнение ц>х (х) = \ К (х, у) <рх (у) \i (dy) + + f(x) (modjx), то для оценивания функционала (фь К) можно ввести оценку Jx: :к)к'"крмт' {6-ЗЛ0) рк к & (Ср. F.2.26).) Она получается из F.2.26) переменой мест Аи/и переменой мест аргументов в ядре К. Минимум ее дисперсии, однако, достигается, если в качестве начальной и переходной плотности выбрать соответственно *<?>'*{?' И р@)(х, у) = ?{? р(х, у) ^ (ф1, | k I ) ф! @5) где фх есть решение уравнения %(х) = ^\К(х, у)| Фх(у)|х(dy) + /(х) (mo Здесь в выражении для jo(oo) и /?@> не участвует решение двойственного уравнения, что не вполне тривиально. В остальном теория оценок типа 7Х с измененным порядком следования / и h строится вполне аналогично теории § 2. Заметим далее без доказательства, что для оценки /2 мера, на которой достигается минимум D/2, «не является марковской» (т. е. не индуцируется никакой цепью Маркова). Если же [I {x: g (х) ^> 0} = 0, то для оценки /3, яв- дяющедся аналогом J ^ в этом случае, можно указать pQJ и
§ 3j ПОВЫШЕНИЕ ЭФФЕКТИВНОСТИ МЕТОДА МОНТЕ-КАРЛО 297 р(°> такие, что по крайней мере для положительных /, К и h дисперсия /3 обращается в нуль. Справедлива Теорема 6.5. Если h (x) положительно (mod |ы), a f (x) и К (у, х) неотрицательны (mod jx) и (mod jj,2) соответственно, то при F.3.11) дисперсия оценки Js обращается в нуль. Доказательство. В данном случае g (у) = О (mod fx). Нормировка р0 (х) и р (у, х) проверяется непосредственно. Воспользуемся далее выражением F.2.52) для D/3 и найдем if* (х) из уравнения \ h {х) [2ф'{х) ~ h {х)]- Ф (х) — Ф B/) + Л (ас) [2Ф* (х) — ft (ж)]. F.3.12) Заметим, что когда сходится ряд Неймана для оператора с ядром К (у, х), то он сходится и для оператора с ядром К (Vi х) ) » 0 < г <С оо (mod ц). Это легко проверить непосредственным сравнением обоих рядов. Тем более это справедливо для ядра К(у,х) ^Шг » гДе ^i (») < г (ж). Преобразуем далее уравнение F.3.12) к виду V (х) = [Ф* (х) - h (х)} \ К (х, у) ?ig- |i (dy) + + Л(яс)[2ф"(дс)-А(я5)], что равносильно ^(х) = ф*(х)[\К(х, у)-№ц(dy) + 2h(x)]-
298 ЦЕПИ МАРКОВА И ИНТЕГРАЛЬНЫЕ УРАВНЕНИЯ [ГЛ. 6 Легко проверить, что решением этого уравнения является функция -ф* (х) = [ф* (х)]2. Так как D/3 = (г|Л -?-) — /2, то, подставляя в это выражение значение if* (х) и /?0 (х), получаем D/,= что и требовалось доказать. В работе Михайлова [4] содержится более сильный результат, заключающийся в том, что при условиях теоремы оценка /3 постоянна на всех траекториях цепи C.6.12). Сравните также полученный результат с результатом Холтона (теорема 6.1) для систем линейных алгебраических уравнений. Следует отметить также, что для широкого класса интегральных операторов и оценок на основе результатов § 2 может быть показано, что малое (по норме) изменение переходных плотностей и начальных распределений выбираемой цепи ведет к малому изменению дисперсии. Такого рода задача об устойчивости была, по-видимому, впервые сформулирована в работе Марчука и Ермакова [1]. Результаты для оценки /3 получены Михайловым [4]. Для оценки /х это сделать совсем просто. Из сказанного следует, что априорные сведения о решении ф* сопряженного уравнения или — в случае оценок типа F.3.9) — прямого уравнения могут быть использованы для уменьшения дисперсии оценки. О приложениях такого рода приемов уменьшения дисперсии к конкретным задачам будет сказано далее. В сложных задачах (типа задач переноса излучения через вещество) обычно не так просто вычислить нормировку переходной плотности, выбранной из соображений, связанных с уменьшением дисперсии, а использование прямого или сопряженного уравнения часто жестко диктуется простотой моделирования. Значительное разнообразие возникающих при этом ситуаций требует разработки широкого арсенала приемов уменьшения дисперсии, ибо критерием качества служит не дисперсия, а количество вычислительной работы, и нужно внимательно следить, чтобы уменьшение дисперсии соизмерялось с усложнением алгоритма, которое часто имеет место.
§ 3] ПОВЫШЕНИЕ ЭФФЕКТИВНОСТИ МЕТОДА МОНТЕ-КАРЛО 299 Выбор оценки является другим, иногда не менее важным средством, позволяющим повысить эффективность алгоритма. Практически при выборе оценки большую роль играют соображения, связанные с существом задачи. С теоретической же точки зрения при сравнении дисперсий возникает та же ситуация, что и при сравнении качества различных случайных квадратурных формул. Полезно иметь в виду, что при сравнении двух оценок / и /' иногда можно указать два различных класса содержательных задач таких, что для первого лучше /, а для второго /', но иногда может оказаться, что одна из оценок всегда хуже для всех содержательных задач. (Строгое описание подобных ситуаций и примеры приводятся ниже.) Отметим прежде всего следующее обстоятельство, касающееся простейших оценок. Сравнение выражений для дисперсий оценок Jx и /2 показывает, что в зависимости от вида уравнения и вида используемого марковского процесса может оказаться предпочтительной либо /1? либо /2, т. е. нельзя утверждать, что одна из оценок заведомо хуже другой при любых обстоятельствах. Для обоснования этого утверждения достаточно сравнить функционалы (h2/g, \р) и BАф* — h2, t|)). if> — в обоих случаях одна и та же функция. Предположим, что /г, ф* и К — положительные функции. Тогда ф* = ЯГ*ф* + h > h при всех х, 2Аф* — № 1> h2 и есть такие К, для которых {Щ* - А2, г|)) = (h2 + б, г|>), где 6 = 6 (х) > 0. В этом последнем случае B/кр* — А2, яр) = (h2 + б, \|)) и при h2) до Если же g достаточно мало, то легко видеть, что может иметь место неравенство противоположного знака. Количество вычислительной работы при использовании обеих этих оценок при простых h отличается мало. Добавочной работой на суммирование при использовании /2 обычно можно пренебречь. Если же вычисление значений h весьма трудоемко, то оценка Jx при соответствующем выборе g может оказаться предпочтительней. При этом следует иметь в виду, что речь идет о вычислении значения одпогд кон-
300 ЦЕПИ МАРКОВА И ИНТЕГРАЛЬНЫЕ УРАВНЕНИЯ 1ГЛ. 6 кретного функционала. Вопрос о поведении дисперсий конкретных оценок рассматривался в ряде работ (например, Михайлов [12], Соболь [9], Хисамутдинов [4], [5], Спанье и Гелбард [1]). В наиболее общей форме вопрос о выборе оптимальных оценок единичного класса обсуждался Хисамутдиновым [5]. При (фиксированной цепи Маркова задача выбора несмещенной оценки с минимальной дисперсией оказывается вариационной задачей с ограничениями, которая имеет, как правило, бесконечно много решений. Если удастся сделать разумные дополнительные предположения относительно класса решаемых задач и преодолеть аналитические трудности, которые при решении упомянутой вариационной задачи могут быть значительными, то можно получить оценку или семейство оценок, эффективных при решении задач этого класса. К сожалению, очень часто стремление уменьшить дисперсию приводит к непомерно сложным оценкам, и выделение классов сравнительно простых в вычислительном отношении несмещенных оценок представляет собой важную самостоятельную задачу. Если выделен некоторый класс Щ оценок такой, что для каждой оценки из Щ критерием ее качества может служить дисперсия, то можно сформулировать следующее определение допустимости оценки. Пусть в = {(/, К, К)} есть множество троек /, К, h, которые пробегают некоторые подмножества из Lr, Nr и IJ соответственно, а ф = {(р0, р)} — подмножество множества пар плотностей, для которых при любой тройке (/, К, h) Ez @ условия F.2.10) и F.2.11) выполняются. И пусть Щ — класс оценок, несмещенных и имеющих конечную дисперсию для любых (/, К, h) €= © и (р01 р) ЕЕ GE ф. Про оценки /, /' из Щ будем говорить, что /' доминирует / для © и ф, и писать /' У /, если для любой тройки (/, К, h) ЕЕ © и любой пары (р0, р) ЕЕ ф имеет место неравенство D/' ^ D/, которое является строгим хотя бы для'одной тройки из @ и одной пары (р01 р) из ф. Допустимой оценкой в $ для © и ф будем называть такую, для которой нет доминирующей ее оценки в %. Описание класса допустимых^оценок, как обычно, позволяет осуществить редукцию проблемы оценивания, т. е. отбросить заведомо плохие оценки.
§ 3] ПОВЫШЕНИЕ ЭФФЕКТИВНОСТИ МЕТОДА МОНТЕ-КАРЛО 301 Простейший пример позволяет убедиться в содержательности задачи построения допустимой оценки. Пусть ЗЕ = [0, 1], р0 (х) =1, р (х, у) = р, где р ЕЕ [0, 1], /, К и h фиксированы и постоянны, Щ состоит из^оценок / (т), т = 1, 2, ..., у которых / 1 1 — т в, = A ~ Л />т ' I 0 , 1фт. В этом случае легко получить, что -ф = pf/(p — К2), а = Л/A )ш т. е. Поэтому /х допустима в $ и при т <С п Jт )>- /п. Если © и ф — более широкие классы, то примеры недопустимых оценок не столь тривиальны. Впрочем, обобщение предыдущего примера на достаточно широкие классы © и ф сравнительно просто. Если для любой пары (р0, р) ЕЕ Gf, 0 < а < g (X) < р < 1, ju-почти всюду, @ — максимально широкое при данном ф множество троек функций f^L^K^JSF^h^L1, а Ш = {/ (m)}J°, причем при любом яг натуральном то' ip > 0, а (х) = Л (x)/g(w) (x), MJfm) = (ф, -gj-^ и, оче- видно, p-i A - а)-т (г|), А2) < МД < а-1 A - Р)"™ (of, fe2), т. е. существует такое т1 ^> 0, что для всех т ^> т1 J A) )>- /(w). Определение допустимости формулировалось б О р фрр нами в самом общем случае. Очевидно, что возможен ряд частных случаев, представляющих специальный интерес (фиксация цепи Маркова, например). Мы не будем останавливаться на них, а перейдем к некоторым другим приемам, позволяющим повысить эффективность метода Монте-Карло. ГМетод [выделения главной части может оказать большую пользу. Как мы видели, при интегрировании по траекториям цепи Маркова имеется некоторая специфика срав-
302 ЦЕПИ МАРКОВА И ИНТЕГРАЛЬНЫЕ УРАВНЕНИЯ [ГЛ. 6 нительно с общими результатами главы 4. В частности, специфическими особенностями обладает метод существенной выборки. Что касается метода выделения главной части, то его применение затруднений не вызывает. Действительно, пусть ф = Хц> + f — уравнение, подлежащее решению, и ф' = У?'ц)г + f — «похожее» на него уравнение, решение которого известно. Тогда «добавка» Дф = ф' — ф есть решение уравнения Аф = ЖАу + {Ж' — Ж)ц' + /'—/, F.3.13) которое лишь правой частью отличается от исходного. Если Аф мало, то выигрыш может быть значительным. Не требует особых пояснений случай, когда первый или несколько первых членов ряда Неймана могут быть вычислены аналитически, либо когда по некоторым переменным легко произвести аналитическое интегрирование. За счет этого можно, как правило, существенно уменьшить вычислительную работу. Использование ветвящегося процесса (Кан [1], Фролов, Ченцов [3], Фролов [1], Огибин [1]), является важным и употребительным средством уменьшения дисперсии. Считая для простоты |li мерой Лебега, а Ж — областью 3) евклидова пространства, рассмотрим следующую конструкцию ветвящегося процесса. Пусть р0 (х) — плотность начального распределения, a pt (ас, у), i —0, 1, ..., т —1, — переходные плотности, причем Считаем, что в начальный момент рождается одна частица в точке х0, распределенной с плотностью р0. которая делится на т аналогичных частиц. Каждой новой частице присваивается номер @, /х), jx = 0, ..., т — 1, и она может с вероятностью gjt (x0) погибнуть, а с вероятностью 1 — gh (х0) перейти в точку xOjJ-l, распределенную в 2) с плотностью ph (х0, хо^)/A — gh (x0)). После перехода каждая из частиц ведет себя аналогично исходной, т. е. делится на т частиц, номер каждой повой частицы имеет вид @, /l, 72)> U = 0, ..., т — 1 и т. д. Номер частицы и точки, в которую она переходит, отражает ее родословную — содержит в себе номера частиц, от которой она произошла. Такой номер бывает удобно рассматривать как число в m-ичной системе.
§ 3] ПОВЫШЕНИЕ ЭФФЕКТИВНОСТИ МЕТОДА МОНТЕ-КАРЛО 303 В результате реализации такого процесса образуется дерево с конечным или бесконечным числом поколений частиц (максимальное число поколений равно максимальному числу разрядов в етг-ичном представлении номеров частиц). Мы будем предполагать, что процесс таков, что с вероятностью единица число поколений конечно. Подробнее вопрос о выборе такого процесса освещен в § 1 главы 7. Дерево, получающееся в результате реализации процесса, мы будем рассматривать как объединение линейных траекторий. Линейной траекторией, принадлежащей дереву, будем называть совокупность точек х0, х0, ix, ас0| ju 7-t,..., х0, ju...,JK. F.3.14) Предполагается, что частица с номером @, jv ..., jk) потомков не имеет. Само дерево образуется объединением траекторий вида F.3.14), причем эти траектории «слипаются» в точках с общим номером. Обозначим совокупность всевозможных деревьев с конечным числом поколений через Г, а дерево из этой совокупности — через у. Различные ттг-ичные числа вида 0, /1? ..., ]к будем обозначать буквой vfe, а отношение vk ЕЕ у будет означать, что в составе дерева у содержится точка с номером v^ и предшествующими ей номерами (т. е. линейная траектория F.3.14)). Маргинальная плотность, соответствующая траектории F.3.14), есть, очевидно, я [v J = р0 (х0) х ХР]Ах0, Xs,) ... pjK (x4_v xVjt)g(«vA.), а плотность, соответствующая дереву у, есть п(у)= Д я [vk\, где штриху знака произведения означает, что одинаковые сомножители берутся в произведении только один раз. Представим ядро К (у, х) оператора Ж в виде суммы т—х K(yix)= 2 К{^{У1х) и соответственно оператор Ж т—1 в виде Ж = 2 ^)щ Положим /о potn о, ?.¦!!'''>.'¦>. «*.
304 ЦЕПИ МАРКОВА И ИНТЕГРАЛЬНЫЕ УРАВНЕНИЯ [ГЛ. 6 и будем сопоставлять траектории F.3.14) случайную величину к 1=0 где со(;/с) удовлетворяют условиям несмещенности F.2.17), соответствующим я (v/c), а дереву у — случайную величину jy(N) = 2 ?vk[Wb F.3.16) Оценка / равна "" F.3.17) где ynY является характеристической функцией дерева данной конфигурации, определяемой числами v*, принадлежащими ему. При вычислении математического ожидания случайной величины в общей сумме выделим слагаемые, соответствующие набору линейных траекторий «<и »о> xoJi 5 •••; «о» ^о,л» «о,Л,^' и т- Д- ПРИ некоторых фиксированных j\, /а, ..., /лг. На основании замечаний 1 и 2 § 2 гл. 6 легко получить, что эти слагаемые дадут в математическое ожидание вклад N I J [Д, 72, ¦.-,/*]= (Л, //го" + S Л" ( П ^U х Z=i m i=l а математическое ожидание оценки F.3.17) есть т—1 N Последнее равенство легко следует из соотношения т—1 х11 = [ж-@) + • • • + ^(т'1) 1V = S ^(jl> • • • x"l)f- ii,--.,iz=o Разделение дерева на линейные траектории было произведено нами лишь для упрощения доказательства. Этим разделением было вызвано и введение множителя l/mN в qQ и последующее умножение на т в величинах qt. Это по-
§ 3l ПОВЫШЕНИЕ ЭФФЕКТИВНОСТИ МЕТОДА МОНТЁ-КАРЛО 305 зволило использовать ахщарат линейных оценок и полученные ранее условия несмещенности. В действительности при вычислениях используется обычно ®\к\ соответствующие простейшим оценкам F.2.26), F.2.27), у которых ы\к) совпадают для всех линейных траекторий, где они «слипаются». В этом случае легко перейти к пределу при 7V ->¦ оо, и справедлива следующая теорема: Теорема 6.6. Если при сформулированных ранее условиях на переходные плотности {х^.} есть множество точек дерева у и каждой точке xv. сопоставлен «вес» Ро то Если же xv — точки обрыва линейных траекторий, составляющих дерево, то h(x.) Читатель без особого труда может обобщить полученные, в связи с переходом к ветвящемуся процессу, результаты на неоднородный случай (когда pj зависят от номера поколения) и случай, когда разбиение оператора Ж на слагаемые также зависит от номера поколения частиц. Если имеется модель некоторого явления, описываемая однородной цепью Маркова, то в ряде случаев для уменьшения дисперсии искомой величины удобно бывает перейти к ветвящейся цепи, используя теорему 6.5. Эта же теорема позволяет перейти к линейной цепи, когда имеется модель, описываемая ветвящейся цепью. Вычислительные вопросы, связанные с моделированием ветвящихся процессов, достаточно подробно описаны в литературе (Голенко [1], Фролов [1]). Мы остановимся подробнее на этих вопросах в § 1 главы 7. Ветвление процесса, если одним испытанием считать реализацию всего дерева и осуществлять разбиение положительного ядра К (у, х) на положительные слагаемые К^ {у, х), ведет
306 ЦЕПИ МАРКОВА Й ИЙТЕГРАЛЬЙЫЪ УРАВНЕНИЯ 1ГЛ. 6 к уменьшению дисперсии на одно испытание, но к увеличению вычислительной работы. Построение в этих условиях вычислительных процедур высокой эффективности — важная и сравнительно малоисследованная задача. Таким образом, при решении интегральных уравнений каждой исходной цепи Маркова и оценке марковской модели можно сопоставить бесчисленное множество моделей, приводящих, вообще говоря, к различному объему работы для решения данной задачи. Основная задача состоит в выборе некоторой конкретной эффективной модели. Эту задачу в настоящее время нельзя считать даже полностью сформулированной. В большинстве случаев она решается на основе интуитивных (или так называемых «физических» в задачах с физическим содержанием) соображений. Подбор подходящей модели может быть осуществлен также экспериментально на основе предварительных малых выборок. Этот подход обсуждался в работе Фролова и Ченцова [2]. Остановимся далее очень кратко на некоторых более специальных приемах повышения эффективности алгоритмов решения интегральных уравнений, разработанных Михайловым [10], [12] и Михайловым и Назараллие- вым [1]. Задача уменьшения дисперсии при вычислении не одного, а некоторого множества функционалов имеет, очевидно, важное значение (сравните § 2 гл. 4, стр. 141). Возможны различные ее постановки. Одна из них состоит в том, что в предположениях § 2 (см. также замечание 2 в конце этого параграфа) мы считаем, что h = h(x,t), teT, т. е. зависит от параметра t из множества Т. Требуется выбрать марковскую цепь (р0, р) так, чтобы минимизировать среднюю дисперсию оценки 67 = [ DJ(t)X(dt), F.3.18) f где X — or-конечная мера, определенная на ст-алгебре подмножеств Т. Предположим: а) Изменение t на носителе меры X не выводит нас за пределы соответствующих пространств (h (х, t) ЕЕ Lq, t<= Т).
§ 3] ПОВЫШЕНИЕ ЭФФЕКТИВНОСТИ МЕТОДА МОНТЕ-КАРЛО 307 б) Искомые плотности р0 и р имеют вид ) , F.3.19) \ К (у,х) г (a>)dx где г — положительная функция. Тогда, согласно F.2.44), где я|) есть решение уравнения F.2.36) и от t не зависит. Средний квадрат математического ожидания \ f есть по теореме Фубини Отсюда следует, что, если h0 (х) = \ h2 (x,t) X (dt) ^ Lq, то из теоремы 6.4 легко заключить, что минимальный средний квадрат математического ожидания JL = J1 (t) будет получен, когда г (х) = фо (х), где ф0 есть решение уравнения Фо (х) = ^К(х, у)ф*(у)dy + h0(x). При этом легко вычислить, что минимальным значением дисперсии будет (<pf h0J — Г\ (ф,h{t))% (dt)\ . Значительно труднее решить задачу об оптимальном выборе функции г в случае оценки J3. Михайловым и Назараллиевым [1] показано, что оптимальная функция г существует и в этом случае, но для ее построения необходимо решить нелинейное интегральное уравнение. Наконец, заметим, что удачная замена интегрального уравнения эквивалентной системой интегральных уравнений может служить источником некоторых приемов повышения эффективности метода Монте-Карло. Один из вариантов такой замены состоит в следующем. Пусть ЭЕ — область 3) s-мерного евклидова пространства. Разобьем ее на т непересекающихся подобластей 25,-, i = 1, ..., т*
308 ЦЕПИ МАРКОВА И ИНТЕГРАЛЬНЫЕ УРАВНЕНИЯ 1.ГЛ. 6 Обозначим A. Xi(aC)~l0, Тогда уравнение Ф (х) = ^К (у, х) Ф (у) dy + / (х) F.3.20) очевидным образом оказывается эквивалентным системе т = \ S K(y,x)^j(y)dy + xi(x)f(x), F.3.21) где г|^ (ас) = ф (х) Хг (#)• Описание алгоритмов расчета для этого случая и сведения об оптимальном разбиении области читатель может найти в монографии Михайлова [12]. § 4. Некоторые приложения 1. Интегральное уравнение переноса излучения и непосредственное моделирование. Вернемся теперь к задаче о прохождении излучения через вещество и рассмотрим ее с точки зрения результатов, изложенных в этой главе. Модели, описанной в главе 3, очевидно, соответствует марковский случайный процесс, однородный во времени, причем движения частиц в фазовом пространстве их координат и скоростей независимы друг от друга и одинаково распределены. С другой стороны, процесс переноса излучения может быть описан интегродифферен- циальным уравнением переноса, которое может быть сведено к интегральному уравнению. Последнее будет интересовать нас главным образом, так как позволит сопоставить непосредственное моделирование с методами решения интегральных уравнений. Имея в виду, что энергия частицы однозначно связана с модулем скорости, будем вместо Е и Q рассматривать вектор v скорости частицы, где это удобно. Обозначим и (t, r, v) плотность числа частиц, проходящих в точке г со скоростью v в момент времени t. Если функцию и можно нормировать так, чтобы интеграл от нее по фазовому пространству
§ 4] НЕКОТОРЫЕ ПРИЛОЖЕНИЯ 309 переменных х = (?, г, v) был единицей, то она может трактоваться также как плотность вероятности частице в момент времени t пройти через точку т со скоростью v. Интегродифференциальное уравнение переноса относительно функции и (t, r, v) имеет вид (Дэвисон [1], Фролов, Ченцов [3]) ^ + (u-grada) = f(x) - | v + \v(r,v')\v\ 2дел (г, | v' |) K2 (v\ v, г) и (t, r, v') dv\ F.4.1) где 2 (r, | v |) — полное макроскопическое сечение взаимодействия; 2 рас и 2дел — соответственно макроскопические сечения рассеяния и деления; v" — среднее число новых частиц, образовавшихся в результате деления; Кг (v\ v, r) — плотность вероятности изменить при рассеянии скорость vr на скорость v (индикатриса рассеяния); К2 (t/, v, r) — плотность вероятности рождения в результате деления частицы со скоростью V, если исходная частица имела скорость v';f (x) — плотность числа частиц, рождаемых источником. Мы будем, далее, ради простоты изложения рассматривать подробно стационарный случай-^- = 0 при отсутствии деления 2дел =0. При этом наиболее поучительным является рассмотрение уже описанного довольно подробно случая прохождения у-квантов через вещество. Для ядерного каскада, также рассмотренного в главе 3, может быть сформулировано уравнение переноса вида, аналогичного F.4.1), но мы не будем рассматривать далее каскадные процессы в связи с интегродифференциальным уравнением. Интегральное уравнение, соответствующее уравнению F.4.1), имеет вид ер (х) = \К {у, х) Ф (у) dy + f (x), F.4.2) где ф (х) есть плотность взаимодействий частиц с веществом в точке фазового^пространства х =,(?*, v), К (у, х) — плотность вероятности частице испытать взаимодействие
310 ЦЕПИ МАРКОВА И ИНТЕГРАЛЬНЫЙ УРАВНЕНИЯ [ГЛ. 6 в точке х после взаимодействия в точке у = (г', v'), f (x) — плотность взаимодействия частиц, вышедших непосредственно! из источника. Физический смысл интегрального уравнения достаточно прозрачен. Оно означает, что плотность взаимодействий в точке х слагается из плотности, обусловленной источником, и плотности взаимодействий во всем фазовом пространстве Л X 2^, из любой точки которого у возможен переход частицы в точку х с плотностью вероятности К (г, х). Равносильность уравнений F.4.1) и F.4.2) может быть доказана при весьма широких предположениях относительно входящих в них функций. Формальный переход от F.4.1) к F.4.2) может быть осуществлен при помощи преобразования Лапласа. Ядро К (у,х) уравнения, как правило, является субстохастическим, т.е. \ К (у, х) dx = 1 — g (у), где 0 < ^B)С- § {У) имеет смысл вероятности поглощения (гибели) частицы. Последняя может быть обусловлена различными физическими причинами, как то: захват частицы ядром вещества или выход ее за пределы объема, заполненного веществом (в вакуум). В случае задач переноса излучения, кроме того, ядро представляет собой при фиксированном у плотность обобщенной меры, и интегральные операторы действуют, вообще говоря, в пространствах обобщенных функций. Все результаты предшествующего параграфа можно распространить на этот случай (см. замечание 2 § 2). Поскольку мы не занимаемся специально задачами переноса, то ограничимся ссылкой на это замечание (см. подробное изложение у Спанье и Гелбарда [1] и Михайлова [12]). Для случая прохождения у-квантов через вещество ядро интегрального уравнения F.4.2) принято записывать в виде X ., 3(а»ехр(-т(у,а>)) g /Q r-r' \ g 4 g. где ak (у -> х) б (К - К - 1 + Й?У) = Кг (у, х) -индикатриса комптоновского рассеяния, к — безразмерная длина волны у-кванта, связанная с энергией, заданной в электрон-вольтах, соотношением X = тс2/Е, где т —
§ 4] НЕКОТОРЫЕ ПРИЛОЖЕНИЯ 311 масса покоя электрона, с — скорость света. В случае у-квантов бывает удобно вместо энергии Е рассматривать длину волны X. Величина т (у, х) носит название оптической длины между точками у и х и определяется равенством х (у, х) = \ 2 (г' + *О, X) dt, F.4.4) б (х) обозначает б-функцию Дирака, т. е. обобщенную функцию, определяемую соотношением \ / (х) б (х — х0) dx = f (xQ) для всех финитных функций / (х). Присутствие первой б-функции в ядре уравнения означает, что длина волны к у-кванта после рассеяния однозначно определяется направлением движения после рассеяния (см. соотношение C.1.1)). Вторая из б-функций означает, что интегрирование по Q вырождается и дает в результате значение подынтегральной функции на линии, соединяющей точки г' и т. Будем также обозначать К, (У, х) = S <*> у_|.-у' *» 6 (О - 7^gf) , F.4.5) так что К{у,х)=-^^-К1{у,х)Кг(у,х). F.4.6) Индикатриса рассеяния Кг (у, х) не зависит от переменной г', а К2 (у, х) не зависит от переменных X' ий'. При переходе к полярным координатам с началом в точке т' вид ядра упрощается. Удобно в качестве новых пространственных переменных выбрать t =| г — г' |, |л = = cos G = (Q, Я') и ф — азимутальный угол. Якобиан преобразования равен в наших обозначениях t2d\idq). Имеют место следующие соотношения (условия нормировки): d^K1(y,x)dt = l, где (io^
312 Цепи Маркова и интегральные уравнения trji. 6 (см. соотношение C.1.3)) и 2 (ж) ехр (- т (у, х)) dt = 1 F.4.7) (см. C.1.1)). Последнее равенство обозначает, что когда г = (ас, у, «) может принимать любое значение: —оо < <Х<+оо, —оо<г/< +оо, —oo<s< + oo,ToZ2(y,a0 нормировано по х на единицу при любых X, |li и ф. Таким образом, если объем, в котором происходит движение у-квантов, есть трехмерное евклидово пространство по переменной г, 2 (х)^>0 для всех х, то ядро К(у,х) удовлетворяет соотношению К (и пг\ с\пг — 2рас ^ — 1 2погл (У) ^ а где 2ПОГл есть сечение поглощения частицы. В этом случае К (у, х) может быть выбрано в качестве р (у, х) — переходной плотности марковского процесса, и g (у) = = 2П0Гл (?/)/2 (у) равна вероятности физического поглощения частицы в точке у. Если отлична от нуля мера множества тех й, для которых 2 (г' + ^» ^) обращается в нуль при t > а, где а — положительное фиксированное число, а г' и X произвольны (это имеет место, например, в случае пространственно ограниченной области изменения г), то частица может покинуть область и вероятность ее возвращения может быть равна нулю. Это явление называют утечкой из области. Состояние, при котором частица безвозвратно покидает область, также является поглощающим состоянием. Таким образом, в общем случае в (У) равна вероятности поглощения (физического) в точке у плюс вероятность того, что точка у находится вне области Л. В обоих случаях легко видеть, что выбор в качестве р (у, х) ядра К (г/, х) приводит к непосредственному физическому моделированию, которое было описано в главе 3. Будем далее считать для простоты, что область Л, в которой 2 (х) отлична от нуля, выпукла. Тогдэ 1 — g (у) для тех у, у которых пространственная составляющая г принадлежит Л, есть 2раСс (|/)/2 (у) и равна нулю, если г лежит вне области Л. Легко видеть, что когда вычисляется вероятность выхода частицы из области Л, то h (х) = б (г — s), где 8 принадлежит границе области
§ 4] НЕКОТОРЫЕ ПРИЛОЖЕНИЯ 313 J#. Если при достаточно большом | г | 2 (х) равна нулю для множества Q положительной меры при некотором фиксированном начале полярных координат, то оценки /3 и /2 в этом случае совпадают. Действительно, g-t в нашем случае равно единице и /х = У2, если траектория обрывается при выходе частицы из области, и нулю — в противном случае. 2. Простейшие примеры «фиктивных» моделей. Если в качестве р (у, х) выбрана функция, отличная от К(у,х), или в качестве р0 (х) выбрана функция, отличная от / (ас), то модель, описываемая марковской цепью (р0» р), не будет, вообще говоря, соответствовать физической картине переноса излучения. Однако при выполнении определенных условий (условия F.2.10)), которые в данном случае означают абсолютную непрерывность меры, индуцированной (/, К), по отношению к мере, индуцированной (р0, р), могут быть построены несмещенные оценки любых средних по траекториям реального процесса. Приведем некоторые простейшие примеры конструирования фиктивных моделей. а) Учет вероятности физического поглощения с помощью статистических весов. Если нас интересует вероятность выхода из области Я, размеры которой таковы, что в среднем происходит несколько взаимодействий частицы с веществом до выхода ее из пределов J?, и величина 2рас/2 мала, то выход частицы из Я будет редким событием и дисперсия оценки может оказаться очень большой. В качестве переходной вероятности в этом случае разумно выбрать рас ^"/ При этом, очевидно, траектория фиктивной частицы не будет обрываться внутри области Я и всегда будет оканчиваться выходом из области. Величины Q[k) при этом будут отличны от единицы. Согласно F.2.12) qu i+1 = = 2рас (#i)/2 (#*)• Частица не поглощается, но «вес» ее убывает от столкновения к столкновению. Такой прием увеличивает количество выходящих частиц и уменьшает дисперсию случайной величины, оценивающей вероятность выхода.
314 ЦЕПИ МАРКОВА И ИНТЕГРАЛЬНЫЕ УРАВНЕНИЯ [ГЛ. 6 б) Пусть теперь Л представляет собой пластинку малой толщины, источник расположен внутри пластинки и его излучение направлено полностью или главным образом по нормали к границе. Нас интересует доля частиц, которые вышли из пластинки, претерпев хотя бы одно рассеяние. Подавляющее большинство частиц выйдет из пластинки, не взаимодействуя с ее веществом, т. е. большинство историй частицы будет прослежено без пользы для нас. Вероятность частице, вышедшей из точки у и имеющей направление движения й, покинуть пластинку, не взаимодействуя с веществом, равна g(y)=exp(- где а (у) — расстояние от точки у до границы пластинки в направлении Q. Положим В этом случае частица никогда не покинет пластинку, и интересующая нас доля частиц, испытавших хотя бы одно рассеяние, может быть оценена более точно. Обрыв траектории возможен лишь в результате физического поглощения. Вес частицы определяется величинами qti i+1 = = 1 — q(Xi). Длина пробега частицы вычисляется не так, как при прямом моделировании. Действительно, в соответствии с F.4.8) длина пробега 1г от точки rt до ri+1 распределена с плотностью вероятности 2 (гг + Ш, Хг) ехр (— ^ 2 (гг + *Q4f %г) <й) x о - ехр ( - ^ 2 (гг + *Oif К) Л)) . о X Если 2 не зависит от г внутри пластинки, то получаем для lt выражение к = 4"loS [1—<хA — ехр (- 2а (*,)))]. F.4.9) Описанный прием, как легко видеть, увеличивает вычислительную работу при моделировании траекторий, так
§ 4] НЕКОТОРЫЕ ПРИЛОЖЕНИЯ 315 как требуется вычисление расстояния до границы на каждом этапе и вычисление экспонент, входящих в выражение F.4.9) и в величины Q[k\ При реальных вычислениях это обстоятельство необходимо принимать во внимание. Особенно трудоемкими вычисления становятся, когда 2 зависит от v и в качестве области Л выбрана не пластинка, а область со сложной геометрией. Если в качестве р (у, х) выбрана функция К (у,хJ(у) / ч л , то g («/) = О, все траектории оказывают- ""рас \У> v1 Я \У)) ся бесконечными, и их нужно прослеживать до тех пор, пока величина Q[k) не станет пренебрежимо малой. Для уменьшения дисперсии оценок функционалов в задачах переноса широко используются сведения о решении сопряженного уравнения. Основанием для этого являются общие соображения, изложенные в предыдущем параграфе. В ряде случаев удается аналитически решить сопряженное уравнение для более простой задачи, например в более простой области, в предположении постоянства сечений и при других упрощающих предположениях. Полученное решение можно попытаться использовать для уменьшения дисперсии. Эффект обычно оценивается экспериментально путем оценивания дисперсии на основе выборки умеренного объема. Можно стать, как и в § 5 главы 4, на иную точку зрения и задать некоторую положительную функцию 6 (ас, аи . . ., ат), зависящую от численных параметров аи . . ., ат. Затем переходная плотность выбирается в виде К (у, х) 9 (у, fli, . . . , а ) ж> = e(x,ai,...aw) • При этом, очевидно, должно выполняться неравенство 1К(у, х)/8 (х, аи . . ., am)dx < 1/9 (у, а±, . . ., ат) для всех значений аи . . ., ат из некоторого множества значений. В случае сложного вида ядра К (у, х) это требование может быть обременительным. Поскольку для оценки /х известно, что дисперсия обращается в нуль для плотностей перехода такого вида, то можно поставить задачу о подборе параметров ах, . . ., ат так, чтобы дисперсия /х достигала минимального значения. Успех
316 ЦЕПИ МАРКОВА И ИНТЕГРАЛЬНЫЕ УРАВНЕНИЯ [ГЛ. 6 зависит от удачного выбора вида функции 0. Величины #i, . . ., ат можно оценивать и отыскивая приближенное решение сопряженного уравнения в виде Э (х, ax,...,am). При этом разумно использовать вариационные методы. Возможны, разумеется, и иные способы введения параметров в плотность (и, следовательно, в величины Q[k)). Распространенным способом введения параметров является экспоненциальное преобразование (Фано и др. [1], Михайлов [3]), на котором мы не будем останавливаться подробно, отсылая читателя к специальной литературе. Необходимость в разработке методов уменьшения дисперсии особенно велика при вычислении методом Монте-Карло малйх вероятностей, например вероятности попадания у-кванта в малый объем фазового пространства или вероятности прохождения через слой большой толщины, когда ослабление излучения достигает порядка 10~4 и менее. В этом последнем случае при непосредственном моделировании из 104 частиц границы области достигнет в среднем одна, и объем вычислительной работы для достижения непосредственного результата становится непомерно большим. Одним из предельных случаев является случай, когда необходимо вычислить поток в точке пространства J?. Очевидно, вероятность прохождения частицы через фиксированную точку пространства равна нулю, и методы непосредственного моделирования оказываются бессильными. Существуют, однако, специальные приемы, позволяющие решить и эту задачу. 3. Локальные методы. Как уже неоднократно отмечалось, для оценки функционалов (ср,К) = \ q>{de)h(x)dx> где ф есть решение уравнения вида F.3.2): ср (х) = = \ К {у, х) ф (у) dy + f (х), 3) = Я X V, могут быть ис- пользованы две схемы — прямая и сопряженная. Прямой мы считаем схему, подробно рассмотренную в § 2. (Можно, конечно, считать прямой схемой двойственную к ней.) Если пытаться с помощью прямой схемы оценить значение искомой функции ф в некоторой фиксированной точке фазового пространства, то h может быть лишь б-функцией, сосредоточенной в этой точке, и даже если считать выполненными все условия, которые позволили бы провести рас-
§ 41 НЕКОТОРЫЕ ПРИЛОЖЕНИЯ 317 суждения § 2 с такой функцией h, то легко видеть, что все моменты оценки / выше первого не будут существовать. При решении двойственной задачи положение иное. В этом случае б-функция войдет в правую часть уравнения. Условия F.2.10), налагаемые на цепь Маркова, будут означать, что р0 должно быть также б-мерой (см. замечание 3 § 2). Моделирование такого начального распределения не вызывает затруднений. В задачах переноса излучения переход к двойственной задаче позволяет найти плотность взаимодействий в точке. Это, однако, лишает моделирование той степени физической наглядности, которая присуща прямой схеме. Кроме того, стремление упростить вычислительную процедуру и сделать дисперсию не слишком большой побуждает выбирать переходную плотность р так, чтобы ядро уравнения входило в К сомножителем. Вычисление нормировки р в этом случае оказывается для реальных задач далеко не простым делом. Описание некоторых вычислительных схем для решения сопряженного уравнения переноса можно найти у Калоса [2] и Хисамутдинова [2]. Таким образом, если f(x) в уравнении F.4.1) играет роль вклада источника излучения, то h (х) играет роль распределения детектора, регистрирующего пришедшие частицы. При решении сопряженного уравнения роли f (х) ик (х) меняются (предполагается, что h (x) неотрицательна и нормирована). Частицы рождаются с плотностью h (x) и после переходов с некоторой переходной плотностью регистрируются детектором, распределенным с плотностью / (х). Прямая задача с точечным источником, но протяженным детектором (h (x) отлично от нуля в значительном объеме фазового пространства) не вызывает при решении особых затруднений. Если же детектор сосредоточен в точке, то возникают трудности, о которых было сказано выше. Для сопряженного уравнения имеет место противоположная ситуация. Иными словами, в задачах переноса излучения, где f (х) отлично от нуля в значительном объеме, a h (x) отлично от нуля в малом объеме фазового пространства, для вычисления функционала (А, ф) = (/, ср*) целесообразно решать сопряженное уравнение. Однако отмечавшиеся трудности, связанные с реализацией двойственной схемы, а также то обстоятельство,
318 ЦЕПИ МАРКОВА И ИНТЕГРАЛЬНЫЕ УРАВНЕНИЯ [ГЛ. 6 что бывают задачи, где и / и h сосредоточены в малых объемах фазового пространства, вызывают необходимость иного подхода. Подход этот состоит в следующем. Если х0 — фиксированная точка фазового пространства, то из F.4.2) следует Ф (as») = J К {у, хо) Ф (у) dy + f (аво). F.4.10) Отсюда сразу получаем, что выбирая h (х) = К (х, х0), мы можем использовать прямую схему для вычисления Ф (х0), и эта схема приведет к успеху, если if (х, х0) удовлетворяет сформулированному выше требованию к h (x) — быть отличной от нуля в значительном объеме фазового пространства. Конечно, это требование не формализовано и требует конкретизации и уточнения в каждом отдельном случае. Нежелательным, очевидно, является и наличие особенностей у К (х, х0), а как следует из F.4.3), ядро уравнения переноса может такие особенности иметь. Остановимся подробнее на случае уравнения переноса. Во-первых, при его решении чаще всего фиксируется только пространственная составляющая фазовых координат, хотя известны алгоритмы вычисления ф в фиксированной точке фазового пространства. Очевидно, если фиксируется г = г$, то для точки х° = (го, v) имеет место соотношение, аналогичное F.4.10). Легко понять, что для вычисления г» функционала \ hx (v) ф (rOi v) dv следует положить h (x) = = /&i (v) К (х, х°) и вычислить \ f(xQ)hl(v)dv. Далее не возникает особых трудностей, если в некоторой окрестности точки х° ядро К обращается в нуль. (Это имеет место в том случае, например, когда точка г0 находится в вакууме и взаимодействие частицы с веществом в этой точке не может иметь места.) Если же это не так, то из F.4.3) легко усмотреть, что К (х, х°) имеет в точке х° особенность в случае задач переноса гамма-квантов. Аналогичная особенность имеет место и для других уравнений переноса. Если фиксируется только пространственная составляющая, то эта особенность типа 1/| г — г0 |2 является единственной. В других случаях нужно считаться также с наличием в составе ядра б-функций. Указанная особенность приводит к расходимости вторых моментов оценок Ju
§ 4] НЕКОТОРЫЕ ПРИЛОЖЕНИЯ 319 /2, /3 и других. Специальные приемы, позволяющие построить оценки с конечной дисперсией, трудоемки в вычислительном отношении (один из таких приемов описан ниже), поэтому для грубой оценки потока иногда используют оценки Jx и /2 с h (х) = К (х, х°)/2Рас(#) (поток и, являющийся решением уравнения F.4.1), связан с плотностью рассеяния ср (х) простым соотношением и = ==ф/2рас). Закон больших чисел позволяет оправдать в этом случае применение метода Монте-Карло, и мы сталкиваемся с интересным и практически важным случаем использования схемы Б, согласно классификации § 3 главы 2. Порядок сходимости при этом равен О (JV~''$) и справедливы все соображения, высказанные ранее о схеме Б. Один из приемов, который позволяет получить оценку с конечной дисперсией (Калос [1]), состоит в том, что при оценке величины § К (х, х°) ф (х)/2рас (x)dx выбирается специальное распределение точки х (особенность включается в плотность). Так, при вычислении вклада при переходе х0 -> Xi плотность распределения гг может быть выбрана равной =с, п |;:й;°1 го р • Аналогично, в общем случае прослеживаются траектории ж0 ->• хг ~> . . . -^ Хь, которым соответствует плотность вероятности Ро(хо)р(хо, Хг). . . р (xfc-2, Xh-JU (Xk-u Xk). Хотя цепь оказывается неоднородной, легко проверить, что при 9г оценки /х и /2 являются несмещенными. При этом qt содержит сомножителем | rt — г° |2 и оценки fx и/2 для —у /^ч Ф (у) dp не содержат в знаменателе величины \rt — г° |2. В знаменатель, правда, войдет | г^г — r° | (выражение в числителе U), однако второй момент оценки уже оказывается конечным. Следует отметить, что расходятся третий и более высокие моменты оценки, так что
320 ЦЕПИ МАРКОВА И ИНТЕГРАЛЬНЫЕ УРАВНЕНИЯ [ГЛ. 6 сходимость распределения оценки к нормальному закону оказывается очень медленной. Обычная оценка дисперсии A.3.5) имеет в этом случае плохую точность и построение доверительного интервала на основе нормального закона не является оправданным. Практическая важность получения эффективных в вычислительном отношении оценок локальных характеристик потока в задачах переноса излучения породила довольно обширную литературу. Обзор методов, связанных с этой задачей, и библиографию можно найти в монографии Михайлова [12]. Изложенные выше в связи с общей теорией приемы решения уравнения переноса излучения в общем достаточны для понимания своеобразия проблемы, если учесть материал главы 3. Случай переноса у-кв&нтов через вещество является типичным, хотя и сравнительно простым, Задача переноса нейтронов, если не делать значительных упрощений физической постановки, более сложна в техническом отношении, но почти все вычислительные приемы, используемые в случае у-квантов, могут быть использованы и в случае нейтронов. Предшествующее описание основных особенностей задач переноса излучения является несколько упрощенным и не должно создавать иллюзий относительно их простоты. Реальные задачи достаточно сложны как с точки зрения конфигурации пространственной области, так и с точки зрения физических эффектов, которые следует учесть. Выбор модели в реальных задачах требует серьезных теоретических исследований и предварительных экспериментов на малых выборках. Вопросы, связанные с конкретными расчетами, требуют большего объема сведений относительно физической стороны изучаемых процессов, чем это содержится в данной книге. Мы не будем останавливаться на них подробнее. Вне поля зрения оказались и многие методы уменьшения дисперсии, изложенные в общем виде в предыдущем параграфе, хотя их конкретная реализация в случае уравнений переноса излучения не всегда тривиальна. Читатель, интересующийся специально решением задач переноса излучения, найдет много полезных дополнительных сведений в монографиях Спанье и Гелбарда [1], Михайлова [12]. Специально вопросам переноса излучения в атмосфере посвящена монография Марчука, Михайлова и др. [1].
ГЛАВА 7 ДРУГИЕ ЗАДАЧИ, СВЯЗАННЫЕ С МОДЕЛИРОВАНИЕМ ЦЕПЕЙ МАРКОВА § 1. Методы решения нелинейных уравнений Методы, связанные с линеаризацией исходной нелинейной задачи, достаточно широко распространены. Если, например, имеется уравнение вида f(x) (modji) G.1.1) и сходится метод последовательных приближений Фп(х) = ^К(х, ?/, фп-i{у))фп(У)М<(dy) + f (x) (mod ji) G.1.2) для некоторого ф0 (х) при п-+ оо, то можно при каждом фиксированном п использовать метод Монте-Карло для решения относительно фп уравнения G.1.2). При этом, конечно, должны быть сделаны многочисленные дополнительные предположения и уточнения. Нужно уточнять, какая метрика имеется в виду, когда мы говорим о сходимости G.1.2), предполагать абсолютную сходимость в той же метрике ряда Неймана для уравнения G.1.2) при фиксированном п и предполагать (что очень важно) устойчивость решения относительно случайных возмущений ядра. Кроме того, когда речь идет о решении интегрального уравнения методом Монте-Карло, нужно дополнительно оговаривать, в каком виде будет представляться решение — в виде гистограммы, в виде отрезка ряда Фурье по некоторой системе функций или в некоторой параметрической форме. Очевидно, что в этом случае при каждом п нужно получать решение уравнения, а не ограничиваться оценкой функционала, даже если нас 11 СМ. Ермаков
322 ЦЕПИ МАРКОВА (ДРУГИЕ ЗАДАЧИ) [ГЛ. 7 интересует какой-либо конкретный функционал. Таким образом, здесь дело осложняется необходимостью хранения информации об искомой функции в памяти ЭВМ. Когда задача существенно многомерная, это требует большого дополнительного объема памяти. Другая трудность, возникающая при решении нелинейных задач описанным методом, состоит в анализе погрешности. Здесь источников погрешности существенно больше и они носят как статистический, так и детерминированный характер. Линеаризация G.1.2) уравнения G.1.1) не является единственно возможной и не всегда наиболее эффективна— можно было бы попытаться использовать, например, метод Ньютона — Канторовича, но к такого рода линеаризации часто приводят физические соображения. В задачах газовой динамики, описываемых уравнением вида G.1.1) (см. например, Валландер [1], Коган [1]), нелинейность физически означает наличие взаимодействия между молекулами газа. При моделировании задается сначала некое начальное распределение фазовых координат молекул фо(х). В поле, описываемом этим начальным распределением, прослеживается движение некоторой группы «пробных» молекул и вносятся коррективы в начальное распределение, что и означает по существу использование формулы G.1.2). Остановимся подробнее на решении нелинейного уравнения Больцмана описанным выше методом. Излагаемая далее вычислительная схема принадлежит Хэвиленду [1]. Ее связь с соответствующим интегральным уравнением прослеживалась Григорьевым, Ивановым и Харитоновой [1] (этой работе во многом следует наше изложение). Анализу погрешности схемы посвящена обстоятельная работа Хикса и Смита [Ц. Как и ранее, наше внимание будет сосредоточено на алгоритмической стороне вопроса. Физическое обоснование принятых моделей следует искать в обширной литературе (например, Коган [1]). Рассмотренные ранее задачи прохождения излучения через вещество являются с математической точки зрения частным случаем уравнений динамики разреженных газов, но прямое физическое толкование интегральной формы нелинейного уравнения в этом случае не столь прозрачно, как в линейном. Его дифференциальная форма является соотношением балан-
§ 1] МЕТОДЫ РЕШЕНИЯ НЕЛИНЕЙНЫХ УРАВНЕНИЙ 323 са числа молекул газа в элементарном объеме фазового пространства. В стационарном случае, если потенциалы межмолекулярного взаимодействия ограничены, это уравнение для модели Больцмана имеет вид v grad и = /2 (и, и) — uJx (и), G.1.3) где J1(u) = \ \v — v^o^v -v^u^v^dv» G.1.4) J2 (и, и) = \ \ и (г, vf) и (г, vj | v' — vx\ х X о (| v' — ^ij) Г (v, v±J v') dv'dvv G.1.5) Здесь и можно интерпретировать как среднее число молекул в единичном объеме фазового пространства Л X ffly v\ vx EH ffl — как скорости двух молекул до взаимодействия, v — скорость одной из них после взаимодействия, г == (х> У> z) ?Е $> or обозначает заданную функцию относительной скорости, а Г — заданную функцию, которая при фиксированных v' и v[ является плотностью вероятности распределения v. Если задача ставится в некотором ограниченном объеме Л е *>?, то уравнение G.1.3) должно быть дополнено граничными условиями. Эти условия могут быть, например, следующими: и (г0, v) = и0 (и), G.1.6) где и0— заданная функция, а г0 принадлежит внешней границе Г объема Я, k(v1,v)u(r0,v1)dv1, G.1.7) 0 где к (vu v) — заданная функция, г0 принадлежит внутренней границе у объема, an — внешняя нормаль к поверхности. Для простоты предполагается, что и внутренняя и внешняя поверхности, ограничивающие объем, выпуклы. Записывая G.1.3) в виде (v grad и) + uJx (и) = = /2 (и, и), легко заметить, что первый член левой части есть полная производная по направлению и при известных /i и /2 это уравнение будет линейным дифференциальным 11*
324 ЦЕПИ МАРКОВА (ДРУГИЕ ЗАДАЧИ) 1ГЛ. 7 уравнением. Записывая формально решение этого уравнения и вводя дополнительные переменные и компенсирующие их введение б-функции, получим следующую интегральную форму нелинейного уравнения Больцмана: и <r'v) = \ ih Чг''v) ехр (~т (**'г'* *)) X dr' Здесь . v) ехр (-т (го, \r-ro t(r,r»= — гп X G.1.9) r± = r' + ZQ, /i и /2 имеют тот же смысл, что и ранее, но в качестве аргументов их здесь удобно указывать фазовые координаты, v = ft г?, /@> определяется условиями G.1.6) и G.1.7). При отсутствии внутренней границы, что мы далее будем предполагать для простоты,— это заданная функция. Подставляя G.1.4) и G.1.5) в G.1.8) и снабжая неизвестную функцию и номером итерации щ получим в« {г, v) = J J ип (г', «' ', v[) g'a (g')T(v, v', *-+ x где g' = \ v' — г?! |, F(°) — второе слагаемое в правой части G.1.8) (известная при наших предположениях функция), а ) "Г'11 v Г (^ ga (g) un (r - IO\ Vl) dVl) dl.
§ 13 МЕТОДЫ РЕШЕНИЯ НЕЛИНЕЙНЫХ УРАВНЕНИЙ 325 Рассматривая G.1.10) как уравнение относительно ип, легко видеть его очевидное сходство с уравнением переноса излучения в интегральной форме (сравните ядро этого уравнения с выражением для ядра уравнения переноса F.4.3)). Более точно, если ввести новую неизвестную функцию (плотность соударений) фт»(ю) = un(x)J1(un.1(x)), х = {г, v), G.1.11) то, как показано при некоторых дополнительных предположениях Григорьевым и др. [1], ядро интегрального уравнения относительно фл, полученного после такой замены, будет иметь смысл переходной плотности. Действительно, G.1.10) будет иметь вид Фп(х)= ^ Kn(x',x)<pn(x')dx' + FM(x), G.1.12) где Кп(х\х) = К'п(х'9х)Кп(х',х), G.1.13) Кп (*', х) = \ gW)W^) 4 т ^ v4 ^ dv^ {7ЛМ) К (х\ х) = -т^р \ go (g) щь-г (г, vx) dvx X у X exp(-t^1(r,r',V)N(T^T- О) |r^r>|, . G.1.15) Известно (Коган [1]), что по крайней мере при сферической симметрии потенциала взаимодействия и упругом характере соударений Т (v, v', v[) имеет смысл условной при фиксированном v[ плотности вероятности изменения скорости v' на v. Отсюда и из G.1.14) следует, что в указанном случае Кп (х\ х) имеет смысл плотности вероятности перехода от скорости vr к v. Что же касается сомножителя Кп (х', х), то он, как легко видеть, с учетом G.1.9) дает плотность распределения длины свободного пробега молекулы. (Здесь опять полезно сравнение с задачами переноса излучения.) Роль 2 здесь, очевидно, играет 1 С ~]—г\ gG(g) Hn-iO**? vi) dvi. Таким образом, если рассматри-
326 ЦЕПИ МАРКОВА (ДРУГИЕ ЗАДАЧИ) [ГЛ. 7 вать /W (ас) как плотность столкновений молекул, рожденных «источником» (в более общем случае, когда имеется внутренняя граница, FW (х) зависит от п), то можно последовательно изучать «историю» молекулы. В работе Хэвиленда [1] на основе физических соображений, используемых при выводе уравнения Больцмана, проводилось такое моделирование истории молекул и при каждом фиксированном п строилась гистограмма их распределения. Затем эта гистограмма использовалась для подсчета следующего приближения. Хотя теоретически сходимость процесса в каком-либо смысле не доказана, гистограммы распределения устанавливались с ростом п и проведенное сравнение с экспериментом дало сравнительно хорошие результаты. Как уже отмечалось, необходимость детального запоминания сведений о предыдущем приближении являлась существенным ограничением, и результаты удалось получить лишь в случае одной пространственной переменной. Очевидную пользу в этом случае могут принести приемы параметрического представления фп и оценки параметров в процессе расчета, но они вряд ли применимы в случае сложной геометрии системы. Как уже отмечалось, погрешность вычислений детально, но не строго, анализировалась Хиксом и Смитом [1]. Они проводили расчеты, варьируя количество испытаний и сравнивая там, где это было возможно, результаты, полученные методом Монте-Карло, с результатами, полученными с помощью квадратурных формул. Легко понять, что при описанном методе вычислений, когда используется двойной метод последовательных приближений, получить теоретические результаты относительно распределения погрешности практически невозможно. Ветвящиеся марковские процессы тесно связаны с нелинейными уравнениями. Использование ветвящихся процессов, как будет следовать из дальнейшего, может избавить нас, при решении нелинейного уравнения, от необходимости запоминания таблицы значений искомой функции. Иными словами, возможно непосредственное обобщение результатов § 2 главы 6 (вычислительной схемы Неймана — Улама) на случай широкого класса нелинейных интегральных уравнений или систем нелинейных алгебраических уравнений. Излагаемые результаты получены в последнее время (Ермаков [8], [9], Некруткин
5 1] МЕТОДЫ РЕШЕНИЯ НЕЛИНЕЙНЫХ УРАВНЕНИЙ 327 [1], [2]). Ниже будут изложены лишь основные идеи, относящиеся к этому кругу вопросов. Более детальное изложение можно найти в цитированных выше работах. Рассмотрим «одночленное» интегральное уравнение Ф(х) = \К (х, уг,..., уа) Пф{у{)\is(&ух ... dys) + f (x), G.1.16) которое в сокращенной форме будем записывать в виде ф =ж<р(*) +/ G.1.17) и будем предполагать, что последовательные приближения Фп = ягф(Д + /, Фо = А G.1.18) сходятся в метрике некоторого банахова пространства F к решению уравнения G.1.16), которое существует. (Очевидно, что существуют такие УС, f и F, что имеет место указанная сходимость.) Нас, как и ранее, будетГинтересовать задача оценивания элемента (ф, h) = J ф {х)Ъ (х) ц (dx) сопряженного к F пространства функционалов" F*. Пусть s = 2. Тогда ф2(а>о) = /(хо) + \^К(х0, хъ х2) х X [/(Xi) +^К (Жх, xz, ас4)/(хъ) f (xA) V?(dxsdxA)] x X [/, (х2) + \^К(*х21 хъ, х6) f (хъ) f (xe) |x2(dxbdx6)]x X \i2(dxxdx2) = /о + 1,2 (/l J ^2,3,4 ,2 (/2 \ Я 1,Б,в/»/в!*в,е) ^1,2 + #0,1,2^1,5,6^2,3,4/3/4/5/6^1,2^3,4^6. G.1.19) Связь переменных в отдельных слагаемых хорошо ассоциируется с деревом 3
328 ЦЕПИ МАРКОВА (ДРУГИЕ ЗАДАЧИ) [ГЛ. 7 Каждое из слагаемых G.1.19), кроме того, соответствует некоторому поддереву этого дерева, а именно — первому слагаемому /0 соответствует вершина, второму — дерево 1 / 1^5 0^ , третьему 0^ *3, четвертому (У* ^6 и последнему — все No 2ч ^2 N4 дерево целиком. Читатель может проверить, что аналогичная запись для ф3 и сопоставление ей аналогичного дерева приведет к тому, что из точек с номерами 3, 4, 5 и 6 «вырастет» еще по два «отростка» и все слагаемые, входящие в выражение для ф3, будут соответствовать некоторым поддеревьям в том же смысле, как это было указано выше. Излагаемая ниже схема основана как раз на том, что функционал (ф, К) можно представить в виде суммы по всевозможным поддеревьям слагаемых, каждое из которых есть многократный интеграл, связанный с этим деревом. Вернемся к уравнению G.1.16) и проведем сначала некоторые вспомогательные рассуждения. Введем в рассмотрение мультииндексы v (к) = A, 1г, . . ., lk), к = 0, 1, 2, . . ., где lu i = 1, . . ., к,— целые числа, которые могут принимать значения 1, 2,. . . ,5. Полагаем v @) = = A), v (й + 1) = (v (к), Zfc+1). Рассмотрим совокупность Уъ, = (^о» • • •» ®л) множеств 95Г (г = 0, . . ., к) муль- тииндексов v (г), удовлетворяющих условиям: а) Для каждого v (г)ЕЕ$Вг соответствующее v (r — 1)Е= ! > б) 1Г для каждого v (r) принимает всевозможные значения от 1 до s. в) Э50 состоит из одного элемента — A). Такую совокупность 7s назовем деревом. Дерево, для которого все 95/с-х = 95^-г, назовем полным. Определенные нами деревья являются поддеревьями полного дерева. На рис. 7.1 приводится пример дерева с четырьмя поколениями. Для него »х = {A,1), A,2), A,з)}, ®; - {A,1), A,з)}, ?2 = {A,1,1), A,1,2), A,1,3), A,3,1), A,3,2), A,3,3)}, »; = {A,3,2)}, », = {A,3,2,1), A,3,2,2), A,3,2,3)}.
§ и МЕТОДЫ РЕШЕНИЯ НЕЛИНЕЙНЫХ УРАВНЕНИЙ 329 Таким образом, наше дерево есть граф, в котором из каждой вершины может исходить либо 0, либо s ветвей. 95Г содержит номера тех вершин, из которых исходит s ветвей. Последовательные приближения G.1.18) для уравнения G.1.16) можно очевидным образом связать с полным /,/,/ 1,1,3 1,3,1 I 1,3,3 1,3,2 Рис. 7.1. деревом, нумеруя переменные с помощью мультииндек- сов. Зададимся некоторым натуральным N. Очевидно, G.1.18) можно записать в виде \п = N — к) X [(v(k), 1],... ,x[(v(k),s]) X <Pw-*-i(» [v (A+l)] (i5 (dx [(v (к), 1)].. .dx[iy (к), s)])+ f(x[v(k)\), G.1.20) Здесь в квадратных скобках указаны номера переменных. Обозначим ф^^ (х [v (к)]) через z [v (к)], а интегральный оператор с ядром К (х [v (к)], х [(v (к), 1)], . . . . . ., х [(v (к), s)]) через avu)« Уравнение G.1.20) можно записать в сокращенных обозначениях в виде . G.1.21) Очевидно, что ф^ (х [v @K) = z [v @I, если полояшть z [v (N + 1I = 0 для всех v (N + 1).
330 ЦЕПИ МАРКОВА (ДРУГИЕ ЗАДАЧИ) [ГЛ. 7 Изучим теперь структуру соотношения G.1.21), которая связана с полным деревом Fjv и, как будет следовать из дальнейшего, с поддеревьями этого полного дерева. Для точной формулировки этой связи определим связанное с деревом у (у ЕЕ Г^) и соотношением G.1.21) выражение А {у) = / [v @)] при N = 0 А (т) = ат П / [v A)] П *v(d П / [v B)] X приЛГ>0. G.1.22) Здесь 95'iv — пустое множество, Я5# не пусто. Очевидно, требование, чтобы 95]v было непусто, можно опустить, считая произведение по пустому множеству индексов равным единице. Это соглашение мы будем считать далее выполненным и не предполагать bN непустым. Для дерева, изображенного на рис. 7.1, выражение Aft) будет иметь вид <hf И. 21 aulaU3f [1,1,11 / [1Д,23/ [1,1,3]/ [1,3,3] х X / [1,3,11 <W U,3,2,l] / [1,3,2,2] /[1,3,2,3]. Докажем теперь следующую лемму: Лемма 7.1. Если z [v @)] вычисляется по формуле G.1.21), где при некотором N > 0 для всех v (N + 1) * [v (N + 1)] = 0, то *[v@)]= S ^(Т). G.L23) где суммирование в правой части происходит по всевозможным деревьям с N и менее поколениями, которые являются поддеревьями полного дерева Tn. Доказательство. Для N = 2 G.1.23) проверяется непосредственно. Предположим теперь, что G.1.23) справедливо для некоторого N = N\ и покажем, что оно остается справедливым при N = N' + 1. Подробная
§ 1] МЕТОДЫ РЕШЕНИЯ НЕЛИНЕЙНЫХ УРАВНЕНИЙ 331 запись выражения z [v @)] для N = N' дает s $ + «v<i) Д / [v B)] + • • • +av(iV_1) П / [v (N)]. G.1.24) Легко видеть, что переход от N = Nr к N — iV' +1 осуществляется заменой в G.1.22) и G.1.24) / [v (N)\ на S / [v (TV)] + a^N) Yl /tv(N + l)] и утверждение леммы легко получить, исходя из правила умножения двучленов (с обязаеальным сохранением порядка сомножителей). Доказенная лемма дает возможность представить фп, определяемое равенством G.1.20), в виде суммы многократных интегралов, составляемых в соответствии со структурой деревьев, являющихся поддеревьями некоторого полного дерева Гп. Рассмотрим теперь однородный ветвящийся марковский процесс, определяемый плотностью начального распределения р0 (х) >0 и переходной плотностью Р (х, у1У . . ., ps) >0. При этом . ..dy8) = 1 -g (x), G.1.25) где 0 ^ g (х) ^ 1. Описание процесса дадим в терминах размножающихся частиц. Считаем, что в нулевой момент времени в точке х [v @)] = х [1], распределенной с плотностью р0 (х [1]), рождается s частиц. С вероятностью g (x [1]) все они погибают, ас вероятностью 1 — g (x [1]) переходят в точки х [v A)] (v A) = 1, 1; ...; l,[s), которые имеют совместную плотность распределения -. ;—птгР (х [I], х [I, 1], . . . . . ., х [1, s]). Затем в каждой из точек х [v A)] снова рождается s (нумеруемых индексом v A)) частиц, которые ведут себя аналогично исходной, т. е. с вероятностью g (x [v A)J) все они погибают, а с вероятностью
332 ЦЕПИ МАРКОВА (ДРУГИЕ ЗАДАЧИ) [ГЛ. 7 1 — g (х [v A)]) переходят в точки, нумеруемые индексом v B), которые имеют совместную плотность распределения Далее описанный процесс повторяется аналогично для каждой новой частицы. Очевидно, что в результате реализации такого процесса образуется дерево описанного ранее типа, число поколений N которого не обязательно конечно. Если N ^> 0 конечно и образовалось некоторое дерево у, то плотность вероятности, ему соответствующая, как следует из описания процесса, есть = Ро(х[1])Р(х[1),х[1Л1. •. ,x[l, X Ц Р С* [v A)]; * [(v A), 1)], ..., х [v A), го]) X X U8(x[vB)])...J[g(x[v(N)]). G.1.26) Легко видеть, что множество деревьев у из IV образует полукольцо, а G.1.24) определяет меру на множествах этого полукольца. Мера деревьев данного вида у есть Р (?) = ip (т) М^ №0» гДе H'Y есть произведение мер |ы такой кратности, сколько переменных х с различными индексами содержится в дереве у, a dy означает аналогичное произведение dx[i]J[dx[v(i)}...]ldxlv(N)]. Если просуммировать Р (у) по всем деревьям с N поколениями и менее и рассмотреть величину в = Jim 2 Р (Т)» то очевидно а ^ 1. Чтобы получить условия, при которых а = 1, рассмотрим интегральное уравнение . • • • dya) + g (X). G.1.27)
§ 1] МЕТОДЫ РЕШЕНИЯ НЕЛИНЕЙНЫХ УРАВНЕНИЙ 333 Сравнивая выражения для Р (у), G.1.26) и G.1.22), легко убедиться в том, что где %n (x) ¦= \^р(х, у1к. .., ys) \\Хлг-1 (yi) Vs {dyx. . .dys) + g (x), Отсюда следует, что при произвольной начальной плотности р0 0 = 1 лишь в том случае, если lim %n (х) = 1 N-*oo " (mod |li). (Легко видеть, что % = 1 является решением уравнения G.1.27).) В этом случае почти все деревья у имеют конечное число поколений. Изменяя нормировку переходной плотности р ветвящегося процесса (увеличивая g (x))i можно всегда добиться выполнения равенства а = 1. Далее мы будем предполагать р и g такими, что а = 1. Вернемся теперь к задаче оценивания функционала J<p (x) h (x)\i (dx), где <р (х) есть решение уравнения G.1.16). Предположим, что выполняются условия: А) из К (х, уг, . . ., у8) =hO (mod \is+1) следует Р (х, уг, . . ., уш) >0 (mod ^); G.1.28) Б) из h (х) Ф 0 (mod \i) следует р0 (х) >> 0 (mod fx), и из / (х) 4= 0 (mod fi) следует g (x) > 0 (mod |ut), несопоставим дереву 7? полученному в результате описанного ветвящегося процесса, следующую случайную величину (оценку): ^ = Ы ДГуц») ТТ /[УA)] ТТ gv(l) ТТ /[У B)] ,, чх ТТ ^vB) ч^ w ТТ / [v(AT)] /7.1.29)
334 ЦЕПИ МАРКОВА (ДРУГИЕ ЗАДАЧИ) [ГЛ. 7 где введены сокращенные обозначения: ho = h(x [1]), р0 = р0 (х [1]), / [v (*)] = / (х [v (&)]), g [v (*)] = g (x [v (&)]), К<К) = K(x[v (A)], x[(v (Л), 1I, . . ., х [(v (/с), *)]), PvCfc) = р (х [v(A)l, x [(v (A), 1)], . . ., x l(v (k)9 s)]L k = 0, 1, ... Имеет место следующая Теорема 7.1. Оценка /Y является несмещенной оценкой функционала (ср, К). Доказательство после проведенных ранее рассуждений не представляет труда. Действительно, Y где р (у) определяется выражением G.1.26), а смысл выражения цЛ (dy) тот же, что и ранее. Рассмотрим сначала 2 ^тР(Т)^(^т)- После под- становки G.1.26) в это выражение получаем выражение типа G.1.22) (К^и) соответствует av(fc)). Результат теоремы следует после предельного перехода при N -> оо. Вычисление дисперсии /Y можно выполнить аналогичным образом. Она конечна для любого h ЕЕ F*, если существует и принадлежит F предел lim ярлг (х)> где N (mod[x). 3=1 Очевидно, что этот предел, если он существует, есть одно из решений гр уравнения G.1.30) Обозначим через ср решение уравнения G.1.16), в котором К заменено на \К\, а/ на |/|. Имеет место следующая
§ 1] МЕТОДЫ РЕШЕНИЯ НЕЛИНЕЙНЫХ УРАВНЕНИЙ 335 Теорема 7.2. Если существует lim i|>jv (x) = \р (х) N-*oo и \р ЕЕ F, то для дисперсии оценки Jy справедливо равенство DJY = [— . ^\ — (h, фJ; G.1.31) D/Y минимальна, если положить AЧ>|, |А|) I S К, f и h неотрицательны^ то минимальное значение DJy есть нуль. Доказательство этой теоремы очень просто (аналогично доказательству теоремы 6.4), и мы его опускаем. Следующим по сложности нелинейным уравнением является уравнение вида St S2) П .. dyj + / (x). G.1.32) Как и ранее, предполагается, что для этого уравнения сходится метод последовательных приближений в метрике пространства F и что эта же сходимость имеет место, если jf A), К^ и / заменить на | К<и |, | К^ | и | / | соответственно. Рассмотрим сначала случай sx = s2. Соответствующий линейный случай ($i = s2 = 1) изучался нами ранее (теорема 6.6). При этом строился ветвящийся процесс, в котором каждая частица делилась на т аналогичных частиц. Подобный прием можно использовать и при^х = = s2 = s ^> 1. Действительно, пусть переходная плотность р (х,ух,..., ув) = РA) (х, ylf. .., ys) + р<«) (х, уг,..., у8), причем для К^\ рA> и К&\ рB> выполнены условия, аналогичные условиям G.1.28), так^что отношения ЛГA>/рA> и K^lp^ имеют смысл. Полагая для некоторого дерева
336 ЦЕПИ МАРКОВА (ДРУГИЕ ЗАДАЧИ) [ГЛ 7 V в G.1,24) avU) = К% + К%, убеждаемся, что = 2 ••• 2 KV П /t(v[i],4i))]x X Ц^У ¦• ¦ П где y), 1), Каждая частица при рождении получает дополнительный индекс 1 или 2. Это означает, что при каждом значении v(;) U(j) принимает значения 1 или 2 независимо (в соответствии со значением соответствующих <7i и #2), а переменная х получает дополнительный индекс iv(j). Легко видеть, что каждое из слагаемых правой части G.1.33) соответствует дереву у, но каждая его ветка, кроме введенной ранее естественной нумерации, имеет еще один номер. Такого рода дерево возникает как реализация «смеси» двух ветвящихся процессов, которая конструируется так. В точке х [1], распределенной с плотностью р0 (х [1]), рождается одна частица. С вероятностью q0 (x [1]) = = 1 — 1р (х [1], ух, . . ., у8) \ks {dyi, . . ., dy8) она погибает, а с вероятностью qt (х [1]), i = 1, 2: \ Р{1) (* У У) ^s (dyn ...» dys) выбирается плотность р^ (х [1], уъ . . ., ys) lqt (x [1]) совместного распределения точек я? [1,1], . . ., ас [1, s], куда переходит s вновь возникших частиц. Затем процесс повторяется для каждой из возникших вновь частиц. Рассуждения, аналогичные проведенным ранее, позволяют построить несмещенную оценку /Y функционала (ср, /г), где ф есть решение уравнения G.1.32): У ho ^v(Q) ТТ / Iv (I)? *v(i)l ТТ ^v(l) ТТ г-TTFT Jy=-z х . . I I г—т—:—г I I —1 . . . L1 an fv (N) G.1.34^
§ 1] МЕТОДЫ РЕШЕНИЯ НЕЛИНЕЙНЫХ УРАВНЕНИЙ 337 Предположив теперь, что s2<Csi- Очевидно, что для этого случая ветвдщиися процесс следует строить как это было сделано выпГе, но при переходе из х [v (к)] к точкам х [v (к +1)] с вероятностью q± (x [v (к)]) будет рождаться st частиц (разыгрываться s± точек x[v (к + 1I)? а с вероятностью q2 (x [v (к)]) — s2 частиц. (Формально можно считать, что всегда рождается sx частиц, но sx — s2 из них фиктивны, и соответствующие им ветви у деревьев нужно исключить. Таким образом этот случай сводится к предыдущему.) Случай, когда в правой части уравнения G.1.32) содержится большее число слагаемых с нелинейностями того же типа, очевидным образом сводится к предыдущему. Читателю предоставляется сформулировать и доказать для «смеси» такого рода теорему, аналогичную теореме 7.2. Другие вопросы, связанные с нелинейными уравнениями и ветвящимися процессами мы осветим лишь бегло. Заметим, во-первых, что уравнение со степенной нелинейностью вида Ф(х) = \К(х, у)cps(у)\х(dy) + /(х) (mod\x) G.1.35) формально можно свести к рассмотренному ранее случаю, если мера fi такова, что можно ввести в рассмотрение б-функцию или ее аналог. Тогда G.1.35) можно записать в знакомой уже форме S ф (X) = J R (X, Ух, . . .,»,) П Ф (Уз) V* (dt/l • • • dVs) + f (X), где R (х, ух, . . ., у8) = К (х, у)Ь(у — ух). . . б (у — у9). Очевидно (см. замечание 3 гл. 6), что переходная плотность ветвящегося процесса должна содержать в качестве сомножителя соответствующие б-функции, что порождает определенные особенности в конструкции дерева. (Все s частиц будут здесь рождаться в одной точке.) Случай уравнения JV Ф (х) = 2 $ К, {х, у) <р* (у) dy + / (х) G.1.36) подробно рассмотрен в работах Ермакова [81, [9].
338 ЦЕПИ МАРКОВА (ДРУГИЕ ЗАДАЧИ) [ГЛ. 7 Во-вторых, нами рассматривалась лишь простейшая оценка типа оценки 1г главы 6. В работе Ермакова [9J описан аналог оценки /2. Очевидно, что можно строить и другие оценки, но это едва ли представит интерес, пока не будут проведены более детальные исследования других оценок в линейном случае. В-третьих, нами рассматривалась «сопряженная» вычислительная схема, а не «прямая», как в главе 6. Рассмотрение «прямой» схемы связано с обращением времени ветвящегося процесса (частицы должны сливаться, а не размножаться). Принципиальное обоснование возможности построения «прямой» схемы содержится в работе Некруткина [1]. Ниже излагается основная идея подхода, развитого в этой работе. Она состоит в следующем. Пусть имеется нелинейное уравнение вида ф (X) = / (X) + jj KW (х, у) ф (у) \l (dy) + , ух, ЫФЫФЫ V?{dyxdVi). G.1.37) т Обозначим <p(w> (Хц . . ., хт) = Д <p(xj). Полагая в G.1.37) х = xl9 получим уравнение, линейное относительно неизвестных функций ф*1) и <р<2>. Оно содержит, однако, две неизвестных функции. Полагая далее в G.1.37) х = х2 и умножая обе части этого равенства на соответствующие его части при х = х1У получим при очевидных обозначениях >4. 5] Это также линейное уравнение. Продолжая этот процесс, аналогичным образом можно получить бесконечную си-
f 1] МЕТОДЫ РЕШЕНИЯ НЕЛИНЕЙНЫХ УРАВНЕНИЙ 339 стему линейны* интегральных уравнений. Эта система будет эквивалента исходному уравнению G.1.37) в том смысле, что если $ля G.1.37) сходится метод последовательных приближений при ф0 (х) = f (х), то он будет сходиться и для полученной системы, если в качестве вектора начальных приближений взять вектор, к-я ком- к понента которого есть Д / {х{). Таким образом, нелиней- ная задача формально сводится к линейной, что дает возможность применить (при соответствующих дополнительных предположениях) аппарат главы 6. В частности, может быть построена и «прямая» схема для решения нелинейной задачи. Исследования в этом направлении, однако, еще далеки от завершения, и мы ограничимся лишь изложением основной идеи этого подхода. Следует заметить также, что уравнение Больцмана, рассмотрением которого мы начинали данный параграф, может быть приведено к виду, который несущественными деталями отличается от уравнения G.1.37). Для этого нужно обе части этого уравнения в дифференциальной форме проинтегрировать по достаточно малому промежутку времени А*. Метод последовательных приближений для построенного таким способом уравнения исследовался в ряде работ. Нетрудно сконструировать также и другие разновидности интегральной формы уравнения Больцмана, практически сходные с G.1.37). Выбор наиболее удобной формы, позволяющей использовать схемы, связанные с ветвящимися процессами, еще предстоит осуществить. Нами не ставилась задача детального освещения применений метода Монте-Карло в газовой динамике. По этой причине остались незатронутыми многие важные для этой области работы (например, работа Бёрда [1]). Можно с уверенностью утверждать, что приложения метода Монте-Карло в газовой динамике заслуживает отдельной книги. Мы использовали уравнение Больцмана лишь как пример, для которого важно] приложение общих методов решения многомерных нелинейных задач. Можно отметить в заключение этого параграфа, что в настоящее время с методом Монте-Карло связано три подхода к решению нелинейных уравнений. Первый подход подразумевает линеаризацию задачи (последовательное
340 ЦЕПИ МАРКОВА (ДРУГИЕ ЗАДАЧИ) [ГЛ. 7 решение ряда линейных задач), второй подход связан с ветвящимися случайными процессами и третий подход связан со случайным поиском и параметризацией исходной задачи (он обсуждался в главе 5). § 2. Стационарные распределения и собственные функции линейных операторов 1. Общие сведения о стационарных распределениях цепей Маркова. Оценка погрешности. Остановимся сначала на теоретико-вероятностных фактах, позволяющих использовать метод Монте-Карло для вычисления характеристик цепей Маркова, связанных с их стационарным распределением. Множество состояний у цепи Маркова будем считать конечным (равным п) или счетным и обозначать Q (у ЕЕ Q). Состояния у будем также снабжать номером (индексом). Рассмотрим некоторые факты относительно структуры цепей Маркова. Говорят, что yk — состояние с номером & — достижимо из состояния Yj-, если существует такое т ^> 0, что вероятность перехода из у* в yk за т шагов положительна. Множество состояний @ = {yiV . . м yis) называется замкнутым, если из любого состояния, входящего в @, не может быть достигнуто никакое состояние, не входящее в @. Если некоторое состояние образует замкнутое множество, то оно называется поглощающим состоянием. Например, если переходная матрица 3* имеет вид (q1' г бгь ) , где d*b х и ?Р2ч2 — квадратные стохастические матрицы, а 0 — прямоугольные нулевые матрицы, то состояния, соответствующие 2PV1, не могут быть достигнуты из состояний, соответствующих ^2,2, и обратно. Цепь с такой матрицей может быть использована для решения систем линейных алгебраических уравнений, очевидно, лишь в том случае, если система распадается на две независимые системы уравнений соответствующего порядка. Цепь называется неприводимой, если в ней нет никаких замкнутых множеств, кроме множества всех состояний. Если вероятность перехода из /-го состояния в /-е (возвращения) за т шагов равна нулю для любого t, не кратного t ]> 0, и t0 — наименьшее число, обладающее этим свойство^ то состояние yj называется периодическим с перио-
§ 2] СТАЦИОНАРНЫЕ РАСПРЕДЕЛЕНИЯ 341 дом f0. Если цепь имеет периодические состояния, то она называется периодической. Пусть теперь i± ->- it ->¦ . . . -»- In — траектория цепи Маркова. Обозначим р (N) вектор с компонентами (Р {iN = 1}, . . ., Р {iN = п}). Основной факт, который будет необходим далее, состоит в следующем. Если марковская цепь с конечным числом состояний — неприводимая и непериодическая, то она обладает свойствами эргодичности. Это означает, что существует предел lim р (N) = ~р, не зависящий от начального рас- JV-9-OO пределения р0. Компоненты вектора ~р — (ръ . . ., рп) положительны и представляют собой дискретное (стационарное) распределение вероятностей. Для эргодической цепи существует предел lim ?PN = S^oo- Последний пред- ЛГ-»оо ставляет собой стохастическую матрицу, все строки которой одинаковы, и ~р удовлетворяет уравнению ~р = i^oo. При бесконечном числе состояний может оказаться, что limp (N) = 0. Подробное изложение этих вопросов чи- татель найдет в книге Феллера [1]. Для дальнейшего полезно заметить, что вектор-столбец рт является собственным вектором матрицы S57, соответствующим собственному числу, равному единице. Поэтому задача определения характеристик стационарного распределения тесно связана с задачей определения собственных функций линейных операторов, когда их наибольшее собственное число есть единица. Основой для применения метода Монте-Карло при решении такого рода задач может служить Усиленный закон больших чисел для цепи Маркова (Сарымсаков [1]), который гласит: если р — единственное стационарное распределение стохастической матрицы SP, то для любого начального распределения р0 и произвольной функции состояний f (у) имеет место равенство N п Р { lim ЛГ-t 2 / (Tik) = S P)f (Ti)} = I- G-2.1) где ii —*-,i2 —*¦ i$ -*-... — последовательность переходов (траектория) цепи Маркова.
342 ЦЕПИ МАРКОВА (ДРУГИЕ ЗАДАЧИ) [ГЛ. 7 Таким образом, для оценки среднего по стационарному распределению р достаточно моделировать одну траекторию цепи, но достаточно большой длины. Метод Монте-Карло может оказаться незаменимым при исследовании цепей с очень большим числом состояний. Такие цепи возникают, например, в теории массового обслуживания и статистической физике. При моделировании в этих случаях часто трудно записать матрицу З5 в явном виде, особенно когда число состояний исчисляется сотнями тысяч. Любая достаточно сложная временная модель, рассматриваемая через промежутки времени Д? и обладающая свойством марковости, может доставить значительные трудности при записи соответствующей переходной матрицы. Это исключает возможность использования классических вычислительных методов линейной алгебры для нахождения стационарного распределения. Что же касается метода Монте-Карло, то, как уже отмечалось, своеобразная трудность состоит в оценке его погрешности. Трудность эта носит вычислительный характер. Нужно построить удобный алгоритм для оценки параметров предельного распределения. Ниже мы остановимся на некоторых алгоритмах для оценки погрешности при моделировании случайных величин, связанных в марковскую цепь. Прежде всего рассмотрим задачу о вычислении Р (©) — вероятности некоторого подмножества стационарных состояний @. Построим методом Монте-Карло траекторию ?х -> i2 -> . . . и в качестве оценки Р (©) возьмем среднее где N'— число попаданий частицы в состояния, принадлежащие © (случай задачи В в гл. 1). Оценка G.2.2) является несмещенной и асимптотически нормальной (см. гл. 1). Ее дисперсия может быть выражена через $> и З^оо. Она равна (Кемени, Снелл [1]) DP (@) = 25 (Z -Е)Ве +0 (N~2), G.2.3) где В — диагональная матрица, на диагонали которой находятся элементы Ъь,ь, равные единице для iES и нулю в противном случае,^ = (Е — (^ — З5,»)), Е — единичная матрица и е — вектор, компоненты которого
§ 2] СТАЦИОНАРНЫЕ РАСПРЕДЕЛЕНИЯ 343 равны единице. Очевидно, использование такого выражения в условиях, когда не имеется даже явного вида матрицы, невозможно. В работе Гарабедян и Романовского [1] предложен следующий прием построения доверительного интервала для Р (@). Пусть переходы из состояния в состояние происходят через некоторые промежутки времени. Обозначим через tly t2, . . ., t^' моменты попадания частицы в множество 6 и т^ = ti+1 — tt. Последовательность т1э . . ., хм* является стационарной и Мтг- = Мт= = 1/Р (@). Очевидно, что если [а~, а+] — доверительный интервал для Мт с некоторым уровнем доверия, то [1/а+, 1/а"] будет доверительным интервалом для Р (<3) с тем же уровнем доверия. Известно (Хеннан [1]), что величина IV'—1 распределена асимптотически нормально с математическим ожиданием Мт и дисперсией b/(N' — 1), где оо Ь = 2 M((T4-Mt)(ti+i-MT)) (см. также гл. 1). Величину Ъ можно оценить по последовательности {Т|} с помощью оценки к ЛГ'-i-s 6» = 2(^'-l-«) S (t{-x)(Ti+s-T). 5=1 1=1 Считая t распределенной нормально, определяем а+ и а" и строим доверительный интервал для Р (©). Описанный метод является достаточно общим. Как уже отмечалось в главе 3, если моделируемый процесс таков, что зависимость от прошлого достаточно быстро убывает с течением времени, то вводя подходящее пространство состояний, его можно приблизить марковским процессом так, что все или все интересующие нас средние значения для обоих процессов будут близки. Это создает базу для использования метода во многих ситуациях.
344 ЦЕПИ МАРКОВА (ДРУГИЕ ЗАДАЧИ) [ГЛ. 7 Кроме того, он может быть также использован для определения погрешности скалярного произведения (h, p), где h — заданный вектор с положительными компонентами. Подробно об этом сказано в цитированной работе Гарабедян и Романовского [1], где имеются численные примеры для п = 20. 2. Оценка погрешности при моделировании процессов регенерации. Широкий класс процессов массового обслуживания относится к числу процессов регенерации. Для этих процессов на базе соответствующей предельной теоремы могут быть построены удобные алгоритмы оценки погрешности. Ниже приводится эта теорема и оценки. Их применение обсуждалось в работах Поляка [1], [2]. (См. также Шнепс-Шнеппе, Инауниекс [1], Шнепс-Шнеппе, Школьный [1], где рассматривались близкие к описанным процедуры.) Процесс регенерации характеризуется тем, что его траектории состоят из независимых участков, называемых циклами. Когда вычисляется аддитивный функционал на траектории, то он может быть представлен в виде суммы независимых случайных величин. Это обстоятельство существенно упрощает задачу оценивания погрешности. Формальное определение процесса регенерации (см., например, Кокс, Смит [2]) связано с понятиями процесса восстановления и цикла. Процессом восстановления называют последовательность взаимно независимых, неотрицательных, одинаково распределенных случайных величин (обычно входящий поток в системах массового обслуживания). Циклом называют упорядоченную пару z = = (8, х (t)), где 0^0 — вещественное число, а х (t) — определенная на [0, 6] функция, принимающая значения из некоторого пространства ЗВ. Пусть % есть а-алгебра подмножеств ЗЕ. На пространстве циклов U также можно определить а-алгебру и ввести вероятностную меру Р такую, что вероятность г|)А (t) = Р {х (t) е Л, 0 > *}, А е Я, определена для всех t ^ 0. Пусть теперь zt = @г-, xt (г)), 1=1,2,... — последовательность взаимно независимых циклов. Если положить Р {0 < *} = 1 — Р {0 > t} = 1 — Р {х (t) е ЗЕ, 0 > t) (предполагается что Р {0 = 0} < 1, Р {х < оо) = 1), то дг образуют процесс восстановления. Процесс регенерации xt сконструируем следующим образом. При t = 0 из U выбираем цикл (х1 (?), 0Х) и на промежутке @, 0Х) полагаем xt = хг (t). Когда мы достигнем момента времени t = 0Х, то снова выбираем цикл (х2 (t), 02) и на интервале времени (9lf 0Х + 02) полагаем xt = x2(t — 0Х); далее
2] СТАЦИОНАРНЫЕ РАСПРЕДЕЛЕНИЯ 345 процесс конструируется аналогичным образом. Ограничение на начало процесса t = О легко можно устранить, но мы не будем останавливаться на этом вопросе. Многие случайные процессы в теории массового обслуживания являются процессами регенерации. Например, в системе массового обслуживания с к приборами (см. гл. 3 § 2), которая в момент времени t = О свободна от требований и в которой интервалы между поступлением требований образуют процесс восстановления, точками регенерации можно считать моменты возвращения в исходное состояние, когда система свободна от требований. (Предполагается, что коэффициент ее загрузки меньше единицы.) Промежутки между точками регенерации являются циклами. Пусть w (t) — некоторая характеристика системы массового обслуживания (например, число требований в системе, число занятых обслуживанием приборов и др.) и требуется определить среднее значение этой характери стики, когда система находится в стационарном режиме. В этом случае в процессе моделирования вычисляется G.2.4) и при некотором Т ^> То w будет равно искомой характеристике с достаточной степенью точности. Если N Т =Sv+i = 2 ХЬ ГДе xi = 5г+1 — St, i = 0, . . ., Nj И ПО- г=0 следовательность s0, . . ., sx образует процесс восстановления, а случайные величины zt = W (si+1) — W (st), где X = \w{t)dt, вваимно независимы и одинаково распределены (если w (t) — процесс регенерации, то такие st существуют), то G.2.5) Мы окажемся в условиях, когда применима предельная
346 ЦЕПИ МАРКОВА (ДРУГИЕ ЗАДАЧИ) [ГЛ. 7 теорема (Крамер [11, Кокс, Смит [2]), если предположим дополнительно: а) случайные величины z{ и Xj независимы i фу б) случайные величины W (si+1) — W (я*), где W (х) = х = ^\w(t)\dt, также взаимно независимы и одинаково рас- о пределены; в) М ^{ = \хт < -(- оо, М z\ = Шт <С + оо, /м = 1,2. Теорема гласит: Теорема 7.3. Распределение случайной величины W (ТIТ при соответствующей нормировке и Т -> оо сходится к нормальному, причем 1. с вероятностью 1 W{T)IT ->¦ ffijyix при Г-^оо, 2. М {W (Т)/Т) -> mx/fxx при Т -> оо, 3. D (W (Г)/Г) = d/T +0 (Г*1), -1тг + б1 hrr) ' G-2-6) ai == М^2 — H-i» ol = m2 — wl?, i|) — коэффициент корреляции между х и z *). Заметим, что аналогичное выражение для d можно получить из G.2.5) и теоремы 4.13. Теорема 7.3 дает возможность, как обычно, построить доверительные интервалы, если получена оценка дисперсии. Величины sk определяются в процессе моделирования, и различные слагаемые, входящие в G.2.6), оцениваются по некоторому числу циклов (в работе Поляка [2] рекомендуется 200— 400 циклов). При этом моменты различных случайных величин оцениваются соответствующими средними арифметическими. Что касается величины смещения, то о ней можно составить представление, используя приемы, сходные с приемами дисперсионного анализа. Нужно иметь по крайней мере две независимые реализации процесса на промежутке времени @, Т) и одну на промежутке @, 2 Т) (последняя может включать одну из реализаций на промежутке @, Г)). Если начальное состояние было во всех случаях одним и тем же, то случайная погрешность *) Теорема 7.3 справедлива при несколько более слабых предположениях, чем сделанные нами.
§ 2] СТАЦИОНАРНЫЕ РАСПРЕДЕЛЕНИЯ 347 для промежутка (О, 2Т) и среднего двух реализаций на (О, Т) будет иметь один порядок, а смещение будет разным. Описанные приемы оценки погрешности в настоящее время наиболее употребительны, если не считать некоторых более общих подходов, связанных с анализом временных рядов, о которых упоминалось в гл. 3. Несколько упрощая ситуацию, можно сказать, что, если в главах 4 и 6 речь шла об оценке среднего, то в задачах, связанных со стационарным распределением, речь идет об оценке отношения средних. Если вспомнить замечание о связи рассматриваемой задачи с задачей об определении собственного вектора матрицы и учесть, что наиболее простым методом приближенного определения компонент собственного вектора, соответствующего наибольшему по модулю собственному числу, является итерационный, где последовательно вычисляются отношения компонент некоторых векторов, то специфику задач, связанных со стационарным распределением, можно уяснить очень четко. Говоря конкретнее, связь между задачами главы 6 и задачей определения характеристик стационарного режима очень просто установить на примере цепи с конечным числом состояний, если считать, что каждый переход из состояния в состояние происходит за время Д t = 1. Действительно, заметим, что скалярное ^произведение (Л, #), где h — произвольный вектор, а р — собственный вектор матрицы 9>т, соответствующий наибольшему собственному числу, равному единице, можно представить в виде (ft, р) = Um ± (ft, 2 <Wft) = Ъ%ТГ(*» S * Здесь р0 — произвольный начальный вектор. Мы считаем, что он является распределением вероятностей. Для оценивания скалярного произведения (р0, 3**Л) можно сконструировать различные оценки, используя результаты главы 6. Легко видеть, однако, что оценка /3, для которой все шг = 1 (см. стр. 282), здесь наиболее естественна. Если считать компоненты вектора h с номерами из ® равными единице, а остальные равными нулю и считать Kit j = pu j (в обозначениях гл. 6,), то для траектории
348 ЦЕПИ МАРКОВА (ДРУГИЕ ЗАДАЧИ) [ГЛ. 7 1 длины N оценка -^r- [J3]n очевидным образом совпадает с оценкой G.2.2). [J3]n здесь обозначает, что берется «урезанная» оценка /3> вычисленная на траектории длины N. В тех случаях, когда отрезки времени между переходами случайны, но процесс регенерирующий, очевидным аналогом оценки-jr=- [J3]n оказывается оценка G.2.4). 3. Аналог метода существенной выборки в стационарном случае рассматривался И. Ю. Линником [1]. Ниже излагаются полученные им результаты. Число состояний цепи предполагается конечным и равным п. Множество состояний обозначим Q = {1, . . ., п). Отметим прежде всего, что оценка -тН/зЫ при Ки j =f= pt, j оказывается несостоятельной. Для простоты считаем, что pt > 0, ри 7- > 0 для *, / = 1, 2, . . ., п. В этом случае стационарное распределение заведомо существует. Пусть $>' = || р^ j I) г, j=i — стохастическая матрица с положительными элементами, ар' — вектор с по- п ложительными компонентами такой, что 2 Р% = ^- Рас~ смотрим оценку JV-1 WAA- 1 Гу, 1 VI t где « = 0 JV—1; Vi.4 (io ~^ Н ~~* - • • -* Jiv-i — отрезок траектории цепи Маркова с начальным распределением р' и переходной матрицей S5'). Имеет место следующая Лемма 7.2. При сделанных предположениях 1°. е (N) является асимптотически несмещенной оценкой для (й,, р), 2°. ? (iV) состоятельна лишь при &' = 3* и р' = р. Доказательство. Утверждение 1° очевидно. Докажем 2°. Пусть i0 -> ?х ->- . . . ->¦ ^]у_х — траектория
§ 2] СТАЦИОНАРНЫЕ РАСПРЕДЕЛЕНИЯ 349 цепи (р\ З5') ж"р' — ее стационарное распределение. Образуем векторный процесс It с траекторией Д-^Д-*- . . ., которая образуется из траектории i0 ->- ii -> . . . по правилу Этот процесс является марковским с множеством состояний Q2 = {1, . . ., га} X {1, . . ., га} и стационарным распределением П = {rij}iea*, где Пх = p'ipitJ(I= (*,/))• Величину %i можно представить в виде i li = -^" hx4u ¦¦•qil = 1^ \ ехр | 2 In It Л' G-2-7) где ^j. = Pij_bi-/p\. ,г- —функция векторного индекса /. Но справедливо неравенство 2 Aп#1)П/^0, причем равенство достигается лишь при ?Р' = ИР- Действительно, так как 1ш: — строго выпуклая функция, то из неравенства Иенсена следует =Inl=0 и равенство имеет место лишь при З5 = З5'. Возвращаясь к G.2.7), видим, что на основании закона больших чисел для процесса ft ?z -> 0 при Z -> оо почти всюду. Отсюда е (N) ->¦ 0 почти всюду и при &> Ф &' не является состоятельной. Пусть теперь 2Р = $>'. Тогда ЛГ-1 ;=о и легко видеть, что в GV) асимптотически несмещена лишь при условии р — р'. Лемма доказана.
350 ЦЕПИ МАРКОВА (ДРУГИЕ ЗАДАЧИ) [ГЛ. 7 Пусть, как и ранее, Q означает множество состояний цепи у Е Q, А (у) — заданная функция состояний цепи и N 42 G.2.8) — оценка функционала Зададимся некоторым натуральным числом s и набором s неотрицательных конечных функций gt (у) (I = 1,... s—1 . . ., s) таких, что из условия h2 (Tif) Д р (^ -> чи+1) > 0 s следует Д ^z(Ti,)]>0 для всевозможных наборов io, ... . . ., i8. Символ р (yf -> у") имеет здесь очевидный смысл вероятности перехода из состояния у' в состояние т". Каждому набору {gji поставим в соответствие векторный марковский процесс zh = (z^\ . . ., z$),k= 1,2, . .., где z$ принимают значения из множества Й, полученного из Q добавлением поглощающего состояния {а}. Процесс этот построим следующим образом. Положим при у', у" Ей и 1 < Z< s G.2.9) ) Р (Т' -* Т") ^j Ю/S (I, Т') при 5 (I, т') > 0, о кроме того, r<D (у -* а) = 1, если S (Z, v') = 0, г") (y' -> а) = 0, если S (I, у') > 0, г«) (а _* ?') = о, у' ф а и И') (а-^а) = 1.
§ 2] СТАЦИОНАРНЫЕ РАСПРЕДЕЛЕНИЯ 351 Будем считать, что при фиксированном к координаты z(fc° вектора zh связаны в цепь Маркова с вероятностью перехода G.2.10) где р^ (у' ->¦ y") имеет смысл вероятности перехода из у' в y" за 5 шагов, а распределение 40) совпадает с начальным распределением исходной цепи Маркова. Пусть теперь N = ms, т = 1, 2, ... Введем следующий класс оценок функционала (р, fo), связанный с семейством функций eSyg(J7i) ~ тп х 2j T №)» (/.?.11) где 0, если %ь == л. Заметим далее, что стационарное распределение процесса »fe имеет вид lim r{Zk = ifio, Zfc = Yit» • • •» z/c = Tis)" = и легко видеть, что среднее функции / по этому распределению равно искомой величине (р, h). Отсюда следует, что оценка G.2.11) является состоятельной при к ->¦ оо оценкой функционала (р, h). При моделировании процесса zft приходится параллельно моделировать исходный процесс, поэтому вычислительная работа возрастает. Траекторию i0 ->• h ->¦ • . . исходной цепи длины N = rns «разрезают» на т непере-.
352 ЦЕПИ МАРКОВА (ДРУГИЕ ЗАДАЧИ) 1ГЛ. 7 секающихся участков и каждое состояние У%,к_1)8 полагается равным z^\ Оно служит исходным для (независимого уже) подсчета реализаций z^\ . . ., z{^ и вычисления оценки G.2.11). Изучим далее дисперсию оценки G.2.11), предполагая h неотрицательной функцией на Q. Пусть процесс / (zh) находится в стационарном режиме и R (к) — его корреляционная функция (s^>0). Обозначим <*.* = * 2 Я (/с). G.2.12) fr=-oo Тогда при N = ms, т = 1, 2, . . ., D le.,8 (N)] = N-4.4 + О (N-*). G.2.13) Положим Ao(T) = ft(T), MT)= S 2>W(T->T')^(T'). ^>0. G.2.14) Справедлива следующая Теорема 7.4. A) Для оценки e^g величина dSig достигает своего минимума rfs, равного 2 G.2.15) ?z (?) = gi0) (Y) = Vz (Y). B) Существуют оценки еы со сколь угодно малой величиной ds,g. Доказательство. Легко видеть, что член ряда G.2.15) с номером к Ф 0 равен соответствующему члену ряда G.2.12), который от g не зависит. Что же касается R @), то Я @) = 2 Р (Tic) V (ТО П IP (Tiz.! ~> TiZ) S (^ Ti/J/ft (Ti,)l - 1=1 - (p, hf, G.2.16) где суммирование происходит по всем yit, . . . ., yisf
§ 2] СТАЦИОНАРНЫЕ РАСПРЕДЕЛЕНИЯ 353 для которых s ^2(Tis)Ilp(Tiz.1->Tiz)>O. Рассмотрим далее условия, при которых G.2.16) оказывается минимальным. Обозначим yt = у, yt = у' и Ss (у') = g (у')- Заменяя S (s, у') его выражением G.2.9), запишем G.2.16) в новых обозначениях = S (Р,йJ, G.2.17) L(y)>0 где s—1 o) П [p (Ti,.! -* W ^ (/, Ti^Vft (ti,) 1. И ф (т) = Sp(t^t')Bp(t-> t") g (т")) h* W)/g (П Y'er Y"efl G.2.18) Очевидно, Ф(Г) > S В нашем случае имеется конечное множество состояний у из Q. Конечное множество g (у\) = g(i\ i = 1, . . ., п, значений функции g на Q будем далее рассматривать как набор независимых переменных в ?г-мерном евклидовом пространстве. Множество g^ ^> 0, i = 1, . . ., п, в этом пространстве обозначим Я. Зафиксируем у и будем рассматривать г|) как функцию переменных g^K Эта функция постоянна на любой полупрямой в Л, исходящей из нуля. Она стремится к бесконечности, когда угол между такой полупрямой и какой-либо гиперплоскостью, ограничивающей ^, стремится к нулю. Условие обращения в нуль 12 С. М. Ермаков
354 ЦЕПИ МАРКОВА (ДРУГИЕ ЗАДАЧИ) [ГЛ. 7 градиента -ф в Я, очевидно, состоит в следующем: ( обозначает здесь текущую переменную). Таким образом, градиент гр обращается в нуль только на полупрямой, проходящей через нуль и точку {h (у') }T'Gr • Поэтому для всякого у е {у : L (у, ?s_2, . . ., i0) > 0} ц)(у) достигает своего минимума при gs (y)=h (у) = ho(y) и этот минимум есть hl(y). (При этом значении gs значения Ф (у) и г|) (у) совпадают). При 5=1 этим доказано первое утверждение теоремы. Если s ^> 1, то при полученных значениях gs (у) обозначим далее в G.2.16) yh^= у, yis_t = у', gs^ (у) = g (у). Проводя суммирование по i0, h, . • ., is-3, iSi легко снова получить выражение вида G.2.17) и провести те же рассуждения, что и выше. Это даст нам оптимальные значения g"s-x (у) = /&i (у). Повторяя это рассуждение еще s— 2 раза (если s> 2) и подсчитывая значение R @) при получаемых оптимальных значениях gt (у), I = 1, . . ., s, получим первое утверждение теоремы при произвольном s. Обозначим далее rs = max | р^ (у -> у') — 'р (у) |, G = y, y'<=o = max h (у). Известно (Кемени, Снелл [1]), что ts < La\ где L — положительная константа и0<а<1. Отсюда и из G.2.15) получим т. е. ds ->- 0 при 5 —> оо, что и доказывает второе утверждение теоремы. Теорема доказана. Хотя оптимальный выбор g указан теоремой, при очень большом числе состояний у ее конструирование с помощью формулы G.2.14) осуществляется далеко не просто, и представляет интерес приближенный выбор g. Он может быть иногда осуществлен при исследовании упрощенной цепи Маркова с укрупненными состояниями. Пример удачного выбора g для оценивания малых вероятностей при моделировании сложной системы коммутации можно найти в работе И. Ю. Линника [1].
§ 2] СТАЦИОНАРНЫЕ РАСПРЕДЕЛЕНИЯ 355 4* Другие методы повышения эффективности при моделировании стационарных распределений цепей Маркова изучались в связи с задачами массового обслуживания и задачами расчета ядерных реакторов. Имеется значительное число работ, где этот вопрос рассматривался в связи с задачами массового обслуживания. Мы сошлемся лишь на работы Башарина, Харкевича и Шнепса-Шнеппе [1], Поляка [1], [2], Поляка и Розенталя [1], Шнепса- Шнеппе [1], [2], а также монографию Фишмана [1]. Ряд других ссылок читатель найдет в дополнительном списке литературы. Систематической теории, подобной теории повышения эффективности при решении интегральных уравнений для задач массового обслуживания, однако, не развито, и ряд приемов носит характер рекомендаций, основанных на эмпирических соображениях. На задачах, связанных с расчетом ядерных реакторов, мы остановимся несколько позже. Для случая процесса регенерации систематическое изложение ряда приемов повышения эффективности содержится в работе Поляка [2]. На некоторых из них мы далее остановимся, имея ввиду отметить как возможность перенесения на стационарный случай некоторых общих приемов, развитых в главе 4, так и определенное своеобразие проблемы, которое уже проявилось, впрочем, при обсуждении метода существенной выборки. Метод частичной регуляризации является очевидной модификацией метода выделения главной части при вычислении интегралов. Предполагается, что случайная величина х, фигурировавшая в теореме 7.3, может быть представлена в виде х = #(х> + а*2\ где я<2) не зависит от х <*> и z, а ее среднее значение известно заранее. В этом случае уменьшения дисперсии можно добиться за счет замены величины #B> ее математическим ожиданием. Легко показать, что получаемый после такой замены процесс будет вновь процессом регенерации, средние для обоих процессов будут совпадать, а дисперсия для нового процесса будет меньше. Метод зависимых циклов является очевидным применением метода антисимметричной выборки (формула D.3.1)). По этому поводу см. также работу Пейджа [1]. Метод состоит в том, что последовательные циклы объединяются попарно. Каждая пара дает новый цикл, внутри которого 12*
356 ЦЕПИ МАРКОВА (ДРУГИЕ ЗАДАЧИ) [ГЛ. 7 испытания зависимы. Если моделирование первого «под- цикла» начинается использованием случайного числа а, то моделирование второго — использованием числа 1 — а. Как следует из главы 4, в некоторых случаях описанный метод будет приводить к повышению эффективности моделирования за счет уменьшения дисперсии случайных величин х и z. Нетрудно применить, очевидно, расслоенную выборку или другие квадратурные формулы со случайными узлами. Смещенность оценок является характерной особенностью рассматриваемых задач. Как правило, при оценивании некоторой характеристики w с помощью оценки J N N G.2.5) (wN = 2 zi I 2 xi) смещение убывает с ростом N как О (N~l), а статистическая погрешность как О (N~^z). В некоторых случаях, однако, константа в выражении О (N~l) может быть большой, и требуется построение специальных оценок, уменьшающих смещение. Чтобы это сделать, нужно заметить, что теоремы типа теоремы 7.3, описывающие предельное распределение некоторой функ- N N ции F (-^ 2 хь -дг 2 %Ч (в нашем случае F (х, у) = ylx) и определяющие величину смещения, могут быть получены, если F разложить в ряд Тейлора в окрестности точки (Мх, Mi/). (Существенно предполагать наличие необходимого числа производных функции F в окрестности этой точки и существование старших моментов случайных величин х и z.) Аналогичным путем, используя разложение F в ряд Тейлора, можно получить оценку wN, смещение которой имеет более высокий порядок убывания. В работе Поляка [2] построена оценка вида G.2.19) где ^\ означает несмещенные оценки соответствующих величин (например, с помощью выборочных средних). Смещение этой оценки убывает как О (N~s^). 5. Приложения, связанные с некоторыми физическими задачами. До сих пор наше изложение было связано, в той или иной мере, с задачами массового обслуживания.
§ 2] СТАЦИОНАРНЫЕ РАСПРЕДЕЛЕНИЯ 357 Задачи, связанные с вычислением характеристик стационарного распределения марковских цепей, играют, однако, важную роль и в других областях науки. Примером тому может служить описываемая ниже модель, которая играет важную роль в статистической физике и к которой могут применяться отдельные методы повышения эффективности, рассмотренные выше. Пусть имеется система N одноатомных частиц. Обозначим rt положение центра инерции ж vt — скорость каждой из них (i = 1, . . ., N). Набор r±, vx\ . . .; rNj vN будем называть состоянием системы. Функция Гамильтона системы Я (ги г?х, . . ., r^r, Vn) есть сумма кинетической и потенциальной энергии N ? Я (гъ vu ..., г я, vN) = 2 —?г + un (rl9 ...,rN) (т — масса частицы). Введем упрощающее предположение — будем считать, что потенциальная энергия определяется попарными взаимодействиями UN(ru...,rN) = 2 Ф(\гг-г,\), где Ф —- заданная функция. Из статистической физики известно, что при достаточно больших N плотность вероятности состояния ru Vu . . ., Vnj Vn есть exp [- Я (rlf«!,..., rN, vN)/kT], G.2.20) где un — константа нормировки, к — константа, Т имеет смысл температуры системы. Так как vt входят только в выражение для кинетической энергии и достаточно простым образом, то можно аналитически проинтегрировать G.2.20) по всем Vi и получить плотность вероятности нахождения частиц в точках ти . . ., Tn в виде Ыу1 ехр {- V (гъ ..., rN)/kT}, G.2.21) где fcw — константа нормировки, так называемый конфигурационный интеграл. Величина а^ может быть выражена через biv» а различные термодинамические величины — давление, энтропия и т. п.— через частные производные
358 ЦЕПИ МАРКОВА (ДРУГИЕ ЗАДАЧИ) [ГЛ. 7 от ан, т. е. через средние вида _ [f (п, . . . , rN) exp {— V/kT} dn .. . drN F = ^ так что нашей задачей является их вычисление при некотором заданном F. Разобьем все пространство на гиперкубы с достаточно большой стороной и будем считать, что задача симметрична относительно граней гиперкуба (когда частица пересекает какую-либо грань, выходя из гиперкуба, она автоматически появляется через противоположную). Далее внутри гиперкуба строится сетка с малым шагом, и считается, что частицы могут находиться только в узлах сетки. Все узлы занумеруем подряд: / = = 1, . . ., п, и будем считать, что п п bN ~ 5* = ^ ехр {- Vj/kT) и F^Fj exp {Vj/kT}. Построим теперь цепь Маркова со стационарными вероятностями Нужно подобрать такие pj, t — элементы стохастической матрицы, чтобы выполнялось условие стационарности п 2 Л. !» = *!. G'2-22) т. е. сколько частиц уйдет из точки с номером /, столько придет в точку / из других точек. Задача, в частности, будет решена, если равновесие будет детальным, т. е. - G-2.23) Если равенства G.2.23) просуммировать по ;, то, очевидно, получим G.2.22). Итак, если pj,t exp {Vt/kT} = р^ exp {Vj/kT}, то выполнено G.2.22). Далее поступаем следующим образом. Выберем некоторую точку сетки с номером I и поместим в ней частицу. С равной вероятностью выберем некоторую другую точку с номером / и подсчитаем соот-
§ 2] СТАЦИОНАРНЫЕ РАСПРЕДЕЛЕНИЯ 359 ветствующую ей потенциальную энергию. Если Vt ^ ^ Vj, то считаем совершившимся переход из / в /. Если же Vi ^> Vji считаем, что переход в 1-ю точку совершается с вероятностью ехр {— (Vt — Vj)/kT}, т. е. выборочное а > ехр {— (Vk — Vj)/kT], и с дополнительной вероятностью считаем, что перехода нет, т. е. частица осталась на месте. В силу симметрии такой процедуры (ей подвергаются все частицы по очереди) условие G.2.22) выполняется. Среднее арифметическое F по всем положениям служит нужной оценкой. Параметры случайного сдвига нужно выбирать в соответствии с физическими свойствами вещества — малыми для кристаллов, большими для жидкостей и еще большими для газов. Подробнее об этом см. Фишер [1]. Другим важным примером физических задач, связанных со стационарными распределениями цепей Маркова, являются задачи расчета ядерных реакторов. Мы остановимся лишь на общей схеме решения этих задач. Подробности читатель сможет найти в достаточно обширной специальной литературе. При решении задач расчета реакторов стремятся обычно так подобрать параметры, определяющие реактор (его размеры и материалы), чтобы распределение нейтронов в нем было стационарным. Стационарный режим характеризуется тем, что коэффициент размножения нейтронов в реакторе к9ф равен единице. Расчет обычно слагается из расчета ряда вариантов величины &Эф, в процессе которых производится подбор параметров. (Вероятно, здесь могут быть использованы методы стохастической аппроксимации, но о реализации подобный вычислительных процедур автору ничего не известно.) При прямом моделировании (имитации физического процесса) задача расчета кдф отличается от задач переноса нейтронов, обсуждавшихся кратко в главах 3 и 6, тем, что 2дел > 0, т. е. имеет место еще один элементарный процесс взаимодействия, в результате которого в некоторой точке фазового пространства вместо одного может возникнуть два или более нейтронов. Как уже описывалось ранее, некоторые нейтроны могут поглотиться, некоторые покинуть систему и требуется определить среднее число нейтронов, которые составят потомство одного нейтрона. Эта величина и есть /сЭф. В действительности мы имеем
360 ЦЕПИ МАРКОВА (ДРУГИЕ ЗАДАЧИ) [ГЛ. 7 здесь дело с ветвящимся марковским процессом, который можно имитировать как ветвящийся и использовать различные статистические оценки для /сЭф. Возникающие при этом неудобства связаны с тем, что при кЭф Ф 1 число частиц будет либо расти, либо убывать. По этой причине разработан ряд приемов замены ветвящегося процесса эквивалентным процессом, в котором число частиц остается постоянным (см., например, Михайлов [7]). Такой процесс является уже стационарным. Для оценок, построенных на его траекториях, можно применить предельные теоре- ремы для случайных величин, связанных в цепь Маркова. Заметим также, что /сэф является наибольшим собственным числом линейного оператора CfC, явный вид которого мы не будем выписывать (его сравнительно просто получить, исходя из уравнения переноса F.4.1)); (см., например, Владимиров, Соболь [1], Марчук [1]). Стационарное же распределение нейтронов является собственной функцией этого оператора, соответствующей кЭф = 1. Алгоритмы метода Монте-Карло для расчета наибольшего по модулю собственного числа и соответствующей собственной функции оператора ЗС, опирающиеся на оценки функционалов вида {CfCmi,h) и, следовательно, на теорию, развитую в главе 6, освещены в большом числе работ. Мы сошлемся в этой связи лишь на работы Владимирова, Соболя [1], Фролова, Ченцова [3], Владимирова [1] и Михайлова [9]. Очевидно, что многие приемы повышения эффективности метода Монте-Карло, развитые как при решении задач расчета реакторов, так и при решении задач массового обслуживания, могут быть перенесены на случай расчета собственных чисел и собственных векторов других операторов. До сих пор, однако, даже очевидный параллелизм, который существует между методом Монте-Карло в задачах массового обслуживания и задачах расчета ядерных реакторов, не нашел практического использования. § 3. Методы решения дифференциальных уравнении Известно значительное число фактов относительно вероятностной трактовки дифференциальных уравнений. Нетрудно также привести примеры использования методов, развитых в теории обыкновенных дифференциальных урав-
3] РЕШЕНИЕ ДИФФЕРЕНЦИАЛЬНЫХ УРАВНЕНИЙ 361 нений и уравнений в частных производных, для решения задач теории вероятностей и математической статистики. В этих областях можно указать работы, ставшие ныне классическими (это, например, работы Винера 12], Филипса, Винера [1], Куранта, Фридерихса и Леви [1], Петровского [1], Каца [3] и ряд других). Вместе с тем систематическое использование связей такого рода для построения эффективных численных процедур метода Монте-Карло, по-видимому, только начинается, и в этой области еще трудно сформулировать общий подход. Мы ограничимся поэтому лишь обсуждением проблематики и рассмотрением некоторых характерных примеров. Задача Коши для обыкновенных дифференциальных уравнений встречалась уже ранее в связи с задачами теории массового обслуживания. Интересно отметить, что обширному классу систем линейных дифференциальных уравнений с переменными коэффициентами могут быть сопоставлены некоторые системы массового обслуживания. Простейшее же дифференциальное уравнение у' (t) = -%(t)y{t), г>0, X(t)>0 связано с пуассоновским потоком требований, интенсивность которого есть X (t). Если у @) = 1, то решение у (t) может быть истолковано как вероятность события, состоящего в том, что до момента времени t не поступило ни одной заявки. Задача решения системы дифференциальных уравнений при умеренном числе неизвестных не является, впрочем, сложной вычислительной задачей, и не возникает надобности в ее решении методом Монте-Карло. Если же число неизвестных очень велико, то метод Монте-Карло может оказаться незаменимым, что хорошо иллюстрируется обсуждавшимися уже задачами теории массового обслуживания. Задачи, связанные с уравнениями в частных производных, в особенности для случая, когда число независимых переменных более двух, представляют большой интерес с точки зрения применимости метода Монте-Карло. Построение алгоритмов метода Монте-Карло для^ решения задач такого рода обычно связано либо с дискретизацией, либо с обращением дифференциального оператора. В обоих
362 ЦЕПИ МАРКОВА (ДРУГИЕ ЗАДАЧИ) [ГЛ. 7 случаях оказывается применимой общая теория, развитая в §§ 2, 3 главы 6. Дискретизация, т. е. замена дифференциального оператора разностным, уже обсуждалась нами в § 1 главы 6. Более того, на основе общей теории, развитой в главе 6, мы можем теперь строить различные оценки и изучать их дисперсию. Для дальнейшего полезно, однако, остановиться на вычислительных деталях, связанных с решением некоторых конкретных уравнений в частных производных. Рассмотрим уравнения в частных производных второго порядка. Уравнения эллиптического типа после перехода к сеточной области и замены вторых производных вторыми разностями могут быть приведены (при достаточно малом шаге в двумерном случае) к системе уравнений вида (см., например, Марчук [1], стр. 165) , 3 = К №, hi f г, При этом G.3.2) где пара индексов i, j принимает все значения, соответствующие внутренним точкам сеточной области. Из G.3.2) следует, что для решения методом Монте-Карло системы вида G.3.1) должна быть построена цепь Маркова, определяемая следующей таблицей: Переход из узла с номером (i, J) в узел с номером: о -1- /) С,/-1) (',/ + *) Вероятность перехода j: Изменение «веса» частицы При этом в каждой точке 2 Pih ^ = 1 — gt, 7-, где git j i^i есть вероятность гибели частицы до перехода, задавав-
3] РЕШЕНИЕ ДИФФЕРЕНЦИАЛЬНЫХ УРАВНЕНИЙ 363 мого таблицей. Наиболее удобная естественная схема получается, когда жл. gi,j = 1 — я*,/ — buj — cus — dui. G.3.3) И преимущества метода Монте-Карло особенно заметны в том случае, когда коэффициенты системы G.3.1) легко вычисляются. Остановимся теперь на граничных условиях и их вероятностной трактовке. В отличие от системы F.1.10), в которой мы считали граничные условия учтенными, будем считать, что система G.3.1) записана без учета граничных условий. Пусть (рис. 7.2.) точка (i\ /') лежит точно на границе области, где задано значение нормальной производной искомой функции i'-W г t't/J' тН-»<* G.3.4) Г Рис. 7.2. Используя это условие, мы можем исключить иу+ь у. Приближенно G.3.4) можно записать в виде или и G.3.1) при i=i', /=/' с учетом G.3.5) приобретает вид щ>, у = {а{>, у + Cf, у) й{'_1, у + Ъ1>;уЩ>у у+1 + dVt уЩ>, у+1 + f{\ у G.3.6) При естественном выборе цепи Маркова (см. G.3.3)) оказывается, что при переходе в узел (V, /') следующий переход с большей, чем при отсутствии граничных условии, вероятностью будет происходить в точку ($'—1,/') (эффект отражения от границы). Можно, конечно, не производить исключения неизвестного иг+и у, рассматривать расширенную систему и соответственно расширить переходную матрицу цепи Маркова. Естественным рас-
364 ЦЕПИ МАРКОВА (ДРУГИЕ ЗАДАЧИ) [ГЛ. 7 ширением переходной матрицы в этом случае оказывается следующее: из узла (V +1,;") частица с вероятностью 1 возвращается в узел {V — 1, у"), т. е. происходит отражение от границы. После этих рассмотрений читатель, знакомый с разностными схемами, легко может придать вероятностный смысл другим приемам учета различных граничных условий. Так, обычно принято считать, что условие ди/дп = — Хи (X ^> 0) приводит к частичному отражению от границы. Действительно, запись в этом случае уравнения, аналогичного G.3.5), даст трехчленное уравнение Здесь можно положить вероятность перехода (if + 1, /) —> -> {ir — 1, ]') равной 1/A -f 2Xh) и вероятность перехода {V + 1, /') -> (*', /') равной 2ШA +2ХК). Разумеется, подобного сорта естественный выбор переходных плотностей не обязательно оптимален с точки зрения величины дисперсии, но он всегда упрощает вычислительную процедуру, и из F.3.7) следует, что он недалек от оптимального для простейших оценок, если решение сопряженного или исходного для оценок вида F.2.26) уравнения меняется в заданной области не слишком сильно. Обратимся далее к уравнению теплопроводности в его простейшей форме -g- = A» + /. G.3.7) При t = 0 решение и будем считать заданным и при каждом t будем считать заданными граничные условия одного из рассматривавшихся ранее типов. В случае двух пространственных переменных одна из возможных явных разностных схем (простейшая устойчивая схема) имеет вид «if)=«&ад+к м?й+cit }и%$+du &?г+т G.3.8) (к — номер момента времени). При этом, если область изменения пространственных переменных есть единичный квадрат, то коэффициенты в G.3.8) заданы для первой краевой задачи так же, как и в F.1.10). Рассмотрим
§ 3] РЕШЕНИЕ ДИФФЕРЕНЦИАЛЬНЫХ УРАВНЕНИЙ 365 естественную (в том же смысле, что и ранее) схему блужданий. Для этого мы должны, как в примере § 1 главы 6, занумеровать неизвестные и построить переходную матрицу цепи Маркова с той же структурой, что и матрица системы. «Сопряженная» схема для решения этой системы приводит к следующему алгоритму. Чтобы найти, например,^решение в точке сетки (?', у") в момент времени к', нужно^начать блуждание в этой точке и в этот момент времени. Далее*блуждание строится точно так, как и в случае эллиптического уравнения, но при каждом переходе время убывает на А^ (индекс к' уменьшается на единицу). Если в каждой внутренней точке вероятность гибели равна нулю, то блуждание оканчивается при выходе на границу или при уменьшении времени до нуля. В этой схеме часто используется оценка F.2.27). Таким образом, «сопряженная» схема соответствует «обратному» течению времени. «Прямая» схема, описанная подробно в § 2 главы 6, здесь более естественна. Частица рождается в нулевой момент времени в одной из точек сетки (распределение вероятностей ее рождения связано с начальными условиями), и затем происходят переходы, опять как в случае эллиптического уравнения, но с прибавлением А* в счетчик времени после каждого перехода. Траектория обрывается при достижении нами заданного момента времени Т. В такой схеме удобно использовать оценки вида F.2.26). Далее остановимся кратко на методах решения простейшего волнового уравнения при начальных условиях u@,x) = U(x), |--@,*) = /•(*) G.3.10) и с граничными условиями и (t, а) = ф1 @, и (t, Ь) = ф2 @. G.3.И) Вопрос о решении его разностного аналога методом Монте-Карло обсуждался в работе Гладкого [1]. При этом
366 ЦЕПИ МАРКОВА (ДРУГИЕ ЗАДАЧИ) [ГЛ. 7 использовалась разностная схема U и г —*Н +иг __ а* , (fr-i) O77(fc-D , „(fc-Dv , Ак) Щ "" \Ui — ZMi + Щ ) + П G.3.12) дополненная разностными уравнениями, соответствующими условию -gj-(O» я) = /2 (ж), и учитывающая другие условия G.3.10) и G.3.11). Случайные блуждания здесь незначительно отличаются по своему характеру от блужданий для разностной схемы, соответствующей уравнению теплопроводности. В этом случае не удается, однако, добиться положительности величин qt. Использование других разностных схем также не приводит к оценкам со знакопостоянными величинами qt. Имеется очень мало работ, где обсуждается применение метода Монте-Карло для решения уравнения G.3.9). Они упоминаются далее. В заключение рассмотрим пример, связанный с разностной схемой для нелинейного уравнения а <; х ^ Ьу и (t, а) = и (t, Ъ) = 0, и@,х) =/,(*). Будем предполагать /, Д, Дл: и Д? такими, что решение системы разностных уравнений „№+« — „W i А* „СЮ /„<*) %М ! „(*) к - 0, 1, . . ., Ml9 i = 1, . . ., М2 - 1, существует и может быть найдено по формулам G.3.14). Очевидно, здесь могут быть использованы методы, описанные в § 1 главы 7,которые приводят в данном случае к схеме блуждания на сетке с делением одной частицы на две аналогичные. Вопрос о случайном блуждании при переходе к пределу, когда шаг сетки стремится к нулю, для эллиптического уравнения и уравнения теплопроводности многократно обсуждался в литературе. (Работы Винера [2] и Фи-
§ 3] РЕШЕНИЕ ДИФФЕРЕНЦИАЛЬНЫХ УРАВНЕНИЙ 367 липса, Винера [1], посвященные этому вопросу, относятся к 1923 году.) В известной мере с этим вопросом связано возникновение таких мощных аналитических средств, как интеграл и мера Винера. (Подробно связь разностной схемы для уравнения теплопроводности с ви- неровским интегралом и методом Монте-Карло прослеживается в работе Крылова В. Ю. [1].) Могут быть построены различные алгоритмы" решения указанных уравнений, связанные с моделированием броуновского движения или вычислением интегралов по мере Винера. Что касается нелинейных дифференциальных уравнений, то связь их с ветвящимися процессами обсуждалась, например, в работах Далецкого [1], Далец- кого и Заплитной [1], хотя вопрос об использовании метода Монте-Карло для их решения не затрагивался. Вероятностная схема решения волнового уравнения, возникающая при стремлении к нулю шага сетки в G.3.12), не изучалась, хотя имеются работы, где уравнение G.3.9) решалось методом Монте-Карло без замены его каким-либо разностным аналогом (Кац [1], [2], Ве- селовская [1]). Нетрудно понять, что отличие дифференциального оператора от интегрального состоит в том, что дифференциальный оператор связан, вообще говоря, с бесконечно малым переходом (непрерывное время и непрерывное изменение координат), в то время как интегральный связан со скачкообразным марковским процессом. При определенных условиях удается, однако, применить аппарат, развитый для решения интегральных уравнений к уравнениям в частных производных. Этот аппарат связан с обращением дифференциального оператора. Метод обращения дифференциального оператора состоит в том, что используется известное решение некоторой краевой задачи, не совпадающей, вообще говоря, с исходной. Его простейшим частным случаем является известный метод «блужданий по сферам» для решения гармонического уравнения Аи = О G.3.15) с некоторыми заданными условиями на границе области Г; в простейшем случае и|г = и.(т)> ?е Г. G.3.16)
368 ЦЕПИ МАРКОВА (ДРУГИЕ ЗАДАЧИ) [ГЛ. 7 Этот случай многократно обсуждался в литературе (Мюллер [1], Соболь [9], Михайлов [121, Елепов и Михайлов [1]). Хорошо известно, что если функция и задана на поверхности Sr сферы Qr радиуса 7?, то ее значение в центре х0 выражается следующим образом: 1 С G.3.17) где | SR | означает площадь поверхности сферы. Формально из этого соотношения и G.3.16) следует интегральное уравнение и (х) = [ К (х, у) и (у) dy + Qru0 (x), G.3.18) i i где hiU»-*I"*'' »ёГ' G.3.19, о, уе г, 1, хе г, и предполагается, что сфера QR находится внутри (может быть, касается границы) области 3), a R ^> О (R может быть функцией х). Здесь ядро уравнения является обобщенной функцией. Если мы применим к этому уравнению теорию, развитую в § 2 главы 6 с учетом замечания 1, то при оценке функционала (/г, и) цепь Маркова, связанная с «сопряженной» схемой, должна выглядеть следующим образом. В некоторой точке х0, распределенной в 25 с плотностью р0 (х0) (р0 (х) > 0 при h (х) Ф 0), рождается частица, которая делает далее переход в точку хг в соответствии с переходной плотностью р (х0, хг). Плотность р (х0, хг) должна быть также обобщенной функцией, сосредоточенной и положительной на сфере радиуса i?, откуда следует, что хх обязана лежать на поверхности этой сферы. Далее хх становится центром новой сферы, если хг не попадает точно на границу Г, и точка х2 должна быть найдена на поверхности этой новой сферы и т. д.
§ 3] РЕШЕНИЕ ДИФФЕРЕНЦИАЛЬНЫХ УРАВНЕНИЙ 369 Поскольку свободный член уравнения G.3.18) равен нулю внутри области, то получить ненулевое значение какой-либо оценки вида F.2.26) мы можем, только выйдя точно на границу области. Это событие, очевидно, за любое конечное число шагов осуществляется с вероятностью нуль. Можно показать, что норма операторов как с ядром G.3.19), так и с ядром р (х, у), гдер (х, у) — любая плотность, которую можно выбрать в данном случае, в пространстве интегрируемых функций есть единица. С этим обстоятельством можно связать и то, что блуждания не выходят на границу за конечное число шагов (Фел- лер [1], т. 2, стр. 298). Чтобы избежать этой трудности, ядро полагают равным нулю в некоторой полоске Ге малой ширины е, прилегающей к границе] Г, а Ог «размазывается» в этой полоске (полагается равным константе). Тогда траектории попадают в Г? за конечное число шагов, и метод последовательных приближений для G.3.18) сходится, хотя оценки оказываются смещенными. Наконец, заметим, что В обычно полагают функцией х, выбирая его максимально возможным при каждом переходе* Это несколько уменьшает вычислительную работу. Таким образом, если мы хотим, например, найти значение функции и, удовлетворяющей G.3.15) и G.3.16) в точке x0Ez D, и считаем, что р (х, у) = К (ас, у), то алгоритм будет выглядеть так. В точке х0 рождается частица, которая переходит в точку х±, распределенную равномерно на поверхности сферы максимально возможного радиуса, содержащейся в D. Если а^ЕЕ Г?, то нами вычисляется нужная величина и (хг), которая и заносится в счетчик. Если осг ЕЁ: Ге, то в точке хг строится снова сфера максимально возможного радиуса и т. д. Подробные обоснования метода, сведения об его эффективности и оценку смещения статистических оценок можно найти в работе Елепова и Михайлова [2], где изучалось более общее уравнение Аи — си = — /, с = const, G.3.20) д - * 1 ** 1 д*
370 ЦЕПИ МАРКОВА (ДРУГИЕ ЗАДАЧИ) [ГЛ. 7 В этом случае аналог G.3.17) есть и (х0) = т=— \ и (s) ds + bR + \ — у Ниже приводится изложение некоторых результатов Елепо- ва и Михайлова. (На возможность столь простого обоснования этих результатов автору указал А. В. Сипин.) Пусть D — ограниченная область с регулярной границей Г, / удовлетворяет условию Гёльдера в?>, с > 0 и и |г = ср. Обозначим Г» ~Т» / Ч/ Т I D I ~. л. \\\ •f(y)dy; J 4Я [X— у | Sll (Я У С) из G.3.21) получим R~ ------ -.^(^ G.3.22) где i?a? означает максимальный радиус сферы S (х) с центром в точке ху которая целиком принадлежит D, а а>! равномерно распределена на поверхности единичной сферы. Из G.3.22) также следует при некотором натуральном п и (хо) = F (х,) + M^QiF (xi) + M^ •••+Мсоь...,сопОпи(о?п), G.3.23) где До вМ/сЯ^) Очевидно, если предположить, что х\ (i = 0, . . ., п) — независимые в совокупности случайные величины, распределенные с плотностью _8к(УТ(Лш.-|а^--а>;|) с 1 —- , с = const, в шаре Q (х^) радиуса /?^ с центром в точке х^ то случайная величина п—1 Jn = — 2 Q4 (I — <!•) f (х[) + Qn" (xn) G.3.24)
3] РЕШЕНИЕ ДИФФЕРЕНЦИАЛЬНЫХ УРАВНЕНИЙ 371 является несмещенной оценкой для и (х0). (Сравните G.3.24) и G.3.22).) Рассмотрим далее последовательность точек xlt cr2, . . . на сферах. Известно, что их можно трактовать как точки первого выхода траектории броуновского движения на последовательность сфер, т. е. xt = Wxi_t Сч), гдет^ еить время первого выхода броуновского движения, начинающегося в точке x{_v на поверхность сферы оо с центром в этой точке. Так как D ограничена, то ^ х{ = т < оо г=1 с вероятностью 1, где т — момент выхода броуновского движения из D. В силу строго марковского свойства WXn (тх + . . . + xh) = = xk и в силу непрерывности с вероятностью 1 броуновских траекторий Km хк = Ню W (Ti + . . . + тк) = W (т) e Г. Далее, n—l |/n|<max/(as)- 4- У, Q^1 ~ Як) + Легко видеть, что Qn ^ 1, так как все qk < 1. Поскольку, кроме П—1 П—1 того, 2 5» A - <7к) = 2 (^ - Зт) = ! - Q« <L T0 M|/n|<C, G.3.25) где 67 — константа, не зависящая от тг. Очевидно, fn является мартингалом относительно семейства с-алгебр 5(п, порожденных процессом хп. Из G.3.25) в силу теорем сходимости мартингалов (Мейер [1]) следует lim Jn = J, где / — интегрируемая случайная величина Пусть теперь при некотором п = пг процесс хп оказался в е-ок- рестности границы. Как и ранее, имеется тЕ — момент первого выхода процесса WXo (t) такой, что Wx (т?) = хп и т? < + оо с вероятностью 1. Известно (Мейер [1]), что Jn = М {/1 %п }, откуда следует М Jn = и (х0). Пусть а>п9 — ближайшая к хп точка границы. Обозначим гг?-1
372 ЦЕПИ МАРКОВА (ДРУГИЕ ЗАДАЧИ) [ГЛ. 7 т. е. 7п получается из Jn заменой хп на ближайшую к ней точку границы. Тогда I fne - Кг К I и (хп&) - ф (ац) | < Аг. Отсюда | М/п — и(хо) | <М \Jn —Jn |< Be. Здесь А и В — константы. Заметим также, что \JnJ< (max| u\ + ^-A - Qn?)V< + оо, откуда следует, что дисперсия Jn , и следовательно, 7п , конечна. Аналог «блуждания по сферам» для уравнения теплопроводности рассматривался в работе Хаджи-Шейха и Спарроу [1], для волнового уравнения — в работе Весе- ловской [1]. Рассматривались и «блуждания по другим фигурам» (имеются в виду аналоги представления G.3.21), где вместо сферы выбрана другая поверхность). Так, в работе Хошино, Ишиды [1] на основе метода суммарных представлений, развитого Положим, построены алгоритмы, связанные с блужданием по поверхности прямоугольного параллелепипеда (см. также работу Мишустина [1], связанную с решением внешней краевой задачи для уравнения Лапласа). Методы Монте-Карло, основанные на обращении дифференциального оператора, еще мало изучены, но так как они укладываются в общую схему, развитую в главе 6, то можно утверждать следующее: 1. Эти методы малочувствительны к размерности задачи и характеру границы области. 2. Они не имеют погрешности, связанной с дискретизацией задачи. 3. Им свойственны преимущества, присущие вообще методу Монте-Карло, как то: возможность оценки отдельных функционалов без нахождения решения в целом, возможность оценки погрешности в процессе вычислений и возможность учета априорной информации о решении задачи.
ГЛАВА 8 ВОПРОСЫ, СВЯЗАННЫЕ С ТЕОРИЕЙ ЧИСЕЛ § 1. Равномерно и вполне равномерно распределенные последовательности. Понятие об арифметическом моделировании случайных процессов Вероятностные методы, обсуждавшиеся до сих пор, позволяют свести задачи, решаемые методом Монте-Карло, к задаче вычисления интеграла достаточно высокой кратности по единичному гиперкубу. Это следует, собственно, из предполагавшейся нами конструктивности меры, по которой производится интегрирование. Подынтегральная функция при этом может не обладать и, как правило, не обладает свойствами гладкости. Правда, методы уменьшения дисперсии направлены к тому, чтобы сделать подынтегральную функцию близкой к константе. Если дисперсию удается сделать достаточно малой, то качество случайных чисел может мало влиять на результат. В общем же случае задача построения псевдослучайной последовательности оказывается весьма близкой к задаче приближенного интегрирования в детерминированной постановке. Очевидно, что класс функций, для которого строится соответствующая квадратурная формула, в этом случае должен быть достаточно широким. Принципиально возможно построить последовательность точек в гиперкубе произвольной размерности таких, что среднее арифметическое значений произвольной интегрируемой по Риману функции будет сходиться с увеличением числа слагаемых к значению соответствующего интеграла. При этом сходимость понимается в детерминированном смысле. Результаты эти имеют принципиальное значение, и мы далее на них остановимся. Будем рассматривать бесконечные последовательности бесконечнозначных чисел. Как правило, будем предпо-
374 ВОПРОСЫ, СВЯЗАННЫЕ С ТЕОРИЕЙ ЧИСЕЛ [ГЛ. 8 лагать, что числа представлены в двоичной системе счисления и принадлежат промежутку [0, 1). Ограничение на систему счисления не является существенным, но иногда упрощает изложение. Пусть гп (п = 1, 2, . . .) — бесконечнозначные двоичные числа из промежутка [0, 1) и Щ = е1? 82, ... — бесконечная последовательность этих чисел. Последовательность Щ называется равномерно распределенной в смысле Вейля на промежутке [0, 1), если для любой интегрируемой по Риману, в собственном смысле, функции h имеет место равенство N 1 Ит ^ 2 *(О =$*(*)**¦ (8.1.1) Будем далее обозначать 2 jV->cx> Я -ИСТИННО 1<п<ЛГ где Sn — некоторое утверждение относительно члена по* следовательности g с номером п. Из (8.1.1) вытекает, что доля членов последовательности, попавших на отрезок [а, Ь) (О <^ а < Ъ < 1), асимптотически равна длине Ь — а отрезка для любых а и&, т. е. Р (а < гп < Ь) = Ъ - а. (8.1.2) Можно показать также, что из (8.1.2) следует (8.1.1), так что равенство (8.1.2) может быть принято в качестве исходного при определении равномерной распределенности по Вейлю. Конструктивно бывает удобно определять последовательность & как последовательность значений функции целого аргумента гп = f (п), 0 <^ / (п) < 1. Если последовательность 8 при этом равномерно распределена, то говорят, что / (п) распределена равномерно. В качестве / (п) часто выбирают дробную долю некоторой функции целого аргумента / (п) = \g{n)}. g (n) может принимать любые вещественные значения. Если / (п) равномерно распределена и f(n) ={g(n)}, то говорят также, что g(n) распределена равномерно по модулю 1 (mod 1). Важное значение в дальнейшем будет играть критерий Вейдя, который составляет содержание следующей теоремы.
§ 1] РАВНОМЕРНЫЕ РАСПРЕДЕЛЕНИЯ 375 N- Теорема 8.1 (Вейль [1]). Для того чтобы последовательность <§ была равномерно распределена, необходимо и достаточно выполнение равенства N -дг 2 ехр Bл1кгп) = О для любого целого, отличного от нуля к. Доказательство (достаточность). Будем исходить из равенства (8.1.2) и считать, что гп являются дробными долями некоторой равномерно распределенной по mod 1 функции g (n), что не умаляет общности. Пусть G (t) — функция с периодом, равным единице,— определена на [0, 1) следующим образом: G{t) = {o, r<*<i' Тогда, очевидно, (8.1.3) Выберем Р ^> 0 такое, что одновременно выполняются неравенства 2р < у и 2р < 1 — у, и построим две вспомогательные непрерывные функции G1 и G2, периодические с периодом 1: 1 при 0 < t < г» 0 при т + Р<^<^1 — р, линейна при — р <; t <; О, % линейна при у ^ t <; у + ?5 1 при О при линейна при линейна при Очевидно, что G2 (t) < G (t) < Gx (t). (8.1.4) Как функция 6?! (t)f так и функция G2 (t) разлагаются
376 ВОПРОСЫ, СВЯЗАННЫЕ С ТЕОРИЕЙ ЧИСЕЛ 1ГЛ. 8 в равномерно сходящийся ряд Фурье оо d (/) = т + р + 2 (а& ехР (Zitikt) + bk exp (— 2nikt)), (8.1.5) /c=l = Т — Р — 2яШ)). (8.1.6) Для доказательства достаточности далее положим t =¦¦ = # (и) и сложим ряды (8.1.5) и (8.1.6) при п = 1, 2, ... ..., N. При р -> 0 из (8.1.3) и (8.1.4) следует требуемое. Доказательство необходимости тривиально. Заметим, что из критерия Вейля сразу же вытекает равносильность определения равномерной распределенное™ с помощью равенств (8.1.2) и (8.1.1). Для построения примера равномерно распределенной в смысле Вейля последовательности необходима следующая простая Лемма 8.1. Имеет место неравенство При целом р неравенство очевидно. Если р — не целое число, то можно просуммировать геометрическую прогрессию под знаком модуля. Это дает т/г-fp 2 ехрBяф/г) n=m-{-i Модуль числителя полученного выражения не превосходит двух, а модуль знаменателя больше, чем | sin 2лр |, что и доказывает лемму. Следствие. Для всякого целого к ф 0 и любого иррационального р N lim-rr- N-+oo 7V П=1 Отсюда следует, что последовательность, для которой е» = {«§}, (8.1.8)
§ 1] РАВНОМЕРНЫЕ РАСПРЕДЕЛЕНИЯ 377 где р — иррациональное число, распределена равномерно в смысле Вейля. Таким образом, равномерно распределенные последовательности существуют. Пусть далее имеется последовательность векторов Q = = хъ х21 . . .; хп = (бп^ . • • » еп}), компоненты которых являются числами из промежутка [0, 1). Говорят, что последовательность Q равномерно распределена в единичном 5-мерном кубе, если для всякой интегрируемой в собственном смысле по Риману в этом кубе функции h (x) имеет место предельное соотношение N 1 1 lim N-1 2 Цхп) = $ЖА> .. J AcCft(x). (8.1.9) N-+oo п=1 0 0 Равносильным требованием является выполнение предельного соотношения Р(а,< eg)<bi; i = 1,... ,*) = П F, - а,) для любых аг и bh удовлетворяющих неравенству 0 ^ ^ at < bt ^ 1. Как и в одномерном случае, часто рассматриваются последовательности векторов, компоненты которых являются функциями целочисленного аргумента хп = (/х (п), . . ., /s (п)), 0 < ft (п) < 1. Имеет место многомерный аналог критерия Вейля. Теорема 8.2. Для того чтобы последовательность Q была равномерно распределена в единичном s-мерном кубе, необходимо и достаточно выполнение равенства N Km * 2 exp {2ni (k^ + ...+ Ыв))}= О для всех А], . . ., ks, не равных одновременно нулю. Доказательство теоремы аналогично доказательству теоремы 8.1. Компоненты векторов последовательности Q могут быть составлены из элементов последовательности <$ и при этом различными способами. Например, можно положить хг = (гх, . . ., es), х2 = (eb+J, . • ., е2Я), . . ., • • м в„в), . . . (8.1.10)
378 ВОПРОСЫ, СВЯЗАННЫЕ С ТЕОРИЕЙ ЧИСЕЛ [ГЛ. 8 ИЛИ дС± = (8j, . . ., 8S), ОС» = (82> • • •» ^s+l/> • • •» х„ = (е», . . ., 8n+s_x), . . . (8.1.11) Последовательность (8.1.11) часто называют гусеницей ранга s последовательности Щ. С последним способом образования последовательности векторов связано Определение. Последовательность Ш называют s-равномерно распределенной, если последовательность векторов, образующих гусеницу ранга s последовательности &, равномерно распределена в единичном s-мерном кубе. Отметим следующие свойства s-равномерно распределенных последовательностей. 1. Если р <s — натуральное число и последовательность Щ s-равномерно распределена, то она и р-равно- мерно распределена. Это утверждение непосредственно следует из многомерного критерия Вейля (теорема 8.2). 2. Обратное утверждение, вообще говоря, неверно. Покажем, что последовательность (8.1.8) {?}, {2р}, . . . ..., {тг|3}, . . ., где р — иррациональное число, не является 2-равномерно распределенной и, следовательно, р-равно- мерно распределенной для р ^> 2. Для 2-равномерно распределенной последовательности необходимо должно выполняться равенство для любой интегрируемой h @ <^ h < 1). Или, если h (х) = х, то Р (гп < еп+1) = 1 — Р (еп+1 < еп) = = 1/2. Для последовательности (8.1.8),роднако, неравенство еп ^> 8п+1 равносильно неравенству гп ^> {гп + Р} и выполняется в том и только в том ^случае, когда 1 — Р ^ 8П < 1. Поэтому Р (вп > еп+1) = Р A - Р < 8П < 1) =- р ф 1/2. В данном случае функция g(ri), дробные доли значений которой образуют последовательность Щ, была линейной функцией. Вейлем [1] рассматривались более сложные функции, в частности, являющиеся многочленами от п: е„ = {№ + сгп^ + . . . + ср}, (8.1.12)
§ 1] РАВНОМЕРНЫЕ РАСПРЕДЕЛЕНИЯ 379 где Cj, . . ., ср,— произвольные числа, ар — иррациональное число. Для этих последовательностей имеет место следующий факт, доказательство которого можно найти в работе Франклина [1]. Теорема 8.3. Если старший коэффициент р полинома g (п) = $пр + с1пр-1+ . . .+ ср — иррациональное число, то последовательность (8.1.12) р-равномер- но распределена, но не (р + 1)-раеномерно распределена. Выбирая достаточно высокую степень полинома g (п), можно, таким образом, обеспечить соответствующий высокий порядок равномерной распределенности последовательности %. Предельный случай ^-равномерно распределенных последовательностей при произвольном s рассматривался Коробовым [1]. Определение. Последовательность <§ называется вполне равномерно распределенной или равномерно распределенной в смысле Коробова, если она s-равномерно распределена для любого натурального s. Теорема 8.3 позволяет ожидать, что вполне равномерно распределенной последовательностью окажется последовательность дробных долей функции, растущей быстрее любой степени полинома. Впервые вполне равномерно распределенная последовательность была построена Н. М. Коробовым действительно в связи с изучением распределения дробных долей показательной функции. Существование вполне равномерно распределенных последовательностей — факт принципиально важный, хотя алгоритмически их построение достаточно сложно. Ниже мы коротко отстановимся на вопросе конструирования этих последовательностей. При этом изложение следует с небольшими изменениями работе Постникова [1] *). Пусть 8 = 62, 62,. . ., 6N, ... — последовательность натуральных чисел, изменяющихся от 0 до q — 1. Составим последовательность скобок (гусеницу ранга s) (бх, б2, . . ., 6S) (б2, б3, . . ., 6S+1). . . FiV, 6N+V . . ., б^.,). (8.1.13) Зафиксируем некоторую произвольную скобку А0 = FJ, б? , . . . ..., 6J), представляющую собой фиксированный набор чисел от 0 до *) Значительно более простой, но не связанный с вероятностной трактовкой метод построения вполне равномерно распределенных последовательностей содержится в работе Коробова [2].
380 ВОПРОСЫ, СВЯЗАННЫЕ С ТЕОРИЕЙ ЧИСЕЛ [ГЛ. 8 q — 1, и обозначим PN (А0) число появлений скобки А0 до N-ro члена последовательности. Последовательность г называется нормальной последовательностью знаков, если для любого натурального s и любой фиксированной скобки А0 имеет место равенство lim 1р„(Д0)=4г. Имеет место следующая Теорема 8.4 (Шапиро-Пятецкий [1]). Если существует постоянная С такая, что для любого натурального s и любой фиксированной скобки А0 то последовательность е является нормальной. Доказательство теоремы опирается на следующую лемму. Лемма 8.2. Пусть г — натуральное число и \ х \ ^ 1. Количество комбинаций из I знаков, в которых фиксированный знак 6^ встречается в количестве llq + xZ/r, не превосходит ql — . Доказательство. Количество комбинаций из I знаков, в которых 6*°) встречается ровно к раз, очевидно, равно C'l (q — 1)'"л. Отсюда следует, что количество комбинаций, определяемое условием леммы, равно = 2 -' а Дальнейшее следует из известных тождеств (например, Натансон [1], стр. 19) I 2 Cfa;fc(l-*)'"*-1, (8.1.15) fc=0 l 2 (к — Ixftfx* A - x)l~K = Ix A — x). (8.1.16) fc=0 Первое из них есть тривиальное следствие биномиальной формулы Ньютона. Второе может* быть получено из первого более сложным путем. Продифференцируем тождество V ??z ' = (^ + z) UOz и Д°" /с=о
§ И РАВНОМЕРНЫЕ РАСПРЕДЕЛЕНИЯ 381 множим обе части результата на z. Вновь продифференцируем полученное тождество по z и домножим его на z. Полагая z = xl(l — х) во всех тождествах, получим i 2 Cf я*A-*)'"* = 4> (8.1.17) i 2 kCfx* A - хI~к - 1х, (8Л. 18) кЮ\ (I - *)'""* = (/ж + 1 — ж) /ж. (8.1.19) Чтобы получить (8.1.16), теперь достаточно домнояшть (8.1.17) (8.1.18) и (8.1.19) на 12х2 — 21х и 1 соответственно и сложить. Вернемся к оценке величины г|). Суммирование в (8.1.14) производится для к1 удовлетворяющих неравенству >-L или U--L1 f-L г Поэтому I Q \ г 2 Если суммирование в правой части последнего неравенства распространить на все к (О ^J к ^ Г), то неравенство разве лишь усилится. Используя (8.1.16) при х = ilq, получим требуемый результат. Лемма доказана. Доказательство теоремы. Разобьем знаки в последовательности на группы по I знаков ЬХЬ2, . . ., ^fy+x,...,^ и зафиксируем некоторое натуральное г. Отнесем группу к категории Л, если 6'0) встречается в ней в количестве Ilq + т//г, | т | < 1, а остальные группы — к категории В. Обозначим через A (N) число групп категории А, а через В (N) — число групп категории В, которые встретятся до I [7V//]-ro знака последовательности. Знак встречается в группе категории А в количестве Ilq + %l/r, а в группе категории В в количестве rl. Поэтому до N-vo знака
382 ВОПРОСЫ, СВЯЗАННЫЕ С ТЕОРИЕЙ ЧИСЕЛ [ГЛ. 8 последовательности 6@^ встретится в количестве PN F<°>) = A (N) 1 + A (N) Х1 + Gitf (N) 1 + Ы = B(N) + b} m. + q Я r\ q где 0 < 62 < 1 и | 03 | < 1. По условию теоремы для достаточно большого N группа категории В встретится не более 2CN/ql раз. Согласно лемме таких групп o(ql • — ], поэтому l л А л B(N) Отсюда Нш N В силу произвольности ги / получаем lim PN (№)/N = 1/q. Бели далее рассматривать скобку из s знаков как один знак (всего тогда имеется q8 знаков), то также легко показать, что lim PN(A)/N = N->oo ~ l/gs, что и доказывает теорему. Рассмотрим далее npnMepi нормальной последовательности знаков q = 2, принадлежащий Чемпернуону [1]. (Аналогичное построение легко осуществить и при произвольном q.) Пусть 0, 1, . . ., 2Г — 1 — набор чисел, которые имеют г разрядов в двоичном представлении. Выпишем в естественном порядке двоичные представления этих чисел: при г = 1 Pi = 0'1, при г = 2 р2 = 00011011 и т. д. Составим последовательность . рг. . ., (8.1.20) сохраняя разделяющие знаки запятые, и покажем, что последовательность (8.1.20) является нормальной. Составим гусеницу ранга s последовательности (8.1.20) и выберем некоторую фиксированную скобку А8. Пусть Sr = ^р,. . . pr. (8.1.21) Если As входит в рг так, что запятые не разделяют ее знаков, то As назовем неразделенной, в противном случае назовем As разделенной. При s <; г неразделенных скобок As нет. При s ]> г существует s — г +1 способов, посредством которых As может войти неразделен-
1] РАВНОМЕРНЫЕ РАСПРЕДЕЛЕНИЯ 383 ной в р м так как первый знак А$ может быть как первым знаком г-значного двоичного числа, так и вторым и т. д. При фиксированном положении 6S остальные s — г знаков могут быть произвольны. Отсюда следует, что число неразделенных скобок As в Sr есть (г — s + 1)-2S~7'. Если же некоторая запятая фиксирована, то она не может делить более чем s различных As. Отсюда следует, что 6S не может встретиться в рг разделенной более чем г-2т раз. Обозначая hr количество появлений As в рг, получим при Но количество двоичных знаков в рг есть г-2г = уг и а количество Нт появления As в Sr есть г г Полагая хг = ^ У\, получим Hr = xr-2~s + О (хг) или для Нт = 2=1 = Н (#г), как функции хг, Н (х^/ху = 2~s + О (х,)/хг. Пусть хг ^ х < xr+v Тогда Я (*)/* < Н (xr+l)/xr < Н (xr+1) xr+l/(xr+1xr). И так как xrJxr = (*г + (г + 4) -2mV*r < A + (г + 1) 2г+1)/(г -2Г) < 1 + 4, то Шп #(*)/*< 5-2-*. Согласно теореме 8.4 получаем, что последовательность Чемпернуона является нормальной последовательностью знаков. Пусть далее имеется система последовательностей причем последовательность %j составлена из знаков 0, 1, ... * * •' 0/-1 (/ ^ 1» • • •» Л; qj > 2). Для этой системы можно построить матричную гусеницу ранга s: А,*' ¦ ¦
384 ВОПРОСЫ, СВЯЗАННЫЕ С ТЕОРИЕЙ ЧИСЕЛ [ГЛ. 8 Очевидно, существует (q^- • -Яи)8 различных матриц, из которых составляется последовательность (8.1.22). Систему последовательностей (8.1.22) называют совместно нормальной, если число Нр (А8) появлений любой фиксированной матрицы As в последовательности (8.1.22) длины Р при Р -> оо стремится к (?i?2- - -Яъ)~8- Очевидно, теория совместно нормальных последовательностей сводится к теории нормальных, если элементом последовательности /б1 . \ считать столбец! * * ) (i = 1, 2, . . .) и образовывать гусеницу x°fc,i / ранга s по указанному выше правилу. Поскольку имеется qxq^ . . q^ различных столбцов, то в этом случае q = qx . . . q^ и может быть сформулирован аналог теоремы 8.4. Теорема 8.4'. Если для системы последовательностей (8.1.22) существует константа С такая, что для любого натурального s любой фиксированной матрицы As lim Hp(bs)/s то система последовательностей (8.1.21) совместно нормальна. Предположим теперь, что нам удалось построить бесконечную систему последовательностей %19 $2> • • •» такую, что при любом фиксированном натуральном / система #lf ^2» • • •» с?i совместно нормальна. Пусть каждая ^i — б^ Ь^\ . ., где б^ (^ / = 1, 2, ...\ может принимать значения 0, . . ,,д — 1. Обозначим а. = -i- + 3 Я + — + . . . + -=р + . . . Справедлива Я2 а1 Теорема 8.5. Последовательность чисел аъ а2, . . . вполне равномерно распределена. Доказательство. Зафиксируем некоторое натуральное s и положим xh = (aft, afc+1, . . ., olk+8_^)9 k = 1, 2, . . . Наряду с xk рассмотрим точки х^ с «урезанными» координатами х^ ~ 6A) б(-° = (a(j>, . . ., с#]м), гдеа<.1>= J-+ . . . + Jy-. Так как мы предположили систему #i, <?2» • • •» # i совместно нормальной, то каждая точка х^р будет встречаться с асимптотической частотой q~ls. Это означает, что при разделе 5-мерного единичного гиперкуба на qls одинаковых кубиков (каждое ребро разделено на ql равных частей) точки последовательности х^\х%\ . . . имеют асимптотическую частоту попадания в каждый из этих кубиков, равную его объему. В силу произвольности I и s теорема доказана. Систему I совместно нормальных последовательностей легко построить при каждом фиксированном /. Для этого достаточно по-
§ 1] РАВНОМЕРНЫЕ РАСПРЕДЕЛЕНИЯ 385 строить, например, последовательность Чемпернуона при q = 2{ и каждому знаку сопоставить столбец из I нулей и единиц. Бесконечную систему построить труднее. Для этого удобно определить индукционную процедуру, которая позволяла бы «приписать» каждой нормальной последовательности такую последовательность, что полученная система была бы совместно нормальной. Ниже описана такая последовательная процедура (Старченко [1, 2]). Пусть бД...— исходная последовательность и As — произвольная фиксированная скобка гусеницы этой последовательности ранга s. Обозначим Hr (As) число появлений скобки As на отрезке из г скобок, образующих гусеницу. В силу нормальности исходной последовательности существует такое R = R (s, 6S), что при /•' > R и г' > R #r,(As) Hr,,(A{ :± (8.123) Но г' — г" Н> (А.)/г' - Яг„ (Ая)/г* ^ Hr (As)/r- - Hr, r l-r'Vr7 ^ l — r"/r' { ' ' ' и при г" больше некоторого R (А8) из нормальности исходной последовательности вытекает неравенство #г„ (As)/r" < Cig~s. Выберем N (s) = sup (Я (As), R (s, As)). Тогда при любом s при r"> N (s) иг' — г" > г" из (8.1.23) и (8.1.24) получим r.q- r^ s (As)/r'f Положим далее N B) = N B) и j\f B5) = 2П« • ЛГ B5 - 2) + 2Пз — 1, где /г8 -~ любое натуральное число, для которого N Bs) < 2П§.ЛГB5 — 2) + 2П* — 2. Тогда, очевидно, N Bs) > N Bs). Последовательность, совместно нормальную с исходной, построим следующим образом по группам, приписывая ее в качестве второго ряда (под исходной): 13 СМ. Ермаков 0-я группа , 0ь . .oNBHL,
386 ВОПРОСЫ, СВЯЗАННЫЕ С ТЕОРИЕЙ ЧИСЕЛ [ГЛ. 8 NB) * * ' б2ЛГB) (I 1-я группа { °ЛГB)+Г • "°2ЛГB)+1 °2/VB)+2' ' ' °4iYB)+3' • • °дГD)' 'б- ... 6 _ 'б - ... б - 'б _ . . .6- „ iVD) 2ND) 2ЛГD)+1 4iVD)+2 4ND)+3 N 2-я группа 1^ б _ 'б - б - б _ 'б- I ЛГD)+2' ' ' 2iVD)+2 2iVD)+3# ' ' 4/VD)+4* 4ND)+5* ' ' iV Докажем, что нами получены две совместно нормальные последовательности. Зафиксируем две скобки Ak и Аь' и составим /с-столб- цовую матрицу Положим х = 2п N Bs) + 2П — 2 (гс = 0, ..., ns+1 — 1) и обозначим G (ж) количество появлений Dk в гусенице ранга /с длины х системы (8.1.21). Выберем s^ к и обозначим через L количество появлений Dk до члена с номером N Bк) — 1. Появление Ak в группе с номером s означает, что в соответствующих местах гусеницы ранга 2s исходной последовательности появится одна из q^s~li^ комбинаций вида s знаков s знаков кроме, возможно, 2s последних членов группы). На каждом участке, разделенном сверху запятыми, эта комбинация появится менее чем CRq~2s раз, где R — количество знаков на этом участке. Число таких комбинаций есть q2(s~k\ откуда число появлений Afe не превзойдет величины и G (х) < L + Cxq~2k + О (s2), где О (s2) появляется при переходе от одной из групп к другой. Отсюда G (х)/х < Ых + Cq-** + О (s2lx) и s2/x -> 0, так как х^> С2-2*, где С2 — константа. Таким образом lim G (x)lx < Cq~2c, и доказательство нашего утверждения сводится, 0С->ОО к проверке условий теоремы 8.4. Последнее делается вполне аналогично тому, как это было сделано при доказательстве нормальности последовательности Чемпернуона. Итак, беря в качестве исходной последовательности, например, последовательность Чемпернуона, можно построить бесконечную систему совместно нормальных последовательностей, и, следовательно, последовательность чисел, распределенную вполне равномерно.
§ 1] РАВНОМЕРНЫЕ РАСПРЕДЕЛЕНИЯ 387 Вполне равномерно распределенные последовательности являются универсальными последовательностями, с помощью которых можно осуществить вычисление интегралов Римана произвольной (в том числе и счетной) кратности. Заметим, что для произвольной интегрируемой в смысле Лебега функции такой универсальной последовательности указать нельзя. Это следует из того простого факта, что множество, образованное любой дискретной последовательностью точек, имеет лебегову меру нуль, и всегда можно указать интегрируемую по Лебегу функцию, которая на этом множестве вообще не определена. Очевидно, что последовательности чисел, которые мы хотим избрать в качестве реализаций случайной величины, равномерно распределенной на промежутке [0, 1], если они используются для решения достаточно широкого класса задач, должны обладать свойствами, в каком-то смысле близкими к свойствам вполне равномерной распределенно- сти. Естественность этого требования подтверждается также следующим соображением: из усиленного закона больших чисел следует, что с вероятностью 1 последовательность реализаций случайной величины, распределенной равномерно на [0, 1], есть вполне равномерно распределенная последовательность. Действительно пусть а = а19 а2, ... — такая последовательность и (а1? . . ., as), (а2, .. ., as+1), ... — гусеница ранга s. Тогда для любой интегрируемой по Риману в единичном 5-мерном гиперкубе 3N функции с вероятностью 1 справедливо равенство N lim4- S f(*n• • • >a*+i) = S /иdx> (8Л-25) ЛГ-*оо i==1 да^ так как скобки гусеницы представляют собой реализации не более чем s зависимых случайных величин (см. гл. 1 § 2). Наконец, в связи с понятием вполне равномерной распределенности представляет непосредственный интерес следующая задача, рассмотренная Ченцовым [2]. Пусть имеется однородная цепь Маркова с конечным числом состояний Yi (i = 1, . . ., и), переходная матрица которой 3* = \\pt9 j ||. Будем с помощью некоторой последовательности чисел 8 = &1У е2, . . . (О <; 8j < 1) моделировать цепь Маркова способом, который ранее неоднократно был описан, т. е. моделируя последовательность 13*
388 ВОПРОСЫ, СВЯЗАННЫЕ С ТЕОРИЕЙ ЧИСЕЛ [ГЛ. 8 дискретных распределений по формулам B.2.6), где в качестве случайных чисел выбираются числа последовательности #. Далее будем ссылаться на этот способ моделирования как на стандартный. Предположим, что матрица SP эргодична, т. е. существует единственное стационарное распределение вероятностей {<7i}i- Как уже от- п мечалось, для вычисления среднего 2 #i/(Ti)n0 пеизвест- г=1 ному стационарному распределению цепи можно ограничиться моделированием одной-единственной траектории, но достаточно большой длины. Задача состоит в том, чтобы описать ограничения на последовательность Щ, налагаемые требованием, чтобы для любой цепи Маркова с эр- годической матрицей и произвольным начальным распределением при моделировании ее стандартным способом и при любом выборе функции / (со) выполнялось равенство N N "т ±- S /(Ti,) = S fc/(Ti). (8-1.26) где yik, к = 1, . . ., N, — последовательность номеров состояний цепи, полученных при моделировании. Решение этой задачи дается следующей теоремой, которая приводится без доказательства. Теорема 8.6. Для того чтобы стандартный способ моделирования любой цепи Маркова с конечным числом состояний и с единственным стационарным распределением вероятностей обеспечивал эргодичность траектории в смысле (8.1.26) (слабую эргодичность), необходимо и достаточно, чтобы последовательность & была распределена вполне равномерно. Конструкция нормальной, совместно нормальных и вполне равномерно распределенных последовательностей в том виде, как это было описано выше, является арифметической моделью равномерно распределенной случайной величины. Модель такого рода, как мы видели, в достаточной мере сложна, и обычно приходится прибегать к более грубым и приближенным моделям (об этом далее в § 2 данной главы). Тем более приятно, что моделирование такого сравнительно сложного явления, как броуновское движение,
§ 1J РАВНОМЕРНЫЕ РАСПРЕДЕЛЕНИЯ 389 осуществляется даже несколько более просто. Результаты относительно арифметической модели броуновского движения принадлежат И. П. Кубилюсу и Ю. В. Линнику [1]. Эта модель кратко описывается ниже. Пусть р — нечетное простое число. Символ Лежандра (т/р) числа т по отношению к р есть 1, если т — квадратичный вычет, 0, если т = О, и —1, если т — квадратичный невычет. Иными словами, (т/р) при фиксированном р является периодической с периодом р функцией целочисленного аргумента т, которая определяется равенством (т)- 0 для т = О, 1 для т = 1,22, -1 для остальных т. Пусть далее R — нечетное бесквадратное число и R = = p-j)v . .ps — его разложение на простые сомножители* Символ Якоби, частным видом которого является символ Лежандра, определяется равенством где в правой части сомножители являются символами Лежандра. Модель строится с помощью сумм S(msfh) S Имеет место следующая Теорема 8.7. Пусть R пробегает любую возрастающую бесконечную последовательность нечетных бесквадратных чисел такую, что для всякого фиксированного с > О при R -> оо, р, пробегающем множество всех простых делителей R, h = h (R) -» оо, log A/log R -> 0; тогда exp(-u*/2(t-s))du
390 ВОПРОСЫ, СВЯЗАННЫЕ С ТЕОРИЕЙ ЧИСЕЛ trJl. 6 и для любого набора непересекающихся интервалов (*i, h), . . ., Eft, tk), 0<sj< tj, / = l, . . ., ft, P {SR (m, sl9 h\ hXxu...,SR (m, $fc, ^; Эта теорема указывает, собственно, семейство моделей броуновского движения. Кубилюсом и Линником построены такие модели, связанные с характерами более высоких степеней. Дальнейшее развитие вопроса можно найти в работе Ляшенко [1]. Мы лишь очень бегло коснулись теоретико-числовых конструкций, воспроизводящих поведение вероятностных объектов. По этому и близким вопросам существует обширная литература. Алгоритмическая сторона теоретико-числовых моделей изучена, однако, недостаточно, и попытка их использования в расчетах по методу Монте-Карло (без специальных дополнительных исследований и усовершенствований) может привести к неоправданно большим затратам машинного времени. § 2. О линейных рекуррентных процедурах получения псевдослучайных чисел 1. Последовательности бесконечнозначных чисел. Ниже приводятся некоторые сведения о последовательностях, получаемых с помощью рекуррентных соотношений. Рассмотрим сначала последовательность Ш — sv 82, ... бесконечнозначных чисел и предположим, что эта последовательность получена рекуррентно по формуле • •» еД п ¦= 0,1, . . ., (8.2.1) т > 1 фиксировано. Естественно попытаться выбрать F такой, чтобы последовательность Щ обладала в каком- то смысле свойствами равномерной распределенное™. Описать полностью ограничения, налагаемые требованием равномерной распределенности на функцию F, видимо, достаточно трудно, и такая задача далее не ставится. Мы приведем лишь следующую простую теорему (Франклин [1]).
§ 2] О ЛИНЕЙНЫХ РЕКУРРЕНТНЫХ ПРОЦЕДУРАХ 391 Теорема 8.8. Пусть {sn} — некоторая последовательность на [О, 1], для которой 6n+1 = F (гп), п = 0, 1, . . . Эта последовательность не может быть р-равномерно распределенной для любого р ^> 1, если F (х) имеет хотя бы одну точку непрерывности на [О, 1). Доказательство. Пусть F (х) непрерывна при х — а, а?[0, 1) и F (а) = Ъ. Тогда существует 6 ^> О такое, что | F (х) — Ъ | < V4 при | х — а | <[ Ь. Обозначим через / пересечение множества {х : | х — а | <[ 6} с интервалом [0, 1) и через / — любой интервал на [0, 1), расстояние точек которого от Ъ превосходит 1/4. Как легко видеть, ни одна из точек последовательности пар (еп, еп+1) не лежит в интервале / X /, что и доказывает теорему. Далее нами будет изучаться простейший случай задания функции F (х) в виде F(x) = {Мх + 9}, (8.2.2) где М — натуральное число, большее единицы, а 0 — произвольное вещественное число. Функция {Мх + 9} непрерывна во всех точках [0, 1), за исключением конечного числа М или М — 1 точек. Легко показать также, что для последовательности еп+1 = {Мгп } Р (гп > гп+1 > ^> еп+2 ) = 1/6 A — М), а не 1/6, как должно было бы быть при 2-равномерной распределенности. Таким образом, рекуррентная последовательность, определяемая дробными долями линейной функции Мх + 0, не может быть даже 2-равномерно распределенной. Тем не менее попытки улучшить дело за счет усложнения вида функции F обречены в известной мере на неудачу. В этой связи мы сошлемся, без доказательства, на следующую теорему (Франклин [1]). Теорема 8.9. Пусть р (х) — полином с веществен- ными коэффициентами. Предположим, что для некоторого е0 последовательность {еп}, построенная по правилу 8n+i = {p (Sn)}> равномерно распределена на [0, 1). Тогда либо р (х) = х + Р (Р иррационально), либо р (х) = Мх + + 9, где М — натуральное число, большее единицы. Числа б0, для которых при каждом натуральном М >> 1 последовательность $ = 80, г1у . . ., элементы
392 ВОПРОСЫ, СВЯЗАННЫЕ С ТЕОРИЕЙ ЧИСЕЛ [ГЛ. 8 которой определяются равенством 8п+1 = {Мгп}, (8.2.3) равномерно распределена на [0, 1), носят название абсолютно нормальных. Множество абсолютно нормальных чисел имеет на [0, 1) лебегову меру единица. Впервые такие числа были построены А. Лебегом и В. Серпинским в 1917 г. Очевидно, также, что аналогичными свойствами обладает последовательность, элементы которой определяются равенством 8п+1 = {Мгп + 0} (8.2.4) при 9 > 0. При достаточно больших М последовательность (8.2.3) обладает многими свойствами последовательностей реализаций случайной величины, равномерно распределенной на [0, 1). Мы изучим эти свойства, опираясь на результаты Сю [1] и их обобщения, полученные Соболем [8] (теоремы 8.10, 8.11). Пусть / (х) — функция, определенная и интегрируемая по Риману в единичном 5-мерном гиперкубе 33S. Положим Ч>М (X) = / (Л?, {Мгх}, {МгМ2х}, . . ., {Мг . . . Мг-гХ}). где Ми . . ., Ms_! — натуральные числа, большие единицы, и М = min (Мц . . ., Ms_i). Обозначим 1 J = J / (х)dx и jm = \ фм (х) Ах. &8 0 Справедлива следующая Теорема 8.10. Если при сделанных предположениях для некоторого Мо ]> 2 при всех М ^> Мо все фм (х) интегрируемы по Риману в @, 1), то lim Jm = J- М-*оо Если при этом f (x) удовлетворяет в 33S условию Липшица S |/(ас') -/(х")|<L 2 | .ri - х\\\> 0<т< 1, (8.2.5)
§ 2] О ЛИНЕЙНЫХ РЕКУРРЕНТНЫХ ПРОЦЕДУРАХ 393 то для М ^> М Q 1 \\ {S^L • (8-2.6) «a5g о Доказательство. Разобьем отрезок @, 1) на Мх равных интервалов и соответственно JM на сумму Af г интегралов, в каждом из которых сделаем замену переменных, полагая Мх = j± + уг. Тогда ;'i=o Jf 1-11 1 Аналогично, разбивая каждый из полученных интегралов на сумму М2 слагаемых и в каждом из них делая замену переменных М2у1 = /2 + г/2, получим / Х Повторяя этот процесс s раз (в последний раз каждый из интегралов разбивается на М частей), получим J Х Mi...Ms_xM X ( /l + У1 /a-i + y-i /s Пусть далее т (ju . . ., js) и ni (Д, . . , j8) — верхняя и нижняя грани функции / в параллелепипеде 1klMh < xk < (jk + 1) /Mk (к = 1, . . ., s; Ms = AT). Очевидно, Mt-l M-l (8-2-7) ii=o < is=o Mi-1 ii=o M-l • S i,=o
394 ВОПРОСЫ, СВЯЗАННЫЕ С ТЕОРИЕЙ ЧИСЕЛ [ГЛ. 8 В этом неравенстве справа и слева стоят соответственно верхняя и нижняя суммы Дарбу для / в 25S. Таким образом, при М —> оо Jm стремится к /, что доказывает первую часть теоремы. Что касается второй части, то ее легко получить из очевидного неравенства (см. (8.2.7)) Mi-l М-1 х 2 ••• 2 (*&(/i> •••»/*) — aUif-Js)) ji=0 Js=0 и условия (8.2.5). Франклином [1] в 1963 г. было показано, что при М ->¦ -> оо последовательность (8.2.3) распределена вполне равномерно для почти всех е0. Ниже мы приведем доказательство более общего утверждения, содержащегося в работе Соболя [8]. Обозначим хк = (8fc> • • • » 8fc+s-l) И Хк = (efcs+i, . . • Будем считать Мх = М2 = . . .= Ms^ = М и докажем следующую теорему. Теорема 8.11. Если f(x) интегрируема по Риману в SD8J и для некоторого Мо > 2 при всех М > Мо все ф^ интегрируемы по Риману в @, 1), то для почти всех е0 из @,1) N-1 M-+OON-+OQ и N-1 Пт Нт ж 2 Доказательство. Пусть е0 — абсолютно нормальное число. Тогда f(Xk) = Так как последовательность с? равномерно распределена,
i 2] О ЛИНЕЙНЫХ РЕКУРРЕНТНЫХ ПРОЦЕДУРАХ 395 то отсюда следует первое из равенств, составляющих содержание теоремы, т. е. упомянутый результат Франклина. Обозначим далее Ms = М, Тогда /(**) = f({MM%l..., {APM%}) = <ри({ММ%}). Но если последовательность {Мк г0} распределена равномерно, то и последовательность {Мкг0} распределена равномерно (см. Постников [2], стр. 75). Согласно критерию Вейля, для любого натурального т Ф О получаем 2 exp Bnims0MK) = о (N), и, в частности, это равенство будет справедливо для всех т = mxM Ф 0. Это означает также, что равномерно распределена последовательность {ММке0}. Как и ранее, отсюда следует lim 2 /(*) М-ос ЛГ-оо УУ fc==0 Теорема доказана. Кацем [3] изучался вопрос о распределении сумм вида N ^2М), »е @,1). (8.2.8) Здесь / — непрерывная функция одной переменной, определенная на @, 1). Им было показано, что распределение таких сумм при N -> оо сходится к нормальному (при надлежащей нормировке). Ряд обобщений этого результата принадлежит Леонову [1], Ибрагимову [1]. Результаты, связанные с предельными теоремами для теоретико-числовых сумм вида (8.2.8), представляют очевидный интерес для метода Монте-Карло, ибо он и основан на предельных теоремах такого рода. Ниже обсуждается многомерный аналог теоремы Каца, доказанный Ермаковым [7], а затем обсуждаются приложения результатов Леонова. Предварительно необходимо доказать следую- щие простые леммы.
396 ВОПРОСЫ, СВЯЗАННЫЕ С ТЕОРИЕЙ ЧИСЕЛ [ГЛ 8 Лемма 8.3. Для любого к > 0 целого имеем 1 1 У({Мкх},..., {M*+s-4})dx = j[ фМ (х) dx о о (8.2.9) (Мг = М2 = ... = Ms_x = М), есд^ интегралы в правой и левой части существуют. Доказательство проводится методом, использовавшимся ранее. Промежуток @, 1) разбивается на Мк равных частей и интеграл в левой части (8.2.9) соответственно разбивается на Мк интегралов. В ;-м слагаемом полученной суммы делается затем замена переменных Мкх = у + /, что и приводит к желаемому результату. Лемма 8.4. Пусть f удовлетворяет в 35s условию Липшица (8.2.5) и \i = sup | / (х) |. Тогда функция ks пере- менных /mi (xi) . . . /m/c (xk) удовлетворяет в ks-мерном единичном гиперкубе 3)Hs условию Липшица с показателем у и константой {тг + • • • + тк) LyJ +"'+m/r\ Здесь к > 1 — натуральное и ти 1 ^ i ^ к,— неотрицательные целые числа, не равные нулю одновременно. Доказательство для к = 2 следует из равенства г) (fmi {Ki) - Г Общий случай доказывается по индукции. Пусть теперь т±, . . ., mk — натуральные ч-ясла и &!, . . ., ik —натуральные числа, удовлетворяющие условию iP + *< ip+i, p = 1, . - ., /с — 1. Обозначим 1 Jm [тг,... , щ] = J /^ ({М%},..., {Mb+-ix}) X ... о .. . х Гк ({М1ьх},..., {М^^х}) dx Существование этого интеграла, как и ранее, предполагается для всех Му больших некоторого Мд.
§ 2] О ЛИНЕЙНЫХ РЕКУРРЕНТНЫХ ПРОЦЕДУРАХ 397 Лемма 8. 5. Для любой интегрируемой в собственном смысле по Риману в 3)s функции f (x) справедливо равенство 5 г* fm*(x)dx... \ fm*(x)dx. (8.2.10) При этом, если f удовлетворяет условию Липшица (8.2.5) в 2DS, то для М > Мо + ..m + mk)L (ks - 1) (лт1+-+гп^"М-^ (8.2.11) Доказательство. Согласно лемме 1, в выражении для Jм [tf^i» . • •> ^г/J можно положить iL = 0. После этого легко видеть, что подынтегральное выражение представляет собой функцию ц>м (х), соответствующую функции ks переменных /mi (x±) . . . /m/c (xk), при этом Mi, . . ., Mfc5_! являются степенями числа М. Отсюда на основании теоремы 8.10 следует (8.2.10). Неравенство (8.2.11) следует из леммы 8.4 и теоремы 8.10. Рассмотрим далее последовательность Щ — е0, ех, ... чисел из @, 1) таких, что е0 — некоторое число из @, 1) и гп+1 = {Мгп}, п = 0, 1, . . ., М > 2 — целое. С помощью последовательности # образуем последовательность Зс0, Зсх, . . точек в 25s по правилу й* = (eie, eis+1, . . ., e(i+1)8-i), i = 0, 1, . . . (8.2.12) и изучим поведение остатка /?лг [/, в0] = jf S /(S«) - i=0 e в зависимости от величины е0. Рассмотрим далее интегралы Ip=](RN[f,x]ydz, p=l,2f... (8.2.13)
398 ВОПРОСЫ, СВЯЗАННЫЕ С ТЕОРИЕЙ ЧИС^Л [ГЛ. 8 Если обозначить f(x) = f(x) — ^ / (х) dx, то N-l I N-l и IP = N-p^ ( 2 i0 4^ ( i=0 0 i=0 В дальнейшем удобно установить соответствие между /р и моментами некоторых случайных величин и воспользоваться известными фактами теории вероятностей. Пусть а — случайная величина, равномерно распределенная на @, 1). Положим е0 = а и рассмотрим соответствующие последовательности (8.2.3) и (8.2.12). Случайная величина Rn [/, а], очевидно, имеет моменты, совпадающие с /р. С другой стороны, поскольку / ограничена, то /р определяют однозначно (с точностью до множества меры нуль) функцию распределения Fn (У) = Р {Rn [/, а] < у) = mes {х : RN [/, х] < у]. (Условие Карлемана (Прохоров, Розанов [1], стр. 212) легко проверяется.) Кроме того, мы будем рассматривать s-мерную случайную величину а, равномерно распределенную в 2)s, и случайную величину ? = f (а). Так как /, = N-* 2 С% р! , \ f- (Th) П (%) dx, (8.2.14) то в предположении, что / удовлетворяет всем ограничениям, наложенным ранее, на основании леммы 8.5 получаем lim Ip = . fc— f /1 N~ где %i — независимые реализации случайной величины ?. Таким образом, при М ->¦ оо каждое /р совпадает с р-м моментом среднего арифметического независимых реали-
§ 2] Q ЛИНЕЙНЫХ РЕКУРРЕНТНЫХ ПРОЦЕДУРАХ 399 заций случайной величины ?, имеющей нулевое среднее и дисперсий и причем характер сходимости определяется центральной предельной теоремой при условии существования всех моментов случайной величины ? (см., например, Прохоров, Розанов [1], стр. 229). При конечных М и N функцию Fn (у) можно, очевидно, представить в виде двух слагаемых FN (У) = Fn (у) + GM (У), где FN (у) — функция распределения случайной величины ЛГ-1 /V 2 li> a Gm (у) при М ->• оо слабо сходится к нулю. 2=0 Если / (х) удовлетворяет условию Липшица (8.2.5), то, согласно (8.2.11) и (8.2.14), I \ x4GM (х) I < ЛН Г 2 (Ь*-1)С% mi/!/ltl 1 |J ' " Lm1+...+m/i.=p /с X X pL)x*-1M-'t < L^v-ip (ps — 1) M"Y. Или |J xp<1Gm (x) I < PM^ (p^ — 1) 1*>~уу так как L ^ \i. Полученная оценка позволяет судить о зависимости моментов функции Gm от размерности области интегрирования и числа М. Результат может быть сформулирован в виде следующей теоремы: Теорема 8.12. Если f (x) интегрируема в собственном смысле по Риману в 3)su для некоторого Мо при М ^> > Мо все (рм (#) интегрируемы по Риману в @, 1), то lim ( lim mesJ80 : —— Rn [/» 4] ^v]) = '-¦?-) d». (8.2.15)
400 ВОПРОСЫ, СВЯЗАННЫЕ С ТЕОРИЕЙ ЧИСЕЛ [ГЛ. 8 Если же f (x) удовлетворяет в 3)s условию Липшица (8.2.5), то при фиксированных N и М ^> Мо, р-й момент (8.2.13) распределения остатка отличается от соответствующего N-1 момента распределения среднего N'1 2^г ^е более чем на г=о величину р (ps — 1) у?М-<. Из теоремы непосредственно следует, что для каждой функции /(х), удовлетворяющей ее условиям, мера множества тех е0, для которых выполняется неравенство ^ (8-2.16) есть 1 — б (г/, М, N), где оо б (г/, М, N) = /2/я J ехр (- и*/2) du + б (М, N) у и 8(M,N)-+0 при M,N->-оо. При достаточно больших фиксированных М nN и фиксированном у (тоже достаточно большом) для данной функции / мера множества тех е0, для которых не выполняется неравенство (8.2.16), есть 1 — б. Если мы возьмем две различные фиксированные функции, удовлетворяющие условиям теоремы, то мера множества е0 таких, что неравенство (8.2.16) не выполняется хотя бы для одной из двух функций, может быть 1 — 2 б и т. д. Вообще, каковы бы ни были [б] различных функций, удовлетворяющих условиям теоремы 8.12, найдется е0 такое, что для каждой из них выполнено (8.2.16). Здесь существенно, однако, что N фиксировано и для другого N е0 может быть иным. Заметим, что если вместо точек xt рассматривать точки Xt, которые образуются из исходной последовательности Щ по правилу xt = (ег, ет, . . ., Ei+S^), i = 0, 1, . . . (гусеница ранга 5), то результат будет иным. В этом случае нельзя пользоваться леммой 8.5, но легко видоизменить рассуждения и получить аналог центральной предельной теоремы для s зависимых случайных величин. Результат будет буквально тем же, но дисперсия б2, фигурирующая в теореме 8.12, будет определяться иначе.
§ 2] О ЛИНЕЙНЫХ РЕКУРРЕНТНЫХ ПРОЦЕДУРАХ 401 Исход» из результатов Леонова [1], можно также указать способы интегрирования, при которых распределение остатка подчиняется центральной предельной теореме. Леоновым [1] получена предельная теорема для эргоди- ческих эндоморфизмов компактных коммутативных групп. В частности, если группа Ж является 5-мерным тором с покоординатным сложением по модулю единица, то произвольный эндоморфизм задается некоторой невырожденной целочисленной квадратной матрицей А порядка s. Он эргодичен тогда и только тогда, когда А не имеет собственных чисел, равных корням из единицы. Пусть х = (аФ , . . ., #(s)) — произвольная точка в 25S. Вектор-столбец, составленный из координат х, обозначим хт. Через {Ахт} обозначим вектор, составленный из дробных долей компонент Ахт. Рассмотрим сумму •Ыж) = -^2/({^г})- (8-2-17) i=0 Имеет место теорема (теорема 5.2 работы Леонова [1]): Теорема 8.13. Если / (х) подчинена условию (на торе) 1 1 sup ([.. Л (/ (x(i),..., *(*-*), (я**) + fe), з<*+1\ ..., а«) - J , (8.2.18) ? = 1, . . ., s, y ]> 0, с — постоянная, то lim mes\x : -^- Eдг (x) — /)< y} = 1 p = -г^- \ ехр(-и2/2)йм, (8.2.19) —oo где V)--0*B (8.2.20) условии (8.2.18) O/< + <»•
402 ВОПРОСЫ, СВЯЗАННЫЕ С ТЕОРИЕЙ ЧИСЕЛ [ГЛ. 8 Кацем [3] была доказана теорема 8.13 при s = 1. Теоремы 8.12 и 8.13 обобщают его результат в разных смыслах. Теорема 8.12 создает принципиальную основу для использования элементов последовательностей вида (8.2.3) в качестве реализаций случайной величины, равномерно распределенной на @, 1), и указывает возможные источники возникающей при этом погрешности. Теорема 8.13 показывает, что при использовании векторной последовательности вида {А1хт} для вычисления 5-кратного интеграла может быть получен результат, близкий к предыдущему, но дисперсия будет иной, а предельное распределение будет нормальным при фиксированных элементах матрицы А, и нет надобности в двойном предельном переходе, как в случае теоремы 8.12. Напомним в заключение этого пункта, что мы предполагали вычисления при получении псевдослучайных последовательностей абсолютно точными, и все предшествующие результаты нуждаются в дополнительных обоснованиях, если вычисления производятся на ЭВМ с конечным числом разрядов. 2. Вычисления с конечным числом знаков. Если при достаточно большом М вычисления производятся на ЭВМ, имеющей ограниченную разрядность (для реальной ЭВМ это всегда так), то результаты, полученные в предыдущем пункте, нуждаются в очевидной корректировке. Легко видеть, что рекуррентное соотношение еп+1 = {Мгп} при больших М не является устойчивым относительно погрешности в задании е0. Поэтому, если мы отыскали некоторое «хорошее» е0 и поместили его в конечную разрядную сетку ЭВМ, производя округление по обычным правилам, то начиная вычисления с этого е0, мы не получим ничего общего с последовательностью, полученной при точных вычислениях. При вычислениях с ограниченной разрядностью удобнее вернуться к форме записи, употреблявшейся в § 1 главы 2, т. е. (8.2.3) записывать в форме ), (8.2.21) х0 и Р > 1 — натуральные числа, х0 <Рш sn+1 = -^jr- Прежде всего легко видеть, что последовательность (8.2.21) в силу конечности числа возможных значений хп обладает свойствами периодичности. Эти свойства могут быть изу-
§ 2] О ЛИНЕЙНЫХ РЕКУРРЕНТНЫХ ПРОЦЕДУРАХ 403 чены различными способами при помощи средств элементарной теории чисел. Наиболее простое изложение необходимых нам фактов содержится в монографии Янссона [1], которой мы будем далее во многом следовать. При этом нами будут рассматриваться последовательности более общего вида, чем (8.2.21), а именно последовательности вида хп+1 == аохп + ai#n_i+ . . . +akxn-k+b (mod P), (8.2.22) где Р, а0, . . ., ак, Ъ и х0, . . ., хк — неотрицательные целые числа. Соотношение х = у (mod P) здесь, как и ранее, означает, что х равен остатку от деления у на Р'. Таким образом, члены последовательности (8.2.22) не превосходят Р, и числа xJP, i = к + 1, ft + 2, . . ., используемые обычно в качестве псевдослучайных чисел, принадлежат промежутку @, 1). При к = 0 получаем формулу (8.2.21). Будем предполагать, что наибольшие общие делители (х0, . . ., хк, Ь, Р) и (а0, • • ., ah, Р) чисел х0, . . ., хк, fe, Р и а0, . . ., ak> P соответственно равны единице. Чтобы подчеркнуть зависимость результатов от числа Р, будем обозначать саму последовательность X = = х0, хи . . . через X (Р) и длину ее периода через L (Р). Когда Р состоит из малых по величине простых сомножителей, процедуру определения L (Р) легко свести к достаточно простой процедуре определения длин периодов для этих малых сомножителей. Для этой цели, считая значения х0, ...,#? фиксированными, докажем следующие леммы. Лемма 8.6. Пусть т1 и т2 — целые положительные числа, (ши т2) = 1 и L (m^u L(m2) — длины периодов X (nix) и X (т2) соответственно. Тогда L (mim2) = = о.н.к. (L (mi), L (т2)), где о.н.к. (яг, п) обозначает общее наименьшее кратное чисел тип. Доказательство. Если л > ft, уп = хп, 0 < п < ft, (8.2.23) то, согласно условию леммы, Уг+;Цтп1)= xi+ciJml, (8.2.24) У1+1Цт$)= ^i+c^^m,, (8.2.25)
404 ВОПРОСЫ, СВЯЗАННЫЕ С ТЕОРИЕЙ ЧИСЕЛ [ГЛ. 8 где i = 0, 1, . . ., к, cifjncit} — целые и/ и / — аатураль- ные числа. Кроме того, Уг+Ь{тхтг) = %{ + С^П^П^ (8.2.26) где ct — целое число. L {тхт^) является наименьшим целым числом, при котором выполняются соотношения (8.2.24) — (8.2.26), т. е. о.н.к. (L {тх), L (т2)), откуда и следует лемма. Из доказанной леммы легко получить s Следствие. Если Р = "Q ргг есть разложение чис- г=1 ла Р на простые множители, то Важный для нас случай наличия кратных сомножителей позволяют исследовать следующие две леммы. Лемма 8.7. Если последовательность X (рт) имеет период, длина которого равна L (рт) (р — простое, т — натуральное число), то длина периода последовательности X (рт+1) либо равна L (рт), либо в р раз его более. Доказательство. Пусть уп+1 определяется, как и выше, соотношением (8.2.23). Тогда Уц-)Шт) = Xi+eitjpm ' i = 0, . . . , /С, причем си j можно считать неотрицательным числом. Если citl делится на р для всех i, то L (pm+1) = L (рт). В противном случае найдется натуральное г, для которого си 1 = г (mod р) и, следовательно, ciy j == rj (mod p). Так как р — простое, то jr ф 0 (mod р) при / = 1,2,... . . ., р — 1 и /г = 0 (mod р) при / = р. Отсюда следует L (pm+1) = pL (pw), что и завершает доказательство. Лемма 8.8. Если X (Р) такова, что L (pm+1) = = pL (pm), то L(pl+m) = plL (рт)у где I и т — натуральные числа. Доказательство. Сохраняя прежние обозначения, при / = 2 имеем ciiP ^ pr (mod pr). Следовательно ctijp= jpr (mod pr). Отсюда, как и при доказательстве леммы 8.6, следует jpr = 0 (mod pr), / = 1,2,... ...,/? — 1, в то время как ррг = 0 (mod pr). Доказательство для / ^> 2 может быть легко проведено по индукции,
§2] О ЛИНЕЙНЫХ РЕКУРРЕНТНЫХ ПРОЦЕДУРАХ 405 Таблица 8.1 т 2 3 4 м А X \ з А 1 3 5 7 А X 3 5 7 9 И 13 15 If li 1, 1, 1, 3, 1, 3 1, 5 1, 7 1 1 » » 1, 3, 1, 5, 1, 7 1, 9 1, И 1, 13 1, 15 Состав последовательности 1 . 1,. 1 . 1 . или или или 1,. 9, 9, или или , 9, , 9, з, з, 11 13 з, з, 3 5 или 3 7 7 5 или или и. или или , 13 5, 15 3, 15, или 9 или 5 5, 7, 3, 7, или 5 13 и, , 15 , 13 13, и, , и 7 7 , или И, 13 , или 7, 15 15 15 или 7,9 Длина периода 1 2 А 1 2 2 2 л 4 4 2 2 4 4 В упоминавшейся нами неоднократно монографии Янссона можно найти примеры определения длины максимального периода для многих последовательностей при различных Р на основе лемм 8.6—8.8. Мы приведем результаты лишь для простейшего наиболее употребительного случая хп+1 = Мхп (mod 2W). (8.2.27) Имеет место следующая Теорема 8.14. Максимальная длина периода последовательности (8.2.27) при т > 3 есть 2т~2 и достигается при М = 3 (mod 8) или М ¦= 5 (mod 8) для всех нечетных х0. Доказательство следует из леммы 8.8 и таблицы 8.1, содержащей результаты непосредственных вычислений при т = 1, 2, 3, 4 и различных М> если заметить, что случай М ^> 28 при Р =?= 2s сводится
406 ВОПРОСЫ, СВЯЗАННЫЕ С ТЕОРИЕЙ ЧИСЕ/Л [ГЛ. 8 к случаю Мх < 2s, где М = М1 (mod 2s) (.9 — натуральное число). Кроме того, легко видеть, что увеличение периода в два раза с увеличением т от четырех до пяти достигается за счет появления в последовательности новых членов, каждый из которых сравним с одним и только с одним из старых по модулю 8. А в общем случае при переходе от т к т + 1 добавляются новые члены, каждый из которых сравним с одним и только одним из старых по модулю 2т. Это полностью доказывает теорему и приводит к следствию, дающему состав последовательности с максимальным периодом в рассматриваемом случае. Следствие. Справедливы следующие утверждения: 1. Если М = 3 (mod 8) и х0 = 1, 3, 9 или 11 (mod 16), то последовательность вида (8.2.27) состоит из чисел вида 8к + 1 и 8к + 3, к = 0, 1, . . ., 2т-3 — 1. 2. Если М = 3 (mod 8) и х0 = 5, 7, 13 или 15 (mod 16), то эта последовательность состоит из чисел вида 8к + 5 и 8к + 7, к = 0, 1, . . ., 2т~3 - 1. 3. Если М = 5 (mod 8) и х0 = 1 (mod 4), то эта последовательность состоит изчиселвида Ак + 1, к = 0, 1,... 4. Если М = 5 (mod 8) и #0 = 3 (mod 4), то эяга тго- следовательность состоит из чисел вида Ак + 3, А: = = 0, 1, . . ., 2т-2 -1. Заметим, что для смешанного метода, т. е. для последовательности вида хп+1 = Мхп +Ъ (mod 2m), максимальный период есть 2т и последовательность естественным образом состоит из всех чисел от 0 до 2т — 1. Таким образом, алгоритм (8.2.3) отличен от алгоритма (8.2.21). В последнем случае имеется конечный период и стремление М к бесконечности лишено смысла. Тем не менее вычислительные эксперименты и тесты показывают, что элементы последовательности (8.2.21) при некоторых М близки по своим свойствам к последовательности реализаций равномерно распределенной на @,1) случайной величины. Имеется значительное число работ, где применялись тесты к последовательности вида (8.2.21) или элементы такой последовательности использовались в практических расчетах. Наиболее полцо исследовались последом-
§ 2] Ь ЛИНЕЙНЫХ РЕКУРРЕНТНЫХ ПРОЦЕДУРАХ 407 тельности вида (8.2.27). В практических расчетах одним из наиболее распространенных значений М является 515 при Р = 235 или Р = 236. Авторы, как правило, отмечают удовлетворительное выполнение различных статистических тестов или хорошее согласие с экспериментом для этого значения константы М. Некоторые библиографические ссылки, соответствующие различным М и Р, приводятся в табл. 8.2. Случай Ъ ф 0 также отражен в некоторых из работ, включенных в таблицу. Что же касается библиографии, в которой предлагаются различные способы получения псевдослучайных чисел, то она весьма обширна. Примерно 2/3 библиографического списка (около 600 работ), составленного Нан- сом и Клаудом [1], относится к такого рода работам. Список этот, впрочем, далеко не полон. Наиболее исследованными можно считать линейные рекуррентные процедуры (8.2.21), а также метод, предложенный (и исследованный) Конюховским [1]. Мы сознательно ограничились лишь мультипликативными датчиками, ибо их исследование достаточно продвинуто и они многократно использовались при решении практических задач. К сожалению, даже в случае этих датчиков нет теорем, ограничивающих область их применимости, хотя примеры «плохих» датчиков известны (например, Гринбергер [1]). Теоретические исследования здесь еще очень далеки от завершенности. Они развиваются в основном в двух направлениях. Первое из них — это исследования свойств равномерной распределенности (в теоретико-числовом смысле) получаемых последовательностей. Отдельные результаты в этом направлении получены Ковью и Мак- ферсоном [1], которые проводили гармонический анализ последовательностей вида (8.2.21), т. е. проверяли выполнение критерия Вейля. В случае ограниченной разрядности он не может выполняться точно и авторы вводили «волновое число», характеризующее качество последовательности. Ими были вычислены минимальные волновые числа для некоторых последовательностей вида (8.2.21) аналитически или с помощью ЭВМ и приведены некоторые оценки снизу минимального волнового числа.
ВОПРОСЫ, СВЯЗАННЫЕ С ТЕОРИЕЙ ЧЙСШ ГГЛ. 8 Таблица 8.2 м 513 51? 23 319 23 23 2" + 3 106 + 3 5« 6 469 693 231 5i? 1 050 005 1 000 003 551 003 551 023 400 003 200 003 20 405 20 005 20 003 10 405 10 005 10 003 6 263 4 005 4 003 2 003 203 41 475 557 5 308 871 296 р 239 2*2 2з5 + 1 Ю20 231-1 108+1 235 1010 235 236 240 235 226 235 Автор Юнкоза [1] Таусски, Тодд [1] Джонсон [1] Бофингер, Бофингер [1] Эсманжо-Боанардель [1] Мак-Ларен, Марса л ья [1] Ковью, Макферсон [1] К овью, Макферсон [1] Ермаков, Прокофьева [1] Марчук и др. [1] Гёльдер [1] Арене, Дитер, Грубе [1]
§ 2] О ЛИНЕЙНЫХ РЕКУРРЕНТНЫХ ПРОЦЕДУРАХ 409 Отдельные результаты, характеризующие равномерность распределения последовательностей (8.2.21), содержатся в работах Аренса, Дитера, Грубе [1] и Нидер- рейтера [1]. Другое направление ставит целью исследовать аналитически парные «корреляции» между членами последовательности и выбрать константу М так, чтобы «корреляции» были по возможности малыми. Здесь поставлены кавычки, ибо разные авторы вкладывают разный, вообще говоря, смысл в понятие корреляций для периодической последовательности. Чаще всего, и мы будем иметь в виду этот случай, аналогом математического ожидания считают среднее арифметическое суммы по длине периода. В принятых ранее обозначениях L-1 j г=0 и аналог ковариаций L-1 1=0 L-1 L-1 - ("Г 2 *«*) ("Г 2 ***ш) • (8-2.28) /=0 1=0 Точные формулы для этих ковариаций оказываются необозримыми и различные авторы получали приближенные выражения для них. Этому вопросу посвящены работы Гринбергера [2], Ковью [1], Янссона [1], Антипова [1], Аренса, Дитера и Грубе [1]. В последних двух содержатся некоторые конкретные рекомендации по выбору константы М. Арене, Дитер и Грубе рекомендуют выби- У5—1 а'2т~2, гдеа= -—^ • Конкретные рекомендованные ими значения М для т = 26 и 35 приведены в табл. 8.2. В заключение обсудим вопрос о том, в какой мере предельные теоремы, обсуждавшиеся в предыдущем пункте, могут быть перенесены на случай вычислений с ограниченной разрядностью. Заметим прежде всего, что теорема 8.10 может быть перенесена на дискретный случай в следующем смысле.
410 ВОПРОСЫ, СВЯЗАННЫЕ С ТЕОРИЕЙ ЧИСЕЛ [ГЛ. 8 Пусть М — достаточно большое число, и речь идет не о вычислении интеграла по 5-мерному единичному гиперкубу, а о вычислении 5-кратной суммы Все точки сетки, занумерованные s индексами 0 <; iu ... . . ., is <^ М — 1, можно занумеровать одним индексом /, полагая = is По любому значению / можно очевидным образом найти и совокупность (iu . . ., ts), определяющих данную точку. Легко проверить также, что (8.2.30) Это последнее соотношение можно использовать для нахождения величин ihIM по заданному /. Заметим, что из (8.2.30) следует А^1, Л = 1,...,«. (8.2.31) Обозначая х0 = j/Ms, из (8.2.30) и (8.2.31) находим М8-! -L- 2 / ('о, {М*о}, ..., M-i M-i M ii=O is=0 где" 0^8г<^ ~п~ •> I = 1, . . .,5— 1. И, если /удовлетворяет условию Гёльдера (8.2.5), то очевидно 1 i>is-i IF j=o (8.2.32)
S 2) О ЛИНЕЙНЫХ РЕКУРРЕНТНЫХ ПРОЦЕДУРАХ 411 что является обобщением теоремы (8.2.10) на случай вычисления дискретной суммы (8.2.29). Можно было бы пойти дальше, обобщая на дискретный случай леммы (8.2.6) — (8.2.8), но в наших рассуждениях уже фигурировало М$, а читатель легко убедится, что обобщение названных лемм потребует рассмотрения существенно более высоких степеней М, и мы неизбежно будем иметь дело с числами, которые нельзя поместить в разрядной сетке ЭВМ. Заметим, однако, что при расчетах по основанию, связанному с числом М, мы можем обойтись конечным, хотя и очень большим числом разрядов, и, как в теореме 8.12, можно для достаточно больших М, N утверждать, что распределение остатка близко к нормальному, если вычисления производятся с конечным, хотя и очень большим числом разрядов. В действительности, как легко видеть, выбор при Р^2тв качестве М степени двойки приводит к немедленному вырождению последовательности, и даже выбор в качестве М числа, близкого к степени двойки, оказывается неудачным (Гринбергер [1]). Как показывает опыт, М и Р должны быть по крайней мере взаимно простыми, и в конечном счете дело сводится к следующей задаче — подобрать такое Мижо,О<М< 2т, 0 < х0 < 2т, чтобы разложение х0 в дробь по основанию М давало цифры (АТ-ичные) е01 еи . . ., близкие к соответствующим цифрам какого- либо из идеальных х0, существование которых утверждается теоремой 8.12 или ее дискретным аналогом. Это требование, как легко видеть, равносильно требованию, чтобы последовательность -р-, -^-,... приближенно равномерно (в теоретико-числовом смысле) была распределена в гиперкубе по возможности более высокой размерности. Названная задача не решена, однако, и неясно, с какой точностью ее можно решить, хотя упоминавшиеся исследования и многочисленные числовые эксперименты показывают, что она не лишена смысла. Из сказанного следует, что мультипликативный метод получения псевдослучайных последовательностей базируется на экспериментальном подходе, хотя есть ряд теоретических соображений, оправдывающих его применение.
412 &ОПРОСЫ, СВЯЗАННЫ! С ТЕОРИЕЙ ЧИСЕЛ [ГЛ. 8 § 3. Приближенное интегрирование и метод Монте-Карло. Метод «квази-Монте-Карло» Остановимся в заключение на некоторых принципиальных вопросах, касающихся предмета метода Монте-Карло и его связи с задачами приближенного интегрирования. Наличие такой связи не вызывает сомнений, и эта связь обсуждалась в той или иной мере почти в каждой главе книги. Тем не менее следует четко понимать, что моделирование (имитация) случайных величин (или процессов) и задача приближенного вычисления интегралов (даже сколь угодно большой кратности) — это две различные задачи. Разумеется, вполне равномерно распределенные последовательности, определение которых связано с процедурой вычисления интегралов Римана, можно рассматривать как арифметическую модель реализаций равномерно распределенной случайной величины. Использование таких последовательностей при вычислениях по методу Монте-Карло является обоснованным практически во всех случаях (имеет место сходимость при увеличении числа испытаний). Но вполне равномерная распределен- ность требует, чтобы по одной и той же последовательности мы могли вычислять интеграл любой кратности, а классические подходы к задаче приближенного интегрирования предполагают кратность интеграла фиксированной и оптимальный выбор весов и узлов кубатурной формулы в некотором классе функций. Здесь уместно еще раз вернуться к работе Колмогорова [2] и напомнить, что необходимым требованием к таблице случайных чисел Т = (tu . . ., tu), tk = О или 1, является стабильность частот я (А) = — 2 h ПРИ выборе подмножества А раз- личными методами из совокупности натуральных чисел 1, . . ., N. Именно такой подход кладется в основу моделирования случайных явлений, он отличен от постановки основных задач приближенного интегрирования. Это обстоятельство и побудило автора довольно подробно остановиться на конструировании вполне равномерно распределенных последовательностей и их связи с мультипликативным методом получения псевдослучайных чисел, сравнительно хорошо зарекомендовавшим себя при решении
§ 3] ПРИБЛЙШЕНЙОЁ ИНТЕГРИРОВАНИЕ 413 практических задач. Как уже отмечалось, общей проблеме арифметического моделирования случайных величин посвящена весьма обширная литература, но очень мало методов действительно использовалось при вычислениях на ЭВМ. Вместе с тем, если метод Монте-Карло используется лишь для оценки математических ожиданий, о которых известно, что они являются интегралами данной кратности, то можно очевидным образом использовать при расчетах узлы какой-либо кубатурной формулы с равными весами. Если с этой точки зрения подходить к псевдослучайным последовательностям, и в частности к последовательностям вида (8.2.21), то задача, которая здесь возникает, состоит в следующем. Имеется метод приближенного интегрирования, который крайне просто реализуется на ЭВМ. Требуется указать наиболее широкий класс функций, для интегрирования которых этот метод пригоден. Понятие пригодности, разумеется, должно быть соответствующим образом формализовано. В настоящее время эта задача для последовательностей (8.2.21) не решена и известно лишь, что если величина х0 (т1 + т2М + . . . . . . + msMs~x)IP оказывается целым числом, то интегрирование функции exp 2ni (m^i + . . . + msxs) с помощью таких последовательностей обречено на неудачу. Наряду с последовательностями, полученными с помощью линейных рекуррентных процедур, в схеме метода Монте-Карло при оценивании математических ожиданий практически использовались некоторые другие последовательности, поведение которых более детально изучено. Далее мы очень кратко остановимся на вопросах, связанных с использованием упомянутых последовательностей, имея в виду в основном алгоритмические аспекты. Как уже отмечалось в конце § 1 главы 4, статистические тесты, примененные формально к некоторой последовательности чисел, тесно связаны с погрешностью интегрирования для достаточно широкого класса функций. Для аналога статистики Колмогорова применительно к детерминированным последовательностям используется термин отклонение (discrepancy). Если Xi, х2, . . •, Xn — последовательность точек 5-мерного гиперкуба 3)s = {х : 0 <^ xt << 1; i = 1, ..., s}
414 ВОПРОСЫ, СВЯЗАННЫЕ С ТЕОРИЕЙ ЧИСЕЛ [ГЛ. 8 и ds (у) — содержащийся в этом гиперкубе 5-мерный параллелепипед г <Уг <1; i= 1, . . ., s], то функцию g {у) = N v (у) — ух . . . z/s, где N— число членов последовательности, a v (у) — число тех из них, которые содержатся в ds (у), называют локальным отклонением последовательности из N точек. Величину sup | g (z) | =D {xn}, которая и является аналогом ста- s тистики Колмогорова, называют отклонением последовательности. Рассматриваются также другие нормы функции g (#), например (аналог статистики Мизеса— Смирнова). В работе Рота [1] для величины ?{хп) получена оценка снизу . (8.3.1) Так как Т {хп} ^ D {хп}, то отсюда следует также D {хп} > csN-* (log #)<-«/*, (8.3.2) где t;s — константа, не зависящая от N. Имеется ряд работ, где конструируются последовательности с достаточно хорошими свойствами уклонений. Мы сошлемся в этой связи на работы Холтона [1], Главки [1], Зарембы [1], Коробова [4], а также на монографии Коробова [3] и Соболя [7]. Наиболее подробно вопрос об использовании узлов кубатурных формул в схеме метода Монте-Карло обсуждается в монографиях Соболя [7 и [9]. Вообще, коль скоро задача сведена к задаче вычисления интеграла кратности s по единичному гиперкубу, то классический подход, о котором шла речь в § 1 главы 4, может быть использован во всей полноте, и единственная особенность, возникающая обычно в связи с решением задач, описанных в предыдущих главах, состоит в малой гладкости интегрируемых функций. Так обстоит дело, однако, если кратность s фиксирована. При вычислении
§ 3] ПРИБЛИЖЕННОЕ ИНТЕГРИРОВАНИЕ 415 же средних по траекториям случайных процессов трудно заранее определить s. Более того, число звеньев траектории марковской цепи с поглощением является случайной величиной. В этих случаях характер процедуры интегрирования должен быть последовательным, т. е. новые узлы квадратурной формулы должны добавляться к использованным ранее без изменения последних. Построен ряд квадратурных формул, удовлетворяющих и этому требованию. Они использовались в схеме метода Монте-Карло при решении задач переноса излучения (Коробов [3], стр. 87—92, Гельфанд, Фейнберг, Фролов, Ченцов [1], Соболь [7]). Другой подход заключается в том, что для интегрирования функции / (хи . . ., хг, . . ., xs) по первым г переменным выбирается некоторая квадратурная формула с равными весами, а переменные хг+1, . . ., xs в каждом члене квадратурной суммы полагаются равными независимым реализациям равномерно распределенной случайной величины а, сконструированным одним из обсуждавшихся выше способов. В частности, для интегрирования по первым г переменным можно воспользоваться квадратурными формулами Коробова (§ 1, гл. 4). Отметим, что для совокупности их узлов имеет место оценка отклонения -\ (8.3.3) где В и р — константы, не зависящие от N, которая вытекает в свою очередь из того факта, что характеристическая функция параллелепипеда ds (у) принадлежит классу функций Е], и оценки D.1.16). Из сравнения оценок (8.3.2) и (8.3.3) следует, что метод оптимальных коэффициентов приводит к совокупности точек, отклонение которых отличается от минимального разве лишь на величину порядка iV log*4/V, где рх — константа, не зависящая от N. Таким образом, при оценивании математических ожиданий узлы кубатурных формул с равными весами можно использовать в схеме метода Монте-Карло в той или иной форме практически во всех случаях. К каким же последствиям приводит использование такого рода вычислительных схем, получивших название метода «квази-
416 ВОПРОСЫ, СВЯЗАННЫЕ С ТЕОРИЕЙ ЧИСЕЛ [ГЛ. 8 Монте-Карло»? К их преимуществам следует отнести возможность более высокого порядка убывания остатка, если подынтегральная функция принадлежит соответствующему классу, и детерминированную оценку погрешности. К их недостаткам следует отнести то обстоятельство, что центральная предельная теорема здесь, вообще говоря, не справедлива для распределения остатка и константа, входящая в оценку погрешности, не может быть столь просто оценена в процессе интегрирования. Особенности, связанные с методом «квази-Монте-Карло», легко пояснить следующим характерным примером. Пусть оценивается М?, где I = / (а), а а — равномерно распределенная на @, 1) случайная величина. Для простоты считаем / дифференцируемой функцией. Тогда среднее арифметическое Sn N значений / в равноотстоящих на @,1) точках N будет оценкой для М? и лучшей, чем N 2 /(°Ч) = Jn- Если же мы построим гистограмму распределения /#, то она будет походить на нормальную плотность с дисперсией О О а гистограмма распределения Sn на такую плотность походить, естественно, не будет, ибо Sn есть константа. Таким образом, обычная формула средних прямоугольников (метод «квази-Монте-Карло») пригодна для оценивания интеграла, но не для моделирования случайного явления — нормального распределения с дисперсией блг- Эти очевидные соображения сохраняют силу и в значительно более сложных ситуациях. Поэтому квазислучайные последовательности могут оказаться непригодными для моделирования случайных процессов. С вероятностной точки зрения «квазислучайные» числа, как правило, зависимы и их использование приводит к искажению корреляционных свойств процесса. И хотя использование неслучайных чисел в схеме метода Монте-Карло может служить источником повышения эффективности алгоритма, возможность их использования должна обосновываться. Нужно пони-
t 3] ПРИБЛИЖЕННОЙ ИНТЕГРИРОВАНИЕ 417 мать, какого рода интеграл вычисляется и в каких случаях существенна независимость используемых случайных величин. Данная книга была посвящена исключительно теоретико-вероятностным и статистическим аспектам метода Монте-Карло (точнее, методу Монте-Карло в смысле определения § 1 главы 1). Поэтому мы ограничились лишь этими беглыми замечаниями относительно неслучайных схем типа Монте-Карло (или метода «квази-Монте-Карло»), считая, что содержание метода в смысле упомянутого определения нами в основном раскрыто. 14 С М Ермаков
ЛИТЕРАТУРА (о с и о в н а я) Альберт (Albert G. Е.) [1] A general theory of stochastic estimates of the Neumann series for the solution of certain Fredholm integral equations and related series, Sympos. on Monte Carlo Methods, ed. H. A. Meyer, Wiley. A956), 37-46. Андерссон (Andersson S. E ) [1] A Monte Carlo model for simulation of tank battles, Nord. Tidskr, information, Behand.. (*966) 6, № 2, 89—100. Андреев (Andreief G.) [i] Note sur ulc relation entre hs integrates definies des products df<3 foacaons, Mem. Soc. SJ., Bordeaux A883) 3, 2, 1—14. А и о л l к M. li., Б а р а и ц e i3 P. Г. [i] Вторая ИхСрац'ш интегрального кипетического оператора в ударной вилне одноатомного газа, Методы вычислений (сб.), Изд-во ЛГУ A968) 5, 43-48. А н т и п о в М. В. [i] Оптимальный производящий мпожптель мультипликативного датчика, Вероятностные методы решения задач математической физики (сб.), Новосибирск A971), 7 -25. Антонов Г. Е., К а т к о в и и к В. Я. [1] Метод синтеза одного класса алгоритмов случайного поиска, Автоматика и телемеханика A971), 6, 154—157. Арепс, Дитер, Грубо (Ahrens J., Dieter U., Grube A.) [1] Pseudo-random numbers: A new proposal for the choice of mul- tiplicators, Computing A97u) 6, 121- 138. Балдини-Челио, Баллик о-Л ей, Спапо-Мепкуч- чими (Baldini-Celio R., Ballico-Lay В., Spano-Mencuccimi A.) [i] A multistage self improving Monte-Carlo method, Nucl. Instrum. and Methods, A969) 72, № 3, 317—320. Бар, Эссен (von Bahr В., Esscen G. G.) [1] Inequalities for the г-th absolute moment of a sum of random variables A < r < 2), Ann. of the Math. Stat. A965K6, 1, 229-303. Барашепк ов В. С., Мальцев В. М., Т о н е е в В. Д. [1] Взаимодействие быстрых протонов с тяжелыми ядрами, Изв. АН СССР, сер. физ. A966) 30, 322—327. Б ат л е р (Buttler J. W.) [1] Machine sumpling from given probability distributions, Sympos. on Monte Carlo Methods, ed. Ы.А. Meyer, Wiley A956), 249—264.
ЛИТЕРАТУРА (ОСНОВНАЯ) 419 Ьахвалов Н. С. [1] О приближенном вычислении кратных интегралов, Вестник МГУ A959), № 4, 3—18. [2] Оценка в среднем остаточного члена квадратурных формул, Журнал вычислит, матем. и матем. физики A961) 1, «№1,64—77. [3] Об оптимальных оценках сходимости квадратурных процессов и методов интегрирования типа Монте-Карло на классах функций, Сб. «Числ. методы решения дифф. и интегр. уравнений», «Наука», М. A964), 5—63. Башарин Г. П., Харкевич А. Д., Ш н е п с - Ш н е п- п е М. А. [1] Массовое обслуживание в телефонии, «Наука», М., 1968. Беляев Б. Н., Царицина И. В. [1] Расчет взаимодействия быстрых нуклонов с ядрами методом случайных испытаний, Методы вычислений (сб.), Изд-во ЛГУ A963) 1, 76-107. Б е р д (Bird G. А.) [1] Approach to translational equilibrium in a rigid sphere gas. Phys. Fluids A963) 6, № 10, 25—31. Бернардини, Бут, Линденбаум (Bernardini G., Booth E. Т., Lindenbaum S.) [1] The interactions of high energy nucleons with nuclei, Phys. Rev. A952) 88, 11, 1017—1026. Блюм (Blum I. R.) [1] Approximation methods which converge with probability one, Ann. of the Math. Stat. A951) 22, 400—407. Б о г а ч е в а А. А., Перепухов В.А., РухманЗ. Е. [1] Применение метода Монте-Карло к расчету аэродинамических характеристик тел сложной формы ь свободно-молекулярном потоке, Журнал вычислит, матем. и матем. физики A968) 8, № 6, 1395-1402. Бокс, Дрейпер (Box G. E. P., Draper N. R.) [1] The choice of a second order rotatable design, Biometrika A963) 60, № 3—4, 355—362. Бокс, Мюллер (Box G. E P., Muller M. E.) [1] A note on the generation of random normal deviates, Ann, Math. Stat. A958) 29, 610-611. БольшевЛ. Н. [1] О преобразованиях случайных величин, Теория вероятностей и ее применения A959) 4, № 2, 136—149. Бофингер, Бофингер (Bofinger E., Bofinger V. J.) [1] On the periodic property of pseudorandom sequences, J. Assoc. Сотр. Mach. A958), 261—265. Бочек Н. П. [1] О вычислении коэффициентов Ритца и Галеркина методом Монте-Карло, Журнал вычислит, матем. и матем. физики A966) 6, № 1, 172—177. Б у с л е н к о Н. П. [1] Математическое моделирование производственных процесс на цифровых вычислительных машинах, «Наука», М., 1964 [2] Моделирование сложных систем, «Наука», М., 1968. V*
420 ЛИТЕРАТУРА (ОСНОВНАЯ) Буслепко Н. П., Голенко Д. И., С о б о л ь И. М., С р а- г о в и ч В. Г., Ш р е й д е р Ю. А. [1] Метод статистических испытаний (метод Монте-Карло), СМБ Физматгиз, М., 1962. Бусленко Н. П., Шрейдер Ю. А. [1] Метод статистических испытаний (Монте-Карло) и его реали зация в цифровых машинах, Физматгиз, М., 1961. Бхаттачария (Bhattacharya P. К.) [1] Estimation of a probability density function and derivatives Sankhiya, A967) A-29, № 4, 373-382. Б ы к о в В. В. [1] Цифровое моделирование в статистической радиотехнике «Сов. радио», 1971. В а з о в (Wasow W.) [1] On the mean duration of random walks, J. Res. Nat. Bur. Stand. A951) 46, 462—472. [2] A note on the inversion of matrices by random walks., Math Tabl. Aids Comput. A952) 6, 78—81. Вайсборд Э. М., Ю д и н Д. Б. [1] Стохастическая аппроксимация для многоэкстремальных за» дач в гильбертовом пространстве, ДАН СССР A968) 181, № 5. 1034-1037. Валландер СВ. [1] Уравнения и постановка задач в аэродинамике разреженны* газов, Аэродинамика разреженных газов (сб.), Изд-во ЛГУ A963) 1, 7—37. В е й л ь (Weyl H.) [1] Ober die Gleichverleilung von Zahlen mod Eins, Math. Ann. A916) 77, 313—352. В е р ш и к А. М., Темельт В. [1] Некоторые вопросы аппроксимации оптимального значения бесконечномерных задач линейного программирования, Сиб. матем. журнал A968) 9, № 4, 790—803. Веселовская А. 3. [1] О решении первой краевой задачи для волнового уравнения методом Монте-Карло, Методы Монте-Карло в вычислительной математике и математической физике (Сб.), Новосибирск, 1974, 128-135. Винер Н. [1] Нелинейные задачи в теории случайных процессов, ИЛ, М., 1961. [2] Differential space, J. Math. Phys. A923), № 2, 138—174. Владимиров В. С. [1] Уравнения математической физики, «Наука», М., 1967. [2] О применении метода Монте-Карло для отыскания наименьшего характеристического числа и соответствующей собственной функции линейного интегрального уравнения, Теория вероятностей и ее применения A956) 1, 113—130. Владимиров В. С, Соболь И. М. [1] Расчет наименьшего характеристического числа уравнений Пайерлса методом Монте-Карло, Вычислит, математика A958) 3, 130-137.
Г а р [1J ЛИТЕРАТУРА (ОСНОВНАЯ) 421 а б с д я н С. М., Романовский И. В. Приближенное построение доверительных интервалов для параметров марковской цепи, Теория вероятностей и ее применения A967) 12, № 1, 123—127. Г е л ь ф а и д И. М., Фейнберг С. М., Ф р о л о в А. С, Ч е н ц о в Н. Н. [1] О применении метода случайных испытаний (метода Монте- Карло) для решения кинетического уравнения, Труды 2-й Международной Женевской конференции по применению атомной энергии в мирных целях, т. 5, Женева A958), 32—45. Гельфанд И. М., Ф р о л о в А. С, Ченцов Н. Н. [1] Вычисление континуальных интегралов методом Монте-Карло, Известия вузов, сер. матем. A958) 6, № 5, 32—45. Г ё л ь д е р (Gelder A.) [1] Some new results in pseudo-random number generation, J. As- soc. Сотр. Mach. A967) 14, 4, 785—792. Главка (Hlawka E.) [1] Zur angenaherten Berechnung mehrfacher Integrale, Monats- hefte fur Math. A962) 66, № 2, 140—151. Гладкий B.C. [1] Вероятностные вычислительные модели, «Наука», М., 1973. Гладышев Е. Г. [1] О стохастической аппроксимации, Теория вероятностей и ее применения A965) 10, № 2, 297—300. Глушков В. М., Калиниченко Л. А., М а р ь я н о- вичТ. П., Москаленко В. М., С а х н ю к М. А. [1] СЛЭНГ — система программирования для моделирования дискретных систем, Изд-во Ин-та кибернетики АН УССР, Киев, 1968. Гнеденко Б. В. [1] Курс теории вероятностей, Гостехиздат, М., 1954. Гнеденко Б. В., Колмогоров А. Н. [1] Предельные распределения для сумм независимых случайных величин, Гостехиздат, М., 1949. Голенко Д. И. [1] Моделирование и статистический анализ псевдослучайных чисел на электронных вычислительных машинах, «Наука», М., 1965. Горский Л. К. [1] Статистические алгоритмы исследования надежности, «Наука», М., 1970. ановский Б. Л. Некоторые вопросы планирования регрессионных экспериментов и теории квадратурных формул со случайными узлами, Диссертация, Ленинград, 1968. [2] О случайных квадратурах гауссовского типа, Журнал вычислит, матем. и матем. физики A968) 8, № 4, 879—884. [3] О допустимости случайных квадратур гауссовского типа, Журнал вычислит, матем. и матем. физики A971) И, № 1, 45-50. [4] Условия допустимости одного класса квадратурных формул со случайными узлами, Матем. заметки A974) 16, 2, 297—-301
422 ЛИТЕРАТУРА (ОСНОВНАЯ) [5] О дисперсии случайных квадратур гауссовского типа, Исследование операций и статистическое моделирование, 1, Изд-во ЛГУ, 1972, 1, 53-60. Грановский Б. Л., Ермаков СМ. [1] О непараметрическом подходе к задачам планирования регрессионных экспериментов, ДАН СССР A968) 180, № 2, 273—275. [2] Случайные квадратуры с частично фиксированными узлами, Методы вычислений (сб.), Изд-во ЛГУ A970) 6, 79—88. Грановский Б. Л., Столяров В. Г. [1] К вопросу о допустимости квадратурных формул со случайными узлами, Методы Монте-Карло в вычислительной математике и математической физике (Сб.), Новосибирск, 1974, 78—85. Григорьев Ю. Н., Иванов М. С., Харитонова Н. И. [1] К вопросу о решении нелинейных кинетических уравнений динамики разреженных газов методом Монте-Карло, Численные методы механики сплошной среды A971) 2, №4, 101—107, Новосибирск. Гринбергер (Greenberger M.) [1] Methods of Randomness. Comm. ACM A965) 8, № 3, 177—179. [2] An a priori determination of serial correlation in computer generated random numbers, Math. Сотр. A961) 15, 383—389. Д а л У., М ю р х а у г Б., Н ь ю г о р д К. [1] СИМУЛА-67 — универсальный язык программирования, «Мир», М., 1969. Далецкий Ю. Л. [1] Континуальные интегралы, связанные с некоторыми дифференциальными уравнениями и системами, ДАН СССР A961) 137, № 2, 268—271. Далецкий Ю. Л., Заплитная Л. Т. [1] Интегралы по пространству деревьев, связанные с нелинейными параболическими уравнениями, Украинский математический журнал A965) 17, № 5, 110—114. Дитер, Арене (Dieter U., Ahrens J.) [1] An exact determination of serial correlations of pseudorandom numbers, Numer. Math. A971) 17, № 2, 101—123. [2] A combinatorial method for the Generation of Normally distributed random numbers Computing A973) 11, №2, 137—146. Дмитриев Ю. П., Тарасенко Ф. П. [1] Об оценивании функционалов от плотности вероятности и ее производных, Теория вероятностей и ее применения A973) 18, 3, 662—668. Дуб Д. Л. [1] Вероятностные процессы, ИЛ, М., 1965. Д ы н к и н Е. Б. [1] Основания теории марковских процессов, Физматгиз, М., 1959. Д ы н к и н Е. Б., Ю ш к е в и ч А. А. [1] Теоремы и задачи о процессах Маркова, «Наука», М., 1967. Дэвисон Б. [1] Теория переноса нейтронов, Атомиздат, М., 1960. ДюгеД. [1] Теоретическая и прикладная статистика, «Наука», М., 1972,
ЛИТЕРАТУРА (ОСНОВНАЯ) 423 Дядькие И. Г., Ж у к о в а С. А. [1] О постановке задачи и алгоритме решения уравнения Шре- дингера методом Монте-Карло, Журнал вычислит, матем. и матем. физики A968) 8, № 1, 222—229. Е л е п о в Б. С, Михайлов Г. А. [1] О решении задачи Дирихле для уравнения Дм — си = —g моделированием блужданий по сферам, Журнал вычислит. матем. и матем. физики A969) 9, № 3, 647—654. [2] Алгоритм «блуждания по сферам» для уравнения Аи — си = = — g, ДАН СССР A973) 212, № 1, 15—18. Ермаков СМ. [1] Интерполирование по случайным точкам, Журнал вычислит матем. и матем. физики A963) 3, № 1, 186—189. [2J Случайные квадратуры повышенной точности, Журнал вычислит, матем. и матем. физики A964) 4, № 3, 550—554. [3] Об оценивании параметров при непрямых измерениях, Труды МИАН СССР A965) 79,106-112. [4] Письмо в редакцию, Теория вероятностей и ее применения A966) 11, № 4, 728. [5] О допустимости процедур метода Монте-Карло, ДАН СССР A967) 172, № 2, 262—263. [6] Метод Монте-Карло и смежные вопросы (изд. 1-е), «Наука», М., 1971. [7] Замечание о псевдослучайных последовательностях, Журнал вычислит, матем. и матем. физики A972) 12, № 4. [8] Метод Монте-Карло для итерации нелинейных операторов, ДАН СССР A972) 204, № 2, 271-274. [9] Об аналоге схемы Неймапа — Улама в нелинейном случае, Журнал вычислит, матем. и матем. физики A973) 13, № 3, 564—573. Ермаков С. М., Е ф и м е н к о Б. А., Золотухин В. Г., Михайлус Ф. ф., НиколайшвилиШ. С, По- ливанскийВ. П. [1] Методы решения уравнения переноса в неоднородных и ограниченных средах, 28 (A Conf) 363 IV— 1964, 3-я Международная конференция ООН по использованию атомной энергии в мирных целях. Ермаков С. М., Золотухин В. Г. [1] Полиномиальные приближения и метод Монте-Карло, Теория вероятностей и ее применения A960) 5, № 4, 473—475. Ермаков С. М., Илюшина Г,А, [1] О вычислении одного класса интегралов с помощью случайных интерполяционно-квадратурных формул, Методы Монте- Карло в вычислительной математике и математической физике (Сб.), Новосибирск, 1974, 67—71. Ермаков С. М., М е л а с В. Б. [1] Об одном подходе к планированию эксперимента при нелинейной параметризации, Заводская лаборатория A973), № 10, 1222-1225. Е р м а ко в С. М., Митиоглова Л. В. [1] Об одном методе поиска экстремума, использующем обобщенный метод Неймана моделировация случайных ведичцц,
424 ЛТГГТРЛТУРА (ОСНОВНАЯ) Методы Монте-Карло в вычислительной математике и математической физике (Сб.), Новосибирск, 1974, 146—151. Ермаков С. М., Нефедов В. С. [1] Об оценках суммы ряда Неймана по методу Монте-Карло, ДАН СССР A972) 202, № 1, 27—29. Ермаков С. М., Прокофьева 3. И. [1] О расчете защиты методом Монте-Карло. Вопросы физики защиты реакторов (сб.), вып. 2, Атомиздат, М. A966), 67—71. Ермаков С. М., Седунов Е. В. [1] Рандомизованные планы регрессионных экспериментов с одной свободной точкой, Исследование операций и статистическое моделирование (сб.), вып. 1, Изд-во ЛГУ A972), 61—71. Ермаков С. М., Скворцов П. Г. [1] Несмещенные оценки суммы ряда Неймана по методу Монте- Карло, Записки научных семинаров ЛОМИ 43, «Наука», Ленинград, 1974, 155—168. 3 а р е м б a (Zaremba S. К.) [1] The mathematical basis of Monte Carlo and Q uasi-Monte-Carlo methods, Soc. Ind. and App. Math. Pev. A968) 10, № 3, 303-314. Зилинский (Zielinski R.) [1] On the Monte Carlo evaluation of the extremal value of a function, Algoritmy A965), № 4, 7—13. [2] Generatory liczb losowych, Warszawa, 1972. Золотухин В. Г., Д е е в Г. Е. [1] Модификация метода Монте-Карло для расчета дифференциального потока нейтронов и <у~квантов> Метод Монте- Карло в проблеме переноса излучений (сб.), Атомиздат A967), 53—66. Золотухин В. Г., Ермакове. М. [1] Применение метода Монте-Карло к расчету защиты от ядерных излучений, Вопросы физики защиты реакторов (сб.), Госатом- издат, М. A963), 171—182. Золотухина Л. А., Латышев К. П., ЧугуеваВ. Н. [1] Стохастические модели слоистой среды и вероятностные свойства отраженных волн, распространяющихся в этих средах, Труды МИАН A968) 95, 42-97. Ибрагимов И. А. [1] Асимптотическое распределение значений некоторых сумм, Вестник ЛГУ, сер. матем., мех. и астр. A960), № 1, 55—69. Ибрагимов И. А., ЛинникЮ. В. [1] Независимые и стационарно связанные величины, «Наука», М., 1965. И о н и н Г. Л., С е д о л Я. Я. [1] Статистическое моделирование случайных процессов, Международная конференция по теории вероятностей и математической статистике, Вильнюс, 25—30 июня 1973 (Тезисы докладов) 1,281—284. Ишии, Секинэ, Оно (Ishii Т., Secine Т., Опо К.) [1] A Monte Carlo calculation of gamma-ray scattering on the jei- dac computer, Codes for reactor Сотр.х Vienna 1, Austria A961), 53—66,
ЛИТЕРАТУРА (ОСНОВНАЯ) 425 Кадыров М. [1] Таблицы случайных чисел, Ташкент, Изд-во СГУ 1936. К а л о с (Kalos М. Н.) [1] On the estimation ot flux at a point by Monte Carlo, Nuclear Sci. and Eng. A963) 16, 111—117. [2] Monte Carlo integration of the adjoint gamma-ray transport equation, Nuclear Sci. and Eng. A968) 33, 284—290. К а н (Kalm H.) [1] Use ol different Monte Carlo sampling techniques, Sympos. on Monte Carlo methods, ed. H. A. Meyer, Willey A956), 145—191. Канторович Л. В.,Акилов Г. П. [1] Функциональный анализ в нормированных пространствах, Физматгиз, М., 1959. К а ц (Кае М.) [1] On the distribution of values of sums of the type / B4), Ann. Math. A946) 47, № 1, 33. [2] О некоторых связях между теорией вероятностей и дифференциальными и интегральными уравнениями, Математика (сборник переводов) A957) 1 № 2, 95—124. [3] Вероятность и смежные вопросы в физике, «Мир», М., 1965. [4] Несколько вероятностных задач физики и математики, «Наука», М., 1967. К е м е н и Д. Д., С н е л л Д. Л. [1J Конечные цепи Маркова, «Наука», М., 1970. Кендал л, Б абингтон-Смит (Kendall M. G., Babington- Smith В.) [1] Tables of random sampling numbers, Tracts for Сотр. A939) 24. К е р т и с Д. [1] Методы Мопте-Карло для итерации линейных операторов, Успехи матем. наук A957) 12, 5 G7), 149—174. Кивиат, Виллан ев а, Маркович (Kiviat P. J., Vil- laneva R., Markovitz H.) [1] The SIMSCRIPT II Programming Language, Prentice Hall, Englewood Cliff. N. J. A969) № 7. К ифер (Kiefer J.) [1] Optimum designes for regression problem 11, Ann. of Math. Stat. A961) 32, 1, 268—279. Кифер, Вольфов и тц (Kiefer J., Wolfowitz J.) [1] Stochastic estimation of maximum of a regression function, Ann. of Math. Stat. A952) 23, 463—466. К л а й н (Kline S. J.) [1] Подобие и приближенные методы, «Мир», М., 1968. К л е й з а В. [1] Оценка ошибки метода Монте-Карло при решении систем нелинейных уравнений, Литов. матем. сб. A973) 13, № 1. Климов Г. П. [1] Стохастические системы обслуживания, «Наука», М., 1966. Ковью (Coveyou R. R.) II] Serial correlation in the generation of pseudo-random numbers, J. ACM A960) 7, № 1, 72—74.
426 ЛИТЕРАТУРА (ОСНОВНАЯ) Ковьго, Макферсон (Coveyou R. R., Macpherson R. P.) [1] Fourier analysis of uniform random number generators, Journ. of Assoc. for Сотр. Mach. A967) 14 № 1, 100—119. КоганМ.Н. [1] Динамика разреженных газов, «Наука», М., 1967. К о к с Д. Р., Смит У. Л. [1] Теория очередей, «Мир», М., 1966. [2] Теория восстановления, «Мир», М., 1967. Коксма, Салем (Koksma J. F., Salem R.) [1] Uniform distribution and Lebesque integration Acta Sci. Math. A950) 12, 87—96. К о л е м а н (Coleman W. A.) [1] Mathematical verification of a certain Monte Carlo sampling technique and applications of the technique to radiation transport problems, Nuclear Sci. and Eng. A968) 32, № l. Коллатц Л. [1] Численные методы решения дифференциальных уравнений, ИЛ, М., 1953. Кол могоро в А. Н. [1] Основные понятия теории вероятностей, ГОНТИ, М.— Л., 1936. [2] On tables of random numbers, Sankhya, Ser. A A963) 25, 369— 376. К о п а к о в В. Д. [1] Некоторые предельные теоремы для непараметрических оценок регрессии, IV Международная конференция по теории вероятн. и матем. статистике (Тезисы докладов) 1, Вильнюс, 1973, 325—328. КонюховскийВ. В. [1] Арифметическое моделирование процесса Пуассона (сб. работ ВЦ ЛГУ) A972) 18, 125-137. [2] Моделирование равномерного распределения (сб. работ ВЦ ЛГУ) A972) 18, 138—154. Коробов Н. М. [1] О некоторых вопросах равномерного распределения, Изв. АН СССР, сер. матем. A950) 14, 215-231. [2] Оценки тригонометрических сумм с вполне равномерно распределенными функциями, ДАН СССР A960) 133, № 5, 1011— 1014. [3] Теоретико-числовые методы в приближенном анализе, Физмат- гиз, М., 1963. [4] О некоторых вопросах теории диофантовых приближений, Успехи матем. наук A967) 22, вып. 3, 83—118. КофманА., КрюонР. [1] Массовое обслуживание, «Мир», М., 1965. Крамер Г. [1] Математические методы статистики, ИЛ, М., 1948. Кронмаль (Kronmal R.) [1] Evaluation of a pseudo-random normal number generator, J. of the Assoc. for Сотр. Mach. A964) 11, № 3, 357—363. ы л о в В. И. Приближенное вычисление интегралов, Физматгиз, М., 1959, Кры [1]
Куб [1] ЛИТЕРАТУРА (ОСНОВНАЯ) 427 К р ы л о в В. Ю. [1] Разностные схемы для уравнений параболического типа и континуальные интегралы (в кн. С. К. Г о д у н о в, В. С. Р я- бенький, Введение в теорию разностных схем, Физматгиз, М., 1962, 330-340). б и л ю с И. П., Л и н н и к Ю. В. Арифметическое моделирование броуновского движения, Изв. вузов A959) 6, 88—89. Курант, Фридерихс, Леви (Courant R., Friedrichs К., Lew у Н.) [11 Ober die partiellen Differenzengleichungen des mathematischen Physik, Math. Ann. A928) 100, 32—74. Куропатенко Э. С, О г и б и н В. Н. [1] Об одной схеме моделирования траекторий частиц в системах сложной геометрии, Журнал вычислит, матем. и матем. физики A968) 8, 212—216. Кутай А. К,, Файнштейн Г. 3. [1] Об оценке резко выделяющихся наблюдений, Измерительная техника A967) 1, 17—19. К э бэк (Kabak J. W.) [1] Stopping rules for quening simulation, Operat. Rew. A968) 16. № 2, 431—437. Леви (Levy P.) [1] Стохастические процессы и броуновское движение, «Наука», 1972. Левин (Levin M. J.) [1] Generation of a sampled Gaussian time series having a specified correlation function. JRE Trans. A960) 7, 545— 548. Л е в и т т (Levitt L. B.) [1] The use of self-optimized Exponential Biasing in obtaining Monte Carlo Estimates of Transmissing probabilities, Nucl. Sci and Eng. A968) 31, № 3, 500-504. Л е й п у н с к и й О. И. и др. [1] Распространение гамма-квантов в веществе, Физматгиз, М., 1960. Л е м а н Э. [1] Проверка статистических гипотез, «Наука», М., 1964. Л е м е р (Lehmer P. H.) [1] Mathematical methods in large-scale computing units, Ann. Сотр. Lab. Harvard University A951) 26, 141—146. Леонов В. П. [1J Некоторые применения старших семиинвариантов к теории стационарных случайных процессов, «Наука», М., 1964. Л и н н и к И. Ю. [1] Улучшение сходимости метода Монте-Карло в некоторых задачах массового обслуживания, Кибернетика A973), № 5, 129—132. Л и н н и к Ю. В. [1] Метод наименьших квадратов и основы теории обработки наблюдений, физматгиз, М., 1962.
428 ЛИТЕРАТУРА (ОСНОВНАЯ) Лисицын В. М., Юдаев А. В. 11] К вопросу решения систем Езелинейных алгебраических уравнений методом случайного поиска, Проблемы случайного поиска (сб.), № 1, «Зинатне», Рига A972), 155—166. Ляшенко Н. Н. [1] О моделировании броуновского движения суммами мультипликативных функций, ДАН СССР A973) 211, № 6, 1294— 1295. Майзель, И ю н ь о л и (Maisel H., Gnugnoli G.) [1] Simulation of discrete Stochastic Systems, Sci. Res. Assoc. Inc. A972), Chicago, Palo Alto ect. Майоров Л. В., Франк-Каменецкий А. Д. [1] Сравнительная эффективность различных оценок в методе Монте-Карло, Препринт ИАЭ им. И. В. Курчатова, М., 1969. Макларен, Марсалья (MacLaren M. D., Marsaglia G.) [1] Uniform random number generators, J. Assoc. Сотр. Mach. A965) 12, 1, 83-89. Маркович Г., Хауснер Б., Карр Б. [1] Симскрипт, Алгоритмический язык для моделирования, «Советское радио», М., 1966. Мартин (Martin F. F.) [1] Computer Modeling and Simulation. New York John Wiley and Sons, 1968. M a p ч у к Г. И. [1] Численные методы расчета ядерных реакторов, Атомиздат, М., 1958. Марчук Г. И., Ермаков СМ. [1] Метод Монте-Карло и методы вычислительной математики, Метод Монте-Карло в проблеме переноса излучения (сб.), Атомиздат, 1967. Марчук Г. И., Михайлов Г. А., Назаралиев М. А., Йарбинян Р. А. ] Решение прямых и некоторых обратных задач атмосферной оптики методом Монте-Карло, «Наука», Сибирское отд., Новосибирск, 1968. Маршалл (Marshall A. W.) [1] The use of multi-stage sampling schemes in Monte Carlo computations, Sympos. on Monte Carlo methods ed. H. A. Meyer, Wiley A956), 123—140. Мейер II.-A. [1] Вероятность и потенциалы, «Мир», М., 1973. Методы] Монте-Карло и их применения (Тезисы докладов на 2-м Всесоюзном совещании по методам Монте-Карло 20—25 октября 1969 г.), Тбилиси, 1969. Метрополи с, Улам (Metropolis N., Ulam S.) [1] The Monte Carlo method, J. Amer. Stat. Assoc. A949) 44, № 247, 335—341. M и р к и н Л. И., Рабинович М. А., Ярославски й Л. П. [1] Метод генерирования коррелированных гауссовских псевдослучайных чисел на ЭВМ, Журнал вычислит, матем. и матем. физики A972) 12, № 5, 1353—1357.
ЛИТЕРАТУРА (ОСНОВНАЯ) 429 Михайлов Г. А. [1] О моделировании случайных величин для одного класса законов распределения, Теор. вер. и ее прим. A965) 10, 4, 749—751. [2] К вопросу о построении экономичных алгоритмов моделирования случайных величин, Журнал вычислит, матем. и матем. физики A966) 6, № 6, 1134—1136. [3] О применении экспоненциального преобразования в расчетах прохождения частиц методом Монте-Карло, Метод Монте-Карло в проблеме переноса излучений (сб.), Атомиздат, 1967, 67—72. [4] Об одном принципе оптимизации расчетов по методу Монте- Карло, Журнал вычислит, матем. и матем. физики A968) 8, № 5, 1085—1093. [5] Использование асимптотических решений проблемы Милна в расчетах по методу Монте-Карло, Изв. вузов, Физика A968) 10, 76—79. [6] Об одном классе оценок по методу Мопте-Карло, Теория вероятностей и ее применения A970) 15, 1, 142—144. [7] Расчеты критических систем методом Монте-Карло, Журнал вычислит, матем. и матем. физики A966) 6, № 1, 71—80. [8] Метод моделирования длины свободного пробега частицы, Атомная энергия A970) 28 № 2, 175. [9] Новый алгоритм метода Монте-Карло для оценки максимального собственного значения интегрального оператора, ДАН СССР A970) 191, № 5, 993-996. [10] О сочетании метода конечных сумм с методом Монте-Карло для решения интегральных уравнений 2-го рода, Матем. заметки A971) 9, № 4, 425—434. [11] Некоторые замечания об использовании сопряженных решений для улучшения алгоритмов метода Монте-Карло, Исследование операций и статистическое моделирование (сб.), Изд-во ЛГУ A972), № 1, 112—118. [12] Некоторые вопросы теорпи метода Монте-Карло, «Наука», Новосибирск, 1974. Михайлов Г. А., НазараллиевМ. А. [1] Оптимизация оценки функциональных зависимостей методом Монте-Карло, Журнал вычислит, математики и математ. физики A970) 10, № 3, 734—740. Мишустин Б. А. [1] О решении задачи Дирихле для уравнения Лапласа методом статистических испытаний, Журнал вычислит, математики и математ. физики A967) 7, № 5, 1179—1187. Мортое (Morton К. W.) [1] A generalisation of antithetic variate techique for evaluating integrals, J. Math, and Phys. A957) 36, 289—293. Мюллер (Miiiler M. E.) [1] Some continuous Monte Carlo methods for the Dirichlet problem, Ann. of Math. Stat. A956) 27, № 3, 569—583. [2] A note on method for generating points uniformly on W-dimen- sional spheres, Communs Assoc. Math. A959) 2, № 4, 19—20. Надарая Э. A. [1] О непараметрических оценках плотности вероятности и регрессии. Теория вероятн. и ее прим. A965), 10, 1, 199—203.
430 ЛИТЕРАТУРА (ОСНОВНАЯ) [2] Об интегральной среднеквадратической ошибке некоторых Hei a- раметрических оценок плотности распределения, IV Международная конференция по теории вероятностей и "математической статистике (Тезисы докладов) 2, Вильнюс, 1973, 109—112. [3] О сходимости по норме L2 оценок плотности вероятности, Теория вероятностей и ее применения A973) 18, 4, 853—856. Найлор (Naylor Т. Н.) [1] Bibliography 19 simulation and Gaming, Computing Rev. A969) 10, № 1, 61—69. H а н с, Клауд (Nance R. E., Claude 0. J.) [1] Bibliography 29. A Bibliography on Random number generation, Сотр. Rev. A972) 13, № 10, 495—508. Натансон И. П. [1] Конструктивная теория функций, Гостехиздат, М.— Л., 1949. Неве Ж. [1] Математические основы теории вероятностей, «Мир», М., 1969. фон Нейман (von Neuman J.) [1] Various techniques used in connection with random digits. Monte Carlo method, Nath. Bur. Stand. Math. Series A951) 12, 36—38. Некруткин В. В. [1] Вычисление интегралов по пространству деревьев методом Монте-Карло, Методы Монте-Карло в вычислительной математике и математической физике (Сб.), Новосибирск,1974, 94—102. [2] Прямая и сопряженная схема Неймана — Улама для решения нелинейных интегральных уравнений, Журнал вычислит, матем. и матем. физики, A974) 14, № 6, 1409—1415. Н идеррейтер (Niederreiter H.) [1] On the distribution of pseudo-random numbers generated by the Linear Congruential Method, Math. Сотр. A972) 26, № 119. 793-795. Огибин В. Н. [1] О применении расщепления и «рулетки» в расчетах переноса частиц методом Монте-Карло, Метод Монте-Карло в проблеме переноса излучений (сб.), Атомиздат, 1967, 72—82. П а р з е н (Parzen E.) [1] On estimation of a probability density function and mode, Ann. Math. Stat. A962) 33, № 3, 1065-1076. Пауэлл, Свэнн (Powell M. J. D., Swann J.) [1] Weighted uniform sampling a Monte Carlo technique for reducing variance, J. Ins. Math. Appl. A966) 2, 228—236. Петровский И. Г. [1] Ober des Irfahrtproblem, Math. Ann. A934) 109, 425—444. Пиранашвили З. А. [1] К вопросу моделирования одного класса нестационарных случайных процессов, Вопросы исследования операций (сб.), «Мецниереба», Тбилиси, 1966. П о л л я к Ю. Г. [1] Вероятностное моделирование на электронных вычислительных'машинах, «Сов. радио» М., 1971. П о л я к Д. Г. [1] Оценка точности статистического моделирования систем массового обслуживания, Изв. АН СССР, Техн. кибернетика A970), № 1, 80.
ЛИТЕРАТУРА (ОСНОВНАЯ) 431 [2] Некоторые способы повышения точности статистического моделирования систем массового обслуживания, Изв. АН СССР, Техн. кибернетика A970), № 4, 75—85. Поляк Д. Г., РозентальГ. О. [1] О повышении точности статистического моделирования систем массового обслуживания, Автоматика и вычислит, техника A972), № 6, 54—58. П о с т н и к о в А. Г. [1] Арифметическое моделирование случайных процессов, Труды МИАН СССР A960) 57. [2] Эргодические вопросы теории сравнений и диофантовых приближений, Труды МИАН СССР A966) 82. П р о х о р о в 10. В. [1] Сходимость случайных процессов и предельпые теоремы теории вероятностей, Теория вероятностей и ее применения A956) 1, № 2, 177-238. Прохоров Ю. В., Р о з а п о в Ю. А. [1] Теория вероятностей. Основные понятия, предельные теоремы, случайные процессы, СМБ, «Наука», М , 1967. Пух (Pugh E. L.) [1] A gradient technique of adaptive Monte Carlo, SIAM Rev. A966) 8, № 3, 346—355. Пэлп, Винер (Paley R. E. A. C, Wiener N.) [1] Fourier transport in the compex domain, N. Y., 1934. Расстригав Л. А. [1] Статистические методы поиска, «Наука», М., 1968. Роббинс, Монро (Robbins H., Monro S.) 11] A stochastic approximation method, Ann. Math. Stat. A951) 22, 400-407. Розенберг (Rosenberg L.) [1] Bernstein polynomials and Monte Carlo integration, STAMJ. Numercal Analisys A967) 4, № 4, 566—577. Розенблат (Rosenblatt M.) [1] Remarks on some nonparametric estimates of a density function, Ann. Math. Stat. A956) 27, 3, 832—837. Романовский И. В. [1] О методах моделирования непрерывных случайных величин из вели щи с равномерным распределением, Методы вычислений (сб.), Изд-во ЛГУ, A966) 3, 113-121. Рот (Roth К. F.) [1] On inegulariti s of distribution, Mathematika A954) 1, № 2, 73—79. Рубинштейн Я. С. [1] Случайный поиск и процедура Дворецкого, Проблемы случайного поиска, № 1, «Зинатне», Рига A972), 59—64. Сакс (Sacks J.) [1] Asimptotic distribution of stochastic approximation procedures, Ann. of Math. Stat. A958) 29, 397—398. Сарымсаков Г. А. [1] Основы теории процессов Маркова, Гостехиздат, М., 1954. Сеге Г. [1] Ортогональные многочлены, Физматгиз, М., 1962.
432 ЛИТЕРАТУРА (ОСНОВНАЯ) СедуновЕ. В. [1] Обобщение задачи Бокса — Дрейпера в планировании регрессионных экспериментов, Заводская лаборатория A973), № 3, 308—314. Сизова А. Ф. [1] Оценка плотности делений в сферическом реакторе, Метод Монте-Карло в проблеме переноса излучен и и (сб.), Атомиз- дат, 1967, 228-231. Соболев С. Л. [1] О формулах механических кубатур па поверхности сферы, Сиб. матем. журнал A962) 3, № 5. [2] Лекции по теории кубатурных формул, 1964, 1—1965, II, Новосибирск. Соболь И. М. [1] Псевдослучайные числа для машины «Стрела», Теория вероятностей и ее применения A958) 3, № 2, 205—211. [2] Точная оценка погрешности многомерных квадратурных формул для функций классов Wx и #ь Журнал вычислит, матем. и матем. физики A961) 1, № 2, 208—216. [3] О вычислении бесконечномерных интегралов, Журнал вычислит, матем. и матем. физики A961) 1, № 5, 918—922. [4] Применение распределения со2 для оценки погрешности при вычислении интегралов методом Монте-Карло, Журнал вычислит, матем. и матем. физики A962) 2, № 4. [5] О периодах псевдослучайных последовательностей, Теория вероятностей и ее применения A964) 9, 2, 367—373. [6] Детерминистическая интерпретация критериев согласия и проверка псевдослучайных чисел, Препринт ИПМ АН СССР, М., [7] Многомерные квадратурные формулы и функции Хаара, «Наука» М., 1969. [8] Об одном подходе к вычислению многомерных интегралов. Вопросы вычислительной и прикладной математики (сб.) Ташкент A970) 38, 100-111. [9] Численные методы Монте-Карло, «Наука», М., 1973. Спанье Дж., Гелбард Э. [1] Метод Монте-Карло и задачи переноса нейтронов, Атомиздат, М., 1972. Срагович В. Г. [1] Моделирование некоторых классов случайных процессов, Журнал вычислит, матем. и матем. физики A963) 3, № 3, 586—593. Стар, Пейдж (Star О., Page А. С. С.) [1] Feasibility Financial studies of a Port installation, Oper. Res. Quarterly A961) 12, № 3. Старченко Л. П. [1] О построении последовательностей, совместно нормальных с данной, Изв. АН СССР, сер. матем. A958) 22, 357—370. [2] Исправления к работе «О построении последовательностей, совместно нормальных сданной», Изв. АН СССР, сер. матем. A959) 23, 635-636.
ЛИТЕРАТУРА (ОСНОВНАЯ) 433 Стратонович Р. Л. [1] Об оптимальных алгоритмах типа стохастической аппрокси- Яации, Изв. АН СССР, Техн. кибернетика A970) № 1, 24—32. С ю (Hsu L. С.) [ 1 ] A general approximation method of evaluating multiple integrals, Tohoku math. J. A957) 9, № 1, 45—55. Таусски, Тодд (Taussky О., Todd J.) [1] Generation and Testing of pseudo-random numbers. Sympos. on Monte Carlo Methods, ed. H. A. Meyer, Wiley, N. Y. A956), 15—28. Тёрн (Torn A.) [1] Crude Monte Carlo quadrature in infinite variance case and central limit theorem, Nord. Tidscr. Information Behandl. A966) 6, № 4, 339-346. T и п п е т (Tippet L. H. C.) [1] Random sampling numbers, Tracts for Сотр., Cambr., 1927, 15. Ткаченко П. Н., К у ц е в Л. Н., Мещеряков Т. А., Ч а в к и н А. М., Чебыкин А. Д. [1] Математические модели боевых действий, «Сов. радио», М., 1969. Т с у д a (Tsuda Т.) [1] Numerical Integration of function of very many variables, Numerische Math. A973) 20, № 4, 377-391. [2] Numerical differentiation of functions of very many variables, Numerische Math. A972) 18, № 4, 327-335. Тсуда, Ишида (Tsuda Т., Ichida К.) [1] Nonlinear interpolation of multivariable functions by The Monte Carlo method, J. Assoc. Сотр. Mach. A970) 17, № 3, 420-425. Тсуда, К и о н о (Tsuda Т., Kiyono Т.) [1] Application of the Monte Carlo method to systems of nonlinear algebraic equations, Numerische Mathematic A964) 6, 59—67. У а й л д Д. Дж. [1] Методы поиска экстремума, «Наука», М., 1967. У и л к с С. [1] Математическая статистика, «Наука», М., 1967. У и н н (Wynn H. Р.) [1] The sequential generation of D-optimum experimental designs, Ann. Math. Stat. A970), 41, № 5, 1655—1664. Фаддеев Д. К., ФаддееваВ. Н. [1] Вычислительные методы линейной алгебры, Физматгиз, М., 1960. Фан Ц з ы (Fan К.) [1] Generalisation of Alouglu Bourbaki-theorem, Math. Zeitschr. A965) 88, № 1, 48—60. ФаноУ., С п е н с е р Л., Б е р г е р М. [1] Перенос ^-излучения, Госатомиздат, М., 1963. Федоров В. В. [1] Теория оптимального эксперимента, «Наука», М., 1971. Ф е л л е р В. [1] Введение в теорию вероятностей и ее приложения, «Мир», М.т 1964. 1Д15 С М. Ермаков
Фра [1] 434 ЛИТЕРАТУРА (ОСНОВНАЯ) Филипс, Винер (Philips, Wiener N.) [1] Nets and Dirichlet problem, J. Math. Phys. A923) 2, 105—124. Ф и н н и Д. Дж. Jl] Введение в теорию планирования эксперимента, «Наука», М., 1970. Фишер М. [1] Природа критического состояния, «Мир», М., 1968. Ф и ш м а н (Fishman G. S.) [1] Concepts and methods in discrete event digital simulation. John Wiley & Sons, N. Y., 1973. Флек (Fleck J. A.) [1] The calculation of nonlinear radiation transport by a Monte Carlo Method, Methods of Сотр. Phys. A963) 1, 43—65. Форсайт, Ляйблер (Forsitlie G. E., Leibler R. Z.) [1] Matrix inversion by a Monte Carlo methods. Math, tables and other aids to сотр. A950) 4, 127—129. а н к л и н (Franclin J. N.) Deterministic simulation of random processes, Math. Сотр. A963) 17, 28—59. [2] Numerical simulation of stationary and nonstationary Gaussian random processes, SIAM Rev. A965) 7, 1, 68—80. Фролов А. С. [1] Решение интегральных уравнений теории переноса методом статистических испытаний, Диссертация МИ АН СССР, М., 1963. Ф р о л о в А. С, Ч е н ц о в Н. Н. [1] О вычислении методом Монте-Карло" определенных интегралов, зависящих от параметров, Журнал вычислит, матем. и матем. физики A962) 2, № 4, 714—717. [2] Использование зависимых испытаний в методе Монте-Карло для получения гладких кривых, Труды IV Всесоюзного совещания по теории вероятностей и матем. статистике. Гос. изд-во полит, и науч. лит-ры Литовской ССР, Вильнюс, 1962, 425—437. [3] Решение трех типичных задач теории переноса методом Монте- • Карло, Метод Монте-Карло в проблеме переноса излучений (сб.), Атомиздат, М., 1967, 25—52. X а б е р (Haber S.) [1] A combination of Monte Carlo and classical methods for evaluating multiple integrals, Bull. Amer. Math. Soc. A968) 74, 683-686. '[2] Stochastic quadrature formulas, Math. Сотр. A969) 23, 751 — 764. 1Хаджи-Шейх, Спарроу (Haji-Sheikh A., Sparrow E. M.) [1] The floating random walk and its application to Monte Carlo solutions o! heat equations, SIAM J. Appl. Math. A966) 14, №2, 370—389. Лам ме рели (Hammersley J. M.) [1] Monte Carlo methods for solving multivariable problems, Ann. New York Acad. Sci. A960) 86, 844—874. Хаммерсли, Мортон (Hammersley J M., Morton K. W.) [1] A new Monte Carlo technique-antithetic variates, Proc. Cambr. Phil Soc. A956) 52. /,/,9-474.
ЛИТЕРАТУРА (ОСНОВНАЯ) 435 Хаммерсли, Хэндскомб (Hammersley J. M., Hands- comb D. С.) [1] Monte Carlo methods, London — N.Y., 1964. Хеннан Э. fl] Анализ временных рядов, «Наука», М., 1964. [2] Многомерные временные ряды, «Мир», М., 1974. Хикс, Смит (Hicks В. L., Smith M. А.) [1] On the accuracy of Monte Carlo solutions of the nonlinear Boltz- man equations, J. Сотр. Phis. A968) 3, 58—79. Хикс, Уилинг (Hicks J. S., Wheeling R. E.) [1] A efficient method for generating uniformly distributed points on the surface of an ^-dimensional sphere., Comm. Assoc. Compc Mach. A959) 2, № 1, 17—19. Хисамутдинов А. И. [1] Об эффективности метода математических ожиданий для задач одного класса, Журнал вычислительной математики и математической физики A967) 7, № 4, 946— 953. [2] Оценка функционала от решения сопряженного уравнения переноса методом Монте-Карло, Журнал вычислит, матем. и матем. физики A968) 8, № 2, 467—471. [3] «Единичный» класс оценок для вычисления но методу Монте-Карло функционалов от решения интегрального уравнения 2-го рода, Журнал вычислительной математики и математической физики A970) 10, № 5, 1269— 1280. [4] Оценки «единичного» класса с минимальной дисперсией, Вероятностные методы решения задачи математической физики (сб.), Новосибирск, A971) 184—210. [5] Оценки с минимальными абсолютными моментами для вычисления методом Монте-Карло суммы ряда Неймана, ДАН СССР A973) 212, № 2, 308—311. Холл (Hall A.) [1] On an experiment determination of я, Messeng. Math. A873) 2, 113—114. X о л т о н (Halton J. H.) [1] On the efficiency of certain quasi-random sequences of points in evaluating multidimensional integrals, Numerische Math. A960) 2, 84—90 and corrigenda p. 196. [2] Sequential Monte Carlo, Proc. Cambr. Phil. Soc. A962) 58, 1, 57-78. [3] A retrospective and prospective survey of the Monte Carlo method, SIAM Rev. A970) 12, № 1, 1_63. Хорофас Д. Н. [1] Системы и моделирование, «Мир», М., 1967. X о ш и н о, Ишида (Hoshino S., Ichida К.) [11 Solution of Partial Differential Equations by a Modified Random Walk, Numer. Math. A971) 18, № 1, 61—72. Хэвиленд Дж. К. [1J Решение двух задач о молекулярном течении методом Монте- Карло (сб. «Вычислительные методы в динамике разреженных газов»), «Мир», М., 1969, 7—115 15*
436 ЛИТЕРАТУРА (ОСНОВНАЯ) Хэвиленд, Левин, Триллинг (Haviland J. К., La- vin M. L., Trilling) [1] Application of the Monte Carlo method to rarified gas flows, Fluid Dinamics Trans, A964) 1, Pergamon press, 279—286. Хэндскомб (Handscomb D. C.) [1] Remarks on a Monte Carlo integration method, Numerische Math. A964) 6, № 4, 261-268. Ц и г л е р И., Хелмберг Г. [1] Новейшее развитие теории равномерного распределения, Математика, ИЛ A963) 7, 3, 3—46. Чавчанидзе В. В. [1] Метод случайных испытаний (метод Монте-Карло), Труды ин- та физики АН Груз. ССР A955) 3, 105. [2] Применение метода случайных испытаний к расчету внутриядерного каскада, Изв. АН СССР, сер. физ. A955) 19, № 6, 629—638. Ч емпернуон (Champernowne О. G.) [1] The construction of the decimals normal in the scale of ten, J. London Math. Soc. A933) 8, 254—260. 4 e н ц о в Н. Н. [1] О квадратурных формулах для функций бесконечно большого числа переменных, Журнал вычислительной математики и математической физики [1961] 1, № 3, 418— 424. [2] Псевдослучайные числа для моделирования марковских цепей, Журнал вычислит, матем. и матем. физики A967) 7, № 3, 632—643. [3] Оценка неизвестной плотности распределения по наблюдениям, ДАН СССР A962) 147, 1, 45-48. [4] Статистические решающие правила и оптимальные выводы, «Наука», М., 1972. ill а л а е в с к и й О. В. |1] Проблема распределения наблюдений в полиномиальной регрессии, Труды МИАН СССР A965) 79, 132—149. Ш апиро-Пятецкий И. И. [1] О законах распределения дробных долей показательной функции, Изв. АН СССР, сер. матем. A951) 15, 47—52. III а р ы г и н И. Ф. [1] Оценки снизу погрешности квадратурных формул на классах функций, Журнал вычислит, матем. и матем. физики A963) 3, № 2, 370-376. III е ф ф е X. [1] Дисперсионный анализ, Физматгиз, М., 1963. Ш и л о в Г. Е., Ф а н Д ы к Т и н ь. [1] Интеграл, мера и производная на линейных пространствах, «Наука», М., 1967. Шпепс-Шнеппе М. А. [1] Статистическое моделирование телефонных систем коммутации, Вероятностные задачи о структурно-сложных системах коммутации (сб.), «Наука», М., 1969, 5—26.
ЛИТЕРАТУРА (ОСНОВНАЯ) 437 [2] О приложении метода вложенных цепей Маркова к моделированию систем массового обслуживания с потерями, Уч. зап. Латв. гос. ун-та им. П. Стучки. A969) 47, 261—274. Шнепс-ШнеппеМ.А., ИнауниексЭ. А. [1] Исследование точности оценок вероятности потерь в однолинейной системе, Латв. матем. ежегодник A969), 187—206. Шнепс-Шнеппе М. А., Школьный Е. И. [1] О точности статистического моделирования СМО, описываемых полумарковскими процессами размножения и гибели, Изв. АН СССР, Техн. кибернетика A973) 5, 60—65. Шойер, Столлер (Sheuer E. M., Stoller D. S.) [1] On the generation of normal random vectors, Technometrics A962) 4, № 2, 278-281. Шрейдер Ю. A. [1] Метод статистических проб (Монте-Карло) и его использование в цифровых машинах, Приборостроение A955), № 7, Шур (Shur J.) [1] Ober die Verteilung der Wurzeln bei gewissen algebraischen Gleichungen mit ganzzahligen Koefficienten, Math. Zeit. A918) 1, 373-385. Э в а н с (Evans О. Н.) [1] Applied multiplex sampling, Technometrics A963) 5, № 3, 341 — Эсманжо-Боннардель (Esmenjaud-Bonnardel M.) [1] Un procede de generation de nomblres «Pseudo-aleatoires» pour Cab 500, Revue France, de Traitement de rinformation-Chif- fres A964) 7, 3, 185-197. 10 н к о з a (Juncosa M. L.) [1] Random number generation on the BRL high-speed computing machines. Ballistic Research Lab., Report 855 A953), Aberdeen Prov. Ground. Я н с с о н (Jansson В.) [1] Random Number generators, Stocholm, 1966.
ЛИТЕРАТУРА (дополнительная) Список дополнительной литературы содержит работы, относящиеся в основном к 1970—1974 гг. Он не претендует на охват всех работ, связанных с методом Монте-Карло и в особенности с его приложениями за указанный период. Так, библиография к главе второй не содержит работ, посвященных физическим датчикам случайных чисел, но достаточно полно отражает алгоритмы и программы моделирования распределений. Библиография к главе 3 составлена так, чтобы по возможности охватить круг приложений, но она в особенности далека от полноты. За редкими исключениями, список дополнительной литературы не содержит работ, указанных в библиографиях, составленных Нансом и Клаудом [1] и Найлором [1] (см. основной список литературы). Указанные источники могут служить хорошим дополнением к библиографии, помещенной в данной книге. К главе 2 Равномерно распределенные псевдослучайные последовательности АнтиповМ. В. К оценке датчика псевдослучайных чисел. В сб. «Вычисл. системы», Новосибирск A970), вып. 42, 81—88. Байер, Руф, Вильямсон (Beyer W. A., Roof R. В., Williamson D.) The lattice structure of multiplicative conquental pseudorandom vectors, Math. Сотр. A971) 25, № 114, 345—363. Барра (Barra J. R.) Controle statistique des suites de nombres «au hasard». «Rev. statist, appl.» A971) 19, № 3, 19—26. Бергер (Berger A.) Die Priiiung rechnerisch erzeugbarer Pseudo-zufallszahlen- folgen. «Wiss. Z. Martin—Luther—Univ. Halle — Wittenberg. Math.-naturwiss. R.», A970) 19, № 2, 39—51. В у д (Wood W. W.) Monte Carlo calculations for hard disks in the isothermal — isobaric ensemble. J. Chem. Phys. A968) 48, 1, 415—434. Арубе (Grube A.) Mehrfach rekursiv-erzeugte Pseudo-Zufallszahlen. «Z. angew. Math. undMech.» A973) 53, № 4, T223 — T225.
ЛИТЕРАТУРА (ДОПОЛНИТЕЛЬНАЯ) 439 Гуд, Госкино (Good I. J., Goskins R. A.) Some relationships satisfied by additive and multiplicative recurrent congruential sequences, with implications for pseudorandom number generation. Сотр. number theory, edited by A. 0. Atkin and B. J. Birch, Acad. press. A971), 127-136. Гудмен, Густавсон, Люисп, Линигер, Миллер (Goodman A. S., Gustavson F. S., Lewisp A. W., Liniger W., Miller I. M.) Pseudo-random number generator. IBM Technical disclosure bulletin A970) 13, 920. Дитер (Dieter U.) 1. Pseudo-random numbers: the exact distribution of pairs. Mathematics of computation A971) 25, № 116, 855—883. 2. Statistical independence of pseudo-random numbers generated by the linear congruential method, Proc. Sympos. on Applications of Number Theory to Numerical Analysis (Montreal, 1971) Academic Press N.-Y. A972). Дитер, Арене (Dieter U., Ahrens I.) An exact determination of serial correlations of pseudo-random numbers. «Numer. Math.» A971) 17, № 2, 101 — 123. К о в ь ю (Coveyou R. R.) Random number generation is too important to be left to chance. Studies in Appl. Math. A969) 3, 70—111. Крал (Krai J.) 1. A new additive pseudo—random number generator for extremely short word—lengths. «Jnf. Process. Left.» A972) 1,№4, 164—167. 2. A note on generation of sequences of pseudo-random number with prescribed autocorrelation coefficients. «Kybernetika» A972) 8, № 6, 485-489. Маритзас (Maritsas D. G.) A high speed and accuracy digital Gaussian generator of pseudorandom numbers. «IEEE Trans. Comput.» A973) 22, № 7, 629-634. Марсалья (Marsaglia G.) 1. Random numbers fall mainly in the planes, Proc. Nath. Acad. Sci. (USA) A968) 61, 25—28. 2. Random variables with independent binary digits. «Ann. Math. Stat.» A971) 42, № 6, 1922—1929. Нидерейтер (Niederreiter H.) On the distribution of Pseudo-random numbers generated by the Linear Congruential Method, Math. Сотр. A972) 26, № 119, 793-795. Олшевский (Olszewski Т.) Digital computer conversion of pseudo-random numbers with uniform distribution into numbers with a predetermined arbitrary distribution. Prace przemyslowego instytutu telekomu- nikacje A971) 21, № 72, 51—55. П л e x а т ы й М. И., Голубев Е. A. Комбинаторные методы построения псевдослучайных последовательностей. В сб. «Вопр. кибернетики», М., 1973, 120—129.
440 ЛИТЕРАТУРА (ДОПОЛНИТЕЛЬНАЯ) П о л л я к Ю. Г. Об анализе псевдослучайных чисел, Автомат, и вычислит, техника A968), № 5, 31—35. Попов Б. А. Один способ получения равномерно распределенных псевдослучайных чисел на ЭЦВМ. «Отбор и передача информ. Респ. межвед. сб.», 1971, вып. 27, 30—33. Смит (Smith С. S.) Multiplicative pseudo-random number generators with prime modulus. J. Assoc. Comput. Mach. A971) 18, № 4, 586—593. Соболь И. М. Три замечания о проверке псевдослучайных чисел. В сб. «Методы Монте-Карло и их применения», Тезисы докладов на 2-м Всесоюзном совещании по методам Монте-Карло, 20—25 октября 1969 г., Изд-во ИК АН ГССР, Тбилиси, 1969, 183. Стоунхэм (Stoneham R. G.) On a new class of multiplicative pseudo-random number generators. Nordisk tidskrift for informations-behandling. A970) 10, № 4, 481-500. Тутилл, Робинсон, Адаме (Tootill I. P. R., Robinson W. D., Adams A. G.) The runs up-and-down performance of Tausworthe pseudorandom number generators. J. Assoc. Comput. Mach. A971) 18, № 3, 381—399. Уитлеси, Гизе (Whittlesey R. В., Giese R. P.) Multi-dimensional pseudorandom nonuniformity, «Proc. UMR-Mervin J. Kelly Communs Conf., Rolla, Mv.» A970) New York, N. Y., 1970, 15-4 A-15—4) 6. Франке (Franke E.) Anmerkungen zur Erzeugung von Zufallszahlen. «Wiss. Z. Ho- chsch. Archit. und Bauwesen Weimar» A970) 17, № 2, 131—132. Хванг, Лин (Hwang F. K., Lin S.) On generating a random sequence. «J. Appl. Probab.» A971) 8, № 2, 366—373. Хейвел, Недома, Прибыл (Havel J., Nedoma P., Pri- byl V.) Random sequences of true-random and pseudo-random type and some methods of their mixing. «Ekon.-mat. obz.» A972) 8, № 1, 58-77. Псевдослучайные последовательности с заданным законом распределения АнтиповМ. В. О моделировании некоторых случайных величин, «Автометрия» A973), № 2, 74—78. Арене, Дитер (Ahrens J. H., Dieter U.) 1. Computer methods for sampling from the exponential and normal distributions, Comm. Assoc. Сотр. Mach. A972) 15, № 10, 873-882.
ЛИТЕРАТУРА (ДОПОЛНИТЕЛЬНАЯ) 441 2. Extensions of Forsythe's Method for Random Sampling from the Normal Distribution, Mathem. of Сотр. A973) 27, № 124, 927— 937. 3. Neuere Methoden zur Erzeugung von nichtgleichverteilten Zu- fallsvarieblen, Z. angew. Math, und Mech. A973) 53, № 4, 221 — 223. БережновВ. И., Горский Л. К., Короленок В. Г. Алгоритм получения последовательности псевдослучайных чисел с разными законами распределения. В сб. «Алгоритмы и программы случайного поиска», «Зинатне», Рига, 1969. Б р а й м е н (Breiman L.) A useful approximation to the normal distribution function with application to simulation. Technometrics. A967) 9, № 4. 647—651. Б у p p (Burr I. W.) A useful approximation of the normal distribution function with application to simulation. Technometrics A967) 9, № 4, 647-651. В а л и е в Т. А., Драголюбова И. В. О моделировании псевдослучайных чисел с некоторыми специальными законами распределения. В сб. «Вопросы кибернетики и вычислит, матем.», вып. 13, «Фан», Ташкент, 1967, 94—101. Г е р м а н В. А., Соболь И. М. Об использовании поверхностей постоянной плотности при моделировании многомерных случайных величин, Журнал вычислит, матем. и матем. физики A971) И, № 3, 789—791. Густавсон, Линигер (Gustavson F. G., Liniger W.) A fast random number generator with good statistical properties. Сотр. A970) 6, № 3—4, 221—226. Д и л л а р д (Dillard G. Н.) Generating random numbers having probability distribution occuring in signal detection problems. IEEE Trans. Inform. Theory, 13 A967), № 4, 616-617. Дитер, Арене (Dieter U., Ahrens I. H.) A combinatorial method for the Generation of Normally distributed random numbers, Computing A973) 11, № 2, 137—146. Добролюбов Л. В., ЛикаревВ. А., П о п о в Д. И., Датчик нормальных псевдослучайных чисел, основанный на обращении функции распределения, Алгоритмы и алгоритмические языки, Вып. 4, ВЦ АН СССР М., 1969, 87—94. Ж е п (Szep A.) Some remark on random number transformation. Stud. Sci. math, hung., A971) 6, № 3-4, 393-397. Зорилеску (Zorilescu D.) Constructii de siruri de numere pseudoaleatoare corelate, ur- mind functii de repartitie date. An. Univ. Bucuresti. Mat.- mec. A972) 21, № 1, 137-145. Кеначчи, Де Матье (Cenacci G., de Matteis A.) Pseudo-Random numbers for comparative Monte Carlo calculations. Numer. Math. A970) 16, 11-15. 16 G.M. Ермаков
442 ЛИТЕРАТУРА (ДОПОЛНИТЕЛЬНАЯ) Кондюрин Ю. Н. О моделировании случайных величии методом суперпозиций, Журнал вычислит, матем. и матем. физики A970) 10, № 1, 262—266. Кудинов В. П. Генерирование псевдослучайных чисел с заданным законом распределения на ЭЦВМ, Сб. науч. тр. Н.-и и проектн. ин-т по обогащ. и агломер. руд черн. мет., 1971, вып. 12, 36-40. М а х о т к и н О. А. Численное исследование процедур моделирования нормального и показательного распределений. В сб. «Вероятности, методы решения задач матем. физ.», Новосибирск A971), 165—172. Нив (Neave H. R.) On using the Box-Miiller transformation with multiplicative congruential pseudo-random number generators, Appl. Statist. A973) 22, № 1, 92—97. П о л л я к Ю. Г. 1. Об экономичных алгоритмах моделирования случайных величин, Журнал вычислит, матем. и матем. физики A966) 6, № 6, 1134. 2. О моделировании случайных величин, связанных со схемой независимых испытаний. «Изв. АН СССР, Техн. кибернетика» A968), № 1, 201—202. П о л я к о в Ю. А., Бирюкова-Савичева Н. В., Королев О. И. Датчик случайных чисел с заданным законом распределения. «Тр. Моск. ин-т нефтехим. и газ. пром-ти» A971), вып. 92, 325—330. Реллес (Relies D. А.) A simple algorithm for generating binomial random variables when N is large. «J. Amer. Statist. Assoc.» A972) 67, № 339, 612-613. P о з и н С. Г., Р о з и н а К. А., X о м с к и й Л. X. Об одном способе моделирования экспоненциального закона распределения, Журнал вычислит, матем. и матем. физики A973) 13, № 2, 503-509. Рошаль А. С. Датчики псевдослучайных чисел с нормальным и пуассо- новским распределением. В сб. «Инж.-мат. методы в физике и кибернетике», Вып. 2, Атомиздат, М., 1973, 153— 156. Фратила (Fratila E.) Metoda Monte-Carlo in evaluarea functiei densitate de probabilitate a unei variabile aleatoare. «Stud. Univ. Babes — Bolyai. Ser. math.-mech.» A970) 15, № 2, 27—32. Хаан, Барфильд (Haan С. Т., Barfield В. J.) Data simulation from probability distributions. «Trans. ASAE», A973) 16, № 2, 374—377.
ЛИТЕРАТУРА (ДОПОЛНИТЕЛЬНАЯ) 443 Моделирование случайных процессов Акимов П. П., Городецкий Ю. М., Шукурьян СИ. О моделировании гауссовых случайных последовательностей на ЦВМ, Автоматика и Телемеханика A968), № 11, 45—50. Быков В. В. 1. Алгоритмы для цифрового моделирования некоторых типов стационарных нормальных случайных процессов, «Электросвязь» A967), № 9. 2. Некоторые вопросы цифрового моделирования случайных полей. В сб. «Методы представления и аппаратурный анализ случайных процессов и полей», Тр. II Всевозможного симпозиума, т. II, Изд-во Сиб. Гос. НИИ метрологии, Новосибирск, 1969, 113—119. Вошврда Милослав. Генерирование случайного процесса с помощью авторегрессионных схем. В сб. «Стат. пробл. упр.», Вильнюс, 1973, вып. 4, 148—162. ГольдштейнВ. Г., Черновой Б. М. Об одном способе моделирования случайного вектора, «Изв. Сиб. отд. АН СССР» A973), № 13, сер. техн. п., вып. 3, 153— 154. Долгополов В. Н., Гондарев В. П., Панов Д. Н., К о с т о р н и ч е п к о В. Г., Ф е д о р е н к о И. Н. Генератор нормальных дискретных случайных процессов с заданной функцией корреляции. В сб. «Регпональн. научн.- техп. семинар по стат. анализу, моде лир. и автоматизации контроля объектов с конструктивно сложной структурой», Таганрог, 1971, вып. 3, 13—21. Конторович В. Я., Ляндрес В. 3. Вопросы моделирования случайных процессов с заданными статистическими характеристиками. В сб. «Материалы I Все- союзн. коиф. «Теория и практ. измерений стат. (вероятности.) характеристик», 1972, Л., 1973, 67—70. Малкина Л. А. Реализация случайных процессов с заданными корреляционными функциями, В сб. «Матем. методы решения экон. задач», № 3, «Наука», М., 1972, 157—165. Мартин, Шерф (Martin R. D., Scharf Louis L.) Simulation of processes with nonseparable covariances. «JEEE Trans. Automat. Contr.» A973) 18, № 5, 546—547. Носков В. Ф. Моделирование на ЦВМ стационарного нормального случайного процесса с дробно-рациональной спектральной плотностью. «Докл. Всесоюзп. объеднн. межвуз конф. по фпз. модели р. (VI) и кибернст. энерг. систем (II) 1972». Секция постановки и обработки модельн. эксперимента, Баку, 1972, 128—133. A п р а и а ш в и л и 3. А. Некоторые вопросы статистико-вероятностнол о моделирования непрерывных случайных процессов. В сб. «Вопросы исследования операций». Изд-во «Мецниереба». Тбилиси, 1966, 53. 16*
444 Литература (Дополнительная) П о л л я к Ю. Г. Моделирование последовательности неравностоящих по времени выборок из гауссового случайного процесса, Изв. АН СССР, Техн. Кибернетика A969), № 1, 50—56. Растригин Л. А. Дискретное моделирование непрерывных случайных процессов. Докл. V межвузовской конференции по физическому и математическому моделированию, секция «Математические вопросы вероятностного и кибернетического моделирования», МЭИ, 1968, 77-82. Ров, К е р р (Rowe I. Н., Кегг М.) A broad-spectrum pseudorandom Gaussian noise generator, «IEEE Trans. Autom. Contr.» A970) 15, № 5, 529—535. Ш е п п а р д (Sheppard С W.) Computer simulation of stochastic processes through model- sampling (Monte Carlo) techniques. FEBS Letters A969) 2, Suppl., 14-21. Шкловер М. Д. О моделировании одного класса случайных полей, Теория вероятностей и ее применения A973) 18, № 2, 425— 427. Шкурский Б. И. Метод математического моделирования двумерных случайных полей, Изв. АН СССР, Техн. кибернетика A969), № 6, 141. Алгоритмы и программы для ЭВМ Б ат л е р (Butler E. L.) Algorithm 370, general random number generator [G5]. Comm. Assoc. Сотр. Mach. A972) 13, 49—52. Белл (Bell I. R.) Algorithm 334: normal random deviates. Comm. Assoc. Сотр. Mach. A968) 11, № 7, 498; A969) 12, № 5, 281. Б е р е н ц (Behrenz P. G.) Algorithm 133: random Comm. Assoc. Сотр. Mach. A962) 5 A1), 553. Грозенбаух (Grosenbaugh L. R.) More on fortran random generator (short communication), Comm. Assoc. Сотр. Mach. A969) 12, № 11, 639. Джордж (George R.) 1. Algorithm 200; normal random. Comm. Assoc. Сотр. Mach. A965) 8, № 9, 559. 2. Algorithm 200. Normal random. Comm. Assoc. Сотр. Mach. A963) 6, № 8, 444. К н о п (Knop R.) 1. Algorithm 384; normal random deviates. Comm. Assoc. Сотр. Mach. A969) 12, № 5, 281. 2. Algorithm 381; random vectors uniform in solid angle, Comm. Assoc. Сотр. Mach. A970) 13, № 5, 326. 3. Algorithm 381; random vectors uniform in solid angle, Comm. Assoc. Сотр. Mach. A972) 15, № 6, 468.
ЛИТЕРАТУРА (ДОПОЛНИТЕЛЬНАЯ) 445 Конеиев В. Н., Никитин О. Р. Формирование последовательностей псевдослучайных чисел на ЭВМ «Проминь», «Сб. науч. тр. Иванов, энерг. ин-т», 1973, вып. 26, 52—55. Кучеренко В. Е. Датчики псевдослучайных чисел для ЭВМ «Сетунь», Труды ВНИИКАНЕФТЕГАЗ, вып. 2, Автоматизация технологических процессов, Изд-во «Недра» 1968, 168. Левис, Гудман, Миллер (Lewis P. A. W., Goodman A. S., Miller I. M.) A pseudo-random number generator for the system 360, IBM system I. A969) 8, № 2, 136—146. M а т io ш к о в Л. П. Получение псевдослучайных величин с равномерным, нормальным и экспоненциальным законами распределения на ЭВМ «Минск-2», Вычисл. техн. в машиностр. Научн.-техн. сб., 1965, вып. 1, 29—37. Новаковский (Nowakowski A.) Generator of pseudo-random numbers for the Odra 1204 computer. Prace przemyslowego instytuta telekomunikacji A971) 21, № 72, 57-58. П а й к (Pike M. C.) 1. Algorithm 267: Random normal deviates. Comm. Assoc. Сотр. Mach. A965) 8, № 10, 606. 2. Certification of algorithm 200: Normal random. Comm. Assoc. Сотр. Mach. A965) 8, № 9, 556. Пайк, Хилл (Pike Т. С, Hill I. D.) 1. Algorithm 266: Pseudo-random numbers, Comm. Assoc. Сотр. Mach. A965) 8, № 10, 605—606. 2. Algorithm 266: Pseudo-random numbers, Comm. Assoc. Сотр. Mach. A966) 9, № 9, 687. П е й н (Payne W. H.) Fortran tausworthe pseudorandom number generator (short communication). Comm. Assoc. Сотр. Mach. A970) 13, № 1, 57. Пейн, Рабунь, Богьё (Payne W. HM Rabung I. R., Bo- gyo T. P.) Coding the Lehmer Pseudorandom Number Generator, Com- mun. Assoc. Сотр. Mach. A969) 12, № 2, 85. П р о л л (Proll L. G.) Remark on algorithm 370 [G5]. General random number generators. Comm. Assoc. Сотр. Mach. A972) 15, № 6, 467— 468. П у p (Poore I. H.) Certification of algorithm 133: Random. Comm. Assoc. Сотр. Mach. A963) 6, № 4, 167. Редер, Рабиыер, Шафер (Rader С. М., Rabin L. R., Schafer R. W.) A fast method of generating digital random numbers. «Bell Syst. Techn. J.» A970) 49, № 9, 2303—2310. С е р а ф и н (Seraphin D. S.) A fast random number generator for IBM 360. Comm. Assoc. Сотр. Mach. A969) 12, № 12, 695.
446 ЛИТЕРАТУРА (ДОПОЛНИТЕЛЬНАЯ) Сноу (Snow R. Н.) Algorithm 342; generator of random numbers satisfying the poisson distribution. Comm. Assoc. Сотр. Mach. A968) 11, № 12, 819-820. С т р о м (Strome W. M.) Algorithm 294: uniform random. Comm. Assoc. Сотр. Mach. A967) 10, № 1, 40. С у л л и н с (Sullins W. L.) Certification of algorithm 266 [G5]. Psoudo-random numbers. Comm. Assoc. Сотр. Mach. A972) 15, № 12, 1072—1073. Федорченко В. Е. Моделирование равномерных псевдослучайных чисел на машине «Сетунь», сер. «Математическое обслуживание машины «Сетунь», вып. 15, Изд-во МГУ, 1966. Ф е л ь д е р (Felder H.) The GPSS/360 random number generator. Second conierence on application of simulation. Inst. Electrical and electronics Eng. A968), 21—28. X а н с с о н (Hansson L.) Remark on algorithm 266 G5. Pseudo-random numbers, Comm. Assoc. Сотр. Mach. A966) 9, № 9, 687. Харст, Кноп (Hurst R. L., Knop. R. E.) Algorithm 425: generation of random correlated normal variables. [G5]. Comm. Assoc. Сотр. Mach. A972) 15, № 5 355—357. Хеммерли (Hemmerle W. I.) Generating pseudorandom numbers on a two's complement machine such as the IBM 360. Comm. Assoc. Сотр. Mach. A969) 12, № 7, 382—383. Холтон, Смит (Halton J. H., Smith G. B.) Algorithm 247: radical-inverse quasi-random point sequence [G5], Comm. Assoc. Сотр. Mach. A964) 7, 701-702. Шафер (Shafer D.) 1. Algorithm 121; Normdev, Comm. Assoc. Сотр. Mach., A962), 5, № 9, 482. 2. Algorithm 121; Normdev, Comm. Assoc. Сотр. Mach., A965) 8, № 9, 556. Шеффер (Schaffer H. E.) Algorithm 369: generator of random numbers satisfying the poisson distribution. Comm. Assoc. Сотр. Mach. A970) 13, № 1, 49. Ill p а к (Schrack G. F.) Remark on algorithm 381 [G5]. Random vectors uniform in solid angle. Comm. Assoc. Сотр. Mach. A972) 15 № 6, 468. Я н к о (Janko T.) Podprogram Mohte Carlo. «Sb. pr. Vyzk ustavu zvuk., obrazov. a reprodukcrii techn.» A971) № 3, 597—599. Ярцев В. И. Моделирование на ЦВМ «Минск-22» случайных чисел, распределенных по закону Эрланга, Изв. Ленингр. электро- техн. ин-та A973), вып. 132, 69—71.
ЛИТЕРАТУРА (ДОПОЛНИТЕЛЬНАЯ) 447 К главе 3 Языки моделирования Гусев В. В. Языки моделирования и некоторые тенденции их развития, Киев, 1972. Дал У., Н и г а р д К. СИМУЛА — язык для программирования и описания систем с дискретными событиями. Алгоритмы и алгоритмические языки (сб.), вып. 2, Изд-во ВЦ АН СССР, М., 1967. Кивиат, Вилланева, Марковиц (Kiviat P. J., Vil- laneva R., Markovitz H.) The SIMSCRIPT II Programming Language Prentice Hall, Englewood Cliff., N. J., 1969. Клейн (Kleine H.) A survey of User's views of discrete simulation languages, Simulation A970) 14, № 5. Краснов, Ховард (Krasnow H. S., Howard S.) Computer languages for system simulation, Digital Сотр. User's Handbook. (Edited by Melvin Klerer and Granino Korn), 1967. МакНели (Me Neley) Simulation languages. Simulation A967) 9, 95—98. Марковиц (Markovitz H. M.) Simulation with SIMSCRIPT, Manag. Sci. A966) 12, № 10, B396-B405. Парен т, Краснов (Parente R. I., Krasnow H. S.) A language for modeling and simulating dynamic systems, Comm. Assoc. Сотр. Mach. A967) 10, № 9, 559 -566. Метод Монте-Карло для моделирования в физике и механике Абуталиев Э. Б.,Садуллаев Р. С. К численному решению стационарной задачи теории фильтрации методом Монте-Карло. В сб. «Вопр. кибернет. и вычисл. матем.» вып. 28, «Фан», Ташкент, 1969, 109—113. Армстронг, Альс миллер, Хэндле р, Бишоп (Armstrong Т. W., Alsmiller R. I., Handler К. С, Bishop В. L.) Monte Carlo calculations of high-energy nucleon-meson cascade and comparison with experiment, Nucl. Sci and Eng. A972) 49, № 1, 82-92. Афнан, Танг (Afnan I. R., Tang I. C.) Evaluation of the imaginary part of the optical potential with a Monte Carlo method, Nucl. Phys. A970) A141, № 3, 653-6G3. Б а л л а п с (Ballance J. O.) A Monte Carlo approach to transition and lree molecular flow problems. Rarefied Gas Dynam., 1, N. Y., Acad. Press., 1967, 578—588.
448 ЛИТЕРАТУРА (ДОПОЛНИТЕЛЬНАЯ) Бар, К а л о с, Стейнберг, Трубецкой (Beer M., Kalos М. Нм Steinberg H. A., Troubetzkoy E. S.) Monte Carlo simulation of physical diffusion processes. «Proc. Summer Comput. Simul. Conf., Montreal, 1973, Vol. I», La Jolla, Calif., 1973, 72—79. Бишоф, Йеатес, Myp (Bischoff F. G., Yeates M. L., Moore W. E.) Monte Carlo evaluation of multiple scattering and resolution effects in Double-differential-neutron scattering cross-section measurements. Nuclear Sci. and Eng. A972) 48, № 3, 266— 280. Вольп, Харди (Volpe J. J., Hardy J.) A comparison of thermal-neutron-activation measurement and Monte Carlo Calculations in Light-Water-Moderated Uranium cells, Nuclear science and engineering A970) 40, № 1, 116— 127. В у д (Wood W. W.) Monte Carlo studies of simple liquid models. В сб. «The Physics of Simple Liquids», Amsterdam, North-Holland Publishing Co. 1968, 116-230. Гейзлер, Циндлер (Geisler G. C, Zindler R. E.) A critical time step approach to Monte Carlo reliability calculation. Nuclear science and engineering A972) 48, № 3, 255—265. Генерозов В. Л., Коломенский В. Л., Кузнецов В. Г., С а к о в и ч В. А. Применение метода Монте-Карло для вычисления риска превышения заданной дозы протонов солнечных вспышек, Журнал вычисл. матем. и матем. физики A970), 10, № 1, 247—250. Дин, Бирд (Dean P., Bird N. Е.) Monte Carlo estimates of critical percolation probabilities F586). Proc. Camb. phil. Soc. A967) 63, № 2, 477—479. Енукашвили И. М., Бегалишвили Н. А. О численном решении интегральных кинетических уравнений коагуляции методом Монте-Карло, Изв. АН СССР. Физ. атмосф. и океана A973) 9, № 8, 878—882. ЗамалинВ.М., Норман Г. Э. О методе Монте-Карло в феймановской формулировке квантовой статистики, Журнал вычисл. матем. и матем. физики A973) 13, № 2, 408—420. 3 о л о т а р (Zolotar В.) Monte Carlo analysis of nuclear reactor fluctuation models, Nuclear Sci. and Eng. A968) 31, № 2, 287—294. Йошимура Тошио, Соэда Такаши (Yoshimura Toshio, Soeda Takashi) The application of Monte Carlo method to the nonlinear filtering problem. «IEEE Trans. Automat Contr.» A972) 17, № 5, 681-684. К а л л и (Kalli Н.) A Monte Carlo solution of multiple scattering in cold neutron scattering experiments, Nucl. Instrum. and Meth. A972) 101, № 2, 263—266.
ЛИТЕРАТУРА (ДОПОЛНИТЕЛЬНАЯ) 449 К а р г и н Б. А. Некоторые вопросы решения нестационарных задач теории переноса узких пучков излучения методом Монте-Карло. В сб. «Вероятности, методы решения задач матем. физики», Новосибирск, 1971, 123—155. Картер, Кэшвелл, Тейлор (Carter L. L., Cashwell E. D., Taylor W. M.) Monte Carlo sampling with continuously varying cross sections along flight paths, Nucl. Sci. and Eng. A972) 48, № 4, 403— 411. К о л е м а н (Coleman W. A.) Monte Carlo Calculation of the Effect of Subterranean Perturbations on Reflected X Rays, Nuclear Sci. and. Eng. A971) 46, № 1, 12—21. Кордаро, Цуккер (Cordaro M. C, Zucker M. S.) A method for solving time-dependent electron transport problems, Nuclear Sci. and Eng. A971) 45, № 2, 107—116. Косарев Ю. Г. Моделирование неупругого рассеяния электронов методом Монте-Карло, В сб. «Вычисл. системы», вып. 30, «Наука», Новосибирск, 1968, 34—40. Лаванд, Йенсен, Салин (Lavande S. V., Jensen С. А., Sahlin H. L.) Monte Carlo evalution of Feynman path integrals in imaginary time and spherical polar coordinates, J. Comput. Phys. A969) 4, № 4, 451—464. Л е в и т т (Levitt L. B.) The probability table Method for treating unresolved neutron resonances in Monte Carlo calculations, Nuclear Sci. and Eng. A972) 49, № 4, 450—457. Макаров А. М., Павлов К. Б., С и м х о в и ч С. Л. Применение метода Монте-Карло к решению нестационарных задач гидродинамики вязкопластических сред, Инж.- физ. ж. A970) 18, № 6, 1116-1121. МакКракин (McCrackin F. L.) WieghtinggMethods for Monte Carlo calculation of Polymer configurations, J. of Research of the Nat. Bur. of Stand. B-mat- hematical sci. A972) 76 B, № 3, 4, 193—200. Марчук Г. И., Михайлов Г. А. 1. О решении задач атмосферной оптики методом Монте-Карло, Изв. АН СССР. Физика атмосферы и океана A967) 3, № 3, 258-273. 2. Результаты решения некоторых задач атмосферной оптики методом Монте-Карло, Известия АН СССР. Физика атмосферы и океана A967) 3, № 4, 394—401. М а т т е с (Matthes W.) Calculation of Reactivity Perturbations with the Monte Carlo method, Nuclear sci. and eng. A972) 47, № 2, 234—237. Миллер, II ё н и ц (Miller L. В., Poenitz W. P.) Monte Carlo interpretation of a U Spherical Shell Transmission experiment at 23 kev. Nuclear sci. and eng. A969) 35, Aj2, 295—297.
450 ЛИТЕРАТУРА (ДОПОЛНИТЕЛЬНАЯ) Миллер, Мили (Miller L. В., Miley G. Н.) Some Monte Carlo techniques for the calculation of Doppler coefficients, Nuclear sci. and eng. A970) 40, № 3, 438—448. Михайлов Г. А. Оценка некоторых нелинейных функционалов и приближеп- ный расчет групповых констант теории переноса методом Монте-Карло, Журнал вычислит, матем. и матем. физики A968) 8, № 3, 590—599. Мюллер- Крумбаар, Биндер (Miiller-Krumbhaar H., Binder К.) Dynamic properties of the Monte Carlo method in statistical mechanics. J. Statist. Phys A973) 8, № 1, 1—24. P а з а н и (Razani A) A Monte Carlo method for radiation transport calculation, Nuncl. Sci. and Technol A972) 9, № 9, 551—554. Ф о с д и к (Fosdick L. D.) The Monte Carlo method in quantum statistics. SI AM Rev. A968) 10, 315—328. Фридман (Friedman I. H.) Random event generation with preferred frequency distributions. J. Comput. Physics. A971) 7, № 2, 201—218. X a p т и г (Hurtig E.) Zur Losung von Inversions problemen mit Hilfe der Monte- Carlo-Methode. Wiss. Z. E. M. Arndt-Univ. Greifswald. Math.- naturwiss R. A972) 21, № 2, 147—152. Хироши Такахаши (Hiroshi Takahashi) Monte Carlo method for geometrical perturbation and its application to the pulsed past reactor, Nuclear sci. and eng. A970) 41, № 2, 259—270. Шеснут, Зальцбург (Chesnut D. A., Salsburg L. W.) Monte Carlo calculation for the two-dimensional triangular lattice gas: supercritical region, J. Chem. Phys. A963) 39, 2081—2084. Метод Монте-Карло для решения задач математической статистики Арат 6, Бенжур (Arato Matyas, Benczur Andras) Szimulacios eredmenyck az clemi gauss folyamat parametrei beesleseinek elosrasara. Magy tud. akad. Szamitastechn. kozp. kozl A972) 8, 3—35. Беллман, Арене (Bellman К., Ahrens H.) Eine Monte-Carlo Studie zur Priifung yon Halbgeschwister- covarianzen als Vorhersageparameter, Biometr. Z. A969) 11, № 5, 305—329. Габриель, Лаченбрух (Gabriel К. R., Lachenbruch P. A.) Non-parametric AN OVA in small samples: a Monte Carlo study of the adequacy of the asymptotic approximation. Biometrics A969) 25, № 3, 593—596. Гильберт (Gilbert R. V.) A Monte Carlo study of analysis of varience and competing rank tests for Scheffe's mixed mobel. J. Amer. Statist. Assoc A972) 67, № 337, 71—75.
ЛИТЕРАТУРА (ДОПОЛНИТЕЛЬНАЯ) 451 Грингортен (Gringorten I. I.) Estimating finite-time maxima and minima of a stationary Gaussian Ornstein-Uhlenbeck process by Monte Carlo simulation, J. Amer. Statist. Assoc. A968) 63, № 324, 1517—1521. Дункан, Лаярд (Duncan G. Т., Layard M. W. J.) A Monte-Carlo study of asymptotically robust tests for correlation coefficients. Biometrika A973) 60, № 3, 551—558. Й е й т с (Yates F.) A Monte-Carlo trial on the behavior of the non-additivity test with nonnormal data. Biometrika A972) 59, № 2, 253—261. Карме p, Свенсон (Carmer S. G., Swanson M. R.) An evaluation of ten pairwise multiple comparison procedures by Monte Carlo methods., J. Amer. Statist. Assoc. A973) 68, № 341, 66-74. Коутский, Теодореску (Koutsky Z., Theodorescu R.) Dber die Anwendung der Monte Carlo-Methade zur naherungs- weisen Bestimmung der Grenzverteilungen von Hetten mit vollstandigen Bindungen. Election Informativnsverarb. und Kybernet. A967), № 2, 127—134. Куракина И. В. Оценка квантилей некоторых статистик при помощи метода Монте-Карло. В сб. «Случайные процессы и статистич. выводы», «Фан», Ташкент, 1971, 34—36. Лин (Linn R.) A Monte-Carlo approach to the number of factors problem, Psychometrika A968) 33, № 1, 37—71. Манн (Mann N. R.) Computer-aided selection of prior distributions for generating Monte Carlo confidence bounds on system reliability, Nav. Res. Log. Quart A970) 17, № 1, 41—54. Нив, Гренджер (Neave H. R., Granger С W. I.) A Monte Carlo study comparing various two-sample tests for differences in mean. «Technometrics», A968) 10, № 3, 509— 522. Парк, Лейниотис (Park S. K., Lainiotis P. G.) Monte Carlo study of the optimal non-linear estimator: linear systems with non-gaussian initial states. «Int. J. Contr.» A972), № 6, 1029—1040. П и н к у с (Pincus M.) A Monte Carlo method for the approximate solution of certain types of constrained optimization problems. «Oper. Res.» A970) 18, № 6, 1225-1228. Пирсон (Pearson E. S.) Alternative tests for heterogeneity of variance; some Monte- Carlo results. Biometrika A966) 53, № 1—2, 229—234. Рамсе й, Гильберт (Ramsey J., Gilbert R.) A Monte Carlo study of some small sample properties of tests for specification error. «J. Amer. Statist. Assoc.» A972) 67, № 337, 180—186. P e л л е с (Relies D. A.) Variance reduction techniques for Monte Carlo sampling from Student distributions. «Technometrics» A970) 12, № 3, 499— 515.
452 ЛИТЕРАТУРА (ДОПОЛНИТЕЛЬНАЯ) Роберте (Roberts F. D. К.) A Monte Carlo solution of a two-dimensional unstructured cluster problem. Biometrika A967) 54, № 3—4, 625—628. Соеда Такаши,|Йошимура Тошио (Soeda Takashi, Yoshimura Toshio) Evaluation of the a posteriori probability- density function for the state variables by Monte Carlo method. «Huxon Kukan Takkax pombunsu», Trans. Jap. Soc. Mech. Eng. A972) 38, № 313, 2217-2223. С п е с (Spece J.) A Monte Carlo evaluation of three nonmetric multidimensional scaling algorithm. Psychometrika A972) 37, № 4, part I, 461— 468. Сривастава, Заатар (Srivastava I. N., Zaatar M. K.) A Monte Carlo comparison of four estimators of the dispersion matrix of a bivariate normal population, using in complete data. J. Amer. Statist. Assoc. A973) 68, № 341, 180— 183. Томан, Байн, А н т л e (Thoman D. R., Bain L. J., AntleC. E.) Inferences on the Parameters of the Weibull Distribution, Technometrics A969) 11, № 3, 445—460. Торнбер (Thornber H.) Finite sample Monte Carlo studies: an autoregressive illustration. «J. Amer. Statist. Assoc.» A967) 62, № 319, 801—819. Уид, Бредли (Weed H. D., Bradley R. A.) Sequential one-sample grouped signed rank tests for symmetry: Monte Carlo studies. «J. Statist. Compur. and Simul.» A973) 2, № 2, 99—137. Харрисон, Бредли (Harrison D., Bradley R. A.) Sequential one-sample grouped signed rank tests for symmetry: Monte Carlo studies. J. Statist. Comput. and Simul. A973) 2, № 2, 99—137. Хатчисон (Hutchison M. C.) A Monte Carlo comparison of some ratio estimators. «Biometrika» A971) 58, № 2, 313—321. X e у т у с (Heutus R. M. J.) Parameter estimation in the exponential distribution, confidence intervals and a Monte Carlo study for a goodness of fit test. «Statist. H.» A972) 13, № 3, 225-246. Худсон, Крачов (Hudson J. D., Krutchoff R. G.) A Monte-Carlo investigation of the size and power of tests employing Satterthwaite's synthetic mean squares. «Biometrika», A968) 55, № 2, 431—433. Чейс, Бюльгрен (Chase G. R., Bulgren W. G.) A Monte Carlo investigation of the robustness of T2. «J. Amer. Statist. Assoc», A971) 66, № 335, 499—502. Шмидт (Schmidt P.) Estimation of a distributed lag model with second order autoregressive disturbances: A Monte Carlo experiment. «Int. Econ. Rev.» A971) 12, № 3, 372-380. Э к б л о м (Ekblom H. А.) Monte Carlo investigation of mode estimators in small samples. Appl. Statist. A972) 21, № 2, 177-184.
ЛИТЕРАТУРА (ДОПОЛНИТЕЛЬНАЯ) 453 Разные вопросы Александров В. М., Сысоев В. И. Применение метода Монте-Карло к синтезу систем по критерию максимальной надежности. В сб. «Некоторые вопросы надежности в задачах автомат, управл.», М., 1967, 5—9. Ализаде Р. И. Синтез шарнирно-рычажных механизмов методом статистических испытаний, Машиноведение A968), № 3, 27—31. Ахмедов А. Об одном способе моделирования некоторого класса систем массового обслуживания, Успехи матем. наук A964) 19, вып. 5, 198—200. Баб и, Эллсворт (Babe W. G., Ellsworth J. H.) A computerized Monte Carlo simulation of solids mixing. Proc. Summer Comput. Simul. Conf., Montreal, 1973, Vol. I, La Jolla, Calif., 1973, 416—422. Бадин, Стоическу (Badin V., Stoicescu V.) Estimarea parametrilor aleatori din unele modele economice prin metoda Monte Carlo. «Stud, so Cerecalc econ. si. cibern. econ.» A973), № 3, 27-38. Балдини-Челио, Баллико-Лей, Менкуччи- ни-Спано (Baldini-Celio R., Ballico-Lay В., Mencuccini-Spa- no M. A.) Un Metodi Monte Carlo auto-ottimizzato a piu'stadi applicato al caleolo di un'efficienza di revelazione. «Lab. naz. Frascati Rept.» A968), № 54, 11 p., ill. Б а р к e p (Barker J. S. F.) Simulation of genetic systems by automatic digital computers. IV. Selection beturen alleles at a six-linked locus, Austr. J. Bid. Sci., A958) 11, № 4, 613-625. Барт, Гармен (Burt J. M., Garman M. B.) Monte Carlo techniques for stochastic PERT network analysis. «INFOR. Can. J. Oper. Res. and Inform. Process.» A971) 9, № 3, 248—262. Бартоломей П. И. Использование метода Монте-Карло для расчета оптимального режима энергосистемы на цифровых вычислительных машинах. В сб. «Тр. Уральского политехи, ин-та» A966) 154, 72—82. Варжапетян А. Г., Сажин Ю. Е. Ускорение процесса моделирования надежности систем методом Монте-Карло. «Автоматика и вычисл. техн.» A973), № 6, 59—61. В д о в и н А. А., КравицкийА. О. Исследование методом Монте-Карло организации восстановления ненадежных систем, В сб. «Прикл. задачи техн. ки- бернет.», М., «Сов. радио», 1966, 147—166. Воробьев В. А., К и в р а н В. К., Н а а ц И. Э. Моделирование случайных плотных упаковок равных сфер на цифровых электронно-вычислительных машинах, Изв. Томск, политехи, ин-та A972) 223, 31—36.
454 ЛИТЕРАТУРА (ДОПОЛНИТЕЛЬНАЯ) Гаррет, Холл (мл.) Оптимальный синтез многозвенников при помощи метода статических испытаний. Конструирование и технология машиностроения, «Мир», М., 1968, № 3, 27—34. Гил л (Gill J. L.) Selection and linkage in simulated genetic populations, Austr. J. Bid. Sci. A965) 18, № 6, 1171—1187. Г и ф ф л е р Б., То м п с о н Д., В а н - Н е с с е В. Опыт вычислений с применением линейного алгоритма и алгоритма Монте-Карло для решения задач календарного планирования на производстве, В сб. «Календари, планирование», «Прогресс», М., 1966, 42—61. Голенко Д. И., К е с л е р СМ., Лившиц С. Е., Мордвинов В. Ю. Статистическое моделирование процесса функционирования системы управления, Тр. Ленингр. инж.-экон. ин-та A972), вып. 94, 82—90. ГорноваЭ. Г. Применение метода Монте-Карло с самообучением в оптимальном проектировании конструкции, Тр. Белорусск. ин-та инж. ж.-д. трансп A972), вып. 114, 44—48. Г ю т т н е р (Giittner К.) Monte-Carlo-Rechnungen zur Ruckstrenung von schweren, hochenergetischen Ionen an Metallo-berflachen.«Z. Naturforsch.» A971) 26a, № 8, 1290—1296. Д а л к и (Dalkey N.) Simulation of Military Conflict, The Proceedings of the fouths Int. Conf. Oper. Res. A961), 717—719. К а с с о у (Cassou M.) Methodes de Monte-Carlo: application au lanceur Europa II, «ELDO/ESRO Techn. Rev.» A969) 1, № 2, 163-183. Климов Г. П. Моделирование на электронных цифровых машинах некоторого класса систем массового обслуживания, Журнал вы- числ. матем. и матем. физики A961) 1, № 5, 935—940. Климов Г. П., Алиев Г. А. Решение на вычислительных машинах одной задачи теории массового обслуживания методом Монте-Карло, Журнал вычислит, матем. и матем. физики A961) 1, № 5, 933—935. Коваленко И. Н. О построении булевых функций большой сложности при помощи метода Монте-Карло, Изв. АН СССР, Техн. кибернетика A964), № 4, 77—80. Койфман А. А. Расчет надежности вычислительных сред методом статистического моделирования при применении локального резервирования и перестройки. В сб. «Вероятности, автоматы и их применение», «Зинатне», Рига, 1971, 207—211. Колемаев В. А., Пащенко П. Д. К применению планирования эксперимента и статистического моделирования в животноводстве, Экономика и матем. методы A973) 9, № 5, 992—994.
ЛИТЕРАТУРА (ДОПОЛНИТЕЛЬНАЯ) 455 Кондюрдн Ю. Н. Некоторые способы повышения точности метода Монте-Карло с применением к расчету вероятностных характеристик нелинейных систем автоматического регулирования, Журнал вычисл. матем. и матем. физики A968) 8, № 5, 1167—1173. Кондюрин Ю. Н. Об одном алгоритме метода Монте-Карло для расчета функционалов, определяемых траекториями нелинейной системы стохастических дифференциальных уравнений, Журнал вычисл. матем. и матем. физики A970) 10, № 6, 1375—1384. Коченов М. И., Правоторова Е. А., Сергеев В. И. Вероятностное моделирование в задачах точности, «Наука», М. A973), 152. Куров Б. Н., Ш а х а н о в В. С. Метод анализа чувствительности алгоритма системы управления, оптимизирующей режимы энергообъединения, на основе дисперсионного анализа и метода Монте-Карло. Тр. Ин-та электрон, управл. машин A969), вып. 5, 43—77. Линдсей, Барр (Lindsay J., Вагг В. М.) Two stochastic approaches to migration: comparison of Monte Carlo simulation and Markov Chain models. «Geogr. ann.» A972) В 54, № 1, 56—67. M а й з л и н И. Е. Определение временных характеристик системы сетевого планирования со случайными оценками длительностей отдельных работ, В сб. «Цифровая вычислительная техника и программирование», Изд-во «Сов. радио», М., 1967, вып. 2, 40, Маргулис X. Ш., Фридман Г. Я. Статистическая модель промышленного предприятия (на примере нефтеперерабатывающего завода). Техн. кибернетика A967), № з, 10—16. Махоткин О. А. Моделирование химического реактора с движущимся катализатором методом Монте-Карло. В сб. «Матем. пробл. химии», Новосибирск, 1970, 75—91, Минц М. И. Использование метода Монте-Карло для рационализации измерения затрат в машиностроении, Экономика и матем. методы A967) 3, № 1,77—82. М4и pfto носецкийН. Б., Рабинович И. Б. Методы Монте-Карло в сетевом планировании, В сб. «Вычисл. методы и программир. для ЭВМ «Урал-2», «Урал-4», Сара- """" 256—259. товск. ун-т, 1966, М и с р a (Misra К. В.) Monte Carlo methi methods and possible applications to system problems. Univ. Rooekee Res. J. A966) 9, № 1—2, part 3,1—14. Мустафи, Нагарьян, Дас Гурта (Mustafi A., Nagarajan V., Das Gupta S.) Certain problems of Monte Carlo modelling of a class oi Markov processes. «J. Inst. Eng. (India). Electron, and Telecommun. Eng. Div.» A970) 50, № 9, 123—128.
456 ЛИТЕРАТУРА (ДОПОЛНИТЕЛЬНАЯ) Назаров В. П., БабенкоВ. Е. Применение метода Монте-Карло для расчета Непрерывных процессов сушки в аппаратах взвешенного сло/k. В сб. «Ма- тем. пробл. химии. Ч. I», Новосибирск, 1973, 108—ИЗ. Н а й л о р (Naylor Th. H.) Computer simulation experiments with models of economic systems. New-York, Wiley, 1971, XVIII. Найлор, Гиантурко (Naylor Т. Н., Gianturco D.) Computer simulation in psychiatry, Archives of General Psychiatry A966) 15, № 3, 293—300. Найлор, Уолланс, Caccep (Naylor Т. Н., Wallan- се W. H., Sasser W. E.) A computer simulation model of the textile industry. J. American Statistical Assoc. A967) 62, 1338—1364. Ованесли, МакРи (Hovanessian S. A., McRee B. R.) Computer analysis of reliability testing with exponential distribution. Comput. and Elec. Eng A973) 1, № 2, 227—237. П ейдж (Page E. S.) 1. On Monte Carlo methods in congestion problems. I. Searching for an optimum in discrete situations, Operat. Res. A965) 13, № 2, 291—299. 2. On Monte Carlo methods in congestion problems, II. Simulation of queuing sustems, Operat. Res. A965) 13, № 2, 300—305. Пескун (Peskun P. H.) Optimum Monte-Carlo sampling using Markov chains. Biomet- rika A974) 60, № 3, 607—612. П о л л я к Ю. Г. Оценка отношения показателей систем по данным статистического моделирования, Изв. АН СССР. Техн. кибернетика A971), № 4, 8-15. Разумовский Ю. В. О выборе коэффициентов системы линейных дифференциальных уравнений методом Монте-Карло, Сб. научн. статей, Н.- и. горнорудный ин-т Мин-ва черн. металлургии СССР, 1969, № 13, 129—132. Рахвальский В. М. Ускорение процесса моделирования при оценке эффективности и надежности сложных систем методом статических испытаний, Изв. АН СССР, Техн. кибернетика A966), № 1, 41. Рудольф (Rudolph И. J.) Anwendung der Monte-Carlo Methode zur Berechnung von Automatischen MaschinenflieJkeihen, Fertigungstechn. und Betrieb. A966) 16, № 8, 471—475. Сванидзе Г. Г., Пирана ш в и л и f 3. А. К вопросу о применении метода Монте-Карло в теории регулирования речного стока, Изв. АН СССР, Энерг. и трансп. A967), № 5, 151—157. С ы т н и к В. Ф. Использование процедуры Монте-Карло для решения задачи календарного планирования. «Исслед. операций и АСУ. Межвед. науч. сб.», 1973, вып. 1, 75—84.
ЛИТЕРАТУРА (ДОПОЛНИТЕЛЬНАЯ) 457 ТрайникС. Б. Оценках разделимости классов, описанных при помощи метода Монте-Карло. В сб. «Методы и модели управления», вып. 3, Рига, 1972, 94—101. Турина Г. А., Т у р и н В. Я. Расчет распределения вероятностей количества ошибок в блоке методом Монте-Карло. В сб. «Передача дискретн. сообщ. по каналам с группирующимися ошибками», «Наука», М., 1972, 101—104. У эр л и (Wehrli M.) Zur Stichprobenreduktion bei Monte Carlo simulationen, Unternehmensforschung A970) 14, № 2, 97—108. Фрейзер (Fraser A. S.) Simulation of genetic systems by automatic digital computers. VII. Effects of reproductive rate, and intensity of selection on genetic structure, Austr. J. Bid. Sci. A960) 13, № 3, 344—350. Хигасино Итиро, Итикэта Тадаси, Торита С и г э ю к и Применение метода Монте-Карло к изучению двигателя внутреннего сгорания, Jidosha gyutsu, J. Soc. Automot. Engrs Japan, Inc. A969) 24, № 4, 296—300. X э н д ш и н (Handschin J. E.) Monte Carlo techniques for prediction and filtering of nonlinear stochastic processes. Automatica A970) 6, № 4, 555— 563. Шильдер (Schilder M.) A Monte Carlo method for analysing non-linear circuits. Int. J. Contr. A967) 5, № 2, 131—134. ШкловерМ. Д. О применении метода Монте-Карло для поиска нефтяных куполов малой амплитуы. Тр. 4-й зимн. школы по матем. программир. и смежн. вопр. вып. 5, М., 1972, 231—234, К главе 4 А н о л и к М. В. Вычисление кратных интегралов, встречающихся в задаче о структуре ударной волны в одноатомном разреженном газе, В сб. «Методы вычислений», Изд-во ЛГУ, 1968, вып. 5Г 49—60. АноликМ. В., Баранцев Р. Г. Вторая итерация интегрального кинетического оператора в ударной волне одноатомного газа, «Методы вычислений» (сб.), Изд-во ЛГУ A968) 5, 43—48. А н о л и к М. В., Мирошин Р. Н. Вычисление континуальных интегралов в задаче об отражении атомов газа от шероховатой поверхности. Вестн. Ленингр. ун-та A971), № 7, 52—55. Б а н к о в и (Bankovi G.) Evaluation ol integrals by Monte Carlo methods based of the one-dimensional random space filling. Magoar tudomanyos
458 ЛИТЕРАТУРА (ДОПОЛНИТЕЛЬНАЯ) akademia matematikal kutato intezetenek. Koziemenyi-mat- hematical institute Hungarian academo of science/publications A961) 6, 3—14. Бахвалов Н. С. Оценка снизу меры случайности, необходимой при употреблении метода Монте-Карло, Журнал вычисл. матем. и ма- тем. физики A965) 5, № 4, 760—763. Григорьева О. В. Прием понижения дисперсии в методе Монте-Карло, Уч. зап. Казанск. ун-та A966) 125, № 6, 79—81. Зилински (Zielinski Ryszard) 1. Metody Monte Carlo, Warszawa, 1970. 2. On the efficiency of Monte Carlo integration the monomial Cft.fc*?- . . a?. Algorytmy A968) 5, № 9, 21-29. Ковью, Кейн, Йост ^(Coveyou R. R., Cain V. R., Yost K. J.) Adjoint and Importance in Monte Carlo Application. Nucl. Sci. and Eng. A967) 27, № 2, 219—234. Кранли, Патерсон (Cranley R., Patterson T. N. L.) A regression method for the Monte Carlo evaluation of multidimensional integrals, Numer. Math. A970) 16, № 1, 58—72. Л и б м а н (Liebmann F. G.) Monte Carlo-Methoden zur numerischen Quadratur auf Gruppen, Computing A972) 10, № 3, 255-270. M e p и с (Meric J.) Sur une methode de Monte-Carlo pour le calcul de certaines integrales simples. С. г. Acad. sci. A969) 268, № 13, A732— A734. Мирам (Mihram G. A.) On antithetic variates. Proc. Summer Comput. Simul, Conf., Montreal, 1973. Vol. I, La Jolla, Calif., 1973, 91—95. Мортон, Варга (Morton К., Varga L ) Bizonyas tipussi tobbszoros integralok kiszamitasa Monte Carlo modszerrel. Kozp. iiz kutato int kozl. A968) 16, № 3, 167-172. Соболь И. М. Вероятностная оценка погрешности для неслучайных сеток интегрирования. Вопр. вычисл. и прикл. мат., вып. 14, Ташкент, 1972, 5—11. Спанье (Spanier J.) A new multistage procedure for systamatic variance reduction in Monte Carlo. SIAM J. Numer. Anal. A971) 8, № 3, 548— 554. T с у д a (Tsuda Takao) 1. Numerical differentiation of functions of very many variables. Numer. Math. A972) 18, № 4, 327—335. 2. Numerical Integration of functions of very many variables, Nu- merische Math. A973) 20, № 4, 377—391. T у р чи н В. Ф. К вычислению многомерных интегралов по методу Монте- Карло. Теория вероятностей и ее применения A971) 16, № 4, 738-743.
ЛИТЕРАТУРА (ДОПОЛНИТЕЛЬНАЯ) 459 X а б е р (Haber S.) 1. A modified Monte-Carlo quadrature, Math. Comput. A966J0, № 95, 361—363. 2. A modified Monte-Carlo quadrature, II. Math. Comp A967J1, № 99, 388-397. 3. Numerical evaluation of myltiple integrals. SIAM Rev. A970) 12, № 4, 481—526. К главе 5 Александров В. М., Сысоев В. И., ШеменеваВ. В. Стохастическая оптимизация систем. Известия АН СССР Техп. кибернетика A968), № 5, 14—19. Брайнина М. 3., Генерозов В. Л., К у з н е ц о в В. Г., Сакович В. А. Вычисление производных дозы методом Монте-Карло для оптимизации формы и состава радиоционной защиты. Журнал вычисл. матем. и матем. физики A967) 7, № 4, 953—957. Дмитриев 10. П., Т а р а с е н к о Ф. П. Об оценивании функционалов от плотности вероятности и ее производных, Теория вероятностей и ее применения A973) 18, № 3, 662—668. Ермольев Ю. М., Марьянович Т. П. Оптимизация и моделирование. В сб. «Пробл. кибернетики», вып. 27, «Наука», М., 1973, 111—125. Зилински (Zielinski R.) A Monte Carlo estimation of the maximum of a function, Algo- rythmy A970) 7, № 13, 5-7. Катковник В.Я. Параметрические операторы усреднения в итерационных алгоритмах решения сложных экстремальных задач. Тезисы докладов VI Всесоюзной конференции по экстремальным задачам, Таллин, 1973. Катковник В. Я., К у л ь ч и ц к и й О. Ю. Методы случайного поиска для решения задачи оптимизации управления дискретной системой, Автоматика и вычислительная техника A972), № 5, 49—55. Лавсон, Лави (Lawson L. P., Lavi A.) Monte Carlo programming Random searching in the solution of parameter optimization problem. «Syst. Seventies. Proc. IEEE Syst. Sci. and Cybern. Conf., Pittsburgh, Pa, 1970», New York, 1970, 257—266. Лившиц А. Л. Использование зависимых испытаний при статистической оптимизации функций, описанных методом Монте-Карло. В сб. «Вопросы кибернетики и вычисл. матем.», Изд-во «Фан», Ташкент, 1969, № 28. Май ер, Роберт (Meier, Robert С.) The application of optimum-seeking techniques to simulation studies: a preliminary evaluation, J. Financial and quantitative Analysis A967) 1, 30—50.
460 ЛИТЕРАТУРА (ДОПОЛНИТЕЛЬНАЯ) М а т ы а ш И. Случайная оптимизация, Автоматика и телемеханика A965) 26, № 2, 246—253. Мироносецкий Н. Б., Могульский А. А., Соболев В. Ф. Об оценке скорости сходимости в методах Монте-Карло решения оптимизационных задач. В сб. «Матем. вопр. формир, экон. моделей», Новосибирск, 1970, 162—172. Михайлов Г. А., Назаралиев М. А. Оптимизация оценки функциональных зависимостей методом Монте-Карло, Журнал вычисл. матем. и матем. физики A970) 10, № 3, 734—740. М о цк у с И. Б. Об одном способе распределения случайных испытаний при решении многоэкстремальных задач, Журнал вычисл, матем. и матем. физики A964) 4, № 2, 380—385. П о л л я к Ю. Г. 1. Об оптимизации систем по данным статистического моделирования. В сб. «Вопросы кибернетики и вычисл. матем», Изд-во «Фан», Ташкент, 1969, № 28, 13. 2. Методы минимизации функций многих переменных (обзор), Экономика и матем. методы A967) III, вып. 6, 881—902. Р а б и н (Rubin H.) Optimisation problems in simulation, Optimizing methods in Stat., Acad. Press., N. Y.- L. 1971, 29—32. Рубинштейн Я. С, Мороз П. А., Малицкий М. Ф., К от л я р Б. Я. Управление длиной реализации в методе Монте-Карло при оптимизации функционалов, заданных статистической моделью. В сб. «Вопр. кибернетики», Ташкент, 1971, вып. 42, 107-113. Сергиевский Г. М., Тер-СаакянА. П. Об использовании факторного эксперимента в задачах многомерной стохастической аппроксимации точки экстремума, Изв. АН СССР, Техн. кибернетика A970), № 5, 23—27. Смит (Smith D. Е.) Requirement of an «optimizer» for computer simulations. «Nav. Res. Log. Quart.» A973) 20, № 1, 161—179. Соболь И. М., С т а т н и к о в Р. Б., ЛП-поиск и задачи оптимального конструирования, Проблемы случайного поиска, 1, «Зинатне», Рига, 1972, 117— 136. Тсуда, Матсумото (Tsuda Т., Matsumoto H.) Linear extrapolation of multivariable functions by the Monte Carlo method, Kyoto Univ. Computation Center, 1965, 1. Фюрст, Мюллер, Ноллау (Fiirst H., Muller P. H., Nol- lau V.) Uber em stochastisches Verfahren zur Bestimmung des Maximums einer Funktion mit experimentall ermittelbaren Funktionswerten und seine Adwendung bei chemischen Pro- lessen. Wiss. Z. Techn. Univ. Dresden. A967) 16, № 1, 9—13,
ЛИТЕРАТУРА (ДОПОЛНИТЕЛЬНАЯ) 461 Шильман СВ. Совмещение метода Монте-Карло с методами поиска экстремума в задачах оптимизации стохастических систем. Изв. высш. учебн. заведений, Радиофизика A971) 14, № 7,1014— 1021. К главе 6 Антюфеев В. С, Михайлов Г. А., Назарали- е в М. А. Модификации локальных оценок с учетом осевой симметрии в задачах атмосферной оптики, В сб. «Вероятностные методы • решения задач математической физики», Новосибирск, 1971, 26—43. Ахатов Ю., Умирбеков А. Решение системы линейных алгебраических уравнений методами Монте-Карло, Тр. Ташкентск. политехи, ин-та A972), вып. 10, 74—89. Б е р к (Berk R. Н.) A note on a Monte-Carlo estimator of Darling and Robbins, Isr. J. Math. A969) 7, № 4, 365-368. Гельбард, Ондис, Спанье (Gelbard E. M., Ondis L. A., Spanier J.) A new class of Monte Carlo estimators, SIAM J. Appl. Math. A966) 14, № 4, 697—701. ГолубицкийБ. М., Танташев М. В. Об ограничении дисперсии «локальных» оценок при решении задач переноса излучения методом Монте-Карло. Журнал вычисл. матем. и матем. физики A972) 12, № 1, 249— 252. Д э в и с (Davis D. Н.) Critical size calculations for neutron systems by the Monte Carlo method, Methods in Computational Physics A963) 1, 67— 88. Калвин, Бургарт, Стивене (Calvin E., Burgart С. Е., Stevens P. N.) A general method of importance sompling the angle of scattering in Monte Carlo calculations. Nuclear Sci. and Eng. A970) 42, № 3, 306—323. К а р г и н Б. А., Михайлов Г. А. Исследование эффективности использования асимптотических решений в расчетах по методу Монте-Карло, Журнал вычисл. матем. и матем. физики A972) 12, № 1, 150—158. Картер, Маккормик (Carter L. L., McCormick N. Т.) Source Convergence in Monte Carlo Calculations, Nuclear Sci. and Eng. A969) 36, № 3, 438-441. Карче p, Эрдман и, Балдонадо (Karcher R. H., Erd- mann R. C, Baldonado) The application of Track-Length Distribution Biasing in Monte Carlo Deep-Penetration Calculations, Nuclear Sci. and Eng. A968) 31, № 3, 492—499.
462 ЛИТЕРАТУРА (ДОПОЛНИТЕЛЬНАЯ) К и м м и н о (Cimmino Gianfrenco) Un metodo Monte Carlo per la risoluzione numerica dei sistemi di equazioni lineari. Atti Accad. sci. 1st. Bologua. Cl. sci. fis. Rend. 1964—1965 A967) 2, № 1—2, 39—44. К о н о т (Conot Jacques) Convergence sure de methodes arithmetiques de Monte Carlo pour l'inversion d'un operateur lineaire, С. г. Acad. sci. A968) 267, № 22, A799—A802. Л а н о p (Lanore J. M.) Weighting and Biasing of a Monte Carlo calculation for very deep Penetration of Radiation, Nuclear science and eng. A971) 45, № 1, 66-77. Л е в и т т (Levitt L. B.) The use of self, optimized Exponential Biasing in obtaining Monte Carlo Estimates of Transmissing probabilities, Nucl. Sci. and Eng. A968) 31, Д« 3, 500—504. Левит т, Спанье (Levitt L! В., Spanier J.) A new Non-Multigroup Adjoint Monte Carlo Technique, Nucl. Sci. and Eng. A969) 37, № 2, 278—287. Макмиллан (MacMillan D. B.) Optimization of importance-sampling parameters in Monte Carlo. Nucl. Sci. and Eng. A972) 48, № 2, 219. Михайлов Г. А. 1. Использование приближенных решений сопряженной задачи для улучшения алгоритмов метода Монте-Карло, Журнал вычисл. матем. и матем. физики A969) 9, № 5, 1145—1152. 2. Об одном классе оценок по методу Монте-Карло, Теория вероятностей и ее применения A970) 15, № 1, 142—144. 3. Некоторые замечания об использовании сопряженных решений для улучшения алгоритмов метода Монте-Карло. В сб. «Исследование операций и статистическое моделирование», Ленинград, ЛГУ, 1972, 1, 112—119. 4. Модификация локальной оценки потока частиц методом Монте- Карло, Журнал вычисл. матем. и матем. физики A973) 13, № 3, 574—582. Спанье (Spanier J.) 1. Two pairs of families of estimators for transport problems. SIAM J. Appl. Math. A966) 14, № 4, 702—713. 2. Some results on transport theory and their application to Monte Carlo methods. J. mathem. analysis and applications A967) 17, 549—559. Стейнберг, Калос (Steinberg H. A., Kalos M. H.) Bounded Estimators for Flux at a Point in Monte Carlo, Nucl. Sci. and Eng. A971) 44, № 3, 406—412. Франк-Каменецкий А. Д. О решении кинетического уравнения методом Монте-Карло, Журнал вычисл. матем. и матем. физики A963) 3, № 4, 766— 769. X и с а м у т д и н о в А. И. 1. Об эффективности метода математических ожиданий для задач одного класса, Журнал вычисл. матем. и матем. физики A967) 7, № 4, 946-953.
ЛИТЕРАТУРА (ДОПОЛНИТЕЛЬНАЯ) 463 2. Оценка функционала от решения сопряженного уравнения переноса методом Монте-Карло, Журнал вычисл. матем. имате*и. физики A968) 8, № 2, 467—471. 3. Выборка по важности в теории переноса излучения, Журнал вычисл. матем. и матем. физики A970) 10, № 4, 999—1005. 4. К уменьшению дисперсии оценки вероятности методом Монте- Карло, Журнал вычислит, матем. и матем. физики A970) 10, № 6, 1547—1549. 5. Поведение дисперсии при изменении распределения длины пробега, Журнал вычисл. матем. и матем. физ. A972) 12, № 1, 257—262. 6. Об одном виде оценок «единичного» класса, Журнал вычисл. матем. и матем. физики A973) 13, № 3, 770—775. X о р и н (Chorin A. J.) Hermite expansions in Monte Carlo computation, J. Comput. Phys. A971) 8, № 3, 472-482. Ш в е н д (Kschwendt H.) Convergence limits in the Monte Carlo of theiry of integral equations, Numer. Math. A968) 11, № 4, 307—314. К § 1 главы 7 Богачева А. А., Перепухов В. А., Р у х м а н Э. Е. Применение метода Монте-Карло к расчету аэродинамических характеристик тел сложной формы в свободно-молекулярном потоке, Журнал вычисл. матем. и матем. физики A968) 8, № 6, 1395—1402. Боргнакк, Ларсен (Borgnakke С, Larsen P. S.) Statistical collision model for Monte Carlo simulation of polyatomic gas. Rept. Dan. Center Appl. Math, and Mech. A973), № 52, 21 pp. Власов В. И. [1] Улучшение метода статистических испытаний Монте-Карло для расчета течений разряженных газов, ДАН СССР A966) 167, Яг 5, 1016—1018. [2] Расчет методом Монте-Карло потока тепла между параллельными пластинами в разреженном газе, Ученые записки ЦАГИ A970) 1, № 4, 46—51. Власов В. И., Хлопков Ю. И. Вариант метода Монте-Карло для решения линейных задач динамики разреженного газа, Журнал вычисл. матем. и матем. физики A973) 13, № 4, 1075—1080. Вогенц, Таката (Vogentz F. W., Takata G. Y.) Rarefied Hypersonic Flow about Cones and Flat Plates by Monte Carlo Simulation. AIAA T. A971) I, 94—100. Горелов С.Л., Коган М. Н. Решение линейных задач динамики разреженного газа методом Монте-Карло, Изв. АН СССР, Механ. жидкости и газа A969), № 4, 136—139. Григорьев 10. Н., Иванов М. С, X а р и т о н о в а Н. И. Решение задачи о течении Куэтта для кинетического уравнения БГК методом Монте-Карло, Вероятностные методы
464 ЛИТЕРАТУРА (ДОПОЛНИТЕЛЬНАЯ) решения задач матем. физики (сб.), Новосибирск, 1971, 69—86. Денисик С. А., Лебедев С. Н., М а л а м а 10. Г., О с и- н о в А. Н. Применение метода Монте-Карло для решения задач кинетики газов. Физика горения и взрыва A972) 8, № 3, 331— 349. Денисик С. А., Лебедев С. Н., М а л а м а Ю. Г. Об одной проверке нелинейной схемы метода Монте-Карло, Журнал вычислит, матем. и матем. физики A971) 11, № 3, 783—785. Перлмуттер Решение задач о течении Куэтта и о теплопередаче между параллельными пластинами в разреженном газе методом Монте-Карло. Сб. «Вычисл. методы в динамике разреженных газов», «Мир», М., 1969, 116—139. Ясинский Ф. Н. Применение метода Монте-Карло к нелинейным аэродинамическим проблемам, Изв. АН СССР. Сер. мех. жидкости и газа A968), № 6, 121-142. К § 2 главы 7 Б а й е с (Bayes A. J.) A minimum variance sampling techique for simulation Models, J. Assoc. Comput. Mach. A972) 19, № 4, 734— 741. Б а ш а р и н Г. П., Ш в а л ь б В. П. О моделировании действия коммутационных систем методом Монте-Карло на ЭЦВМ, Изв. АН СССР, ОТН, энергетика и автоматика A962), № 3, 22—41. Г а в е р (Gaver D. Р.) Statistical Methods for Improving simulation Efficiency. Proc. Conf. Appl. Simul., Dec. 8—10, 1969, 38—46. Далей (Daley D. J.) Monte Carlo estimation of the mean queue size in a stationary Gl/M/I queus. Operat. Res. A968) 16, № 5, 1002— 1005. И о н и н Г. Л., Ш н е п с М. А. Статистическая эквивалентность оценок по времени и по вызовам в системе массового обслуживания, Латвийский математический ежегодник A966) 2, 99—102. КочарянТ. В. Моделирование сложных систем с помощью кусочно-непрерывных марковских процессов. Научн. труды Моск. инж.- экон. ин-та A973), вып. 66, 3—7. Л и нник И. Ю. Об улучшении сходимости метода Монте-Карло при вычислении параметров систем массового обслуживания, Вероятностные методы решения задач математической физики (Сб.), Новосибирск, 1972, 156—164.
ЛИТЕРАТУРА (ДОПОЛНИТЕЛЬНАЯ) 465 Л у й к И. А. О решении методом Монте-Карло одной задачи массового обслуживания, Кибернетика A966), № 4, 71—77. Митчелл (Mitchell Bill) Variance reduction by antithetic variates in Gl/G/I queuing simulations, Oper. Res. A973) 21, № 4, 988—997. Михайлов Г. А. 1. О расчетах возмущений ядерных реакторов методом Монте- Карло, Журнал вычисл. матем. и матем. физики A966) 6, № 2, 380—384. 2. Расчеты критических систем методом Монте-Карло, Журнал вычисл. матем. и матем. физики A966) 6, № 1, 71-80. Морено (Moreno С. W.) A technique for simulating transient sequential queues in a production line. (Ph. D. Thesis) Purdue Univ., Lafayette, Ind. A966). Поляк Д. Г. Смешанные оценки для вероятности потери заявки, Проблемы передачи информации A973) 9, вып. 2, 86—92. Поляк Д. Г., Б е лов Е. Т. Сравнение оценок по времени и по вызовам для вероятности потери в многолинейной системе обслуживания с ограниченной очередью, Проблемы передачи информации A972) 8, вып. 2, 67—82. Фуксман А. Л., Харламова Е. Д., Ш май л о Н. В. Ускорение процесса моделирования отказов в больших системах, Автоматика и вычислительная техника A969), № 1, 63. Хайруллин Р. X. Об одном алгоритме методов Монте-Карло для нахождения максимального характеристического числа линейного положительного оператора. В сб. «Функц. анализ и теория функций», Казан, ун-т, 1971, вып. 8, 156—166. Хан (Hahn G. J.) Sample sizes for Monte-Carlo simulation. «IEEE Trans. Syst., Man, and Cybern.» A972) 2, № 5, 678-680. К § 3 главы 7 Аман (Amann H.) 1. Der Rechenaufwand bei der Monte-Carlo-Methode mit Infor- mationsspeicherung, Z. angew Math, und Mech. A968) 48, № 2, 128-131. 2. Monte-Carlo-Methoden und lineare Readwertprobleme, Z. angew. Math, und Mech. A968) 48, № 2, 109—116. 3. Optimale Anfangsverteilungen bei der Monte-Carlo-Methode mit Informationsspeicherung, Z. angew. Math, und Mech. A967) 47, № 5, 286—299.
466 ЛИТЕРАТУРА (ДОПОЛНИТЕЛЬНАЯ) АхатовЮ.К., Умирбеков А. У. Обзор по некоторым методам Монте-Карло для решения дифференциальных уравнений эллиптического типа. В сб. «Вопр. вычисл. и прикл. матем.», Ташкент, 1972, вып. 10, 74—78. Б о з и н и (Bozzini Maria T.) Techniche Monte Carlo per particolari contorni in problemi di tipo elliptico. Rend. 1st. lombardo Accad. sci. e lett A972) A 106, № 1, 47-59. Гопалсами, Аггарвала (Gopalsamy К., Aggarwala В. D.) On a Monta Carlo method for Inharmonic boundary value problems, Z.^angew. Math, und Mech. A973) 53, № 6, 293— 298. Григорьева О. В. Метод Монте-Карло для одной краевой задачи эллиптического типа, Уч. зап. Казанск. ун-та A966) 125, № 6, 82-84. Д я д ь к и н И. Г., Ж у к о в а С. А. О постановке задачи и алгоритме решения уравнения Шре- дингера методом Монте-Карло, Журнал вычисл. математики и матем. физики A968) 8, № 1, 222—229. Дядькин И. Г., Стариков В. Н. Об одной возможности экономии машинного времени при решении уравнения Лапласа методом Монте-Карло, Журнал вычисл. матем. и матем. физики A965) 5, № 5, 936— 938. Е л е п о'в Б. С, Михайлов Г. А., Стефанюк Г. Р. Алгоритмы метода Монте-Карло для решения задачи Дирихле в сложных областях с одновременной оценкой градиента потенциала, Тр. III Казахстан, межвуз. научн. конф. по мат. и мех., 1967, Алма-Ата, 1970, 151—153. Коростелев А. П. Вероятностное представление задачи с косой производной, Теория вероятностей и ее применения A973) 18, № 1, 172— 176. Кугиани, Бозини (Cugiani M., Bozzini М. Т.) Metodi Monte Carlo per problemi di tipo ellittico, Atti Semin. mat. e fis, Univ. Modena A970) 19, № 2, 354—370. Кугиани, Ливерани, Реголиози (Cugiani M., Li- verani A., Regoliosi G.) Processi di simmetrizazione nelle opplicazioni Monte-Carlo al problem di Dirichet, Atti Semin. mat. e fis. Univ. Modena, A968) 17, 142—159. Л и т л (Little W. D.) Hybrid computer solutions of partial differential equations by Monte-Carlo methods. «AFTPS Conf. Рос. Vol. 29», Washington, D. C, Spartan Books, 1966, 181—190. П атарлагсну. (Patarlageanu V.) Rezolvarea ecuatiilor differentiate cu derivate partiale de tip elipticprin metoda Monte Carlo. «Lucr ICPE» A972), № 27, 143-151.J
ЛИТЕРАТУРА (ДОПОЛНИТЕЛЬНАЯ) 467 Перец (Perez V. J.) Resolucion de ecuaciones elipticas en derivadas parciales par el metodo Monte Carlo. Trab. estatist. у invest, oper A969) 20, № 1, 117—121. Разафиндракото (Razafindrakoto A.) Solutions numcroques do l'equation de Poisson a trois variables par la methode de Monte-Carlo. C. R. Acad. Sci., Paris A967) 265, № 15, A425—A428. Райнартц (Reinartz E.) Die numerische Behandlung verschiedener Probleme bei par- tiellen Differentialgleichungen mit Monte-Carlo-Methoden. Mitt. Ges. Math, und Datenvirarb A970), № 7, 58. Старгут, Рожевиц (Szargut J., Rozewic J.) Zastosowanie metody Monte Carlo do trzeciego zagadnienia brzegowego ustalonego przewodzenia ciepla, Zesz. nauk. Poli- techn. blaskiej A966) AJ 168, 3—30. Трофимов Е. П. Типовая программа решения краевых задач уравнения Лапласа методом статистических испытаний Монте-Карло в системе ИП-3, Тр. Всесоюзн. н.-и. проект.-конструкт, ин-та комплекс, автоматиз. нефт. и газовой промышленности, 1972, вып. 4, 95—110. Тсуда, Ишида, Кийоно (Tsuda Т., Ichida К., Kiyo- поТ.) Monte Carlo path-integral calculations for two-point boundary-value problem. Numer. Math. A967) 10, № 2, 110—116. Умирбеков А. У. Влияние шага сетки и числа испытаний на решение краевых задач методом Монте-Карло для уравнения Лапласа, Тр. Ташкент, политехи, ин-та, 1970, вып. 67, 68—81. Фармер'; (Fahrmeir L.) Schwache Konvergehz von Wahrscheinlichkeilsmafien und ein hybrides Monte-Carlo-Verfahren fur lineare Randwertaufgaben. Diss. Dokt. Naturwiss. Fak. Allg. Wiss. Techn. Univ. Miin- chen, 1972. Ф р а т и л a (Fratila E.) Metoda Monte Carlo pentru determinarea solutiei unor ecuatii differentiale de ordin superier. Stud, si cere. mat. A972) 24, № 8, 1209—1217. Хартманн (Hartmann W.) Ober eine Erweiterung der Monte-Carlo-Methode zur Losung linearer Randwertprobleme zweiter und dritter Art, Z. angew. Math, und Mech. A972) 52, № 9, 471—477. X э н д л е р (Handler H.) Monte-Carlo solution of partial differential equations using a hybrid computer. IEET Trans. Election. Comput. A967) 16, № 5, 603-619. Шкленник А. Ф. О решении задач Дирихле методом блужданий. Сб. «Диффе- ренц. уравнения и их применение в технике», Рига, 1968, 53-72.
468 ЛИТЕРАТУРА (ДОПОЛНИТЕЛЬНАЯ) К главе 8 Воронцов Ю. В., Полляк Ю. Г. Об использовании квазислучайных последовательностей при прямом вероятностном моделировании систем, Автоматика и вычислительная техника A971), № 6, 23—27. Г а б а и (Gabai H.) On the discrepancy of certain cequences mod I, Illinois, J. Math. A967) 11, № 1, 1—12. Голенко Д. И., Лившиц С. Е., Тарнополь- с к и й Ю. Я., Я р о к е р Я. Н. Исследование 8-сетей в процессах статистического моделирования., Тр. Ленингр. инж.-экон. ин-та A972), вып. 94, 43— 50. 3 а р е м б a (Zaremba S. К.) 1. The mathematical basis of Monte Carlo and Quasi-Monte Carlo methods. Soc. Ind. and App. Math. Rev. A968) 10, № 3, 303— 314. 2. Good lattce points in the sense of Hlawka and Monte-Carlo integration, Monatch. Math. A968) 72, № 3, 264—269. 3. A quasi-Monte Carlo method for computing double and other multiple integrals, Aequat. math. A970) 4, № 1—2, 11—12. 4. Application of number theory to numerical analysis. Acad. Press. N. Y. 489 pp. 816; J. of the Royal Statistical Soc. Ser. A, 136, part. 2, 1973. К ахав (Kahane J.-P.) Sur la repartition de {Xju} modulo I. Semin Dubreilef Pisot. Fac. Sci. Paris, 1963/64 A967) 17 № 2, 20/01—20/04. Кеначчи, Де Матейе (Cenacci G., De Matteis A.) Quasi-Random sequences by Power Residues, Numer. Math. A972) 20, 54—63. Соболь И. М. О псевдослучайных числах для построения дискретных цепей Маркова методом Монте-Карло, Журнал вычисл. матем. и ма- тем. физики A974) 14, № 1, 36—44. Стоянцев В. Т. 1. Решение задачи^ Коши для параболического уравнения методом квази-Монте-Карло, Журнал вычисл. матем. и матем. физики A973) 13, № 5, 1153—1160. 2. Решение задачи Дирихле методом квази-Монте-Карло, УМН A95) 30, вып. 1, 263—264. X а б е р (Haber S.) Sequence of numbers that are approximately completely equi- distributed. J. Assoc. Сотр. Math. A970) 17, № 2, 269—272. Ц и н г л е р И., Хельмберг Г. Новейшее развитие теории равномерного распределения, Математика, ИЛ A963) 7, № 3, 3—46.
ПРЕДМЕТНЫЙ УКАЗАТЕЛЬ Абсолютная непрерывность мер 15, 34 Абсолютно нормальное число 392 Арифметическое моделирование броуновского движения 389 — — равномерно распределенных последовательностей 388 (В-распределение 72 Вероятностное пространство 10 — — конструктивное 32 Гистограмма 213 Датчик случайных чисел 45 Дерево 329 Дискретизация 362 Дисперсия оценок вероятности подмножества стациопарных состояний 242, 243 — — решения алгебраических уравнений 269 — — — интегральных уравнений 283 Доверительный интервал 26, 29 Закон больших чисел для независимых случайных величин 18 — — — — — — — усиленный 19 — — — — цепей Маркова усиленный 341 Интеграл 14 — Винера 23 Квадратурная формула 121 — — интерполяционная 123 — — рандомизованная 132, 135 Константы мультипликативного метода 408 Критерий непрерывности траекторий 24, 205 — согласия 30 Линеаризация (при решении нелинейных уравнений) 321 Линейное программирование 235, 238 — — полубесконечномерное 240 Максимальный период псевдослучайной последовательности 405 Математическое ожидание случайного процесса 20 — — случайной величины 16 Метод антисимметричной выборки 162 — «блужданий по сферам» 367 — выделения главной части 137, 301 — зависимых испытаний 204 — — циклов 355 — композиции 60 — Монте-Карло (простейшая схема) 130 — наименьших квадратов 228, 248 — Неймана (моделирования распределений) 53 — — — — обобщенный 55 — расслоенной выборки 145 — сравнений 46
470 ПРЕДМЕТНЫЙ УКАЗАТЕЛЬ Метод стохастической аппроксимации 241 — — — (приложения) 247 — существенной выборки 138, 293, 348 — частичной регуляризации 355 Моделирование дискретной случайной величины 53 — изотропного направления в пространстве 72 — нормального распределения 68, 71 — обслуживания станков мостовым краном 102 — показательного распределения 52, 65 — прохождения ^-квантов через вещество 84 — равномерного распределения 31, 41 — систем массового обслуживания 97 — случайных процессов 74 — танкового сражения 106 — траектории броуновского движения 76 — ядерного каскада 87 Модификация метода Монте- Карло 34 Мультииндекс 328 Мультипликативный метод получения псевдослучайных чисел 46, 407 Неравенство Бара — Эссеена 19, 36 (п, 8)-таблицы случайных чисел 44 Обращение дифференциального оператора 367 Обыкновенные дифференциальные уравнения 361 Оптимальные коэффициенты 129 Оптимальный выбор меры 139, 293 Остаток квадратурной формулы 121, 124 Отклонение последовательности чисел 413 Оценка, асимптотически несмещенная 26, 200 — дисперсии 28 — допустимая 300 — единичного класса 278 — линейная для решения интегральных уравнений 275 — локальная 316 — максимального правдоподобия 27 — непараметрическая неизвестной плотности 208, 204 — — поверхности регрессии 215 — несмещенная 26 — остатка квадратурной формулы 126, 127, 135 — производной 205 — эффективная 26 Планирование регрессионного эксперимента 216 Плотность распределения 16 Поглощающее состояние 266, 273 Полиномы Бернштейна 142 Понижение порядка интегрирования 144 Последовательность вполне равномерно распределенная (в смысле Коробова) 379 — равномерно распределенная в смысле Вейля 374 — s-равномерно распределенная 378 Преобразование Н. В. Смирнова (формулы обращения) 50 Производная Радона — Нико- дима 14 Процедура метода Монте-Карло 164 — — — допустимая 165, 169, 300 — — — последовательная 197 Псевдослучайные числа 45 Равномерно распределенная случайная величина 38
ПРЕДМЕТНЫЙ УКАЗАТЕЛЬ 471 Система интегральных уравнений 308 — —- — бесконечная 338 — линейных алгебраических уравнений 259 Случайная квадратурная формула 148 — — — интерполяционная 159 — — — с двумя свободными узлами 195 — — — — одним свободным узлом 173 — — — — частично фиксированными узлами 191 — — — симметризованная 163 Случайное интерполирование 223, 232 Случайный поиск 249, 250 — процесс 20 — — броуновского движения 22 ветвящийся 302, 326 — — гауссовский 21 — — (конструктивное задание) 32 — — марковский 21 — — регенерации 345 — — сепарабельный 24 Смещение 356 Спектральная плотность 77 Стационарное распределение 340 Схема Неймана — У лама 259, 271 — — — прямая и сопряженная 316 Таблицы случайных чисел 42 Уравнение Больцмана 323 — волновое 365 — переноса излучения 309 — теплопроводности 364 — эллиптического типа 362 Условие несмещенности 164, 277 Фиктивная модель 87, 119, 313 Формула Бинэ — Коти 228 Функция распределения 15 — Хаара 156 ^-распределение 29, 72 Центральная предельная теорема 19 Цепь Маркова с бесконечным числом состояний 273 — — — конечным числом состояний 22, 258 Эргодический эндоморфизм 401 Эргодичность 341 Эффективность метода Неймана 54, 57 — модификации метода Мо*нте- Карло 35 Языки моделирования 114
Сергей Михайлович Ермаков МЕТОД МОНТЕ-КАРЛО И СМЕЖНЫЕ ВОПРОСЫ (Серия: «Теория вероятностей и математическая статистика») М., 1975 г.. 472 стр. с илл. Редактор В. В. Абгарян Техн. редактор Л. В. Лихачева Корректор М. Л. Медведская Сдано в набор 10/IV-1975 г. Подписано к печати 2/Х 1975 г. Бумага 84х108*/м- Физ. печ. л. 14,75. Условн. печ. л. 24,78. Уч.-изд. л. 25,82. Тираж 13500 экз. Т-17315 Цена книги 1 р. 81 к. Зак. JNft 2471. Издательство «Наука» Главная редакция физико-математической литературы 117071, Москва, В-71, Ленинский проспект, 15 2-я типография издательства «Наука» Москва, Шубинский пер., 10