/
Текст
И, М, СОБОЛЬ
ЧИСЛЕННЫЕ
МЕТОДЫ
МОНТЕ-КАРЛО
ИЗДАТЕЛЬСТВО «НАУКА»
ГЛАВНАЯ РЕДАКЦИЯ
ФИЗИКО-МАТЕМАТИЧЕСКОЙ ЛИТЕРАТУРЫ
Москва 1973
517.8 + 518
С 54
УДК 519.2
Численные методы Монте-Карло, И. М
Соболь. Главная редакция
физико-математической литературы изд-ва «Наука», 1973.
Книга возникла из курса, который
автор неоднократно читал в Московском
инженерно-физическом институте, где у
слушателей предполагалось знакомство с
теорией вероятностей в весьма ограниченном
объеме (соответствующем программе
втузов). На этом уровне удалось рассмотреть
важнейшие разделы теории методов Монте-
Карло.
В книге эти разделы изложены
значительно полнее, имеется много примеров,
подобраны упражнения. Многие результаты
излагаются впервые.
Книга рассчитана на студентов втузов,
инженеров, научных работников. Она
будет особенно полезной специалистам по
вычислительной и прикладной математике.
Книга содержит 73 рис., библ. 185 назв.
Издательство «Наука», 1973.
0224—1857
С 042 @2) -73 57'73
ОГЛАВЛЕНИЕ
Предисловие «5
Введение 7
Глава 1. Получение случайных величин на ЭВМ Ю
§ 1. Три способа получения случайных величин Ю
§ 2. Псевдослучайные числа 19
§ 3. Статистическая проверка случайных чисел .... 30
^'пражнения к главе 1
Глава 2. Преобразования случайных величин .
§ 1. Метод обратных функций (основной прием модели
рования случайных величин)
§ 2. Моделирование многомерных случайных величин .
42
44
44
53
§ 3. Преобразования вида ?==g(yu Y2)
§ 4. Преобразования вида ?=?(Yb ... , уп) . . . . 70
§ 5. Методы отбора 74
Упражнения к главе 2 83
Глава 3. Вычисление интегралов 86
§ 1. Общий метод оценки математических ожиданий . , 86
§ 2. Простейший метод Монте-Карло для вычисления
интеграла 93
§ 3. Важнейшие способы построения хороших оценок
(способы уменьшения дисперсии) 100
§ 4. Интегралы, зависящие от параметра . • . 123
Упражнения к главе 3 131
Глава 4. Вычисление интегралов (сложные оценки) . . . 135
§ 1. Методы Монте-Карло с повышенной скоростью
сходимости 135
§ 2. Случайные квадратурные формулы ..... 143
§ 3. Использование смещенных оценок 151
Упражнения к главе 4 159
Глава 5. Решение линейных уравнений 161
§ 1. Интегральные преобразования 161
§ 2. Неоднородные интегральные уравнения .... 171
§ 3. Пример: рассеяние частиц 182
§ 4. Однородные интегральные уравнения 185
§ 5. Решение линейных алгебраических систем . 193
Упражнения к главе 5 • 207
ОГЛАВЛЕНИЕ
Глава 6. Моделирование естественных процессов . . . 210
§ 1. Моделирование путем имитации 211
§ 2. Моделирование свободного пробега 221
§ 3 Использование статистических весов 231
§ 4. Статистические веса и интегральные уравнения . . 247
Упражнения к главе б 251
Глава 7. Неслучайные точки в алгоритмах Монте-Карло 253
§ 1. Конструктивная размерность алгоритмов Монте-
Карло 254
§ 2. м-мерные псевдослучайные точки 259
§ 3. Поиски «универсальных» псевдослучайных чисел . . 270
§ 4. Проверка псевдослучайных чисел с
детерминистической точки зрения , 274
Упражнения к главе 7 277
Глава 8. Некоторые другие задачи 279
§ 1. Интерполирование функций от большого числа
переменных , 279
§ 2. Простейший случайный поиск 281
§ 3. Решение уравнения Лапласа 284
§ 4. Вычисление винеровских интегралов 287
Приложения
I. Вспомогательное неравенство 292
II. Таблицы 292
Литература 298
Указатель 308
ПРЕДИСЛОВИЕ
Книга эта возникла из курса, который я в течение
ряда лет читал в Московском инженерно-физическом
институте, но довольно сильно отличается от него: все
вопросы изложены здесь значительно полнее. Основной
материал, предназначенный для общего курса методов
Монте-Карло, содержится в главах 1, 2, 3, 6, 7,
исключая мелкий шрифт. Предполагается, что читатель
знаком с теорией вероятностей в сравнительно небольшом
объеме, примерно соответствующем программе по
высшей математике для втузов *).
За последнее десятилетие сфера приложений методов
Монте-Карло необычайно расширилась. Методы Монте-
Карло используются для расчета задач физики (перенос
излучения и вещества, ядерная физика, статистическая
физика и др.), радиотехники, теории массового
обслуживания, теории надежности, химии, биологии,
экономики (оптимизация, управление, сетевое планирование и
др.), теории автоматов, аэродинамики, гидрологии —
перечислить все невозможно. В книге рассмотрены
почти все наиболее важные вопросы, связанные с
применением методов Монте-Карло, и можно надеяться, что она
будет полезна специалистам, использующим эти методы,
независимо от области приложений.
По мнению автора, современный курс методов
Монте-Карло обязательно должен содержать хотя бы
краткое изложение детерминистического подхода к методам
Монте-Карло, так как использование так называемых
детерминированных псевдослучайных чисел позволяет
во многих задачах увеличить скорость сходимости
A/А/1-8 вместо 1/уЛО> не нарушая структуры
вычислительного алгоритма. Этим вопросам посвящена глава 7.
*) В лекции для инженеров-физиков следует включать также
ряд вопросов из главы 5,
6 ПРЕДИСЛОВИЕ
Обычно преобразования случайных величин
излагаются как справочный материал: различные способы
моделирования экспоненциальных величин, различные
способы моделирования нормальных величин и т. д. Вместо
этого в главе 2 построена общая классификация
преобразований, используемых для моделирования различных
случайных величин. На первый взгляд принцип этой
классификации может показаться формальным. Но
полностью его роль выясняется в главе 7 в связи с
введенным в книге понятием конструктивной размерности
алгоритмов Монте-Карло.
Нередко при изложении методов Монте-Карло много
места уделяют способам решения задач линейной
алгебры. Однако такие способы редко применяют на
практике, где, как правило, используют более быстро
сходящиеся численные методы линейной алгебры. Поэтому
в главе 5 излагаются в первую очередь способы
решения линейных интегральных уравнений; и лишь в § 5
этой главы как частный случай рассмотрены
алгебраические системы.
В главе 6 рассмотрены различные способы введения
статистических весов. Эти способы позволяют,
отправляясь от естественного процесса, строить модели для
расчета, более выгодные, чем имитация процесса (см.
мелкий шрифт, стр. 9). Устанавливается связь этих
приемов с методами вычисления интегралов и решения
интегральных уравнений»
Главы 4 и 8 выходят за рамки общего курса. В
главе 4 указаны наиболее интересные и, вероятно, наиболее
перспективные направления исследований методов
вычисления интегралов, а в главе 8 рассмотрены
некоторые задачи других типов. Таким образом, эти главы
как бы иллюстрируют возможности развития методов
Монте-Карло «вглубь» и «вширь».
Упражнения предназначены в первую очередь для
того, чтобы сообщить читателю дополнительные сведения.
Я пользуюсь случаем, чтобы выразить свою
признательность Н. Н. Ченцову, многолетний контакт с
которым повлиял на мои взгляды на методы Монте-Карло.
И. Соболь
ВВЕДЕНИЕ
0.1. Методы Монте-Карло. Общепринятого
определения методов Монте-Карло пока нет. Назовем методами
Монте-Карло численные методы решения
математических задач при помощи моделирования случайных
величин*). При таком определении приходится к методам
Монте-Карло причислить некоторые другие методы, как,
например, стохастические приближения или случайный
поиск, которые по традиции рассматриваются отдельно.
Однако специалисты, занимающиеся этими вопросами,
нередко сами называют свои приемы методами Монте-
Карло.
В то же время в определении подчеркивается что:
а) речь идет о численных методах (и конкурировать
они могут с классическими численными методами, а не
с аналитическими методами решения задач);
б) решать методами Монте-Карло можно любые
математические задачи (а не только задачи вероятностного
происхождения, связанные со случайными величинами).
Название «Монте-Карло» произошло от города
Монте-Карло (княжество Монако), известного своим
казино, ибо одним из простейших приборов для
генерирования случайных чисел служит рулетка.
Официальной датой рождения методов Монте-Карло
считают 1949 год, когда появилась статья под
заглавием «Метод Монте-Карло» [159]. Возникновение метода
связывают обычно с именами Дж. Неймана, С. Улама,
Н. Метрополиса, а также Г. Кана и Э. Ферми; все они
в 40-х годах работали в Лос-Аламосе (США).
Необходимо сразу же подчеркнуть, что теоретические основы
*) Можно добавить: «и статистической оценки их
характеристик».
в
ВВЕДЕНИЙ
методов Монте-Карло были известны значительно
раньше. Более того, фактически такие методы не раз
использовались для расчетов в математической статистике.
Однако до появления электронных вычислительных
машин (ЭВМ) методы Монте-Карло не могли стать
универсальными численными методами, ибо моделирование
случайных величин вручную — весьма трудоемкий
процесс.
Развитию методов Монте-Карло способствовало
бурное развитие ЭВМ. Алгоритмы Монте-Карло (как
правило, обладающие небольшой связностью)
сравнительно легко программируются и позволяют рассчитывать
многие задачи, недоступные для классических
численных методов. Так как совершенствование ЭВМ
продолжается, есть все основания ожидать дальнейшего
развития методов Монте-Карло и дальнейшего расширения
области их применения.
0.2. Общий курс методов Монте-Карло. Важнейший
дрием построения методов Монте-Карло — сведение
задачи к расчету математических ожиданий. Более
подробно: для того чтобы приближенно вычислить
некоторую скалярную величину а, надо придумать такую
случайную величину |, что М? = а; тогда, вычислив N
независимых значений §ь ..., ?w
величины g, можно считать, что
Рис.1.
Пример. Требуется оценить объем Vq
некоторой ограниченной пространственной
фигуры G.
Выберем параллелепипед П, содержа*
щий G, объем которого Vu известен (рис. 1).
Выберем N случайных точек, равномерно
распределенных в П, и обозначим через N'
количество точек, попавших в G. Если N велико,
то, очевидно, Nr : W« VG i Vn, откуда
получаем оценку
VQ*Vn(N'/N).
В этом примере случайная величина g равна Vn, если случайная
точка попадает в G, и | равна нулю, если точка попадает в П~О.
Нетрудно проверить, что математическое ожидание M?=VG> а сред*
нее арифметическое
ВВЕДЕНИЕ 9
Легко видеть, что существует бесконечно много
случайных величин ? таких, что М| = я. Поэтому теория
методов Монте-Карло должна дать ответы на два
вопроса:
1) как выбрать удобную величину | для расчета той
или иной задачи?
2) как находить значения ?ь |2, ... произвольной
случайной величины |?
Изучение этих вопросов и должно составить
основное содержание практического курса методов Монте-
Карло.
Почти все методы, рассмотренные в настоящей
книге, основаны на расчете математических ожиданий. За
рамками книги остались упомянутые выше методы
случайного поиска (кроме простейшего) и стохастических
приближений.
Среди методов Монте-Карло можно выделить
методы, в которых полностью воспроизводится модель
рассчитываемого процесса. Такие методы иногда называют
«физическими», хотя автору представляется более
удачным другое название этих методов — имитационные.
Имитация естественных процессов широко используется
в самых различных областях науки, техники, экономики.
Однако приемы имитации в каждой области свои, и
подробно излагать их более целесообразно в специальных
руководствах, а не в общем курсе методов Монте-Карло.
Нет оснований считан?, что имитация естественного процесса —
это лучший способ для расчета этого процесса; скорее — наоборот.
В самом деле, при имитации вычисляется вся информация о течении
процесса; однако в реальных задачах, как правило, не нужна вся
информация о всех величинах; поэтому естественно ожидать, что
существуют методы, в которых скорость расчета нужных величин
повышается благодаря отказу от информации о ненужных величинах.
Слово «численные» включено в заглавие книги, чтобы подчеркнуть,
что здесь рассматриваются главным образом не имитационные
методы.
ГЛАВА 1
ПОЛУЧЕНИЕ СЛУЧАЙНЫХ ВЕЛИЧИН НА ЭВМ
В алгоритмах Монте-Карло фигурируют значения
случайных величин с различными законами
распределения. Как будет доказано в гл. 2, для того чтобы
вычислять значения любых таких величин, достаточно уметь
находить значения какой-нибудь одной случайной
величины, ибо всегда можно подобрать такую функцию от
этой случайной величины, которая имеет требуемый
закон распределения. Поэтому мы сначала рассмотрим
вопрос о том, как получать на ЭВМ значения одной,
«стандартной», случайной величины.
§ 1. Три способа получения случайных величин
1.1. Случайные числа и случайные цифры. Как
правило, в качестве стандартной выбирают непрерывную
случайную величину у, равномерно распределенную в
интервале @,1). Напомним основные характеристики
этой величины: при 0<Сх<<1 плотность ру (х) = 1, а
функция распределения Fy(x)—x\ математическое ожидание
М7=1/2, дисперсия Df=l/12.
Заметно реже в качестве стандартной используют
дискретную случайную величину е, которая с
одинаковой вероятностью может принимать 10 значений 0, 1,
2,.,., 9. Распределение е задается таблицей
( 0 1 2 ... 9 \
Ш 0,1 0,1 ... 0,1 )
Мы будем называть величину «у случайным числом,
а величину е случайной цифрой. Иногда е называют де-
5 i) ТРИ СПОСОБА ПОЛУЧЕНИЯ СЛУЧАЙНЫХ ВЕЛИЧИН 11
сятичной случайной цифрой, чтобы отличить ее от
двоичной случайной цифры — величины а с распределением
'О 1
,5 0,5y
Чтобы установить связь между -у и 8, разложим чис-»
ло 7 в бесконечную десятичную дробь:
7 = 0, е^г... eft... A)]
Последняя запись означает, что
Y S3 *
/г=1
Теорема 1. Десятичные цифры гь ..., сл,...
чайного числа 7 представляют собой независимые
случайные цифры. Обратно, если еь ..., еА,.. .—
независимые случайные цифры, то формула A) определяет
случайное число.
Доказательство. Если величина f равномерно
распределена в @,1)» то еА=/ тогда и только тогда,
когда
0, 8j ... efe_if<Y<0, Bt ... Ek-}t + Q, 0^.01, B)]
k '
причем 6i, ..., efe_i в B) могут принимать любые
значения 0, 1, ..., 9. Так как длина каждого из интервалов
B) равна 10"* и интервалы эти попарно не
пересекаются, то
p{ek==i}==; % 10"*= 10*.10"*= 0,1;
сумма берется по всем интерзалам, так что еь ..., ek-i
независимо пробегают значения 0, 1, .... 9.
Пусть теперь l^s</s. Рассмотрим вероятность
одновременного выполнения равенств Р {ел=/, es=/}-'
Очевидно, оба эти равенства будут выполнены тогда и
только тогда, когда выполнено неравенство B), и в то
же время ea=j. Следовательно,
9
Р {в* - i, гь = /} = 2 10-* = 0,01.
12 ПОЛУЧЕНИЕ СЛУЧАЙНЫХ ВЕЛИЧИННА ЭВМ [ТЛ Г
Точно так же Р{е^ = /ь ...,% =/J = 10"e и, таким
образом,
Р {Чг = iu ..., eifes = /s} = Р {eftl = /1} ... Р {tks = 4},
а это означает независимость е^, ..., е^.
Перейдем к доказательству обратного утверждения.
Произвольное число х из интервала @, 1) запишем в
форме бесконечной десятичной дроби
x=0,aia2...ah... . C)
Если y<*> то в разложении A) либо ei<0i, либо ei —
= а\ и 82<«2, либо г\ = аи г2 = а2 и е3<Яз, и т. д.
Поэтому
оо
Р (Y < х) = 2 Р {?i = аъ ...» e*_i = fl*-i, бй < дл}.
Так как по условию теоремы все еь..., eft независимы,
то
Легко видеть, что P{eh<icih}=ah-10, ибо значениями
eft в этом случае могут быть О, 1, ..., afe—1. Значит,
р {?<*}= 2 ало-1-ю-**-0- 2 o.io-ft = .v,
и теорема доказана.
1.2. О приближенных случайных числах. В
вычислениях всегда используют числа с конечным количеством
десятичных знаков, поэтому вместо случайных чисел f
употребляют конечные десятичные дроби т = 0, ъ\... еп.
Никаких специальных исследований по этому поводу
мы проводить не будем: мы считаем, что здесь имеет
место ошибка округления такая же, как при любых
приближенных вычислениях.
Отме1им одно простое свойство чисел у> которое теряется при
таком приближении *).
*) В книге использованы следующие обозначения: Ц(х) —целая
часть числа х (т. е. наибольшее целое число, не превосходящее х),
Д(х) —дробная часть числа х (т. е. Д {х)=х—Ц(х))ч
§ ;) ТРИ СПОСОБА ПОЛУЧЕНИЯ СЛУЧАЙНЫХ ВЕЛИЧИН 13
Теорема 2. Пусть g — произвольное целое положительное
число. Случайная величина г] = Д(?у) равномерно распределена в
интервале @, 1).
В самом деле, если х принадлежит интервалу @, 1), то
вероятность
1
/г=0 ft=0
что и требовалось доказать ^
Ясно, что приближенная случайная величина Y^O» ei • •. ?п не
обладает таким свойством, так как при g — p2n, где /? — целое,
Иногда вычислители пы гаются использовать цифры Ci, ..., efe
числа уДля одной цели, а цифры efe+1,..», ел— для другой.
Теоретически такой прием вполне обоснован: из теоремы 1 вытекает, что
одно случайное число у эквивалентно бесконечной
последовательности случайных величин у:
О, ei ... ея, 0, ел+1 ...е2л, 0, е2/1+1 ... в3я, ...
Тем не менее его не всегда можно рекомендовать на практике: как
мы увидим ниже, «качество» случайных чисел, используемых в
расчетах, проверяется с помощью специальных тестов; и нередко главные
разряды — ei, ег, 83 чисел у оказываются гораздо лучше
проверенными, чем более далекие разряды.
1.3. Таблицы случайных цифр. Предположим, что мы
осуществили N независимых опытов, в результате
которых получили /V случайных цифр еь ..., ew. Записав
эти цифры (в порядке появления) в таблицу, получим
то, что называется таблицей случайных цифр (см.
стр. 295, где цифры объединены в группы только ради
удобства чтения).
Способ употребления такой таблицы весьма прост.
Если в ходе расчета некоторой задачи нам потребуется
случайная цифра е, то мы можем взять любую цифру
es из этой таблицы. Если нам понадобится случайное
число y> то мы можем взять из таблицы п очередных
цифр и считать, что ч = ®> е* 8*+i — ei+n-i. Выбирать
цифры из такой таблицы в случайном порядке не
обязательно. Их можно выбирать подряд. Но, конечно,
можно начинать с любого места, читать в любом
направлении, использовать любой заранее заданный алгоритм
14 ПОЛУЧЕНИЕ СЛУЧАЙНЫХ ВЕЛИЧИН НА ЭВМ [ГЛ !
выбора, не зависящий от конкретных значений цифр
таблицы *).
Все сказанное выше относится к «идеальной»
таблице случайных цифр и не вызывает никаких сомнений.
Мы не будем подробно останавливаться на трудностях,
возникающих при переходе к «реальным» таблицам, но
отметим некоторые из них.
Во-первых, изготовление хорошей таблицы — весьма
сложное дело, ибо в любом реальном опыте всегда
возможны ошибки. Например, для изготовления таблицы
[166], содержащей миллион случайных цифр, была
построена и тщательно отлажена специальная «рулетка»
(с использованием электроники). Тем не менее после
некоторого периода хорошей работы она стала
выдавать, как показала проверка, не равновероятные цифры.
Таким образом, проверка «качества» таблицы
абсолютно необходима. Никакие априорные соображения о
тщательности постановки опыта не гарантируют нас от
ошибок.
Тесты для проверки таблиц случайных цифр
рассмотрены ниже в § 3. Здесь только поясним, что
проверяется частота каждой из десяти цифр, частота
различных соседних пар и т. п»
Вторая трудность связана с «незаконностью»
многократного использования одной и той же таблицы.
Вычислителей зтот вопрос не очень беспокоит, так как
интуитивно ясно, что таблицу можно повторно
использовать при решении независимых задач (впрочем, что
такое «независимые» задачи — не очень ясно).
Возможность использования одних и тех же случайных величин
для решения целых классов задач доказана ниже в
гл. 3, § 4.
Наконец, отметим еще известный парадокс: в
большой таблице найдутся плохие участки. (Например, в
таблице, содержащей 10100 цифр, вполне вероятно найти
*) Таблицы случайных цифр очень удобны для осуществления
случайной выборки. Пусть, например, требуется из 55 предметов
отобрать случайно 6 предметов. Занумеруем исходное множество
предметов и воспользуемся таблицей со стр. 295. Рассмотрим пары цифр
из таблицы: 86, J51, 59, 07, 95, 6G, 15, 56, 64, ... и отберем предметы с
номерами, оказавшимися в этой последовательности: 51, 07, 15,
34, 23, 32.
§ I] ТРИ СПОСОБА ПОЛУЧЕНИЯ СЛУЧАЙНЫХ ВЕЛИЧИН 15
100 пулей подряд.) Очевидно, самостоятельное
использование таких участков недопустимо.
В настоящее время таблицы случайных цифр (или
более разнообразные таблицы случайных величин)
используют главным образом при расчетах вручную; для
расчетов на ЭВМ ими практически не пользуются.
Основная причина этого —чисто техническая: внутренний
накопитель всех современных ЭВМ сравнительно мал и
большая таблица туда не помещается; а обращение к
внешним запоминающим устройствам'сильно замедляет
счет. Вторая причина — ограниченность объема
существующих таблиц,— по-видимому, играет второстепенную
роль: можно заготовить таблицу любого объема, если
это потребуется.
1.4. Датчики случайных чисел. Генераторами или
датчиками случайных величин называют различные
технические устройства, вырабатывающие случайные
величины. Чаще всего для построения датчика используют
«шумящие» радиоэлектронные приборы (диоды,
тиратроны, газотропы и др.). Не вдаваясь в технические
подробности, рассмотрим один из возможных способов
построения датчика, вырабатывающего случайные
двоичные цифры а.
Нетрудно представить себе счетчик, который
подсчитывает количество v флуктуации напряжения шумящего
t'k
прибора, превышающих заданный уровень ?*0 за
фиксированное время At (рис. 2). Еще проще устроить
счетчик, который выдавал бы число v (mod 2), т. е. 0 при
четном v и 1 при нечетном v. Если вероятности
появления 0 и 1 в таком процессе равны между собой, то
можно считать, что устройство вырабатывает случайную
последовательность двоичных цифр.
16 ПОЛУЧЕНИЕ СЛУЧАЙНЫХ ВЕЛИЧИН НА ЭВМ [ГЛ I
Если вероятность появления нуля отлична от
половины Р{0} =рфО,5у то можно ввести какую-нибудь
схему стабилизации вероятности. Например, можно
группировать цифры парами и выдавать 0 при получении
пары 01 и 1 — при получении пары 10, а пары 00 и 11
просто опускать. Так как Р{01} = Р{10} =/?A—р), то в
результате получим последовательность нулей и единиц
с равными вероятностями *).
Обычно датчики случайных чисел содержат т
генераторов описанного* типа, работающих независимо, так
что датчиком выдается приближенное случайное число
4 = 0, с&1 ... ат, записанное в форме m-разрядной
двоичной дроби. Для случайных чисел отведена специальная
ячейка в накопителе, и скорость генерирования их столь
велика, что на каждом такте работы ЭВМ в этой
ячейке получается новое случайное число.
Применение датчиков случайных чисел свободно от
тех недостатков, которые препятствуют широкому
применению таблиц: не требуется места во внутреннем
накопителе и запас чисел практически неограничен. Тем
не менее подавляющее большинство задач, решенных
методом Монте-Карло, сосчитано без применения
датчиков. Ибо датчики имеют свои, новые недостатки. Во-
первых, числа, выработанные датчиком, нельзя
воспроизвести. Это затрудняет контроль расчетов и делает
невозможным счет на таких ЭВМ, на которых двойной
пересчет является правилом**). Во-вторых, приходится
содержать и эксплуатировать дополнительное
устройство, которое требует ухода и регулярной проверки
«качества» вырабатываемых чисел с помощью специальных
тестов.
Основные области применения датчиков —системы
автоматического регулирования и аналоговые
вычислительные машины, а не методы Монте-Карло.
1.5. Метод псевдослучайных чисел. Мы видели, что
пригодность случайных чисел определяется в конечном
счете не процессом их получения, а тем, удовлетворяют
*) К сожалению возможен также случай, когда вероятность р
меняется во времени или зависит от предшествующих цифр, и тогда
простые схемы стабилизации ье спасают положения.
**) Можно, конечно, запомнить все выработанные числа, но
тогда мы фактически будем использовать таблицу.
§1]
ТРИ СПОСОБА ПОЛУЧЕНИЯ СЛУЧАЙНЫХ ВЕЛИЧИН 17
ли они некоторым принятым тестам. Но в таком случае
совершенно безразлично, как эти числа получены, они
могут быть даже сосчитаны по какой-нибудь формуле,
лишь бы они удовлетворяли тестам!
Такая точка зрения иногда вызывает возражения,
ибо, вычисляя числа по формуле, мы тем самым сразу
отказываемся от их «случайности». Любопытно, что
такого рода возражения чаще высказывают
нематематики, хотя, казалось бы, математики должны более
решительно протестовать против нестрогости. Дело в том,
41 о математики лучше понимают, что слово
«случайность», взятое выше в кавычки, использовано там не в
математическом, а скорее в обыденном смысле. С точки
зрения математика равномерно распределенная
случайная величина y—это абстрактное понятие; и только
опыт может убедить нас в том, что какая-либо
конкретная последовательность чисел fi, ^2, ¦ ¦ • , Ч* обладает
интересующими пас свойствами независимых случайных
чисел Y-
Числа yi> Tf2» • • > Y*, которые вычисляются по какой-
либо заданной формуле и могут быть использованы
вместо случайных чисел при решении некоторых задач,
называются псевдослучайными числами.
Нередко считают, что тесты, приведенные ниже в § 3,
обеспечивают возможность использования проверенных случайных или
псевдослучайных чисел в любых задачах. Это излишний оптимизм. В
действительности каждый тест связан с каким-то достаточно
широким, но ограниченным классом задач (см. гл. 7, § 4), и правильнее
было бы говорить о таблицах, датчиках или псевдослучайных числах
для определенных классов задач*).
Конкретная последовательность псевдослучайных
чисел сходна с таблицей случайных чисел: ее можно один
раз тщательно проверить и затем многократно
применять; все числа легко воспроизводятся; и запас чисел
в такой последовательности, как мы увидим позднее,
тоже ограничен. Однако метод псевдослучайных чисел
свободен от главного недостатка таблиц: существуют
простые формулы для расчета псевдослучайных чисел,
*) Любой реальный объект лишь приближенно описывается
математическим понятием, и всегда можно указать задачи, в которых
данная математическая модель непригодна. Например, как бы
аккуратно ни была начерчена прямая, при достаточно большом
увеличении она превратится в волнистую или даже прерывную линию.
8 И. М. Свбгаь.
18 получение случайных величин нл эвм [гл. i
такие, что на получение каждого числа затрачивается
всего 3—5 команд ЭВМ, а программа расчета занимает
в накопителе лишь несколько ячеек.
Подавляющее большинство расчетов методами
Монте-Карло выполнено с помощью псевдослучайных чисел.
1.6. Сравнение трех способов с практической точки
зрения. Попутно с изложением методов получения
случайных величин мы рассмотрели некоторые их
достоинства и недостатки. Остановимся еще на вопросе о
быстроте выработки случайных величин.
При решении на ЭВМ большинства задач на
получение псевдослучайных чисел затрачивается гораздо
меньше времени, чем на расчет самих задач. В самом
деле, практика показывает, что в настоящее время
количество псевдослучайных чисел, используемых при
решении отдельных задач, как правило*), имеет порядок
104—105 и редко, достигает 106—107. Если на выработку
каждого числа затрачивать 5 оперцаий, то на получение
всех чисел уйдет не более 5-Ю7 операций. На
современных ЭВМ, скорость которых равна 5-Ю5 операций в
секунду, это составит не более 100 секунд.
Используя датчики, можно организовать
«сверхбыструю» выработку случайных чисел, так как,
присоединив к ЭВМ k датчиков, мы будем за один такт работы
ЭВМ получать k случайных чисел. Однако выигрыш
времени при расчете сложной задачи в указанных выше
условиях окажется меньше двух минут. Так что, исходя
из интересов методов Монте-Карло, не стоит гнаться
за «сверхбыстрой» выработкой случайных величин*).
Разумно требовать, чтобы скорость выработки была
того же порядка, что скорость счета ЭВМ.
Псевдослучайные числа этому требованию удовлетворяют.
В табл. 1 перечислены достоинства и недостатки
трех методов по шести признакам. Подчеркнем, что речь
идет только об «эксплуатационных» особенностях, а не
о «качестве» вырабатываемых чисел, которое должно
проверяться во всех трех методах.
*) Исключение составляют такие задачи, в которых огромные
массивы случайных чисел подвергаются очень простой обработке.
Но такие задачи выгоднее решать на специализированных машинах,
а не на универсальных ЭВМ. К тому же, вероятно, для большинства
таких задач можно придумать лучшие способы решения...
ПСЕВДОСЛУЧАЙНЫЕ ЧИСЛА
Из таблицы видно, что метод псевдослучайных
чисел—самый удобный с практической точки зрения. Это
подтверждается также всей практикой расчетов
методами Монте-Карло.
Таблица 1
Метод
таблиц
датчиков
псевдослучайных ЧИСвгП
Достоинства
Проверка однократная.
Воспроизводить числа
можно
Запас чисел неограничен.
Сверхбыстрое получение.
Места в накопителе не
занимает
Проверка однократная.
Воспроизводить числа
можно.
Быстрое получение.
Места в накопителе
занимает мало.
Внешние устройства не
нужны
Недостатки
Запас чисел ограничен.
Занимает много места в
накопителе или
медленно вводится.
Нужна внешняя память
Проверка периодическая.
Воспроизводить числа
нельзя.
Требуется специальное
устройство
Запас чисел ограничен
Необходимо, однако, признать, что не все
разделяют эту точку зрения. Некоторые авторы отдают
предпочтение датчикам, аргументируя тем, что:
а) псевдослучайные числа вырабатываются
медленнее и занимают место во внутреннем накопителе;
б) не стоит расходовать рабочее время большой
ЭВМ, когда можно использовать время небольшой
приставки;
в) а все-таки числа, вырабатываемые д^чиком,
«случайные», а псевдослучайные числа — нет...
§ 2. Псевдослучайные числа
Общей теории псевдослучайных чисел в настоящее
время нет. О возможных путях построения такой
теории разговор пойдет в гл. 7. Здесь мы ограничимся
изложением некоторых фактов, главным образом
эмпирического характера.
20
ПОЛУЧЕНИЕ СЛУЧАЙНЫХ ВЕЛИЧИН НА ЭВМ
[ГЛ I
2.1. Алгоритмы вида уп+1 = Ф(уп). Большинство
алгоритмов, используемых на практике для получения
псевдослучайных чисел, представляют собой
рекуррентные формулы первого порядка
<уп+1==ф(^п), D)
где начальное число ^о задано. Легко показать, что
функция у=ф(х), изображенная на рис. 3, не может
У
1 х
Рнс 3.
Рис 4.
породить хорошую последовательность псевдослучайных
чисел fi, 42, • • • В самом деле, если по настоящим
случайным числам построить точки с координатами G1,42),
(Тз. Tf*)э • • •» т0 оыи равномерно распределены в
единичном квадрате 0<х<1, 0<//<1, в то время как
соответствующие точки, построенные по числам D),
(Ть ФЫ), №. ФGз)Ь (Т5> ФЫ), ...,
располагаются на кривой у = ф(х).
Следовательно, «хорошую» последовательность
может породить только такая функция у=ф(х), график
которой весьма плотно заполняет единичный квадрат.
Примером такой функции может служить функция */=
—u(gx) при очень больших g (рис. 4). И
действительно, эта функция послужила основой для ряда методов
получения псевдослучайных чисел.
Конечно, приведенное условие только необходимо,
но далеко не достаточно для того, чтобы формула D)
порождала «хорошие» псевдослучайные числа.
Другая важная черта алгоритмов вида D) — то, что
при реализации их на ЭВМ они всегда порождают пе-
§ 21 ПСЕВДОСЛУЧАЙНЫЕ ЧИСЛА 21
риодические последовательности. В самом деле, так как
в коде любой ЭВМ можно записать лишь конечное
число /V чисел, заключенных между нулем и единицей, то
рано или поздно какое-нибудь значение ^ь совпадает
с одним из предыдущих значений ^. Тогда в силу D)
Tfi.+<=T'+< ПРИ /=1, 2, ..• E)
Пусть L — наименьшее число, удовлетворяющее E)
при некотором / (/<:L); множес!во чисел •уо» Ть • • • > Tf^-i
0 12 I 1*1 L-1LL+1
__l I I I I I L.
Рис. 5.
называется отрезком апериодичности
последовательности D), число L — длиной отрезка апериодичности, а
P=L—/— длиной периода (рис. 5).
Очевидно, в рассматриваемом случае отрезок
апериодичности состоит из различных чисел. И обычно для
расчета не рекомендуют использовать больше чем L
чисел последовательности D)*). Ясно также, что L^.N.
Для экспериментального определения L и Р можно
рекомендовать следующий алгоритм. Выбирается целое число Т (в несколько
раз меньшее, чем предполагаемое значение L). Вычисляются подряд
числа Yo» Yb Ys> • ••» причем yOt yT, у2т> ••• запоминаются, и все yt
из отрезка рТ<Ц^ (/?+1)!Гсравниваются со всеми YoiYr» ••• * УрТ- Как
только окажется выполненным равенство yio = ymTi вычисляется
длина периода P=io—mT и число t — io--pT.
Чтобы вычислить L, по числу У(р__цТ вычисляется 7(^—1O*+/,
после чего считаются и сравниваются между собой две
последовательности значений: 7(^1O-+/ и Y(m-i)r-<+/ ПРИ /я/» *+1* *+2>
Не позднее чем при / = /+'/ произойдет совпадение этих значений.
Если совпадение произойдет при /=/<>, то L=(p— 1)Г+/0.
2.2. Некоторые конкретные алгоритмы.
2.2.1. Первый алгоритм для получения
псевдослучайных чисел был предложен Дж. Нейманом. Его называют
*) Впрочем, использование L-\-P чисел, как правило, ни к каким
осложнениям не приводит, особенно при решении сложных задач,
когда маловероятно, что повторяющееся число будет вторично
использовано для моделирования той же величины.
22 ПОЛУЧЕНИЕ СЛУЧАЙНЫХ ВЕЛИЧИН НА ЭВМ (ГЛ. !
методом середины квадрата (middle-square method).
В этом методе число уп предполагается 2й-значным:
Чп=0, ax a2...a2k.
Чтобы получить число fn+ь надо уп возвести в квадрат
У2п = 0, &i&2 • • • t>4k
и затем отобрать средние 2k цифр этого квадрата:
Нетрудно проверить, что этому методу соответствует
функция
или, что то же,
ф (х) = Ю~2к Ц[ 102* Д A0* х2) ].
Однако от метода середины квадрата вычислители
отказались, так как в последовательностях, построенных
таким образом, получается больше, чем гужно, малых
чисел (см. ниже упражнение 4 гл. 1). Интересно, что
при некоторых "уо наблюдается вырождение
последовательности, т. е. YnSsO при п^п0.
2.2.2. Наибольшее распространение получил
алгоритм, предложенный Д. Л е м е р о м, который
называют методом вычетов (residual method) или методом
сравнений (congruential method). В этом методе ф(я) =
= Д(?*),т. е.
Тп+1=Д(?т~)> F)!
где g — большое целое число.
Докажем, что если задать ^о в форме несократимой
дроби Чо=пго/М, где Шц и М — целые числа, и М
взаимно просто с g, то все уп будут несократимыми дробями
вида *(п—тп/Му где числители тп определяются
формулой
mn+]=gmn(modM). G)
Запись G) означает, что пгп+\ равно остатку,
полученному при делении gmn на М (или, другими словами,
Wn+i — это наименьший положительный вычет gmn по
модулю М).
§ 2} ПСЕВДОСЛУЧАЙНЫЕ ЧИСЛА 23
Доказательство (по индукции). Пусть уп = тп/М— не-
сократимаядробь.Тогдаgyn=-gmnIM. Из G) следует, чтоgmn~rM-{-
~\-mn+\ t где г — целое число. Легко видеть, что тп^х взаимно просто
с М В самом деле, если допустить, что у т>п+\ и М есть общий
множитель — простое число /i, iogmn должно делиться на h\ но g
делиться на h не может, так как g взаимно просто с М; поэтому
должно делиться на h число тп, а это противоречит предположению
о том, что тп/М несократимая дробь. Итак, тп^х взаимно просто
с М и
Tn+i = Д (8тп/М) = Д(г + та+1/М) = тп+1/М.
На практике обычно используют формулу G).
Изучению последовательностей тп посвящено много работ.
Методами теории чисел удалось исследовать длину
отрезка апериодичности (см. упражнение 5 гл. 1) и
оценить некоторые величины, аналогичные коэффициентам
корреляции между ч и 11 = 0G), между ^ и rj —Ф(Ф(ч))
и т. п. Однако вопрос о пригодности таких
псевдослучайных чисел в конечном счете решается обычными
статистическими тестами § 3, т. е. эмпирически. При
некоторых (g, M, то) получаются удовлетворительные
последовательности, при других — плохие. (См. также гл. 7,
п. 3.3.)
Удовлетворительная последовательность
псевдослучайных чисел получается, например, при g-=517, Л1=242,
mo=l (L==P = 240); результаты статистической
проверки этих чисел приведены в [171].
Обширная литература, посвященная методу сравнений, имеется
в [69, 139, 140]. Ряд статей с указанием недостатков метода перс-
числен в [180].
2.2.3. В качестве примера нелинейного алгоритма,
использующего некоторые особенности системы команд
ЭВМ, рассмотрим алгоритм, предложенный автором
книги для ЭВМ «Стрела». В этом алгоритме число ^«н
получается из числа ^„ тремя командами:
1) число ч„ умножается на большую константу g;
2) изображение произведения g^n в ячейке ЭВМ
сдвигается на 7 разрядов влево;
3) вычисляется абсолютная величина полученного
числа, которая и есть ^n+i (при вычислении абсолютной
величины число нормализуется).
24 ПОЛУЧЕНИЕ СЛУЧАЙНЫХ ВЕЛИЧИН НА ЭВМ [ГЛ I
Удовлетворительная последовательность
псевдослучайных чисел получается, например, при g=1017 и ^0= 1
(L = 87 835, P=53 535); результаты статистической
проверки этих чисел приведены в [75].
Чтобы пояснить этот алгоритм, необходимо указать, что в ЭВМ
«Стрела» числа представляются в нормализованной двоичной форме
x~sgnx-m-2p, где p=\+U(\og2\x\) — порядок числа, а т
—мантисса @,5^ап<1). Ячейка ЭВМ, в которую записывается число х,
\ порядок
ЗЩ Знай
мантиссы порядна
Рис. 6.
состоит из 43 двоичных разрядов (рис 6). В у-м разряде записана
величина с., которая може! равняться нулю или.единице, и
/1 /
sgn х = (— \f\ sgn р = (— 1)"8в
(в двоичной записи
т==0, <?i е2... е35, \р\ =е37 ez%... е4г).
Если произведению gyn соответствует ячейка [0, ^^...^г], то
после операции сдвига* получаем [е7 е& . . . е42 0 0 0 0 0 0 0]. Абсолютная
величина этого числа в двоичной записи равна уп+1 =0, еве9... е&.
Нетрудно проверить, что в случае, когда размещение
мантиссы т и порядка р в ячейке ЭВМ другое, то же число vn+i можно
получить из gyn с помощью двух или трех сдвигов и поразрядного
сложения результатов этих сдвигов
2.2.4. Для получения псевдослучаиных чисел на различных ЭВМ
используют весьма разнообразные алгоритмы, подобные
изложенному в п. 2.2.3, которые иногда называют способами перемешивания.
Сведения о них имеются в [19, 69]. К сожалению, описание
алгоритмов далеко не всегда сопровождается указанием количества
проверенных чисел и тестов, которым эти числа удовлетворяют, или
хотя бы указанием работ, в которых имеются данные о таких
проверках.
Например, некоторое распространение получил трехкомандный
алгоритм, разработанный Д И. Голенко для той же ЭВМ «Стрела».
Однако позднее сам автор алгоритма обнаружил ([19], стр. 117),
что получаемые этим методом числа плохо удовлетворяют одному из
важнейших тестов — проверке пар.
§ 2] ПСЕВДОСЛУЧАЙНЫЕ ЧИСЛА 23
2.2.5. Из других алгоритмов вида D) отметим попытки
«улучшения» метода вычетов F) путем рассмотрения функций вида
ИЛИ
где р — заданное дробное число.
L Заметного распространения эти методы не получили.
г 2.3. Оценка L для алгоритмов вида уп+1==Ф(уп).
'Для оценки длины отрезка апериодичности,
характерного для последовательностей вида D), можно
воспользоваться следующей элементарной вероятностной моделью.
Пусть имеется конечное множество, содержащее N
различных чисел. Произведем последовательность
независимых опытов, в каждом из которых из этого
множества извлекается и записывается одно число. Вероятность
извлечения каждого числа в каждом из опытов равна
1/jV (выборка с возвратом). Обозначим через L
случайную величину: номер опыта, в котором впервые будет
извлечено уже записанное число.
Теорема 3. В указанной модели для любого
lim P {L/ VN<x}=l- e~x2}2. (8)
Л'-*оо
Доказательство. Обозначим записанные числа через у<>, Yi»
Y2, ... Легко вычислить вероятность того, что L окажется равным п9
где \^n^N:
так как
,-, Г То. .... 7„-1 *" Тя-2 ^ V0> "" V/7-2] = "-(*-»,
11 п ! rt 2 различны J Л/
а вероятность того, что уп совпадет с одним из различных чисел
Ye. Y*» •••• ye—1» Равна nlN.
26 ПОЛУЧЕНИЕ СЛУЧАЙНЫХ ВЕЛИЧИН НА ЭВМ [ГЛ. 1
Фиксируем произвольное *>0, и пусть k = Ll(xYN). Тогда
'Легко видеть, что
Ь ) = +°
1
Так как n<* = O(}/F), то rt//V = O(l)/77); поэтому
и интересующую нас вероятность можно записать в форме
k -ъа
?{L < xYn}~ Vj e (n/N)[l+O(l/YN)]* (9)
Рассмотрим теперь разбиение интервала 0</<* точками tn
Wn/У^, где /г=1, 2, . . . , k (рис. 7), и составим интегральную
сумму для функции te~~*! по этому разбиению:
Из неравенства хУЖ — \<к^х}ПТ видно, что tk = Л/уТ?->х при
О х t
Рис. 7.
o. Поэтому последнее слагаемое в этой сумме стремится при
о к нулю, и
j
о
Отсюда и из соотношения (9) следует (8). Теорема доказана.
§ 2] ПСЕВДОСЛУЧАЙНЫЕ ЧИСЛА 27
Следствие. Так как математическое ожидание
неотрицательной случайной величины с функцией
распределения 1 — е~х*'2 равно ]/"л/2,то из (8) следует, что
при N —> оо
М1~УЧя/2)Ж (Ю)
Рассмотренная в настоящем пункте модель предложена в статье
[75], там же получена формула A0), а теорема 3 доказана
Л. Н. Большевым и' Д. И. Голенко. Несмотря на грубость модели,
оценки (8) и A0) оказались полезными во многих опытах, связанных
со способами «перемешивания», когда теоретико-числовая оценка
периода практически невозможна. В качестве N выбирается
количество возможных значений функции Ф(х) в конкретной ЭВМ; тогда
можно ожидать, что длина отрезка апериодичности окажется
порядка Y(n/2)N.
Например, в методе п. 2.2.3 на ЭВМ «Стрела» значение функции
Ф(х) (до нормализации) записывается в форме 0, е$, е^,..е^ значит,
Лг==235 и L~2,3-105. На практике для ряда подобных алгоритмов
были экспериментально обнаружены отрезки апериодичности длиной
от 0,8-105 до 3,5-105
Замечание. В книге [19] параграф, содержащий теорему 3,
называется «Критерий проверки периодичности последовательности
псевдослучайных чисел». Однако по этому «критерию» судить о
качестве псевдослучайных чисел нельзя. У некоторых вполне
удовлетворительных последовательностей, полученных по формуле F),
длина L гораздо больше, чем оценка A0) (фактически L~O(N)). В то
же время некоторые последовательности с L &У(л/2) Л^не
удовлетворяют ни одному из основных тестов § 3.
2.4. О более сложных алгоритмах.
2.4.1. Вместо формул вида D), представляющих
собой рекуррентные формулы первого порядка, можно
пытаться использовать для получения последовательностей
псевдослучайных чисел рекуррентные формулы
порядка г
считая, что начальные значения -у<ъ Ть ..., *fr-i заданы.
Вероятно, длина отрезка апериодичности у такой
последовательности при г>\ гораздо больше, чем при /*=1.
Однако теорема, аналогичная теореме 3, даже для
случая г=2 не доказана.
В ряде работ рассматривались методы вида A1),
представляющие собой обобщения методов пп- 2 2 1 и
2.2.2:
28 ПОЛУЧЕНИЕ СЛУЧАЙНЫХ ВЕЛИЧИННА ЭВМ [ГЛ. t
Все же применяются такие методы редко. Наверно
компенсация за сложность этих методов по сравнению с
методами вида D) недостаточна.
2.4.2. Для получения последовательности ^о, Ть
можно одновременно использовать два алгоритма типа
D) с различными функциями Ф(л:) и ^(х):
(ФЫ, если пфО (mod Л!), .
\Ч(Уп)> если п = 0 (modM). l h
В счете по методу A2) почти все время используется
формула 7п+1 = ФGп),и только когда п кратно М,
последовательность «возмущается»: fn+i = 4f (ч«). Поэтому
метод этот, предложенный Д. И. Голенко, назван методом
возмущений, а целое число М — периодом возмущения.
Метод возмущений увеличивает длину отрезка
апериодичности по сравнению с методом D). Вместо
оценки A0) получается оценка (см. упражнение 6 гл. 1)
ML ~J/'(я/2) NM.
Однако необходимо предостеречь вычислителей от
некритического применения этого метода: качество всех
используемых псевдослучайных чисел должно быть
проверено. Наблюдались случаи, когда по каждой из
формул -уп+1 = ф(-уя) или уп+1 = Ч)>('уп) вычислялись удов-
летворительные псевдослучайные числа (с L«|/"(jt/2) N),
а в реализованном по этим формулам методе A2)
числа оказались плохими: не проходил первый тест п. 3.2
(несмотря на то, что L было близко к У(п/2) NM).
2.4.3. Рассмотрим рекуррентную формулу r-го порядка
г—1
<*п+г= 2 ekan+k (mod 2)f; A3)
где во=1, а все остальные коэффициенты е}- и переменные а. могут
принимать лишь два значения—-0 или 1. Если начальные значения
а0, аи . ..аг__!, заданы, то A3) позволяет последовательно вычислить
аг, аг+1 ,... Случай ao = ai = .. ,=ar__1 =0 из рассмотрения
исключается. Уравнение A3) называется моноциклическим, если период Р
решения a0, <zi, . . ,, ап, ... равен Р= V —lf
§ 2] ПСЕВДОСЛУЧАЙНЫЕ ЧИСЛА 29
Нетрудно доказать, что все решения моноциклического
уравнения имеют одну и ту же длину периода Р, и период их совпадает с
отрезком апериодичности.
Пример. Уравнение а„_|_4 = ап + а/г+ г (mod 2)
моноциклическое Если задать начальные значения «0=1, ai = a2 —u<$=0, то
получим последовательность с периодом 15:
100 010 011 010 111 100 010 ...;
если начать со значений ao = ai = a2=a3= 1, то снова получим
последовательность с периодом i'3 *
111 100 010 011 010 111 100 >..,
которая лишь сдвигом номеров отличается от предыдущей.
Уравнение ап+4 = ап + а/г+2 + an+3(mod 2) не
моноциклическое. Если начать со значений ao=l> ai = cc2 = (Z3==0, то получим
последовательность с периодом 7
1000110 1000110 ...,
а если задать начальные значения ao==ai = a2 = a3=l1 то получим
последовательность, состоящую из одних единиц.
В статье Н. Ц и р л е р а [185], где исследованы важнейшие
свойства уравнений A3), последовательности, порождаемые моноцикли-
ческимн уравнениями, называются ^-последовательностями. Термин
«моноциклическое уравнение» введен в [82]. В [176] описаны
электронные схемы, реализующие формулы вида A3); по этим схемам
построены физические датчики псевдослучайных двоичных цифр. Ибо
решения а0, аь.,.,ап, ... моноциклических уравнений во многих
отношениях ведут себя как двоичные случайные цифры (см.
упражнение 7 гл 1).
Например, формула
ап+3) = an + an+3 (mod 2)
порождает последовательности с 1 = Р=231 —1. Проверка 600 000
цифр, получающихся при начальных значениях (а0, ..., а3о) = AОО
101 100 111 НО 001 101 ПО 101 0000), показала, что эти цифры
удовлетворяют основным тестам п. 3.2, сформулированным
применительно к двоичным цифрам (проверка выполнена Ю. Л. Левитаном).
Однако если из цифр а0, аь ... %ап% ... попытаться строить
m-разрядные значения случайной величины у
Yo = 0, а0 ... aw_1, Yl = 0, ат ... а2т_и
Тг=-°> «2/тг ••• аЗт-1» •••>
то пригодность таких чисел, вероятно, окажется ограниченной:
результаты работы Р. Таусворта [172] дают основания ожидать, что
эмпирическое распределение групп
будет близким к теоретическому только при выполнении условия
m-ss^r J
30 ПОЛУЧЕНИЕ СЛУЧАЙНЫХ ВЕЛИЧИН НА ЭВМ [ГЛ. 1
§ 3. Статистическая проверка случайных чисел
Мы видели, что случайные числа, полученные любым
из трех рассмотренных в § 1 методов, необходимо
проверить. Рассмотрим важнейшие критерии, используемые
обычно для такой проверки. Все эти критерии
необходимы для случайных чисел, но о достаточности
критериев можно говорить, только ограничив класс задач,
которые предполагается решать с помощью проверяемых
случайных чисел. Такая точка зрения будет развита в
гл. 7, § 4.
3.1. Статистические критерии согласия
3.1.1. Теорема К. Пирсона. Рассмотрим
произвольную случайную величину §, которая может быть
одномерной или многомерной, дискретной или
непрерывной. Обозначим через X множество возможных значений
§. Фиксируем какое-нибудь разбиение множества Хна г*
попарно непересекающихся множеств Хи .«., Хг таких,
что
Р{Ъе=Х3}=Р!>0 при /=1,2,..., г.
Очевидно, pi+...+pr=P{ge=X}==l.
Выберем N независимых значений ?ь ...,?*
величины | и обозначим через v, количество значений,
принадлежащих Xj. Легко видеть, что математическое ожида-:
ние Mvj=A^pj*).
В качестве меры отклонения «истинных» значений vj
от «теоретических» Np, удобно выбрать величину
72 = "V
Теорема. Каковы бы ни были исходная величина
\и разбиение X=Xi+... -\-XT (такое, что все
*) Случайная величина Vy подчиняется биномиальному закону
распределения с Mv;.= Np- и Dvy. = Np^ A —р^. Совокупность
величин (vi, ... , vf) подчиняется мультиномиальному закону
распределения: при &i+...+ kr=N
§ 3]
СТАТИСТИЧЕСКАЯ ПРОВЕРКА СЛУЧАЙНЫХ ЧИСЕЛ
31
при каждом х>0
N-+CD
- \ kr-i(x)dx%
О
A5)
где плотность km(x)f называемая плотностью
распределения х2 с m степенями свободы, выражается формулой
(рис. 8)
km (х) - [2m 2Г (
3.1.2. Критерий согласия %2. Теорему
предыдущего пункта часто используют в статистике для
проверки гипотез о законе распределения случайной
величины.
У
Рис. 8.
Фиксируем достаточно большую вероятность р,
которую будем называть доверительной вероятностью или
коэффициентом доверия. Вероятность 1—р обычно
называют уровнем значимости. Теоретически в качестве р
можно выбрать любое число 0<р<1. Практически же
выбор р означает, что (в рассматриваемой задаче) мы
считаем событие с вероятностью ^р достоверным, а
событие с вероятностью ^1— р невозможным при
единичном испытании.
Пусть теперь имеется конкретная гипотеза о законе
распределения случайной величины |. В результате
осуществления N независимых экспериментов были
получены N значений |ь ..., %N этой случайной величины
(N достаточно велико). Не противоречат ли эти N
значений нашей гипотезе?
Чтобы ответить на этот вопрос, можно рассуждать
следующим образом. Выберем какое-нибудь число г и
ПОЛУЧЕНИЕ СЛУЧАЙНЫХ ВЕЛИЧИН НА ЭВМ
[ГЛ 1
разбиение множества возможных значений X случайной
величины | на г попарно непересекающихся множеств
Х=Х\-\-... +ХГ. Исходя из нашей гипотезы, можно
вычислить вероятности pi=P{^^Xj}. Предположим, что
разбиение выбрано так, что «все Pj>0. Тогда по
значениям gi, ..., In нетрудно вычислить величины vi, ..., vr
(этот этап в статистике называют группировкой
значений) и по формуле A4) —величину %2N. Если наша
гипотеза справедлива, то (при достаточно большом N)
эга величина достаточно хорошо подчиняется закону
распределения %2 с (г—1) -й степенью свободы. Из
уравнения
f ?r_, (л-) dx = 1 — p
X?(A 1, 1-P)
можно найги значение y2(r— 1, 1 — P), отвечающее
фиксированному нами уровню значимости 1—р (рис. 9).
Если наше значение Х^<Х2(Г~~1> 1—Э)9 то этот
результат не противоречит нашей гипотезе; если же X2N^
>X2(r—h I—P), то, в
соответствии со сделанным
соглашением, это
означает, что наступило
невозможное событие, и
гипотеза должна быть
отброшена, так как она
привела к противоречию.
Конечно, вывод этот
зависит от выбранной до-
Рис д. верительной
вероятности и поэтому не носит
абсолютного характера. Чаще других используют
доверительные вероятности [3 = 0,95; 0,99; 0,999;
соответствующие уровни значимости 1—-[5 = 0,05; 0,01; 0,001
называют 5%-ным, 1%-ным и 0,1%-ным уровнями. Если
1%&*%2(г—1, 1—р) при р=0,95, то значение х^
называют почти значимым, при р = 0,99 — значимым, а при
Р=0,999 — высоко значимым (рис. 10).
На практике широко используют таблицы
распределения х2 (см. стр. 293), в которых приведены значения
о
§ 31
СТАТИСТИЧЕСКАЯ ПРОВЕРКА СЛУЧАЙНЫХ ЧИСЕЛ
33
Р) —корпи уравнения
со
\ km (х) их = Р,
X2
A6)
где, очевидно, Р= 1—р. Если полученному в эксперич
менте значению %n при
т = г—1 отвечает в
таблице Р<0,001,то это
значение %2N высоко
значимо. Например, если при
г =10 получено значение
y2N =9,4, то по таблице
при девяти степенях
свободы находим, что Рж
я^0,40; следовательно,
полученное значение x2v
Допустимо.
Рпс. 10.
3.1.3. Замечания о применении критерия %2.
а) О выборе разбиения. Если N заранее ограничено, то
нельзя выбирать г слишком большим, так как тогда будут малыми
величины Npj и неустойчивыми значения vy . Обычно рекомендуют
выбирать X] так, чтобы минимальные Npj были не меньше чем 20.
б) О больших г. В таблицах %2 число степеней свободы т
обычно не превосходит 30. При больших значениях можно
использовать таблицу интеграла вероятностен (стр. 293), так как
распределение величины ?=У2%2 — у2т близко к нормальному с параметрами
@; 1):
«-! П
Ф(гI,
где z — У2хг~У2т. В [5] имеется таблица поправок к последней
приближенной формуле.)
в) О многократном применении критерия %2.
Соглашение о невозможности события с вероятностью ^1—р = Р
справедливо для единичного испытания. Если мы будем повторять наш
опыт много раз, то (в среднем) для 100 Р% полученных значений %2N
соответствующие вероятности окажутся меньше Р (при условии, что
гипотеза наша верна).
г) В некоторых случаях гипотетическое распределение
величины содержит неизвестные параметры аи ..., а$ и эти
параметры оцениваются по результатам тех же W испытаний (т. е. но
вначениям ?ь ,,., lN). Тогда также можно использовать критерий
3 И. М. Соболь
34
ПОЛУЧЕНИЕ СЛУЧАЙНЫХ ВЕЛИЧИН НА ЭВМ
[ГЛ 1
X2 для проверки согласия между значениями ?i, ..., ?д, и
гипотетическим распределением с подобранными параметрами. Однако
предельное распределение следует рассматривать с m=r—s—1
степенями свободы [44].
д) О «с л и ш к о м хороших» значениях/2. Допустим, ч го
сосчитанное значение %^ оказалось столь малым, что
соответствующее ему значение Р>0,99 В этом случае значения gb .... lN
настолько хорошо подчиняются гипотетическому распределению, что ...
возникает сомнение в их «случайности».
Как мы увидим ниже в гл. 7, для решения некоторых задач
важно именно хорошее распределение значений (а не «случайность»),
и такие «слишком хорошо» распределенные значения позволяют
быстрее решать эти задачи.
3.1.4. Критерий со2. Рассмотрим одномерную
случайную величину ? с функцией распределения F(x).
Выберем N независимых значений
1ь •••»?* этой случайной
величины и построим
эмпирическую (или выборочную)
функцию распределения
где SN(x) равно количеству
значений, меньших чем х. (На
рис. 11 N=5). Так как
Fn (х) — это частота
события {?<*} при N испытаниях,
а вероятность этого события
(х) сходится по вероятности *)
i(x) от F(x) часто
х
Рис. 11.
P{t<x}=F(x), то
к F(x), когда N-+OO.
В качестве меры
используют величину
отклонения
J IF(x)-Fn(x)]%(IF(x).
.1A8)
Теорема (Р. Мизес, Н. В. Смирнов). Какова бы
ни была случайная величина | с непрерывной функцией
*) Последовательность случайных величин t|i, ..., i)N, ...
сходится по вероятности к постоянной с, если при любом Л>0 вероят*
ность
Р 11п^—¦
0л когда N-+oo,
§ 3]
СТАТИСТИЧЕСКАЯ ПРОВЕРКА СЛУЧЛПНЫХ ЧИСЕЛ
35
распределения F'(*), при каждом
N-+CQ
A9)
где функция а1 (х) от \ не зависит.
На этой теореме основан критерий согласия со2,
позволяющий проверять гипотезы о функции
распределения одномерной непрерывной случайной величины g.
Схема использования этого критерия точно такая же,
как схема использования критерия %2: фиксируется
доверительная вероятность [J; из уравнения
находится соответствующее значение лгр (рис. 12;
таблица функции а\(х) на стр. 293); по гипотетической
функции распределения F(x) и эмпирической функции
распределения FN {x) вычисляется ®%; если величина
ft>A^#p, то это означает, что наступило невозможное
событие или, другими словами, наша гипотеза привела
п
1,0
р ¦—-Х^- У"а№ ¦
1,0
\
1
4/5
3/5
2/5
i
i
i
¦ У=>
-
i
i
1 1
X
Рис. 12.
Рис. 13.
к противоречию. Конечно, предполагается, что
количество значений N достаточно велико.
По сравнению с критерием %2 критерий о>2 имеет
одно преимущество: не нужна группировка значений (и,
стало быть, не надо вводить параметр г). Применять
критерий можно обычно уже при JV>50. Однако, чтобы
вычислить со2, нужно расположить значения ?i, ..., gw
в порядке возрастания:
8*
36 ПОЛУЧЕНИЕ СЛУЧАЙНЫХ ВЕЛИЧИН НА ЭВМ [ГЛ. I
(Такой ряд выборочных значений называется в
статистике вариационным рядом). Если количество значений
(т. е. N) превышает объем внутреннего накопителя ЭВМ,
то расположение их в порядке возрастания
представляет собой весьма трудоемкую процедуру. Из-за этого при
очень больших N критерий со2 используют редко.
Выведем теперь .формулу для расчета Од,. Во-первых, нетрудно
проверить, что
F*N(x) = k/N при ?(/0<*<?(fc+i),
где k = 0, 1, ..., N, и условно ?@)=—со^(Лг4-])==00(Рис- 13). Далее
условимся для краткости писать Fk вместо F(l(k)). Тогда из A8)
следует, что
fe=o i{k)
N
Z
- 2 f т
k=0L
k=0
L 3 N + Nz \+ N Fk~~ N *
Сумма первых двух квадратных скобок легко вычисляется.
Последние члены дополним до полного квадрата:
Порле несложных вычислений получим окончательную формулу,
которую удобно записать в следующем виде:
§ 31 СТАТИСТИЧЕСКАЯ ПРОВЕРКА СЛУЧАЙНЫХ ЧИСЕЛ 37
3.2. Проверка таблиц случайных цифр. Для
проверки таблицы случайных цифр еь е2, ..., гм М. Г. Кен-
далл и Б. Б. Смит предложили использовать четыре
теста. В каждом из них цифры классифицируются по
некоторому признаку и эмпирические частоты
сравниваются с их математическими ожиданиями при помощи
критерия х2- Тесты эти: проверка частот (frequency
test) — проверяется частота различных цифр в таблице;
2) проверка пар (serial lest) — проверяется частота
различных двузначных чисел среди пар 8182, 8283,
ез84, ¦«., ejv-i sN; 3) проверка интервалов (gap test) —•
проверяется частота различных интервалов между
двумя последовательными нулями; 4) проверка
комбинаций (poker test)—проверяется частота различных
типов четверок (abed, aabc, aabb> aaaby aaaa) среди
четверок 81828384, 82838485, .. ¦
Большинство последующих авторов также
использовали эту систему тестов, внося, однако, в нее некоторые
изменения, среди которых отметим два. Вместо
проверки интервалов обычно используют проверку серий (run
test): цифры eft+i, eft+2, ..., eh+i образуют серию длины/,
если е/{+1=--е7г+2= ... = ek+h но ел#=еА+ь eh+i+i?=eh+l.
Вместо проверки пар 8182, 8283, е384, ... преверяют
независимые ПарЫ 8182, 8384, 85SG, . . .
С - детерминистической точки зрения (она изложена
в гл. 7) проверка частот и проверка независимых пар —
важнейшие необходимые тесты. Проверка серий
обобщает «критерий случайности», часто используемый в
статистике [24]. И только проверка комбинаций носит
несколько искусственный характер. Поэтому можно
рекомендовать в качестве основных использовать
следующие два теста.
Первый тест (проверка частот и пар).
Предположим, что количество цифр N=2N' четное. Цифры вь ...
.. ., 8лг разобьем на пары 8182, 8384, .. .* Zn-i&n*
Обозначим через Уц количество пар (/'. Сосчитав матрицу
( /, /^9, легко вычислить тякже величины
Смысл этих величин очевиден: v<. — количество цифр,
38 ПОЛУЧЕНИЕ СЛУЧАЙНЫХ ВЕЛИЧИН НА ЭВМ [ГЛ. 1
равных i, среди цифр еь сз, 85, ..., Zn-u v-i—
количество цифр, равных i, среди цифр е2, гь .... ?n\ v* —
общее количество цифр, равных /.
По значениям vih viy v*. и v.j можно сосчитать
величины хуу для нескольких проверок. Самые важные
среди них (индексы N или N' обычно не пишут):
с 9 степенями свободы, соответствующая проверке ча-:
стот, и
о
с 99 степенями свободы, соответствующая проверке пар.
Кроме того, иногда вычисляют величины
9 9
Х^оЖ'Й^'-0'1^2 и зс8 = оЛлГ'/?о^-/-°'Ш/)а'
каждая с 9 степенями свободы; эти величины
соответствуют проверке частот среди цифр с нечетными и
четными номерами.
Используют также критерий независимости строк и столбцов
матрицы Vf у, которому соответствует величина
с 81 степенью свободы [44] Впрочем, последний критерий на
практике оказывается весьма близким к проверке пар
Второй тест (проверка серий). Сосчитаем
количества rii серий длины / в последовательности цифр
8ь ..., 8л- при /==1, 2, ,.., т, и пусть ftm-j-i
—количество серий с /^т+1 (они объединяются в одну
группу). Обозначим общее количество серий через /i =
— ni + v +#m + Ят+г Величина %2 с т степенями
свободы вычисляется по формуле
" U "Р1 пРт+1
гдер,=9-10-',
§ 31
СТАТИСТИЧЕСКАЯ ПРОВЕРКА СЛУЧАЙНЫХ ЧИСЕЛ
Обозначим через К случайную длину серии, начинающейся с
цифры ел+1(т. е. ek+i?=ek). Очевидно, pL Р {к = 1} = Р { еь+1 =
r=8fe+2 = ... = efe+/=^6^+l_|_1} = @,l)/-10,9 = 9-10-/ и от номера
серии не-зависит. Таким образом, каждая серия может с вероятностью
Pi иметь длину /. Количество щ серий длины / среди п серий
подчиняется биномиальному распределению и Мгц = /гр/.
В качестве примера в табл. 2 приведено распределение по длине
серий, полученных при проверке /V = 50 000 ч;сел в [75].
Таблица 2
Теоретические
чения
Эмпирические
ченнч
зна
зпа-
..
40 500
40 508
40 531,5
4050
4010
4053,
2
п.
405
417
405,
3
п1
4
45
40
45,0
п
45 000
45 035
__
По данным последних двух строк вычисляем х2—1>39. При w =
этому значению соответствует Р — 0,71.
Дополнительные тесты. В качестве
дополнительных тестов следует в первую очередь рекомендовать
проверку частот независимых троек езА+1вз*+2взл+з> затем
четверок 84^+184^+2646+364^+4 и т. д.— основания для такой
рекомендации приведены в § 4 гл. 7. Так как
количество различных троек, четверок и т. д. весьма велико
A03, 104, ,..), то подсчет всех типов групп имеет смысл
проводить лишь для достаточно больших N. При
меньших N группы можно объединять по различным приз-
пакам. Например, при упомянутой выше проверке
комбинаций четверки eh+\... eft+4 классифицируются по
количеству совпадающих цифр в группе (признак,
напоминающий комбинации при игре в покер).
Во многих работах предлагаются различные
дополнительные тесты. Имеет место даже чрезмерное
увлечение такими тестами. Несмотря на справедливость
принципа «каши маслом не испортишь», надо четко
представлять себе, что все такие тесты только
необходимы. Положительный результат любого теста означает
только, что этот результат не противоречит гипотезе
40 ПОЛУЧЕНИЕ СЛУЧАЙНЫХ ВЕЛИЧИН НА ЭВМ [ГЛ 1
о случайности цифр еь ..., en, но, может быть, какой-
нибудь другой тест эту гипотезу опровергнет...*).
3.3. Проверка псевдослучайных чисел. В качестве
основных тестов для проверки псевдослучайных чисел
7ь ..., 4n используют те же тесты, что и для проверки
таблиц: проверяются первые десятичные цифры гк=
= Ц(\0^к). Фигурирующая в первом тесте величина
vi} равна количеству пар (^fc-i, 72*) таких, что
Более детальную проверку распределения чисел
¦уь ..•> Tiv можно осуществить с помощью критерия со2.
Если расположить эти числа в вариационный ряд
Yd)< YB)
то из B0) вытекает, что
V
Однако, как уже отмечалось в п. 3.1.4, при очень
больших N построение вариационного ряда весьма
трудоемко.
Естественно, что при проверке псевдослучайных
чисел всегда используют различные дополнительные тесты
для проверки последующих десятичных цифр ук. Иногда
десятичные (или двоичные) цифры чисел ^ выделяют
и проверяют независимо. Конечно, лучше было бы
использовать тесты п. 3.2 с более мелким разбиением, но
уже при совместной проверке двух десятичных цифр
пришлось бы вычислять матрицу (v«) размером 100Х
ХЮО. Поэтому на практике ограничиваются более
простыми проверками, и -далекие цифры чисел ук обычно
оказываются хуже проверенными.
В пользу указанной системы тестов можно привести
аргумент практического характера: в литературе,
пожалуй, нет примеров, когда числа, удовлетворяющие всем
*) Более того, имея конечную группу цифр еь ... eNy всегда
можно придумать такой тест, зависящий от конкретных значений
еь ••-, sNy который опровергает нашу гипотезу. Но не надо такие
тесты придумыватьL.
§ 31 СТАТИСТИЧЕСКАЯ ПРОВЕРКА СЛУЧАЙНЫХ ЧИСЕЛ 41
тестам, оказались бы непригодными для решения
конкретной задачи (в которой не предъявлялись
повышенные требования к точности решения); есть, однако,
примеры неудачных расчетов с помощью чисел, которые
не удовлетворяли одному из тестов. В частности, из-за
того, что числа, упомянутые в п. 2.2.4, не
удовлетворяли тесту проверки пар, плохо моделировалось
нормальное распределение.
Таким образом, строго говоря, разумность
приведенной системы тестов — факт эмпирический. В
действительности эти тесты не гарантируют универсальной
пригодности чисел. Поэтому иногда целесообразно вводить
дополнительные тесты, связанные с характером
решаемых задач. Впрочем, успешное решение нужной
задачи— самая лучшая проверка случайных чисел.
3.4. О проверке датчиков случайных чисел. Для
проверки чисел, выдаваемых датчиком, можно использовать
те же тесты, что и для проверки псевдослучайных чисел.
Особенность проверки датчиков в том, что
проверяются не те числа, которые используются в счете. Поэтому,
кроме проверки «качества» выдаваемых чисел, должна
еще как-то гарантироваться устойчивость работы
датчика.
Мы не будем останавливаться на технических
способах контроля. Отметим только, что обычно расчет
тестов, вроде рассмотренных в пп. 3.2 и 3.3, проводят и
до, и после расчета нужной задачи, если она не
слишком продолжительна во времени.
3.5. О проверке больших массивов случайных чисел. Так как в
расчетах часто используется не вся таблица, а только часть ее, то
имеет смысл проверить также части таблицы. Например, таблицу,
содержащую N цифр, разбивают на 5 частей по N\ = N/s цифр и
проверяют каждую из этих частей. Если s>>50, то вполне вероятно
среди значений %% » соответствующих одному (какому-нибудь)
критерию, встретить значение, отвечающее Р<0,01. Это не означает, что
вся таблица плоха: * просто данную часть не надо использовать как
самостоятельную таблицу в расчетах, в которых требуется &N\
случайных цифр.
Можно проверить, согласуются ли s полученных значений %2N
с теоретическим распределением %2 для данного критерия. Такая
проверка нередко используется в качестве дополнительного теста. И
с этой точки зрения ясно, что отдельные «плохие» значения %2Ni
обязаны появляться, если гипотеза справедлива и $ достаточно
велико.
42 ПОЛУЧЕНИЕ СЛУЧАЙНЫХ ВЕЛИЧИН НА ЭВМ [ГЛ Г
Некоторые авторы предлагают использовать гакую проверку
таблицы по частям вместо проверки таблицы как целого. К
сожалению, это неверная рекомендация. Автору известен пример, когда
500 00Q цифр проверялись и как целая таблица и по частям: 20
частей по 25 000 цифр. Все части удовлетворяли всем пяти критериям
первого теста (п. 3.2), распределение полученных значений Xjvt для
каждого из критериев хорошо согласовалось с теоретическим
распределением %2. Однако весь массив из 500 000 цифр не удовлетворял
ни одному»из критериев первого теста (причем для одного из
критериев было Р<0,00001!)
Такому несколько неожиданному результату можно дать
следующее объяснение. Можно предположить, что рассматриваемая
последовательность цифр имеет распределение, несколько
отличающееся от равномерного, но для расчета по N\ цифрам такое отличие
допустимо. Отсюда не следует, что это отличие по-прежнему будет
допустимым для расчета, в котором используются N>N\ цифр.
Наоборот, если увеличение количества цифр вызвано желанием
увеличить точность расчета, то ясно, что при достаточно большом N
отличие это станет недопустимым
Итак, к большим массивам случайных цифр (или чисел) предь-
являются большие требования. Этот факт хорошо известен
практикам: подобрать хорошую псевдослучайную последовательность,
содержащую 103— 104 чисел, гораздо проще, чем подобрать такую же
последовательность, содержащую 105—106 чисел*).
Это следует иметь в виду также при проверке датчиков
случайных чисел: нехорошо проверять датчик тестами, охватывающими
103— 104 чисел, а в расчете использовать 10б—107 чисел.
Упражнения к главе I
1. Доказать, что коэффициент корреляции случайных величии
Y и г] = Д(|ГУ) ПРИ делом g^\ равен \/g.
2. Как с помощью таблицы случайных цифр (стр. 295)
моделировать последовательность независимых испытаний, в каждом из
которых вероятность наступления некоторого события А равна
Р{Л} =0,752?
3. Предположим, что количество v элементарных частиц,
попадающих в детектор за время А/, подчиняется распределению
Пуассона со средним значением bAv — aAt. Пусть ? = v(mod2). Доказать,
что при аД/->оо вероятности Р{|=0} и Р{| = 1} стремятся к 1/2.
На этом принципе построены некоторые датчики случайных цифр.
4. Рассмотреть случайную величину ц=Д(?у2) с целым g и
доказать, что P{r\<x}=x+V'x/g + О(х/ Vg) при х>0 и g ->оо
(К. Д. Точер [174]).
*) Иногда высказывают мнение, что критерии %2 или со2 слишком
жестки при очень больших N. Однако, как показывают формулы
B7) и C0) гл. 7, именно постоянство %% или со^ регулирует
упомянутое в тексте повышение требований к большим массивам
случайных чисел, если требовать, чтобы погрешности, фигурирующие в
этих фор .мулах, убывали как /7
УПРАЖНЕНИЯ К ГЛАВЕ 1 43
Из этой формулы следует, что хотя Р {ц < х) -* х при g-^oo
тем не менее при g=]0k и х=Ю~'к вероятность Р{т)<10"~*} « 2-10~~/е,
что в два раза больше, чем при равномерном распределении. Так как
алгоритм Уп+l = Д AO*yJP близок к алгоритму середины квадрата:
у произведения у\ отбрасываются k старших цифр слева, то этот
результат в какой-то мере объясняет, почему в методе середины
квадрата получается больше, чем надо, малых чисел.
5. Доказать, что если М с g и М с то взаимно простые, то из
формулы G) следует, что
а) тп=я ёпЩ (mod M);
б) для последовательности /По, rri\,---,mn всегда L —Р;
в) длина периода Р равна наименьшему целому корню
сравнения gp —isO(modiW).
6. Обобщить теорему 3 на случай метода возмущений A2)*
lim P {L/ УТШ < х] = 1 — е"х2/2.
N->oo
Указание. Предположить, чго при всех возможных
аргументах х функции Ф(х) и xV(x) не равны и использовать
вероятностную модель п. 2.3. Роль L играет номер опыта, в котором впервые
YL=v/, /<L, и в то же время L —/^-0(mod М) (И. М Соболь [79]).
7. Доказать, что если последовательность а0, аь ..., ап ...
удовлетворяет моноциклическому уравнению A3), то при каждом s
таком, что l^s^r, среди групп вида (а^,..., an_^s_] ) при 0^/7^
^Р — I встречаются по 2r~~s раз все возможные группы, состоящие
из нулей и единиц, кроме группы @, ... , 0), которая встречается
2/--S — 1 раз. (н. Цирлер [185]).
Указание. Доказать сначала это для s = r.
8. В качестве меры отклонения F*N (х) от F(x) (см п. 3.1.4)
можно использовать величину
D=* sup \F*N(x)-F(x)\.
— <х><х«х> ' 1У l
Критерий Колмогорова, близкий к критерию со2 и в некоторых
случаях более удобный, основан на теореме А. Н. Колмогорова.
Теорема. Какова бы ни была случайная величина | с
непрерывной функцией распределения F(x), при каокдом 0
lim Р { /Л' D < х) - К (х),
N
(Таблица функции распределения Колмогорова К(х) имеется на
стр. 293)
Доказать, что для расчета D можно использовать формулу
D =
ГЛАВА 2
ПРЕОБРАЗОВАНИЯ СЛУЧАЙНЫХ ВЕЛИЧИН
В этой главе рассмотрены преобразования,
позволяющие с помощью случайных чисел *у вычислять
значения любой случайной величины |. Такие вычисления
называют моделированием случайной величины | или
формированием реализаций случайной величины ?.
Впрочем, вычислители предпочитают их называть
разыгрыванием величины g. Владение этими
преобразованиями необходимо каждому, кто желает овладеть
«техникой» применения методов Монте-Карло.
Автор не старался изложить здесь максимальное
количество рецептов для моделирования различных
величин— это сделано в специальной литературе (см.
[19, 69, 111]). Упор сделан на изложение методов и их
систематизацию. Впервые в основу классификации
преобразований положено количество случайных чисел,
используемых при расчете одного значения \. Поначалу
этот принцип может показаться несколько
искусственным, по в полной мере его роль выяснится в гл. 7.
Некоторые из общих методов, наиболее важные с
точки зрения практики, сформулированы в виде теорем.
Замечания практического характера см. в п. 5.7.
§ 1. Метод обратных функций
(основной прием моделирования случайных величин)
1.1. Моделирование дискретных случайных величин.
Рассмотрим дискретную случайную величину | с
распределением
Х\ X<i ... Хп \ ,..
Pi Pi .^ PnJ
§ 1] МЕТОД ОБРАТНЫХ ФУНКЦИЙ 45
где р{= Р {1 = х{}. Для того чтобы вычислить
значения этой величины разделим интервал 0^у<1 на
интервалы Дг- такие (рис. 14), что
длина Д4 равна рг.
Теорема 1. Случайная величина g,
определенная формулой I
%=хи когда *уеД,, B)
имеет распределение вероятностей A).
Доказательство занимает одну строку: 4/
= длина Ai = pi.
Для практической реализации формулы B) Рис. 14.
удобно в накопителе ЭВМ расположить подряд
значения хи x2i ..., хп и ри Pi+P2, Р\+Р2+Рг, -., 1. Для
того чтобы вычислить очередное значение |, находим
очередное у. Затем сравниваем -у с р\. Если ^<.р\У то
1 = х{\ если 'i'^pu то сравниваем у с Р\+р*. Если
, то |==^2; если ^^Р\-\-Р2ь то сравниваем f с
3, И Т. Д.
1.1.1. Легко видеть, что в случае, когда ? = Xi (l^i^n— 1),
приходится осуществить i сравнений, и лишь в случае, когда % — хп,
число сравнений равно п—\. Поэтому среднее число сравнений,
затрачиваемых при получении одного значения |, равно
п-1
Так как порядок значений хи ...,хп в A) произволен, то выгодно
расположить их в порядке убывания вероятностей, т. е. так, чтобы
Px^-pi^- . .. z^Pn* Тогда величина t будет минимальной (Ю. Г. Пол-
ляк [69]).
1.1.2. Расчет по формуле B) заметно упрощается в
случае, когда все значения Х\, ..., хп
равновероятны: р\= ... =рп= \/п. В этом случае многократные
сравнения не нужны: так как Д, — это интервал
(i—\)/n^iy<.iJn, то условие ^еД< равносильно
условию i—1^^Y</, или Ц(щ)—1—1. Вместо формулы
B) можно записать, что
%=хи где /
46 ПРЕОБРАЗОВАНИЯ СЛУЧАЙНЫХ ВЕЛИЧИН [ГЛ 2
1.1.3. Теорему 1 легко обобщить на случайную
величину, которая может принимать бесконечную
последовательность значений хи х2, ..., хП9 ... и имеет
распределение
* х\ %2 • • • %п
\ Pi Ръ • • • Рп
В этом случае числа хп и рп задаются формулами, и
вычисление их при каждом расчете | может оказаться
весьма трудоемким. Тогда можно выбрать число яотак,
чтобы сумма вероятностей pi+... -\-рщ была
достаточно близкой к 1, и значения хи ..., хПо и рь ..., p,h
заготовить заранее. Вычислять х{ и р* по формулам
придется только при i>nd9 а это будет достаточно редко.
1.2. Моделирование случайных событий.
Моделирование случайных событий сводится к моделированию
дискретных случайных величин. Чтобы показать, как
это делается, рассмотрим четыре задачи, в каждой из
которых требуется моделировать последовательность
одинаковых независимых испытаний.
1.2.1. В каждом из испытаний может наступить или
не наступить некоторое событие Л, вероятность
наступления которого Р{А}=р задана.
Рассмотрим случайную величину |, называемую
индикатором события Л, которая равна 1 при наступлении
Л и 0 при наступлении противоположного события Я.
Распределение ? задается таблицей
41 о
Р 1 —Р
Согласно теореме 1 для осуществления каждого
испытания надо найти случайное число ^ и проверить
неравенство Y<P- Если оно выполнено, то событие Л в этом
испытании произошло, а если *f^P> то нет.
1.2.2. С испытанием связана полная группа попарно
несовместных событий*) Ль ..., Ап и заданы
вероятности P{Ai}=pi.
Для моделирования таких испытаний рассмотрим
случайную величину % — номер наступившего события.
*) Это значит, что сумма Ai+...+ An есть достоверное собы«
тие и А -Л = 0 при 1ф\.
§ 1] МЕТОД ОБРАТНЫХ ФУНКЦИИ 47
Очевидно, распределение | выражается таблицей
1 2 ... п
Pi Рг • • • Рп
Для осуществления каждого испытания надо выбрать
случайное число f и по теореме 1 разыграть значение g.
Если ? = /, то произошло событие Аи
Пример. Столкнувшись с ядром атома урана, нейтрон может
рассеяться, быть захваченным или вызвать деление ядра. Если через
2s' 2с' 2/ обозначить соответствующие этим событиям сечения
взаимодействия, а через ^ = 2* ~^~ 2с "^ 2/ — полное сечение
взаимодействия нейтрона с ядром, то вероятности трех возможных
событий равны соответственно 2У2' 2</2 и 2/2* Чтобы
разыграть «судьбу» нейтрона при столкновении, выбирают случайное
число y*> если y< 2/2» то считают> что нейтрон рассеялся; если
<a2j/2) ' B</2), то нейтрон поглотился; еслиBУ2)~^
у, то нейтрон вызвал деление ядра.
1.2.3. С испытанием связаны два независимых совместных
события А и В, вероятности которых заданы: Р {А} = pAi Р {В} = рв.
Ввиду независимости событий А и В можно последовательно
моделировать их наступление в каждом испытании: сперва по числу
Yi методом п. 1.2 1 определить, наступило ли событие Л, а затем
точно также по числу Y2 определить, наступило ли событие В.
Однако часто более экономен другой способ. Рассмотрим полную
группу попарно несовместных событий, состоящую из четырех
событий:
Л_. Л D Л ¦ /I D Л A ft A A fi /*3\
Вероятности этих событий легко вычислить:
Следовательно, метод п. 1.2.2 позволяет, используя одно
случайное число у» определить, какой из этих четырех исходов наступил в
моделируемом испытании
1.2.4. С испытанием связаны два зависимых совместных события
А и В, и заданы вероятности Р{А} = рА, Р {В} = рв, Р [АВ] = рАВ.
В этом случае также следует рассмотреть полную группу
событий C), только вероятности этих событий вычисляются иначе:
Впрочем, и в этом случае можно осуществить последовательное
моделирование событий А и В, используя два случайных числа
48
ПРЕОБРАЗОВАНИЯ СЛУЧАЙНЫХ ВЕЛИЧИН
[ГЛ. 2
Yb Уг- Сперва по числу Yi (методом п. 1.2.1) определяем, наступило
ли событие А. Если А наступило, то, зная условную вероятность
Р{В/А} = рАВ/Рл, можно по числу у2 определить, наступило ли
событие В: условием наступления, В служит выполнение неравенства
у2<Р{В/А}. Если же событие А не наступило, то наступление В
придется разыгрывать с помощью условий вероятности Р{В/А}, которая
равна Р{ВЩ = (рв — Рлв)/(\ — рА).
1.3. Моделирование непрерывных случайных величин.
Предположим, что случайная величина | определена в
интервале а<х<Ь и имеет плотность /?(я*)>0 при
а<Сх<Ь. Обозначим через F(x) функцию
распределения g, которая при a<ix<Zb равна
F (х) - j p (и) du.
Случай а= — оо и (пли) Ь = оо не исключается.
Теорема 2. Случайная величина ?,
удовлетворяющая уравнению.
имеет плотность распределения р(х).
Доказательство. Так как функция F(x) строго
возрастает в интервале (а, Ь) от F(a)=0 до F(b) = l,
то уравнение D) имеет единственный корень при каждом
7 (рис. 15). При этом равны
^А вероятности
У
Fix)
И так как случайная
величина ч равномерно
распределена в интервале @,1), то
Рис. 15.
а ° **лтил * =F(x+dx)-F(x)=p(x)dx,
что и требовалось доказать.
В тех случаях, когда уравнение D) аналитически
разрешимо относительно ?, получается явная формула
для разыгрывания случайной величины |, где
§ 1] МЕТОД ОБРАТНЫХ ФУНКЦИЙ 49
G(y)—обратная функция по отношению к y=F(x).
В других случаях можно уравнение D) решать
численно. Если объем накопителя позволяет, то удобно
составить таблицу функции G(y)y 0<#<l, и по ней
находить значения §. Иногда удобно использовать таблицу
функции F(x), a<x<ib, и находить значения \
обратной интерполяцией. О некоторых приемах составления
таблиц см. [8, 9, 90].
Пример Экспоненциальная случайная
величина!; определена при *0<*<°° с плотностью
Так как
F (х) = | a(?-d<"-*"> du^l- e-a<*-4
то уравнение D) примет вид
1 __?-«<? -*о) = у#
Отсюда получаем явное выражение для расчета §
g = *o-(l/fl)ln(l-Y). E)
1.4. Метод обратных функций. Теоремы 1 и 2
представляют собой частные случаи общего метода, который
естественно назвать методом обратных функций (наряду
с названием inverse functions method встречается также
direct method).
Рассмотрим произвольную случайную величину | с
функцией распределения F(x) — P{|<x} (рис. 16, а).
Обратную по отношению к F(x) функцию G(y)
определим следующим образом. Во-первых, дополним график
функции y=F(x) вертикальными отрезками в точках
разрыва до непрерывной линии y=F0(x) (рис. 16, б);
функция y=F0(x), вообще говоря, неоднозначна. Эту
же линию можно записать уравнением вида x~G0(y).
где функция Go (у) опять-таки не обязана быть
однозначной: интервалам постоянства F0(x) соответствуют
вертикальные отрезки' G0(y) и наоборот. Положим
G(y) = G0(y) в точках непрерывности и G(y)==G(y+0)
в точках разрыва (рис. 16, в).
Построенная таким образом однозначная функция
G(y) не убывает при 0<#<1 и непрерывна справа во
4 Ц, Щ, Соболе
50
ПРЕОБРАЗОВАНИЯ СЛУЧАЙНЫХ ВЕЛИЧИН
[ГЛ. 2
всех точках*). Функции F(x) и G(y) связаны
следующим свойством: G(y)<Cx тогда и только тогда, когда
y<F(x). Для доказательства этого свойства достаточно
проверить, что каждое из двух неравенств G(y)<Cx и
y<CF(x) означает, что
точка {G(y), у) располсь
жена на линии y = F0(x)
одновременно и левее и
ниже точки (х, F(x))
(рис. 17).
Теорема 3.
Случайная величина
l = G(t) F)
имеет функцию
распределения F (х).
Для
доказательства теоремы нужно
вычислить функцию
распределения случайной
величины |, определенной
формулой F):
То, что теорема 1
предоставляет собой частный
случай теоремы 3, видно
из сравнения рис. 18, на
котором изображена
функция x=G0(y),
соответствующая дискретной
случайной величине, с рис. 14:
если теД* на Рис- 14> то
GQD)=Xi на рис. 18.
В условиях теоремы 2
функция G(y) совпадает с обычной обратной функцией
kF(x) и уравнение F) равносильно D).
*) Аналитическое определение: функция G(y) равна нижней
грани множества чисел х, для которых y<F(x)t т. е.
G(y)= inf x.
§ II
МЕТОД ОБРАТНЫХ ФУНКЦИЙ
51
Заметим, что так как случайная величина 1—-у
имеет то же распределение, что у, то в формулах B), D),
F) можно вместо у написать 1—у. Следовательно,
указанные способы моделирования не единственно
возможные. Иногда замена у на 1—f несколько упрощает
формулы расчета. Например, вместо формулы E) можно
использовать формулу
Е=^о—A/аIп у. G)
Итак, метод обратных функций позволяет записать
формулы для моделирования любой случайной
величины g. Но нередко этот метод приводит к сложным или
-И
Н
Рис. 18.
просто неудобным алгоритмам. Например, для того
чтобы вычислять значения гауссовской (нормальной)
случайной величины Е; с параметрами @; 1),
приходится решать уравнение
J
J e-^2dt =
В таких случаях обычно прибегают к помощи других
методов моделирования, связанных с другими
преобразованиями случайных чисел у.
1.5. Преобразования вида %=g(t). Попытаемся
найти всевозможные функции g(y) такие, что случайная
величина §(ч) имеет функцию распределения F(x). Для
этого необходимо и достаточно, чтобы Р{§"(у) <x}—F(x).
Введем единичную функцию
@ при г<0,
A при г>0.
52
ПРЕОБРАЗОВАНИЯ СЛУЧАЙНЫХ ВЕЛИЧИН
Так как плотность pv(f/) = l при 0<у<С1, то
Р {g (У) < х} - J ру (у) dy =ie(x-g (у)) dy.
[y\g(v)<x) 6
Таким образом, получаем уравнение, которому должна'
удовлетворять функция g(y):,
1
$e{x-g(y))dy = F(x). (8)
Общее решение уравнения (8), по-видимому, неизвестно *).
Однако легко указать частные классы функций g(y), в которых
решения существуют. Для простоты ограничимся случаем, когда
моделируемая величина ? принимает значения в интервале а<х<С.Ь и
имеет плотность вероятностей р(\)>0 при а<.х<.Ь.
х
Ъ
М1
Рис. 19.
Рис. 20.
Пусть g(y) строго возрастает при 0<у<1 и ^@)=а, g(l)=6.
Тогда из рис. 19 видно, что e(x—g(y)) = \ при 0<у</г(х), где
h(x)—функция, обратная по отношению к g(y). Из (8) вытекает,
что
Их)
F(*)= f dy = h(x). (9)
6
Переходя к обратным функциям, запишем, что g(y) равна G(y) —
обратной функции к F(x). Мы пришли, таким образом, к методу
обратных функций 6 = G()
*) Если моделируемая случайная величина ? непрерывна, то
плотность ее p(x)=F'(x), Дифференцируя (8) с учетом того, что
e'(z)=b(z) —дельта-функция Дирака,получим вместо (8) уравнение
— g{y))dy ^ р{х).
§ 2] МОДЕЛИРОВАНИЕ МНОГОМЕРНЫХ ВЕЛИЧИИ 53
Пусть теперь g(y) строго убывает при 0<г/<1 и g@)=fr,
g(\)—a. Тогда из рис. 20 видно, что е(х—g(y)) = 1 при /z(x)<j/<1,
и из (8) вытекает, что
Сделав замену переменной y — h(x), полечим соотношение F(g(y))~
= 1— у, отеуда g(y) — G(l—у). Таким образом, в этом случае
g = <j(l— у), и мы снова пришли к методу обратных функций с
заменой у на 1—у»
Эти же решения уравнения (8) можно получить для любой
случайной величины, если предположить, что g(y) обладает свойствами
обратных функций G(y) в смысле п. 1.4. Помимо этих двух
монотонных решений, существует бесконечное количество немонотонных
решений. Однако используются они сравнительно редко. Пожалуй,
единственный общий метод, основанный на использовании
немонотонных функций g(y), это модифицированный метод суперпозиции
Г. А. Михайлова, изложенный в п. 3.3.3.
Прежде чем перейти к преобразованиям более
общего вида, рассмотрим основные методы моделирования
многомерных случайных величии.
§ 2. Моделирование многомерных случайных величин
2.1. Моделирование я-мерной случайной точки с
независимыми координатами. Если координаты я-мерной
случайной величины Q=(?b ,,., |п) независимы, то
функция распределения
FQ(xu ..., xn)=Fi(xx)... Fn(xn)9
где Fi(Xi)—функция распределения величины ?,.
Естественно ожидать, что в этом случае можно
моделировать каждую величину |* независимо:
где Yi, ..., Yn — независимые случайные числа.
Дейавнтелыю, так как ^« независимы, то и |<,
определенные формулами (II), независимы. Поэтому их
совместная функция распределения равна произведению
Р {?l < *1, • • • , In < ХП) = Д Р {I < xt) =
« П Fi (xt) = FQ (xx ха).
54
ПРЕОБРАЗОВАНИЯ СЛУЧАЙНЫХ ВЕЛИЧИН
[ГЛ 2
Пример. Случайная точка Q с декартовыми
координатами (^....Дп) равномерно распределена в л-м е р-
п о м параллелепипеде П = {а/<*,•<&/; i=l, 2,..., л}
(рис. 21 для /г = 2).
Плотность вероятностей точки Q постоянна в П:
с при (хг,..., л^)
О при (*!,...,*„)
П,
где 1/с= П (Ьс — а^ — объем П (л-мерный объем). Интегрируя
рл по всем переменным, кроме xi9 легко получить, что плотность Е/
равна
[1/(*,-*<) при ^е (а., Ь,),
1 0 при х^(аг Ьс).
Следовательно, каждая из координат ^ равномерно распределена в
интервале ai < xt < bif и координаты эти независимы.
Согласно A1) запишем уравнения
откуда вытекают явные формулы для расчета координат
? - (_ / h \ i —— 10 г\
2.2. Моделирование /i-мерной непрерывной
случайной точки (с произвольными координатами). В
общем случае, когда |ь ..., |„
зависимы, их совместную
плотность можно представить в виде
произведения условных
плотностей вероятностей этих величин:
Pq(xu ...,*„) =
Все условные плотности
вероятности выражаются через совмест-
Рис. 21. ную плотность pQ(xu ..., хп).
Приводим выражения условных плотностей в общем виде; все
интегралы беру гея от — оо до оо:
x2 ... dxtu
хх) = J... J pQdx3... dxn
§ 2] МОДЕЛИРОВАНИЕ МНОГОМЕРНЫХ ВЕЛИЧИН 55
Рз(*зК» *2) = §•••§ PQdx±... dxn[p1 (xt) p2 (x2\ xj]-1,
= I V/i [Pi (*i)• • -p,,-2 (*n-2I *i••••• *п-з)Г! •
pn (xn\xlt..., xn_{) = pQ [Pl (Xl) ... pn_l (xn__x \xlf...t xn_2)]-K
Введем условные функции распределения
X.
I
Ft (xi \xl9...9 xt-\) = J pi (x | xx,.. • t xt-_i) dx.
— CO
Теорема 4. Пусть -уь ..., *ун — независимые
случайные числа. Совокупность случайных величин |ь ...
,.., !-п, полученных при последовательном решении
уравнений
Л(Е)
Fn (In | 5i,..., Sn-i) = 7m
совместную плотность вероятностей pQ{xu . *., *n),
Доказательство. Если значения |i=JCb ...
##<) gl.^1=Xi_i фиксированы, то случайную величину |.
с функцией распределения F<(^|^i, •••» ^<-i) можно
определить по формуле D):
Тогда вероятность неравенства ^i<^<^+^< равна
Следовательно, с точностью до бесконечно малых более
высокого порядка вероятность совместного выполнения
п неравенств равна произведению
pn(xn\xu ..., xn-i)dxn
=Pq
и теорема доказана.
56
ПРЕОБРАЗОВАНИЯ СЛУЧАЙНЫХ ВЕЛИЧИН
[ГЛ 2
Представление плотности pQ(xu ..., хп) в форме
произведения условных плотностей координат gi, .../|n
возможно п\ способами. В частности, при п = 2
Ря (хи х2) =р\ (х{)р2 (х21 xi) =р2 (х2)р\ (xi |х2).
Разным произведениям соответствуют разные порядки
разыгрывания величин |ь ..., |п
и, вообще говоря, разные урав-
нения A2). Нижеследующий
пример показывает, что иногда
удачный выбор порядка
позволяет упростить эти уравнения.
Если |i, ..., \п независимы,
то все их условные
распределения равны безусловным
Ря(х\, ..., Xn)=pi(xi)...pn(xn)
и порядок разыгрывания вели-
чнн Роли не играет: уравнения
A2) превращаются в A1).
1
с 22.
Пример Рассмотрим случайную точку (?, г]), которая может
принимать значения в треугольнике х-\-у<^\> х>0, у>0 (рис. 22)
с плотностью р(х3 у)=6х.
а) Выберем в качестве первой величины ?. Тогда
1-х
Рц (У 1 х) = р (*, y)/pt (х) = A — а-)-1 при 0 < г/ < 1 — х.
Соответствующие эгим плотностям функции распределения:
х
О
У
: U
о
при
при
—дг.
Из формул A2) получаем уравнения для последовательного
вычисления I и г]
МОДЕЛИРОВАНИЕ МНОГОМЕРНЫХ ВЕЛИЧИН 5?
б) Выберем теперь в качестве первой величины г\. Тогда
= 3(\—yJ приО<г/<1.
у)~2 при 0<д;< I—г/.
Соответствующие функции распределения:
к
Fх\ (#) == ) Рц (у) dv = 1 — A — #K при 0 <[ у < 1,
о
л:
t= J Р| (" I У) du = л:2 A — у)~2 при О < х < 1 — #.
о
Из формулы A2), используя 1 —Yi вместо уи получим уравнения для
последовательного вычисления г\ и |
Сравним теперь оба алгоритма для расчета | и tj: в первом из них
для нахождения | необходимо решать кубические уравнения, в то
время как во втором можно использовать явные формулы
Замечание. Учащиеся часто допускают ошибку и вместо
Pq{x> y)=Pi(x)P2(y\x) пишут соотношение F Q (x, у) =Fi(x)F2(y\x).
Однако последнее тождество неверно! В рассмотренном примере в
треугольнике Fq(x, у) =3х2у, а
2.3. Возможные обобщения теоремы 4. Важнейший
вывод из теоремы 4 состоит в том, что моделирование
многомерной случайной величины может быть сведено
к последовательному моделированию ее координат.
Формулы A2) используют для этого метод обратных
функций. Но это вовсе не обязательно: в некоторых случаях
формулы расчета окажутся проще, если использовать для
моделирования случайной величины ?,- с условной
плотностью Pi(x\lu . • •, &-0 какой-нибудь из методов,
рассмотренных в последующих §§ 3, 4, 5.
Например, из результата п. 4.1 следует, что вместо формул A3)
можно использовать следующий алгоритм, в котором на расчет
каждой точки (g, tj) затрачиваются пять независимых случайных чисел,
но зато не надо извлекать корней:
4; Уь).
58 ПРЕОБРАЗОВАНИЯ СЛУЧАЙНЫХ ВЕЛИЧИН [ГЛ 2
2.4. Использование замены переменных. Во многих
случаях удается упростить формулы моделирования
многомерной случайной величины путем удачного
выбора координат.
Правило преобразования плотности при
преобразовании координат. Пусть у^ = g; (*i, ..., хп^
f=l, 2, ..., п, — взаимно однозначное дифференцируемое
отображение области В в пространстве Xi,...txn на область В' в пространстве
У\,...,уп- Если плотность случайной точки Q = ( li,... Дл) в В
равна Pq(xu ..., хп), то плотность случайной точки Q'=(\)u ..., цп)
в В', где x\i = gi (?i,. ., ?л), равна
х
n)
d(xlf...,xn)
Уп)
в правой части xi должны быть выражены через yim
Доказательство. Пусть D' — произвольная область внутри
В\ a D — ее прообраз при рассматриваемом отображении. Очевидно,
P{QD} PfQ'D'}. По правилу замены переменных в интеграле
Pqdxi ... dxn =
D Df
а по определению плошосги pQ,
Уп)
dy\.--dyn,
D
Dr
Приравнивая эти вероятности и принимая во внимание
произвольность D\ получим требуемый результат.
2.4.1. Пример. Случайнаяточка Q равномерно
распределена в шаре x2+y2~\-z2<R2.
Обозначим через |, г), С декартовы координаты точки Q. Их
совместная плотность распределения в шаре постоянна: pq (x, у, z) =
= [D/3)яЛ3]. Однако плотности распределения каждой из
координат достаточно громоздки (см. ниже п. 3.2.1). Поэтому перейдем
к сферическим координатам (рис. 23):
x=rs\n 6 cos ф, у —г sin 0 sin ф, z — rcosQ.
В новых координатах шар превращается в параллелепипед
0^6<я, 0^ф<2я. Так как якобиан преобразования
д(х, У, z)ld{rt 0, q)=r2s\nQt
то в новых координатах плотность
.Pq (г, 8, Ф) = [D/3) nR3]~] г2 sin 9.
С 2]
МОДЕЛИРОВАНИЕ МНОГОМЕРНЫХ ВЕЛИЧИН
59
Легко видеть, что эта плотность представляет собой произведение
трех плотностей
Pq (г, 6, Ф) « Cr2R~3) B~l sin 0) Bл)-1
и, следовательно, сферические координаты r^, 0q, ф^ точки Q
независимы. Уравнения A1) для их нахождения можно записать так:
f Зл2Ла р
sin 8
~~У2* J л"
0 0 0'
Отсюда получаем широко распространенные формулы
Тз-
A4)
По этим значениям нетрудно вычислить и декартовы координаты
точки Q:
Г| = rQ siuOq sin ф^
Q
= rQ sin 6Q cos
= rQ cos 0^
2.4.2. Пример. Выбор случайного направления в
пространстве.
Обычно, говоря о «случайном» направлении, подразумевают
выбор случайного направления в условиях, когда все направления
Рис 23
Рис. 24.
равновероятны (в противном случае должно быть задано распределен
ние вероятности различных направлений). Направление условимся
характеризовать единичным вектором
где
0)з —
^|^ з
для любого телесного угла Q
интересует такой случайный вектор со, что
Q
60 ПРЕОБРАЗОВАНИЯ СЛУЧАЙНЫХ ВЕЛИЧИН [ГЛ 2
Легко видеть, что если Q — случайная точка, равномерно
распределенная в шаре x2-\-y2+z2<iR2, то направление ее
радиуса-вектора обладает нужным нам свойством. Действительно, если Qi и п2—
два равных телесных угла, то объемы соответствующих им шаровых
секторов равны (рис. 24), и вероятность того, что точка Q попадет
в каждый из них, одинакова. Поэтому из A4) получаем формулы
для выбора «случайного» направления.
cos 9 = 2yi — 1, ф==2яу2. A5)
Декартовы координаты вектора со вычисляются по обычным
формулам:
co-l = cos ф У\—cos2 6 , о)о = sin ф У\ — cos21), oK = cos0.
2.4.3. Пример [8]. Случайная точка Q = Ei * • • •. ?„)
подчиняется «-мерному нормальному (гауссовскому)
распределению с математическими ожиданиями М^=Я; и
вторыми моментами М [(§;—а^ (|.— а^)]=Ь^. Определитель
матрицы В— (b{j) положителен: Д5> 0.
Плотность такой случайной точки выражается формулой
pQ (Xl,
,..., хп) = у ^ехр |- -I- Д сц (дг, - а() (х, - ау)
где С — (Сц} — матрица обратная, по отношению к В, а Дс —ее
определитель.
Как известно, линейным преобразованием координат можно
привести положительно определенную квадратичную форму,
стоящую в показателе, к сумме квадратов. Удобно при этом использовать
векторные обозначения: если и = (wi,..., ил) и v = (vlt..., v^j —
векторы, то их скалярное произведение
если С = {сLj)—квадратная матрица (l^i, j^n)r то w —Си — это
п
вектор с компонентами wi — 2j cialla'^ квадратичная форма выра-
а -=\
жается через скалярное произведение
п
2 сИ (хс — at) (Xj — aj) = (С (х — а), х — а).
Выберем новые координаты #i*...? уп, и пусть х—а^=Ту. Тогда
(С(х-а), х-а) = (СГ^/, Ту) - (Г'СГг/, у),
где Т' — транспонированная .матрица Т. Последнее выражение
обратится н {у, у)} если Г'СТ=-Е — единичная матрица. Отсюда
§ 31
ПРЕОБРАЗОВАНИЯ ВИДА S~g(Vi. Ъ)
61
С= (Т')~1Т~1, а В = С~1 = ТТ'. Таким образом, матрица
преобразования Т должна удовлетворять уравнению
ТТ'=В.
A6)
Якобиан преобразования х — Ту+а равен определителю
матрицы: д(х)/д(у) =АГ. Из A6) следует, чю(А7J = А5, а так как
B = C~l, то(ДгJ = (^с). Значит,
Теперь можно записать плотность точки Q в новых координатах
2 • 2
и) П [
= П [Bя)
4=1
_ J 1 2
откуда видно, что новые координаты точки Q независимы и
нормальны с параметрами @; 1).
Итак, для того чтобы вычислить
значения ?!,..., ?Л, надо найти п
независимых значений ?lt ..., Z,n нор- /
мальной величины с параметрами
@; 1) —как это сделать, см. п. 3.2.2.
или п. 4.4, и тогда
При практической реализации
этого метода единственное сложное
место — расчет матрицы Т. Из теории
матриц следует [64], что существует
треугольная матрица T—(t{J^f удов- рис
летворяющая A6). Если при j>i все
ty = 0, то A6) превращается в систему, состоящую из п(п+\)/2
уравнений
/г = 1
и все 1ц могут быть последовательно вычислены в порядке,
схематически указанном в рис. 25. Матрицу С вычислять не надо.
§ 3. Преобразования вида |=я(Ть Ъ)
3.1. Постановка задачи. Пусть *{\ и 72 — Дв^
независимых случайных числа. По аналогии с п. 1.5 можно
пытаться найти всевозможные функции g(x, у) такие,
что случайная величина gDu b) имеет функцию
распределения F(x). Так как случайная точка (fi, 42)
равномерно распределена в единичном квадрате
62 ПРЕОБРАЗОВАНИЯ СЛУЧАЙНЫХ ВЕЛИЧИН [ГЛ 2
у, то, повторяя рассуждения п. 1.5, получим для
определения g(x, у) уравнение, аналогичное (8):
1 1
е{*-ё (*. У)) dx du -= F (z). A7)
Мы не будем заниматься исследованием решений
этого уравнения. Оно, по-видимому, более удобно для
доказательства известных формул (см. п. 4.1), чем для
получения новых. Вместо этого рассмотрим несколько
методов построения преобразований вида |=й"(^ь Тг).
Эти методы имеют много практических приложений.
Во всех методах вместо одномерной величины g
моделируется двумерная случайная величина Q, по
значениям которой нетрудно вычислить g. Большой произвол
в выборе распределения Q используется для того,
чтобы упростить формулы счета. В п. 3.2 плотность
pQ(x, y)=pQ(r) зависит только от г, и моделируются
полярные координаты точки Q. В пп. 3.3 и 3.4 | — это
декартова координата точки Q=(?, ц), но сперва
моделируется ц.
3.2. Применение полярных координат. Допустим, что
к случайной величине ?, которую надо моделировать,
удалось подобрать случайную величину ц так, что
плотность точки Q с декартовыми координатами ? и ц
зависит только от расстояния до начала координат
*> У)—С(г) ПРИ
Здесь 0^/?i</?2^°°. Тогда удобно моделировать
полярные координаты точки Q, а уже по ним вычислять |.
Если x=rcos(p, г/=г sin ф, то якобиан
преобразования д(х, у)/д(г, ф)=г и плотность точки Q в полярных
координатах равна
Ря(г> 4>)=гс(г)-
Область изменения полярных координат точки Q —
назовем ИХ р И 8 — ПРЯМОУГОЛЬНИК /?1^Г</?2! 02
Поэтому легко доказать, что они независимы:
Рр(г) =2пгс{г), ро(ф) = Bл)
§ 3] ПРЕОБРАЗОВАНИЯ ВИДА ?=g(Yi. Va) 63
По формуле A1) для вычисления р и 9 получим
уравнения
р
2я J гс (г) dr = Yi, в Bя)~* = у2. A8)
Вычислив р и 6, нетрудно найти и декартовы
координаты точки Q:
? = pcos0, r)==psin6.
3.2.1. Пример. Случайная величина ? определена в интервале
—R<x<R с плотностью р(х) = 2(nR2)~iyR2 — x*.
Нетрудно показать, что g представляет собой абсциссу случайной
точки Q, равномерно распределенной в круге x2-\-y2<.R2. В самом
деле, еслирд (х, у) — (nRv~lB этом круге, то
^ 2
J pQ (дг, у) сГг/ = -^г К^й—*2 при М < R.
Из формулы A8)_при с(г) = (я/?2)", /?i==0, R2=R получаем явные
формулы р = /? Kyi» 0==2яу2. Таким образом,
Если в этом примере сразу применить метод обратных функций
для моделирования ?, то уравнение D) /7(g)==Y для нахождения g
окажется весьма сложным:
f F) = 4- + 4"arc'5in 4"+13? >/«1=^ = V-
32 2. Пример. Случайная величина С нормальна с
параметрами @; 1)
р1 (х) = Bяр1/2 е~х2/2, 0 < х < со.
Выберем независимую от С случайную величину т], также
нормальную с параметрами @; 1), и рассмотрим на плоскости х, у
случайную точку Q с декартовыми координатами С и tj. Очевидно,
PQ (x. y)=Pt (х)рц (у) = BлГ1е-гЯ/2, 0 < г < ю.
По формулам A8), где удобно вместо Yi взять 1—Yi» получим
уравнения
Р
так что р = У—2 In yv Следовательно,
?==}A__2 1n'v1co3 2ttY2i Л = /— 2 In Yi sin 2луа. A9)
64 ПРЕОБРАЗОВАНИЯ СЛУЧАЙНЫХ ВЕЛИЧИН (ГЛ. 2
Формулы A9), полученные в [107], позволяют по двум
случайным числам Yi и Y2 сосчитать сразу два независимых значения
случайной величины С. Если нужно лишь одно такое значение, то можно
ограничиться одной из этих двух формул.
Замечание. Если случайная величина С нормальна с
параметрами @; 1), то случайная величина
нормальна с параметрами (а; а). .
3.3 Метод суперпозиции. Допустим, что функция
распределения F(x) интересующей нас случайной величины
| представима в виде
%x), B0)
где все Fh(x)—также функции распределения, а
Из B0) при х->оо следует, что Ci+... +cm=l.
Следовательно, можно ввести дискретную случайную
величину ц с распределением
1 2 ... т
так что Р {г] = &} =ck.
Теорема 5. Пусть 71 ti 42 — независимые
случайные числа. Если по числу ^i разыграть значение r\ = k
случайной величины г), а затем из уравнения Fh(i>)=^2
определить g, то функция распределения | равна F(x).
Доказательство. Воспользуемся теоремой о
полной вероятности и вычислим функцию распределения
величины |, построенной в теореме:
Р {К х} = J2 Р {I < х\п = Щ Р {г, = Щ =,
что и требовалось доказать.
Функции распределения вида B0) встречаются
тогда, когда мы имеем дело со смесью случайных величин.
Например, если у нас всего N деталей, среди которых
Nk деталей с функцией распределения «времени
жизни» Fh(t), &=1, 2, ..., т, то функция распределения
§ 3] ПРЕОБРАЗОВАНИЯ ВИДА ?-g(Vi. Vt) 65
«времени жизни» для случайно выбранной детали равна
т
F(t)= 2 (Nk/N) Fk (t).
/2=1
Однако представление B0) часто придумывают
искусственно, чтобы облегчить процедуру разыгрывания ?.
Метод суперпозиции был предложен Дж Батлером [ПО] и развит
в работах [40, 58, 108, 109, 155, 156]. Возможность обобщения его на
случай бесконечного числа слагаемых в B0) и на многомерные
распределения очевидна,
3.3.1. Пример [ПО]. Случайная величина g
определена в интервале 0<л:<1 и имеет функцию
распределения
где все с ^^0.
Можьо считать, что Fk (х) = xk при 0<*<1, и воспользоваться
методом суперпозиции. Из теоремы 5, ислользуя теоремы 1 и 2,
получим формулу
если 2 с/ < Vi < 2 ci* To 6 = (YaI/fe
(при ^=1 левую часть неравенства полагать равной нулю).
3.3.2. Пример. Случайная величина | определена в интервале
0<О'<2 с плотностью
Если для нахождения значений величины g воспользоваться
методом обратных функций D), то получим формулу
F-1L-66-12Y-1,
так что придется решать уравнение пятой степени.
Можно» однако, представить р(х) в виде суперпозиции
плотностей Pl(x) == 1/2 и р2{х) = E/2) (*-1L:
5 1
На основании теоремы 5 получим следующий явный алгоритм для
вычисления значений ?:
( 2^3, если уг < б/б,
11 + \ 2у% — 1, если Vi > б/6»
б И. М. Соболь
Св ПРЕОБРАЗОВАНИЯ СЛУЧАЙНЫХ ВЕЛИЧИН [ГЛ 2
Следующая модификация метода суперпозиции принадлежит
Г. А. Михайлову [58].
3.3.3. Модифицированный метод суперпозиции.
Оказывается при реализации метода суперпозиции можно
ограничиться одним случайным числом у.
Теорема 5'. Если в условиях теоремы 5 по числу у разыграть
значение r\ = k случайной величины ц, а затем определить | из урав-
I къ \ _,
= 0, где 0= у—y\ct- \ck \то функция распределения %
равна F(x).
Для доказательства этой теоремы достаточно заметить,
что Р{9<*/|г| = &} = */, т е. 0 равномерно распределена в интервале
(О, 1). Поэтому ураьнение Ffe(|)=0 определяет случайную величину
с функцией распределения F ^ (x) так же, как в теореме 5*).
В примере п. 3.3.2 величина 0 равна F/5) у при г] = 1 и 0 равна
6у—5 при т] = 2. Для ? получаем формулу
( A2/5) у, если у < 5/6,
Ь + |/2у — И, если у ^ 5/6,
которая выгоднее формулы п. 3.3.2, ибо не требует вычисления
второго случайного числа.
Необходимо отметить, однако, что модифицированный метод
более чувствителен к качеству псевдослучайных чисел, используемых
в расчете: для успеха обычного метода важно, чтобы частота
попадания псевдослучайных чисел в каждый из интервалов Д^ =
ГЛ-1 k 1
= 2 cj^x< 2 ci
б
Равня^ась Ck\ для модифицированного метода
li / J
важно также, чтобы распределение этих чисел внутри каждого д^
было достаточно хорошим.
Модифицированному методу суперпозиции соответствует
преобразование вида ? = g(Y) с разрывной функцией g{y), которую
проще записать, если ввести функции Gk(y), обратные к Fk(x):
^A^lj при
Проверим непосредственно, что эта функция удовлетворяет
уравнению (8). Представим интеграл в виде суммы:
J«(*-*(*))<fo=2! I Ф-С/Л (у-Ъ с
О Й=1АЛ L \\ /=1
*) Нирудно доказать, что 0 и ц независимы [68],
§ 31 ПРЕОБРАЗОВАНИЯ ВИДА l=g(Vi, V2) 67
k-l
В /г-м слагаемом сделаем замену переменной у = ^ c^-\-ckz\
/-¦=1
тогда Л/г преобразуется в [0, 1] и
1 m 1
f * (* - 8 (У)) dy=y± ck [ e(x — Gk (г)) dz.
0 k=l 0
Так как Gk (z)<x тогда и только тогда, когда z<Fk (x), то
1 1
Г e(x-Gk{z))dz=f e(F!i(x)-z)dz = Fk(x).
О О
Следовательно,
i т
О /г==1
Тем самым мы получили новое доказательство теоремы 54
Функцию g(y) можно сделать непрерывной, если использовать
при нечетных k уравнение /7^(?)=9» а при четных k — уравнение
/ЪК) = 1-е.
Заметим, наконец, что, в отличие от обычного метода
суперпозиции, модифицированный метод не может быть так просто обобщен
на случай многомерной случайной величины \.
3.4. Метод интегральной суперпозиции. Рассмотрим
непрерывную случайную точку Q с декартовыми координатами ? и ц на
плоскости х, у. Если плотность Q равна р(ху у), то плотность | равна
со
= J P(x, y)dy.
Как отмечалось в п. 2.2, моделировать координаты точки Q
можно в любом порядке Воспользуемся представлением р(х, у) =
~Рт\(у)Ръ (Х\У) и будем сперва моделировать г), а затем |. Иными
словами, сперва найдем т^ из уравнения /^(тО^^ь а затем g — из
уравнения FgfSI'n)—Y2 • В тех случаях, когда последние уравнения
решаются проще, чем уравнение D) метода обратных функций,
такой алгоритм может оказаться выгодным. Вообще же метод
интегральной суперпозиции используется сравнительно редко, главным
образом тогда, когда плотность р%(х) задана в форме интеграла по
параметру.
Пример [ПО]. Плотность случайной величины | при 0<я<оо
пропорциональна интегральной показательной функции я-го порядка
(л>0)
68 ПРЕОБРАЗОВАНИЯ СЛУЧАЙНЫХ ВЕЛИЧИН [ГЛ 2
Так как здесь р(х, у) = ny~ne~xy, то
00
I » У)dx = /2^~"™1 ПР" 1 < У < т»
о
Pi {х\у) = Р (*, yj/p^ (У) = ^-^ при 0 < х < со.
Соответствующие функции распределения равны
F^(y)=l-y-n, Fl(x\y) = l-e-*v.
Из уравнения /7TJ(r|) = I — yi найдем ii=(yi)—V«йа из уравнения
1'\A\ч)=:1—У2 найдем g= —трЧпуг- Итак,
Замечание. Общий метод суперпозиции может быть описан
одной формулой
Именно в таком виде он был сформулирован Дж. Батлером
(composition method). Если случайная величина т] дискретна, то получаем
метод п. 3.3, а если т] непрерывна — метод интегральной
суперпозиции. Однако в приложениях гораздо большую роль играет
дискретный случай.
3.5. Некоторые приложения метода суперпозиции.
3.5.1. Попр а вки к приближенным
распределениям. Предположим, что плотность р(х)
случайной величины | аппроксимируется снизу достаточно
простой линией у(х), как это изображено на рис. 26.
Очевидно, в качестве приближения к р(х) можно выбрать
плотность
Р\(х)=у{х)/си
ь
где Ci = J y(x)dx, и находить приближенные значения
а
? по плотности Pi(x).
Можно, однако, представить р(х) в форме
суперпозиции двух плотностей
P\(x)=y(x)/ci к р2(х) = [р(х)-у(х)]/с2,
и получить таким образом Метод для точного
моделирования g. Алгоритм расчета ? по плотности #>(*) может
оказаться весьма сложным; но на времени счета это
§ 3]
ПРЕОБРАЗОВАНИЯ ВИДА %=g(Vu V2)
69
почти не скажется, ибо Р2{х) будет использоваться очень
редко: Р{г) = 2}=с2=1-~^1<^1.
Итак, метод суперпозиции дает возможность учесть
«поправку» р2(х), практически не увеличивая времени
счета, а лишь ценою усложнения программы (впрочем,
обычно это весьма нежелательно). (Дж. Марсалья [155]).
3.5.2. Дробление области определения
случайной величины. Этот прием иногда используют
при моделировании случайной величины, плотность
которой резко различна в различных областях*
Ь (с
Рис. 26.
Рис. 27,
Пусть р{х)—плотность случайной величины |, определенной в
интервале а<х<Ь. Разобьем этот интервал на сумму
непересекающихся интервалов Aft, так что (a, b) =Ai+.. .+Am (рис. 27) и
вероятности попадания g в
положительны:
m
= J
p(x)dx>0.
Введем в рассмотрение плотности
{p{x)/ck при л:еА&,
О при х*Д>. •
Очевидно, cl+...+ cm=si и при всех х из (а, ^)
Р (а:) == схрх (х) + ...+ стрт (х).
Согласно теореме 5, для того чтобы найти значение ?, можно
сперва по числу Yi разыграть номер области t) = kt а затем
вычислить | из уравнения
р (х) dx = ckyZf
B1)
где ад —левый конец
70 ПРЕОБРАЗОВАНИЯ СЛУЧАЙНЫХ ВЕЛИЧИН [ГЛ. 2
Легко проверить, что с точки зрения количества вычислений
этот метод хуже, чем метод обратных функций. В самом деле,
уравнение D) для нахождения ?
J p (x) dx = у
а
можно решать следующим образом: сперва найдем номер k такой,
что
2 ci < у < J2 V B2)
тогда это уравнение превратится в уравнение
= Y-5l<7. B3)
решая которое и найдем g. Уравнение B3) проще, чем B1), и
совпадает с уравнением модифицированного метода суперпозиции
для рассматриваемой задачи.
Положение может резко измениться в пользу метода дробления
области, если вместо B1) использовать для моделирования ? с
плотностью Pk(x)> в Да какой-нибудь другой способ. Правда, тогда
на получение одного значения | будет затрачиваться больше двух
случайных чисел.
Метод дробления области применим также для моделирования
многомерных случайных величин [19].
§ 4. Преобразования вида §=?(ть • • • > Тп)
Мы ограничимся несколькими весьма
разнообразными примерами преобразований указанного вида. Во всех
формулах 71, . . . , Чп — независимые случайные числа.
4.1. Извлечение корней из случайных чисел.
Докажем, что значение случайной величины |, определенной
при 0<а:<С1 с функцией распределения F(x)=xn,
можно вычислять по формуле
ь . . . ; ?„). B4)
Заметим сперва, что функция распределения
случайной величины ?=?(^1, . . . , чЛ равна F(x) тогда и
только тогда, когда g(y\, . . . , уп) удовлетворяет ураь-
нению
1 1
I • • • U (х - g (у±, ..., уп)) dyx... dyn - F (x), B5)
о о
§ 4] ПРЕОБРАЗОВАНИЯ ВИДА l=g(v., . . т, Уп) 71
вполне аналогичному уравнению (8). Затем рассмотрим
величину g, определенную уравнением B4). Так как
max (у\\ ...; уп)<х в том и только в том случае,
когда одновременно у\<.х, . . . , уп<.х} то
ее с г
J • • • J е (х — max yt) dyl .. .dyn = ... J dy{ ...dyn = xn,
0 0 K/<n 0 0
что и требовалось доказать.
Если эту же случайную величину \ моделировать
методом обратных функций, то, очевидно,
I = "/? B6)
Сравнивая формулы B6) и B4), приходим к выводу,
что в любом алгоритме можно заменить извлечение кор-.
ня из случайного числа взятием наибольшего из
нескольких независимых случайных чисел.
На ранних этапах развития ЭВМ формула B4) часто
использовалась даже при я = 2, так как извлечение корня осуществлялось но
весьма громоздкой подпрограмме. Например, на вычисление У у на
ЭВМ «Стрела» затрачивалось 3-|-24 = 27 операций C операции — на
расчет у), а на вычисление max (уг, Уг) —всего 3+3+2 = 8 операций.
Обобщение формулы B4) приведено в упражнении
9 гл. 2.
4.2. Моделирование гамма-распределения. Во многих
задачах встречаются величины ?(п>, определенные при
0<#<oo с плотностью вероятностей
^(^[(tt-l)!]-^-1*-*, B7)
где п^\—целое число. Закон B7) называется гамма-
распределением *), так как
f xn~le-*dx = Г (/г) =* (л — 1)!
о
(Встречаются также распределения B7) с дробными п.)*
Метод обратных функций приводит к явной формуле
для вычисления ?(Л) только в случае я=1
|Ш = —hry. B8)
*) Закону B7) подчиняются интервалы между событиями в
потоках Эрланга (см. гл. 6, п. 1.3.1).
72 ПРЕОБРАЗОВАНИЯ СЛУЧАЙНЫХ ВЕЛИЧИН [ГЛ 2
Докажем, что при любом п значения |(п) можно
вычислять по формуле
... Ъг). B9)
Доказательство (по индукции). При п=1
формула B9) превращается в уже доказанную формулу
B8). Допустим, что плотность величины B9)
выражается формулой B7), и рассмотрим величину
По известному правилу композиции плотностей
независимых слагаемых
со со
P|(n+i)(*) - J pn(x-t)Pi(t)dt= Jpn(x— t) e-'dt.
' —со О
Используем теперь индукционное допущение:
P|(«+i) (*) - [(я- I)!] J (x- t)*-*e-*dt =*
= [л!]-1 *»«-* = ?„+,(*).
Пример [56, 118]. Часто при неупругом рассеянии нейтрона
ядрами энергия ? рассеянного нейтрона представляет собой
случайную величину с плотностью
р (Е) = (Е/Т2) е-<Е*т\ 0 < Е < со
(это так называемый «испарительный спектр»; параметр Т зависит
от вида ядра и от энергии нейтрона перед столкновением). Используя
замену переменной Е~Тх и формулу B9) при м=2, получим для
расчета энергии после рассеяния формулу
? = -nn(YiY2). C0)
4.3. Моделирование семейства биномиальных
распределений. Рассмотрим случайную величину |, которая
подчиняется биномиальному распределению с
параметром р, т. е. при & = 0, 1, 2, . . . , п
P{i = k} = Cknpk{\-p)n-k. C1)
Это дискретная величина, и моделировать ее можно
методом п. 1.1.
Предположим теперь, что для расчета некоторой
задачи необходимо многократно моделировать
распределение C1) с различными значениями р, получающимися
§ 4] ПРЕОБРАЗОВАНИЯ ВИДА *-?(Vu . . * Уп) 73
в ходе расчета. Вместо того чтобы каждый раз вычислять
все вероятности C1), можно использовать следующий
алгоритм, который представляет собой алгоритм
моделирования п независимых испытаний (ср. п. 1.2.1): для
каждого из чисел ^ь • ^ • > Т* проверяется неравенство
Y<</?. Если это неравенство оказалось выполненным k
раз, то l=k [174].
Формулу, выражающую ? через ^ь • • • » 7*» можно
записать в виде
? 2 (p yt)
4.4. Приближенное моделирование нормального (га-
уссовского) распределения. Рассмотрим
нормированную *) сумму п независимых равномерно
распределенных величин:
l). C2)
Согласно центральной предельной теореме при п-»-оо
Р {?<я) < х}-+ Bя)-»'2 f е-<гЩ. C3)
*—СО
Следовательно, по формуле C2) при достаточно
больших п можно вычислять приближенные значения
нормальной случайной величины ? с параметрами @; 1).
Асимптотика в формуле C3) устанавливается
весьма быстро (на рис. 28 изображены плотности ? и ?C))>
и поэтому на практике можно ограничиться значением
/г=12:
С«СA2)-||*-6. C4)
Иногда ограничиваются в C2) лишь' пятью
слагаемыми, но зато добавляют поправку, которая ускоряет
сходимость распределения к нормальному;
J] C5)
*) Случайная величина т]0 называется нормированной, если
Мг|0=0, Дт]овв1. Любую случайную величину tj с конечными Mtj и
Dr] можно нормировать: величина т)о«(г| — Mtj)/Dtj нормирована.
74
ПРЕОБРАЗОВАНИЯ СЛУЧАЙНЫХ ВЕЛИЧИН
[ГЛ. 2
Последние две формулы нередко оказываются удобнее,
чем A9), так как расчет по ним возможен без
обращения к подпрограммам In и sin.
3 л
О поправках, ускоряющих сходимость, см. [4]. В [47] имеется
пример, при расчете которого пришлось использовать п = 30.
§ 5. Методы отбора
5.1. Общая характеристика методов отбора.
Предположим, что в m-мерном пространстве переменных
уи . . . , Ут заданы случайная точка Q'= (г}Ь . . . , цт)
с функцией распределения FQ,{yu - . . , ут) и некоторая
область В\ Рассмотрим одномерную случайную
величину |, определенную формулой
?=<p(Q') при Q'e=B\ C6)
Для расчета по этой формуле можно выбрать
случайную точку Q' в пространстве; если Q'^B\ то
вычисляется |=9(Q/); если Q'&B\ то точка Q'
отбрасывается и выбирается новая. Таким образом, при расчете по
формуле C6) из случайных точек Q' с функцией
распределения FQ, отбирают точки, принадлежащие В\ и по
ним вычисляют g. Мы будем говорить, что формула C6)
определяет метод отбора для моделирования \ (в
литературе встречается также термин «метод отказов»,
более соответствующий английскому выражению rejection
technique).
Эффективностью метода отбора называют
вероятность отбора или, более подробно, вероятность того, что
$ 51 МЕТОДЫ ОТБОРА 75
точка Q' будет использована для расчета |, а не будет
отброшена. Очевидно, эффективность метода C6)
равна вероятности
. C7)
Выбрав N точек Q\ мы получим в среднем всего эМ
значений |. Следовательно, на расчет каждого значения
| затрачивается в среднем 1/э точек Q'. Ясно, что при
малых э метод C6) становится практически
неэффективным.
Если на реализацию каждой точки Q' затрачивается
п случайных чисел ^ь • • • » Т«» гДе> очевидно, п^т, то в
среднем на одно значение ? затрачивается п/э
случайных чисел. В вычислительной практике (при
моделировании одномерных величин |) чаще всего встречается
случай т=2 и n=m.
5.2. Моделирование усеченных распределений.
Рассмотрим случайную величину т|, определенную в интер-
ь
вале а<.х<Ь с плотностью р(х) (так что] р (x)dx=l).
а
Говорят, что случайная величина | имеет усечен-
ное распределение р(х), если она определена в
интервале (a', b')a{a, b) и плотность ее пропорциональна р(х).
Очевидно,
Гь I"
Pi (х) = р (х) И р (х) dx\ > р (х);
см. рис. 29, где а=а'=0, 6 = оо.
Если мы умеем вычислять значения г], то значения
| можно находить методом отбора:
5 = ть если г]е(а7, 6')- C8)
Эффективность такого метода равна
Ъ'
э= ) р(х) dx.'
а'
5.3. Метод Неймана [163]. Этот метод очень часто
используется на практике. Иногда все методы отбора
называют методом Неймана.
76
ПРЕОБРАЗОВАНИЯ СЛУЧАЙНЫХ ВЕЛИЧИН
[ГЛ 2
Рассмотрим случайную величину ?, определенную на
конечном интервале а<х<Ь с ограниченной плотностью
' ч - (рис. 30).
ЬЧ
Рис. 29.
х
Рис. 3&
Теорема 6. Пусть ^i и 42 —независимые
случайные числа и g/=a+'Yi(^—а)> ч\'=сЧ* Случайная
величина \9 определенная условием
1=1\ если г|'<р(ГЬ '(даУ
имеет плотность вероятностей, равную р (х).
Доказательство. Во-первых, заметим, что
точка (|7, г]7) равномерно распределена в прямоугольнике
а<х<Ь, 0<у<с (см. п. 2.1). Далее вычислим услов-.
ную вероятность:
Р{?<2} - РE7 <*1 V < Р (У)} = Р il^w<pW» }' '
Знаменатель последнего выражения — это вероятность
попадания точки (?7, тO) под кривую у=р(х). Так как плот-,
ность точки (|7, т]7) постоянна и равна |>(&—я)]"» то
Ь р(*)
Р {Y <С Р (?')} = ^ fc F—^)]—! ^ — [с(Ь — а)]-
а 0
Числитель равен вероятности того, что точка (|7, г]7)
окажется под кривой и в то же время %'<z\
2 Р(^) *
J dx J [с F - a)] <fy = [с F—a)J-J j /7 (х) dx.
§ 5] МЕТОДЫ ОТБОРА
Таким образом, получаем, что
77
а это как раз и требовалось доказать. х -
Эффективность метода C9), согласно C7), равна
вероятности попадания точки (|', г]') под кривую у=р(х),
т. е. з = Р{г)/<С/?(!/)}' Последняя вероятность уже
вычислялась в ходе доказательства теоремы. Значит,
эффективность метода Неймана будет наибольшей, если
выбрать наименьшее возможное с, т. е. положить с=
= sup p (х). Впрочем, это очевидно также из геометри-
а<х<Ь
ческих соображений.
Пример. Случайная величина g определена при —R<x<R
с плотностью p(x)=2(nR2)-i VR2 — х*-
Согласно теореме 6 нужно выбрать два значения Vi и Y2 и
вычислить E'=/?Byi — 1) и t)/=2(ji/?)-iy2; если т)'<р(|'), то g = g'.
Однако условие /n/<p(g/) в данном примере выгодно
преобразовать: оно равносильно условию \2<V^—BYi — 1J*После
дальнейших упрощений окончательно запишем:
g=#BYi— 1), если Byi — 1J<1 — у\.
Эффективность этого метода э = я/4. По сравнению с формулой
? = ^VYi cos 2яу2» полученной в
п. 3.2.1, формула метода отбора
проще: не надо извлекать корень и
вычислять косинус.
5.4. О некоторых обобщениях
метода Неймана. Во многих
работах рассмотрены самые
разнообразные обобщения метода п. 5.3.
(например, [73, 109, ПО]).
Большинство обобщений, относящихся к
моделированию одномерной случай
ной величины g, могут быть
получены из нижеследующих формул
D0)-D1).
Предположим, что нас
интересует случайная величина g,
определенная в интервале а<х<Ь. рис gj.
Рассмотрим случайную точку Q'=
с== (?'» V) с плотностью р(х, у) в
полосе а<х<Ь, — оо<г/<оо, и кривую y=f(x), заданную при
а<х<Ь (рис. 31). Определим метод отбора:
?=§', если п'</(Б'). D°)
D
а
\jrfw
i
\!
Z ' Ш X
78 ПРЕОБРАЗОВАНИЯ СЛУЧАЙНЫХ ВЕЛИЧИН [ГЛ 2
Нетрудно вычислить плотность случайной величины g, определенной
формулой D0): при <<6
Fg (г) = Р [I < г] = Р {V < г |ч' < / R')} -
z fix)
\ dx \ p (х, у) dy
^dx ) P (x, y) dy
a »—oo
продифференцировав по z, получим плотность
Ш) I ь f(x)
ps(*)= | D(zty)dy I ]dx j p(x,y)dy. D1)
—oo / a —oo
Если требуется моделировать случайную величину g с заданной
плотностью р§(х), то существует бесконечное количество способов
выбрать р(х, у) и f(x), удовлетворяющие D1).
5.4.1. Сперва рассмотрим частный случай, когда |' и г}'
независимы: р(х, у) — рЪ' (х) рх\'(у)\ Тогда изD1) вытекает, что
рг (z) = pv (z) j Ру], (у) dy/ J pv (x) dx J p,v (у) dy. D2)
*-oo ' a ^-oo
Последняя формула записывается более коротко, если ввести
функцию распределения величины г\\ равную F^,(y):
/ь
р^ (г) = pv (г) 1^, (f (г)) / J pv (x) F^ (f (x)) dx.
J a
Итак, если плотность р^ (х) моделируемой случайной величины g
представима в форме произведения
где k — постоянная, то ? можно моделировать по формуле D0), в
которой g' имеет плотность p^(x)t а г\' — функцию распределения
Fп> (У).
5.4.2. Предположим дополнительно, что O^f(x)^c, и выберем
случайную величину ц\ равномерно распределенную при 0<#<с.
Тогда рЦ'{у) = 1/с и из D2) вытекает, что
р6 (г) = pv (г) f (z) \ рг (х) f (x) dx.
Следовательно, если плотность р| (х) моделируемой случайной
величины g представима в форме произведения
D3)
§ 51 МЕТОДЫ ОТБОРА 79
где 0^f(x)^.c, a k — постоянная, то \ можно моделировать по
формуле D0), в которой ?' имеет плотность р^г (я), а т)' равномерно
распределена в интервале @, с).
Эффективность метода в этом случае равна
ь /(*)
J
0
Представляя /?g (х) в форме различных произведений D3), можно
построить различные методы вида D0) для моделирования
величины |. В частности, таким методом можно моделировать случайные
величины, плотности которых неограничены.
Пример. Случайная величина g определена при
0<Сл:<С1 с плотностью
где ()
Представим р^(х)в форме произведения D3) с р%> (х) = B]/х)-1.
Значения ?' легко вычислять методом обратных функций, так как из
D) вытекает, что У?'=Уь Следовательно, g/==(YiJ, ц' = су2 и
6 = 6' ПРИ Т)'<0F').
Эффективность в этом примере равна э=Bг)"~1. Ясно, что для
повышения 9 следует выбрать наименьшее возможное значение с,
равное с =» sup и (л:).
5.4.3. Снова предположим, что 0^f(x)^.c. Если g' равномерно
распределена при а<*<6, а т]' равномерно распределена при
0<#<с, то g' = a+YiF—а) и т)/ = су2. Из D2) вытекает, что при
a<z<b
Значит, чтобы моделировать случайную величину | с ограниченной
плотностью Р| (л:), можно выбрать
В этом и состоит метод Неймана C9).
5.5. Выбор равномерно распределенных точек в
сложных областях. Методы отбора C6) легко обобщить так,
чтобы отбирались значения многомерной случайной
величины ?. Мы рассмотрим лишь один прием, который
имеет много практических приложений. Его можно
считать частным случаем метода моделирования усеченных
распределений (п. 5.2), если иметь в виду обобщение
этого метода на многомерный случай.
Пусть В — ограниченная область на плоскости х, у,
«сложная» с точки зрения вычислительной практики:
80
ПРЕОБРАЗОВАНИЯ СЛУЧАЙНЫХ ВЕЛИЧИН
|ГЛ. 2
например, невыпуклая или несвязная или такая, что
границы на отдельных участках трудно записать в явном
виде. Предположим лишь, что существует достаточно
простой алгоритм, позволяющий определить,
принадлежит ли области В любая заданная точка {х, у) или нет.
Выберем прямоугольник n={a1<x<6i, a2<y<b2},
содержащий область В (рис. 32). Координаты случайной
bt х
Рис. 32.
Рис. 33.
точки Q'= (§', г)'), равномерно распределенной в П,
легко вычислить (п. 2.1):
g'=ai+4d(&i—a{)9 Л/=«2+Т2(&2—а2).
Для нахождения точек, Q, равномерно
распределенных в В, можно вычислять точки Q', равномерно
распределенные в П, и отбирать среди них те, которые
принадлежат В. В самом деле, для любой области G с В
Так как Q' равномерно распределена в П, то
вероятность попадания Q' в любую область пропорциональна
площади этой области: P{Q/<=G}=SG/Sn, P{Q'^B} =
=5B/Sn. Следовательно,
P{Qz=G}=SG/SB.
или, что то же, плотность pQ(x, y) = l/SB в области В.
Эффективность такого метода равна отношению
площадей
§ 51 МЕТОДЫ ОТБОРА 81
Поэтому э будет наибольшей тогда, когда площадь П
минимальна — результат очевидный геометрически.
Ясно также, что в тех случаях, когда область В хорошо
вписывается, например, в круг С (рис. 33), лучше не
пользоваться прямоугольником П, а отбирать точки Q
из числа точек Q', равномерно распределенных в С.
Эффективность такого метода 9=SB/SC будет выше, ибо
SS
Пример. Случайные точки Q=(g, т), С),
равномерно распределенные в ш а р е x2-\-y2+z2<R2, можно выбирать
следующим образом: 1) находим три случайных числа у и Y2, Уз;
2) вычисляем координаты g' = 2Yi —1, г|'=2у2—1, С'=2у3 —1;
3) если (|'J+(тГг+(?'J<1. то полагаем l=Rl\ ц = Яц', С=/?С';
в противном случае выбираем новую тройку уь Y2, Уз-
Эффективность метода э== D/3) я/?3: B RK = n/6. Несмотря на
то, что э близка к 1/2, по полученным здесь формулам случайные
точки в шаре вычисляются быстрее, чем по формулам п. 2.4.1, в которых
приходится вычислять ^/"у~и соБ2яуз-
5.6. Алгоритмы, соответствующие методам отбора. Формула C6)
не определяет полностью алгоритма для расчета значений ?, так как
вычислять значения Q' можно различными методами. Если каждая
точка Q' вычисляется по п случайным числам Yi> • •. » Уп, где п^т,
то все координаты Q' представляют собой функции T]t.= gt- (ylt ... , y )»
/=1, 2, .,* , m. Подставив эти выражения в C6), получим, что
l = 4>(gi(Vh * . . » Vn). • • • . Sm (Yi. • • • » Уп))- Следовательно, g
выражается через Yi» ... г Ynno формуле вида ? = g(Yi» ••- i Yw).
Рассмотрим теперь преобразование
^^^(^'•••'^n)» 1<J<^» D4)
которое отображает единичный «-мерный куб
на область возможных значений Q' в m-мерном пространстве
переменных уи . » . * Ут. Обозначим через В прообраз В1 при
отображении D4) (иными словами, В — это множество таких точек (хи ...
... txn) из Кп> которым при отображении D4) соответствуют точки
(Уи • . • >Ут), принадлежащие В'). Тогда условие Q' е В\
фигурирующее в C6), равносильно условию (уь ••«» Yw)e^-
Итак, формуле C6) соответствует следующий алгоритм расчета
Е по Yb ... . Уп:
б-8? (Yi».--» Yn) ПРИ (Vi.....Yn)eB. D5)
Формально можно считать, что D5) —это частный случай C6), так
6 и. М.
82 ПРЕОБРАЗОВАНИЯ СЛУЧАЙНЫХ ВЕЛИЧИН [Г Л 2
как вместо точки Q' с произвольной функцией распределения Fq,
здесь фигурирует точка (yi, . . . ,Ytt), равномерно распределенная
в Кп. Однако наши рассуждения показывают, что реализация любой
формулы C6) в конечном счете осуществляется с помощью алгоритма
D5), где, возможно, п^пг.
Эффективность этого алгоритма равна э = К5 объему (я-мер-
ному) области В. Еще раз напоминаем, что количество случайных
чисел, затрачиваемых на расчет одного значения |, случайно и может
оказаться равным п, 2п, Зл, ... ; в среднем это количество равно п/э.
Функцию распределения случайной величины ?, заданной
алгоритмом D5), нетрудно вычислить:
Т„)<*. (Vi.....T«N
= {VB)-'l ... \е (z-g(xit..., xn))dxi.. .dxn.
В
Следовательно, для того чтобы алгоритм D5) определял случайную
величину ? с функцией распределения F(x)% должно выполняться
условие
TT-J"...{«(*-?(*! xn))dXl...dxn = F(x). D6)
3 В
Уравнение D6) можно рассматривать как обобщение уравнения B5),
которое получается из D6) при В = Кп>
Общий алгоритм методов отбора D5) можно считать частным
случаем бесконечномерного преобразования
i=?(Y.> \i ). D7)
когда каждое значение 5 вычисляется по бесконечной
последовательности независимых случайных чисел. Такие преобразования
встречаются в практике методов Монте-Карло.
Если при каждом конкретном наборе хг,..., х^ .».
функция g зависит лишь от конечного количества аргументов хи то расчет
по формуле D7) затруднений не представляет. Это как раз
справедливо для алгоритма D5), когда функция g{xlt..., хс,...) равна
g(xi,....xn), если (хг,...,хп)еВ9
g{xn+l,...,x2n), если (xL,...,xn)&Bt
если
УПРАЖНЕНИЯ К ГЛАВЕ 2 83
5.7. Заключительные замечания. При выборе
алгоритмов для расчета методами Монте-Карло различных
задач возникает вопрос, какие же преобразования
использовать для моделирования той или иной конкретной
случайной величины |. Ответить на такой вопрос
однозначно нельзя. Целесообразность тех или иных
преобразований зависит от многих факторов.
Например, часто стремятся к минимизации времени,
затрачиваемого на получение одного значения g. Однако
за такую минимизацию приходится расплачиваться
удлинением программы и (или) расходом места во
внутреннем накопителе ЭВМ. Если во внутреннем
накопителе места много, то можно использовать таблицу с
интерполяцией (см. конец п. 1.3): такой способ будет, как
правило, самым быстрым. Поэтому выбор любого
другого способа моделирования — это компромисс*).
Далее, выбирая преобразования, редко учитывают
качество псевдослучайных чисел. Но одномерное
распределение чисел f{ обычно тщательно проверено, а
распределение групп (if<n+b .-•> 4in+n) при п^З
проверяется хуже, в результате чего формула вида %=g(yu ...
..., fn) при п^З может оказаться менее точной, чем
формула вида l=g('y)- Поэтому уменьшение количества
случайных чисел, затрачиваемых на получение одного
значения |, иногда представляется весьма желательным
(особенно с точки зрения гл. 7).
К счастью, при расчете многих задач время,
затрачиваемое на преобразование случайных величин, не
слишком велико, и можно выбирать самые простые и
естественные способы моделирования.
Упражнения к главе 2
1. Вывести явную формулу для расчета значений случайной
величины ? с функцией распределения
+ e-5*b 0<*<co.
*) Еще быстрее — осуществлять случайную выборку из заранее
заготовленной таблицы значений I Для некоторых случайных
величин такие таблицы имеются [165], однако в расчетах на ЭВМ
применяются они редко (ср. конец я. 1 3 гл. 1).
Интересно отметить, что точно так же можно использовать
таблицу для моделирования случайной величины, значения которой
получают экспериментально и функция распределения которой неизве*
стна (даже в многомерном случае).
6*
84 ПРЕОБРАЗОВАНИЯ СЛУЧАЙНЫХ ВЕЛИЧИН [ГЛ 2
2. Вывести явную формулу для расчета значений случайной
величины I с плотностью распределения р(х) —cos22nmx, 0<x<2; число
т^. 1 целое.
3. Вывести явные формулы для расчета случайных точек,
равномерно распределенных в плоском кольце Щ < х2 + у2 < R\.
4. Вывести явные формулы для расчета реализаций случайной
точки (|, п) с плотностью р(х, у) =3у, определенной в треугольнике,
О1раниченном прямыми ^ = 0, у = х и у=\.
5. Вычислить плотность случайной величины | = Т1 — lnY, если ц
имеет плотность р(х) при 0<*<оо (ц и y независимы).
6. Доказать, что случайную величину ?, определенную в
интервале 0<дс</, с плотностью
р(х)= ае-~ах1(\—е-с1)*
можно моделировать с помощью любой из четырех формул:
7 ln yJ;
5 = —(l/fl)lnY, если
7. Если гамма-квант с энергией Е рассеивается в результате
комптон-эффекта, то его энергия после рассеяния | представляет
собой случайную величину с плотностью р(х), пропорциональной
функции
/(?, х) =х1Е+Е1х+{ЦЕ-\1х) B+1/? - Их)
при ЕA+2Е)~1<.х<.Е (закон Клейна— Нишина). Доказать, что g
можно вычислять методом отбора:
Ъ = 1'9 если Y2[i+2E+(+2?)-»]<f(Et ?'),
где Е'—?A+2?
(И. Г. Дядькин [26]).
8. Энергию нейтрона, испущенного при делении ядра U235, часто
считают случайной величиной |, определенной при 0<х<оо, с
плотностью
р (Х) = се~х!Т sh Ъ
где Ъ и Т — параметры, с=]//я е~~ь2/2 (ЬТ)~~]—нормировочная
постоянная. Доказать, что | можно вычислять по формуле
-In у],
где 5 —нормальная случайная величина с параметрами @; 1); Си у
независимы.
(Г. А. Михайлов [56])
9. Независимые случайные числа Yh Y2» • • • 1
Yn-f-m—расположены в порядке возрастания Y(i)<YB)<- • • ^V(„+/»-!)• Доказать,
УПРАЖНЕНИЯ К ГЛАВЕ 2 85
что ?= V(n) подчиняется бэта-распределению с параметрами пит:
рг (х) = [В (пш т)Гххп-х A - х)т~1.
(J. С. Butcher, H. Messel [109]).
(Способы моделирования бэта-распределения с дробными
параметрами рассмотрены в статьях [62, 73, 102, 103, 141].)
10. Доказать, что формулы /о=1, //==» /^ i—^ и
ll - h-\ [1 - <Y/I/<»-'+1>]. i - 1. 2, . . ., /г/
определяют случайную точку (?и ... , In)* равномерно
распределенную в n-мерной пирамиде #i + ... +xn<U */>0.
11. Допустим, что случайная точка Q с плотностью р(<р(х, •«/, г))
определена в области В. Обозначим через Lc часть поверхности
ф(*, У'. 2)= с, принадлежащую В, и предположим, что семейство Lc
при Ci<c<c2 заполняет В. Доказать, что если Igradcpl^ «=Л(с),
то точку Q можно моделировать в два этапа: сперва выбирается
случайное значение параметра р с плотностью рр (c) = [p(c)/h(c)]SL ,
где SL -— площадь LCt а затем на поверхности L выбирается
случайная равномерно распределенная точка.
(В. А. Герман, И. М. Соболь [17].)
12. Доказать, что случайная точка с декартовыми координатами
(gi/ri. • • • » Srt /П). где?/ = — In у^а rj = gi+. • . + Ъп,равномерно
распределена в симплексе *i+..• + хп ==1,0< xt<.\ (/=1,2,..., п).
13. Доказать, что случайная точка с декартовыми координатами
(Ci/p, ... , Сп/р), где 6, . . . » Crt —независимые нормальные
случайные величины с параметрами @; 1), a p=(?i +• ••+ ?/iI/2* Рав"
номерно распределена на поверхности единичной многомерной сферы
ГЛАВА 3
ВЫЧИСЛЕНИЕ ИНТЕГРАЛОВ
Во введении уже упоминалось, что в подавляющем
большинстве задач, решаемых методами Монте-Карло,
вычисляют математические ожидания некоторых
случайных величин. Так как чаще всего математические
ожидания представляют собой обычные интегралы, то
центральное положение в теории методов Монте-Карло
занимают методы вычисления интегралов.
В настоящей главе изложены наиболее важные и
вместе с тем наиболее простые методы, знакомство с
которыми необходимо каждому специалисту в области
Монте-Карло. Более сложные методы, не имеющие пока
значительных практических применений, но
намечающие, как нам думается, основные направления развития
методов вычисления интегралов, рассмотрены в гл. 4.
Впрочем, п. 1.1 гл. 4 мог бы быть отнесен к гл. 3:
выборка по группам не раз использовалась в практических
вычислениях. Численный пример, приведенный в конце
гл. 4 (п. 3.3), относится к оценкам, рассмотренным в
обеих главах.
Заметим, что почти все результаты этих глав легко обобщаются
на интегралы Римана — Стилтьеса (и даже Лебега — Стилтьеса [33]).
Мы, однако, всюду рассматриваем только интегрирование в смысле
Римана.
§ 1. Общий метод оценки математических ожиданий
1.1. Сходимость метода. Рассмотрим произвольную
случайную величину ?, у которой существует
математическое ожидание М| = а. (Напомним, что по
определению математическое ожидание М| существует тогда и
§ 1] МЕТОД ОЦЕНКИ МАТЕМАТИЧЕСКИХ ОЖИДАНИЙ 87
только тогда, когда существует М |||.) Чтобы оценить
величину а, выберем N независимых реализаций ?ь ...,
..., ?л- случайной величины g и вычислим среднее
арифметическое
Так как последовательность одинаково распределенных
независимых случайных величин, у которых существуют
математические ожидания, подчиняется закону больших
чисел (теорема А. Я- Хинчина [44]), то среднее
арифметическое этих величин сходится по вероятности*) к
математическому ожиданию: при JV-^oo
Таким образом, при больших N величина |w«a; и
оценку A) можно использовать во всех случаях, когда
существует М|=а.
1.2. Погрешность метода. Предположим
дополнительно, что случайная величина ? имеет конечную
дисперсию
D|=M(|2)-(M|J. B)
Из курса теории вероятностей известно, что
последовательность одинаково распределенных независимых
случайных величин с конечными дисперсиями подчиняется
центральной предельной теореме. Последнее означает,
что для любых
lim Р L < [1/У7Щ S (It -a)< J L
N-юо I 1=1 )
xt
Выберем лг2= — Xi=x. Тогда из последнего соотношения
получим,что
{ N
Km P
где Ф (х) — интеграл вероятностей, таблица которого
*) Определение сходимости по вероятности приведено на стр. 34.
88 ВЫЧИСЛЕНИЕ ИНТЕГРАЛОВ [ГЛ 3
приведена на стр. 293:
Ф(х) = B/J/2jc) J е-<2'2Л?.
Следовательно, при достаточно больших значениях N
Р{\Ь-а\<хУЩШ}^Ф(х). C)
Формула C) содержит целое семейство оценок,
зависящее от параметра х. Если задать любой коэффициент
доверия р (см. стр. 31), то можно найти (по таблице)
корень х=х$ уравнения ф(х)=$. Тогда из C) вытекает,
что вероятность неравенства
%Z-a\<xtVWN D)
приблизительно равна E.
Чаще других используют коэффициент доверия [1=,
= 0,997, которому отвечает хр==3, или р = 0,95, которому
отвечает хр=1,96. (Значение *р=3 соответствует так
называемому «правилу трех сигм», ибо случайная
величина %N приближенно нормальна и ее среднее
квадратичное уклонение а=У DI/N.)
1.3. Вероятная ошибка метода. Несколько иной
подход к оценке ошибки связан с понятием вероятной
ошибки
rN = 0,6745 УЩ/N. E)
Численный множитель 0,6745, фигурирующий в E),—
это значение х$9 отвечающее ^ = 0,50. Название
«вероятная ошибка» вызвано тем, что
Р {\In - а| < rN) » 1/2 » Р {Цл, - а\ > rN}y
т. е. одинаково вероятны ошибки, большие чем rN, и
ошибки, меньшие чем г*.
Величина rN часто используется на практике для
характеристики порядка ошибки: действительная ошибка
Ил—а | зависит от использованных в расчете случайных
чисел и может оказаться в 2—3 раза больше, чем rNy но
может быть и меньше. Таким образом, используя rN, мы
оцениваем порядок ошибки, а используя D) — верхнюю
границу ошибки (с коэффициентом доверия {J).
§ 1] МЕТОД ОЦЕНКИ МАТЕМАТИЧЕСКИХ ОЖИДАНИЙ 89
1.4. Эмпирическая оценка дисперсии. Как правило,
когда мы приступаем к расчету Mg, значение дисперсии
Dg неизвестно. Хорошую теоретическую оценку для Dg
удается получить редко. Однако в большинстве задач
величину Dg нетрудно оценить эмпирически, в ходе
расчетов а. В самом деле, достаточно одновременно
с вычислением 2gi вычислять также 2(gtJ; так как при
больших N
)G)()f
t--=l
то из B) видно, что
Dg «A/ло 2 (Ы - [A/Л0 21 hj. F)
Формулу F) постоянно используют на практике.
Правда, ниже в п. 1.7 доказано, что при небольших
N более точна формула
G)
отличающаяся от предыдущей множителем (l — l/N). IIo
в расчетах, выполняемых методами Монте-Карло,
всегда А/» 10, и разница между G) и F) невелика. К тому
же надо иметь в виду, что Dg используется только для
оценки ошибки, так что погрешность порядка 10% в
значении Dg роли не играет.
1.5. Оценка ошибки без расчета дисперсии. Будем
по-прежнему считать, что дисперсия Dg конечна.
Допустим, что по каким-либо причинам (иногда из-за
отсутствия места во внутреннем накопителе ЭВМ) мы
не можем (или не хотим) одновременно с Sg< вычислять
также 2(gO2- Оценку погрешности g*—а тем не менее
можно получить.
Предположим, что N=mNu где т — небольшое
натуральное число m^3t a N\ настолько велико, что
распределение случайной величины
С = (UN,) S It (8)
90 ВЫЧИСЛЕНИЕ ИНТЕГРАЛОВ [ГЛ. 3
(где |ь . . . , 5лг, — независимые случайные величины,
распределение которых совпадает с распределением |)
можно считать близким к нормальному (по той же
центральной предельной теореме). Очевидно, М? = а.
Вместо того чтобы сразу вычислять |*, разделим
задачу на т «вариантов» и вычислим т величин, которые
можно считать независимыми реализациями ?:
?•<* ~ лГ JL ?'+# и • • • >
г 1=1
1 ^
f m = 7v7 ?
Воспользуемся теперь следующей теоремой Р.
Фишера [24, 44].
Если ?ь . . . , ?т — независимые одинаково
распределенные нормальные (гауссовские) случайные
величины с математическим ожиданием а, то случайная
величина _
х — а
где
подчиняется закону распределения Стьюдента с (т—\)-й
степенью свободы*). Это означает, что для любых
*) Плотность распределения Стьюдента с г степенями свободы
выражается формулой
г+1
( Х2\ 2
'rW = cr М + 7 » "~
где нормировочная постоянная
§ 1J МЕТОД ОЦЕНКИ МАТЕМАТИЧЕСКИХ ОЖИДАНИЙ 91
В нашем случае величины ?ь . . . , ?т приближенно
нормальные; M?ft=a; x=g*;
2j (?ft — %N) . (9)
Выбрав ^2=—Xi=x, получим приближенное равенство
Р !|Iv - а\ < xVs2l{m-\)) « 2Jsw_! (y) rf//,
которое будет тем точнее, чем ближе распределение %
к нормальному.
На стр. 294 приведена таблица корней *=/т,р
Уравнения
2 f sm (у) dy = |5.
6
Если задан коэффициент доверия (}, то по этой таблице
нетрудно найти соответствующее значение x=tm-\t?> и
записать окончательную оценку: вероятность неравенства
\%n - a| < <«-i.p Ks2/(m - 1) (Ю)
приблизительно равна р.
Оценка A0) подобна оценке D), но вместо
неизвестной дисперсии D| сюда входит эмпирическая величина
s2, которую легко вычислить по формуле (9). Однако,
вообще говоря, оценка D) применима при меньших Аг.
Неравенство A0) позволяет определить также
вероятную ошибку метода E):
riv == ^«-1,0,6/^/(m-l). A1)
Оценка A0) использовалась в некоторых работах автора и,
независимо, в работе Г. Герцеля иМ. Кал оса [127].
1.6. Случай D|=oo. Из п. 1.1 вытекает, что
бесконечность дисперсии не препятствует приближению %к к
а. Однако последующие оценки погрешности теряют
силу. Из D) видно, что в случае конечной дисперсии
ошибка убывает как N~l/2. При D|=oo порядок убывания
ошибки оказывается хуже. Поэтому обычно
рекомендуется избегать методов расчета, в которых дисперсия ос-
редняемсП величины бесконечна.
92 ВЫЧИСЛЕНИЕ ИНТЕГРАЛОВ (ГЛ 3
Тем не менее в некоторых задачах такие методы
используются. Оценки погрешности при D| = oo имеются
в монографии [33] (см. также статьи [144, 176].)
1.7. Замечание. О некоторых терминах, употребляемых в
математической статистике [24, 44].
Независимые реализации ?ь ..., %N случайной величины g
называются выборкой. Предположим, что закон распределения величины !•
зависит от некоторого параметра а. Любая функция от выборочных
значений ср(?ь..., |дг), используемая в качестве приближения к а,
называется оценкой а. Если Мср==а, то оценка ср называется несме-
р
щечной. Если ф —>> а при N —>- оо, то оценка ф называется
состоятельной. При небольших N более существенно отсутствие смещения,
при больших — важнее состоятельность.
Очевидно, оценка A) представляет собой несмещенную и
состоятельную оценку математического ожидания а.
Легко доказать, что оценка дисперсии
фигурирующая в F), смещенная В самом деле,
М | A/Л/) 2 Щ - % 1 = М (V) - М (Щ = DI - DlN>
ибо MJ = М1д,. Из A) следует, что Df^ =Dg/A^. Поэтому
Несмещенную оценку дисперсии дает формула G).
Рассмотрим две функции <p'(?It ...,gw; р) и ф'^Бь..., ?дг; р).
Интервал (ф', ф/7) называется доверительным интервалом для
параметра а с коэффициентом доверия р, если вероятность неравенства
ф'<а<ф" равна C:
В приведенных выше оценках D) и A0) использованы
доверительные интервалы для среднего значения а нормальной случайной
величины: в первом случае — при известной дисперсии, во втором —
при неизвестной. Так как величины |л/ и t,k лишь приближенно
(асимптотически) нормальны, то вероятности неравенств
%N - Х& УШИ! < а < \N + *p VWN
и соответственно
лишь приближенно равны
§ 2] ПРОСТЕЙШИЙ МЕТОД МОНТЕ-КАРЛО 93
§ 2. Простейший метод Монте-Карло
для вычисления интеграла
2.1. Простейший метод Монте-Карло. Обозначим
через G произвольную область (ограниченную или
неограниченную, связную или несвязную) плоскости х, у.
Точки плоскости будем обозначать одной буквой Р={х,у),
а элемент площади dP=dxdy. Рассмотрим задачу о
приближенном вычислении интеграла
/- $f(P)P(P)dP, A2)
G
где р(Р)—некоторая заданная плотность вероятностей,
определенная в G, так что J/? (P) dP = 1.
G
Заметим сразу, что любой интеграл
по ограниченной области G можно считать
интегралом вида A2). Действительно, если площадь G
обозначить через SG, то p\(P) = l/SQ при P<=G представляет
собой плотность вероятностей случайной точки,
равномерно распределенной в G. Если ввести функцию fx(P) =
= SG-f(P) то, очевидно,
Чтобы построить метод Монте-Карло для расчета
интеграла A2), рассмотрим случайную точку Q с
плотностью р(Р) и введем скалярную случайную величину
Z=f(Q), математическое ожидание которой равно
искомому значению интеграла
SI- A3)
G
Для расчета MZ можно использовать оценку A).
Итак, если Qi, . . . , Qn — независимые реализации
случайной точки Q и Zi=f(Qi), . . . , ZN=f(QN)9 то
оценкой интеграла A2) служит величина
Ц Z,. A4)
94
ВЫЧИСЛЕНИЕ ИНТЕГРАЛОВ
[ГЛ 3
Очевидно, M9iv = /, и если существует M|Z|, то, соглас-
р
но п. 1.1, оценка 0^ > L В рассматриваемом случае
M\Z\=l\f(P)\p(P)dP.
G
Следовательно, если интеграл A2) сходится абсолютно,
то 9iv сходится по вероятности к /.
Пример. Требуется вычислить интеграл
оо
/== [ f(x)e~kxdxt где k>0.
6
Выберем плотность p(x)=ke~kx и функцию. fi = ?~7(*). Если
6/ -значение случайной величины | с плотностью р(х), то оценка
интеграла
Находить значения g можно по формуле G) гл. 2. Поэтому Формулу
для вычисления / можно записать в виде
N
где Yt,
In у,.),
yv —независимые случайные числа.
Zl
В дальнейшем вычисляются только абсолютно
сходящиеся интегралы. Однако метод Монте-Карло
позволяет вычислять и условно
сходящиеся интегралы, если
преобразовать их надлежащим
z*f(s,u) образом (см. упражнение 5
гл. 3).
2,2. Геометрический метод
Монте- Карло. Предположим,
что в области G
0<f{P)^c. A5)
В трехмерном пространстве х,
у, z рассмотрим
цилиндрическую область G=GX@, с)
Рис. 34. (рис. 34), а в ff рассмотрим
случайную точку Q с плотно-
стьк^/)(#, у, z) — (\jc)p(x, у). Очевидно, проекция
точки Q на плоскость х, у представляет собой случайную
§ 2] ПРОСТЕЙШИЙ МЕТОД МОНТЕ-КАРЛО 95
точку Q=(l, г|) из п. 2.1 (с плотностью ,р(х, у))у а
третья координата G, назовем ее ?;, не зависит от ^ и т) и
равномерно распределена в интервале 0<г<с, так что
ее плотность р^(г) = 1/с.
Выберем N независимых реализаций Qb . . . , QN
случайной точки Q; обозначим через v количество
точек, оказавшихся ниже поверхности z=f(P), и составим
оценку
QN = cv/N. A6)
Дискретная случайная величина v подчиняется
распределению Бернулли Р {v = m} = C™pm(l—p)N~m(tn==Of I,. . .
. . . , N), где р — вероятность того, что точка Q
окажется ниже поверхности z=f(P). Вычислить эту
вероятность нетрудно:
T))}= Idxdy Г ~p(x,y,z)dz =
G О
Так как Mv=Np=(l/c)NI, то из A6) вытекает, что
^ р
M0jv=/. Сходимость Эдг Ч следует из известной
теоремы Бернулли о сходимости частот к вероятностям.
Впрочем, оценку A6) также можно представить в
форме A). Введем случайную величину Z, зависящую
от точки Q=(l, ц, t):
(с, если ?</(?, л),
Z-l0, если ?>/F, п).
Если точкам Qi, . . . , QN соответствуют значения Z[y.. ¦
- ., ZNi то
^. A7)
^, р
И поэтому утверждения о том, что М6^ = / и GN ^ /
вытекают также из результатов § 1. Абсолютная
сходимость интеграла A2) следует из ограничения A5).
Геометрический метод представляет собой обобщение метода
вычисления объема, рассмотренного во введении. В самом деле, если
96 ВЫЧИСЛЕНИЕ ИНТЕГРАЛОВ [ГЛ 3
область G ограничена и p(P)^\/SG при Р е С, то при больших N
v/N » 11с =
где V== \f(P)dP— объем части б1, ограниченной сверху поверх-
G
ностью z=f(x, у), a V~ = cSG—объем всей цилиндрической
области G.
2.3. Сравнение точности методов Монте-Карло.
В оценке A4) фигурируют значения случайной величины
Z=f(Q)i где Q — случайная точка с плотностью р(Р).
Так как для существования дисперсии DZ необходимо
и достаточно, чтобы существовал второй момент
A8)
(ср. B)), то условием применимости оценок
погрешности § 1 в рассматриваемом случае служит
существование интеграла A8)*).
Если через L2 обозначить множество ф) акций f(P),
для которых интеграл A8) сходится, то требование
сходимости этого интеграла можно записать в форме f(P)^
eL2. В тех случаях, когда важно указать область G и
плотность р{Р)у будем писать, что f(P)^L2(G\ p).
Итак, еслтт f(P)^L2(G\ p), то дисперсия осред-
няемой величины Z в простейшем методе п. 2.1
конечна:
DZ= \f*(p)p(P)dP-l\ A9)
G
Рассмотрим теперь геометрический метод п. 2.2.
В оценке A7) осредняются значения случайной
величины Z, для которой
так что дисперсия
DZ = с/ - Р. B0)
*) Из сходимости интеграла A8) следует абсолютная
сходимость интеграла A2), ибо
I/ (Р)\Р (Р) dP^ < J Г (Р) Р (Р) dP.
ПРОСТЕЙШИЙ МЕТОД МОНТЕ-КАРЛО 97
Сравним величины A9) и B0): если 0^/(Я)^с, то
(Р) р (Р) dP < с J/ (/>) р (Р) dP - cl,
следовательно,
DZ<DZ. B1)
Неравенство B1) показывает, что в каком-то
отношении простейший метод Монте-Карло лучше
геометрического метода: при одинаковом количестве N осредпя-
емых величин вероятная ошибка оценки A4) будет не
больше, чем вероятная ошибка оценки A7). Можно
сказать, что точность метода Монте-Карло зависит от
дисперсии осредняемой слунайной величины. И простейший
метод всегда точнее геометрического.
Пример. Требуется вычислить интеграл
/= f exdx.
о
Оценк'и A4) и A6) в этом случае равны
N
v
где v — количество пар (Ti, Yi)> • ••> (vyv» Vyv) таки^, что еу\ < evl
(как всегда Ть ...* 7л;» Vi» •••» Y.v~~ независимые случайные числа),
По формуле A9) вычислим дисперсию DZ:
1
DZ= f e^dx — I* = A/2) (е3 — 1) — (в— IJ = 0,2420.
О
По формуле B0) вычислим дисперсию DZ:
DZ = ef — /2 =(?—] = 1,7183.
2.4. Сравнение трудоемкости алгоритмов
Монте-Карло. Из результатов предыдущего пункта
напрашивается вывод, что простейший метод Монте-Карло всегда
выгоднее геометрического. Однако такой вывод был бы
слишком поспешным: хотя вероятная ошибка оценки G*
и меньше вероятной ошибки QN при одинаковых N, но
время, затрачиваемое на расчет QNi может оказаться
гораздо больше времени, затрачиваемого на расчет 0W,
7 И М, Соболь
98 ВЫЧПСЛГЛШГ ПНТПГР\ЛОВ ГГ.Л 3
И тогда оценка 6Л- окажется практически более
эффективной, чем GiV.
Обычно говорят, что «построен метод Монте-Карло»
для расчета интеграла / тогда, когда определена оценка
вида (I), приближающая /:
при этом обычно предполагается, что М? = /. Условимся
говорить, что «построен алгоритм Монте-Карло»,
соответствующий данному методу, если указаны также
формулы для моделирования используемых в этом методе
случайных величин. Например, оценка A4) и формула
Z~f(Q) определяют метод Монте-Карло; чтобы
получить алгоритм Монте-Карло, надо указать еще
формулы для расчета точки Q по стандартным случайным
числам. Как мы видели в гл. 2, это можно делать
различными способами, так что один и тот же метод
Монте-Карло может быть реализован в виде различных
алгоритмов.
Рассмотрим два алгоритма Мопте-Карло
(безразлично соответствуют ли они разным методам или одному)
для вычисления интеграла /. Пусть в одном
алгоритме осредняются значения случайной величины |' =
= g'(Yi,..., v). а во втором g" = g"Di,..., v)> так
что соответствующие оценки интеграла равны
О,; = (l/N) 2 It и О; = AAV) S С B2)
,•=1 i=i
Обозначим дисперсии осредняемых величин через D' =
= D?' и D"=D?", и пусть /' и t" — время,
затрачиваемое на расчет одного значения ?' и соответственно |",
Естественно считать более эффективным тот алгоритм,
который требует меньшего времени счета для
достижения заданной вероятной ошибки.
Для того чтобы вероятная ошибка для первого из
сравниваемых алгоритмов равнялась /v, = e, количество
А;/ осредняемых значений ?', согласно E), должно
равняться
§ 2] ПРОСТЕЙШИЙ .МЕТОД М0Н1 Е КАРЛО ?9
Время счета при этом окажется равным
Для второго алгоритма время счета, необходимое для
достижения той же вероятной ошибки е, равно
Назовем трудоемкостью алгоритма Монте-Карло
произведение /Dg дисперсии осредняемой случайной
величин | на время / расчета одного значения |. Тогда
время счета, необходимое для достижения заданной
вероятной ошибки, окажется пропорциональным трудоемкости
алгоритма. Ясно, что из двух алгоритмов более
эффективен менее трудоемкий.
Так как трудоемкость используется обычно для
сравнения алгоритмов, то вычислять ее можно в любых
единицах, в частности, / можно выражать в секундах,
а можно — в количествах элементарных операций.
Конечно, надо предполагать, что сравниваемые алгоритмы
реализуются с помощью одних и тех же вычислительных
средств. Кстати, не исключена возможность того, что
при переходе к другим средствам вычисления менее тру
доемкии алгоритм станет более трудоемким.
Пример. Вычислить интеграл
6 °
Можно считать, что под интегралом стоит также плотность
p(x)z=\ случайной величины у. Тогда простейший метод приводит
к оценке
/»A/iV) 23 5|Av
Дисперсия осредняемой случайной величины Z=(yI'5 равна
Так как О^Л'1/5^!» то можно воспользоваться также
геометрическим методом:
где ~ZL =-;!, если у\ < (Y;I 5 и 1^0 в противном случае. Дисперсию
7*
100 ВЫЧИСЛЕНИЕ ИНТЕГРАЛОВ 1ГЛ. 3
осредняемой величины легко вычислить по формуле B0):
~ 5 /5\2 5
Таким образом, в полном согласии с B1), DZ<D?r
Оценим количество операций, затрачиваемых на расчет одного
значения Zt или Zr Для расчета Zt надо найти одно случайное число
Ус — три операции — и вычислигь(у^)J 5. На ЭВМ вычисление хх °
осуществляется путем логарифмирования с помощью стандартных
программ In х и ехр х. Общее количество используемых в таком
расчете элементарных операций /«70.
Для расчета Z tna^o найти два случайных числа 7/ и Ус — шесть
операций — и вместо неравенства yt < (Т/I/5 проверить равносильное
неравенство (?*) < V;- Общее количество элементарных операций
в таком расчете /ж 10.
Значит, / • DZ«1,4, WZ~\,4 и второй алгоритм оказывается не
более трудоемким, чем первый, несмотря на то, что дисперсия DZ
в семь раз больше, чем DZ.
Однако тот же простейший мегод можно реализовать с помощью
другого алгоритма (см. п. 4.1 гл. 2).
тогда ^«20 и t • DZ«0,40, гак что трудоемкость этого алгоритма
оказывается заметно меньшей.
§ 3. Важнейшие способы построения хороших оценок
(способы уменьшения дисперсии)
Из формулы E) видно, что вероятная ошибка
оценки A) пропорциональна yD$/N. Скорость убывания этой
ошибки с ростом iV невелика. Поэтому очень важно
научиться выбирать для расчета интегралов такие
вычислительные схемы или, другими словами, такие
случайные величины g, для которых дисперсия D| по
возможности мала. Часто способы построения таких схем
называют способами уменьшения дисперсии,имея ввиду,
что для этих способов дисперсия должна быть меньше,
чем дисперсия простейшего метода Мопте-Карло (п. 2.1).
3.1. Частичное аналитическое интегрирование. Если
часть задачи можно решить аналитически, то, используя
это частичное решение, обычно удается построить метод
§ 3] СПОСОБЫ ПОСТРОЕНИЯ ХОРОШИХ ОЦЕНОК 101
Монте-Карло для решения всей задачи с дисперсией,
меньшей, чем A9). Правда, вообще говоря,
построенные таким путем методы могут оказаться более
трудоемкими и в конечном счете невыгодными.
Мы будем говорить об аналитическом
интегрировании, хотя в некоторых случаях такую же роль может
сыграть численное интегрирование, если точность этого
интегрирования значительно выше, чем точность метода
Монте-Карло.
3.1.1. Выделение главной части. Это весьма
очевидный и весьма общий принцип, относящийся ко
всем методам Монте-Карло: если главную часть задачи
можно вычислить аналитически, то, как правило,
выгодно считать методом Монте-Карло не всю задачу, а
только «поправку» — разницу между всей задачей и главной
частью. Уменьшение дисперсии при этом может
оказаться очень значительным.
Пусть, например, требуется вычислить интеграл A2)
/= Sf(P)p(P)dP,
G
где f(P)^L2(G\ /?), и имеется функция h(P)^L2(G\ р)у
«близкая» к /(Р), такая, что значение интеграла
\h{P)p{P)dP~C
G
известно. Тогда вместо оценки A4) можно использовать
оценку
9; « С + A/Л0 Ц [/ (Q{) - h (Q,)]f B3)
*«1
ибо математическое ожидание осредняемой величины
Z'=C+f(Q)-h(Q)
равно MZ'=C+/—С=/. Дисперсия Z/ в этом случае
равна
DZ' - Jtf (Р) - h (Р)]2 р (Р) dP - (/ - СJ,
о
Если А (Я) настолько близка к f{P), что
1
и
то, очевидно, и
Ю2 вычисление интегралов гп з
Пример. Вычислить интеграл
I
/= \ exdx,
О
рассмотренный'в п. 2.3. Так как ех = 1+х+ ..., то выберем h(x)=x
(постоянное слагаемое на дисперсию не влияет). Согласно B3)
получим расчетную формулу
Дисперсия осредняемой величины Z/=\/2-[ ey —у равна
1
DZ' = \{ех— хJ dx — (I - 1/2J - (е — 1) E — е)/2 —
6
— 23/12 = 0,0437
и значительно меньше, чем DZ и DZ в п. 2.3.
Общие правила выделения главной части указать
трудно: в различных задачах это делается по-разному.
Например, при расчете больших сцинтилляционных
детекторов необходимо учитывать многократно рассеянные
нейтроны (их вклад в световыход составляет до 10%).
В. Г. Золотухину с сотрудниками [37] удалось добиться
значительного увеличения точности метода Монте-Карло
путем аналитического учета вклада нерассеянных и
однократно рассеянных нейтронов.
В ряде областей физики используют теорию
возмущений, которая позволяет оценить решение сложной
задачи по известному решению «близкой» простой
задачи. Если рассчитывать методом Монте-Карло не всю
сложную задачу, а только интегралы теории
возмущений, то можно значительно повысить точность
результатов [57].
3.1.2. И нтегр и р ов а н не по части области.
Допустим, что мы умеем (аналитически) вычислить
интегралы по некоторой части В области G:
где 0<с<С1. Докажем, что, как правило, всегда выгодно
представить интеграл A2) в виде суммы
/= Sf(P)p(P)dP+C B4)
с i
§ 3]
СПОСОБЫ ПОСТРОЕНИЯ ХОРОШИХ ОЦЕНОК
ЮЗ
и вычислять простейшим методом только интеграл по
области G\=G—B. (Если С близко к /, то можно
считать, что мы выделяем
главную часть; но данный прием ij\
выгоден и тогда, когда область
В заметно меньше, чем G
(рис. 35); правда, и
понижение дисперсии в этом случае
будет заметно меньше.)
В области G\ определим
плотность Р\(Р) —р(Р)/A— с)
и рассмотрим случайную
величину * рпс> 35.
где Q'— случайная точка с плотностью р\{Р) в G\.
Легко видеть, что MZ' = /. Поэтому для расчета / можно
использовать оценку
N
где Qi,...»Q# —независимые реализации точки
Q'. Чтобы сравнить эту оценку с оценкой A4), сравним
дисперсии DZ' и DZ, где Z = f(Q).
Теорема 1. Если существует дисперсия DZ, то
B6)
Доказательство. Согласно определению
дисперсии
DZ=Jf*pdP-I2= U2pdP+ J/2prfP-/2,
DZ' = A _ cf I PPldP — ГA —с)
Умножив DZ на 1-е и вычтя DZ', получим, что
A -с) DZ-DZ' = (l-c) J f-pdP -A-е) Г* + (I-Q\
В
Оставшийся интеграл по области В выразим через
неотрицательную величину
Ь2~ {(f-C/cJpdP= \PpdP-
в в
104
ВЫЧИСЛЕНИЕ ИНТЕГРАЛОВ
ГГЛ. 3
+ [У~с1 -
Тогда окажется, что
A _ С) DZ - DZ' - A - с)
что и требовалось доказать.
Предположим, что задан какой-либо алгоритм
расчета точек Q в G. Тогда трудоемкость алгоритма A4)
равна (tQ+ti)DZ, где tQ — время расчета одной точки Q, а
tf — время расчета одного значения /(Q).
Рассмотрим оценку B5). Если никакого более
удобного способа моделирования точек Q' в G\ пет, то
можно отбирать точки Q' среди точек Q (п. 5.2 гл. 2).
Эффективность такого отбора 3=P{QeGi} = l—с.
Поэтому время расчета одной точки Q' в среднем равно tQ,=
— (tQ+to)I(l—c)f где t0—-время, затрачиваемое на отбор
(т. е. на проверку условия Q^G\). Трудоемкость
алгоритма B5) в этих условиях равна (/Q, = ^)DZ'.
Легко доказать, что если
to^ct,, B7)
то трудоемкость алгоритма B5) не больше, чем
трудоемкость алгоритма A4). В самом деле,
(tQ> + /,) DZ' < [(tQ + ctf)l(\ ~ с) + tf\ DZ' < (/Q + tf) DZ.
Условие B7) легко проверяется на практике. Если
область В «простая», а функ-
ция f(P) «сложная», то,
ОЧевидно,
Пример. Требуется
вычислить объем фигуры V,
ограниченной поверхностью (в
сферических координатах)
г = а-|-/ш(ф, 0),
где —К«(ф, 0)^1 (рис. 36).
Обозначим через Уо и V\
вписанный в V и описанный
около V шары, радиусы которых
равны а — h и a+h. Объемы Ко,
Vt V\ будем обозначать теми
Рис. 36. же буквами. Воспользуемся
геометрическим методом:
выберем случайные точки Qlf. >^Q^9 равномерно
распределенные в Vu и если v из этих точек попадут внутрь V, то будем считать,
что объем V приближенно равен
§ 31 СПОСОБЫ ПОСТРОЕНИЯ ХОРОШИХ ОЦЕНОК 105
Выделим теперь объем ^шара Vo. Для этого достаточно выбрать
случайные точки Qj«.. . i QN, равномерно распределенные в
шаровом слое V\ — Vo', если v' из этих точек принадлежат V, то объем V
приближенно равен
Вместо сравнения дисперсий осредняемых величин сравним в этом
примере дисперсии самих оценок. Так как vhv' подчиняются
биномиальным распределениям с параметрами p=V/Vi и соответственно
/7/=(V— V0)/(^i— V'o), то Dv = Np(l—p)y DV = Np'(l— p').
Поэтому Г% = A/ЛО 1/A/! - F), D9^ = (\/N) (У- Vo) {Vi - V).
Очевидно, всегда Do
Если отношение ве=/?/а<1, то в оценке QN мы фактически
выделяем главную часть задачи, и уменьшение дисперсии D$N по
сравнению с DdN должно быть особенно заметным. Действительно,
так как V0=D/3)n(a — h)\ Vi = D/3)я(a+hK, то можно записать,
что 1/= D/3) я (а+ МоЛ)8, где |wo|<l. Тогда нетрудно сосчитать, что
величина
V(Vi — V) = [D/3)яа8]23A - и0)е+О(е2)
пропорциональна е, а величина
(V - 1/0) (Кх - V) = [D/3) я^]9- 9 A - «») е3 + О (в»)
— второго порядка малости.
Наконец, покажем, что если моделировать точки Q и Q' в
сферических координатах (п. 2.4.1 гл. 2), то алгоритмы, соответствующие
обоим рассмотренным методам, примерно одинаково сложны: /«/'.
В самом деле, в обоих ^случаях для i-ro испытания f нужны три
случайных числа Yi» y\* ?'/• Координаты точек Q; и Q\вычисляются
соответственно по формулам
или
3/-
где Ь=(а — h)*f(a-\-hK. Условие принадлежности точки Q Q{
объему V проверяется одинаково:rt< a-\-hu (<pt., б^.Если это условие
выполнено, то к счетчику v (соответственно v') добавляется единица.
3.1.3. Интегрирование по части
переменных (понижение порядка интеграла).
Докажем, что если аналитически взять интеграл по некоторым
из переменных, а по остальным переменным
использовать тот же метод Монте-Карло, то дисперсия
уменьшится [143]. Правда, в отличие от случая, рассмотрен-
Юб ВЫЧИСЛЕНИЕ ИНТЕГРАЛОВ [ГЛ 3
ного в п. 3.1.2, нередко бывает, что после
интегрирования по некоторым из переменных получаются более
сложные формулы счета и, несмотря на уменьшение
дисперсии, трудоемкость возрастает.
Перейдем к точной формулировке задачи. Пусть
требуется вычислить интеграл
U\f()p(,),
G G'
где р(Р, Pf)—совместная плотность вероятностей
случайных точек QeG и Q'selG'\ JJ p{P,P')dPdP'=\.
GG'
Если интеграл этот вычислять простейшим методом, то
осредняемая случайная величина Z=f(Q, Q').
Предположим, что по переменному Рг мы умеем
выполнить интегрирование и можем вычислить плотность
точки Q:
Pi(P) = \p(P,P')dP\
Ь'
а также функцию
h (Р) - 1 / (Р, П Р (Р, Pr) dPf IP
Тогда, очевидно,
и если вычислять простейшим методом этот интеграл, то
придется осреднять величину Z/=/i(Q).
Теорема 2. Если дисперсия DZ конечна, то DZ7^
Z
Доказательство. Воспользуемся неравенством
A) на стр. 292.
(Pi (P) h (Р)]2 = Г f / Vp - Vp dP'J < f f*P dp* \ p dp\
[bf I Gf G'
Отсюда следует, что
/? (P) Px (P) < (p (p, p1) p (p, pr) dp\
§ з]
СПОСОБЫ ПОСТРОЕНИЯ ХОРОШИХ ОЦЕНОК
Проинтегрировав это неравенство по Р, получим, что
f /i (P) Pi (P) dP<\dP[P (P, Pr) p (P, Pr) dP',
G G ?.
пли, что то же, M(Z/2)^ M (Z2). Так как
то тем самым доказано, чго DZ
П р и м е р. Рассмотрим интеграл
l = \\{\ly)dxdy,
в
где область интегрирования В представляет
собой треугольник, ограниченный прямыми ,
#=!, л;=2 и у=х (рис. 37). Интеграл этот
легко вычисляется:
2 х 2
1 ^\dxl У^йУ = f lnxd* = ^
1 l li
= 2 In 2 — 1-0,38630.
Рис. 37.
А. Введем случайную точку (I, rj), плотность которой р(лг, ^)ss2
в В. Тогда / = MZ, где Z==Bn)", а дисперсия
2 *
DZ = Г dx\ 2~]y~2 dy ~ /2 = A/2) G 1п 2 — 1) — 4 In2 2 = 0,0043.
1 1
Так как плотность р^ (у) =2B — у), то из уравнения F^ (г)) = 1 —у
получим, что tj = 2 "|/"y» Следовательно, оценка интеграла / равна
Б. Проинтегрируем аналитически плотность и подынтегральную
функцию по у:
X X
Pi (х) = 12 dy - 2 (х - 1), р, (jt) / (х) = J A/у) ^ = 1плг.
В этом случае функция распределения ?_ргвиа Fi(^) = (л:—IJ. Из
уравнения /rjE)=Y следует, что 5=1+Уу« Так как осредняемая
величина Z/—fi(i)=2~1(l— l)ng, то оценка интеграла
Дисперсия в этом случае равна
2
DZ' = Г 2 (д: - I) hi2 jf ^v - /2 = 0,15025 - 0,14923 = 0,0010.
108 ВЫЧИСЛЕНИЕ ИНТЕГРАЛОВ [ГЛ 3
В. Из первых цифр табл. 4 (стр. 295) образуем десять случайных
чисел и вычислим по ним значения 0ю и О'ю- Случайные числа:
Yi = 0,86515, Y2=0,90795, уз=0,66155, у4=-0,66434, у5=0,56558,
Ye=0,12332, Y7=0,94337, ув=0.57802, уэ = 0,69186, Yio = O,O3393.
Сосчитанные по ним значения:
010 = 0,408, 0'1О-=О,378.
Ошибки этих значений 6i0 — /=0,022 и 0'ю — /=^0,008 близки к
соответствующим вероятным ошибкам г10 = 0,014 и rI0=0,007.
3.2. Метод существенной выборки. До сих пор мы
рассматривали интегралы вида A2) и использовали при
вычислении их случайные точки с плотностью р{Р).
Предположим теперь, что требуется вычислить
абсолютно сходящийся интеграл
I0=\f(P)dP, B8)
G
где область G может быть как ограниченной, так и
неограниченной, и квадрат функции f(P) не обязательно
интегрируем. Предполагается только, что* f \f{P) |dP>0.
G
3.2.1. Плотность p{P)y определенную в G, назовем
допустимой по отношению к f(P), если р(Р)>0 в тех
точках, в которых f(P)=?O.
Если р(Р)>0 всюду в G, то эта плотность
допустима по отношению к любым f(P). Вообще же допустимая
плотность может обращаться в пуль, но только там, где
f(P)=O. Множество точек, в которых f(P)=O, назовем
Со и пусть G+=G—Go.
Выберем произвольную допустимую плотность р(Р)
и рассмотрим функцию
z (P) = i
1 о при />е<?0.
Если Q — случайная точка, определенная в G с
плотностью р(Р)у то
MZ0 (Q) = f Zo (Р) р (Р) dP= J / (Р) dP = /0,
G Q +
ибо вне множества G4* функция f(P)=Q.
§ 3] СПОСОБЫ ПОСТРОЕНИЯ ХОРОШИХ ОЦЕНОК ЮЭ
Согласно п. 2.1 для приближенного расчета /о молено
использовать независимые реализации Qi, . . ¦ , Qn
случайной точки Q и оценку
Вероятная ошибка этой оценки зависит от дисперсии
DZ0(Q), которую нетрудно вычислить: так как
DZ0 = jjzl(P)p(P)dP~-/i
Ь
•го
DZ0 = l[f2{P)Ip(P)\dP-ll B9)
G+
Величина эта зависит от выбора плотности р{Р) и даже
не обязательно конечна. Естественно поставить вопрос о
выборе р(Р) #так, чтобы минимизировать DZ0.
Теорема 3. Минимальная дисперсия DZ0
реализуется в случае, когда плотность р(Р) пропорциональна
\f(P)\ и равна
\$j C0)
Доказательство. Если плотность р{Р)
пропорциональна \f{P) |, то она равна
]l. C1)
Подставив C1) в B9),получим, что DZ0=DZ0.
Осталось доказать, что, какова бы ни была
допустимая плотность р{Р), дисперсия DZ0^DZ0. А это легко
доказывается с помощью неравенства A), стр. 292:
" I I 1 !•! < т-ч I <S I 1 I <• . i Л « ,» « т-ч I й
¦u
С+ I LO+
\ j §
G'l" G+ C+
Следствие. Если подынтегральная функция f(P)]
не меняет знака в G, то, DZ0=0,
110 ПЫЧПГЛГНИЕ ИНТЕГРАЛОВ (ГЛ 3
Отметим, что плотность р(Р) тождественно равна
нулю в области Go, в которой /(Я)=0. Этот результат
согласуется с выводом из теоремы 1, что область, в
которой /(Я)=0, выгодно при интегрировании исключить.
В действительности использовать плотность C1) для
расчета интеграла B8) нельзя, ибо в C1) входит
значение J \f(P)\dP, вычисление которого представляет со-
G
бой задачу, эквивалентную по трудности исходной
задаче (в случае знакопостоянной функции f(P) —в
точности эквивалентную). Однако из теоремы 3 можно
сделать вывод, что желательно выбирать плотность р(Р)
по возможности пропорциональной |/(Я)|. Такой метод
выбора р(Р) часто приводит к величинам Zo с
небольшими дисперсиями. Он был предложен Г. Капом [142]
и называется методом существенной выборки
(importance sampling), ибо если р(Р) пропорциональна |ДЯ)|, то
в тех частях области G, в которых |/(Я}| больше и
вклад которых в /0 более существен, будет выбираться
больше случайных точек.
Возможна и другая интерпретация целесообразности
выбора р(Р) пропорционально f(P) (в случае
знакопостоянной f(P)): чем ближе Z{)=f(P)/p{P) к постоянной,
тем меньше дисперсия DZ0(Q).
Очень сложные плотности р{Р) использовать не
рекомендуется, так как тогда процесс реализации
случайных точек Q с плотностью р(Р) станет очень
трудоемким. Заметим, что для вычисления интеграла
не обязательно использовать оценку QN: можно
применить какой-нибудь из методов п. 3 1.
При м е р. Интеграл
I
о
рассмотренный в пп. 2 3 и 3.1.1, можно представить в виде
1
$ е* A + x)-lp{x)dx.
§ 3] СПОСОБЫ ПОСТРОЕНИЯ ХОРОШИХ ОЦЕНОК U1
где р(х) = B/3) A+*). Значения случайной величины g с плотностью
р(х) вычисляются по формуле | = У\ + Зу—1 (метод обратных
функций), а оценка равна
В эгом примере дисперсия осреднясмон величины Z(g)= C/2) g5
'+ l)~* равна
1
DZ = C/2) \е2х (\ +X)-Idx — I2^ 0,0269.
о
Это гораздо меньше, чем в п. 2.3, и меньше, чем в п. 3.1.1.
3,2.2. Метод существенной выборки позволяет строить
хор жше оценки для несобственных интегралов B8).
Предположим, что область G ограничена, но
^*(P)dP = оо. C2)
В этом случае простейший метод Монте-Карло
позволяет записать оценку интеграла B8)
1=1
где точки Qi равномерно распределены в G, a VG —
объем G. Однако оценка этаплохая, ибо D0A=oo. В то
же время оценка, полученная методом существенной
выборки будет иметь конечную дисперсию, если выбрать
допустимую плотность р{Р) так, чтобы интеграл,
фигурирующий в выражении B9), сходился. Такие
плотности всегда существуют. В частности, этому
требованию удовлетворяет плотность C1).
На .практике, если подынтегральная функция f(P)
имеет особенность, то стараются выбрать плотность р(Р)
с той же особенностью, так, чтобы отношение f(P)lp(P)
было ограниченным. Прием этот часто называют
включением особенности в плотность.
Предположим теперь, что функция f(P) в B8)
особенностей не имеет, но область интегрирования G но
ограничена. Чтобы оценить такой интеграл, можно
115 вычисление интегралов сгл. з
выбрать ограниченную область GeczG так, что
f f(P)dP
и строить оценку для интеграла по области Ge. Вместо
этого можно попытаться заменой переменных
преобразовать G в конечную область. Однако наиболее
естественным, по-видимому, надо считать использование метода
существенной выборки. И в этом случае также
рекомендуется включать особенность в плотность, т. е. выбирать
р(Р) так, чтобы отношение f(P)/p(P) стремилось к
постоянной при |Р| -> оо, Ре С
3.2.3. Один тип интегралов с особенностью.
Обозначим через G шар x2+y2+z2<R2. Во многих разделах физики и
механики встречаются интегралы вида
ff/i(P, P')$radPdP't
GG
где обе точки Р и Р' принадлежат G, а р — расстояние между этими
точками: р=|Р — Р'|.
Рассмотрим интеграл такого типа с особенностью
\\ C3)
GG
тле функция /i(p) ограничена и /г@)^0. Интеграл C3) абсолютно
сходится при а<3.
А. Для того чтобы вычислить интеграл C3) простейшим методом
Монте-Карло, выберем две независимые случайные точки Q и Q',
равномерно распределенные в G. Так как плотности их Pq (Р) =
= pQt (Р')= l/VG, то положим Z=: 1/2/г(р)р-а,где р= IQ — Q'|,
VG =D/3)я/?3. Тогда MZ = /, а дисперсия Z равна
Ш = VI \\ h2 (p) {T2adP dP' - /2.
GG
При 1,5^ а <3 последний интеграл расходится и DZ==oo.
Б. Воспользуемся методом существенной выборки и выберем
совместную плотность р(Р, Р') случайных точек Q и Q' так, чтобы
она содержала такую же особенность, как подынтегральная функция.
Так как р(Р;Р') =Pq (P)Pq/(P'I P), то точку Q будем по-прежнему
считать равномерно распределенной в G: Pq (Р) з 1/V<?. *
Для определения Pq? (P'\P) перенесем начало координат в точку
Р и выберем сферические координаты г', 0', q/ с центром в Р (рис. 38).
Направление (из точки Р) условимся задавать единичным вектором со,
а расстояние по этому направлению от точки Р до границы шара G
назовем /(со). Пусть
Pq'P' \Р) = («лГ1 C - а) (г')-аГC-а), - C4)
Гдег'НР'-Pj, a cD=(P/-P)/r/,
§
СПОСОБЫ ПОСТРОЕНИЯ ХОРОШИХ ОЦЕНОК
113
Нетрудно проверить, что формула C4) действительно
определяет условную плотность вероятностей: при любой фиксированной
точке Р н v
J pQ,(P'\P)dPr »^DяГ^© Г C-а)(г'J~а/а"~3?*г'«=1.
Ъ 6
Рассмотрим скалярную случайную величину
Z (Q, Q') = 4jiVq C - а)-1/? (р) /3~а (©),
где р = | Q7 — Q |, co=(Q/-.Q)/p. Нетрудно вычислить, что
№ ~l\ZPQ {P)PQ> {P' \?)dP dP' =:\\h(r')(r'r*dP dPf = 1,
GG cg
a дисперсия этой величины равна
DZ = (AnVGf C - аГ2 fj/г2/6~2ар dP dP' ~ /a.
CG
Так как функция /i(p) ограничена, а / не превосходит диаметра шара
G, то последний интеграл сходится, и
дисперсия DZ конечна при всех а<3.
В. Из-за симметрии задачи
интеграл C3) может быть сведен к
трехкратному. В расчетной схеме методов
Монте-Карло этот факт учитывается
«автоматически», если при
реализации случайных точек принимать во
внимание симметрию. Чтобы показать
это выведем расчетные формулы для
обоих способов расчета /.
Сферические координаты точки Q
в обоих случаях можно вычислять
по формулам A4) гл. 2. Однако из
соображений симметрии ясно, что
точку Q можно выбрать на оси Oz.
Поэтому положим XQ = У§ в О»
Рис. 38.
rQ
Q Q
В способе Л точка Q' также равномерно распределена в G. Из
соображений симметрии ясно, что можно ее выбирать в плоскости
с[/ = 0 и считать, что
где cos 9Qr
— 1, r
Q,
Получаем следующий алгоритм для расчета / методом А:
1) Формулы для /-го испытания
— 1, rQ. ^
Р = YrQ' ~ 2rQrQ' cos V + *
§ И м. Соболе
114
ВЫЧИСЛЕНИЕ ИНТЕГРАЛОВ
(ГЛ 3
2) Если р — pt —значение р, полученное в i-u испытании, то
C5)
В способе Б случайную точку Q' с плотностью C4) можно
строить следующим образом: сперва из ючки Q надо выбрать случайное
направление со (п. 2.4.2 гл. 2); затем на луче P/=Q+r/co выбрать
случайное расстояние р с функцией распределенияFp (г') = (г7/K~а,
0<г'</ (где /=/(со)); тогда Q' =
O+pw.
В самом целе, условная
плотность точки Q' (при условии Q = P)
в сферических координатах г', Q', ф' о
центром в Р равна
т .
Первый сомножитель равен
плотности случайного направления со (в
сферических координатах), а второй —
это условная плотность случайного
расстояния на луче Р' = Р-{-/"о) при
условии, что со уже выбрано.
Те же соображения симметрии,
что в случае А, позволяют выбирать
направление со в плоскости ф' = 0. Оно определяется одним
параметром jx==cos0/ = 2y/— 1 (рис. 39). Вычислив*) расстояние / =
==|?--ч?|, получим следующий алгоритм для расчета / методом Б:
1) Формулы для /-го испытания
Рис. 39.
р =
з-а).
2) Если / = li и р = pt- — значения / и р, полученные в i-u
испытании, то
N
/ =
C - аГ1^-1
C6)
В обоих алгоритмах — C5) и C6) — на каждое испытание
затрачивается всего три случайных числа, так что фактически вычнеля-
*) В векторных обозначениях ? = Q+/co. Так как (L, L)=R2, то
получаем квадратное уравнение /2(со, co)+2/(Q, Co) + (Q, Q)=R2,
в котором (со, со) = 1. Решение: /== —(со,(?)+]/*(со, QJ + /?2 — (Q, Q).
Чтобы перейти к декартовым координатам, заметим, что Q={0, 0, r^j^
a o)={sin0/, 0, cosG'}. Следовательно, (Q, Q)=r^,(co, Q) =
5= rn cos О',
способы построения хороших оипток
11S
ос я трехкратный интеграл. В общем случае, когда функция h(Py Р')
зависит не только от расстояния р== |Р—Р'|, а от самих точек Р
и Р', пришлось бы моделировать все шесть координат точек Q и <?'.
Г. Рассмотрим численный пример: интеграл C3) в случае
[
GG
где С — единичный шар *2-}-</2+22<l. Некоторые значения этого
интеграла: /2 = 4, /] = 32/15, /_i = 64/35.
Запишем оценки C5) и C6) для 1Х и /2:
р
Г2;
/> = (8/3) /У V /2; /Б ^
Нетрудно заметить, что в этом случае оценка /Б зависит лишь от
двух случайных чисел.
Вычислим дисперсии соответствующих этим методам величин
^(«) (формулы приведены в пунктах А и Б):
DZ(a) =
откуда следует, что
2,560,
/2 ,
= со. Для оценок типа Б
DZfa)
= A6/3J C - а)-2л-2 fj /6-2ар (Р, Р'
Пусть а'==2а — 3, так что 6— 2а = 3 — а'. Тогда
' - /2
откуда следует, 4^02^=5,201, DZf2) = 6,756. Интересно
отмстить, что DZA) >DZA). Этот пример показывает, что неудачное
использование существенной выборки приводит к увеличению
дисперсии.
Таблица I
Точные
значения
Результаты расчета
Ошибки
Вероятные ошибки
Jj=2,13
—0,35
0,34
7 f=1.48
—0,65
0,49
/r=4,00
/^=•1,94
—2,0в
СХ>
-0,63
0,55
116 ВЫЧИСЛЕНИЕ ИНТГГРАЛОВ [ГЛ. 3
В табл. 1 приведены результаты расчета всех четырех оценок
при N=10 с использованием случайных чисел, указанных на стр. 108.
Здесь же указаны ошибки расчета и вероятные ошибки г10.
3.3. Симметризация подынтегральной функции.
3.3.1. Простая симметризация. Пусть
требуется вычислить интеграл
ь
по конечному интервалу а<х<6. Рассмотрим случаи-»
ную величину |, равномерно распределенную в этом
интервале, и величину Z=F—а)/(|). Так как MZ=/0, то
простейший метод Монте-Карло приводит к оценке
интеграла
где |ь . . . , |v — независимые значения |.
Рассмотрим теперь симметризованную функцию
интеграл которой по-прежнему равен /о, и пусть ZA) =
— (&—а)/шШ- Ввиду того, что MZA) = /0, можно
записать симметризованную оценку интеграла
b ~
Так как математическое ожидание квадрата Z
равно
-х)}dx = b-^p \JГ (х)dx+]f (x) f(a + b-x)dx]
la a J
а математическое ожидание квадрата Z равно
§ 31 СПОСОБЫ ПОСТРОЕНИЯ ХОРОШИХ ОЦГЛЮК 117
то легко доказать, что всегда М [Z(I)]2^MZ2 и,
следовательно, DZ(I)sg:DZ. Однако для расчета одного
значения ZA) надо вычислить два значения f(x). Поэтому
трудоемкость оценки &$ будет меньше трудоемкости
QN только тогда, когда DZU) по крайней мере вдвое
меньше, чем DZ. Оказывается, для монотонных
функций это всегда выполнено.
Теорема 4. Если кусочно непрерывная функция
f(x) монотонна при a^Zx^ib, то
DZ(I)<c(l/2)DZ.
Доказательство*). Из выражений для
дисперсий
ь ъ
2DZn> = (b - a)\f\x) dx +(b - a) f f(x)^f(a+b-x)dx-2ll
a a
И
вытекает, что утверждение теоремы равносильно
неравенству
(b-a)$f(x)f(a+b-x)dx^li C7)
а
Предположим для определенности, что f(x) не
убывает и f(b)>f(a). Введем вспомогательную функцию
v(x) = (b-a)]f(a+b-t)dt-{x-a)r09
а
которая обращается в нуль па концах отрезка
Производная этой функции
монотонна, </(а)>0, v'(b)<Q; следовательно, v(
*) Мы рассматриваем случай, когда f(x) непрерывна и
дифференцируема. Однако нетрудно видоизменить доказательство (вводя
интегралы Стилтьеса) так, что ни дифференцируемость, ни
непрерывность f (x) не понадобятся,
||3 ВЫЧИСЛЕНИЕ ИНТЕГРАЛОВ [Г Л 3
при a^.x^ib. И можно записать очевидное неравенство
ь
Проинтегрировав по частям, получим неравенство
Подставив сюда выражение для v'{x), получим C7).
Случай невозрастания f{x) рассматривается точно
так же, так как тогда v(x) ^0, f {x)
Пример. Рассмотрим интеграл
/= [еЧх.
Симметризованная функция в этом примере равна jO)(x)~-
— A/2) (ех -\-ех~х) (рис. 40), а
соответствующая оценка
N
Дисперсия осредняемон
величины равна
DZA) =A/4) [2е —
~{е— 1) C^ — 5)] =0,00392.
Это во много раз меньше, чем
D2 02420
3.3.2. О с л о ж и о й
симметризации. Интервал Ж
<*<6 можно разбить на
конечное число частей и на каж-
Рис. 40. дой из них использовать прос-
тую симметризацию,
з, Ь) па
Рассмотрнм случай разбиения (а, Ь) па две равные части. Пусть
(l/2)(+ft). Тогда
= A2) J [/ (у) + / (а + с - у)} dy + A/2) J [/ (у) -f / (с + Ь - у)] dy.
а с
В первом из этих интегралов сделаем замену переменной х = 2у — а,
которая преобразует интервал (а> с) в (a, b), a во втором — замену
§ 3] СПОСОБЫ ПОСТРОЕНИЯ ХОРОШИХ ОЦЕНОК Ц9
х = 2у — Ь, которая преобразует интервал (с, Ь) в (а) Ь). Получим
выражение
ь
/о = J /B) (х) dxt
а
где
Следовательно, для оценки интеграла /о можно использовать
величину
где 2[.2^—значения случайной величины Z^2) ~ (b — a
Пример. Рассмотрим интеграл
1
/- fB-3,i'-A:2)dx-l/6.
о
Так как f(x) =2—Зх — х2, то нетрудно вычислить, что
/(*> (х) = х-х\ /B) (х) = A/8) A + 2х - 2
Сравним дисперсии величин
l
DZ = f B - 3* - ,v2J dx — 1/36 = 41/30 - 1/36 = 241/1801
b
l
DZA}=: f(jc— x2J^ — 1/36 = 1/30-1/36= 1/180;
b
i
= A/64) \(\+2x—2л-2J rfjc — 1/36 = 9/320 — 1/36 = 1/2880.
b
Если обозначить время расчета }(х) через tf то времена расчета /<О (,х)
и /B) (х) приблизительно равны 2/ и 4/. Следовательно, трудоемкости
трех способов расчета равны соответственно
241//180>2г/180>0,25//180.
3.3.3. К сожалению, различные методы
симметризации, весьма наглядные и эффективные в одномерном
случае, становятся громоздкими и трудно
оцениваемыми пру переходе к функциям многих переменных. Даже
простая симметризация функции f(x, у, г) по всем пере-
120 ВЫЧИСЛЕНИЕ ИНТЕГРАЛОВ [ГЛ 3
менным в единичном кубе содержит уже 8 слагаемых:
f»'«=(l/8)[/(*t У, z)+f(l-x, у, z)+f(x, l-y, z) +
.+/(*, У, \-z)+f(l-x, 1-у, z)+f{l-x, у, 1-г) +
+f(x, 1-У, 1-2)+/ A-х, 1-у, 1-2)].
Некоторые способы одномерной симметризации рассмотрены в
работах [133, 136, 149]. См. также упражнение 6.
При расчете методом Монте-Карло ряда физических задач [29]
используют приемы, которые по существу представляют собой
частичную симметризацию (по отдельным переменным). Например, вместо
того, чтобы моделировать случайное направление каждой частицы,
вылетающей из заданной точки О (рис. 41), по формуле cos0=»
= 2у —1 рассматривают пару частиц, которые вылетают по
направлениям 8i = arccosBY —1) и 62=л; —0Ь Выбор направления 62
равносилен использованию 1 — y вместо значения у. Такой способ
моделирования обеспечивает более равномерное расположение траекторий
частиц в пространстве.
3.4. Двухэтапные схемы расчета. В некоторых
задачах можно указать не одну «хорошую» оценку, а целое
семейство, зависящее от параметров. Возникает вопрос
о наилучшем выборе параметров. Обычно условием
выбора служит требование минимума дисперсии оценки
(при этом молчаливо предполагается, что время
расчета одного испытания слабо зависит от значений
параметров).
Аналитическое решение в этой ситуации, как
правило, невозможно. Однако можно рекомендовать
численный подход: на первом этапе весьма грубо вычисляются
дисперсии оценки при различных значениях параметров
(это нетрудно сделать методом п. 1.4 по небольшому
количеству N испытаний); на втором этапе решается
основная задача, при помощи оценки с наилучшей
системой параметров. Известные по первому этапу время
счета и дисперсия позволяют довольно точно оценить
объем работы, необходимый для достижения заданной
вероятной ошибвд,
§ 3] СПОСОБЫ ПОСТРОЕНИЯ ХОРОШИХ ОЦЕНОК 121
Мы рассмотрим два примера однопараметрических
оценок.
3.4.1. В п. 3.1.1 для приближенного вычисления интеграла
G
использовалась оценка
где Q;—случайные точки с плотностью р(Р), a h(P) — некоторая
функция, «близкая» к /(Р), интеграл которой известен: С~
=]*Л(Р)р(Р)dP* Обе функции f(P) и h(P) принадлежат L2{G\ p),
о
Можно выбрать произвольный параметр а и рассмотреть более
общую оценку интеграла /
е$> « аС + (\/N) 2 [/ (Qt) - ah (Q()]. C8)
Действительно, в C8) осредняется величина Z(a)=aC+f(Q)—ah(Q)t
математическое ожидание которой М2(а) = /. По известной формуле
о дисперсии суммы
DZ(Cd) = D/ (Q) - 2ar /D/ (Ц) Dh (Q) + a2Dh (Q), C9)
где г — коэффициент корреляции величин /(Q) и h(Q):
Простые вычисления показывают, что минимум DZ^a) реализуется
при a==ao=.r/D/(y)/D/z(Q)H равен
min DZ^a) = DZ^ = A — г2) D/ (Q).
a
(Теоретически возможен даже случай DZ(CCo) —0, который
реализуется при И = 1; однако на практике, если И=1, то случайные
величины f(Q) и h(Q) связаны линейной зависимостью [(Р) =ЛЛ(Р)+Б,
и искомый интеграл раЕен 1=АС~\-В\ никакие приближенные оценки
не нужны).
Пример. Требуется вычислить интеграл
1
Так же, как в п. 3.1.1, положим h(x)=x, но вместо оценки B3)
воспользуемся оценкой C8)
6<*> - (а/2) -
122 ВЫЧИСЛЕНИЕ ИНТЕГРАЛОВ [ГЛ 8
T.iK как
l 1
D/= \е~Чх — /2 = 0,2420, Oh = f x2dx - A/4)= 1/12,
b о
r Y'DfDh = [(<?* — /)(* — 1/2 d* = A/2) C-е),
b
то наилучшее значение ao = 6C — г) = 1,6903, и соответствующее ему
значение дисперсии равно
DZ@°= A/2) (г2— 1) — Я _ 3C — (?J = 0,00393.
Это примерно в 10 раз меньше, чем DZ' в п. 3 1 1. Ничего
удивительного в таком результате нет: нз рис. 42 видно, что прямая f/ = /+
+аэ(*—1/2) гораздо лучше приближает функцию // = <?*, чем
прямая // = / + А'— 1/2. '
3.4.2. Чаще других встречается
метод существенной выборки, за-
инеящпй от параметра. Если при
всех а (из искоюрого множества)
плотности р(Р; а) допустимы по
отношению к f(P)y то интеграл
1и= \{Р) dP молию вычислять
G
методом существенной выборки
(п. 3 2) с любым а. Наилучшее
значение и —а0 — это значение,
при котором достигает минимума
f U2(P)!p(P; *)]dP,
фиприрующнй в выражении B9) для дисперсии. Аналитическое
исследование способов выбора а имеется в статье А Маршалла [157].
Однако на практике обычно выбор а осуществляется
экспериментальным способом, указанным в начале п. 3.4.
Пример. Интеграл
/= \еЧк
о
в п 3.2.1 вычислялся методом существенной выборки с плотностью
р(х) == B/3) (Н-*)« Рассмотрим теперь семейство допустимых
плотностей
р(х; а) = (Ц-см)/A+а/2), а>0.
Для разыгрывания значений случайной величины 5 с плотностью
р(х\ а) методом обратных функций получаем уравнение
§ 1] ИНТЕГРАЛЫ, ЗАВИСЯЩИЕ ОТ ПАРАМЕТР \ 123
решение которого нетрудно записать в явном виде. Окончательная
оценка интеграла /:
G<«> = A + а/2) /V V е-с (| _] а^.)-1,
где ^ = [] /]
В этом примере дисперсия осредняемой величины
DZ(a> = f A + а/2) A + OLx)
о
После замены переменной ау = 2(\+ах) это выражение превратится п
2+2,а
B-1 + a-1)e"a f e!Jy-ldy-l\
2 а
где интеграл выражается через интегральную показательную
санкцию Ei(jc):
DZ(a) = B~! + а") е~2/а [ш B + 2/a) — Ei B/a)] - /2.
При a=l получаем для DZ(l) выражение из п. 3.2.1, которое равно
0,0269. Однако расчеты показывают, что дисперсия D2^a) будет
минимальной при a = do «1,81, когда DZ^o) =0,0040.
§ 4. Интегралы, зависящие от параметра
4.1. Использование зависимых испытаний.
Предположим, что требуется приближенно вычислить значение
интеграла
/(*)= \f(P,X)p(P)dP D0)
G
при нескольких значениях действительного параметра ?,,
например X=X\f . . . , к8- Если при каждом из этих I
условие применимости простейшего метода
Монте-Карло выполнено
DZ (X) = f /2 (Р, fc) /? (P) rfP - /2 (X) < со,
Ь
то можно записать оценку для /(л):
eiVa) = (l/^J/(Q^^), D1)
где Qi, . . . , Q:v — случайные точки с плотностью р{Р).
124 ВЫЧИСЛЕНИЕ ИНТЕГРАЛОВ [Г Л 3
Оценка D1) справедлива при каждом из
интересующих нас значений Яь . . . , Xs. Если функция f(P, к)
непрерывно зависит от X, то и QN(X) будет непрерывной
функцией от Я. Вычислив 0jv(Jw), . . . , 0*(ta) мы,
конечно* получим значения, отличные от I(h\), . . . , /(Яв),но
эти значения будут расположены па гладкой кривой.
Если N достаточно велико, то кривая 0*(Я) окажется
достаточно близкой к 1(Х) и по значениям QN{Xh) можно
будет даже оценить производную /'(X) (если она
существует) .
Несколько неожиданным может показаться
утверждение, что результаты п. 1.2 не дают достаточного
основания для применения оценки D1). В самом деле, из
D) следует, что вероятность неравенства
| 0* (к) - / (К) |< хр VDZ (K)/N D2)
приблизительно равна р (если N достаточно велико). Это
справедливо при каждом Я==Я^. Но нельзя утверждать,
что вероятность одновременного выполнения нескольких
неравенств D2) при A,=A,i,..., Xs тоже равна рв/
Формула D) позволяет оценить все ошибки |0*г(А,*) —
—ПК)\> если ^ля каждого Я==Яй вычислять QN{Kh) по
независимым испытаниям, т. е. считать, что
где Qih при /=1, 2, . . . , N; А=1, 2, . . . , 5
—независимые случайные точки с плотностью р{Р). Однако в
этом случае приближенные значения интеграла даже
при очень близких % могут различаться между собой на
величину порядка У DZ/iV и результаты расчета не дают
верного представления о разностях I(Xh+\)— I(kk)-
(Кроме того, при таком расчете приходится вычислять в s
раз больше случайных точек.)
Пример. Вычислить интеграл
/ (К) =s f cos lx dx = Х~] sin 21
о
для А.в.0,2, 0,4; ... ; 2,6.
ИНТЕГРАЛЫ, ЗАВИСЯЩИЕ ОТ ПАРАМЕТРА
125
0,2
0,4
0,6
0,8
1,0
1,2
1,4
I (X)
1,947
1,793
1,553
1,249
0,909
0,563
0,239
1,920
1,722
1,401
0,997
0,551
0,105
—0,300
1
1
1
0
0
0
0
e+
,929
,732
,474
,915
,377
,627
,348
0
0
0
0
Э
J
0
По
,01
,04
,08
,14
,19
,24
,28
к
1,6
1,8
2,0
2,2
2,4
2,6
—0
—0
-0
-0
—0
—0
tt)
,036
,246
,378
,433
,415
,340
e
-о,
—0,
-0,
—0,
—0,
—0,
0
628
851
955
939
814
600
Та
0
—0
-0
—0
-0
б л и
0+
,196
,040
,299
,175
,056
,163
ца 2
0,30
0,31
0,31
0,30
0,29
0,28
По формуле
Ю
проведены два расчета, результаты которых даны в табл. 2 и на
рис. 43. В нервом случае для расчета всех 0ю(Я) использовались
-10-
Рис. 43.
одни и те же Yi» • • • » Yio приведенные на стр. 108; соответствующие
результаты обозначены кружками: 6°. Во втором случае для расчета
каждого 6ю(Я) использовались новые случайные числа (образованные
из пятерок цифр таблицы на стр. 295, которые выбирались подряд);
соответствующие результаты обозначены крестиками: 0+.
126 ВЫЧИСЛЕНИЕ ИНТЕГРАЛОВ [ГЛ. 3
На рис. 43 отчетливо видно, что значения 6° расположены на
гладкой кривой, сходной с 1(к) (непрерывная линия), а значения Qf
разбросаны около 1(к). В табл. 2 приведены также вероятные
ошибки
г10(Л)= 0,675 /65^ =
= 0,675- Ю-1'2 [2 — X sin 2X ()Г1 sin 2л - cos 2Я)]! 2.
Значение jV=10 невелико, и нельзя быть уверенным в том, что
распределение 0ю достаточно близко к нормальному. Поэтому интересно
отметить, что все ошибки Эю(Я) — /(Я) по порядку равны rl0{%).
На протяжении многих лет метод D1) неоднократно
и с успехом использовался в самых различных расчетах,
по строгое обоснование его было впервые
опубликовано лишь в 1962 году А. С. Фроловым и Н. Н. Чен-
цовым [92]. Этому же вопросу посвящены работы [67,
78, 84]. В дальнейшем изложении мы следуем статье [78].
4.2. Вспомогательная теорема о погрешности
простейшей квадратурной формулы. Допустим, что для
приближенного вычисления интеграла
i
/- \f(x)dx
6
используются .V фиксированных точек Х\, . . . , xNi
принадлежащих интервалу @, 1), и простейшая формула
Погрешность такого приближения зависит от функции
fix):
N 1
6(/)-O/A0l/(^-J7W^. D3)
i-=l 0
Обозначим через W'2 (L) множество непрерывных
функций f(x) с кусочно непрерывными производными
/7(л:), такими, что
1
Ui'(x)fdx<L-. D4)
о
По сравнению с § 2 здесь мы сужаем класс
подынтегральных функций: там требовалось только, чтобы
f(x)<=L2, а здесь-— //(.Y)dL2.
ИНТЕГРАЛЫ, ЗАВИСЯЩИЕ ОТ ПАРАМЕТРА
127
Обозначим через SN(x) количество точек х{ с поме-
рами 1^/^yV, удовлетворяющих неравенству Xi<x.
Нетрудно проверить, что
N
SN(x) = 2 е(х — х?),
и представляет собой ступенчатую функцию (рис. 1-1).
Теорема 5. Каковы бы ни были точки Х\, . . . , .v.v,
верхняя грань погрешности D3) равна
sup
р () р
(/)!=-4- \\\S,(x)-Nxfdx\ .
D5)
Доказательство. Функция f(x) может быть
выражена через свою
производную У\
Полагая здесь х = х( и
суммируя по /, получим, j
что
С другой стороны, интег-^/7 ^
рируя по частям, легко
получить, что
1 1
Л 1 I LL.
1 т
L1 d/i
Рис. 44.
Вычитая последнее равенство из предпоследнего,
получим формулу для погрешности
' (/) [Nt — Sjs (t)l dU D6)
128 ВЫЧИСЛЕНИЕ ИНТЕГРАЛОВ ГГЛ. 3
Из формулы D6), используя неравенство A)
'(стр. 292) и условие D4), выводим, что если f()
1'2
эта величина как раз фигурирует в D5).
Осталось доказать неулучшаемость последнего
неравенства. Для этого рассмотрим функцию
= L\[Nt-SN(t)]dt
1
о
о
-1/2
Так как f [gf (x)f dx = L2, то g (x) ? W'2 (L). Подставив
6
f=g(x) в D6), получим, что
\\/2
f
Таким образом, теорема доказана.
4.3. Оценка погрешности метода Монте-Карло с
помощью распределения о>2. Выберем N независимых
случайных чисел «уь . . . , 7л- и рассмотрим погрешность
простейшего метода Монте-Карло
Й--1
D7)
В этом случае величины, входящие в D5), имеют весьма
простой вероятностный смысл: SN(x)/N — это
эмпирическая функция распределения /^(х) выборки ^ь - • • »?*
(ср. A7) гл. 1), а х — это функция распределения F(x)
случайной величины f (при 0<х<1). Поэтому,
согласно A8) гл. 1,
JL
л/
л. (х) - NxP dx}= {|[F; - FfdF Ц E)' \
§ 4] ИНТЕГРАЛЫ. ЗАВИСЯЩИЕ ОТ ПАРАМЕТРА 129
Из теоремы предыдущего пункта вытекает, что для
простейшего метода Монте-Карло D7)
sup |6(/)| = L]A^V. D8)
Воспользуемся теоремой Мизеса — Смирнова,
приведенной на стр. 34: если N достаточно велико, то Р{т<С
<Сх}жа\(х). Следовательно, можно выбрать любую
доверительную вероятность р найти соответствующий ей
корень х=х$ уравнения ai(x$)=$ и утверждать, что с
вероятностью, приблизительно равной р,
sup |6(/)|<L/^V. D9)
Из оценки D9) следует, что при достаточно большом
N с вероятностью, приблизительно равной J3, неравенство
справедливо одновременно для всех функций /(*)€=
eEW'2(L).
Обратимся к интересующему нас случаю, когда
вычисляется интеграл вида D0)
1
I(K) = $f(x9k)dx E0)
6
с помощью оценки вида D1)
1 N
Из предыдущего результата вытекает, что если при всех
a^Xt^b производная fx (x, Л)е/-2, то с вероятностью,
не меньшей чем (J, при всех этих К одновременно
E2)
где, очевидно,
М 11/2
9 И. М. Соболь
130
ВЫЧИСЛЕНИЕ ИНТЕГРАЛОВ
1ГЛ. 3
4.4. Численное дифференцирование оценки E1). Рассмотрим
случай, когда существует производная I'(к) от интеграла E0), и
докажем, что по значениям В#(А.) можно обычным способом эту
производную оценить:
QN(b + h)QN(X)
V (Я) ^ 2Л •
Допустим, что при а^Х^Ь существуют вторые производные
fu (*. Я) е La и | /^ (х9 Я)| <С. Тогда
а оценка D1) для этого интеграла равна производной от оценки E1)}
2
На основании D9) можно утверждать (мы по-прежнему
считаем, что N достаточно велико), что с вероятностью, не меньшей
чем р, одновременно справедливы и неравенство E2), и неравенство
где
/2
Далее, в силу сделанных предположений, при любых
фиксированных значениях Yi»...,?^ Функция E1) дважды
дифференцируема по Я. Из разложения
± А)
вытекает, что
E4)
Наконец, из E3) и E4) следует, что
и это неравенство, одновременно, с E2) и E3), имеет место с
вероятностью, не меньшей чем р.
В ?гих условиях, по-видимому, целесообразно выбирать h
порядка l/yi
УПРАЖНЕНИЯ К ГЛ. 3
131
4.5. О таблицах случайных чисел. Оценка D9) в
какой-то степени оправдывает многократное
использование таблиц случайных чисел, ибо по одним и тем же
числам («по таблице»)
можно решать много
задач: вычислять интегралы
от любых функций f(x), ,
принадлежащих W^ (L).
Оценку, аналогичную
D9), можно получить для
гораздо более широкого
класса задач,
включающих вычисление
интегралов от функций многих
переменных. Однако для 0 х; хг хп / х
всех функций f(x) из L2
оценка погрешности тако- Рис. 45.
го типа невозможна.
В самом деле, каковы бы ни были точки xit ... , xN, найдется
функция f(x) (рис. 45) такая, что
1
б) f / (х) dx = L — s, где L > 8 > 0 — любые числа;
о
I
в) j P (x) dx < L2,
о
Для такой функции, очевидно, б(/)=? — е. Следовательно, при
ЛЮбыХ Х\л . . . , Xfl
sup f6(/)|> L,
и величина эта не стремится к нулю, когда УУ -> оо.
рала
Упражнения к главе 3
1. Записать формулы для расчета методом Монте-Карло интег-
f(x, yt z)dxdyd2
E5)
от произвольной ограниченной функции f(x% у, г). Область
интегрирования G определена неравенствами х2+у2<г<.2.
9*
132
ВЫЧИСЛЕНИЕ ИНТЕГРАЛОВ
[ГЛ 3
2. Требуется вычислить интеграл E5) от произвольной
ограниченной функции f(x, у, г) по области G, расположенной между
Рис, 46.
X
Рис. 47.
плоскостями *=#i и х=х2 (рис. 46); сечение G плоскостью
а'=а:о изображено на рис. 47.
Случайные точкиQ^ = (tit %> gf) в области G будем выбирать
по формулам
УПРАЖНЕНИЯ К ГЛ. 3 133
Можно ли в качестве оценки для / использовать среднее
арифметическое
Если нет, то написать верную оценку, содержащую значения
/(Qi),,)
3. Построить оценку с конечной дисперсией для вычисления
интеграла
j x"BI2f[x)dx
о
в случае, когда f(x)~x при л;->оо и f(x)~x2 при *->0.
4. Записать формулы для расчета интеграла
00
/ = f f(x)e-kxdx, k>09
о
с помощью значений случайной величины ?, плотность которой
равна р(х) = ае~ах. Доказать, что если /(х) ж Ахп} то диспепсия будет
наименьшей при attao=k/(n+l).
5. Условно сходящийся интеграл
00
/ = J x~* sin 2лх dx
можно вычислить методом Монте-Карло с помощью оценки
где
Доказать, что М[Л(у) sin лу] =/, D[h(y) sin ny] < A/2)/г2@) — Л
6. Рассмотреть симметризации функции
оо
f (х) == а0 + 2 ( afe cos 2я** +
на интервале 0<x<l и выразить дисперсии Df(y), D/A)(y) и
D/B) (у) через коэффициенты Фурье ak и bk.
7. Рассмотреть функцию /C) (*) = A/2) [/(лг/2)+f(l—дг/2)] и
доказать, что хотя, вообще говоря, /C) (*) Ф /A) (х) (где /A) (х) =
= A /2) [/(л:)-f-/A—*)]), но по отношению к простейшему методу
Монте-Карло эти функции равносильны:
М/<3) (у) =
134 ВЫЧИСЛЕНИЕ ИНТЕГРАЛОВ [ГЛ. 3
8. Требуется вычислить интеграл A2) вт функции f(P)&L2 (G\ p).
Пусть ф1(Я), ... , Ф8(^)—ортонормированные функции со средними
значениями, равными нулю, т. е.
Рассмотрим семейство оценок для /
где Q- — независимые случайные точки с плотностью p(P)f
а ах,..., as параметры.
Доказать, что дисперсия этой оценки минимальна тогда, когда
G
9. Случайная величина v^ подчиняется биномиальном^ распре-
n.—i
делению: Р {vfe = /} = С}п р[ A — pk) f /==0, 1,..., nk.
Случайные величины vi, ... , Vj независимы. Требуется вычислить
математическое ожидание ограниченной величины v\=f(vu ... , v^),
которое равно
nlt...,n
Если все n^^lO и 5« 20, то количество слагаемых в этой сумме «1020.
Ясно, ято на современных ЭВМ такая сумма вычислена быть не
может.
Построить простейший метод Монте-Карло для расчета Мт] и
какой-нибудь алгоритм, соответствующий этому методу»
ГЛАВА 4
ВЫЧИСЛЕНИЕ ИНТЕГРАЛОВ
(СЛОЖНЫЕ ОЦЕНКИ)
§ 1. Методы Монте-Карло с повышенной
скоростью сходимости
1.1. Выборка по группам. Этот хорошо известный в
статистике прием ([24], стр. 218) может быть с успехом
использован для уменьшения дисперсии. По идее он
весьма близок к методу существенной выборки: здесь
также предлагается выбирать больше точек в более
«существенных» областях, однако выбор регулируется не
специальной плотностью, а указанием количества точек
в различных областях.
Итак, пусть требуется вычислить интеграл
I = $f(P)p(P)dP. A)
Разобьем область интегрирования G на т частей
GG G
и введем обозначения
Pj= §p(P)dP, Ij= \f{P)p{P)dP.
G G
§ j
Gi Gi
Очевидно,
i
В области Gj рассмотрим случайную точку Q(/) с
плотностью p(P)/pi и для оценки 1й воспользуемся
136 ВЫЧИСЛЕНИЕ ИНТЕГРАЛОВ (СЛОЖНЫЕ ОЦЕНКИ) [ГЛ 4
простейшим методом Монте-Карло: так как
то, выбрав Nj независимых реализаций Q\}),..., Qn\
точки QU) можем записать оценку для /,:
N.
P L
Складывая такие оценки для всех Ijt получим новую
несмещенную оценку
i
е; = s -5- i f (<л
Общее количество случайных точек в формуле B)
обозначим по-прежнему через N:
N=NX+, . .+Nm. C)
Заметим сразу, что оценку B) можно считать квадратурной
суммой со случайными узлами. В самом деле, обычная квадратурная
формула записывается в форме
где точки Pi,..., PNy принадлежащие G, называются узлами,
а числа Сг,..., CN — весами. Если квадратурная формула точна для
функций f(P) =const, то Ci+ . *. +CN == 1.
Оценка B) дает нам такую же приближенную формулу
N.
т /
/=1 s=l
причем и здесь
Предположим, что f(P)^L2(G; p). Тогда точность
простейшего метода Монте-Карло для расчета /
характеризуется дисперсией оценки A4) гл. 3, которая равна
§ 1] МЕТОДЫ С ПОВЫШЕННОЙ СКОРОСТЬЮ СХОДИМОСТИ 137
где
G
Найдем теперь дисперсию оценки B). Очевидно,
/=1 s=l
и так как здесь тачки Q{s}) при s=l, . . . , Ns
независимы, то
т
De; = 2(p//^)D/(Q</)). D)
Легко вычислить, что
G.
i
E)
Теорема 1. Если разбиение G=Gi-f. . .'+Gm и
число N фиксированы, то минимум выражения D) при
дополнительном условии C) равен
^[J F)
и реализуется при
Nj = NPj VWW)/?^ Pi VD/(Q(/)). G)
Доказательство. Согласно F) величинаЬ%равна
Используя неравенство Коши — Буняковского, получим
где справа стоит D). Остается проверить, что при
подстановке G) в D) получается F).
138 ВЫЧИСЛЕНИЕ ИНТЕГРАЛОВ (СЛОЖНЫЕ ОЦЕНКИ) [ГЛ. §
В реальных задачах дисперсии D/(Q(i)), как прави-
йо, заранее неизвестны. Известны лишь вероятности р5.
Оказывается, этого уже достаточно, чтобы выбрать Ni9
обеспечивающие уменьшение дисперсии (т. е.
неравенство D9^<D0*).
Теорема 2. Если разбиение G=Grf. . .+ Gm
фиксировано, то при
(8)'
величина D) не превосходит D6*.
Доказательство. Умножив E) на pj и
просуммировав по / от 1 до /п, получим
S PjDf (QU)) = J/i (Р) /7 (Р) dP - 5 (/?
гДалее
Следовательно,
m
2 ppf (Q(/)) < I /2 (P) P (P) dP - /2 = DZ.
Подставив (8) в D), получим выражение
которое в силу предыдущего неравенства не превосходит.
\[l/N)DZ=DQN. Таким образом теорема доказана.
Теоремы 1 и 2 доказаны в [24] для случая выборки
из конечного множества. Если выполнено условие (8),
то выборка называется типической.
В действительности выбирать Nt по формуле G) или
(8) нельзя, так как Л^ обязаны быть целыми. Обычно
выбирают любые из ближайших к G) или (8) целых
чисел, лишь бы удовлетворялось условие C).
Пример. Чтобы вычислить интеграл
§ 1J МЕТОДЫ С ПОВЫШЕННОЙ СКОРОСТЬЮ СХОДИМОСТИ 139
с помощью #=10 точек, разобьем @, 1) на две равные части и
выберем в @, 7г) всего 4 равномерно распределенные точки ?A), а в
(V2, 1)-—6 равномерно распределенных точек |B)# Тогда Pi=P2=-
= 1/2, #i=4, #2=6 и
8=1 S=l
Дисперсия этой оценки D0*o = A/16) De* + A/24) Del , где
A) 1/2 / 1/2 \2
Del =2j e2xdx— 2j Л« I = e — 1 — 4 (yl — lJ =0,03492,
De1 =2 je2*d* — [2 Jrtjc =:e2 — e — 4 (e — ]/7J = 0,09493.
1/2 \ 1/2 /
Следовательно, D9*0 =0,00614, в то время как дисперсия
простейшего метода D8iO=0,0242. Значения ^ и |*2) легко вычисляются по
формулам |A)=0,5у и 6B)=0,5A+у/).
1.2. Оценки с повышенной скоростью сходимости.
Пусть G — конечная область в /г-мерном пространстве
неременных хи • • • , хп, так что интеграл A) п-крат-
ный: Р=(хи . . . , хп)у dP—dxu . . . , dxn. Рассмотрим
оценку Э# в случае, когда m=N и все Л^=1:
N
/=1 J
Обозначим через dj диаметр *) области Gj и
предположим, что существуют положительные постоянные С\ и
с2 такие, что при всех /= 1, 2, . . . , N
Условия A0) — A1) означают, что все области Gj
равномерно малы как по вероятности, так и по
геометрическим размерам.
*) Диаметром области G называется верхняя грань расстояний
между двумя точками этой области:
d= sup (Pi-Pal.
P PSG
140 ВЫЧИСЛЕНИЕ ИНТЕГРАЛОВ (СЛОЖНЫЕ ОЦЕНКИ) [ГЛ. 4
Например, если разбить единичный куб
в котором
X
= 1, па N=Mn равновеликих кубов с
ребром 1/М (рис. 48), то,
очевидно, все А,= 1/Л/, а все
Теорема 3. Предполо-
оюим.что функцияf(P) и все
ее частные производные
первого порядка df/dxh
непрерывны в G и при всех
k
\dfldxk\<L
1 Если выполнены условия
Рис. 48. (ю) и (И), то для
дисперсии оценки (9) справедливо неравенство
где с=
Доказательство. Выберем внутри G,
произвольную точку Sj= (sj, 1, . . . , sitn) и воспользуемся
формулой Тейлора:
Cljtk (Xk — Sjtk),
A3)
где aitk — значения производных df/dxh в некоторых
точках (зависящих и от Sh и от Р), так что все |ai>fc|^
L. Из A3) следует, что
где %\!),... Л{п] — координаты случайной точки Q(i).
Воспользуемся известным в теории вероятностей
соотношением
Гл 1
§ ll МЕТОДЫ С ПОВЫШЕННОЙ СКОРОСТЬЮ СХОДИМОСТИ 141
и запишем цепочку неравенств:
п
S V [aLk (Б</> - S/iik
<2 /l/i^M)J<2
Tак как Q<'> GE Gy, то j E^ — s,-ift | < dj и, используя A1),
получим
/D/ (Q(/)) < L 2 rf, < Lnc9N-4n.
Последнее неравенство вместе с A0) позволяет
оценить дисперсию D0^: из (9)
DO; = | р) D/ (Q(/>) < | (Lnc^N-i-v*)*,
i i /—i
откуда следует A2).
Замечание. В математической статистике оценки, дисперсии
которых убывают быстрее чем ]/N, иногда тназывают сверхэффек-
тивными.
С помощью теоремы 3 оценим погрешность 0^ — /.
Для этого в известном неравенстве Чебышева
P{h-Mn|<u}^l-(Dri//*2), # A4)
справедливом при любом /г>0, положим у\ = 0^, а А=
= (l/e)]/D0^ ,где е>0 — малое число. Получим
неравенство Р1|0^-/|<A/е)/та>1-гЛВ силу A2)
тем более имеет место неравенство
Р 1| влг - / | < (сЦв) ^-(Ь2)-(г«)} > 1 ~ в2, A5)
которое показывает, что со сколь угодно большой
вероятностью ошибка ®n—I убывает как yv~(I/2)~A/n), т. е.
быстрее чем N~]/2.
Конечно, при больших п это ускорение порядка
сходимости незначительно. И поэтому на практике оценка
,(9) используется редко.
Теорема 3 впервые была доказана В. Дупачем [120] для случая
G — Kl\ p(P) = l и разбиения, изображенного на рис. 48. См. также
[1, 128].
142
ЁЫЧИСЛЁПИЕ ИНТЕГРАЛОВ (СЛОЖНЫЕ ОЦЕНКИ) [ГЛ 4
1.3. Сравнение с квадратурными формулами.
Фиксируем произвольные точки S^G^ и рассмотрим
квадратурную формулу
A6)
Для того чтобы оценить ее погрешность, умножим A3)
на р(Р) и проинтегрируем по G,
Ij = Pjf (Sj) +2 I aLk (xk - sJtk) p (P) dP. A7)
Интеграл, стоящий справа, легко оценить с помощью
и A1):
Суммируя равенства A7) по /от 1 до N и используя
последнюю оценку^ получим, что в условиях теоремы 3
N
A8)
Сравнение A5) и A8) показывает, что порядок
вероятностной оценки погрешности A5) на N~4i лучше, чем
порядок оценки A8). Это не случайность. Следует
подчеркнуть различный характер обеих оценок: оценка A8)
справедлива одновременно для всех функций
рассматриваемого класса D\(L) —с непрерывными частными
производными \dfldxh\^L\ можно переписать ее в виде
/IS5L)|l/(/>)p(/>)d/>""l1^(Sy)
В то же время неравенство A5) справедливо для одной
функции f(P) (хотя и любой) из Di(L).
Вопрос о наилучших порядках сходимости
квадратурных формул, в которых используются значения f(P)
в N заданных точках, и недетерминированных методов
вычисления интегралов, в которых используются
значения f(P) в N случайных точках, исследовался Н. С. Бах-
§ g СЛУЧАЙНЫЕ КВАДРАТУРНЫЕ ФОРМУЛЫ 143
валовым [2]. Для некоторых классов функций,
заданных в /Сп, оказалось, что если наилучший порядок
сходимости квадратурных формул (на рассматриваемом
классе) равен Af~a, то можно построить
недетерминированный метод интегрирования, порядок сходимости
которого (для каждой функции класса) будет с большой
вероятностью равен N~a-l/2. И этот порядок сходимости
тоже является наилучшим. (См. упражнение 1 на
стр. 159).
Практического применения такие нелатерминирован-
ные методы интегрирования пока не имеют, вероятно,
из-за того, что сами многомерные квадратурные
формулы, на базе которых должны строиться эти методы,
достаточно сложны.
Другой подход к оценкам с повышенной скоростью сходимости
использован в [85], где для некоторых классов функций доказано,
что если имеется семейство квадратурных формул с порядком
сходимости, равным N~af 0<a^l (на рассматриваемом классе), то,
выбрав подынтегральную функцию из этого класса случайно, можно
с большой вероятностью гарантировать для нее порядок сходимости
дг-а-1/2, если а+1/2<\ и N~l, если а+Уа>1.
§ 2. Случайные квадратурные формулы
2.1. Случайные квадратурные формулы. Обычно
квадратурной формулой для вычисления интегралов
вида
I = $f(P)p(P)dP
при фиксированной функции р{Р) называют выражение
/~2 С/(/>,), A9)
где и узлы Ри . . • , Pn^G и веса Ci, .- . . , С* заданы.
Естественно назвать случайной квадратурной формулой
выражение
где QA\..., Q(f° — случайные точки, определенные в
G (случайные узлы), а хь . . . , х* — случайные
скалярные величины (случайные веса).
144
ВЫЧИСЛЕНИЕ ИНТЕГРАЛОВ (СЛОЖНЫЕ ОЦЕНКИ)
[ГЛ. 4
Рассмотренные в § 1 оценки B) и (9) представляют
собой частные случаи суммы B0) с фиксированными (не
случайными) весами.
Другой класс случайных квадратурных формул, в
которых веса Xj являются функциями от узлов Xj=
= Xj(Q(i), ..., Q{N)), был построен С. М. Ермаковым и
В. Г. Золотухиным [34], использовавшими структуру
интерполяционных квадратурных формул, точных для
заданной системы функций фо(^), <pi(^)> • . • , Фш(^).
2.2. Некоторые свойства интерполяционных
квадратурных формул. Рассмотрим произвольную л-мерную
область G. Все функции будем считать кусочно
непрерывными и принадлежащими L2(G; 1). Выберем
систему ортонормировапных функций фо(^)> 4>i(P)> • • •
• . . , Ф«.(Р) так, что
Для приближенной оценки интеграла"
/ = J / (Я) Ф
G
рассмотрим квадратурную формулу
B1)
B2)
Фиксируем произвольные различные узлы Ро,Р\9...9Рт
и выберем веса Со, Си ... 9 Сп так, чтобы эта формула
была точной для функций f=<$o{P)> /=ф1 (Р), . ¦ . ,/=
=фя(Р).
Полученную при таком выборе формулу B2) удобно
записать в форме отношения двух определителей
^ (Po,..., Рт),
где по определению
(Ро,..., Рт) =
8(Ро)
g(Pm)
B3)
B4)
§ 21 СЛУЧАЙНЫЕ КВАДРАТУРНЫЕ ФОРМУЛЫ И5
В самом деле, если в B3) подставить f=q>j при 1^
^/^т, то в определителе W у. (Ра, . . . , Рт) окажутся
два совпадающих столбца и он обратится в нуль; в этом
случае /= j q>;- (P)(po(P)dP=O. Если же /=фо, то
числитель и знаменатель в B3) совпадут, но в этом случае
/ = j Фо {P)dP=l. Единственное ограничение примени-
G
мости формулы B3) —это требование, чтобы Wq>o(Po,...
..., Рт) ?=0. Если оно выполнено, то формула точна для
любых линейных комбинаций вида /=#офо(Р)+- • •+
+^тфт(Я), и поэтому представляет собой в каком-то
смысле «разумную» квадратурную формулу.
Лемма 1. Пусть фо(Р), Ч>\(Р)> . • • ,
Фт(Р)—любая совокупность ортонормированных функций в G.
Тогда
f ... \wldP0...dPm = (m+1I B5)
G G
Доказательство проведем индукцией по т. При
пг=2
Фо(ЯО Ф1(Ях)
Отсюда
Ко = Фо (Яо) Ф? (Pi) - 2Фо (Яо) Ф1 (Ро) Фо (Л) Ф1 (Pi)
\= 1 + 1-2.
GG
Допустим теперь, что для определителей порядка т
формула B5) справедлива и интеграл равен т\
Рассмотрим определитель (га+1)-го порядка WVo(PO9 . . .
. . . , Рт) и разложим его по элементам первой строки:
m Фо (^l) •••Ф- 1 (^l) Ф. (^l) ...ф (^l)
B6)
10 ц. М. Соболе
146 ВЫЧИСЛЕНИЕ ИНТЕГРАЛОВ (СЛОЖНЫЕ ОЦЕНКИ) tni 4
i
Нетрудно заметить, что каждый из определителей в
B6) есть определитель типа №Фо порядка т: его
столбцы образованы значениями т ортонормированных
функций в т независимых точках. Согласно индукционному
допущению
Поэтому, возведя B6) в квадрат и проинтегрировав
с(сперва по Ро, затем по Рь • . . , Рт), получим
S JФ/ (^о) dpo^1 = (/n + 1)!
Лемма 2. Яг/сгб фО(Я), ф1(Я), . • . , фт(Р), ф(Я) —
любая совокупность ортонормированных функций в G.
Тогда
Доказательство. Выберем новую функцию ф=
= A^2/2) [фО(Р)+'ф(Р)], которая также ортогональна ко
всем ф1(Р), • • • 9 fm(P) и нормирована:
2 (P) dP =
По известным правилам действий с определителями
так, что
W% = A/2) [Wl
Проинтегрировав это равенство по всем переменным и
использовав лемму 1, получим, что
-Т[<т + 1)! + 2 J• • • Iw*>
откуда вытекгет утверждение леммы 2,
§ i) СЛУЧАЙНЫЕ КВАДРАТУРНЫЕ ФОРМУЛЫ 14?
2.3. Случайные интерполяционные квадратурные
формулы. Обозначим для краткости n(m-J-l) -мерную
область, точки которой Т=(РОу Ри ..., Рт), через В =
= GX- . -XG и пусть dT=dPodPi. . .dPm. Пусть
далее Во— множество точек 71, в которых И?Фо = 0, а В+==
= В—Во.
Определим случайные точки Q@), ..., Q(m) в G и
в качестве оценки интеграла B1) рассмотрим
случайную величину
Wi (О@) 0{tn))
w
О, если
B7);
Теорема 4. Если совместная плотность распреде-;
ления случайных точек Q@), ..., Q(m) в В равна
р (Р , . . ., Рт) = [Ц7 (р Рт)]2 B8)
то для любой функции f(P) из L2{G; 1)
>0(P)dPt B9)
DO [/] < J/2 (P) dP - |о [ J / (Р) Ф/ (/>) dP]2. C0)
Доказательство. Выберем произвольную
конечную функцию f(P) из Z*2(G; 1) и обозначим через с,ее
коэффициенты Фурье сг = f / (Р) <р/ (Р) dP. Пусть
о
» V с^
g L ?=о ' ' ' * ¦ - г
Если а2=^=0, то, введя функцию <ф= A/а) [/(Р) —
— 2 С/Ф/ (^) получим представление
/-о J
m
/ (Р) =¦ S с/ф/ (Р) + mj> (P). C1)
/-Q
10 •
148 ' ВЫЧИСЛЕНИЕ ИНТЕГРАЛОВ (СЛОЖНЫЕ ОЦЕНКИ) |ГЛ 4
Легко проверить, что ty(P) ортогональна ко всем срД
и нормирована:
Если а=0, то представление C1) также справедливо:
в качестве if>(P) можно выбрать любую нормированную
функцию, ортогональную ко всем фНЯ), 0/
Подставив C1) в B4), получим, что
т
/=о
С помощью последней формулы нетрудно вычислить
математическое ожидание оценки B7):
Из последних двух интегралов первый равен (m-f-l)!
по лемме I, а второй равен нулю по лемме 2. Таким
образом, М@[/])=Со, что равносильно B9).
Перейдем к вычислению дисперсии:
М(в[/1J= j
в+
cl
Так как здесь J 1^^Г< JB7J ^Г=(т+1)!- по той
в+ в
же лемме 1, то МF [/]J^^о+а2, откуда вытекает
§ 2] СЛУЧАЙНЫЕ КВАДРАТУРНЫЕ ФОРМУЛЫ 149
неравенство, равносильное C0):
Впервые эта теорема была доказана в [34], а
уточнение к ней — в [32]. Из доказательства видно, что знак
равенства в C0) реализуется тогда и только тогда,
когда
= 0. C2)
Во
Это условие будет выполнено для любых функций f(P)>
если объем Во (n(ra-f-l) -мерный) равен нулю. Иными
словами, если 1^Фо=0 только на многообразных
меньшего числа измерений, чем /г(т+1), как, например,
Р0=Р{ и т. п.
Равенство C2) не будет выполнено для некоторых
функций f{P), если функции фо(^), . • • > (рт{Р)
линейно зависимы в какой-то области G'aG с положительным
м-мерным объемом: в этом случае 1Гфо=0 в области
G'X- • -XG' с положительным п(т+1)-мерным
объемом, и объем Во положителен.
Легко показать, что оба эти случая возможны. В самом деле,
пусть G — интервал 0<*<1, т=1, так что /Ь—квадрат {0<*0<1,
Если выбрать ф0 (х) = 1, ф i (х) = УЪ A —2х), то
1 1^3 A — 2лг0)
и множество Во состоит из точек, расположенных на диагонали Хо=Х\
квадрата В. Если выбрать фо(#) = 1, Ф1М =sgn (Уг — х), то легко
вычислить, что
4>i(x
и №фо(л:о, ^i)=0 в двух четвертях {0<хо<1[2, 0<Xi<ll2} и
{V2<°Jfo<l. ll2<xi<\} квадрата 5*).
Верхняя граница C0) для дисперсии D6[f] имеет простой
геометрический смысл: она равна квадрату расстояния (в метрике
пространства L2) от функции {(Р) до линейного подпространства,
определяемого функциями (Я) У(Р)
*) В качестве ф1(*) в этом примере использована вторая
функция системы Хаара [82].
150 ВЫЧИСЛЕНИЕ ИНТЕГРАЛОВ (СЛОЖНЫЕ ОЦЕНКИ) [ГЛ. 4
I
Пример. Рассмотрим интеграл / = J f(x)dx. Пусть т=\ и
о
заданы две ортонормированные функции: фо(*)=1| <Pi(*) =
У
Обозначим через Е и л две случайные точки (вместо
и вычислим определители, входящие в B7):
wf = / (I) Ф1 (л) - / (л) Ф1 (Б) = /з [/ (Е) A - 2ii) -
^ = Фо (Б) Ф1 (л) - Фо (л) Ф1 (Б) = 2 /з (Е - ц).
Из B7) и B9) вытекает оценка интеграла /:
Ш = 2-1 (?-лГ1 [A -2л) /(Б) - П -2Б) /(Л)Ь
где Е и л имеют совместную плотность распределения
'1.4 (*• У) = 6 (* - *>>2' ° < ^* У < 1 • <33)
1
Для расчета интеграла / = §exdx по десяти значениям подынтег-
о
ральной функции запишем оценку
Дисперсия этой оценки, согласно C0), где имеет место знак
равенства, есть
= 0,2 {0,5 (е2 — 1) — (е — IJ — 3 C — <?J} -г 0,000788.
Уменьшение дисперсии по сравнению с простейшим методом весьма
значительное.
Так как Р\%Х\(Х* #)^6, то удобно находить значения Е и л
методом Неймана (п. 5.3 гл. 2): выбираем три случайных числа yit y'it у]
и проверяем условие yt < (y* —Y;J. Если оно выполнено, то
?t=Yt> ^ = Ус Эффективность отбора «=!/в- Пример расчета по
формуле C4) приведен в табл. 1. Результат этого расчета 0ю= 1,731.
2.4. Замечания. Методу й. 2.3 посвящено несколько работ [20,
31, 137]. Исследователей привлекает большая общность метода и
значительное уменьшение дисперсии. Однако он имеет и свои
недостатки. Во-первых, пока нет удобных и достаточно общих приемов
для разыгрывания ^вчек Q*°\ ..., Q*m* с млотностыо B8) *). Во-вто*
*) Если известна верхняя граница плотности p(Q^ ,. •«, Q) ^
^с, то для разыгрывания точек Q*°\ . ..,Q*m* можно использовать
метод Неймана, эффективность которого э = 1/с.
§ 3]
ИСПОЛЬЗОВАНИЕ СМЕЩЕННЫХ ОЦЕНОК
151
Таблица 1
i
1
2
3
4
5
0,69186
0,91682
0,22561
0,95114
0,40837
If
0,0339 5
0,12904
0,70177
0,16021
0,93030
Числитель
2,2588
2,8043
— 1,6128
2,8182
—1,7569
Знаменатель
0,6579
0,7878
—0,4762
0,7909
—0,5219
1,716
1,780
1,694
1,782
1,683
рых, в формуле B7), вообще говоря, присутствуют отрицательные
случайные веса (ср. пример п. 2.3); а формула со знакопеременными
весами практически плоха, если число слагаемых велико. Чтобы
устранить эти недостатки, надо использовать другие плотности
р(Ро, . • • ш Ля)» отличные от B8) (см. [33]). Наиболее подробно
изучен случай, когда все точки Q^\ ..., Q*m) представляют собой
функции от одной случайной точки Q*0) (Б. Л. Грановский [20, 21]).
§ 3. Использование смещенных оценок
Все указанные в гл. 3 и 4 оцеки 0 интеграла
{P)dP C5);
представляют собой несмещенные оценки: Мб=/.
Большинство авторов ([33, 130]) включают условие
несмещенности даже в определение случайной квадратурной
N
формулы B0), требуя, чтобы 2*//(Q(/)=/ для всех
/=1
f(P)^L2(G\ p). И мы отдали дань этой традиции в
гл. 3, п. 2.4.
Однако, как указано в гл. 3, п. 1.7, при больших /V
(когда количество используемых значений f(QU))
велико) для практических целей достаточно требовать
только, чтобы оценка была состоятельной: 6 >/. В самом
деле, обычно порядок дисперсии DQ=O(N~l) и
вероятная ошибка rN оказывается rN—O(N-m). В тех
случаях, когда смещение 8—/=О(Л^~1), ясно, что при
больших N порядок ошибки определяется величиной rN, а не
смещением.
152 ВЫЧИСЛЕНИЕ ИНТЕГРАЛОВ (СЛОЖНЫЕ ОЦЕНКИ) [ГЛ. 4
3.1. Взвешенная равномерная выборка.
Предположим, что нам удалось найти допустимую по отношению
к f(P) плотность р(Р), приближенно пропорциональную
j/(P)|. Д. Хэндскомб [137] предложил в качестве
оценки интеграла по конечной области G
использовать величину
5iv = 2/(Ql)/Sp(Q<), C6)]
i=l /i=l
/ »
где Qi? • •.» Qm —независимые случайные точки, рав-,
номерно распределенные в G.
Естественно сравнить оценку C6) с оценкой метода
существенной выборки, где рекомендуется использовать
такую же плотность р{Р). Согласно п, 3.2.1 гл. 3
получаем оценку • -
где Qi, . . . , QN — независимые реализации случайной
точки Q с плотностью р(Р). Сразу видно, что при
сложных р{Р) расчет по формуле C6) гораздо проще, так
как не требуется разыгрывать точки Q* с этой
плотностью. . .;
Предположим, что I |f(P)|dP<oo. Тогда по теоре-
N
ме Хинчина (стр. 87) величина (VG/N]^f (Qi) ~-W0,
N
а величина (VG/N)^ p (q]) —-> 1, когда N-+ оо (здесь
VG — объем области G). Следовательно, по известному
свойству сходимости по вероятности, величина 6^ также
сходится по вероятности к /о, так что оценка 8*
состоятельна.
Оценка C6) исследовалась в работе М. Поуэлла и
Дж. Свэпна [164]. При некоторых предположениях
относительно f(P) и р(Р) удалось доказать, что, когда
§ 3] ИСПОЛЬЗОВАНИЕ СМЕШЕННЫХ ОЦЕНОК ' 153
N—>- оо, дисперсия
DO* = ^ J [f(P) - Iop (P)]*dP + O(ffi), C7)
а смещение
Легко видеть, что если f(P)^O и p=p(P)=f(P)/IOy то
главные члены в DO* и МО*—/о обращаются в нули (ср.
с методом существенной выборки).
Пример. Вычислить интеграл / = ^ехс1х=е— 1. Пусть
о
B/з) A+а:). Оценка C6) при Л/=10 равна
ю Y // ю
Ч 104-^
Главный член дисперсии в этом примере легко вычисляется:
в то время как для простеГмиего метода D0iO=0,0242.
3.2. Простейший метод Монте-Карло с поправочным
множителем. Пусть требуется вычислить интеграл вида
C5), где р(Р)—заданная плотность вероятностей,
определенная в G и Qi, . . . , Qn — независимые
реализации случайной точки Q с плотностью р(Р). В качестве
оценки интеграла / рассмотрим величину
] C8)
где функция v(P) пока не определена. Если Mv(Q) — \f
то оценка C8) будет состоятельной (доказывается так
же, как в п. 3.1).
Оценка C8) сходна с оценкой C6), так как при больших N
с большой вероятностью
[ЛГ "I—I Г N
*?" -[-Fg<—
N
154 ' ВЫЧИСЛЕНИЕ ИНТЕГРАЛОВ (СЛОЖНЫЕ ОЦЕНКИ) [ГЛ. 4
В то же время для Q N гораздо легче вычислить математическое
ожидание и дисперсию.
Теорема 5. Если f(P)e=L2(G\ p), v(P)<=L2(G\ р)
и Mv(Q) = l, то
l $J(l-v)pdP, C9)
6* = ^ j[/ -1 B - v)]2 p dP + 0 (Ц. D0)
Доказательство. Для краткости обозначим f*=
fcs^Q,), Vi=v(Qi). Заметив, что при 1фк величины эти
независимы, запишем
= Л^-2 [# (M - l) м/Мо + ЛМ (fv)l D1)
Так как Mf=/, Mu=l, то
1^5^ = /-^"^ (/-/»),
.что равносильно C9).
Перейдем к вычислению дисперсии DO*. Так как
то в сумме необходимо выделить слагаемые с четырь-т
мя различными индексами (i, /, ky /), с тремя
различными индексами, например вида (/, i,k, l) с двумя
различными индексами вида (/, г, k, k) или вида (*, /, i, l) и со
всеми совпадающими индексами (i9iti9i). Тогда
нетрудно получить, что
МЭ^ = Л^" {N (N - 1) (ЛГ - 2) (N - 3) (М/J
+ Л^ (N - 1) (iV - 2) [М (/2) (ШJ + 4М (fv) MfUv +
+ (М/J М (у2)] + Л^(Л^— 1)[М(/2)М (v2) + 2{М (МJ +
+ 2М/М (fv2) + 2МуМ (/2у)] + WM (f2v2)}.
Вычитая из M^iv квадрат выражения D1) и принимая
§ 3] ИСПОЛЬЗОВАНИЕ СМЕЩЕННЫХ ОЦЕНОК 155
во внимание равенства М/=/, Ма=1, найдем
выражение для дисперсии
D$N = ЛГ4 {N (N - 1) (- AN + 6) /2 +
+ N(N -I) (N -2)[M(f*) + I*M(v2)] +
+ 2N (N - 1) (N - 4) /М (/у) + УУ (W - 2) [М (/у)]2 +
+ ЛГ (ЛГ - 1) [М (/2) М (у2) + 2/М (fv2) + 2М (/2<01 +
В этом выражении легко выделить главные члены
DS* = ЛГ1 {- 4/2 + М (/2) + /2М (t^) + 2/М ф>)} +
+ О (М-*) = N-Щ [(/ - 2/ + /уJ] + О (ЛМ>).
Последняя формула совпадает с D0), и таким образом
теорема доказана. _
Из C9) видно, что оценка 0* будет несмещенной для
любой функции f(P) тогда и только тогда, когда а(Я) =
е=1. В этом случае C8) обращается в оценку
простейшего метода Монте-Карло. Однако для каждой
конкретной f(P) существует бесконечно много таких v(P), что
]f(l-v)pdP=0.
G
Из D0) видно, что если v(Р) =2—f(P)/I, то главный
член выражения DQN обращается в нуль и 09*=
= O(/V~2). При этом смещение в нуль не обращается и,
согласно C9), равно
В этом смысле оценка 9* хуже, чем оценка 9*. Неясно,
однако, играет ли указанное свойство какую-либо роль
на практике, когда выбор /?=—/// или v = 2—f/I в
точности невозможен. Заметим, что функция v(P) в теореме 5
не обязана быть знакопостоянной, так что если h(P)^i
i«/(P) и значение интеграла Mft(Q) == f h(P)p(P)dP—
= СфО известно, то целесообразно положить v=2—
Р)/С
Пример. Вычислить интеграл / = J exdx= 1,7183. Так как
о
то положим у=2— B/з) A-М) = Gз) B—х).
156
ВЫЧИСЛЕНИЕ ИНТЕГРАЛОВ (СЛОЖНЫЕ ОЦЕНКИ) [ГЛ. 4
Согласно C8) при Л/
10 получим оценку
о /Ю
-?
Главный член дисперсии тот же, что в примере п. 3.1, так что
D0io«O,OO287, невероятная ошибка гю=0,б75]/ D0^o -0,036.
Смещение же равно М910 — /=—0,1A—е/3) =—0,0094, т. е. в несколько
раз меньше. (С увеличением N различие это еще увеличивается:
например, при N=100 вероятная ошибка Гюо~О,О11, а смещение
равно — 0,00094).
3.3. Численный пример. Большинство оценок в гл. 3 и 4
иллюстрировались одним и тем же примером: формулой для расчета
интеграла
1
/= J exdx= 1,718.
о
Выпишем все эти формулы при N=10 (точнее, с использованием
десяти значений подынтегральной функции).
Во-первых, две грубые оценки:
1. Простейший метод
Ю у
2. Геометрический метод
1 ^ ~ ^ U9 если еу\ < е \
0io = T62dZ" ГДО Zi==\ , у
i==l [О, если еу\ > е 1.
Во-вторых, четыре оценки, соответствующие основным методам
уменьшения дисперсии:
3. Выделение главной части К-
4. Существенная выборка с плотностью р= B/3) A+л:)
5. Симметризованная оценка
' ИСПОЛЬЗОВАНИЕ СМЕЩЕННЫХ ОЦЕНОК 157
б. Выборка по двум группам
, 4 М) 6 Л2)
2+
где
t(!) _ Z? tB)
W — 2 • fe* = 2
Затем две оценки, соответствующие двухэтапиым схемам расчета:
7. Выделение главной части А=аоA+*) при с&о= 1,690
01О =0,8451 + ±2
8. Существенная выборка с р=A+апл0/A+О,5ао) при ао=1,81
ви- o,i9O5
где
?, == 0,5525 (]/1 + 6,89Gvt. — l).
Далее случайная квадратурная формула интерполяционного
типа:
^-2*1,-) Л-A-2|,.) Л
где для расчета пары ??., % надо выбрать три случайных числа yi9
Yj»Vf и проверить условие у/ < [у^ — YiJ- Если это условие
выполнено, to?j- = у^ т)^ = 7i» B противном случае надо выбрать новую
тройку случайных чисел. В среднем на получение каждой пары
\>i* Л* придется затратить 6 проб.
И, наконец, две смещенные оценки:
10. Взвешенная равномерная выборка
11. Простейшая оценка с поправочным множителем
*-АA'")("-14
В табл, 2 сравниваются трудоемкости /ю*06ю этих оценок по
отношению к вычислительной машине БЭСМ-4: /ю — это время
расчета 9ю в миллисекундах (Для смещенных оценок в качестве D0iO
приведено значение главного члена дисперсии.)
158
ВЫЧИСЛЕНИЕ ИНТЕГРАЛОВ (СЛОЖНЫЕ ОЦЕНКИ) [ГЛ 4
се
С*
S
хо
w
Н
1а
О
¦I
CD
<М 00 Ф
1а I
О5
см а ^
8 о 8
о м о
I Г- S
о м
-^ СО
сЗ о"
00
О *^ 1О
О •» «чн
О О5 О
я. я я
о о
5 i
I
о
CO O5
о "*
СО
И
»=;
\о
со
Н
S
U
0 см со
t- LQ СО
1 О
со
Q СО
О О
00 О
М ri гн
«^ О О
¦^ сГ сГ
Ю 1> ^
Vt< CM ^н
1>- О О
СО 00 СО
(N О ^н
1>- О О^
^ о о"
00 О О5
О ^н чн
t^ О О^
^ <э <э
S3
го со
00
S 8 о
ОЬ ^-1 ^-<
^ о* о
a? L «^
УПРАЖНЕНИЕ К ГЛ. 4
159
В табл. 3 приведены значения 0ю и ошибки 0ю — /, полученные
при расчете всех этих оценок с помощью случайных чисел yt,
выписанных на стр. 108. (В качестве yt и у", необходимых для расчета
оценок 2 и 9, выбирались дальнейшие группы цифр из табл. 4 (стр. 295),
умноженные на 10~б.) Здесь же указаны вероятные ошибки Гю.
Легко видеть, что фактические ошибки по порядку хорошо согласуются
с вероятными ошибками, хотя количество слагаемых во всех оценках
слишком мало для того, чтобы можно было гарантировать
применимость центральной предельной теоремы.
Упражнения к главе 4
1. Пусть G — конечная область в л-мерном пространстве.
Предположим, что дано разбиение G=Gi+ ... + GN и каждая из
областей G; центрально симметрична с центром Sy. Пусть Q(/) —
случайная точка, равномерно распределенная в Gjf a QW симметрична Q^
(относительно центра Sj): Q(/) + Q(;)'= 2Sy. В качестве оценки для
интеграла /0 = §f(P)dP рассмотрим симметризованную формулу
где К;. —объем области G^
Доказать, что если f(P) и все ее частные производные первого
и второго порядков непрерывны в G, причем для всех к, /=»
= 1, 2,... ,п
\d*f/dxkdXl\ < L,
и выполнено условие A1), то для дисперсии б$* справедливо
неравенство
где с %
При этих же условиях оценить погрешность квадратурной
формулы
cLN~2/n.
Указание. Доказательства аналогичны пп. 1.2 и 1.3. ч
(Для случая G=Kn и разбиения, изображенного на рис. 48, это
предложение доказано Н. С. Бахваловым [1]; см. также С. Хабер
160 ВЫЧИСЛЕНИЕ ИНТЕГРАЛОВ (СЛОЖНЫЕ ОЦЕНКИ) [ГЛ 4
2. Доказать, что математическое ожидание оценки
!
i
\
"N- Mn ^j^ l\ M M
все узлы которой зависят от одной случайной точки (уи ... ууп),
равномерно распределенной в единичном кубе Кп, равно
кп
(Б. Л. Грановский)
3. Доказать, что величина YN {bN — /0) из п. 3.1
асимптотически нормальна, и вычислить главный член C7) дисперсии ^9^.
ГЛАВА 5
РЕШЕНИЕ ЛИНЕЙНЫХ УРАВНЕНИЙ
§ 1. Интегральные преобразования
1.1. Итерированные функции. Рассмотрим функцию
ф(Р), определенную в некоторой области G на плоскости
Р= (х, у), и функцию К(Ру Р')> определенную при P<~G,
P'G Интегральное преобразование
{P,Pf)q{Pf)dP' A)
преобразует функцию ср(Я) в функцию /<ф(Р), которую
называют итерацией функции ср(Р) с помощью ядра
К(Р, Р'). Второй итерацией функции ф(Я) (с помощью
ядра К(Р, Р)) называется функция ККср(Р), которая
обозначается /С2ф(Я).
Очевидно,
/С2Ф (Р) = JJК (Р, Р') К (Р\ Р") Ф {Р") dP'dP».
Точно так же определяются /С3ф(Р), . . . ф
Вычислять такие интегралы можно методами,
указанными в гл. 3 и 4. Однако задачи, в которых приходится
вычислять итерации функций, имеют свою специфику:
обычно требуется не одна какая-нибудь итерация, а
несколько или даже все итерации до некоторого порядка.
Поэтому вычислительные схемы Монте-Карло выбирают
так, чтобы все эти итерации вычислялись одновременно
по одним и тем же случайным испытаниям.
Далее, многие методы приближенного решения
интегральных уравнений используют не сами значения/С'(Р)
И И. М, Соболь
162 РЕШЕНИЕ ЛПНГПИЫХ УРАВНЕНИЙ [tJ\ 5
а некоторые функционалы от /Оф(Р), чаще всего —
линейные, представимые в форме скалярных
произведений.
Условимся записывать скалярное произведение
функции ф(Я) и -ф(Р) в виде
(Ф, я|:)= 1ф(Я)г|г(Р)йР. B)
G
В следующем пункте мы рассмотрим задачу о
вычислении интегралов вида (\|), /(Чр). Заметим, что если
область G /г-мерная, то интеграл (ty, /Сф) представляет
собой п(/+1)-кратный интеграл.
В дальнейшем мы будем предполагать, что
, i|>(P)e=L2(G), /((P, P')e
Эта запись означает, что
f ifdP < со, J \\hlP < со, f f 7BdP rfPr < oo.
Легко доказать, что если cp(P)^L2{G) и f)
L(G), то скалярное произведение B) конечно. Это
вытекает из неравенства A) па стр. 292:
I w\p dP < )
\G " G
00.
Так же легко доказать, что если cp(P)^L2(G) и
/С(Р, P/)^L2(GXG)> то A'<p(P)€=L2(G). В самом деле,
из A) следует, что
2(P, Pf)dP' ]
Интегрируя это неравенство по Р, получим
оо.
Отсюда вытекает, что и /С?ф(Р), . . . , /<Vp(P), . . .
принадлежат L2(G).
Пример. Область G представляет собой треугольник ,
y>Q, *+^<i (рис. 49), ядро К(х, у, х', у') —хх'+уи'. Если выбрать
§ n
ИНТЕГРАЛЬНЫЕ ПРЕОБРАЗОВАНИЯ
163
!. ТО
1 1-л
,0=J<fr' J d/(**' + */) = -?.
0 0 b
1 1-х'
, r/)= J<te' f йу'
0 0
нетрудно проверить, что /С1ф = б"" 81~~{(х -f- у) при 1=1, 2, ...
1.2. Вычисление линейных функционалов от
итерированных функций. Предположим, что в области G
заданы функции (p(P)e=L2(G), x|>(P)e=L2(G), /((Р, Я')<=
eL2(G)<G) и требуется вычислить интегралы (if>, /С;ф)
для /=0, !,•..,«.
Выберем в G произвольную плотность вероятностей
Р), допустимую по отношению к ф(Я) (см. гл. 3, п. 3.2),
и произвольную условную плотность вероятностей
р(Р, Я/)-=/?(Я/|Я), допустимую по отношению к ядру
1\(Р, Р'). Условия нормировки
Jp() ]>(, )
а
Определим в G случайную траекторию Т{ (рис. 50)
где точка Qo имеет плотность р(Р), а плотность точки
Рис. 49.
Рис. 50.
Q) при известном значении Q^_i равна p(Qj-u Я).
Функцию р(Я, Р') часто называют плотностью вероятностей
перехода из точки Я в точку Р' и обозначают р(Р-=>Р')9
164 РЕШЕНИЕ ЛИНЕЙНЫХ УРАВНЕНИЙ [ГЛ. 5
а функцию р(Р) называют начальной плотностью.
Траекторию можно интерпретировать как точку в GX- • -X
\G = Gi+K Плотность вероятностей этой точки равна
PdQo, • • • , Qi)=P(Qo)p(Qo, Qi). . .p(Qi-i, Qt). C)
Функцию (З) называют плотностью траектории Т{.
Введем в рассмотрение функции от траектории,
называемые обычно весами:
__ K(Qo,Qi)K(Q1,Ql)...K(Ql_l,Qi)
1 p(Q0. Qi)p(Qi. Q2) -.-P(Q/_i, Q}) ' [ }
которые определены при /=1, 2, . . . , i. Для /=0
положим W{)=\\ тогда справедлива рекуррентная формула
E)
которая позволяет последовательно вычислять все Wj по
мере расчета траектории.
Обозначим через 6*[ф] случайную величину
. F)
Теорема 1. Если условия, перечисленные в начале
пункта, выполнены, то математическое ожидание
величины Э,[г|)] равно (яр, /С'<р)
МОг[я|з] = (г|), /С'ф). G)
Для доказательства теоремы вычислим это ма-
мематическое ожидание:
. |
Приняв во внимание соотношения C), D) и F),
получим *)
G Н УЧ°' G 6
X rfQ,... <*Q* = J * (Q
G
*) В этой главе переменные интегрирования иногда
обозначаются той же буквой Qit ч^то и случайная точка.
§ 1] ИНТЕГРАЛЬНЫЕ ПРЕОБРАЗОВАНИЯ 165
Доказательство теоремы нуждается в одном уточнении.
Плотности р(Р) и (или) р(Р> Рг) могут обращаться в нуль в тех точках,
в которых i|?(P) и (или) К{Р, Р) обращаются в нуль. В таких
точках формулы D), E) и F) не определены. Можно доопределить в
этих точках W. и 6t- [ф], полагая их равными нулю. На значение
интеграла это не повлияет, ибо если произведение p(Qo)p(Qo, Qi)..*
*..p(Q;_i , Qi) равно нулю в некоторой области BczGX ...Х^» то
произведение ty(Qo)K(Qo, Qi).../( (Qt_i, Qt) также равно нулю
в В и интеграл по области В равен нулю. В дальнейшем мы
оговаривать доопределение соответствующих величин не будем, так как
это всегда может быть осуществлено таким же образом.
Теорема 1 позволяет построить метод Монте-Карло
для расчета величин (г|), /СЧр). В самом деле, если по
указанным правилам построить N траекторий вида 1\ и
для каждой из них вычислить 6*[i|)], то при достаточно
большом N
1 N
(Ф,/С'ф)»^ЗвЛФЬ, (8)
где 0г|/ф]8 — значение 0*[г|>], сосчитанное для s-й
траектории. Так как часть (Qo-^Qi-^.. -~+Qj) траектории Тг
при j<Ci представляет собой траекторию того же типа
Th то по тем же точкам можно вычислить 0,[t|)]e и
оценить (ф, /С'ф) для /<*'.
Если требуется вычислить несколько скалярных
произведений (г|\ /Сер) с различными функциями ф и -ф, го
это можно осуществить с помощью одних и тех же
траекторий Ти так как закон построения траекторий
зависит только от р(Р) и /?(Р, Р')> но не от ф и if»; и если
выбрать положительную плотность р(Р), то она будет
допустимой по отношению к любой г|?(Я).
1.3. Вычисление значений итерированных функций.
Мы укажем три способа оценки /Сф(Р).
1.3.1. Траектории с фиксированной
начальной точкой. Формально, для того чтобы
вычислить значение /С'ф(Я) в точке Я=Ро> можно выбрать
/7(Р)=г|)(Р)=6(Р—Ро), где б (Я) —дельта-функция
Дирака*). Тогда из G) вытекает, что
-Ро) ] =
*) Хотя дельга:функция и не принадлежит L2{G), но скалярное
произведение F, К1 ф)конечно.
166 РЕШЕНИЕ ЛИНЕЙНЫХ УРАВНЕНИЙ [ГЛ 5
Выбор в качестве начальной плотности дельта-функции
означает, что начальная точка фиксирована: Qo=Po.
Сократив в F) ij;(Qo) с p(Qo), можно переписать G) в виде
(9)
Итак, если все N траекторий Т{ начинать с
фиксированной точки Q0 = PQi to
/СЧ (P0)^^i{Wi^(Qi)\Qo - РоЪ (Ю)
где индекс s имеет тот же смысл, что в (8). Конечно,
форхмулу (9) можно вывести не прибегая к помощи
дельта-функции, а рассматривая лишь траектории,
начинающиеся из точки Ро и их плотность.
Изложенный метод, очевидно, неудобен, если нужны
значения К*Ц)(Р) во многих точках, ибо из каждой
такой точки пришлось бы строить «свои» N траекторий.
Следующие два способа позволяют использовать одни и
те же траектории для оценки /Сгср(Р) во многих точках.
1.3.2. Средние значения по области. Обоз-
начим через %в(Р) индикатор произвольной обласги
BczG:
у (р^!1' если р?в>
/в^ } 1о, если
Пусть р(Р)—произвольная «весовая» функция. Если в
формуле G) положить -ф=р%Ву то
M0t- [pxfl] - (рхв, /С'ф) = IР (Р) /СЧ (Р) dP. A1)
в
Формула A1) позволяет по N траекториям вида Г,
оценить среднее значение /Оф(^) с весом р(^) по любой
области В:
= $р(Р) /СЧ (Р) dPl I p (P) dP.
в в
так как стоящий в числителе интеграл
N
Jp(P)/C4CP)dP«4-2 e,[px*l.. A2)
В /v s=l
Наличие справа величины Хв имеет простой смысл:
суммируются 6*[р], но только по тем траекториям, для
которых начальная точка QB
§ П ИНТЕГРАЛЬНЫЕ ПРЕОБРАЗОВАНИЯ 167
Конечно, надо иметь в виду, что если область В очень
мала, то в A2) окажется очень мало слагаемых,
отличных от нуля, и точность такого метода расчета будет
невысокой.
Обозначим интересующую нас ф\пкцшо через м—/С'Ф (Р).
Метод настоящего пункта позволяет вместо значений и(Р\), ... % и(Р\Л
в заданных точках Р\, ... , Pk вычислить средние значения
ив , ..., ив по некоторым областям Въ ... у Bk содержащим со-
1 к
ответствующие точки Pi, ... , Р . Оценить погрешность такого
приближения нетрудно, если по полученным значениям "#1'—-»/ул
можно составить себе представление о поверхности и(Р). Например,
пусть вместо значения и(х{)) мы вычислили среднее значение
u0 = j и (v) x dxj J x dx.
Если и(х) &v(x) =a-f/;j2, то ошибка //3~и(л'о) приближенно равна
b (Xo + h)*-(xo-h)* 9
1.3.3. Оценка коэффициентов Фурье.
Выберем в качестве г|*>0°) в G) несколько ортонормнрован-
ных функций ifitP), ..-¦ i\*m(P), так что (yph, ^)=бу.
Здесь fiw — символ Кропекера: ft^=0 при /е^у и 6Afe=l.
Формула G) позволяет оценить коэффициенты Фурьеcitk
функции /О'ф(Я) относительно ^h(P):
Если система функции \[\у..., i|?m выбрана достаточно
разумным образом, то
т
К*Ф (Р) ^ "^ С' iMh (Р) (\3)
и, вычислив приближенные значения
получим приближение A3) для /Ocp(P) во всей области.
1.4. Случайные траектории с поглощением.
Траектории типа Ti — далеко не единственный способ вычисления
итераций методом Монте-Карло. Зададим произвольную
168 РЕШЕНИЕ ЛИНЕЙНЫХ УРАВНЕНИЙ [ГЛ 5
функцию а(Р), удовлетворяющую в G условию
Пусть s(P) = l — а(Р), а плотности р(Р) и р(Р, Р')
такие же, как в п. 1.2.
Определим в G траектории fv случайной длины v
по следующим правилам:
а) точка Qo выбирается в соответствии с плотностью
)
б) в точке Qi (где /—О, 1, ...) траектория с
вероятностью a(Qj) заканчивается и с вероятностью s(Qj)
продолжается;
в) если траектория не заканчивается, то точка Qj+\
выбирается в соответствии с плотностью p(Qj, Р).
Естественно назвать а(Р) вероятностью поглощения
случайной точки в точке Р и s(P)—вероятностью
рассеяния этой точки.
Вероятность получить i-звенную траекторию fv с
соответствующими вершинами, расположенными в
окрестностях точек Ро, Р\> ...» Р<* равна произведению
р (Ро) dPos (Ро) Пр (Рни Pi) dPiS (Pf) p (Л-ь Pt)dPiu(Pi).
Введем обозначение
Pt(P» ...,Л)- Р(Ро) П^(РМ) р(Рни Р,)а(Р(); A5)
тогда вероятность получить f-звенную траекторию fv
равна
P{v = i} -J.. .pt (Po, .. м
Запишем также условную плотность вероятностей
траектории Ту при условии, что v=i:
Pv (Ро, . . м Pi|v = /) = Pi (P01 . . ., Л)/Р {V - /}.
Вдоль траектории Tv рассмотрим функции W{ (веса),
определенные (для y^v) рекуррентной формулой
W. - 1. Г/ = wHX [К (Qi-u Qi)/s @,-1) р (QHuQitt- A6)
§ 11 ИНТЕГРАЛЬНЫЕ ПРЕОБРАЗОВАНИЯ 169
Сравнивая A6) с E), легко заметить, что
Wj (Ро Pi) = Wf (Po, ..., р,) s (Ро) ...s (P;_i). A7)
Обозначим через 0x[\f>] случайную величину
$№ = №№/рШ&1[<р((Ц)/а№]. A8)
Теорема 2. ?стш условия, перечисленные в начале
п. 1.2, выполнены, то условное математическое
ожидание величины 6i [\fj] равно
М {8, №]|v = /} = (ф, /С'ф)/Р {v = {}. A9)]
Доказательство. По определению
М {0; [Щу = /} = J ... J 0, [г])] Я (Qo, ..., Q,|v = I) dQQ...
G G
<= J..• JФ(Qo) П
G G /=1
Теорема 2 позволяет сформулировать метод Монте-
Карло для расчета (\|), /(Чр) с помощью траекторий fv.
В самом деле, реализовав N таких траекторий, получим
среди них Ni траекторий, состоящих из i звеньев.
Очевидно,
P{ )
А из A9) вытекает, что
^у^яьт, B0);
Ni i
где Qi[^]a -—значение 0i[i|)] на s-й траектории (из числа
i-звенных траекторий). Заметим, что последнюю фор-
м.улу можно заменить формулой
1 Ni ~
№f/C'9)«^2jef№,. B1 х
1.5. Сравнение точности оценок (8) и B0). В оценке (8) осред-
няются значения случайной величины Qi [-ф], математическое
ожидание которой равно О|\/С*ф). В B0) осредняются значения случайной
170 РЕШЕНИЕ ЛИНЕЙНЫХ УРАВНЕНИЙ [ГЛ 5
величины lf=P{v = /}0j [г|?], условное математическое ожидание
которой равно также(г|), /С'ф)- Для того чтобы сравнить дисперсии
этих величин, достаточно сравнить математические ожидания их
квадратов. В первом случае
МО1; [+1 = J • • • j «? №] p. (Qo, ..., ty) dQ0... dQi% B2)
а вб втором
М [Щ |v = i) =\..-\ 6?3V(Q«. .. -, <?,-/v = 0 dQ, • - <«?, =
- P {v = »} I ... .f Of W~Pi (<?„ ..., Qt) dQ0... dQr
G G
С помощью формул C), F) и A5), A8), приняв во внимание
соотношение A7), нетрудно проверить, чго имеет место тождество
6? № Р( =Т)? [Г,'рсз (Qo) ...s (<?,_,) a (Q,.). B3)
Используем B3), чтобы преобразовать последнее выражение для
Вообще говоря, выражение B4) может быть как меньше, так и
больше, чем B2). Однако в весьма важном частном случае, когда
поглощение постоянно во всей области G или, другими словами,
a(P)s==a, эти выражения равны. В самом деле, в этом случае
Р {v = j} = as1 I ... I р, (Р„ ..., Pi) dP0... dPi = BS',
и дробь, стоящая в B4), равна dQ0 ... dQim
Следовательно, в случае а(Р)^а дисперсии равны
Щ №1 = 0A^ = 1).
Для того чтобы количество слагаемых в формулах (8) и B0) было
одинаковым и равнялось N*, в первом случае надо построить jV==
— N* траекторий типа Тt, а во втором случае, чтобы N- = N*, надо
построить в среднем N*/P{v = /}>//* траекторий типа TVt Таким
образом, оценка B0) для (ф, К1Ц>) оказывается менее выгодной.
На различных других оценках величины ("ф, /С*ср) мы
останавливаться не будем. Кроме случайных траекторий типа Т1 и Tv,
возможны и другие типы траекторий. Например, «поглощение» может
происходить при пересечении некоторых заранее заданных линий или
адвисеть только от направления звена траектории и т. п.
§ 21 НЕОДНОРОДНЫЕ ИНТЕГРАЛЬНЫЕ УРАВНЕНИЯ 171
§ 2. Неоднородные интегральные уравнения
2.1. Постановка задачи. Ряд Неймана. Рассмотрим
интегральное уравнение
z(P)=JK(P,P')z(P')dP'-{-f(P),
которое с учетом A) можно записать в виде
z = Kz+f. B5)
Здесь z(P)—искомая функция, /С(Р, У3')—заданная
функция, называемая ядром уравнения, /(Р) —
заданная функция (свободный член).
Предположим, что f(P)^L2(G), K(P, P')<^L2(GXG).
Можно попытаться искать решение методом
последовательных приближений. Пусть г@) = ср(Р)
—произвольная функция из L2(G). Пусть далее при i=l% 2, ...
г(<) = /Сг('-п+/. B6)
Нетрудно вычислить, что
'l)f+Klq>. B7)
Последовательные приближения г@ сходятся при
1->оо к решению г уравнения B5) тогда и только тогда,
когда это решение представимо в виде ряда Неймана
г - У, К![. B8)
Условия сходимости ряда Неймана имеются, например,
в [63].
В частности, если
Л^(/\ P')dPdP'
то ряд B8) сходится в среднем:
lim (z-ifi Klf, г- V /<7]=0.
Если, кроме того, для всех
\ К2 (Я, Р') dP' < С,
с
то ряд B8) сходится абсолютно и равномерно в В.
172 РЕШЕНИЕ ЛИНЕЙНЫХ УРАВНЕНИЙ [ГЛ 5
Лемма. Если ряд B8) сходится в среднем, то для любой
функции я|)(Я) из Lo(G)
JimU, 2
Доказательство. Рассмотрим разность
0М)-М>, _ _
t=0
Из неравенства A) иа стр. 292 следует, что
m
когда w -> оо.
Формулы B7) и B8) показывают, что вычисление
2(?) или 2 сводится к вычислению суммы
итерированных функций.
2.2. Оценка линейных функционалов от Z(t\
Результаты § 1 позволяют указать методы Монте-Карло для
вычисления скалярных произведений (я|э, z{i)), где
(Р) —любая заданная функция из L2(G).
В самом деле, рассмотрим случайные траектории Ти
определение которых дано в п. 1.2, и введем
случайные величины ?*[я|)]» зависящие от таких траекторий:
51 ^/ (Q/) + ^ф №*)]. B9);
(При <=0 полагать квадратную скобку в B9) равной
W(Q))
q())
Легко доказать, что математическое ожидание этих
величин равно
" МЬ[ф] = (Ф. г«), C0)
ибо каждое слагаемое в B9) —это величина типа 0<[ф]з
MS,»] -1М {№-; Wi m) + М Щ Ww (%)} =
2 (Ф, /Су/) + (*, /С'ф) =
/-о
§ 2] НЕОДНОРОДНЫЕ ИНТЕГРАЛЬНЫЕ УРАВНЕНИЯ 1?3
Соответствующий C0) метод Монте-Карло:
(Ч>,*«>)«* SbhN,, C1)
iV s=l
где ?i[i|)]e — значение ?t[i|)] на 5-й траектории.
Очевидно, по одним и тем же траекториям типа Тг
можно вычислять значения (ф, z{i)) для нескольких
функций г|)(Р) и даже для нескольких уравнений B5) —
с одним и тем же ядром К{РУ Р'), но с разными /(Р).
Сами значения z{i)(P) можно вычислять любым из
трех методов, указанных в п. 1.3. Если ряд Неймана
B8) сходится, то при достаточно больших i значения
(г|), г@) могут служить приближениями к (г|), z).
2.3. Метод существенной выборки для траекторий 7V
В предыдущем пункте рассматривались траектории Ти
построенные по произвольным допустимым р(Р) и р(Р,
P')t но не было никаких указаний на то, как лучше
выбирать эти плотности. Однако от их выбора зависят
дисперсии D?i[i|)], определяющие точность метода
Монте-Карло C1). Особенно нежелательна большая
дисперсия тогда, когда начальное приближение г@) = ф(Р)
близко к точному решению z(P), так как можно
«испортить» это приближение.
Если функция zU)(P) известна, и интеграл (г|), г0))
вычисляется с помощью существенной выборки (гл. 3,
п. 3.2), то минимальная дисперсия такой оценки,
согласно теореме 3 гл. 3, равна
Ь -(г|>,2</>J.- C2)
Теорема 3. Предположим, что ядро уравнения
B5) и его решение неотрицательны
К(Р, Р')>0, *(Я)>0,
а траектории Т{ строятся с начальной плотностью
и с плотностью вероятностей перехода
р(Р, Р')=К(Р. Р')<р(Р')/Кср(Р). C4)
Если начальное приближение ср(Р) равно решению z(P)t
то при любом у = 0, 1,2,...,/
DC/№=A- C5),
174 РЕШЕНИЕ ЛИНЕЙНЫХ УРАВНЕНИЙ trJl 5
Доказательство. Если fp = /Ccp+f и выполнено
равенство C4), то
[]
В то же время при /^2 из B9) следует, что
^/-1ф (Q/-0 - l*
/)] - hl> (Qo)/P (Qo)l ^/-i [ф (Q/-0 - / (Q/-0 -
— /Сф (Q/-i)] =- 0.
Следовательно, при любом / значение ?,[г|э] зависит
лишь от Qo и, с учетом C3), равно ?,[ф] =sgn if(Qo)X
X(hM> ф)- Поэтому дисперсия ^[ф] равна
А так как из ц)(Р)=г(Р) следует, что все гО)(Р)==
=г(Р), то последнее выражение для D?j[\|)] совпадает
с C2). Теорема доказана.
Как и в гл. 3, п. 3.2.1, плотности C3) и C4) с у(Р) =
= z(P) практически использовать нельзя, так как
решение z(P) неизвестно. Однако, имея «хорошее»
приближение 20(P)«z(P), мы можем (в принципе) выбрать
ф(Р)=<г0(Р), и дисперсии D^[^] будут близки к
минимальным.
Если функция -ф(Р) знакопостоянна, то очевидно,
2.4. Оценка линейных функционалов от Z.
Рассмотрим бесконечные случайные траектории
которые строятся по тем же правилам, что траектории
7Y Тогда любой начальный участок (Qo-*-... ->-Qi)
этой траектории представляет собой траекторию типа
Тг и плотность его Pi(Qo, ..., Q0 выражается формулой
C). Предположим, что начальная плотность р(Р)
допустима по отношению к 'ф(Р), а плотность
вероятностей перехода р(Р, Р') допустима по отношению к
К(Р> Р'). Тогда из теоремы 1 следует, что при
каждом i
§ 2] НЕОДНОРОДНЫЕ ИНТЕГРАЛЬНЫЕ УРАВНЕНИЯ 175
Рассмотрим случайною величину ?[t[], зависящую от
траектории Т^:
При некоторых условиях справедливы равенства
i
1- 0
и математическое "ожидание величины Ц*ф] оказывается
равным вычисляемому функционалу:
М?[ф] = (ф, z). C7)
Например, достаточно потребовать, чтобы было /С(Я,
Я')^0, f(P)^O и ряд Неймана B8) сходился в
среднем. Более общие условия приведены ниже в теореме 4.
Если C7) справедливо, то для оценки (ij*, z) можно
использовать N траекторий типа Т», по каждой из них
вычислить значение ?[^]e (s—номер траектории) и ос-
реднить результат
(Ф.?)«4-2СК-Ь- C3)
Конечно, построить бесконечную траекторию численно
невозможно. На практике траекторию строят до тех пор,
пока слагаемые в C6) не становятся пренебрежимо
малыми по сравнению со всей суммой, и тогда
траекторию «обрывают». Часто в качестве условия обрыва
используют неравенство
Wt<e,
iMc 8>0—некоторое наперед заданное малое число,
а I — номер последней точки траекторги.
Можно обойтись без искусственного обрыва
траекторий, если вместо траекторий Т^ использовать
траектории с поглощением Tv (п. 1.4) В самом деле,
рассмотрим случайную величину
- № (Qo)/P (Qu)J ^v [/ (Qv)/« (Qv)J C9)
176 РЕШЕНИЕ ЛИНЕЙНЫХ УРАВНЕНИЙ [ГЛ. 5
со случайным номером v, равным количеству звеньев
траектории 2V
При некоторых условиях математическое ожидание
случайной величины ?v[i|)], зависящей от случайного
индекса v, можно вычислить по формуле
со
M?vШ = S M {Xv№ | v = i} P {v = i},
;=о
аналогичной формуле полной вероятности. Так как при
v = i и / = ф величина ?v[i|)]=0i['i|)], то из .теоремы 2
вытекает, что
М {Xv №11 v = i} = (-ф, Klf)/P{v = /}.
Следовательно,
ОО / ОО \
и окончательно
M^v[\|?] = (г|), г). D0)
Формула D0) также будет справедлива в случае,
когда К(Р, Р')>0, f(P)>0 и ряд Неймана B8) сходится
в среднем. Более общие условия см. ниже в теореме 5.
Соответствующий формуле D0) метод Монте-Карло
N ^
где ?v[t|?]8 — значение Sv[if)] на 5-й траектории типа Tv>
a v — номер последней точки этой траектории.
2.4.1. Метод Монте-Карло C1) позволяет оценить функционал
(ф, г), если только ряд Неймана B8) сходится в среднем, так как
можно фиксировать столь большое /, чтобы разность |(ф, г*1*)—-(-ф, г) |
была меньше любого заданного е>0. Казалось бы, методы C8) и
D1) также должны сходиться при этом единственном условии. К
сожалению, переход в бесконечномерное пространство GX^X •••
заставляет наложить несколько более жесткие ограничения, связан-
00
ные с тем, что сходимость ряда 2 ^Л/ не обеспечивает вообще
1=0
со
говоря, существования М 2 Л; и приходится требовать, чтобы схо-
оо
дился ряд 2 ^l1!^.
f=0
§ 21
НЕОДНОРОДНЫЕ ИНТЕГРАЛЬНЫЕ УРАВНЕНИЯ
177
Интегральное уравнение
, P')\~z{P')dP'
B5)
назовем мажорантным по отношению к уравнению B5). Так как
\КЧ\<:\К\1 1/1» то из сходимости (в среднем) ряда Неймана для
мажорантного уравнения следует абсолютная сходимость (в
среднем) ряда B8).
Теорема 4. Если ряд Неймана для мажорантного уравнения
B5) сходится в среднем, то имеет место равенство C7).
Теорема 5. Если ряд Неймана для мажорантного уравнения
B5) сходится в среднем, то имеет место равенство D0).
Легко видеть, что _в_ случае, когда К(Р, Р')^0 и /(Р)^0,
мажорантное уравнение B5) совпадает с уравнением B5) и из теорем
4 и 5 вытекают достаточные условия, приведенные в п. 2.4.
Перейдем к доказательству теоремы 4. Из теоремы I
следует, что
Сумма таких математических ожиданий равна
P(Qo)
Щ
= 2 (№, \КПП)= №1,2 itfl'l/l
и (по лемме п. 2.1) стремится к конечному пределу, равному (|i|)|,F).
Сходимость этого ряда обеспечивает существование MC[iJ)] и
справедливость равенства
Еще раз применяя лемму п. 2.1, получим, что
СО /71 / ttl
Аналогично доказывается и теорема 5. Из теоремы 2
вытекает, что
(М, f/d*' |/1)
P(Q9)
Затем с помощью леммы п. 2.1 доказывается сходимость ряда
2 м {\xv w | |v = i) р
i=0
2 (Ж. i«i' i/i) «= AФ1. i).
0
которая обеспечивает существование Mlv \\p] и справедливость
- J2 И. М. Соболь
178 РЕШЕНИЕ ЛИНЕЙНЫХ УРАВНЕНИЙ [ТЛ 5
равенства
2I } 2
1=0 1=0
сю
То, что Т] (ф, /С7) = (i|), г), мы уже доказали,
г-о
Метод Монте-Карло для расчета (\\\ z), справедливый и то1да,
когда ряд Неймана для мажорантною уравнения расходится,
рассмотрен в статье [148]
2.5. Сравнение точности оценок C8) и (II). Для того чтобы
сравнить дисперсии D?[\j)] nDLv[t|], рассмотрим матемашчсские
ожидания квадратов этих величии. Во-первых,
M%2VW = 2М пгШ I v = i) P {v=i} =
Используя A7) и A5) для перехода от WL и /\, к lFt- и pf- и введя
(для краткости) обозначение
^7(Of), D2)
запишем результат в виде
Во-вторых, из C6) и D2) видно, чт
Для того чгобы оценить это выражение, запишем ого в виде
со
где / — любое число из' интервала 0<*<1, и воспользуемся
очевидным неравенством 2uv^.u2-{-v2
0? 0? \ со оо
. «,/=0 \ ' l I <=Q /=Q
НЕОДНОРОДНЫЕ ИНТЕГРАЛЬНЫЕ УРАВНЕНИЯ 179
Следовательно,
и математическое ожидание этой величины не превосходит
МЕ21Ф1 < 2 Т=Г f • • • К ^ (<?«. • • •> <?,•) '"?о-. .<#,. D4)
Теорема б. ?с/ш траектории Tv строятся с постоянным
поглощением (т. е a(P)==za во всей области G), го
Для доказательства этом теоремы воспользуемся формулами
^43) и D4). Так как s(P)==l—а, то из D3) вытекает, что
^ W = S ~^ f • • • f Г? л, (Qo. • •.. Q{) dQ*.. .^,.
i=0 G G
Положим в D4) /=1—а. Тогда D4) превратится в неравенство
M|2[ij}]^ MJypH» я отсюда сразу вытекает, что D?,[ф] ^D?v[if].
3 а м е ч а н и е. Вообще говоря, ряды D3) и D4) не обязаны
сходиться, и дисперсии могут быть бесконечными. Условия
конечности дисперсий D?|4|;>] и D^v[a|)] приведены в упражнениях 2 и 3.
Теорема 6 показывает, что в конкретном случае постоянного
поглощения оценка C8) для (г!), z) обеспечивает лучшую точность,
чем D1) (при одном и том же количестве траекторий). Впрочем,
оценка D1) все-таки ыонат оказаться менее трудоемкой, чем C8).
Так будет, например, в случае, когда функция f(P) очень сложна
(по сравнению с формулами расчета траекторий), так как для расчета
С|/ф] необходимо вычислять f(Qj) во всех точках траектории 7\>о,
а для расчета CY[4j>] нужно лишь значение f(Qv) в последней точке
траектории Tv •
2.6. Использование сопряженного уравнения.
Нетрудно убедиться, что вместо того, чтобы вычислять
функционал (г|), г) от решения z уравнения
z=Kz+f, D5)
можно решать сопряженную задачу: вычислять
функционал (/, и) от решения и уравнения
и=/С*и-|-ф, D6);
где /С*(Л Р')—К(Р', Р). В самом деле, умножив ска-
лярно D5) на иу а D6) на 2, получим
(и, г) = (и, Кг) + (и, /), (и, г) = (К*и,
12*
180 РЕШЕНИЕ ЛМПГЙИЫХ УРАВНЕНИЙ (ГЛ 5
Так как*) (/С*а, г) = («, /(г), то из этих соотношений
вытекает, что (и, /) = (я|), г).
Уравнения D5) и D6) мы будем называть
сопряженными.
Если плотности р(Р) и р(Р, Р'), по которым
строятся траектории Т^ (п. 2.4), допустимы по отношению к
f(P) и /С*(Я, Р') (соответственно), то, согласно п. 2.4,
можно рассмотреть случайную величину
^i D7)
где веса Wl = 1, Г/ = IF,*., [/С* (Q,-,, Q;)/p (Q/-i,
Нетрудно доказать, что если условия теоремы 4
выполнены, то математическое ожидание ?*[/] равно
ME*[/] = (/, «) = (*, г).
Следовательно, при больших N
2
D8)
где ?*[/]* — это значение ?*[f] на 5-й траектории.
Интересно, что даже в случае уравнения D5) с
симметричным ядром, когда /С*(Я, Р')=К(Р, Р') и W] =
= W'j оценки C6) и D7) представляют собой различные
оценки для функционала (\f>, г):
Очевидно, различие в объеме работы, затрачиваемой
на расчет этих оценок: для расчета ?[if>] надо один
раз вычислить г|)(Р) и много раз f(P)> а для расчета
*) {К*и, г) = J К*и (Р) г(Р) dP = ^ К* (Я, Р') и (Pf) z (P) dP dP' =
= || К (P't Р) г (Р) и (Р') dP dP'= | Кг (Р') и (Pf) dP' = (а, /(г).
Обычно ядро К(Р\ Р) называют транспонированным, а комплексно
сопряженное с ним ядро К(Р', Р) —сопряженным (по отношению к
К IP, Р')). Однако для действительных ядер К(Р', Р)=_К(Р\ Р).
§ 2] НЕОДНОРОДНЫЕ ИНТЕГРАЛЬНЫЕ УРАВНЕНИЯ 181
?*[И —наоборот, один раз вычислить f(P) и много раз
Некоторые задачи сводятся к уравнению D5) с
дельта-функцией: /(Я)=соб(Р—Ро) («источник» расположен в точке Pq и имеет
«интенсивность» с0). В таких задачах величина
? М>] = С0 Ц> (Qo)/P (Qo)l 2 Г ;6 (Qi ~ P0)
для расчета практически бесполезна. В то же время величину
1?[сод(Р~-Ро)] можно с успехом использовать, если положить
р(Р) =б(Р—Ро), т. е. (ср. п. 1.3.1) строить траектории Т^ с
фиксированной начальной точкой Qo — Po. Получим величину
для которой
2.7. Усложненные оценки линейных функционалов от z.
Используя те же траектории Г*, или Tv, можно построить различные
более сложные оценки для функционала (ф, г). Рассмотрим одну из
них, которая фактически означает оценку (г|), Кг) вместо г|>, г).
В самом деле, из B5) следует, что (г|), г) = (г|э, /Сг) + A|), /).
Предположим, что интеграл (tf, f) мы умеем вычислить
аналитически (или численно). Тогда расчет (г|э, Kz) позволит нам найти (ф, z).
В таких задачах, в которых ядро К(Р, Р') мало по абсолютной
величине иг«[, выделение (-ф, f) из (ф, 2) может сыграть роль
выделения главной части и существенно увеличить точность оценки
(*, 2).
Легко указать два способа расчета (гр, Kz). Во-первых, так как
(of», Kz) = (/С*г|?, г), то можно использовать случайные величины
?[/С* ф] или Су[/С*ф]. Во-вторых, так как функция v = Kz
удовлетворяет уравнению
с тем же ядром, что у исходного уравнения ^25), то для расчета
(\J), v) можно использовать величины С [г])] и Cv[i|)] с функцией Kf
вместо /.
В обоих случаях расчетные формулы по сравнению с п. 2 4
усложнятся, так как либо вместо г|?@0) придется вычислять /Сч|>(Уо),
либо вместо / (Qt) придется вычислять Kf (Qc)
*) Встречаются уравнения вида B5), в которых Р и Р'
принадлежат различным пространствам Топа сопряженные уравнения
могут обладать весьма различными свойствами.
182 РЕШЕНИЕ ЛИНЕЙНЫХ УРАВНЕНИЙ [ГЛ 5
Методы Монте-Карло, основанные на использовании случайных
траекторий, были первоначально предназначены для решения
линейных алгебраических систем (см. ниже § 5). Траектории с
поглощением были построены Дж. Форсайтом и Р. Лейблером [121] (по
идег Дж. Неймана и С. Улама), а бесконечные траектории — В.
Вазовым [181]. Начальные и переходные вероятности, аналогичные
C3) и C4), были указаны Дж. Кэртиссом [114]. Обобщения на
случай линейных интегральных уравнений имеются у многих авторов,
начиная с работы Р. Каткоски [116]. О более сложных оценках для
(ф, г) см. [33, 94, 170].
§ 3. Пример: рассеяние частиц
3.1. Основное уравнение теории рассеяния. Методы
Монте-Карло часто используются для расчета различных задач, связанных с
прохождением частиц (нейтронов, гамма-квантов и др.) через
вещество. Мы не будем касаться здесь специальных вопросов, а
рассмотрим лишь общую схему рассеяния, предполагая, что частицы
при столкновении с атомами (точнее, с ядрами атомов) среды могут
либо рассеиваться, либо поглощаться. Обозначим через Я точку
шестимерного фазового пространства координат г и скоростей v
частицы. Обозначим элемент объему dr dv этого пространства
через dP.
Пусть f(P)dP — количество первых столкновений, a z(P)dP —
количество всех столкновений в элементе объема dP около точки Я
(за единицу времени). Функцию f(P) можно явно вычислить, если
задан источник частиц. Функцию г (Я), называемую плотностью
столкновений, требуется найти.
Введем ядро столкновений /Сет (Я', Я), которое определяется
следующим условием: КС?(Р\ P)dP — это вероятность того, что
частица, испытавшая столкновение в точке Я', испытает следующее
столкновение в элементе объема dP около точки Р (за единицу времени).
Конкретный вид ядра столкновений в одногрупповой теории
переноса нейтронов имеется на стр. 223.
Нетрудно составить интегральное уравнение, которому
подчиняется плотность столкновений:
г(Р)= J Кот (Я', P)z(P')dP'+}(P), D9)
ибо столкновение в окрестности точки Р может быть либо первым
столкновением, либо следует за столкновением в окрестности
некоторой точки Я', а количество таких столкновений (за единицу
времени) равно z(P')dP'. Область интегрирования в D9) —¦ все
пространство. Введем сопряженное ядро /С(Я, Я')=/(Ст(Я' Я). Тогда
уравнение D9) совпадает с уравнением B5), а сопряженное
уравнение D6) можно записать в виде
и (Я) = J /Сст(Я, Я') и (П dP' + ф (Я). E0)
В рассматриваемом случае итерации/(Я) —функции /С/(Я),/С2/(Я), ...
имеют простой физический смысл: это плотности вторых, третьих и
т. д. столкновений. И ряд Неймана
§ 3] ПРИМЕР. РАССЕЯНИЕ ЧАСТИЦ 183
о^ачает, что плотность столкновении есть сумма плотностей первых,
вторых и т. д. столкновений.
Обычно требуется вычислить какие-нибудь функционалы вида
(г)?, г). Это можно сделать любым из методов, указанных в § 2.
3.2. Использование истинных траекторий. Нетрудно вычислить
вероятность s(P') того, что частица после столкновения в точке Рг
снова испытает столкновение
s (Р7) == J /CCi (P\ P)dP.
Следовательно, s(P') — это вероятность рассеяния частицы при
столкновении в точке Р', а а(Р') = 1—s(P')—вероятность
поглощения.
Истинными траекториями частиц будут, очевидно, траектории с
поглощением (типа Т v), которые строятся по плотности вероятностей
перехода
Р')=/<СТ(Р, P')/s{P) E1)
с истинной вероятностью поглощения а(Р) = 1—s(P). Плотность E1)
всегда допустима по отношению к ядру сопряженного уравнения
E0); поэтому естественно вместо функционала (t|), z) вычислять
функционал (f, и) (см. п. 2.6).
Запишем случайную величину C9) применительно к уравнению
E0) и функционалу (/, и):
= [/ (Оо)/Р (Qo)l К [Ф (<?v)/
Нетрудно, однако, убедиться, что при каждом i
^. «(«,_,) P(Qy_bQ/)
это — важнейшее следствие закона E1). Таким образом, в
рассматриваемом случае
1С г/] = I/ №„)/р (Qo)l [Ф (Qv)/fl (Qv)l
и М?*[/] = (г|), г). Напомним, что v — это случайный номер
последней точки траектории.
3.3. Использование искусственных траекторий. Из теоремы 6
вытекает, что в некоторых случаях оценка для (г|), г) будет иметь
меньшую дисперсию, если в расчете использовать траекторию без
поглощения (типа G"«>) *).
Пусть плотность вероятностей перехода снова определена
формулой E1). Согласно A7) и п. 3.2 в этом случае
*) Ограничение а(Р)*&а, фигурирующее в теореме б, строго
говоря, справедливо только в бесконечной однородной среде в одно-
групповом приближении.
184 РЕШЕНИЕ ЛИНЕЙНЫХ УРАВНЕНИЙ [ГЛ 5
а величина C6) применительно к уравнению E0) и функционалу
(/, и) равна
И в этом случае М?*[/] = (гр, z).
Вес W. имеет простой физический смысл: это вероятность того,
что частица уцелеет (т. е. не поглотится) после столкновений в
точках Qo, Qi,..., Q,--i.
3.4. Существенная выборка. Рекомендации C3) и C4),
обеспечивающие при ср(Р)=ы(Р):^0 минимальные дисперсии оценок Djt
в случае уравнения E0) принимают вид
)и(Р) Ксг(Р,П
. и) • Р(Р>Р>- Ксти(Р)
Так как f(P)^O (по физическому смыслу), то здесьбу = 0. Стоит
подчеркнуть, что в эти формулы входит не решение z(P) уравнения
рассеяния, а решение и(Р) сопряженного уравнения.
Конечно, можно обеспечить малые дисперсии, также используя
правила C3) и C4) применительно к уравнению D9) с ядром
К(Р, Р')~Кст(Р\ Р). Однако построение траекторий с плотностью
переходов E1) делает метод расчета физически более наглядным и
легче контролируемым.
3.5. Рассеяние в области G. Часто встречаются задачи, в
которых существенно только рассеяние внутри заданной области G:
частица, вылетевшая из G, исключается из рассмотрения. Все
изложенные выше методы применимы и к таким задачам, при расчете
которых можно считать, что все пространство вне области G заполнено
поглощающим веществом: если /ССт(Р'. Р) =0 при Р'(? (?, то s(P')^0
()\ при $
Однако, так как нас интересуют значения z(P) только внутри
G, то вместо уравнения D9) можно решать уравнение
г (Р) = J /Сст (Р', Р) г (Р') dP' + / (Р), E2)
G
где P^G. Естественно ожидать, что, применяя методы § 2 к
последнему уравнению, можно получить лучшую точность, чем при
решении уравнения D9) во всем пространстве (ср. гл. 3, п. 3.1.2). Любые
траектории в этом случае не будут истинными траекториями.
В практических расчетах часто используют оценки 1* [/] и
C*[f], а плотность р(Ру Р') выбирают пропорциональной /Сст(Р, Рг).
Некоторые методы решения уравнений D9) и E2) для нейтронов в
одногрупповом приближении имеются в гл 6, § 4).
Литература к § 3: [8, 25, 33, 36, 50, 51, 53, 59, 93, 105, 127,
144, 145, 153, 168].
§ 4] ОДНОРОДНЫЕ ИНТЕГРАЛЬНЫЕ УРАВНЕНИЯ 185
§ 4. Однородные интегральные уравнения
4.1. Расчет первого собственного значения и первой
собственной функции. Рассмотрим интегральное
уравнение
где К — действительный параметр. Это же уравнение с
учетом A) можно записать в виде
г=Ш. E3)
Если при некотором X уравнение E3) имеет решение
г(Р)Ф0, то это значение К называется собственным
значением уравнения*) E3), a z(P) —собственной
функцией, соответствующей этому собственному значению К.
Собственные функции будем считать нормированными
так, что (г, г) s=l.
Предположим, что наименьшее по абсолютной
величине собственное значение уравнения E3)
положительно A,i>0, и соответствующая собственная функция
z{(P)>0 внутри G.
При весьма широких предположениях относительно
ядра /С(Р, Pf) для приближенного расчета Х\ и Z\(P)
можно воспользоваться методом Келлога [10, 63]:
каковы бы ни были положительные внутри G функции
ф(Р) и i|?(P), отношения (-ф, /С'ф): (ф, /С1+1ф)
стремятся к hi
а нормированные итерации ф в каждой точке стремятся
к собственной функции
lim tf'q> (Р) (Я'ф, Я'ф)-1'* = г± (Р).
i
Расчет величин (-ф, К{у) и К*<р(Р) можно
осуществлять методами Монте-Карло, рассмотренными в § 1.
Заметим, что траектории Г< а позволяют одновременно
вычислить все (ф, JSftp) и Kjy{P) при /=0, 1, .••, и
¦) Собственным значением оператора К называют обратную
величину: 1Д.
186 РЕШЕНИЕ ЛИНЕЙНЫХ УРАВНЕНИЙ [ГЛ 5
Скалярным произведением (/Сер, /С?ср) на практике
пользуются редко: по значениям /0'ф (Я) можно получить
приближенный рельеф функции zx(P), а нормировку
осуществить отдельно.
Все вышеупомянутые предположения выполнены,
например, в случае, когда ядро К(Р> Р') симметрично
К(Р\ Р)=К(Р, Pf) и положительно определено: (/Сф,
ф)>0 при ср^О (конечно, предполагается также, что
(P)L(G) K(P P')L(GXG) и 4>(P)e=L2(G)),
Для того чтобы пояснить сущность метода Келлога, рассмотрим
случай (весьма важный), когда все собственные значения уравнения
E3) суть
а соответствующие им собственные функции Z\(P)>0, ^()
образуют полную ортонормнрованную систему (гь гт) = 6у-т (символ
Кронексра). Пусть неотрицательная функция ср(Р) равна
где, очевидно, 6j == (ф, г0>0. Из этого разложения следует, что
Запишем скалярные произведения, фигурирующие в методе Келлога:
til \l ' /71/» ' ' ' ^
и выделим главные члены в интересующих нас величинах:
/71G1
т=1 т—1
Отсюда видно, что сходимость будет хорошей, если >-i<X2, и
плохой, если Хг близко к К\. Положительность ty(P), вообще говоря, не
нужна: нужно лишь, чтобы (г|), 2\)Ф0.
Заметим, что если выбрать ф(Я) так, что &i = ((p, 2i)=0, но
( )?0 то
Х81 /СЧ (Р) (/С;Ф, /C^)""l/2 - *2 (Я).
§ 41 ОДНОРОДНЫЕ ИНТЕГРАЛЬНЫЕ УРАВНЕНИЯ 187
4.2. Метод существенной выборки для траекторий 7\.
Предположим, что К(Р, Р')&?0 и ф(Р)^0. Интеграл
= J ...
G
можно вычислить методом п. 3.2 гл. 3 с помощью
любой допустимой плотности р(Ро, ..., Pi) в СгХ--Х^.
Из теоремы 3 гл. 3 следует, что если выбрать плотность
р Н ¦ (*\>) I * (Ро, Pi) - * {Pi-u Pi) Ф (Р,)/(М,
то дисперсия будет минимальной, и равна она
при знакопостоянной функции ij)(P) минимум этот Ь<=0.
Легко убедиться в том, что плотности /? отвечают
траектории (Qo->Qi-^.. • ->Q<)c вероятностями
перехода, зависящими от номера точки. Это следует из
представления р в виде произведения условных плотностей
Однако здесь, как и в п. 2.3, законы построения
траекторий C3) и C4) обеспечивают минимальность
дисперсий, если ф(Р) пропорциональна Z\(P).
Теорема 7. Предположим, что ядро уравнения E3)
и первая собственная функция гг(Р) неотрицательны
K{P,P')>0, 2i(P)>0f
а траектории Tt строятся по законам C3) и C4);
% ф)
ф(Р)=^1(Р), с^О, го я/?м каждом г дисперсия
Доказательство. Если ф=сгь то /Сф =
Г
188
РЕШЕНИЕ ЛИНЕЙНЫХ УРАВНЕНИИ
[ГЛ 5
Тогда плотность C) траекторий Т{ равна
№(РоIф(Ро)
~ (Ж. Ф)
№(P0)|/f(P0.
А так как /(Чр=А, /ф, то нетрудно проверить, что
плотность р также равна этому выражению.
4.3. О других методах расчета Х\ и 2i(P). Большинство методов
для приближенного расчета Х\ (метод Ритца, метод моментов и др.
[63, 60]) так или иначе требует вычисления некоторых интегралов.
Если эти интегралы достаточно сложные, то может оказаться
целесообразным применение методов Монте-Карло. Рассмотрим схему
одного из таких методов, который использовался в [14] для оценки
эффективного коэффициента размножения нейтронов в реакторе.
Допустим, что мы можем указать несколько ортонормированных
функций il?i(P), . . . ,^m (P) так, что первая собственная функция
2i(P) уравнения E3) достаточно хорошо аппроксимируется их
линейной комбинацией
'г(Р)-
2
• 1
Вычислим (методом Монте-Карло) интегралы
и составим линейную алгебраическую систему уравнений с
неизвестными си . . . , ст:
m
^i == ~J bjiCj* ^==1>2, ...,/72.
/==1
Решать эту систему можно методами высшей алгебры. Если jll === jjti —=
наибольший корень характеристического уравнения
—М-
ипг\
Ьпг2
= 0,
а си . . . ¦
ванное так,
b\m b2m ••• bmm—
cm — соответствующее ему решение системы, нормиро-
... +
= 1, то
S
§ 4] ОДНОРОДНЫЕ ИНТЕГРАЛЬНЫЕ УРАВНЕНИЯ 189
Идею метода легко объяснить следующим образом. Пусть
ipi(^), .... \рт (Р), • • .— полная система ортонормированных
функций из L2(G). Разложим в ряды по системе {i|?t.} искомую
функцию г (Я) и итерированные функции /<% (Р):
оо
г(Р)=2 efo(P). где С/=(г.^),
Щ (Р) = ? ЬцУ, (Р), где ь„ )
Подставим эти выражения в уравнение E3): с одной стороны,
/=1 1=1 /=1
а с другой
Приравнивая коэффициенты при ty{ (P), получим бесконечную
линейную систему уравнений для нахождения величин с\% ...
¦ «• > сщу ••• » эквивалентную уравнению E3),
оо
л v^i i, « / 19
/=1
Если в этой системе пренебречь величинами ?m_j_i» ?m_f-2* •••¦ то
придем к конечной системе, выписанной выше.
4.4. Пример: интегральное уравнение Пайерлса. Нахождение
критических параметров ядерного реактора в простейших случаях (в
одногрупповом приближении) сводится к вычислению первого
собственного значения %\ интегрального уравнения
E4)
*(Р')е
которое называется уравнением Пайерлса [25, 51]. Здесь б?0 —
трехмерная область (объем реактора), в которой происходит диффузия
нейтронов, а(Р) и Р(Р)—заданные положительные функции*), ин-
*) Они выражаются через нейтронные сечения (см. стр. 47) и
среднее число v нейтронов деления: a(P)=2. P(P) =2S+v2^.
См. также упражнение 5 гл. 6.
190
РЕШЕНИЕ ЛИНЕЙНЫХ УРАВНЕНИЙ
{ГЛ. б
теграл в показателе берегся по отрезку прямой, соединяющей точки
Р и Р' и равен
Р' \Р—р'\
Р О
где о)= (Р/—Р)/\Р/—Р\ —единичной вектор.
Если Я#1>1, то область Go подкрптическая, если %\<\, то
область Go надкритическая. Область будет критической при К\=\\ в
этом случае собственная функция п{{Р) равна плотности нейтронов.
Ядро уравнения E4) не симметрично, но симметризуемо и ил!е-
ет слабую особенность. В. С. Владимиров [10] исследовал
сходимость метода Келлога для уравнений такого типа и методы Монте-
Карло для расчета приближений. Оказалось, что метод п. 4.1
полностью применим для решения уравнения E4), а если выбрать г|; =
~), то приближения л@ __ /^ (г 0кА/(К*^(пАН)
монотонно убывают;
Расчеты )ч и ?h(P) этим методом
были осуществлены'в [13, 76].
4.4.1. Численный пример
[13, 82]. Пусть Go — однородный шар
радиуса #=1 и «?==1,279, Р^/га, где
/7=1,724.
Выберем rp(P)s==l и ij)(P)s=:jl
Плотность начальной точки Qo
зададим формулой р= Bл/?г0)", где г0 —
расстояние Qo от центра шара.
Плотность вероятностей перехода р(Р, Р')
из точки Р в точку Р7 выберем так,
тпобы в знаменателе стояла величина
\Р—Р'\2 (ср. гл 3, п. 3.2.3). Для этого воспользуемся сферическими
координатами (р, ф, 6) с центром в точке Р (рис. 51). Пусть
Рис
р (Р, Р') = ае~а0 [4лр2Р (Р, со!
1—1
где F(P, со) = 1—ехр(—а/), а / — расстояние PL по направлению со
от точки Р до границы шара. Нетрудно проверить, что
4ш'(Р, со)
4я
так что р(Р, Р') действительно есть условная плотность вероятностей.
Выведем формулы для расчета траектории 7",-. Расстояние от
начальной точки Qo до центра шара вычисляется по формуле го=/?У~у1
Две другие координаты можно не разыгрывать из-за симметрии
задачи Направление случайного луча P'—Qi + pcot- из точки Q{ on-
ределяется величинами
= cos 0i и
Первую из них можно вы-
§ 4] ОДНОРОДНЫЕ ИНТЕГРАЛЬНЫЕ УРАВНЕНИЯ 191
числять по формуле f-i; =2у—1, а вторую (из соображений
симметрии) можно полагать равной нулю ф; =0. Расстояние от точки Qt-
по направлению coi до границы шара равно
где г{ — расстояние от Qt до центра шяра. Если обозначить F{ __.
= f (Qp ©<)• то' очевидно, F, = 1 - exp (- а/,). для определения
случайного расстояния pt- = |Qt-_j.i — Q,|» получаем уравнение
J ae-a*ds=*yFlt
о
откуда следует, что pt- = — (I/a) In A —y ^i)- Вычислив точку Q^^
= Qt -\- p^, можем найти расстояние от нее до центра шара
Так как ф(Р)^1, ф(Я)з=р, то (по формуле F)) нужная нам
величина равна 0t- = ОДР] =2лр/?г01Г/. Так как из E) следует, что
U7i = U^t-_1/t/r^_1> а U^os=l. то легко получить рекуррентную формулу
для расчета непосредственно G/:
Полный набор расчетных формул.
1) Начальная точка траектории:
2) Звено номер /+1 (/ = 0, 1 i'-l):
F, = 1 -e~a//; p, = - (I/a) In A - ?2/+з/:';);
еж - bfiFfl r/+1 =
3) Если 0ys —значение 0y, полученное при расчете траектории
номер st то нужные нам скалярные произведения (/О7'1, Р)
приближенно равны
-2
s=l
оооооо
to н*» о о to cd
to cd «<i оо оо со
tO CD >?n О Сл CD
ОООО ОС
ооо^мс
-J CD Н* CO CO С
rfs-<l 00 to О s
оооооо
О О О I-* tO CD
?* О -J h&n CO CD
СЛ СО О й^ 00 СО
>О ОО
;>ь^ СО CD
I-S* О ^ t"^ •"** Н-Ь.
оЪЪЪоо
О СО О и« СО CD
to оо со ^ о ^д
tO -q СП tO LO I-*-
СО О С> О5 <О |О
tO tO 00 h^ О •<!
^^ ^^ ^5 ^^ О> !О
^^ ^^ ^^ ь^ СО CD
ь*» кЬ> 00 Ф4» О ""^
СП СО СО CD СЛ Ю
ооо
ооооо
ooo^w
- WC5
t^ i^» 00 СЛ О --Э
СЛ СО 00 О С5 CO
со
CD СЛ 45ч СО tO н* О
j<i oojx> 00J30 оо jo
tO JN СО Н»- О 00 СО
1>О СО СП О IN5 О СЛ
00 00 00 00 00 00 CO
00 00 00 00 00 00 CD
H*» tolsS toTpN^Gt'lO
i4>» О Сл <*J О Сл to
?» i^s CO t^. 00 tND CO
•^ tO CD O5 OS 00 rfS
оо оороро оо оо со
h*. to DO tO 4S O5 to
oo to to оо о сл со
СЭ СО CD JN СО СО tO
СЛ CD CO О ОО СО
00 00 00 00 СО 00 СО
? ? СО СО СП СО
О5 CD О СО СО СО 4>»
•-J *J СО —Л СО СП CD
00 00 00 00 00 00 СО
!-*¦ tO tO DO кР4 CD Ю
со ^ о со о сл со
*»4 СП н&> tO О СО ^йч
^1 tts СЛ СО tO CD CD
00 00 00 00 00 00 СО
^ н». tolo CO CD Ю
CD 00 О —4 СО СЛ СО
СЛ СЛ 00 *<1 00 СО СП
00 00 О О СО СЛ 0>*
00 00 00 00 00 СО СО
^lotoco cIo
CD О *<1 СО СП СО
СЛ «J *J О» <l OJ СП
CD СО СО *-*> 1М> *> ь*.
СП
СЛ
CD С
СО 00 00 00 00 00 СО
и1 ьэсо оь1о
to on со-<i со сл со
СО tO СП tO CD СО СП
•<! Н»- (-*. i^. и*. О rfN
00 OO 00 00 00 00 СО
СП СЛ С?> -J СО СП СО
4г* ^Л CD CO -J СО СЛ
СО СС СО Ю О СО гР'
00 00 00 00 00 00 СО
н^. ь^ to Ю СО CD ГО
От CD О -J СО СЛ СО
!О Ct О J^CD СО СП
о ^ со со оо ь^ со
to
0J
U J]
хиниэнии* зинзииа
561
§ 51 РЕШЕНИЕ ЛИНЕЙНЫХ АЛГЕБРАИЧЕСКИХ СИСТЕМ 193
В табл 1 приведены значения (/(Л, fi)N, полученные при
расчете по этим формулам, а в табл. 2 — соответствующие отношения
При расчете этого же примера методом характеристик *) получено
значение Х{ = 1,000.
В ходе расчета были сосчитаны дисперсии Dfy, которые при
/=0, 1, ... , 6 равны соответственно 10,7; 21,9; 37,5; 57,3; "<¦ 81,1;
110,9; 147,0. Если по этим дисперсиям вычислить вероятные ошибки
величин (/^1, р)^, например, при Af=210, то получим значения rl024=;
= 0,07; 0,10; 0,13; 0,17; 0,19; 0,22; 0,26 Нетрудно заметить, что
погрешности соответствующих величин (/С;1, Р)#при ЛГ = 210 в табл. 1
на порядок меньше, чем г1024 (если судить по изменениям этих
величин с ростом /V). Это вызвано тем, что пример считался с
помощью детерминированных псевдослучайных точек, о которых речь
пойдет в гл. 7.
§ 5. Решение линейных алгебраических систем
5.1. Алгебраическая система как частный случай
интегрального уравнения. Рассмотрим линейную
алгебраическую систему, состоящую из т уравнений с т
неизвестными гь ..., zm:
т
г* = 2 ЯоФ*р + /а, 1 < а < т, E5)
которую сокращенно будем записывать как
z=Az+f. E6)
Запись E6) можно считать одним векторным
уравнением, где 2= BЬ . *., zm) и /= (fи ..., fm) — m-мерные
векторы, А = (аар) —квадратная матрица размера mYjn
(которая определяет линейное преобразование в
пространстве векторов):
Скалярное произведение векторов будем по-прежнему
¦) Метод характеристик [11] позволяет находить решения ураз-
нения E4) с большой точностью, но практически применим только
в случае достаточно простой «геометрии» области Go.
13 И. м. Соболь
194 РЕШЕНИЕ ЛИНЕЙНЫХ УРАВНЕНИЙ [ГЛ 5
обозначать скобкой
(/, г) = S /ага.
Рассмотрим интегральное уравнение вида B5)
г (*) = J /С (*, *') г (д/) dx' + /(*), E7)
с
где в качестве G выберем отрезок оси абсцисс
Обозначим через Ga отрезки a—l^x<a, так что
I
О / 2 т-1 гп z>
п
/>
Рис. 52.
G = Gi^\-... -\-Grn (рис. 52). В качестве свободного
члена и ядра уравнения E7) выберем кусочно постоянные
функции
f (л-) =fa при хе
К(ху х') =а«р при
Для такого уравнения при x^Ga
Z (X) = 5 J К (*, /) 2 (Л'О б/У + /а = 2 ^аР I г (Л'') ^ + /а.
И так как последнее выражение от х- не зависит, то
решение г(х) постоянно в Ga.
Обозначив
г(х)\с = 2а E81
сможем переписать последнее уравнение как
Следовательно, решение г(х) уравнения E7)
представляет собой функцию, постоянную в каждом из Ga,
значения га которой на этих отрезках удовлетворяют
§ 51 РЕШЕНИЕ ЛИНЕЙНЫХ АЛГЕБРАИЧЕСКИХ СИСТЕМ 195
алгебраической системе E5). Обратно, если (ги ..*
..., гт) — решение системы E5), то формула E8)
определяет решение уравнения E7).
5.2. Случайная цепь для решения алгебраической
системы. Очевидно, все методы Монте-Карло, приведенные
в § 2, применимы для оценки решений уравнения E7)
и дают нам возможность оценить решение системы E5).
Однако специфика уравнения E7) позволяет упростить
эти методы и дать им иную интерпретацию.
Так как /(х), К(х, х') и z(x) постоянны при x^Ga,
x'eGp, то естественно выбирать плотности р(х) и
р(х, х') также постоянными
р(х)=ра при
р(х, x')=pa0 при *<=Ga, *'<=Gj3. E9)
Величины ра и /?«р, очевидно, должны быть
неотрицательными и удовлетворять условиям нормировки
т т
2 Ра = 1, 2 Ра* = 1. F0)
Правила E9) можно интерпретировать как
равномерное распределение случайной точки внутри
соответственно Ga или Gp. Можно, однако, совсем отказаться
от фиксации положения этой точки и говорить только
об отрезке, в котором эта точка расположена. Тогда
Ра — это вероятность того, что начальная точка
траектории попадет в Ga, а /?«э— вероятность того, что
случайная точка из Ga перейдет в Gp. При такой
интерпретации вместо траектории 7\ случайной точки достаточно
рассмотреть последовательность случайных номеров
ko-^ki ->... -*~ku F!)
тех отрезков Ga, в которые эта точка попадет.
Итак, для решения системы E5) мы будем строить
цепь случайных номеров F-1), каждый из которых
может принимать значения 1, 2, ¦.., т. Правила
построения цепи F1):
F2)
где начальные вероятности ра и вероятности переходов
Pap должны удовлетворять условиям нормировки F0).
13*
196 РЕШЕНИЕ ЛИНЕЙНЫХ УРАВНЕНИЯ (ГЛ 5
В теории вероятностей такие цепи называются цепями
Маркова с конечным числом т состояний [71]. Веса W}
вдаль цепи F1) вычисляются по формуле
Wf = ^-' F3)
Pk?xpktkt • • • Pkj_^j
или по рекуррентной формуле
Формулы эти — следствие D) и E).
Условимся говорить, что распределение вероятностей
(Ри • • • > Рш) допустимо по отношению к вектору
^=(-фь..., фда), если для тех а, для которых -фа^О,
значение ра>0. Аналогично распределение (/?ар)
допустимо по отношению к матрице Л=(аар), если рар>0
для тех пар (а, 0), для которых аар?=0.
Как известно, из теории матриц, для того чтобы
со
ряд S ^/ сходился для любого вектора /, необходимо
/=о
и достаточно, чтобы все собственные значения fi=jia
матрицы Л, представляющие собой корни уравнения
det |аар~-|1баз| =0, лежали внутри единичного круга (на
комплексной плоскости): ||да|<1 при а=1, 2, ..., т.
Достаточным условием может служить неравенство
т т
2 a?i<C 1 или неравенство max 2 К/1 < 1«
i,/=0 1<г</п/=1
СфорлМулируем для системы E5) теорему,
вытекающую из теоремы 4 (§2). Пусть бесконечная цепь
ko ~> k\ ->... ~> ^i ->•...
строится по правилам F2), где ра и ра$ допустимы по
отношению к if» и (аар) соответственно, и рассмотрим
случайную величину
Ш = (^роД^//*,, F4)
Теорема 8. Если все собственные значения \ia
матрицы (|яар|) по абсолютной величине меньше единицы,
то математическое ожидание случайной величины ?[г|з]
равно
= (¦, г). F5)
§ 5] РЕШЕНИЕ ЛИНЕЙНЫХ АЛГЕБРАИЧЕСКИХ СИСТЕМ 197
Повторим доказательство со стр. 177 применительно к
рассматриваемому случаю. Так как
то, принимая во внимание F3), получим, что
—° Wjfk | = У\ tytQat t ... at.
Затем
во оо
причем существование этого математического ожидания
обеспечивается условиями теоремы
Если какие-нибудь из элементов матрицы (йа$)
равны нулю, то обычно целесообразно выбрать
соответствующие вероятности перехода /?ар = 0 (ср. п. 3.2.1 гл. 3).
В противном случае, если в цепи окажется переход
^„i-^&j, которому отвечает рь. fe.^>0 и аь ь. = 0,
то из F3) видно, что все Wj— Wj+\= . #. =0; можно
считать, что цепь, попав в kjf останавливается: любые
дальнейшие переходы ^->^+1-»-... значения величины
" _ ~ не изменят.
Если матрица А содержит целую строку из нулей:
аа1 = аа2=... =аат=0, то, конечно, нельзя все
соответствующие вероятности выбрать нулевыми: это
противоречило бы условию F0). Тогда можно положить
раа=1, раР=0 при р=7^а, так что ра3=бар.
5.3. Вычисление одной компоненты решения. Иногда
встречаются задач и, сводящиеся к системе E5), где,
однако, нас интересует не все решение z=(zu ..., гте),
а только одна из неизвестных, например zr. Методы
Монте-Карло позволяют приближенно оценить одну эту
компоненту. Для этого достаточно в качестве ф выбрать
единичный вектор е(г)= @,..., 0, 1, 0,..., 0), в
котором лишь на г-м месте стоит 1. Тогда скалярное
произведение равно
В качестве начальных вероятностей можно выбрать
ра= е{и или, другими словами, начинать цепь с ko=r.
198 РЕШЕНИЕ ЛИНЕЙНЫХ УРАВНЕНИЙ И'Л 5
Итак, строим цепи r-*k{-*k2->... г>&»-> ...,
вычисляем вдоль цепей веса
wm.-«*,-,», 66
и случайные величины
2 F7)
Если количество цепей N достаточно велико, то
где ? [eir)}9 — значение ?[е(г)], полученной на 5-й цепи.
5.4. Обращение матрицы. Пусть задана квадратная
матрица ?=(йар), 1^а> р^т. Требуется вычислить
элементы обратной матрицы С—(са$),
удовлетворяющей соотношению ВС=Е, где Е — единичная матрица:
/1 0 ... 0V
^ = 10 1 ... О
\0 О ... 1
Если все собственные значения fia матрицы В
удовлетворяют условию
|l
то задача эта может быть решена методом последо!за-
тельных приближений*). В самом деле, обозначим через
А матрицу
А =Е—В. F8)
Легко проверить, что собственные значения матрицы А
равны 1—[ха и, следовательно, по абсолютной величине
меньше единицы. В силу этого сходится ряд
со
С=У\А*
*) Более общий случай см. упражнение 6 стр. 209.
**) Для запоминания можно заметить, что ряд (? —/4)"~!
СО ОО
2^* аналогичен геометрической прогрессии (I—^)~1=2 ^ *
§ !5| РЕШЕНИЕ ЛИНЕЙНЫХ АЛГЕБРАИЧЕСКИХ СИСТЕМ 109
Докажем, что если матрица А удовлетворяет
условиям теоремы 8, то для того, чтобы вычислить элемент
Сгт матрицы С, можно использовать цепи п. 5.3; надо
лишь, кроме if»=e(r), выбрать еще f=e{r'\
В самом деле, мы видели, что М?[е(г)]=2г, где
zr—r-я компонента решения уравнения E6). Однако это
решение равно
:гак что его r-я компонента есть
m
zr = 2л
а=1
В частном случае, когда f=^(r), получим, что zr= crr*%
что и требовалось доказать.
Подставив в F7) вместо / вектор е{г), получим
соответствующий этому случаю метод Монте-Карло: при
достаточно большом А'
F9)
здесь снова s — номер цепи, а сумма с условием
(i| &,=/-') означает, что суммируются только те Wu для
которых номер &*=г\
5.4.1. Численный пример: найти матрицу С, обратную
к матрице
/1/2 О
В=( —2 1/2 0 |.
V-1 О
собственные значения которой, очевидно, равны p,i = ^i2== 1/2,
Сперва по формуле F8) вычислим матрицу
РЕШЕНИЕ ЛИНЕЙНЫХ УРАВНЕНИЙ
(ГЛ 5
Затем выберем матрицу вероятностей перехода, допустимую по
отношению к матрице Л, например:
П 0 0\
I О О
G0)
1) Чтобы оценить элементы Си, С\2 и С]з, надо строить цепи,
начинающиеся с ?0 —г=1 Так как в первой строке матрицы G0) лишь
О, то uce цепи окажутся одинаковыми:
Веса вдоль такой цепи меняются на множитель
Осреднение в F9) не нужно, достаточно одной цепи для получения
точного результата
— 1 1 ,
= 0.
2) Столь же просто оцениваются элементы с31, сЪ1 и с&\ цепь
начинается с feo=/'=3; так как в третьей строке матрицы G0) лишь
один ненулевой элемент Рз1 = 1, то А:1 = 1, далее ^2=lt ^з=1, . . .
Итак, все цепи будут одинаковыми
а соответствующие веса (с учетом того, что fl3i/p3i = l) равны
Поэтому
1 1
3) И только для вычисления с2ь с2г и с2з нужно действительно
строить случайные цепи, начинающиеся с ko — r=2t и производить
расчеты. Впрочем, в этом случае различные типы цепей легко
классифицируются, ибо во второй строке матрицы G0) лишь p2i и р22
отличны от нуля.
§ 5] РЕШЕНИЕ ЛИНЕЙНЫХ АЛГЕБРАИЧЕСКИХ СИСТЕМ 201
Цепь, начало которой kQ = 2, может несколько раз оставаться в
kl—k2 = . . •=^ =2. Но если окажется, что ^^_|_i =1» то дальше
уже все kt+x = k^—. . .= 1. Следовательно, общий вид такой
цепи @</<оо)
Соответствующие такой цепи веса легко вычислить: так как
Интересующие нас суммы весов вдоль такой цепи равны
, 2 ^ = 4 + 2+1+1/2+. . .-8,
Из этих соотношений сразу следует, что c2i = 8, с2з = 0.
Оставшийся элемент С22 можно вычислить аналитически, если
записать, что вероятность получить цепь G1) равна (см', начало
стр. 39)
и вместо формулы F9) воспользоваться точным выражением для
математического ожидания
Итак, обратная матрица С равна
/2 0 0\
С =8 2 0 .
V2 0 1/
Конечно, в общем случае (когда в матрице Л много ненулевых
элементов) разнообразие цепей столь велико, что заменить формулу
F9) аналитическим расчетом невозможно. Заметим также, что "по
цепям, начинающимся с ?0=г, можно одновременно вычислять все
err' с г'=1, 2, . . . , /п, ибо каждое №,• входит в сумму 2
(</^
при одном и только одном г'.
5.5. Решение дифференциальных уравнений
Лапласа и Пуассона. В ограниченной связной области G
плоскости х7 у с простой границей G0 рассмотрим
202
РЕШЕНИЕ ЛИНЕЙНЫХ УРАВНЕНИЙ
[ГЛ. 5
дифференциальное уравнение с частными производными
д2и/дх2+д2и/ду2=Р(х9 у),
G2)
где и=и(х, у) —искомая функция. Уравнение G2) при
F(x, */)=0 называется уравнениел1 Лапласа, а при
F(x, у)Ф0—уравнением Пуассона.
Предположим, что на границе G0 задана некоторая
функция g(x9 у) (часто пишут ?(S), где S — длина дуги
границы, отсчитываемая от какой-нибудь
фиксированной точки). Требуется
найти такое решение
и(х> У) уравнения G2),
которое на границе
совпадает с g(x, у):
и(х, у) Go=g. G3I
Задачу об отыскании
решения уравнения G2),
удовлетворяющего гра-
ZT ничному условию G3),
называют задачей Дирихле,
Для приближенного
решения этой задачи [63,
88] выбирают на
плоскости достаточно мелкую
квадратную сетку с
шагом h (рис. 53).
Координаты узлов этой сетки
пусть будут Xj=jh9 yi=lh9 а значения u(xh yi) и
F(xj> Уд Для краткости обозначим ujtl и Fitl. Узел (/, /)
называют внутренним, если и он, и все четыре соседних
с ним узла (/—1, /), (/+1, /), (/, /—1), (/, /+1)
принадлежат G-|-G°, в противном случае узел (/, /),
принадлежащей G+G0, называют граничным.
Во внутреннем узле (xh yt) уравнение G2)
заменяется разностным уравнейнем
-<> -1};щя!рё.'!!?цй узел
' -граничный узел
I 1 1 П"ГГ
Рис. 53.
которое можно переписать в виде
%1 = A/4) (ини+ uj+ul + ui^_
G4)
§ 5] РЕШЕНИЕ ЛИНЕЙНЫХ АЛГЕБРАИЧЕСКИХ СИСТЕМ 203
В граничных узлах полагают
Ui,i = gj,i. G5)
(Значения gj9l «сносят» с ближайших точек границы G0.)
Решение алгебраической системы G4)— G5) при й->0
приближается к решению задачи Дирихле для
уравнения G2).
Если перенумеровать все узлы, принадлежащие
G-\~G° (в произвольном порядке), и переписать в том же
порядке уравнения G4) и G5), то получим систему
вида E5)
т
Ua = 2 ОарИр + /а, а = 1,2,. . . ,/ГС
1
(т — количество узлов), с весьма своеобразной
матрицей А: внутреннему узлу с номером а отвечает строка
аа\>..., пат, в которой 4 элемента равны 1/4, а
остальные— нули; граничному узлу с номером а отвечает
строка aai = aa2= ••• =tfam=0; все диагональные элементы
aaa=0. (Можно доказать, что все собственные значения
такой матрицы по абсолютной величине меньше
единицы.) Свободные члены этой системы равны /а=
= — (\/4)h2Fa, если узел номер а внутренний, и /a=ga»
если узел номер а граничный.
Воспользуемся методом п. 5.3. и построим метод
Монте-Карло для расчета иТ — значения решения в одном
(заранее заданном) узле. Выберем матрицу переходов
(аа$, если узел номер а внутренний,
= {
j3, если узел номер а граничный
[(баз — символ Кронекера: 6aa=l, 6ар=0 при $
Процесс построения цепи по такому закону
оказывается очень наглядным: 1) начинаем с йо—/*; 2) если узел
ki внутренний, то с одинаковой вероятностью lU
выбираем в качестве ki+\ номер одного из соседних с ним узлов;
3) если узел kx граничный, то цепь останавливается:
Расчет весов W{ вдоль такой цепи также
чрезвычайно прост: пока цепь не попала на границу lFo=U^i=f..
м.= ^=1; далее Я7<+1 = 117<+2 = ... =0.
РЕШЕНИЕ ЛИНЕЙНЫХ УРАВНЕНИЙ
[ГЛ 5
Поэтому случайная величина F7) оказывается равной
где ki — номер первого выхода цепи на границу. В G6)
все ffe0,. •., fk.__ вычисляются по формуле /а=—¦
— (\/4)h2Fa и лишь последнее fh. равно значению gh?-
Замечание. Если вместо граничных условий G3)'
заданы более сложные условия, например:
[с\и~\-С2(ди/дх) +с3 (du/dy)]Go=gn
та уравнения G5) наряду с щ, t будут содержать также
значения иа в некоторых соседних узлах. И случайная
цепь, попав на границу, останавливаться не будет.
Пример. Пусть и(х% у) —• решение уравнения Лапласа
(д2и/дх2) + (д2и!Aу2) = 0 в единичном квадрате O^x^l, 0^#
удовлетворяющее граничным условиям и{х, 0)=0, w@, у)
u(xt l)s=.v, мA, у)=у Вычислить значение и A/2, 1/2).
0,
Рис. 54.
Выберем в квадрате сетку с шагом 6=1/4 и перенумеруем
узлы так, как это указано на рис. 54. Для уравнения Лапласа
формула G6) еще более упрощается: C=gfe^, так что С равно значению g
в том узле, в котором цепь попадает на границу. Возле каждого
граничного узла на рис. 54 проставлено значение g для нашего
примера. <
РЕШЕНИЕ ЛИНЕЙНЫХ АЛГЕБРАИЧЕСКИХ СИСТЕМ
205
Для построения цепей воспользуемся таблицей случайных цифр,
приведенной на стр. 295Ч Если случайная цифра е окажется 0 или 4,
то будем перемещаться в соседний узел справа; если е равно I или 5,
то будем перемещаться влево; если 8 равно 2 или 6, то
перемещаемся вверх; если е равно 3 или 7, то перемещаемся вниз; значения
е, равные 8 или 9, опускаем.
Таблица 3
6 5 1
13—18—17—16
6 6
13—18—23
5 0 7 5 6 6 1
- - 1 - Т Т -
13—12—13—8—7—12—17—16
4 3 4
13—14—0-^10
2 3 3 2 4 3 7
л Т Ф 1 t -* 1 1
13—18-13—8—13—14—9—4
16 0 3 3 3
<- t •+ \ 1 1
13—12—17—18—i3—8—3
4 5 5 5
13—14—13—12—11
5 6 5
13-12-17—16
7 5 7
13—8—7—2
5 5
13—12—11
5 1
13—12—11
0 2 6
-* t t
13—14—19—24
4 2 5 0 2
13—14—10—18—19—24
3 7
4- 1
13—18—3
5 1
13—12—11
2 2
t t
13—is—23
В табл. З приведены 16 случайных цепей. В первой строке
записаны использованные случайные цифры, во второй — схематически
указано направление перемещения, а в третьей — сама цепь
(номера fe/). Соответствующие этим цепям значения С равны 0, 0, 0, 1/2,
1/-1, 0, 0, 0, 0, 3/4, 0, 3/4, 1/2, 0, 0, 0. Среднее арифметическое этих
величин дает нам приближенное значение решения в точке A/2, 1/2):
Из эмпирической оценки дисперсии
1 16 1
°?«"иг 2 ?? - 15ТТ6
Т
.0,081
следует, что вероятная ошибка ги а» 0,675 J^D?/16 « 0,05.
Точное решение рассмотренной задачи и = ху, так что
и A/2, 1/2) =0,25, и фактическая ошибка расчета равна 0,08.
206 РЕШЕНИЕ ЛИНЕЙНЫХ УРАВНЕНИЙ • (ГЛ 5
Метод настоящего пункта позволяет вычислять
решения разностных уравнений, аппроксимирующих
дифференциальные уравнения. Связь таких задач с
блужданиями по сетке была впервые установлена в [113]. В § 3
гл. 8 указан метод Монте-Карло для решения задачи
Дирихле, не связанный с разностными уравнениями.
5.6. Случай очень большого числа переменных.
Методы Монте-Карло, изложенные в §§ 2, 3, 4, часто
используются в вычислительной практике, так как
классические численные методы решения интегральных
уравнений в многомерном случае приводят к весьма сложным
расчетным схемам. Методы настоящего параграфа,
напротив, сравнительно редко используются, так как эти
задачи хорошо решаются численными средствами
линейной алгебры. Пожалуй, только в задачах с большим
числом переменных методы Монте-Карло могут успешно
конкурировать с методами линейной алгебры [115],
Предположим, что требуется оценить одну компоненту zr
решения z системы E5), у которой все |яар| < <7/m > j/al^^ и ?<!•
В этом случае ряд zr ~ fr+ (Aj)r -f (A2f)r +¦.. сходится быстрее,
чем геометрическая прогрессия c+cq+cq2+... > и при заданной
точности можно ограничиться каким-то определенным количеством /
слагаемых:
*г = 2 Шг. G7)
Будем считать, что /^3. Для того чтобы по компонентам вектора
А1} вычислить все компоненты вектора Al+lft необходимо
проделать т2 умножений (операциями сложения, как более простыми, мы
пренебрегаем). У вектора Аг\ нам нужна лишь одна компонента
(Aff)r Следовательно, общее количество умножений, затрачиваемых
при расчете по формуле G7), равно (/— \)т2-\-т.
Рассмотрим теперь метод п. 5.3. Пусть все Ра$ ~ */т> ЭТ0 зна"
чит, что каждый номер hi с равной вероятностью может принимать
значения 1, 2, . . . , т независимо oikt_x . Такой выбор можно (см.
стр. 46) осуществлять по формуле ^/ = 1+Z/ (/ггу)» где у — очередное
случайное число.
Для реализации цепи с такими вероятностями перехода надо:
1) выбрать ko*rsr9 2) выбрать k\ и найти элемент «^; 3)
выбрать k2 и найти я^и т. д. до а kt^{kf. Значение случайной
величины F7), соответствующей G7), будет вычисляться по формуле
? = S wifk.> где ttV= ^¦-i/n"*/_1V WQ == 1.
УПРАЖНЕНИЯ К ГЛ, б 207
Если матрицу аа^ заранее умножить на т, то на расчет одного
значенияС будет затрачиваться всего 3/умножений (т на у, mak, k
на wt_i и fk{ на W,.). II если для достижения требуемой
точности придется вычислить /V цепей, то общее количество умножений
при таком способе расчета равно 3tN-\-m2.
Очевидно, расчет методом Монте-Карло будет экономичнее, чем
расчет по формуле G7), если
(t~2)m2+m>3tN. G8)
Легко показать, что величина N — количество цепей,
необходимое для достижения заданной вероятной ошибки — ограничена при
т -> оо и t ->• оо. В самом деле, как известно, N пропорционально дис-
t
перспи D?. Но D?<M?2 и так как |?| < с 2 Я1 <с(\ — q)~l, ro
DC<c2(l—q)~2. Последняя граница ни от т, ни от t не зависит.
Квадратному неравенству G8) удовлетворяют все т такие, что
m > [- 1 + У1 + 12/ (* - 2)/Vj/[2 (/ — 2)].
Так как /V>1, то это неравенство можно заменить более простым
т > /12/(/ — 2)Л//[2 (/ — 2)] = yl^//(/ — 2).
Наконец, так как при /^3 отношение //(/—2)^3, то последнее
неравенство, а вместе с ним и G8), будет выполнено при любом /^3,
если только _
т > 3 У W.
Например, если N=900, то метод Монте-Карло выгоднее, чем
расчет по формуле G7), для систем порядка т>90.
Упражнения к главе 5
1. Рассмотрим произвольную функцию R(P, P') из L2(GXO) и
решение z(P) уравнения B5), представимое в виде сходящегося
ряда B8). Чтобы вычислить квадратичный функционал (Rz, z)
методом Монте-Карли, можно использовать пары независимых
случайных траекторий (Л. В. Майоров, А. М. Суховой [49]).
а) Пусть две траектории типа Т^ (Qo -» ... —» Qi -»...) н
\Q'q -»...—» Qy—> • • .)строятся по плотностям
Р (Со). Р (Q^-i.Q/) и р' (Qi), / (Q/'-l Qj)
соответственно. Определим случайную величину rj, зависящую от
пары таких траекторий:
208 РЕШЕНИЕ ЛИНЕЙНЫХ УРАВНЕНИЙ [ГЛ 5
б) Пусть две траектории THnaTv(Q0->. . . ~> Qv) и (Qq ~* •••
• ••->Qv') строятся по законам p(Q0), p (Qi_i> QJ. « (Qt) и // (Qq),
р' (С/—i» Q/)» a'(^/) соответственно. Определим случайную величину
V[vx>, зависящую от пары таких траекторий:
R{Q0,Q0) Hfi,) f{Qv.)
П v(Q) v'(q;)'
П™'~ p(Qo)p'{Q'o)
Доказать, что если выполнены условия теоремы 4, то
Мг|= My]vv, == (#*> г).
2. Доказать, что если плотности р(Р) и р(Р, P')t по которым
строятся траектории Г<х,, удовлетворяют условиям
f IK (P. P') f (P') P~l (P, P') Г1 (P)f P (P, P') dP' < q < 1
(при любом PeG), то дисперсия D?[\|)]<oo.
Указание. Воспользоваться неравенством D4).
3. Предположим, что функции
lD\n-a(P)> *D\r*F)- s(P)p(P,P')
принадлежат соответственно A2(G), L2(^), L2(Gy,G), и ряд
Неймана для решения zD уравнения zD = KDzD + fD сходится.
Доказать, что дисперсия оценки C9) конечна и равна
(В. Г. Золотухин, С. М. Ермаков [36]).
4. Интегральное уравнение
f
имеет решение z=50x.
а) Доказать, что последовательные приближения B6) сходятся,
если только интеграл К<р(х) конечен.
б) ПустьAlf . . ,,Д/ —заданные интервалы, расположенные
внутри [0, 1], и требуется вычислить методом Монте-Карло п. 2.2
упражншия к гл 5 209
числа
iltk-= J zu)(x)dx, Л =1,2 /,
в случае, когда начальное приближение 2@) (х) == 1 Выписать все
расчетные формулы, если начальная плотность р(х)==1, а плотность
вероятностей перехода из х в х' пропорциональна (х + x')!Y хг •
5. Доказать, что в условиях п. 3.2 (расчет по истинным
траекториям) можно для оценки (i|), z) вместо случайной величины
XI [/] = [/ (aQ)/p (Qo)i № (Qv)/* (Qv)]>
называемой оценкой по поглощениям, использовать случайную вели-
v
чину х* [/] = [/ (Q0)lp (Qo)] 2 * (Q/)> называемую оценкой по
Указание. Получив выражение
2 j...j/(р0J *(*/) п ^CT(ps_,, ps)«(pt)dp,...dplt
i—0 /==0 s=l
использовать тождество й (Pt) =1 — J /CCT (Pt-, Pt-+1) d/Vj_i.
6. Рассмотрим квадратную матрицу В — (Ьа$), 1<а, (З^т, все
собственные значения fia которой удовлетворяют условию
|1*а-Л|<Л' h>0' G9)
Построить метод Монте-Карло для обращения матрицы В при
помощи итераций матрицы А—Е — /г-1 В. (Если все собственные
значения fit, ¦.., \inl матрицы В действительны и положительны, то
условие G9) всегда выполнено приh — max (щ; ...; \im)-)
7. В области С={0<а:<1, /^0} рассмотрим
дифференциальное уравнение теплопроводности
duldt = d2u!dx2+F(x, t).
Требуется найти решение и=и(х, t) этого уравнения,
удовлетворяющее граничным условиям
Выберем прямоугольную сетку с шагом h по х и At по /.
Координаты узлов этой сетки Xj = jh, tt = /А/, а значения и (*;-, 11) и
F (xjt //) обозначим Му^ и Fjj. Во всех внутренних узлах
заменим дифференциальное уравнение разностным
At * Л2 +W./-1*
которое, введя параметр х=Д///!2, можно переписать в форме
иЛ1« Ka/+lf,., + A - 2х) ад,., + хи/-1§/-1 + AtFh^.
Условие устойчивости этого уравнения и<1/2.
Определить случайную цепь, аналогичную цепи из п. 5.5, для
расчета Ujj методом Монте-Карло.
И и. м. Соболь
ГЛАВА 6
МОДЕЛИРОВАНИЕ ЕСТЕСТВЕННЫХ
ПРОЦЕССОВ
Рассмотрим какой-нибудь естественный процесс, на
протекание которого влияют различные случайные
факторы. Законы распределения этих факторов будем
считать известными: иногда эти законы можно
вычислить теоретически, чаще — экспериментально. Так
как мы умеем находить значения случайных величин
с любыми законами распределения (гл. 1 и 2), то,
разыграв конкретные значения случайных факторов, мы
сможем рассчитать конкретную случайную
реализацию процесса. Такой расчет называют имитацией
(simulation).
Большинство приложений метода Монте-Карло
связано именно с имитацией. Технические приемы
имитации в различных областях науки, техники, экономики
подробно рассматриваются в специальных книгах.
Поэтому мы ограничимся лишь очень кратким изложением
нескольких простых примеров (§1).
С точки зрения математики гораздо интереснее то,
что для многих задач можно построить более выгодные
алгоритмы расчета, если1 отказаться от имитации
естественного процесса и воспользоваться некоторыми
искусственными моделями.
Именно таким способам расчета — моделированию
с использованием статистических весов — посвящена
настоящая глава. Основная- область применения этих
методов (пока)—нейтронная физика. Однако материалы
конференции [55] показывают, что такие методы
начинают проникать и в другие области.
§ 1] МОДЕЛИРОВАНИЕ ПУТЕМ ИМИТАЦИИ 211
§ 1. Моделирование путем имитации
1.1. Задача о поглощении нейтронов. Рассмотрим
ограниченную выпуклую (для простоты) область Go
в пространстве, не содержащую делящихся ядер.
Считаем известными сечения рассеяния и поглощения 2(г, Е) =
=2в(л, ?)+2a(r, Е) и индикатрису рассеяния ps(r\ Q'; Q),
которая представляет собой условную плотность
распределения направлений рассеяния Q. В точке roeGo
расположен источник нейтронов с энергией ?оис
равновероятными направлениями Qo начальной скорости.
Требуется вычислить вероятность рА того, что нейтрон,
вылетевший из источника, поглотился в области Go.
Задача рассматривается в одногрупповом приближен
нии, так что энергия нейтрона Ео при рассеянии не
меняется.
Возможностью возвращения вылетевшего нейтрона
обратно в Go пренебрегаем. Последнее условие означает,
что нейтрон, вылетевший из Go, перестает нас
интересовать. Поэтому можно внешнюю среду заменить любой
поглощающей средой с сечением 2=2а^ео>О.
Рассмотрим какой-нибудь нейтрон, порожденный
источником. Выберем случайное направление fio его
скорости (методом гл. 2, п. 2. 4. 2). Затем разыграем
для него случайную длину go свободного пробега — как
это делать указано ниже в § 2. Получим точку
столкновения нейтрона ri = ro+g<A)«
Если ri^Go, то мы считаем, что история нейтрона
закончилась вылетом из области Go, и полагаем
случайную величину г|а=0.
При ri^G0 разыгрываем судьбу нейтрона (методом
гл. 2, п. 1.2.2). Если нейтрон поглотился, то история его
заканчивается и полагаем г]А=1. Если же нейтрон
рассеялся, то в соответствии с индикатрисой р8(г\> Qo; й)
разыгрываем новое направление скорости Q = Qi, затем
новую длину свободного пробега gb и вычисляем
следующую точку столкновения /2=ri+iiQi.
Расчет траектории продолжается до вылета
нейтрона из области Go или до его поглощения. (Можно
доказать, что при весьма общих условиях вероятность
бесконечной последовательности рассеяний внутри Go
равна нулю.) Если история нейтрона заканчивается погло-
14*
212 МОДЕЛИРОВАНИЕ ЕСТЕСТВЕННЫХ ПРОЦЕССОВ (ГЛ б
щением, то полагаем т]а=1, в противном случае полага-.
ем tia=0 (рис. 55).
По определению искомая вероятность рА=Р{цА=\}'
Так как распределение случайной величины г\А задается
таблицей
(\ 1 \
\Ра I ~ Ра)
то Мца—Ра, Ъг\а=Ра — Р2А . Оценкой величины рА
В,:.— \ ^
'л
Рис. 55.
служит среднее арифметическое
P/^-l-SOuL A)
где {г[А)8 — значение г]А, полученное на 5-й траектории,
а N — общее количество реализованных траекторий.
Последнюю формулу можно записать также в виде
где NA — количество траекторий, закончившихся
поглощением нейтрона.
Изложенный метод Монте-Карло для расчета рА
основан на имитации поведения нейтронов в среде. В
каком-то смысле это самый естественный метод решения
задачи. Однако это не лучший метод. Ниже, в § 3
указаны несколько видоизменений этого метода, позволяющие
строить случайные величиныу\такие,что Мг)=рА hDtj^:
<; Dt)a. При этом будет использована следующая лемма.
Лемма. Если случайная величина т), для которой
t\/|rj=pA, удовлетворяет неравенствам O^tj^I, to
i
Доказательство. Так как МгJ^Мт)=рА, то
дисперсия Dq = Щ'— р\ < рА - р\ =
§ 1]
МОДЕЛИРОВАНИЕ ПУТЕМ ИМИТАЦИИ
213
1.2. Задача о размножении нейтронов. Предположим,
что область Go, рассмотренная в п. 1.1, содержит
расщепляющиеся вещества, так что полное сечение 2=284-
+2с+2/, где 2С — сечение захвата, a S, — сечение
деления. При захвате поглощенный нейтрон «исчезает», а
при делении вместо поглощенного нейтрона появляются
v новых нейтронов, называемых нейтронами деления.
Распределение случайной величины v задано *).
Снова ограничимся одногрупповым приближением и
будем считать, что энергии всех нейтронов равны ?У,
рассеяние изотропно; распределение скоростей каждого
из нейтронов деления также изотропно.
Рассмотрим историю одного нейтрона, оказавшегося
в области Go. Каждое звено его траектории
моделируется так же, как в п. 1.1: разыгрываются случайное
направление Qj, случайный пробег |( и «судьба» при
столкновении в точке г<+1=г<4-|г?2| (гл. 2, п. 1.2.2). Если
произошло деление, то разыгрывается величина v, и
траектория в точке ri+\ разветвляется на v ветвей, каждая
из которых моделируется независимо по тем же
формулам. Полученную ветвящуюся траекторию часто
называют деревом. Схема такого дерева изображена на рис. 56.
*) Обычно, Если Mv=v", заключено, между т и т+1, то
считают, что P{v=m+I} = m+1—v, P{v=m}=v—-m.
214 МОДЕЛИРОВАНИЕ ЕСТЕСТВЕННЫХ ПРОЦЕССОВ ГГЛ б
Область Go называется критической, если количество
нейтронов в этой области постоянно во времени.
Наиболее распространенный метод расчета критичности — счет
по поколениям [25, 51, 53] —состоит в следующем.
Поместим в Go некоторое количество п\ нейтронов, которые
будем считать нейтронами 1-го поколения. Затем
разыграем историю каждого из этих нейтронов до его
«исчезновения» (т. е. до вылета из Go, до захвата или до
поглощения с делением). При этом мы получим некоторое
количество п2 нейтронов деления, которые будем считать
нейтронами второго поколения. После расчета
достаточно большого числа i поколений, отношения 1и+\1щ
устанавливаются, так как п{+[/п{-+кэфф. Величина &офф
называется эффективным коэффициентом размножения
нейтронов в Go. Если Аэфф=1, то область Go критична.
(При ?офф<1 цепная реакция в Go затухает, а при
*.1ФФ>1 —приводит к взрыву.).
Очевидно, для расчета по поколениям строить
ветвящиеся траектории не нужно.
1.2.1.0 технике расчета ветвящихся траекто
р и и. Ветвящиеся траектории встречаются во многих задачах,
связанных с прохождением элементарных частиц, когда, например,
фотон может привести к образованию пары электрон — позитрон или
к появлению свободного электрона (фотоэффект). При расчете
деревьев вовсе не обязательно сперва строить все дерево, а потом
производить его обработку (т. е. отбор нужных данных и
осуществление нужных вычислений). Укажем два основных алгоритма
постепенной обработки дерева.
а) Обработка дерева по поколениям. Этот способ
удобен в тех задачах, в которых деревья длинные, но не слишком
сильно ветвятся. Схема расчета достаточно очевидна: по частицам
одного поколения вычисляем все частицы следующего поколения и
одновременно производим обработку построенной части дерева.
Затем информацию о старом поколении можно уничтожить Так что в
памяти приходится хранить не более двух поколений.
Вообще говоря, к поколению можно отнести любые две частицы,
не являющиеся «предками» друг друга (например; нейтроны,
соединенные пунктиром (/) на рис. 56). Тогда следующее поколение
определяется однозначно (пунктир B)).
б) Лексикографическая обработка дерева. Этот
способ удобен в тех задачах, в которых деревья ;не очень длинные,
но сильно ветвятся. Схема расчета такова: движемся по одной
(какой-нибудь) ветви, производя обработку и записывая все
ответвления. Достигнув конца ветви, возвращаемся на одно колено назад и
начинаем двигаться по какому-нибудь из записанных ответвлений.
Если записанных ответвлений нет, то возвращаемся еще на колено
§ 1] МОДЕЛИРОВАНИЕ ПУТЕМ ИМИТАЦИИ 215
назад. Счет закончится тогда, когда мы возвратимся к основанию
дерева.
Номера на рис. 56 указывают порядок одного из возможных
лексикографических обходов изображенного дерева. Ясно, что при
каждом возвращении на одно колено можно уничтожить
информацию об обработанной части. Поэтому в любой момент в памяти
ЭВМ сохраняется лишь одна полная или неполная ветвь с
записанными ответвлениями.
1.3. Системы массового обслуживания. Рассмотрим
модель одной из простейших (однофазных) систем
массового обслуживания. Такая система состоит из п линий
(или каналов, или пунктов обслуо/сивания), каждая из
которых может независимо «обслуживать» заявки. В
любой момент времени линия может быть либо свободной,
либо занятой.
Примерами таких систем могут служить
автозаправочная станция (линии — бензоколонки, заявки —
приезжающие машины), телефонная станция (линии —
каналы связи, заявки — вызовы абонентов), парикмахерская
(линии — мастера, заявки — клиенты) и т.д.
В систему поступает случайный поток заявок,
вероятностные характеристики которого предполагаются
известными. Если в момент поступления &-й заявки, назовем
его tk, имеются свободные линии, то одна из них
(правило выбора должно быть задано) принимает на себя
обслуживание этой заявки. Продолжительность
обслуживания заявки i-й линией представляет собой
случайную величину т, плотность распределения которой /?,(/)
также должна быть задана.
Предположим, что наша система представляет собой
систему с отказами: если в момент tk все линии заняты,
то система выдает отказ. (Такая модель годится для
телефонной станции, но не подходит для
автозаправочной станции или парикмахерской, которые ближе к так
называемым системам с ожиданием). Важнейшая
характеристика системы с отказами — среднее число
отказов в заданном интервале времени. Конечно, число
отказов зависит от поступающего потока заявок.
Аналитические методы позволяют рассчитывать
системы массового обслуживания только в простейших
случаях. Во всех более сложных задачах приходится
прибегать к статистическому моделированию [7, 38, 43].
216 МОДЕЛИРОВАНИЕ ЕСТЕСТВЕННЫХ ПРОЦЕССОВ ГГЛ 6
1.3.1. Описание потока заявок. Чаще других
рассматривается стационарный пуассоновскый поток,
называемый также простейшим потоком, в котором
интервалы между моментами поступления двух последователь-
пых заявок независимы и подчиняются
экспоненциальному распределению: tk=th-i-\-Q, и функция распределения
О равна
. B)
Величина а=1/М0 называется интенсивностью потока
заявок.
Из более сложных стационарных потоков отметим
только потоки Эрланга, в которых величины 0=4—4-i
также независимы, но подчиняются более общему
гамма-распределению (см. гл. 2, п. 4.2) с плотностью
Р (*) = („_!)) я1"-1*-", 0
оо.
Интенсивность такого потока равна 1/М0 = а/т.
Сравнительно редко используют нестационарные
пуассоновские потоки, в которых функция распределения
0=4+i—4 зависит от th:
/4*)=l--exp{--Ja(/A + s)dsb 0<*<оо.
о
Нетрудно проверить, что F(x) в последнем случае имеет
тот же вид, что функция распределения свободных
пробегов (см. ниже формулу F)). Изложенный в п. 2.2.3
метод постоянного сечения позволяет легко
моделировать такие нестационарные потоки, вводя фиктивные
заявки.
1.3.2. Алгоритм расчета системы с
отказами. Рассмотрим конкретную систему с отказами,
состоящую из п линий. Плотности pi(t) считаем
известными. Правило выбора свободной линии сформулируем
так: заявка поступает на линию, которая освободилась
раньше всех, а если таких несколько, то на ту из них,
номер которой меньше.
Пусть в рассматриваемую систему поступает
простейший поток заявок с интенсивностью а. Требуется
оценить среднее число отказов за время
§ 1] МОДЕЛИРОВАНИЕ ПУТЕМ ИМИТАЦИИ 217
Поставим в соответствие линии с номером i ячейку
ЭВМ, в которую будем записывать момент
освобождения этой линии Т{. В начальный момент, очевидно, Тх =
= 7= ... =Tn=to. В отдельную ячейку будем
записывать величину f = min Tt.
\<1<п
Момент поступления первой заявки разыграем по
формуле
Очевидно, первую заявку начнет обслуживать первая
линия. Время обслуживания т найдем из уравнения
Линия номер 1 будет занята до момента (Т\)яоъое=)
= *1+т. Следовательно, в соответствующей первой линии
ячейке надо заменить Тх на (Г^новое и вычислить
новое Т.
Предположим теперь, что «судьбу» (k— 1)-й заявки,
поступившей в момент 4-ь мы Уже выяснили. Тогда
разыгрываем момент поступления k-n заявки
и проверяем, если ли свободные линии. Для этого
достаточно проверить неравенство
Г</4. (ЗУ
а) Если C) выполнено, то линия, для которой Т{=ТУ
приступает к обслуживанию &-й заявки (если линий, для
которых Г<=Г, несколько, то выбирается та из них,
номер которой меньше). Продолжительность
обслуживания т разыгрывается по формуле
затем вычисляется (Г<) новое=**+т и новое значение Т.
После этого можно перейти к рассмотрению следующей,
(/г+1)-й заявки.
б) Если неравенство C) невыполнено, то свободных
линий в момент th нет и система должна выдать отказ.
218
МОДЕЛИРОВАНИЕ ЕСТЕСТВЕННЫХ ПРОЦЕССОВ [ГЛ б
В этом случае необходимо прибавить единицу к
счетчику отказов, после чего можно перейти к рассмотрению
(&+1)-й заявки.
Расчет продолжается до тех пор, пока момент
поступления очередной заявки не окажется больше, чем
'ков. К этому времени в счетчике отказов будет стоять
количество отказов \х за время t0^.t<itKOH.
Повторив такой опыт N раз (с различными случайны-
ми числами), получим N значений ц,ь ...э i\N, по
которым можно оценить среднее число отказов за время
*о^<^кон#. М|х« О/АО ((ii+ ... +М-*). Схема обработки
одной заявки изображена на рис. 57,
§ п Моделирование путем имитации 219
1.4. Расчет вероятностных характеристик сложной
случайной величины. Рассмотрим я-мерную случайную
точку Q=(|1 ,...,|n), закон распределения которой
FQ(xu..., xn) известен. Требуется вычислить
какие-нибудь вероятностные характеристики скалярной
случайной величины
например Mr] или Р{г|еД}, где А—заданный интервал.
Если функция /(*ь..., хп) хоть сколько-нибудь
сложная (или задана алгоритмом, а не аналитическим
выражением), то аналитически вычислить функцию
распределения Fr\(y) не удается. Весьма естественно в этой
ситуации использовать метод Монте-Карло.
В самом деле, приемы гл. 2 позволяют находить
независимые реализации Q, точки Q. По ним можно
вычислить соответствующие значения r]i=/(Q1)
величины т). Достаточно большая выборка г\\у..., r\N
позволяет оценить любые характеристики величины ц,
например,
2
i-==i
где %а(у) — индикатор интервала Д (см. стр. 166). В
п. 3.1.4 гл. 1 указано, как по выборке г)Ь ..., r\N
построить эмпирическую функцию распределения F# (у),
которая при больших W близка к Fn{y) *).
*) Для того, чтобы оценить плотность рц (у) случайной
величины rj, обычно строят гистограмму h ^у). Для этого выбирают
интервал [я, Ь), содержащий все выборочные значения г]ь ...,%,
разбивают его на г интервалов:
г
(а, Ь) = 2 fo/-i» У})* где ^о = «» У, = ^.
и вычисляют количества выборочных значений, принадлежащих этим
интервалам: vb ,.., v^ (ср. гл I, п. 3.1,2). Гистограммой называется
ступенчатая линия hN( ) = (vyW)/(^ — y^), при у е [yj^,v yfa
(/=1, 2, ... , г.
О гистограммах в «-мерном случае см. [98].
220 МОДЕЛИРОВАНИЕ ЕСТЕСТВЕННЫХ ПРОЦЕССОВ [ГЛ б
В указанную схему укладываются способы расчета
многих практических задач. Интересно, что в
большинстве случаев приходится выполнять серии расчетов,
отличающихся значениями некоторого параметра Я, так
что r)(A,)=/(Q; Я), и метод гл. 3, п. 4.1 оказывается
весьма полезным.
Мы ограничимся только одним примером.
1.4.1. Оценка качества приборов.
Рассмотрим электрический прибор, который состоит из
сопротивлений Ril\ R{2\ ... емкостей СA), СB),... и др.
Предположим, что качество прибора определяется величиной Ь\
которая может быть вычислена по параметрам деталей:
?/=/(/?<», /?<2\ ..., С"\ СB), ..... ...,) D)
В действительности параметры всех деталей несколько
отличаются от номинальных, и поэтому значения U для
разных экземпляров прибора будут отличаться от D).
Можно пытаться оценить пределы изменения ?/, выб*ь
рая самые неблагоприятные значения параметров.
Однако далеко не всегда ясно, какой набор параметров будет
наихудшим. К тому же, как правило, такая оценка боль*
шого практического значения не имеет, так как в
действительности мало вероятно, чтобы все параметры
одновременно были наихудшими (особенно если их много).
Поэтому более рационально считать параметры всех
деталей независимыми случайными величинами и
методом п. 1.4 определить закон распределения случайной
величины U.
Для такого расчета нужно знать функции
распределения параметров всех деталей. К сожалению,
вероятностные характеристики деталей
заводами-изготовителями пока не выдаются. Конечно, можно получить такие
данные путем просмотра больших партий однотипных
деталей. Но это довольно большая работа. И чтобы
избежать ее, некоторые исследователи поступают проще:
если указано, что величина сопротивления может
отклоняться от номинала R на ±5%, то считают, что величина
эта нормальна с параметрами (а; о), которые
определяются из условий
а=Я, За=0,05/?
(ср. с «правилом трех сигм», стр. 88).
§ 2] МОДЕЛИРОВАНИЕ СВОБОДНОГО ПРОБЕГА 221
Заметим, что экспериментальное определение
вероятностных характеристик прибора возможно лишь тогда,
когда имеется достаточно большая партия готовых
приборов. Метод настоящего пункта позволяет оценить эти
характеристики еще на стадии проектирования,
§ 2. Моделирование свободного пробега
2.1. Закон распределения длины свободного пробега.
Предположим, что вдоль оси Ох движется некоторая
элементарная частица (нейтрон, фотон, протон и т. п.),
которая может сталкиваться с частицами (обычно с
ядрами атомов) среды. Во всех исследованиях, явно или
неявно, фигурирует следующее предположение:
вероятность того, что частица, долетевшая до точки х, испытает
столкновение в интервале (х, лг+А*), равна
2Ах+о(Ах). E)
Множитель пропорциональности 2 называется полным
сечением или подробнее: полным макроскопическим
эффективным сечением взаимодействия частицы со
средой. Значение 2 зависит как от состояния среды в
точке х, так и от типа и энергии частицы.
Формулу E) можно считать определением полного
сечения*). Вполне аналогично определяются сечения
различных типов взаимодействия (различных реакций),
которые могут произойти при столкновении частицы.
Например, Ss — сечение рассеяния, Ъ} — сечение деления
и др. Такие сечения иногда называют парциальными
сечениями.
О х z+Az я '
Рис. 58.
Рассмотрим теперь частицу, вылетевшую вдоль
оси Ох из точки х=0 (рис. 58). Обозначим через g
случайную длину свободного пробега этой частицы,
*) Обычно рассматривают пучок, содержащий N одинаковых
частиц, долетевших до точки х. Если в среднем в интервале (х, лг-f*
+ испытывают столкновение Л^'Дл: частиц такого пучка, то
222 МОДЕЛИРОВАНИЕ ЕСТЕСТВЕННЫХ ПРОЦЕССОВ [ГЛ б
а через F(x) —функцию распределения S-, так что F(x) =
Р{}
Вероятность гого, что частица испытает первое столк-;
новение в интервале {х, х+Ах), равна
F(x) = [l-F(x)] [2{х)Ах+о(Ах)].
(Здесь 1—F(x) —вероятность того, что частица долетит
до точки #.) Разделив это соотношение на Ах и перейдя
к пределу при Д#->0, получим дифференциальное
уравнение
dF/dx=[l—F(x)]2(x).
Решение этого уравнения, удовлетворяющее начальному
условию /г@)=0, легко записать:
= 1 — exp,— I y(s)ds\. F)
Это и есть искомая функция распределения g.
х
Интеграл I (х) = f2j(s)ds часто называют оптической
о
длиной интервала @, #). Из условия нормировки
f(oo) = l следует необходимое требование /(оо)=оо.
2.1.1. Ядро столкновений в одкогрупповой теории переноса *).
В этой теории скорость частиц предполагается постоянной по
абсолютной величине (но не по направлению) и не меняется во время
свободного пробега. Поэтому фазовое пространство (см § 3 гл. 5)
можно считать пятимерным* P=(ry Q), где г — координаты
частицы, аЙ- единичный вектор направления скорости.
По определению КСт(Р'< P)dP — это вероятность того, что
после столкновения в точке Р' фазового пространства частица
испытает следующее столкновение в элементе dP около точки Р.
Вероятность того, что частица при столкновении в Р' рассеется, равна
Обозначим /=|г—г'\, ш== (г—г')//, и в качестве координат
точки г выберем сферические координаты с центром в
г' (рис. 59), так что ar~l2dlda) — элемент «физического»
объема. Для того чтобы рассеянная частица могла попасть в
элемент dr около точки г, направление ее движения после рассеяния
должно оказаться в конусе da около направления со. Вероятность
такого события выражается через индикатрису рассеяния р (/", Q'; Q)
и равна ps( r', Q'; oo)rfco. Если это условие выполнено, и части-
*) Одногрупповая (или односкоростная) теория часто
используется для расчета диффузии быстрых нейтронов, особенно в среде,
состоящей из тяжелых атомов [25, 51].
МОДЕЛИРОВАНИЕ СВОБОДНОГО ПРОБЕГА 223
ца рассеялась по направлению со, то вероятность столкновения в
интервале (/, l+dl)t согласно F), равна
Z(r)exp — j 2(r' + as)ds
\ о
Наконец, направление скорости Q (как независимая величина в
Рис. 59.
фазовом пространстве) обязана совпадать сои вероятность этого
равна 6(Q—co)<2Q. Следовательно,
2 (г') -\И
/Сст (Я', Р) dP = Ypy р^ (г', Q'; со) dcol1 (л) « ° № (Q — со) dQ.
Введя сюда dP = dr dQ = l2dl d&du и сократив ^Р, получим
формулу
J
G)
2.2. Моделирование свободного пробега нейтрона.
2.2.1. В однородной среде. Так как во время
пробега энергия нейтрона не меняется, то полное
сечение постоянно: 2(?, x)=2(?)sS. Из уравнения F)
следует
F{x) = l-e-*9
и метод обратных функций позволяет записать явную
формулу для расчета g
? = -A/2) Inf. (8),
224
МОДПЛМРОВЛНИЕ ЕСТЕСТВЕННЫХ ПРОЦЕССОВ
[ГЛ. б
О
Легко вычислить, что средняя длина свободного
пробега Мб=1/2. Если в качестве единицы длины выбрать
1/2, то g =—In 7 средних длин свободного пробега.
2.2.2. В кусочно однородной среде (метод
обратных функций). Мы рассмотрим случай,
когда интересующая нас область пространства G состоит
из конечного числа однородных областей. Именно такова
геометрия большинства задач, встречающихся на
практике. В то же время очевидно, что всякую неоднородную
среду можно , с любой точностью аппроксимировать
. такой кусочно однородной средой.
z\ Поверхности, являющиеся
границами областей, как правило, не
сложнее, чем поверхности второго
порядка: плоские, сферические,
цилиндрические, конические. Поэтому
не представляет труда найти
аналитически пересечение любого луча с
любой из этих поверхностей.
Рассмотрим простейший (по
своей логике) алгоритм для расчета
свободного пробега в такой среде,
разработанный автором в 1955 г. В
качестве иллюстрации выберем
область G, представляющую собой
трехслойный конечный цилиндр с
«крышкой» в форме полусферы.
Сечение G плоскостью у=0 изображено на рис. 60, где
цифры означают номера различных областей. В этом
примере шесть граничных поверхностей:
3
2
Ч
2
\
3
0 Rj /
Рис. 60.
3)
5) г-Я;
6) jc2 + г/2 + (г — ЯJ
Пусть нейтрон вылетает из точки г0 по направлению
единичного вектора со. Тогда уравнение /г(|) = 1—ч
запишется в виде
HI) =
(9)
§ 2)
МОДЕЛИРОВАНИЕ СВОБОДНОГО ПРОБЕГА
225
Чтобы решить это уравнение, находим пересечение луча
r=rQ+a)S со всеми граничными поверхностями, и все
положительные значения s, соответствующие точкам
пересечения, располагаем в порядке возрастания:
0=s@)<sA)<sB)<...<5Gn). A0)
Вычисляем длину отрезков луча /(f)=s(<)—s(<_i)f
каждый из которых принадлежит одной области, и находим
соответствующие этим областям значения 2, которые
обозначим через а({), /=1, 2,..., т*).
Обозначим через Ik интегралы /ft=/(s(A)), Они легко
вычисляются по формуле
Нетрудно доказать, что если
если же —In
облааи G.
то
^—In Y</A+b то
(-inT-/fc); (И)
> и нейтрон вылетает из
J L
т_
Рис. 61.
В самом деле, легко видеть, что 5<ь)<?<5он-1) тогда
и только тогда, когда /*</(|)<Л+ь Уравнение (9)
*) Программа расчета должна содержать блок, позволяющий
определить, какой области принадлежит любая заданная точка.
Выбрав середину отрезка 1щ^ можно найти номер области, которой
принадлежит 1цу ,
15 И. М. Соболь
226
МОДЕЛИРОВАНИЕ ЕСТЕСТВЕННЫХ ПРОЦЕССОВ
[ГЛ б
в этом случае можно переписать в виде (рис. 6!)
/*+a(ft+i) (g—s(k))= —In if,
откуда сразу вытекает A1).
На рис. 62 изображен пример такого луча с указанием всех
и .s(8) здесь
«лиш.s(8)
Легко заметить, однако, что пересечения sB)>
ние». Чтобы исключить «лишние» пересечения, можно, например,
изменить определение граничных поверхностей, добавив к ним
неравенства (одно или несколько), выделяющие действительный
участок границы. В примере, изображенном на рис. 62, граничные
поверхности запишутся так:
l)x* + y* = R*,
2) x2 + у* - R\,
5) 2=
3)
; 6)
> — Л ) — /\o, Z ^> tl•
Определив точку пересечения луча r=r0-fcos с какой-нибудь из
граничных поверхностей и получив положительное значение s, следует
подставить координаты точки* пересечения в соответствующие этой
поверхности неравенства. Если координаты точки пересечения хотя
бы одному из этих неравенств не удовлетворяют, то данная точка
пересечения исключается (рис. 63).
Если количество граничных поверхностей в задаче велико, а
фактические пробеги нейтронов малы, то такой алгоритм невыгоден;
Рис. 62.
Рис. 63.
каждый раз пришлось бы вычислять очень много пересечений, хотя
в действительности каждый нейтрон пересекает лишь о дну-две
поверхности. Для построения более экономного алгоритма в [46]
предлагается разбить граничные поверхности на элементарные
граничные поверхности, каждая из которых разделяет две области.
В нашем примере (рис. 60) окажется 10 таких поверхностей (в скоб-
§ 2] МОДЕЛИРОВАНИЕ СВОБОДНОГО ПРОБЕГА 227
ках указаны индексы поверхности, т. е. номера областей, которые
эта поверхность разделяет):
1) x2 + y2^R2t о<2<я, О; 2);
2)*a + j/2 = tfl, 0<2<Я, B; 3);
3) дся + у* = /?|. 0<2<я, @;3);
4J = 0, x2 + //2<jR2> @; 1);
5) z = 0. Я?<*а + уа</& @; 2);
С)
7)
8)
9)
Ю)
z =
2 =
2 =
Z =
0,
я,
я,
я,
*?<
f (г-
* +
;^2
ЯJ
+
г/2
+
-f
=
Уг
<
У2
¦у2
<
<
<
Rl
Rl
г> Я,
@; 3);
A; 4){
B; 4);
C; 4);
@; 4).
Если, например, исходная точка г0 принадлежит области 5, то
надо найти пересечения луча r=r0+@5 только с теми
элементарными граничными поверхностями, в индексах которых фигурирует 3.
Если область 3 выпуклая, то такая точка пересечения будет
единственной; в общем случае выбираем точку пересечения с
наименьшим s, превосходящим s^y которое и назовем sA). Второй индекс
пересекаемой поверхности показывает, в какую область переходит
нейтрон. И т. д.
В примере, изображенном на рис. 63, s(\) соответствует точке
пересечения луча с поверхностью 2, а нейтрон переходит в область
2. Затем находим пересечения луча со всеми элементарными
поверхностями, в индексе которых имеется 2, и отбираем пересечение,
которому отвечает наименьшее 5, превосходящее sA). Таким образом,
получим значение s^2)» соответствующее первому пересечению луча
с поверхностью /, и номер следующей области — /.
Конечно, условия Ik <— In v< ^+р входящие в A1), следует
проверять постепенно, по мере нахождения
5<1)' 1{\У a(U> /i; sB)' lBV аB)< /2'-«*
2.2.3. В произвольной среде (метод
постоянного сечения). В последние годы широкое
распространение получил совсем другой метод
моделирования пробегов в сложной среде, предложенный,
по-видимому, Е. Р. Вудкоком. Кусочная однородность среды
при этом не предполагается.
Выберем произвольную постоянную a^supS, и обоз-
начим через 2Ф разность 2Ф=а—2^0. Условимся счи-
15*
228 Моделирование естественных процессов [гЛ 6
тать, что при столкновении нейтрона с ядрами, кроме
реакций, входящих в 2, возможна еще одна —
фиктивное столкновение, при котором ни энергия, ни
направление движения нейтрона не меняются. Сечение фиктивного
столкн©вения будем считать равным 2Ф. Если (ср.
пример гл. 2, п. 1.2.2) 2 = 2s+2c+2/, то вероятности
соответствующих реакций в условной задаче равны 28/а,
2с/а, 2//а, а вероятность фиктивного столкновения равна
2ф/а. Пробеги в этой задаче легко вычисляются по
формуле (8)
6 = -A/аIпТ, A2I
а тип столкновения разыгрывается с учетом всех
четырех возможностей. Ниже доказано, что сумма таких
пробегов до первого нефиктивного столкновения
подчиняется тому же закону распределения F), что истинный
случайный пробег.
Теорема 1 ([112]). Рассмотрим нейтрон, вылетающий из
точки дг=О по направлению оси Ох и подчиняющийся законам
условной задачи Обозначим через I координату первого
нефиктивного столкновения. Тогда функция распределения ? выражается
формулой F)
Доказательство. Обозначим через v случайное
количество фиктивных столкновений в интервале @, ?) и рассмотрим случай
v=i (г = 0, 1, 2, ...). Выберем произвольные числа xlf х2, ...
удовлетворяющие неравенствам
О < хх < х2
xt
Вероятность того, что фиктивные столкновения окажутся в
окрестностях точек #i, . . . , xiy а первое нефиктивное столкновение — в
окрестности точки x^i равна (ср. A5) гл. 5)
Проинтегрировав эту вероятность по всем возможным xlt . . . , xt , l
§ 2] МОДЕЛИРОВАНИЕ СВОБОДНОГО ПРОБЕГА 229
таким, что хс+[ < х, получим вероятность
?[\<х, v = '}=!dxl+l j d*,...?*(*,
* ax *l+l
l+I[2] I
о
Все внутренние интегралы легко вычисляются. Если ввести обозна-.
X
чение /ф (х) = ] ^]ф ^s) ds, то (заменив jc^—§— 1 на ^ можно будет
о
записать результат в виде
Р {| < х, v = «} =]е-*» [а - Уф(</)] \L^1 dy.
Отсюда следует, что
t=0 о
1 — е ф =
что и требовалось доказать.
Так как при увеличении а количество фиктивных столкновений
возрастает, то обычно стараются выбрать минимально возможное
значение, т" е. a=sup2. Некоторые другие применения метода
постоянного сечения указаны в работах [152, 169].
2.3. Моделирование свободного пробега заряженной частицы.
Рассмотрим пробег быстрой заряженной частицы в плазме, состав
и температуры которой (как функции времени / и координаты г)
заданы. Физические ограничения на плазму: а) не слишком
большое разрежение; б) ларморовский радиус значительно больше
длины свободного пробега, так что траекторию частицы можно считать
прямолинейной: r=ro+ws-
В результате взаимодействия с электронами и ионами среды
частица теряет свою энергию (тормозится). Этот процесс можно
считать непрерывным, так что вдоль траектории
dE/dt = -q(E, r, t).
Формулы для расчета q предполагаются заданными.
Полное сечение 2 заряженной частицы зависит от ее энергии и
положения, так что в конечном счете 2 = 2(?, г, /). Скорость
частицы v = ds/dt связана с ее энергией соотношением Е= (\/2)Mv2t
где М — масса частицы.
230 МОДЕЛИРОВАНИЕ ЕСТЕСТВЕННЫХ ПРОЦЕССОВ [ГЛ 6
Для того чтобы вычислить значения функции
s(t)
о
можно численно интегрировать систему обыкновенных
дифференциальных уравнений
dl dE ds
Ъ <13>
с начальными условиями /(^о)=О, E(tQ) —Eo, s(/0)=0. Если при
t~tk значение Ik = / (tk)< — In у, а при / = /ft+1 значение /^l^
= / (^_ц) ^> — In у, то значения всех величин в момент
столкновения — / — ^, Е ~ ?| и 5 = g — можно проинтерполировать:
6 = sk + z (sk+l - sk)f где г = ( — In v —
Возможен также случай, когда при t = tk значение /ft все
еще не превосходит —In y, а частица вылетает из области G или ее
энергия оказывается ниже интересующего нас уровня Ek <?mjn.
Тогда частица из дальнейшего рассмотрения исключается. При расчете
некоторых задач оказалось удобным выбрать в качестве независимой
переменной в A3) энергию Е и численно интегрировать уравнения
*L _L —- — ?L- V2L
dE =="" q • dE q * dE q
при ?o^?^?min с начальными условиями t(E0)—t0, s(?>0)=0,
)
Для моделирования пробегов заряженных частиц также можно
использовать метод постоянного сечения (п. 2.2.3), если только в
интересующем нас диапазоне величин sup2 = a<oo. Тогда можно
длину свободного пробега разыгрывать по той же формуле A2);
затем придется интегрировать два уравнения
dE_ _ j_ dt 1
ds v ' 'ds ~~ v
от s = 0 до 5 = | (начальные значения E@)=E0, t(O)=to) и,
только вычислив Е^, t^ и >Г (?^, /-|, /^)? можно будет определить
(разыграть), фиктивное ли это столкновение или нет.
Замечание. Изложенный метод разработан в [81]. Иногда
взаимодействие заряженной частицы с электронами и ионами среды
целесообразно учитывать двояко: взаимодействия, приводящие к
небольшим изменениям энергии частицы, осредняются и включаются
в непрерывное торможение д, а сравнительно редкие столкновения,
влекущие за собой значительное изменение энергии
(«катастрофические Столкновения»), включаются в 2 и разыгрываются [39, 104].
§ 3] ИСП0ЛЬ30В\НИЕ СТАТИСТИЧЕСКИХ ВЕСОВ 231
§ 3. Использование статистических весов
В гл. 5 мы встречались с величинами Wj или
^которые называли весами. Однако при решении многих
физических задач веса можно вводить, руководствуясь чисто
физическими соображениями, отправляясь при этом о г
естественного процесса и не пользуясь
макроскопическими уравнениями (например, уравнением переноса).
Нередко использование весов заметно повышает
эффективность расчета.
Мы рассмотрим несколько способов введения весов
на примере задачи о поглощении нейтронов (п. 1.1).
3.1. Веса, заменяющие розыгрыш поглощения.
Предположим, что из источника г0 в направлении Qo вылетел
не один нейтрон, а «пакет», состоящий из большого
числа w0 идентичных нейтронов. Разыграв длину
пробега go, определим точку столкновения для всего
пакета ri = ro+g(A)* В среднем при таком столкновении
[2a(r1)/S(r1)]ti2;o нейтронов поглощаются, а [29(г\I
/T.(r\)]wo нейтронов рассеиваются. Поэтому, разыграв
(в соответствии с индикатрисой рассеяния) новое
направление движения пакета Q\ будем считать, что
в этом направлении движется пакет, состоящий из
нейтронов.
Правила построения траектории оказываются во
многом такими же, как в п. 1.1: так же разыгрываются
пробеги gf, функции распределения которых в соответсь
вии с F) равны
Fi (х) = 1 - ехр - | 2 {п + Qts) ds\, A4)
так же разыгрываются направления Q{. Однако при
столкновении в точке ri+i = r<+g<Qj «судьба» нейтрона
не разыгрывается: вместо этого предполагается, что
ш;{[2а(r<+i)/S(ri+i) ] нейтронов из пакета поглотились,
а в рассеянном пакете остаются лишь
] A5)
нейтронов. История пакета заканчивается тогда, когда
232 МОДЕЛИРОВАНИЕ ЕСТЕСТВЕННЫХ ПРОЦЕССОВ [ГЛ. 6
он вылетает из области Go. Количество поглощенных за
всю историю нейтронов равно
№ = JJ [2а (ГЖ) I 2 (Г/+1)] Wh A6)
где \^—номер последней точки траектории внутри Go
(другими словами, /*v+i^G0).
Наконец, нетрудно заметить, что величины A5) и
A6) пропорциональны ш0. Поэтому, несмотря на
рассуждения о «большом количестве» w0 можем считать,
что
wo=l. A7)
Тогда величина тД1) —количество поглощений в расчете
на один испущенный нейтрон — окажется оценкой
искомой вероятности: Мчл} = Ра- (Формальное
доказательство имеется в § 4).
Для приближенного расчета рА нужно реализовать
достаточно большое число N траекторий указанного
вида (с доо=1) и положить
N
pA^-JflZ Ыа)в,
где (t^Ms—значение ца\ полученое на траектории
номер s.
Докажем теперь, что оценка yf^ всегда не хуже
оценки 11л, используемой при имитации поведения нейтронов
(п. 1.1):
D^U<D^. A8)
Согласно лемме п. 1.1. для этого достаточно доказать,
что 0<^1}<1.
Введем для краткости обозначение
* = 2.(ri)/2(r,). A9)
Из формул A5), A6) и A7) вытекает, что при 1^\
Wi = S^ . . . Si,
v-i B0)
Ъ{ = У SS S(l
§ 3] ИСПОЛЬЗОВАНИЕ СТАТИСТИЧЕСКИХ ВЕСОВ 233
Последнее выражение легко преобразовать к виду
^1) = l-s1sa...sVf B1)
откуда сразу следует требуемое неравенство.
3.1.1. В большинстве реальных задач дисперсия Dr]^l) заметно
меньше, чем &ЦЛ, однако общих оценок на этот счет мало.
Обратимся к частному случаю— однородной области Go, когда
Обозначим через Pi вероятность того, что траектория пакета
закончится в точке rt-_j_j с номером i+l или, другими словами, Pi=s
= P{v = ?}. Вычислять эти вероятности нам не потребуется
Заметим только, что ро равно вероятности того, что нейтрон,
испущенный источником, вылетит из области Со, не испытав ни одного
столкновения.
Теорема 2. Рассмотрим задачу о поглощении нейтронов в
однородной области Go (п. 1.1 ). Если
то имеет место неравенство
Dr^0 < вЩА. B3)
Доказательство. Из формулы B1) видно, что в
однородной области случайная величина т)д' может принимать только
значения 1 —5 , где 1=0, 1, 2, ... Следовательно, ее распределение за-,
дается таблицей
0 1—s 1-s2 ... )-sc ..
Ро Pv Pi ••• Pi
Математическое ожидание этой величины равно
fl 2 t 2 t2 / 2 v
1=1 1=1 t=l 1=1
Так как Щ^ —Р^, т0 получаем выражение
Рл=1-Ро-2 Ptsl- B4)
i=i
Дисперсию т]^ запишем в форме
234 МОДЕЛИРОВАНИЕ ЕСТЕСТВЕННЫХ ПРОЦЕССОВ [ГЛ. &
Так как s/ < s при всех i^s'l, то отсюда следует, что
Dv^> < 1 - Ро - 2 |] Pisl + s 2 Pisl - р\.
Входящую сюда сумму исключим с помощью формулы B4).
Получим неравенство
Наконец, воспользуемся условием B2) теоремы, после чего
последнее неравенство превратится в B3):
3.2. Веса, учитывающие вылет из области Go. Снова
рассмотрим задачу о поглощении нейтронов из п. 1.1.
Пусть из точки г{ в направлении Q, вылетает пакет,
состоящий из большого чис-
ла Wi идентичных нейтронов.
-Обозначим через U
расстояние от точки Гх до границы
области Go (по направлению
полета, рис. 64).
Обозначим через Fi(x) функцию
рис. 64. распределения A4) длины
свободного пробега g для
одного нейтрона из пакета. Вероятность того, что нейтрон
этот вылетит из области Go, равна
В среднем из области Go вылетят т{[\— Fi(li)]
нейтронов пакета, a WiF^U) нейтронов испытают
столкновение внутри Go. Будем считать, что в следующую точку
столкновения ri+\ прилетит пакет, содержащий
Vt+^wJFiiU) B5)
нейтронов. Тогда свободный пробег ?' для того пакета
надо разыгрывать внутри Go. Это значит, что
величина |' подчиняется усеченному распределению A4) на
интервале 0<л:</< (см. п. 5.2 гл. 2). Функция
распределения |' равна
$ 3] ИСПОЛЬЗОВАНИЕ СТАТИСТИЧЕСКИХ ВЕСОВ 235
Метод обратных функций позволяет записать уравнение
для расчета ?'=|',- в виде
Л (Г) = (!-?) Л(/<) B6)!
или, по аналогии с (9), в виде
/ (%') з J Ц (г, + Qts) ds =- In
о
Определив точку столкновения пакета ri+i=rt-\-Q&'l9
разыгрываем (обычным способом), рассеялся ли пакет
или поглотился? Если он рассеялся, то количество
нейтронов в пакете после рассеяния равно
wi+l = vi+i. B7)
Если он поглотился, то количество поглощенных
нейтронов т](л2) =Vi+\. Очевидно, история пакета не может
закончиться вылетом и продолжается до его поглощения в
некоторой точке rv+i.
Если положить оуо—1> то из B5) и B7) следует, что
wi=Fo(lo)Fl(ll)...Ft^(li^)9 B8),
а случайная величина
№ B9)
/Hi
В этом случае гул равно количеству поглощенных
нейтронов, приходящихся на один нейтрон источника, и
служит оценкой для искомой вероятности рА.
Формальное доказательство равенства М*1л] = Ра имеется в § 4.
Расчетная формула такого метода Монте-Карло:
л/
где ('ЧлОв —значение ^2), полученное по траектории
номер s.
Из формул B8) и B9) видно, чтот)(л2)^1 и (по
лемме п. 1.1) дисперсия
B)
Таким образом, точность оценки у\а всегда не хуже, чем
точность оценки цА, получаемой при имитации поведения
236 МОДЕЛИРОВАНИЕ ЕСТЕСТВЕННЫХ ПРОЦЕССОВ [ГЛ. 6
нейтронов. Правда, расчет величины г^ может
оказаться более трудоемким, чем расчет т]А, из-за
необходимости вычислять U.
3.3. Веса, заменяющие розыгрыш поглощения и учи*
тывающие вылет из области Go. Следующий способ
расчета рА объединяет особенности двух предыдущих
методов. Пусть из точки rt в направлении Qi вылетает пакет»
состоящий из большого числа wf идентичных нейтронов.
Если (как в п. 3.2) w([l—Fi(li)] нейтронов пакета
вылетают из области Go, то в следующую точку
столкновения /\-+i = ri+?l- Qi прилетит всего vi+i = wiFi(li)
нейтронов (длина пробега |,- определяется из уравнения B6)).
А теперь, как в п. 3.1, будем считать, что
нейтронов при столкновении поглотились, а
нейтронов рассеялись и продолжают полет по
направлению Qi+\. При таком способе расчета все траектории
оказываются бесконечными и не могут закончиться ни
вылетом, ни поглощением. На практике расчет
продолжают до тех пор, пока вес пакета wt не станет
пренебрежимо малым, например меньше некоторого заданного
числа е.
Если использовать обозначение A9), то, выбрав
шо=1, получим, что
wi=F0(l0)slFl(ll)s2...Fi-l(li-l)su C0)
а количество поглощенных за всю историю пакета
нейтронов равно
^ = 2 vl+i (I - si+l). C1)
1=0
Формальное доказательство того, что М^л3) =/?л>
имеется в § 4. Формула для оценки рА, очевидно, запишется
так:
Где (t]^3))s —значение ^3)на траектории номер
§ 3] ИСПОЛЬЗОВАНИЕ СТАТИСТИЧЕСКИХ ВЕСОВ 237
Из формулы C1) видно, что т]^ ^0. Чтобы доказать,
что т]У^1, представим эту величину в виде
¦= F о ('о) - 2 Л> do) ---Ft (/,) A - Fi+l (li+l)} Sl ... s/+1;
тогда, очевидно, т]д3) ^Fo(/o)^l и по лемме п. 1.1
дисперсия Dv^3) < Dy^-
Доказательство. Формулу C1) запишем в виде
оо оо
В первой сумме выделим первое слагаемое, а в остальных
слагаемых заменим индекс i на t-fl:
1=0
Подставив это выражение в предыдущее равенство, получим
i=--0
i=--0
что и требовалось доказать.
3.3.1. На рис 65 приведены схемы расчета одного звена
траектории во всех четырех методах оценки р А. Номер @) соответствует
методу п. 1.1, номера A), B) и C) — методам пп. 3.1, 3.2 и 3 3.
Нетрудно заметить, что основное различие в количестве вычислений
связано с тем, что в методах @) и A) нужно проверять условие
«^•+1еС0»,а в методах B) и C) приходится вычислять ^и^. (/()ш
Кроме того, в методах @) и B) на расчет одного звена
траектории затрачиваются 4 случайных числа у» а в методах A) и
C) — только 3. Остальные различия сводятся к нескольким
элементарным арифметическим операциям.
Некоторые пояснения к схемам на рис. 65. По условию задачи
точка го задана; в методах A), B) и C) заданы также доо=1, а в
методах A) и C), кроме того, полагаем hQ==0. Величина /г/ —это
суммарное количество поглощенных в точках rli...tri нейтронов.
238
МОДЕЛИРОВАНИЕ ЕСТЕСТВЕННЫХ ПРОЦЕССОВ
[ГЛ. в
¦с*
«or
Jl
—
ft?
A
+
li
3
о
s
¦C*
<N,
I
-i;
§ 3] ИСПОЛЬЗОВАНИЕ СТАТИСТИЧЕСКИХ ВЕСОВ 239
Во всех методах Qo выбирается случайно (формула A5) гл. 2);
Qj разыгрывается по плотности р (riy Q^ j; Qy величина s( a
2Л')/2(')
2ЛJ)
В методах @) и A) пробег s, определяется из уравнения
^/(^i) = ^ a rH-l ==/'t+ h®i» в методах B) и C) пробег
i\определяется из уравнения Ft [%t) = yFi (/,), a rtj_x = rt + l[Qt (lL—
расстояние от точки rj до границы Go по направлению Q/).
Замечание. Из рис. 65 видно, что количество вычислений в
методе A) не больше, чем в методе @). Поэтому из A8) вытекает,
что для рассматриваемой задачи алгоритм, использующий оценку
г)^\ всегда более экономичен, чем алгоритм, основанный на
имитации процесса, использующий оценку г\А.
3.4. Различные статистические веса. Величины wt9
использованные в пп. 3.1, 3.2 и 3.3, называют весами
(или статистическими весами). И вместо того чтобы
говорить о пакете, содержащем w{ нейтронов (число ш<
обычно дробное!), говорят о нейтроне с весом wu При
движении нейтрона по траектории вес его меняется.
3.4.1. Расщепление траекторий.
Использованные выше рассуждения (с пакетом идентичных
нейтронов) показывают, что после очередного столкновения
в точке п вместо одного нейтрона с весом wt можно
рассматривать га идентичных нейтронов, вес каждого
из которых равен wjin. Таким образом, траектория
нейтрона после точки г{ как бы расщепляется на m
траекторий, каждая из которых дальше строится независимо.
Этот прием используют для лучшего учета
прохождения нейтронов в некоторых «важных» областях.
3.4.2. Случайный обрыв траекторий. Этот
прием в каком-то смысле противоположен
предыдущему: после очередного столкновения в точке г{ для
нейтрона с весом Wi можно разыграть дополнительную
альтернативу: либо с вероятностью р вес нейтрона
увеличивается и становится равным wjp, либо с вероятностью 1—р
нейтрон «гибнет», и траектория заканчивается.
Действительно, в среднем при такой процедуре вес нейтрона
остается прежним:
{wjp) -P+Q- (l—p)=wt.
Случайный обрыв траекторий используют в тех
случаях, когда вес нейтрона становится весьма малым и
продолжать рассчитывать его траекторию «невыгодно»:
240 МОДЕЛИРОВАНИЕ ЕСТЕСТВЕННЫХ ПРОЦЕССОВ [ГЛ 6
вклад от всех последующих столкновений сравнительно
невелик, а вычислений много; и в то же время
пренебречь таким весом нельзя.
3.4.3. Систематическая выборка. Рассмотрим
источник нейтронов с энергией EQ и равновероятными
направлениями скоростей, распределенный в области Go
с плотностью р(г). Требуется промоделировать N
нейтронов из этого источника.
Вместо того чтобы независимо разыгрывать
начальные положения всех этих нейтронов в соответствии
с плотностью р(г)у можно разбить Go на т
непересекающихся областей
Go=Goi+Go2+ .. .+GOm
и выбрать в них по Nu N2> ..., Nm начальных
положений (сумма Ni+.. .+Nm не обязана равняться /V). При
этом нейтронам, у которых ro^GOk, придется приписать
начальные веса
§(r)dr, C2)
так, чтобы сумма начальных весов всех Ni-^...-{-Nm
нейтронов равнялась
Заметим, что начальные направления для каждого
из этих нейтронов можно выбирать независимо,^
плотность распределения г0 внутри GOk равна р (г)/ j p {r) dr.
%
3.5. Статистические веса и существенная выборка.
Обоснование статистических весов в простейших задачах
может быть получено при помощи метода существенной
выборки (гл. 3, п. 3.2). В самом деле, пусть требуется
вычислить математическое ожидание Mf(Q), где
случайная точка Q=(§i, ¦¦., §п) имеет плотность pQ(xu
• •., хп), определенную во всем я-мепном пространстве.
Можно ввести любую другую случайную точку #=
= (Ль ..., т]п) с плотностью/?я(*1 %), допустимой по
.отношению *к произведению f(x,..., xn)pQ(xi9...> xn), и
§ 31 ИСПОЛЬЗОРЛНИЕ СТАТИСТИЧЕСКИХ ВЕСОВ 241
заменить расчет M/(Q) расчетом Wf(H)w(H)], где
w(H)=pQ(H)/pH(H), C3)]
ибо
M[f(H)w(H)]=$f(P)w(P)Pu(P)dP =
здесь Р= (хи ..., хп). Если координаты гц, ..., т]п
моделируются последовательно, с использованием условных
плотностей (п. 2.2 гл. 2), то из тождеств
¦п ~. ( y y \ /^*•fv*^^^«-lv*lv*\ 71 *• (v I v* v i\
HQ \л1 i • • • f лп) — /'?i \Л1) Н$> \Л2 1 Л1/ • • • гьп \xn I •*!»••• 1лп— 1/
и /7/^ (хг, ..., xn) = /7T|l (Xj) Рц2 (х21 ^). 4. р<цп (хп | #i,..., #л—i)
вытекает, что «вес» равен
Рр (Н) Р|, ("Hi) /^i, (Ли I Лт) ^л (^ifHi*' "» ^n—l)
Вычислить вес можно рекуррентно, используя формулы
Wq=, 1; до,= ^-1 , г,
Именно так вводились в гл. 5 величины Wit которые там
назывались весами.
Обычно на практике считают, что введение весов
приводит к уменьшению дисперсии, если w<\. Эта
рекомендация требует пояснения, так как во всем пространстве
неравенство w<\ невозможно: оно равносильно
неравенству pQ<ipH, которое противоречит требованию
нормированности плотностей. В действительности
желательно, чтобы неравенство w<.\ выполнялось в той
части В пространства, которая вносит основной вклад в
интегралы M/2(Q) и М [Р (Я) w2 (//)]; тогда
(P) Рч (P)dP~]j Г (Р) pQ (P)dP,
= J /2 (Р) Ш (Р) PQ (Р) ^Р ^ J f (Р) Ш (Р) PQ (P) ^Р <
и, следовательно, D[f(H)w{H)]<Df{Q).
16 И. М. Соболь
242 МОДЕЛИРОВАНИЕ ЕСТЕСТВЕННЫХ ПРОЦЕССОВ [ГЛ 6
Во многих практических задачах выполнение этого
условия гарантируется тем, что f(P) ФО только в
некоторой части фазового пространства, и как раз в этой
части w(P)<Cl. Например, в задаче п. 1.1
распределение нейтронов, вылетевших из области Go, на величину
рА не влияет. Введя веса, учитывающие вылет из области
(п. 3.2), мы исключаем моделирование нейтронов вне Go
и получаем метод расчета, в котором всегда ш<<1.
3.6. Метод подобных траекторий. Нередко
приходится рассчитывать методами Монте-Карло серии
геометрически подобных задач. В такой ситуации можно
ограничиться моделированием случайных траекторий лишь для
одной из этих задач, а траектории для всех других задач
получать преобразованием подобия. Этот метод был
предложен К. Мортоном [161], который, моделируя
прохождение нейтронов через однородную пластинку
толщины А=1, вычислял вероятности прохождения p(h) для
целой серии однородных пластинок и даже оценил
производную dp/dh при /i=0. Дальнейшее развитие
метода имеется в [8, 95]. Обоснование его следует из
§ 4 гл. 3.
В качестве примера рассмотрим задачу о
поглощении нейтронов из п. 1.1. Предположим, что требуется
вычислить вероятности поглощения рА(к) для серии
однородных областей G0(X) с центром подобия в источнике
г0 (рис. 66), X — коэффициент подобия. Расчет
траекторий Т в Go A) будем осуществлять методом п. 1.1 или
З.1., а траектории V в G0(k) будем считать подобными Г.
Нетрудно заметить, что направления звеньев
траекторий Г' и судьбы нейтронов при столкновениях в точках
этих траекторий окажутся разыгранными правильно,
так как законы рассеяния и поглощения во всех
точках одинаковы*). Однако длины звеньев траекторий Т
будут разыграны неверно.
В самом деле, длина свободного пробега \' для
траектории V должна выбираться в соответствии с
плотностью
Pl(x) =Ze-*\
*) Метод подобных траекторий применим также в задачах, в
которых учитываются потери энергии нейтронов при столкновениях:
потери в точках траекторий Т' будут такими же, как в
соответствующих точках траекторий Г,
ИСПОЛЬЗОВАНИЕ СТАТИСТИЧЕСКИХ ВЕСОВ
243
Вместо этого мы полагаем ?' равным Я?, где пробег 5
для траектории Т имеет ту же плотность ръ(х), так чю
плотность hi равна
Согласно C3) этот произвол надо компенсировать
весовым множителем
Поэтому, если на траектории V из точки г\ по
направлению Qt вылетел нейтрон с весом w\, то надо считать,
Рис 66.
что в точку п+\=Г1 QiXli прилетит нейтрон с весом
Если расчет ведется методом п. 3.1, то после учета
поглощения в точке ri-fi останется нейтрон с весом
w'i+x^w'i&Wkeb-^K C4)
Для того чтобы выразить веса wL через веса wt в
области Go A), разделим C4) на A5):
244 МОДЕЛИРОВАНИЕ ЕСТЕСТВЕННЫХ ПРОЦЕССОВ [ГЛ. б
Выбрав Wo =wq= 1, получим формулу
'(Легко доказать, что последняя формула справедлива
также в случае метода п. 1.1.)
Согласно A6) количество поглощенных на
траектории V в Go(k) нейтронов равно
,,A) (я,) = ф^'
3.7. Векторные веса. При расчете многих задач нейтронной
физики (в частности, связанных с ядерными реакторами) вместо одно-
группового приближения используют более точное многогрупповое
приближение [25, 51, 53]: предполагается, что энергия каждого
нейтрона может принимать конечное число значений ?i>?2> ... >Ет-
Таким образом, в каждый момент нейтроны оказываются
распределенными на т групп. При столкновении нейтрона с ядром атома
среды возможно как «собственно» рассеяние, при котором нейтрон
остается в той же группе, так и замедление, когда нейтрон из
группы / переходит в группу k, причем &>/•
Рассмотрим задачу о поглощении нейтронов (п. 1.1) в
многогрупповом приближении. Пусть заданы числа Pj — вероятности
того, что нейтрон, испущенный источником, принадлежит группе
номер у. Задана матрица сечений рассеяния
и полные сечения для нейтронов всех групп
так что вероятность того, что нейтрон группы / при столкновении
перейдет в группу &, равна 2^/2;, а вероятность того, что он
поглотится, равна 2д/27. Для простоты будем считать, что
направления рассеянных и замедленных нейтронов (так же, как и
нейтронов источника) распределены равномерно по пространству.
Требуется вычислить вероятность поглощения р А в области GQ для
одного нейтрона источника.
Легко видеть, что метод п. 1.1 без труда переносится на такую
задачу: сперва разыгрывается энергия испущенного нейтрона, а
затем прослеживается его траектория (до поглощения или до вылета
из области Go); конечно, при каждом столкновении нейтрон может
Использований: статистических весов 245
перейти в другую энергетическую группу. Методы пп. 3.1—3.3
также применимы *).
В работе [80] использованы статистические веса более
сложного вида, и строится одна траектория для нейтронов всех групп.
Предположим, что вдоль траектории движется «большой пакет»,
содержащий нейтроны всех групп. Пусть вектор w(i) = {wi(i)t . . .
. . . , wm(i)} описывает состав пакета после столкновения в точке
Г/, так что Wj(i) —количество нейтронов, принадлежащих группе /.
Воспользуемся весами, заменяющими розыгрыш поглощения и
учитывающими вылет из области Go (п. 3.3). Фиксируем номер
одной из групп /=/о и условимся свободный пробег ?' пакета
разыгрывать по закону B6) для этой группы, так что плотность |' равна
где lt — расстояние от точки г{ до границы Go по направлению
полета ?2; **). Так как истинная длина свободного пробега для
нейтрона группы / внутри Go имеет плотность
M*)=2'« /ve )• 0<x<!i>
мо умножить количество
то, согласно C3), необходимо умножить количество таких
нейтронов на весовой множитель
C5)
Количество нейтронов группы / в пакете после столкновения мы
обозначили Wj(i). Из них в области Go останутся лишь
( -я7/Л
Wj(i) \l — е 7 нейтронов. С учетом C5) надо считать, что в точку
ri, j = ri• + V&i прилетят всего
нейтронов группы /, где множитель
*) Можно также вычислить все вероятности
поглощения—-назовем их pjA —при условии, что испущен нейтрон группы /, и
затем сосчитать величину рА — РАР\ + • • • + Р™рР т -
**) Будем писать I' без индекса iy чтобы не загромождать
изложение индексами.
246 МОДЕЛИРОВАНИЕ ЕСТЕСТВЕННЫХ ПРОЦЕССОВ [ГЛ 6
В результате столкновения в точке rt^ из этих оу-(/+1)
нейтронов часть, а именно су(* + 1) Bfl/S0 нейтронов, поглотятся,
a Uy (/ + 1) BJfe/2 ;не^тР0Н0В пеРеиДУт в ГРУППУ номер k. Из всего
пакета в группу номер k попадут
щ ('¦ +1) = 2 B*/2;)"/<* + !>
нейтронов, а количество поглощенных нейтронов равно
Нетрудно проверить, что если ввести m-мерные векторы
• ••»^fl J и диагональную матрицу
(V (!) О
О Lm (!)
то схему расчета весов можно записать в векторной форме:
w(i + l) = Sv(i + 1) C6)
при i=0, 1, 2, . . . Количество поглощенных за всю историю пакета
нейтронов выражается через скалярные произведения
C7)
В [80] в качестве /0 выбирался номер самой быстрой
группы: /о=1. Вероятно, в некоторых случаях выгоднее в качестве /0
выбирать номер самой важной (или самой многочисленной)
группы.
Формулы для расчета траектории пакета от количества групп
т не зависят. При увеличении т меняется лишь размерность
векторов и матриц в формулах C6).
Совсем другой метод введения векторных весов для решения
интегральных уравнений предложен в [61],
СТАТИСТИЧЕСКИЕ &ЕСА 24?
§ 4. Статистические веса и интегральные уравнения
4.1. Вероятность рА— линейный функционал от плотности
столкновений. Предположим, что источник нейтронов, описанный в п. 11,
излучает 1 нейтрон в единицу времени. Обозначим через z{P)
плотность столкновений за единицу времени в 5-мерном фазовом
пространстве (см. п. 2.1.1) и рассмотрим уравнение D9) гл. 5
* (« = J Кет (Р'> Р) г (Р') dP' + f(P). C8)
Область интегрирования по Р'= (г', Q') в этом уравнении: по
координате г'-— все пространство, а по Q'— все направления. Ядро
столкновений выписано на стр. 223. Свободный член f(P) —это плотность
первых столкновений. Явное выражение для f(P) приведено ниже
в п. 4.2.
Искомая вероятность поглощения рА в области Go может быть
записана в форме скалярного произведения рА = (z, if»), где
ЗС(?в(г), C9)
a %G (г) — индикатор области Go (т. е. lo^—l при
при r<?G0). В самом деле,
внутренний интеграл представляет собой плотность полного
количества столкновений в точке г за единицу времени, или, что в
нашем случае одно и то же, в расчете на один нейтрон источника;
умножив это количество на Bд/2) dr> получим количество
поглощений в элементе dr около точки г, а проинтегрировав по <70, получим
количество поглощений в области й0—также в расчете на один
нейтрон источника.
4.2. Плотность первых столкновений. Обозначим
(D =(/¦--Го)//, / = I Г — Го | -
Вероятность того, что направление скорости нейтрона, испущенного
источником, окажется в конусе da около направления ©, равна
<ico/Djt). Далее, рассуждая в точности так же, как в п. 2.1.1,
получим, что вероятность первого столкновения в элементе dP около
точки Р равна
P = ^Ц (г) в ° d№(Q-a)dQ,
откуда следует формула
= 4H7* 2 О ехР I - 12 Со + ««) 4 6 (Я - «). D0)
24$ МОДЕЛИРОВАНИЕ ЕСТЕСТВЕННЫХ ПРОЦЕССОВ (ГЛ б
Важно подчеркнуть, что приведенный в п. 1.1 алгоритм расчета
Qo и первой точки столкновения Г\ представляет собой способ-
моделирования случайной точки Qo= (rи &о) фазового пространства с
плотностью D0). Плотность оказывается нормированной из-за того,
что источник наш единичной мощности:
оо - j 2ds
(Р) dP - (j) ~ [ ^ (г) * ° ^ $ 6 (Q - co)dQ =
о
- f Vets
°
Рассмотрим теперь случайные точки столкновения Qj =
«== (г-/_4_i - &i) в фазовом пространстве и выясним, какие
траектории Qo-> Qi-> Q2-+- . ¦ соответствуют рассмотренным выше
алгоритмам расчета рА.
4.3. Имитация прохождения нейтронов как метод решения
интегрального уравнения. Из п. 4.2 следует, что при реализации
алгоритма п. 1.1 плотность начальной точки (р(Р) из гл. 5) равна f(P).
Плотность вероятностей перехода (р(Р, Р') из гл. 5) при ri ^q0
равна
Р (Qi-V Р) = Ps (/7, G,-.,; ©) / /?^, (/) 6 (Q - о),
где / = у—rf|, ю «= (г — rt-)//. Если г^ (f Go, то можно считать,
что траектория останавливается в точке Qt_i» т. е. р (Qt- j, P) =
*= б (Р — 0t_i) и Qi = Qi_l, Таким образом,
f/CCT (Р, P')/s(P) при r?G0l
б(Р' —Р) при rgG0, ( '
Очевидно, траектории Qo-> Qi-> . . .-> Qv при таком методе
расчета представляют собой траектории с поглощением типа Т\ во
всем пространстве. Поглощение (а(Р) из гл. 5) равно
« (Я) = 2а @/2 М- D2)
При геС0 можно считать, что 2Я = 2» так что а^^===^*
Согласно гл. 5, п. 3.2 оценкой функционала (if, г) служит
величина^* [/] = [/ (Q0)!p (Q,)] [if (Qv)/a (Qv)], которая в нашем случае,
когда p(P)=f(P), а г|з(Р) определена формулой C9), равна
если rv+]GGOi
если г¦ , , ^Go.
СТАТИСТИЧЕСКИЕ ВЕСА 249
Таким образом, случайная величина \]л m п. 1.1 равна Cv [/]
и ЩА = ($, г) = рА.
4.4. Веса, заменяющие розыгрыш поглощения, как метод
решения интегрального уравнения. Легко видеть, что алгоритму п. 3 1
соответствуют траектории без поглощения (типа 7*«>) во всем
пространстве, которые строятся по той же начальной плотности р{Р) =
= f(P) и плотности вероятностей перехода D1) Согласно п. 3.3
(гл. 5), в качестве оценки (я|\ г) можно выбрать величину ?*[/],
которая в рассматриваемом случае запишется как
причем W* =s{Q0)s{Qi) ... s(Qi_l). Если Vfl — первая точка
траектории, оказавшаяся вне Go, то ^(Q^—O при всех /=¦ v,
v+1, ... Поэтому сумму можно закончить членом с / = v—1:
2;
Сопоставив формулы для Wj и С*[/] с формулами B0) и
A6), нетрудно заметить, что в этом случае wt = Wt , 1}^I) =
= е*[/], следовательно, Щ^ = (ф, г) = рА.
4.5. Веса, учитывающие вылет, как метод решения
интегрального уравнения. Обозначим через G область фазового пространства,
состоящую из таких точек Я=(г, Q), что г<=G0. Так как при Р'(Е<3
ядро столкновений КСТ(Р', Р)^=0, то (п. 3.5 гл. 5) уравнение C8)
можно заменить уравнением
$ f(P). D3)
Алгоритму п. 3.2 отвечает начальная плотность р(Р) точки
== (/*!, Qo) в G такая, что
р (Р) = Dя/*Г
где /о— расстояние от источника г0 до границы области Go по
направлению Qo, l=\r—ro|, G)=(r—r0)//. Сравнивая это выражение с
D0), видим, что
P(P)=f(P)IFodo). D4)
Нетрудно также записать плотность вероятностей перехода,
соответствующую алгоритму п. 3.2:
Сравнивая эту формулу с G), получим, что
Р(Р, п^КсАР, Р'№Р9 Р'), D5)
J7 И. М. Соболь
250 МОДЕЛИРОВАНИЕ ЕСТЕСТВЕННЫХ ПРОЦЕССОВ [ГЛ б
где, как нетрудно вычислить,
V /
/(г, со') —расстояние от точки г до границы Go по направлению
вектора о)'=(г'—гI\г'—г\
В качестве поглощения в п. 3.2 выбирается истинное
поглощение: а(Р) = 2'a(/*)/^j (г)- Таким образом, рассматриваемому
алгоритму соответствуют траектории с поглощением типа 7\ внутри G.
Согласно п. 3.5 гл. 5 в качестве оценки для (ф, z) можно
выбрать величину
Ц [/] = U (Qoh'P С\>>1 К
где (см. A6) гл. 5)
a s(P) = l—a(P). Здесь v— номер точки Qv = (rv+l* ^vL B которой
траектория закончилась поглощением
С учетом выражения для /г(Р, Р') можем записать Wt в виде
Приняв во внимание формулы C9) и D4), получим, что
Наконец, сравнив формулы для Wi и gv [/] с формулами
B8) и B9), увидим, что wl = Fo (/0) W*__{ и т)^2) =1;* [/].
Следовательно,
Mi|^ =. (ф, г) = р^.
4.6. Веса, заменяющие розыгрыш поглощения и учитывающие
вылет, как метод решения интегрального уравнения. Снова
рассмотрим уравнение D3) внутри G. Алгоритму п. 3.3 отвечает та же
начальная плотность D4) и та же плотность вероятностей перехода
D5). Однако соответствующие траектории в фазовом пространстве
представляют собой траектории типа Т^ без поглощения. Для
оценки скалярного произведения (i|), г) используем оценку ?*[/] из гл. 5:
С* 1/1 = f9 (/,) v iv ;t {Q.} = у F0
0
F0
,=0 1=0
УПРАЖНЕНИЯ К ГЛ. 6 251
Однако, в отличие от предыдущего пункта, здесь
/ i / — i /—l
Сравнивая последние две формулы с C1) и C0), нетрудно
заметить, что vi+l = Wl F0(l0) и tj^) == ?*[f]. Следовательно,
4.7. Веса п. 3.3 при решении уравнения Пайерлса. В п. 1.2
изложена схема расчета критичности по поколениям Однако можно
рассчитывать критичность также по времени, сравнивая количества
нейтронов в Go через заданные промежутки времени [118] или i»o
пробегам, сравнивая количества нейтронов в Go после каждого
пробега всех нейтронов.
Нетрудно показать, что численный метод решения уравнения
Пайерлса, использованный в п. 4.4 гл 5, можно интерпретировать
как расчет по пробегам с использованием весов п. 3.3. В самом
деле, пусть на /-м шаге в Gf) оказалось N нейтронов, один из
которых— нейтрон номер 5 — расположен в точке rj и имеет вес 0;-
(индекс 5 мы опускаем). Разыграем случайное направление
скорости этого нейтрона \ij и найдем расстояние до границы шара по
этому направлению /у. Тогда, согласно п. 3.3,0.6 / нейтронов
вылетят из шара, и столкновение в точке r,_f_j испытают всего
—а/
QjFj нейтронов, где р.= 1 г ;. Из них в/^7/B</2)
нейтронов испытают рассеяние, a QjFj B//2) ВЫЗОВУТ деления, в
результате которых получится всего vOy/r/ Bf/2) нейтронов.
Всего в точке ry_j_j после столкновения окажется
нейтронов. Эта формула совпадает с соответствующей формулой
п. 4.4.1 гл. 5. Легко также проверить, что отношение количеств нейт-
. . рр,
( N \\( N \
ронов в Go, равное 2 0/,s )/( S e/+l,s совпаДает
Упражнения к главе б
1. Записать формулы для расчета методом п. 2.2.2 свободного
пробега нейтрона в многослойном шаре r2<R2n, в котором
2 = aft при R\_x <r2 <Rl> Rq == 0, RX<R2< ... < 1<п.
2. Записать формулы для расчета кофф однородного шара r2<R2
методом п 1 2. Плотность нейтронов первого поколения считать
17*
252 МОДЕЛИРОВАНИЕ ЕСТЕСТВЕННЫХ ПРОЦЕССОВ [ГЛ 6
пропорциональной 1 — {rjRJ\ предполагать,- что v = 2,5, а &эфф
близок к 1 *).
3. Записать формулу для расчета &офф однородного шара из
упражнения 2 методом поколении с помощью весов п 3.3.
4 Доказать, что плотности D4) и D5) нормированы.
5 Р1з уравнения D3) вывести уравнение Пайерлса для
плотности нейтронов п(г) в критической области Go
п {r) = J tIf ехр |- f 2(г + 03S)ds\п (r']dr/>
С I О J
где/=|г'-г|.
Указание. В критическом случае {(Р) выражается через
г(Р) при помощи интегрального преобразования с ядром
[v(r')V/ (rf)/^s(r')\ Kci{P', P)- Плотность п{г) также выражается
через г (Я), так как 2 (г) л (г) = §z(P)dQ.
*) Если ^эфф сильно отличается от единицы, то п{ либо
быстро обращается в нуль, либо переполняет накопитель ЭВМ.
Приходится искусственно пополнять или разреживать некоторые
поколения, или использовать нормировку числа нейтронов.
ГЛАВА 7
неслучайные точки в алгоритмах
монте-карло
В этой главе рассматриваются только такие методы
Монте-Карло, в которых выборочные средние
используются для оценки математических ожиданий. Сюда
относятся как методы вычисления интегралов, так и методы
расчета величин, вырабатываемых в ходе
моделирования естественных процессов: например, формула (8) гл. 5
(ф,/(/ср)да12в/тз . П)
или формула A) гл. 6
П , s***' _L ^ /иЛ (О\
Для этих методов4можно указать бесконечные
множества заведомо не случайных чисел, которые
гарантируют сходимость соответствующих алгоритмов Монте-
Карло не по вероятности, а в обычном смысле,— если
использовать эти числа вместо случайных. Такие числа
часто называют квазислучайными. Очевидно, достаточно
большие группы квазислучайных чисел в каком-то
смысле удовлетворяют определению псевдослучайных чисел,
приведенному на стр. 17. (Если проверять такие числа
с помощью тестов § 3 гл. 1, то часто результаты
оказываются слишком хорошими, например Р>0,9999).
Использование таких чисел в расчетах имеет свои
минусы и свои плюсы. С одной стороны, вероятная
ошибка перестает быть характеристикой порядка
ошибки, числа пригодны лишь для определенных классов
254 НЕСЛУЧАЙНЫЕ ТОЧКИ В АЛГОРИТМАХ [ГЛ. 7
задач и должны использоваться в определенном
порядке.
С другой — гарантирована сходимость вычислений,
не нужны статистические тесты и, самое главное,— во
многих задачах удается добиться более быстрой
сходимости: вместо ^У^УУиорядок ошибки оказывается равным
1/JV1-8 (где е>0 как угодно мало). Пренебрегать таким
выигрышем нельзя!
Отношение специалистов к квазислучайным числам различное:
одни считают, что только на таком пути можно строго обосновать
методы Монте-Карло; другие считают, что такой подход
уничтожает методы Монте-Карло... ([70, 130, 183]). Однако все алгоритмы,
изложенные в гл. 2—6 книги, сохраняют свою силу независимо от
того, какие псевдослучайные числа предполагается использовать.
Так что говорить о гибели методов Монте-Карло вряд ли стоит.
Можно не сомневаться, что и для других методов Монте-Карло
(например, связанных с расчетом средних по одной эргодичной
траектории) будут найдены достаточно удобные квазислучайные числа.
§ 1. Конструктивная размерность
алгоритмов Монте-Карло
Так же как-в гл. 3, п. 2.4, условимся говорить, что
задан метод Монте-Карло для расчета некоторой
скалярной величины а, если указана такая случайная
величина т), что ее математическое ожидание равно а:
Щ=а9 C)
и оценкой для а служит среднее арифметическое
здесь т|ь ..., г\м — независимые значения rj.
Однако формула D) не определяет алгоритма расче-.
та, так как значения одной и той же случайной
величины г) можно вычислить различными способами (гл. 2).
Так же как в п. 2.4 гл. 3, условимся говорить, что задан
алгоритм Монте-Карло для расчета величины а, если,
кроме формулы D), задана формула
, .... т(п)> ...). E)
выражающая нужную нам величину tj через
независимые случайные числа.
§ 1] КОНСТРУКТИВНАЯ РАЗМЕРНОСТЬ АЛГОРИТМОВ 255
Таким образом, формулы A) и B) определяют
лишь методы Монте-Карло для расчета величин (\|), К]ц)
и рА. А соответствующие им алгоритмы будут заданы
только тогда, когда будут записаны формулы для
моделирования всех входящих в определение 0Дг|)] и
ru величин при помощи случайных чисел f-
1.1. Алгоритмы с конечной конструктивной
размерностью.
Определение. Если функция Ф зависит от п
аргументов
то мы скажем, что конструктивная размерность (к. р.)
алгоритма D) — E) равна п.
В эгом случае для реализации /-го «испытания»
достаточно выбрать п случайных чисел Yf1}» • • •» У\п) и
вычислить по ним случайное значение
Конечно, может случиться, что при каких-то конкретных
значениях аргументов функция Ф зависит не от всех
7A),..,, 4{п)* Так что конструктивная размерность п —
это максимальное количество случайных чисел, которое
может понадобиться для реализации одного испытания.
Так как каждая из независимых величин fA\---, ^(n)
равномерно распределена в интервале @, 1),то функция
(ьч •>!/») определена в единичном л-мерном кубе
/Ся= {0<tji< 1,..., 0<уп< 1},
и случайная- точка Г=(уП),..., ч(п)) равномерно
распределена в Кп: плотность ее /?г(Уь-.., #«) = 1 при
(#i>..«» уп)^Кп* Следовательно, искомая величина г
может быть записана в форме n-мерного интеграла
по Кп:
I ... i Ф(/Л, ..^yn)dux ...dyn. F)
Мы приходим к следующей общей интерпретации
алгоритмов Монте-Карло: если конструктивная
размерность алгоритма равна п (к. р. = я), то этот алгоритм
представляет собой приближенный метод вычисления
256 ' НЕСЛУЧАЙНЫЕ ТОЧКИ В АЛГОРИТМАХ [ГЛ. 7
/г-мерного интеграла F) по случайным точкам Гг=:
^(vl1^ •• чУ\п)), равномерно распределенным в Кп
1
Здесь и ниже для краткости используется запись
J Ф (Р) dP = j ... j Ф (у,, ... уп) dyx... dyn.
,,п О О
Формула G) равносильна формулам D) и E).
Пример. Вычисляется однократный интеграл
ь
I = $flx)p(x)dx, (8)
а
где р(х) —плотность вероятностей некоторой случайной величины
|, определенной в интервале a<.v<6, с помощью простейшего
метода Монте-Карло
1 л
Если случайную величину g моделировать методом обратных
функций (п. 1.4 гл. 2), то |=G(y). Функция G(y) это обратная функция
X
по отношению к y = F(x), где F (х) = f р (/) dt. Замена y = F{x)
а
преобразует интеграл (8) к виду
I = \f{G(y))dy.
о
Очевидно, в этом случае O — f(G(y)) и к р равна 1.
Однако, вообще говоря, для моделирования | можно нспользо*
вать какую-нибудь формулу вида ?=#(уь ... ,Уп) (§ 4 гл. 2).
Согласно B5) гл. 2 (ср. сноску на стр. 52) в этом случае
1 1
р (х) = Г ... f б (х — g (ylt ..., уп)) dy1 ... dy .
о о
Подставив это равенство в (8) и поменяв порядок
интегрирований — сперва по х, а потом по у\9..., уп — получим, что
1 1
Таким образом, в этом случае Ф=/(?(#ь ... , уп)) и к. р.
равна п.
§ 1) КОНСТРУКТИВНАЯ РАЗМЕРНОСТЬ АЛГОРИТМОВ 257
1.2. Алгоритм с бесконечной конструктивной
размерностью. Такие алгоритмы встречаются довольно часто
при моделировании физических задач. Например, в
задаче о поглощении нейтронов (гл. 6, п. 1.1) траектория
нейтрона может (теоретически) состоять из сколь
угодно большого числа звеньев, так что нельзя указать
заранее, сколько значений тA), ..., •у<п),... понадобится нам
для реализации такой траектории.
Алгоритмы с к. р., равной оо, получаются также при
моделировании случайных величин методами отбора
(гл. 2, § 5), когда количество значений у, используемых
для реализации одного значения tj, случайно и
(теоретически) может оказаться сколь угодно большим.
Пример. Рассмотрим снова вычисление интеграла (8).
Предположим, что р(х)^.с и значения ? вычисляются методом Неймана
(гл. 2, п. 5 3):
g = a+F—я)у, если су'<р(а+(Ь—а)у)\
если последнее неравенство не выполнено, то пара случайных чисел
(у, y') отбрасывается и выбирается новая пара.
Нетрудно проверить, что в этом случае
где функция g (#i, yv ..., yk> yk <¦> ...) определяется следующими
условиями:
если су\ > р (gi), ..., cyk_x > p (gJz__i)>
но cy'k<p(gk)> то g = gk.
где (для краткости) мы обозначили gk величину
a+(b—a) yk\
>fe ===== 1, 2, ... (Конечно, при желании можно ввести единую
нумерацию переменных). И в этом случае ф=/(?), так что к. р. = оо.
Запишем (формально; строгое определение имеется в [82])
интеграл по бесконечномерному единичному кубу, в котором все
0< yk<l, °<Ук< 1-
1 1
/ =Г .Г...
Q О
258 НЕСЛУЧАЙНЫЕ ТОЧКИ В АЛГОРИТМАХ [ГЛ 7
и докажем, что /«> = /. Для этого представим /«, в виде бесконечной
суммы интегралов по областям, в которых g—gk1
р jgt) p (Яг)
1с .11 ,1с
+ f f *У1*У\ f I
о п (gt) о о
... f f Л//г_1<%_1 f f f(gk)dykdy'k+...
Здесь каждый из интегралов вида
1с 1 !
f f / (8к) ЛУь йУ'к = f / (rt + (^ - a) У к) ~P(a + (b — a) yk) dyk
bo о
легко вычисляется с помощью замены x = a+(b—a) yk и равен
где э — эффективность метода Неймана А каждый из «наружных»
интегралов равен
11 1 г Т
f f ^й^л= Г 1—-Р(«Ч-(& —«)УЛ) \dyk = \-9.
о р (gk) bl c J
f
о р (gk)
с
Следовательно,
Реализация алгоритмов Монте-Карло с к. р. = оо на
практике затруднений не вызывает, если предполагать,
что в расчете используются «настоящие» случайные
числа ч- Иногда каждое испытание доводят до конца, и
количество использованных случайных чисел оказывается
конечным (хотя и случайным). Иногда расчет испытания
прекращают после выполнения некоторого условия.
Например, при решении интегрального уравнения можно
$ 21 п МЕРНЫЕ ПСЕВДОСЛУЧАЙНЫЕ ТОЧКИ 259
ограничиться конечным (фиксированным) числом членов
ряда Неймана, а при использовании алгоритма п. 3.3
гл. 6 учесть условие обрыва wh<e. В этой ситуации мы
по существу аппроксимируем алгоритм с к. р. = оо
алгоритмом с к. р. = /г0. Величина п0 зависит от допустимой
погрешности расчета и может зависеть от общего
количества испытаний N или даже от конкретных значений
7, использованных во время расчета. Поэтому оценка п0
иногда весьма затруднительна.
Значение к. р. играет важную роль, когда мы в
качестве случайных значений y хотим использовать
неслучайные (детерминированные) числа. В этом случае алгоритм
с различными к. р. приходится рассматривать отдельно.
§ 2. /г-мерные псевдослучайные точки
2.1. Равномерно распределенные последовательности.
Рассмотрим произвольный алгоритм Монте-Карло с
к. р. = п и соответствующую ему функцию Д>{у\, .• •, #»)•
Как мы видели в п. 1.1, этот алгоритм сводит решаемую
задачу к вычислению интеграла G).
Естественно поставить вопрос: нельзя ли указать
неслучайную последовательность точек Pi,..., Ри... из Кп
такую, что
1 N
J Q>(P)dP = lim д- УФ(Рд (9)
К
для всех функций Ф из достаточно широкого класса?
Определение. Последовательность точек Ри ...
... , Ри ... называется равномерно распределенной в Кп>
если соотношение (9) справедливо для любой функции
Уь ¦•¦ , Уп), интегрируемой в Кп по Риману*).
Понятие это было введено в 1916 г. Г. Вейлем [182],
который построил также примеры равномерно
распределенных последовательностей.
*) Напомним, чю интеграл Римана определяется только для
ограниченных функций.
Однако автор книги недапно доказал, что если выбратьРс = Qc
(см. п. 2.4.2), то формула (9) справедлива также для функций Ф(Я)
с любыми степенными особенностями вида у\~ ... */~ • гдо
Pi<l, ... , Рл<1 (см. Докл. АН СССР 2!0, Кя 2, 1073 г., 278-281).
260
неслучайные точки в алгоритмах
[ГЛ. 7
Сопоставление формул (9) и G) показывает, что для
реализации алгоритмов Монте-Карло с к. р. — п можно
попытаться вместо случайных точек 1\ использовать
точки равномерно распределенной последовательности Р,-.
Для этого надо при реализации 1-го «испытания» вместо
случайных чисел уМ, ..., у\п) использовать декартовы
координаты yi%\, ..., yi>n точки Рг. Соотношение (9)
гарантирует сходимость такого способа вычислений для
большинства встречающихся на практике алгоритмов.
Легко заметить, что равенство (9) не нарушается, если
изменить в последовательности Рь . • ¦ , Ри ... любое
конечное число точек. Однако сходимость средних к
пределу может при этом очень замедлиться. Поэтому далеко
не каждую равномерно распределенную
последовательность разумно использовать на практике в качестве
псевдослучайных точек. Среди всех равномерно
распределенных последовательностей следует отобрать в некотором
смысле (см. ниже п. 2.2) «хорошие». Отыскание таких
последовательностей обычно наталкивается на серьезные
трудности.
Например, еще Г. Вейль доказал, что любые
последовательности точек с декартовыми координатами
где 0|, . . . , 0^ —алгебраически независимые иррациональные чпс-
ла, равномерно распределены в Кп . Но ни одного «хорошего»
набора 9|, . . . , Qn при /г>2 до сих пор не известно. (На рис. 67, а
изображены точки Ри . . . , Piq в квадрате, полученные при 0! =
У 2/2, 02=}//2.)
§ 2] я-МЕРНЫЕ ПСЕВДОСЛУЧАЙНЫЕ ТОЧКИ 261
2.2. Геометрическая характеристика равномерно
распределенных последовательностей. Обозначим через G
произвольную /7-мерную область, принадлежащую Кп,
а через VG— ее объем (я-мерпый). Обозначим через
SN(G) — количество точек с номерами 1^/^iV
принадлежащих G.
Теорема (Г. Вейль). Для того чтобы
последовательность точек Ри ... , Ри ... была равномерно
распределенной в К'\ необходимо и достаточно, чтобы для
любой области G
. _ = VQ. (Ю)
Отсюда видно, что при больших N количество точек,
принадлежащих G, среди точек Рь ... , Pn,
приблизительно пропорционально объему VG.
Рассмотрим случайную точку Г, равномерно
распределенную в Кп, и N ее независимых реализаций Гь ... , IV
Так как вероятность P{r€EG} = l/G> то сходимость
частоты попадания этих реализации в G к вероятности
попадания означает, что
Сравнение этой формулы с A0) снова показывает, что
точки равномерно распределенной последовательности
являются аналогами независимых
реализаций случайной точки Г.
Мы уже отмечали, что не все
равномерно распределенные
последовательности одинаково хорошо
распределены. Оценить
«равномерность» распределения можно при
помощи величины, называемой
отклонением. Чтобы определить ее,
выберем в /С1 произвольную точку Р
и обозначим через ПР параллелепи- Рнс Г)8
пед с диагональю ОР и со
сторонами, параллельными координатным осям (рис. 68).
Отклонением группы точек Ри ... , PN называется
величина
Da -sup |SA A1,,) - NVU |. 00
262 НЕСЛУЧАЙНЫЕ ТОЧКИ R АЛГОРИТМАХ [ГЛ 7
Следующая теорема легко вытекает из работ Г. Вейля:
Теорема. Для того чтобы последовательность точек
Ри • •• Pn, ••> была равномерно распределенной в /(",
необходимо и достаточно, чтобы
lim (DN/N) = 0.
2V->oo
Очевидно, чем быстрее убывает отношение DN/Ny тем
более равномерно распределена последовательность").
Можно доказать, что l/2^DN^Ny но неясно, каков
наилучший порядок роста DN при N-+-oo. В настоящее
время известны лишь два класса последовательностей
точек в Кп> для которых при всех N
DK = O(\n«N). A2)
Это последовательности Холтона и ЛПт-последователыю-
сти. Примеры таких последовательностей — Pi и Qi
приведены ниже в п. 2.4. Существуют ли
последовательности, для которых DN — o(lnnN) при всех N неизвестно.
Однако для точек Q\ , ..., Q/v при N=2m отклонение
равно DN = O(lnn~lN).
В книге [82] изучается другая количественная характеристика
расположения группы точек Рь . . . , PNy называемая
неравномерностью ср^ = Фо^Яь • . . , PN). Для нее справедлива теорема,
аналогичная предыдущей: для того чтобы последовательность точек
Ри ¦ . . , Р N была равномерно распределенной вКп, необходимо и
достаточно, чтобы lim (фоо/Л7)=0.
Можно доказать, что l^y^^N. Поэтому наиболее
равномерно распределенными следует считать такие последовательности,
неравномерности которых при всех N ограничены. Среди известных в
настоящее ьрсмя последовательностей точек в Кп лишь
«^^последовательное! и обладают этим свойством:
ФвоЮГ* ....<&)< О (л ,т). A3)
Для последовательностей Холтона получена только более слабая
оценка: Ф^ = O(lnn^V).
*) В литературе часто отклонением называют отношение DN /N,
так как это есть верхняя грань отклонений эмпирической функции
распределения 5^ {Up)/N точек Р{, ..., PN от теоретической
функции распределения случайной точки Г, которая в точке Р равна
Vjlp* Ср. также упражнение 8 гл. 1.
§ 2] я МЕРНЫЕ ПСЕВДОСЛУЧАЙНЫЕ ТОЧКИ 263
2.3. Ускорение сходимости. Формула (9) справедлива
для всех интегрируемых по Риману функций Ф (уи..., уп).
Если рассмотреть более узкие классы функций, то
возможны оценки погрешности этой формулы. Например,
неравенство
% A4)
где с(Ф) ни от N, ни от точек Р{ не зависит, справедливо
для любых Р\, ... , PN и для всех функций Ф(уь. ¦., Уп),
которые непрерывны и ограничены в Кп вместе со своими
частными производными, содержащими не более одного
дифференцирования по каждой переменной. (Все эти
производные можно записать формулой диФ1ду-к ... d{J\k>
где l^/i</2<... </ь^л и k может принимать
значения 1, 2,..., п. Старшая среди этих производных,
дпФ/ду{ ... дуа).
В сл\чае /г=1 доказательство неравенства A4) аналогично
дока чат е лье ту теоремы 5 г л 3. В самом деле, пусть с'(Ф)==
1
= J |Ф'(х) \dx. Тогда,полагая в D6) стр. 128 / = Ф, получим, что ка-
о
ковы бы ни были точки хи ..., хм »з .прервала @,1)
[ф^^
с (Ф) ' <ф) D
N
0 < к
Однако алгоритмы Монте-Карло весьма часто
приводят к разрывным функциям Ф. Поэтому важно отметить,
что оценка A4) справедлива для гораздо более широких
классов функций (Э. Хлавка [138], И. М. Соболь [82]).
Например, если все разрывы функции Ф(#ь ... , уп)
расположены на конечном числе гиперплоскостей вида
///( = const (т. е. параллельных координатным
гиперплоскостям), а в остальных точках куба Кп функция Ф и все
вышеупомянутые производные непрерывны и ограничены,
то неравенство A4) выполнено.
Интересно, что разрывы, возникающие при
моделировании дискретных случайных величин и при
использовании метода суперпозиции (гл. 2, п. 3.3) как раз такого
типа. Напротив, при использовании метода Нейман?
264 НЕСЛУЧАЙНЫЕ ТОЧКИ В АЛГОРИТМАХ [ГЛ 7
(гл. 2, п. 5.3) возникают разрывы, которые не обязаны
располагаться в гиперплоскостях, параллельных
координатным.
Пример Снова предположим, что вычисляется интеграл (8),
а случайная величина | моделируется методом суперпозиции:
6 = Gk (y<2)), если ct+ ...+ cft_, < 7(" < Ci + • • • + Ч,
(Gf (у)—обратная функция но отношению к Fk(x)). В этом случае
/е — 1 к
2 ir
/-1 /-=1
так что Ф(У\, г/г), вообще говоря, имеет разрывы при у — си У — с
2,
В этом же случае метод Неймана (см. пример п. 1.2) приводит
к функции Ф = /(?(*/ь У\у •••))» которая разрывна при cyk=^
b-a) yk)t 6=1, 2, . . .
Если в A4) подставить Pt=P* или Pi=Qi , то в
соответствии с A2) правая часть окажется порядка
O(AHlnNV). Так как при всех достаточно больших N
справедливо неравенство lrrN<;iVe (при любых
фиксированных п^\ и е>0), то можно сказать, что
погрешность A4) убывает быстрее, чем N~{l~B) с любым г>0.
Напомним, что порядок погрешности формулы G) с
«настоящими» случайными точками равен N~l/2y т. е. заметно
хуже.
Численный пример, сосчитанный с помощью точек Q*,
имеется в гл. 5, п. 4.4.1. См, также [13а].
Заметим, что порядок сходимости формулы (9) не
может быть o(N~l) даже на весьма узких классах функции
(см. упражнение 5 на стр. 278).
2.4. «Хорошие» псевдослучайные точки.
2.4.1 Последовательность Холто на Pi. Для
построения этой последовательности необходимо
определить числовые последовательности pr(i). Фиксируем на-
турплыюе число г^2.
Определение. Если в r-ичной системе счисления
/ = rtlf,aTO_i ... а2аи то снова в r-ичной системе
/?,(/)== О, а{а2 ... am-iam.
Здесь все о,. — целые г-нчпые цифры, т. е. равны одному из
значений 0, 1, 2, . . . , г— 1. В десятичной системе последние две
п МЕРНЫЕ ПСЕВДОСЛУЧАЙНЫЕ ТОЧКИ
265
формулы выглядят так:
Первые 10 значений Рз@ приведены в табл. 1.
i
i троичн.
p3(i) троичн.
1
1
0,1
1/3
2
2
0,2
2/3
3
10
0,01
1/V
4
11
0,11
4/9
5
12
0,21
7/9
6
20
0,02
2/9
7
21
0,12
5/9
8
22
0,22
8/9
Та бл
9
100
0,001
1/27
и ц а 1
J0
101
0,101
10/27
Пусть гь..., гп — попарно взаимно простые числа.
Последовательностью Холтона называется
последовательность точек в К11 с декартовыми координатами
(РгЛО, ¦.., Prn(i)),i=l,29 ...
Эти последовательности были построены Дж. Холтоном
[131], получившим для них оценку A2). Все такие
последовательности равномерно распределены в Ка.
На практике обычно в качестве гь ..., гп выбирают
первые п простых чисел: ri = 2, г2 = 3, г3=5, ... и
используют /г-мерные точки
2.4.2. ЛПХ'П оследовательность Qt-. Свойства
Л/7т-последовательностей подробно изучаются в [82].
Здесь мы укажем лишь алгоритм для расчета точек
Q/ = (qi% 1 • • • • • qt% n), f = 1, 2, ...,
образующих ЛЯт-последовательность. Программа
расчета на ЭВМ БЭСМ-4 имеется в [86].
Определение. Если в двоичной системе счисления
i=emem-\ ... е2еи A5)
то для всех у = 1,2, ..., п
qt.,= eiV}l)*e%Vf.....emV}m). A6)
Здесь ей ... , ^т—двоичные цифры, каждая из
которых равна 0 или 1. В десятичной системе
11. Д\. Соболь
266 НЕСЛУЧАЙНЫЕ ТОЧКИ В АЛГОРИТМАХ [ГЛ 7
Числа V/s) можно найти по табл. 6 (стр. 297), которая
позволяет вычислить более 2-106 точек Q/* в кубе Кп
размерности я^13. Звездочкой (*) обозначена операция
поразрядного сложения по модулю два в двоичной
системе.
Более подробно, чтобы вычислить «сумму» о*/?, надо оба
слагаемых записать в двоичной системе
тогда в двоичной системе
а * Ь — О, схс2 ... г^,
где ck — (яуг + ЬЛ (mod 2) или, другими словами, ck = 1, если
afc ^ ^ и ck = 0, если ak = bk.
В системе команд любой ЭВМ имеется специальная команда,
осуществляющая операцию *. Обычно ее называют командой
сравнения. Она относится к числу логических команд и выполняется
быстрее, чем арифметические команды. Вообще, для расчета по
формуле A6) нужны лишь логические команды (произведение скУ^
либо равно V*jkK если е^ = 1, либо равно нулю, если <??=0).
Пример. Вычислить первые 10 точек Qt в трехмерном к\бе.
По табл. 6 (стр. 297) находим нужные значения \^< Они написаны
в табл. 2.
Вычисления по формуле A6) сведены в табл 3.
Результаты в десятичной системе:
Q* - A/2, 1,2, 1 2), Ql = C/8, 3 8, 5/8),
(? = A/4,3/4, 1/4), (? = 17,8,7/8, 1/8),
Ql =C/4, 1/4, 3/4), Ql = A/16, 15/16, Ц/16),
Q'l - A/8, 5/8, 7/8), Ql = (9/16, 7/16, 3/16),
Q! - E/8, 1/8, 3/8), Q*o = E/16, 3/16, 15/16).
На рис. 67, в изображены точки Q{ , ...,QJ6 в квадрате, а на
рис 67, 6—16 «настоящих» случайных точек.
Замечание. Хотя табл. 6 на стр. 297 рассчитана
на к. р. ^13, ее можно иногда использовать при любых
к. р., даже к. р. = оо. В качестве значений недостающих
координат псевдослучайных точек можно выбирать
обычные псевдослучайные числа *у, так что, например,
п МИРНЫЕ ПСЕВДОСЛУЧАЙНЫЕ ТОЧКИ
267
Целесообразно вычислять по qui наиболее существенные
переменные в Ф(у\, ... , уп,\..), а по y\j)—все
остальные. Если в действительности существенных координат
немного, то такой способ расчета может ускорить
сходимость (по сравнению с расчетом по формуле G)).
(Двумерные точки, у которых одна координата случайная,
а вторая детерминированная использовались в [18].)
Таблица 2
В десятичной системе
\
1
2
3
1
1/2
1/2
1/2
2
1/4
3/4
1/4
3
1/8
5/8
7/8
4
1/16
15/16
11/16
В
>v S
1
2
3
двоичной системе
1
0,1
0,1
0,1
2
0,01
0,11
0,01
3
0,001
0,101
0,111
4
0,0001
0,1111
0,1011
Таблица 3
г
1
2
3
4
5
()
7
8
9
10
{ДВ
1
10
И
100
101
110
111
1000
1001
1010
у№
r j
т/A)* уB)
F(.3)
j
у О)* у [В)
уB)* уC)
i j
y(i) *yB)*
Y j i
*FC)
;
FD)
yO)* j/D)
^(.2)* у D)
0,1
0,01
0,1*0,01 =
=0,11
0,001
0,1«0,00| =
=-0,j()l
0,0! 0,001 =
=0,011
0,1 0,01*
• 0,001=0, 111
0,00:)l
0,l*0,c001 =
=0,1001
0,010,0001=
,-0,0101
0,1
0,11
0,l,U=
=0,01
0,101
0,4*0,101 =
=0,001
0,11*0,101 =
= 0,011
0,1*0,11*
*0,101=0,111
0,1111
0,1 0,1111 =
=0,0111
0,11 0,1111 =
=0,0011
0,1
0,01
0,1-0,01 .-=
-0,11
0,111
0,10,111-
=0,011
0,01^0,111--^
=0,101
0,li0,0l*
-0,111=0,001
0,1011
0,1 -0,1011 =
=0,0011
0,01*0,1011=
=0,1111
18*
268
НЕСЛУЧАЙНЫЕ ТОЧКИ В АЛГОРИТМАХ
[ГЛ 7
2.4.3. Общие требования. Если подходить к вопросу
более строго, то от хороших псевдослучайных точек естественно
потребовать, чтобы:
1° асимптотика D N или ф^была наилучшей (или хотя бы
близкой к наилучшей);
2° константы в A2) или в A3) были наилучшими (или хотя бы
достаточно малыми);
3° значения DN/N или cpoo/iV были небольшими уже при
небольших N;
4° алгоритм расчета этих точек на ЭВМ был достаточно
простым.
К сожалению, проверить все эти требования в настоящее
время невозможно, так как наилучшие значения констант A3)
неизвестны (а для DN неизвестен даже наилучший порядок
роста).
Однако первому требованию в какой-то мере удовлетворяют
точки Р. и вполне — точки Q*t ¦ При небольших п второму и
третьему требованию удовлетворяют точки Q*. Наконец, время расчета
точек Q. того же порядка, что время расчета стандартных
псевдослучайных точек 1\. (если только имеется готовая таблица У/ч)).
Для расчета точек Р* нужны лишь п простых чисел, но по
сравнению со временем расчета Q^ время расчета Рс примерно в п раз
больше.
2.5. Замечание о роли дисперсии. В расчетах,
выполненных по точкам Qf, фактическая ошибка часто
оказывается на порядок меньше вероятной.
Пример. Рассмотрим значения (А'31, 0) ^ при N=2m,
приведенные в табл. 1 гл. 5 (стр. 192). Условимся считать последнее
значение, соответствующее yV = 214,
д точным. Фактические ошибки 6Л =-¦
= \(K*\t$)N-K*l.№\
выписаны в табл. 4. Рядом приведены »с-
роятные ошибки г^ = 0,675 V D03/A\
где дисперсия D03=57,3.
Очевидно, bN заметно меньше, чем г д..
Не следует думать, что
если дисперсия не
определяет ошибку, то все приемы
гл. 3, 4, направленные на
уменьшение дисперсии,
теряют смысл. Во-первых,
алгоритмам с меньшей
дисперсией отвечают функции Ф с меньшим изменением,
которые, вообще говоря, интегрируются лучше.
Л
V
•)<)
210
•;и
212
213
<кч. i)/V
8,3510
8,3381
8,2746
8,2840
8,2837
8,2770
8,2723
0.079
0,066
0,002
0,012
0,011
0,005
—
0,32
0,22
0,16
0,11
0,08
0,06
0,04
/2-МЕРНЫЕ ПСЕВДОСЛУЧАЙНЫЕ ТОЧКИ 269
Простейший результат в этом направлении для случая п—\
можно получить с помощью формулы D8) гл. 3, стр. 129. В самом
деле, для любой функции Ф(у) класса W'2(L),
О 1=1
где можно считать, что
1
о
Как доказано в [78], еслиФ (у) е W2 (L), то дисперсия случайной
величины Ф(у) удовлетворяет неравенству
DG>(y)^L2/n2. A8)
Фиксируем числа Yi» • ••,Т,у. ^3 0?) видно, что для тех
функций, для которых L меньше, погрешность интегрирования будет
меньше. Но таким функциям, согласно A8), соответствуют также
меньшие значения дисперсии.
Во-вторых, алгоритмам с меньшей дисперсией часто
отвечают более гладкие функции Ф, удовлетворяющие
оценке A4). Например, при расчете задачи о поглощении
нейтронов методом п. 1.1 гл. 6, осредняемая функция
может принимать лишь два значения: 0 и 1. Нетрудно
убедиться в том, что ее разрывы не параллельны
координатным гиперплоскостям*). А при расчете той же задачи
методом п. 3.3 (гл. 6), осредняемая функция непрерывна
и даже дифференцируема.
Вообще говоря, можно ожидать большего ускорения
сходимости за счет использования детерминированных
псевдослучайных чисел тогда, когда используются более
совершенные алгоритмы метода Монте-Карло.
*) Если область Go— шар r2<R2, то из формулы ri^.l = ri +
следует условие вылета
Поэтому одна из поверхностей разрыва осредняемой функции
определяется уравнением
В случае изотропного рассеяния (r^, Q^) —\r^By— 1), длина пробега
|^. = — A/2) lny', гак чте уравнение это связывает y с у\
270 НЕСЛУЧАЙНЫЕ ТОЧКИ В АЛГОРИТМАХ [ГЛ 7
§ 3. Поиски «универсальных» псевдослучайных чисел
В предыдущем параграфе были указаны
детерминированные точки, координаты которых можно
использовать в качестве псевдослучайных чисел при реализации
алгоритмов Монте-Карло с конечными к. р. Однако
весьма часто встречаются также алгоритмы с к. р.= оо.
Рассмотрим некоторые попытки построить
детерминированные псевдослучайные числа, пригодные для расчета
задач с любыми к. р. Мы говорим о попытках, так как
нельзя считать, что эти поиски уже закопчены: до сих
пор нет последовательностей, удовлетворяющих
требованиям практики (типа описанных в п. 2.4.3), да и сами эти
требования не вполне четко сформулированы.
3.1. Использование бесконечномерных точек. Такой
подход к проблеме был предложен Н. Н. Ченцовым в
1961 г. [97]. На этом пути удалось указать весьма
широкие классы функций Ф{уи . •• , Уп, ...)> зависящих от
бесконечного числа переменных Уи . • • , Уп, •.. @<#п< 1)
и такие классы последовательностей Pi,..., P*,...,
состоящих из точек бесконечномерного единичного
куба
Pi=(Uuu . •• » Уип, ..•)>
что для каждой функции класса
| N 11 оо
Пт— 2 Ф(Р;)Н* •••!••• Ф @1....,#,„•..) П dyk,
и порядок сходимости лучше, чем \/Nl~? с любым е>0.
В частности, этим классам функций принадлежат любые
достаточно гладкие функции Ф(#ь • • • , Уп)9 зависящие от
любого конечного числа переменных п. Поэтому при
реализации всех упомянутых в § 1 алгоритмов с к. р. = оо
можно пытаться вместо псевдослучайных чисел
использовать координаты точек Р{.
Пока известны лишь две конкретные
бесконечномерные последовательности с более или менее «хорошими»
свойствами. Одна из них — обобщенная ЛПх-последова-
тельность — вычисляется по формулам A5), A6), где
1^/<оо. К сожалению, достаточно простых формул для
расчета всех элементов l/js> нет.
§ 3] «УНИВЕРСАЛЬНЫЕ» ПСЕВДОСЛУЧАЙНЫЕ ЧИСЛА 271
Вторая последовательность, впервые рассмотренная
в [77], называется обобщенной последовательностью
Холтона. Точки этой последовательности РГ> /== 1, 2, ... ,
имеют координаты
Р*= [Ргг @. Ргг У)* • • •> Рги @. • • «)'
где ri<C/*2< •.. <Сп< ... — последовательность всех
простых чисел.
Для расчета точек Р* на практике можно задать
достаточно большую таблицу простых чисел и (или)
запрограммировать какой-нибудь алгоритм их нахождения
(например, метод решета). Первые две точки этой
последовательности:
JL L L L L
__ / 1 2 2 2 2 \
Если мы хотим использовать точки Р* для расчета задачи
о поглощении нейтронов (гл. 6, п. 1.1), то для построения
первой траектории надо вместо случайных чисел
использовать значения 1/2, 1/3, 1/5,..., для второй—1/4, 2/3,
2/5,..., и т. д. Пример такого расчета имеется в [80].
3.2. Вполне равномерно распределенные
последовательности чисел.
Определение. Последовательность чисел х\, ...
...,**,..., принадлежащих интервалу @, 1),
называется вполне равномерно распределенной, если при каждом
натуральном п последовательность точек
(*Ь • • • » *п), (Хп+1, • • • , Х2п), (*2п+Ь • • • , АГ3„), ... A9)
равномерно распределена в /С". Понятие это было
введено Н. М. Коробовым в 1949 г. [41].
Из п. 2.1 вытекает, что если функция Ф(уи ... , у„)
интегрируема по Риману в Кп, то
=- J Ф (Р) dPf B0)
и соотношение это справедливо для любого натурально*
го п или, другими словами, для функций Ф от любого ко-
272 НЕСЛУЧАЙНЫЕ ТОЧКИ В АЛГОРИТМАХ 1ГЛ 7
печного числа аргументов. Следовательно, вполне
равномерно распределенные последовательности чисел можно
(в принципе) использовать для практической реализации
алгоритмов Монте-Карло с любыми конечными к. р., а в
некоторых случаях и с к. р. = оо [99]. К сожалению, до
сих пор неизвестно ни одной вполне равномерно
распределенной последовательности, которая в какой-то степени
удовлетворяла бы требованиям п. 2.4.3 при различных п.
Пример [126] Известно, что существуют бесконечно много
таких чисел а> 1,чю последовательность дробных долей xt¦ = Д (а1),
г —1, 2, . . . , вполне равномерно распределена*). Легко доказать,
что такие а обязаны быть трансцендентными числами. Но до сих
пор ни одного конкретного значения а не найдено.
Можно доказать, что вышеприведенное определение
вполне равномерно распределенных последовательностей
эквивалентно следующему.
Определение. Последовательность чисел Х\> ...
..., хи ..., принадлежащих интервалу (О, 1),
называется вполне равномерно распределенной, если при
каждом натуральном п последовательность точек
(хи ... , хп), (х2, ... , хд+1), (х3, ... , хп+2), ... B1)
равномерно распределена в Ка.
Из этого определения и п. 2.1 следует, что если
Ф(#ь ...» Уп) интегрируема по Риману в Л'", то, каково
бы ни было натуральное дг,
Л'-1
Пт у 2 Ф Ыь .. м*/+я) = J Ф (Р) dP. B2)
Может показаться, что расчет по формуле B2)
выгоднее, чем расчет по формуле B0), так как при этом
затрачивается примерно в п раз меньше чисел х{. Несомненно
однако, чтс вычислители, инстинктивно стремясь к
«независимости» псевдослучайных точек, отдадут предпочтение
точкам A9) и формуле B0). Вполне вероятно, что они
правы: может оказаться, что для точек B1) отклонение
DN (при любом я?) растет быстрее, чем для точек A9).
Вопрос этот не исследован.
*) Таким свойском обладают почти все
§ 3] «УНИВЕРСАЛЬНЫЕ» ПСЕВДОСЛУЧАЙНЫЕ ЧИСЛА 273
3.3. Асимптотически вполне равномерно
распределенные последовательности чисел. Рассмотрим семейство
последовательностей хи ... , xh ... , зависящее от
натурального параметра g(g=\y 2,...):
Xl(g),X2(g),...,Xt(g),... B3)'
Семейство B3) естественно назвать асимптотически
вполне равномерно распределенным, если для любой
функции Ф(Уи ... , Уп)у интегрируемой по Рнману в /<",
при любом натуральном п справедливо равенство
1 N-i
lim lim -тг 2 Ф (хЫЛ i (g),..., xin+n (g)) =|Ф(Р)dP,
B4)
или равенство
л-i
lim lim -jr % Ф (Xi.ui (g),..., x,+n (g)) = .[ Ф (P) UP. B5)
Термин этот введен И. Франклином в 1963 г. [126].
Ему же принадлежит второе утверждение следующей
теоремы, первое утверждение которой доказано в [83].
Теорема. Существует бесконечно иного чисел а,
0<а<1, таких, что семейство последовательностей
xi(g)=M(agi)9 t=l, 2, ...
асимптотически вполне
равномерно распределено как в смысле
B4), так и в смысле B5)*).
Интересно отметить, что при
каждом фиксированном g
последовательность Xi=u(agl) может
быть равномерно распределенной
в К\ но точки (x2i-u X2t) не
могут быть равномерно
распределенными в /С2. В самом деле, Рпс б9
точки (хи х2), (хг, х4)... можно
записать в виде (хи M(gx{))9 (*з, Д(#*3)), •• • Отсюда
видно, что все они расположены на линии y=M(gx),
которая состоит из g отрезков прямых y=gx—k при
Таким свойством обладают почти все а из интервала @, 1).
274 ! НЕСЛУЧАЙНЫЕ ТОЧКИ В АЛГОРИТМАХ [ГЛ 7
?=0,..., g—1 (рис. 69). Тем более последовательность
х{ не может быть вполне равномерно распределенной.
Сформулированная теорема в какой-то мере
объясняет, почему метод сравнений (п. 2.2.2 гл. 1) позволяет
строить «хорошие» псевдослучайные числа и почему
приходится выбирать большие g: из G) гл. 1 вытекает, что
Т<=Д(То?1')- Однако никаких выводов о том, как
выбирать «хорошие» #, М, то отсюда сделать нельзя.
Как доказал С. М. Ермаков [33], скорость сходимости
в формуле B4) (но не в B5)!) связана с УОФ(Г)/Л^.
§ 4. Проверка псевдослучайных чисел
с детерминистической точки зрения
4.1. Интерпретация простейших критериев. В гл 1, § 3 мы
рассмотрели некоторые тесты, используемые для проверки
псевдослучайных чисел, и отметили, что все такие тесты только необходимы,
но не достаточны: они могут опровергнуть гипотезу о том, что
Ti» •••»?# —независимые значения случайной величины у» но не
•могут доказать ее. Сузим теперь постановку вопроса: вместо
«можно ли числа ylt ..., yN считать независимыми значениями у?»
зададим вопрос: можно ли числа ?i. ..., yN использовать вместо
независимых значений у в формуле
1 j N
о t=i
при любых Ф(х) из достаточно широкого класса?
При такой постановке вопроса рассмотренные в гл. 1 критерии
оказываются и необходимыми и достаточными — каждый на своем
классе функций Ф(х). Впервые такая интерпретация была
изложена автором в 1968 г.
4.1.1. Критерий со2. Из формулы D8) стр. 129 вытекает,
что
sup
l 1 л? I /—Г
f Ф (jc) dx — _ У Ф (y.) - L 1 / !jV . B7)
о N Si M F Af
z
Следовательно, малость величины а>д? необходима и достаточна для
того, чтобы ошибка приближения B6) была мала для всех
функций класса W 2 (L).
4.1.2. Критерий х2. Разобьем интервал @, 1) на г
интервалов A'i+ . . .+Х^ = @, 1), длины которых равны ри . . . , pf так,
что Pi+...+ рг = 1 и все р. >0. Обозначим через v. количе-
i 4]
ПРОВЕРКА ПСЕВДОСЛУЧАЙНЫХ ЧИСЕЛ
275
ство значений у. при 1^/<Лг, принадлежащих X.. Критерий %2
основан на асимптотическом распределении величины
^ —'- Л B8)
которое не зависит от Хи , . . ,Х^, а только от числа степеней
свободы г— 1.
Введем множество функций Ai(L), постоянных на каждом из
Хр т. е. функций вида
O(x)=Cj при х е Ху, 1 < / < г,
и таких, что
B9)
Пегрхдно вычислить, что если cp(x)e/lj(L), то
li
Используя изустное неравенство Bи о.J ^ 2«2. 2y?f получим оценку
V. ,2]1/2
причем оценка эта точная, так как при
< L
-1/2
N
последнее неравенство обращается в равенство. Итак,
"<) о Н ^i
ir
C0)
Отсюда видно, что малость величины %$ необходима и
достаточна для того, чтобы ошибка приближения B6) была мала для всех
функций класса A\(L).
Мы. знаем, однако, что к формуле B6) сводятся лишь такие
алгоритмы Монте-Карло, у которых к. р.= 1. Стало быть,
рассмотренные критерии (как и критерий Колмогорова, см. упражнение 8
276 НЕСЛУЧАЙНЫЕ ТОЧКИ В АЛГОРИТМАХ [ГЛ. 7
гл 1 и упражнение 6 гл 7) гарантируют применимость проверенных
псевдослучайных чисел уь • • • » 7# только для расчетов по
алгоритмам с к. р. = 1.
4.2. Многомерные критерии. Если мы хотим использовать этч
же числа для расчета по алгоритмам с к. р. = я, то необходимо
проверить их с помощью какого-либо «-мерного теста. Например, ра-"
зобьем куб Кп на г областей Хх+ . . . -f- Xr—Kn, объемы которых
равны Ри *-*Рг, так что Pi-f... + Pr =-1 и все р. >0. Из чисел
Yi» . • • »V/v образуем Nп ~Ц(Ы[п) точек с координатами
(Vi Yj. (Yrt+i. •••> V2«). ••
и пусть V.— количество таких точек, принадлежащих X..
Тот же критерий %2 с (г—1)-й степенью свободы позволяет
проверить распределение этих точек в К'1 с помощью величины
Обозначим через/4/;(L) множество функций Ф (xlf
постоянных на каждом Х^., т. е. функций вида
Ф(*1, ...,*л) = су при (г! ^я)€Ху, 1 < у <
и таких, что выполнено условие B9). Повторяя вычисления п. 4.1.2,
получим, что
Р ? Ф (
\1| |
C1)
Таким образом, малость уД, действительно гарантирует
применимость чисел Yi> • • • ¦ Tjv для Расчета по некоторым алгоритмам с
к. р. = п.
Конечно, класс алгоритмов, которым отвечают функции
Ф (х1} ..., х;,) из Л^ (L) весьма узок. Однако если г велико и
все X. малы, то многие функции допускают хорошее приближение
кусочно постоянными функциями из Ап (L). И тогда
псевдослучайные числа, пригодные для интегрирования функций из Ап (L)
окажутся пригодными для интегрирования гораздо более
разнообразных функций.
4.3. О системах тестов. С точки зрения изложенного в пп. 4.1
и 4.2, система тестов, рекомендованная в гл. 1, представляется
логичной, но довольно слабой. В самом деле, она включает
простейшие проверки одномерного и двумерного распределения у. и
заодно распределения некоторых попутно вычисляемых второстепенных
величин. Лишь проверка серий может рассматриваться как тест,
УПРАЖНЕНИЯ К ГЛ. 7 277
рассчитанный на алгоритмы с к. р. = оо, правда, алгоритмы весьма
специального вида
Если бы речь шла только об использовании алгоритмов с
любыми к. р.^л, то можно было бы предложить очень хороший тест —
расчет отклоненияD N или, другими словами, /г-мерный критерий
Колмогорова (см. упражнение 8 гл. 1 и упражнение 6 гл. 7).
Правда, вычисление DN при больших N очень трудоемко.
Обеспечить же эмпирической проверкой «универсальность»
псевдослучайных чисел, по-видимому, крайне трудно. Например, без
теоретических результатов, подобных результатам § 3, пришлось
бы проверять я-мерное распределение не один раз, а п раз, так как
из того, что точки (Yt, ..-,Vrt)> (Vn+v •" YaJ- хорошо
распределены, не следует, что точки(v/,. ..,у/+я),(?/+л+! Y/~f2/i)>---
при 1</<п также хороши. Это видно из следующего простого
примера: в последовательности 1111000011110000 . . . пары 11, 11,
00, 00, 11, 11, 00, 00 распределены неравномерно (так как
комбинаций 01 и 10 совсем нет); отбросив первую единицу
последовательности, получим пары 11, 10, 00, 01, 11, 10, 00, 01, . . . , где каждая
из возможных комбинаций встречается одинаково часто.
Результаты этого параграфа содержатся в статье [84].
Упражнения к главе 7
1. Рассмотрим пример п 1.2, где значения | вычисляются
методом Неймана. Ограничим число проб величиной / и условимся
полагать Ф=0, если cy[^p(gi)t ... 9 су\> p(g(). Для такого
алгоритма к. р.=2/.
Доказать, что для того, чтобы погрешность такого прпближе-
ния не превосходила вероятной ошибки метода /#=0,675}^D/(g)/Wf
должно выполняться неравенство
/ > In (rN/I) In A - э).
2. Выберем в кубе Кп равномерную кубическую сетку,
состоящую из N = Мп точек с координатами
l
м '"" м
где г'ь . . . , i =1, 2, . . . , М. Доказать, что отклонение этой
сетки равно D/v=0,5^V1" п (при /г=1 величина DN *=0,5
минимальна, но при больших п отношение DN/N убывает крайне медленно)
3. Вычислить точку <?!*3 в 4-мерном кубе. Ответ: Q*3 = A1/16,
13/16, 13/16, 15/16).
4. Используя равенства V\s) = 2~~s при s=l, 2, . . . , доказать,
что первые координаты <7itl точек Qi совпадают с числами рг(О*
278
НЕСЛУЧАЙНЫЕ ТОЧКИ В АЛГОРИТМАХ
[ГЛ. 7
б. Какова бы ни была последовательность чисел хи..., х^ ... из
интервала @, 1), равенство
для f«=A: и f~x2 одновременно невозможно. (Н. Н Ченцов).
6. Обозначим W} (L) множество непрерывных функций f(x)t
определенных при 0<#<;1 и т.-елщнх кусочно непрерывные
производные f'(x) такие, что
1
Доказать, что для любых чисел Yi» • • • > Ум
1 , м
sup
= L-
Где KN=z]/ND — величина, фигурирующая в критерии
Колмогорова (.упражнение 8 гл 1) (И. М. Соболь [84]).
ГЛАВА 8
НЕКОТОРЫЕ ДРУГИЕ ЗАДАЧИ
§ 1. Интерполирование функций от большого числа
переменных
В книге уже встречались задачи, в которых методы
Монте-Карло оказываются эффективнее классических
методов при большом числе
переменных (см. упражнение 9
гл. 3 и п. 5.6 гл. 5). Здесь
изложена одна задача такого
типа, рассмотренная впервые
Дж. Хэммерсли [134].
1.1. Постановка задачи.
Рассмотрим функцию f(xb...
¦.., Хп), значения которой
известны лишь в вершинах
единичного д-мерного куба
Кп. Требуется проинтерполи-
ровать значение этой
функции в точке (хи ..., хл),
расположенной внутри Кп (рис. 70). Интерполяция линейная
по каждому из переменных.
В случае п=\ интерполяционная формула всем
хорошо знакома:
Рис 70.
Нетрудно проверить, что при п—2 получается
аналогичная формула:
f i)+Xlx2f{i, l). (l)
280 НЕКОТОРЫЕ ДРУГИЕ ЗАДАЧИ [Г Л 8
' Чтобы записать эту формулу в компактной форме,
введем индексы вершин k\ и k2, каждый из которых
может принимать два значения —0 и 1. Пусть
1 х{ при kt = 1.
Тогда A) можно переписать в виде
Точно так же выглядит интерполяционная формула в
случае /г переменных:
*„)• C)
Расчет по формулам B) и C) в принципе весьма прост.
Однако количество слагаемых в C) быстро растет с
ростом п и уже при /г = 30 превышает 109.
Может показаться, что для больших п такая
постановка задачи нереальна: невозможно хранить 230
значений функции /. В действительности это и не нужно:
достаточно иметь алгоритм, позволяющий вычислить
значения / в вершинах Кп.
1.2. Метод Монте-Карло. Введем п независимых
случайных величин 1{1\ ..., |(п), каждая из которых
может принимать два значения —0 и 1, и пусть
р{|«> = 0} = 1-*ь Р{6<'>=1}=*,. D)
Совокупность этих величин (|A>, ..., ?(п)) определяет
случайную вершину куба Кп.
Теорема 1. 'Математическое ожидание f(|A), ...
..., 1{п)) равно
М/F(|\..., 6(ж)) =/(*ь..., хл). E)
Доказательство. Из B) и D) нетрудно заметить,
что и при &г=0, и при ki=\ справедливо равенство
P{?(i) *=&»} = с (&*). Поэтому правая часть обычной
§ 2) ПРОСТЕЙШИЙ СЛУЧАЙНЫЙ ПОИСК 281
формулы для математического ожидания
превращается в правую часть формулы C),откуда сразу
вытекает E).
Соответствующий формуле E) метод Монте-Карло:
при больших N.
где (si'\..., l\n)),..., {%$,..., ?Jv°) — независимые
реализации случайной величины (?A),..., 6(я)) (или,
другими словами, набор случайных вершин куба).
В последней формуле легко выразить все ?(t) через
случайные числа f, так как ?(t) = e(xi— у). Получим
формулу
/ (Xl,.... xn)^±y.f (e (Xl - vi.,),.... е (хп - у„,,)), F)
iV S"-=l
где все ^/,. — независимые случайные числа. Формула F)]
позволяет интерполировать значения f(x\f ... , хп) в
нескольких точках, используя одни и те же случайные
числа «у,,, (ср. гл. 3, § 4).
В статьях [179] и [177] построены методы Монте-Карло для
экстраполирования и нелинейной интерполяции функции /(хь ...
••-.*„)
§ 2. Простейший случайный поиск
2.1. Случайный поиск. Рассмотрим ограниченную
кусочно непрерывную функцию Ф(Р)_1__определепну10 в
замкнутом единичном n-мерном кубе /Сп, так что /Сп —
это куб Кп вместе с его границей. Обозначим через Р
точку абсолютного максимума Ф(Я)_в /Сп, т. е. такую
точку, что Ф(Р)^Ф(Р) для всех P<dKn.
Простейший поиск точки Р состоит в том, что в кубе
задается произвольная последовательность точек Р\, ...
19 И. М. Соболь
2§2 НЕКОТОРЫЕ ДРУГИЕ ЗАДАЧИ [ГЛ 8
... , PNt ... , называемых пробными точками; в каждой
из этих точек вычисляется значение Ф(Л); и находится
точка Ptot в которой
Ф(Л-0) = max Ф (/><),
l<i<N
Точка Р{0 служит приближением к точке Р.
Рассмотрим произвольную область В<^Кп с
положительным д-мерным объемом VB*>0y содержащую точку Р.
Если при N-+oo хотя бы одна пробная точка попадает
в Б, то говорят, что процесс поиска сходится.
Докажем, что если в качестве пробных точек
выбирать независимые случайные точки с плотностью р(Р) >0
внутри /Сп, то процесс поиска сходится. Для
доказательства фиксируем произвольную область В с VB>0,
содержащую точку Р и обозначим через рв вероятность того,
что одна пробная точка попадет в В.
Очевидно,
Вероятность того, что хотя бы одна из N пробных точек
окажется в В, равна 1 —A—pB)N и стремится к 1, когда
ЛГ->оо.
Следовательно, какой бы коэффициент доверия р
мы ни выбрали, при достаточно большом N с
вероятностью, большей чем р, хотя бы одна пробная точка
попадет в В.
Если никакой предварительной информации о
расположении Р нет, то естественно выбрать р(Р)==1, т. е.
использовать пробные точки Ти равномерно распределен,
ные в Кп. Такой поиск называют простейшим случайным
поиском (или слепым поиском).
Ясно, что процесс поиска можно улучшить, если в
ходе поиска менять плотность р(Р) с учетом уже получен-
ных значений. Например, точку Р{ выбирать по плотности
Pi(P), которая строится с учетом значений Ф(/I),...
,,. , <D(Pi_i). На таких более совершенных (но и более
сложных) алгоритмах поиска мы здесь останавливаться
не будем [22, 66, 72, 184]. Отметим только некоторые
ситуации, в которых простейший случайный поиск весьма
полезен.
§ 2] ПРОСТЕЙШИП СЛУЧАЙНЫЙ ПОИСК 283
а) Функция Ф(Р) достаточно гладкая, но
многоэкстремальная. Простейший случайный
поиск целесообразно использовать для отбора начальных
точек, из которых можно локальными методами (метод
градиентов, наискорейший спуск и др.) попасть в
ближайший максимум. Чем тщательнее выбор начальных
точек, тем меньше шансов пропустить абсолютный
максимум.
б) Требуется найти максимумы
нескольких функций Ф[(Р), ... , Фт(Р). При простейшем
случайном поиске можно одновременно (по одним и тем
же пробным точкам Гг) искать максимумы (и минимумы)
всех этих функций.
Такая ситуация довольно типична для задач
оптимального конструирования: обычно качество
конструкции можно оценивать по ряду весьма различных
критериев, и выбор решающего (или компромиссного)
критерия удается сделать лишь тогда, корда известно, чего
можно добиться, оптимизируя тот или иной критерий
в отдельности.
2.2. ЛП-поиск. В полном согласии е идеями гл. 7,
можно попытаться использовать в качестве пробных
точек для простейшего поиска любые точки, образующие
равномерно распределенную последовательность в Кп
(гл. 7, п. 2.1): чем более равномерно распределены точки,
тем лучших результатов можно ожидать от поиска.
Сходимость такого поиска легко доказать: так как
для любой области В при N-+oo отношение SN(B)/N-^-
-*VB (см. A0) гл. 7), то SN(B) ~NVB\ следовательно,
количество пробных точек, попавших в В, неограниченно
возрастает с ростом N (если только 1/в>0).
ЛП-поиском называется простейишй поиск, в котором
пробными точками служат точки Qi , ..., Qiv * •.,
образующие ЛПт-поеледовательноеть (и. 2.4. гл. 7).
Сравнение ЛП^поиска с простейшим случайным
поиском проводилось на многих задачах. И неизменно
ЛП-поиск оказывался более эффективным.
Пример В табл 1 приведены результаты поиска максимума
некоторой (достаточно сложной) функции Ф(Р) от 9 переменных
[86]. Обозначенияil^j), ГB). ГC) —три наилучшие точки,
полученные при случайном поиске, a Q*1)f Q*2), Q(*3)—три наилучшие точки
полученные при ЛП-поиске с тем же количеством N пробных точек
284
НЕКОТОРЫЕ ДРУГИЕ ЗАДАЧИ
(ГЛ
2.3. Поиск в произвольной конечной области. Если
функция Ф{Р) определена в конечной замкнутой области
G, то для реализации простейшего случайного поиска
надо выбирать случайные точки (|ь ... , |п), равномерно
N
512
1024
2048
Ф((
48,
48,
48,
12
61
01
Ф(
47
48
48
<Л )
,00
,12
,12
Ф(
37
47
47
,84
,83
,83
ФСГ
42,
42,
43,
О»
29
29
52
Та
Ф(ГB))
39,52
40,21
42,29
блица 1
Ф(ТC))
38,51
39,52
40,22
распределенные в G. Делается это с помощью
преобразований гл. 2, которые можно записать в форме |* =
= #ЛТь.-.> Tm)t l^k^n, где, вообще говоря, т^п.
Обозначим через Г= (^ь ••• > 7™) случайную точку,
равномерно распределенную в Кт. Пусть Fi, ... , Г* ...—
независимые значения Г. Тогда i-я пробная точка в G
имеет координаты
(gi{Ti)9...9gn(Tt))9 /=1, 2, ...,УУ, ...
Эти же преобразования позволяют осуществить в
области G и ЛП-поиск. При ЛП-поиске координаты i'-ii
пробной точки равны
(gi(QO, ...,gn(Qtr)), /=1,2, ...,N, ...,
где функции gk — те же, a Q* ,... ,Qn , ...— точки т-мер-
ной ЛПт-последовательности.
§ 3. Решение уравнения Лапласа
3.1. Построение случайных траекторий. Пусть задана
ограниченная связная область G и точка P0^G.
Определим случайную траекторию Qo-^Qi->.. .-^Qn1"-^...
следующим образом: положим Qo=/V> далее, если
точка Qn известна, то построим окружность произвольного
радиуса /„, располол<енную внутри G, и на этой
окружности выберем случайную точку Qn+i (рис. 71). Таким
образом,
Qn+i = Qn+/n0>n> я=0, 1, 2, ... §
РЕШЕНИЕ УРАВНЕНИЯ ЛАПЛАСА
285
где G)n={cos(pn, sincpn}, и угол срп равномерно
распределен в интервале @, 2я).
Теорема 2. Если функция u(P)^u(xt у) удовлетво*
ряет в области G уравнению Лапласа
д2и/дх2+д*и/ду2=0, G)
то при каждом п и при любых /о, ... , U математическое
ожидание Mu(Qn+l) равно значению и(Р0) в начале
траектории.
Доказательство.
Придадим более точный смысл
утверждению о
произвольности радиуса /п. Будем считать,
что задана некоторая
плотность qn(l), которая
тождественно равна нулю при всех /,
превосходящих минимальное
расстояние от Qn до границы
G0, а также при /<0; случай
qn(l)=&(l—ln) также
допускается; и выбор 1п
осуществляется в соответствии с плотностью рис. 71.
Пусть рп(Р) —плотность распределения точки Qn в G.
Тогда математическое ожидание величины u(Qn+{) =
==u(Qn+ln(i>n) равно
оо 2я
Ш(Qa+i) = I /7„ (Р) dP j qn(I) dl J u(P + /со) ?J.
G —oo 0 zn
По известной теореме о среднем 'значении гармонической
функции [88]
л 2л
Поэтому
Ми (Qn+\) = I и (Р) рп (Р) dP = Ми (Qn).
G
При п = 0 точка Qo^Po, u(Q0)==u(P0) и Mu(Q0) =
= и(Р0). Применяя индукцию, получим утверждение
теоремы.
288
НЕКОТОРЫЕ ДРУГИЕ ЗАДАЧИ
[ГЛ. 8
Построение цзаекторий рассмотренного типа в
трехмерном случае иногда называют блужданиями по
сферам.
3.2. Решение задачи Дирихле для уравнения
Лапласа. Траекторию предыдущего пункта можно
использовать для приближенного решения
задачи Дирихле (гл.5, п. 5.5). Пусть
на границе G0 области G задана
ограниченная функция g(P).
Обозначим через и(Р) искомое решение,
удовлетворяющее внутри G
уравнению G) и обращающееся в g(P)
при P<eeG°.
Фиксируем достаточно малую
окрестность G\ границы G0 (рис.
72). Чтобы вычислить и(Р0), будем
строить траектории вида Po-^Qi-*-
->... ->¦ Qv до тех пор, пока
случайная точка Qv не попадает в Ge.
Пусть Pv — ближайшая к Qv точка
границы G0. Можем считать, что
значение случайной величины w(Qv) приближенно равно
u(Qv) ~g(Pv). Построив N траекторий такого типа,
получим значения ?(PVl), ... , g(PvN), по которым
оценивается искомое решение
и(Р0)^-гг^ g(Pv).
s=l s
Заметим, что сходимость по вероятности
Рис. 72.
(8)
s=l
когда N-+oo не вытекает из теоремы Хинчина (стр. 87), ибо в
сумме (8) фигурируют N различных случайных величин,
различающихся правилами выбора /0, /i, . . . Можно, однако
воспользоваться другой формой закона больших чисел — теоремой Чебышева:
Если величины х\и ..., Ц8 , ... независимы и существуют
Щ$ = as и Dr)s ^C, то при N-+oo
1 N 1 N О
(Доказательство этой теоремы легко получить, применяя к
величине A/#)(t)i+. . ,-f i\N) неравенство Чебышева, стр. 141).
§ 4] ВЫЧИСЛЕНИЕ ВИНЕРОВСКИХ ИНТЕГРАЛОВ 287
В нашем случае все М« (QvJ = «(Л))» а дисперсии Du (QVs) <
(Qv )<C2, где C = sup \g(P)\. В самом деле, как известно
[88], максимум и минимум гармонической функции достигаются на
границе области, так что \и(Р) |<С при всех Pe=G.
Такой метод расчета и(Р0) считается более быстрым,
чем метод п. 5.5 гл. 5, так как вдали от границы G0
позволяет делать большие шаги (/«). Обычно рекомендуют
выбирать максимально возможные радиусы 1п. Впрочем,
аккуратного численного сравнения этих методов автор
не видел.
Изложенный метод был предложен Дж. Брауном [6] и
обоснован М. Мюллером [162], который доказал, в частности, что
вероятность того, что траектория P<r**Qi-+-. . .->Qn->. . . никогда
не попадет в Gg, равна нулю. Дальнейшее развитие метода —
организация зависимых испытаний, решение уравнений более общего
вида, использование вместо кругов других фигур (для которых
известны функции Грина) — имеются в работах [28, 30, 65].
§ 4. Вычисление винеровских интегралов
Решения многих задач теории вероятностей,
статистической и квантовой физики, теории дифференциальных
уравнений могут быть выражены через так называемые
континуальные интегралы [16]. Вычисление
континуальных интегралов классическими методами весьма сложно,
хотя некоторые «квадратурные» формулы для этого
имеются [12, 123]. Методы Монте-Карло для расчета таких
интегралов были, по-видимому, впервые использованы в
работе И. М. Гельфанда и Н. Н. Ченцова [15].
4.1. Винеровские интегралы. Чаще других
встречаются континуальные интегралы по мере Винера,
называемые обычно винеровскими интегралами:
(9)
где С — пространство всех непрерывных на отрезке
O^t^T функций x(t)9 удовлетворяющих начальному
условию х@)=0, a F[x(t)]—произвольный
непрерывный и ограниченный функционал, заданный на С.
При определении меры Винера здесь, как и в Г16],
коэффициент диффузии D полагается равным 1/4: этого всегда можно
добиться изменением масштаба времени. Пусть * = ?(/)—координата
288 НЕКОТОРЫЕ ДРУГИЕ ЗАДАЧИ [ГЛ 8
частицы, совершающей броуновское движение вдоль оси Ох,
начинающееся из точки g@)=0. Если ?>=1/4, то плотность
вероятностей 6@ равна
Рассмотрим случайную траекторию x=\{t) частицы,
совершающей броуновское движение, с начальным
условием ?@)=0 (такую траекторию называют также вине-
ровским процессом [71]). Тогда математическое
ожидание случайной величины F[S(/)] равно интегралу
Отсюда вытекает простейший метод Монте-Карло для
расчета интеграла (9)
SFWdwxttjr'ZFltis)], (Ю)
G N s«l
где |(i)@> • • •» \{N){t)—независимые реализации
броуновской траектории x=\{t).
4.2. Приближенное построение броуновских
траекторий. Укажем два способа приближенной реализации
таких траекторий. В обоих способах отрезок [0, Т]
делится на п равных частей абсциссами
О=/о<*1<*2<...<*«=7\ A1)
разыгрываются случайные значения траектории К**), и
w
h Ь J ^*fr
Рис. 73.
полученные точки (tu \{ti)) на плоскости /, х
соединяются отрезками прямых (рис. 73). Построенная ломаная
и есть приближенная броуновская траектория.
ВЫЧИСЛЕНИЕ ВИНЕРОВСКИХ ИНТЕГРАЛОВ 289
В приведенных ниже расчетных формулах ?ь ?2, •••—
это независимые нормальные случайные величины с
параметрами а=0 и о2=1.
Первый способ основан непосредственно на
определении броуновского движения: так как условное
распределение l(ti) при известном значении g(^-i) нормально
с параметрами a=§(^-i) и о2= A/2) |/,— f*-i|, то при
t=l, 2, ..., п
I (U) = I (U-i) + УТ1ЩЪ1. A2)
Формула A2) с начальным условием ?@)=0 позволяет
разыграть все значения ?(/,-).
Второй способ [14, 48] основан на том, что если
значения i(t') и \(t") известны, то условное распределение
значения^ U- {tf + *") также нормально с параметрами
Пусть /г=2?п. Используя условие ?@)=0, можно
разыграть значение ЦТ) = 1 @) + VT/2 ?2 (это фактически
формула A2) при м=1),а затем разыгрывать остальные
значения ?(/*) в серединах отрезков:
6 (Т/2) = i- 1Б @)
(ЗГ/4) = 1 [Б (Г/2) + Б (Т)] +
I (Т/8) = 4 16 @) +
Численный пример [8]. Вычислить вииеровский
интеграл, точное значение которого известно:
где
о
290 ' НЕКОТОРЫЕ ДРУГИЕ ЗАД\ЧИ [ГЛ 8
Случайные траектории будем строить вторым способом при
п=4. Расчетные формулы:
|(l)=0,70711Ci,
?(l/2)=0,5g(l)+0,35355C2,
6A/4)-0,56A/2)+0,25Св.
Значение функционала ||х||2 на ломаной вычисляется точно: на
каждом отрезке можно воспользоваться формулой
ъ
J
f @ dt = Щ± [р (а) + / (а) / (Ь) + /2 (Ь)],
которая точна для функций f(t), линейных на [а, Ь]. Получим
расчетную формулу
|| gj|» = 1 {& @)+ 262A/4) + 2?2 A/2) + 2|2 C/4)+ g2 A) +
+ I @) 6 A/4) + | A /4) 1 A /2) + 1( 1/2) | C/4) + | C/4) g A)}.
Результат расчета, выполненного в [8] при /V=10, случайно
оказался исключительно хорошим:
-^211^ = 0,2387.
В самом деле, так как
то при jV=10 вероятная ошибка Гю=0,675/]/120=0,062 (именно
такой порядок имеет погрешность, если взять всего девять из
сосчитанных десяти траекторий). Кроме статистической ошибки из-за
малого значения N, возможна еще ошибка от замены траекторий
ломаными, т. е. из-за малости п.
4.3. Замена континуального интеграла многомерным.
Фиксируем разбиение A1) отрезка [0, Т] и условимся
каждую непрерывную кривую x(t) заменять ломаной
?(/)> совпадающей с x(t) во всех точках деления:
x(ti) = х (ti) = Xi, i = 0, 1, ..., п.
Значение функционала F[x] на таких ломаных можно
ВЫЧИСЛЕНИЕ ВИ'НЕРОВСКИХ ИНТЕГРАЛОВ 291
рассматривать как функцию от п переменных: F\x] =
= F(xly...y хп). Известно [16, 89], что
я/2 <х оо
J F [х\ dwx = lim I -^j f ... J F (xlt ...,xn)
G M->oo \ni I -co —oo
exp { j
Поэтому для приближенного расчета интеграла (9)
можно вычислять многомерные интегралы, стоящие справа,
при достаточно больших п. Можно, в частности,
использовать методы Монте-Карло (гл. 3 и 4).
В статьях [124, 124, Ш, 178] методами Монте-Карло
вычисляются континуальные интегралы, к которым сводятся некоторые
задачи теории обыкновенных дифференциальных уравнений и, в
частности, уравнения Шрёдингера (другие методы Монте-Карло для
расчета уравнения Шрёдингера рассмотрены в работах [27, 119, 122,
146, 150]).
ПРИЛОЖЕНИЯ
Вспомогательное неравенство
Пусть в области С задана неотрицательная функция
Рассмотрим дпе произвольные функции и(Р) и v{P),
принадлежащие L2(G\ p). '1о1да справедливо неравенство
[J uvpdP]2< lu2pdP\v2pdP. A)
[g \ g g
Доказательство. Запишем очевидное неравенство
где / — любое действительное число. Это неравенство можно
переписать в виде
t2 J и2р dP+2t$ uvp dP + $v2pdP^Q.
G G G
Как известно, квадратный трехчлен At2+2Bt+C, где Л^О,
неотрицателен при всех —оо</<оо тогда и только тогда, когда В2—ЛС^СО.
А в нашем случае неравенство В2^АС совпадает с A).
Неравенство A) представляет собой одну из известных форм
неравенства Коши — Буняковского, называемого также неравенством
Шварца.
Таблицы
Таблица 1 содержит некоторые значения интеграла вероятностей
Ф(*), функции распределения а\(х) и функции распределения
Колмогорова К(х). Определения этих функций см. на стр. 88, 35 и 43.
Таблица 2 содержит некоторые значения распределения %2.
Определение величины %2(m, P) см. на стр. 33.
Таблица 3 содержит некоторые значения распределения Стью-
дента. Определение величины t т^си. на стр. 90.
ТАБЛИЦЫ
293
Таблица 4 содержит 1000 случайных цифр, которые имитируют
независимые значения случайной величины е (гл. 1, § I).
Таблица 5 содержит 200 нормальных величин, которые
имитируют независимые значения нормальной (гауссовской) случайной
величины ? с параметрами
я = М? = 0, a2=DC=l.
Таблица 6 содержит числители величин V^s\ необходимых для
расчета точек Q^ (стр 265). Знаменатели всех VJS\ равны 2s, так что,
например, VD9) = 433/512.
Таблица I
Некоторые значения интеграла вероятностей Ф(л*), функции
распределения п\{\) и функции распределения Колмогорова К(х).
X
0,675
0,842
1,036
1,282
1,645
1,96
2,58
2,81
3,29
3,72
Фи>
0,50
0,60
0,70
0,80
0,90
0,95
0,99
0,995
0,999
0,9993
1
0,12
0,15
0,18
0,24
0,35
0,46
0,74
0,87
1И7
1,49
МО « .
0,50
0,60
0,70
0,80
0,90
0,95
0,99
0,995
0,999
0,9998
0,82
0,89
0,97
1,07
1,22
1,36
1,63
1,73
1,95
2,15
0,50
0,60
0,70
0,80
0,90
0,95
0,99
0,995
0,999
0,9998
Таблица 2
Значения %2{ту Р)
•>
3
4
5
fi
7
8
9
10
/>
Р
0,9Я
0,01
0,02
0,12
0,30
0,55
0,87
1,24
1,65
2,09
2,56
0,90
0,10
0,2
0,6
1,1
1,6
2,2
2,8
3,5
4,2
4,9
0,70
0,30
0,7
1,4
2,2
3,0
3,8
4,7
5,5
6,4
7,3
0,50
0,50
1,4
2,4
3,4
4,4
5,3
6,3
7,3
8,3
9,3
0,30
| 0,70
2,4
3,7
4,9
6,1
7,2
8,4
9,5
10,7
11,8
0,10
0,90
4,6
6,3
7,8
9,2
10,6
12,0
13,4
14,7
16,0
0,05
С,95
6,0
7,8
9,5
11,1
12,6
14,1
15,5
16,9
18,3
0,01
0,99
9,2
11,3
13,3
15,1
16,8
18,5
20,1
21,7
23,2
0,005
0,995
10,6
12,8
14,9
16,7
18,5
20,-.
22,0
23,6
25,2
0,001
0,999
13,8
16,3
18,5
20,5
22,5
24,3
26,1
27,9
29,6
294
ТАБЛИЦЫ
tn
12
1'i
16
18
20
25
3.0
35
40
45
50
55
60
P |o,9<
P
0,01
3,6
4,7
5,8
7,0
8,3
11,5
15,0
18,5
22,2
25,9
29,7
33,6
37,5
0,90
0,10
6,3
7,8
9,3
10,9
12,4
16,5
20,6
24,8
29,1
33,3
37,7
42,1
46,5
0,70
0,30
9,0
10,8
12,6
14,4
16,3
20,9
25,5
30,2
34,9
39,6
44,3
49,1
53,8
0,50
0,50
11,3
13,3
15,3
17,3
19,3
24,3
29,3
34,3
39,3
44,3
49,3
54,3
59,3
0 30
0,70
14,0
16,2
18,4
20,6
22,8
28,2
33,5
38,9
44,2
49,5
54,7
60,0
65,2
Та
0,10
0,90
18,5
21,1
23,5
26,0
28,4
34,4
40,3
46,1
51,8
57,5
63,2
68,8
74,4
блиц
0,05
0,95
21,0
23,7
26,3
28,9
31,4
37,7
43,8
49,8
55,8
61,7
67,5
73,3
79,1
a 2 (продолжение)
0,01
0,99
26,2
29,1
32,0
34,8
37,6
44,3
50,9
57,3
63,7
70,0
76,2
82,3
88,4
0,005
0,995
28,3
31,3
34,3
37,2
40,0
46,9
53,7
60,3
66,8
73,2
79,5
85,7
92,0
0,001
0,990
32,0
36,1
39,2
42, ">
45,3
52,6
59,7
66,6
73,4
80,1
86,7
93,2
99,6
Таблица З
m x.
2
3
4
5
6
7
8
9
10
12
14
16
18
20
25
30
50
100
oo
0,50
0,817
0,765
0,741
0,727
0,718
0,711
0,706
0,703
0,700
0,696
0,692
0,690
0,688
0,687
0,684
0,683
0,679
0,677
0,675
:
Значения t m
0,70
\
\
i
\
1
1
1
1
1
1
1,34
1,25
1,19
1,16
,13
,12
1,11
1,10
,09
1,08
,08
[,07
1,07
,06
,06
,05
,05
,04
,04
0,90
2,92
2,35
2,13
2,02
1,94
1,90
1,86
1,83
1,81
1,78
1,76
1,75
1,73
1,72
1,71
1,70
1,68
1,66
1,65
0,95
4,30
3,18
2,78
2,57
2,45
2,36
2,31
2,26
2,23
2,18
2,14
2,12
2,JO
2,09
2,06
2,01
2,01
1,98
1,96
0,99
9,92
5,84
4,60
4,03
3,71
3,50
3,36
3,25
3,17
3,06
2,98
2,92
2,88
2,85
2,79
2,75
2,68
2,63
2,58
0,995
14,09
7,45
5,60
4,77
4,32
4,03
3,83
3,69
3,58
3,43
3,33
3,25
3,20
3,15
3,08
3,03
2,94
2,87
2,81
0,999
31,60
12,92
8,61
6,87
5,96
5,41
5,04
4,78
4,59
4,32
4,14
4,02
3,92
3,85
3,73
3,65
3,50
3,39
3,29
ТАБЛИЦЫ
1000 случайных цифр
295
Таблица 4
86515
69186
41686
86522
72587
94377
91641
53807
12311
14480
79130
25731
45904
19976
15218
73189
28709
17932
94590
08749
91682
87653
79429
85444
85739
02555
74364
21656
50055
18788
41899
05498
88898
39976
22148
90795
03393
42163
47171
93000
57802
18867
00607
90316
50961
90410
37525
75601
04925
49286
64448
38238
66686
22561
43448
12904
98088
66186
39453
44326
52905
16796
93662
11244
91332
69207
51512
23775
21279
60102
66155
42502
85181
88059
89688
52452
76773
04825
87113
84754
45420
16287
70492
07824
89571
31276
76208
64254
70177
28484
29142
75162
59157
67981
91641
84637
59575
81305
29835
32795
66785
16107
30649
36694
18465
66434
99224
38967
89342
78416
42499
97526
82134
84778
57616
ты
66181
10274
76044
42903
70795
76575
57598
03569
16325
65877
97496
95114
49687
40837
76154
32764
58846
35801
54313
87225
52141
86545
85970
87650
56558
88955
33181
67248
27589
33346
27256
80317
45863
38132
75593
73244
23974
32373
59598
33071
53163
26623
21302
62766
64517
59297
16021
36801
93030
14150
91090
69558
23472
39072
12332
53758
72664
09082
99528
83935
66447
75120
24520
64294
51435
61870
14783
05312
56774
96929
58481
91730
17381
31466
31466
79636
30890
38666
03675
07876
66515
41675
22700
16809
296
ТАБЛИЦЫ
Таблица 5
200 нормальных величин
0,201
1,161
0,586
0,143
0,952
1,180
—0,274
0,101
—2,301
—0,909
—0,268
—0,602
—0,057
1,494
—0,851
0,8%
0,438
-0,107
0,650
0,833
0,595
0,888
1,360
0,396
1,400
—0,865
0,141
—0,455
—1,232
1,499
1,225
0,418
2,855
1,702
—0,821
1,192
—0,669
—0,925
—0,286
— 1,771
0,003
1,083
— 1,357
—0,645
—0,083
—1,250
0,009
—0,506
—0,441
1,105
0,515
0,215
1,516
— 1,139
0,084
—0,957
1,440
0,626
0,317
—0,541
—0,276
1,110
0,541
— 1,550
—0,843
1,224
— 1,338
0,188
—0,054
—2,101
—0,008
— 1,589
0,090
1,281
2,885
—0,586
1,157
—0,443
—0,392
0,832
—1,213
0,212
—0,156
—0,203
1,224
—0,717
0,247
—0,115
—0,079
0,557
—0,453
—0,167
0,777
1,306
—0,351
0,610
1,057
—0,793
0,709
0,419
1,399
—1,170
—0,084
0,750
0,376
0,035
0,582
1,507
0,404
0,469
0,857
0,999
—0,556
1,798
0,427
1,388
— 1,465
— 1,238
—0,132
—0,700
0,856
1,222
1,717
0,072
—0,847
1,714
1,989
—0,471
1,775
0,096
0,214
0,086
1,405
—0,878
— 1,102
0,218
—1,514
0,766
0,S89
0,580
1,042
1,882
— 1,115
0,638
1,466
—0,556
—0,103
—0,510
0,614
—0,889
0,978
0,408
0,251
—0,616
2,196
—1,163
—0,533
—0,425
—2,140
0.С06
0,117
1,391
— 1,877
—0,783
—1,298
— 1,765
—0,520
1,573
—0,447
—0,397
—1,814
0,739
0,278
—0,443
1,685
0,812
0,541
— 1,193
— 1,360
0,41/
—0,768
0,117
0,145
— 1,660
0,837
1,880
0,677
—0,43,3
—0,511
-0,227
—0,301
1,141
—0,332
1,141
—0,209
0,887
0,119
0,061
—1,697
0,276
ТАБЛИЦЫ
297
О
со
00
СЛ
Ю
ОО
СО
I s
s s
3 8
J-н 00
CM <M
СМ
со
(М
00
о
CM
13107
4369
855
4141
4125
091
11523
3841
693
1624
6929
S39
LO
Ю
CO
CO
1—«
CO
LO
CO
LO
CO
LO
2
00
^ - CO
S5
СО
со
г
ю
00
00
ю
СО
ел
о
со
Ю СЛ h~ t-< CO ~
—, LO t^- ^ ^ CD CD
LO Г- "-> LO СЛ CO
—• 00 CD CO CM I- —'
"~* Ю CD CM Ю — CO
О CD
см
CD
СО
см
S
CS
Г- CO
t^ CO
i
со —
CO ^
CN
LO
CN
CM
CD
S5
см
о
LO
CO
о
CD
co
~ CO —i
S 2
CM
о
О)
CM
Ю
CM
Й
8
Ю
CO
00
CM
1233
CO
CD
475
LO
00
CO
689
177
293
169
СЛ
765
819
s?
S;
CN
789
631
417
191
Oi
f4-
CM
CM
C'J
0C/
>— CO tO —
LO Ю
CM
-и LO —'
- CO ~\
-» <M CO
20 и. AV Соболь
ЛИТЕРАТУРА
1. Бахвалов Н. С, О приближенном вычислении кратных
интегралов. Вестник МГУ, сер. матем., механ., астрон., физ., 1959,
№ 4, 3-18.
2. Бахвалов Н. С, Об оптимальных оценках сходимости
квадратурных процессов и методов интегрирования типа Монте-Карло
на классах функций. Сб. «Числ. методы решения дифф. и ин-
тегр. уравнений», «Наука», 1964, 5—63.
3. Б е л я е в Б. Н., Царицына И. В., Расчет взаимодействия
быстрых нуклонов с ядрами методом случайных испытаний.
Сб «Методы вычислений», ЛГУ, 1963, № 1, 76—107.
4 Большее Л. Н., О преобразованиях случайных величин.
Теория вероятн. и ее применение, 1959, 4, № 2, 136—149.
5. Б о л ь ш е в Л. Н., С м и р н о в Н. В., Таблицы математической
статистики, «Наука», 1965.
6 Браун Д ж. В., Метод Монте-Карло. «Современная
математика для инженеров» под ред. Э. Беккенбаха, ИЛ, 1958.
7. Б у с л е н к о Н. П., Моделирование сложных систем, «Наука»,
1968.
8. Б у с л е н к о Н, П., Г о л е н к о Д. И., Соболь И. М.,
С р а г о в и ч В. Г, Ш р е й д е р Ю. А., Метод статистических
испытаний (метод Монте-Карло). СМБ, Физматгиз, М., 1962.
9 Б у с л е н к о Н. П., Ш р е й д е р Ю. А., Метод статистических
испытаний (Монте-Карло) и его реализация на ЦВМ, Физматгиз,
М., 1961.
10. Владимиров В. С, О применении метода Монте-Карло для
отыскания наименьшего характеристического числа и
соответствующей собственной функции линейного интегрального
уравнения. Теория вероятн. и ее применение, 1956, 1, № I, 113—130.
11. Владимиров В. С, Численное решение кинетического
уравнения для сферы. Вычислит, математика, 1958, № 3, 3—33.
12. В л а д и м и р о в В. С, О приближенном вычислении вине-
ровских интегралов. Успехи матем. наук, 1960, 15, № 4, 129—135.
13. В л ад и м ир о в В. С, Соболь И. М., Расчет наименьшего
характеристического числа уравнения Пайерлса методом Монте-
Карло. Вычислит, математика, 1958, № 3, 130—137.
13а. Воронцов Ю. В., ГТолляк Ю. Г., Об использовании
квазислучайных последовательностей при прямом вероятностном
моделировании систем. Автоматика и вычислительная техника,
1971, № 6, 23—27.
ЛИТЕРАТУРА 299
14. Гельфаид И. М, Фролов А. С, Чепцов Н. Н,
Вычисление континуальных интегралов методом Монте-Карло Изв.
вузов, сер. матем , 1958, № 5, 32—45
Г) Гельфанд И. М., Ченцов Н Н., Численное вычисление
континуальных интегралов. ЖЭТФ, 1950, 31, № б, 1106—1107.
16 Гельфаид И. М, Яглом А. М., Интегрирование в
функциональных пространствах и его применение в квантовой
физике. Успехи матем. наук, 1966, 11, №1, 77—114.
17 Герман В. А., Соболь И.-М., Об использовании
поверхностей постоянной плотности при моделировании многомерных
случайных величин. Ж. вычисл. матем. и матем. физ., 1971, 11,
№ 3, 789—791
18 Голенко Д. И., Образование случайных величин с
произвольным законом распределения. Вычислит, математика. 1959,
№ 5, 83—92.
19 Голенко Д. И., Моделирование и статистический анализ
псевдослучайных чисел на ЭВМ, «Наука», 1965.
20 Грановский Б. Л., О случайных квадратурах гауссов-
ского типа. Ж- вычисл. матем. и матем. физ., 1968, 8, № 4,
879—884.
21 Грановский Б. Л., О допустимости случайных квадратур
гауссовского типа. Ж. вычисл. матем. и матем. физ., 1971, 11,
К° 1, 44—50.
22. Турин Л. С, Опыт применения метода Монте-Карло для
нахождения экстремальных значений функций. Сб. «Вопросы
вычисл. матем и вычисл. техники» под ред. Л. А. Люстерника,
Машгиз, М., 1963, 118—123.
23. Г утер Р. С, Муратова Т. А., Метод Монте-Карло и
парадокс Бертрана. Заводская лаборатория 1970, № 5, 582—584.
24 Д у н и н - Б а р к о в с к и й И. В., Смирнев Н. В., Теория
вероятностей и математическая статистика в технике (общая
часть), Гостехиздат, М., 1955.
25 Д э в и с о н Б., Теория переноса нейтронов, Атомиздат, М., 1960.
26 Дядькан И. Г., Моделирование случайной энергии гамма-
кванта, рассеянного в результате комптон-эффекта. Ж. вычисл.
матем. и матем. физ., 1966, 6, № 2, 384—385.
27 Дядькин И. Г., Жукова С. А., О постановке задачи и
алгоритме решения уравнения Шредингера методом
Монте-Карло. Ж. вычисл. матем. и матем. физ., 1968, 8, № 1, 222—229.
28 Дядькин И. Г., Стариков В. Н., Об одной
возможности экономии машинного времени при решении уравнений
Лапласа методом Монге-Карло. Ж. вычисл. матем и матем. физ.,
1965, 5, № 5, 936—938.
29 Дядькин И. Г., Стариков В. Н., Об использовании
симметрии и других особенностей нейтронных траекторий для
ускорения расчетов методом Монте-Карло. Ж- вычисл. матем. и
матем. физ , 1968, 8, Ко 5, 1001 — 1012.
30 Елепов Б. С, Михайлов Г. А., О решении задачи
Дирихле для уравнения Аи— си— —g моделированием
«блужданий по сферам». Ж- вычисл. матем. и матем. физ., 1969, 9, № 3.
647—654.
31 Ермаков С. М., Интерполирование по случайным точкам,
Ж. вычисл. матем. и матем. физ., 1963, 3, № l/186—190.
300 ЛИТЕРАТУРА
32. Е р м а к о в С. М., О допустимости процедур метода Монте-
Карло. Докл. АН СССР, 1967, 172, № 2, 262—264.
33 Ермаков С. М., Метод Монте-Карло и смежные вопросы,
«Наука», 1971.
34. Ермаков С. М., Золотухин В. Г., Полиномиальные
приближения и метод Монте-Карло. Теория вероятн. и ее
применение, 1960, 4, № 4, 473—476
35 Золотухин В. Г.. Деев Г. Е., Модификация метода
Монте-Карло для расчета дифференциального потока нейтронов и
у-квантов. [53], 53—66
Зо
36. 3 о л о ту х и и В. Г., Ермаков СМ., Применение метода
Монте-Карло для расчета защиты от ядерных излучений. Сб.
«Вопросы физики защиты реакторов», Госатомиздат, М., 1963,
171—182.
37. 3 о л о т у х и н В. Г., Е ф и м е н к о Б. А.,
Дорошенко Г. Г., Расчет амплитудных распределений импульсов в
однокристальном сцинтилляционном спектрометре быстрых
нейтронов. [53], 149—179.
38. К л и м о в Г. П., Стохастические системы обслуживания,
«Наука», 1966.
39. Ко л ьч у ж к и н А. М., Шевцова И. Н., К расчету
характеристик потока электронов методом Монте-Карло. Изв. вузов,
сер. физика, 1969, Кя 11, 134—136.
40. К о н д ю р и н Ю. М., О моделировании случайных величин ме-
методом суперпозиции. Ж. вычисл. матем. и матем. физ., 1970, 10,
№ 1, 262—266.
41. Коробов Н. М., Некоторые проблемы распределения
дробных долей. Успехи матем. наук, 1949, 4, № 1, 189—190.
42 Коробов Н. М., Теоретико-числовые методы в
приближенном анализе. Физматгиз, М., 1963.
43. К о ф м а н А., К р ю о н Р., Массовое обслуживание, теория и
- приложения, «Мир», 1965.
44 Крамер Г., Математические методы статистики. ИЛ, 1948,
45. К у б и л ю с Й. П., Л и н н и к Ю. В., Арифметическое
моделирование броуновского движения. Изв. вузов, сер. матем., 1959,
№ 6, 88—95.
46 К у р о п а т е н к о Э. С , О г и б и н В. Н., Об одной схеме
моделирования траекторий частиц в системах сложной геометрии.
Ж. вычисл. матем. и матем. физ., 1968, 8, № 1, 211—216.
47 Кутай А. К., Применение метода Монте-Карло в
исследованиях точности приборостроения. [54], 98—101.
48 Л е в и П. Стохастические процессы и броуновское движение,
«Наука», 1972.
49. М а й о р о в Л. В., Суховой А. М., О вычислении
некоторых нелинейных функционалов от решения уравнения переноса.
Сб. тезисов докл. совещания по методам Монте-Карло, Минск,
1970.
50. Майоров Л. В., Франк-Каменецкий А. Д.
Сравнение различных нелокальных оценок потока. [54], 113—115.
51. М арчу к Г. И., Методы расчета ядерных реакторов,
Госатомиздат, М., 1961.
52. М а р ч у к Г. И., М и х а й л о в Г. А, Н а з а р а л и е в М. А.,
Д а р б и н я н Р. А., Решение прямых и некоторых обратных
ЛИТЕРАТУРА 301
задач атмосферной оптики методом Монте-Карло, «Наука»,
Новосибирск, 1968.
53 Метод Монте-Карло в проблеме переноса излучений. Сб. под
ред. Г. И. Марчука, Атомиздат, М., 1967.
54 Методы Монте-Карло и их применения. Сб. тезисов докл. на 2-м
Всесоюзн. совещ. по методам Монте-Карло. Тбилиси, 1969.
55. Методы Монте-Карло и их применения. Сб. тезисов докл на
3-й Всесоюзн. конф. по методам Монте-Карло, Новосибирск,
1971.
56. М и х а й л о в Г. А., О моделировании случайных величин для
одного класса законов распределения. Теория вероятн. и ее при-
мен., 1965, 10, № 4, 749—751.
57. Михайлов Г. А., О расчетах возмущений ядерных реакторов
методом Монте-Карло. Ж. вычисл. матем. и матем. физ., 1966, 6,
Кя 2, 380-384.
58 Михайлов Г. А., К вопросу о построении экономичных
алгоритмов моделирования случайных величин. Ж. вычисл. матем.
и матем. физ., 1966, 6, № 6, 1134—1136.
59 Михайлов Г. А., Использование приближенных решений
сопряженной задачи для улучшения алгоритмов метода
Монте-Карло. Ж- вычисл. матем. и матем. физ., 1969, 9, № 5, 1145—1152.
60. М и х а й л о в Г. А., Новый алгоритм метода Монте-Карло для
оценки максимального собственного значения интегрального
оператора. Докл. АН СССР, 1970, 191, № 5, 993—996.
61. Михайлов Г. А., О сочетании метода конечных сумм с
методом Монте-Карло для решения интегральных уравнений 2-го
рода. Мат. заметки. 1971, 9, К° 4, 425—434.
62 Михайлов Г. А., Моделирования бета-распределения, один
из параметров которого целый. [55], 107—108.
63 Михлин С. Г., Смолицкий X. Л., Приближенные
методы решения дифференциальных и интегральных уравнений. СМБ,
«Наука». 1965.
64 Мишина А. П., Проскуряков И. В., Высшая алгебра.
СМБ, Физматгиз, М., 1962.
65 М и ш у с т и н Б. А., О решении задачи Дирихле для
уравнения Лапласа методом статистических испытаний. Ж. вычисл.
матем. и матем. физ., 1967, 7, № 5, 1179—1185.
66 М о ц к у с И. Б., Многоэкстремальные задачи в проектирова- \J
иии, «Наука», 1967.
67 П о л л я к Ю. Г., О сравнении двух вероятностей. Теория
вероятн. и ее применение, 1963, 8, № 2, 195.
68 П о л л я к Ю. Г., Об экономичных алгоритмах моделирования
случайных величин. Ж. вычисл. матем. и матем. физ.., 1968, 8,
№ 3, 710.
69 Полляк 10. Г., Вероятностное моделирование на ЭВМ, «Сов.
радио», М., 1971.
70 Постников А. Г., Арифметическое моделирование
случайных процессов. Труды матем. ин-та АН СССР, I960, т. 57.
7J П р о х о р ов Ю. В., Розанов Ю. А., Теория вероятностей.
Основные понятия, предельные теоремы, случайные процессы
СМБ, «Наука», 1967.
72 Растригин Л. А., Статистические методы поиска, «Наука», i )
1968. v
302 ЛИТЕРАТУРА
73. Романовский И. В., О методах моделирования
непрерывных случайных величин из величии с равномерным
распределением. Сб. «Меюды вычислений», ЛГУ, 1966, № 3, 113—121,
74 Сизова А. Ф , Оценка плотности делении в сферическом
реакторе. [53], 228—231.
75 Соболь И. М., Псевдослучайные числа для машины «Стрела».
Теория вероятн. и ее применение, 1958, 3, № 2, 205—211.
76 Соболь И. М., О решении интегрального уравнения Пай-
ер лса методом Монте-Карло. Теория вероятн. и ее применение,
1960, 5, № 3, 361—366.
77 С о б о л ь И. М , О вычислении бесконечномерных
интегралов Ж. вычисл. матем и матем. физ., 1961, 1, № 5, 917—
922.
78 Соболь И. М., Применение распределения оJ для оценки
погрешности при вычислении интегралов методом Монте-Карло.
Ж вычисл. магем. и матем. физ., 1962, 2, № 4, 717—723.
79 Соболь И. М., О периодах псевдослучайных
последовательностей Теория вероятн. и ее применение, 1964, 9, № 2, 367—
373.
80 Соболь И. М., Метод Монте-Карло для расчета критичпо-
сти в многогрупповом приближении. [53], 232—254.
81 Соболь И. М., О расчете движения заряженных частиц в
плазме методом Монте-Карло. [54], 180—182.
82 Соболь И. М., Многомерные квадратурные формулы и
функции Хаара, «Наука», 1969.
83. Соболь И. М., Об одном подходе к вычислению
многомерных интегралов. Вопросы вычислит, и приклад, математики,
Ташкент, 1970. № 38, 100—111.
84. С о б о л ь И. М., Детерминистическая интерпретация критериев
согласия и проверка псевдослучайных чисел. Сб. «Исследование
операций и статистическое моделирование», Ленинград, 1972,
162—169.
85 Соболь И. М., Вероятностная оценка погрешности для
неслучайных сеток интегрирования. Вопросы вычислит, и приклад,
матем., Ташкент, 1972. № 14, 5—11.
8Ь Соболь И. М., Статников Р. Б., ЛП-поиск и задачи
оптимального конструирования. Сб. «Проблемы случайного
поиска». «Зинатне», Рига, 1972, ЛЬ I, 117—135.
87 Срагович В. Г.. Моделирование некоторых классов
случайных процессов. Ж. вычисл. матем и матем. физ., 1963, 3, № 3,
586—593.
88 Тихонов А. Н., Самарский А. А., Уравнения математик
ческой физики, изд. 3, «Наука», 1966.
89 Фомин С. В., О включении интеграла по мере Випера в
общую теорию интеграла Лебега. Научн. докл. высш. школы,
физ.-матем. науки, 1958, № 2, 83—85.
90 Франк-Каменецкий А. Д., О решении кинетического
уравнения методом Монте-Карло. Ж. вычисл. матем. и матем.
физ., 1963, 3, № 4, 766—769.
91 Франк-Каменецкий А. Д., Применение метода Монте-
Карло для многогруппового расчета реакторов. Атомная
энергия, 1964, 16, №2, 119—122.
ЛИТЕРАТУРА 303
92 Фролов А. С, Ченцов Н. Н., О вычислении методом
Монте-Карло определенных интегралов, зависящих от параметра.
Ж. вычисл. матем. и матем. физ., 1962, 2, № 4, 714—717.
93. X и с а м у т д и н о в А. И., Оценка функционалов от
решения сопряженного уравнения переноса излучения методом
Монте-Карло. Ж. вычисл. матем. и матем. физ., 1968, 8, № 2,
467—471.
94. X и с а м ут д и н о в А. И., Единичный класс оценок для
вычисления по методу Монте-Карло функционалов от решения
; интегрального уравнения 2-го рода. Ж. вычисл. матем. и матем.
физ., 1970, 10, № 5, 1269—1280.
95. X и с а м у т д и н о в А. И., К уменьшению дисперсии оценки
вероятности методом Монте-Карло. Ж. вычисл. матем. и матем.
физ., 1970, 10, № 6, 1547—1549.
96. Ч а вч а ни дзе В. В., Джапаридзе К. Г., Кумсиаш-
в и л и В. А., Статистико-вероятностное моделирование цепных
химических реакций. Тр. Ин-та кибернет. АН Груз. ССР, 1963,
1, 85—91.
97. Ч е н ц о в Н. Н., О квадратурных формулах для функций
бесконечно большого числа переменных. Ж. вычисл. матем. и
матем. физ., 1961, 1, № 3, 418—424.
98. Ч е н ц о в Н. Н., Оценка неизвестной плотности распределения
по наблюдениям. Докл. АН СССР, 1962, 147, № 1, 45—48.
99. Ч е н ц о в Н. Н., Псевдослучайные числа для моделирования
марковских цепей, Ж. вычисл. матем. и матем. физ., 1967, 7,
Ко 3, 632—643.
100. Шилов Г. Е., Интегрирование в бесконечномерных
пространствах и интеграл Винера. Успехи матем. наук, 1963, 18, № 2,
99—120.
101. Ш рейдер Ю. А., Решение систем линейных алгебраических
уравнений по методу Монте-Карло. Вопросы теории матем.
машин, 1958 № 1, 167—171.
102. В A n k 6 v i G., A note on the generation of beta distributed and
gamma distributed random variables. Magyar Tud. Akad. Mat.
Kut Int .Kozlemenyei, 1964, 9A, Хя 3, 555—563.
103. Bckessy A., Remarks on beta distributed randon numbers.
Magyar Tud. Akad. Mat. Kut. Int. Kozlemenyei, 1964, 9A, № 3,
565—571.
104 Berger M. J., Monte Carlo calculation of the penetration and
diffusion of fast charged particles. [158], 135—215.
105 Berger M. J., Reflection and transmission of gamma
radiation by barries, Monte Carlo calculation by a collision-density
method. J. Research NBS, 1955, 55, № 6, 343—350.
106 Bouquet G., Feix M., Nicourd P., Sajaloli C,
Emploi de la methode de Monte-Carlo pour la determination du
volume critique d'un cylindre. C. R. acad. sci., 1958, 246, № 9,
1382—1384.
107. Box G. E. P.. Muller M. E., A note on the generation of
random normal deviates. Ann. Math. Statistics, 1958, 29, № 2,
610—611.
108 Butcher J. C, Random sampling from the normal distribu-
' tion. Comput. J., 1961, 3, N2 4, 251—253.
304 ЛИТЕРАТУРА
109. Butcher J С, Messel H., Electron number distribution
in electron-photon showers. Phys. Rev., 1958, 112, № 6,
2096—2106.
110. Butler J. W., Machine sampling from given probability
distributions. [170], 249—264.
111. С ash we 11 E. D., Everett C. J., A practical manual on the
Monte Carlo method for random walk problems. Pergamon Press,
1959.
112. Col em an W. A., Mathematical verification of a certain Monte
Carlo sampling technique and applications of the technique to
radiation transport problems. Nucl. Sci. Engng, 1968, 32, № 1,
76—81.
113. Courant R., Friedrichs F., Lewy H., Ober die par-
tiellen Differenzengleichungen der mathematischen Physik. Math.
Annalen, 1928, 100,32—74.
114. CutUss J. Hm «Monte Carlo» methods for the iteration of
linear operators. J. Math. Phys., 1954, 32, № 4, 209—232.
115. Curt is s J. H., A theoretical comparison of the efficiencies of
two classical methods and a Monte Carlo method for computing
one component of the solution of a set of linear algebraic equa-«
tions. [170], 191—233.
116. Cutkosky R. E., A Monte Carlo method for solving a class
of integral equations. J. Research NBS, 1951, 47, № 2, 113—115.
117. D a h 1 quis t G.f Monte-Carlo-metoden. Nordisk Mat. Tidskr.,
1954, 2, 27—43.
118. Davis D. H., Critical-size calculations for neutron systems
by the Monte Carlo method. [158], 67—88.
119. Donsker M. D., Kac M., A sampling method for
determining the lowest eigenvalue and the principal eigenfunction of
Schrodinger's equation. J. Research NBS, 1950, 44, 551—557.
120. Dupac V,, Stochasticke pocetni metody. Cas. pro pest, mat.,
1956, 81, № 1, 55—68.
121. Forsyth G. E., Lei bier R. A., Matrix inversion by a
Monte Carlo method. Math. Tables Aids Cornput.. 1950, 4, № 31
127—129.
122 Fortet R., On the estimation of an eigenvalue by an additive
functional of a stochastic process, with special reference to the
Kac —Donsker method. J. Research NBS, 1952, 48, № 1, 68—75.
123 Fosdick L. D., Approximation of a class of Wiener integrals.
Math, of Comput., 1965, 19, № 90, 225—233.
124. Fosdick L. D., The Monte Carlo method in quantum statistics.
SIAM Rev., 1968, 10, № 3, 315—328.
125. Fosdick L. D., Jordan H. F., Path-integral calculation of
the two-particle Slater sum for He4. Phys. Rev., 1966, 143, № 1,
58—66.
126. Franklin J. N., Deterministic simulation of random processes.
Math, of Comput., 1963, 17, № 81, 28—59.
127. Goertzel G., Kalos M., Monte Carlo methods in transport
problems. Progress in nuclear energy, ser. 1: Phys. and Math.,
1958, 2, 315—369.
128. Haber S., A modified Monte Carlo quadrature. Math, of
Comput., 1966, 20, № 95, 361-368; 1967, 21, № 99, 388-397.
ЛИТЕРАТУРА 305
129 На be г S., Stochastic quadrature formulas. Math, of Comput.,
1969,23, 108, 751—764.
130 Haber S., Numerical evaluation of multiple integrals. SIAM
Rev., 1970, 12, № 4, 481—526.
131. Malton J. H., On the efficiency of certain quasi-random
sequences of points in evaluating multi-dimensional integrals. Nu-
mer. Math., 1960, 2, № 2, 84—90.
132. Ha It on J. H., A retrospective and prospective survey of the
Monte Carlo method. SIAM Rev., 1970, 12, № |, 1—63.
133. Ha It on J. H., Handscomb D. C, A method for
increasing the efficiency of Monte Carlo integrations. J. Assoc. Comput.
Machinery, 1957, 4, № 3, 329—340.
134. Hammersley J. M., Monte Carlo methods for solving mul-
tivariabie problems. Ann. New York Acad. Sci., 1960, 86, № 3,
844—874.
135. H a m m e r s 1 e у J. M., Handscomb D. C, Monte Carlo
methods. Methuen, London, 1964.
136. Hammersley J. M., Morton К W., A new Monte Carlo
technique: antithetic variates. Proc. Cambridge Philos. Soc, 1956,
52, № 3, 449—475.
137. Handscomb D. C, Remarks on a Monte Carlo integration
method. Numer. Math., 1964, 6, № 4, 261—268.
138. Hlawka E. Uniform distribution mod. 1 and numerical
analysis Compositio Math. 16, № 1—2, 92—105.
139. Hull Т. Е., D obeli A. R., Random number generators. SIAM
Rev., 1962, 4, № 3, 230—254.
140. Jansson В., Random numbers generators. Stockholm, 1966.
141. John к М. D., Erzeugung von betaverteilten und gamma-
verteilten Zufallszahlen, Metrika. 1964, 8, № 1, 5—15.
142. К a h n H., Random sampling (Monte Carlo) techniques in
neutron attenuation problems. Nucleonics, 1950, 6, № 5, 27—33; 1950,
6, № 6, 60—65.
143. Kahn H., Use of different Monte Carlo sampling techniques.
[170], 146—190.
144. Kalos M. H., Monte Carlo method for estimation of flux at a
point. Nuclear Sci. Engng, 1963, 16, № 1, 111—117.
145. Kalos M. H., Importance sampling in Monte Carlo shielding
calculations. Nuclear Sci. Engng, 1963, 16. № 2, 227—234.
146. Kalos M. H., Stochastic wave function for atomic Helium.
J. Comput. Phys., 1966, 1, № 2, 257—275.
147. Kendall M. G., Smith В. В., Randomness and random
sampling numbers. J. Royal Statist. Soc, 1938, 101, № 1,
147-166.
148. К sch wen d t H., Convergence limits in the Monte Carlo
theory of integral equations. Numer. Math., 1968, 11, № 4,
307—314.
149. Laurent P. - J., Remarque sur revaluation d'integrales par
la methode de Monte-Carlo. С R. acad. sci., 1961, 253, № 4,
610—611.
150. La wand e S. V., Jensen C. A., Sahlin H. L., Monte
Carlo integration of the Feynman propagator in imaginary time,
J. Comput. Phys., 1969, 3, № 3, 416—443.
306 ЛИТЕРАТУРА
151. L eh me г D. H., Mathematical methods in large-scale
computing units. Proc. second symposium on large-scale digital
calculating machinery A949). Harvard Univ. Press, 1951, 141—146.
152. Leimdorfer M., On the use of Monte Carlo methods for
calculating the deep penetration of neutrons in shields. Chalmers
Tekn. Hogsk. Handi., Gothenburg (Sweden), 1964, № 287.
153 MacMill an D. В., Comparison of statistical estimators for
neutron Monte Carlo calculations. Nuclear Sci. Engng, 1966, 26,
№ 3, 366—372.
154. Mann N. В., Wald A., On the choice of the number of class
intervals in the application of the chi square test. Ann. Math.
Stat., 1942. 13, № 3, 306—317.
155. M a r s a g 1 i a G., Expressing a random variable in terms of
uniform random variables. Ann. Math. Stat. 1961, 32, № 3,
894—898.
156. Mars a gli a G., MacLaren M. D., Bray T. A., A fast
procedure for generating normal random variables. Comm. Assoc.
Comput. Machinery, 1964, 7, № 1, 4—10.
157. Marshall A. W., The use of multi-stage sampling schemes
in Monte Carlo computations. [170], 123—140.
158. Methods in computational physics, ed. B. Alder, S. Fernbach,
M. Rotenberg. Vol. 1: Statistical Physics. Acad. Press, New
York, 1963.
159. M e t г о р о I i s N.. U 1 a m S. M., The Monte Carlo method. J.
Amer. Statist. Assoc, 1949, 44, № 247, 335—341.
160. Morton K. W., A generalization of the antithetic variate
technique for evaluating integrals. J. Math. Phys., 1957, 36, № 3,
289—293.
161. Morton K. W., Scaling neutron tracks in Monte Carlo
shielding calculations. J. Nuclear Energy, 1957, 5, № 3/4, 320—324.
162. Mull er M. E., Some continuous Monte Carlo methods for the
Dirichlet problem. Ann. Math. Stat., 1956, 27, № 3, 569—589.
163. Neumann J., Various techniques used in connection with ran*
dom digits. NBS Appl. Math, series, 1951, N° 12, 36—38.
164. Powell M. J. D., Swann J., Weighted uniform sampling —
a Monte Carlo technique for reducing variance. J. Inst. Math,
and its Appl., 1966, 2, № 3, 228—236.
165. Q u e n о u i 11 e M. H., Tables of random observations from
standard distributions. Biometrika, 1959, 46, № 1/2, 178—202.
166. RAND Corporation. A million random digits with 100 000
normal deviates. The Free Press, 1955.
167. Satoshi I., A new pseudo-random generator using binary
shift-register. Bull. Tokyo Inst. Technology, 1965, JSfe 68, 1—7.
168. Span ier J., Gelbard E. M., Monte Carlo principles and
neutron transport problems. Addison-Wesley, Reading, 1969.
169. Stee n N. M., A simple method to improve the efficiency of the
2fl/2/ estimator in Monte Carlo programs. Trans. Amer. Nuclear
Soc, 1966, 9, № 1,204.
170. Symposium on Monte Carlo methods, ed. H. A. Meyer. Wiley.
New York, 1956.
171. Та us sky O., Todd J., Generation and testing of pseudo*
random numbers. [170], 15—28.
ЛИТЕРАТУРА 307
172. Та us wort he R. С, Random numbers generated by linear
recurrence modulo two. Math, of Comput., 1965, 19, № 90,
201—209.
173. Thou less D. J., Integration of the Schrodinger equation by
a Monte Carlo method . Proc. Phys. Soc, 1965,86, № 553,905—913.
174. Tocher K. D., The application of automatic computers to
sampling experiments. J. Royal Statist. Soc, ser. B, 1954, 16, № 1,
39—61.
175. Todd J., Experiments in the solution of differential equations
by Monte Carlo methods. J. Washington Acad. Sci., 1954, 44, № 12,
377—381.
176. Torn A., Crude Monte Carlo-quadrature in infinite variance case
and the central limit theorem. Nordisk. Tidskr. Inform. Behandl.,
1966, 6, № 4, 339—346.
177. Tsuda Т., Ichida K., Nonlinear interpolation of
multivariable functions by the Monte Carlo method. J. Assoc. Comput.
Machinery, 1970, 17, JNfb 3, 420—425.
178. Tsuda Т., Ichida K., Kiyono Т., Monte Carlo
path-integral calculations for two-point boundary-value problems. Nu-
mer. Math., 1967, 10, J\fb 2, 110—116.
179. Tsuda Т., Matsumoto H., A note on linear extrapolation
of multivariable functions by the Monte Carlo method. J. Assoc.
Comput. Machinery, 1966, 13, № 1, 143—150.
180. V e r d i e r P. H., Relations within sequences of congruential
pseudo-random numbers. J. Research NBS. ser. B, 1969, 73B, № 1,
41—44.
181. Wasow W., A note on the inversion of matrices by random
walks. Math. Tables Aids Comput., 1952, 6, 78—81.
182. Weyl H., Ober die Gleichverteilung von Zahlen mod Eins.
Math. Annalen, 1916, 77, № 3, 313—352.
183. Zaremba S. K., The mathematical basis of Monte Carlo and
quasi-Monte Carlo methods. SIAM Rev., 1968, 10, № 3, 303—314
184. Zielinsky R., Metody Monte Carlo. Warszawa, 1970.
185 Zierler N., Linear recurring sequences. J. SIAM, 1959, 7,
№ 1, 31—48.
УКАЗАТЕЛЬ
Алгебраические системы 193
Алгоритм Монте-Карло 98, 254
, трудоемкость 99
, конструктивная
размерность 255
Асимптотически вполне
равномерное распределение 273
Бесконечномерная
последовательность точек 270
Блуждания по сферам 285—286
Броуновская траектория 288
Вариационный ряд 36
Вероятная ошибка 88
Вероятность доверительная 31
—перехода 163
— поглощения 168
— рассеяния 47, 168
Веса 164, 168
— векторные 244
— статистические 239, 240
Ветвящаяся траектория 213
Взвешенная равномерная
выборка 152
Винеровский интеграл 287
Включение особенности в
плотность 111
Вполне равномерное
распределение 271
Выборка 92
— взвешенная равномерная 152
— по группам 135
— систематическая 240
— существенная 108
Выборка типическая 138
Выделение главной части 101
Вычисление обратной матрицы
198
— одной компоненты решения 197
Геометрический
Карло 94
Гистограмма 219
Группировка 32
метод Монте-
Датчик случайных чисел 15
Двухэтапная схема расчета 120
Дерево 213
—, лексикографический обход
214
— , обход по поколениям 214
Длина отрезка апериодичности 21
— свободного пробега 221
Доверительная вероятность 31
Доверительный интервал 92
Допустимая плотность 108
Допустимое распределение 196
Дробная часть Д(х) числа х
12
Зависимые испытания 123
Задача Дирихле 202, 284
Имитация 210
Интеграл вероятностей 88
— Винера 287
-— континуальный 287
Интегральное уравнение
неоднородное 171
УКАЗАТЕЛЬ
309
Интегральное уравнение Пай-
ерлса 189
теории рассеяния 182
Интегральной суперпозиции
метод 67
Инте1рирование по части
области 102
переменных 105
Интенсивность потока заявок 216
Интерполирование 279
Итерации 161
Итерированные функции 161
Квадратурная формула 143
интерполяционная 144
случайная 143
интерполяционная 146
Квазислучайные числа 253
Класс функций L2(G) 162
--L2(G\p) 96
Конструктивная размерность
алгоритма 255
Континуальный интеграл 287
Коэффициент доверия 31,92
— Фурье 167
К. р. 255
Критерий согласия Колмогорова
43
X2 31
о2 34
Критическая область 214
ЛП-поиск 283
ЛПт-последовательность 265
— обобщенная 270
Матрицы обращение 198
Метод возмущений 28
— вычетов 22
— Неймана 75
— обратных функций 49
— подобных траекторий 242
— постоянного сечения 227
— псевдослучайных чисел 16
— середины квадрата 22
— сравнений 22
— суперпозиции 64
интегральной 67
модифицированный 66
— существенной выборки 108
дЛЯ траекторий 173, 184,
187
Методы отбора 74
— перемешивания 24
— уменьшения дисперсии 100
Многогрупповая теория переноса
244
Моделирование биномиального
распределения 72
— бэта-распределения 85
— в полярных координатах 62
— гамма-распределения 71
— дискретной случайной
величины 44
— комптон-эффекта 84
— многомерного нормального
распределения 60
— многомерной случайной точки
54
с независимыми
координатами 53
— непрерывной случайной
величины 48
— неупругого рассеяния
нейтронов 72
— нормального распределения 63,
73
— равномерного распределения в
параллелепипеде 54
в пирамиде 85
в симплексе 85
в сложных областях 79
в шаре 58, 81
На поверхности сферы 59,
85
— свободного пробега
заряженной частицы 229
нейтрона в кусочно
однородной среде 224
в однородной среде 223
в произвольной среде
227
— случайного направления 59
события 46
— «судьбы» нейтрона при
столкновении 47
— усеченных распределений 75
— экспоненциального
распределения 49, 84
— энергии нейтронов деления 84
Начальная плотность 164
Нейтроны деления 84, 213
310
УКАЗАТЕЛЬ
11еравенство Коши-Буняковского
292
— Чебышева 141
Неравномерность 262
Одногрупповая теория переноса
222
Оптическая длина 222
Отклонение 261
Отрезок апериодичности 21
Оценка качества 220
— квадратичного функционала
207
— несмещенная 92
— по поглощениям 209
— по столкновениям 209
— погрешности 87, 89, 128
— сверхэффективная 141
— смещенная 92, 151
— трудоемкости 99
— усложненная 181
Плотность бэта-распределения 85
— вероятностей перехода 163
— гамма-распределения 71
— допустимая 108
— начальная 164
— первых столкновений 247
— распределения Стьюдента 90
X2 31
— столкновений 182
Погрешности оценка 87, 89, 128
Подобных траекторий метод
242
Последовательность точек
бесконечномерная 270
равномерно распределенная
259
— Холтона 264
обобщенная 271
— чисел асимптотически
вполне равномерно распределенная
273
вполне равномерно
распределенная 271
Постоянного сечения метод 227
Поток Пуассона 216
иестационарный 216
— Эрланга 216
Правило «трех сигм» 88
Преобразование плотности 58
Простейший метод
Монте-Карло 93
с поправочным
множителем 153
Проверка интервалов 37
— комбинаций 37
— пар 37
— псевдослучайных чисел 40,
274
— серий 37
— частот 37
Псевдослучайные числа 17
Равномерно распределенная
последовательность 259
Разыгрывание случайной
величины 44
Распределение допустимое 106
— длины свободного пробега
221
— Колмогорова 43
— равномерное в многомерной
пирамиде 85
в многомерном
параллелепипеде 54
симплексе 85
в шаре 58, 81
на поверхности
многомерной сферы 85
Рассеяние частиц 182
Расщепление траектории 239
Ряд Неймана 171
Сечение взаимодействия 221
Символ Кронекера б/у 167
Симметризация 116, 159
Система массового
обслуживания 215
Систематическая выборка 240
Случайная интерполяционная
квадратурная формула 146
— квадратурная формула 143
— траектория Т( 163
Гоо 174
ветвящаяся 213
, лексикографический
обход 214
¦ , обход по поколениям
214
с поглощением 168
Случайная цепь 195
— цифра 10
Указатель
311
Случайное направление 59
— событие 46
— число 10
Случайный обрыв траектории
239
— поиск 281
— поток заявок 216
Случайных цифр таблица 13, 131,
295
— чисел датчик 15
Сопряженное уравнение 179
Суперпозиции метод 64
Существенная выборка 108
Сходимость по вероятности 34
Счет по поколениям 214
Таблица случайных цифр 13, 131,
295
Теорема Колмогорова 43
— Мизеса — Смирнова 34
— Пирсона 30
— Фишера 90
— Хинчина 87
— Чебышева 286
Точность метода Монте-Карло
96
Траектории броуновские 288
— ветвящиеся 213
— с поглощением 7v 168
-Г/ 163
— Гоэ 174
Трудоемкость алгоритма Монте-
Карло 99
Уравнение дифференциальное
Лапласа 201, 284
Пуассона 201
теплопроводности 209
— интегральное неоднородное 171
однородное 185
Пайерлса 189, 252
— мажорантное 177
— моноциклическое 28
— сопряженное 179
—теории рассеяния 182
— Шредингера 291
Уровень значимости 31
Функции от большого числа
переменных 13-1, 206, 279
Целая часть Ц(х) числа х 12
Эмпирическая оценка дисперсии
89
— функция распределения 34
Эффективное сечение
взаимодействия 221
Эффективность метода Неймана
77
— отбора 74
Эффективный коэффициент
размножения нейтронов 214
Ядро столкновений 182, 222
— интегрального уравнения 171
Илья Меерович Соболь
ЧИСЛЕННЫЕ МЕТОДЫ
МОНТЕ-КАРЛО
М., 1973 г., 312 стр. с илл.
Редактор Г. Я Пирогова
Техн редактор Е Н Земская
Корректор В. П. Сорокина
Сдано в набор 13/VII 1973 г. Подписано к печати
17/ХП 1973 г. Бумага 84Х108/32. Физ. печ. л. 9,75.
Условн. печ. л. 16,38. Уч.-изд. л. 16.08 Тираж
22 000 экз. Т-19945. Цена книги 1 р. 22 к.
Заказ N» 132
Издательство «Наука»
Главная редакция
физико-математической литературы
117071, Москва, В-71, Ленинский проспект, 15
4-я типография изд ва «Наука».
Новосибирск, 77, Станиславского, 25,