Текст
                    В. А.ВАТУТИН,!. М.ТЕЛЕВИНОВА
В. П. ЧИСТЯКОВ
ВЕРОЯТНОСТНЫЕ
МЕТОДЫ
в физических
исследованиях

В. А. ВАТУТИН, Т. М. ТЕЛЕВИНОВА, В. П. ЧИСТЯКОВ ВЕРОЯТНОСТНЫЕ МЕТОДЫ в физических исследованиях , МОСКВА «НАУКА» ГЛАВНАЯ, РЕДАКЦИЯ ФИЗИКО-МАТЕМАТИЧЕСКОЙ ЛИТЕРАТУРЫ 1985
ББК 22.171 В 21 УДК 519.2 Ва ту тп п В. Л.. Те л свинов а Т. М., Ч и с т я к о в В. П. Вероятностные методы в физических исследованиях.— М.: Нау- ка, Главная редакция физико-математической литературы, 1985. Обсуждается выбор и использование математических моде- лей изучаемых явлений для задач из различных разделов ядер- ной физики (спектрометрии экспериментов, теории счетчиков, процессов в ядерпых реакторах и других). Рассматриваются-об- щие методы обработки результатов измерений (классические статистические методы, методы регуляризации, робастпое оце- нивание) . Для математиков, физиков, инженеров, использующих тео- рию вероятпцстей для решения прикладных задач, аспирантов* и студентов математических и физических специальностей. Табл. 1. Ил. 14. Библиогр. 55 иазв. Рецензент ы: кандидат физико-математических паук Ю. И. Тюрин, кандидат физико-математических наук Ф. II. Беляев В 1702060000-031^—^ 053(02.)—85 ©Издательство «Наука» Главная редакция ' (Ьизико-математической литературы. 19N5
ОГЛАВЛЕНИЕ Предисловие *............................ Введение. Математические модели..................... Глава 1. Схемы распада радиоактивных ядер . § 1. Постановка задачи.......................... § 2. Математические модели . . . . . . . § 3. Среднее и дисперсия числа попаданий в задан- ное состояние................................... § 4. ^-переходы................................. § 5. Совпадения 7-переходов (77-совпадения) . § 6. Оценки параметров.......................... Глава 2. Задачи обработки результатов спектрометри- ческих экспериментов................................. § 1. Спектрометрические эксперименты .... § 2. Математические модели....................... § 3. Оценка параметров.......................... Глава 3. Счетчики...................*............... § 1. Общая модель счетчика . k.................. § 2. Счетчик типа I. Общее определение .... § 3. Пуассоновская модель счетчика типа I . § 4. Общая модель счетчика типа I............... § 5. Счётчик типа II. Общее определение .... § 6. Счетчики с постоянным продлевающимся мерт- вым временем.................................... § 7. Регистрирующие системы с несколькими счетчи- ками типа I..................................... § 8. Сочетание счетчиков вида II I.............. § 9. Сочетания счетчиков вида II -> II и I -> II . § 10. Некоторые статистические задачи в теории счетчиков ...................................... Глава 4. Ветвящиеся процессы........................ § 1. Метод производящих функций................. § 2. Модель фотоэлектронного умножителя . § 3. Концентрация нуклидов...................... § 4. Вероятностные характеристики систем с накоп- лением нейтронов . . . ................ § 5. Ветвящиеся процессы с диффузией . . . . Глава 5. Задачи градуировки '....................... , § 1. Основные математические модели........... § 2. Задачи градуировки с точно известными значе- ниями шкалы..................................... 5 7 13 13 14 20 23 25 29 32 32 33 43 58 65 68 69 74 79 81 83 92 92 93 97 103 117 125 125 128 1*
4 ОГЛАВЛЕНИЕ § 3. Асимптотические свойства оценок в задачах гра- дуировки со случайными значениями шкалы . . 134 § 4. Оценки максимального правдоподобия .... 144 Глава 6. Объединение оценок..........................132 § 1. Объединяемые оценки........................ 152 § 2. Критерий неоднородности объединяемых оценок 153 § 3. Оценке! параметров но загрязненной выборке мп дисперсиями.................................. 157 § 4. Объединение оценок при неполной информации о корреляционной матрице..........................164 Глава 7. Оценивание но неоднородным выборкам . . 171 § 1. Неоднородность выборки......................171 § 2. Критерий неоднородности объединяемых оценок 172 § 3 Оценка параметров по загрязненной выборке 178 § 4. Минимаксные оценки..........................184 Глава 8. Метод регуляризации и смененное оценива- ние /............................................190 § 1. «Обрашые» задачи........................... 190 § 2. Линейные алгебраические уравнения .... 192 § 3. Системы алгебраических уравнений с навес гний матрицей коэффициентов............................198 § 4. Смещенное оценивание........................200 Список литературы...................................205
ПРЕДИСЛОВИЕ Обработка результатов экснеримептов в физике во- обще и в ядерной физике в частности требует ясного представления о происходящих при измерениях про- цессах, знания основных положений теории вероят- ностей н математической статистики, умелого исполь- зования приемов вычислительной математики и про- граммирования. Поэтому решение важных прикладных задач невозможно без привлечения ученых различных специальностей. Однако специалисты, успешно работа- ющие в своей основной области, нередко о других об- ластях имеют недостаточно хорошее представление. Кроме того, неодинаковая оценка значимости различ- ных сторон решения задачи может при определенных условиях отрицательно повлиять па успех совместной работы. Физика, занимающегося обработкой эксперименталь- ных данных, прежде всего (и это естественно) интере- сует полученный в результате обработки конечный вы- вод, ради которого ставился эксперимент; статистиче- ские методы и используемые программы для ЭВМ нужны ему лишь как вспомогательный инструмент. Это обстоятельство нередко определяет желание сразу вос- пользоваться готовыми рецептами. Такой подход может привести к, ошибочным результатам, так как готовых рецептов для каждой конкретной задачи практически никогда не бывает. Математика, занимающегося прикладной задачей, нередко больше интересуют новые методы пли форму- лы, которые удалось получить при ее решении. Если формула дает возможность решить задачу, ио с точки зрения математика не является «красивой», то интерес к исследуемой проблеме значительно ослабевает. Если «личные» интересы специалистов разных об- ластей при решении задачи не подчинены общей цели, то рассчитывать па удачу трудно. Надеемся, что настоящая книга будет способство- вать взаимному ознакомлению физиков и математиков
6 ПРЕДИСЛОВИЕ с постановками задач и методами их решений, а также даст представление о некоторых трудностях, которые приходится при этом преодолевать. Описания на веро- ятностном языке математических моделей явлений, хо- рошо знакомых физикам, окажутся полезными для более строгого анализа соответствия модели описывае- мому явлению, дадут возможность шире использовать в вычислениях стандартные приемы теории вероятно- стей (вместо, или в дополнение к интуитивным рас- суждениям), будут способствовать уменьшению разли- чий в терминологии, что приведет к облегчению ис- пользования специальной литературы по теории веро- ятностей. Возможно, изложение мало знакомцх при- кладникам разделов теории вероятностей (например, гл. 4) будет способствовать их более широкому исполь- зованию в прикладных задачах. С другой стороны, ма- тематиков, мало связанных с прикладными задачами, главы 7 и 8 познакомят с направлениями, возникнове- ние которых существенно стимулировалось потребно- стями практики. Вместе с тем нужно отметить, что мы не претенду- ем на полноту изложения затронутой в книге темати- ки; это замечание относится прежде всего к главам 4, 7, 8. Читателям, заинтересовавшимся этими главами, можно рекомендовать монографии [34], [39], [52J. Для понимания изложения достаточно знакомства с начальным курсом теории вероятностей для техни- ческих вузов (см., например, [43], [18J) или универси- тетским курсом (см. [35]). Пользуемся случаем поблагодарить академиков В. С. Владимирова, Ю. В. Прохорова, А. Н. Тихонова за обсуждение задач, вошедших в эту книгу. В своей работе мы постоянно пользовались советами и разно- сторонней помощью ректора МИФИ В. М. Коло- башкина, сотрудников МИАН Б. А. Севастьянова, А. М. Зубкова, О. В. Вискова, а также сотрудников ОИЯИ (г. Дубна) Ц. Вылова и В. Н. Покровского. Усовершенствованию изложения способствовали крити- ческие замечания Ф. Н. Беляева (ИТЭФ) и Ю. Н. Тю- рина (МГУ). Всем им мы приносим свою искреннюю благодарность. Авторы
ВВЕДЕНИЕ МАТЕМАТИЧЕСКИЕ МОДЕЛИ При любой обработке экспериментальных данных, состоящей в нахождении оценки измеряемого парамет- ра по результатам прямых измерений (показания шка- лы прибора, отсчеты в каналах спектрометра и т. п.), явно или неявно используются некоторые априорные предположения. ЭГи предположения являются по су- ществу моделью процесса измерения или моделью изу- чаемого физического процесса. Теоретическое сравне- ние различных методик обработки экспериментальных данных и оценка их эффективности возможны лишь тогда, когда априорные предположения или модель точно описаны. Четко определенную модель явления, сформулиро- ванную в математических терминах, называют матема- тической моделью исследуемого явления. При выборе такой модели приходится учитывать два противополож7 ных требования: А) соответствие модели изучаемому процессу; Б) достаточная простота модели,, позволяю- щая провести ее детальное исследование математиче- скими средствами. Выбор математической модели — самая существен- ная часть решения любой прикладной задачи. В этой книге построение математических моделей будет прове- дено для широкого круга реальных процессов, встре- чающихся в ядерной физике. Рассмотрим несколько известных вероятностно-ста- тистических моделей. В математической статистике выборкой объема п называют случайный вектор х = = (^i, ..., Хп)» Величина х является исходной для всех дальнейших вычислений, проводимых при нахождении измеряемого параметра. Все математические предпо- ложения о выборке содержатся в указании закона рас- пределения х. В различных сериях измерений пли экспериментов величина х может принимать различные зпаченпя.
8 ВВЕДЕНИЕ. МАТЕМАТИЧЕСКИЕ МОДЕЛИ Простейшей и наиболее распространенной моделью измерений является независимая выборка. В этом слу- чае величины Xi, ..., хп независимы; их. совместная плотность распределения рХ1... хп • ••> ип) определя- ется равенством РХ1...Хп(.Щ., ...,Un) = p^-.p^Un), (0.1) где р(и) — одинаковая для всех Xi плотность распреде- ления. Модель (0.1) пригодна для описания независи- мых экспериментов, проводимых в одинаковых услови- ях. Уже на основании модели (0.1) можно делать не- которые выводы об оценках, напрпмер, параметра а = ==М^ (/ = 1, ..., лг). В качестве примера рассмотрим нередко используемую на практике рекомендацию: оценка параметра а вычисляется по формуле Зная лишь о существовании некоторых характеристик плотности р(и), таких как J up (и) du и J и2р (и) du,не- трудно оцепить &х и, следовательно, близость х к а. По выборке ад, ..., хп легко вычисляется эмпирическая функция распределения; из предположения (0.1) выте- кает сходимость при п -> оо эмпирической функции распределения к теоретической. В рамках этой модели можно исследовать и сравнивать как другие оценки параметра а, так и различные оценки иных парамет- ров, связанных с плотностью ptu). Таким образом, опа удовлетворяет требованию Б). Однако, если ограни- чить пашу модель рекомендацией (0.2), не привлекая (0.1) и каких-либо других предположений, то никаких содержательных выводов о качестве оценки х полу- чить в этом случае пе удастся; нельзя ни оценить скорость приближения х к а, пи сравнить х с другими возможными оценками. Если выполнение условия Б) для различного рода моделей проверяется в процессе непосредственных ис- следований в рамках самой математической модели, то справедливость условия Л) никакими математическими средствами установить нельзя. Единственным критери- ем в этом случае является практика. Если совокуп- ность выводов, сделанных на основе модели, согласу-
ВВЕДЕНИЕ. МАТЕМАТИЧЕСКИЕ МОДЕЛИ 9 ется с экспериментальными данными, то модель сле- дует признать удовлетворительной. В противном слу- чае нужно строить другую модель. Как правило, в априорную информацию удается включить более пол- ные сведения о выборке. Иногда можно указать вид плотности распределения хе. р(и)=р0(я, 61, • • •, 6Д (0.3) где ро — известная функция; 0 = (6Ь ..., 9J — неиз- вестные параметры. Особенно часто используется пред- положение о пормальпости распределения х{. Предпо- ложения такого рода в случае согласия с эксперимен- том позволяют сделать более глубокие и тонкие выво- ды о характере происходящих явлений. Промежуточное положение между моделями (0.1) п (0.3) занимает модель, использованная Хубером (см. [511) для построения оценок по загрязненным измере- ниям. Согласно одной из его моделей Xi (£=1, ..., п) независимы, одинаково распределены и каждая вели- чина Xi имеет функцию распределения Flu) = (1 _ 8)Т?0(н - с) + ^Ши), (0.4) где Fotu — c)—функция распределения, описывающая основную долю измерений; е (0< е < 1) — доля загряз- ненности; с — оцениваемый параметр сдвига; Н(и) — неизвестная функция распределения загрязняющих из- мерений. В этой модели неизвестной является функ- ция распределения Я(н). Обычно предполагается, что Н(и) принадлежит некоторому классу (например, клас- су симметричных распределений). Предположение о независимости измерений, как правило, выполняется для измерений, полученных не- посредственно с прибора без дополнительной обработ- ки. Однако это предположение в каждой конкретной за- даче требует тщательного исследования и обоснования. Коррелпровапность результатов измерений х^ х2, ... ..., хп по самой выборке проверить нельзя. Для такой проверки нужно иметь набор независимых выборок xih xi2, ..., xin (Z=l, ..., N), (0.5) полученных в таких же условиях, как и исследуемая выборка. Зная выборки (0.5), можно оцепить ковариа- ции. В качестве оценки cov Сгл, xt) обычно используют
10 ВВЕДЕНИЕ. МАТЕМАТИЧЕСКИЕ МОДЕЛИ выборочную ковариацию а затем статистическими методами решают вопрос о наличии зависимости. Исследование по выборкам (0.5) можно заменить исследованием условий проведения опыта или анали- зом формул, ПО КОТОРЫМ ВЫЧИСЛЯЛИСЬ веЛИЧИНЫ Xi, ... ..., хп, если они пе были получены в результате пря- мых измерений. Решая вопрос о зависимости, следует избегать слиш- ком вольного использования теоретико-вероятностных понятий. Иногда за коррелированность принимается одинаковая распределенность величин; нередки также случаи, когда рассматриваются как зависимые резуль- таты опытов, в которых вероятности исходов зависят от номера опыта. Результаты прямых измерений xh ..., хп, получен- ных па одном приборе, можно рассматривать как неза- висимые. Одпако, как пи страппо, от этого предположе- ния весьма часто приходится отказываться. Пусть, на- пример, £i = a + A + 6f U = l, ..., п\ (0.6) где а — измеряемый параметр, 6г- — случайная ошибка измерения, А — систематическая ошибка данного при- бора. Если обрабатываются измерения, полученные с одного прибора, то А — постоянная величина и в (0.6) независимы. Если параметр а оценивается по груп- пам результатов измерений вида (0.6), полученных с разных приборов, xhi — а + Аа + 6hi U = 1, ..., п; к = 1, ..., А), то &-й прибор, на котором получены измерения яА1, ... ...', xhn, естественно рассматривать как случайно вы- бранный’и, следовательно, систематическую (для &-го прибора) ошибку Aft в общей совокупности данных можно считать случайной. В этом случае величины #fti, ..xhn коррелпрованы. Анализ различных реальных ситуаций приводит к выводу, что корреляции возникают, как правило, когда измерения оказываются функциями от прямых измере-
ВВЕДЕНИЕ. МАТЕМАТИЧЕСКИЕ МОДЕЛИ Ц пий и от какой-либо общей величины или группы ве- личин. Пусть Хг (j = 1, ...» п) — приближенные значения некоторого параметра а. полученные в п различных лабораториях в результате вычислений по формуле ^:=фг(у:, Z). (0.7) Измерения yi проводились независимо, а оценка z не- которого вспомогательного параметра является общей. В такой ситуации величины х{ обычно оказываются зависимыми. Равенства (0.7) являются по существу уточненной моделью измерений х^ ..., хп. Модели корреляций вида (0.7) были использованы в работах [3], [24] (см. также гл. 6). Значительное уточнение предположений о распре- делении выборки, используемой для оценки измеряе- мых параметров, можно получить на основе построе- ния математических моделей приборов или исследуе- мых процессов. Примером такой модели, описывающей работу спектрометра, является разрешающая функция (или функция отклика) АеЫ. Эта функция чаще всего ин- терпретируется как плотность распределения выход- ного сигнала х, соответствующего входной энергии Е. Нередко функция отклика АЕ(х) измеряется непосред- ственно. При таком подходе увеличение точности из- мерений либо требует значительных затрат, либо не- возможно вообще. Предпочтительнее из теоретических соображений получить вид функции АЕ(х) с точностью до небольшого числа параметров, значения которых затем определить экспериментально. Получение теоре- тического вида Ае(гг) можно рассматривать как значи- тельное уточнение модели прибора. В качестве другого примера приведем модели раз- личных процессов деления. Процессы, происходящие в ядерных реакторах, по своей природе случайны. Од- нако из-за большого количества факторов, которые нужно учесть, расчеты приходится проводить .только в среднем, уравнения составлять для средних значе- ний характеристик (например, концентраций деля- щихся ядер и т. д.). Может оказаться, что в некоторых ситуациях необходим учет случайных колебаний. Ма- тематическими моделями, ^позволяющими более полно Исследовать пропессы с делением частиц, являются
12 ВВЕДЕНИЕ. МАТЕМАТИЧЕСКИЕ МОДЕЛИ ветвящиеся процессы, теория которых достаточно хо- рошо развита (см. [34]). В работе [22] ветвящиеся процессы использовались при расчете флуктуаций в развитии каскадпых ливней, а в работе [10] —при рас- чете флуктуаций нуклидов. Математические модели случайных размещений (см. [25]) п пх обобщения могут оказаться полезными при определении положения точечных источников космического излучения, при анализе правильности определения схем * распада радиоактивных ядер и т. д. Методы построения оценок существенно зависят от математической модели. Сравнивать качество оце- нок естественно в «равных условиях», когда матема- тическая модель пли априорная информация одина- ковы. Чем больше априорная информация, тем точ- нее оценка. Таким образом, усилия, направленные па ^уточнение математических моделей исследуемых яв- лений, являются оправданными.
ГЛАВА 1 СХЕМЫ РАСПАДА РАДИОАКТИВНЫХ ЯДЕР § 1. Постановка задачи При распаде радиоактивных ядер происходит из- лучение се-, р-частиц и т. д. Образовавшиеся при этом дочерние ядра могут находиться в различных состоя- ниях, определяемых как уровни энергии ядра. При излучении у-кваптов изменяется состояние ядра. Рас- пад радиоактивных ядер происходит, как правило, по довольно сложной схеме. Знание схем распада необходимо как для установ- ления и уточнения представлений о фундаментальных свойствах материн, так и для практической деятель- ности специалистов, использующих в своей работе радиоактивные изотопы. Для определения схемы распада используются ха- рактеристики процесса распада, которые могут быть измерены. К таким характеристикам относят энергии а-, р-частиц радиоактивных ядер, энергии у-перехо- дов *). Кроме регистрации отдельных у-кваптов опре- деленных энергий, регистрируют еще совпадения у-пе- реходов (уу-совпадеппя). При переходе в коротко- живущее состояпие сразу происходит новый у-пере- ход. Соответствующие этим переходам два у-квапта регистрируются прибором как одновременные (уу-сов- иадение). Методы построения схем распада подробно рас- сматриваются в книге Б. С. Джелепова [5]. Пусть, * например, в эксперименте зафиксированы два пере- хода с энергиями Eh Е2. В этом случае (см. [5], стр. 94) возможны три схемы распада (рис. 1 и 2). При дополнительной информации из схем распада, изображенных на рис. 1, можно исключить ложные. ♦) С точностью до энергии отдачи ядра энергии у-переходов равны разностям между соответствующими энергетическими уровнями.
14 ГЛ. Г. СХЕМЫ РАСПАДА РАДИОАКТИВНЫХ ЯДЕР Если в эксперименте зафиксированы, например, ^у-сов- падения, то исключается схема в). о Рис. 1, £1 £ £1 Рис. 2. О 1 Для описания математических моделей схемы рас- пада удобно изображать в виде ориентированного гра- фа, вершинами которого являются возможные состоя- ния, а ребрами отмечаются переходы, имеющие поло- жительную вероятность (см. -рис. 2). В данной главе будут приведены математические модели процессов распада (§ 2), позволяющие вычислить теоретические значения некоторых измеряемых характеристик (§§ 3— 5). В § 6 приводятся статистические оценки, уточня- ющие значения параметров схемы распада, когда схе- ма распада уже установлена. § 2. Математические модели В качестве математических моделей радиоактивного * распада будем рассматривать цепи Маркова |(£) с не- прерывным временем t, множеством состояний кото- рых являются числа 0, 1, 2, ..., п, ...; предполага- ется, что переходы из состояния i возможны только в состояния / > i. Состояния будем интерпретировать как типы дочерних ядер пли их энергетических со- стояний. Состояние 0 соответствует исходному радио- активному ядру. Марковский процесс описывает пре-
§ 2. МАТЕМАТИЧЕСКИЕ МОДЕЛИ 15 вращения одного исходного ядра. Распады различных ядер исходного образца являются независимыми мар- ковскими процессами. Предположим, что при h -* О Р О + /0 = 7 I £(0 0 = fi; + + О (fc), (2.1) где бн=1, 6ij = 0 (/¥=/), Xy = 0 Хн=—Х{<<0, оо ^i= 2 ^ik' fe=i+l Параметры Ху можно представить в виде Ху = Х-^у, оо где Wij — вероятность перехода из i в у, a Xj = X* j=i+i Если г» — время пребывания в состоянии г, то Mtj = =• 1/Х|. Для вероятностей Pj (i) = Р {£ (0 = ]} не- трудно получить систему уравнений. По формуле пол- ной вероятности j-i Pj (* +л) = 2 wс1 ~ + ° i=0 где Xj = — Xjj. Отсюда ±1£±^>=_хЛМ + 2л(^« + »(1), i—о и при h 0 в пределе получим dP- VI = (2.2) 1=0 Полученная система уравнений является прямой систе- мой уравнений Колмогорова. Обычно мы будем пред- полагать, что Ро(О) = 1 (процесс начинается с ядра в состоянии 0). Через вероятности P^t) легко выразить математи- ческое ожидание и дисперсию числа ядер £/£), нахо- дящихся в состоянии /, если в образце было N ядер; Величину можно представить в виде суммы не- зависимых величин £/*) = 0ДО + B2(t) + ... + 0^(0, (2.3) где Qk(t) (7с = 1, 2, ..., N) равно 1, если / является состоянием Zc-го ядра образца в момент t, и 0А(£)=О
1G ГЛ, 1. СХЕМЫ РАСПАДА РАДИОАКТИВНЫХ ИДЕИ в противном случае. Отсюда M^(0 = .VP;(0. О^(0 = ^(<)(1-РД/)), (2.4) так как МО, (/) = Pk (t), DO, (£) = Ph (/) (1 - P, (/)). Если Po(O) = 1, Pj(O) = 0 (/> 0), то решение системы (2.2) находится по следующим рекуррентным форму- лам: ро(о = гЧ (2.5) pj (f) = f е^и Pi СО (/ = 1, 2, ...). О i=0 Вероятность перехода ыз состояния i в состояние / при условии, что пребывание в состоянии i закончи- лось, определяется формулой (2.6) Рассмотрим несколько примеров. Пример 2.1. Найдем P^t) для схем распадов а) и б) рис. 1 и 2. Пусть трем уровням этих схем соот- ветствуют состояния процесса 0, 1, 2; Хо > Л01 + ^02, Xi > Х12, Х2^0; формулы (2.5) дают Ро (0 = е7ко*, Р, (О = (е-М _ е-Ч), Л1 ло Л (0 = (Х02 + -^=Т" ) е"У ~ _______Z01 1— Л _ А01Х12 - 'l р-Ч' (Х1-ЛО)(Л2-Х1) с *2~vl 02 Если все X/ различны, то вероятность P^t) имеет про- стой вид (2.8) 11=о где Сы — некоторые постоянные. Формулы (2.7) можно также получить, подставляя выражения (2.8) в систе- му (2.2) и решая систему уравнений для неизвестных коэффициентов cAj.
$ 2. МАТЕМАТИЧЕСКИЕ МОДЕЛИ 17 Если состояние 2 является стабильным, то Х2 = 0. В этом случае P>(t) (?v0Ai2 — Xu2^i)при Разберем теперь случай, когда Xi существенно больше Хо и Х2. Обозначим ъ время пребывания в сос- тоянии i. Тогда Мтг-= 1/Х/. В рассматриваемом случае состояние 1 является короткоживущим, так как сред- нее время пребывания в состоянии 1 существенно меньше времен пребывания в состояниях 0 и 2. Не- трудно проверить, что lim Р2 (t) = С*-*0* — Х±->ОО л2 % если Л12/%1 -> 0. Предельное значение Р2(0 совпадает с правой частью второй формулы в (2.7), если в ней 1 заменить на 2. Пример 2.2. Рассмотрим схему распада, приве- денную на рис. 3. С третьего уровня возможен переход в состояния, отличные от 4 и 5. Для этой схемы Аго — А,о1 4* Ло2 4~ Хоз, — ^12 4" Х1з, (2.9) Х2 = Х2з, Хз Х34, А,4 — Х45, Х5 = 0. Вероятности перехода определяются формулами == Хог’/^О (i == 1} 2, 5)j U?i2 == Aj2/Aq, 7Z?j3 = 1 W[2i 1^23 = 1, Ш34 — Х34/Х3, - ш45 = 1. Система уравнений (2.2) для рассматриваемой схемы 2 В. А. Ватутин и др.
18 ГЛ. 1. СХЕМЫ РАСПАДА РАДИОАКТИВНЫХ ЯДЕР имеет следующий вид: dPo _ а р « р р а dt Лого> -jp — — + гоЛо1> dP9 dt = ^2^2 -^о\)2 "Ь ^1Л12» dP.* ' (2.Ю) ~~dT ~~ ~~~ ^3^3 + Л*13 + ^2^23» ~d^= ^4Р4 + Р3^34, "dp' ~ Pq^Q^P4^4* Вероятности Ро, Р^ Ръ совпадают с вероятностями (2.7); вероятности Р3, Р4, Р5 могут быть найдены по формулам (2.5) или подбором коэффициентов в (2.8). о Пример 2.3. Выпишем систе- МУ уравнений для схемы распа- . // Да, приведенной па рис. 4. Мы 1 / / \\ могли бы воспользоваться общими / \\ формулами (2.2). Этим общим / \ \ >4 уравнениям более соответствуют \1 \ I представления схемы распада, \1 приведенные па рис. 5. Однако Ч5 представление схемы распада па рис рис. 4 облегчает установление факта распадения общей системы (2.2) на две системы, соответствующие каскадам 0 ^-1-^3 и 0->2->4->5: "77" — ^iPi + ЛЛоп ' i ! dP ' "77" “ “ Чрз + Ро\з + ^i^i3’ dP2 (2.И) '~dt~ — ^2^2 + ^(Ло2, dP '~d^' ~ ^4^4 + ^(Ло4 + ^2^24» dP "dt' = ^5 "Ь ^(Ло5 "I" ^4^45» где Po (t) = е~ко*. Будем говорить, что из i можно попасть в j если при некотором t вероятность Р {£ (t) = J | £ (0) s
§ 2. МАТЕМАТИЧЕСКИЕ МОДЕЛИ * 19» = i} > 0. Назовем цепочкой, ведущей из i в у, цепоч^ ки вида i -* Zt -> h -> ... -> It j или i j (r = 1, 2, ...). (2.12У Для этих цепочек определим число Ajj = inf X/, где; , i нижняя грань находится по всем Ze(f, Zb Zr, у). Обозначимчисло таких параметров Xi (l^(i, ... ..., Zr, у)), которые равпы А,> Назовем порядком це- почки (2.12) функцию Пусть число А$* является наименьшим среди чисел Ац, определенных для цепочек (2.12),. Равенство Л*- = А^- может выпол- няться для нескольких разных цепочек. По каждой цепочке с А^ = A*j определим соответствующее Обозначим v*j наибольшее из чисел vfj, соответству- ющих цепочкам с минимальным А^. Тогда при t->co Putt) =P{U0=7l B(0)-0=ci3iv»H-‘Ai*(i +о(1)). (2.13) Это соотпошепие является частным случаем асимпто- тических формул, полученных в работе [42]. Формулу (2.13) нетрудно получить, если исполь- зовать систему обратных уравнений Колмогорова для вероятностей A/Z): 'dP^(t) Vi 1Л <г-!-i+1' k=l+l (ЬМ) ZVO) = 1, P^(O)=Q (Z^Z? ...?/-I). 2*
20 ГЛ. 1. СХЕМЫ РАСПАДА РАДИОАКТИВНЫХ ЯДЕР Система (2.14) решается последовательно начиная с I = /. Если определены ' P^t\ ..., Л-1(М (2.15) то общее решение линейного неоднородного уравнения, которому удовлетворяет Рц(Л\ можно представить как сумму двух решений: общего решения соответствующе- го неоднородного уравнения и частных решений, соот- ветствующих функциям (2.15). На каждом шаге можно определять только коэффициент при слагаемом, имею- щем максимальный порядок роста. Это приведет к яв- ной формуле для коэффициента Сц в (2.13). § 3. Среднее и дисперсия числа попаданий в заданное состояние Обозначим rpU) число попаданий процесса £(0 в состояние i за время t. Величина щ(£) = 1, если за вре- мя t траектория (О^и^О проходила через i, и щО) = 0 в противном случае. Эти равенства для щ(0 следуют из того, что переходы £(£) возможны только в состояния с большими номерами. Положим A (Z, t) = = Мтр (t). Тогда т. е. A(i, t) совпадает с вероятностью хотя бы одного попадания в состояние i за время t. Вероятность того, что процесс |(0 находится в состоянии I в момент I, равна P^t) (см5 (2.5)). Очевидно, Л (г, 0=/=Л(0. Выра- зим A(i, t) через вероятности Pk(t) — 1). Пусть rp(s, 0 — число попаданий процесса £(0 в состо- яние i на интервале времени (s, i). Тогда тр(£ + h) = щ(0, £ + Л) = Цг(О, t) + щ(£, t + h). (3.1) По формуле полпой вероятности PM,t + h) = i} = г-1 = S^WPbii(M + /0 = i|U0 = M = - + o(h) fe=o при h -> 0. Используя это соотношение для вычисле-
§ 3. СРЕДНЕЕ И ДИСПЕРСИЯ ЧИСЛА ПОПАДАНИЙ 21 ния математического ожидания от обеих частей равен- ства (3.1), получим г—1 A (i,t + li) = А (f, t) + h S (О + 0 W* /г=0 Отсюда А^ + »~А^ = (г) + о (1)> k—0 что при h -> 0 дает /1=0 Интегрируя это соотношение по t в пределах от 0 до t, получим п=о Функция А (Л, t) не убывает дю t и ограничена свер- ху 1. Следовательно, существует предел ИшЛ(г, t) = Ri. (3.3) /-»оо Ясно, что величина Ri — это вероятность того, что про- цесс |(О когда-либо попадет в состояние I. Вероят- ность Ri совпадает с вероятностью попадания когда- либо в состояние i вложенной цепи Маркова |п = ^(тп), где тп — момент тг-го скачка цепи Маркова %U). Пере- ходные вероятности цепи Маркова определяются формулам^ (2.6). Дисперсия величины определяется формулой Dlh (0 = М т)? (i) - (М т)< (*))2 = A (I, t) (Г- A (I, /)), так как i|{ (t) = (f). Следовательпо, lim D r|4 (<) = t~>oo Рассмотрим несколько примеров. Пример 3.1. Вычислим Л(1, Л(2, t) для схемы распада, рассмотренной в примере 2.1. По формулам
22 ГЛ. 1, СХЕМЫ РАСПАДА РАДИОАКТИВНЫХ ЯДЕР . (3.2) и (2.6) находим - л (1, О - 1Q1 f Р.ы du = JI (L- с"1-'), J 4 (3.4) f t А (2, t) = Х02 J Р% (^) du + %12 J Р\ (Ц) du = о о = -^(1 _ е-М) + 1(1 _ е-Ч‘)_ 1 (i-e-S«)\ Л0 Л1 Ло\Ло . Л1 J Отсюда lim А (1, t) = R± = %01/%0, t->oo (3.5) Hm4(2, i) = fi2 = ^+k^. t-*00 Л0 Л0 Л1 Пример 3.2. Для схемы распада, рассмотренной в примере 2.2, ограничимся вычислением R{ = Jim А (г, t) /->оо (i = 1, ..., 5). Для этого воспользуемся вложенной цепью Маркова с вероятностями переходов найден- ными в примере 2.2. Нетрудно проверить, что = W01 = т1. RZ = w02 + И’(А= т1 + ‘ ~Г> Л0 Л0 Ао Л1 7?3 = u>01u>13 + w01w12w23 = Rt ~ R3^34 ~ R3 ~V~t ~ W05 + ~ + Rl‘ Лз Ло Пример 3.3. Величины Ri для схемы распада, рас- смотренной в примере 2.3, находятся также при помо- щи вероятностей перехода вложепной цепи Маркова: Р _ Х01 О _ Х02 р _ \1 + Х03 х“ 2~Ч’ 3 V-’ Р ^02 + \)4 Р ^02 “Ь \)4 + ^«5 ло ло Эти равенства выписаны в предположении, что ника- кие переходы, кроме переходов, указанных на рис. 4 И
§ 4. v-ПЕРЕХОДЫ 23 5 стрелочками, не могут происходить с положительной вероятностью. Другими словами, предполагается, что выполнены равенства %о = ^01 “Ь ^02 “Ь ^03 “Ь ^04 “Ь ^05, М == ^13» ^2 = ^24» ^4 = ^45* § 4. у-переходы Обозначим ij0U) число 'у-переходов, которые про- изошли с уровня i на уровень /. Очевидно, что для од- ного начального ядра тщ-U) = 1 или т]уШ=0. При вы- числении значений Л (г, /, t) = М (г) = р {т]у (t) = 1} полезно ввести вспомогательные величины ip/s, £), рав- ные числу переходов из г в у на интервале времени, (s, t). Тогда т]у(£ + h) = r)y(0, t + h) = т]у(0, i) + тр/i, t + h). Отсюда получим A (i, j, t + h) = A (i, t) + M T]ij (t, t + h). При h -> 0 M Hij («, t + h) = Pt (0 Kijh + о (h) и, следовательно, Л(ц /, t + h) = A(i, j, t) + кР{{1)К1} + о1,Ь). Из этого равенства находим производную * dA (i, j, t) dt Таким образом, G, 7, 0 = J Pi (^) du. (4.1) о Так же, как в предыдущем параграфе, устанавливается существование предела lim A (f, J, t) = Rij. (4.2) Z->oo Число Rij, очевидно, является вероятностью того, что в цепи Маркова ^(0 когда-либо произошел переход из
24 ГЛ. 1. СХЕМЫ РАСПАДА РАДИОАКТИВНЫХ ЯДЕР I в у, т. е. Rij — вероятность перехода одного ядра ис- точника с уровня i на уровень /. Вероятности 7?i? тоже могут быть найдены по вероятностям перехода (2.6) вложенной цепи Маркова определенной в § 3. Дисперсия величины тщ(£) определяется формулой D (i) = A (i, j, t) (1 — А (г, у, t)) (I < у). Отсюда lim D (/) = (1 — 7?у) (г < j). i->(X> Вычпслпм Иц для схем распада, рассмотренных в двух предыдущих параграфах. Пример 4.1. Для схемы, рассмотренной в примере 2.1, по формуле (4.1) находим Л(0,/, 7) = ^(1-е"хо<) (/ = 1,2), О А (1, 2, 0 = У • - -Хт- (Г V - Г ) % \ Л1~Хо \ ' и Л • lim А (0, у, t) (/ = 1,2), t^x> Ло lim Л (1, 2, £) = -Д • тЧ t-+oo Ло Л1 ' т. е. 7?0; — Т?12 = • у?. Сравним 7?Oi и R\2- Если только переход па уровень 2 При Xi>X12 (т. е. с уровня 1 состояния, отличные от 2) пме- с уровня 1 возможен (М = ^Иг)} ТО 7?о1 == Ri2> возможны переходы в ем Т?12 <7?oi. Пример 4.2 (см. выражения величин Иц через вероятности перехода вложенной цепи Маркова: рис. 3; пример 2.2). Приведем А, 2 = (7 = 1, 2,5); = ^3=^-^, 1 Т?14 — Т?15 = о, Т?23 — R2 ^24 ~~ ^25 ~ О, Д2 А А 7? — 7? о_—л 7? — 7? — 7? П34-П3 ; » ~ U’ П4,-> П4; ’ Н4* Л3 Л4
§ 5. СОВПАДЕНИЯ у-ПЕРЕХОДОВ (vy-C О ВПАДЕНИЯ) 25 Здесь 7?г — вероятность попадания процесса £(0 в со- стояние z, вычисленная в примере 3.2. Приведем об- щую формулу для вероятностей (4.2): X • RVj=R^. (4.3) Отметим, что в. случае схемы распада с двумя пе- реходами величины 7?oi и Т?12 были связаны неравен- ством (см. пример 4.1). о—-------------в В общем случае величины Rit г+1, /?г+1,гЧ2 определяются формула- __________ ми ' р р *+1 *4, г+1 — — т) _ тэ ^г+1, г+2 *4+1, г+2 — 21 г+1 —i------ Лг+1 -j------------------ Рис. 6. и не связаны каким-либо опреде- ленным соотношением. Действительно, пример схем распада с 7?i,i+i> Я.+м+г был указан (пример 4.1). Схема распада с Rt, .+1 < <+2 приведена на рис. 6. Если %oi > 0, Хог > 0, то Е> \)1 \)1 + ^02 __ 4 _ Р 7?12=^<—V-1- 23’ так как Xi2 = Xi, ^гз = ta- § 5. Совпадения у-переходов (уу-совпадения) Если уровень / является короткоживущим, то энер- гии, выделяемые при у-переходах Z -> / -> к, фиксиру- ются прибором практически одновременно. В этом слу- чае говорят, что фиксируется совпадение ^-переходов. Появление совпадения у-переходов, соответствующего переходам Z -> j к, означает, что найдутся такие мо- менты времени < t2 < t3, что gUi) = i, gU2) = 7, |(£3) = = к. Обозначим тщДО число событий указанного вида, наступивших к моменту t. Отметим, что тщ-ДО не яв- ляется числом совпадений ^-переходов, если состояние 7 — не короткоживущее. Величину тщДО можно пред- ставить в виде T)i»e) = T]oWiuW> (5.1)
26 гл. 1. СХЕМЫ РАСПАДА РАДИОАКТИВНЫХ ЯДЕР * где T)y(i) — число переходов из I в j, введенное в § 4. Положим A(i, j, к, t) =-Mr]yh(f)- Поскольку Mr]yfe(£) = то A(i, j, A, t) — не убывающая ог- раниченная функция и lim А (г, /, к, t) = R^ki (5.2) /->оо где Rijh — вероятность того, что траектория цепи Мар- кова пройдет когда-либо через- состояния f, 7, к. Вели- чину Т?г№, аналогично тому, как это делалось при вы- числении величин Ri и R^, можно выразить через ве- роятности перехода (2.6) вложенной цени Маркова £п: (5>3) Для вычисления А(Л, A, t) при конечных значениях t нужно найти сначала вероятности = = = (5.4) По формуле полной вероятности 7-1 Pi (i, t + h) = Pj (i, t) (1 — fyh) + 2 Pi (i, 0 ^ijh + о (h). Z«=i Отсюда выводим систему дифференциальных уравне- ний для 0: dp. (i, t) vJ “V2 = 0 + 0^ (7 = г, * + 1, •••)• l=i (5.5) Представим + h) в виде + h) = + трд(£, t + h), (5.6) где 11оь(£, t + h) — число появлений состояний i, 7, к цепи Маркова £(0 на интервале времени (t,'t + h). Ис- пользуя равенство М т)ць (t, t + h) — Pj (i, t) kikh + 0 (ft), h -> 0, и равенство (5.6), получим Л(г, 7, A, t + h)=A(i, j, к, + t)kihh + о(М. Отсюда dA(i, j, к, t) ту f* -----di---= 0 Мй-
§ 5. СОВПАДЕНИЯ у-ПЕРЕХОДОВ (уу-СОВПАДЕПИЯ> 27 Таким образом, t А («. Л К 0= j pi & ы) dui (5-7) О где вероятности PjU, t) находятся из системы (5.5). Полученная формула (5.7) для конечных t достаточ- но сложна. В случае, когда состояние / является ко- роткоживущим уровнем, можно найти более простую приближенную формулу, удобную для практических вычислений. Цепь Маркова £(О с короткоживущими уровнями будем рассматривать как процесс блуждания по графу, соответствующему изучаемой схеме распада. Заменим этот процесс блуждания новым процессом следующим образом. Удалим вершины графа, соответствующие коротко- живущим уровням. В новом графе вероятности перехо- да по дугам, соединяющим долгоживущие уровни, сох- раним. В полученном графе окажутся разорванными пути, ведущие с одного уровня на другой через корот- коживущие состояния. Заменим такие пути дугами, задав вероятности перехода по ним естественным обра- зом. При изучении 7-переходов и совпадений 7-перехо- дов по новой схеме блуждания нужно считать, что пе- реходы по новым дугам приводят к совпадениям 7-пе- реходов. Для иллюстрации описанного метода рассмот- рим следующий пример. П ример 5.1. Пусть в схеме распада, изображенной па рис. 3 добавлены переходы из 0 в 3 и 4 (см. при- мер 2.2); состояние 3 является короткоживущим. При построении упрощенной схемы блуждания нужно ис- ключить уровень 3. Времена пребывания в оставших- ся состояниях 0, 1, 2, 4, 5, очевидно, не изменятся, изменятся только вероятности переходов. Для новой схемы блуждания в таблице 1 приведены возможные переходы; энергии, которые выделяются при данных переходах; вероятности переходов. Здесь Eij обозначена энергия, выделяемая при переходе с г-го уровня схемы распада на j-й уровень. Отметим, что уровни 0 и 4 соединены двумя дугами (переходами). Переход по дуге 04-1 дает 7-квант, а переход по дуге 04-2 — 77-совпадение. Кроме того, совпадения 7-кван- тов регистрируются также при переходах из 1 в 4 и
28 гл. !< СХЕМЫ ГЛСПЛДЛ РАДИОАКТИВНЫХ ЯДЕР из 2 в 4. В этой упрощенной схеме математическое ожидание числа совпадении ^-переходов определенного тина совпадает с математическим ожиданием числа переходов по соответствующей дуге. Это позволяет ис- пользовать формулы из § 4 для вычисления математи- Таблица' 1 Переходы Энергии Вероятности пере- ходов 01 ^*01 Xoi/Xo 02 Eq2 %ог/А<о 04-1 ^04 Л04А0 04-2 Еоз + Е34 ^озМо 05 А/05/Л0 12 E12 Х-12/А-] 14 ^13 + ^34 Х13/Х1 24 ^23 + ^34 1 45 E45 1 ческих ожиданий-(Л(0, 4, О, /1(1, 4, t\ А(2, 4, t)) чис- ла переходов за время t по дугам 04-2, 14, 24. Соотно- шения (4.1) и (2.7) дают A (0, 4, е = — е ло о А (1, 4, i) = %13 J (е~к°У - е-Ч«) du = о t А (2, 4, 0 = j Р2 (u) du. о Отсюда, воспользовавшись (4.2) и (4.3), находим Jim А (0, 4, t) = Х03/Х0, /-»оо lim А (1, 4, t) = t->oo Ло Л1 lim А (2, 4, I) = Х02/Л0. 1
§ 0. ОЦЯПКП ПАРАМЕТРОВ 29 При анализе схем распада иногда используется «коэффициент ослабления интенсивности совпадений у-переходов», который естественно определить следую- щей формулой: Kijhtt) = A(i, j, к, l)/Aki, j, к). (5.8) Используя формулы (5.2) и (4.2), получаем K-ijk ~ Иш Кijk (£) Rtf» Отсюда и пз формул (5.3) и (4.3) находим = (5.9) Полученное значение K*jk не зависит от /. Таким обра- зом, коэффициенты ослабления интенсивности совпаде- ний ^-переходов, заселяющих одни уровень, одинаковы. Этот факт используется для проверки правильности построения схем расиада. § 6. Оценки параметров Если схема распада уже установлена, то для оцен- ки параметров схемы можно использовать функцио- нальные связи между оцениваемыми параметрами. Так, например, в схеме, рассматриваемой в примере 2.2 (см. рис. 3), при переходах между уровнями I, 2, 3 выделяются энергии c = Ej3, a = Ei2, Ъ = Е23, В данном случае с = а + Ь. (6.1) Для величин а, Ь, с первоначально (при построении схемы распада) устанавливаются независимые оценки а, с. Будем предполагать, что М а = а, М М с = с, D а = о2, D b = о2,, D с = о2. Если воспользоваться функциональной зависимостью (6.1), то для параметров а. Ь, с по оценкам г/, Ь, с можно получить оценки с меньшей дисперсией. Най- дем значения а*, 6*, минимизирующие Ш Ь) = +л^- + -£~ . .
30 ГЛ. 1. СХЕМА РАСПАДА РАДИОАКТИВНЫХ ЯДЕР Оценки а*, Ъ* удовлетворяют системе уравнений Отсюда а* = а(1 — к%) + (с — bYkl, Ь* = Ь(Д —kf) + + (c — a)kl, с* =с(1 — Л2) + (а + b)k%, где ^ = о2/о2, ^ = о2ь/о2, *2 = о2/а2, О2 = Оа + + Ос. Нетрудно проверить, что Da*=o2(l-fc2), Db* = al(l-kl), De* = а2с(1-^). В общем случае имеется г параметров Ъ = (Ьъ 62,. • • ' ___, Ьг) и $ параметров а= (а4, а2з а3), являющихся - функциями от bu b2, ..Ьг: a^Fiibi, Ъ2, ..., br) (f=l, ...,j?). (6.2) Предположим, что имеются независимые оценки ai3 bh для которых , М bt = bh D ai = Ou/n, Dbt = ah/n. (6.3) Будем также предполагать, что эти оценки при п -> 00 асимптотически нормальны. Обозначим bt оценки, ми- нимизирующие по bi функцию Можно показать, что при достаточно общих условиях (см. [38]) оценки bt асимптотически нормальны, и для их ковариационной матрицы может быть получено яв- ное выражение. Такого типа оценки и их свойства^бо- лее подробно рассматриваются в €вязи с задачами гра- дуировки и задачами обработки результатов спектро- метрических экспериментов (см. гл. 2 и 5). Функцио- нальные связи'в работе [24] использовались при оцен- ке парав^етров схем распада.
§ 6. ОЦЕНКИ ПАРАМЕТРОВ 31 Остановимся более подробно на случае, когда функ- ции Fi в равенствах (6.2) линейны: сц = Cnbi + ci2b2 + .*..+ Cirbr 0 = 1, ..s). (6.4) Предположим также, что все дисперсии в (6.3) одина- ковы и равны о2/п. Оценки б* = (б^, b%, ..., б,), мини- мизирующие Q (Ьъ ..., &г) = 2 (л—CiA— ... — ciTbry + 5 (fa— i=l г—1 удовлетворяют системе уравнений $ $ s 2 cilcil^l + • • • +2 circil^r + bi = bi + 2 cilai (6*5) г—1 г=1 i=l (Z = l, ..., r). Запишем эту систему уравнений в матричной форме. Воспользовавшись обозначениями С = (Cij), b = (Ь^ ..., бг), а = (аъ ..ав), ' вместо (6.5) получим (C,C + Z)(6*)' = (6' + C'a'\ (6.6) где I — единичная (г X г)-матрица. Отсюда (b*Y = (Z + C'O^Cb' + C'?). (6.7) Из равенств (6.4) и (6.5) следует, что . Мб* = б, (6.8) т. е. оценка б* является несмещенной оценкой пара- метра Ь. Ковариационную матрицу D6* оценки б* можно найти по формуле (7.3) гл. 6 [431: 2 D&* = £-(1 + С'С)~\ (6.9)
ГЛАВА 2 ЗАДАЧИ ОБРАБОТКИ РЕЗУЛЬТАТОВ СПЕКТРОМЕТРИЧЕСКИХ ЭКСПЕРИМЕНТОВ § 1. Спектрометрические эксперименты Разнообразные эксперименты, используемые в ядер- ной физике, основаны на изучении реакций с учас- тием элементарных частиц или атомных ядер. На об- разец (или мишень) направляется поток частиц, обра- зуемых каким-либо источником. Результат взаимодей- ствия фиксируется прибором. Обычно в результате та- кого взаимодействия появляются частицы различных энергий. Частицы, имеющие энергию из определенного интервала, фиксируются соответствующим каналом спектрометра (см. [21]). Данные, полученные в подоб- ном эксперименте, можно представить в виде целочис- ленного вектора (A?i, к2, ..., kN), где ki— число отсче- тов (число частиц) в i-м канале спектрометра. Иногда отсчеты можно накапливать во всех каналах одновре- менно. Однако чаще приходится настраивать спектро- метр на регистрацию частиц в одном канале или в группе каналов. Прежде чем приступить к обработке полученной информации (вектора (&i, к2, ..., kN)\ целью которой является нахождение приближенных значений (оценок) измеряемых параметров, нужно выбрать подходящую математическую модель. Если модель достаточно пол- ная, то можно определить совместное распределение вероятностей заполнений каналов (/с1г..., kN). Это рас- пределение вероятностей зависит от параметров, ха- рактеризующих изучаемый процесс, а также от ряда условий, в которых проводился эксперимент: вида спектрометра, наличия фона (посторонних яастиц) и т. д. При большой 'интенсивности источника налетающих частиц необходимо учитывать тот факт, что спектро- метр допускает просчеты (частицы, попавшие в' «мерт- вое» время, не регистрируются; см. гл. 3).
§ 2. МАТЕМАТИЧЕСКИЕ МОДЕЛИ 33 Достаточно полная математическая модель, описы- вающая эксперимент с точностью до небольшого числа неизвестных параметров, содержит значительную ап- риорную информацию. Если эта модель дает хорошее описание эксперимента, то статистическими методами можно получить эффективные оценки измеряемых па- раметров. Однако отметим, что методы оценивания, основанные на знании вида совместного распределения, более чувствительны к нарушению основных предполо- жений математической модели по сравнению с метода- ми, в которых используется закон больших чисел. При достаточно полной математической модели экс- перимента возможно использование методов наиболь- шего правдоподобия пли минимума %2, дающих эффек- тивные оценки. В случае предположений типа закона больших чисел естественно обработку спектрометриче- ских экспериментов сводить к решению интегральных уравнений (см. гл. 8). § 2. Математические модели Рассмотрим несколько моделей типичных спектро- метрических экспериментов. Обычно предполагается, что используемый в эксперименте налетающий поток частиц является пуассоновским. Это предположение хорошо подтверждается практикой. Описание взаимо- действия частиц налетающего потока с мишенью су- щественно зависит от конкретного эксперимента. Результатом взаимодействия может быть частица определенной энергии. Кроме самого факта появления частицы часто требуется определить ее энергию или импульс. Если на прибор попадают частицы одной энергии (монохроматический поток), то результаты из- мерений энергии окажутся несколько «размытыми». Характер такого размытия описывается разрешающей функцией (или функцией отклика) Ль-(£"), являющей- ся плотностью распределения измерений Е' энергии монохроматического потока Е. Функция отклика часто измеряется экспериментально; иногда ее можно оце- нить методом Монте-Карло, если удается построить ма- тематическую модель процессов, происходящих в при- боре. Очень редко функцию А£СЕ") можно найти тео- ретически. 3 В. А. Ватутин И др.
34 ГЛ. 2. ЗАДАЧИ ОБРАБОТКИ Кроме потока основных частиц, используемых в эксперименте, па прибор могут попадать посторонние частицы, образующие фон. Фон может появляться из-за посторонних примесей в источнике или в мише- ни; к частицам фона можно также отнести космическое излучение. Иногда фон удается измерить в отдельном экспери- менте. Измерения фона и функции отклика будем на- зывать вспомогательными измерениями, в отличие от основных измерений, связанных с исследуемыми части- цами или дтозультатамп их взаимодействий. К вспомо- гательным измерениям можно также отнести оценку мертвого времени детектора Сем. гл. 3). Отметим, что просчеты в отсчетах частиц из-за мертвого времени приводят к тому, что выходной поток уже не является пуассоновским. Перейдем теперь к точному описанию математиче- ских моделей. Такого типа модели рассматривались в работе [31]. 2.1. Модель основных измерений с учетом фона. Пусть частицы источника образуют пуассоновский по- ток; aQh + o(h) — вероятность вылета частицы из ис- точника за время h (/г->()). Предположим, что незави- симо от источника за время h (h -> 0) может появиться частица фона с вероятностью аЛ + о(М. Поток частиц фона также предполагается пуассоновским. Любая частица источника с вероятностью soi регистрирует- ся i-м каналом спектрометра (г = 1, ..., N). Вероят- N пость 90 = X 5ог того, что частица источника будет за- г-1 регистрирована в каком-либо канале, может быть мень- ше единицы. Обозначим вероятность регистрации частицы фона f-м каналом спектрометра. Будем пред- N полагать, что 2'91г==^^ этом случае параметр at ха- г=1 рактерпзует интенсивность регпетрацпи частиц спект- рометром, а не интенсивность источника. Таким обра- зом, oci£ — математическое ожидание суммарного числа .частиц фона, зарегистрированных во всех каналах спектрометра. Обозначим rii(t) общее число частиц (источника и фона), зарегистрированных в f-м канале спектро- метра.
5 2. Математические модели 35 Найдем производящую функцию *) случайного век- тора n(t) = nN(t)): g(f,2) = Mzri(t)z2T’2(')...2^('), 2 = (Z1, ...,zN), (2.1) при условии, что g(0, z) = 1. Для этого запишем g(t + h, z) по формуле полного математического ожидания, рассмотрев все возможные изменения на интервале времени .(0, h).' Вероятность того, что на интервале (0, h) никаких изменений век- тора n(t) не произойдет, т. е. не появится никаких отсчетов, с точностью до o(h) равна (1 — a(ih + сс0М1 — $0) + о(А)) (1 — аЛ + о(Л)) = = 1 — (а0$0 + ai)^ + o(h). (2.2) Так как потоки частиц источника и фона однородны по времени, то (N - тт nk(t+h) 11 z? /1=1 M^) = 0, Л-1, ...Л Н=?(М). (2.3) Вероятность появления ровно одной частицы источника л регистрации ее в Z-м канале равна (aQhsQi + о(Л))(1 — ajt + o(h)) = aosoih + о(Л). (2.4) Используя однородность потоков частиц, находим (N П z?<!+ft) п{ (Л) = 1, пк (/г) = Oj к ф i I = Z{g (t, г). (2-5) Аналогично находятся вероятности и условные мате- матические ожидания для частиц фона. Перемножив вероятности указанных событий на соответствующие им условные математические ожидания, после сум- мирования получим tg (t + Л, z) = (1 — (aoso + «i) h) g (£, z) + N N + aoh 2 zhsohg (t, z) + 2 zkslkg G, z) + о (h). h=l *) Подробнее о производящих функциях см. гл. 4, § 1. 3*
36 ГЛ. 2. ЗАДАЧИ ОБРАБОТКИ j Отсюда ’ #(* + /*> Z) _ | h i (A \ I ад» + «1 + 2 zk (a„snh + ajSlft) g (Z, z) + о (1), ] fe~l / и при h 0 получим дифференциальное уравнение / 4 N \ - ao*o “Ь otj 4* z/t 4~ j g z), (2.6) I К ft=1 / i g (0, z) = 1. 5 NN | Используя равенства s0= 2 soi, 1=2 sii> решение (2.6) j i=l i~l j запишем в следующем виде: J = (2.7) j A=1 j где I XA = aosQk + (2.8) -j Из формулы (2.7) следует, что координаты вектора п(Л) = (щи), ..., nN(t)) независимы и распределены по закону Пуассона с параметрами М, ..., XNt соответст- венно. Таким образом, p{n/i(i)==Z) = ^e-4 (2.9) От параметров, для оценки которых ставится экспе- римент, зависят величины $Ог = $оХ0). Величины оп- ределяются фоном. Часто известен общий вид фона на исследуемом интервале энергий; например, частицы фона распределены по каналам равномерно (постоян- ный фон) или линейно (в зависимости от номера ка- нала). В этом случае величины можно выразить через небольшое число параметров, и оценки всех па- раметров находить по результатам одного эксперимен- та без дополнительных измерений фона. Если проводится N последовательных независимых экспериментов, каждый из которых соответствует одно- му каналу и продолжается время t, то совместное рас- пределение отсчетов тоже определяется производящей функцией (2.7). Если в последовательных экспериментах регистри- руются частицы в группе каналов и в группах каналов разных экспериментов допускаются перекрытия, то ре-
§ 2. МАТЕМАТИЧЕСКИЕ МОДЕЛИ 37 зультатом такой последовательности экспериментов яв- ляется вектор (тг1(^1), nN(tN)), где — чпсло от- счетов в i-м канале и h — суммарное время, в течение которого в этом канале набирались отсчеты. Производящую функцию вектора (пД^), nN(tNY), g (£ь ..., tN, z) = М П • • • • (2.10) Й=1 можно получить как произведение производящих функ- ций вида (2.7), относящихся к отдельным эксперимен- там рассматриваемой серии экспериментов. Нетрудно проверить, что лг g(ti, ...,tN,z) = I[ekk{Zh Х), (2.11) Ь=1 где определены формулой (2.8). Величины тг^), PnUn) независимы, и их одномерные распределения оп- ределяются формулой (2.9). Если абсолютные значения параметров а0, ai нас пе интересуют, то для оценки параметров 0 = (01, ... ..., 0S), от которых зависят soi, удобно воспользоваться условным совместным распределением отсчетов при ус- ловии, что задано общее число отсчетов. Используя определение условной вероятности и не- зависимость ..., nN(^), получим N 2 пг (М = & г=1 N р|ЗМ*{) = 4 р = 4 11=1 ) К 1—1 J где к — ki + ... + kN. Подставляя в это равенство вы- ражения k • Р{п^Ц) = кг}^^-е~^, г (Ml + • • . + -(Х1*1 + ...+Хдг*дг) к\ С (N ” 1 2 wi(^)=*
ГЛ, 2. ЗАДАЧИ ОБРАБОТКИ 38 найдем Р п/(^) = ki, i = 1, . ,N N 2 ni (ti) = к &! Iе) 4 O\ ~ kx\ ... kNl P1 ' "‘'Pn ’ рЛ2) где P^rr^L-T-t 0 = (2-13) i A1f1+ ... -Г Формулы (2.13) при ti = t2 —... = tN = t можно запи- - сать в следующем виде: где N POi = soi/so, PU = S1V so=Ssoi- (2-15) В формуле (2.14) коэффициенты при ра, р1{ можно за- менить на 1 — 7, 7 (0 7 1). Тогда Pi = (1 - 7)ро< + 7Ри- (2-16) Параметр 7 является долей отсчетов, соответствующих фону, в общем числе отсчетов по всем каналам. Рассмотренная модель пригодна для описания мно- гих спектрометрических экспериментов. В качестве примера отметим эксперименты по определению массы нейтрино (см. [28D. В этих экспериментах использо- вался p-распад трития в атомарном состоянии. Теоре- тические формулы для pi могут быть выражены через небольшое число параметров, одним из которых явля- ется масса нейтрино. 2.2. Модели с учетом мертвого времени. Пропуски в счете частиц входного потока, вызванные' мертвым временем, приводят к тому, что выходной поток пере- стает быть пуассоновским. В гл. 3 показано, что сред- нее число частиц, зарегистрированных счетчиками ти- па I и II, определяется формулами (4.7) и (6.11). Сле- довательно, для модели и. 2.1 математическое ожида- ние числа частиц, потерянных в i-м канале из-за мерт- вого времени, асимптотически равно сМо$оА, где Z == 1,
§ 2. МАТЕМАТИЧЕСКИЕ МОДЕЛИ 39 2, а для счетчика 1-го типа определяется формулами 61 = Хт 1 -j- XV S2 = 1 — т — математическое ожидание мертвого времени. Ана- литическую формулу для совместного распределения координат вектора n(t) с учетом потерь за счет мерт- вого времени получить не удается. Если предположить, что частица, которая должна зарегистрироваться в Z-м канале, с вероятностью 6Z по- падает в мертвое время, то совместное распределение n(t) = n2(t), ..., nN(t)) определяется формулами (2.7), (2.8), (2.11) — (2.16), в которых нужно soi и заменить на sOi= (1 — Sz)sOf, $ц=(1 —6/)$ц. В этой при- ближенной модели математическое ожидание числа ча- стиц, потерянный из-за наличия мертвого времени, совпадает с асимптотической формулой в точной мо- дели. Приближенная модель, по-видимому, дает хорошее согласие с экспериментом в случаях, когда мертвое ’время имеет показательное распределение. Пригодность приближенной модели для получения оцецок измеряемых параметров в реальных случаях требует специального исследования. 2.3. Модель эксперимента с одновременным прове- дением основных и вспомогательных измерений. Рас- смотрим эксперимент, в котором частицы, испускаемые источником, проходят последовательно через два об- разца, с которыми могут взаимодействовать. Если ча- стица не взаимодействовала с первым образцом, то она может взаимодействовать со вторым. С каждым образ- цом связан спектрометр, который регистрирует факт взаимодействия и какой-либо параметр взаимодейст- вующей частицы (например, энергию). Будем предполагать, что частицы, испускаемые ис- точником, образуют пуассоновский поток; вероятность- появления частицы в интервале времени длины h рав- на а0Л + о(А) при Л->0. Пусть частица фона на Z-й спектрометр (Z = l, 2) за время попадает с ве- роятностью aih + o(h). Обозначим 4? вероятность то- го, что частица, попавшая в Z-й образец, провзаимодей- ствует с Z-м образцом и будет зафиксирована в Z-m канале; аналогичные вероятности для частиц фона
40 ГЛ. 2. ЗАДАЧИ ОБРАБОТКИ обозначим sh. Предположим, что N N М = 4°<1, 2^ = 1 (/ = 1,2). (2.17) г—1 i=l Пусть ’naif) — число отсчетов в i-м канале 1-го образ- ца за время t. Найдем производящую функцию „ Ч _ n12<0 „п1№ n2l(t) n22(t) n2N(t) g\t,Z) —Z12 z2l Z22> *...*Z2N , z = (z(D, z<2)), Z^ = (zZ1, zl2, . . . , ZlN) (I = 1, 2). .Мертвое время может быть учтено так же, как это де- лалось в п. 2.2. Чтобы не усложнять формулы, будем предполагать, что интенсивность источника мала, и мертвым временем можно пренебречь. Так же, как в п. 2.1, для g(t + h, z) выпишем фор- мулу полного математического ожидания N / N \ + (Xjh 2 + а(Л (1 — 1 — 4?) 2 $oVz2i I "1“ i=l \ i=l / N 4“ (%2h S2^Z2^ i=l g(t,z) + o(h), из которой нетрудно получить следующее уравнение: n = — (а0 + «1 + “г) + 2 (ao4i + alSli) + i=l + «.(1-4“)(1-Л + N ) + 2 («о (1 — 4Х)) 4? + a2»2i) Z2i g (t, z). i=l J Отсюда, используя (2.17) и равенство N N - i - 2 + (i - 4°) 2 4? + (i -4») (1-4”), i=l ’ i=l
§ 2. МАТЕМАТИЧЕСКИЕ МОДЕЛИ 41 » получим N dt 2 (aoso? + »15ц) (гн — 1) + 4“) 4? + a2*2i) (z2i — 1) g. (2.18) Решение уравнения (2.18) с начальным условием g(0, z) = 1 определяется N N g (*, *) = П П (2.19) i=l i=l где = a04V + «i«n, ^2i = «0 (1 — 4x)) 4? + a2*2i- (2.20) Из соотношения (2.19) следует, что величины пц(Л) (Z = 1, 2; i = 1, ..N) независимы и P{n;i(0 = A;) = (2.21) По аналогии с п. 2.2 находим, что Р |n;i (i) = = кц, Z = l, 2; i = l,..'.,N N 2 Пн (t)=nt (t), i=l 1=1,2 - П (г-ЛоЫ0)*'1-... (2.22) 1=1 V/11 • • • KIN- • / где kt = ktl + ... + kiN, P? = (1 ~ Y;) Pot + Уi = a;/(ao40 + »o), p _S;. (z_12) (2.23) Рог — s0i/&0 1 Рц — sli \b — 4* Примером эксперимента описанного вида является эксперимент по определению сечений деления (см. Г36]). Сечения деления второго образца известны и ис- пользуются для определения распределения нейтронов налетающего потока по энергиям; сечения первого
42 ГЛ. 2. ЗАДАЧИ ОБРАБОТКИ образца измеряются. В этом эксперименте 4° = J л (Е) ct (Е) Л?> (E)dE (I = 12 2)j (2.24) ДЕ где — плотность распределения энергии нейтронов налетающего потока по интервалу AZ?, с^Е) — вероят- ность взаимодействия нейтрона энергии Е с Z-м образ- цом, AjZ) (Е) — функция отклика (вероятность того, что нейтрон энергии Е, провзаимодействовав с Z-м образ- цом, даст отсчет в Z-м канале 1-го спектрометра. Функ- ция с2{Е). известна/ а с^Е) известна с точностью до нескольких параметров (число уровней, собственные значения энергий, соответствующих уровням, ширины резонансов и т. д.), которые должны быть определены в данном эксперименте. , 2.4. Модель эксперимента с независимым измере- нием фона. Рассмотрим эксперимент, в результате ко- торого получены две независимые выборки отсчетов: noi(Z), ..., n02V(Z), 72H(Z), ..., niN(t); (2.25) noi(t) — число отсчетов в Z-м канале за время Z, образо- ванное частицами источника и фона; пц&) — число от- счетов частиц фона в Z-м канале за время t при отсут- ствии источника. Будем предполагать, что потоки ча- стиц источника и фона, а также процесс регистрации частиц такие же, как в п. 2.1. Тогда производящая функция g0 (t, = MZo!01(<) • . . , • z(0) = (z01, . . ., ZoN), определяется формулой (2.7), если в ней положить z = z(0). Производящую функцию gl (Z, z<D) = Mzh11(0. ... • z^(°, zd> = (Zh, . . ., Z1N), можно получить из (2.7), если положить z = z(1) и а0 = = 0. Приведем условные распределения для выборок ,(2.25) (см. (2.14), (2.15), (2.16)): Р nzi(Z) = 7г{, Z = 1, ....N N i=l j <2-26) ftp .. . KN] i=1
§ 3. ОЦЕНКА ПАРАМЕТРОВ 43 где Pio) = (1 - У) Ро°? + УРи, V = ®17(®0^0 4" ®-l), Poi = ^Oi^O, P1F = ^li" Отсюда, полагая а0 = 0, находим P^Sh. (2.28) § 3. Оценка параметров При оцепке параметров по спектрометрическим из- мерениям наряду с хорошо известными методами (наи- большего правдоподобия, минимума %2, наименьших квадратов) используются их различные модификации, а также многочисленные методы, основанные на ин- туиции и здравом смысле. Нередко используемый ме- тод почти не описывается, а указывается лишь, что при обработке был использован какой-либо стандарт- ный метод, хотя на самом деле была использована его. модификация (см., например, [28]). Обычно методы, основанные на здравом смысле, приводят к состоятельным оценкам. Однако дисперсии оценок, полученных с их помощью, либо не приводят- ся вообще, либо приводится их недостаточно обосно- ванный вывод. Нестандартные методы, выбираемые чаще всего йз-за простой процедуры получения оценок, заслужи- вают более детального предварительного исследования. Если оценки 0*, определяемые исследуемым методом, удовлетворяют системе функциональных уравнений, связывающих лишь определяемые оценки и известные оценки вспомогательных параметров, то для вычисле- ния ковариационной матрицы 0* можно воспользовать- ся результатами работы [38] (см. гл. 5, § 3). Рассмотрим некоторые методы оценивания по ре- зультатам экспериментов, математические модели ко- торых были описаны в § 2. 3.1. Оценка параметров при известном распределе- нии фона. Рассмотрим эксперимент, математическая модель которюго описана в п. 2.1 § 2. Будем предпо- лагать, что вероятности sQi и $1г-, а следовательно, и Ph Poh Ра являются известными функциями от неиз-
гл. 2. ЗАДАЧИ ОБРАБОТКИ вестных параметров 0 = (0it ..0в): $О< = $О1'(0), $li = S1i(0), Pi = Pi(tf), Ро£==Л)г(0), Pa = Pi№) 0 = 1, ...,Л0. (3.1) В этом случае по отсчетам в каналах n^t), ..., nN(t\ полученным в результате суммарного действия источ- ника и фона, возможно определение 0. Перечислим сначала наиболее часто используемые методы оценки©. Из формул (2.9) следует, что = = (к = 1, ..., N), (3.2) где Xft = Xft(0) определены равенствами (2.8), (3.1). Для оценки 0 иногда предлагается минимизировать вели- чину N (3.3) 1=1 I которая рассматривается как взвешенная сумма квад- ратов в регрессионной задаче (thk (к = 1, ..., N) — значения функции; nk(t) (к = 1, ..., N) — измерения этих значений в N точках). При такой интерпретации истинные значения измеряемой функции в N точках при t -> °° меняются; в обычной регрессионной задаче при увеличении числа измерений в каждой точке оцен- ки значений функции в этих точках сближаются с по- стоянными величинами (истинными значениями функ- ции). Метод, основанный на минимизации (3.3), естест- венно рассматривать как модификацию минимума %2. Попытка обосновать рассуждения регрессионного типа и пронормировать переменные значения tkk при- водит к вероятностям pk (см. (2.14)) попадания изме- рений в соответствующие интервалы. Вместо (3.3) естественно минимизировать величину N 1=1 * где к = nt + п2 + ... + nN, Пг = пМ. Очевидно, что ми- нимизация 0) является обычным методом мини- мума %2.
§ 3. ОЦЕНКА ПАРАМЕТРОВ 45 Оценки 0* параметра 0, полученные минимизацией (3.4), удовлетворяют системе уравнений V* [^-кр.(в*) (ni-kp.(Q*))2\dpi 5“ \ )”> .... (3.5) Если при дифференцировании (3.4) по 0, знаменатель считать постоянным, то вместо (3.5) получится более простая система уравнений N \ па—^Ра (9*) др. ** P^w*) = ° (/ = !> • • • >s)- (З-6) i=l * J Метод оценки, заключающейся в определении 0* из системы (3.6), называется видоизмененным методом %2 (см. [26], стр. 462). N Так как 2/^(9) = 1,т° последняя система урав- г=1 нений преобразуется к системе уравнений n VI Th VP- .2^54 = ° ('='............“)• 2=1 * J Нетрудно проверить, что система (3.7) определяет зна- чения 0, максимизирующие функцию правдоподобия ... .pZ (3.8) Таким образом, оценки, полученные видоизмененным методом %2, являются оценками максимального правдо- подобия. В прикладных работах значения 0*, минимизирую- щие (3.4), часточ определяют различными численными методами, не опираясь на систему (3.5). Чтобы упрос- тить задачу минимизации, вместо (3.4) иногда мини- мизируют величину W)-i (з.9) 1=1 * Эта величина получается из (3.4) при замене вероят^ ности рД0) р знаменателе ре оценкой
46 ГЛ. 2. ЗАДАЧИ ОБРАБОТКИ Отметим еще один широко используемый метод ин- тервального оценивания. Пусть xlv-i—случайная вели- чина, имеющая распределение %2 с N — 1 степенями свободы. Определим число ХаЛ-i равенством P{xn-i> > Xa.N-il == а* Положим Gn = {9: Qh (п, 0) < Хал-i)», п = (rai, • • •, пи)- (3.10) Область Gn выбирают в качестве доверительной обла- сти для параметра 0. Если функция Qk(n, 0) имеет распределение %2 с N — 1 степенями свободы, то P{0e Gn} = 1 — а. В действительности величина Qk(n, 0), где 0 — истинное значение параметра, рас- пределена как х2 с N — 1 степенями свободы лишь асимптотически при &->«>. Приведем теперь некоторые утверждения о точеч- ных оценках, полученных перечисленными выше ме- тодами. Будем предполагать, что функции pi = pi(Q) (Z = l, ..., N) трижды, непрерывно «дифференцируемы в окрестности истинных значений параметров (0Ь ... ..., 0S) и что обратные матрицы, используемые в при- веденных ниже утверждениях, существуют. Оценки максимального правдоподобия. Оценки мак- симального правдоподобия 0* = (0*, ..., 0«) максимизи- руют функцию правдоподобия (3.8). Вектор 0* явля- ется решением системы (3.7). При достаточно общих условиях вектор Vfc(0* — 0) при к = щ + ... + nN -> оск асимптотически нормален с нулевым математическим ожиданием и ковариационной матрицей В = (Ьо), об- ратной к матрице 5* = (Ьг*)с элементами ъ*. _у±др1дЛ ~ £ р, 50.50/ /=1 £1 t 3 Элементы матрицы В* = (&*j) определяются равенством (см. [17], стр. 321) ш 4 /д In L д In L \ ^=4M(-5orwr (3,12) N Дифференцируя соотношение In ni hi Pi но 0/, получим z=i n dln£ у ni_d.Pi & Pl
§ 3. ОЦЕНКА ПАРАМЕТРОВ Отсюда / д In L д In L м (“Ж N 1 др, др, dQi Л~ "W р р ёё? ёё" ~ \J2=1 12 1 1 V М 2 1 др1 i)pl _1_ V М 1 др,1 др,2 Zd ?2 '1 2 р,^ <*), ЙО. Для полиномиального распределения (2.12) Mnj = М (и, (iil — 1) + ~ А- (к — 1) р2 А-рр Мп,п,^ k(k-l)p, р,* де. Подставляя эти значения в (3.13), пайдем /gin Л a In ТЛ _ у, ( _Л_\ др,др, м ( де, де} j i [ ) + р,) до’.ао'. др, др, 12 де, дв} ~ '1*2 -fcV J_dJi^L s Pl d&i de^ (3.13) др, до: Отсюда следует (3.11), так как (3.14) Оценки минимума и21. Оценки 0*, полученные мето- дом минимума %2, минимизируют величину (3.4) и удов- летворяют системе уравнений (3.5). Если положить Pi = щ/к и воспользоваться равенством (3.14), то си- стему (3.5), заменив выражение в круглых скобках равным ему к виду N / *\2Л 2 1Ы"° (, = 1................s)- <зл5) /=1 \ / 3 1 / п. \ р выражением I “у можпо привести При исследовании свойств 0* (решения системы (3.15)) удобно воспользоваться общей теоремой, полученной в работе [38] (см. гл. 5, теорема 3.6). Используя эту
48 ГЛ. 2. ЗАДАЧИ ОБРАБОТКИ теорему, можно показать, что вектор УА(0* —0) при к оо асимптотически нормален с нулевым вектором математических ожиданий и ковариационной матрицей В = (Ъц), являющейся обратной к матрице с элемен- тами (3.11). Таким образом, оценки метода минимума %2 асимптотически совпадают с оценками максималь- ного правдоподобия. Вычислим ковариационную матрицу D предельного распре- деления вектора ]/7v(0*— 0). Согласно теореме 3.6 (гл. 5) (3.16) где ° = Ы’ °н = (k cov (р* ’ ₽*)); dF, dF, i I * / • A % T\ здесь производные , —* взяты в точке pj — р^ (/= 1, . .., Д'). э dPj Для полиномиального распределения (2.12) имеем MP* = Pi> Мр?р* = ^-^piPj а- Г *\2 1 2 I м(л) =—Pi + — Pi- Подставляя эти значения в формулу cov (/»*, />*) = Мр*р* — — Мр*Мр*, получим C0V(pt’P*) = -4'l’ipJ QPi^-T Pi^-Pi)- Таким образом, Otj — $ijP i PiPn (3.17) где 6г-i — 1, 6гj = 0 (г /). Заменяя в формуле = — 2 dpidpt 1 d2pt l) L р^^^гр]^ pt на pi и используя соотношение (3.11), получим dFi у Г 2 dPl dPl d2Pl j _ dQi ЙЕ j- ij’
$ 3. ОЦЕНКА ПАРАМЕТРОВ 49 поскольку j4_ = 0. dQi9Qj Следовательно, -2B* = -2(6*)t (3.18) где Ъ*- определены равенством (3.11). В формуле < Р* dPj - 9Pj = 2 Pj "1 положим p* = Pj. Тогда матрицу Fp* можно записать в виде 2 dPj FP* = (cii)' cij= Pj 59, • <3,19) Теперь вычислим матрицу D = (йц), определенную формулой (3.16). Воспользовавшись формулами (3.17), (3.18) и равенст- вом (В*)”1 = В, получим в = -г(вМ°(в₽*в') и Dij = -T 2 ^Л'2%'Л'»Ч = 21~2а’ lll2l3l4 где 2г=4_ 2 ^лл^лЧ. *1’*2,Z4 2г= "Г 2 ЧЧ'зЧ^'лЧ' *1’*2’Z3,?4 Подставляя в Si и 52 значения ci}, определенные в (3.19), найдем > 2- V I. 1 dPl2dPl2J, _ 1 Ч р, дв, 50, Ч lr/2J4 ll2 г1 li - 2 ч r-_ 2 М3 '2 '1 '< <!.'« 4 В. А, Ватутин и др, --
50 ГЛ. 2. ЗАДАЧИ ОБРАБОТКИ И Таким образом, 1Эц = bij и D = В. Оценки минимума Qk(n> 0). Система уравнений для оценок, минимизирующих 0) (см. (3.9)), имеет следующий вид: ^4(0, Р*) = 0, p* = (pt,...,p*N)t. (3.20) где р* = njk, (3.21) Z=1 Pl г При к -> °° вектор У&(0* — 0) асимптотически .нор- мален с нулевым математическим ожиданием и кова- риационной матрицей В = (bi;), обратной к матрице В* с элементами (3.11). Действительно, так же, как в случае для оценок ми- нимума х2, убеждаемся, что в точке р* = р dJ\h* _ 1 д21 Op*' Pi Эти производные отличаются от соответствующих про- изводных, вычисленных при исследовании оценок ми- нимума х\ лишь множителями, которые сократятся при перемножении матриц в формуле (3.16). Оценки, основанные на безусловных распределени- ях отсчетов. Рассмотрим сначала оценки 0*, миними- зирующие (3.3). Дифференцируя (3.3) по 0, получим систему уравнений (0 h[t (ftj (0 ^7^) q (j = 1, . . ., 5), (3.22)
§ 3, ОЦЕНКА ПАРАМЕТРОВ 51 аналогичную системе (3.5). Систему (3.22) нетрудно преобразовать к следующему виду: 2 ((Я- =0 (,'“1................“> <3-23> i=l \ \ где X* = щ _ При t °° вектор УД0* — 0) асимптотически нор- мален с нулевым вектором математических ожиданий и ковариационной матрицей D == (/),>), обратной к мат- рице с элементами — (3 24) (О)ае. ее/ Асимптотические распределения оценок, минимизи- рующих (3.3), и оценок максимального правдоподобия совпадают. Оценки максимального правдоподобия мак- симизируют функцию правдоподобия ЛГ ,л ЧМНПМ)Г'‘‘‘' <3-25) Система уравнений для оценок максимального правдо- подобия имеет следующий вид: 2 55; = ° = <3-26) Схема вычисления ковариационных матриц оценок, определяемых (3.23), (3.26), аналогична вычислению ковариационных матриц оценок, определяемых уравне- ниями (3.15) и (3.7). Проведем сравнение ковариационных матриц оце- нок, полученных на основании условных и безусловных распределений. Для условных распределений ковариа- ционная матрица вектора 0* — 0 является обратной к матрице С(&) = (coW): <3-27) 1=1 П » 3 для безусловных распределений ковариационная матрп- 4*
52 ГЛ. 2. ЗАДАЧИ ОБРАБОТКИ ца является обратной к матрице C(t) = (ctjU)): жгч 4 дХ} дХ} са(0 = 1217 аё"[АО? (3.28) Параметр к в (3.27) является случайным. Поэтому срав- нение оценки (3.27) с оценкой (3.28) естественно прово- дить при помощи Мс^к), Так как МЛ=£Л,гдеА = Х1 + + Х2 + ... + Хх, то, заменяя в (3.27) pi на МЛ, получим м~. ^0. л л2 д д2 dQj, или - I А К I а0 д dQ I 50 Д JQ I- 4=51 *'\* • 9 \ J J ' Отсюда - t(y — сз 29> MCW w - П 1 5е а9 л dQ а9 • Р-^у) М==1 I I 3 г 1 j При одном неизвестном параметре (s = 1) величины, обратные к (3.28) и (3.29), равны соответственно Таким образом, использование условных распределений приводит к некоторому увеличению дисперсий оценок. 3.2. Оценки параметров при неизвестном распреде- лении фона. Если распределение фона неизвестно, то измерения для оценки его влияния проводят отдельно. Пусть получены выборки (2.25). Воспользуемся услов- ными распределениями (2.26) —(2.28). Будем считать, что вероятности р^ зависят от неизвестных парамет- ров 0 = (01? ..., 0S): p(Qi = Po°i (0). Кроме того, будем считать, что параметр у и вероятности = р({т) = i — 1, . .., N — 1) регистрации частицы фона в г-м канале также неизвестны. Оценки максимального правдоподобия. Функция правдоподобия имеет следующий вид: N N L = L (0, V1 blt .,., ^_х)= П (Ри)П°и П b»lv, (3.30) V—1
§ 3. ОЦЕНКА ПАРАМЕТРОВ 53 где Ь/У =1 ... 1? ^ои — ^lv = (£), noi + ^02 + • • • + noN, ki = nii + ».. + Win, Pu = CLU (1 — T) + Y&u, au = t^ou = Squ/sq, bu = slu. Для вычисления ковариационной матрицы вектора оценок нам потребуются частные производные от In L. Непосредственно проверяется, что TV _ N ^=УП-^(Ь _а\ дв, р,, "эе/ df Ар'0» Uup * и=1 и г и—1 и (3.31) 31п£ п0. t п1} noN n1N dh Р ' ' h Р • * O0j *N °N Отсюда и из формул N да M/Zqu ~ ^qPui = kybj, ^g“ = 0, u=il i Mftflu == k$Pu 4" (*0 1) Pu^i MWqu^ov “ *0 (^0 1) PuPv (Ц 0» M«ij = krbj + kv (kt — 1) b2j, Mnu^ij = (ki — 1) bibj (i j) получаем n?.-±M^^ = /i_v\2Vfty JL^^i Ul} к M dQ. dQ. ” V) Vo 2л p ae. ae{ (i, j = 1, ..., s), n* _ n* __________ 1 m P In L d In M 27s+1,i - DitS+1 - -у M — J = N . 2bj — a, da, (^ = 1, ...Л), 1=1 1 г n* ______ n* ______ 1 M/d In Z/d In ZA ZA.s-H+j - P>s+i+j,i - — M j = (4 da- 4 ^7^i~^iv ^Г/ 0 = 1,.,.^; / = (3.32)
54 ГЛ. 2. ЗАДАЧИ ОБРАБОТКИ N -4 м (Чг = т. 2 4 - »о*. \ Г 1--1 I Ds+l.s+1+j = -Ds+l+j.s+l = (7 = 1, ...,2V- 1), n* _ 1 м rdinbdlnbX _ о Ло?2 Yi fA+i+M+i+j - — м -oi^-J - °и \ р. + Ь. (г, / = 1, ...,2V). Обозначим (б*, ..., 0J, у*, bi, b*N_^ оценки мак- сималыюго правдоподобия соответствующих парамет- ров. Матрица D = СОД обратная к матрице О* =(/)*Д где Ь*ц 0,7 = 1, + TV) определены формулами (3.32), является ковариационной матрицей предельного при к -> оо распределения вектора Vk (01 — 0i, ..., в* — 0S, у*—у, bi—bi, ..., b*N^i—2>jv-i). Систему уравнений для оценок максимального прав- доподобия, используя (3.31), можпо записать в следую- щем виде: N D* л /V * 2^ = о. 2£(».--<)= о, 1=1 1=1 (3.33) = о, р; р„\ ь] b'N VVo(/_p" +М‘г:_~ Vj Глг/ \°j °N где Pi = n^lk^ bj = n^lk^ Рассмотрим теперь оценки максимального правдопо- добия для безусловных распределений. Совместное рас- пределение двух выборок (2.25) в случае, когда основ- ной эксперимент проводится в течение промежутка вре- мени ^о, а эксперимент по измерению фона — в тече- ние времени ti, определяется формулой 'Р {fyH (^о) = ^Qh ^11 (^1) = ^111 = 1, • • •, TV} = =д . (W2! (3.з4) Z=1 /for к1Г где Xoz = aasoz + Хп (Z = 1, ..., TV). Величины % явля- ются функциями soi == $(н(9) от неизвестных параметров .
§ 3, ОЦЕНКА ПАРАМЕТРОВ 55 0 = (01, ..0в); величины (Z = 1, ..N) рассмат- риваются как неизвестные параметры интенсивностей фона. Используя (3.34), получаем логарифм функции правдоподобия L: N In L = 2 (»oi (4)ln h'.to — hito + Пц (Zi) In — Kutj). (335) 41 Дифференцируя (3.35) по 0, и Xi/, находим ain£_y . ^ог Л’о/(zo)/?o да{ Ч/ 1J, ain£ . f «о<7«о Л..(пи/Ч Л (3.36) Приравнивая к 0 правые части этих равенств, получим систему уравнений для оценок максимального правдо- подобия 0* = (0*, .. •, 6s*),. = (^п, • • •, ^in)« Матрица В*, обратная к ковариационной матрице предельного распределения вектора 1Лк (0Х — 0ъ ,. ,2 03 — 061 Хи — %п, .. имеет вид (П* D* 09 Bie (3.37) где 0 In L 0 In L\ и*' I, ^ОХ=^лО a in £ a in L ае. ao. ац. d* f кл d In L d In L\ = aiu a^J- Непосредственно проверяется, что .. a In L d In L _ . 2 у dsnl ds0, •VI on м — roao да . да. t = 1 J i ае. ае. М a In L д In L aei dklj М <5 In L д In L _ - I м дКГ " Hoi — °u I a + i /• Л1г / (3.38)
56 гл. 2. ЗАДАЧИ ОБРАБОТКИ «Вычитание» фона. Рассмотрим для простоты слу- чай, когда оба эксперимента (основной и по измерению фона) продолжались в течение одинакового времени t. Часто используемый в приложениях метод «вычита- ния» фона основан на следующем соображении. Если отсчеты nQi(t) основного эксперимента включают отсче- ты фона, то разности nQi(t) — Пц(Л) можно рассматри- вать как отсчеты основного эксперимента в отсутствие фона. Это соображение верно, если перейти к матема- тическим ожиданиям разностей по безусловным рас- пределениям. Действительно, Мпог (0 = loit, Mnu (i) = и, следовательно, М (noi (£) Пц (£)) = (3.39) Необходимо, однако, учитывать, что отсчеты фона, во- шедшего в пМ, и отсчеты фона nu(t) измерены в не- зависимых экспериментах. Это может привести к тому, что некоторые разпости noi(t) — nu(t) будут отрица- тельными. Если рассматривать математические ожидания раз- ностей по условным распределениям (при условии, что и01 + • •. + ^о№ &о, Пц + ... + niN = то равенст- ва, аналогичного (3.39), получить не удается, так как (см. (3.30)) Mwoz = (1 — +ybi), М (tool rill) =7^ М/- Ограничимся рассмотрением метода оценки, осно- ванного на безусловных распределениях. Логарифм «функции правдоподобия» для разностей nQi(t) — — nu(t) (в предположении, что разности являются от- счетами в основном эксперименте без фона) имеет вид N In Lj = 2 ((«ог (0 — пи (0) In (аоМ) — *«<»%)• Z—1 - Приравнивая к 0 производные In по 0г-, после не- сложных преобразований получим следующую систему уравнений для оценок 0* = (0^, ..., 0s) параметров 0 = (01э ..., 0в): лг (г = 1,. S k Vo/ J (3.40) где K*oi = по1 (£)/£, = пи
§ 3. ОЦЕНКА ПАРАМЕТРОВ 57 (3-41) ds03 (3.42) щмулы ^•) = 0, (3.43) Обозначим Fi левые части системы (3.40). Так же, как и для оценок, полученных на основе условных рас- пределений, проверяется, что оценки 0*, удовлетворяю- щие системе (3.40), асимптотически нормальны при t оо. Ковариационная матрица предельного распреде- ления выражается через производные от функций Fi и ковариационную матрицу Xoi, Хц. Непосредственно проверяется, что В точке Xqi = %oi, X*; = эта производная опреде- ляется равенством N > = у J_ Ч/ Ч г Аналогично вычисляются производные Используя формулы (3.41), (3.42) и ф( lim t cov (X*b X*j) = б^-Хн, lim t cov t-»oo t-+oo lim t cov (%*i, = A-oiSij Z->oo можно при помощи теоремы об оценках, заданных не- явно (см. гл. 5, теорема 3.6), установить асимптотиче- скую нормальность вектора lit (0* — 0) при t -+ °° и найти ковариационную матрицу предельного распре- деления.
ГЛАВА 3 СЧЕТЧИКИ § 1. Общая модель счетчика Во многих физических экспериментах, связанных с радиоактивным излучением, используются счетчики частиц. Так, например, для измерения ^-активности радиоактивных ' ядер применяются счетчики Гейге- ра — Мюллера, а спектрометрия нейтронов по методу ядер отдачи осуществляется при помощи сцинтилляци- онных детекторов и пропорциональных счетчиков (бор- пых, водородных и т. д.). Процесс регистрации импуль- сов, вызванных радиоактивным излучением, может быть описан следующим образом. На вход счетчика в случайные моменты времени поступают частицы, вы- зывающие импульсы. Ввиду того, что счетчик импуль- сов обладает определенной инерционностью, не все эти импульсы зарегистрируются: чем большую инерцион- ность будет иметь счетчик, тем больше импульсов не будет зарегистрировано. Минимальный промежуток времени между попаданиями на вход счетчика, двух последовательных частиц, при котором будут зареги- стрированы два импульса, называется разрешающим временем или мертвым временем. Поскольку «поте- ря» импульсов может существенно исказить суть про- исходящего явления, при обработке результатов экспе- риментов это явление нужно учитывать. Работ, посвященных изучению счетчиков, довольно много (см., например, [21], [23], [55], [56] и библио- графию в них). Все эти работы можно условно разде- лить на две группы: «физические» работы и «матема- тические» работы. К первой группе относятся статьи, в которых описывается принцип действия некоторых приборов (или класса приборов) и без особой матема- тической строгости выводится ряд формул, Тс(ких как оценка интенсивности поступления частиц на счетчик, оценка числа потерянных импульсов и т. д. В «мате- матических» работах приводятся математические мо- дели счетчиков, а затем доказываются теоремы, иногда
§ 2. СЧЕТЧИК ТИПА I. ОБЩЕЕ ОПРЕДЕЛЕНИЕ 5g весьма глубокие, описывающие свойства таких моделей. Получающиеся при этом формулы бывают громоздкими и не всегда имеют практическое применение. В настоя- щей главе предпринята попытка соединить описанные ' выше подходы. Наряду с достаточной математической строгостью при построении и изучении моделей счетчи- ков (или, если это необходимо, ссылками на точные ут- верждения) проводится подробный анализ примеров, имеющих важное' прикладное значение. Опишем модель счетчика, регистрирующего импуль- сы. Пусть = 0 — момент включения счетчика, а 0 Si S2 . — моменты поступления частиц на счетчик. Обозначим fa (f = 1, 2, ...) длительность им- пульса (мертвого времени), вызванного частицей, по- ступившей на счетчик в момент St. По последователь- ностям {Si}iL0 и {Xi}w построим последовательность моментов регистрации импульсов. Последова- тельность {/?!}£=! будет некоторой подпоследователь- ностью последовательности {5г}£=0, т. е. — Sni (&= = 1,2, ...). Будем предполагать, что первая частица, пришедшая на счетчик, обязательно регистрируется (7?i = 51), а номера п\ остальных зарегистрированных частиц будут зависеть от того, какие правила отбора осуществляются счетчиком. Обычно рассматриваются два типа счетчиков с непродлевающимся и продлеваю- щимся мертвым временем, называемых соответственно счетчиками типа I и типа II. Более детальное описа- ние моделей этих счетчиков будет приведено в следую- щих параграфах. § 2. Счетчик типа I. Общее определение 2.1. Регистрация импульсов счетчиками типа I. В счетчиках типа I мертвое время т не продлевает- ся, т. е. импульсы частиц, попавших на счетчик после регистрации импульса через время, меньшее чем т, не удлиняют мертвое время и не регистрируются. В рамках описанной выше модели это выглядит так. (Напомним, что %г — длительность мертвого времени i-й частицы, поступившей на счетчик.) Пусть nt = 1, а nj+1 = min [пл Sn > Sni + XnJ (г = 1г 21...).
60 fti. 3. СЧЕТЧИКЙ Тогда последовательность где Ri = Sn.^ являет- ся последовательностью моментов регистрации импуль- сов. Схема такого отбора показана на рис. 7. Для еди- нообразия введем обозначение 7?0 = 0. 2.2. Вероятностная модель. Обозначим 7\ = £i+1 —5г, Ц = 7?г+1 — Ri (i = 0, 1, 2, ...) и будем предполагать, что величины То и Т{ (Л > 1) — промежутки времени между поступлениями на счетчик последовательных частиц — случайны, независимы и одинаково распреде- лены. Предположим также, что и величины (f = 1, 2, ...) случайны, независимы и одинаково распределе- ны. Из этих предположений, очевидно, вытекает, что случайные величины Li (i = 0, 1, ...) независимы и для i > 1 одинаково распределены. Обозначим р (t) = Р {То < 0 = Р {А, < t}, в (о = р {Xi < t}. tf(0 = P{£i<0,, Hn = MTon, p = pi, Tn = MXi, T = Ti, o2 = Dxi, Pn = ML?, p = px, O1 =DLr В дальнейшем будем предполагать, что величины ц, т и о2 конечны и ц > 0, т > 0. Из сделанных выше допу- щений следует, что как моменты поступлений частиц Si (i = 1, 2, ...), так и моменты регистраций импульсов Ri являются суммами независимых неотрицательных случайных величин. Этот факт дает возможность при изучении различных характеристик последовательно- стей {5i}^0 и {^г}Г-о применять хорошо развитую тео-
§ 3. ПУАССОНОВСКАЯ МОДЕЛЬ СЧЕТЧИКА ТИПА I 61 £ию восстановления. Однако, прежде чем это делать, разберем самую простую и широко используемую мо- дель счетчика типа I — пуассоновскую. § 3. Пуассоновская модель счетчика типа I 3.1. Функция распределения времени между регист- рациями. В этой модели счетчика типа I предполага- ется, что ( 1 - = ( О, t>0; t<0, (3.1) а функция распределения длительности мертвого вре- мени B(t) абсолютно непрерывна, причем &(0=В'(0. Если равенство (3.1) выполнено, то для любого Р{Т^х + 0 Тг > х} = *}+0 = 1 - (3-2) Это соотношение показывает, что случайная величина, имеющая показательное распределение, «забывает» прошлое. Пусть Ц = + £(Т0, Xi), где £(?0, Xi) — время, про- шедшее с момента T0 + Xi Д° следующего момента ре- гистрации импульса счетчиком. Используя свойства ус- ловного математического ожидания, можно показать, что К (t) = Р {£х < 0 = Р {Xi + ЦТ», xi) = t t = J (1 — е^Ш-и)) Ъ (и) du = X J В (и) du. (3.3) о о Соотношение (3.3) означает, что распределение слу- чайной величины Li совпадает с распределением суммы двух независимых случайных величин, одна из которых имеет распределение 5(0, а вторая распределена по по- казательному закону с параметром X. Поскольку МГ0 = X”1, DT0 = X-2, то из (3.3) получаем р = MLi = т + X"1, (3.4) а2 = DLx - о2 + Х“2. (3.5)
62 ГЛ. 3. СЧЕТЧИКЙ 3.2. Число поступивших и зарегистрированных им- пульсов на промежутке (О, I]. Точные формулы. В этом разделе изучаются свойства двух случайных величин: Nt — число частиц, поступивших на счетчик за вре- мя (0, d; Yt — число зарегистрированных импульсов за время (О, t]. Обозначим КА) индикатор события А: {1, если событие А произошло: А < Л О,. если событие А не произошло. М7{5{<0= P Нетрудно проверить равенства ^ = 2(з.б) г=1 (3.7) Заметим теперь, что (3-8) а при I > 2 3 7\<4 = Л(0. (3-9) j=0 ) где Fi(t) — i-я. свертка функции F(t) с собой: ' ' t F^-Ftf), Fi+l(t) = §Fi(t— u)dF (и). (3.10) о И, наконец, при i > 2 , i-i 1 1 Д)+ \ = }К^-и^Р(и)= j 0 = Ki^F (f). (3.11) MZ{7?i<i)= P Вычисляя математические ожидания от левых и правых частей равенств (3.6) и (3.7) и используя
§ 3. ПУАССОНОВСКАЯ МОДЕЛЬ СЧЕТЧИКА ТИПА I 63 соотношения (3.8)—(3.10), находим II (t) = Ml {5i < t} = 2 Fi (f), i=l i=l (3.12) G (i) = МУ( = J MZ {R, < t} = F (0 + 2 K^F («). i=l i=2 (3.13) Перестановка знаков суммирования и математиче- ского ожидания законна, ибо ввиду (3.1), (3.4) и уси- ленного знака больших чисел в правой части равенств (3.6) и (3.7) с вероятностью 1 имеется лишь конечное число слагаемых. Из (3.12), (3.13) на основе соотношения (3.10) и аналогичного представления для функций KiU) полу- чаем, что функции H(t) и GU) удовлетворяют следую- щим 1штегральным уравнениям, называемым обычно уравнениями восстановления: t H(t) = F (t) + j Н (t - и) dF {и), (3.14) О t G(i) = F(i) + $G(t-u)dK{u). О (3.15) . До сих пор мы нигде не пользовались явным видом функций FU) и KU) и опирались лишь на тот факт, что величины ц и т конечны и положительны. Этих знаний и соотношений. (3.14) и (3.15) достаточно, как мы уви- дим ниже, для изучения асимптотического поведения функций HU) и GU) при t -* оо в общей ситуации. По- лучить точные формулы в общем случае нельзя. Понес- ли FU) имеет вид (3.1), то математическое ожидание величины а также моменты любого целого порядка можно вычислить точно. Действительно, нетрудно убедиться, используя, на- пример, метод математической индукции, что t О (г = 1,2,...). (3.16)
ГЛ. 3. СЧЕТЧИКИ Далее, для i > 1 имеем Р {Nt = 1} = Р {Nt 1} - Р {Nt > i + 1} = = Р < t} - Р {Si+1 = (t) - Fi+1 (0 = — J (1 — F (t — u\) dF (u) = J е-^~и^ ui-'e-^du^ 0 O' (3.17) Таким образом, случайная величина Nt имеет распре- деление Пуассона с параметром Xt. Именно поэтому счетчик типа I с входным потоком, удовлетворяющим (3.1), называется пуассоновским. Из (3.17) вытекает H(t) = MNt = M, (3.18) DNt = U. (3.19) Соотношение (3.18) легко получить и непосредственно из представления (3.12) и равенства (3.16). Поскольку Л = гт™- = — равенство (3.18) можно записать в виде IYI2 0 р ’ Hit) = £/ц. (3.20) Таким образом, нам удалось решить уравнение (3.14) в частном случае показательного распределения. Для того чтобы получить явное выражение для функции Git), сделаем дополнительные упрощения, а именно предположим, что мертвое время постоянно, т. е. Р [%. = т) = 1 для любого i при некотором т > 0. При этом предположении из (3.3) следует е-т-т) т; 0, t < т. (3.21) Отсюда по индукции нетрудно получить, что Kdf)- t—ix р С -—т-7 | t^ix; (i — 1)! J > о л (3.22) 0, t < tx. f 1
§ 4. ОБЩАЯ МОДЕЛЬ СЧЕТЧИКА ТИПА I 65 Подставляя (3.22) в (3.13), находим G (0 = 1 - е~и + 2 f (1 - X i=10 ’ It} du = 1 — e~u 4- 2 — i)I X t X f (1 — (и — ir)1-1 e~^u~ix>fdu = 1 — e~~u + ir u %iT + (T=4)T J (! “ v^e-^dv - 1 - e~u + i=i ’ 0 [i/т] . p~iT *yjT + 2 г~7н j vi~1e~’kvdv— I rK(HTM"Mp = 1=1 l 0 0 > [i/т] / ’ J ,• \ = 1 - e-^ + 2 I 1 - 2 X 'T"" e-^-^ I = i=l \ j==0 7 ’ / [t/т] oo = 2 e^,-m 2 k=0 j=i+l Уже в этой простой ситуации точная формула для МУ* выглядит громоздко. Поэтому в дальнейшем мы огра- ничимся лишь асимптотикой функции G{t) при t -+ § 4. Общая модель счетчика типа I Вернемся теперь к счетчикам типа I с произволь- ными функциями F(t) и B(t) и проанализируем урав- нения (3.14) и (3.15), которые были выведены без ис- пользования явного вида этих функций. Для этого нам понадобится несколько фактов из теории восстанов- ления. Элементарная теорема восстановле- ния ([40], стр. 427). Пусть H(t) и GW — решения 5 В. А. Ватутин и др.
66 ГЛ. 3. СЧЕТЧИКИ уравнений (3.14) и (3.15) соответственно. Тогда оо lim£g} = ц = f udF(u) = МГо, (4.1) Moo Г Ц Л О -_оо lim£^.=_Li р= ^udK(u) = ML1. (4.2) Moo f Р J О Поскольку функция F(t), а следовательно, и вели- чина ц известны, из (4.1) сразу получаем асимптотику для математического ожидания числа частиц, посту- пивших на счетчик за время (0, fl: t/^, что согласуется с (3.20). Асимптотику величины непосредственно из (4.2) получить нельзя, поскольку величина р — математическое ожидание 4 промежутка между последовательными регистрациями — неизвест- на. Для ее нахождения привлечем следующее вероят- ностное утверждение. Тождество Вальда. Если |2, ..., |п, • •. последовательность независимых одинаково распреде- ленных случайных величин, М | | < оо, a v — такая целочисленная случайная величина, что событие {v = п} не зависит от случайных величин |п+1, |п+2, ... и М v < оо, то М & + g2.+ ... + £v) = М Ъ М V. (4.3) Другими словами, если случайная величина не зави- сит от будущего, то справедливо равенство (4.3). Рис. 8. Из определения случайной величины вытекает (рис. 8), что Е1 = Т1 + Т2 + ... + Туо(Хр+1, (4.4) где Уо(^) = max {п: Т, + Тг + ... + Тп < х}. (4.5)
§ 4, ОБЩАЯ МОДЕЛЬ СЧЕТЧИЦА ТИПА I 67 Нетрудно понять, что при фиксированной величине %! случайная величина У(Х1) + 1 не зависит от будуще- го. Это позволяет, используя свойства условного мате- матического ожидания, получить такую цепочку ра- венств: = М[М(Г1 + Т2+... + 7’ y^xp+i) | Xi! = М [М Т. М (Уо (Х1) +11 Х1)1 = М (М Н (Х1) + 1) = = р I J Н (u)dB (и) + 11. (4.6) \о / Лишь предпоследнее равенство в этой цепочке нуждается в пояснении. Его справедливость вытекает из определения величины У0(Х1) как числа регистра- ций частиц на промежутке (О, XJ. Это в принципе ре- шает задачу нахождения асимптотики G(£) при Если р(х) имеет вид (3.1), то ввиду (3.20) равенство (4.6) выглядит так: р = = т + V1, что согласуется с (3.4). В этом случае соотношение G(f)------L—= (4.7) 7 т + Г1 , допускает наглядную интерпретацию. Действительно, после регистрации частицы счетчик запирается в сред- нем на время т. Поскольку экспоненциально распреде- ленные случайные величины обладают свойством «за- бывать» прошлое, то следующая частица придет на счетчик в среднем через йремя Аг1 = р. Следовательно, частицы будут регистрироваться в среднем через вре- мя т + Ал1, и за время t будет зарегистрировано при- мерно t/(x + V1) частиц. В приложениях важно знать не только МУ$, но и степень отклонения Yt от МУЬ т. е. дисперсию У<. Схема вычисления асимптотики DYt с применением преобразования Лапласа имеется в [55]. Мы же приве- дем лишь окончательный результат. Теорема ([55], стр. 101). Пусть < оо. Тогда о? t->oo, (4.8) где величина aj = М — (М вычисляется по 5*
гл. з. СЧЕТЧИКИ 68 формуле оо 01 = м Х1 + 2 J tdB(t) °. 1 — (t + Z/) + t + j (1— F(t + у — и)) dH (и) О dy + оо оо J dB(t) $у О о 1 - F (t + у) + i + J (1 — F (t + у — u))dH(u) О dy — р2. В случае, когда Fit) удовлетворяет (3.1), соотноше- ние (4.8) вместе с (3.4) и (3.5) дает 1 + А2о2 t (1 + Ат)3 t —> оо. Этой формулой заканчивается предварительное изуче- ние счетчиков типа I с «вероятностной» точки зрения. Статистические задачи, возникающие при исследовании характеристик, счетчиков типа I, будут рассматриваться в § 10. § 5. Счетчик типа II. Общее определение 5.1. Регистрация импульсов счетчиками тппа~ II. Счетчики типа II — это счетчики с продлевающимся мертвым временем. Используя обозначения § 1, мо- дель счетчика типа II можно описать так. Пусть Рис. 9.
§ 6. СЧЕТЧИКИ С ПОСТОЯННЫМ МЕРТВЫМ ВРЕМЕНЕМ 69 лг± = 1, а ni+l = min {п: Sn > Sm + /т, п^т< п} (j = l, 2, ...). Последовательность где == 0> а ^г==5,пр яв- ляется последовательностью моментов регистрации им- пульсов счётчиков типа II. Пример построения такого процесса регистрации приведен на рис. 9. 5.2. Вероятностная модель. Будем предполагать, что случайные величины Ti (i = 0, 1, 2, ...’) и (Z = 1, 2, .. .) удовлетворяют условиям п. 2.2. Из этих условий вытекает, что величины Ц = /?+1 — (I = 0, 1, ...) — промежутки времени между последова- тельными регистрациями — независимы и при i > 1 одинаково распределены. § 6. Счетчики с постоянным продлевающимся мертвым временем Для счетчиков типа II не удается провести полный анализ в общей ситуации. Поэтому мы разберем под- робно лишь случай, когда для некоторого т > О Р{/г—т} —1 (^ = 1, 2, ...), т. е. следующий импульс мо- жет быть зарегистрирован не раньше, чем через вре- мя т после попадания последней (быть может, незаре- гистрированной) частицы па счетчик. 6.1. Функция распределения Li Первая за- дача, которая стоит перед нами,— нахождение функции распределения случайной величины Li (i>l), равной промежутку времени между соседними регистрациями импульсов. Поскольку величины Li при разных I име- ют одно и то же распределение, мы будем опускать индекс i. Итак, пусть L — промежуток времени между двумя соседними регистрациями, a v — число частиц, пришедших па счетчик в промежуток времени между соседними регистрациями. Тогда (рис. 10) отрезок L можно представлять себе как множество, полученное объединением v перекрывающихся интервалов длины т, начала которых совпадают с моментами поступлений незарегистрированных частиц на счетчик, и последнего (v+D-го интервала, имеющего длину больше т, пра- вый конец которого совпадает с моментом регистрации
ГЛ. 3. СЧЕТЧИКИ счетчиком нового импульса. Нетрудно понять, что P{V = /C} = ^(T)^_F^))) (6.1) где F (t) = Р {Т\ t} — функция распределения про- межутков между поступлениями частиц на счетчик. Рис. 10. Действительно, для того чтобы получить «перекрываю- щуюся» последовательность из к + 1 интервалов мерт- вого времени, нужно, чтобы промежутки времени меж- ду поступлениями к + 1 частиц на счетчик (включая частицу, импульс от которой дал начало мертвому времени) не превышали т, а после поступления (Л + 1)-й частицы в течение времени т поступлений не было. Вероятность первого события равна Fa(t), а вто- рого 1 — F(t), что и дает равенство (6.1). Теперь, ис- пользуя формулу полной вероятности и тот факт, что Р {L t} == 0 (Л < т), находим p{L<«}= 2 p{L<qv = fc}P{v = fc} = = P{7’0<f|7’0>T}.(l-F(r)) + + Цо + Л + ..•+ ... .... Tft_x<T, n> r}Fk (т) (1 - F (?)). (6.2) Пусть для каждого к = 0, 1, 2, ... случайные величины |0, gi, ..., Ife-i и независимы, причем = = i = l, 2, ..., Л-1), (6.3) ^(o-poi^o^-FL^ (*>т)- (6-4)
§ 6. СЧЕТЧИКИ, С ПОСТОЯННЫМ МЕРТВЫМ ВРЕМЕНЕМ 71 Тогда, очевидно, Р{7’о+Л+...+ | Т0^г, Т^т, п>т} = = Р{&о + 51+ ••• +U-i + ^<t} = $N(t-u)dQk(u)- О Эти соотношения' позволяют преобразовать (6.2) к виду P{L<Q = (F(0->(t))7{«>t} + ОО f + (1-F(r)) FhN(t— u)dQh(u). (6.5). k=l о Применяя к обеим частям равенства (6.5) преобра- зование Лапласа и используя соотношения ОО /оо . k / Т \ /г J e-s< dQh (t) = fe~s‘d(? (t) j = H e~stdF (t)) 0 4 ' '0 ' и oo oo J e~st N (t) dt = $ • e~st dt = 0 T = -тгЛтт; f e~st dF (f), s(l—/(t)) J ' /? T получаем ] e~st P{L^t}dt = 0 = J(F (0 - F (r) e~st dt • 2 ( S e~stdF (i)^ = т h=Q \0 J = Je~stdF(t)l s( 1- e~st dF (t) j . т IL \ о / _ Последнее соотношение вместе с равенством p-s<pu<o^ = 4 p-s<dp is <6-6) о о
72 ГЛ. 3. СЧЕТЧИКИ справедливым для любой случайной величины с Р {^ > 0} = 1, дает <pL (s) = М e~sL = J e~std p {L < t} = f e'stdX (t) - о о = J e~stdF (t) (1 - J e~stdF (t) ). (6.7) T \ 0 / В частном случае F(t) = 1 — e u (£ > 0) получаем фь(5) = Ae-(5+X)7(s + for(s+X)T). (6.8) Можно показать, используя (6.5), что в этом случае = Р t} = e~Kx(i-e~ut~T))l{t>T} + оо k + 22 + (6.9) ?+—1 m=0 где 6.2. Асимптотика числа зарегистрированных им- пульсов на отрезке (О1, Л. Обозначим Yt число импуль- сов, зарегистрированных счетчиком за время (0, £1. Пусть G(t) = MYt. Из предположений и. 5.2 так же, как при выводе (3.15), вытекает, что t G(t) = F(t) + § G(t — u)dK (и), Q где К (t) = P {L t} = P {Li <3} — функция распре- деления расстояния между соседними регистрациями, преобразование ‘Лапласа которой задается равенством (6.7). Явный вид этой функции мы не знаем, однако, как показано в § 4, для нахождения асимптотики G(t) при t оо достаточно вычислить МА. Дифференцируя (6.7) по 5 в точке s = 0, после небольших преобразова- ний получаем оо ML = - (0) = Jи dF (и)= • (6.10) О
§ 6. СЧЕТЧИКИ С ПОСТОЯННЫМ МЕРТВЫМ ВРЕМЕНЕМ 73 Отсюда так же, как это делалось в п. 3.3, нетрудно вы- вести, что G(0~(1-F(t)).-^,. г->оо. г (6.11) Физический смысл соотношения (6.11) ясен. Действи- тельно, в силу (4.1) за время t на счетчик поступит примерно t/[i частиц. Из этих частиц зарегистрированы будут лишь те, для которых выполнено условие: чесли х — момент поступления частицы па счетчик, то пре- дыдущая (быть может, незарегистрированная) частица поступила на счетчик раньше момента х — т. Вероят- ность же выполнения этого-условия равна 1 — F(x), что и дает (6.11). Отметим также, что если F(f) — экспо- ненциальное распределение с параметром X, то (6.10) и (6.11) имеют вид МЛ = ^Т/Х, t->oo. (6.12) Для нахождения асимптотики Dyf при t оо необ- ходимо вычислить DL = ML2 — (МЛ)2. Дифферен- цируя по 5 в точке 0 равенство (6.7) два раза, получаем МЛ2 = <р! (0) = 1-Лт) J Lo (6.13) Объединяя (6.13) с (6.10), находим DL = оо L0 Т + 1 - (т) J xdF ~ 1 -5 (т) о (6.14) Несложные выкладки показывают, что если выполнено (3.1), то DA = (б>2*т _ 2WT)/V. (6.15)
74 гл. 3. СЧЕТЧИКИ Из (6.10) и (6.14), используя (4.8), выводим DYt~ DL (ML)3 (6.16) t —> оо. § 7. Регистрирующие системы " j с несколькими счетчиками типа I « Многие регистрирующие системы состоят из не- скольких подряд идущих счетчиков, каждый из кото- рых обладает своим мертвым временем, причем, если счетчики ахй Ъ идут непосредственно друг за другом, то счетчик Ъ может регистрировать лишь импульсы (не обязательно все), зарегистрированные счетчиком а. 7.1. Случай двух счетчиков типа I. Постановка за- дачи. Рассмотрим схему, состоящую из счетчиков а и Ъ типа I (рис. И). Зарегистрированные импульсы Рис. И. Пусть на .вход счетчика а поступают частицы. Про- межутки времени между поступлениями частиц явля- ются случайными величинами с функцией распределе- ния Fit). Обозначим Ва (t) = Р (х? t} функцию рас- пределения мертвого времени в счетчике a, Bb(t) = = Р функцию распределения мертвого ’ вре- мени в счетчике Ь, (Здесь и ниже мы будем применять согласованным образом обозначения §§ 1—6, помечая их индексами а и &.) Если частица была зарегистриро- вана счетчиком а, то на вход счетчика Ъ подается им- пульс, который будет зарегистрирован, если jb этот мо- мент счетчик Ъ свободен, т. е. импульс поступил после окончания мертвого времени на счетчике Ь. Пусть У а t и it—число импульсов, зарегистрированных за время [0, t) соответственно на счетчиках а и Ь. Попы- таемся установить, как связаны между собой величи- ны МУ? и МУ?. Поскольку па вход второго счетчи- ка поступают лишь импульсы, зарегистрированные пер- вым счетчиком, то моменты их регистраций/??, /??, ♦ .. можно рассматривать как моменты поступления им- пульсов на второй счетчик, причем функция распреде-
§ 7. СИСТЕМЫ С НЕСКОЛЬКИМИ СЧЕТЧИКАМИ ТИПА I 75 ления промежутков между соседними отсчетами, я“(о = Р!л?+1-я?<*} = Р{£?<Н (i>i), для случая F(t) = 1 — е~и (Л > 0) вычисляется по фор- муле (см. (3.3)) t Ка (f) = X J e~w~u',Ba (u) du. (7.1) о Предположим, что счетчики а и Ъ включаются одновре- менно. Тогда первая частица, поступившая па счетчик а, будет обязательно зарегистрирована счетчиком -Ь. Поэтому Tq = Lq = Lq и из результатов §§ 2 — 4 вытекает, что функция Gb (t) = МУ* удовлетворяет ин- тегральному уравнению t Gb(t} = F (0 + J Gb (t - и) dKb (u), (7.2) 0 4 где Kb(t) — функция распределения длительности про- межутков между отсчетами счетчика Ъ. 7.2. Асимптотика МУ/ при t-+oo. Поскольку (7.2) совпадает по виду с (3.15), то для выяснения асимп- тотического поведения Gb(t) при t 00 достаточно вы- числить величину рь = МЛь = °^udKb(u) о — математическое ожидание промежутка времени Lb между соседними регистрациями второго счетчика. Рис. 12. Прежде всего заметим (рис. 12), принимая 0 за начало отсчета, что La^La1 + Ll+...+ La (ъ} (7.3)
76 ГЛ. 3. СЧЕТЧИКИ где Уо (/) = шах {я: Sn = L“ + L% + ... + по- скольку следующий импульс будет зарегистрирован счетчиком Ъ лишь после окончания мертвого времени Xi- Положим G^t) = МУо(£). Так же, как и при выводе (3.14), нетрудно показать, что G^ (t) удовлетворяет следующему интегральному уравнению: G“ (£) = £“ (0 + § G% (t — u)dKa (и). (7.4) О Вернемся снова к равенству (7.3). Используя свойства условного математического ожидания, находим Mi" = м [Ц + Ц +... + J = »м[м[г; + Li+ ... +-t;;W)+.K <’Ч Но при фиксированной .длительности «мертвого» вре- мени Xi случайная величина Yq (xi) = max {n: L* + + L% + .. . + не зависит от будущего. Отсюда, применяя тождество Вальда (4.3), выводим м + ... + z ь. I х?1 = М£“М [У“ (х?) + 11 хП- L у0\Х1/+11 J Подставляя это соотношение в (7“.5), получаем рь = MLb = М [ML1 (МУо (%Э +1) I = - = М [ML“ (G“(x?) + 1)] = ML“ (MG# (хЭ + 1) = = pJi += \ о / = p (1 + f Я (u) dBa (u)) 11 + J G“ (u) dBb (u) j. (7.6) \ 0 / \ 0 / Таким образом, зная Ka(t) и 5ь(0, можно найти рь, что в свою очередь вместе с (7.2) дает Gb(0~-^ (7-7) 7.3. Система пуассоновских счетчиков. Соотношения (7.6) и (7.7) кажутся на первый взгляд бесполезными, ибо вычислить правую часть (7.6) непросто. Однако
§ 7. СИСТЕМЫ С НЕСКОЛЬКИМИ СЧЕТЧИКАМИ ТИПА I 77 в некоторых практически важных случаях величина р6 может быть представлена в более удобном виде. В ка- честве иллюстрации этого утверждения рассмотрим си- стему пуассоновских счетчиков. Пусть ^“(0 = (<>0), (7.8) а Bb(t) = P(xJ<O = l-e“4' (f>0). (7.9) В силу (7.1) ка (t) = К f (1 - е~КаиУе~ю~и) du. о Отсюда f e~stKa (t) dt = . , .^тп-, (7.10) J s(s+ X) («+ xa) ’ v ’ или, используя (6.6), оо оо J (/) = S J К- (!) e-'dl - -(ТТПИТ+П- (7Л1> 0 0 а Применяя к левой и правой частям равенства (7.4) преобразование Лапласа и делая очевидные упрощения, получаем оо оо ^e~stG“(t}dt = 0 \e~stKa{£)dt 0 (7.12) Поскольку правая часть,(7.12) является рациональной функцией, можно воспользоваться теоремой обращения Хевисайда и получить точную формулу для функции Go (t) при t > 0: Ga0 (f) = Res -2------e* + Res -2----------------est = s=o s (s + A, + Aa) s=-x-Xa s (s + X + 2ia) = V Г, _ 1 , X -(X+M‘l X + XaL * + *<, * + *<, Г
78 ГЛ. 3. СЧЕТЧИКИ Последнее равенство вместе с (7.9) приводит к соот- ношению оо § G“ (и) dBb (и) = О _ 4х Г 1 . 1 ,__________ч______1 _ Л. + %а + Ч (^ + Ч) (^ + Ч + Ч) % X Г 1 11 = Х + Х "Ч _ X + X + х. ]• (7ЛЗ) Учитывая, что в силу (7.8) и (3.4) 4 1 X -I— X ра=4+х='-^-’ (7Л4) и подставляя (7.13) и (7.14) в (7.6), окончательно по- лучаем _ 1 , 1 1 1 Рб 1 Ф X ф X, х -К 1 + X • а д 1 а 1 о Проведенные выше расчеты могут быть выполнены и в других случаях. Это возможно, например, если случай- ные величины Xi и Xi имеют гамма-распределения с параметрами аир, л а г» 1 к <*7 J О С = T^rJ ^e-^du, (7.15) О или распределения, являющиеся взвешенными линей- ными комбинациями функций такого вида. 7.4. Система нескольких счетчиков типа I. Аналоги соотношений (7.6) и (7.7) можно получить и для слу- чая к подряд идущих счетчиков типа I. Не проводя детального вывода, сформулируем окончательный ре- зультат. Пусть имеется система счетчиков аь а2, ..., ак ти- па I, на вход первого из которых поступают частицы (рис. 13). Промежутки времени между поступлениями соседних частиц имеют распределение F(f). Обозначим
§ 8, СОЧЕТАНИЕ СЧЕТЧИКОВ ВИДА II-*1 79 Ваэ (0 функцию распределения мертвого времени у’-го счетчика. Пусть функцииGQ\t) (/ = 1, 2, ..., к) яв- ляются решениями уравнений t Gaoj (f) = Ka\t) + J Gaj (t - u) dKai (u). 0 Тогда математическое ожидание paft промежутка време- Импульсь^J* рмпульсы Рис. 13. Т flfe ни L между последовательными отсчетами счетчика ak вычисляется по формуле peft = ML“ft = = ц (1 + J Я (u) dBai (u)^l Д H + JGo^1 («) dBa} (a) \ o J \ о и, следовательно, Gak(t) = MYatk----------------Z->oo. § 8. Сочетание счетчиков~вида II I Рассмотрим систему счетчиков а и Ь, первый из ко- торых является счетчиком с продлевающимся мерт- вым временем, Р{%1 = то} = 1 для некоторого та>0, а второй — с непродлевающимся мертвым ♦ временем. Нетрудно понять, что такое сочетание счетчиков прин- ципиально не отличается от системы счетчиков вида I I, исследовавшегося в § 7. В самом деле, и в том и в другом случаях на вход счетчика Ъ подается после- довательность импульсов, промежутки времени между которыми независимы и одинаково распределены. Спо- соб получения этих импульсов не имеет значения для отсчетов на счетчике Ъ. Поэтому для величины Gb(t) — числа зарегистрированных импульсов на промежутке [О, 0 и в этом случае справедливы соотношения (7.2)—
80 ГЛ. 3. СЧЕТЧИКИ (7.7). Нужно лишь учесть, что функции Ка (t), G% (t) и МЛ® находятся из соотношений (см. (6.6), (6.7), (6.10) и первое равенство в (7.12)) <РгДз)= { e~stdKa (t)— оо = J e~sidF (t) та 1 — j e~sidF (t) о (8.1) pa=ML^p/(l-F(Ta)) (8.2) и oo oo I / oo \ J e~s,G’f' (z) dt = J e~s,dF (t) si 1 - J e~sldF (t) . (8.3) 0 TO / \ 0 / В частности, если F(t) = 1 — e~u {t > 0), to oo J e-slG^ (t} dt = -4- <rT«(s+%). 0 5 Обращая это равенство, получаем Go (i) = A(<-To) e-?-T“ (8.4) Поскольку в рассматриваемом случае Р« = eKr°/K, (8.5) то (8.4) и (8.5) вместе с (7.6)’дают Рь = j 1 “ (1 - в" W) + JudBb (u) j. ' та / • ‘ (8-6) Соотношения (8.6) и (7.7) позволяют вычислять Gb (/) = МУ; при t -> оо для систем счетчиков вида II-> I. Формулу (8.6) можно значительно упростить, если предположить, что Р {Xi = т6} = 1 для некоторого т& > >0 пли, в терминах функции распределения Bb(t\ ъ 1°> t <т6; Z >т6.
§ 9. СОЧЕТАНИЯ СЧЕТЧИКОВ ВИДА II—II И I ->П 81 Если т& < Та, то из (8.6) вытекает р& = е^а/'к — ра, что естественно было и ожидать, поскольку в этом случае все частицы, зарегистрированные первым счетчиком, будут зарегистрированы вторым. Если же ть > та, то Рь = (1 + % (ть - та) е-Хт«)А. § 9. Сочетания счетчиков вида II II и I II Сочетания счетчиков II II и I II были факти- чески изучены в § 6, поскольку там мы полностью оп- ределили выходные характеристики счетчика II, если на вход поступали частицы через случайные промежут- ки времени, имевшие общую функцию распределения F(t). Поэтому для того, чтобы найти асимптотику Gb(t) при t оо в обоих случаях, нужно лишь произвести соответствующие переобозначения. Пусть т& — мертвое время счетчика Ъ. Из (6.7) вытекает, что <PLb (s) = ме SLh = 4 i-je-stdKa(t) . о = J e~stdKb(t) = J e~sldKa (t) 0 4 I Поэтому (см. (6.10), (6.14)) p6 = M/? = — <p^(,(0) = ——-^я \ b) 0 (9.1) MLa (ть)’ (9.2) - OO * DZ? =------------ f u2dKa (u) + l-A"(Tb) Отсюда следуют асимптотические соотношения Gb (t) ~ IzAJlzl f, t -> OO, (9.4) Pa и .Dy t-^oo. (9.5) (MA6)3 4 ’ 6 В А. Ватутин и др.
82 ГЛ. 3. СЧЕТЧИКИ Осталось лишь вычислить явно MLb и DZ? для каж- дого сочетания в отдельности. Сочетание II -> II. Из (6.10) вытекает, что pa = р/[ 1 — Т'ЧТа)! , (9.6) поэтому РЬ = (9J) Если, в частности, F(t) = 1 — е~и (/ > 0), то р6 = ?Мь(1-Яа(т&))], (9.8) где в силу (6.9) при т& > тв Ка (ть) = е~ХТа (1 — е_х(Ть-т°)) + + 22 (-i)mcrzft(Tb-vn + i)Tje-XT< fe=l m=0 Для вычисления дисперсии Ьь воспользуемся (9.6), (6.13) и (6.14), заменив в последней формуле F(t) на Ka(f). Тогда DLb =----- 1-ка о Ч ( р2 1* 1 — Ка 1 la 4 а/ о --------f udKa(u)~ и2 Сочетание I-> II. В этом случае (см. (4.6)) (оо \ 1 +Jtf(u)d5a(u) . о / (9-9) Без дальнейших предположений о функциях F(t) и
§ 10. НЕКОТОРЫЕ СТАТИСТИЧЕСКИЕ ЗАДАЧИ 83 Ba(t) формулу (9.9) упростить нельзя. Рассмотрим два примера, в которых такое упрощение возможно. 1. F (0 = 1 - е~* (t 0), Ва (f) = l- е" Ч Ввиду (3.3) и (3.4) имеем Ка (0 = К J (1 - e~KaU) e~w~u}du = О 1 - СТ * ¥= ,Q .т = А Аа (9.10) 1 — е~и — Ме~и, К = Ка; ро = ML“ = V1 + XJT1. (9.11) Таким образом, = —х + х°— (9.12) Ма(1-АГ“(ть)) 2. Пусть T'XJ) = 1 — , Ba(t) =I{t > та), т. е. мертвое время первого счетчика постоянно и равно Та. С физической точки зрения интересен лишь случай хь > Та. Именно этим случаем мы и ограничимся. Из (9.9) и (3.18) находим Ра = V1 + Та, (9.13) и поскольку (ср. с (3.21)) ка (0 = 1 - е~х(‘"т“) j: (t Та), (9.14) . ТО = . (9.15) Используя равенства (9.10)—(9.15)г можно найти явные выражения для D£b в обоих случаях. Посколь- ку получающиеся при этом формулы громоздки, мы их приводить не будем. § 10. Некоторые статистические задачи в теории счетчиков В предыдущих параграфах при изучении свойств счетчиков типов I и II предполагалось, что «входные» параметры регистрирующих систем, такие как распре- деление промежутков между поступлениями частиц на 6*
84 ГЛ. 3. СЧЕТЧИКИ счетчик или распределение мертвого времени, из- вестны. Зная эти характеристики, мы смогли вычислить «выходные» характеристики счетчиков, математиче- ское ожидание и дисперсию числа зарегистрированных импульсов па промежутке (О, Й. Однако на практике приходится сталкиваться с обратной задачей: по числу зарегистрированных импульсов восстановить или оце- нить «входные» параметры счетчиков. Решение этой задачи в общей ситуации вряд ли возможно, поэтому мы ограничимся изучением характеристик «входного» потока частиц для случая F(t) = 1 — e~Kt (i>0), где X — неизвестный параметр. 10.1. Вспомогательные вероятностные результаты. При исследовании свойств статистических оценок па- раметров нам понадобятся два известных вероятност- ных утверждения. Пусть go = 0, gi, g2, ..gn, ..последовательность независимых случайных величин с конечными диспер- сиями, причем случайные величины g2, g3, ... одинако- во распределены. Положим р = Mg2, о2 = Dg2, Zt = = max {^ : g0 + gi + ... + gn < t). Справедлива следую- щая теорема (см. Боровков А. А. Теория вероят- ностей.— М.: Наука, 1976, стр. 201). Теорема 10.1. Для любого у е (—оо; +оо) lim Р 2-»оо е 2 du = Ф (у). Пусть щ = (т]|, ..J]?) — случайный вектор, распре- деленный при t оо асимптотически нормально с век- тором математических ожиданий а = (а1? ..., щ) и ко- вариационной матрицей 0=46=4-11^^- Теорема 10.2 ([43],стр. 156).Если ср^, ..., Хь)= = ср(я) — числовая функция, дважды непрерывно диф- ференцируемая в окрестности точки а, то случайная величина ср(тр) распределена при асимптотиче- ски нормально с параметрами <р(а) и (В&,&)/£, где Ъ = (&п ..., 6А) — вектор с координатами °Хг 10.2. Оценка параметров счетчика типа I. Пусть мы наблюдаем число регистраций частиц Yt счетчиком
§ 10. НЕКОТОРЫЕ СТАТИСТИЧЕСКИЕ ЗАДАЧИ 85 типа I, когда на вход поступает пуассоновский поток частиц. В силу (4.2) и (4.7) (10.1) t р 1 + Лт’ t —> оо. Более того, ввиду (4.9), теоремы 10.1 и равенства t t2 1 + Zo2 Л . ~1 ч’~Г> t~>00, (1 + Хт)3 * можно утверждать, что _______к \/-.Л + хУ 1\ t i+uj/ У (1 + Лт)3 Л<х —>Ф(я).. (10.2) * J t->OO Таким образом, если в качестве оценки величины р-1 мы предложим величину = то эта оценка бу- дет асимптотически несмещенной и состоятельпой. Дальнейший анализ зависит от того, известна или нет величина т — математическое ожидание мертвого времени. Величина т известна. В этом случае в качестве оценки X величины X можно взять £ = р-1/(1-т(?1). (10.3) Действительно, в силу теоремы 10.2, примененной для к = 1 к функции ср(я) = х/(Л — хх\ оценка X при t -> оо распределена асимптотически нормально с ма- тематическим ожиданием и дисперсией D;- - 4 тгтйг (гтй > - -Н +w)(‘+^>- Величина т неизвестна. Ясно, что в этом случае без дополнительной информации получить разумную оцен- ку X нельзя. Поэтому будем предполагать, что можно менять интенсивность -поступления частиц на счетчик: увеличивать или уменьшать ее в нужное число раз. Этого можно добиться, изменяя, например, расстояние между источником 'частиц и счетчиком или используя источник с известным периодом полураспада. -
86 ГЛ. 3. СЧЕТЧИКИ Пусть У/х-(1) — число частиц, зарегистрированных счетчиком за время [0, М, если частицы поступали на счетчик с неизвестной интенсивностью %, а У* (А) — число частиц, зарегистрированных счетчиком за время [О, £2], если частицы поступали на счетчик с интен- сивностью к%; число к известно. Предполагается, что величины Yt (1) и Yt (к) независимы. Положим 1 2 = ^ = rw- (W-4) В силу (10.1У—(10.3) величины ^ = ^^(1), l2 = t^Yt2(k) при ti -> оо и t2 00 будут распределены асимптоти- чески нормально с параметрами аь Ьц/ti, где а1 d2 = _L_ 1 -{- Хт’ Ьп *1 ' Ь22 1 + хУ к ~ (1+W ty (10.5) ] (Ю.6) j = 1 4- fe2X2o (1 + Ш) 2 кк ~ 1+ккт;1 Зафиксируем е=^^2 и положим гц = = (лх, Х2)« Ввиду J (10.5)—(10.6) и независимости Xi и Х2 вектор тргпри i оо асимптотически нормален с параметрами 1 4 0 \ . . = fв = {-(,“ „J- (“’) Разрешим систему (10.4) относительно % и т. Тогда _ ккг — %2 (к — 1) ’ Т =(Л-1)^2’ *- = к^-уу Если в теореме 10.2 мы выберем • фЫ = ф(#1, х2) == (kxi — х^Кк — 1 )a;i^2, то получим, что величина i т = (Н1-£2)/а-1)£л2 (10.8)' ' распределена при оо асимптотически нормально с параметрами ф(а) = т и дисперсией Dr = (В6, Ь)!^.
§ 10. НЕКОТОРЫЕ СТАТИСТИЧЕСКИЕ ЗАДАЧИ 87 Здесь вектор Ъ имеет координаты _ ду(х) (1 + 1т)2 1 д\ х=а (* —1)Х2’ _ д<р (х) I _ _ (! + Ш)2 2 дх2- |х=а (fc-l)W.2' Отсюда и из (10.7) 4-(в&;&) = 4-[б11&2 + е&22&1] = Г1 *1 “ t [(1 + !-v>(1 + w + + (1 + AW) (1 + AU)]. (10.9) Аналогичные выкладки для функции <p(xr±, ^2)= = (к — l)xix2/k(x2 —xj показывают, что оценка t = (к - 1)%Х/*(%2 - М) (10.10) распределена при. -*• «> асимптотически нормально с параметрами % и Ьтн?(1 + w>+ т ттШ <1ОЛ1> Предположим теперь, что общее время наблюдения t=£i + £2 велико, но фиксировано. Спрашивается, как нужно выбрать е для того, чтобы дисперсия (10.9) или (10.11) была минимальной. Подставляя в эти равенства £i = e£/(l + e) и минимизируя по е, получаем, что (10.9) будет минимально при „ _ -1/ fc(l + X2d2)(l+XT) 1 |/ (h-aWJu+Ht)1 а (10.11) — при • Р = 1 / а3.(1 + аУ) (1 + И ’ _2 V (14-А:2%2а2)(1 + Ш)* (10.12) (10.13) Если заранее известно, что о = 0, т. е. мертвое вре- мя счетчика постоянно и равно т, а «С 1, что отве- чает случаю так называемых малых загрузок, то (10.12) и (10.13) перейдут в соотношения УЛ, е2 — ^ЛУЛ. Таким образом, в случае малых загрузок для
88 ГЛ. 3. СЧЕТЧИКИ того, чтобы дисперсия т была минимальной, необхо- димо, чтобы t. = t, = (10.14) 1 Va + i ’ 2 V* + i 4 ' а для того, чтобы дисперсия X была минимальной,— = к-]/к _ ---1----t 1 к~ук-[-1 Л-УА.-+1 причем Dt ~ ( У к + 1)2 Д (к —-I)3 V к X3 в первом случае, а во втором DX X (/с У к + i)2/tk (к — 1). 10.3. Оценка параметров счетчика типа II. В отли- чие от соотношения (10.1), в этом случае М ~ у = ке~К\ (10.15) причем ввиду (6.12), (6.15) и (6.16) D ^- = ~ - 2Хте~?'т). (10.16) Поэтому в силу теоремы 10.1 величина распре- делена асимптотически нормально с параметрами а и где а = Ъ = ХбНт(1 - 2Хт^).. (10.17) Рассмотрим теперь величину р~4=Хв“Хт. Даже если р-1 и т были бы известны точно, определить однознач- но X из приведенного вы- ше равенства мы не смог- ли gbj, поскольку ПрИ фик- __5— _______________ сированном z/<=(0, (гт)-1) •° / уравнение у = хе~хх име-_ / ! ! ет два корня (рис. 14), .----:----1iВ связи с этим так же, 0 271 1//~ Хг х как и в п. 10.2, будем Рис. 14. предполагать, что у пас есть два независимых на- блюдения числа регистраций на интервалах длины и t2 соответственно. Пусть за время было зарегистрировано Y (1) ча- стиц, если частицы поступали с интенсивностью X, а за время t2 Y t2 (к) частиц, если частицы поступали
§ 10. НЕКОТОРЫЕ СТАТИСТИЧЕСКИЕ ЗАДАЧИ 89 с интенсивностью &Х. Обозначим M = Х2 = Ш"*Хт. (10.18) Ввиду (10.15) —(10.17) справедливы соотношения p{(£i - ^Ij/'т- (1 - 2тЛ{) < х }—ч- Ф (ж) (г = 1, 2), где £2^2“%2(/с). Полагая е = гщ= (Хъ Х2) и выбирая по теоре- ме 10.2 1 Ж*)= (/^~l)-T10g V получаем, что если величина т известна, то оценка 4 ккл l = (10Л9) при t{ оо распределена асимптотически нормально с параметрами X и(В&, где b = (Ьъ Ь2) = (-}—т-, —77—г \ ' т’ 27 ^(/г —1)1^’ (/с —1)тЛ2у а /^(1-2^) 0 \ I 0 8Х2 (1 - 2тХ2) ? После очевидных упрощений при оо получаем Р /1 1 [(1-2UQ2 |/ t. (к -1)2x4 J(l- 2тХ2)21< Нетрудно убедиться, что в случае малых загрузок Хт 1 п фиксированного зцачеппя t = t{ + t2 дисперсия X будет минимальна, если выполнено (10.14). Если же продолжительность мертвого времени т неизвестна, то, как следует из теоремы 10.2, при
90 ГЛ. 3. СЧЕТЧИКИ fj = еТ2, tt -*• оо оценка ______________________h ___1 V-* Vм !»g л — 1 Л2 распределена асимптотически нормально с параметра- ми т и ti1 DT, где п 2 Г1/ 1 к \2 °*7Т . L \ ^2 / - е(1-2Х2т)/_1_____1 V' = ^2 I ]ng^i & — 1 1 = (к -1)4* И С1 - 2Хте"Хт) (1-й 1т)2 + + -%-(1 - 2Ш e-ftU) еЫл(1 - Хт)21, (10.20) что при малых загрузках близко к (10.9). Такая со- гласованность в оценках является естественной, ибо при малых загрузках счетчик с продлевающимся мертвым временем работает фактически так же, как и счетчик с пепродлевающимся мертвым временем, ввиду того, что вероятность поступления частицы на счетчик в период мертвого времени мала. Аналогичные выкладки показывают, что при -> ->00, ti = &t2 и неизвестном т Р {(X - %) /]/~Ф (х), где £ _ 1) ^-i/(fe-i) n _ X2 Г 1 - 2tXi , 2 । 6 С1 -2тХ2) ] _ U* “ (*—1)8 [ %, К + Х2 J = —^—2 [(1 — 2Хте~Хт) eult + (*-1)2Г ' -+ А (1 _ 2XT/«e-XftT) - (10.21) По тем же причинам, что и раньше, при Хт<С 1 (10.211 близко к (10.11).
§ 10. НЕКОТОРЫЕ СТАТИСТИЧЕСКИЕ ЗАДАЧИ 91 10.4. Оценки числа частиц, поступивших на пуас- соновский счетчик за время [О1, tL Полученные в пп. 10.2 и 10.3 результаты можно использовать для оценки среднего числа импульсов MTVf, поступивших на пуассоновский счетчик за время (0, Й. Обращаясь к (3.18), получаем, что в качестве оценки MTVf можно выбрать = kt, где X вычисляется по формулам (10.3) или (10.10) для счетчиков типа I и по формуле (10.19) для счетчиков типа II.
ГЛАВА 4 ВЕТВЯЩИЕСЯ ПРОЦЕССЫ Среди моделей физических явлений, связанных со столкновениями и превращениями частиц, важное место занимает теория ветвящихся процессов (см. [34]). Возникшая более 100 лет назад, эта теория бурно раз- вивалась в последние 20 — 25 лет. Накопленные ею факты позволяют строить математические модели фи- зических процессов, которые удовлетворительно, во всяком случае в первом приближении, описывают суть происходящих явлений. Такие модели построены, например, для процессов, происходящих в фотоэлект- ронных умножителях, нуклонных каскадах (см. [10], L22], [341, [41], [49]). Наиболее удобным математиче- ским аппаратом для изучения ветвящихся процессов оказался метод вероятностных производящих функций, к изложению которого мы и переходим. § 1. Метод производящих функций Пусть £ — целочисленная неотрицательная случай- ная величина, оо Р„ = Р{^ = «} (п = 0, 1, 2, ...), = п=0 Производящей функцией F*(s) (или просто Fts)) на- зывается ряд оо F(s) = ^(S) = MS’=2Wn. (1.1) Рассмотрим несколько примеров. Пример 1. Пусть £ принимает значение 0 с ве- роятностью q и 1 с вероятностью р = 1 — q. Тогда f\(s) = q • s° + р • s1 = q + ps. Пример 2. Пусть P {v = n} = ^"^(n = 0,1,2,...).
§ 2. МОДЕЛЬ ФОТОЭЛЕКТРОННОГО УМНОЖИТЕЛЯ 93 Тогда оо ^(«) = 2^г^п=еХ(5_1)- П=о Нетрудно убедиться в том, что производящие функции обладают следующими свойствами: Г. Радиус сходимости ряда (1.1) не меньше 1. 2°. При любом /с, для которого F41)<°°, сущест- вует МВ (В- 1).. .(В-к + 1) = Fft.(l). В частности, MB=F'(1), MB(B-1) = F''(1), DI = M ? - (M В)2 = M В (В - 1) + M В - (M В)2 = = F" (1) + F' (1) - (F' (I))2. (1.2). 3°. Если . |2) • •Bn — независимые неотрица- тельные целочисленные случайные величины, то п F£1+52+-+&п (s) = П FЦ («)• г=1 4°. Если v, |b |2, ...» ...— последовательность неотрицательных независимых целочисленных случай- ных величии, причем величины (f = l, 2, ...) оди- наково распределены, то ^1+B2+-+MS) = = FV(F51(S)). Введем, наконец, понятие итераций производящих функций. Итерациями производящей функции' F(s) называется последовательность функций Ft(s) (t = = 0, 1, 2, ...), определяемых соотношениями FM=s, Fi(s)=FM1 Ft+M=F(FM). Так, для примера 1, приведенного в начале параграфа, F2(s) = q + p(q + ps) = q + pq + p2s, а для примера 2 F2(s) = exp — 1)}. § 2. Модель фотоэлектронного умножителя Рассмотрим фотоэлектронный умножитель, усили- вающий слабый поток первичных частиц, образован- ный квантами света, пришедшими извне. Кванты света,
94 ГЛ. 4. ВЕТВЯЩИЕСЯ ПРОЦЕССЫ попадая на фотокатод умножителя, выбивают из светочувствительного слоя некоторое количество элект- ронов. Эти электроны после соответствующей фокуси- ровки и ускорения ударяются в электрод, называемый динодом. Динод изготавливается из вещества, способ- ного при воздействии на него первичными электрона- ми испускать вторичные электроны, число которых в несколько раз превышает число первичных электронов. Эти вторичпые электроны направляются на следую- щий динод и т. д. Таких динодов в умножителе может быть 10 и более. Требуется оцепить число электронов на выходе, если на фотокатод попало т квантов света. Математическая модель описанного выше процесса такова (см. [41]). Пусть сначала тп = 1. Обозначим число электронов, выбитых квантом из фотокатода. Величину можно рассматривать как случайную ве- личину с производящей функцией °F(S) = F0(S)= 2Л0)^, Fo(s) = l. (2.1) Ь1 П=0 *1 Чаще всего функция QF(s) имеет вид °F(s) — q +j>s, p+q = l. Электроны, выбитые из фотокатода, мы бу- дем называть электронами нулевого поколения. Зану- меруем их числами 1, 2, ..., Электрон нулевого поколения под номером i выбивает из динода случай- ное число электронов первого. поколения с произ- водящей функцией 'F ($) = F , (з) = 2 р<№, F . (1) = 1. (2.2) Ч п=о *1 Эксперименты показывают, что, например, для сурь- мяно-цезиевого динода при энергии электронов 500 эВ величина может принимать значения от 8 до 12. Будем предполагать, что число электронов-, выбитых из. динода некоторым фиксированным электроном пер- вого поколения, не зависит от числа электронов, вы- битых остальными электронами нулевого поколения. Обозначим ц(0 число электронов, образовавшихся на £-м шаге. Тогда ц (0) = /м _ Ш + ^2 + • • • + если И (^ — 1) > 0» /о о\ ) (О, если ц (t — 1) = Од
§ 2. мЬДЕЛЬ ФОТОЭЛЕКТРОННОГО УМНОЖИТЕЛЯ 95 где — независимые одинаково распределенные слу- чайные величины с производящей функцией t Nt *F (s) = Ms6* = S p^sn, *F (1) = 1. • n=o Физически величина %>i обозначает число электронов, выбитых Z-м электроном U—1)-го поколения из'^-го динода. Пусть F(t, s) — производящая функция числа электронов £-го поколения. Из (2.3) и свойства 4° § 1 для производящих функций получаем F(t,s) = F t t t (s) = Fll{t_1)(F t(s)\ = Si4fe2+---+spiO-i) \ ) = F(t-\, (2.4) Используя эту формулу несколько раз, выводим -F(t, s)=F(0, WF(...(W))))). (2.5) В частности, если условия эмиссии на всех динодах одинаковы, т. е. T^s) = Ws) G = 2, 3, ..., t), то F(t, s)=F(0, 'FM). (2.6) Заметим теперь, что F(0, s) — производящая функция числа электронов нулевого поколения. Поэтому F(0, $) = = °F(s), если на фотокатод поступил один квант света, и, следовательно, в этом случае Ж 5)=Ж(...(%)).)). (2.7) Если же на фотокатод поступило v квантов, где v — случайная величина с производящей функцией Fv(s),to К(0)>$ + + ... +& (Здесь (j = 1,2, ..v) — независимые случайные величины с производящей функцией °F(s), равные числу электронов нулевого поколения, выбитых г-м квантом.) Поэтому F(0,s)=Fv(W)). Таким образом, F(t, s)=Fv(°m..(%))))),
96 ГЛ. 4.‘ ВЕТВЯЩИЕСЯ ПРОЦЕССЫ что переходит в равенство F(t, s)=Fv(°F(1^(s))), (2.8) если условия на динодах одинаковы. Вычислим величины A (t) = Мц(£) и D(£) = D|i (i), исходя из свойства 2° § 1 для производящих функций и равенства (2.7). Дифференцируя (2.7) по s, находим t = (2-9) 1=0 Отсюда, обозначая Аг = ZF' (1) = выводим t МИ(0 = ПА, (2.10) . 1=0 что в случае одинаковых условий на динодах дает Мц(0 = А0А*- (2.11) Дифференцируя (2.9) по s еще раз и обозначая Д = = lF" (1), получаем МК0Н0-<) = ПА 2т П Д 1=0 \j=o 3 k=j + l J Это соотношение вместе с равенством (1.2) приводит к желаемому результату * / * n t \ t t □и(0 = П^ 2-J- п 4 +П^-П4 i=o \j=o ? fc=J+i у 1=о 1=о Если условия на динодах одинаковы и B = Bi = = 1, 2, ..., t), то п 4 4^1; Dp,(£)=j . -^0 “Ь ^Aq + Aq Лд, А = 1. (2.12) Пусть теперь па фотокатод поступило случайное число частиц v. Для простоты предположим, что QF(s) == = q + ps п условия па динодах одинаковы. Тогда F(t, s)=Fv(q + plFt(s)). (2.13)
§ 3. КОНЦЕНТРАЦИЯ НУКЛИДОВ 97 Отсюда м JX (i) = F' (t, $) !„_! = F'v (1) рАг и, при Л ¥= 1, Dn(0 = ^v(l)pM2t + + + F’- (Ч ”А' - (Ч Рл")’- В частности, если величина v взята из примера 2 § 1, то Мц (0 = КрА*, (2.14) а DH (t) = ХрА* + 4 (2.15) Для фотоэлектронного умножителя А > 1. Сравнивая (2.11) и (2.12) или (2.14) и (2.15), получаем, что ]/ Dp (i) ~ сМ|х (t) при больших значениях t. Это свидетельствует о большом разбросе числа электронов, получаемых па выходе, относительно Mp(t). Более того, теоретически возможна ситуация, когда на по- следнем t-м уровне электронов не будет совсем. Ве- роятность этого события ввиду (2.13) вычисляется по формуле F (f, 0) = Р {р (0 = 0} - Fv (q + plFt (0)). В частности, если мы для простоты положим 4F(s) = = sh для некоторого А, что означает увеличение числа электронов при прохождении через динод в к раз, то получим F(t, 0)=Fv(<7). Для Fv(s) = еК{8~1) при Х = 3 и q = 0,06 это приводит к равенству F(t, 0) — 0,06. § 3. Концентрация нуклидов 3.1. Физическая постановка задачи. Разобранная выше модель фотоэлектронного умножителя дает нам пример ’ветвящегося процесса Гальтона — Ватсона. В этом процессе изменение численности частиц про- исходит фактически дискретным образом, ибо нас ин- тересует лишь число частиц в t-м поколении, а не мо- менты их регистраций. Более интересным с практиче- ской точки зрения является марковский ветвящийся 7 в. А. Ватутин и др.
98 ГЛ. 4. ВЕТВЯЩИЕСЯ ПРОЦЕССЫ процесс с несколькими типами частиц и непрерывным временем. Строгое описание такого процесса имеется в [34]. Мы же разберем несколько примеров приме- нения марковских ветвящихся процессов, не вдаваясь в технические'подробности. Первый пример связан с определением концентрации нуклидов в образце, облу- чаемом постоянным нейтронным потоком. Для устойчивой работы реактора необходимо регу- лировать поток нейтронов, возникающих в про- цессе деления ядерного топлива (например, 239Ри, 235U). Такая регулировка проводится автоматически и непрерывно. В стационарном режиме на небольших отрезках времени поток нейтронов можно считать постоянным. В этих условиях естественно ограничить- ся изучением процесса превращения актиноидов (239Pu, 235U) и продуктов их деления. Знание концент- раций нуклидов необходимо для расчета различных характеристик процессов, происходящих в реакторе (суммарное энерговыделение, отравление реактора про- дуктами распада, суммарная активность и т. д.). Теория ветвящихся процессов к описанию превра- щений нуклидов в потоке нейтронов постоянной плот- ности была применена в работах [10], [И]. Решение в более общих случаях может быть получено «склеива- нием» решений для различных потоков постоянной плотности. Значительно более точпое описание процессов де- ления, происходящих в реальном реакторе, могла бы дать теория регулируемых ветвящихся процессов. Однако эта теория в настоящее время еще недоста- точно развита. 3.2. Математическая модель. Основные уравнения. Построим математическую модель описанного выше процесса. Пусть п — число типов нуклидов, взаимные превращения которых нас интересуют. Обозначим эти типы 7\, Т2, ..Тп. Будем предполагать, что за вре- мя Д£ 0 нуклид типа не подвергнется изменениям с вероятностью l-kkt + olkt) (3.1) и с вероятностью 1{Р®Д£ + о (Д£), со = (coi, со2, . *., соп), (3.2) превратится в совокупность, соответствующую вектору
$ 3. КОНЦЕНТРАЦИЯ НУКЛИДОВ . 99 о, где — число нуклидов типа Тк. Положим а (*) = h (2 р?“г... £п - и (2 • \ ш J \ О) / Ввиду (3.1) и (3.2) /<(!) = О, 1 = (1, 1, ...» 1). (3.3) Пусть рА) = (pt(f), p2(i), ...., pn(i)) — вектор числа нуклидов различных типов в момент t, а Fh (i, s) = М R(<) | pk (0) = 1, (0) = 0, i Ф *]. Известно (см. [34], стр. 119), что набор функций ^\(£, удовлетворяет системам дифференциальных уравнений -^^- = /*(^(As)t...^n(As)).: (*=172,...,») и - (3.4) ^h(t, я) у, OFh(t,s) -^01----= 2 A (S) —------- (*=1, 2,..., л) J=>1 < (3.S) с начальными условиями Fh(0, s) = sA. Обозначим . Aj (f) = М[р, (/) I pft (0) = 1, Pi (0) = 0, i =# *], (3.6) ^)(0 = М[р1(А(рЛ0-^)Гн*(0) = 11 н(0)=0, i^k], (3.7) где би = 0 при i ¥» / и 8ц = 1, если i = у, dfh(^ d2fkCs) dsi г s=l ^13 — ds^s- s=l \ * / Дифференцируя (3.5) сначала по sh а затем по в точке s = 1, нетрудно получить, используя (3.3), сле- дующие системы уравнений: 2 Ам (0 Лад (0) = бад (3.9) (у = 1, 2, ..., п), —~~=2 (о ан + (f) +2 Ам w 2$>(0) = 0 («,/ = 1,2,...,»). (ЗЛ0) Т
100 ГЛ. 4. ВЕТВЯЩИЕСЯ ПРОЦЕССЫ Пусть в момент t = 0 имелось Nf нуклидов типа .Tf (г = 1, 2, и). Положим 7V = (M, N2, Nn). Из. (3.9) и (3.10) вытекает, что функции 4 (0 = м (н (01 ц (0) = N) = 2 NtAl} (0 1=1 и (О = 2^/(0 1=1 удовлетворяют системам уравнений -^ = 2^(0ао-, А(0) = ^ (7 = 1, 2,. ,.,п) (З.И) И = 2 (о ач + + 2 А‘ (о 1=1 1=1 (3.12) Dij(O) =0 G, 7 = 1, ..п). Прежде чем переходить к дальнейшему анализу систем (3.11) и (3.12), рассмотрим несколько примеров в предположении, что плотность потока нейтронов Ф постоянна. Пример 1. Цинк зоZn за счет ^--переходов пре- вращается с вероятностями 0,85 и 0,15 в 743iGa и gfGa. Пусть Х = 1п2/7, где Т — период полураспада. Если назвать ядра зо^п, 3i™Ga и ^Ga соответствен- но частицами типов Tt, Т2, Т3, то при Д£-> 0 Р{Т1~^ Т2} = Х 0,85Д^ + о(Ы), м Р{7х--> тз} = ^-0,15Дг + о (Д£), (3.13) Af Р {7i-> ГЦ - 1 - W + о (М). AZ Отсюда /1(^1, s2, $з) = Л(—51 + 0,85 • $2 + 0,15 • s3). (3.14)
§ 3. КОНЦЕНТРАЦИЯ НУКЛИДОВ 101 Пример 2. Ядро 31 Ga за счет ^--переходов пре- вращается в ^Ge, а за счет захвата нейтрона — в 3iGa. Эти два процесса независимы. Пусть а — сечение захвата нейтрона (вероятность поглощения), ХФ = а • Ф, а Х₽Д£ + o(At) и ХФД£+ о(ДЙ— вероятности процессов ^-перехода и захвата нейтрона за время At 0. Назовем ядра 3iGa, 32 Ge и 31 Ga соответственно частицами типов Л, Т2, Т3. Тогда Р {7\ -> То} - XrA* + о (ДО, м Р{Т1->Т3} = ХфД^ + о (ДО, ы Р {7\-> 7\} = 1 - (Хэ — Хф) At + о (ДО ы и, следовательно, /1(^1, $2, $з)== (Хр ХФ)$1 + Хр$2 тЬ ХФ$3. (3.15) Пример 3. Превращения актиноидов возможны за счет деления на два осколка, ^-переходов и процессов захвата. ПустьKDAt + о(Д£), ^At + okAt), ХФД£ + о(ДО — вероятности деления, ^-переходов и захвата нейтронов при Д£->0. Пусть тип 7\ соответствует исходному актиноиду, типы Т2, Т3 соответствуют нуклидам (акти- ноидам), полученным за счет процессов ^-переходов, а типы (Т4, Т5), (Т6, Т7), ...— осколкам при делении. Тогда /1($1, $2, $3, $4, ^5, $6, $7, . . .) = = — (Хп + Хр + ХФ)$1 + Хр$2 + ХФ$3 + “Ь Хп(л45^4^5 "Ь Лб7^6^7 “Ь . . .), (3.16) где ХФ = оФ • Ф, Xd = 0d • Ф, оФ, Od — селения (вероят- ности) захвата и деления, л45, Лб7, ..вероятности получения при делении пар типов (Ть, (Т6, Тт) и т. д. 3.3. Линейные функционалы от траекторий процес- са. Пусть р(0) = (Д\, N2, ..., Nn) — вектор числа нук- лидов в момент t = 0. Во многих прикладных задачах представляет интерес величина ц(£) = CigtG) + c2y,2W + ... + cnp,n(£), (3.17) где Ci (i = l, 2, ..., n) — некоторые константы. Так, например, если сг = 1 для любого г, то это общее число
102 ГЛ. 4. ВЕТВЯЩИЕСЯ ПРОЦЕССЫ частиц, участвующих в процессе в момент t\ если с^_ = 6ijf то T](t) — число нуклидов j-го типа и т. д. Оче- видно, что м [П (01II (0) = АГ] = 2 (*), (3.18) i=i где 4/г) (i=l, 2, n) — решения системы (3.11), а D[n (01 Iх (°) = АП = 2 CiCjCovfMOiHiW)- (3.19) ij=l Обозначим pij) = 1» 2, ..., n\ v == 1, 2, ..., Nk) число нуклидов у-го типа, образовавшихся из у-го нук- лида А:-го типа,’имеющегося в момент £ = 0. Тогда п Nk , = 2 (3-20) k=l V=1 t Используя это представление, нетрудно убедиться в справедливости равенства COV (flj (£)) = Dij (2) + (£) 2 N^Ahi (0 (3.21) что вместе с (3.19) дает 0[П(Ш(0) = ЛЧ- = 2 (£') + 2 ci^i (0 2 [ 2 ei^ki (0 ) i,j=l i=l te=l \i=^ / Таким образом, решив системы вида (3.11) и (3.12), можно пайти Мц(£) и D?](£) функционала (3.17). При больших Nh N2, ..Nn распределение величин ИДО, а следовательно, и ц(£) можно считать прибли- женно нормальным. В этом случае вероятность вы- полнения неравенства где Gj (Z) = Мт](*) — ие V Dr) (t)t Ga(f)=Mu (t) +
л § 4. СИСТЕМЫ С НАКОПЛЕНИЕМ НЕЙТРОНОВ ЮЗ + u8VrDr](i), можно оценить, используя нормальное приближение. Подробности, связанные с такого рода оценками, содержатся в [11]. § 4. Вероятностные характеристики систем с накоплением нейтронов В рассматривавшихся в предыдущем параграфе примерах применения ветвящихся процессов к изуче- нию концентрации нуклидов в нейтронном потоке не принималась во внимание зависимость интенсивности вероятностей деления частиц от времени. В некоторых практических ситуациях такое допущение является естественным: задача становится проще и, что самое главное, не происходит потери ее физического смысла. Однако в задачах, связанных с ядерными реакторами деления, это допущение не всегда оправдано. В этом параграфе будет рассматриваться процесс деления ядер и накопления мгновенных и запаздывающих нейт- ронов, зависящий от времени. Исчерпывающие резуль- таты получить в этом случае трудно, поэтому в конце параграфа эта же задача будет решаться без учета изменения интенсивности вероятностей деления со временем. 4.1. Взаимодействие нейтронов с ядрами? Прежде чем переходить *к математической модели, которая будет изучаться в дальнейшем, остановимся па неко- торых допущениях и предположениях физического ха- рактера. 'Главную роль в процессах, происходящих в ядер- пых реакторах, играют нейтроны. При движении внутри реактора нейтрон может взаимодействовать с ядрами, расстояние до которых меньше 10“12 см. При этом воз- можны (см. [29]) упругое рассеяние (изменение на- правления движения), деление ядра (в результате деле- ния ядро испускает несколько мгновенных нейтронов, которые можно использовать для поддержания цепной реакции, и запаздывающие нейтроны), неупругое рас- сеяние (потеря' нейтроном большей части энергии),* радиационный захват (образование новых изотопов) и захват нейтрона с испусканием заряженных частиц. Кроме того, происходит утечка нейтронов из реактора. * В предыдущем описании умышленно не упоминалось об испускании ^-квантов, протонов и а-частиц, кото-
104 ГЛ. 4. ВЕТВЯЩИЕСЯ ПРОЦЕССЫ рое сопровождает захват и неупругое рассеяние нейт- ронов, ибо в дальнейшем пас будет интересовать лишь количество нейтронов (мгновенных или запаздываю- щих) в реакторе. В связи с этим вместо слова «нейт- рон» иногда будет использоваться термин «частица». Гибелью или потерей нейтрона будем называть не- упругое рассеяние, выход из реактора, радиационный захват и захват нейтрона с испусканием заряженных частиц. 4.2. Математическая модель. Определенные ядра (такие, как 235U, 239Pu и др.) при облучении их^лейт- ронами могут делиться и при делении испускать нейт- роны. При этом среди общего числа нейтронов на акт деления некоторые являются мгновенными, а некото- рые — запаздывающими. Например, для 235U при деле- нии тепловыми нейтронами доля запаздывающих нейт- ронов v составляет 0,0065% (Кипин Дж. Р. Физи- ческие основы кинетики ядерных реакторов.— М.: Атомиздат, 1967; см. стр. 114). Величина v является суммой вкладов ядер-предшественников, число типов которых может достигать 6 и которые характеризуются разными временами «задержки» нейтронов. В даль- нейшем такие ядра-предшественники также будем на- зывать частицами. Кроме того, в рассматриваемую систему возможен приток нейтронов «извне» для за- пуска реактора или для поддержания уровня нейтро- нов в реакторе. Под нейтронами, приходящими из внешних источников, будем понимать нейтроны, ис- пускаемые ядрами изотопов, которые не принимают непосредственного участия в циклах деления.. При запуске реактора такими источниками могут^ напри- мер, служить изотопы бериллия или бора, бомбарди- руемые а-частицами или у-квантами. Такие частицы в теории ветвящихся процессов принято называть им- мигрантами. Рассмотрим теперь в качестве модели размножения частиц ветвящийся процесс с п + 1 типами частиц. Типы ..., Тп являются типами ядер-предшествен- ников, тип Тп — это нейтроны, а тип TQ — внешний источник, способ действия которого окисап ниже. Предположим, что мгновенный нейтрон (частица типа Тп), существующий в момент t, за время Д£->0 с вероятностью 1 —ХпД£ + о(Д£) (4.1)
§ 4. СИСТЕМЫ С НАКОПЛЕНИЕМ НЕЙТРОНОВ 105 не подвергается изменениям и с вероятностью ^nPn(t}M + o(\t) (4.2) превратится в совокупность частиц, задаваемую векто- ром со = (©!, со2, ..(On), где со, —число частиц типа Ti. Случай, когда сог=0 для любого Z, соответствует гибели частицы. Физическая природа рассматриваемо- го процесса накладывает ограничение соi + со2 + ... ... + (on-i С 1, что соответствует образованию не более одного ядра-предшественника запаздывающих нейтро- нов (вероятность образования более одного ядра-пред- шественника пренебрежимо мала [49]). Частица же типа Тк (& = 1, тг —1) за время Д£->0 с вероят- ностью 1-W + o(A« (4.3) не изменится и с вероятностью № + о(М) (4.4) произведет одну частицу типа Тп, Величину xk — 1 можно интерпретировать как среднее время жизни частицы типа Тк. Обозначим по аналогии с п. 3.2 А(5)=М^п-^) (й = 1, 2, ..., п-1), (4.5) /п (tx 8) = ( 2 Рп (0 8“ — Sn'j, S“ = Si1 . . . Sn”- (4.6) \ co / Ясно, что должно выполняться соотношение fn(t, 1)=0. (4.7) Отметим, что для описания работы реального реак- тора рассматриваемая математическая модель должна быть значительно усложнена (нужно учитывать рас- пределение нейтронов по энергиям, положение в зо- нах реактора, регулировку реактора и т. д.). Для на- глядности можно считать, что введенная математиче- ская модель описывает процесс размножения нейтро- нов в среде, поглощающая способность которой зави- сит от времени, а формула (4.2) определяет вероят- ности наборов эффективных частиц, т. е. частиц/ участвующих в дальнейшей реакции (без учета поглотившихся частиц). Важными характеристиками процесса деления яв- ляются эффективное среднее число kp(t) мгновенных нейтронов и эффективное среднее число k(t) мгновен-
106 ГЛ. 4. ВЕТВЯЩИЕСЯ ПРОЦЕССЫ ных и запаздывающих нейтронов, «образующихся» при гибели одного нейтрона. Величина k(t) называется ко- эффициентом эффективного размножения нейтронов, а величина &?(£) —1 — мгновенным избыточным раз- множением. Нетрудно понять, что M0 = S®>X(0i 1(4.8) СО *(0 = 2|«>|Рп(0г l(4-9) <0 где I со I = ой + ю2+... + Юп. Положим Fk (т. h s) = м [г<‘> | и (т) = sA] = 2 р {у (0 = со = ©||л(т) = 6ft}s“. Из (4.1)—(4.7) вытекает (см., например, [34], стр. 120), что функция F*(t, i; s) удовлетворяет уравнению в частных производных 1=И 1 п - (4.10) с начальным условием ГЛ(т, т; s) = sh, а весь набор функций Fk(t, t; s) (Л = 1, 2, ..., п) удовлетворяет системе дифференциальных уравнений — = - h (т; F (т, Ц $)) (к = 1, 2,..п) (4.11) с начальными условиями Fk(t, t\ s) = sk (к = 1, 2, ... ..., ri). Здесь Мт, t\ $) = (Л(т, t\ s)i F2(t, t; s), ... ., Fn(x, t\ s)). Соотношения (4.10) и (4.11) позволяют выписывать системы обыкновенных дифференциальных уравнений ДЛИ -4^1 м [Hi (01 Пл (т) = 6А] и М [Hi (0 (Hi (0 — 6{j) IИ (т) = 6ft], аналогично тому, как это делалось в п. 3.2. Ясно, что решить эту систему в общем случае не удается. Одна- ко некоторые выводы о характере происходящих яв- лений сделать все-таки можно. Дело в том, что сред- нее время существования мгновенного нейтрона обыч- но гораздо меньше задержки во времени испускания
§ 4. СИСТЕМЫ С НАКОПЛЕНИЕМ НЕЙТРОНОВ 107 запаздывающего нейтрона. Так, например, в реакторе на быстрых нейтронах время жизни мгновенных нейт- ронов ~10-8 с, а в тепловом реакторе ^10"’ с, в то время как среднее время задержки запаздывающего нейтрона —0,2 с. Поэтому возможны две качественно разные ситуации. Если, например, kp{t} > const > 1 для любого £>0 (это означает увеличение в среднем - числа мгновенных нейтронов при потере системой нейтрона), то число мгновенных нейтронов- экспонен- циальным образом возрастает за малое время, и эф- фектом запаздывающих нейтронов можно пренебречь. С другой стороны, если kp{f) < 1, a k{t) > 1 для лю- бого £>0, то как число мгновенных нейтронов, так и число ядер-предшественников жсо временем будут возрастать экспоненциально; однако время, через ко- торое этот эффект окажет заметное влияние на харак- тер происходящего процесса, в несколько раз больше времени жизни ядер-предшественников, в связи с чем для качественного описания процесса достаточно огра- ничиться изучением ядер-предшественников в момент t. Прежде чем переходить к описанию размножения нейтронов в реакторе в общей ситуации, рассмотрим следующий пример. Пример £ Пусть лг = 2, что соответствует одному типу ядер-предшественников, вероятности pf (С не за- висят от t, функции fSsi, s2) и f2(sh s2) имеют вид /1(^1, S2) = Х1($2 S1), /г= (? + г$14 — S2) (г + q = i,r, 0). Будем считать, что в момент t = 0 в системе нахо- дился лишь один мгновенный нейтрон. Переход к слу- чаю с несколькими нейтронами и несколькими ядрами- предшественниками может быть осуществлен при по- мощи метода, изложенного в § 3. Составим для нашего примера систему (3.9). Имеем == —#12 == Х1, #21 == ^*2^» #22 == Аг2(2г 1). Отсюда —— = — ^11 (0 М + ^12 (0 ^М’ = ля(()М + ли(1)Ч(2г-1),
108 ГЛ. 4. ВЕТВЯЩИЕСЯ ПРОЦЕССЫ причем Лц(0) — 1, Л12(0)=0. Решим эту систему ли- нейных дифференциальных уравнений. Ее характери- стическое уравнение имеет вид х2 + (2ц + (1 - 2г)к2)х + Ш1 - Зг) = 0, а его решения Xi и х2 можно записать так: яг2 = (—М — Х2(1 — 2г) — Д)/2, где А = ]/"(! — 2г)2 - 2АА (1 - 4r) + 1?. Из равенств £1^2 = XiMl — Зг), Xi + х2 = — Xi — (1 — 2г)Х2 и неравенства Xi > х2 следует равносильность неравен- ства Xi < 0 неравенству Зг<1 (я?! < 0 <=> Зг < 1), а так- же следуют два других соотношения: v = 0 Зг = 1, #! > 0 Зг > 1. Заметим, что из определения функции f2(s$, s2) выте- кает (см. (4.8) и (4.9)), что для рассматриваемого при- мера коэффициент эффективного размножения k(t) = = к = 3г, а мгновенное избыточное размножение kp(t) _ 1 = кр — 1 = 2г — 1. Решение рассматриваемой системы имеет вид . А,и= £л!_\ В силу определения Л имеем Д2 > (%i — (1 — 2г)Х2)2. Отсюда Ч + *2 ДНЧ-С1-2^)^ п —• х1 2Д И (Х1 + *2) (Х1 + Z1) о V(X2-X1) Поведение величин АИ(О и Л12(О при t>Q су- щественно зависит от знака хх. Рассмотрим асе воз- можности.
§ 4. СИСТЕМЫ С НАКОПЛЕНИЕМ НЕЙТРОНОВ' 109 1°. < 0 (или, что одно и то же, & = 3г<1). В этом случае lim Ап (t) = lim Л12 (Z) = 0. t-»oo t->oo Такой процесс в теории ветвящихся процессов назы- вается докритическим (см. [34], стр. 151). В реальных реакторах эта ситуация теоретически возможна лишь при запуске. Однако при добавлении топлива или удалении поглотителя коэффициент к эффективного размножения нейтронов будет возрастать и вскоре пре- высит 1. Поэтому допущение г < 1/3 даже качествен- но не будет соответствовать действительности. 2°. Xi = 0 (или & = 3г=1). В этом случае л / за. за. х j Л12 = л2 + + х2 + 3A.J 6 2 • Заметим, что Ли(^)+Л12(0 = 1 и, кроме того, X ЗА lim Ап (0 = j—Ига Л12 (t) = 1 . t-»oo л2 +* t->oo л2 ‘ Такой процесс в теории ветвящихся процессов назы- вается критическим (см. [34], стр. 151). 3°. Xi > 0 (&==3г>1). Наиболее интересные выво- ды можно получить при г > 1/3, что соответствует надкритическому ветвящемуся процессу. Поскольку в этом случае на один потерянный нейтрон прихо- дится в бреднем больше одной новой частицы, то про- исходит экспоненциальный рост числа нейтронов. В связи с этим интересно выяснить, как быстро про- исходит накопление нейтронов и какими факторами это накопление обусловлено. До сих пор мы еще нигде не воспользовались тем фактом, что Аг ^rf1, А2 = где Ti и т2 — соответственно среднее время до испус- кания запаздывающего нейтрона ядром-предшествен- ником и среднее время жизни мгновенного нейтрона. Как уже отмечалось, ь > т2. Обозначим 0 = т2п1 — = Тогда h - Ш(2г ~ I)2 + 2(4г- 1)9 + 92 ~ (I - 2г) - 9]/2.
110 гл. 4. ВЕТВЯЩИЕСЯ ПРОЦЕССЫ 1 Заметим теперь, что (4г —1)0^-^-0 при г >1/3 и 0 > 02. Поэтому главный член подкоренного выражения определяется соотношением между 0 и (2г—I)2. Огра- ничимся лишь случаем (2r — I)2 > 0. Тогда ~4%2[|2г- 1| (1 + 0) - (1-2г)-в]. Если теперь, г > 1/2, или, что одно и то же, кр — 1 == = 2г.—1>0, то —W2r—1) и, следовательно, сред- нее число мгновенных нейтронов Ац(Л) заметно воз- растает за время £<СТ1. Поэтому вклад запаздываю- щих ней-тронов можно не учитывать/ Эта ситуация соответствует «мгновенно-надкритическому» < реактору ([29], стр. 151). Пусть теперь 1/3 < г < 1/2. В этом случае к = = Зг > 1, а кр — 1 = 2г — 1 < 0. Имеем „ 1 [4г 1д л1_____а ,3г 1 U — 2г J *“ Л11 — 2г’ Следовательно, рост чцсла нейтронов (в среднем) будет заметен лишь через время, сравнимое по порядку с Tt. В этом случае запаздывающие пейтроны окажут су- щественное влияние на характер происходящего про- цесса. Разобранная ситуация соответствует надкрити- ческому реактору, который не является мгновенно- надкритическим. Уже на этом простом примере видно, что полный анализ системы (3.9) является нелегкой задачей. По- этому в дальнейшем мы ограничимся лишь рассмот- рением надкритических ветвящихся процессов. 4.3. «Мгновеннд-надкритический» процесс размно-. жения нейтронов. Как уже отмечалось, при kpU) > 1 запаздывающие пейтроны можно не учитывать. Для того чтобы получить уравнение, которому удов- летворяет производящая функция * 3" п (т, х) == = М 1 ц (т) = 8П] такого процесса, положим Хл = = 0 №=1, 2, ..., n—1). Это означает, что = = Хь1 =* оо, т. е. время до момента испускания запаз- дывающего нейтрона ядром-предшественником типа Тк
$ 4, СИСТЕМЫ С НАКОПЛЕНИЕМ НЕЙТРОНОВ 111 бесконечно. Отсюда и из (4.11) и (4.5) следует Fk(t, t; s') =sk (A: ¥= n). (4.12) Полагая теперь в (4.11-) k — n, получаем dF„ (т, i; s) aT — Sl, $2» • • •! Sn-1) ^п(т, $)), (4.13) и для того, чтобы получить уравнение для 5гп(т, t\ х), достаточно в (4.13) положить Si == s2 =... = sn-i = 1, sn = x и ф(т, х) =/п(т; 1, 1, ..., 1, х). Тогда (т, V, х) , , di = — Ф (т, $~п (т? t\ х)). (444) k п (^i х) = X, Обозначив А (т, 0 = М [Ия (01 (т) = 1], а (т) = | и дифференцируя (4.14) по х в точке я = 1, находим ^^ = -а(т)Л(тл0,. Л(^0 = 1. Решая это уравнение, получаем Л (т21) = exp j а (и) du . (4Л5) Если kp(t) > const > 1, то ввиду равенства kp(tj =» = 1 + а(0 (см, (4.8)) среднее число мгновенных ней- тронов растет со временем экспоненциально. Диффе- ренцируя (4.14) два раза в точке х = 1 и полагая ₽ (т) = В (т, t) = М [Ия (0 (Ия (0-11 Нп (т)=1] ох приходим к уравнению = - р (т) А* (Т, 0 - а (т) В (Т11)> решение которого с учетом (4.15) дается формулой В (tt 0 = ехр (4.16)
112 ГЛ, 4. ВЕТВЯЩИЕСЯ ПРОЦЕССЫ Из (4.15) и (4.16) можно найти D [pn(^) I Цп(т) =1], пользуясь равенством D [Нп (О I Цп (т) = 1] = Я'(т, t) +А (т, 0 - А2 (т, t). 4.4. Характер размножения нейтронов в случае kt(t)< 1, fc(t)>l. Если kp(t) < 1, a k(t) > 1Г то, как уже отмечалось в начале параграфа, пренебрегать эф- фектом запаздывающих нейтронов нельзя. Появление в такой системе нейтрона приведет к цепочке некото- рого числа делений. Если проследить за размножением лишь мгновенных нейтронов (без учета размножения запаздывающих), то в силу условия kp(t) < 1 эта це- почка делений быстро оборвется. Останется лишь не- сколько ядер-предшественников, каждое из которых через определенное время испустит один запаздываю- щий нейтрон. Предположим, что /№)> const >1. То- гда сумма чисел мгновенных нейтронов и ядер-пред- шественников со временем будет экспоненциально воз- растать, и для понимания характера происходящего процесса можно ограничиться изучением ядер-пред- шественников. Поскольку время жизни нейтронов ма- ло по сравнению с промежутком времени от момента деления до испускания запаздывающего нейтрона ядром-предшественником, можно предполагать, что но- вые ядра-предшественники возникают сразу же после испускания нейтрона, и следить лишь за их развитием во времени. Но для этого сначала необходимо выяс- нить распределение числа ядер-предшественников, по- явившихся благодаря одному нейтрону. В терминах частиц задача формулируется так: найти распределе- ние вектора v = (vt, ..., vn-t) числа частиц типов Л, Т2, ..., Tn-i в процессе, начавшемся с одной части- цы типа Тп, которые образовались в результате цепоч- ки превращений Тп -> Тп Тп Ti (i = 1, 2, ... ..., п~ 1). Последнее фактически означает, что части- цы типов Л, Тг, ..Тп-1 в дальнейшем не изменяют- ся. Такие частицы в теории ветвящихся процессов на- зываются финальными (см. [34], стр. 133). Для нахож- дения распределения v снова воспользуемся равенст- вами (4.12) и (4.13), так как именно эти уравнения описывают процесс размножения частиц в интересую- щем нас случае: условие Xfe = 0 (А#=п) соответствует «замораживанию» частиц типов Л, Т2, ..Тп_х. Огра- ничимся «разбором стационарного случая, т. я. случая,
§ 4. СИСТЕМЫ С НАКОПЛЕНИЕМ НЕЙТРОНОВ 113 когда в (4.1) и (4.2) величины Pn(t) = Pn не зависят от времени. В этом случае Fn(r, t*, s) зависит лишь от разности t — т. Обозначим /п(т, s) = fn(s), Gn(t — т, s') = Fn(r, t; s19 ..., sn_l9 1). Из (4.13) после соответствующей замены переменных находим dGn(t,s') , — in ($1, • • • 9 sn-l, Gn (^9 s ))» 17) Gn(09s') = i. Известно (см., например, [34], стр. 164—166), что су- ществует lim Gn (£, s') = G ($'), причем при каждом s' n-*oo функция G (s') = 2 P (co') («')“' = M (s')v удовлетворяет уравнению fn(s', G(/))=0. (4.18) Последнее соотношение можно получить и из (4.17), положив в нем формально G(s') вместо Gn(J, s'). Ра- венство (4.21) позволяет находить среднее суммарное число ядер-предшественников по всем типам, порожда- емых цепочкой мгновенных нейтронов, а также дис- персию этой суммы. Действительно, пусть согласован- но с (4.7) dsn — кр 1 Обозначим, далее, •= а. ds. , г -- ^«9 n—1 == i=l d2fn (x9 x, . Ox2* d2/n (* • dxdsn = h. Величина сц есть среднее число частиц типа 7\, обра- зующихся при делении. Из уравнения (4.18), полагая 8 В. А. Ватутин и др.
114 ГЛ. 4, ВЕТВЯЩИЕСЯ ПРОЦЕССЫ $i — s2 =..= sn-i = х, находим £4 de _£/n dG dx "г Ox (4.19) Отсюда (напомним, что Ivl = v, + v2 +... + vn-i). M1 I _ dGQr,*, ...,г) I _ _ /£4 I _ « lvl l v 1 dx 1^ дх I OG |x=1 ! _ kp- (4.20) Дифференцируя (4.19) еще раз, находим d2G = Г^/n/dGV ^2/ndG >2/nlp/n dx2 <?G2 \ dx J + dGdx dx + 5x2 JI dG ' что при x — 1 дает M (| v|(| v| —1)) = = — 1 ^bn _L d 4- 2ah dx2, x=i 1 . (1 — &p) 2 1 (4.21) Из (4.20) и (4.21) стандартным способом можцо найти D|v|. ' Обратимся снова к примеру 1, рассматривавшемуся в п. 4.2. Если 1/3 < г < 1/2, то kp = 2r<i, а Л = 3г> > 1, и, следовательно, для указанного диапазона зна- чений г предыдущие выкладки останутся в силе. Ре- шая уравнение /2(s1? G(SlY)=0, ^2(^ + rs1G2(s1)-G(s1))=0, находим G(51) 1 - V 2г$х (4.22) Пользуясь разложением получаем irVnnl
§ 4. СИСТЕМЫ С НАКОПЛЕНИЕМ НЕЙТРОНОВ 115 Отсюда, в частности, следует, что P{v>7V-l} = _ у Г (п - 1/2) -п__________1 (4г?У ~£N trVnnl к q) 4r(l-4rg)V« N™ 1 поскольку по формуле Стирлинга ГСг) = 112ях я*-1 е~*(1 + о(1)), х -> и, следовательно, г|—‘/2W— 4гТ/лтг! 4г V лп3/2 Из (4.22) непосредственным дифференцированием мож- но найти Mv и Dv. Вернемся теперь к задаче определения числа ядер- предшественников в момент времени t (напомним, что мы пренебрегаем временем жизни мгновенных нейтро- нов и следим лишь за изменениями в числя ядер-пред- шественников). Фактически нужно рассмотреть новый ветвящийся процесс с п — 1 типами частиц, в котором частица типа Т\ за время А£ 0 с вероятностью 1 —ХгД£ + о(Д£) не подвергнется изменениям и с веро- ятностью XjP (со') \t + о (Д£) даст со' = ((щ, ..., (on-i) потомков. Если обозначить Gi (t, s’) = М [(Sy'(,) | И' (0) = 6j, (4.23) где p/U) = (giU), ..., Цп-iU)), ii положить gi(s') = UG(s') - sj, то из приведенных выше предположений'так же, как это делалось в п. 3.2, выводим, что набор функций (4.23) удовлетворяет системе уравнений dG. (t, s') ldt =g. (*, /), • • • - Gn-i (t, s’)) (i = 1, ..., n-1) (4.24) с начальными условиями Gt(0, s') = sh а каждая из этих функций удовлетворяет уравнению в *Частных производных dG. (£, s') жг/ dG. (t, s') <4-25) Z==l 1 с начальными условиями (MO, s') = Sp * • - 8е
116 гл. 4. ВЕТВЯЩИЕСЯ ПРОЦЕССЫ Соотношения (4.24) и (4.25) могут служить осно- вой для дальнейшего анализа. Из них, например, мож- но получить системы дифференциальных уравнений, аналогичные (3.9) и (3.10), для среднего и дисперсии числа ядер типа в момент 7, а также для линейных функционалов от этих величин. 4.5. Приток нейтронов из внешних источников. Как уже отмечалось в п. 4.2, кроме увеличения числа час- тиц в системе за счет деления, возможен приток ней- тронов из внешних источников. На языке ветвящихся процессов такая ситуация может быть описана при помощи введения одного фиктивного типа частиц То или нескольких типов, если это необходимо, в процесс, описанный в п. 4.4. Частица типа То за время At 0 с вероятностью 1 — g0(f)At + o(Af) не подвергнется из- менениям и с вероятностью gk(t)At + o(At) произведет к частиц типа Тп и одну частицу типа То. Такой про- цесс называется ветвящимся процессом с иммиграцией ([34], стр. 217). Положим оо g(t,sn) = — g0(f) + S gk(t)Sn, g(t, l) = 0, fe=l /о (*, s) = sog (t, Sn), Fo (T, t- s") = M [(5'Г''(0 I p (t)- = 60], где s" — (s0, si4 ..., sn), p"Q) = (p0U), pi(£), ..., pnU)). Тогда так же, как и в (4.11), получаем, что набор функций Fh(x, t; s") (& = 0, 1, ..., тг) удовлетворяет системе дифференциальных уравнений dFh (т, t\ s") дх--=-Мг, "F(r,t;s")), Ffe(T,r;S")=Sft, (4.26) где "F(t, t; s") = (F0(t, t; s"), F/т, t; s"), ... ..., Fn(.r, t; $")). Поскольку функции /*(т, •) (&>1) не зависят от переменной з0, то новым по сравнению с (4.11) является лишь уравнение = — Fo (т, £; s") g (т, Fn (т,. t; s)). (4.27) Заметим теперь, что F9 (т, t; s") = s0M | р" (т) = 6В] = = s0^ (т,
§ 5. ВЕТВЯЩИЕСЯ ПРОЦЕССЫ С ДИФФУЗИЕЙ 117 Используя это равенство в (4.27), находим (Т, s) g (т, Fn (т,«;я)), (4 28) . (т,т;$) = 1. Отсюда ST (т, t\s) = exp j g(r, Fn(r, (4.29) ' Из уравнения (4.29) можпо находить различные ха- рактеристики процесса р," G), зная соответствующие характеристики процесса |1U). Так, например, t М [щ (01 и" '(0) М = J g' (Т, 1) М [Hi (u) I н (т) = 6n] du. т Более подробно эти вопросы рассмотрены в [34] и [49]. § 5. Ветвящиеся процессы с диффузией 5.1. Описание модели. До сих пор при исследова- нии свойств Нейтронных потоков мы ограничивались изучением изменения числа нейтронов во времени, пренебрегая тем фактом, что размножение нейтронов происходит в пространстве. Если для каскадов косми- ческих лучей такое предположение не искажает об- щей физической картины, то для расчета процессов, происходящих в ограниченных областях, вид этих об- ластей имеет существенное значение. Так, в случае реактора, имеющего определенную форму активной зоны (шар, цилиндр и т. д.), число нейтронов внутри зоны в момент t будет зависеть от ее размеров. В этой ситуации может оказаться полезной модель ветвящих- ся процессов с диффузией (см. [34], гл. X), которая является естественным обобщением модели марковско- го ветвящегося процесса с несколькими типами частиц, использовавшейся в § 3 для изучения превращений нуклидов. В модели ветвящихся процессов с диффу- зией учитывается положение частиц в пространстве. Предполагается также, что частицы при попадании на границу рбласти поглощаются. Перейдем к точной ве- роятностной постановке задачи. Пусть в односвязной области G трехмерного про- странства с достаточно гладкой границей dG происхО’
118 ГЛ. 4. ВЕТВЯЩИЕСЯ ПРОЦЕССЫ дит случайное блуждание и размножение частиц типов Т2, ..., Тп. Опишем сначала процесс блуждания. Предположим, что Р1 (t; х, Л), х = (хх, х2, а?3), есть вероятность того, что частица типа находящаяся в момент 0 в точке х, будет находиться в области А G в момент t. Обозначим р*(Л; х, у), y = (yi, у^ уз\ плот- ность вероятности Р{ («;х, 4): Р1 (f; х, 4) = J / (f; х, у) dy. А Будем предполагать, что функция р{(Л\ х, у) удовлет- воряет уравнению др{ (t; х, у) = д2р* (*; х, у) д2р* (t; хч у) — I дх? дх* \ X А . + 7= (*; У), D1 > 0, (54) 5^3 у с начальными и граничным условиями ./(0; х, у) = 8(у — х), p\t\ х, y)L->3G = 0. (5.2) Детальное физическое обоснование формулы (5.1) вы- ходит за рамки этой книги. Отметим лишь, что спе- циалисты по теории вероятностей называют эту фор- мулу прямым уравнением Колмогорова, а физики — уравнением Фоккера — Планка. Если обозначить x{t) положение частицы типа Т{ в момент t, то, говоря не- строго, формула (5.1) описывает процесс, в котором x(t + At) — x(t) — D^ivtt + At) — ш(О), At -> 0, где w(t) = (wSt), w2(t), w3(t)) — процесс броуновского движения в трехмерном пространстве 7?3. Для такого процесса Mirj (t) = 0, a D (z, w (t)) = ct (z, z) для лю- бого вектора z^R3. Заметим также, чкго последнее ус- ловие в (5.2) соответствует «уменьшению» интенсивно- сти размножения частиц вблизи границы и поглоще- нию на самой границе. Обозначим время блуждания частицы типа Ti из точки х до поглощения па границе через тХ{. Из первоначального процесса "блуждания получим новый процесс, сокращая время жизни частиц. Для это- го предположим, что за время At 0 частица типа Т{ с вероятностью 1 — KiAt + o(At) не подвергается нзме-
$ 5. ВЕТВЯЩИЕСЯ ПРОЦЕССЫ С ДИФФУЗИЕЙ Ц9 нениям и с вероятностью hi&t + o(At) независимо , от положения внутри области G, происхождения и возра- ста превращается в совокупность других частиц. Коли- чество этих частиц, а также распределение по типам задаются равенством (3.2). Время жизни xxi частицы типа Ti, начинающей блуждание из точки х е G, бу- дет, таким образом, равно тх$ = ппп(тх<, тД где слу- чайные величины т< и тх< независимы, причем плот- ность распределения т» равна *** (t 0). Обозначим К*(х, А) вероятность того, что превра- щение частицы типа 2\, находившейся в точке х в мо- мент своего рождения, произойдет в области А. Тогда со К{ (х14) = J р1 (t; xi 4) Xje %i*dt. о Отсюда получаем формулу для вычисления вероятно- сти ditx) того, что частица типа находившаяся в на- чале своей жизни в точке х е G, поглотится на, грани- це, не успев превратиться в другие частицы: di.(x) = l-K1(x1G) = l p* (t; х, у) dy ] Zje ^dt. 5.2. Производящие функции. Обозначим Р® t) вероятность того, что частица типа Т{, находившаяся в момент 0 в точке х е G, к моменту времени t превра- тится в совокупность частиц, характеризуемую векто- ром ш. Пусть, далее, Fi (*, М = 2 Р* № (i » 1,2г...х п\ <0 Pte, t\ s) = (Fi(x, t; s), ..., Fn(x, t; $)). Выведем, используя обозначения § 3, интегральное уравнение для функции Fi(x, t\ s). Для этого рассмот- рим подробнее эволюцию первоначальной частицы ти- па Т{. За промежуток времени [О, Й могут осущест- виться следующие 3 возможности. С плотностью ве- роятности р' (£ — щ х, у) (0 < и < t) ча- стица испытает превращение в момент t — и в точке у е G и произведет потомков в соответствии с произво- дящей функцией М5) = 2Р?Л где вероятности со
120 ГЛ. 4. ВЕТВЯЩИЕСЯ ПРОЦЕССЫ те же, что и в (3.2). Эволюция каждого из этих потомков типа Т5 к моменту t задается производящей функцией F^y, и; s). С вероятностью е =е § рг y)dy G первоначальная частица за промежуток времени [0, t] не подвергнется изменениям и не поглотится на гра- нице 3G. И, наконец, с вероятностью t 1 — ё [р1 (t\х, у) dy — §duJр' (t — щ х, у) dy G О G частица за время [0, t] поглотится на границе 3G. Учи- тывая эти случаи, находим Fi (х, t;s) — t t = J du j рг (t — u; x, у) (F (у, щ $)) dy + о о + s{e X,f [ p' (t-, x, y)dy + 1 — e j px (t; x, y) dy — G G t — J du [ рг (t — щ x, y) dy. (5.3) 0 G Получим из уравнения (5.3) уравнение в частных про- изводных для функции F^x, t; s). Для этого продиффе- ренцируем обе части равенства (5.3) по t, учитывая (5.2). Тогда dFi (х, t\ s) dt = = J du J hl (F^y, щ s)) dy + 0 G + j dy _ e-^ J aPi(t'd-^. dy _ G G t - J du J dpi (t~“' x'y} dy - 0 G — X} (F{ (x, t; s) - 1) + Xi.hi (F (^, t; s)) - X{.
§ 5. ВЕТВЯЩИЕСЯ ПРОЦЕССЫ С ДИФФУЗИЕЙ 121 Отсюда, обращаясь к (5.1) и используя равенство fits) — Xi(hits) — Si), выводим dF. /т t' —г-{д’ ’ = ИгЫ\ (х, /; s) + A (F (х, t; «))• (5.4) Начальные и граничные условия для этого уравнения выглядят так: Ftx^O; s) = s, Ftx, s)|x_f0G = l. (5.5) Последнее соотношение в (5.5) отражает тот факт, что на границе dG частицы поглощаются без размножения. 5.3. Математическое ожидание и дисперсия числа частиц в области. Весьма важными характеристиками процесса размножения нейтронов в реакторе (в рам- ках рассматриваемой вероятностной модели) являются математическое ожидание и дисперсия их числа. Обо- значим dF. (х, t\ s) = —--------------- (5-6) °Sj 8=1 математическое ожидание числа частиц типа Tj в мо- мент t в области G, если в момент 0 в области была лишь одна частица типа Т,, находившаяся в точке G. Ясно, что если в момент t = 0 в процессе было частиц типа Th (к == 1, 2, ..., п), то общее число частиц типа Tj в процессе в момент t будет вычислять- ся по формуле М1Д t) + (о2А/я, t) + ... + a)nAjn(x, t). Вернемся теперь к 'величине Ац(х, t). Дифференци- руя (5.4) по Sj в точке s = 1, находим, что эти величи- ны удовлетворяют системе дифференциальных уравне- ний в частных производных дА ( t) Ац (х, 0 + 2 0> (5.7) ft=i где Ю ч
122 гл. 4. ВЕТВЯЩИЕСЯ ПРОЦЕССЫ Ввиду (5.5) и (5.6) начальные и граничные условия для системы (5.7) имеют вид 24у(х, 0) == S/J, A{j(X9 t) lx->9G == 0 (^, J == . . ., 7i)j (5.8) где бу — символ Кроиекера. Решение краевой задачи (5.7)—(5.9) можно найти, пользуясь, например,’методом Фурье. Если в процессе участвует несколько типов частиц, этот метод приво- дит к громоздким выкладкам, поэтому мы ограничимся лишь случаем п = 1. Вводя обозначения Ап(х, t) =А(х, t), D'^D, ам = а, перепишем (5.7)—(5.8) следующим образом: dA{dt ° = D А А + аА (5.9) А(х, 0) =.1, А(х, ^)1х->ао = 0. (5.10) Как всегда, применение метода Фурье начинается с решения некоторой вспомогательной задачи. Пусть {<Рт (я)}т=1 — нормированные ортогональные собствен- ные функции, а 0 < Vi < v2 v3 < ... — собственные значения спектральной задачи Дф(я) + vcpCr) = 0, cpU)lx->9G = 0. (5.11) Известно, что если решение этой задачи существует (а это мы всегда будем предполагать), то ф/я) > 0 при х е G. Следуя схеме метода Фурье, ищем решение системы (5.9) в виде Л (ж, t) == 2 Pm (0 <Pm (х). (5.12) 771=1 Подставляя. (5.12) в (5.9) и приравнивая коэффициен- ты при срт(х) в левой и правой частях получившегося равенства, выводим, что функции удовлетворяют системе обыкновенных дифференциальных уравнений = - Z)vmpm (0 + арто (0 (т = 1, 2, ...). (5.13) Начальные условия для этих уравнений находятся из первого равенства в (5.10): 0О • (* *^1 0) 1=3 S Pm (0) фщ (%) — if
$ 5, ВЕТВЯЩИЕСЯ ПРОЦЕССЫ С ДИФФУЗИЕЙ 123 что в • силу ортонормированности функций фт(х) дает Pm (0) = J фт (у) dy. (5.14) о Решая (5.13) с учетом начальных условий (5.14) и подставляя это решение в (5.12), получаем 0 = 2 e(a-'Dv’n)<<pm (х) J ym(y)dy. (5.15) 771=1 G Поскольку ф1(я)>0 при x^G, то из (5.15) вытекает, что при a>Z)vi среднее число нейтронов в области G будет со временем экспоненциально расти. Если же a<Dvi, то Л (rr, t) -*• 0 при £->«>, В соответствии с этим процесс, в котором a>Z)vi, называется надкрити- ческим, а процесс, в котором a<Z>Vi,—докритическим. Случай a = Dvt называется критическим. В критиче- ском процессе среднее число частиц со временем оста- ется ограниченным. Обозначим ц(х, 0 число нейтронов в области G в момент t, если в момент 0 в области имелся лишь один нейтрон, находившийся в точке х, a q(x) обозначим вероятность того, что цСг, £) = 0 при некотором £<°°. Из общей теории диффузионных ветвящихся процессов следует (см., папример, [34], стр. 373), что для докри- тических и критических процессов с одним типом ча- стрщ g(x) = 1 при любом х е G, а в надкритических g(x) < 1 при любом х е G. Таким образом, как докри- тический,'так и критический процессы являются вы- рождающимися. Заметим теперь, что величины а и D являются характеристиками вещества и не могут быть изменены. Однако первое собственное значение Vi спектральной задачи (5.11) существенно зависит от вида области G. Изменяя размеры и форму области G, можно для каждого конкретного вещества выбрать их так, чтобы происходящий в этой области процесс был докритическим. Это позволит избежать экспоненциаль- ного накопления нейтронов в реакторе и, следователь- но (в рамках нашей вероятностной модели!), обеспе- чить его безопасное функционирование. В связи с этим можно говорить о критическом размере области той или иной формы: если размер области меньше крити- ческого, то процесс вырождается; если больше крити- ческого, то происходит экспоненциальный рост числа
124 ГЛ. 4. ВЕТВЯЩИЕСЯ ПРОЦЕССЫ частиц. Так, например, если область G — куб со сто- роной Z, то для задачи (5.11) Vi = Зл2/г2 и, следователь- но, /крИт = лУЗД/Уа. Если же область G — шар радиуса /?, TO—Vi = (л//?)2, что приводит к равенству Лкрит = = лУ£/Уа. Из (5.4) и (5.5) можно вывести уравнения для вто- рых моментов числа частиц различных типов. Так, если п = 1 и p(rr, t) — число частиц в области G в мо- мент Z, если при t = 0 существовала лишь одна части- ца, то величина В (х, t) = М р, (я, t) (р (ж, t) — 1) удов- летворяет уравнению = DM3 (х, t) + аВ (х, I) + &42 {х, t), (5.16) где & = /"(!), с начальными и граничными условиями В(х, 0)=0, В(х, Z)L_>0g = O. (5.17) Решая сначала задачу (5.9) — (5.10), а затем задачу (5.16) —(5.17), можно получить, используя формулу (1.5) на с. 133 в [43], явное выражение для Dp (ж, t). Применение ветвящихся процессов в ядерной физи- ке не ограничивается описанными выше моделями. За рамками книги остались такие вопросы, как расчет при помощи моделирования коэффициента к(t) размноже- ния нейтронов на одно поколение, определенного в (4.9), как ветвящиеся процессы с энергией и их применение к электронно-фотонным каскадам и некоторые другие. Эти вопросы достаточно подробно описаны в моногра- фиях [34], [41] и [12], причем, если в первых двух книгах упомянутые задачи рассматриваются с чисто теоретической точки зрения, то монография [12] мо- жет оказаться полезной при построении конкретных вычислительных программ.
ГЛАВА 5 ЗАДАЧИ ГРАДУИРОВКИ § 1. Основные математические модели Многочисленные способы измерения можно услов- но разделить на два основных типа: прямые и косвен- ные. При прямых измерениях измеряемая величина непосредственно сравнивается с соответствующей вели- чиной эталона. К таким измерениям можно отнести измерение длины линейкой, взвешивание на чашечных весах и т. п. При косвенных измерениях о величине измеряе- мого объекта судят по результату его вдздействия на измерительный прибор. Так, при взвешивании на пружинных весах вес определяется по растяжению пружины. В таких случаях по значению, получен- ному на шкале, прибора, требуется вычислить измеряе- мую величину. Результат вычислений для удобства отмёчают па соответствующем делении шкалы (напри- мер, вес, соответствующий данному растяжению пру- жины). Естественно потребовать, чтобы соответствие между значениями шкалы и значениями измеряемой величи- ны было взаимно однозначным. Рассмотрим для про- стоты случай, когда такое соответствие, устанавлива- ется многочленом е = е(х) = а0 + сцх + ... + агхг, (1.1) где е — измеряемая величина, а х — соответствующее ей значение шкалы. Градуировкой будем называть опре- деление коэффициентов а = (а0, . -, йг). В идеальной ситуации, когда все величины извест- ны точно, градуировку можно было бы провести сле- дующим образом. Градуируемым прибором измеряется р = г + 1 известных величин ..., ер, величины ... ..., ер должны быть различными. Пусть х^ ..., хр — соответствующие et, ..., ер значения шкалы прибора. Тогда, подставляя эти значения в (1.1), получим
126 ГЛ. 5. ЗАДАЧИ ГРАДУИРОВКИ систему уравнений - , «о + <Ч.хг + . . . + ОтА = ei (i = 1, р)- (1.2) Определитель этой системы при р = г + 1 отличен от О, и, следовательно, система (1.2) дает нам единствен- ное значение вектора а = (а0, «1, ..аг). Обычно величины UJ и {хд известны с ошибкой. В этом случае при р>г+1 система оказывается не- совместной. Если ошибки в определении величин {х} малы по сравнению с ошибками в определении вели- ( чин {ej или практически отсутствуют, то задача гра- дуировки является обычной регрессионной задачей. Рассмотрим более подробно этот случай, когда {rrj можно считать заданными точно. Пусть при каждом х^ (i«l, ..., 7?) есть несколько независимых измере- ний 6ij (/=1, ..., п») величины ei G = l, ..., р). При теоретических исследованиях мы будем рассматривать измерения как случайные величины. Обычно будем предполагать, что величины ец (j = 1, ..., I = 1, ..., р) ~ (1.3) независимы. Пусть, кроме того, М ец = eir De{;- = a2 (i = l,..., р; j = 1, ..., пД Задача заключается в том, чтобы по величинам вц найти оценки а = (а0, (ц, ..., аг) коэффициентов а = = (а0, а,1,- ..., Or), обладающие достаточно хорошими свойствами. Обычно мы будем требовать, чтобы Ма<=я< (i = 0, 1, ..г) (несмещенность оценки) и чтобы Оа|->0при ..., пр -> оо. Из этих условий следует, I что оценка (Ц является состоятельной (т. е. сходится , | по вероятности к истинному значению параметра). | По выборкам можно получить песме- 1 щепные и состоятельные оценки вг и а2: пг ' пг ~?i = 7- 2 еа> 2 (еа ~ е«)2* с1-4) г j=1 г Чаще всего выборки (1.3) неизвестны, а известны * лишь оценки 61, ё2, ..., ёр, (1.5) для которых г М = et = е (a?i) = У, ahx\, D ej = с4/п». (1.6) fc=o
§ 1. ОСНОВНЫЕ МАТЕМАТИЧЕСКИЕ МОДЕЛИ 127 Чтобы не усложнять вычисления, будем предполагать, 2 что о»е известна. Оценки (1.5) могут быть в некоторых задачах по- лучены по формулам, отличным от (1.4). Способ полу- чения оценок не будет иметь для нас значения, мы лишь предположим, что оценки (1.5) независимы и для них выполнены равенства (1.6). При построении оце- нок параметров а = ..., аг) по оценкам (1.5) можно пользоваться обычными формулами регрессион- ного анализа (см. [48]). Для измерений, проводимых в ядерной физике, бо- лее естественным является случай, когда не только по* и Xi известны с погрешностью. Например, при гра- дуировке спектрометров энергии е гамма-квантов изме- ряются по их,воздействию на прибор, причем резуль- тат воздействия х является случайным в силу процес- сов, происходящих в спектрометре. Пусть градуируе- мым спектрометром измеряются одинаковые энергии е\ гамма-квантов, излучаемых i-м образцом. Для энер- гии известна оценка ег-, полученная по результатам независимых экспериментов. Обозначим Хц, ..., х^ показания шкалы прибора, соответствующие заре- гистрированным гамма-квантам. Показаниями шкалы прибора могут быть, например, номера каналов спект- рометра. Тогда xis — помер капала, соответствующий s-му в порядке регистрации гамма-кванту. Вместо век- тора номеров каналов хгщ)в этом случае мож- но рассматривать вектор заполнений (kih ..., kiN\ где N — число каналов, ка— число отсчетов в Z-м канале; ка равно числу координат вектора(хц, . . ., ^п{), рав- ных Z; kia > О (s = 1, ..., TV), ки + ... + kiN =₽ Пусть некоторая оценка хг = х£хц, ..., xini) явля- ется несмещенной, Мзд = а величины Xi и связа- ны равенством (1.1). Таким образом, мы должны опре- делить коэффициенты а = (а0, ..., аг) в случае, когда е и х известны с ошибками. В качестве исходных дан- ных при решении этой задачи будем использовать не- зависимые случайные величины ei, ..., ер, Xi, ..., хр, (1.7) для которых Mei — =* Qe/n^ D"xi =s'(1*8)
128 ГЛ. 5. ЗАДАЧИ ГРАДУИРОВКИ И ei — е (х{) = а0 + агх{ + ... + агх\. Особенность рассматриваемых задач градуировки, являющихся частными случаями регрессионных задач, состоит в том, что одна и та же независимая перемен- ная может быть измерена несколько раз. Методы получения оценок для двух приведенных постановок задач п свойства этих оценок будут рас- сматриваться в следующих параграфах. § 2. Задачи градуировки с точно известными значениями шкалы 2.1. Некоррелированные выборки. Пусть оценки (1.5) некоррелированы. Тогда предположения (1.5) и (1.6) можно записать в виде = с (х$ (Lq -р xt -р . .. -р arXi -р (i = 1, .. ., р, г + 1), (2-1) где 6i — некоррелированные случайные величины с ‘ р М6| = 0, D6; = ПОЛОЖИМ (n), = i=l , = 1. Для получения оценок (ц коэффициентов (ц методом наименьших квадратов нужно минимизиро- вать величину р Q. (а0, , аг) = 2 ai <”) & ~ е <2,2) Систему уравнений дО р ~ -q^- = — — е(х^)хк1 =0 (*=0,1, ...,г), которой удовлетворяют оценки (Ц, можно записать в следующем виде: а.Хк + ... + arXk+r^ Ёк (/с = 0, 1, ..., г), (2.3) где _ р р Ek= Xai(n) Six}, Хк = ^aifnjXi. (2.4) i=l i=l
§ 2. ТОЧНО ИЗВЕСТНЫЕ ЗНАЧЕНИЯ ШКАЛЫ 129 Для исследования оценок а0, аь ..., аг полезно ра- венства. (2.1) и систему (2.3) записать в матричной форме. Положим *) еа Уарер)', 6а =(/а161, ..V ар 6Р)', (2 — (а0, <21, . • •, аг) , ~ (^ft/)» где xhi = xkL. Отметим, что координаты вектора ёа имеют одинаковые дисперсии, равные Oe/W- Введен- ные обозначецпя позволяют записать равенства (2.1) в виде еа — Хаа 4- ба» (2.5) Система уравнений (2.3) в матричной форме имеет следующий вид: Х«Х'«а = Ха7а. (2.6) Будем предполагать, что определитель | ХаХ'а | матрицы ХаХа отличен от 0, ХО xl .. • Хг Хг х2 : •• •• Лг+1 #=0. Хг *г+1 •• • *2г В этом случае система (2.6) имеет единственное ре- (2.7) шение а — (а0, ^i, . . ., аг) — (-Va-Va) Хаеа. (2»8) Из (2.5) вытекает, что Мга = Хаа. Это равенство вместе с (2.8) приводит к равенству Ma = (XaXa^XaX'ad = а, т. е. оценка а является несмещенной оценкой век- тора а. Используя формулу для вычисления ковариацион- ной матрицы Da вектора а, являющегося линейным преобразованием вектора еа (см., например, гл. VI, § 7, ♦) Здесь и в дальнейшем знаком ' будем обозначать трайс- понирование матрицы или вектора, рассматриваемого как пря- моугольная матрица. 9 В. А. Ватутин и др.
130 ГЛ, 5, ЗАДАЧИ ГРАДУИРОВКИ (7.3) [43]), и симметричность матриц ХаХ'а и (•Ха^а)-1, ПОЛУЧИМ 2 Da = (Х<Х)’\ (2-9) так как Deo = o«n-1Z, где I—единичная матрица. Из формулы (2.9) следует, что оценки а параметров а со- стоятельны при п-+°°> а<(п)a< (0<а<<°о). Более сильным утверждением об оценках а является теорема Гаусса — Маркова (см., например, [48], гл. 1, § 1.4). Приведем ее формулировку в следующем виде. Теорема .2.1. Если выполнены условия (2.1) и (2.7), то при любом заданном векторе с = (с0, ..., сгУ функция гр(а) = с'а имеет линейную относительно е^ ..., ер несмещенную оценку гр с наименьшей дис- персией и эта оценка является единственной в классе линейных несмещенных оценок. Оценка гр определяет- ся формулой гр = со^о + + ... + стаг. (2.10) В условии теоремы 2 ([48], стр. 25), переформулировкой ко- торой является теорема 2.1, требуется, чтобы функция гр (а) »=: '= с'а допускала оценку. По теореме 1 из [48] (стр. 24) множе- ство функций, допускающих оценку в рассматриваемом нами [ р /г случае, представимо в виде< 2 I S Vi I р ГДе — npOHS- li^ \fe=o ‘ / J вольные постоянные. Функция гр (а) == с'а с произвольным век- тором с входит в это множество, так как система уравнений Р M = G = 0,1, ...,Г) , г=1 имеет решение при любом с. Из теоремы 2.1 следует, что оценка ah в классе ли-» нейных относительно eh ..., еР оценок ah является оценкой с наименьшей дисперсией. Действительно, гр(а) = с'а = ak, если ch = 1, Ci = 0 (Z =/= к). . Отметим одно важное приложение теоремы 2.1. Если значению измеряемой величины eQ соответствует значение шкалы х0, т. е. = я0 + агх0 + .., + то оценку ?о величины eQ естественно находить по
§ 2. ТОЧНО ИЗВЕСТНЫЕ ЗНАЧЕНИЯ ШКАЛЫ 131 формуле ео = ао + «А + • •. + (2.11) Из теоремы 2.1 следует, что оценка (2.11) имеет наи- меньшую дисперсию среди линейных оценок. Если величины ё^ ..ёр имеют нормальное рас* пределение, то оценки а являются оценками макси* малъного правдоподобия и, следовательно, утвержде- ние теоремы 2.1 может быть распространено с класса линейных оценок на класс всех оценок. В прикладных задачах исходные оценки ..., часто оказываются при п -> ©о, аг(п)-> (г = 1, ..., р, 0 < а< < 1) асимптотически нормальными. В этом случае в силу линейности оценок ак и 'ф эти оцен- ки также являются асимптотически нормальными. 2.2. Коррелированные выборки. Пусть теперь е(Х}) + 6$ = aQ + агх^ + ... + arx\ + 6$ (f=i... .,p) <2Л2> и MSi - 0, cov (б{, 6j) = (2.13) Положим e * (ei, • •., ep) , 5 (6^, ..., 6p) , a (^Zq, a^ ..., a?) , В = (&Д X = (яД где x^ = x*. Будем предполагать, что определитель |5| матрицы В отличен от 0. Матрицу, обратную к матрице В, обозначим В* = Предположейия (2.12) и (2.13) в матричной форме имеют вид е = Х'а + 8 (2.14) п Мб = 0, D6 = В. В случае коррелированных выборок для нахожде- ния оценок а = (а0, ..., аг) параметров а естествен- но минимизировать выражение р ~ ~ <?(«)= 2 Ьм(ек — e(a:ft))(ez — (2.15) В случае нормально распределенных ёг оценки а, ми- 9*
132 ГЛ. 5. ЗАДАЧИ ГРАДУИРОВКИ нимизирующие (2.15), являются оценками максималь- ного правдоподобия. Дифференцируя (2.15) по av (z? = 0, 1, ..., г), по- лучим систему уравнений для оценок а: р = — 2 Ьм{хь&1 — еw) + ^iGk — ек(хк))] = О 9 h,l=l (v = 0, 1, ..., г), зли р 2 bkixk(ei — е(ж/)) = 0 (р = 0,1, ..г). '' А,1=1 Последнюю систему нетрудно преобразовать к виду г / р Д р ~ 2 «Я 2 = 2 (р = о, 1, ;=0 \k,l=l / k,l=l (2.16) или, в матричной форме, ХВ*Х'а = ХВ*ё. Отсюда, если \ХВ*Х'\ =/=0, находим а = (ХВ*Х'У-1ХВ*ё. ' (2.17) Для оценок а верна теорема, аналогичная теореме 2.1. Теорема 2.2. Если выполнены условия (2.12), <2.13), 151=7^0 и \ХВ*Х'\Ф 0, то при любом векторе с = (с0, Ci, ..., Cr)' функция гр(а)=с'а имеет линейную относительно е^ ..., ер несмещенную оценку гр с наи- меньшей дисперсией и эта оценка является единствен- ной в классе линейных несмещенных оценок. Оценка гр задается равенством гр = с'а, где а определено в (2.17). Доказательство. Пусть С — ортогональная матрица такая, что СВС' = Л, где Л — диагональная матрица. Коорди- наты вектора ед == Ьт^Се некоррелированы и имеют единич- ные дисперсии. Из уравнений (2.12) следует, чтоеЛ= + бд, где Хд = Л""1уГ2СХ', 6Л = Л—1/2С6. Вектор ед удовлетворяет условиям теоремы 2.1. Так как векторы е и ед связаны линейно, то существование и единственность оценки с наименьшей дис- нерсией доказаны. Осталось показать, что оценка с наименьшей дисперсией выражается через вектор а, определенный формулой (2.17). Оценка ад, построенная по вектору ед, согласно теореме
§ 2. ТОЧНО ИЗВЕСТНЫЕ ЗНАЧЕНИЯ ШКАЛЫ Ш 2.1, находится из уравненияХдХд а А = ХАе v Отсюда, так как хлх'л = (хС'А-1/2) (А-1/2СХ4) = ХВ*Х', Хлел = (XC"A-1/2)(A-12Ce) = ХВ*~е, получаем ХВ*Х'аА = ХВ*ё. Таким образом, аА совпадает с оценкой а, задаваемой формулой (2.17). Теорема доказана. 2.3. Линейная градуировка. Результаты, приведен- ные в и. 2.1, применим к линейному случаю. Система уравнений (2.3) при г = 1 имеет вид (LqXq 4“ а^Х^ = ctoXi “Ь ^1^2 = ^i, (2.181 где р р р Хо = 2 = 1» ^1=2 ^2=2 i=l i=l i=l ~ P _ P ~ ^0 — -^1 == i=l i=l Определитель этой системы Xn X. Д = Y° / 2 неотрицателен, так как по неравенству Коши — Буня- ковского Xi^X2. Условие Д^О равносильно в рас- сматриваемом случае неколлинеарноети векторов (1, 1, ..., 1) и х2, ..., хр). Таким образом, Д>0, если среди координат (^i? ..., хр) есть различные. Матрицы, входящие в формулы (2.8) и (2.9), име- ют следующий вид: Подставляя эти выражения в (2.8) и (2.9), получим а0 = 4(ад-ад), = -ад), (2.19) ‘S*2’ = й"’ cov^°’ = ~ (2.20)
134 ГЛ. 5. ЗАДАЧИ ГРАДУИРОВКИ Изменяя начало отсчета шкалы, т. е. переходя от переменных Xi к переменным х± = + с, можно поДо- р , брать с так, чтобы 2 0. Формулы (2.19) в слу- i=l р чае, когда выполнено условие Xj = 2 aixi = 02 име- . ют вид =-д-Х’г.Е'о, = (2.21) кроме того, оценки aQ п оказываются некоррелиро- ванными. § 3. Асимптотические свойства оценок 4 в задачах градуировки со случайными значениями шкалы 3.1. Уравнения метода наименьших квадратов. Пе- рейдем теперь к рассмотрению случая, когда и значе- ния независимых переменных Xi (i = 1, ..., р) заданы с ошибкой. Предположения (1.7) п (1.8) можно запи- сать в виде Ъ = е (xi) — а0 + a±xi + ... + arxi + 6b • Xi^=Xi + ^{ (.1 = 1, ..., p, p>r+ 1), (3.1) где случайные величины бь ..., 6P, ..., незави- симы и MSj = IVIyj = 0, D6{ = о?/п|, Dyi — cfx/mh (3.2) a=(a0, a1? ..., aT\ x = (xh ..., xp) — неизвестные па- раметры. Будем предполагать, 'что п< = а<(и) • тг, т{ = v = Pi(n) • n, 2 ai (n) = 1 И при W 00 i=l а<(п)->аъ рДп)(0<аг < 1, 0< p<<oo) для всех i = 1, 2, ..., p. В рассматриваемом случае вместо (2.2) нужно по переменным а = (а0, al9 ..., аг) и х = (Xi, ..., хр) минимизировать Q(at х) = @в(а, х) + Qx(x), (3.3)
§ 3, СЛУЧАЙНЫЕ ЗНАЧЕНИЯ ШКАЛЫ 135 где величина Qe(a, х) определена формулой (2.2), а р ах i«l Приравняв к нулю производные* dQ dQe IV = П°ЛУ’ чим г+1 уравнений, определенных равенствами (2.3) и (2.4) или равенством (2.6). Подчеркнем, что эти уравнения относительно новых неизвестных (а, х) уже не линейны. Оставшиеся р уравнений системы полу- чаются из равенств 77-= — 7T«i («) (<?i — е to)) е' to) - •^•₽i(«)to—®i)=0 (К O* (i=l,p), которые нетрудно преобразовать к виду xt = Xi + Gi — е to)) е' to), (3.5) aePi где е'(х) — производная многочлена е(я). Так же, как и в § 2, будем предполагать, что ХаХл=^0. При этом условий из уравнений (2.3) по формулам (2.8) можно выразить а через х, а = а(х), и подставить в (3.5). Тогда остается система из р уравнений (3.5) с неизвестными xlt ..., хр, В явном впде решение не находится. Для решения (3.5) с a = (a0 (ж)1 fx)) = (XaXa) Хаеа можно воспользоваться методом итераций, положив 2 Ж, (f + 1) = Xi + to — е to (0)) е' to (£)), (3.6) °Л xit) = to(£), ..., xp(t)), Xi(0') = xi (i = 1, ..., p). • Достаточные условия сходимости a(x(t)), x(f) при t-»-oo к решению системы (2.3), (3.5) в виде точных не- равенств имеют довольно сложный вид. Отметим толь- ко, что итерационный процесс сходится, если отноше- ния а<0*/р{04 (г = 1, ., р) достаточно малы.
136 ГЛ. 5. ЗАДАЧИ ГРАДУИРОВКИ 3.2. Асимптотические свойства нулевого приближе- ния. Нулевое приближение в итерационном процессе, определенном формулами (3.6), само является доста- точно хорошей оценкой. Обозначим а(0) = (а0(0), ai°\ • •« ...» аР0)У оценку, определяемую нулевым прибли- жением. По формуле (2.8) находим в<о) = (ВД’1и. (3.7) где Ха = хм = xht еа =( , /а^е'р). При п -*• оо оценки Xi сходятся по вероятности к поскольку, согласно (3.2), □#$->(). Следова- тельно, прп больших п обратная матрица в (3.7) опре- делена с вероятностью, близкой к 1. Если матрица ХаХа вырождена, то в (3.7) положим а(0) = 0. Оцен- ка а(0) = a(0)(?a, х) в окрестности точки x = x=(xi, ... ..., хр), ёа = еа = (eiVai, ..., ер11ар) является непре- рывной функцией. Так как еа, х при п оо сходятся по вероятности к x={xh ..., хр) и ea = (eiVai, . .♦ ..., ерУаР\ то прп п -> оо а^^ХоХ'аУ1Хаеа = а. р Здесь и ниже символом => обозначается сходимость по вероятности. Таким образом, оценка а{0) является состоятельной оценкой а. Справедливо более сильное утверждение. Теорема 3.1. Если выполнены предположения (3.1), (3.2) и | ХаХ'а | =Н= 0, то при любом 1_= 0, 1, ..., г, любом 8 > 0 и любой функции ф(тг) = о(Утг) Р [ | az(0) — at | < e/cp (n)) -> 1 при тг -> оо. Утверждение этой теоремы является следствием более об- щей теоремы. Теорема 3.2. Пусть = (|ni, ..., 5ns) — последователь* ностъ случайных векторов с конечными моментами = G = •••’*)> bkl (n) «'v(wU = — = где (vni — vi)}n ->• 0, bki(n) bki при n->oo; функция =
§ 3. СЛУЧАЙНЫЕ ЗНАЧЕНИЯ ШКАЛЫ 137 в 7(xi, •••, *«) определена в окрестности точки v = (14, vt) и имеет в этой окрестности непрерывные частные производные второго порядка. Тогда для любого 8 > О при п-> оо Р{№1’ •••’ •••> vs) I <Р(и)<е}->1, где <р(п) = о(Уп). Доказательство этой теоремы проводится аналогично дока- зательству теоремы 6.1 гл. 7 [43]. Оценки в», Xi (i = 1, ..., р) при п -> оо часто оказы- ваются асимптотически нормальными с параметрами Меъ M#j, Dei, Dxj. Введем обозначение для линейной части приращения функции /(£, ц) от двух групп слу- чайных величин | .., gz), ц = (ц19 ..., цт). По- ложим ад(/) = ад + ад, где 1=1 ш . (Л - 2 -«?’). ««> = (<•?’....<>'“). 41) = м^,' 42) = Мгц. Теорема 3.3. Если при п-+ °° величины ё{,..., ёр, #1> ..Хр асимптотически нормальны с параметрами IVki = е^ Dei = о^/па^ Мхг = хъ = ОхА₽< и | ХаХа| у= 0, _ то совместное распределение величин (а[0) — ai)]/п (1 = 0, 1, г) сходится к нормаль- ному распределению с нулевым вектором математиче- ских ожиданий и ковариационной матрицей D = (Dh1), где Dhl = lim п cov (Х~~ («£о)), Z~~ (az(0))). П-»оо Теорема 3.3 является частным случаем следующей теоремы. Теорема 3.4. Пусть £n = (gni, . .., gns) — последо- вательность асимптотически нормальных случайных векторов, моменты которых определены в теореме 3.2; f(x) = (/Дж),'..., x = (xi, .. ., xs); координаты
138 . * ГЛ, 5, ЗАДАЧИ ГРАДУИРОВКИ векторной функции f(x) имеют в окрестности точки x = v непрерывные частные производные второго по* рядка. Тогда при тг совместное распределение ве- личин (/,(gn) —(i = l, г) сходится к нор- мальному распределению с нулевым вектором матема- тических ожиданий и ковариационной матрицей, рав- ной пределу ковариационной матрицы линейной по gn части приращений — fi(v)YIп. Доказательство. Согласно теореме 6.1 гл. 7 [43] при п -+ ос асимптотически нормальна последовательность Ci/i(gn)+ +... 4-cr/r(£n). Отсюда следует утверждение теоремы 3.4, так как ci, ..., сг произвольны. Выпишем при г = 1 явные формулы для а^\ а^: = 4- (XX - X0’ = А (е* _ е*Х),; (3.8) где ~ ,v Д^^-Х2, X1=^laixi, X2=%a$, i=«l i=l ♦ Р ~ * р ^0 = 2 = 2 С^Х^в}» i=l i=l Положим Р Р хх = 2 ед, ^2=2 ai^i, i=l i=l P P #0 = 2 wu ^i=2 - i=ii <=1 Так как a0(0), «i0) линейны no el9 ..ёР, то для их линейных приращений имеем W0)) == ао — -^7 («i°0 — «£ — (3.9) где aQ, at определены формулами (2.19). Для упрощения вычислений ограничимся рассмот- рением случая, когда МХ! = ХХ= 2ед = о, Pi = i = г=1 . . (3.10) Производная да^/дх^ в точке = = (i =
§ 3. случайный значения шкалы 139 « 1, ..р) определяется формулой Ч(о) _ 1 f дх^ А I дх, I А дх. Полагая здесь Д = Х2 й используя формулы = 2а,о:,, = a,t = 2a,x, — 2Ххя, ® 2а,о:,, получим Ч = <*iEi дх^ ^2 Отсюда и из (3.9) для линейной части а^ находим LZЛ0)) = & — 2 ai & “ *<)• ' (3- И> 2 |=1 Аналогично вычисляется 1 [ Е । ~ 4” “у~ I ““* Eo 2xi —у I fa ’ X{)9 4=1 \ 27 Из последнего равенства и соотношений e{ = a0 + aiX{, Eq == (Iq* Ei = 0,1X2 получим a p LTS (®i0>) = — ai) “ "Г 2 aixi & ~ xd' <3*12) ’ 2 i==1 Из формул (3.12) и (2.20) в условиях теоремы 3.3 следует, что распределение величин Vn^a^ — a0)t ]fn(ai0) — ai) сходится при п^^> к нормальному распределению с ковариационной матрицей D = {Dij)^ где 9 / a? 1 ai Поо = о. 1 + р2 -5- g0 Doi = ое2р2 git \ а / 2 (3.13) р Р2 = Ш gl=^ а*х\ (Z = 0,1, 2).
140 ГЛ. 5. ЗАДАЧИ ГРАДУИРОВКИ 3.3. Общие теоремы о неявно заданных оценках. Приведем сначала теорему о состоятельности оценок. Пусть z = (z/n), ..., zP(n))' — состоятельная оценка ~ р z=(zo ..zp)', т. е. при п -> оо, Оценки 0 = (01, ..0m) определяются как решение системы уравнений /\(0!, ..0m, Zi, ..., zp) = 0 (f = 1, ..., тп). (3.14) ~ р Теорема 3.5. Если zi (п) => zt (i = 1, .. ч p) при n -* сю, Л(01, ..0m, Zi, ..., zp) = 0 (f = 1, ..., тп), (3.15) функции Fi(Ui, ..., Um, .., vp) непрерывно диффе* ренцируемы в окрестности точки (u, v) = (иь ... • • •, Um, Vi, • . ., Up) == (0i, • . ., 0m, Zi, • • ., Zp) = (0, z) и функциональный определитель D(.uV-’um) du- ¥=0 (3.16) в окрестности точки (и, v) = (0, z), то в окрестности точки (0, z) существует единственное решение ~ р (01, . . ., 0m) U 9j => 0| при П-+ о° (i = 1, ..., тп). Доказательство этой теоремы основано на теореме о неявных функциях. Предположим теперь, что совместное распределение величин {zi — z^l/n (Z = 1, ..., р) сходится при п -* °° к нормальному распределению с нулевым математиче- ским ожиданием и ковариационной матрицей о = (ОгД где = lim nM (zi (n) — z^ (zj (n) — zj). (3.17) 71-* oo Теорема 3.6. Если величины {zi — z^n (i = 1, ..., p) при n oo в пределе распределены нор- мально с ковариационной матрицей (3.17), выполнены условия (3.15), (3.16) и функции F^u, и) (j = 1, ..тп) дважды непрерывно дифференцируемы в окрестности точки (0,_z), то совместное распределение величин — (Л = 1, . .., тп) сходится при п оо к нор- мальному распределению с ковариационной матрицей D
§ 3. СЛУЧАЙНЫЕ ЗНАЧЕНИЯ ШКАЛЫ 141 определенной формулой Р = (Фё1Ф2)а(Фё1Фг)\ . (3.18) / dF{ \ / dF{ \ где матрицы из производных Фе = ), Ф2 = I ) \ °®з / \ з / взяты в точке (0, z). Доказательство. По теореме о неявной функции в ус- ловиях теоремы 3.6 система (3.14) имеет единственное решение, у которого непрерывны все частные производные 2-го порядка. Так же, как в доказательстве теоремы 6.1 гл. 7 [43]^ проверя- ется, что предельное распределение вектора (0i — 01, . .< ,0m — 0т)Уп совпадает с предельным распределением ли- нейных частей р г~ (( 0{ - е{) 1/п) = 2 Wu (zt - Z/) Vn, (3.19) Z=1 где Wu = d^ildzi определяются системой уравнений dQ dz +•+ dQ dz ~ dz . . . ч (3-2°) (i = 1, ..., тп; k = 1, ..., p). Системы (3.20) в матричной форм,е имеют вид ФеРИ = = —Ф2, где W = (W\z), и, следовательно,W = — Фд ХФ2. Отсю- да, используя (3.19) и формулу (7.3) гл. 7 [43], получим ут- верждение теоремы. Уравнения (2.3У и (3.5), которым удовлетворяют оценки метода наименьших квадратов, можно записать в форме (3.14). Вектором неизвестных параметров 0 яв- ляется вектор 0 = (а, х) = (а0, «1, ..., ar, xh х2, ..., хр) (тп = р + г + 1). Вектор оценок z имеет вид £ (в, х) (е 1, в2, • •., еР) х 1, х2, ..., хр). Функции Ft в (3.14) нужно определить следующим об- разом: xi е, х) = aQXk 4- + ... + arXh+r — (* = 0,1,.#11г), (3.21) Fr-н (а, х, е, х) = —Xi + J\p2 — е (х,)) (е' (х{)) 0 = 1,
142 ГЛ, 5. ЗАДАЧИ ГРАДУИРОВКИ где р2 = Ох/ае, в (ж) = а0 + а^х +.,, + агхт\ Д опре- делены формулами (2,4). Элементы матриц Ф0, Фх в точке (а, х, е, я) вычис- ляются по формулам 3FT,, j t а. — = Xk+l, (х{) р2 да^ да^ 1 4 v r (3*4 <?Fb . ~ Ь_1 дЛ.. * = a^e (Xj) - ка^. \ = 0 (iV J), * * (3.22) (*=од. dFk h - а}4, 0^1 dFr+l = “j 2 де^ Pj Р ’’ । • д Г} i — 1г • • •, 'Pt 1 — 1д е, • 2 r)t dFb -^ = 0 (k = Q,L.tllr)t дх. dFz <3-23) -Й^ = о (1#=/). aej Матрицу Фе удобно представить в следующем виде: /А В\ Ф0=^ J, (3.24) где А = (аъ) (г, / = 0, 1, ..г), В = (Ьъ) (i == 0, 1, ,.. ..., г; / = 1, ..., р), U = (пц) (г = 1, ..., р; j = 0, 1, .. ..., г) и С = (съ«) U, 7 = 1,..., р). Следующая лемма позволяет находить матрицы, об- ратные к матрицам вида Фе. Лемма 3.1. Если определители матриц С и А — BC~^U отличны от нуля, то матрица Фе вида (3.24) имеет обратную матрицу ’ /А* U*\ Ф* = I \В* С*/1 где Л* = U - и* = - (Л - ВС-ЧГт'ВС-\ в* = - С* = С-1 - C-'UU*. Доказательство. Так как ФеФ* — единичная матрица, то - /АА* + ВВ* AU*+ВС*\ (1^ 0\ \ВА*4-СВ* + ( 0 7Р/’
§ 3. СЛУЧАЙНЫЙ значения шкалы 143 где 0 —нулевая матрица, а 7л —единичная (к X &) -матрица. Из равенства UA* 4- СВ* = О следует, что В* = —С-1 СМ*. Под- ставляя это выражение для В* в равенство А А* + ВВ* — 1г+и получим АА* — BC~lUA* = 7r+i или (Л — BC-*U)A* = Jr+i. Та- ким образом, получены формулы для Л* и В*. Аналогично оп- ределяются С* и £7*. _Для вычисления ковариационной матрицы вектора уп (а0 — aOt а* — alt >.., а*—аД где а* = (а„,,,.,aj)— оценка метода наименьших квадратов вектора а = = (а0, ..«г), удобно ввести следующие обозначения: dpkhi) — диагональная (р X р)-матрица с элементами диагонали hh h2, ..., hp*> /1 1 \4 ^2 Матрицы, входящие в (3.24), можно записать в следую- щем виде:. Ао Х1-Хт \ а = ’Jft1 1 в = yr,p (X) dp («<«' (х,)), \Xr ^r+1“‘^2r / C = -dp(l + ^p’(e'(^))2)< U = - p2dp (e' (xO ) V'rtP {x). (3.25) Используя (3.22), (3.23) и (3.2), получим (3.26) где Ip — единичная {р X р)-матрица. Формула (3.18) в общем случае для ковариационной матрицы дает сложное выражение. В случае, когда Х{ распределены нормально, оценки метода наименьших квадратов совпадают с оценками максимального прав- доподобия (см. § 4).
144 ГЛ. 5. ЗАДАЧИ ГРАДУИРОВКИ § 4. Оценки максимального правдоподобия Если известны плотности распределения выборок, или исходных оценок, используемых для построения оценок интересующих нас параметров, то возможно ис- пользование метода максимального правдоподобия. При достаточно общпх условиях регулярности оценки мак- симального правдоподобия оказываются асимптотически нормальными п асимптотически эффективными. Уравнения для оценок максимального правдоподо- бия обычно не удается решить в -явном виде. Однако при численном решении методом последователь- ных приближений уже первое приближение дает асимптотически эффективную оценку (см. * [17J, §§ 5.2, 5.5). Пусть Уг = (Уи, Уг2, . . ., Vin^ (i = 1, .. • , N) (4.1) — независимые выборки и р^у, 0) — плотность рас- пределения у и (Z=l, ..., Wi)v 0='(0i, ..., 08)^0. Логарифм функции правдоподобия L для (4.1) име- ет вид N nv ini = 2 2 v=l i=l (4.2) Пусть ni = na,(n), a/n) а,- (0 < a{ < 1) при n <» (Z = 1, 2, ..., 2V). Предположим также, что выполняют- ся обычные условия регулярности: 1°. Функции In pi(x, 0i, ..., 08) трижды непрерывно дифференци руемы, 2°. Существуют интегрируемые на всей прямой функции Н(х), Н^х), Н2(х) такие, что д In pi при любых и интеграл Яг(гг), д2 In р. dQ, dQ. l2 <H2(x), 0 Е 0, f = 1, . . ., N, — ОО < я < оо, 00 J Н3 (х) (х, 0) dx —00 равномерно ограничен по 0 е 0.
§ 4. ОЦЕНКИ МАКСИМАЛЬНОГО ПРАВДОПОДОБИЯ 145 3°. Матрица 2>о(е) = (М°?(9))=Вт^ 71—>0О ™ где n(L) /„' _ V i \ f д 1п р”(х’ 0) д 1п р»(т’ 0) i а\ л Du (п) ~ av 00 j pv (%, 9) dx, v=l ОО * р£(п) = („П^(п)), конечна и невырождена. Матрица DLtri) называется информационной. Приведем сначала теорему, обобщающую неравен- ство Рао — Крамера на случай нескольких параметров (см. [32], стр. 280—281). Пусть 04, ..., 08 — оценки па- раметров 01? ..., 08, найденные по выборкам (4.1), D0~= (cov (fy, 0;-)) и MO^O; 0 = 1, - (4.3) Теорема 4.1. Если выполнены условия регулярно- сти, 0 = (0Ь ..., 08) любая несмещенная оценка пара- метра 0 = (0И ..., 08) и равенства (4.3); 0j — J • • • J 0j (^1, ..., мдг) L (и£, ..., мдг, 0) dur ... dujy 0 = 1, ...,s) можно дифференцировать под знаком интеграла, то матрица DQ — Dl1 (п) неотрицательно определена. Доказательство. В условиях теоремы легко проверя- ется, что е * /51п£(?1, ...,^,0)\ МI 1-0. / й1пЛ(У1, ...,^,0)4 _ м ^(0j — о) dOj J ~ 6И- Ковариационная матрица вектораV= (в,, ...,04’ dlnM , —00— I имеет следующий вид: /D0 Ia \ (л рь(пМ (4.4) д In L 50х ’ • •• Так как ковариационные матрицы неотрицательно определены, Ю В. А. Ватутин и др.
146 ГЛ. 5. ЗАДАЧИ ГРАДУИРОВКИ то их определители неотрицательны (см. [2], теорема 5, стр. 258). Таким образом, D0 Л >0, I. — РЕХ 1 >0. Л Dl (п) 0 ^Е1 Т4 Произведение этих определителей тоже неотрицательно: = | D8- D'11 > 0. D0 - О Р71 Z. о Этот же результат сохранится, если вместо вектора V взять век- тор V.^ .^с любыми (и, ..., ii) с= (1, 2, s), состоящий из ко- ординат V с индексами ч, h. Отсюда и из теоремы 5 ([2], стр. 258) следует утверждение теоремы. Из приведенной теоремы вытекает следующее ут- верждение. Пусть ковариационная матрица вектора не- смещенных оценок 0* = (01, ..., 0*) совпадает с D^n) и 0 = (01? ..., 08) — любые несмещенные оценки 0 = = (01,..., 0,). Тогда в условиях теоремы для любых по- стоянных Ci, ..., cs имеет место неравенство (4.5) М=1 / \1=1 ' Оценку 0* = (0*, ..., 0^) будем называть асимптоти- чески эффективной, если nD0*->Z)o при п 00. Приведем теперь теорему, позволяющую находить асимптотически эффективные оценки. Пусть по выборкам (4.1) найдены «грубые» оценки 0 = (01, ..., 0S) параметров 0 = (0Ъ . .., 0S). Положим (0) = (4П), • • •, 4П)), (0) = (4"0, где л(п)_ 1 5lnL(z/r ...,yN,0) ‘ ~Vn („>_ ! д* In L(yv..., у N, в) (4-6> n Матрицу, обратную к матрице Sn(0), обозначимВ^1 (0),
§ 4. ОЦЕНКИ МАКСИМАЛЬНОГО ПРАВДОПОДОБИЯ 147 если она существует; в противном случае положим ВпЧе^о. Теорема 4.2. Если выполнены условия регуляр- ности 1°—3° и величины (0j —-0$)]/п (Z = 1, сходятся при п-+ оо по вероятности к 0, то оценка е* = 0--^5-1(е)лп(е) у п (4.7) асимптотически нормальна с вектором математических ожиданий 6 и ковариационной матрицей D^ln. Теорема 4.2, полученная в работе [37], обобщает теорему 5.5.4 ([17], стр. 324). Докажем сначала две леммы. Лемма 4.1. Распределение вектора Лп(0), определенного формулой (4.6), сходится к нормальному распределению с ну- левым вектором математических ожиданий и ковариационной матрицей D^1. Доказательство. Координаты можно предста- вить в виде 4"’ - V; 2 2 %; «)• %; (»« Ч - V V=1 i=>l 3 Слагаемые 0) (v = 1, ..., N\ i = 1, ..., nv) независи- мы, одинаково распределены при фиксированных и, j и имеют конечную дисперсию. Отсюда и из формул (4.4) следует ут- верждение леммы. Лемма 4.2. Если выполнены условия регулярности 1°—3°, то матрица Вп(Ъ), определенная формулами (4.6), сходится с вероятностью 1 к матрице — Доказательство. Заметим, что d2lnZ, д In L д In L 1 d*L ЖЖ “ - dQ. + L dQ.dQ.- Отсюда следует, что М ("Г вп (9)) = - Do (9)- (4.8) так как в условиях регулярности 1 д2Ь L de^Qj 10*
, 5 < fe-. 148 M. 5. задачй Градуировки Из формул (4.6) получаем, что п / . nv =2а’(л) “ 2,}> е) v=l \ ° Л=1 где слагаемые а л, fl4 _ a2lnM^’0) % (yvk' 9) - dQ;dQ. независимы, одинаково распределены при фиксированных f, /, v и имеют конечное математическое ожидание. Таким образом, для внутренних сумм выполняется усиленный закон больших чисел. Отсюда и из (4.8) следует утверждение леммы. Доказательство теоремы 4.2. Из лемм 4.1 и 4.2 следует, что вектор — В”1 (0) Ап (0) при п -> оо асимптотиче- ски нормален с нулевым вектором математических ожиданий и ковариационной матрицей В”1. Пусть е > 0 произвольно. Для координат вектора Ап(0) в окрестности точки 6==6 по форму- ле Тейлора с остаточным членом в форме Лагранжа имеем Ai + I l/7i V f 1 д2111L (у’9А ЛТ ' о \ I + Vn2i » de,d9i |(9з-9з) + j=i \ 1 3 / + Vй — 2 ~П dd.dfhdt), (9ь — 9й) — ei)* ' к, 1=1 г л 1 где у = (yi, ..., удг). Отсюда в области |0< —0<| < еп~1/4 (i = 1, ..., s), используя условие регулярности 2°, получим С .. Лп(0) =ЛП(0)+ У7ВП(0) (0-0)+ ]/7бП (4.9) (. N nv 422яз(м W- v==l U=1 J Аналогично находим, что в;1(е) = V(0) + r(n)> (4.10) Где r(n) = (r(J>), ( 2V п» — \ г 1/4ег v= l u=l J
§ 4. ОЦЕНКИ МАКСИМАЛЬНОГО ПРАВДОПОДОБИЯ 149 Из формул (4.7), (4.9) и (4.10) получаем Уп (0* - 0) = (0 - 0) 1/Я - В-1 (0) Ап (Г) = = - В-1 (0) Ап (0) - Г(П>4П (0) - Г<«>2?п (0) (0 - 6) - — г(п)6(п) Т/n -В'1 (0) 6(п) Уп. N ~ Отсюда и из того, что вероятность события О {| 0$— 0j< стремится к 1, обычными рассуждениями получаем, что распре- деление вектора Уп (0* —0) совпадает с распределением век- тора — В”1 (0) Ап (0). Теорема доказана. Воспользуемся теоремой 4.2 для нахождения асимп- тотически эффективных оценок коэффициентов гра- дуировочной кривой. Пусть j & 121 • • • ? • • •, G = • • *t Р) (4.11) — независимые нормально распределенные величины и Меу = е (х{) = а0 + avxi + ... + «X, Dey = о>, Мху = xi, Dxy = о£. Положим ~ 1 V ~ ~ 1 V ~ ei п £ eih xi — т £ xij' ni & mi £1 Тогда Ьб?| = Пе/пъ DXj =(5х/гп{ (/ = !,♦.., р). В качестве грубых оценок вектора (а, х} = = («о, • • •» Лг, Xi, ..., хр), требующихся для построе- ния асимптотически эффективных оценок, можно взять вектор ( а(0), х) = (аоо), ai0), ..., 40), хь ..., хр), (4.12) где а(0) = (йоО), ai0), ..., б40)) — нулевое приближение, определенное в § 3. Действительно, так как условия теоремы 3.3^ выполнены, то совместное распределение величин Уп (а|0) — aj (I = 0, .. г) сходится к нор-
150 ГЛ. 5. ЗАДАЧИ ГРАДУИРОВКИ мальному распределению и, следовательно, для любо- го 8 > 0 Р {>Лг | Я|0) — | > е} = Р { Vn | а-0) — | > е Утг} -> б прп п оо. Логарифм функции правдоподобия L для выборок (4.11) имеет следующий вид: Р пг lnL = -А 22(^-е<х«))2- г=1 j=i Р mi ~ 2 2 —^)2'+const- i=l j=i Вектор Ап(а, х) определяется равенством Ап(а, х) = 1 (d\nL "|/n \ ^aQ ’ д In L д In L ’ даг ’ дх^ 1 д In ZA ’ дхР Г где Р OlnL _ да, ~ п V? h ( ~~ — — е (xi)), к 1=^1 -«to)) + -r (4.13) d In £ г -у ai^' to) й • (ж{ — ^г)- Отсюда 1 д2 In L п да^да^ л Р °е i=l 1 d2 In £ _ п дх^дх- 0 (j j)i = (kaixi 4^ — e to)) — aixie' to)). (4-14) £ = [e„ (ж{) (~ _(g _(e, (x.))2] _ 21. n dxi °e °x Формулы (4.14) определяют элементы матрицы Вп(ё, х, а, х). Элементы матрицы Do = — МВп{ё, х, а, х) находятся, по формулам п дауда^ Р 42а^+/’ —мр^=о 2 Ad г г ’ п дх.дх. °е г=1 г (i =/=/), _J_M£4nA = п x'ie' {xi), °е (4.15) п дх2. г 4 + i-(<?' to))2- °х °;
§ 4. ОЦЕНКИ МАКСИМАЛЬНОГО ПРАВДОПОДОБИЯ 151 Асимптотически эффективная оценка (а*, я*) век- fc тора (а, х) может быть найдена по формуле (4.7). При вычислении В^1 можно воспользоваться лем- мой 3.1. Согласно теореме 4.2 ковариационная матрица предельного распределения вектора ((а*, х*} — (а, хУ)1п равна Dq1. ' Вычислим Dq1 в линейном предполагать, что р случае (г=1). Будем (i = 1, р). Тогда / А г) _____I “Л 1 р2 ГР. где М R - I “1 ^2/ ° \a.rr аР \ 2 Г М2 , Р = — арХр) \Ge) Если положить ^о1 = о! (7*\ с*/’ /1 о \ 1 = (о 1/Х2)’ 1ВйВаА 1 — то согласно лемме 3.1 А* = (Л - = [/2 - Отсюда при р 0 А* = А-1 + а^А^ВоВ'А-1 + О (р«). Так как ^0 ^1/^2 \ gi = 2 (I = 0, 1, 2), 1=1 то ковариационная матрица предельного распределе- ния вектора Vп (а* — а0, а* — ax) имеет вид ФЧ \ , \ 2 х| + О(р2<Тх). (4.16) 1 L , а1Р g2) I М }) / 1 + Р2«1^о «2 I I 2 2 I ф ч \ Х2
ГЛАВА 6 ОБЪЕДИНЕНИЕ ОЦЕНОК § 1. Объединяемые оценки В физических исследованиях измерения одной и той же величины а проводятся, как правило, независимо несколькими исследователями в различных институтах или лабораториях. Обычно оценка у величины а полу- чается в результате довольно сложной процедуры обра- ботки (различной в разных организациях) непосредст- венных результатов различных экспериментов. Полу- ченная оценка у вместе с оценкой Ьа ее среднеквадра- тичной ошибки Од приводится авторами в статьях или в отчетах. Поскольку проведение экспериментов связа- но со значительными затратами, необходимо использо- . вать всю имеющуюся информацию об оцениваемой ве- личине. Таким образом, возникает задача построения по имеющимся оценкам более точной оценки. Пусть У1, #2, . . ., Ут (4.1) ' — оценки неизвестного параметра а, полученные т ав- торами. Оценки yi обычно можно представить в виде Z/i = /(0ii, .0ift, Ф1, фР), (1.2) где 0и, ..., 01/ц — оценки параметров 0и, ..., Qih., по- лученные i-м автором по выборке •Til? • • •» (1*3) а ф1} ..., фр — оценки параметров фъ ..., фр, получен- ные по общей для всех авторов‘выборке zn^ Такими оценками 9ц, ..., 0цц могут быть, например, оценки коэффициентов уравнения, которому удовлетво- ряет неизвестная величина а. Выборки (1.3) для раз- личных авторов можно считать независимыми. Оценка- ми фл, ..., фр могут быть значения величин фъ ..., фр, взятые из таблиц.
§ 2.’СЛУЧАЙ С ИЗВЕСТНЫМИ ДИСПЕРСИЯМИ 153 При использовании оценок (1.1) для построения бо- лее точной оценки а будем различать следующие слу- чаи: оценки (1.1) некоррелированы и известны их дис- персии; оценки (1.1) коррелированы и известна их ковариационная матрица; оценки (1.1) коррелированы, известны дисперсии и частично известны коэффициен- ты корреляции. ' Оценки (1.1) разумно считать некоррелированными, если точность оценок <р1? ..., срр значительно превосхо- дит точность других оценок в (1.2). Если функции в (1.2) известны, то можно, используя линейное при- ближение, оценить ковариации оценок (1.1). Однако чаще всего функции /< неизвестны или известны лишь некоторые из них. В этом случае можно считать изве- стными ковариации соответствующей части оценок (1.1). Отметим еще, что в данной главе рассматриваются оценки, полученные по измерениям, не имеющим систе- матических ошибок. Задачи оценивания при наличии систематических ошибок обсуждаются в гл. 7.. § 2. Объединение оценок с известными дисперсиями Будем предполагать, что оценки Уь Уг, Ут (2.1) параметра а, полученные по выборкам уц, ., м ущ (i = 1, *.тп), являются несмещенными (Му< ==' а) и известна их ковариационная матрица. Положим Dy =* = D/n, где у = (уъ ..., yw), D = (Dy), = п cov (у,, у,). Предположим, что «j = Di/j = о?/очп, cov (у{, у}) = р{^а/п Тогда ___ pjjOiO/V а,-а/. (2.2) Величины о<, ро предполагаются известными. Коэффи- циенты линейной несмещенной оценки Ус = Cjj/t + с2у2 + .. „+ стут (2.3) параметра а удовлетворяют, очевидно, следующему
154 ГЛ. 6. ОБЪЕДИНЕНИЕ ОЦЕНОК условию: т i=l (2-4) Среди оценок (2.3) будем искать оценку с наименьшей дисперсией. 2.1. Объединение некоррелированных оценок. В рас- сматриваемом случае pij = O и о2 о2 о2 Dyc = <?0(e) = C2i;2- + C22^+ ... +4^ (2.5) пг п2 пт найдем £ = (<?!, ..., ст\ минимизируя (20(с) при нали- чии связей (2.4). Используя метод неопределенных множителей Лагранжа,, получим, что минимум достига- ется при с{= hi (z = 1, ..., тп), где , л л . &. / т CCi \ “1 = = В*= 241 (2-6) Таким образом, оценка у — Mi + Мг + hmym (2.7) имеет минимальную дисперсию. Подставляя Ci = hi в (2.5), получим _ Dy = В2/п. (2.8) Очевидно, что 52 min (af/aj. г 2.2. Объединение коррелированных оценок. В об- щем случае дисперсия оценки (2.3) определяется фор- мулой т Dy с = Q (С) = 4 2 (2-9) ij=l где Du определяются формулой (2.2). Предположим, что матрица D невырождена. Используя метод неопре- деленных множителей Лагранжа, для коэффициентов с,, минимизирующих (2.9) при наличии связи (2.4), по- лучим систему уравнений ч о ( Q (с) + Ь { 2 ci —1 j) т = ~п 2 Diici + ° ’ 3=1 (1 = 1,2,....от).
§ 2. СЛУЧАЙ С ИЗВЕСТНЫМИ ДИСПЕРСИЯМИ 155 Эта система уравнений в матричной форме имеет вид De' = — — •(!), где (1) - вектор-столбец из единиц. Отсюда с' = _ п 4 ' и, следовательно, учитывая (2.4), получим с.(1) = -^-(1)' D-1 • (1) = (1). Таким образом, X = —лг/2( (1) 1)), с =D~l • (1)/((1) 'D-1 (1)). Положим Z)-1 = (jD*j) и » тп пг т Wi = 2 w=2 w> - 2 = W- <2Л°) j=l i=l i,j=l Теперь оценку с минимальной дисперсией можно запи- сать в виде у = Hiyi + H2y2 + ... + Нтут, (2.11) где Hi определены формулами (2.10), или, в матричной форме, У=^г(1)'2)-У, Ж = (1)'2)-1(1). (2.12) Отсюда, воспользовавшись формулой (7.3) гл. 6 [43], найдем ^ = ^((1)'D-1)Z>/(D-1(1)) = = —2 ((1)' ZT1) D (JT1 (1)) = (1)(1) = 4г Таким образом, Dy = \/nW. (2.13) Любую из оценок (2.1) можно рассматривать как ли- нейную функцию от (2.1), и, следовательно, Dy ^minDyi, так как у имеет минимальную дисперсию среди линейных оценок.
156 ГЛ. 6. ОБЪЕДИНЕНИЕ ОЦЕНОК 2.3. Объединение слабо коррелированных оценок. Формулы (2.10) коэффициентов оценки с наименьшей дисперсией значительно сложнее соответствующих фор- мул (2.6) в некоррелированном случае. Если оценкой у, определяемой формулами (2.7), (2.6), воспользовать- ся в случае, когда (г=1, ..., т) коррелированы, то оценка у не будет иметь минимальной дисперсии. Срав- ним Пу с минимальной дисперсией Пу для слабо коррелированных оценок. Предположим, что D=D0 + &R, (2.14) где 8 > 0 мало, a Do = (б^а|), R = (7?Д R^ = /Тага; Ди —0; Так как D = Um + M^)D9, то при 8 0 D-1 = Do-1 Um + Mo1)-1 = Do1 Um - Mo1 + + e2 (ВД1)2) + О (83). (2.15) Оценку у можно представить в виде y = ^'D^\ (2.16) 0 где Wo = (1)’ Dg1 (1). Отсюда . Dy = ((Г) Do-1) D (n0-1 (I))- (2.17) При D —Z)o ата формула совпадает с (2.8). Воспользо- вавшись формулами (2.13) и (2.17), получим Dy.^y = nWDy - 1. (2.18)- Подставляя в (2.12) и (2.17) разложение Z)"1 по степе- ням 8 (формула (2.15)), найдем w = Wo - е ((1)' D^RD-01 (1)) + + е2 (1)' По"1 (ЯПо-1)2 (1) +- О (е3), Dy = + 8 (1)' D^RD? (1)).
§ 3. ОЦЕНКИ С НЕИЗВЕСТНЫМИ ДИСПЕРСИЯМИ 157 Отсюда и из (2.18) следует, что (Ру - Dy)/Dy = f2[w0 (1)' zV( W1)2 (1) - или, полагая BDq1^) = А, получим (PPoA'ZVA - ((1)' 7VA)2) + О (e’), (2.19) Dy W‘ так как Д' = (1)' D;*R и (i)' d;1 (rd;1)2 (i) = ((i)' d^r) d;1 (rd;1 (i)). Положим RD;1 (1) = (Ai, ..., Am), m ii (2.20) д< Тогда т д (l/Do^A = 2 «i-т- S—1 Ц? гп WW4 = 2 ij=l ai°j Отсюда и из (2.19) получим окончательную формулу Полученная формула характеризует ухудшение оценки у по сравнению с оценкой у. § 3. Объединение независимых оценок с неизвестными дисперсиями Будем для определенности считать, что оценки (1.1) получены по т независимым выборкам У и, Ун, • • •, У in. (г = 1, Myi} = a, Dyi} = <rf. (3.1) Сами выборки (3.1) неизвестны, известны только ве- личины ni n'i = 4 = т-2(»у-у<)2- м < >==»! <
158 ГЛ. 6. ОБЪЕДИНЕНИЕ ОЦЕНОК Положим п{ = аМп (z = l, 2, ..., т). Будем пред- полагать, что сХг(тг)а; (сбг > 0), п->оо. Оценки z/i параметра а и дисперсии оценок могут в некоторых задачах определяться не формулами (3.2). Однако, если их асимптотические свойства аналогичны асимптотиче- ским свойствам оценок (3.2), то приводимые ниже ре- зультаты будут по-прежнему верны. ЗД. Оценки со случайными весами. Из формул (3.2) следует, что Dz/j = о?/п| = а?/а{ Прп извест- ных о? объединенная оценка определялась формулами (2.6), (2.7). В случае неизвестных в качестве оцен- ки а естественно выбрать оценку у = ^1У1 + Т^Уъ + ... + ИтУт, (3.3) где (т \ —1 24 « <3’4) 1=1 sl J hi определены формулами (2.6) и s* — формулами (3.2). Если Si = 0, то 1/4 в формулах (3.4) заменяем 0. При известных сг|/п< дисперсия объединенной оценки (2.7) не превосходит при любом i. Для оценки (3.3) аналогичное утверждение неверно: в ра- боте [54] для нормально распределенных выборок (3.1) показано, что Dy при всех i (i = 1, ..., т) тогда и только тогда, когда rii > 9 (i = 1, ..., т) или щ = 9 при некотором i и п, > >17 (/=^f). Таким образом, дисперсия оценки у может быть больше какой-либо дисперсии исходных оценок только при малых пи Мы будем изучать асимптотические свой- ства у, когда п -> оо и аЛтг) -> аг-. 3.2. Асимптотическая нормальность. Асимптотиче- ская состоятельность и несмещенность оценки у, опре- деленной формулой (3.3), являются следствием следую- щей теоремы (см. [14]). Теорема 3.1. Ясли М (у^— a)*<zC при всех т и всех г = 1, ..., ттг, 0<о2 4 ст2, 0<a^ai(n)=^ а < оо и т = о(п) прип-+ <*>, то величина (у — аУ^п/В
§ 3. ОЦЕНКИ С НЕИЗВЕСТНЫМИ ДИСПЕРСИЯМИ 159 при п °о асимптотически нормальна с параметрами (О, 1). Величины Buy определены формулами (2.6) и (3.3). Доказательство. Воспользуемся равенством У-а - 2\(?/4-<г) + 7?п, (3.5) г-1 где Rn= (3.6) i=l hi 1li (sr • 5m)’ = hi (°r •••’4)- Оценим сначала M (^л — h.)2, Обозначим L индикатор события: | — о? | <е0 г г Bq * * при всех t = 1, ..m. Тогда м (7. - h.y- = м (Ц (h. - А.)2) + м ((1 - |£о) (/7. - Л.)2). Так как 0 < 1, 0 hi 1, то М((1-|е)(^-Л.)2)<4М(1-^)<4 £Р{^-а2 | > е0). 0 0 1=1 Отсюда, используя оценку (см. [26], с. 382) Р1Й - I >.!«“ И получим М ((1 -Ц) (h. - h.)*) . (3-7) где К2 — некоторые постоянные. Представим Л/ — hi в сле- дующем виде: m где а а. m тп Zi = ~^' = Z(m) = 2 Z(rn)^ Zk- * 1 h=l h=l Нетрудно убедиться в том, что найдутся такие постоянные ci, с2 (0 < Ci <. с2), для которых в достаточно малой окрестное о 2 стп точки q = О| выполняются неравенства CL Z С2’ Z(m)^C2*
160 ГЛ. 6. ОБЪЕДИНЕНИЕ ОЦЕНОК Отсюда и из (3.8) получим и, следовательно, МЦ(^-Л.)3<К4/птп2, (3.9) так как М(4-а2)2 ^.KJn, Здесь К3, /Г4 — некоторые постоян- ные. Объединяя (3.7) и (3.9), получим М (\ - Л{)2 < К2 + к ' 1 г/ й п 4 п>тГ и, следовательно, м | ( *i - hi) (Vi - а) | < Км 0~i" М2^- Оценивая при помощи этого неравенства величину Rn (см. (3.6)), найдем т J т 1 ' У»м|Л„|<хwj/-+7?. . Отсюда следует, что в условиях теоремы ^nRn сходится по ве- роятности к 0 при п -и оо.^Таким образом, предельное распреде- ление величины (у— а)}п совпадает с предельным распределе- нием величины т ^п.т = S hi («г ~ “)• (ЗЛ°) i=l Если т = const, то т)п, т является конечной суммой асимптоти- чески нормальных случайных величин у г — а. Пусть теперь т -> оо. В условиях теоремы Л/тп h{ Л/т, где 0 < h_ < Л — некоторые постоянные. Используя эти неравен- ства, получим, что Dnn>nl = B2 Ь/т (Ь > 0 — некоторая постоянная) и т ГЗ 3/2 т л \ С3т = 2 «8/2А?М ki - а I3 < -^3 - 2 /М (уг - «)в = О . h=l 4 7
§ 3. ОЦЕНКИ С НЕИЗВЕСТНЫМИ ДИСПЕРСИЯМИ 161 так как М (у г — а) 6 = О (1/п3). Отсюда при т -> оо Ст / т^2 \ —т== = О -> 0. /D4n,m \от ' ) Таким образом, выполнено условие Ляпунова. Следовательно, величина т]п, m асимптотически нормальна и при т->оо. Тео- рема доказана. Отметим, что при т = const величина 2J2, получен- ная из В2 заменой <з\ на сходится по вероятности к В2. В этом случае в формулировке теоремы 3.1 можно заменить В2 на В2. В такой форме теоремой можно воспользоваться для построения асимптотических дове- рительных интервалов. Действительно, при п -> °° Р\У Г7=В < а < У + иа *= [ e^dx. 1/2 л J -wa 3.3. Асимптотические формулы для моментов. Пред- положим, что величины (3.1) нормально распределены. Вместо смещенных оценок s2 дисперсий о? будем ис- пользовать оценки s2 = п^2/(пг — 1). Оценки у г и si независимы (см. [43], стр. 184). Покажем, что оценка у, определенная формулой (3.3) с /ц = /ц ($i, .. ^sm), является несмещенной. Так как у{ и s2 независимы, то независимы */» и hi (st ..., st). Тогда Mi/ = У, Mhiyi = У Мhi • Mi/j = i=l i~l m так как У, hi = 1. i=l -m / m V = а У MA| = a-M I У = a, i=l \i=l / Таким образом, Mi/ = a, (З.И) Нормально распределенные величины имеют конеч- ные моменты любого порядка. В дальнейшем мы прп п->оо будем пользоваться оценкой (см. [26], стр. 384) М Gi - a?)2' = О (l/n')t (3.12) где t > 0 — любое целое число. 11 В. А. Ватутин и др.
162 ГЛ. 6. ОБЪЕДИНЕНИЕ ОЦЕНОК Теорема 3.2. Пусть уц (г=1, ..., тп; 7 = 1, ... ..., nJ — независимые нормально распределенные слу- чайные величины с Myjj = a, Оуц = а2. Если п -> оо, О <а^а^а< оо, 0 < о2 о2 < оо (при всех i) и тп = о(п1) при некотором целом t>Q, то m = 1 + 42^(1-^) +0 k=l 1 ( m ^Г+ где В2, hk определены'формулами (2.6). Доказательство. Используя (3.11) и независимость ве- личин Др s2, получим Dy - М (у - я)2 = М 2 /7г (Уг - а) k=l = 2 Mhkhl-M(yk- a}(Vi~ а). k,l=l Отсюда m 2 (3.13) г=1 г Найдем асимптотическую формулу для МД2. Для этого восполь- зуемся методом доказательства асимптотических формул от вы- борочных моментов (см. [26], стр. 388—390). Обозначим £е индикатор события: | а? | < е0 при всех i = 1, ..., тп. Ис- пользуя неравенство Чебышева и (3.12), получим ~ ' М ( 5/2 ~а?)2* С р 114 - °? > %) <----л-----< <3-14) ео 8о п где С > 0 — некоторая постоянная. Отсюда * Ст Ст Р{Ц = 0}<^Г> Ррео==1}>1_^. (3.15) Используя (3.15), оценим второе слагаемое в правой части формулы Mfe*=MgeJ| + M(l-£eo)Af. (3.16) Так как Д2<1,то С/Тгь М(*-Ч)М<М(1-Ч)<^. (3.17)
§ 3. ОЦЕНКИ С НЕИЗВЕСТНЫМИ ДИСПЕРСИЯМИ 163 Чтобы оценить первое слагаемое в (3.16), воспользуемся разло- женцем Д? (72, в 8о-окрестности точки $2 = о2 (I == = 1,..., т): т ..»а+2',”(Ч-“В+ Л=1 +4 jX“R-»?,)('?-»?)+ b^9,k*=l где h^\ ЦЬ’*)—первые и вторые производные функции Л? в точ- ке (о*, а —третьи производные в некото- рой точке из 8о-окрестпости. Умножим (3.18) на и вычислим от обеих частей полу- . ченпого равенства математическое ожидание. Так как о|, то < /М(1-?ео)2Мр|-а^ = ]/рр8о = 0}0^ = т1^' \ nU+D/2 у- Аналогично оцениваются сомножители во второй сумме в (3.18) при к Ф I, Для оценки третьей суммы в (3.18) нужно восполь- зоваться неравенствами < /м - О2 м Р22 - °12)2( °13)2’ М Cs\ - ( *23 - *23)2 < /M(^2-aI2)4M(Pft3-o^. Отсюда и из (3.12) получим М I si — о? |Н«? — о? I Is? — о? I — О (—. I hl fel IJ h2 k2 I I ft3 h3 I \ ns/2 } 11*
164 ГЛ. 6. ОБЪЕДИНЕНИЕ ОЦЕНОК Главные члены асимптотической формулы для М № полу- чаются из Л? и от следующей части второй суммы (3.18): т fe=l Для завершения доказательства теоремы нужно вычислить [)^2 и воспользоваться оценками 1 \т / 1 \т ) г \т J где ни один из индексов к, I, кь к2, к3 не равен i. Если один из указанных индексов совпадает с i, то показатель степени т понижается на единицу. § 4. Объединение оценок при неполной информации о корреляционной матрице Пусть величины / Уь Уг, .... Ут (4.1) являются несмещенными оценками параметра а. Будем предполагать, что известны Оуг = (г = 1, .♦. , т). Положим У = (У1 + У2 + . • • + Ут)- (4.2) Свойства оценки у существенно зависят от корреляци- онной матрицы величин (4.1). Если оценки (4.1) неза- висимы, то Dy = (oj + ..._+ а™)/ж2, й в случае о? = = ... = От = а2 имеем Dr/ = оЧт. Рассмотрим теперь другой крайний случай, когда ро=1, где. ру = = соу(у{, yP/OiOj. В этом случае ’ m = 4 2 = А (Ст1 + • •-• + °™)2. т ij=l т и при а? = ... = о2т = а2 имеем Dy = о2. Таким обра- зом, оценка (4.2) при одинаковых в случае незави- симых yi имеет дисперсию, в т раз меньшую дисперсии каждой отдельной оценки, а в случае линейно связан- ных оценок (4.1) .с рц = 1 дисперсия оценки (4.2) не уменьшается по сравнению с дисперсиями yit
§ 4. НЕПОЛНАЯ ИНФОРМАЦИЯ О КОВАРИАЦИЯХ 165 В § 2 были найдены линейные относительно уг оцен- ки с наименьшей дисперсией в случае, когда ковариа- ционная матрица известна. Аналогичные оценки можно найти, если известны лишь оценки ковариаций. Однако нередки случаи, когда элементы ковариационной мат- рицы или их оценки полностью неизвестны или извест- ны частично. Ограничимся для простоты случаем, когда коэффи- циенты корреляции либо известны точно, либо неизве- стны и неизвестны их оценки. Дисперсии оценок (4.1) также будем считать известными точно. Такого типа ситуации возникают в случае, когда приходится объ- единять оценки, полученные разными группами иссле- дователей. Оценки обычно являются функциями от не- посредственных результатов измерений данной группы, а также от оценок других параметров, которые могут быть общими для различных групп. Положим / = {(&, /): г, /==1, ..., тп}. Обозначим R множество пар U, /), для которых известны коэффици- енты корреляции n(Q)_n._ cov(^) Pij — Pij — > U. ]) S Неизвестные коэффициенты корреляции обозначим zfj = =ру, где (i, у) еЯ = /\Я. Пусть Ус = + сгу2 +... + cmym. (4.3) Тогда Q (с, z) = Dyc = S + S _ ZifliOjCiCj, (4.4) где c — (ci, ..., cm), z'= {z,7, (i, /) s7?}. Положим Q (c) = max Q (c, z). (4.5) z Здесь максимум находится по тем значениям z, кото- рые вместе известными p{j.=p^ образуют матрицу, являющуюся корреляционной. Для этого необходимо, и достаточно, чтобы rml гm2 * * rmm (4.6) где гц = pif, если (i, у) ^R, и ru = ziit если (j, у) e_R.
166 ГЛ. 6. ОБЪЕДИНЕНИЕ ОЦЕНОК При имеющейся информации в качестве объединен- ной оценки естественно выбрать У* = Ус* = С*У1 + . . . + СтУт, (4.7) где с* определяется равенством <?(с*) = inf Q(c). (4.8) т S с-=1 1=1 Заметим, что функция (4.4) линейна по и, следо- вательно, максимум Q(c, z) достигаете^ на границе об- ласти, определяемой неравенствами (4.6). Таким обра- зом, задача определения максимума Q(c, z) становится обычной задачей на условный экстремум. Рассмотрим несколько частных случаев. 4.1. Объединение двух оценок. Пусть ус — линейная оценка: ус = су{ + (1 — е)у2, где Mz/X = Mz/2 = диспер- сии Dyi = Oi (г = 1, 2) известны, а коэффициент кор- реляции pi2 = z неизвестен. Так как |z| < 1, то Q (с) = max (c2c?L + (1 — с)2о2 + 2с (1 — с) — |г|«1 = С2О1 + (1 — С)2 02 + 2 | С | | 1 — С | 0^2. Положим о0 = min (oj, о1). Тогда ^(с)>о20(с2 + (1-с)2 + 2|с||1-с|) = = Оо ( | с| + |1 —с|)2>О2 и, следовательно, <2(с*)= inf (2(с) = Оо, где с = 1, если и с = 0, если а! = ао* Таким образом, при объединении двух оценок с неизвестной корреляцией нужно из двух оценок выбирать одну оценку с меньшей дисперсией. 4.2. Объединение m оценок с полностью неизвест- ными коэффициентами корреляции. Пусть ус = с^ + ... ... + cmym, Mi/t = a (i == 1, ..., ум), дисперсии Dy г = о? известны и все коэффициенты корреляции zi} неизвест- ны. Координаты вектора (сь ..., ст) (если все они от-
§ 4. НЕПОЛНАЯ ИНФОРМАЦИЯ О КОВАРИАЦИЯХ 167 личны от 0) можно разбить на два множества: Ц = = {£: > 0), = CiCi<0}. Если среди ..., ст есть равные 0, то на два множества разбиваем только отличные от пуля координаты. Очевидно, что при фик- сированном с имеем ' Dyc < 2 I CiCj I OjOj = i,j=l = 2 CiCjdiCj + 2 CiCjCTiCTj —2 2 CiCjOiOj, (i.jleli (i,j)6I2 <611 так как |гу|<1. Правая часть последнего равенства достигается, если = 1 (г, /) е Ц пли (г, /) е 72) и z^ = = —1 (г €=Zi, 7е72 или г^72, j^IJ. Корреляционная матрица с указанными значениями z^ существует. Дей- ствительно, такую корреляционную матрицу имеют ве- личины щ = Tb = -g, г^72, где g— некоторая случайная величина. Из приведенных рассуждений следует, что Q (с) = max Dz/C = 2 ! 011 <4 | {*<?} {’j=1 Отсюда, полагая a2 = min °ч, найдем i m <?(c)>Go 2 |O||cJ = По(Ы + • •• + I Cm I)2 > Oo, ij=ll так как Ci + c2 + ... + cm = 1.' Таким образом, у* совпа- дает с исходной оценкой, имеющей наименьшую дис- персию. 4.3. Объединение пг групп оценок с неизвестными корреляциями между группами. Пусть У и, Ун, • • •, У ini (г = 1, . .., пг) (4.9) — несмещенные оценки параметра а; известны о2/ = = Пг/,; и коэффициенты корреляции р«х,<1а = Р/р(2 ве- личин уцх, уц2- Коэффициенты корреляции Рц1гц2 = = znltji2 величин yuv уц2 при неизвестны. Не- смещенную линейную относительно величин (4.9) оцеп-
168 ГЛ. 6. ОБЪЕДИНЕНИЕ ОЦЕНОК ку хс удобно представить в виде Xc^^c-yi, (4.10) i=l где _ пг тп У г = СцУИ + . . . + cin yin 2 Cil = 1, 2 с» = 1- 1 г 1=1 г=1 Оценка х*, на которой достигается нижняя грань ве- личины ♦ sup Dzc = sup 2 ciCjPij(z) ]/Dpi j/Di/j, z z 1,3=1 может быть представлена в виде (4.10): _ m — — п* х*=^с*у*, yt=^c*,yih (4.11) г=1 1=1 и, следовательно, при любых сг-, Си (г = 1, ..., т; 1 = = 1, ...» пг) Dx* = 2 cfc*p*j |/Di/* Dt/* sup Dxc, ij=l z где p*j — коэффициенты корреляции Q/Г, J/*). Если теперь при фиксированных с* к оценкам г/* применить результат п. 4.2, то из неравенства (4.11) получим, что среди коэффициентов „ с* отличен от нуля только коэф- фициент, соответствующий оценке у i с_ наименьшей дисперсией. Так как дисперсии оценок т/< находятся независимо от с* (г = 1, ..., тп), то в оценку х* долж- ны входить т/j, являющиеся для своих групп оценками с наименьшей дисперсией. Таким образом, показано, что оценку х* можно оп- ределять в два этапа: сначала, используя результаты § 2, нужно в каждой группе (4.9) найти несмещенную линейную оценку yi с наименьшей дисперсией, а за- тем в качестве оценки х* параметра а взять среди yi (1=1,9..Лт) оценку, имеющую наименьшую дис- персию. 4.4. Объединение т некоррелированных групп оце- нок. Предположим теперь, что т групп оценок (4.9) не-
§ 4. НЕПОЛНАЯ ИНФОРМАЦИЯ О КОВАРИАЦИЯХ 169 корродированы, т. е. = ® ПРИ В этом случае минимаксная оценка х* может быть найдена по формуле t=l где у* — минимаксная оценка в i-й группе, а с* = = ((Dy*)-1/(DJ/i )-1 + ... + (Dy™)-1). Равенство Drr* = inf sup Da;c c z проверяется посредством рассуждений, аналогичных рассуждениям предыдущего п. 4.3. 4.5. Объединение трех - оценок. Перенумерацией объединяемых оценок можно любой случай трех объ- единяемых оценок свести к одному из следующих че- тырех случаев: 1°. Все коэффициенты корреляции неизвестны (р12 == Zf, Р13 — Z2, р23 = 23). 2°. Один из коэффициентов корреляции известен (р!3 = Р13> = Р» Р12 = р23 = 2з)# 3°. Известны два коэффициента корреляции (Р12 = Р1г\ Р13 = Рп > р23 z)* 4°. Все коэффициенты корреляции известны (п _ п(о) п __ п(о) п _ п(о)\ \Р12 — Р12 , Р13 “ Р13 > р23 ~ Р23 /• _ Случай 1° был рассмотрен для произвольного числа объединяемых оценок. Случай 4° рассмотрен в § 2. .Для иллюстрации сведения задачи к задаче с услов- ным экстремумом рассмотрим более подробно случай 2°. Определим сначала границу области, на которой надо искать максимум величины ' з Q (с, z)> D +>2г/2+сзг/з)=<21(г) + 2 сМ + ЗсхСзр^СТд, ' • i=l ГДе ^i(z) = 2(С1С2-21Щ02 Ограничимся для простоты рассмотрением случая, когда а1 = о2 = о3 = а,. р=И=1. Тогда условия (4.6),
170 ГЛ. 6. ОБЪЕДИНЕНИЕ ОЦЕНОК определяющие нужную нам область, имеют вид 1 Z1 p 1 Z1 Z1 1 = 1 L-z?>0, Z1 p 1 z3 z3 1 = = 1 — Р2 — (г? — 2pzrz3 + г|) > 0. Таким образом, область в которой надо искать экстре- мум, определяется неравенствами 4 < 1, z2 — < 1 — р2. Дальнейшие вычисления не вызывают принципиаль- ных затруднений, и мы не будем их проводить до конца. Отметим, что рассматриваемый случай является частным по отношению к случаю, рассмотренному в п. 4.3. Действительно, оценки уч у2, у3 распадаются на две группы: у3 и у2. Коэффициенты корреляции между оценками из разных групп неизвестны, а внутри групп — известны. Таким образом, согласно выводам п. 4.3 нужно по оценкам yh у3, используя результаты § 2, найти наилучшую оценку у, а затем из оценок у и у2 выбрать оценку с меньшей дисперсией. В случае 3° условия (4.6) запишутся в виде 1 Р12 Р13 Р12 1 Р13 Z 1 — 1 — Р13 — Р12 + 2P12P13Z — 22 2^0, | Z Простые явные выражения для минимаксной оценки в данном случае не получены.
ГЛАВА 7 ОЦЕНИВАНИЕ ПО НЕОДНОРОДНЫМ ВЫБОРКАМ § 1. Неоднородность выборки Некоторые задачи, связанные с оценкой по неодно- родным выборкам, рассматривались в гл. 6. В этих за- дачах неоднородность возникала из-за различия экспе- риментов и методов обработки, используемых для по- лучения оценки общего параметра. Предполагалось, что объединяемые оценки хг являлись несме- щенными оценками параметра а = (г == 1, ..., г). Дисперсии оценок могли быть различными. Различие дисперсий допускалось заранее и дисперсии оцени- вались. Кроме неоднородностей такого типа могут возник- нуть неоднородности, менее поддающиеся учету. На- пример, некоторые из объединяемых оценок х{, ..., хг могут оказаться смещенными., В этом случае среди чисел Мл\, ..., Мяг йайдутся различные. Если этот факт установлен, то среди предложенных оценок есть смещенные. В этом случае требуется специальное ис- следование причин, вызвавших противоречивые резуль- таты. Как правило, объединять такие оценки не сле- дует. Иногда среди оценок xl9 ..., хг выделяется боль- шая группа однородных оценок и предполагается, что оценки оставшейся меньшей группы являются смещен- ными. Конечно., может оказаться, что оценки меньшей группы получены по результатам более качественного эксперимента и именно они являются несмещенными. В выборке, получаемой в ходе одного эксперимента, регулярная неоднородность может возникать из-за ухудшения работы прибора. Кроме того, неоднород- ность часто возникает из-за случайных кратковремен- ных нарушений условий измерения. В результате по- являются измерения, резко отличающиеся от осталь- ных. Для выявления таких аномальных измерений предлагались различные критерии. По выборке, полу-
172 ГЛ. 7. ОЦЕНИВАНИЕ ПО НЕОДНОРОДНЫМ ВЫБОРКАМ ченной отбрасыванием аномальных измерений, пред- полагалось находить оценки искомых параметров. Та- кой подход к оценке параметров в условиях загрязнен- ной выборки представляется естественным, однако исследование свойств найденных оценок является во многих случаях весьма сложной задачей. Другой подход к оценке параметров по загрязнен- ным выборкам рассматривается в работе [51]. В каче- стве модели загрязненных измерений предлагается вы- борка х2, ..., хП1 где Р {?1 < х} = (1 — 8) G (х — а) + &Н (я), 8 — фиксированный параметр (доля загрязнения), G Се —а)известная функция распределения, ЯСе) — неизвестная функция распределения из некоторого класса распределений. Для неизвестного параметра а ищется «наилучшая» оценка при «наихудшей» Н(х). Качественно описанные в данножпараграфе задачи более детально рассматриваются в следующих пара- графах. § 2. Критерии неоднородности объединяемых оценок В § 3 гл. 6 по независимым оценкам общего пара- метра а и по оценкам дисперсий этих оценок была построена оценка а в предположении, что все исходные оценки являются несмещенными. Таким образом, чтобы воспользоваться формулами (3.3), (3.4) гл. 6, нужно сначала убедиться хотя бы в том, что объединяемые оценки однородны, т. е. имеют одинаковые математиче- ские ожидания. Пусть xi, .. .^хг — независимые оценки параметра а. Предположим сначала, что = a, = (& = 1, •.г) (2.1) и Xi при ть ->_<» асимптотически нормальны с парамет- рами (а, ъЛп). Пусть в нашем распоряжении имеются также состоятельные оценки s\ параметров а*. По- ложим (г \ I WT--W 72. — I / 24-^М2, (2.2) 1=1 si /I
§ 2. КРИТЕРИЙ НЕОДНОРОДНОСТИ 173 где 5а=2‘(Н <2-3) i=l V< / Для проверки гипотезы Яо, состоящей в том, что Mrq = Мя2 = ... = Mzr, (2.4) можно воспользоваться величиной цг: Т]г = (^г я)2(2.5) Если значение цг для полученной реализации оценок Xi, ..хг превосходит некоторое число С, то гипотезу (2.4) следует отвергнуть. Число С выбирается так, чтобы Ро {ПгС> = где Ро(.)— распределение вероятностей, соответствую- щее гипотезе Яо. Таким образом, а — уровень значимо- сти'критерия или вероятность ошибки 1-го рода, т. е. вероятность отвергнуть основную гипотезу, когда опа верна. В качестве конкурирующей гипотезы выберем гипо- тезу состоящую в том, что среди чисел Мгг<= (i — 1, ... г) (2.6) есть разные. Ошибка 2-го рода Р = Pi {Лг < £}• е Здесь Pi(j— распределение вероятностей, соответствующее гипотезе • Найдем асимптотическое распределение цг при ги- потеза Яо, когда п^оМ • п и aAn) а< (0 < щ < оо) при п -> оо. Покажем сначала, что исследование предельного распределения цг при гипотезе Но можно заменить ис- следованием предельного распределения более простой величины i = (2.7) i=l ai где <=1а< л (2.8)
174 ГЛ. 7. ОЦЕНИВАНИЕ ПО НЕОДНОРОДНЫМ ВЫБОРКАМ Для этого достаточно показать, что т]г — Цг при п -> °° сходится по вероятности к 0, т. е. для любого е > О lim'P {| i]r — j]r | > е) =4). (2.9) 21->оо Докажем сначала лемму. Лемма 2.1. Пусть функция у(х, у) определена и непрерывна в области G = {(я,'/):— оо <гс{<оо, i = 1, . .f; | г/{ — г/{0) |<Л, i = 1,.. А > 0 — некоторая постоянная-, G = 1, — слу- чайные величины, у которых М 11| С при любых i и п; fni сходятся по вероятности к у^ при п-+ оо; последовательность 1-п сходится по вероятности к 0. Тогда последовательность произведений 1пф(£п1, ••• .. ., ^nL • • •> сходится по вероятности к 0 •при п-+ оо. Доказательство. Пусть N>0, 80>0, 81 > 0 (8i < Л) — некоторые постоянные и Фа = max I ф (х, у)\, GN = G(] {(я, у):\ Xi\<N, (x,y)=GN . _____i=l, Тогда Р {I <Р (&\ • • •, • • •, I < Фп, | In | < е0} > >1-2 Р{|^|>^}-2 рИМЫ- г=1 г=1 - Р( IUI >‘.}> 1 - 5 - Р(1Ы>М - -2 Р { 1Й1 - | > «,}, г=1 так как Р {||>7V}< М [£$|. Для заданных 8>0 и 6>0 выберем N, е0, 81 так, чтобы при п>п, выполнялись неравенства tc 6 7V 2 ’ < е’ Р {ILI > е0} < 2 Р {| I > М <
§ 2. КРИТЕРИЙ НЕОДНОРОДНОСТИ 175 Тогда при п > п0 ' ' Pl lute.',’...Й’.Й, ...,Й’)|<е1> >Р||<р(Й’, ...,Й’|<Ф«.Еп|<е«|>1-6- Лемма доказана. Докажем теперь (2.9). Если в формулах (2.5) и (2.7) от величин Xi перейти к величинам xi = х^ — а. то вид формул не изменится, и, следовательно, можно сразу считать, что — 0. Представим величины т]г и тр в виде Так как М^= 0, то = следовательно, М | /й | /M(r^) = а,/ /ай (2.12) Р Обозначим сходимость по вероятности символом =^; за- метим, что при п оо у 21 lX V 1!ру^1 п П «2 Jnrf 2 ’ л J—d 2 i=l i=i Оj Утверждение (2.9) следует из леммы 2.1, формул (2.11) и соотношений (2.12), (2.13).
176 гл. 7. ОЦЕНИВАНИЕ ПО НЕОДНОРОДНЫМ ВЫБОРКАМ Сходимость распределений величин тр к ^-распре- делению доказывается обычными рассуждениями. Теорема 2.1. Если распределение величин х, (г = 1, ..., г) соответствует гипотезе (2.4), то при п-+ оо распределения величин т]г сходятся к распределению %2 с г — 1 степенями свободы.. Доказательство. Положим = = 1, ..., г). Тогда \i=l Ui v JI Выберем ортогональное преобразование следующего вида: Zi = x-S; zi = cilyl + ci2y2 + ... + cryr (1 = 2, ..., г). (2.14) Из второй формулы (2.10) получаем, что п = 2 уХ-» = 2 4 (2.15) i=l i=l Отсюда следует утверждение теоремы, так как z2, ... ..., zr асимптотически независимы и асимптотически нормальны с параметрами (0, 1). Из доказанной теоремы й из утверждения (2.9) получаем следующую теорему. Теорема 2.2. Если распределение величин xt (i = l, ..., г) соответствует гипотезе Но, то при п-+<х> последовательность распределений величин цг сходится к yj-распределению с г — 1 степенями свободы. Для определения вероятности ошибки 2-го рода нужно исследовать распределения величин т|г, тр при гипотезе когда среди аг = есть различные. При различных at нельзя общий случай свести к случаю а^ = = 0, так как в новых переменных х^ — х^ — ai вид ве- личин т]г, т]г изменяется. В доказательстве близости распределений и т)г прп гипотезе Но существенно использовали равенство = 0. Таким образом, при- веденное для Но доказательство не переносится на рас- пределение с Hi. Найдем сначала математическое ожидание Цг.
§ 2. КРИТЕРИЙ НЕОДНОРОДНОСТИ 177 Теорема 2.3. Если распределение величин хг (iel, ..г) соответствует гипотезе Hi, то Мрг = г \ 2 А (J? dk— §2 Доказательство. Воспользуемся второй форму- лой (2.10). Нетрудно проверить, что Подставив этп выражения во вторую формулу (2.10), получим утверждение теоремы. Мы предполагали, что величины Xi лишь асимптоти- чески нормальны. При этом предположении величина т]г может иметь нецентральное ^-распределение только в пределе. Нетрудно проверить, что величина не имеет предельного распределения. Действительно, ве- личина ’ 6п = п 2 ? (”) 1 2 o2/ S In az (тг) ---~al 21 (2.16) входящая в Мцг, неограниченно возрастает. Если предположить, что Хг распределены нормально, то, воспользовавшись (2.14), величину тр можно пред- ставить в виде (2.15). При гипотезе величины Zi (1 = 2, ..., г), входящие в (2.15), уже не имеют нуле- вого математического ожидания, но являются независи- мыми нормально распределенными с единичными дис- персиями. Таким образом, величина т|г имеет нецент- ральное %2-распределепие. Параметр нецентральное™ определяется равенством (2.16). Сформулируем полу- ченное утверждение в виде следующей теоремы. 12 В. А. Ватутин и др.
178 ГЛ. 7. ОЦЕНИВАНИЕ ПО НЕОДНОРОДНЫМ ВЫБОРКАМ Теорема 2.4. Если х{ (г=1, ...» г) — независи- мые нормально распределенные величины с Mxj = а{, = вМщ, то величина цг, определенная формулой (2.7), имеет нецентральное ^-распределение с параметром нецент- ральности 6ni определяемым формулой (2.16). Вопрос о возможности аппроксимации распределе- ния тр нецентральным ^-распределением требует до- полнительного исследования. § 3. Оценка параметров по загрязненной выборке Рассмотрим методы оценки параметров, основанные на отбрасывании аномальных измерений. Пусть изме- рения образуют независимую выборку Xi, х2, .хп, Хп+ь (3.1) где Р {Xi< х} = F (х) (г = 1, ..., и + 1),”а = М^, а2 = Dtfj. Ниже для описания выборок, содержащих аномальные измерения, вид функции Ftx) будет уточнен. Положим = т 2 хк, 4= 2 — Xi)2. (3.2) k^i k^i Оценки (3.2) являются несмещенными оценками пара- метров а и о2. Для выделения аномальных измерений используются различные критерии. Ограничимся рас- смотрением критерия, основанного на сравнении про- веряемого измерения Xi со средним Xi части выборки, оставшейся после выбрасывания Xi. Введем индикаторы 1, если О,- если (3.3) где L > 0 — некоторая постоянная. Измерение хг будет использоваться для построения оценки, если г, = 1, и не будет использоваться в противном случае. Некото- рые свойства индикаторов щ совпадают со свойствами более простых индикаторов у<0) = (1, если |а —- 4 * ( Oj если |а — ‘ '
§ 3. ОЦЕНИВАНИЕ ПО ЗАГРЯЗНЕННОЙ ВЫПОРКЕ 179 В следующей лемме устанавливается близость инди- каторов Vi и i40). - . Лемма 3.1. Если Мя* < оо2 L > Lo > 0 и при лю- бых х', х" iFUO-PGr")! <С№-х"\, (3.5) где Сi >0 — некоторая постоянная, то существует по- стоянная С2 > 0 такая, что м|р{ —Pi0)|<-^=. (3.6) 1 уп Доказательство. Представим левую часть не- равенства (3.6) в виде м IV - ^0)/ = Р h ф = л + Р2,_ (3.7) где Рх = Р {| — а | < Lg, | Xi — xi | > Lsi}r P2 = P {| х} — a | > Lo, j Xi — Xi | < Lsi}. Нетрудно проверить, что Pi Рц "Ь Р<2, где Рц = P {*i < a + Xi > xi + Zs}},_ P12 — P < a — La, Xi> Xi — LsJ. Используя неравенство (3.5), получим' Pn<M|P(a + Lo)-P(^ Ci (М | Xi — a | + ZM | st — о |). Отсюда и из неравенств M|xi —a|< /Dxj V n 1 1 1 S. + О | О 11 1 где Cs — некоторая постоянная, получаем Рц G I )• Аналогично оценивается Р12. В ре- 12*
180 ГЛ. 7, ОЦЕНИВАНИЕ ПО НЕОДНОРОДНЫМ ВЫБОРКАМ зультате для Рц получаем оценку нужного вида. Для завершения доказательства леммы пужпо оценить вто- рое слагаемое Р2 в (3.7). Оценка А получается анало- гично оценке Л. Теперь можно установить сходимость при п -> о© величины (3.8) п +1 ’ ' 7 воспользовавшись сходимостью более простой величины г(о) | „(о) I । (о) '(о) = 1 2 + vn+i (3.9) п 1 Нетрудно проверить, что М?40) = рь, где pL == F(a 4- Lo) - F(a - Lo). (3.10) Величины z?i0) (Z = 1, ..., тз4-1) независимы, и, следо- вательно, согласно закону больших чисел Р v^^pL (3.11) при тг -> оо. Теорема 3.1. Если выполнены условия леммы 3.1, то величина v, определенная равенством (3.8), при п-+ оо сходится^по вероятности к величине pL, опреде- ленной формулой (3.10). Доказательство. Из формулы и леммы 3.1 получим Отсюда для любого 8 > 0 находит оценку Р { I V — Z2(0) I > е} — М I V — Р(0) | е е |/ Следовательно, и — => 0 при п оо. Воспользовав- шись (3.11), получим утверждение теоремы.
§ 3. ОЦЕНИВАНИЕ ПО ЗАГРЯЗНЕННОЙ ВЫБОРКЕ 181 Величина v является долей оставшихся измерений. Положим " V1 + + • • + ^п+1*„+1 4 + v2 + . . . + рп+1 (3.12) Покажем, что х является состоятельной оценкой а. Раз- ность х — а можно представить в виде х — а = — (у — аи) (1--------, (3.13) Pl \ v / где у = (ед + ... + vn+lxn+l)/(n + 1). Исследование пре- дельных распределений х — а можно заменить иссле- дованием предельных распределений более простой величины. Лемма 3.2. Если выполнены условия леммы 3.1, то при п-> оо величины х — а и —(.У — av) пРи и той же нормировке либо обе имеют одно и то же предельное распределение, либо обе не имеют предель- ного распределения. , _ Р Доказательство. Так как при п <», то при п -> оо и — Рт* Р 1-----=>1. V Отсюда и из формулы (3.13) следует утверждение леммы. Теорема 3.2. Если выполнены условия леммы 3.1 и F(x + «) = !- F(a — х\ то при п оо « _ Р х=>а. Доказательство. Из леммы 3.2 следует, что достаточно при п -> оо доказать сходимость по вероят- ности к нулю последовательности величин Пп = У — (LV = (zx — а) + ... + р„+х (хп+1 — а)]. (3-14) Не ограничивая общности, можно положить а= 0.
182 ГЛ. 7. ОЦЕНИВАНИЕ ПО НЕОДНОРОДНЫМ ВЫБОРКАМ Пусть Пп0) = + • • • + 4Ui*n+i). (3.15) Тогда Th — Tln0) = JTTpi K^i — yi0)) #i+ • • • + (*h+i—^+J. Так как согласно лемме 3.1 м I Vi - v<y I ] Xi IC /M(yi-^0))2D^ = = о ]/ м | Pi - j4o) i < g /c;/«1/4, TO М|ты-т)Г|<-£-4, (3.16) где C>‘0 — некоторая постоянная. Из неравенства Р (3.16) следует, что т]п — Лп' => 0 при п Таким р образом, осталось докааать сходимость Т1 => 0 при п -> оо. Нетрудно проверить равенство La [ xdF (х) = Q. — La Отсюда и из независимости величин (Z = 1, ... Р ♦ ..,n+ 1) получаем, чго ц^0)=>0 при п -> оо. Теоре- ма доказана. В качестве одной пз моделей «загрязненной» вы- борки может быть рассмотрена выборка (3.1), у кото- рой х х F(x) = (l-e)-A J J —оо ' О / _оо (3-17) где фо(н), фДи) — симметричные относительно п = 0 пдотпости распределений с пулевыми-математическими ожиданиями и единичными дисперсиями. Параметр 8 (О < е < 1) характеризует долю измерений, полученных ’ при нарушении основного процесса измерений. Будем
§ 3. ОЦЕНИВАНИЕ ПО ЗАГРЯЗНЕННОЙ ВЫБОРКЕ 183 предполагать, что Oi>a0. Из (3.17) находим Mrq = a, D#i = а2 — (1 — Ъ) + еа^ и Ьо/а0 £<7/(7! pL = 2 (1 — 8) J <р0 (и) du + 2е J <р£ (u) du. о о Из неравенства 2 о2 ^ = (1-е) + е4>1 °о ' ао получаем следующее неравенство: < ’ г> Pl > Pl = 2 (1 — е) J <р0 (и) du. (3.18) О Неравенство (3.18) дает некоторую оценку 8, так как плотность <р0(я) считается известной, а для pL есть состоятельная оценка v. Для сравнения оценки х с оценками, полученными другими методами, нужно знать асимптотическое рас- пределение х. При исследовании асимптотического рас- пределения х не удается заменить исследование после- довательности (3.14) последовательностью (3.15). В работе [50] рассматривалась оценка п+1-[а(п+1)] *“= п — 14-2 [а(п+ 1)] a’(i)’ (Зф19) Wa(n+1)]+1 где х(1) х(2) С ... #(п+1) — вариационный ряд, по- строенный по выбЬрке (3.1). В работе [50] было пока- зано, что при некоторых ограничениях на симметрич- ную относительно # = 0 плотность распределения p(z) величины Xi — а оценка ха при п -> оо асимптотически нормальна с математическим ожиданием а и диспер- сией, равной (Та/и, где На = 2az2a P{xi — а > za} = а. za + f x2p(x)dx ~za (1 - 2а)2, (3.20) Подставляя в (3'20) плотность
184 ГЛ. 7. ОЦЕНИВАНИЕ ПО НЕОДНОРОДНЫМ ВЫБОРКАМ распределения»(3.17) са = 0, получим za (3.21) Обзор оценок,’аналогичных оценкам данного пара- графа и следующего, содержится в работе [15]. § 4. Минимаксные оценки Рассмотрим минимаксный подход к оцениванию па- раметров по загрязненным выборкам, предложенный Хубером (см. [51]). Для простоты изложения будем предполагать выполненными более сильные условия по сравнению с условиями работы [51]. Пусть ^i, я2, .. , хп — загрязненная выборка, для которой плотность распределения Xi имеет вид z ч 1 — 8 (х — а\ , 8 (х — а' = —Фо(—)+-ф1 ао а. (4.1) где е (0 < 8 < 1), Оо — известные параметры; ср0(х) — известная симметричная относительно х = 0 плотность распределения; ф1(я) — неизвестная симметричная плот- ность распределения; а — неизвестный оцениваемый параметр. Таким образом, множество возможных рас- пределений измерений определяется формулой (4.1). Зададим теперь класе оценок. Пусть р(я)^ 0—не- прерывная строго выпуклая функция такая, что lim р(я) = оо. Положим |х|-»оо П Q (z) = 2 р (х{ — z). г=1 (4-2) Минимум функции Q(z) достигается в единственной точке z = Tn = 71nU1, ..хп). Величина Тп(х{, ..., хп) рассматривается в. качестве оценки параметра я. Оцен- ка Тп зависит от выбора функции р(я). Оценки, полу- чаемые минимизацией (4.2), называют ^/-оценками.
§ 4, МИНИМАКСНЫЕ ОЦЕНКИ 185 При р(я) = хг оценкой Тп является обычное среднее арифметическое. Если р(я) = |яг|, то оценка Тп совпада- ет с выборочной медианой. Оценка Тп является оцен- кой максимального правдоподобия, если р(я) = = —In + а). Положим 1р' (я), если производная р' в точке х существует; (р' (х — 0) + р' (х + 0)) в противном случае. Если ф(я) непрерывна, то оценка Тп является решени- ем уравнения п 2 ф Тп) = о. i=l (4.3) Определим функцию X(z) равенством оо X (z) = Mij) (Xi — z) — J ip (u — z) p («) du. —oo Утверждение об асимптотической нормальности Тп, полученное в [51J, в рассматриваемом случае можно сформулировать в следующем виде. Теорема 4.1. Пусть %(а)=0, в точке z = a функ- ция k(z) имеет производную и %'(а)<0. Кроме того, предполагается, что функция оо j ф2 (х — z) р (х) dx = М (ф2 (х± — z)) — 00 конечна и непрерывна в точке z = a. Тогда оценка Тп при п-* оо асимптотически нормальна с математиче- ским ожиданием а и дисперсией — У2(р, р), где V2 (Р, Р) = ( f ^{х-а)р (х) dx'j —U-. (4.4) \ А <а)) Рассмотрим несколько примеров, иллюстрирующих использование теоремы 4.1. Пример 1. Пусть р(я)=я:2 и, следовательно, функция ф(я) = 2х непрерывна. Уравнение (4.3) в этом
186 гл. 7. ОЦЕНИВАНИЕ ПО НЕОДНОРОДНЫМ ВЫБОРКАМ случае имеет следующий вид: 2 2 - Тп) - 0. 1=1 п 1 Отсюда Тп =— z, xh. Функция )dz) вычисляется в яв /i=i * ном виде X (z) = М (2 — z)) = 2 (а — z). Следовательно, V(a)==—2. Кроме того, оо М'ф2(х1 — а) = 4 J (х— а)гр (х) dx = 4<j2, V2 (р,/>)=<j2. — 00 Таким образом, оценка Тп при п -> оо асимптотически нормальна с математическим ожиданием а и дисперси- ей о2//г. Пример 2. Положим р(я) = Ы. Функция 'Ф(я) = 1, если х > 0; О, если х — 0; — 1, если х < О, разрывна. В этом случае оценку Тп нужно искать, ми- нимизируя непосредственно функцию (4.2), которая в рассматриваемом случае имеет вид п <2 (г) = 2 | xj - z |. i=l Обозначим £(i) С х{2) С ... Х(П) вариационный рйд ис- ходной выборки. Если п нечетно, то нетрудно прове- рить, что Q(z) минимально^ когдаz ^ Тп = .. \L2] + 1) Действительно, пусть z возрастает от —оо до я(1). Тогда все слагаемые Q{z) уменьшаются. При переходе z че- рез слагаемое с х^} начинает увеличиваться, но каждое из остальных Слагаемых уменьшается па вели- чину, равную абсолютной величине приращения .сла- гаемого с я(1). Очевидно, что функция Q{z) будет убы- вать до точки z = x,fni р Аналогично рассматрива- ется случай четного п. Если п четпо, то оценкой Тп является любое- число, принадлежащее отрезку
4. МИНИМАКСНЫЕ ОЦЕНКИ 187 Гот' "([Si+‘]]Так ка“ оо оо Мф2 (zx — а) = J i])2(u — d)p(u)du = j p(u)du = 1, —оо — оо Z X(z1 = Mi|)(^i—z) = P{x1>z}—P{xx<z}=l—2 j" p(u)du, < —оо X' (а) = — 2р (а), то V2(p, р) = 1/4р2(а). Оценка Тп асимптотически нор- мальна с математическим ожиданием а и дисперсией 1/4п/>2(а). Пример 3. Пусть теперь p(w) = Г 1 2 -тг если если |u|sS 1«Г> Z к-. Z1' к- (4.5) Отсюда и, если | и | 1р(и ) = к, если z и >к-, к. если и < Z-k. Следовательно, *ф'(и) = 1, если Ы Л, и 1|/^) = О, если |и| > к. Оценка Тп является решением уравнения 2 (Xi-Tn) + k 2 -к 2 =о. х^: Х|’Х|-Тп>/1 Xi'Xi~Tn<-k Так как X(z) =М'ф(д;1 — z\ то X'Cz) = —Мг|/Сг1 — z) и ft+a V (a) — J р (и) du. -h+a Кроме того, учитывая симметричность р(и +а\ найдем Мг|?2 (#i —- а) = J (и — а)2 р (и) du + 2к2 J p(u)du. —Ma k+a Оценка Тп при п оо асимптотически нормальна с математическим ожиданием а и дисперсией V2(p, р)/п1
188 ГЛ. 7. ОЦЕНИВАНИЕ ПО НЕОДНОРОДНЫМ ВЫБОРКАМ где (kA-a J (и — а)2 р (и) du + -kA-а со \ / / kA-а \ 2 + 2к2 р (и) du\[ j p(u)duj. (4.6) k+a JI \-kA-a J . Приведем теперь без доказательства основной ре- зультат работы Хубера [51]. Пусть функция ф0(.г), входящая в* (4.1), дважды непрерывно дифференци- руема, множество точек Хо = {х: ф0Сг) > 0) связно и функция —In фо (ж) выпукла на множестве Хо. В этом случае асимптотическую дисперсию V(p, р) лю- бой М-оценки Тп параметра а можно представить в виде У(Р р}= (*1-а) Р) (Мг|/(ях — а))2 ’ где г|;(я:) = р'(л:). В [51] показано, что существуют плотность распределений р*(х) вида (4.1) и функция р*Сг), для которых выполняются равенства sup V (р*, р) = V (р*, р*) .= inf V (р, р*). (4.7) V р Функции р* и р* найдены в явном виде. Пусть .х0, xj — максимальный интервал, на котором /х — а\ I t (х — а \ Т7 гz Фо ——j/ф -------] и xQ, xtl К удовлетворяют соотношению
§ 4. МИНИМАКСНЫЕ ОЦЕНКИ 189 Тогда \ 0 / если х $ *0; р* (х) = id если z0< С х < хг\ d- •>, \ 0 / если х п 4*(ж) = — (р*(.г))7р*(я). Оценка Т* с указанной функцией является оценкой максимального прав- доподобия для распределения с плотностью р*(х). Из равенства (4.7) следует, что при любом выборе р(я) в случае, когда плотностью распределения Xi является р*(х), для асимптотических дисперсий выполняются не- равенства F(p*, р*) < У(р, р*). Такшм образом, при наихудшем выбор© р* оценка, оп- ределяемая р*, является паилучшей. Подробное изло- жение методов описанного типа содержится в моногра- фии Хубера [52]. При практическом использовании минимаксного подхода Хубера полезно детальное исследование воз- можного класса распределений (4.1). Слабые ограниче- ния на функцию ф1(ж) могут приводить к неоправдан- ному завышению дисперсии рассматриваемой оценки.
ГЛАВА 8 МЕТОД РЕГУЛЯРИЗАЦИИ И СМЕЩЕННОЕ ОЦЕНИВАНИЕ § 1. «Обратные» задачи Значительная часть физических экспериментов ос- нована па измерении параметров или функций, кото- рые тем или иным способом связаны с вектором пара- метров или функциями, определение которых является целью проводимого опыта. Обозначим х измеряемую величину (вектор или функцию), у — результат воздействия х на прибор. В общем случае можно считать, что Ах = у, (1.1) где А —некоторый оператор. Величина у определяется из эксперимента с ошибкой; оператор А обычно изве- стен недостаточно точно. По приближенному значению у величины у и приближенному виду А оператор А требуется оцепить х. Уравнение (1.1) часто оказывается интегральным уравнением. Например, при оценке вероятности взаи- модействия s(E) частицы, имеющей энергию £*, интен- сивность Х(Е") регистрации этой частицы как частицы, имеющей энергию £", определяется формулой оо * X (Е') = f р (Е) s (Е) А (Е, Е') ЛЕ, (1.2) — оо где р(Е) — плотность распределения энергии исследу- емой частицы, А(£’, £")-—функция отклика. Функция р(Е) зависит от источника исследуемых частиц4, А(Е, Е') является характеристикой прибора. Эти функ- ции могут быть измерены во вспомогательных экспе- риментах. Интенсивность ХСЕ") оценивается по резуль- татам основного эксперимента. Если вид функции s(E) известен заранее и нужно оценить только некоторые параметры, входящие в фор- мулу для $(£), то можйо решать задачу классическими
§ 1. «ОБРАТНЫЕ» ЗАДАЧИ 191 методами. Например, написать совместное распределе- ние чисел отсчетов в каналах (см. гл. 2) и воспользо- ваться методом наибольшего правдоподобия. Во многих задачах вид измеряемой функции x(t) неизвестен и неизвестен вид плотности распределения непосредственных измерений y(t). Кроме того, «обрат- ная» задача (1.1) может оказаться некорректной (см. [39]), т. е. небольшие изменения у и А могут приво- дить к значительному изменению х. Для решения такого рода задач А. Н. Тихоновым (см. [39]) был предложен метод регуляризации, осно- ванный па учете дополнительной информации самого общего характера (например, типа гладкости .оценива- емых функций). Этот метод позволяет находить устой- чивые решения. В статистической интерпретации тео- ремы о существовании регуляризовапных решений, приведенные в [39], для широкого круга задач явля- ются теоремами о существовании состоятельных оце- нок Сем. [44], [45]). Рассматриваемые в регрессионных задачах «гребневые» оценки (см. [4], [13], [33]) сов- падают с регуляризованными решениями систем линей- ных алгебраических уравнений. При оценке качества регуляризовапных решений следует обратить внимание на два обстоятельства. Во- первых, регуляризованпые решения оказываются сме- щенными и, следовательно, в качестве оценки точно- сти нужно использовать среднее квадратическое откло- нение оценки от. оцениваемого параметра, а не диспер- сию. Во-вторых, метод дает хорошие результаты в тех случаях, когда в качестве оценки точности нужно ис- пользовать характеристики, относящиеся ко всей сово- купности оцениваемых параметров. В регрессионных задачах такой характеристикой является сумма дис- персий оценок («полная дисперсия»; см. [4], [13]), или М(х — х)(х — хУ, где £ —оценка вектора х. Естественно качество оценки вектора параметров, пли неизвестной функции, рассматривать в зависимо- сти от их дальнейшего использования. Пусть, напри- мер, требуется найти интеграл от неизвестной функ- ции по заданному отрезку. Интеграл может быть за- менен интегральной' суммой: / »= G0! + . . . + Cv6.v, где Ci, ..., известные коэффициенты интегральной
192 гл. 8. МЕТОД РЕГУЛЯРИЗАЦИИ И СМЕЩЕННЫЕ ОЦЕНКИ суммы, а 01, ..— значения неизвестной функции в N точках. Если 9jV — регулярпзованиые оценки 01, . . ., 0JY, то I = с±0± + ... + cnQn — регулярпзованная оценка I. Качество оценки Т есте- ственно оценивать величиной М(/ — /)2. § 2, Линейные алгебраические уравнения Рассмотрим следующую задачу. Пусть требуется определить вектор параметров z(0) = (4°\ • • •, Z/i0)), о котором известно, что он является минимальным по длине, h h“»ll! = 2 MX i=1 решением системы алгебраических уравнений Az = u, (2.1) где А == (ai}) — (m X /с)-матрпца, z = (zb ..., zft)', п== = (щ, ..., umY. Таким образом, предполагается, что си- стема (2.1) совместна. Интересующее нас решение всег- да существует и единственно. Однако в прикладных задачах точные значения элементов матрицы А и координат вектора и неиз- вестны; имеются лишь их приближенные значения u' = (uh ..., uh). (2.2) По этим данным требуется найти приближенное зна- чение z вектора z(0). Такого типа задачи рассматриваются и в матема- тической статистике, и в вычислительной математике. С точки зрения математической статистики определе- ние приближенных значений z параметров z(0) по ре- зультатам измерений (2.2) является обычной задачей оценки параметров. В вычислительной математике сна- чала устанавливается подходящее понятие решения приближенной системы уравнений Az = u, (2.3) а затем указываются методы решения. Отметим, что система (2.3) чаще всего оказывается несовместной.
§ 2. ЛИНЕЙНЫЕ АЛГЕБРАИЧЕСКИЕ УРАВНЕНИЯ 103 • А. II. Тихоновым (см. [39]) был предложен общий метод, позволяющий находить приближенные решения уравнений вида (1.1), в которых А и у известны лишь с ошибками. Эти приближенные решения устойчивы по отношению к малым изменениям исходных данных. Решение, полученное с помощью этого метода, назы- вают регуляризоваппым. Рассмотрим некоторые вероятностные свойства ре- гуляризованных решений на примере алгебраической системы уравнений. В работе [16] рассматривалась си- стема (2.3) в случае, когда матрица А=А известна, а вектор й распределен нормально с известной кова- риационной матрицей. Вероятностные свойства регуля- ри^ованпых решений общей системы (2.3) изучались в [441, [45]. Регуляризоваппое решение z(a) системы (2.3) сбли- жается с истинным решением z(0) системы (2.1), когда величина отклонения б приближенных значений А, й от истинных 4, и стремится к 0 и при этом параметр регуляризации a = a(6) тоже стремится к 0. Для на- хождения z(a) системы (2.3) в работе [39] предлага- ется минимизировать функционал MAz. и, Al = WAz - й\\2 + allzll2, (2.4) k где || х ||2 = 2 х?. 1=1 Существует единственный вектор z(a), минимизиру- ющий* (2.4). Этот вектор является единственным реше- нием системы уравнений (al + A'A)z = А'и, С2.5) где /—единичная (к X W-матрица. Теорема 4 (гл. III [39]) устанавливает сближение z(a) = (a/ + 4'4')“14'w с истинным решением z{0\ когда б -> 0, aea(6)->0. Отметим, что при a = 0 минимизация (2.4) приво- дит к обычному методу наименьших квадратов. Коэф- фициент при а в правой части (2.4) называют стабили- зирующим функционалом. Введение стабилизирующе- го функционала приводит к устойчивости решения, минимизирующего (2.4). Выбор стабилизирующего функционала проводится с учетом дополнительной ап- - 13 В. А Ватутин и др.
194 ГЛ. 8. МЕТОД РЕГУЛЯРИЗАЦИЙ И СМЕЩЕННЫЕ ОЦЕНКИ рпорной информации о характере решения рассматри- ваемой задачи. Теоремы о существовании регуляризованных реше- ний в статистической интерпретации являются теоре- мами о существовании состоятельных оценок. Приведем в качестве примера статистический аналог теоремы о существовании регуляризованного решения для систе- мы алгебраических уравнений (см. [39], гл. III, тео- рема 4). Будем предполагать, что точная система уравнений (2.1) совместна. Пусть величины ац = ац(п), Ui = Ui(n) являются оценками ац и щ и сближаются с ними, когда п оо. Параметр п может быть, например, объемом выборки, по которой получены оценки и,. Теорема 2.1. Пусть а(?г)>0, 6(тг) > 0 — любые функции, удовлетворяющие при п-+ оо условиям а(п) ! О, 8(п) 4 0, 6(т?) = о(аМ). Если при всех I, j lim Р {| ai} (п) — ai} | < 6 (п)} = ~ (2.6) lim Р {] (п) — щ | < 6 (n)} = 1, П->оо то для любого е > О lim Р {| Zi“(n)) — г(40) | < е) = 1 (г = П-»оо где z{a{n)) — решение системы (2.5) с а = а(п). Приведенная теорема является переформулировкой теоремы 4 гл. III [39]. Отметим, что оценка 2(а) существует всегда и для ее вычисления не требуется никакой информации о распределении величин uit Для оценок наибольше- го правдоподобия нужно знать вид совместного рас- пределения ац, Ui. Кроме того, оценки наибольшего правдоподобия не всегда существуют. При минимальной информации (2.6) об оценках Uij, Ui естественно в качестве оценки z(0) брать вектор 2(а), минимизирующий (2.4). Если известна дополни- тельная информация об оценках ац, uh то вместо функ- ционала (2.4) можно подобрать другой функционал, минимизация которого приведет к оценкам с меньшей дисперсией. В случае, когда матрица А известна точно и известна ковариационная матрица вектора й, в рабо- те [16] выбран функционал, зависящий от ковариаци
§ 2. ЛИНЕЙНЫЕ АЛГЕБРАИЧЕСКИЕ УРАВНЕНИЯ 195 онной матрицы. Сравнение регуляризованпых решений с оценками, полученными методом наименьших квад- ратов, проводится в § 3 в случае, когда определитель матрицы А'А отличен от 0. Теорема 4 гл. III [39], аналогом которой явля- ется теорема 2.1, доказана в [39] методом, пригодным для обобщения на уравнения в бесконечномерных про- странствах. Поясним на примере, как нужно выбирать функции и б(п). Рассмотрим частный случай си- стемы (2.1): = щ (f— 1, ..., к), (2.7) где ац^0 0 = 1, ..., г), aii = u>i = 0 0 = r+l, ..., к), и, следовательно, 40)= 0 = 1, * *., г), 40) = 0 (Z = = г + 1, ..., к). Пусть ац(п), uj(n) — оценки ац, щ, удовлетворяющие условиям (2.6). Система уравнений (2.5) в этом случае имеет вид (а + а^) zi = (i = l,...,k). (2.8) Отсюда 7(a) — *г — аНиг 0 = 1, >..,к). При 1 = 1, ..., г величины а„ сходятся по вероятности ~ р к ац^0; кроме того, а(п) -> 0 при п->оо. Сле- довательно, при п -> оо ~(a(n)) _ aHui Р aiiuj _ uj = (о) 1 а(п) + аг?. а?. «н ‘ ’ Пусть теперь i > г. Так как ац = = 0, то из условий (2.6) вытекает, что вероятность неравенств \ui\ <6(п), laiil < 6(п) и неравенства |^а(п)) аии а (") + «и < б2 (п) а (п) (2.9) при п -+ оо стремится к 1. Из неравенства (2.9), учиты- вая, что б(п) = о(а(п)), находим z^(n)’io (i = г + 1, ..7с). . Сходимость оценки г|а(п)) (i = 1, ..Тс) к решению 13»
196 ГЛ. 8. МЕТОД РЕГУЛЯРИЗАЦИИ И СМЕЩЕННЫЕ ОЦЕНКИ (i=l, ..к) для систем вида (2.7) доказана. Практи- ческий выбор параметра а обсуждался в ряде работ, ссылки на которые можно найти в [13], [39]. Отметим еще одно полезное свойство оценок z(a). Теорема 2.2. Если смешанные моменты оценок ац, Ui (Z = 1, ..., тп; j = 1, ..., к) порядка 2гк конечны, то конечны смешанные моменты порядка г координат вектора z(a) при любом а > 0. Доказательство. Квадратная (k X АО-матрица А'А симметрична и неотрицательно определена. Для определителя I al + А'А | матрицы al + А' А выполня- ется неравенство |а/ + А’А\ =П& + a)>a*>0, i=l где Xi>0 — собственные числа матрицы А'А. Утверж- дение теоремы следует из этого неравенства и формул для координат z(a), выписанных по правилу Крамера. Предположим, что совместное распределение вели- чин Vn(a0- —atj), Inkui — ид (Z=l, ..., тп; / = 1, ..., к) при п -> оо сходится к нормальному распределению с нулевым вектором математических ожиданий и неко- торой ковариационной матрицей. Так как асимптотиче- ская нормальность сохраняется при линейных преоб- разованиях, то вместо системы уравнений (2.5) и соот- ветствующей ей точной системы уравнений {al + A'A)z = А'и естественно рассмотреть системы уравнений {al А А)у — v, {al + A)y = v, (2.10) где А=Щ)=С-М'ЛС, А=(М = С-1Л'ЛС, (2.11) kij = 0 (Z ¥=/), Хи = кг > 0 — собственные числа матрицы А'А, и = С~1А'и, а = С~'А'й, y = C^z. Решение систем (2.10) обозначим соответственно у™ = САЛ • • •, г/П У(ам> = (у^п)\ ... Пусть Xi > 0, Х2 > 0, ..., кг > 0, Хг+1 = ... = kk = 0. (2.12) Отсюда и из совместности системы (2.1) следует, что
§ 2. ЛИНЕЙНЫЕ АЛГЕБРАИЧЕСКИЕ УРАВНЕНИЯ 197 ur+i = ... = vk = 0. Таким образом, решение у{0) — = C'”1z(0) определяется формулами H0) = fiAi (г=1, г), у{^ = 0 (г>г+1). Из формул (2.11) и асимптотической нормальности ве- личин dij, Ui следует ^асимптотическая нормальность ве- личин Уп(Х0- — Xij), l/n(vi — Vi). Справедлива следующая теорема. Теорема 2.3. Если система (2.1) совместна, вы- полнены_условия (2.12), совместное распределение ве- личин 1/п(ац — ац), l/niiii — Ui) (i = 1,.. ,,m; j = l,...k) при п-+ оо сходится к нормальному распределению с нулевым вектором математических ожиданий, функция а(п) I 0 так, чтоу^па (тг)-> оо, то совместное распреде- ление величин Пм = (йа(’п)) - (i = 1,..г) сходится при п-^ оо к нормальному распределению с нулевым вектором математических ожиданий и неко- торой (возможно, вырожденной) ковариационной мат- рицей', величины Yny^^ = &) сходятся по вероятности к 0. В случае, когда все > 0 (т. е. определитель мат- рицы А'А отличен от 0), доказательство асимптотиче- ской нормальности z(a(n)) проводится так же, как дока- зательство асимптотической нормальности функции от эмпирических моментов (см. [261). Если некоторые Хг = 0, то исследование асимптотической нормальности несколько усложняется. Доказательство теоремы 2.3 приведено в [45]. Оно основано на том, что распреде- ление вектора i/(a(n)) асимптотически совпадает с рас- пределением решения */* = (z/*, . .*/*) системы (al + А*)у = и*, где А* = (%у), Хг* = Хц, X* =0v*= = ... ..., г), v* = 0 (г = г + 1, ..к). Отметим, что из теоремы 2.3 следует асимптотиче- ская нормальность решения z(a(n)). Представим отклонение приближенного решения 1/(|а(п)) (I = 1, ..., г) от истинного решения у^ = Р|/Х<
198 ГЛ. 8. МЕТОД РЕГУЛЯРИЗАЦИИ И СМЕЩЕННЫЕ ОЦЕНКИ в виде V п{у Уг )— (Х.+а(п))А. +гЬ,г (^10) Так как a(n)Vn->oo При п-+оо, то из (2.13) следует, что в теореме 2.3 нельзя заменить уУ(Х< + а(п)) на точное решение vjXi. Таким образом, неслучайная часть смещения вносит больший вклад в общее откло- нение по сравнению со случайной частью. Сравнение регуляризоваппых решений с оценками метода наименьших квадратов проведем в следующем параграфе для систем с известной матрицей коэффи- циентов. § 3. Системы алгебраических уравнений с известной матрицей коэффициентов Будем предполагать, что в системе (2.1) известна оценка й вектора и и известна матрица Л, причем оп- ределитель матрицы А'А отличен от пуля. Для упро- щения вычислений предположим, что М и = 0, коор- динаты и независимы и имеют одинаковые дисперсии, равные о2. В этих предположениях истинная система (2.1) имеет единственное решение z= (А'А)~1А'и. (3.1) Оценка метода наименьших квадратов, т. е. оценка минимизирующая выражение HA'Az — ull, определяется формулой z(0) = (А'А)-'А'и. (3.2) Отметим, что обычная регрессионная задача (см. гл. 5, § 2) является частным случаем рассматриваемой зада- чи оценки решений системы (2.1) с известной матри- цей А. Формула (2.9) гл. 5 в обозначениях данного параграфа имеет следующий вид: D z(0) = о2 (Л'Л)-1. (3.3) Регуляризованное решение находится по формуле ^«) = (ZM + a7)“M'w. (3.4) С этими оценками совпадают «гребневые» оценки коэф- фициентов .регрессии (см. [33], стр 89). Оценка (3.4)
§ 3. СИСТЕМЫ С ИЗВЕСТНОЙ МАТРИЦЕЙ КОЭФФИЦИЕНТОВ 199 является линейной функцией от вектора й. Очевидно, что все свойства регуляризованпых решений, приведен- ные в § 2, для постоянной матрицы А легко проверить непосредственно. Оценка (3.4) является смещенной, так как Mz(a) = (A'A + aZ)"xA'u z(0) = (A'A)~lA'u^ (A'A + aI)~iA'u. Ковариационная матрица z(k) определяется формулой Dz(a) = a2 (A'A + aZ)-1A'A (A'A + (3.5) В § 2 гл. 5 отмечалось, что среди несмещенных оце- нок линейной функции wc = caz{¥ + ... + ChZh\ с = ..., сА), при любом векторе с линейной оценкой с наименьшей дисперсией является оценка ш(с0) = c1z(i) + ,.. +, ckz^\ Если отказаться от условия несмещенности, то оценки сравнивать можно по величине среднего квадрата от- клонения оценки от истинного значения оцениваемой величины. Положим а2(0)- М(?7с0)-шс)2, (3.6) а2 (а) = М (w(a) — wc)\ (3.7) где z/?(a) = + ... + Теорема 3.1. При любом векторе с найдется та- кое а>0, что о2(0)>о2(а), где о2(0), о2(а) определены формулами (3.6), (3.7). Доказательство. При а0 формулу (3.4) можно записать в виде = (/ + аХУ'ХА'й = (ХА' - аХ2 + О(а2))и, где X = (А'Л)“4. Отсюда z(a) - z(o) = ХА'(и - и) - (aX2 + O(a2))z7 и м (w(a) - wtf = М (с (?a) - z(0)) ( ?“> - 2(о))'с') = = с-сХ (I - 2аХ) с' + О (а2).
200 ГЛ. 8 МЕТОД РЕГУЛЯРИЗАЦИИ И СМЕЩЕННЫЕ ОЦЕНКИ Из этой формулы и формулы (3.3) при а 0 получаем о2(0) - о2(сс) = 2о22сХ2с' + 0<а2). Теорема доказана. Если определитель матрицы А'А близок к 0, то эле- менты ковариационной матрицы Dz(0) (см. (3.3)) и ве- личина дисперсии о2(0)=о2с(Л'Л)-1с' могут быть очень большими. Использование регуляри- зоваипых решений позволяет значительно уменьшить среднее квадратическое отклонение. § 4. Смещенное оценивание В предыдущем параграфе па примере регуляризо- ваппых решений было показано, что использование смещенных оценок приводит к уменьшению среднего квадратического отклонения оценок от значений оце- ниваемых параметров. Приведем еще два простых примера, иллюстрирую- щие необходимость использования смещенных оценок. Пусть требуется по независимым оценкам 01? ..., 0jv параметров 01? ..., 0N оценить линейную функцию I = С101 + с202 + ... + cN0v, (4.1) где Ci, ..., cN — известные коэффициенты. Задачи, при- водящие к необходимости оценки 7, отмечались в § 1. Будем предполагать, что М0{ = 0j, D0J = о?, В качестве несмещенной оценки I естественно выбрать 7 = CjOi + ... + CjyOtf. (4.2) Тогда O2(7)=xM(7-t)2 = dz= А=1 (4.3) Сравним оценку (4.2) с оценкой Z» = сД + ... + с„0п (n<N).
§ 4. СМЕЩЕННОЕ ОЦЕНИВАНИЕ 201 Так как ~ п ~ N In — I == 2 сг^г “ 0i) — 2 1=1 l=n+i TO n / N \2 cr2(7n) = M (/„-/)*= + 2 СД . (4.4) 1=1 \/=n+l / Нетрудно указать условия, при которых Од > о^. Пусть, например, n = N— 1. Тогда (4.2) и (4.3) разли- чаются только последними слагаемыми и, следователь- но, o2(7)-a2(7n) = cHo?/-0?v). Таким образом, если aN существенно больше |9NI, т. е. дисперсия оценки существенно больше оцениваемого параметра, то в Т последнее слагаемое cNQN лучше от- бросить. Другой пример существенного использования сме- щенных оценок связан с оценкой методом Монте-Карло решений различных краевых задач математической физики. Пусть, например, векторная функция и(х) удовлетворяет в трехмерной области G некоторому уравнению в частных производных и на границе Г -об- ласти G функция и(х) совпадает с ф(я): и(х) = ф(ж), если х е Г. В ряде случаев дифференциальное уравне- ние может быть заменено интегральным соотношением. Например, для уравнения Ламе интегральное соотно- шение имеет вид (см. [30]) и (*) = 7^2 f А (х’ и dS' (4-5) SR(x) где А(х, у) — некоторая матрица, SrIx) — сфера ра- диуса R с центром в точке х, dS — элемент поверхно- сти сферы. Соотношение (4.5) позволяет построить оценку и(х) следующим образом. Пусть Ге — 8-окрестпость грани- цы Г. Определим последовательность точек хп (п = = 0, 1, 2, ...): xQ = x; xn+i — случайная точка, равно- мерно распределенная на сфере максимального радиуса с центром в хп, принадлежащей области G; у = = min {п: хп Ге}. Последовательность точек {хп} па-
202 ГЛ. 8. МЕТОД РЕГУЛЯРИЗАЦИИ И СМЕЩЕННЫЕ ОЦЕНКИ зывают процессом «блуждания по сферам» (см. [12]). Пусть и(х) известна при любом х е Ге. Оценку иЛх} можно задать формулой (см. [47]) u(x)—A(xq, х^А{х^ х2)... A(xv_h xv). (4.6) Эта оценка является несмещенной. Представим и (х) — = Мн (х) в виде оо u(x)=2cft0ft, (4.7) k=l где ch = Р {у = к}, Gk = М (Л (xQ, хг) ... А xv) • • и (zv) | v =к). Коэффициенты ch в (4.7) методом Мон- те-Карло оцениваются с большой точностью за корот- кое время. Сложнее оценить 0h. С ростом к сильно уве- личивается дисперсия элвхМ'ентов матрицы, равной про- изведению матриц A(xi, Хг+1), Если в (4.7) ограничить- ся оценкой конечного числа слагаемых, то полученная оценка будет смещенной оценкой и(х), Уменьшение числа слагаемых может существенно повысить точ- ность получаемой оценки, так как увеличение смеще- ния может быть незначительным, а уменьшение дис- персии — достаточно большим. Оба рассмотренных примера приводят к одной ста- тистической задаче — оценке линейной функции от неизвестных параметров. Оценки, указанные в приме- рах, иллюстрируют лишь возможность улучшения не- смещенных оценок при переходе к выбору оценок из более широкого класса. Получим теперь оптимальную (в некотором смысле) оценку. В качестве оценок величины 7, определенной (4.1), будем использовать оценки Z(g) = qfii + ... + QnQn, q = (<Ь, ..Qn). Оценку _____ Ir = + ... + q^N назовем минимаксной, если M (Д'- /)2,='inf sup - 7)2. (4.8) ' q N i=l В такой постановке в [4] (стр. 200—201) была найде-
§ 4. СМЕЩЕННОЕ ОЦЕНИВАНИЕ 203 на оценка угла наклона в линейной регрессионной за- даче с нулевым свободным членом. В работе [47] бы- ли получены минимаксные оценки векторной линейной функции от неизвестных векторных параметров. Найдем сначала величину Q (7»с) = SUP Q (?> с> 9), (4.9) *22 1=1 где Q (?, с, 0) = М (7 (q) — /)2, 0 = (01? .... 0Л), с = = (?i, ..., сЛ). Заметим, что верхняя грань в (4.9) достигается на границе: N ^e2i = R2. (4.10) 1=1 Следовательно, при условии (4.10) нужно найти верх-’ шою грань функции .<?(?, с, 0) = м (s (?j0i — с»0.)') • \ i=l J Представим эту функцию в следующем виде: N / N \2 Q (?» с,, 6) = 2 + (S е*(9i - q) . (4.И) i=l \ i=l / Воспользуемся методом неопределенных множителей Лагранжа. Положим / n \ G (X, 0) = Q (q, с, 0) + X 2 81 - 7?2 . \ 1=1 / Тогда ' < =2 (g. - q) + 2X0} = 0 (« = !,.. .Л). N L- 2 0. Отсюда 0г = — (^ — сг)£/Х. Подставляя это выражение в уравнение связи (4.10), получим
204 ГЛ. 8. МЕТОД РЕГУЛЯРИЗАЦИИ И СМЕЩЕННЫЕ ОЦЕНКИ и, следовательно, _ N N Q (q, с) = 2 q*<A + *2 2 ~ ci)2- (4-12) 1=1 1=1 z Теперь нужно найти минимум (4.12) по q. Из равен- ства (4.12) находим g = 27io2 + 2Z?2(7.-Ci) = 0 (i = l, Отсюда <?г* =Cj/(1 + о2//?2) (4.13) И Ir = 2 сД/(1 + Ж (4.14) i =1 Объединяя (4.13) и (4.12), получим Q{q\c)= 2с2о2/(1+^2)- 1=1 IV Таким образом, если 2 т0 N i=l
СПИСОК ЛИТЕРАТУРЫ 1. Баруча-Рид А. Т. Элементы теорпи марковских про- цессов п их прпложеппя/Пер. с англ.— М.: Наука, 1969. 2. Б е к л е м и ш е в Д. В. Курс аналитической геометрии.— М.: Наука, 1974. 3. Г о р о ж а п к и п В. М. и др. К вопросу объединения оце- нок.— Сообщения ОПЯП.— Дубна: 1980, 5-80-579. 4. Демиденко Е. 3. Линейная и нелинейная регрессия.— М.: Финансы п статистика. 1981. 5. Д ж е л е п о в Б. С. Свойства атомных ядер. Методы разра- ботки сложных схем распада.— М.: Наука, 1974. 6. Д о р о г о в В. И., Покровский В. Н., Чист я- ков В. П. Эффективность оценивания данных по не- однородной выборке.— Сообщения ОИЯИ.— Дубна: 1983, 5-83—244. . 7. Д о р о г о в В. И., Чистяков В. П. О сумме индикато- ров пеапомальных результатов измерений. Вероятностные методы в дискретной математике.— Тезисы докладов к Все- союзной конференцпп (31 мая — 2 июня' 1983, Петроза- водск: 1983, с. 23—24. 8. Д о р о г о в В. И., Чистяков В. П. Объединение оценок при неполной информации о корреляционной матрице.— Автоматизированные системы информации по ядерным дан- ным: Тексты лекций.— М.: Изд. МИФИ, 1983, с. 32—37. 9. Дорогов В. И., Чистяков В. П. Корреляция экспе- риментальных данных по нейтронным сечениям.— В кн.: Нейтронная физика: Материалы 6-й конференции по ней- тронной физике. Киев, 2—6 октября 1983 г.— М.: Эиергоатом- издат, 1984.— Т. 1, с. 127—130. 10. Д о р о г о в В. И., Ч и с т я к о в В. П. Оценка флуктуаций нуклидов в нейтронном потоке методами теории ветвящих- ся процессов.— ДАН, 1983, т. 273, № 5, с. 1102—1104. 11. Дорогов В. И., Чистяков В. П. Оценка точности функционалов от концентраций нуклидов в нейтронном по- токе.— Экспериментальные методы и аппаратура в ядерно- физических исследованиях.— М.: Энергоатомиздат, 1984, с. 88—93. 12. Ермаков С. М., Михайлов Г. Л. Статпстическое мо- делирование.— 2-е изд.— М.: Наука, 1982. 13. Е р м а к о в С. М., Панкратов Ю. Д. Смещенные оцен- ки и метод регуляризации.— Вести. Ленинградского ун-та, 1976, Ко 7, вып, 2, с. 27-30. 14. Е р о ф е е в М. И., Лепе ш кип М. В., Т е л е в и п о- в а Т. М., Чистяков В. П. Об асимптотической нор- мальности оценок ядерных данных, описывающих распад ядра.— Экспериментальные методы ядерной физики.— М.: Атомиздат, 1981, № 8, с. 67—73.
206 - СПИСОК ЛИТЕРАТУРЫ 15. Ершов А. А. Стабильные методы оценки параметров (об- зор).— Автоматика и телемеханика, 1978, № 8, с. 66—100. 16. Жуковский Е. Л. Статистическая регуляризация си- стем алгебраических уравнений.— Ж. вычисл. мат. и мат. физ., 1972, т. 12, № 1, с. 185—191. 17. Закс Ш. Теория статистических выводов/Пер. с англ.— М.: Мир, 1975. 18. Захаров В. К., Севастьянов Б. А., Чистя- ков В. П. Теория вероятностей.— М.: Наука, 1983. 19. Зорина Т. В., Лепешкин М. В., Т е л е в и н о в а Т. М. Оценка ненейтронных ядерных данных.— Эксперименталь- ные методы ядерной физики.— М.: Атомиздат, 1980, № 6. 20. Идье В. и др. Статистические методы в эксперименталь- ной физике/Пер. с англ.— М.: Атомиздат, 1976. 21. Калашникова В. И., Козодаев М. С. Детекторы элементарных частиц.— М.: Наука, 1966. 22. Калмыков Н. II., Чистяков В. П. Расчет флуктуа- ций в развитии каскадных ливней методом Колмогорова.— Изд. АН СССР, сер. фпзич. 1965, т. 29, № 9, с. 1702—1705. 23. Кокс Д. Р., Смит В. Л. Теория восстановления/Пер. с англ.— М.: Сов. радио, 1968. 24. К о л о б а ш к и и В. М., Лепешкин М. В., Телевин о- в а Т. М., Чистяков В. П. Оценка ядерных данных, описывающих распад ядра.— Экспериментальные методы ядерной физики.— М.: Атомиздат, 1980, № 7, с. 3—19. 25. К о л ч и н В. Ф., Севастьянов Б. А., Ч и ст я к о в В. Н. Случайные размещения.— М.: Наука, 1976. 26. К р а м е р Г. Математические методы статистики.— -2-е изд./Пер. с англ.— М.: Мир, 1975. 27. К у р б а т о в В. С., Т я и к и п А. А. Вычитание фона при оценке параметров методом максимального правдоподобия.— В кн.: [20J. 28. Л ю б и м о в В. А. Существует ли у нейтрино масса по- коя? — М.: Изд. МИФИ, 1981. 29. М ё р р е й Р. Физика ядерпых реакторов/Пер. с англ.— М.: Атомиздат, 1959. 30. Н о б е д р я Б. Е. Численные методы в теории упругости и пластичности.— М.: Изд-во МГУ, 1981. 31. Простаков И. А., Те ле вино ва Т. М., Чистя- ков В. II. Математическая модель обработки спектро- метрических экспериментов. Автоматизация эксперимента в физических исследованиях.— М.: Энергоатомиздат, 1984, с. 47—51. 32. Рао С. Р. Линейные статистические методы и их приме- нения/Пер. с англ.— М.: Наука, 1968. 33. Себер Дж. Линейный регрессионный анализ/Пер. с англ.— М.: Мир, 1980. 34. С е в а с т ь я н о в Б. А. Ветвящиеся процессы.— М.: Наука, 1971. 35. С е в а с т ь я п о в Б. А. Курс теории вероятностей и мате- матической статистики.— М.: Наука, 1982. 36. С у р и н а И. И. Решение задачи параметризации сечения деления с учетом интерференции между уровнями. (Авто- реферат кандидатской диссертации.)— М.: Ин-т атомной энергии им. И. В. Курчатова, 1982.
СПИСОК ЛИТЕРАТУРЫ 207 37. Т е л е в и и ов а Т. М., Чистяков А. В. Об асимптоти- ческой эффективности оценок ядерных данных.— Методы экспериментальной ядерной физики в исследованиях про- цессов и продуктов деления. М.: Энергоатомиздат, 1983, с. 122-125. ; 38. Т с л е в и н о в а Т. М., Чистяков В. П. Две теоремы о неявно заданных оценках.—ДАН, 1983, т. 271, № 2, с. 305—306. 39. Тихонов А. Н., Арсе и и н В. Я. Методы решения не- корректных задач.— М.: Наука, 1979. 40. Феллер В. Введение в теорию вероятностей и ее прило- жения. Т. 2/Пер с англ.— М.: Мир, 1967. 41. Харрис Т. Теория ветвящихся случайных процессов/Пер. с англ.— М.: Мир, 1966. 42. Ч и с т я к о в В. П. Обобщение одной теоремы ветвящихся случайных процессов.— Теория вероятн. и ее прпмен., 1959, т. 4, № 1, с. 109-113. 43. Ч п с т я к о в В. П. Курс теории вероятностей.— 2-е изд.— М.: Наука, 1982. 44. Чистяков В. П, Некоторые замечания о методе регуля- ризации.— ДАН, 1982, т. 265, № 6, с. 1324—1326. 45. Чистяков В. П. О некоторых вероятностных свойствах регуляризованпых решений.— Мат. заметки, 1982, т. 32, № 6, с. 889—899. 46. Чистяков В. П. Метод регуляризации и смещенное оце- нивание.— Теория вероятн. и ее примен., 1984, т. 29, № 1, с. 173-174. 47. Чистяков П. В. О смещенной оценке решения прост- ранственной задачи теории упругости методом Монте-Кар- ло.—Теория вероятп. и ее примен., 1984, т. 29, № 1, с. 174-175. 48. III е ф ф е Г. Дисперсионный анализ.— 2-е изд./Пер. с англ.— М.: Наука, 1980. 49. Bell G. I. Probability distribution of neutrons and precur- sors in a multiplying assembly.—Ann. of Physics, 1963, v. 21, p. 243-283. 50. Bickel P. J. On some robust estimates of location.—Ann. , Math. Stat., 1965, v. 36, N 3, p. 847-858. 51. Huber P. J. Robust estimation of a location parameter.— Ann. Math. Stat., 1964, v. 39, N 1, p. 73—101. 52. H u b e r P. J. Robust Statistics. J. Wiley, 1981. 53. Kalachey Ju. L., Kolobashkin V. M., Lepesh- k i n M. V., T e 1 e v i n о v a T. M., C h i s t j a k о v V. P. Nuclear data evaluation.— International conference on nuc- lear data for science and thechnology.—Antwerpen: 6—10 September, 1982, p. 609—611. 54. N о r w о о d T. E., Hinkelmann. Estimating the common mean of several normal populations.—The Ann. Stat.,'1977, v. 5, N 5, p. 1047—1050. 55. T a k a c s L. On the seqence of events selected by a coun- ter from recurrent process of events.— Теория вероятн. и ее примен., 1956, т. 1, № 1, с. 90—102.
Владимир Алексеевич Ватутин Татьяна Михайловна Телевинова Владимир Павлович Чистяков ВЕРОЯТНОСТНЫЕ МЕТОДЫ в физических исследованиях Редактор И. Е. Морозова Техн, редактор Е В. Морозова Корректор И. Я. Кришталь ИБ № 12403 Сдано в набор 10 06.84. Подписано к печати* 22.01.85. Формат 84/ 1081Аз Бумага тип. № 3. Обыкновенная гарнитура. Вы- сокая печать. Усл. печ. л. 10,92. Усл. кр.-отт. 11,13. Уч.-изд. л. 10,6. Тираж 6000 экз. Заказ № 242. Цена 1 р. 20 к. Ордена Трудового Красного Знамени издательство «Наука» Главная редакция физико-математической литературы 117071 Москва В-71, Ленинский проспект, 15 4-я типография издательства «Паука» 630077 г. Новосибирск, 77, Станиславского, 25
1 р. 20 к. вш