Текст
                    В.К. ГРИШИН
СТАТИСТИЧЕСКИЕ МЕТОДЫ
АНАЛИЗА И ПЛАНИРОВАНИЯ
ЭКСПЕРИМЕНТОВ

В. К. ГРИШИН СТАТИСТИЧЕСКИЕ МЕТОДЫ АНАЛИЗА И ПЛАНИРОВАНИЯ ЭКСПЕРИМЕНТОВ Допущено Министерством высшего и среднего специального образования СССР в качестве учебного пособия для студентов физических специальностей вузов ИЗДАТЕЛЬСТВО МОСКОВСКОГО УНИВЕРСИТЕТА 1975
УДК 519.24 Книга посвящена статистическим методам, применяемым в практике экспериментов для анализа и обработки резуль- татов наблюдений. Особое внимание уделяется систематичес- кому изложению способов проверки различных гипотез (оцен- ки параметров распределений случайных величин, сравнение результатов измерений, проведение кривых по совокупности эмпирических точек и т. д.). При этом обсуждаются как су- губо практические вопросы (например, выбор критериев для оценки достоверности результатов измерений), так и аспекты общей теории, связанные с построением единых методов под- хода к решению различных задач. Кроме того, рассматрива- ются вопросы статистического планирования экспериментов, в том числе экстремальных экспериментов и исследований по выяснению механизма явлений. Изложение иллюстрируется многочисленными примерами, графиками, дополнительными за- дачами и таблицами. Рецензенты: кафедра общей физики Московского физ.-техн. ин-та, * кафедра экспериментальных методов ядерной физики /МИФИ, канд. физ.-матем. наук С. Н. Соколов 0$) Издательство Московского университета, 1975 г. 20306-000 1О_ „ г-----------13о—. г 077(02)—75
ОГЛАВЛЕНИЕ ПРЕДИСЛОВИЕ 5 ГЛАВА I. СЛУЧАЙНЫЕ ВЕЛИЧИНЫ И СПОСОБЫ ИХ ОПИСАНИЯ § 1. Случайные величины.................................. 6 § 2. Функции случайных величин. Центральная предельная теорема......................................................17 § 3. Некоторые специальные распределения.23 ГЛАВА II. ЭКСПЕРИМЕНТ И СТАТИСТИЧЕСКАЯ ОЦЕНКА ПАРАМЕТРОВ РАСПРЕДЕЛЕНИЯ § 4. Эксперимент и достоверность наблюдений......................28 § 5. Доверительный интервал и доверительная вероятность . 29 § 6. Схема эксперимента. Выборочный метод и задачи ста- тистики ....................................................32 § 7. Принцип максимального правдоподобия..........................33 § 8. Оценка параметров физических распределений ... 34 § 9. Достоверность оценки дисперсии нормального распреде- ления ......................................................38 § 10. Достоверность оценки среднего генеральной совокупности 41 § 11. Достоверность оценки среднего пуассоновского процесса 45 ГЛАВА III. СТАТИСТИЧЕСКАЯ ПРОВЕРКА ГИПОТЕЗ § 12. Критерий значимости.........................................49 § 13. Альтернативные гипотезы. Мощность критерия ... 52 § 14. Проверка распределения...............................56 § 15. Сравнение дисперсий..................................60 § 16. Сравнение средних............................67 § 17. Сравнение средних при бедной статистике.....................72 § 18. Анализ грубых ошибок . ......................74 ГЛАВА IV. РЕГРЕССИОННЫЙ АНАЛИЗ § 19. Стохастическая зависимость..................................77 § 20. Регрессионный анализ. Метод наименьших квадратов . 78 § 21. Оценка линии регрессии......................................81 § 22. Дисперсия коэффициентов регрессии .... 84 § 23. Достоверность оценки кривой регрессии ... 90 § 24. Влияние погрешностей в определении аргумента ... 93 § 25. Дополнительные замечания . 94 ГЛАВА V. ПЛАНИРОВАНИЕ ЭКСПЕРИМЕНТА § 26. Оптимальное планирование эксперимента.......................98 § 27. Оптимальное распределение времени наблюдений ... 99 § 28. Выбор точек наблюдений................................... 103 § 29. Эксперименты по выяснению механизма явлений . . . 108 3
§ 30. Последовательное планирование . . . . . . < 115 ДОПОЛНЕНИЕ § 31. Измерение интенсивности событий....................118 § 32. Линейный регрессионный анализ.......................120 § 33. Бейесовские оценки..................................122 § 34. Рандомизация . ............................123 ПРИЛОЖЕНИЕ Таблица сАквантилей........................................ 126 СПИСОК ЛИТЕРАТУРЫ < ............................128
ПРЕДИСЛОВИЕ Вопросы статистического анализа относятся к одним из наиболее актуальных в математической интерпретации эмпи- рических данных, поскольку статистический материал часто является единственным объективным источником информации об исследуемых процессах. Не меньшее значение придается в настоящее время пла- нированию исследований. Все возрастающая сложность экс- перимента вынуждает исследователя с предельным вниманием •относиться к составлению планов проведения работ. Автор не ставит себе цель познакомить читателя со всем многообразием достижений математической статистики. В кни- ге рассматривается применение статистических методов лишь для наиболее характерных задач, встречающихся в практике эксперимента. Теоретический материал широко иллюстрирует- ся численными и графическими примерами, а также дополни- тельными задачами. Книга написана на основании курса лекций, читаемых в лечение многих лет на отделении ядерной физики физического факультета МГУ. Это наложило некоторую специфику на подбор иллюстративных примеров. Однако изложение основ- ного материала имеет самый общий характер. Поэтому книга окажется полезной для специалистов различного профиля. Автор стремился к сочетанию доступности изложения и научной строгости. Для более детального ознакомления с от- дельными вопросами можно обратиться к специальной лите- ратуре, список которой прилагается. Автор выражает искреннюю благодарность Н. П. Клеть .кову за ценные советы и замечания. 5
Глава I СЛУЧАЙНЫЕ ВЕЛИЧИНЫ И СПОСОБЫ ИХ ОПИСАНИЯ § 1. Случайные величины Результаты, получаемые в экспериментах, по своему ха- рактеру являются случайными. Это связано либо со стати- стической природой самого исследуемого явления, либо с различными случайными воздействиями, которые неконтро- лируемо вносятся в процессе измерений. Поэтому даже в про- стейших экспериментах причинно-следственная связь между отдельными компонентами явлений оказывается подчас на- столько неочевидной, что установить ее оказывается возмож- ным лишь после кропотливого анализа.’ Такой анализ про- водится с помощью методов математической статистики, изучающей закономерности совокупностей случайных собы- тий. Основные свойства случайных событий описываются в настоящей главе. 1. Случайные события. Вероятности случайных событий. Математическая статистика оперирует с множеством событий А, В, .., наблюдение которых зависит от случайных причин. Важнейшей характеристикой случайного события является вероятность р его наблюдения. Последняя может быть опре- делена как средняя частота появления данного события при многократной (в пределе — бесконечной) реализации условий его наблюдения. Достоверные события имеют вероятность, равную единице. Для невозможных событий вероятность рав- на нулю. Вероятность произвольного случайного события А есть положительное число, не превосходящее единицу, т. е. 0==£р(Д)^1. Среди различных событий различают совместные и не- совместные события, смотря по тому, могут ли они осуще- ствляться в одном и том же испытании. Если события несо- вместны, то вероятность их одновременного наблюдения равна нулю. Типичным примером несовместных событий яв- ляются противоположные события А и А, где А означает, например, отсутствие события А. Вместе с тем совокупность событий А+А представляет собой достоверное событие (ли- 6
бо «да», либо «нет»), вероятность которого равна единице. Поэтому р(А + А)=р(А) +р(А) = 1. Отсюда р(А) = 1— р(А). Для совместных событий Ль Л2, ... вероятноЬть их одно- временного наблюдения не больше, чем вероятность наблю- дения каждого из событий в отдельности, т. е. р(ЛИ2...)^ <р(Аг). Характер последнего неравенства определяется величина- ми условных вероятностей р(А,/Ай) наблюдения событий А, при условии появления событий Ак. Таким образом, вероят- ность наблюдения двух случайных событий можно определить как произведение вероятности одного события и условной вероятности наблюдения другого события (по отношению к первому): р(АЛ) = р(А) -рИ2М1). События Л1 и Л2 называются независимыми, если при по- явлении одного из них вероятность наблюдения другого не изменяется. События Ль ..., Лп называются независимыми в совокупности, если любые два из них и любые их совмеще- ния независимы. Условные вероятности независимых событий совпадают с вероятностями наблюдения каждого из собы- тий. Поэтому вероятность осуществления независимых собы- тий равна произведению вероятностей событий: р(Ах... А„) = р(А1)...р(А„). В частности, р (А ... А) = р*. _ - k 2. Случайная величина. Распределение случайной вели- чины. Рассмотрим множество событий, состоящих в появле- нии того или иного числа. Такое множество удобно описы- вать с помощью понятия случайной величины. Случайной величиной у, или стохастической переменной, называется величина, наблюдаемое значение которой зави- сит от случайных причин. Полный набор всех возможных значений, которые принимает случайная величина у, назы- вается генеральной совокупностью. Генеральная совокупность может представлять собой либо непрерывный континуум, ли- бо набор дискретных значений. Случайная величина характеризуется полностью, если указаны вероятности, с которыми она может принимать те или иные значения генеральной совокупности. Эти вероят- ности описываются с помощью интегральной функции рас- пределения и функции плотности распределения. Интеграль- 7
ная функция распределения случайной величины у опреде ляется как вероятность событий у^у', где у' — некоторо» число, т. е. * F(y') = Р (у <«/'). Функцию распределения можно определить для л случайной величины независимо от характера ее генера/ совокупности (дискретной или непрерывной, конечной бесконечной). В соответствии с определением ?(у) причем F(—оо) =0; F(oo) = 1 Здесь под символами ±оо понимаются максимальное и минимальное значения; до- пускаемые генеральной со- вокупностью. Для непрерывных слу- чайных величин функция распределения — гладкая функция, для дискретных величин функция распреде- ления имеет характерный ступенчатообразный вид (рис. 1). Однако функция распределения, представ- ляющая собой накопленную вероятность, для любой слу- чайной величины является неубывающей функцией. Поскольку Рис. 1. Функция распределе- ния непрерывной (а) и дис- кретной (о) случайных вели- чин р (У < Уъ) = Р (У < У1) + Р (У1 < У < Уг\ то Р(У1<У<Уъ) = F(yi)~ F(y^- Нетрудно видеть также, что Р{у>у')= )-Р1у<у')=- )-F(y'Y U-4> Функция плотности распределения связана с интеграль- ной функцией соотношением Р(Ю = -^г. <1-5> ау * Определяют также F(y')=P(y<y'). 8
Согласно (1.5) произведение p(y')dy' представляет веро- ятность наблюдения случайной величины у в пределах зна- чений yf <iy^yr+dyr\ Р(У' <У<У' + dy')=p(y')dyf, а Очевидно, ь P(a<y<b) = J p(y')dy'. а J P(y')dy' = 1. —00 (1-6) Строго говоря, функция плотности распределения может применяться лишь для характеристики случайных величин с непрерывными генеральными совокупностями. Однако мож- но, используя понятие S-функции Дирака, функцию плотно- сти распределения ввести и при описании дискретных конти- нуумов, понимая р(у) как i (1.7) где pi — вероятность наблюдений отдельных значений у=Уй 6(у—У г) —функция Дирака. Поэтому . Р(У<Уч) = ^Р1- (1-8) i<v Учитывая сказанное выше, будем считать, что случайная ве- личина у задана, если известна ее функция плотности распре- деления. В дальнейшем, следуя установившейся традиции, функцию плотности распределения назовем просто распределением. 3. Параметры распределений. Среди числовых характери- стик случайных величин важнейшими являются математиче- ское ожидание, или (генеральное) среднее, и дисперсия слу- чайной величины. Математическое ожидание Му, или (генеральное) сред- нее у, случайной величины определяется как среднее по гене- ральной совокупности значение: оо Му=у = J y'p(y')dy', — 00 ' (1-9) 9
где, как и ранее, под символами ±оо понимаются предель- ные значения в генеральной совокупности. Для дискретной величины запишем Му = у = ^ytpt, (1.Ю) I распространяя суммирование на все возможные значения у. Определенный интерес представляет также значение слу- чайной величины, при котором плотность распределения до- стигает максимума. Это значение называют модой распреде- ления. Если имеется два или более максимумов, то распре- деление называют соответственно двухмодальным, трехмо- дальным и т. д. Дисперсией D(y) случайной величины называется мате- матическое ожидание, или среднее значение, квадрата откло- нения этой величины от ее среднего D(y) = М(у — Му)2 = (у-у)2. (1.11) Заметим, что математическая операция усреднения любой функции <р(г/) по нормированному распределению (т. е. при со J pdy' = 1) определяется как —00 <₽(*/) = J Ч(У')р(У')йу' либо ф(*/) = £ф(*/<)Рй —оо i Поэтому D(y)= J (у'~ У)2 pdy' (1.12) — 00 либо £>(Р)==£(рг-у)аА. (1.13) i Для вычислений полезно соотношение D(y) = y2-'y2. Величина o=]f D называется стандартным, или средним квадратичным отклонением. Отметим, что у и D(y) сущест- вуют не для всех распределений. 4. Рассеяние наблюдаемых значений. Неравенство Чебы- шева. Дисперсия D является очень важной характеристикой случайной величины. Она описывает рассеяние наблюдае- мых значений случайной величины в окрестности ее средне- 10
ю значения (если, конечно, у и D существуют). Степень рас- сеяния, а именно вероятность наблюдения значений у' слу- чайной величины при различных отклонениях у' от среднего значения у, характеризуется неравенством Чебышева. Для любого распределения с конечными значениями у и о вероятность события \у'—^|>og, где g — число, большее единицы, не превосходит \/g2, т. е. P(\y'-y\>^g)<i/g2- (1.Н) Для доказательства последнего отметим сначала одно свойство случайной величины, которая может принимать лишь неотрицательные значения. Пусть z— такая величина. Тогда для любого положительного числа b справедливо не- равенство P(z>b)<z/b. (1.15) Действительно, согласно (1.4) и (1.6) P(z>Z>) = jp(z')dz', где p(z)—плотность распределения z. С другой стороны, при z^O ОО ОО QO оо z = z'pdz' > f z' pdz' bpdz' — b pdz' 6 i b b (так как в области интегрирования z'^b), откуда и следует неравенство (1.15). Заметим теперь, что неравенства \у'—у\>а и (у'—у)2>а2 равносильны. Следовательно, используя (1.15), имеем Р (I У’ — У\ > а)< (У’ — У)*/а?, что при a = cg и приводит к неравенству Чебышева. Большая простота и универсальность позволяют исполь- зовать неравенство Чебышева для важных теоретических заключений, хотя для практических оценок оно оказывается слишком грубым. Правда, неравенство Чебышева удается уточнить, если имеется дополнительная информация о харак- тере распределения случайной величины. Так, для симмет- ричных распределений с одним максимумом справедливо Р(\У’ ~y\>og)< 4/9 g*. Кроме дисперсии и стандартного отклонения для описа- ния меры рассеяния случайной величины используют также 11
другие числовые характеристики распределений. Вообще, ве- личина Hfe = М (у — My)k = (у — y)k носит название центрального момента k-того порядка. Для симметричных распределений g2n+i = 0. В качестве показателя асимметрии вводят величину Л = |х3/ог3. Остроту вершинной части (одномодольных) распределе- ний описывают с помощью эксцесса, определяемого соотно- шением £ = (^>-3. Для нормального распределения (см. п. 6 § 1) эксцесс Д=0. Это соответствует традиции, согласно которой нормаль- ное распределение принято за исходное при оценке сглажен- ности других распределений (подробнее см. § 14). Иногда на практике для описания рассеяния прибегают к величине Нт =!«/ — у\, получившей название среднего абсолютного отклонения. Од- нако по своим аналитическим свойствам и в качестве стати- стической характеристики эта мера заметно уступает сред- нему квадратичному отклонению. 5. Квантили. Функция распределения P=F(y') указывает зависимость вероятности Р от значения у' случайной пере- менной. Обратная функция y’=G(P) (1.16) определяет значения переменной, которые соответствуют дан- ным накопленным вероятностям. Эти значения называются квантилями распределения. Квантиль, соответствующая на- копленной вероятности Р, называется Р-квантилью и обозна- чается как уР. Для непрерывных и дискретных распределе- ний уР является соответственно решением уравнений УР Р= J P{y')dy'-, —00 P^^PI- (1.17) 6. Нормальное распределение. В качестве примеров не- прерывного и дискретного распределений рассмотрим нор- мальное и биномиальное распределения. 12
Нормальное (или Гауссово) распределение имеет вид pW=w'4’l-V)' <1Д8> Рис. 2. Нормальные распределения при различных а Это симметричное распределение (рис. 2) со средним значе- нием, равным а, и дисперсией а2=р2. Поэтому нормальное распределение обычно за- писывается в виде (1.18), заменяя р на о. Геомет- рически стандартное от- клонение о совпадает с расстоянием от среднего значения у = а до точек перегиба кривой. Для случайной вели- чины у с нормальным распределением вероят- ности наблюдения ее зна- чения в интервалах У±а, У±2а, у±3о равны соответственно 0,683; 0,955; 0,997. Нормальное распреде- ление играет очень важную ке (см. § 2). Это неудивительно, ибо нормальное распреде- ление описывает случайные величины, имеющие самые общие свойства, а именно: непрерывность значений, равновероят- ность симметричных относительно у отклонений, большая вероятность малых отклонений от у. Очень часто рассматривают нормированное распределение для величины У — а U — л----_ о роль в математической статисти- нормальное (1-19) которое имеет вид p(„)=7^exp(-f). (1-20) Очевидно, й = 0, а £>(«) = 1 (параметры (0, 1)). Нормированное распределение хорошо изучено; имеются подробные таблицы квантилей Up. Квантили ненормирован- ного нормального распределения находятся, как уР = а + «ро. (1.21) 13
Для нормального распределения справедлива следующая связь между центральными моментами: -= а2-'1(2л)!/2яп!; f^+i = 0. ( 7. Биномиальное распределение. Биномиальное распреде- ление (распределение Бернулли) описывает дискретные со- бытия следующего типа. Допустим, что исследуется частота появления какого-либо случайного события А при неизмен- ных условиях в серии п экспериментов (испытания независи- мы между собой). И пусть условия таковы, что в каждом из экспериментов событие либо наблюдается, либо нет. Если вероятность обнаружения в отдельном опыте равна Pi(A) =р, то в серии из п экспериментов следовало бы ожидать пр со- бытий. Какова вероятность Pn(Af),. что событие А будет об- наружено N раз (N—0, 1,..., п)? Такая постановка охватывает чрезвычайно широкий класс экспериментов. Исследуется ли радиоактивный распад, на- блюдается ли рассеяние частиц (под частицами можно пони- мать любые объекты) в данном интервале переменных, изу- чаются ли спектральные характеристики событий и т. д., во всех этих случаях фактически имеют дело с событиями, кото- рые либо происходят, либо не происходят. Радиоактивные ядра либо распадаются, либо нет в заданный интервал вре- мени, частицы либо попадут, либо нет в интересующий нас интервал и т. д. (единственное уточнение — число опытов фиксируется заранее). Искомая вероятность описывается биномиальным распре- делением = (L22> Справедливость соотношения (1.22) подтверждается сле- дующим образом. Напомним, что если вероятность события А равна р, то вероятность противоположного события А (т. е. отсутствие события Л) равна (1—р). Теперь обратим внимание на то обстоятельство, что инте- ресующий нас исход испытаний может быть представлен как совокупность чередующихся событий Л и Л, в которой собы- тия Л и Л встречаются JV и (п—7V) раз соответственно. Ве- роятность наблюдения такой последовательности (независи- мость испытаний) равна рк(1—p)n~N. Поскольку порядок наблюдения событий неважен, искомая вероятность равна сумме вероятностей всех таких комбинаций со всевозмож- ными чередованиями событий Л и Л. Количество возможных благоприятных комбинаций определяется числом сочетаний из п различных номеров по N, т. е. равно С„ = nl/N\(n— N)l. 14
Так как вероятность каждой из комбинаций равна p.v(i—p)n~N, то, умножая последнюю величину на Сп , прихо- дим к (1.22). Биномиальное распределение имеет параметры (эти ре- зультаты нетрудно получить, используя свойство бинома Ньютона) N = £ NCnPN(l — p)n~N — пр\ N=0 D(N)=(N — N)2 =np(l —р)<-^-. (1.23), Биномиальный закон в равной степени описывает распре- деление событий как в серии последовательных испытаний, I так и при одновременном наблюдении над совокупностью ’ п объектов. В последнем случае обычно исследуется распре- деление событий, наблюдаемых в течение промежутков вре- мени. Если средняя интенсивность событий при испытании с од- ним объектом равна %, а время наблюдения t, то р=М, а вероятность встретить в течение этого времени исследуемое событие N раз (п объектов) Рп (0) = (1 “ U}n'N' (1,24) Если число объектов наблюдения очень велико (п^>1), то вместо (1.22) целесообразно руководствоваться асимптоти- ческими формулами. Распределение редких событий, наблюдаемых в течение времени t, описывается соотношением Пуассона Р(ЛА) = (1.25) которое получается из (1.24) асимптотическим переходом при п->оо, но при условий, что v=n’K остается конечной ве- . личиной. Таким образом, параметр v характеризует среднюю интенсивность событий, Р— вероятности наблюдений N со- бытий за время t *. По определению среднее число N = vt, что, разумеется, подтверждается прямыми вычислениями. Дисперсия результатов в статистике Пуассона равна D(N) = £ (N—N)*P(N) =. vt = N. (1.26) jV=0 * к распределению Пуассона можно прийти также по-иному. Тогда, если вероятность наблюдения события в бесконечно малом проме- жутке dt пропорционально dt, появление дискретных независимых собы- тий будет описываться распределением Пуассона. 15
Тот же результат можно получить из (1.24) предельным пе- реходом. При малых значениях vt распределение Пуассона асим- метрично относительно N (рис. 3). При 1 распределение Рис. 3. Огибающая распределения Пуас- сона при малых значениях v Рис. 4. Распределение Пу- ассона для N=vt = 20 (1) и распределения Гаусса_для Af=20(a2=tf) (2) и АГ=80 (3) становится практически непрерывным и совпадает с нормаль- ным распределением со средним значением и дисперсией, равными N (рис. 4): P(N)-+ ——— ехр^ 2лг )• у 2stN (1.27) События, подчиняющиеся статистике Пуассона, обладают важным свойством: сумма независимых пуассоновских про- цессов— также пуассоновский процесс со средним и диспер- сией, равными соответственно сумме средних и дисперсий каждого из процессов. Квантили биномиального и пуассоновского распределений можно вычислить с помощью квантилей ^-распределения (см. § 3). Задачи 1. Показать, что если С — постоянная величина, то С = С; D(C) = 0; (Ж=Су; D(Cy)=C*D(y), где у — любая случайная величина. 16
Указание. Постоянную можно рассматривать как дискретную слу- йную величину, которая принимает только одно значение с вероят- ностью, равной единице. 2. Распределение молекул газа по скоростям описывается соотношением Максвелла p(v) = const • u2 exp — —— . \ &K1 / Найти среднюю и наиболее вероятную скорости частиц. В чем причина их различия? 3. Вероятность выхода из строя одного генератора силовой установки равна р. При каких значениях р схему с двумя генераторами следует предпочесть четырехгенераторной схе- ме (установка обеспечивает работу потребителя, если рабо- тает не менее половины генераторов). 4. Установить соотношение (1.25) предельным переходом из (1.24). Указание. Полагая, что q=nM=vt<oo, воспользоваться предель- ными соотношениями .. / л \п—N (1 — М) = (1-------- ) —► е-’, \ fl / П-*эо —-—(xz)w = 9wr/j_JVzd_\ (« — #)! ' 1 4 Ц п ) J п_>хч 5. Установка регистрирует в среднем 2 события в секунду. С какой вероятностью она будет «молчать» в течение 1, 2, 3 с? Решение. Ближайший отсчет произойдет между моментами t и /+<//, если в течение времени t не будет ни одного отсчета, а затем в течение dt произойдет один отсчет. Вероятность обоих (независимых) со- бытий равна e~vt и vdt, а вероятность первого отсчета в интервале (/, /Ч-dZ] равна pdt = ve~~vtdt. Искомая вероятность p(t) = ve~vt. Подставляя v=2 и /=1, 2, 3, получим значения: р(1) =0,271; р(2) = = 0,037; р(3) =0,007. Используя полученное соотношение, оценим среднее оо значение длительности интервала «молчания»: /= §xpdr = \/v. Диспер- о сия интервалов: D(t)~\/v2. Очевидно, разброс интервалов может быть очень большим. § 2. Функции случайных величин. Центральная предельная теорема Функции случайных величин. Используя понятие слу- чайной переменной (§ 1), мы можем описать сколь угодно сложные множества случайных событий, рассматривая по- следние как системы, или ансамбли случайных величин, в ’той или иной степени взаимосвязанных между собой. 17
Такие системы случайных величин у\, у2, ..., уп (п— число- произвольное) будем понимать как функции случайных пере- менных. Функции случайных переменных Ф = Ф(«/ь .... уп) по своей сути новые случайные величины в пространстве {yi, Уя, Уп}- Распределение р(Ф) определяется не только видом функции Ф («/,), но зависит также от характера рас- пределений случайных величин р(уд- Однако прежде, чем перейти к установлению явной зависимости р(Ф) от р (уд> выясним некоторые общие свойства функций случайных пе- ременных. Расширим сначала понятие функции плотности распреде- ления (или просто распределения, согласно принятой терми- нологии). В пространстве п случайных переменных i/j функ- ция р(у’х, у’2, ... , y^dy'{dy'2 ... dy'n будет определять вероят- ность одновременного наблюдения значений аргументов в интервалах [у'(; у'{ 4- dy^J, i = 1, 2, ... , п. Для независимых случайных величин вероятность совмест- ного наблюдения значений уг равна произведению вероятно- стей наблюдения каждого из значений. Поэтому для незави- симых аргументов р(У1, Уъ--- ,уп) = 1\р(уд- 1=1 Вероятность наблюдения случайной точки Q(«/i) в области G пространства {yi, у2, ..., уп} описывается соотношением р (Q (Уд <= G) = | Р (у\, У .у’д dy\dy2... dyn. Рассмотрим теперь ряд теорем и определений. Теорема 1. Среднее суммы случайных величин равно сум- ме средних этих величин: (£»<)-&• <2-» > I Для доказательства (2.1) достаточно убедиться в спра- ведливости утверждения yi+y2=yi+y2. Имеем У1 + Уг = J J (У\ + Уд Р (у'1, Уд dy{ dy2 = ^ у\ pdy'i dy2 4- 4- ^У2 pdy'i dy2, где p(y\, y2)dyidy2 — вероятность того, что случайные ве- личины i/i и у2 принимают значения [z/i,2; 1/1,2 + dy'i,2]. Но так как функции f pdy2 и Jpdy\ определяют распределения вели- чин у\ и у2, дальнейшее доказательство очевидно. 18
Теорема 2. Среднее произведения независимых случайных .величин равно произведению их средних значений: (П yi) = <2-2) i i Справедливость (2.2) следует из независимости усредне- ния для независимых величин, так как р(уг, ... , уп) =П Р(Уд- i Теорема 3. Дисперсия суммы независимых случайных ве- личин равна сумме их дисперсий: = (2-3) i i Доказательство (2.3) основывается на том обстоятель- стве, что для независимых величин среднее значение произ- ведения отклонений от средних равно нулю, т. е. (У( — Уд (Ук~Ук)=^ В общем случае для произвольных случайных переменных эта величина отлична от нуля. Введем величину Н* = (У1 — Уд (Ук — ~Ук\ (2-4) которая называется ковариацией, или смешанным вторым моментом, переменных yt и уь- Нормированная ковариация (>* = (2.5) где ^i,k—VD(yi,k) — средние квадратичные отклонения распределений называется коэффициентом корреляции случайных величин yt и yit. Коэффициент корреляции указы- вает меру связности случайных величин. Значение коэффи- циента корреляции лежит в пределах —IsgZp^l. Действи- тельно, вычисляя дисперсию функции и+ = У1 ~yi | Уь—~Ук ~ °i о* и месм ^(м±) = 2 ± 2ргй. Отсюда следуют пределы изменения р^, поскольку диспер- сия любой величины — неотрицательное число. Для независимых величин yifl коэффициент корреляции Рг7г=О. Напротив, значение р^=±1 указывает на строгую функциональную связь между у{ и yk (при ptft=±l либо 19
D(u_) =0, либо£)(и+) =0, т. е. и- или M+=const, и и оказываются связанными линейным соотношением). Однако из равенства pift=0 еще не следует независимость- величин tji и yk, поскольку в этом случае величины могут ока- заться связанными более сложным (нелинейным) образом. Воспользовавшись определением коэффициента корреля- ции, можно получить следующие соотношения: а) среднее произведения двух случайных величин t/j и уь (У(Ук) = (Уд (Ук) + PikW, (2-6> б) дисперсия суммы случайных величин r/i, у2, ... D (Syi)= 3 D +2 E (2-7> i i i<k 2. Приближенный анализ функции случайных величин.. Для получения предварительных оценок можно ограничить- ся приближенным анализом функции случайных переменных. Тогда количественные характеристики распределения этой функции (напомним, что функция случайной величины — есть новая случайная величина) по заданным параметрам исход- ных переменных находятся следующим образом. Пусть Ф = Ф(уь ..., уп), где у\, ..., уп — независимые слу- чайные величины. Разложим Ф в окрестности точки (у\, ... ...» Уп): п Ф=Ф(у1,...,уп) + У1(у1-у1)-^-+... (2.8> Обычно в пределах достаточно узкой области можно огра- ничиться линейным разложением Ф(уг). Отсюда Ф —Ф(*Л...Уп), (2.9> т. е. среднее значение искомой функции приблизительно сов- падает со значением этой функции при средних значениях аргументов. Дисперсия распределения Ф(у<) равна П(ф) = (ф-ф)^У (£jLya2, (2.10> дУ‘ 1 где а?—дисперсии распределений случайных величин у^ Например, для функции Ф=у\1у2 имеем 7 D (Ф) ~ (а|/yi + У2) у2/yl . 20
Соотношения (2.9) и (2.10) справедливы, еслрв — 1 V’ д2Ф гг2 "Г? ф^>—5 --------аг Если Ui — стохастически не независимы,. ?? 2 д% то (2.11) остается в силе, а дисперсия йэд41 —I «и- г v р„ол. (2,11). ~ ' дУ1 ' “ dyt дук 3. Преобразование распределений. Укажем теперь спосо- бы вычисления распределений функций случайных величии. Пусть у — случайная величина с известной плотностью» распределения р(у), а Ф = Ф(у)—однозначная функция. Если Ф(у)—неубывающая функция, то оба неравенства у^У\ и Ф^Ф1(г/1) всегда выполняются одновременно. Та- ким образом, Р(у^у\) =Р(Ф^Ф1), или Ё(у)=С(Ф), где F и G — функции распределения величин у и Ф. Отсюда б(Ф) =Г(у)|у=У(Ф). Следовательно, £(ф) = -^- = AF__dy_ = р(у)*У_ . (2.12> 7 d<t> dy d<D у=у(ф) do У=У(Ф) z Если, например, Ф=у2, то (у^О) £(ф)=—7=7-р(^ = У(Ф)); ф>0. 2/Ф Поскольку Р(у^ур) =Р(Ф^Ф(ур)), квантили функции слу- чайной величины совпадают с преобразованными квантиля- ми аргумента, т. е. Фр=Ф(ур). Для монотонно убывающей функции Д(У^У1) = = Р(Ф2>Ф1(у1)), или С(Ф) = 1—F(y). Отсюда £(ф) = —р(р)А-| d$> 1Р=!/(Ф) Рассмотрим теперь функции нескольких случайных аргу- ментов. Очевидно, для получения плотности распределения такой функции ф=ф.(уь ...,уп) нужно просуммировать ве- роятности наблюдений всех значений переменных, при ко- торых рассматриваемая функция Ф имеет фиксированное- значение р(ф) = jp(yi, ..., у’п)6(Ф — Ф(у!, .... yn))dy'i... dyn, (2.13> где б — дельта-функция Дирака, p(yi, уп) — плотность, вероятности в точке Уь ..., уп. Для независимых величин,, как отмечалось, р= 2Ь
При вычислении интегралов следует пользоваться соотно- шением б (2 (У)) = £ 6 (У — У;)/ I z' (у,) |, 1 где суммирование ведется по всем корням уравнения г(у,) = = 0. Например, для суммы двух независимых переменных ф = г/14-г/2, где —оо<У1,2<°°, из (2.13) следует, что плот- ность распределения Ф определяется соотношением р(Ф)= J Р1(У')Р3(Ф — y')dy'. (2.14) —оа 4. Асимптотика композиций большого числа распределе- ний. Центральная предельная теорема. Реальные физические явления, являясь результатом взаимодействия многих случай- ных причин, могут иметь сложные распределения. Однако они обладают важным асимптотическим свойством, облегча- ющим их обработку. Оказывается, что совместное действие большого числа не- зависимых причин с интенсивностями разброса одного поряд- ка приводит к нормальному распределению для величин, возникающих под влиянием этих воздействий. Этот вывод следует из центральной предельной теоремы (А. М. Ляпу- нов), согласно которой распределение суммы Ф = 2г/, (где i yi есть п независимых случайных переменных со средними ~Уг и дисперсиями oi) стремится при и > 1 к нормальному распределению со средним Ф = £«/г и дисперсией о2(Ф) = i = (если только существуют такие числа а, 0>О, что i __________ <г?>а и \yt — г/г|8<Р; другими словами, относительный вклад о? в о® при п^>1 стремится к нулю). Не останавливаясь на доказательстве, заметим лишь, что при большом количестве случайных причин фактически реа- лизуются условия возникновения нормального распределе- ния (см. п. 5 § 1). В связи со сказанным становится понятным, почему нор- мальное и другие основанные на нем распределения играют особую роль в математической статистике. Задачи 1. Найти формулу для оценки дисперсии: а) логарифма интенсивности излучения г/=1п(А^//); б) функции (у1У2,...,Уп)1(гхг2.гп). -22
2. Показать, что распределение суммы независимых вели- чин с нормальными распределениями является также нор- мальным. 3. Убедиться, что плотность распределения суммы неотри- цательных независимых случайных величин равна ф р(Ф) = J pL (у') р.2 (Ф — y’jdy'. О Указание. Для неотрицательных величин уравнение Ф=У1+У2 оп- ределяет пределы их возможных значений, как 4. Радиактивный (3-источник состоит из смеси двух изото- пов со средними интенсивностями vi и V2. Показать, что флук- туации интенсивности суммарного потока (3-частиц описы- вается также распределением Пуассона. Указание. Воспользоваться соотношениями w PW= £ PANJP^N-NJ И N (1 + x)N = £ xkm/kl (N — А)! k=o 5. Источник у-излучения изготовлен из смеси изотопов,, каждый из которых имеет собственное энергетическое рас- пределение pi(Ef). Каково общее энергетическое распределе- ние p(Ef) радиактивного источника? Решение. Здесь мы встречаемся с распространенным видом задачи по изучению распределения суммарной «продукции по качествам изде- лий». В то время, как флуктуации общей интенсивности излучения подчи- няются статистике Пуассона, распределение у,-частиц по энергетическим интервалам [£, E+dE] определяется суммарным потоком у-частиц, испу- скаемых каждым из изотопов в данном интервале энергий. Таким обра- зом, итоговый энергетический спектр у-источника находится наложением* спектров каждого из изотопов с соответствующими «весовыми» коэффи- циентами, т. е. Р(Л i i где Vi — средние интенсивности изотопов. Заметим, что статистика числа у-частиц, регистрируемых в любом энергетическом интервале [E't E'+dE'] за какой-либо промежуток вре- мени /, является пуассоновской со средним значением У Vjipi (Е). i § 3. Некоторые специальные распределения 1. х2"РаспРеДеление* Рассмотрим п независимых случай- ных величин «1, ..., un, каждая из которых распределена нор- 22
мально с параметрами (0, 1). Сумма квадратов этих случай- ных величин называется -суммой: = (0<х2<оо), (3.1) i=l .a f=n называется числом степеней свободы х2- Функция х2 обладает распределением, которая в силу нормированности Ui зависит только от f. Плотность х2'Распределения, харак- теризующая вероятность обнаружения значений в интервале ЙХ2> Х2+^Х21> имеет вид (Пирсон) р(х2) = "Г' / /7 (Х2>7ехр(“ (3,2) 22 Г(4-) \ 2 ) где Г — гамма-функция. Соотношение (3.2) нетрудно дока- ,-зать методом индукции, установив его сначала для /=1 (см. (2.12) и задачу 3 § 2). Рис. 5. ^-распределение при различ- ных f Кривые плотности х2-рзспределения для различных f ука- заны на рис. 5. Согласно (3.2), х2==А D(x2)=2f. При f^>i (практически при /^30) распределение переходит в нормаль- ное с параметрами (f, 2f). Очевидно, величина —----------->• 1, f f—0° так как ее дисперсия стремится к нулю. Справедлива теорема сложения, согласно которой сумма k стохастически независимых Х/; величин имеет х2 распреде- ление с числом степеней свободы, равной сумме чисел степе- ней свободы каждой из величин k k £ xFf = Xf при f = J fl. (3.3) i~ 1 i=l 724
Существует также обратная теорема — теорема разложе- ния ^-распределения на суммы квадратов величин, линейно- связанных со случайными переменными и,-, которая форму- лируется следующим образом. X Пусть имеются суммы квадратов: Q = £ /2, где К слу- / чайных величин 1$ являются линейными функциями стохасти- чески независимых переменных распределенных нормально* с параметрами (0,1) каждая. Если имеются т линейных соот- ношений (связей) между «.<, то числом степеней свободы. Q-суммы является число f=X—tn. Тогда, если в результате линейных преобразований сумма квадратов п случайных величин щ, ип разбита на k сумм, квадратов Qi...с fi, ..., fk степенями свободы, т. е. X2 = = Qi + • • • +0ь <=i то необходимым и достаточным условием того, чтобы вели- чины Qi, ..., Qk оказались стохастически независимыми и опи- сывались распределениями с fi, ..., fk степенями свободы, яв- ляется выполнение равенства /х + fz+ ••• + fk=n- Теорема разложения оказывается чрезвычайно полезной? для различных статистических оценок. 2. ^-распределение. Рассмотрим случайную величину 2/2 V2 (A, fa) - ~ / -у- (° < °а< °°). (3.4> /1 > /2 где %i,2 — определены согласно (3.1) и (3.2). Плотность распределения и2 описывается соотношением. (Фишер): 21-1 (^)2 А+/. (A + fiV2) 2 (3.5> которое можно получить с помощью (2.13), используя (3.2). Кривые плотности ^-распределения для различных fi_n fz указаны на рис. 6. Согласно (3.5), среднее значение и2 = =faf (fa—2), если f2>2. Квантили ^-распределения vp (fi, f2) связаны соотноше- нием Vp(fv, А) = 1/р?-р(А, А). (3.6> 25
поскольку в соответствии с (3.4), u2(fi, fz) = l/v2(f2, ft)- ^-рас- пределение включает, как частные случаи, другие распреде- ления. Действительно, поскольку x2|f=i == и2> X2//lf=«> = 1, то v2(l, oo) = u2, о2(/, оо) = х2/А v2(l, f)=m (3.7) где t — переменная Стьюдента. Рис. 6. ^-распределение при различ- Рис. 7. Кривые плотности /-распреде- ных ft, h ления 3. /-распределение. Случайная величина t = (— оо</<оо), ' (3.8) где них2 определены согласно (3.1) и (3.2), имеет распределение (Стьюдент): г ( ^+1 \ -(+? 1 \ 9 ) / /2 \ 2 Р(0 = ~~ 1 + f . . (3.9) \ 2 / (которое может быть получено непосредственно из (3.5) пре- образованием t = ±|/о2(1, /)• /-распределение симметрично относительно нуля. При ,f->oo распределение стремится к нормальному с параметра- ми (0, 1) (рис. 7). Вследствие симметричности распределения для /-кванти- лей справедливо tp = — /j_p. Учитывая связь между величинами х2> о2, /, можно уста- новить соотношения между квантилями этих распределений: Ур(А оо) = Хр//; Vp(oo, f) = Нул-р', v2P(l, f)^(tt+p)2-, v2P(f, l) = (/p)-2; (3.10) 2 2 Vp (1, oo) = (u i+p)2; Vp (oo, 1) = (u p)“2. 2 2 26
v2~ и ^'РаспРеДеления широко применяются при статисти- ческом анализе экспериментальных данных. Задачи 1. Установить, что распределение р(у) величины у — У Xf (0^t/<°°) имеет вид р(!/) = fi2 t------ 2''2” Г (//2) Проанализировать случаи с [—1, 2. Совпадает ли распреде- ление р(у) при f=3 с максвелловским? 2. Используя результат задачи 1, записать плотность рас- пределения абсолютного отклонения zi=ly—1/|, если у рас- — Г 2 пределен нормально. Показать, что zx = ”1/ — а ~ 0,8а. Т л Чему равно среднее суммы п абсолютных отклонений, zn = —- У | t/j — уД, если все величины yt распределены нор- мально с равными дисперсиями а2? 3. Показать, что для пуассоновского распределения при; f=2(§+l) справедливо соотношение 5 - N Р(АГ<1)= У Nl Решение. Для ^-распределения можно записать (Г($) = ($—!)!> ОО 00 р(Х®>2т])=С р(х2Мха= f t4 5e-Tdr, J S‘ J 2П П где £=/72— 1. Отсюда, вычисляя последний интеграл по частям, приходим: к искомому соотношению. 4. Убедиться, что для биномиального распределения вы- полняется соотношение В Рл(ЛГ<£) = 2 0^/(1-^ = W=0 = 1-р(НЛ, при А = 2(1+1); Д = 2(п-|). Указание. Воспользоваться методом решения предыдущей задачи».
Глава II ЭКСПЕРИМЕНТ И СТАТИСТИЧЕСКАЯ ОЦЕНКА ПАРАМЕТРОВ РАСПРЕДЕЛЕНИЯ § 4. Эксперимент и достоверность наблюдений Как уже отмечалось, на результаты экспериментов ока- зывают влияние случайные воздействия, возникающие в про- цессе измерений и обработки. Совокупность внешних возму- щений вызывает разброс результатов. Это усугубляется действием целого ряда систематических причин («сдвинутая» шкала приборов, плохая геометрия опыта и т. д.). Помимо внешних случайных и систематических воздейст- вий разброс измеряемых значений может быть обусловлен также статистической (вероятностной) природой самого на- блюдаемого явления. Так, при исследованиях процессов микромира необходимо учитывать статистическую природу этих явлений. Такого рода особенности проявляются и при изучении чисто «классических» объектов (многочастичные системы, например плазма). В итоге эмпирический материал по своему характеру яв- ляется случайным. В опыте разброс значений часто интерпретируется как результат несовершенства экспериментальной методики, а отклонение значений от некого среднего — как ошибка изме- рений. При этом различают случайные и систематические ошибки, связанные соответственно со случайными и система- тическими причинами. Однако понятием «ошибка измерений» следует пользоваться с известной осторожностью. Если рассеяние результатов, возникающее в .процессе са- мого измерения, может трактоваться как мера погрешностей, допускаемых в измерениях, то неопределенность значений, •связанная с природой исследуемого процесса, позволяет су- дить лишь о статистических закономерностях этого явления и не может называться собственно ошибкой. Таким образом, следуя одностороннему определению ошибки, можно «обнаружить» ее даже в условиях идеально- го эксперимента, в то время как несовпадение данных будет отражать объективную реальность явления. Хотя, конечно, 28
можно упомянуть класс экспериментов по измерению абсо- лютных констант (заряд, масса, спин элементарных частиц и т. д.), в которых разброс значений при определении этих величин, по-видимому, нужно отнести к «чистым» ошибкам измерения. Резюмируя сказанное, следует заключить, что анализ ре- зультатов наблюдений должен базироваться на вероятност- ных представлениях. § 5. Доверительный интервал и доверительная вероятность Остановимся прежде всего на способе описания неопреде- ленности, допускаемой при статистической интерпретации ре- зультатов наблюдений. В качестве характеристики неопределенности или несо- вершенства в описании измеряемых величин, базирующемся на данном эмпирическом материале, избирают доверительный интервал, в пределах которого с заданной доверительной ве- роятностью можно обнаружить значения исследуемой вели- чины. Размах доверительного интервала и служит мерой достоверности при статистических выводах. К сожалению, на практике погрешности методики изме- рения не всегда поддаются оценке. Поэтому доверительный интервал, соответствующий заданной доверительной вероят- ности, указывает значения величин, наблюдаемые в экспери- менте в условиях предлагаемой методики измерений. При заданной доверительной вероятности доверительный интервал можно вычислить, если удается установить распре- деление исследуемых величин. Для данного распределения р(у) вероятность события у^уР равна УР Р(У<Ур}= J P(y')dy', (5.1) --00 где уР — Р-квантиль. Поэтому доверительной вероятности Р сопоставляется доверительный интервал уР, <у^2уР„ кото- рый вычисляется согласно соотношению Ур Р(.Ур1<У<Ур1) = J Pdy'=P2 — P1, (5.2) УР, где Р2 и Pi соответствуют квантилям Р(У^Ур1,г) ~ Р\л (рис. 8). Величина е = 1— Р (5.3) 29
называется уровнем значимости (величину 1—е называют также коэффициентом надежности). На рис. 8 значения квантилей ypt,, соответствуют накоп- ленным вероятностям численно совпадающим с величи- нами площадей заштрихованных областей (Р2 соответствует вся заштрихованная область так, что Р{у>Ур,) = 1—Рг}- Очевидно, границы доверительного интерва- ла [у2, yi] можно смещать в стороны больших или меньших значений у, не изменяя величины Р. Обычно эти границы вы- бирают таким образом, чтобы накопленные веро- ятности Р(у^Ур\)=Р\ и Р(У>УРг) = 1—Ръ были равны между собой. В этом случае оказыва- Рис. 8. Квантили уР{ 2 распределе- ются равными вероятно- ния р(у) сти отклонений у в сто- роны больших и меньших значений от у2,\. Полагая Р1 = 1—Р2 = е/2, имеем Р (Уф < У < t/l-B/2) = 1 — 8. (5.4) ‘ Для симметричных распределений со средним у имеем Ур,—у=у—у Pt (доверительный интервал оказывается сим- метричным относительно среднего значения у) и Р(\У — ^Kki-e/2 — У|) = 1— е. (5.5) Часто доверительный интервал указывают в единицах , среднего квадратичного отклонения о. Если последнее извест- но, то можно сделать определенные суждения о границах доверительного интервала, даже не исследуя характер рас- , пределения результатов. Согласно неравенству Чебышева | P(\y-y\<<yg)>i-\/g\ j т. е. интервалу (y±ag) соответствует доверительная вероят- j ность, не меньшая, чем 1—1/g2. Однако это значение, как правило, оказывается очень заниженным. Так, для нормаль- ного распределения Р(\У-У\<°) = 0,683-0,7. Поэтому неравенство Чебышева может быть использовано лишь для ориентировочных оценок. 30
Заметим, что в силу традиции значение (утах—У), соот- ветствующее доверительной вероятности 0,683 (уровень зна- чимости ес^О.З), часто называют средней квадратичной ошиб- кой. Для нормального распределения эта величина совпа- дает со средним квадратичным отклонением. Поэтому стан- дартное отклонение называют средней квадратичной ошибкой. Средняя квадратичная ошибка является удобным пара- метром для описания распределения случайной величины, по- скольку среднеквадратичный интервал (с Р=0,68) опреде- ляет основное рассеяние результатов наблюдений. Однако если необходимо более детально охарактеризовать возмож- ное рассеяние наблюдаемых значений, следует указать (по- мимо среднеквадратичного) интервал, соответствующий боль- шему значению доверительной вероятности, например с Р = =0,95 (е=0,05). Нелишне подчеркнуть, что в то время, как для нормального распределения интервал с Р=0,95 опреде- ляется удвоенным средним квадратичным отклонением, в ре- альных распределениях его границы могут заметно превос- ходить значения, равные среднему ± удвоенная «средняя квадратичная ошибка». Обычно в эксперименте некоторые, а иногда и все из па- раметров распределения исследуемой величины неизвестны, и заключение о них делается на основании полученных эмпи- рических данных. Подход к решению подобных задач обсуж- дается ниже. Здесь же мы ограничимся замечанием, что в условиях недостаточной эмпирической информации сужде- ния об исследуемых величинах обладают меньшей достовер- ностью. В конечном счете это выражается в том, что границы соответствующих доверительных интервалов расширяются (особенно при малых е). Остается уточнить, как описать и толковать достоверность оценки для величины, имеющей строго детерминированное значение (такими величинами являются, например, парамет- ры распределений). Допустим, что в результате серии изме- рений и вычислений удалось установить, что вероятность от- клонения некой эмпирической оценки у от генерального сред- него у в пределах ±Д1-е/2 равна 1—е, т. е. Р(\У — f/К Д1-е/2)= 1 — е. (5.6) Если проанализировать это соотношение с точки зрения оценки генерального среднего у, то следует заключить, что интервал //±Д1-е/2 с вероятностью Р=1—е «накрывает» значение у. Другими словами, при многократном проведении опытов (и вычислении у и Д1_е/2) в 100(1—е) % случаев 31
указанный интервал будет содержать истинное значение у, и лишь в 100е% случаев — указывать ошибочное значение для у (см. также § 10). § 6. Схема эксперимента. Выборочный метод и задачи статистики Приступая к эксперименту, исследователь ставит своей целью выяснение определенных объективных характеристик интересующего его явления. К таким характеристикам могут относиться, например, данные о распределении какой-либо величины (среднее, дисперсия и т. д.). Как правило, иссле- дователь располагает некоторой предварительной информа- цией, позволяющей в той или иной степени спланировать на- правленное проведение наблюдений. В процессе наблюдений экспериментатор собирает дополнительную информацию, ко- торая и служит реальной базой для вынесения суждений. Как бы ни был обширен эксперимент, собираемая инфор- мация никогда не бывает абсолютно исчерпывающей. Наобо- рот, обычно (особенно в малоизведанных областях) эмпири- ческая информация оказывается весьма ограниченной. Собранный материал может представлять несомненный интерес сам по себе. Однако задача статистического анализа данных наблюдений заключается в том (и в этом состоит его сложность), что на основании конечного числа данных при- ходится делать выводы (и оценивать их достоверность) отно- сительно более широкого круга явлений. Например, мы изучаем намагниченность образца при различных температурах. Допустим, что исходя из некоторых предварительных соображений мы измерили намагничен- ность при определенных значениях температуры образца. Этот материал уже представляет определенную ценность. Тем не менее задачей исследования является установление зави- симости намагниченности во всем интервале изменения тем- пературы, т. е. необходимо, опираясь на ограниченный мате- риал, вынести суждения о более широкой совокупности явле- ний. В этой связи будем рассматривать собранный материал как некую пробную группу, или выборку, представляющую лишь один из возможных вариантов наблюдения значений из генеральной совокупности исходной величины. Разумеется, в силу случайности пробной выборки сужде- ния, сделанные на ее основании о характере генеральной со- вокупности, имеют случайный характер. Теория должна ука- зать, следовательно, как наилучшим способом распорядиться накопленной эмпирической информацией для получения наи- более достоверных выводов и одновременно оценить и степень надежности этих заключений. Наконец, теория должна пред- 32
сказывать также пути получения наиболее полезной инфор- мации, т.-е. выработать методы научного планирования экс- перимента. § 7. Принцип максимального правдоподобия Принцип максимального правдоподобия является одной из самых плодотворных идей, лежащих в основе построения методов статистического анализа. Кратко принцип максимального правдоподобия может быть сформулирован следующим образом (Фишер): «Наилучшим описанием исследуемого явления является то, при котором максимальна вероятность получить фактиче- ски измеренные значения наблюдаемых величин», В дальнейшем принцип максимального правдоподобия бу- дет использован для различного рода статистических оценок. При этом в качестве исходного материала будет использо- ваться совокупность экспериментальных данных, рассматри- ваемых согласно вышесказанному (см. § 6), как случайная выборка конечного объема из генеральной совокупности зна- чений наблюдаемых величин. Безусловно, никакой ограниченный материал не дает воз- можности точно определить параметры генеральной совокуп- ности. Такой материал позволяет лишь указать оценки иско- мых параметров. Однако способ оценок, следующий из прин- ципа максимального правдоподобия, обладает рядом отли- чительных свойств, заставляющих при сравнении различных критериев отдать предпочтение этому принципу. Перечислим основные свойства, которыми обладают оцен- ки, следующие из принципа максимального правдоподобия. Прежде всего оценки являются состоятельными, т. е. схо- дятся по вероятности к соответствующим параметрам. Пусть, например, в генеральной совокупности оценивается параметр а. На основании выборки объема п получена его оценка ап. Тогда при бесконечном увеличении объема выборки вероят- ность того, что значение ап отклонится от а на сколь угодно> малую величину, стремится к нулю. Оценки, базирующиеся на случайном материале, сами являются случайными величинами и имеют некоторое выбо- рочное распределение. Однако оценки, следующие из прин- ципа максимального правдоподобия, являются асимптотиче- ски нормальными и асимптотически эффективными, т. е. их распределение сходится к нормальному при п->оо и диспер- сия этих распределений при и^>1 меньше дисперсий любых. Других оценок, найденных по выборке того же объема. Вообще в качестве меры сравнительной эффективности Двух различных оценок си и аг параметра а принимают отно- шение В. К. Гришин 33- 2
е= (<Х1~а)—. (7.1) (а2 — а)8 Более эффективной является оценка, для которой величина (а—а)8 оказывается наименьшей, поскольку ей соответству- ет меньшее рассеяние. Таким свойством обладают оценки, полученные с помощью рассматриваемого принципа. Оценки оказываются также достаточными, т. е. содержат максимум информации относительно исходных параметров. Отметим еще одно важное свойство статистических оце- нок, которое впрочем не вытекает безусловно из принципа максимального правдоподобия. Это — так называемая несме- щенность оценок, требующая, чтобы при любом объеме вы- борки п среднее оценок по всем возможным в генеральной совокупности значениям величин, имеющимся в выборке, совпадало с истинными значениями параметров (о процеду- ре такого усреднения см. § 8). Если имеется несколько оценок, то обычно выбирают не- смещенную оценку, поскольку в последних отсутствуют си- стематические смещения. Условие несмещенности особенно важно при малом объ- еме выборки. С помощью этого требования удается уточнить оценки, вытекающие из общего принципа. § 8. Оценка параметров физических распределений В большинстве физических экспериментов общий харак- тер распределений случайных величин можно предсказать заранее или на основании некоторых предварительных изме- рений, или с помощью определенных теоретических сообра- жений. Неизвестны лишь параметры этих распределений. Укажем способ их оценки, опираясь на метод максимального правдоподобия. Пусть в эксперименте исследуется величина у, причем из-, меренные значения оказались равными yit у2, ..., уп', измере- ния независимы между собой. Если теоретическая плотность вероятности наблюдений в некоторой точке у, есть pfjji, а. ₽>—)» где а, р,...— параметры этого распределения,то вероятность получения в опыте указанных значений опреде- ляется величиной п ИУ1, ‘--,Уп)= п р(уь <*> Р> •••)• Величина L называется функцией правдоподобия выбор] 34
ки. Заменим теперь в L параметры а, 0, ... на их оценки а, 0, а = а(г/1, ... , уп), (8.2) ••• , Уп), Согласно принципу максимального правдоподобия, наи- лучшими оценками а, 0,... являются такие, при которых функ- ция правдоподобия L принимает максимальное значение,, т. е. при -^ = 0, ->=0,... (8.3) да д 0 Вместо (8.3) часто удобнее использовать уравнения а1"£ = 0, =0, ... (8.4) да 00 ' ’ В качестве примеров рассмотрим задачу определения па- раметров пуассоновского и нормального распределений. Распределение Пуассона. Для распределения Пуассона функция правдоподобия имеет вид П Ы j. = (8.5) i=l * где v — средняя интенсивность процесса, Nt — значения чис- ла событий, фиксируемые в течение времени t (все измерения имеют равные длительности t). В соответствии с (8.4) для оценки v имеем п <8-6» Следовательно, наилучшей оценкой v является выборочное среднее от эмпирических интенсивностей Ni/t, т. е. п (8.7) i=l Оценка v является несмещенной, поскольку v = v. I 2* 35
Нормальное распределение. Для случайной независимой выборки уи ..., уп объема п из генеральной совокупности с нормальным распределением функции правдоподобия равна / У <уг| _ 2L I 1=1________I L = (2ло2) 2 ехр\ 2<я /, (8.8) где ц и о2 — среднее значение и дисперсия в генеральной со- вокупности. Оценки т] и а2 следуют из уравнений = 0; d,"L = 0, (8.9) dr) да» ИЛИ п п -4- У(«/> — л)=0;--------4-—=—У(& — п)2 =0. о2 2<j2 2 (о2)2 — Откуда п П= —У>. (8-10) п Ля* 1=1 п °2= • (8J1) 1=1 Для проверки несмещенности оценок воспользуемся соот- ношениями У( = К> — — (8.12), где 6ц = 1 и 6ife — 0 при i ф k. В результате л = л; — w ~1 g2. (8. п Поэтому несмещенными оценками параметров нормального! распределения являются выборочное среднее —(8.141 /г I я выборочная дисперсия | n I О2 = —ЦгУ(^-П)2. (8.15| п —11 ч i “ 11 36
Поскольку 1] и о2 —случайные величины, каждая из них характеризуется соответствующими дисперсиями. Так, дис- персия г] равна —----— а2 = (т) —т])2 = —, (8.16) что нетрудно показать с помощью (8.13) и (8.12). Можно показать, что оценки т) и а2 обладают свойствами оценок, отмеченных в § 7. В заключение этого параграфа обсудим следующий прак- тически важный вопрос. С помощью (8.14) мы сумели сде- лать определенный вывод об истинном значении среднего в генеральной совокупности. Как оценить достоверность этого вывода? Казалось бы, поскольку тип распределения нам из- вестен, мы можем, например, определить доверительный интервал для оценки среднего П =i|± — у п (8.17) где т] и а вычисляются согласно (8.14) и (8.15) *, приписав ему значения доверительной вероятности 1—е = 0,7. Действи- тельно, как мы увидим в дальнейшем, такого рода суждение близко к истинному при п^>1. В других случаях (особенно, если мы располагаем очень малым объемом выборки) дис- персия оценок т] и о2 оказывается настолько большой, что мы не можем пользоваться квантилями нормального рас- пределения с точно известными параметрами. Другими словами, доверительная вероятность, соответ- ствующая интервалу (8.17), может существенно отличаться от значения 1—е=0,7. Вопрос о величинах необходимых по- правок может быть решен после выяснения достоверности оценок о2. Задачи 1. В серии из п испытаний событие А наблюдалось траз. Указать оценку вероятности р появления события А. Решение. Функция правдоподобия в данном эксперименте * Здесь и в дальнейшем а будем понимать как а = V а2 . 37
Поэтому уравнение для определения оценки р записывается d In L т п — т __ др р 1 — р Отсюда ~ т р= — 2. Показать, что а) оценку а2 можно представить в виде о® -------- (У у1—«п ); П—1 / £=1 б) величины оценок (8.15) и (8.16) не изменятся, если У^Уг + Const. § 9. Достоверность оценки дисперсии нормального распределения Рассмотрим более подробно соотношение (8.15). Оказы- вается, случайная величина о2 как функция стохастических переменных обладает свойствами ^-распределения, отмечен- ного в § 3. Действительно, рассмотрим сумму квадратов независимых величин Ус — П а (9-1) имеющих нормированное нормальное распределение. Согласно определению такая сумма имеет свойства %2-рас- пределения с числом степеней свободы f — nz п п (9.2) Произведем в этой сумме простые преобразования: «// —п = (& —п) + (п —п). Тогда п п 1=1 ' i=l + -^-(П-П)2. (9.3) 38
Если т] совпадает с выборочным средним, т. е. п 1=1 то в соотношении (9.3) среднее слагаемое обращается в нуль и X«=Qi + Q2, (9.4) где Здесь Ц — линейные комбинации uj. Вследствие определения q мы имеем одно линейное уравнение (связь), между tit, и соотношения (9.5) представляют Q-суммы с числами степе- ней свободы fi—n—1 и f2=l. Поскольку fi+f2=ti, то, ис- пользуя теорему о разложении х2-распределения, приходим к выводу, что обе суммы обладают %2-распределениями при h=n— 1 и f2=l. Итак, выборочная дисперсия п ё = -1— У (yt - П)2 = а2 4- <9-6) П— 1 f 1=1 при f—n—1. Так как ^-распределение хорошо изучено, мы располагаем теперь способом, с помощью которого нетрудно указать достоверность оценки дисперсии по (8.15). Для указанной величины доверительный интервал с уров- нем значимости е вычисляется по Р-квантилям ^-распреде- ления: р (Хр. < X2 <%/>,)= ^2 - = 1 - е- (9.7) Отсюда* Р (А< <я~1.)?’ <А) L , = 1 -в. (9.8) Решая это неравенство относительно а2, определяем дове- рительный интервал, в пределах которого с вероятностью 1—е находится истинное значение дисперсии генеральной со- вокупности Р (Vi**2 < °2 < Y^2) = 1 ’— е> (9.9) * В дальнейшем знак равенства будет сохраняться лишь для дискрет- ных распределений. 39
где Y1.2 = -4- ^р2,1 f=n-\ Значение Yi>2 вычисляется по таблицам квантилей ^-рас- пределения или по таблицам f/>(oo, f) и Vp(f, оо) квантилей (см. § 3). Как правило, Р2 и Л выбирают таким образом, чтобы р1=:1-р2= 1 2 2 Для уровней значимостей е = 0,3 и 0,05 при малом объеме выборки в табл. 1 имеем значения величин уьг (верхнее зна- чение соответствует в = 0,3, нижнее — в = 0,05). Таблица 1 f = п - 1 1 2 3 4 5 6 10 оо 0,483 0,526 0,556 0,593 0,617 0,638 0,690 1 Yi 0,200 0,271 0,320 0,358 0,389 0,415 0,488 1 28,6 5,71 3,75 2,86 2,53 2,27 1,79 1 Y2 1018 39,5 13,9 8,26 6,02 4,85 3,08 1 сравнения в табл. указаны величины Так как бес- >-о2, Для конечном объеме выборки, что и подтверждает состоятельность оценки о2 по о2. Напро- тив, при малых объемах выборки неопределенность оценки о2 по о2 довольно велика. Пример. Пусть мы располагаем следующими данными: У1 = 0,9; y2=l,l; «/3=1,0. Оценим дисперсию генеральной совокупности. Здесь г) = 1,0 и а2 = 0,01. Используя данные табл. 1, нахо- дим, что при 8=0,3 истинное значение а2 лежит в пределах а2 = 0,01 0,047 ; 8=0,3. — 0,0047 «Ошибка» превосходит 100%. Столь большая неточность в оценке является результатом большой доли случайности, допускаемой в выборке малого объема. В заключение остановимся на оценке среднего квадратич- ного отклонения о. Очевидно, доверительный интервал для оценки о следует непосредственно из (9.9), поскольку кван- 40 Yl,2 при 1, то а2 - 1
тили функций случайной величины совпадают с преобразо- ванными квантилями аргументов (§ 2). Поэтому с вероят- ностью Р=\—е о /y2 • (9.Ю) Тем не менее следует иметь в виду, что величина о = рЛг2 является смещенной оценкой среднего квадратичного откло- нения, так как а=о(1—2/(8п—7)) #=<т. Несмещенной оцен- кой о является величина о (1—2/(8п—7))-1. На практике в качестве оценки среднего квадратичного отклонения о нередко используют арифметическое среднее абсолютных отклонений п /и = —Т)|, (9.11) 1=1 где т) — выборочное среднее. Это более смещенная оценка, так как Кроме того, по сравнению с о величина т является менее эффективной оценкой, поскольку £)(o/n//n)> D(oo/o). Дру- гими словами, при равных выборках оценка о по т дает меньшую точность, чем при использовании о. Поэтому при оценке среднего квадратичного отклонения о целесообразно обращаться к величине о. Задачи 1. Показать, используя (9.7), что Z)(q2) =2о4/(п—1). 2. Не является ли неравенство Чебышева более чувстви- тельным, чем соотношение (9.9)? 3. Указать объем выборки, при котором доверительный интервал становится уже, чем о2 (при е=0,05). § 10. Достоверность оценки среднего генеральной свокупности (нормальное распределение) Согласно результатам § 8 наилучшей оценкой генераль- ного среднего является выборочное среднее, вычисляемое в соответствии с (8.14). Нетрудно видеть, что эта оценка 41
остается неизменной, если генеральная дисперсия о2 известна заранее. В этом случае достоверность в определении гене- рального среднего можно описать с помощью квантилей нор- мированного нормального распределения. Очевидно, величина и = ^~п , (10.1) где т] — выборочное среднее, а г) — истинное значение сред- него, представляет случайную величину с нормированным нормальным распределением. Поэтому для заданного уровня значимости е можно записать Р(«р, = 1 — 8> где Р2—Pi=l—е, Ир„,— квантили нормированного распреде- ления. Положим Pi = l—Рг=е/2. Тогда, поскольку ые/2 = = — имеем Р (— Ui-e/2 < и < щ-8/2) = 1 — е. Таким образом, вероятность того, что выполняется неравен- ство п — а/К« • «1-8/2 < Г) < Л +о/Уп • «1-8/2, (10-2) равна 1—е. Тем самым мы определяем границы доверитель- ного интервала для т]. Во избежание возможных недоразумений уточним еще раз, как следует понимать соотношение (10.2), а также лю- бое соотношение, определяющее доверительные границы. Если имеется несколько выборок (с фиксированным объе- мом п), то границы доверительного интервала изменяются от выборки к выборке, в силу случайности последних, вместе с изменением выборочного среднего. Среди большого числа выборок доля 1—& общего числа интервалов будет содержать (накрывать) генеральное среднее т). Может случиться, что тот или иной интервал не содержит т], но в большом числе опытов это явление будет наблюдаться лишь с частотой е. Если генеральная дисперсия а2 неизвестна, то для оценки достоверности в определении генерального среднего вновь обратимся к соотношению (9.6). Функция о2 может быть выражена через х2-величину. Поэтому соотношение t = = —-— (Ю.З); V о2/п / X2// обладает свойствами случайной переменной с /-распределе- нием с числом степеней свободы f=n—1. 42
Используем теперь это свойство для вычисления довери- тельных границ в оценке генерального среднего. Для заданного уровня значимости е имеем А-в/2) = 1-8, (10.4) где, как обычно, Pi=l—^2=8/2 (квантили /-распределения связаны соотношением tP=—ti~P). Следовательно, можно утверждать, что с вероятностью 1—е истинное значение гене- рального среднего лежит в пределах Л Л-е/2 -8/2, (10.5) Vn Vn. где т] и о — выборочные среднее и среднее квадратичное от- клонение, а Л-в/2 -квантиль берется при f=n— 1. Тем самым мы можем ответить на вопрос, поставленный в конце § 8. Отсутствие точной информации о значении гене- ральной дисперсии а2 вынуждает нас расширить границы до- верительной области. Это расширение характеризуется вели- чиной отношения ^1-е/2/н1-8/2, которая тем больше, чем мень- ше объем выборки. Лишь при очень большом объеме выбор- ки, когда оценка о2 практически совпадает с генеральной дисперсией, не происходит дополнительного увеличения до- верительного интервала. Значения 6-8/г -квантилей (называемых иногда коэффи- циентами Стьюдента) для уровней значимости е = 0,3 и е = =0,05 (верхние значения соответствуют е=0,3, нижние — 8 = 0,05) указаны в табл. 2. Таблица 2 f = п — 1 1 2 3 4 5 6 10 оо *1—8/2 1,96 12,71 1,34 4,30 1,25 3,18 1,19 2,78 1,16 2,57 1,13 2,45 1,09 2,23 1,04 1,96 При п->оо, /-распределение стремится к нормированному нормальному, квантили которого для е=0,3 и 0,05 практи- чески равны 1 и 2. Очевидно, при п<10 квантили /-распре- деления заметно превосходят эти значения. Пример. По выборке из трех измерений «/1 = 0,9; = #з=1,0 оценим генеральное среднее. Согласно (10.5) имеем (т]=1,0; о=0,1) 43
о Л—е/2 — 1 >0 ~t~ 0,058 /i—j/2, T) =n± у и или _ 1,0 ± 0,078 при 8 = 0,3, 1,0 ±0,248 при е — 0,05. Таким образом, «удвоенная средняя квадратичная ошиб- ка» (е = 0,05) более чем в два раза превосходит соответствую- щее значение для генеральной совокупности с точно извест- ной дисперсией. При большем объеме выборки расширение доверительного интервала не столь значительно. Задачи 1. По данным выборки ..., уп найти параметры распре- деления величины Ф(у) («косвенный» анализ Ф). Решение. При известном распределении у с помощью преобразо- вания нетрудно установить вид распределения Ф(г/), а затем, используя принцип максимального правдоподобия, оценить среднее и дисперсию ге- неральной совокупности для величины Ф. Если распределения для у и Ф не известны, но есть предположение, что распределение Ф не обладает ярко выраженной асимметрией, то мож- но считать его близким к нормальному и для оценок использовать резуль- таты этого параграфа, рассматривая значения Ф1=Ф(#1), ...» Фп=Ф(«/п) как новую выборку. 2. Найти параметры распределения для функции многих случайных переменных. Решение. Если Ф является функцией многих случайных перемен- ных у^\ у^\ у&, то анализ параметров распределения необходимо про- изводить на основе новой выборки Фь ..., Фп, по формулам § 8 и 9, где под Фг- следует понимать значение этой функции в каждой точке (у^ у<?, ••• > У?')- Для приближенной оценки параметров распределения для Ф можно воспользоваться формулами § 2. Так, дисперсия оце- нивается где о? — оценки средних и дисперсий каждой из переменных у^. Достоверность оценки среднего Ф можно описать соотношением Ф = Ф$'>)± Оф Ve/aW, где / — находится из уравнения k 44
__числа степеней свободы оценок а^. 3. Сколько измерений нужно сделать, чтобы положение среднего Ф = Ф(у) «определялось с точностью 5°/о»? Решение. Вопрос поставлен, как это часто встречается, не вполне четко. Будем его понимать таким образом, что отношение размаха дове- рительного интервала, найденного при данном уровне значимости к эмпи- рическому среднему, не должен превышать 0,05. Размах интервала равен. ф1-е/2 ~ Ф = 1—е/2 У tl f=n-l где Ф и Оф оцениваются из (8.14) и (8.15) по выборке Фг = Ф(г/г). Оче- видно, при п->оо интервал сокращается до нуля, так как аф и стремятся к конечным величинам. Отсюда п определяется как решение уравнения ^1—е/г/Ф = 0,05. Например, при Ф=10, аф=0,5 и е=0,05 из табл. II имеем /г^б. Очевидно, ответ не кажется вполне убедительным, поскольку выбор 8 страдает известной долей неопределенности (§ 5). Более четко этот вопрос решается с помощью оценки вероятности конкурирующего решения (см. § 13). § 11. Достоверность оценки среднего пуассоновского процесса Пуассоновское распределение характеризуется одним па- раметром— генеральным средним. Если в течение времени t зафиксировано Nd событий, то N~Nd1 а средняя интенсив- ность (см. (8.7)) (11.1) В качестве границ доверительного интервала, определяю- щим с уровнем значимости е положение среднего N=vt по его оценке Nd, выбираем два числа N2>N& и Ni<NQi задана ные следующим образом. Построим два распределения со средними N=N2 и N=N^. потребовав, чтобы вероятность наблюдения значений N^N& для первого распределения не превосходила Pi = е/2, а ве- роятность наблюдений значений N^Nd для распределения с меньшим значением среднего N = N\<Nd была не более 1—^2 = е/2, т. е. P{N <W9; N = NJ = Рг = V е-^ = е/2, ЛшА k\ k=Q (11.2) 45
P(N>N,; N = jVx) = l—P2 = j? <^1е-лг,=8/2. k=N3 Рис. 9. Доверительный интервал для оценки среднего распределения Пуассона по Na Тем самым мы устанавливаем границы возможных отклоне- ний Na от N, соответствующие доверительной вероятности Р=1—е: P(jVx<jV<jV2) = 1-е. (11.3) На рис. 9 площадь левой заштрихованной области (под оги- бающей) равна вероятности P(JV^2Va при N=N2), правой — P(N^.Na при N—Ni). Граничные числа N2 и N\ находятся как решения уравнений (11.2); эти числа выражаются через квантили х2-распределения (см. § 3, задача 2): ^ = Т<е/2 при f = 2(JV,+ l), (11.4) ^1=ТХе/2 пРи/ = 2^э- Очевидно, границы несимметричны относительно Na, что следует из асимметрии распределения. Значения N\ и N2, следующие из (11.4), указаны в табл. Ш (верхние числа соответствуют е=0,3, нижние — для е=0,05). 46
Таблица 3 0 1 2 3 4 5 6 8 10 Ni 0 0 0,167 0,025 0,679 0,242 1,32 0,619 2,02 1,09 2,76 1,62 3,53 2,20 5,12 3,45 6,761 4,79] n2 1,91 3,69 3,24 5,57 4,80 7,23 6,10 8,77 7,36 10,2 9,84 11,7 11,2 13,1 13,7 15,8 14,5 18,4 Доверительные границы для интенсивности событий рав- ны 2L<v<2!Jl (Ц.5) На первый взгляд вызывает удивление существование верхней границы при Na=0. Однако мы должны от- давать себе отчет в том, что отсутствие событий за проме- жуток времени t еще не гарантирует их невозможность при большем времени наблюдения. Разумеется, верхнее допусти- мое значение интенсивности убывает с ростом t (например, v<l,91/0. Как следует из табл. 3, с ростом Na размах доверитель- ных границ |ЛГЭ—Л^1,г| растет, но относительная неопределен- ность |М>—У1,2| /М> убывает. Пример. При измерениях космического излучения в тече- ние 100 с прибор зарегистрировал 8 событий. Средняя интен- сивность событий v =-^- = 0,08 соб./с, а доверительные границы vi=0,035 и V2=0,158 при 8=0,05. Следовательно, v = 0,08 ± 9’9?? при е = 0,05. U, UttO При Л^Ю распределение Пуассона практически совпа- дает с нормальным с параметрами (N, N). В этом случае оценка среднего упрощается, поскольку мы можем восполь- зоваться квантилями нормального распределения. Поэтому записываем р(иР,< = Р2-Р1 = 1—е, (11.6) \ И N / где up{ 2 — квантили нормированного нормального распре- 47
деления. Полагая Pi=l—Р2 = е/2 и реша^ (11.6) относитель- но N, получаем / / / 2~^ 4 ' /Уэ I | , “1-8/2 | 1 / Uf-e/2 , “1-8/2 t V + 2Л,э ~ * / N3 4/V| Значения t^-e/2-квантилей при е=0,3 и 0,05 указаны в по- следнем столбце табл. 2. Сдвиг центра доверительного интервала, следующий из (11.7), обусловлен зависимостью дисперсии от среднего. Сравним результаты (11.7) и Данные табл. 3. При п=10 из (11.7) следует (е=0,05) N2= 18,5; A^i = 5,38, т. е. в преде- лах уровня значимости границы совпадают. При вместо (11.7) используют упрощенную фор- мулу v = 2М1 । ц‘-*/2 Так что средний квадратичный интервал для N — vt равен N3 ± VN3, а удвоенный — N3 ± 21/N3. Из данных табл. 3 очевидно, насколько неточна послед- няя оценка в области малых значений N3. Задачи 1. С помощью прямых вычислений подтвердить из (11.2), что при N3=0 верхняя граница доверительного интервала пуассоновского процесса равна Af2=ln(2/e). 2. Число отсчетов в схеме совпадений, вызываемое посто- ронним источником за 100, оказалось равным 6. Собствен- ные шумы вызывают 3 совпадения за те же 100 с. Что мож- но сказать о фоне, создаваемом одновременно двумя этими источниками? Указание. Воспользоваться теоремой сложения пуассоновских про- цессов.
Глава III СТАТИСТИЧЕСКАЯ ПРОВЕРКА ГИПОТЕЗ § 12. Критерий значимости Обратимся теперь к рассмотрению более широкого круга проблем статистического анализа, а именно проблем, связан- ных со статистической проверкой различных теоретических гипотез. Прежде чем перейти к анализу наиболее характер- ных задач такого рода, обсудим используемые в статистике при их решении основные критерии. Проблема статистической проверки какой-либо гипотезы в общих чертах сводится к следующему. Как правило, харак- теристики исследуемого явления, заключение о которых де- лается на основании статистических наблюдений, в процессе анализа сравниваются с другими статистическими данными, либо с уже известными или предполагаемыми числовыми константами. Для выработки статистических критериев срав- нения прежде всего нужно указать интервал, в пределах ко- торого возможные значения испытываемого параметра встре- чаются с наибольшей вероятностью (или интервал, который с наибольшей вероятностью накрывает предполагаемые зна- чения числового параметра). Если теоретическое значение этого параметра укладывается в указанный интервал, то ги- потеза не будет противоречить наблюдениям, если нет, то ги- потеза с большой вероятностью может быть отвергнута. Подчеркнем еще раз, что выводы о противоречивости или непротиворечивости эмпирического материала и исходной гипотезы не носят абсолютного характера, а покоятся на большой или меньшей доли правдоподобия. Например, пусть мы сравниваем эмпирическое среднее п с предполагаемой величиной т] = т]о- Ясно, что если разность И—По будет достаточно мала (например, меньше стандарт- ного отклонения для п), то естественно считать гипотезу о совпадении т) и т)о оправданной. В противном случае это пред- положение следует отбросить. 49
Чтобы придать этому критерию более трчный математиче- ский смысл, уточним ряд понятий. Область, в которой вероятность наблюдения статистиче- ской величины, например т]—т]о, достаточно велика, назы- вается областью принятия гипотезы. Область с малой веро- ятностью наблюдения т]—т)0 называется областью непринятия гипотезы или критической областью. В качестве первого ша- га в построении статисти- ческого критерия уста- навливают уровень зна- чимости, т. е. задают не- которое малое число 8 и указывают критическую область, вероятность по- явления в которой иссле- дуемой величины не пре- вышает 8. Если проверяе- мая гипотеза верна (т] = = т]о), то критерий приве- дет к неверному решению, т. е. к непринятию гипо- тезы в 100% е случаев, и £ верному решению, к ее принятию, в 100 (1—8) % случаев. Рис. 10. Область принятия гипотезы при одностороннем (а) и двустооон- нем (б) критериях В зависимости от того, допускаются ли отклонения т] от Яо только в одну сторону или принимаются во внимание лю- бые значения т|, критерий может быть односторонним или двусторонним. Например, при проверке гипотезы t]=r)o по эмпирической оценке т)>г|о односторонний критерий устанав- ливает область принятия гипотезы как тц_8 (рис. 10, а). В этом случае эмпирическое значение^т]! — тц_8 не противо- речит исходной гипотезе, а значение т)2 > т)]_8 — отвергает ее. Двухсторонний критерий устанавливает область принятия гипотезы как т)8/2< т)< Л1-8/2- Тогда эмпирическое значениеrfr (рис. 10,6) не противоречит гипотезе г)=г]о, а т)2 — отвергает ее с уровнем значимости е. Границы критической области, так же как и значения г), вычисляются на основании эмпирической выборки, и крите- рий тем чувствительней, чем богаче статистический мате- риал. При прочих равных условиях односторонний критерий 50
\ чувствительнее двустороннего (интервалы Ai—е/2 = Я1-8/2 — __т) и Ле/2 = т) — Яе/г оказываются больше чем Ai_8 = T)i—е — — т] или Де = т| — т)е, за исключением случаев с резко выра- женной асимметрией распределения наблюдаемых событий). Пример 1. Для проверки сохранности углеродной плен- ки, предназначенной для использования в качестве мишени, произведены три измерения ее веса: 0,9; 1,1; 1,0 мГ. Можно ли утверждать, что вес пленки не противоречит «паспортно- му» данному т)о=1,18 мГ (известно точно)? Здесь эмпириче- ское среднее т) = 1,0. Выбираем критерий значимости е=0,05. Согласно оценкам § 10, для данного уровня значи- мости границы критической области оказываются равными: г]о,о25 — 0,92; т)о,975 = 1 >44 (<у~ = 0,06; /0,975 = 4,3; До,975 = 0,26). Следовательно, измерения не противоречат паспортному данному, хотя ограниченность выборки и не позволяет счи- тать заключение достаточно обоснованным. В качестве другой иллюстрации обратимся к задаче, где нужно использовать односторонний критерий. Пример 2. Пусть электронная аппаратура допускает в среднем 3% просчетов. После усовершенствования ее в 1000 контрольных измерениях было зафиксировано 17 про- счетов. Можно ли считать, что усовершенствование эффек- тивно? Поскольку предполагаемая гипотеза есть сокращение числа просчетов, мы должны проверить возможность слу- чайного отклонения при первоначальном среднем уровне просчетов только в сторону меньших значений. Для данного процесса испытания вероятность просчета может быть определена на основании нормального рас- пределения (число испытаний 1) со средним т) = 30 и средним квадратичным отклонением (см. (1-26)) а = /1000 . 0,03 = 5,48. При критерии значимости е=0,05, нижняя граница допустимого случайного отклонения Ло.оз=л—<Мо,95=30—5,48 • 1,64=21. Улучшение значимо. Задача Допустим, что повторные измерения (пример 1) указы- вают, что вес углеродной пленки отличается от паспортного значения. Сколько нужно сделать измерений, чтобы под- твердить это сомнение? Решение. Для данной серии п испытаний положение границ кри- тической области а Пкр = По±—— У п *1—8/2. 51
Отсюда если по-прежнему т) = 1,0, а а=0,1, то т)о—Ло,о25=О,18 достигает- ся при п^5 (е—0,05). Вообще же решение этой задачи сложнее, по- скольку значения т] и а могут изменяться в процессе расширенной вы- борки. §13. Альтернативные гипотезы. Мощность критерия По определению статистический критерий значимости может таить в себе большую долю неопределенности. Чем меньше уровень значимости, тем меньше вероятность от- вергнуть гипотезу в то время, как она верна. Но одновре- менно теряется чувствительность критерия, так как грани- цы значимости раздвигаются и появляется опасность спутать правильную гипотезу с другой, пусть и достаточно близкой. Следовательно, увеличивается вероятность ошибки другого рода, когда гипотеза считается правильной, хотя она не верна, а близка к истинной. Таким образом, мы здесь сталкиваемся с возможными ошибками двух родов: а) непринятие гипотезы, в то время как она верна — ошибка первого рода; вероятность этой ошибки равна е; б) принятие гипотезы, хотя последняя не верна — ошиб- ка второго рода, вероятность которой обозначается как р. Простой критерий с уровнем значимости в контролирует лишь ошибки первого рода и не измеряет степень риска, связанного с ошибками второго рода. Для оценки вероятности совершения ошибки второго рода мы должны уточнить постановку задачи, допуская возможность существования альтернативной гипотезы. При этом вероятность (по отношению к первоначальной гипоте- зе л=Ло, часто называемой Яо-гипотезой) попадания в критическую область должна быть велика, если эта альтер- нативная гипотеза справедлива. Итак, если проверяемая гипотеза л = Ло неверна, т. е. генеральное среднее л^Ло, а л = Ль то вероятность того, что отклонение эмпирического среднего л от ло попадает в критическую область, будет зависить от значения ль Обоз- начим эту вероятность как л(л1)’ 31 (Л1) = Р {Л — Ло > А1—е/2 ИЛИ rj — Ло < — Де/2; Л = Л1}. (13.1) где Д1-е/2= Л1-8/2 —Л И Дс/2 = л — Лг/2! Л1-Лг/2 — довери- тельные границы оценки генерального среднего. Полагая Л — Ло = Л — Л1 + Л1 — Ло = Л — Л1 + К записываем л (П1) = Р (П — Л l > Д1-Е/2 — + Р (Л — Л1 < — Дг/2 — Ч (13.2) 52
Величина л(т]1) называется мощностью критерия отно- сительно альтернативной гипотезы T| = r|i. Если то критерий опровергает гипотезу т) = т)о с вероятностью л, и не противоречит с ней с вероятностью 1—л. Таким образом, вероятность ошибки второго рода для гипотезы г| = г)0 равна р=1—л. Если гипотеза, альтернативная к проверяемой то следует пользоваться односторонним критерием: л(П1) —По>Л1-е; П = П1)- (13.3) Либо, если т)х< т)о, л(П1) = ^(П — По< — де! П =' Лх)- (13-4) Вообще мощность критерия указывает вероятность от- рицания первоначальной гипотезы как функцию некоторого неизвестного параметра, т. е. функция мощности дает вероятность вынесе- ния правильного решения для всех возможных зна- чений Т), ОТЛИЧНЫХ ОТ Т]о, а для т)=='г]о она опреде- ляет вероятность выне- Рис. 11. Проверка гипотезы т) = Ло по выборочному средн ем у _т] при аль- тернативной гипотезе т) = т)>1]о- Об- ласть неопределенности в оценке ги- потезы (а) и мощность критерия (б) сения неправильного суж- дения. Чем больше %, тем чувствительнее этот кри- терий *. Если расстояние ^между генеральным сред- ним т] и гипотетическим средним т]о мало, то мощ- ность критерия также мала. Однако то, что критерий принимает не- верную гипотезу, совео шая при этом незначи тельную ошибку, не име ет практического значе ния (т. е. ошибка не вы ше допустимой). При прочих равных условиях мощность критерия тем выше, чем богаче эмпирический материал. Рис. 11 иллюстрирует обсуждаемые здесь идеи. Если по выборочному среднему т] проверяется гипотеза т] = т)0 при альтернативной гипотезе = то критической об- ластью для исходной гипотезы будет г] > Желая за- * Подразумевается, что распределение имеет один максимум. 53
страховаться от возможной ошибки из-за случайных откло- нений т) от т|о в сторону больших значений, мы сдвигаем вправо границу критической области. Но тем самым мы становимся все менее критичными по отношению к гипо- тезе т)>т)о- Очевидно, такая возможность существует всегда^ Вероятность ее уменьшается, если эмпирическая оценка т] лежит слева от т)0, но лишь при т] <С ЛЭ вероятность аль- тернативной гипотезы т) >т)о не превышает 0. В этом смысле интервал значений лр < Л <С является областью стати- стической неопределенности при оценке гипотезы. Однако если т) оказывается вблизи гц-е, большее пред- почтение можно отдать гипотезе т)=т]1. Действительно, вы- числяя вероятность того, что отклонение т)—т)0 окажется критическим, если т]=т]1 (эта вероятность — — По > Д1-е; П = П1) = р (и > П(1-е— 1; % = Т)1 — По))» мы ВИДИМ, что последняя заметно возрастает (вся заштрихованная ~(0) площадь вправо от тн—е на рис. 11,6). Поэтому если эмпирическое значение и попадает в ин- тервал т|1--е—т]^е, то с вероятностью я мы долж- ны отдать предпочтение гипотезе и лишь с вероят- ностью 0 = 1—л — гипотезе т)=Но- Другими словами, ошиб- ка второго рода, допускаемая при этом, равна 0. Записы- вая далее 1—0= Р(г| > пр), мы тем самым еще раз указываем интервал rji-e — Пр. в пределах которого гипоте- зы имеют право на «совместное сосуществование» (правда, теперь с различными вероятностями). Разумеется, последние слова не следует понимать бук- вально. Просто в условиях эксперимента в указанном ин- тервале различение гипотез не кажется достаточно обосно- ванным. На практике двусмысленное или неопределенное толкование недопустимо. Как, например, сделать очередной шаг в анализе, если предшествующий этап не имеет четко- го результата? В таких случаях исследователь обязан сде- лать определенный выбор между гипотезами. Мотивом для такого выбора, очевидно, может служить та степень риска, которая в данной ситуации может быть оправданной, если выбор окажется ошибочным. Значения ошибок б и 0 и позволяют оценить степень допускаемого здесь риска. Таким образом, с помощью рассмотрения конкурирую- щих гипотез можно более четко проанализировать резуль- таты эксперимента и в значительной степени устранить неопределенность в принятии решений, с которой исследо- ватель сталкивается в задачах, где фигурирует лишь одна гипотеза. Фактически, при одной проверяемой гипотезе 54
однозначно обнаруживается лишь негативный результат (и гипотеза отбрасывается). Если же наблюдения не проти- воречат исходной гипотезе, то она остается открытой для дальнейшей проверки, поскольку результаты наблюдений иногда столь же «убедительно» можно согласовать с мно- жеством других, не выдвинутых гипотез. Постановка задачи с выдвижением альтернативной ги- потезы во многом устраняет эту неопределенность. Здесь положительный исход проверки достаточен для принятия исходной гипотезы, а не альтернативной к ней. Конечно, такой вывод закономерен, если конкурирующая гипотеза является достаточно обоснованной. В противном случае мы вернемся к прежней неоднозначности в интерпретации ре- зультатов. Это обсуждение поясняет трудности, возникающие под- час при выборе значения уровня значимости и толковании итогов эксперимента в процессе проверки одной гипотезы. Действительно, может оказаться, что эмпирические данные при одном уровне значимости противоречат, а при другом— не противоречат исходной гипотезе (например, при е=0,3 доверительный интервал не накрывает, а при е=0,05 на- крывает предполагаемое значение). Вполне очевидны сомне- ния исследователя. Ситуация становится более определенной, если помимо исходной выдвигается конкурирующая гипотеза. В этом случае исследователю важно решить, какую из гипотез можно принять с наименьшим риском ошибки. Если обе гипотезы достаточно равноправны (к сожалению, иногда такое равноправие нарушается просто в силу пристрастно- сти исследователя), то для повышения надежности в выбо- ре окончательного решения следует положить равными ошибки первого и второго родов, т. е. 8=р. В сущности, последний аргумент служит основной руко- водящей идеей, позволяющей добиться минимального риска (в условиях имеющихся данных) при вынесении того или иного заключения (ср. решения примеров в § 12 и в на- стоящем разделе). Метод анализа с использованием альтернативных гипо- тез позволяет не только с большей надежностью интерпре- тировать результаты наблюдений, но и более четко органи- зовать эксперимент в целом. Например, с помощью функ- ции мощности можно планировать объем эксперимента, проводимого с целью различения гипотез. Так, если исследуется генеральная совокупность с из- вестной дисперсией о2, то тц_8 — цр = («i-e + U\_$)<s'iVn, где п — объем выборки. Число наблюдений, необходимое Для того, чтобы с достаточной уверенностью различить ги- потезы т)о и т)ь оказывается равным 55
п = («1-г + Ы1_р)2 О2/(Т]1 — По)2, (13.5) а критическая область для опровержения исходной гипоте- | зы определяется как “1-е + «1-р 1 Если опасность неверного выбора гипотез имеет равную серьезность последствий, то полагают е=р, и при 2"^- Но + Ч1 2 отдают предпочтение исходной версии г)=по; при обратном неравенстве принимают т)=111- Вероятность ошибок каждо- го из решений не превышает е. Пример. Обратимся вновь к задаче с контролем каче- ства углеродной пленки (§ 12, пример 1) с помощью взве- шивания. Допустим, что пленка, находясь некоторое время на открытом воздухе, могла «запылиться». При взвешива- нии допускается ошибка <т=0,1 мГ (аппаратурная ошибка). Сколько нужно сделать измерений, чтобы с надежностью в 90% мы смогли заметить изменение веса в 0,1 мГ? Пола- гая «1_е =ui_p = «о,95> получаем из (13.5) п=(2Х1,64Х Х0,1/0,1)2= 11. При этом, если среднее арифметическое из- меренных значений окажется больше 1,185 мГ (исходное значение веса равнялось 1,18 мГ), следует признать увели- чение веса пленки. Ряд других примеров на различение альтернативных ги- потез будет рассмотрен в последующих разделах. Рассмотренное выше сравнение гипотез относилось к простому случаю, когда одной проверяемой гипотезе про- тивопоставлялась другая. Возможны и более сложные си- туации, когда сравниваются гипотезы, являющиеся группа- ми простых гипотез. Такое сравнение проводится методами, обобщающими рассмотренные в этом разделе. § 14. Проверка распределения Построение статистических критериев предполагает, что вид распределения исследуемого явления известен. Как правило, определенные выводы о характере возможного распределения можно высказать заранее. Однако даже и в этом случае полной убежденности в справедливости какого-либо предположения, очевидно, не может быть (в силу, как уже неоднократно отмечалось, возможного влияния случайных или систематических причин). Поэтому экспериментатор часто сталкивается с необходимостью про- бе
верки распределения, тем более что знание последнего мо- жет представлять самостоятельную ценность и служить целью специального исследования. Проверка или установление распределения проводится на основе экспериментального материала достаточно боль- шого объема. При этом может быть использован метод дис- кретного описания с по- мощью группировки по ин- тервалам (разновидность способа предварительно- го «сжатия» информации). Для этого весь накоп- ленный материал разбива- ется по группам, соответ- ствующим определенным интервалам значений на- блюдаемой величины. В качестве эмпирической ха- рактеристики каждой из групп избирается выбороч- ная частота, равная числу событий, наблюдаемых в пределах соответствующего интервала, деленному на число всех наблюдений. На рис. 12 построена так называемая гисто- грамма, где выборочные частоты равны площадям каждой из ступеней (т. е. ординаты равны значениям выборочных частот, деленным на ширину интервалов). Ширина интер- валов Д{ не обязательно постоянна; наоборот, целесообраз- но менять ее, выбирая минимальный шаг в области наи- больших частот наблюдения событий. Значение выборочной частоты является объективной оценкой величины истинной частоты наблюдения событий в данном интервале (§ 8). Если число событий, отмеченных в данном интервале, равно тг-, а весь объем выборки равен и, то вероятность появления событий в интервале оценивается как Pi = — П (14.1) Возможные флюктуации числа /п{ описываются биноми- альным законом, так что оценкой дисперсии этих флюктуа- ций является величина of = npi(l — Pi) = mi (1----(14.2) \ n / Используя эти данные, можно, например, с помощью методов регрессионного анализа (гл. IV) построить огибаю- щую гистограммы. Однако сравнение эмпирического рас- пределения pi с гипотетическим можно провести без по- 57
строения огибающей, а используя количественные методы статистических критериев согласия. Отметим прежде всего х2-кРитеРий согласия Пирсона. Для заданного гипотетического распределения можно вы- числить теоретические значения вероятности pi наблюдения событий в i-интервале. Очевидно, £ р, = 1. Теперь, распо- t лагая выборкой наблюдения с объемом п, составим сумму , (14.3) i=i i=i np‘ где г — число анализируемых интервалов. Убедимся, что при достаточно большом п случайные величины стремят- ся к переменным щ, имеющим нормированные нормальные распределения (см. § 1). Действительно, в соответствии с общими свойствами случайных величин и их оценок при п>1 флюктуации величины (т^—npi) должны описываться нормальным распределением с нулевым средним и диспер- сией <т2-> пр,. Поэтому, учитывая, что между параметра- ми pt имеется одно связывающее их соотношение ^рг = 1, i можно утверждать, что если исходная гипотеза о виде рас- пределения верна, то сумма (14.3) асимптотически имеет Х2-распределение с f=r—1 (практически уже при npi^5>). Если вычисление pi производится по гипотетическому распределению, параметры которого сами оцениваются на основании данного эмпирического материала, то число сте- пеней свободы f уменьшится еще на число оценок этих параметров. Так, для распределения Пуассона f=r—2 (оце- нивается генеральное среднее), а для нормального — f=r—3 (оценивается генеральное среднее и генеральная дисперсия). Поэтому можно сформулировать следующий статистический критерий согласия гипотетического распре- деления с эмпирическим: гипотеза принимается (с уровнем значимости е), если V (mj — npi)2 npi Х?-е> (14.4) в противном случае она отклоняется. Возможность приня- тия конкурирующей гипотезы должна оцениваться в соот- ветствии с рекомендациями § 13. Кроме х2-критерия Пирсона широко используется интег- ральный критерий Колмогорова, по которому сравниваются эмпирическая и предполагаемая функции распределения. 58
Напомним, что функция распределения представляет накоп- ленные вероятности, т. е. для случайной величины F{y')= Р(У<У')- Согласно Колмогорову, случайная величина Х = £>1/п, где п — объем выборки, a D — максимальная абсолютная разность между эмпирической и гипотетической (любой, непрерывной) функциями распределения, т. е. D = max|F„(t/) —FTeop(i/)|, (14.5) при п»1 приближенно описывается функцией распределе- ния 00 _2k2)^ К(К)=Р(К<К1) = '£(-1)ке *(bi>0). (14.6) Поэтому если оказывается, что % ^1—е> где Р(Х< М_8) = 1—е (значения Л1-8 протабулированы и указаны в статистических таблицах, например Хо,95= 1,36), то с уровнем значимости е критерий отбрасывает исходную гипотезу. Как мы видели, во многих случаях случайные события могут быть описаны нормальным распределением. Провер- ка «нормальности» распределения совершается с помощью упомянутых критериев согласия, например, применяя кри- терий Пирсона (при f—r—3). Если проверка отмечает некоторое несовпадение эмпи- рического распределения с нормальным, то описание иссле- дуемого процесса можно улучшить, используя нормальное распределение и его производные. Плотность эмпирического распределения может быть представлена в виде р(у)=у р(«) A d3P Ё d*P 6 du» "Г 24 du* (14.7) где р(и)—плотность нормированного нормального распре- деления с аргументом и= (у—т|)/<г. Здесь т) и о2 — выбороч- ные оценки среднего и дисперсии, А и Е — выборочные асимметрия и эксцесс: п п A--i-Vta-nA (14.8) 59
Напомним, что для произвольного распределения асим- метрия и эксцесс определяются соотношениями л = 4-(!/-#, Е=-±-(у-~уГ-3. (14.9) СР (Р Для нормального распределения А и Е равны нулю. Асимметрия бывает положительной или отрицательной, смотря по тому, в сторону больших или меньших значений спадает более полого кривая плотности. Эксцесс характе- ризует вершину распределения, которая при положитель- ном эксцессе является более острой (по отношению к нор- мальному распределению) и более «размазанной» при отрицательном эксцессе. Часто для улучшения приближения распределения к нормальному обращаются к преобразованным величинам случайных переменных (так, распределение величины К2х2 ближе к нормальному). В дальнейшем будем предполагать, что за исключением особых случаев гипотеза о нормальном законе распределе- ния соблюдается. Задачи 1. Показать, что для распределения Пуассона A = l/]/JV и E=\fN. 2. С помощью (14.7) показать, что улучшенной нормаль- ной апроксимацией распределения Пуассона является функ- ция 1 p(N) = exp) у 2nN § 15. Сравнение дисперсий Гипотезы о дисперсиях играют в эксперименте исключи- тельную роль, поскольку только знание параметров рассея- ния результатов и позволяет судить о надежности измере- ний. Рассмотрим несколько характерных задач, встречающих- ся в практике. Начнем с проверки гипотезы, что генераль- ная дисперсия не превышает некоторого допустимого значе- ния. Практической аналогией такой постановки является «извечный» вопрос о том, при каких условиях можно гаран- тировать достоверность результатов не ниже определенного уровня. 60
Отметим прежде всего следующее. Пусть мы распола гаем определенным набором результатов, на основании ко- торых находим эмпирическое значение дисперсии о2 (см. § 8). Оценим предельное допустимое значение гене- ральной дисперсии Отах, которое еще не противоречит опыт- ным данным. Так как п (T2 где n — объем 2 значение amax м — 1 \ а / / |f=n-i ’ i=l выборки, то предельное непротиворечивое находится из уравнения или <Jmax = S'2 -L-. (15.2) Хе значения квантилей f/тппк. также квантилей При 8 = 0,05 Хо,9б// и V = Хо.95/Хо,05, необходимые для дальнейших рассмотре- ний, указаны в табл. 4. Пример 1. Имеется выборка с п = 7, согласно которой эмпирическое среднее квадратичное отклонение о = 2,3. Оценим верхнюю границу суждений о генеральном о, не- противоречащих значению о. При е = 0,05, атах = 2,3-]/3,7 = = 4,4. * Таблица 4 2 3 4 5 6 10 20 30 оо f/Xo.03 19,5 8,5 5,6 4,4 3,7 2,5 1,8 1,6 1 Хб,05^ 3,0 2,6 2,4 2,2 2,1 1,8 1,6 1,5 1 = Xq,95/Xo,O5 58 | 22 1 13 9,7 7,7 4,7 2,9 | 2,4 1 Обратимся теперь к проблеме проверки гипотез о вели- чине генеральной дисперсии. Предположим, что проверяе- мая гипотеза определяет генеральную дисперсию как о2 = По! альтернативная гипотеза состоит в том, что °2 >4 61
Если исходная гипотеза верна, то величина о2 _ X2 о2 f f=n—l (15.3) где а2 —оценка дисперсии, сделанная на основании эмпи- рического материала с объемом п. Выбирая уровень значи- мости е, мы определяем верхнюю допустимую границу слу- чайных колебаний величины о2/оо, превышение над кото- рой поставит под сомнение гипотезу (гг 2 у2 \ ---а2=Оо|=6. (15.4) f ) Пример 2. На основании 11 измерений оценка генераль- ной дисперсии оказалась равной о2=5,6. Не подтверждает ли этот результат сомнение, что о2>оо =4,7? При уровне значимости е=0,05 значение = 1,8. __ ао Кр Эмпирическая величина о2/оо=1,2, что не противоречит ги- 2 потезе со. ~ о2 . Xi-е Однако если проверка показывает, что —------------, то ао f это еще не гарантирует, что о2 не может быть больше, чем сто. Последняя возможность определяется величиной функции мощности критерия по отношению к альтернатив- ной гипотезе о2 = of > Oq: n(a1)=p(-4>4=L; *2=<*0 = \ ao z / (15.5) где %2 = of/oo > 1 (альтернативная гипотеза о2 = of ‘ означает, что o2/of = x2/f). Поэтому вероятность возможной ошибки, до- пускаемой при проверке гипотезы о2 = Оо по отношению к аль- тернативной гипотезе о2 = of = Х2о§, равна р = 1 — л. Отсюда, выбрав определенные значения е и р, можно оценить, например, объем выборки, необходимый для раз- деления гипотез, или минимальное значение X2, при котором гипотеза о2=Оо будет забраковываться с вероятностью л = 1—р. 62
Так как р(х2>4г%1-в\ =1-Р = Р(Х2>Х₽), (15.6) то это значение равно (15.7) х₽ При 8=р = 0,05 значения %2 для различных f указаны в табл. 4. Отметим теперь, что к тому же результату можно придти, если воспользоваться непосредственно итогами про- верки предельно допустимого значения о^ах (см. (15.2), в КОТОРОМ Отах"» 01, е~>Р). Если гипотезой, альтернативной к проверяемой, являет- ся о2=02<оо, то критическая область при уровне значи- мости е определяется соотношением с2 Хе °20 < f ’ а мощность критерия по отношению к альтернативной ги- потезе *(а2)=Р(х2<77Хе)= 1-₽. Наконец, при альтернативной гипотезе о2#=0о критиче- ской для исходного предположения является область О8 Хе/2 . С2 Х1—е/2 <*0 f ’ °о f Если выполняется одно из последних неравенств, то с уров- нем значимости 8 гипотеза о2 = Оо опровергается. Часто на практике приходится сталкиваться с более сложной задачей: сравнением двух дисперсий на основании их эмпирических оценок. Допустим, что в процессе исследования генеральных дисперсий <Ti и о2 получены оценки of и о2, каждая из которых базируется на независимых выборках с объемами «1 и п2. Проверим гипотезу о2 = о2. Напомним, что отношение двух случайных величин ~2 / 2 ~2 / 2 , 01/01 и о2/о2 представляет хорошо известную функцию с ^-распределением при fi=ni—1; /2=«2—1: Ъ, I Со -4 -4=^(А. /з)- (15.8) а1 I °2 63
Если исходная гипотеза of = 02 верна, то с вероятно- стью 1—8 должно выполняться соотношение p[vI/2< си 1 II СМ1 со 1 СМ _ V СМ —« 1 CM С4 Критическими для зываются значения проверяемой гипотезы of = 02 ока- -8/2 (/1, /2)*, *2 ~2 <С ^е/2 (/1, /2) -- 2 а2 vl—е/2(/2> /1) Значения квантилей 2 2 fll-e/2 И U1-8 для частного случая указаны в табл. 5 (8 = 0,05), откуда следует, что границы критической области для малых выборок расставлены до- вольно широко. Таблица 5 2 з 4 1 5 1 6 10 20 30 oo d0,975 39 15 9,6 7,2 5,8 3,7 2,5 2,1 1 v0,95 19 9,3 6,4 5,1 4,3 3,0 2,1 1,8 1 Если появляется сомнение, что генеральные дисперсии не равны, а, например, Oj >02, то гипотеза Oi = о2 прове- ряется при альтернативной гипотезе о? > 02 (знак нера- венства выбирается, например, вследствие того, что для эмпирических дисперсий of > о2) с помощью односторон- него критерия. Критической областью, отвечающей уровню значимо- сти е, будет область А)- °2 (15.10) Как видим, этот критерий четко различает гипотезы лишь при f^>l, хотя и является несколько более строгим, чем (15.9). Мощность критерия по отношению к альтернатив- ной гипотезе о? = 1) равна / -52 * \ , л(Х) = р — >о?_8; х»>1 = \°2 J (15.11) 64
— р[ g‘ / °2 \ vi-e \ — Р (у* \ <rf / О2 j ' — 2 \ I2 Vl-eb Поэтому значение Л.2, при котором вероятность отверг- нуть гипотезу 01 = 02 достигает значения 1—0, определяет- ся уравнением Р^2>^Ц=1-0=Р(и2>^). (15.12} \ Л / Отсюда *2 = р?-8(А./г) =р2_е(Л) /2)02_р(/2) Z1). А) Пример 3. Пусть для ^выборок с /i=fs=10 отношение эмпирических дисперсий of/of = 2,5, и мы должны ре- » 2 2 шить: можно ли согласиться с гипотезой o»i =02- Так как с«о,95(10,10) = 3,0, то эмпирическое значение не противоречит этой гипотезе. При этом для альтернативной гипотезы Х2=2 мощность критерия равна P(v2(10,10) > 1,5) ~ 0,3, т. е. вероятность принятия гипотезы of = of, когда в дейст- вительности о2 = 2of, равна ог 0,7. Если нужен критерий» лучше различающий эти гипотезы, следует увеличить объемы выборок. В случае, если критерии не различают значимо диспер- 2 2 2 2 о тт сии си и Иг, мы полагаем Oi = <т2 = о2. Для характери- стики о2 целесообразно использовать объединенную оценку —2 Ооб PiA+gjfa А + /2 (15.13) Рассмотрим вопрос о сравнении нескольких дисперсий- Требуется выяснить, например, являются ли выборочные Дисперсии of, ... , of, имеющие числа степеней свободы fi, ..., fk, оценками одной и той же генеральной дисперсии. Хотя определенные суждения о равенстве дисперсии мож- но вынести, последовательно применяя, например, ^-крите- рий для сравнения двух дисперсий и соединяя их в случае согласия в объединенную дисперсию, более квалифициро- ванные выводы можно сделать с помощью критерия Барт- лета, а при равных объемах выборок — критерия Кочрена. Остановимся на последнем. Оказывается, отношение макси- мальной (среди выборочных) дисперсии к сумме всех 3 В. к Гришин 6®
max (п|) ®1 + • • • + записывается распределением, которое зависит только от числа выборок k и числа степеней свободы f каждой из вы- борок. Некоторые gi—t -квантили этого распределения при ®=0,05 указаны в табл. 6. В случае если эмпирическое зна- чение g<gi-e, то различие дисперсий незначимо, и для оценки генераль- ной дисперсии следует избрать объединенную оценку. Табл ица 6 К 2 3 4 5 10 00 f=3 0,94 0,80 0,68 0,60 0,37 0 5 0,88 0,71 0,59 0,51 0,30 0 0,82 0,63 0,52 0,44 0,25 0 Задачи 1. Сколько измерений необходимо сделать, чтобы быть «уверенным, что дисперсия о2 < 2о2? Решение. При 8=0,05 значение квантили f/%o,05-С 2 при п>20. 2. Какова причина различия критериев (15.2) и (15.4)? 3. Найти объем выборки, позволяющий различить гипо- 'тезы о! = со и о2 — 2оо- Решение. Из табл. 4 следует (в=0,05), что п>30. 4. Решить задачу 3 в случае, если сравнение дисперсий производится по эмпирическим дисперсиям о2 и 51. Решение. Согласно (15.12), при а=р=0,05 и fi=ft имеем тад,85 = V2. Отсюда nt,a >90. 5. При контрольной проверке стабильности эксперимен- тальной аппаратуры сделано 11 измерений с выборочной дисперсией о? = 0,2. После замены ряда блоков повторные 11 контрольных измерений дали оценку 51 = 0,05. Можно ли заключить, что произошло улучшение стабильности ап- - паратуры? Решение. Здесь 5i/?2 = 4 при fi —f,= 10. Если улучшения нет, чю ©(/о2 не должно превышать значения (в=0,05) t^95(10,10)=3,0<4. Следовательно, разброс результатов уменьшился. 6. Для сравнения стабильности двух установок на каж- дой из них проведено 30 контрольных измерений с выбо- рочными дисперсиями 5? — 1,2 и 51 = 2,0 (е=0,05). «9
Имеют ли установки одинаковую стабильность? Если ранее установки имели одинаковую стабильность, то не ухудши- лась ли стабильность второй установки? § 16. Сравнение средних Проверка гипотез о средних, так же как и сравнение дисперсий, относится к числу центральных проблем мате- матической статистики, поскольку достоверное определение генерального среднего и представляет основную задачу большинства экспериментов. Гипотезы о средних оцениваются в соответствии с об- щими рецептами статистической проверки, достаточно пол- но проиллюстрированных в предыдущих разделах. Напомним сначала, что способы оценки генерального среднего г| по выборочному среднему т], рассмотренные в- § 10 и 11, позволяют вынести суждения о среднем, если по- следнее не известно. Проверка гипотезы tj —Ло совершается с помощью одно- сторонних или двусторонних критериев, смотря по тому» какой характер носит альтернативная гипотеза. Если альтернативная гипотеза определяется как- Н==111>т1о> то критическая область для исходного предполо- жения устанавливается как (с уровнем значимости е) 4^->Л-е|/=л-ь е, Уп где т| и о2 — выборочные среднее и дисперсия (см. (8.14) в (8.15)), соответствующие эмпирическому материалу с объ- емом п. Функция мощности критерия, равная \ о/ У п ) определяет, что вероятность ошибочного суждения tj=tic (в то время как = не более чем р=1—я. Из равен- ства П-Чо = П-Ч1 _|. П1-Л<> . = t + в/Уп О/ Уп О/Уп О где Х=(т)1—г]о)/0/^ п, вытекает, что функция мощности зависит от комбинаций t и х2-распределений, которая на- зывается нецентральным /-распределением. При достаточна большой выборке функция мощности приблизительно равна 3* 6Z
X = 2k-Hl.., (16 3) a//n тде Ф(нР)—функция распределения нормированного нор- мального распределения (так называемая функция оши- бок), см. табл. 7. Пример 1. Укажем значение X, при котором гипотеза t)=T|o забраковывается с вероятностью я=1—0 = 0,95. Пусть мы располагаем выборкой с объемом п=11. При ® = 0,05 значение /0,95 (/= Ю) = 1,81 = — t0i05; величина «0,95=1,64. Отсюда Х= 1,81 + 1,64/1 +0,16 =3,6. Таблица 7 “р 0 0,25 0,52 0,84 1,28 1,64 1,96 1Р = Ф(М 0,50 0,60 0,70 0,80 0,90 0,95 0,975 При альтернативной гипотезе t)=t)i#=t)o используется двусторонний критерий с критической областью (напомним, ЧТО /е/2 = tl—е/2) In — По I >-77-^1-е/2 (16.4) при f=n—1. Рассмотрим теперь сравнение двух генеральных сред- них, основанное на выборочных средних rji и т)2- Это более сложный случай, поскольку для построения критериев необ- ходимо знание дисперсий. Поэтому сравнение средних по эмпирическим данным производится в два этапа. Руководствуясь эмпирическими данными (с объемами «1 KJI2), находятся выборочные средние т)1 и Пг и диспер- сии of и al. Затем сначала сравниваются генеральные дисперсии О] и 02 по критериям, описанным в предыдущем .разделе. Если различие генеральных дисперсий Oi и Ог незначи- мо, то полагаем of = afi = и для характеристики о2 со- ставляется объединенная оценка Поб = Qi/1 + 02/2 /1 + /2 (16.5) / ’ «8
которая выражается через х2-распределение с f=fi+f2= =П1 + п2—2. Поскольку величина и = ~ тц) ± (ТЬ — Па) (Л1 dz Лг) — (Ла Лз) (16 6) (где т)1 и Иг— гипотетические генеральные средние) имеет нормированное нормальное распределение (§ 2, задача 2), то величина t == —(Л1 ±Лз) (16 7) «об]/ — + — У nt пг имеет /-распределение со степенью свободы f=rtf+n2—2. Следовательно, для гипотезы г]1±ц2=с/ критическая об- ласть при уровне значимости е определяется, как |т)1±П2 —^1><^в ^i-e/2 (16.8) Г ^2 при f=ni+n2—2. Если есть сомнение, что значение Ц1±Ц2 отклоняется от d в сторону больших значений, то используется односто- ронний критерий с границей /1_8. Пример 2. На основании двух серий измерений п\=1 и п2 = 11 с выборочными т)1=5,0; of =0,8; т)2=4,6; о2 = 0,5 оценим гипотезу Ц1=г)2 (т. е. </=0). Сравним сначала дисперсии. Их отличие незначимо (е=0,05), так как oi/o2 = 1,8<00,95(6,10) = 3,2. Объединенная оценка ^об = 0,61. Величина F= ------m —= 1)3б. °об \/~~ + ~~ Р ^2 Так как /0,95 (f=16) =3,3>/=1,36, то можно считать Л1 = Н2- В случае, если сравнение дисперсий показывает их зна- чимое отличие, т. е. рассмотренный критерий ис- пользовать нельзя, так как формально составленная объединенная оценка не может быть выражена через х2-пе- ременную. Тем не менее величина У = 1^11 'Па) (Л1 dz Лг) (16 9) VО1/П1 + О2/«2 69
приблизительно описывается /-распределением с числом f степеней свободы, которое определяется из соотношения + а^/пг)2 (51/«1)4 (о|/п2)а --------1---------7Г-+~1Г-- (,610) Поэтому если при т]1±т]2=</ значение е/2, то гипо- теза т)1±т]2=^ опровергается с уровнем значимости е. В заключение рассмотрим вопрос о сравнении несколь- ких средних. Гипотеза о равенстве нескольких генеральных средних проверяется с помощью оценки усредненных выбо- рочных данных. Ограничимся случаем, когда генеральные дисперсии каждой из выборок различаются между собой незначимо. Располагая выборками Пг, п*, ..., п-k с выборочными сред- ними и дисперсиями т]х.........Л* и о?, ... , о*, составляют объединенную дисперсию k ~ S ai‘fi ----- =О2у, (16.11) 5 А Р--1 k где а2 — генеральная дисперсия выборок: f = (пг-1). 1=1 С другой стороны, если гипотеза о равенстве всех гене- ральных средних справедлива, то можно составить объеди- ненное выборочное среднее т|, рассматривая всю совокуп- ность эмпирических данных как единую выборку: _ k k n = £ (16.12) i=l z=i Так как величина и = Пг —Лг — П а//пТ сг/КпГ распределена нормально с параметрами (0,1), то оценка дисперсии k ~ о2 = fe2i — п)2 = а2у (16.13) i=i связана с ^-распределением с /=&—1. Таким образом, от- ношение величин о2 и Ооб имеет ^-распределение: 70
~ k <?/<*об ==v2(/i = &—1; A = £(«; —1))- (16.14) г=г Очевидно, среднее значение оценки а2 равно о2, так как %2=f. Если же гипотеза о равенстве средних не верна, то можно показать, что среднее значение о2 больше, чем о2. Из сказанного следует критерий сравнения средних. Ги- потеза равенства средних не верна, если а2 значимо пре- ~2 вышает Ооб> т. е. rrz \ / Об £=1 (16.15) Напротив, при обратном неравенстве можно считать, что генеральные средние совпадают. Тогда для оценки гене- рального среднего следует избрать значение т), вычисляемое по (16.12), а достоверность этой оценки характеризовать с помощью объединенной оценки дисперсии. Задачи 1. Указать критерий сравнения генеральных средних тр и т)2 по их выборочным оценкам, если генеральные дис- 2 2 Персии известны и равны Qi и a2- Решение. Согласно (16.6), гипотеза 1Ц—i)2=d принимается, если 1%—^|< Т f 01 о2 Г ~п~ ,“1“8/2’ ’ /11 /^2 где —квантили нормированного нормального распределения. 2. Найти объединенную оценку r)i и t]2 в случае их незна- чимого различия (дисперсии о? и <т2 известны). Решение. Пусть r]i=T]2='lb Составляя функцию правдоподобия наблюдения оценок и Лэ и максимизируя ее,* находим (см. также пример из § 23) ГГ2 «2 - С2 . ~ а1 П1 — + П2 — ~ /^2 л = —— gl । g2 /11 /18 3. Измерение по двум методикам эффективного сечения реакции дали результаты: (6,4; 7,2; 7,0; 5,8) барн и (7,4; 71
7,5; 6,5; 7,0) барн. Можно ли быть уверенным, что методики не равноправны? 4. При изучении времени жизни странной частицы 2~ в трех научных группах получены значения: (1,50; 1,45; 1,55; 1,6)-10-10 с, (1,62; 1,60; 1,65; 1,60) • 10-10 с, (1,60; 1,59; 1,60) -10-10 с. Совпадают ли эти результаты? § 17. Сравнение средних при бедной статистике В экспериментальных исследованиях подчас склады- вается ситуация, когда числа наблюдаемых событий неве- лики. Распределение редких событий существенно отличает- ся от нормального. Поэтому результаты серий наблюдений с бедной статистикой следует оценивать, опираясь на кри- терии, отличные от рассмотренных в § 16. Предположим, что распределение исследуемых редких событий являются пуассоновскими. Тогда сравнение пара- метров генеральных совокупностей можно провести с по- мощью следующего так называемого условного критерия. Допустим, что в результате двух серий независимых наблюдений было зафиксировано N\ и N2 событий соответ- ственно. Если средние каждой из_генеральной совокупно- стей равны между собой, т. е. Ni = N2=N, то вероятность отметить в этих сериях ki и k2 событий Р(^,^).= Р(^)Р(^) = i^Le~2N. (17.1) Введем в качестве новой величины сумму x=&i+&2- Со- гласно свойству пуассоновских распределений наблюдаемое значение х имеет вероятность pW=Ae-!". (17.2) Поэтому условная вероятность того, что мы зафиксиру- ем k\ событий в первой серии при общем числе событий, равном х, описывается соотношением Р(^|х) = P(klt k2)/P(x) = (4-Г-ТТТГ• <17-3) Проверяя гипотезу Nt = N2 при альтернативной гипотезе A^i>A^2, вычисляем условную вероятность N + (17.4) 72
Если эта вероятность не превосходит избранного уровня значимости е, то проверяемая гипотеза Ni=N2 отвергается. Поскольку соотношение (17.4) эквивалентно условию (см. § 3, задача 4 при р=V2) P(^>^|V) = l-p(o2(A,f2)<-^--R6, (17.5) \ ЛГ2+1 / где fi=2(W2+l); fz=2Ni, то критической для исходной ги- потезы является область ~-J±r>v^(2(N2+ 1); 2Л\). (17.6) Ла -г 1 При двусторонней альтернативной гипотезе е следует заменить на е/2. Пример. При исследовании первичного компонента кос- мических лучей за сеанс было обнаружено две частицы с ультрарелятивистской энергией. В следующий сеанс прибор зарегистрировал семь частиц этого сорта. Есть ли повод для заключения, что интенсивность потока не постоянна? Согласно (17.6) вычисляем соотношение A^i/(.V2+1) = =7/3=2,33. Так как о^975(6; 14) = 3,50 >2,33, то проверка с 5-процентным уровнем значимости не подтверждает наше сомнение. Если проверка не указывает на значимое различие меж- ду средними, истинное значение среднего N=Ni = N2 оцени- вается на основании величины N9= (Ni+N2)/2 (см. § 11). С помощью условного критерия сравниваются интенсив- ности пуассоновских потоков также в случае, если измере- ния характеристик потоков происходят в течение различных интервалов времени. Пусть в первом измерении пуассонов- ского потока в течение времени Л зарегистрировано М со- бытий, а во втором измерении за интервал времени t2 от- мечено Л/^2 событий. Если интенсивности потоков равны vi и V2, то вероят- ность того, что за те же промежутки времени будут отме- чены ki и k2 событий, равна P(klt k2) = (17.7) Повторяя далее процедуру построения условного крите- рия, находим вероятность N (17.8) где б = v1/1/(v1/1 + v2t2). 73
Для проверки исходной гипотезы v2/vi=Xo при альтерна- тивной гипотезе УгМ<Ло вычисляем вероятность (17.8) при О='0‘(Хо)- Если оказывается, что величина (17.8) не превос- ходит е, то с этим уровнем значимости исходная гипотеза отвергается. Квантили соотношения (17.8) выражаются через кван- тили ^-распределения. Поэтому критической для исходной гипотезы будет область (2 (ДГ2 + 1); 2^). (17.9) N2 + 1 h При сравнении с двусторонней конкурирующей гипоте- зой уровень значимости выбирается в два раза меньше. Так, если в рассмотренном примере время первого сеанса в полтора раза превосходит время второго, то гипо- теза о постоянстве интенсивностей космических потоков от- падает, так как 1,5-7/3 = 3,5—t>jj975(6; 14). Задачи 1. По данному эмпирическому числу Na событий указать предельно_ допустимое (при уровне значимости е) значение среднего Мпах пуассоновского потока._ Решение. Вычисляем P(N^Na; W=Armax), и, воспользовавшись далее соотношением (11.4), находим Mnax = — е при f=2(Na+\). & При Na=2 значение ЛГщах=6,3 (при 8=0,05). 2. Показать, что в случае незначимого отличия средних ин- тенсивностей их оценка находится как v= (Л^+Л/гШЛ + ^г)- § 18. Анализ грубых ошибок Одним из условий получения наиболее достоверных вы- водов является однородность эмпирического материала, которая заключается, в частности, в том, что среди резуль- татов отсутствуют грубые ошибки. Последние могут появ- ляться, например, вследствие сбоя в работе эксперимен- тального оборудования. Поэтому все грубые ошибки долж- ны быть выявлены и исключены. Однако здесь исследователя может подстерегать, пожа- луй, одна из самых коварных ошибок. Это происходит, если допускается предвзятое отсеивание материала, подчас под- стрекаемое желанием экспериментатора «подогнать» ре- зультаты. 74
Сложность анализа грубых ошибок заключается в ка- залось бы парадоксальном выводе, что чем больше объем выборки, тем с большей вероятностью следует ожидать рез- ких «выбросов». Действительно, если вероятность отклонения | —ri|<A равна р, где z/t-— один из результатов, т) — генеральное среднее, т. е. Р(\У1-пКЛ) = Р, (18.1) то вероятность того, что все п измерений будут отклоняться от т| не более чем на А, равна рп. И как бы близка к еди- нице ни была величина р, при п-+оо эта вероятность стре- мится к нулю, т. е. Pdf/max-П|< А) = Р"---->-0, (18.2) где утя-г — максимальное среди наблюдаемых значений в данной выборке. Таким образом, появление больших откло- нений— не аномальность, а статистическая закономерность. Поэтому статистический критерий отбрасывания грубых ошибок (резких выбросов) строится с учетом этой особен- ности всей совокупности наблюдений. Если для отдельного наблюдения Р(У1~~ n<8i-a)= 1—а, то согласно (18.2) Р(«/тах — Т]<б1_а) = (1 — а)п~ 1—ла, (18.3) если па<^1. Полагая далее, что наибольшее отклонение в выборке может превышать некоторое предельно допустимое Д1—в с вероятностью не более е, имеем Р(Утах — П<А1-в) = 1 — es 1 — па. (18.4) Отсюда Р (Утах Т) 61—е/л) = 1 8, (18.5) где 61—е/п — квантиль, определяющая границу критической области отклонений для отдельных наблюдений. Следовательно, когда оказывается, что максимальное отклонение в выборке Утах Л 2? 81—е/л > (18.6) то с уровнем значимости е такое отклонение может забра- ковано как ошибочное. • Квантили 61- е/л вычисляются, исходя из распределений случайной величины у. Если среднее значение я и диспер- . 75
сия а2 известны, то для нормально распределенных величин амплитуда предельного допустимого отклонения равна (j/i Л)тах = OUi—е/п > (18.7) где «1_;е/л —квантили нормированного распределения. Однако обычно сравнивают z/max с выборочным сред- ним т), располагая лишь выборочной оценкой дисперсии о2. В этом случае границу критической области следует сдви- нуть: (У1 — П)тах = (1 + -у) у (18.8) где f — число степеней свободы оценки 07. Последнее соот- ношение дает хорошую точность при п^1 (более точные оценки имеются в сборниках математических таблиц). Иногда в серии наблюдений имеется несколько сомни- тельных точек. Тогда их анализ проводится путем последо- вательного отбора. Сначала оставляют наименьший из «подозрительных» выбросов и рассматривают усеченную выборку, в которую включаются точки, не вызывающие сомнения, и наименьший из резких отклонений. Если про- верка, базирующаяся на этой ограниченной выборке, позво- ляет забраковать сомнительный результат, то естественно отбрасываются и другие большие отклонения. Напротив, в случае благоприятного исхода анализ продолжается, расширяя выборку за счет следующего по величине вы- броса, и т. д. Задача При измерении температуры плазмы газового разряда получены значения: (1,0; 1,3; 1,4; 1,0; 0,8; 2,9)-Ю4* К. Мож- но ли отбросить последний результат как ошибочный?
Глава IV РЕГРЕССИОННЫЙ АНАЛИЗ §19. Стохастическая зависимость До сих пор рассматривались задачи, прототипом кото- рых являлись эксперименты, проводимые при неизменных условиях наблюдения. Однако существует также более- широкий класс исследований, в которых изучаемое явле- ние наблюдается при различных внешних условиях. В общих чертах такой эксперимент можно рассматри- вать как попытку установления зависимости некоторой ве- личины у от независимой переменной х. Нетрудно видеть, что здесь исследуется особый тип за- висимости, характерный для случайных величин. Действи- тельно, для каждой совокупности опытных условий неиз- бежно следует ожидать рассеяния результатов измерений. Поэтому при переходе от одной «точки» независимой пере- менной Xi к другой будут наблюдаться не строго детерми- нированные значения исследуемой величины у, а наборы данных, лишь в той или иной степени характеризующие генеральные совокупности значений у=у(Хг). Но, конечно,, параметры генеральных совокупностей могут изменяться в зависимости от условий наблюдений. Такая зависимость, при которой изменение одной пере- менной меняет распределение другой, относится к стохасти- ческой зависимости. Изучение стохастической зависимости затрагивает весь- ма обширный круг проблем. Заметим, например, что не всегда стохастическая зависимость четко указывает на пер- вопричинную связь. Поучительным примером в этом отно- шении являются опыты Беккереля, который обнаружил, что интенсивность рентгеновских лучей тем выше, чем ярче люминесцентное свечение катодной трубки, испускающей эти лучи. Это послужило основанием для ошибочного пред- положения, что люминесцентное свечение является причи- ной рентгеновского излучения. Мы ограничимся анализом наиболее важного вида сто- 77
хаотической зависимости: установлением функциональной зависимости между средним значением генеральных сово- купностей у(х) и аргументом х. § 20. Регрессионный анализ. Метод наименьших квадратов Кривая т\=у(х) носит название кривой регрессии. Раз- личают теоретическую линию регрессии (подразумевая под таковой истинную функциональную зависимость, сущест- вующую в природе) и эмпирическую линию регрессии (имея в виду соотношение, устанавливаемое с помощью конкретного опытного материала). Последнюю обозначим •как r)=i{(x). Проведение кривых через экспериментальные точки и их уравновешивание относятся к так называемому регрессион- тному анализу. Такой анализ будем развивать, опираясь на ‘-принцип максимального правдоподобия. Итак, предположим, что в результате серии независи- п мых измерений получено £ г( эмпирических точек t/a, со- t=i ответствующие п значениям независимой переменной ^i(l^i^n), причем результаты уц. при относят- ся к точке Xi. Будем подразумевать, что общий характер генеральной совокупности результатов известен, т. е. известно функцио- нальное выражение для вероятности наблюдения измеряе- мых значений, которое обозначим как Р(Уа) = Р (Ул. Пь ’ -J 1 (20.1) Неизвестными остаются лишь параметры этих распреде- лений, определение которых и составляет один из этапов регрессионного анализа. Вообще говоря, априорное знание вида распределения «генеральных совокупностей значений во многом предопре- деляет характер проведения измерений. Дело в том, что ‘помимо знания средних значений T\i=y(Xi) крайне жела- тельно также иметь представление о достоверности (точно- сти) их определения. Только таким образом, оценивая до- стоверность вклада отдельных точек, можно с наибольшим ^правдоподобием построить итоговую кривую регрессии. Достоверность определения гр = «/(х,) можно оценить, фасполагая значением генеральной дисперсии. Для пуассо- новского процесса дисперсия совпадает со значением гене- 78
рального среднего. Поэтому определение среднего уже- позволяет оценить достоверность измерений. Напротив, для нормального распределения дисперсия находится с по- мощью дополнительных оценок. Следовательно, измерения Рис. 13. Условия опыта X}, х2, ... .... хп и результаты наблюдений &2К' ••• ' хп>. величин с пуассоновским нормальным распределения-- ми носят различный харак’- тер. Поясним сказанное на следующем примере. Допу- стим, что наблюдается угло- вое рассеяние частиц на, мишени. Измерения для не- которого фиксированного. угла можно проверить не- прерывно в течение всего выделенного времени по- скольку есть все основания ожидать, что процесс рас- сеяния является пуассонов- ским. Если в течение этого времени прибор отметил Nt частиц, то, используя это чис- ло можно определить интенсивность рассеяния и его дис- персию. Однако если появились сомнения, что характер распре- деления в силу каких-то причин уже не пуассоновский, пол- ное время ti наблюдения разбивается на ряд интерва- лов tn,, и производится независимых измерений,. на основании которых и оценивается средняя интенсивность, рассеяния и его дисперсия. Располагая совокупностью эмпирических точек, состав- ляем функцию правдоподобия L= П Р(Ул,П1.Ч)- (20.21 Оптимизируя функцию L по rji, о,-, получаем для каждо- го из параметров п уравнений, с помощью которых можно» найти оценки значений этих параметров. Однако если нас интересует установление функциональ- ных соотношений, например ц = ц(х), то целесообразно из- брать иной путь. Мы постулируем, исходя из каких-либо- теоретических или практических соображений, что зависи- мость т]=т](х) описывается, по крайней мере, в пределах коридора xi^x^xn кривой г) = г) (х, а0, ... , am_i), (20.3> 7Sb
т параметров которой определим с помощью оптимизации функции правдоподобия. В дальнейшем, за исключением особых случаев, будем считать, что распределение величин ун, близко к нормаль- ному. Помимо соображений, высказанных при обсуждении центральной предельной теоремы (§ 2), учтем также об- стоятельство, что (как показывается в теории информации) нормальное распределение содержит минимум информации по сравнению с любым распределением с той же диспер- сией. Поэтому замена некоторого распределения на экви- валентное нормальное не может привести к переоценке точности наблюдений. Таким образом, записываем п г. п = (20.4) 1=1 х=1 ' ‘ i=l где тр— т) (Xf) и а2 —генеральные среднее и дисперсия в каждой из точек. При исследовании зависимости типа (20.3) будем опе- рировать с первой из сумм в (20.4), содержащей квадраты отклонений эмпирических значений от средних. Потребовав для установления наиболее правдоподобного описания т] = т](х) максимума функции L, приходим к выводу, что такое описание вытекает из решения уравнения п г, м=2 j =min- <2о,5) i=i V °1 7 Следовательно, принцип максимального правдоподобия приводит к методу наименьших квадратов. Введем эмпирические средние групп наблюдения для каждой из точек хс ri А=1 (20.6) которые, как мы знаем (yi совпадают с выборочными сред- ними), являются несмещенными оценками генеральных средних т|«- Представляя у1}. — т)( = yiK — yt + yi — ть разбиваем сум- му М на две: м=м1 + м2 = V + V (20.7) 80
о О'; где Оу. — —— является дисперсией эмпирического средне- ‘ ri го yi. Сумма Afi включает рассеяние наблюдений относитель- но эмпирических средних и не зависит от вида кривой т](х). Напротив, ЛГ2 представляет лишь сумму квадратов отклоне- ний эмпирических средних от этой кривой. В этой сумме величины 1/о2г играют роль статистических весов, выра- жая то очевидное заключение, что достоверность вклада отдельных эмпирических точек тем выше, чем меньшей дис- персией они обладают. Поэтому для удобства описания це- лесообразно ввести нормированные статистические веса, определив последние как (20.8) Умножив все квадратичные формы (20.7) на постоянное число о2, определяемое в соответствии с (20.8), записываем ^i = Ylwir~l(y^~ = S ^i(yi — П/)-- (20.9) i,k i=l Нетрудно видеть, что такое преобразование никоим обра- зом не влияет на окончательные результаты. Величины статистических весов вычисляются по теорети- ческим значениям дисперсий о^. Однако в практических расчетах обычно используют их эмпирические оценки, при необходимости уточняя эти оценки в следующих приближе- ниях. § 21. Оценка линии регрессии Предположим, что кривая регрессии может быть пред- ставлена в виде т— 1 Т|(х) = £ акВк(х), (21.1) Л—О где В0(х)....Bk-i (х) —система базисных функций, выби- раемых на основании из тех или иных предпосылок. В част- ности, кривая т)(х) может быть разложена по системе по- линомов. Тогда число т—1 будет совпадать с максималь- ной степенью х, присутствующей в описании т](х). Пара- метры ак называются коэффициентами регрессии. 81
Заметим, что вид аргумента, так же как и функции у, выбирается подчас из соображения практического удобства или в силу установившихся традиций. Так, если известно, что разложение ведется по косинусам угла &, полагают x=cosft, или х=(1—cos'O')^. Аналогично поступают с функцией у. Например, при изучении констант радиоактив- ного распада целесообразно оперировать с логарифмами интенсивностей. Вообще говоря, последнее может противо- речить исходному предположению о нормальном распреде- лении наблюдаемых величин. Для приближенных оценок можно пойти на такой компромисс, учитывая, что неболь- шое отклонение от нормального закона не повлечет за со- бой больших неточностей. Однако там, где есть возмож- ность провести точный расчет, не следует избегать этой возможности, стараясь придать функции правдоподобия наиболее корректный вид. Заменив в (21.1) коэффициенты регрессии их оценка- ми as, имеем ~ п m—1 М2 = JjO'i (yi — £ «Л (xj)2. 1 Л=0 (21.2) Откуда, требуя, чтобы сумма ЛГ2 при этих оценках достига- ла минимума, получаем систему уравнений для их опреде- ления: п т—1 £ v>i [yt - £ «Л (*')) (х{) = О (21.3) <=1 *=о (при k' — 0, 1. ... , т — 1), или ml (21.4) /г=о где Ckk' = £ WiBk (xf) Bk- (Xi); Yk’ = £ Wiyfik- (x;). (21.5) i=l i=l Матрица называется информационной матрицей Фи- шера. Решение системы линейных уравнений (21.5) можно найти, например, методом построения матрицы I, С^1-1|, обратной "z! , (1 при k = k", = к (21.6) (0 при k^k". 82
Тогда оценки аь вычисляются как /Л—1 (21.7) k'=Q Оценки CLk являются несмещенными, т. е. ал = ал, в чем нетрудно убедиться, усредняя (21.7) по всем возможным случайным значениям ус а* = J Ckk' К = Cu'WMiBk’ (xi) = k' i,k’ = £ wfikk’ ak»Bk'Bk" = a,k"C^Ck’k’ =a*. i,k,k" Особый интерес представляет система «ортогональных» базисных функций, удовлетворяющих условию £ wtkBk (xt) Bk- (хг) = N^, (21.8) i=i где Nk = £ w.Bl iXi). (21.9) i=i Базисные функции, удовлетворяющие условию ортого- нальности на системе п точек xj, значительно облегчают процедуру вычисления коэффициентов аь. Для ортогональ- ных функций, которые обозначим как £&(х), матрицы ||С^-|| и II См* II являются диагональными т. е. С ж = Ckk’ -~=N~k18kk-. Поэтому У wtfAto) ----------- (21Л0) i=l Как увидим в дальнейшем, представление, основанное на ортогональных функциях, т. е. T)W=£aAW, (21.Н) обладает рядом ценных свойств (упрощение расчетов яв- ляется их следствием), что и позволяет отдавать ему «ре- шительное» предпочтение. 83
Задачи 1. Базируясь на эмпирических средних уи у2....уп, про- вести линейную регрессию (см. § 31). 2. Используя эмпирические средние yi, ..., уп, построить критерий согласия эмпирических данных с заданной теоре- тической КРИВОЙ Т] = Т](х). Решение. Если у<—эмпирические средние, а о2/л/—их диспер- сии, то п S/ \2 = 2 £=1 Следовательно, критерий согласия записывается в виде (ср. § 14). Л12<%1_8. § 22. Дисперсия коэффициентов регрессии Для оценки дисперсий коэффициентов регрессии вычис- лим величину — (а* = ай) (а, — as). (22.1) Согласно (21.7) имеем а* — ak = J Wi (yt — r|z) Bk- (хг). itk Учитывая далее соотношения (t/£ — т]{) (i/y — т);.) = о^6г/, получаем cl = ®г (& — nJ CVk-Bk' (хг) Wj (у} — г),) C^BS- (л,) = a2Cfa1, (22.2) поскольку ОрДОг = о2. Таким образом, оценки коэффициентов регрессии в об- щем случае оказываются коррелированными. Однако для ортогональных базисных функций матрица ЦС^11| является диагональной и оценки не коррелированы, т. е. (22-3) и Как отмечалось, коэффициенты корреляции, равные в данном случае 84
Л Г-1 gfes _ Cfes CTfc<Ts /c^c-1 (22.5) указывают, насколько близка к линейной связь между ап (§ 2). Если значения |р&з| близки к единице, выбранное представление т](х) =£аАВ*(*) (22.6) k нельзя считать удачным. Корреляция увеличивает диспер- сию оценок и создает дополнительные вычислительные трудности. Коррелированность означает, что соответст- вующие члены в представлении (22.6) дублируют в боль- шей или меньшей степени друг друга. Поэтому соответст- вующую комбинацию akBk+asBs целесообразно заменить новой функцией aiBt, объединяющей описание этой комби- нации, что среди прочего приводит к «экономии» средств описания. Для ортогональных базисных функций оценки а* оказы- ваются не коррелированными, так что такое представление яв- ляется наиболее экономным. Вообще, подчас нелегко еще до обработки предугадать наиболее удачное представление. Эта проблема в значи- тельной степени упрощается, если коэффициентам регрессии придавать наглядный характер. Например, один параметр может характеризовать положение пика кривой, другой — его ширину и т. д. Так, из двух записей линейной регрессии Лх — «о* + «V*х и [г]2 — а(о2) + а}2)(х — х) предпочтение сле- дует отдать второй, поскольку коэффициент а<2) характери- зует только наклон линии, а средняя высота ее определяет- ся только значением а(о2). Аналогично для описания парабо- лической кривой т](х) целесообразно выбрать представле- ние^ т]=а+й (х—х)2, в котором каждый из параметров а, b и х характеризует различные свойства кривой. Обратимся теперь непосредственно к оценке дисперсий коэффициента регрессии. Вследствие (22.2), оценка диспер- сии о~ сводится к нахождению оценок объединенной дис- ak персии о2, определяемой согласно (20.8). Оценку для о2 можно получить непосредственно из ис- ходного соотношения о2 = -------1------ (22.7) 85
так как значения csy{ <Л/г£- или хотя бы закон изменения о2 от точки к точке предполагались известными. Эту оценку можно свести к первой квадратичной форме Л11( поскольку последняя содержит несмещение оценки дис- персий о? результатов в каждой из точек наблюдения Х{. Согласно (8.15), $ = ст» V /Л—у± \ = о2 У (Г{ — 1). (22.8) \ (J: ) i.K I Так что несмещенной стохастической оценкой а2 может служить соотношение S1 =------------- (22.7') i С помощью St можно сформулировать основные требова- ния к точности наблюдений в отдельных точках, необходимой для того, чтобы погрешность в определении коэффициентов регрессии, независимо от вида кривой не превышала некоторой величины (для построения системы ортогональ- ных базисных функций не нужно знать эмпирические значе- ния Уг). Вторая несмещенная оценка а2 может быть получена с помощью квадратичной формы п т—1 = (yt - £ akLM)2, (22.9) i=i “о среднее значение которой равно (as— независимы) — п _______________ м2 = 2 W( ~== °2 (« — т)- i=l Поэтому второй несмещенной оценкой о2 является 5 w‘ (у: — 2 (х<))2 si = 1=1-------—------------(22.10) п — т где коэффициенты as определяются в соответствии с (21.10). Соотношение (22.10) включает разброс точек относи- тельно эмпирической кривой регрессии. Поэтому S2 является в известной мере более объективной оценкой, чем Sj. 86
Полученные оценки обладают свойством стохастической независимости. В процессе вычисления ak и о~ исходная квадратичная сумма М, которая, очевидно, имеет х2-Распре- делениес/ = степенями свободы, была разбита на Л4Ь и М2 (см. (20.5) и (20.7)). Последнюю сумму после преоб- разования yi—i\i=yi—Tb + tli—*]« разбиваем еще на две части } (22.11) что нетрудно показать, используя свойства ортогональности функций Lfc. Число степеней свободы квадратичной фор- мы М{ равно /х = ^гг— п ( имеет п соотношений = = —— V ya. V а число степеней свободы каждой из сумм r' 1 ’ в (22.9) равно соответственно f^n—tn (существует т свя- зей, накладываемые на yi при оценке as) и f2=m. Отсюда, поскольку + f2 + — = f, мы можем утверждать (используя еще раз теорему о разложении %2-распределе- ния), что А41 и суммы в (22.11) имеют %2-распределения с f1 = ^]ri —га; [2=п—т и f3=m степенями свободы. i В частности, оценки S2 и 31 могут быть представлены в виде 2 2 fl ft (22.12) Соотношения (22.12) дают нам право воспользоваться методами § 15 для сравнения оценок S2 и S|. Такое срав- нение позволяет эффективно контролировать ход экспери- мента, так как несовпадение оценок (S2 § Зг) может слу- жить показателем различного рода погрешностей, допускае- мых в процессе измерений. Одна из причин, вызывающих значимое превышение <Si>32, может заключаться в систематических ошибках, недостаточно корректно учтенных в регрессионном анализе. 87
В частности, систематические ошибки могут нарушать усло- вия независимости yia.- В этом случае необходимо при описании результатов отдельно указать дисперсии незави- симых случайных колебаний эмпирических средних г/, и от- дельно— дисперсии коррелированных для всех z/j колеба- ний (см. § 25). Обратное значимое неравенство S|>Si может указы- вать прежде всего на нарушения условий опыта при пере- ходе от одной точки наблюдения к другой. Другая причина — недостаточно полное описание кривой регрессии. Естественным шагом в устранении последнего недостатка является расширение описания: т)(х, m)^v\{x, т + 1) = ^kLk(x), (22.13) fe=0 хотя иногда целесообразно перейти к новой системе базис- ных" функций (например, от разложения по степеням коси- нуса к полиномам Лежандра). Такая процедура последовательного расширения в опи- сании кривой регрессии является необходимой, если теоре- тическое представление точно неизвестно. Здесь целесооб- разно подчеркнуть еще раз очевидное удобство, связанное с использованием ортогональных базисных функций. Дейст- вительно, для построения функции Lm и нахождения а-m не надо перевычислять значения а*<т.- Чтобы оценить, являет- ся ли расширение в описании т](/п)-»-г)(/п + 1) целесообраз- ным, обращаемся вновь к сравнению дисперсий $1(т) и S2 (т + 1), найденных для rj(m) и т)(/п + 1) соответствен- но. При этом для вычисления дисперсии S^/n-f-l) можно использовать уже имеющуюся оценку Si (tn), так как 2 «’/(й- 2 (п S2 (т + 1) — —-______—________= m m 2 п — (m+1) п — т—1 Сравнение дисперсий проводится, например, с помощью ^-критерия: отличие S2(w+1) и значимо, если —>Ui-e(fi = п — tn; f2=n — tn— 1). (22.14) ^(m + 1) Если неравенство (22.14) выполняется, улучшение в опи- сании оказывается значимым, и можно сделать еще один шаг в расширении описания г\-^х\(т+2), добиваясь мини- 88
мального значения величины Зг (согласно принципу Гаусса условие Sf = min является необходимым, чтобы оценки as были эффективными). Не всегда такое последовательное расширение в описа- нии является действенным. Это связано либо с недостаточ- ной информацией, содержащейся в эмпирическом материа- ле (следует расширить эксперимент или повысить' точность измерений), либо с неудачной формой описания (о путях дальнейшей минимизации S-г см. гл. V). Заметим, что иногда эффективность описания теоретиче- ской зависимости т)=т](х) характеризует с помощью корре- ляционного отношения б, определяемого как П/)2 i/)2 где г); = т]г (аА); у = а0 — оценка среднего всей совокупно- сти данных (см. (21.10), L0=l)- Очевидно, 0^0^ 1; ©->-0, если T]=ao=const, т. е. величины у и х некоррелированы. Для эффективных оценок @->1. Допустим теперь, что удалось получить минимальное значение Зг, и это значение не отличается значимо от 3?. Тогда целесообразно составить объединенную оценку а для оценки дисперсии коэффициента регрессии избрать соотношение S8 2>,£*(хг) (22.16) Задача При исследовании углового распределения р-частиц, ис- пускаемых при распаде поляризованных ядер Со60 (измере- на интенсивность р-частиц для 10 различных углов, перво- начально анализировалась гипотеза симметричного распре- деления, т. е. Pi = ao + a2cos2<p. При этом оценка 3* имела значение Зз =12,0. После уточнения описания Р2 = ао + + ai cos ф+аг cos2<p соответствующая оценка оказалась Зг =2,0. Можно ли на основании этих результатов сде- лать заключение о несохранении четности при р-распаде (установить асимметричность распределения)? 89
§ 23. Достоверность оценки кривой регрессии Оценки Uk коэффициентов регрессии^ как было указано, распределены нормально со средним ak = ak и дисперсией 2 (J2 п » <rk =---. Поэтому случайная величина Nk Wt (23 1) Km v^if имеет /-распределение, число степеней свободы которого оп- ределяется числом степеней свободы оценки S2 (для объеди- ненной оценки f=Sr,-—tri). Следовательно, можно утверж- дать, что с доверительной вероятностью 1—е выполняется соотношение S / «а — S VNk /1-8/2 <«*< а* + (23.2) Пример. Рассмотрим вопрос об определении интенсив- ности источника с точки зрения регрессионного анализа. Пусть мы располагаем двумя измерениями интенсивности источника. В первом измерении за /1 = 100 с прибор зареги- стрировал 5770 событий; во втором, проведенном через некоторое время, счетчик за /2 = 50 с отметил 3012 событий. Если интенсивность источника постоянна, то для пост- роения «кривой регрессии», содержащей лишь параметр т) = а0, имеем две эмпирические точки vi = 57,7 соб./с и v2 = 60,2 соб./с, измеренные с дисперсиями 01=0,58 и <?2 =1,2. Поэтому (см. задачу § 21) v =а0 = + _ 58,8 1/о| + 1/а| а дисперсия оценки среднего о2 — (1 /ст? + 1/о2)~ 1 — 0,39. Поскольку здесь N\, N^\, то /i_e/2 совпадают с кван- тилями нормированного нормального распределения. Вы- бирая е=0,05 («o.975= 1,96), записываем v = (58,8 ± 1,2) соб./с. Конечно, информация, содержащаяся в материале, в принципе позволяет оценить не только интенсивность, но и,, например, стабильность источника (если указано время, разделяющее интервалы измерений t\ и /2). Располагая оценками а*, можно указать так называе- мый коридор ошибок всей линии регрессии, т. е. средне- го
квадратичное отклонение каждой точки эмпирической кри- вой регрессии: — П)2 • (23.3) Учитывая свойство стохастической независимости а&, запи- сываем (23.4) Оценкой среднеквадратичного отклонения кривой регрессии является величина Г т—1 S~(x)=Sl/ у Ll/Nk • (23-5) ' ь=о где S2— одна из оценок дисперсии коэффициента регрессии с соответствующим числом степеней свободы. Следовательно, величина п(х) —п(х) 3~(х) = t (х, f) (23.6) имеет /-распределение, так что истинная кривая регрессии лежит в коридоре (с вероятностью 1—е) П (х) — %(х) ti-e/2 < ц (х) < rf(x)+ (x) /1-8/2. (23.7) 7(x) Рис. 14. Кривая регрессии (сплош- ная кривая) и коридор ошибок (пунк- тирные линии) Коридор ошибок кривой регрессии будет соответствовать оценкам (23.7) при е = 0,3. Заметим, что «ошибки» в поло- жении кривой регрессии определяются не локальными, а усредненными характеристиками погрешностей измерений, 91
представленными в S и £~ и могут не совпадать с ошиб- ками измерений в остальных точках (рис. 14). Если имеются две эмпирические кривые регрессии W Ul) (х); ъ = £ af Ц2) (х), (23.8) k k полученные в результате двух независимых серий наблюде- ний, то гипотезу об их совпадении можно проверить, используя, например, локальный критерий. Обычно наибольший интерес вызывает положение кри- вых в районе особых точек, например в области резонанса. Степень совпадения двух кривых в отдельных точках мож- но установить с помощью обычных статистических крите- риев. Для этого сначала вычисляют оценку суммарного коридора ошибок = V4(x) + Sl(x) . (23.9) а затем составляют величину т_ Ч1(х) —n2U) SrfU) (23.10) которая (см. § 16) приблизительно описывается /-распреде- лением с числом степеней свободы f, определяемым из урав- нения з046(х) si St(x) f fl h (23.11) Гипотеза о совпадении кривых в точке х принимается, если |Т|</1_е/2. В специальной литературе рассматриваются также ин- тегральные критерии, проверяющие совпадение эмпириче- ских кривых в среднем во всем интервале изменения аргу- мента х. Очевидно, кривые в целом совпадают, если их ко- ридоры ошибок в основном перекрываются, хотя в отдель- ных точках локальный критерий может отмечать их значи- мое расхождение. Задача Допустим, что сравнение двух эмпирических кривых не указывают на значимое их различие. Построить объединен- ную линию регрессии. Решение. Ограничимся построением объединенных оценок коэф- фициентов регрессии. Используя (23.1), нетрудно составить функцию 92
правдоподобия для оценки коэффициента регрессии а* по двум преды- дущим оценкам ак и ak . Отсюда, в первом приближении «*, (А + Wi °2 + akt (ft + 1) fl <7| ~---------------------------» (Л + 0 /г + (fa + О/i ai S12 где fj 2—числа степеней свободы каждой из оценок а*] 2; а, 2 = ~~ ’ '• "*1,2 § 24. Влияние погрешностей в определении аргумента В эксперименте значения независимой переменной из- вестны не абсолютно точно, а с некоторой неопределенно- стью. Это скорее норма, чем исключение в практике экспе- римента. Обычно погрешность в определении значений ар- гумента поддается контролю. Поэтому условия измерения планируются таких образом, чтобы относительная роль та- кой погрешности была минимальной. Так, если исследуется временная зависимость, то пытаются расставить точки из- мерения таким образом, чтобы относительная ошибка в определении времени была исчезающе малой. К сожалению, всевозможные ухищрения не всегда дают должный эффект. Более того, иногда по условиям экспери- мента точки расставлены настолько тесно, что существует реальная угроза «спутать» точки, т. е. приписать результа- ты измерений, которые «по праву» принадлежат к соседней точке. Например, при измерении поглощения 0-лучей толщи- на мишени увеличивается последовательным наложением тонких фолы. Ошибка в определении суммарной толщины растет как корень из числа фольг, и на некотором этапе может сложиться парадоксальная ситуация, когда толщина очередной фольги оказывается меньше, чем ошибка в изме- рении общей толщины поглотителя. В случае, если погрешностями в определении значений аргумента пренебречь нельзя, анализ кривых должен бази- роваться на иных принципах, рассматривая эмпирические точки как величины в многомерном пространстве случай- ных переменных (такой анализ называют конфлюентным, т. е. сливающимся). В большинстве случаев, однако, можно считать, что ошибки в определении х не очень велики. Тогда для уста- новления искомой функциональной зависимости т) (х) мож- но воспользоваться результатами регрессионного анализа, внеся некоторые исправления в расчетные соотношения. На участке кривой вблизи точки (х$, yi) теоретическую кривую можно представить, ограничиваясь первыми члена- ми в разложении Тэйлора 93
Т) (X) CsJ Т] (Xi) + (X — хг) Tf (Xi) + -i- (x — Xi)2 T)' (Xi). Поэтому в качестве оценки эмпирического среднего в со©т- ношениях (21.7) следует избрать величину У1 = Vi + y Л' (хд, (24.2) по-прежнему понимая под выборочное среднее, а для дисперсии эмпирического среднего — Л* (xt)> (24.3) где — дисперсия случайных флюктуаций выборочнего среднего, a c4z —дисперсия аргумента х,. Происхождение поправок для yi и <Ту. довольно очевид- но. Так, рассеиваясь вследствие дисперсии <£, эмпириче- ские точки скапливаются на участках вогнутостей кривой. Недостаток полученных соотношений (24.3) и (24.4) за- ключается в том, что они зависят от характера поведения кривой, вид которой еще следует установить в процессе предстоящего анализа. Эта проблема обычно решается ме- тодом последовательных приближений, причем в качестве исходной предпосылки можно использовать параметры кри- вой, проведенной через эмпирические точки прямо на глаз. § 25. Дополнительные замечания 1. Систематические ошибки. Обычно под систематически- ми ошибками понимают погрешности измерений, имеющие не статистическое происхождение. Такие ошибки возникают подчас как следствие ошибок в градуировке всякого рода констант, значение которых необходимо для вычисления измеряемой величины. Так, при исследовании рассеяния частиц (фотонов, фононов,- ядерных частиц и т. д.) расчет- ными параметрами являются плотность (толщина) мишени, интенсивность потока частиц, эффективность детектора. Другой источник систематических ошибок — плохая гео- метрия опыта. Если, например, экспериментатор в погоне за повышением интенсивности счета располагает детектор слишком близко к мишени (шаг иногда вынужденный вследствие малой чувствительности или плохой разрешаю- щей способности прибора), детектор будет фиксировать также побочные события (рассеянные частицы). Ситуация может усугубляться неправильным выбором рабочей гипотезы. В измерениях рассеяния частиц такие ошибки возникают, если толщина мишени оказывается 94
больше длины рассеяния частиц. В этом случае частицы могут попасть в детектор после вторичного рассеяния. В итоге теоретическая кривая регрессии отклонится от экс- поненциальной (приподнят «хвост»), и экспериментатор полу- чит заниженную величину эффективного сечения процесса. Систематические причины нарушают условие независи- мости наблюдений уц,. Как следствие матрица ошибок теряет диагональный вид: (.У1 — Лг) (У/ — Л/) = оу = 6// + £ <*ti (И), (25.1) где Оу. — случайные независимые ошибки, of/(|i) — ошибки, об- условленные систематическими причинами. Поэтому квадратичная форма, минимизация которой поз- воляет найти оптимальную форму описания, имеет вид п • ма= £ (.Vi —Пг) “'»/(«// —Л/). (25.2) «./=1 где ||а>«|| — нормированная матрица статистических весов, обратная по отношению к матрице ошибок ус п * п J £^ = 1. (25.3) Z=1 i,/=l Полагая т— 1 л(*)= a*Lft(*). (25.4) /г=0 мы, как и ранее, варьированием по а* получаем оценки коэффициентов регрессии, которые записываются в наибо- лее простой форме, если функции Lh удовлетворяют обоб- щенному условию ортогональности: У (xi) ^ij ^k' (•*/) — Nk $kk'- (25.5) M=1 Тогда = £ yiWijLkiXj). (25.6) i./=l Оценки az, стохастически независимы (т. e. описание наиболее экономно) и имеют дисперсию of = <j*/Nk. (25.7) Для оценки а2 можно избрать соотношение (25.3) (пер- вая оценка Si) или соотношение S| = Mz/(n — т). 95
Как видим, корректный учет систематических ошибок заметно усложняет процедуру вычислений. Поэтому часто избирают путь последовательного анализа, учитывая сна- чала случайные ошибки, а затем систематические. Своеобразным примером такого последовательного ана- лиза (а точнее, последовательного исключения системати- ческих ошибок) может служить способ «исправления» ре- зультатов, огрубляемых вследствие конечной разрешающей способности измерительной аппаратуры. Конечная разре- шающая способность измерительных устройств (например, недостаточное спектральное или угловое разрешение детек- тора, малая чувствительность дискриминатора, большое мертвое время прибора) приводит к усреднению результатов по некоторому интервалу изменения независимого аргумента. Это усреднение особенно чувствительно в окрестности пиков кривой, где оно «смазывает» остроту резонансов. Систематические ошибки, допускаемые при этом, можно описать, если ввести некоторую функцию ф (х—х) характе- ризующую эффективность регистрации прибора. Тогда из- меренное сглаженное значение величины у имеет вид {У (xi)) = j у (х) ф (х — xt) dx (функция ф нормирована). Истинное значение У (xt) = (y(xi)) + byt меньше или больше усредненного, смотря по тому, на пике или впадине кривой лежит эта точка. Если известна функция ф(х—х), то необходимую по- правку Ду,- можно вычислить, используя в качестве исход- ного приближения кривую регрессии t]<°>(x), построенную на основании усредненных данных <z/(xf)>: &yi — я<0) (Xi) — J П(0) (х) ф (х — х() dx. Если найденная поправка Ауг- сравнима по величине с то надо вычислить следующее приближение. Другой способ учета систематических ошибок — рандо- мизация — в случайном перемешивании возможных система- тических воздействий, в результате систематические ошибки превращаются в разновидность случайных (см. § 34). 2. Обработка наблюдений при бедной статистике. При недостаточно богатой статистике следует исходить из функции правдоподобия, построенной на основании распределения Пуассона (рассматриваются дискретные события). Располагая значениями чисел наблюдаемых событий Afi(*i), . Nn(xn), определяем функцию правдоподобия £6
П М L = П e~Vi <l (Vitil "> . (259> * * Ni I £=1 в которой vj — предполагаемые значения средней интенсив- ности событий для каждого из значений аргумента ъ, ti— времена отдельных измерений. Постулируя далее теоретический вид кривой регрессии. /П—1 V (X) = £ akBk (х), (25. 10> Л=0 найдем оценки коэффициента регрессии из системы уравнении® п (х^ 1=1 (25.1I> т—1 k=0 Эта система нелинейна. Точное ее решение — весьма трудоемко (особенно, если числа сравним с фоном). Здесь, также можно рекомендовать метод последовательных приблиг- жений, заменив знаменатели дробей в (25.11) сначала на? эмпирические значения средних n.i=Nijti, а затем на вычисленные с помощью (хг) и т. д. Относительные k расхождения vi и могут быть довольно заметными, так чт<г для достижения удовлетворительной сходимости требуется не- сколько приближений. С нелинейными расчетными уравнения- ми приходится сталкиваться также, если рабочая гипотеза— нелинейная по некоторому числу параметров (например, т] = е/ях + е$х). Помимо вычислительных сложностей, нели- нейные уравнения приводят к алгебраической неоднознач- ности оценок, и для выбора «истинной» оценки приходите® прибегать к дополнительному анализу. Задача Найти поправку на просчеты, связанные с мертвым вре- менем детектора. Решение. Просчеты возникают потому, что в течение некоторого времени после регистрации события прибор теряет чувствительность. Рассмотрим детектор с непродлеваюшимся мертвым временем т. Еслж> прибор зафиксировал в течение 1 с т событий, то полное время, в тече- ние которого детектор оставался нечувствительным, составило W=nrt- Поэтому эффективное время регистрации (за 1 с) равнялось ^>ФФ = 1—/пт, в течение которого прибор и «смог» зарегистрировать т событий. Истинная интенсивность потока событий v=m/(l—/пт). т V — 1 — /пт ’ 4 В. К. Гришин
Глава V ПЛАНИРОВАНИЕ ЭКСПЕРИМЕНТА § 26. Оптимальное планирование эксперимента Планирование эксперимента относится к одной из самых актуальных проблем научного исследования. Многогран- ность изучаемых явлений, сложность и высокая стоимость научного оборудования, острая нехватка времени — все это вынуждает исследователя тщательно продумывать план проведения предстоящих экспериментов. Проблема планирования исследований чрезвычайно об- ширна. Это связано прежде всего с большим~'разнообразием задач, возникающих в практике эксперимента. Обычно при планировании выделяют два основных направления: плани- рование экстремальных экспериментов и планирование экс- периментов по выяснению механизма явлений. С проблемами первого типа исследователю приходится встречаться в процессе поиска условий, при которых изу- чаемое явление отвечает некоторому критерию оптимально- сти наблюдений. Эксперименты второго типа ставятся для выяснения закономерностей, характеризующих явление в целом, чаще всего это исследования -различных моделей, описывающих изучаемое явление. Примером такого моде- лирования может служить регрессионный анализ с последо- вательным увеличением числа полиномов, привлекаемых для описания теоретической кривой. Разумеется, это разде- ление довольно условно. В реальных экспериментах иссле- дователь нередко вынужден отыскивать наилучшие условия наблюдения какого-то явления, не располагая полной ин- формацией относительно его характера. Можно вновь обра- титься к регрессионному анализу и рассмотреть случай, когда необходимо экстраполировать эмпирическую кривую в некоторую область, непосредственно не наблюдаемую. Очевидно, наиболее надежно экстраполяция будет осущест- вляться, если удается найти достаточно верное описание (модель) кривой регрессии. Последнее обстоятельство опре- деляет, в частности, число точек наблюдения: С другой сто- 98
роны, экстраполяция определяется и взаимным положением точек наблюдений. Таким образом, результат эксперимента зависит от того, насколько удачно решены обе задачи- (поиск и модели, и экспериментальных условий наблюде- ния). Прежде чем перейти к рассмотрению конкретных задан по планированию наблюдений, обсудим возможные способы сравнения результатов экспериментов. С точки зрения статистического анализа наилучший ре- зультат эксперимента будет в случае, если значения иссле- дуемых величин оцениваются с максимальной достоверно- стью. Это требование и будет использовано в дальнейшем для отыскания путей оптимального планирования экспери- мента. При прочих равных условиях достоверность тем вы- ше, чем меньше дисперсия наблюдаемых значений. Поэто- му с точки зрения статистического подхода к оценке ре- зультатов эксперимент спланирован оптимально, если дис- персии будут достигать минимальных значений. В зависимости от конкретного вида задач, часть из ко- торых рассматривается ниже, оптимальное планирование достигается при минимизации той или иной комбинации дисперсии результирующих оценок. Однако исследователю не безразлично также, каким способом и при каких затратах получены конечные резуль- таты. Иногда один план эксперимента с несколькими худ- шими (в смысле статистических критериев) показателями может оказаться более приемлемым, чем другой, в котором большая «точность» достигается ценою значительно боль- ших затрат. В этом случае планы эксперимента строятся с целью минимизации величины /? = Т+ЧГ(Р), получившей название функции потерь эксперимента. Здесь Т — обоб- щенные затраты (время, материальные затраты и т. д.), W(D)—некоторый функционал, зависящий от дисперсий оценок искомых величин. Вид этого функционала и его доля в общей функции потерь определяется конечной целью эксперимента и способом сравнения результатов, который избирается в данной ситуации. § 27. Оптимальное распределение времени наблюдений Для иллюстрации методов построения оптимальных пла- нов эксперимента рассмотрим сначала ряд задач, связан- ных с выборов наилучших условий наблюдения. К числу упомянутых проблем относится вопрос о рас- пределении времени в эксперименте между отдельными операциями. Допустим, что в эксперименте исследуется не- которая величина У, значения которой мы определяем в ре- 4* 9»
зультате косвенных наблюдений с помощью п вспомогатель- ных величин у\, ...» уп, имеющих случайный характер. Тем -самым мы полагаем, что Y = Y(ylt...,y„). (27.1) Представление об истинном значении величин У и ее дисперсии можно получить, воспользовавшись приближен- ными соотношениями (§ 2) (27.2) п <27-3) 1=1 где ^ — предполагаемые истинные (средние) значения вспомогательных величин, о^. —их дисперсии. Значение дисперсии D(Y) характеризует погрешность в -'определении У, и очевидным ответом на поставленный во- прос о получении максимальной достоверности в оценке У будет требование минимальности дисперсий D(Y). Напомним, что если yi определяется как выборочное среднее дискретных измерений, т. е. Г1 Х=1 ах дисперсия _2 _ Последнее справедливо, так как число г{ отдельных измере- ний в каждой из точек в кс^нечно^ .счете' пропорционально полному времени Ц, потраченному на операцию"" измере- ния yi (предполагается, что неустранимые ошибки доста- точно малы). Для непрерывных измерений я дисперсия yi также убывает с увеличением времени на- блюдения " I, ' ОТО
Таким образом, можно представить дисперсию измерен- ных величин t)t как Здесь hi — некоторая конечная величина (Л? совпадает с дисперсией ву. при Л=1), называемая функцией трудности : измерений в отдельных точках. Если величины Оу{ неиз- i вестны, то функция трудности измерения составляется по их оценкам. Очевидно, при бесконечном времени наблюдений о^->0; также £)(У)->-0. Однако в эксперименте на определение У отводится не бесконечное, а конечное время, поэтому его необходимо так распределить между отдельными опера- циями, чтобы £)(/)-> min. , Если бы слагаемые, входящие в (27.3), оказались рав- ными между собой (при ^ = 1), полное время можно было бы распределить равномерно между всеми измерениями. Тогда дисперсия D(Y) минимизировалась бы только за счет увеличения суммарного времени. _ В общем случае величины (dY/dyi)2h2i не равны между собой. Поэтому наблюдения становятся не равнозначными, и большее внимание следует уделять тем измерениям, вклад которых в дисперсию D(Y) максимален. Положим Т = (27.5) i и будем искать минимум дисперсии D(Y) при общем усло- вии Т = const. Обычно при решении такого рода задач (на условный экстремум) используют метод Лагранжа, в котором все величины ti считаются независимыми, но находят минимум функции Я(Г) + ЬТ = У Ц), (27.6) где параметр Л определяется затем с помощью (27.5). 101
Используя эту процедуру, находим а затем (27.7) I dY I “7=“ Л‘ I дУ1 I (27.8) dY дУ1 Окончательно дисперсия равна п i=--l а среднее квадратичное отклонение п ат1п(Г)=р^£|-|£-|л{. t=l (27.9) (27.10) В эксперименте значение hi оценивается с помощью предварительных измерений, но ошибка, связанная с неточ- ностью знаний hi, в общем невелика, так как обычно боль- ший относительный разброс в hi наблюдается в тех точках, вклад которых в дисперсию D (У) минимален. Чтобы оценить эффективность полученного соотношения, сравним результаты измерения У по двум методикам: опти- мального и равномерного распределений времени между наблюдениями. Допустим, что одно из слагаемых в (27.3), например первое, преобладает. Тогда из (27.10) следует, что погрешность измерений amln (У) — -у— дУ дУ1 hi. При равномерном распределении времени мы имели бы <т(У) = дУ дУ1 hi — ]/”л CFmin (У)> Пример. Оценим время, необходимое для определения интенсивности событий с требуемой точностью б. Пусть vi и V2 — предварительные оценки интенсивностей основного источника вместе с фоном и отдельно от фона. Тогда 102
Y = Vj — v2; Л?,2 = vi.2, и распределение времени опреде- ляется соотношением : 1г v2, а общее время Т— Y /Т ’ /ух-УЧ’ !Так, если jvi = 100 соб./мин; V2=25 соб./мин, а 6=3%, то Т = l/e’fl/vj — |/v7) = 45 мин при Л=30мин и ^2 = 1бмин. Этот пример еще раз подтверждает основной вывод из предшествующего анализа, что с наибольшим вниманием следует измерять точки, вклад которых в общую дисперсию максимален. Задача Оценить время, необходимое для определения отноше- ния интенсивностей двух источников с точностью 6. ! Решение. Пусть vi,s — интенсивности источников. 1/112= vi,2- Распределение времени оптимально, если Тогда У=У|М; ti _ Kva УЧ и полное время равно / 1 1 \2 / ’’=(•^= + “7=1 /б’- \ У Vj у v2 ) / При vi=400 соб/мин, v2=100 соб/мин, 6—5% имеем Т=9 мин. § 28. Выбор точек наблюдений В примере § 27 вспомогательные величины t/j, с по- мощью которых оценивалось искомое соотношение Y(yi), полагались фиксированными. Более широкие перспективы сулит эксперимент, в котором выбор величин «/,• происходит в процессе наблюдений. В этом случае перед исследовате- лем открываются дополнительные возможности подбора условий наблюдений (набор величин yt и их вклад в У(у<)), при которых конечный результат оценивается с наиболь- шей достоверностью. Некоторые рекомендации здесь довольно очевидны. Так, уже в опыте при определении интенсивности порка собы- тий точность измерения можно повысить, добившись сниже- ния уровня помех; для измерения амплитуды резонанса ! наблюдения целесообразно проводить в районе пика и т. д. К сожалению, не всегда можно следовать даже очевид- , ным рекомендациям. Так, чтобы измерить высоту резонанс- 103
ного пика, необходимо прежде всего определить его поло- жение. Особые осложнения возникают, если исследуемая об- ласть значений включает участки с повышенной трудностью измерений. Примером такого эксперимента может служить определение эффективности обратного рассеяния потока ча- стиц на мишени. Чтобы измерить эту величину, детектор следует поставить на пути следования самого пучка, что делать довольно бессмысленно. Другими словами, функция трудности измерения здесь становится бесконечно большой. Обратимся к другому весьма характерному в этом от- ношении примеру с исследованием различных фазовых пе- реходов в веществе при изменении внешних условий (тем- пературы, внешнего магнитного поля и т. д.). Состояние вещества в районе критических точек будет обладать повы- шенной неустойчивостью. Следовательно, измерение харак- теристик вещества в этих областях связано со значитель- ными трудностями. Если прямые наблюдения малоэффективны, то эти трудности можно обойти, анализируя характер поведения исследуемых величин в «труднодоступных» точках путем экстраполяции данных, полученных при наблюдениях в смежных областях. Для такой экстраполяции в область с повышенной трудностью наблюдений нужно быть уверен- ным в том, что с помощью измерений в других точках уда- лось «уловить» общий характер поведения кривой, описы- вающей исследуемое явление. Таким образом, возникает проблема наиболее удачной расстановки точек во всем ин- тервале изменения аргумента. Учитывая довольно общий характер предыдущего об- суждения, проанализируем проблему оптимального выбора условий наблюдений, подразумевая под последними область изменения независимого аргумента х, в которой встречаются участки различной трудоемкости измерений. Под исследуе- мой функцией У=У(г/{) будем понимать кривую регрессии, уравновешиваемую по заданным точкам уг=у{х^. Кривую регрессии целесообразнее всего описать с по- мощью ортогональных функций F(x)=£aAL/(x). к=0 (28.1) Тогда дисперсия функции У в некоторой точке х оценивает- ся из соотношения (28.2) fc=0 104
где величины a2, Lk, Nk определяются в соответствии с соот- ношениями (20.8), (21.8), (21.9). Проблема минимизации дисперсии о2(У) сводится, таким образом, к оптимальному вы- у бору числа точек х< и их поло- жения (исходя из некоторых предварительных измерений функции трудности). Условимся прежде всего от- носительно выбора числа то- чек измерения. Целью регрес- сионного анализа является установление наилучшего опи- сания эмпирического материа- ла, содержащего измерения в п точках. В процессе этого анализа подбирается макси- мальный номер /Птах ФУНКЦИЙ Lk, исследуемых в описании. При этом предельное значение ГГЪаат^П. С Другой СТОрОНЫ, Рис. 15. Ошибки в оценке наклона прямой, проводи- мой на основании измере- ний в двух (а) и трех (б) точках (измерения прово- дятся за одинаковые про- межутки времени) если заранее твердо установ- лен набор функций zk(x) с из- вестным /пШах (например, ут- верждается, что в разложении функции У(х) в ряд по х мак- симальная степень х равна т—1), то минимальное число точек наблюдения равно Птт=т. При этом можно показать, что если точки расставлены так, чтобы обеспечить минимум дисперсии, то введение еще одной точки при неизменном общем времени наблюдения может только ухудшить точность оценки параметров кривой. Для иллюстраций этого рассмот- рим пример с линейной регрессией. На рис. 15, а указаны два результата наблюдений //1,2, полученные для проведения линии У=а+р(х—х). Средняя квадратичная ошибка в оценке параметра (5 равна — xi) (§ 21). Приблизительно это зна- чение ор описывается . разбросом угла наклона в пучке пря- мых, проведенных в пределах коридора ошибок (на рис. 15, а разброс определяется пунктирными линиями). Распыление того же лимита времени на измерения в трех точках, вклю- чая еще одну промежуточную х', лишь снижает точность из- мерений отдельных yi, расширяет коридор ошибок и в итоге увеличивает ср (рис. 15, б). Таким образом, полагаем, что число точек измерения п=/п. Тогда в качестве функций £л(х) можно избрать ин- 105
терполяционные полиномы Ньютона п Lk W =—П /*~~~\ = ~^=Г • (28.3) Vwk i=\^Xfc~x^ Wk i*k Все функции 4(х) являются полиномами степени п~ 1, различаясь между собой коэффициентами при х. Их ортого- нальность следует из очевидного равенства 4(х,)=б^-. Отсю- да вытекает также, что Nk = — 1, i Соотношение (28.2) теперь принимает вид п o4Y)= £ ll{x)^k. (28.4) fe=l Используя далее понятие функции трудности и соотношение (27.8), указывающим оптимальное распределение времени Т между наблюдениями в отдельных точках, получаем а(П = ~У ( <28-5) k —1 Варьируя функцию а(У) по Х{, можно найти систему урав- нений, определяющих наиболее благоприятное расположение точек наблюдения, при котором дисперсия У в искомой точке достигает минимума. В качестве такой точки может быть избрана точка с повышенной трудностью измерения. Конечно, этой операции должна предшествовать серия предваритель- ных измерений, с помощью которых можно было бы соста- вить представление о поведении функции трудности измере- ния. Предложенный метод минимизации а (У) связан с доволь- но кропотливыми расчетами. Однако вместо аналитического способа решения (28.5) можно предложить геометрический прием отыскания наивыгоднейшего положения точек на- блюдения. Предположим, что ft^x^xi<.. .<хп^1, подразумевая, что интересующая нас область экстраполяции расположена вблизи нуля. Снимем модули и одновременно подберем зна- ки слагаемых в (28.5) таким образом, чтобы при x^xj функ- ция о(У) не изменилась. Например, при и=3 мы получаем функцию w = -ту- (а<Х1)~ — (*-*>)! h + [(Х-ХХ)(Х- Х2^_ h1 , (28 6) (•*2 — Х1) (х2 — х3) (х3 — хх) (х3 — х2)] J 106
1 которая совпадает с о (У) при х<;хь Функция о* является параболой (в общем случае (п—1)-й степени), проходящей через точки (хЛ; hjV^T), (х2; —h2f]fT), .... В области х~0 величина о*(0) будет определять ту ошибку, которую необходимо сделать минимальной. Построим теперь графики функций ±Л(^)/ИТ , с которы- , ми функция о* (%) имеет общие точки, указанные выше. При j различном выборе точек наблюдения величина о(0) окажет- I ся минимальной, если х2,... расположить так^ чтобы пара- бола о*(х) лишь касалась кривых ±h(x)/YT в этих точ- ках, т. е. о* (0) ->min, если -^-1 =±-^Ш. (28.7) дх I*, /Т 1 Действительно, соотношения (28.7), как показывают вы- кладки, эквивалентны обычному условию минимума для (28.5). На рис. 16 расположение точек хР, хР, ... не отвечает условию минимума о (У); последний достигается для точек хР, .... На рис. 17 приводятся примеры нахождения наи- Рис. 16. Примеры расположе- ния точек измерения (неудач- ного — хр, хр, ... и удач- ного — хр, х<2>) Рис. 17. Примеры нахождения выгоднейшего расположения то- чек измерения для экстраполяции постоянной и линейной регрессии в область х~0 выгоднейшего расположения точек для постоянной, линейной и параболической регрессии для случая, когда функция труд- ности измерений обращается в бесконечность в двух точках х=0 и х=1. Если экстраполяция производится в точку х', где xi<x'<Xf+h то поиск оптимального расположения точек на блюдений происходит по той же схеме: парабола ((п—1)-й степени) вписывается в коридор ±h(x)j]fT таким образом, 107
чтобы ближайшие к х! точки касания_лежали на -f- ft(x)/l/T , а затем поочередно на Тй(х)//Т. Поскольку функция h (х) известна лишь приближенно, значения xj, х2,... перво- начально можно определить, вписывая параболы, например, просто от руки. Затем, накопив дополнительную информа- цию, положение точек наблюдения можно уточнить. Рассмотренную схему поиска оптимальных условий на- блюдения при экстраполяции в точку можно применить и для решения других подобных задач, например для получения наименьшей погрешности при уравновешивании кривой ре- грессии во всей области изменения переменной х (разновид- ность так называемого минимаксного плана, т. е. плана ми- нимизации наибольшей дисперсии). § 29. Эксперименты по выяснению механизма явлений Эксперименты по выяснению механизма явлений — это по сути дела различные модельные испытания. Использова- ние моделей является естественным шагом в процессе изу- чения объективных закономерностей. Та или иная схема приближения применяется, например, при попытке выделить основные связи среди всего многообразия взаимодействий. Нередко модель предлагается также для преодоления вычис- лительных трудностей, возникающих, если какое-нибудь из- вестное соотношение имеет слишком сложный вид. Построение модели начинается с выяснения факторов хь х2,..., X*, определяющих особенности изучаемого явления. Совокупность этих факторов х= {хь х2,.., х*} образует про- странство размерностью k, называемое факторным простран- ством или пространством контролируемых переменных. Соот- ветствующие значения контролируемых переменных, которые могут быть реализованы, определяют объем факторного про- странства, исследуемого в эксперименте. Задачей исследования является установление связей меж- ду контролируемыми переменными. Поскольку результаты наблюдений представляют собой случайные величины, то имеет смысл говорить о связи средних значений испытывае- мых величин с контролируемыми переменными. В общем слу- чае такую связь (модель) можно описать с помощью некото- рой функции т) = т] (х, а), (29.1) подразумевая, что последняя зависит также от совокупности неизвестных параметров а= {ао,..., ат}. 108
В зависимости от степени информативности относительно?:, вида этой функции ti=r)(x, а), описывающей так называемую» поверхность отклика, эксперименты становятся либо для определения или уточнения значений параметров а?» либо, если имеются различные предположения относительна вида т](х, а), для выбора наилучшего описания. Располагая минимальными сведениями относительно» т](х, о) можно допустить, что функция т)(х, а) аппроксими- руется конечным рядом по некоторой системе функций» ^{“^{(^1, • ••» ^ft) . Поэтому, не уменьшая общности, можно записать, что» Т1 = ао "Ь а1 + • • • + ат — (а X)r (29.2) где а = {а0, аь ... , ат); X = {1, Х1г ... , Хт}. Здесь задан- ные функции Х{ могут рассматриваться как новые контроли- руемые переменные, интервал изменения которых будет ха- рактеризовать объем реального факторного пространства в данном эксперименте. При X{-+Xi модель (29.2) вырождается в линейную. В слу- чае, если исследуется влияние лишь одного фактора, т. е.. х-+х, то (29.2) дает кривую регрессии. Очевидно, оценки параметров <х< и их достоверность» будут определяться характером измерений. В общем случае оценки а, могут оказаться коррелированными, и дисперсии оценок D (сца4) будут составлять матрицу недиагональнога вида D = D (Oa.aJ = II Ois I|. Характер планирования исследований во многом опреде- ляется конечной целью эксперимента. Если необходимо выяс- нить значения параметров а,, то планы измерений строят- таким образом, чтобы минимизировать либо величину опреде- лителя матрицы ошибок (планы с |D|->min называются D-оптимальными*), либо величину средней дисперсии оце- нок ( —-— V о» = —J— Sp D -> min; Л-оптимальные~планыY \ т 1 tn 1 / ' i либо максимальную среди оценок дисперсии величину ( max о» -►min; минимаксные планы в пространстве пара- метров) . При построении всей поверхности отклика используется другой критерий, минимизирующий наибольшую дисперсию в» * D-планы имеют простой геометрический смысл: объем эллипсовд^ рассеяния всех оценок ai(p(ao,am)=const) определяется значением |D| и для D-планов стремится к минимуму. юа
оценке функций т] (х, а) (тах£>(т)(х, a))-»min; минимаксные планы, пример которых был рассмотрен в предыдущем раз- деле). Статистические критерии часто дополняются требова- ниями минимальных затрат (время, материальные расходы и т. д.). Обсудим некоторые особенности планирования экспери- ментов для оценки параметров а,. Представление модели в форме (29.2) указывает, что минимальное число измерений, необходимое для оценки <ц, составляет Wmin=/n+l. Это чис- ло близко к оптимальному, поскольку при минимальном чис- ле опытов каждое из измерений можно произвести с наи- большей точностью (при неизменном общем лимите времени, см. § 28; мы отвлекаемся здесь от всякого рода неконтроли- руемых систематических ошибок, см. § 34). Обратим внимание теперь на то, что в однофакторной ли- нейной модели T|=Kxo+aiX параметры ее при прочих равных условиях определяются с наибольшей достоверностью, если расстояние между точками наблюдения максимально (рис. 16). Общую модель (29.2) можно рассматривать как набор однофакторных. Поэтому условие наблюдений целесо- образно подбирать так, чтобы пределы возможных измене- ний каждой из переменных ЛДх) были бы наибольшими. Очевидно, для оценок а< необходимо иметь два значения (или два уровня) каждой из Х{. Следовательно, при варьи- ровании переменных нужно стремиться к наибольшему рас- стоянию между уровнями Тем не менее простейшая схема эксперимента, в которой наблюдения проводятся методом традиционного однофактор- ного испытания (один опыт ставится так, что все переменные находятся на нижнем уровне, а затем следует т опытов с поочередным переводом Xt на верхний уровень), не позво- ляет выявить все имеющиеся возможности. Испытания явля- ются многофакторными, поэтому можно так варьировать пе- ременные Xi, чтобы охватывать в среднем больший интервал изменения функции т). Другими словами, более рациональной является схема, в которой полнее используются свойства многомерного факторного пространства. В факторном про- странстве исследуемый в эксперименте объем представляет собой многомерный прямоугольный параллелепипед с верши- нами, расположенными на уровнях варьирования Хг-. Схема последовательного однофакторного испытания перемещает точки Х{ от вершины к вершине по кратчайшему расстоянию (вдоль ребра). Однако выгоднее другая схема, при которой точки смещаются на наибольшее в среднем расстояние (по диагоналям граней параллелепипеда). Эти общие рекомендации, высказанные на интуитивном уровне, имеют простое аналитическое истолкование. Учиты- 110
вая случайный характер наблюдаемых значений величины т), для оценки параметров а/ можно непосредственно использо- вать результаты гл. IV. Повторяя рассуждения § 21, запи- сываем az = Сй1 Yh (29.3) /=1 где СЦ1 — элементы матрицы, обратной матрице ||С«||; эле- менты последней определяются соотношением XdDXdi). (29.4) Здесь О/ — дисперсии у, — наблюдаемые в опыте зна- чения 1); j— номер опыта (всего N опытов); X«(j) — зна- чения каждой из переменной в /-опыте (O^i, Хо=1). Величина N К; = У-^-ууХ;(/). (29.5) /=1 Как и в случае однофакторной регрессии, можно показать, что оценки а, обладают наименьшей дисперсией (наиболь- шей достоверностью), если матрица ||С«|| является диаго- нальной, т. е. варьирование переменных X,- производится по ортогональной схеме 4-^(/)=о. (29.6) Тогда оценки az и их дисперсии аа. оказываются равными аг - 2 Х( (j)/Cie, <&. = 1 /С„. (29.7) i=i °i Следовательно, интервалы варьирования X,- и последователь- ное чередование уровней при оптимальном планировании должны подбираться таким образом, чтобы выполнялось со- отношение (29.6), а oL-»>min. Если дисперсии а/ в раз- ‘ 2 личных опытах примерно одинаковы, то условие оа/->ппп выполняется автоматически при максимальном расстоянии между уровнями X,-. При этом (а/ = оо) N < = Х1(/). (29.8) /=1 111
Для большей наглядности перейдем к нормированным пе- ременным и масштаб варьирования выберем так, чтобы наи- <юльшие и наименьшие значения Xi соответствовали ±1. Соотношения (29.6) — (29.8) принимают вид £Х/(/) = 0; (29.9) а<=У>Л(Ж; 4z==oM / тде N — число испытаний. В схеме последовательных однофакторных испытаний оценки параметров определяются соотношением (Xi (/) = ± 1) аг =(yl+i—yl)!2. Поэтому дисперсия оценок о» = сго/2. “z Таким образом, схема многофакторных ортогональных ис- пытаний позволяет в N/2 раз уменьшить дисперсию оценок. Пример. Допустим, что необходимо определить вес трех тел А, В, С. Обсудим возможные способы их измерений. Обычный способ — независимые определения веса тел. Если при взвешивании тел прибор показывает соответственно зна- чения yit у2, уз, а «нулевое» показание прибора — уо (всего четыре измерения), то веса тел равны У1—Уо, • • • > Дисперсии этих оценок равны 2g2, где о2 — дисперсия каждо- го из результатов Обратимся те- перь к многофакторной модели, пред- полагая, что допускается взвешива- ние сразу нескольких тел. Тогда в со- ответствии с соотношениями (29.9) можно построить последовательность испытаний (знаки ± означают, что тело либо взвешивается, либо нет) Таблица 8 Февуль- VSV А в а + — — ^8 — — + — + —— 3U + + + (табл. 8). При этом нулевое показа- ние прибора не фиксируется. ^Согласно измерениям вес тела А равен (yi—уз—Уз+у^!2, а дисперсия этой оценки о л = <т2 (и аналогично для других тел). В итоге при том же числе опытов более рациональная схема наблюдений позволяет в два раза уменьшить диспер- сию оценок. До сих пор в рассуждениях не было четко оговорено чис- ло испытаний N. Очевидно, минимальное число измерений равно числу параметров, т. е. Ут1п=/п+1, и выше отмеча- лось, что желательно, чтобы N-^-Nnaa- Однако всегда ли мож- 112
но подобрать оптимальные условия наблюдения (ортогональ- ность наблюдений) при одинаковых максимальных размахах AXi варьирования каждой из переменных Xi (последнее усло- вие необходимо для того, чтобы параметры а,- оценивались с одинаковой достоверностью)? Оказывается, что при N=Nmia=tn+1 и ЛХ=2 для всех Xi соотношения (29.9) выполняются, если число параметров т+1 кратно четырем. В других случаях не удается при минимальном числе испыта- ний добиться равномерности в оценках а,, которая наблю- дается, если их дисперсии равны между собой. Это нетрудно видеть, например, при нечетном числе параметров, когда ус- ловие Xz(/)=0 при выбранном масштабе уровней /=1 Xi(j)=±l не выполняется. Если число т+1 не кратно четырем, то для равномер- ности оценок <ц целесообразно расширить объем наблюдений (N>m + 1) до ближайшего числа, кратного четырем (N уве- личиваеся по отношению к Mnin=»*+1 не более чем на три). Безусловно, дисперсия Оо отдельных наблюдений при большем числе испытаний увеличивается. Как следует из самых общих соображений (§ 27), величина оо в среднем обратно пропорциональна времени измерений, т. е. Оо пропорциональна N/Т, если общее время Т фиксируется. По- этому при имеется относительный проигрыш в N/Nmtn раз в оценке Oq. Но, с другой стороны, — ol/N, а в однофакторной схеме испытаний о» —<Jo/2. В итоге, не- ai смотря на некоторое увеличение числа опытов ортогональные многофакторные измерения дают выигрыш в (т+1)/2 раз по сравнению с простейшей схемой. В качестве иллюстрации используем еще раз рассмотрен- ный пример, сократив число измеряемых объектов до двух (А и В). Обращаясь к табл. 8 (первые два столбца), видим, что проведение четырех взвешиваний (измерение yz означает теперь «нулевое взвешивание») определяет веса тел с диспер- сией a2(/v=4) вместо дисперсии 2<j2(W=3) при измерении весов лишь по первым трем результатам. Так как а’(4)~оо а °2(3) — во I то ортогональная схема сулит общий выигрыш в полтора раза в оценке дисперсии весов. Если не все параметры <х< требуется оценить с одинаковой достоверностью, то число испытаний можно сократить до yVmin- Максимально возможная достоверность оценок а* до- стирается путем подбора различных интервалов варьирования 113
переменных, оставляя предельный размах ЛХ=2 лишь для оценки наиболее важных параметров. Аналогично поступают, если дисперсии <5? отдельных измерений не одинаковы. Как и в случае, рассмотренном в § 28, здесь целесообразно избегать областей с повышенной трудностью измерений. Интервалы варьирования переменных Х{ выбирают, стремясь минимизировать величину = 1/Ск. Формулировка модели в форме (29.2) допускает сколь угодно сложную зависимость исследуемой величины т] от ис- ходных контролируемых переменных х. В случае линейных связей Xt — J- |x(S xt предельные интервалы варьирова- s ния AXi=max находятся без труда. Однако для нелинейных сложных связей Х{=Х{(х) решение этой задачи не очевидно и нередко противоречиво. Поэтому при обсуждении модели целесообразно обращаться к переменным, оттеняющим доми- нирующие связи в исследуемом механизме. В настоящее время разработаны эффективные методы поиска упомянутых экстремальных решений путем последо- вательных приближений, в общем связанные с довольно зна- чительным объемом вычислений. Возникающие здесь трудно- сти успешно преодолеваются с помощью современных ЭВМ. Оценки параметров <ц — один из необходимых моментов в выяснении механизма взаимодействия. Не меньшее значе- ние имеет другой аспект в исследовании, связанный с поис- ком интервала переменных, в котором функция т| (х, а) дости- гает экстремальных значений. Наглядным примером такой задачи может служить исследование условий, при которых какая-нибудь реакция (химическая, ядерная и т. д.) дает максимальный выход. Решение этой проблемы осложняется тем, что при широ- ком варьировании переменных не всегда просто установить надежную модель взаимодействия. Как правило, здесь уже нельзя ограничиться линейной моделью и необходимо прибе- гать к более сложным представлениям, нередко видоизменяе- мым в процессе исследования. В таких случаях для отыскания экстремальной поверх- ности отклика целесообразно использовать шаговый метод. При этом необходимо прибегать к приближениям различной степени сложности с тем, чтобы сосредоточить основное вни- мание на наиболее важных участках исследования. Однако, как и при оценке параметров модели, наиболее рациональная схема опытов реализуется не при последовательном варьиро- вании переменных, а при многофакторных испытаниях. С этой целью на каждом из этапов исследования строится 114
поверхность отклика, и дальнейшее варьирование совокупно- сти переменных задается в направлении наибольшего гра- диента к поверхности. Такой способ соответствует самому быстрому пути подъема по поверхности отклика (так назы- ваемый метод крутого восхождения). В сочетании с рассмот- ным выше методом многофакторного эксперимента для ло- кального описания поверхности отклика этот способ позво- ляет отыскать экстремальную поверхность наиболее эконом- ным образом. § 30. Последовательное планирование Метод построения экстремальной поверхности отклика может служить одним из примеров последовательного плани- рования. В общем случае, сбор предварительной информации, поиск оптимального плана проведения эксперимента, корректирова- ние действий, связанное с уточнением статистических данных или с изменением условий опыта, — все это можно рассмат- ривать как отдельные этапы последовательного планирова- ния, идеальным воплощением которого является непрерывное последовательное планирование. Собственно, только непре- рывное планирование, при котором в каждый момент выби- рается наилучший план действий, и позволяет составить оптимальный план проведения всего эксперимента в целом. В конечном счете, такое планирование сводится к посто- янному сосредоточению центра внимания на тех точках изме- рения, которые дают наибольшую скорость накопления ин- формации об исследуемом явлении. Последнее особенно важно в экспериментах с обилием альтернативных решений, когда сначала необходимо «про- смотреть» несколько рабочих гипотез и выбрать наиболее достоверные версии. В подобных случаях, прежде чем перей- ти к дальнейшим исследованиям, например уточнению ряда параметров, необходимо поставить серию предварительных экспериментов, которые позволили бы дискриминировать модели. При планировании таких экспериментов стремятся отыскать точки, в которых сравниваемые модели были бы поставлены в критические условия. Последовательное планирование позволяет значительно сократить общий объем усилий и затрат и резко повысить эффективность исследований. В качестве иллюстрации по- следних слов рассмотрим пример с проверкой гипотез о гене- ральном среднем. Допустим, что нужно сделать выбор между гипотезами q=T]o и т) =тц, где Классические критерии статистиче- ского сравнения предполагают, что число испытаний не за- висит от наблюдаемых результатов. В этом случае, используя 115
эти критерии, можно указать число испытаний, при котором критерии становятся достаточно чувствительными для разли- чения гипотез. Однако число наблюдений можно сократить, если в процессе испытаний непрерывно сравнивать резуль- таты наблюдений. Испытания продолжаются до тех пор, пока наблюдения не попадут в одну из областей принятия гипотез (либо т|=т|о, либо г)=т]1). Очевидно, такой последовательный анализ, на каждом шагу учитывающий уже накопленную информацию, может оказаться значительно эффективнее по сравнению с класси- ческими методами, фиксирующими число наблюдений заранее. Действительно, при последовательном анализе в среднем про- исходит двойное сокращение числа испытаний. Для пояснения принципов, положенных в основу этого анализа, рассмотрим критерий отношения вероятностей, предложенный Вальдом. В этом критерии находятся отноше- ния вероятностей pi(n) и ро(п), равные вероятностям наблю- дать значения У\.....уп при г)=т]1 и т]=т|о соответственно (п=1, 2,...). Так как испытания независимы, то п Pi,o(n) =- FI P(Pi> n = П1.о). (30.1) i=i Пока отношения pi(n)/p0(ri), вычисляемые для каждого п, за- метным образом не отличаются от единицы, т. е. пока В<-^-<Д, (30.2) Ро(«) следует продолжать испытания. Но как только неравенство (30.2) нарушается, наблюдения заканчиваются и отдается предпочтение гипотезе т)=т)о или т)=1]ь Числа А и В выбираются так, чтобы вероятность отверг- нуть гипотезу т)=т1о (если она верна) не превосходила е, и вероятность отвергнуть гипотезу л=т11 (если она верна) не превосходит р, т. е. функция мощности л(г)о)=е и л(т]1) = 1—р. Это осуществляется, когда А = - В = —. (30.3) е 1 —е Если наблюдаемая случайная величина имеет нормальное распределение с известной дисперсией о2, то соотношение (30.2) нетрудно преобразовать к виду п 111 — По 1 — 8 2 “ < —£— In m +-Т|°- п. (30 А) 1)1 — По 8 2 116
Испытания продолжаются до тех пор, пока накопленная сумма не выйдет за одну из границ, указанных в (30.4) (см. рис. 18). Рис. 18. Критические области для раз- личения гипотез 'П=т1о и методом последовательных испытаний Задача Рассмотреть, используя критерий последовательного ана- лиза, вопрос об оценке интенсивности пуассоновского потока. Обсудить возможные экспериментальные схемы таких наб- людений.
ДОПОЛНЕНИЕ §31. Измерение интенсивности событий Рассмотрим эксперимент, в котором с помощью опреде- ленной схемы регистрируется поток событий. Среди событий вместе с «истинными» встречаются также «ложные», вызван- ные различными помехами. Последние составляют некий фон, на уровне которого и происходит отсчет истинных событий. Если уровень помех остается постоянным и не зависит от интенсивности суммарного потока событий, то фон можно выделить с помощью дополнительных измерений. Пусть име- ются следующие данные. В течение времени t\ наблюдаются события, вызванные совместным действием источника иссле- дуемых событий и фона; всего зарегистрировано Afi событий. Кроме того известно, что при наблюдении фона в течение t2 отмечено N2 событий. Оценим интенсивность источника. Оценками измеренных интенсивностей являются ^ = 4-’ ^=-r- <311> Г1 *2 Поэтому оценкой интенсивности источника v оказывается ве- личина v = v~— v<j>. (31.2) При JVi, N2^> 1 величина (v—v<p) распределена нормально с дисперсией 02=^1.+ 4-. (31.3) Г1 *2 Следовательно, определяем интенсивность источника как ’ = 2Г“ "Г ±/^+Т <31-4) где «1-8/2 — квантиль нормированного нормального распре- деления. Например, «0,975=1,96. 118
Если в эксперименте возможно предварительное прогно- зирование, то времена наблюдений t\ и t2 целесообразно вы- бирать так, чтобы ~ : V*®- (31.5) Тогда полуширина доверительного интервала (T’=fi+/2) . lAi + /v® /Q1 сч Д1—е/2 ---------------«1—е/2- (31.6) Если Ni^> 1, a TV2 — невелико, но Vi^>v<p, полученные со- отношения остаются в силе, поскольку относительно большая неточность в определении малого компонента слабо влияет на погрешность оценки конечного результата. Таким образом, в случае «богатой статистики» всегда можно недобрать такие условия наблюдения, при соблюдении которых интенсивность источника определяется с большой точностью. Значительно меньшей надежностью обладают оценки ин- тенсивности в обратном случае, когда наблюдаемые числа событий Afi и N2 невелики. Это в общем следует уже из (31.4), хотя нужно иметь в виду, что оценка (31.4) доверительного интервала при бедной статистике оказывается заниженной (см. § 11 и 17). Часто для понижения уровня фона применяют различные специальные схемы регистрации (например, схемы совпаде- ний). Предположим, что с помощью специальной схемы уда- лось понизить уровень фона в l/q раз. Но при этом эффек- тивность регистрации истинных событий также уменьшалась в 1/х раз (конечно, l>x>q). Выгодно ли применение такой схемы? Если интенсивность источника и фона равны v и уф соот- ветственно, то относительные ошибки при «прямых» измере- ниях и с помощью указанной схемы равны § 1 УГу + уф + 1/7^ 1 Vt v . ]/ху + <?уф + о2 — (31.7) xvVT Сравнивая оценки, можно заключить, что применение ука- занной схемы измерения целесообразно, если Уд Vi+xh/g+l * УТ+й+1 где h — v/Уф. Так, при х=1/3 и #=1/20 последнее неравен- ство наблюдается, если h^0,8. 119
С помощью соотношения (31.7) можно оценить эффектив- ность методики измерений также в том случае, если уровень помех зависит от интенсивности потока событий. § 32. Линейный регрессионный анализ Пусть в результате п серий измерений в точках хь..., хп получен эмпирический материал, на основании которого сле- дует провести линейный регрессионный анализ. Линейная регрессия имеет вид П (х) = aoLo + ajLj (х). (32.1) Допустим, что по каждой серии наблюдений имеются оценки эмпирических средних yi.....уп и их дисперсий о^£. Постро- им ортогональные базисные полиномы £0 и L\. Полагаем £0 = 1; £1 = х —х. (32.2) Используя условие ортогональности (21.8), записываем £ «'ЛА (*/) = £ «’г (.xi — х) = 0. (32.3) i=l ' Отсюда п I X = 2 "Ж = ~т~ / S-Г" : = 1 • <32,4) i-1 % / j I Следовательно, эмпирическая линия регрессии имеет вид Я (х) = а0 «1 (х — х), (32.5) где согласно (2.10) а0 = Уад-; О1 = —--------------=------(32.6) i Доверительные интервалы для оценок коэффициентов дис- персии описываются соотношениями (с доверительной веро- ятностью 1—е) «о = “о ± е/2» ai = ax ± SZi_8/2/(*< - rf, (32.7) где S2 — одна из оценок объединенной дисперсии (20.8); число степеней свободы последней определяет значение 120
6-8/2-квантили. Выбирая оценку (22.10), имеем при f=n—2 S= —«о ——x))7(n—2). (32.8) i Доверительный интервал для оценки всей линии регрессии в произвольной точке х определяется соотношением Л(х)=п(х)± $6-8/2-./ 1 +-----(Х- Х) _—. (32.9) |/ £wZ(Xi— х)2 Корреляционное отношение можно записать в виде |2w(xi — x){yt — у) | 0 = ----—J . (32.10) 1 / 2 Wi Iхi ~ х>2 2 wi (Mi ~ У? V 1 f y=at Если положение точек Xt определяется с ощутимой погреш- ностью, то оценки параметров линии регрессии выражаются теми же соотношениями с единственной поправкой <3у. + Л* (Jxi — + СИ (0) Охр где e£z — дисперсия xf, a ai(0) — оценка коэффициента ре- грессии при 0xz = 0. В заключение сделаем несколько замечаний относительно оптимального выбора условий наблюдений. Не всегда в ходе эксперимента можно свободно маневрировать между отдель- ными операциями измерения. В частности, если нет уверен- ности в том, что теоретическая регрессия является линейной, то сомнения такого рода можно устранить лишь после прове- дения дополнительного анализа при полном числе точек п>2. В противном случае разумно было бы ограничиться всего двумя точками (при п=2 следует использовать оценку (22.7)). Положение точек и распределение времени между измерениями в каждой из них будет определяться конкрет- ными задачами эксперимента. Так, если интерес представ- ляет проведение самой линии регрессии, то планы измерений составляются в соответствии с рекомендациями гл. V. Анало гич«о поступают и в других случаях. Выясним, например, оптимальные условия измерения коэффициента <хь При п = 2 стандартное отклонение оценки щ равно aa, УаУг Х Х2 —Xi (32.11) ^2 + hi уУТ (х2 — хх) 121
если времена измерений выбираются как : t2—h\: Л2, где Л1,2=Л(Х1,2) — значения функций трудности измерений = Т = /х + ^2. Следовательно, точки наблюде- ний расставляются таким образом, чтобы величина (Л14-Л2)/(х2—X!) была минимальной. § 33. Бейесовские оценки При оценке различных гипотез в эксперименте использует- ся некоторый набор исходных данных и предпосылок, кото- рый позволяет сделать предварительные суждения о харак- тере распределения исследуемых явлений, или оценить апри- орную вероятность обнаружения тех или иных значений рассматриваемых величин. Если теперь исследователь распола- гает дополнительными экспериментальными данными, то, используя эти факты, можно уточнить эти суждения о вели- чине искомой вероятности, т. е. составить мнение об апосте- риорной вероятности обнаружения событий. Фактически различного рода статистические оценки, рас-- смотренные выше, проводились по этой схеме. Так, знание a priori характера распределения позволяет по эмпирической выборке оценить a posteriori параметры этого распределения. Ряд полезных оценок апостериорной вероятности можно сделать с помощью формулы Бейеса. Пусть событие А может наблюдаться лишь при условии, что произошло какое-нибудь событие В{ из числа несовмест- ных событий Вь В2,..., Вп, вероятности которых известны. Если известны условные вероятности p(A/Bi), то вероятность события А выражается следующей формулой полной вероят- ности P(A) = VP(B,).P(A/B<). (33.1) События Bi в рассматриваемом случае называют гипотезами относительно А, или каналами наблюдения (обнаружения) А. С другой стороны, если событие А наблюдается, то возни- кает вопрос о том, насколько вероятно протекание процессов по тому или иному каналу, т. е. какова величина Р(В{/А). Последняя определяется соотношением (Бейес) Р (В{/А) = ^(В»)-РМ/В<) ' (зз.2) 2 Р(В,)Р(Л/Ву) /=1 доказательство которого непосредственно следует из опреде- ления условий вероятности и соотношения (33.1). 122
Рассмотрим с точки зрения полученных соотношений проблему поиска полезного сигнала на уровне помех (фона). Обозначим как событие Bi сигнал, в котором присутствует искомое явление, и как В2 — сигнал, вызванный только по- мехами. Предположим, что известна вероятность р появления сигнала первого типа, т. е. В\, условная вероятность г ошиб- ки регистрирующей системы при появлении В\ и условная ве- роятность 0 ошибки системы при появлении В2. Пусть систе- ма просигнализировала об обнаружении события В\. Какова вероятность того, что это действительно так? В данном случае событие А — сигнал системы об обна- ружении Bi. Тогда Р(Вх) = р; Р(В2) = 1—р; Р(Л/ВХ)= 1 — е; Р(Д/В#) = ₽. Применяя формулу Бейеса, находим, что (апостериорная) вероятность действительного присутствия полезного сигнала (после положительной сигнализации) равна р (В1/Л) = —тНтгйг—- (33-3) р(1—в) + (1— р)р а (апостериорная) вероятность отсутствия сигнала, несмотря на положительную сигнализацию системы, равна р<в2/а)=—и (33-4) р(1 —е) + (1 —Р)₽ Очевидно, Р(В1/Д)>р; P(Bi/A)-*A при 0-Ю. Поэтому соотношения (33.3) и (33.4) могут быть использованы, на- пример, для различных аппаратурных оценок. § 34. Рандомизация Выше неоднократно отмечалось, что в эксперименте часто приходится иметь дело с различными внешними воздействия- ми, которые систематически вносятся в процесс наблюдения и приводят к так называемым систематическим ошибкам (мы не рассматриваем здесь различные систематические из- менения в характере исследуемого явления, которые должны быть предметом особого анализа (гл. IV), поскольку такие изменения являются объективной особенностью исследуемого процесса). Среди систематических ошибок нередко встреча- ются систематически действующие факторы, которые трудно поддаются анализу и контролю. Традиционный способ распределения на систематические и случайные ошибки оказывается здесь мало эффективным. Поэтому используют другой подход, следуя особой программе наблюдений, которая составляется таким образом, чтобы слу- чайным образом «перетасовать» отдельные этапы исследова- 128
ний и рандомизировать*, т. е. сделать случайными, подобные трудно контролируемые систематические воздействия. Резуль- таты такого рандомизированного эксперимента можно обра- батывать с помощью статистических методов, рассмотренных ранее. План рандомизации составляется с учетом конкретных особенностей эксперимента, в зависимости от которых он может иметь ту или иную степень сложности. Рассмотрим в качестве примера процесс испытания каких- либо приборов, причем имеется несколько партий этих при- боров. Цель испытаний — установить надежность работы приборов. Очевидно, сам процесс испытания приборов на экспери- ментальном стенде подвержен влиянию различных внешних факторов, которые могут не оставаться постоянными в про- цессе наблюдений. В свою очередь приборы из различных партий также могут несколько отличаться по своим качест- вам. Например, приборы из первой партии в среднем более устойчиво работают при несколько повышенной температуре, а из другой — при пониженной. Если испытания произво- дятся сначала с приборами из первой партии, а затем из дру- гой, то не исключено, что переход от одной партии к другой совпадет с температурными колебаниями на стенде (которые происходят довольно медленно). В итоге измерения покажут завышенную (или заниженную) надежность приборов. Для того чтобы устранить такие плохо контролированные явления, наблюдения целесообразно рандомизировать во вре- мени и в пространстве. В данном случае это нетрудно сде- лать, например, определяя с помощью таблицы случайных чисел номер партии, из которой следует брать прибор для очередного испытания. Такая процедура позволит считать случайными все неизвестные явления, даже если в действи- тельности они подчиняются каким-то неясным нам детерми- нированным закономерностям. При дальнейшей статистиче- ской орбаботке материалов измерений все эти неизвестные для нас явления учитываются дисперсией, которая будет служить мерой разброса в стабильности работы приборов. Обратимся теперь к более сложному случаю, полагая, на- пример, что испытания приборов из различных партий проис- ходят на нескольких стендах. Здесь появляется дополнитель- ное ограничение на рандомизацию — необходимость сбалан- сирования индивидуальных особенностей стендов. Для решения подобной задачи может быть рекомендована схема с рандомизированными блоками, когда объекты иссле- дования подразделяются на отдельные группы. В каждой из групп объекты располагаются различными (неповторяющи- * От английского random — случайный. 124
мися) способами, а последовательность испытаний групп вы- бирается случайным образом. Пусть, например, испытываются приборы из п партий на п стендах. Для рандомизации исследований можно построить план на основании так называемых латинских квадратов объема («Х«). Так, при п=5 наблюдения проводятся бло- ками из пяти серий, а приборы из пяти партий А, В, С, D, Е можно расположить (в латинском квадрате каждый вари- ант испытаний появляется один и только один раз в каждом столбце) как указано в табл. 9. Таблица 9 Серия испытания Стенд 1 2 3 4 .5 1 С Е А D В 2 в D Е С А 3 А С D В Е 4 Е В С А D 5 D А В Е С Правильный план рандомизации здесь состоит в том, что для каждого этапа в эксперименте латинский квадрат выбирается случайно из всех возможных квадратов данного объема. Более простой план (хотя и не всегда корректный) сводится к записи одного квадрата и случайной перестановке строк и столбцов для очередного этапа. Число объектов и типов испытаний могут не совпадать (например, число испытываемых объектов — четыре, а за один цикл могут быть исследованы лишь три объекта). В та- ком случае обращаются к неполноблочным сбалансирован- ным планам (из квадрата вычеркивается один или более символов). В реальных ситуациях встречаются также другие ограничения. Возникающие дополнительные трудности устра- няются с помощью более сложных планов рандомизации, в частности путем усложнения схемы с рандомизированными блоками (квадраты Юдена, греко-латинские квадраты, ла- тинские кубы и т. д.; подробнее см., например, Ч. Р. Хикс. Основные принципы планирования эксперимента. М., «Мир», 1967).
S Приложение Таблица о2-квантилей Верхние числа —og 90(f1F /2), средние —1^ 95 (flt Д,), нижние —1^975 (Д, /2) 1 2 3 4 5 6 7 8 9 10 15 20 30 50 100 00 39,9 8,53 5,54 4,54 4,06 3,78 3,59 3,46 3,36 3,28 3,07 2,97 2,88 2,81 2,76 2,71 1 161 18,5 10,1 7,71 6,61 5,99 5,59 5,32 5,12 4,96 4,54 4,35 4,17 4,03 3,94 3,84 648 38,5 17,4 12,2 10,0 8,81 8,07 7,57 7,21 6,94 6,20 5,87 5,57 5,34 5,18 5,02 49,5 9,0 5,46 4,32 3,78 3,46 3,26 3,11 3,01 2,92 2,70 2,59 2,49 2,41 2,36 2,30 2 200 19,0 9,55 6,94 5,79 5,14 4,74 4,46 4,26 4,10 3,68 3,49 3,32 3,18 3,09 2,99 800 39,0 16,0 10,6 8,43 7,26 6,54 6,06 5,71 5,46 4,76 4,46 4,18 3,98 3,83 3,69 53,6 9,16 5,39 4,19 3,62 3,29 3,07 2,92 2,81 2,73 2,49 2,38 2,28 2,20 2,14 2,08 3 216 19,2 9,28 6,59 5,41 4,76 4,35 4,07 3,86 3,71 3,29 3,10 2,92 2,79 2,70 2,60 864 39,2 15,4 9,98 7,76 6,60 5,89 5,42 5,08 4,83 4,15 3,86 3,59 3,39 3,25 3,12 55,8 9,24 5,34 4,11 3,52 3,18 2,96 2,81 2,69 2,61 2,36 2,25 2,14 2,06 2,00 1,94 4 225 19,2 9,12 6,39 5,19 4,53 4,12 3,84 3,63 3,48 3,06 2,87 2,69 2,56 2,46 2,37 900 39,2 15,1 9,60 7,39 6,23 5,52 5,05 4,72 4,47 3,80 3,51 3,25 3,06 2,92 2,79 57,2 9,29 5,31 4,05 3,45 3,11 2,88 2,73 2,61 2,52 2,27 2,16 2,05 1,97 1,91 1,85 5 230 19,3 9,01 6,26 5,05 4,39 3,97 3,69 3,48 3,33 2,90 2,71 2,53 2,40 2,30 2,21 922 39,3 14,9 9,36 7,15 5,99 5,29 4,82 4,48 4,24 3,58 3,29 3,03 2,83 2,70 2,57 58,2 9,33 5,28 4,01 3,40 3,05 2,83 2,67 2,55 2,46 2,21 2,09 1,98 1,90 1,83 1,77 6 234 19,3 8,94 6,16 4,95 4,28 3,87 3,58 3,37 3,22 2,79 2,60 2,42 2,29 2,19 2,09 937 39,3 14,7 9,20 6,98 5,82 5,12 4,65 4,32 4,07 3,41 3,13 2,87 2,67 2,54 2,41 58,9 9,35 5,27 3,98 3,37 3,01 2,78 2,62 2,51 2,41 2,16 2,04 1,93 1,84 1,78 1,72 7 237 19,4 8,88 6,09 4,88 4,21 3,79 3,50 3,29 3,14 2,70 2,52 2,34 2,20 2,10 2,01 948 39,4 14,6 9,07 6,85 5,70 4,99 4,53 4,20 3,95 3,29 3,01 2,75 2,55 2,42 2,29
I к \ 1 2 3 4 5 59,4 9,37 5,25 3,95 3,34 8 239 19,4 8,84 6,04 4,82 957 39,4 14,5 8,98 6,76 60,2 9,39 5,23 3,92 3,30 10 242 19,4 8,78 5,96 4,74 969 39,4 14,4 8,84 6,62 61,2 9,42 5,20 3,87 3,24 15 246 19,4 8,70 5,86 4,62 985 39,4 14,3 8,66 6,43 61,7 9,44 5,18 3,84 3,21 20 248 19,4 8,66 5,80 4,56 993 39,4 14,2 8,56 6,33 62,7 9,47 5,15 3,80 3,15 50 252 19,5 8,58 5,70 4,44 1008 39,5 14,0 8,38 6,14 63,3 9,49 5,13 3,76 3,10 oo 254 19,5 8,53 5,63 4,37 1018 39,5 13,9 8,26 6,02 VP P = J p(v*)dv»; 0 jp (°°> 1) = («pyj)"2- t>p (f, oo) = Xplf; Vp (oo, f)
Продолжение прил. 6 7 8 9 10 15 20 30 50 100 оо 2,98 2,75 2,59 2,47 2,38 2,12 2,00 1,88 1,80 1,73 1,67 4,15 3,73 3,44 3,23 3,07 2,64 2,45 2,27 2,13 2,03 1,94 5,60 4,90 4,43 4,10 3,85 3,20 2.91 2,65 2,46 2,32 2,19 2,94 2,70 2,54 2,42 2,32 2,06 1,94 1,82 1,73 1,66 1,60 4,06 3,63 3,34 3,13 2,97 2,55 2,35 2,16 2,02 1,92 1,83 5,46 4,76 4,30 3,96 3,72 3,06 2,77 2,51 2,32 2,18 2,05 2,87 2,63 2,46 2,34 2,24 1,97 1,84 1,72 1,63 1,56 1,49 3,94 3,51 3,22 3,00 2,84 2,41 2,20 2,01 1,88 1,77 1,67 5,27 4,57 4,10 3,77 3,52 2,86 2,57 2,31 2,11 1,97 1,83 2,84 2,59 2,42 2,30 2,20 1,92 1,79 1,67 1,57 1,49 1,42 3,87 3,44 3,15 2,93 2,77 2,33 2,12 1,93 1,78 1,68 1,57 5,17 4,47 4,00 3,67 3,42 2,76 2,46 2,20 1,99 1,85 1,71 2,77 2,52 2,35 2,22 2,12 1,83 1,69 1,55 1,44 1,35 1,26 3,75 3,32 3,03 2,80 2,64 2,18 1,96 1,76 1,60 1,48 1,35 4,98 4,28 3,81 3,47 3,22 2,55 2,25 1,97 1,75 1,59 1,43 2,72 2,47 2,29 2,16 2,06 1 ;76 1,61 1,46 1,33 1,21 1,00 3,67 3,23 2,93 2,71 2,54 2,07 1,84 1,62 1,44 1,28 1,00 4,85 4,14 3,67 3,33 3,08 2,40 2,09 1,79 1,55 1,35 1,00 Основные соотношения =//%?_₽; 4(’. 7)=ai+p/2)8;4(A 1)=аР/2)-2; «’)=(“i+p/2)2;
СПИСОК ЛИТЕРАТУРЫ 1. Верден В. Математическая статистика. М., ИЛ, 1960. 2. Хальд А. Математическая статистика с техническими приложениями. М., ИЛ, 1956. 3. Клепиков Н. П., Соколов С. Н. Анализ и планирование экспе- риментов методом максимума правдоподобия. М., «Наука», 1964. 4. Д у н и н-Б а р ко в с к и й И. В., Смирнов Н. В. Теория вероятно- стей и математическая статистика в технике. М., Гостехиздат, 1955. 5. Хелстром К. Статистическая теория обнаружения сигналов. М., ИЛ, 1963. 6. Налимов В. В., Чернова Н. А. Статистические методы планиро- вания экстремальных экспериментов. М., «Наука», 1965. 7. Налимов В. В. Теория эксперимента. М., «Наука», 1971. 8. Федоров В. В. Теория оптимального эксперимента. М., «Наука», 1971. 9. Большее Л. Н., Смирнов Н. В. Таблицы математической стати- стики. М., «Наука», 1965. 10. Янко Я. Математико-статистические таблицы. М., Госстатиздат, 1961. Владислав Константинович Гришин статистические методы АНАЛИЗА И ПЛАНИРОВАНИЯ ЭКСПЕРИМЕНТОВ Тематический план 1975 г. № 135 Редактор Ф. И. Горобец Обложка художника К. Г. Нагапетьяна Технический редактор В. И. Овчинникова Корректоры Л. С. Клочкова, Г. В. Зотова Сдано в набор 26/XI 1974 г. Подписано к печати 28/VII 1975 г. Л-21847 Формат бОХЭО'/и Бумага тип. № 2 Физ. печ. л. 8,0 Уч.-изд. л. 6,54 Изд. № 2423 Зак. 704 Тираж 12660 экз. Цена 23 коп. Издательство Московского университета. Москва, К-9, ул. Герцена, 5/7. Типография Изд-ва МГУ. Москва, Ленинские тары
23 к.