Текст
                    Г. И. ИВЧЕНКО, Ю. И. МЕДВЕДЕВ, А. В. ЧИСТЯКОВ
СБОРНИК
ЗАДАЧ
ПО
МАТЕМАТИЧЕСКОЙ
СТАТИСТИКЕ
Допущено
Государственным комитетом СССР
по народному образованию
в качестве учебного пособия
для студентов высших
технических учебных заведений
Москва «Высшая школа» 1989


ББК 22.172 И 25 УДК 519.2 Рецензенты: кафедра прикладной математики Москов- Московского инженерно-строительного института (зав. кафедрой проф. В. В. Кучеренко) и проф. Э. А. Надарая (Тбилисским государст- государственный университет) Ивченко Г. И. и др. И25 Сборник задач по математической статистике: Учеб. пособие для втузов/Г. И. Ивченко, Ю. И. Мед- Медведев, А. В. Чистяков — М.: Высш. шк., 1989. — 255 с: ил. ISBN 5-06-000049-4 Задачник дополняет учебное пособие «Математическая статис- статистика» A984). Он охватывает все основные разделы современной ста- статистической теории и предназначен для проведения практических заня- занятий и лабораторных работ по курсу математической статистики, пре- предусмотренному новой программой по высшей математике для втузов. Большинство задач снабжены решениями или методическими указа- указаниями, ко всем задачам даны ответы. 1602090000D3090000000) —524 И 89—89 ББК 22.172 001@1)-89 5,78 ISBN 5-06-000049-4 © Г. И. Ивченко, 10. И. Медведев, А. В. Чистяков, 1989
ОГЛАВЛЕНИЕ Предисловие ТЕОРЕТИЧЕСКОЕ ВВЕДЕНИЕ И ЗАДАЧИ. Глава 1 Основы статистического описания, выборочные характеристики и их распределения 6 Глава 2 Оценивание параметров распределений 37 § 1. Оценки и их общие свойства 46 § 2. Оптимальные оценки 57 § 3. Оценки максимального правдоподобия (о.м.п.) .... 67 § 4. Доверительное оценивание 74 Глава 3 Проверка статистических гипотез 80 § 1. Критерии согласия 89 § 2. Выбор из двух простых гипотез 99 § 3. Сложные гипотезы 102 § 4. Проверка гипотез и доверительное оценивание .... 104 § 5. Критерий отношения правдоподобия (к.о.п.) 106 § 6. Разные задачи 107 Глава 4 Линейная регрессия и метод наименьших квадратов 110 Глава 5 Решающие функции 121 Глава 6 Статистика стационарных .->„ последовательностей ОТВЕТЫ И РЕШЕНИЯ 137 Приложения 240 Указатель распределений 251 Литература 253
ПРЕДИСЛОВИЕ Настоящий сборник задач охватывает все традицион- традиционные разделы современной статистической теории. Его со- содержание соответствует курсу математической статисти- статистики, предусмотренному новой программой по высшей математике для инженерных специальностей высших технических учебных заведений. Часть задач повышенной сложности может быть использована в качестве заданий для учебно-исследовательских и курсовых работ. Задачи в основном носят аналитический характер: в них требуется показать справедливость того или иного утверждения или провести исследование. Они непосред- непосредственно дополняют или раскрывают принципиальные положения математической статистики. В сборник включены задачи, связанные с моделиро- моделированием случайных величин на ЭВМ и получением исход- исходного для статистической обработки материала. Фактиче- Фактически на основе любой «теоретической» задачи, в которой речь идет о статистическом алгоритме анализа данных, можно поставить, задавая конкретные значения парамет- параметров модели (причем возможно неограниченное число вариантов), соответствующую «практическую» задачу, формулируя в качестве предварительного этапа задание смоделировать исходные данные, используя или готовые таблицы случайных чисел, или получаемые с помощью специально составленных программ. В дальнейшем, при обработке этих «экспериментальных» данных с помощью соответствующего теоретического алгоритма, имеется возможность сравнить предсказание теории с известными исходными параметрами, при которых моделировалась выборка. По степени трудности задачи, помещенные в сборни- сборнике, не одинаковы. Для решения некоторых из них могут потребоваться значительные усилия, такие задачи отме- отмечены звездочкой. Большинство задач, решение которых не сводится к применению стандартных алгоритмов, снабжено подробными решениями, даны методические указания.
В начале каждой главы приведены основные понятия, теоретические положения и формулы из соответствующе- соответствующего раздела теории, которые непосредственно используют- используются при решении помещенных в данную главу задач. В конце книги имеются статистические таблицы, необ- необходимые для получения числовых результатов. Указатель распределений облегчит поиск задач, в которых рассмат- рассматриваются различные аспекты исследования одной и той же модели. При составлении задачника использованы отечествен- отечественные и зарубежные источники (учебники, задачники, жур- журнальные статьи и др.). Авторы будут признательны всем, кто поделится сво- своими соображениями по улучшению содержания книги. Замечания можно направлять по адресу. Москва, Ж-28, Б. Вузовский пер., 3/12, МИЭМ, кафедра теории вероят- вероятностей и математической статистики. Авторы
ТЕОРЕТИЧЕСКОЕ ВВЕДЕНИЕ И ЗАДАЧИ Глава 1 ОСНОВЫ СТАТИСТИЧЕСКОГО ОПИСАНИЯ, ВЫБОРОЧНЫЕ ХАРАКТЕРИСТИКИ И ИХ РАСПРЕДЕЛЕНИЯ 1. Статистические данные, являющиеся исходным «материалом» в задачах математической статистики, обычно являются результатом наблюдения некоторой ко- конечной совокупности случайных величин Х = (Х], ..., Хп), характеризующей исход изучаемого эксперимента. В та- таких случаях говорят, что эксперимент состоит в прове- проведении п испытаний, в которых результат /-го испытания описывается случайной величиной Xi, i=\, ..., п. Сово- Совокупность наблюдаемых случайных величин X = (X , Х„) называется выборкой, сами величины X,, i= 1, ..., п, — элементами выборки, а их число п — ее объемом. Множество X = {* = (*[, ..., хп)) всех возможных реали- реализаций выборки Х = (Х\, ..., Хп) называется выборочным пространством. Когда истинное распределение случайной величины X (функция распределения Fx{x\, ..., хП) = = Р (Xi ^лг1 Лл^х,,)) неизвестно (полностью или хотя бы частично) и указан лишь класс (семейство) допусти- допустимых распределений F = [F(X], ..., х„)}, которому принад- принадлежит распределение Fx выборки X, то говорят о статис- статистической модели (X, F) (или, короче, о модели F). Ма- Математическая статистика решает (в рамках заданной мо- модели F) задачи уточнения (выявления) различных свой- свойств истинного распределения Fx по результатам проводи- проводимых наблюдений (по выборке А"). Часто рассматриваются эксперименты, в которых про- проводятся повторные независимые наблюдения над некото- некоторой случайной величиной ? (ее распределение обозна- обозначается символом L(|)). В таких случаях выборка Х = = (^1, ..., Хп) представляет собой совокупность незави- независимых одинаково распределенных случайных величин, причем L(Xi)= L(?), '=1. ¦••. п; говорят также для краткости, что Х = (Xt, ..., Х„) есть выборка из распреде- распределения L(?). Статистическая модель для повторных неза- независимых наблюдений обозначается кратко в виде F =
= [Fi), т. е. указывается лишь класс допустимых функций распределения исходной случайной величины ?. Если F = {F(x; 0), 9g9), т.е. допустимые функции распределения задаются с точностью до значений неко- некоторого параметра 0, то такая модель называется пара- параметрической, а множество 0 возможных значений пара- параметра 0 — параметрическим множеством. В дальнейшем рассматриваются только модели абсо- абсолютно непрерывного или дискретного типа и для едино- единообразия используется обозначение h(x) = f(x) (для пара- параметрических моделей f(x; 0)) как для плотности распреде- распределения случайной величины ? в случае, когда распределе- распределение /-?, абсолютно непрерывно, так и для вероятности P(? = je) в дискретном случае. В случае параметрической модели распределение ве- вероятностей на выборочном пространстве X , отвечающее параметру 0, обозначается символом Ре. Аналогично, Ео Т(Х), DqT(X), ... — обозначения соответствующих мо- моментов заданной функции Т(Х) от выборки X в случае, когда Fx(x\ 0) — функция распределения выборки. 2. Во многих задачах математической статистики рас- рассматриваются последовательности случайных величин {т]л}, сходящиеся в том или ином смысле к некоторому пределу г) (случайной величине или константе), когда /г-»-оо. В дальнейшем используются два вида сходи- сходимости: сходимость по вероятности (г|„Д-г)О Р(|т]л — т)|> >е)->0 -Ye>0) и сходимость по распределению, или слабая сходимость ( Ь(т]„)-*- L(tj) или r\n-*-r\^-F^n(x) -*¦ -^¦FT](x)\/-x^C(F^), где C(F) — множество точек непре- непрерывности функции F(x). При этом из Р-сходимости сле- следует L-сходимость. Многие результаты о Р-сходимости различных выборочных характеристик являются следст- следствием следующего общего утверждения о сходимости функций от случайных величин [1, с. 20]: р если т)ш- -*¦ с, = const, i = 1, ..., г, и ф(х|, ..., х,) — про- произвольная непрерывная в некоторой окрестности точки (Ci, ..., Сг) функция, ТО Ф(Т]П1, ..., Т)„,)-^-ф(С|, .... С,). 3. Если X = (Xi, ..., Хп) — выборка из некоторого рас- распределения L (I). то Fi(x) = F(x) называют теоретической функцией распределения, а f(lW = j^L = i_2e(x_X0 (l.i)
— эмпирической функцией распределения (здесь \1п(х" — число элементов выборки, удовлетворяющих условию *,<*, а е(х) = If JPJ *<°' - ^ункция Хевисайда). По теореме Бернулли, Fn(x)^F{x)\/-x, когда л-»-оо, т. е. при больших п значение Fn(x) может служить оцен- оценкой для F(x). Более глубокое обоснование для оценива- оценивания теоретической функции распределения с помощью эмпирической функции распределения дают теоремы Гли- венко и Колмогорова об асимптотических свойствах Fn{x) при больших п [1, с. 15]. Если случайная величина ? дискретна и принимает значения аи аг, .... то более наглядное представление о законе распределения ? дадут частоты п,/п, где А, — число членов выборки, равных а,: в этом случае А,/лА-Р(? = а,.), r= 1, 2, ..., когда «-><». Для величин |, имеющих плотность Д(*) = f(x), можно рассмотреть частоты hk/n событий {|еД*}, где (Л*} — система непересекающихся интервалов, образующих раз- разбиение области возможных значений |. В этом случае при п-+<х> ?= S f(x)dx, л* и если А* малы, то по частотам hk/n можно построить два «графика», напоминающие график функции f(x) и называемые гистограммой и полигоном частот соответ- соответственно [1, с. 16], которые могут дать некоторое предва- предварительное представление о законе распределения |. Каждой теоретической характеристике g = \g(x)dF(x) соответствует ее статистический аналог G=G(X) = \ g(x)dFn{x) = ±- называемый эмпирической или выборочной характерис- характеристикой. В частности, статистическими аналогами для тео- теоретических моментов являются выборочные моменты. Выборочным моментом k-го порядка называют величину п и При k = 1 величину Ап\ называют выборочным средним и обозначают X: 8
у ' V У Выборочным центральным моментом fe-ro порядка назы- называют величину мпк = мпк(Х) = -±-2 № - x)k. При k = 2 величину А4„2 называют выборочной диспер- дисперсией и обозначают символом S2 = S2(X): используется также обозначение S'2 = —^Ц—S2. Анало- гично вводят выборочные абсолютные моменты, выбороч- выборочные семиинварианты и т. д. Другим примером выборочных характеристик являют- являются выборочные квантили. При этом р-квантиль для любой функции распределения F(x) определяется как с.р = = ini{x:F(x)^p}, 0<р<1, а выборочная р-квантиль Zn,P есть р-квантиль эмпирической функции распределе- распределения Fn(x). Если расположить элементы выборки X = = (Xi, ..., ХП) в порядке возрастания их величин, то полу- получится последовательность новых случайных величин называемая вариационным рядом выборки; при этом Х[к) — k-я порядковая статистика, k = 1, ...,«, a ^i) и Х(„) — экстремальные (соответственно минимальное и максимальное) значения выборки. Тогда Zn,p выражается через порядковые статистики: (М+|) ПРИ пР дробном, (Яр) при пр целом. В частности, Zn. 1/2 — выборочная медиана. Любая выборочная характеристика, имеющая вид не- непрерывной функции от конечного числа величин А„к (в частности, сами выборочные моменты, а также вы- выборочные центральные моменты М„*.), сходится по вероят- вероятности при п-*- оо к соответствующей теоретической характеристике и может служить оценкой последней, когда число наблюдений п достаточно велико. Аналогич-
но, Zn.p-^-Qp, если только распределение Щ) обладает гладкой плотностью. 4. В выборочной теории изучаются различные свой- свойства распределений выборочных характеристик как в точ- точной, так и асимптотической (т. е. при большом объеме выборки) постановках. При исследовании асимптотиче- асимптотического (при н->-оо) поведения соответствующих распре- распределений широко используются предельные теоремы тео- теории вероятностей и прежде всего две основные из них: закон больших чисел и центральная предельная теорема. Напомним их простейшие формулировки [2, с. 150—154]. Закон больших чисел. Если случайные величины г\], т\2, ... независимы, одинаково распределены и имеют математическое ожидание Ет], = а, то — Oli + - + Т1„) ->- а при п -*¦ оо. Центральная предельная теорема: если дополнительно к предыдущему существует Dt], = а2 > 0, то при п -+¦ оо Многомерный вариант центральной предельной тео- теоремы имеет следующий вид: пусть r-мерные случайные векторы т|л = (т1„1, ..., ппг), п=1, 2, .... независимы, одинаково распределены и имеют конечные моменты а; = Е-пи, Ьц = соу(тц,-, цч), i, j = 1, ..., г. Тогда , В= HMD. где Si/ = Oiw + ¦¦• + г]ш — nai)/-y/n, / = 1, ..., г. (Определение многомерного нормального распределения см. ниже в п. 6). Приведем некоторые утверждения о сходимости функ- функций от случайных величин, которые понадобятся в даль- дальнейшем при решении задач. Р PL 1°. Если Цп-*-ц и функция у непрерывна, то у{'Цп)->-ц>('ц)- 2°. Пусть [т\п, gn}, n = 1,2, ..., — последовательность пар случайных величин. Тогда а) Цп — sn-^0, б) ?(т|я)-»-1(л). 10
в) I (т]„)-> Цт\), gn-^C = const=> L{x\n + gn)-v Цц + + с), Цт\„$п)-*- L(cj\), L(r)n/Sn)-*- Цц/с) при с Ф 0; г) fin — Sn-^-0, L(c,n)->- L(g), функция ц> непрерывная =**фЫ —фЫ-^-о. 3°. Пусть Тп = 7"„(Я), Af = (А1,, ..., Х„), — оценка ска- скалярного параметра 6 в модели F = {F(x; 6), 0е9)и такая, что L0(V« (^п — в)) -*¦ JV@, ст2@)) при п-+ оо и всех вев. Пусть, далее, функция <р дифференцируема и ф' =И= 0. Тд , [Ф'F)]2а2(е)). Кроме того, если функции ф' и а непрерывны, то Обобщение утверждения 3° на случай векторного параметра 9 = Fi, .... 9f) имеет следующий вид. 4°. Пусть Тп = G"„1, ..., 7ЯЛ)—_оценка параметра в, удовлетворяющая условию ?0(V" (^я — 8))->-^V@, 2F)) при л-»- оо и всех вев. Тогда для любой дифференцируе- дифференцируемой функции ф от г переменных при условии, что у (в) ^ 0, где d2@) = 6'@JFN(8), 6(8) = = (-дйг~, ..., -д^-) ¦ ?сли, кроме того, функция ф непрерыв- но дифференцируема и все элементы матрицы вторых элементов 2F) непрерывны по в, то и{-М${т „)-ф(в)]/г»(г „))-> JV(o, 1). На основании центральной предельной теоремы вы- выборочный момент Л„А асимптотически нормален с пара- параметрами а* = Е?* и —D?* = (с&2* — <xl)/n, что кратко записывается так: I (Лл*) ~ JV (а*, (а2« — а*)/л). Асимпто- Асимптотически нормальным является и совместное распределе- распределение любого конечного числа выборочных моментов Ank, а также (при некоторых дополнительных условиях) распределение любой дифференцируемой функции от конечного числа моментов Ank. В частности, асимптоти- асимптотически нормальными являются и центральные выборочные МОМеНТЫ Мак- Исследование асимптотического поведения распреде- П
лений порядковых статистик Хда при п -*¦ оо проводится методом прямого анализа точных распределений величин X(k). При этом средние члены вариационного ряда (т. е. когда номер k = k(n) удовлетворяет условию ур, О < р < 1) для распределений L (|), обладающих гладкой плотностью, оказываются асимптотически нормальными; для крайних же порядковых статистик (т. е. для Х(Г), X(n-s + i) при фиксированных r,s^\) класс предельных распределений исчерпывается распределениями трех типов, отличных от нормального [1, с. 26]. 5. Напомним некоторые формулы из теории вероят- вероятностей, которые часто используются для нахождения явного вида распределений при преобразованиях случай- случайных величин. Пусть вектор X = (Xi, ..., Xk) имеет абсо- абсолютно непрерывное распределение с плотностью f(x), х = (х , jc*)€S=/?*, и h = (/i,, ..., й*) :S->/?* — произвольное взаимно однозначное и гладкое (т. е. все частные производные dhi{x)/dxj непрерывны) преобра- преобразование, якобиан которого J{x) = det Эх, dxk dhk(x) не обращается на S в нуль. Тогда плотность распределе- распределения случайного вектора У = h(X) = (h\{X), ..., hk(X)) имеет следующий вид: где А — обратное к h преобразование: h~\h{x)) = х. Выделим два часто встречающихся частных случая. Если k = 1, то речь идет о преобразовании случайной величи- величины: Y = h(X), где h(x) — взаимно однозначная гладкая функция с не обращающейся в нуль производной. В этом случае плотность распределения Y имеет вид A.3) Если речь идет о линейном преобразовании: Y = b detA=a=5^0, то плотность распределения Y равна КА\Ь))\\ В ряде статистических задач приходится иметь дело с частным с, = 1/ц двух независимых случайных величин, 12
плотности распределения которых Д и ^ известны. Плот- Плотность распределения величины g может быть вычислена по формуле оо П(У)= \ h(xyU*)Mdx. A.4) 6. Для удобства дальнейшего изложения приведем наиболее часто встречающиеся в приложениях распреде- распределения L(l) и некоторые их свойства. 1) Нормальное распределение^^, а2), — оо < ц < оо, (X — 1 о > 0, имеет плотность ———е 2а' , —оо < *< оо; У2ла при этом ц = El, <г = D?, a центральные моменты \ik = = Е(| — ц)* равны соответственно |i2r + i = 0, \i2r = = Ш. о2' = 1. з...Bг - 1)а2г. Распределение N @, 1) называют стандартным нормальным, его функцию рас- х пределения обозначают Ф(х) — -— \ e~''/2dt; уравне- /2а ние Ф(иР) = р, р 6 @, 1), однозначно определяет р-кван- тиль ир, при этом «i_p= —ир; используется также обозначение су = Ы(|+?)/2- Случайный вектор | = (?i, ..., Ik) имеет (й-мерное) нормальное распределение ЛГ{\х. = = ((ii, .... \ik), 2 = ll^'/ll*). если его характеристическая функция имеет вид1 Ее"'1 = при этом Е(?) = (Е| Е?*) = \i, = Е(Б - ц)(Б - |i)' = llcov (Ь, Если 2 # 0, то распределение^ц, 2) называется невырожденным (собственным) и имеет плотность 2 f(x) = Bл)" ^| 2 | 2 ехр{ —Ь(ж- |i)'2~'(* - Важнейшим свойством нормального распределения явля- ' При матричных преобразованиях векторы понимаются как вектор- столбцы, означает транспонирование. 13
ется то, что при линейном преобразовании т) = А\(А— заданная матрица) снова получается нормальный слу- случайный вектор, при этом L(r\) = N(A\i, A2.A'). В частности. если т] = 11%, где U — ортогональная матрица, приводя- приводящая 2 к диагональному.виду U'^U = D = \\Ь':?\\ (Я,,-, /= 1, ..., k — собственные числа 2)> то L(i\) = =N(U'n, D), т. е. компоненты вектора ц некоррелирова- ны, следовательно, и независимы. Полагая Z = = Д-|/21Г(|—ц) (если все А,,->0), получим L (Z) = =N@, Ek), где ?<: — единичная матрица размера k. Таким образом, всегда можно указать линейное преобра- преобразование, переводящее невырожденный нормальный век- вектор в вектор с независимыми стандартными нормальными компонентами. В статистических приложениях, где имеют место выборки из нормального распределения, важную роль играют следующие утверждения [1, с. 29—31]: 1°. Если. X — (Х\, ..., Хп) — выборка из распределения N([l, о2) и t = BX,Q i = X'AiX, i = 1,2 — соответственно линейная и квадратичные функции от X, то для незави- независимости t и Qi достаточно выполнения условия BAi = О, а для независимости Q\ и Q2 — условия A\Ai = A2A, = = 0. 2°. Пусть [х = 0, а2 = 1 и Л? = А\ (матрица Л, — идемпотентная); тогда L(Q\) = %2(r), где т = rang A\ = = tr A\ — след матрицы А\. 3°. Теорема Фишера. Выборочные среднее X и дис- дисперсия S2 независимы и при этом Ь{л[п(Х — \л)/а) = = Af(O, I), aL (nS2/a2) = %2(п — 1) (определение хи-квад- рат распределения см. ниже). 2) Гамма-распределение Г(а, К), а, К > 0, задается 1-1 е-х/а °° плотностью ——, л:>0 (здесь Т(Х) =) fe'ldt, Х>0 — гамма-функция), и имеет моменты Е|6 = = аьГ(Х + Ь)/Г(Х), Ь>—Х. В частности, Eg = аХ, Т>1 = а2Х. Частный случай Т (а, 1) называют экспоненциаль- экспоненциальным или показательным распределением. Другой частный случай ГB, /г/2) называют распределением хи-квадрат с п степенями свободы и обозначают %2(п); при этом %2(я) —Lfe2 + ... + In), где слагаемые независимы и Lfo) = N@, 1), i = 1, ..., п. Для р-квантили распределения %2{п) используют обозначение %2р<п. 14
3) Распределение Вейбулла W(a, a, b) зависит в общем случае от трех параметров: параметра положения (сдвига) a?R[, параметра формы а>0 и параметра масштаба Ъ > 0 и задается функцией распределения Здесь Частный случай W(a, I, b) известен как двухпарамет- рическое экспоненциальное распределение, a W(a, 2, b) — как распределение Релея. 4) Бета-распределение E(а, b), a, b > 0, задается плотностью ха~ 'A — х)ь~ /В(а, Ь), 0^*<!1, где В(а, 6) = y~^t — бета-функция. Здесь Eg = -^ , ( )( + +) 5) Равномерное распределение R(a, b), — оо < а й<оо, имеет постоянную плотность /(*) = 6. Здесь 6) Распределение Kouiu K(a), — оо < а < оо, задается плотностью -, — оо <х< оо. Для этого л 1 + {х — а)' распределения не существуют моменты, в том числе и математическое ожидание, постоянная а совпадает с медианой gh. Распределение Коши обладает следующим интересным свойством: если случайные величины ?|, ..., In независимы и /.(?;) = К(а), i = 1, ..., п, то L(|) == /((a), где черта означает среднее арифметическое. 7) Распределение Стыодента с п степенями свободы S(n) = L(tn = ц/^Jxn/n), где случайные величины г\ и %% независимы и при этом Это распределение имеет плотность Sn(x) = —¦ —— •- , + , , - оо < X < оо ; ^ <) ( ) 15
для его р-квантили используется обозначение /р,„. 8) Распределение Снедекора с п\ и ni степенями I i2 ос2 \ свободы S(ni, n2)=llFru,ni = ^1-:~\, где случайные величины хД и у}, независимы и при этом L(y%) = х2(п,), i= 1, 2. Плотность этого распределения имеет вид 4 4a его р-квантиль обозначается Fp „, „,, при этом Fi_p „,,„,= = 1//>..,.,,. 9) Биномиальное распределение Bi(n, p) — это рас- распределение числа «успехов» в п независимых испытаниях с двумя исходами («успех» — «неуспех») и неизменной вероятностью «успеха» р 6 @, 1) (схема Бернулли). Здесь Р(| = k) = Cknpkqn~ \ k = 0, 1, ... , n{q = 1 — р), Е? = пр, Щ = npq. При п = 1 имеем распределение Бернулли Bi(\, p). 10) Полиномиальное распределение М(п; р\, ..., pw), Р\ + ••• + Рл/ = 1 — это распределение случайного векто- вектора v = (vi, ..., \N) с целочисленными неотрицательными компонентами, удовлетворяющими условию vi + --- + -j- \N = п, которое имеет вид P(v = А) = Й[|"'А , p\\..phN\ h = {h , hN), hi + ... + hN = п. Здесь ( np,(l — p,) при « = /, Ev,- = no,-, cov (vj, v/) = { ... \ —npiPj при 1ф j. Если произведено п независимых испытаний с N возмож- возможными исходами, вероятности которых неизменны и равны р\, ..., ры соответственно, то, обозначив через v, число реализаций i-ro исхода, i— 1, ..., N, будем иметь, что L(v) = M(n; pi pN). Если N = 2, то М{п; р, 1 — р) = = Bi(n, p), т. е. полиномиальное распределение сводится к биномиальному. 11) Распределение Пуассона П(Х), X > 0, задается вероятностями Р(? = k) = e~x-^-, k = 0, 1, 2, ...; при 16
этом А, = Е| = D| и вообще Е(?); = к', где (а),- = = a(a-l)...(a-j+l), />1, (аH = 1. _ 12) Отрицательное биномиальное распределение Bi(r, p), p ? @, 1), г= 1, 2, ..., задается вероятностями P(S = *) = C* + *-ipV. * = 0, 1, 2, ... (<? = 1-р). Это распределение числа «успехов», предшествующих r-му «неуспеху» в бесконечной последовательности испытаний Бернулли. Здесь Е? = rp/q, D?, = rp/q2. В частном случае г — 1 распределение Ш(\, р) назы- называется геометрическим. 13) Гипергеометрическое распределение H(r, N, п) за- задается вероятностями Щ = k) = CkrCN--\/CnN, max@, n + г - N) < k < min(n, r). Если в урне содержатся N шаров, г из которых красные и N — r — черные, и из урны извлекается случайная выборка без возвращения объема п, то случайная вели- величина % — число красных шаров в выборке — имеет ука- указанное распределение. Здесь Е? = ^-, D? = — (I — zf и вообще Е^ = 7лоГ- 7оГ Дальнейшие свойства этих распределений рассмотре- рассмотрены в задачах 1.39—1.55. Если статистическая модель F= {/^j задается распре- распределением какого-нибудь стандартного типа при неиз- неизвестных определяющих его параметрах 8 (или некоторых из них, если параметров несколько), то модель имеет такое же название. Например, говорят о нормальной модели #(8, а2), когда среднее неизвестно, о модели Nil*., 82), когда неизвестна лишь дисперсия, об общей нормальной модели yV(8i, ef), когда оба параметра неиз- неизвестны, о пуассоновской модели 11@) и т. д. 7. Для изучения и иллюстрации эффективности раз- различных статистических процедур удобно использовать статистическое моделирование, реализуемое с помощью последовательности псевдослучайных чисел. Псевдослу- Псевдослучайными числами называют последовательности чисел, получаемые по некоторому алгоритму и обладающие свойствами последовательности случайных чисел. Методы получения псевдослучайных чисел рассматриваются в учебной и монографической литературе [9, 10]. Обычно для получения реализации последователь- последовательности независимых случайных чисел с произвольным 17
распределением используют реализацию последователь- последовательности независимых случайных чисел, равномерно рас- распределенных на отрезке [0, 1 ]. Реализацию равномерно распределенных случайных чисел и0, Uu U2, ••• A-5) наиболее часто получают линейным конгруэнтным мето- методом [9]: UH=Zn/m, A.6) где 2„ — последовательность, определяемая рекуррент- рекуррентным соотношением zn + i = azn + с (mod m), где 2о — начальное значение, а, с, т — положительные целые числа. Последовательность A.5), определяемую формулой A.6), строго говоря, нельзя рассматривать как реализа- реализацию независимой последовательности равномерно рас- распределенных чисел, так как она является либо периоди- периодической, либо содержит период с подходом. При этом длина периода Т не превышает пг, так как не превышает пг число различных значений гп, п = 0, 1, 2, ... . Очевид- Очевидно, что бессмысленно использование таких последова- последовательностей длиной, превосходящей длину подхода и периода. Однако при специальном выборе констант а, с, m и 2о последовательность A.5) имеет максимально возможный период т. Условия, при которых последовательность имеет мак- максимальный период, приводятся в следующей теореме [9]. Теорема. Длина периода линейной конгруэнтной последовательности A.5) равна m тогда и только тогда, когда: 1) с и m — взаимно простые числа; 2) Ь = а — 1 кратно р для любого простого р, явля- являющегося делителем гп\ 3) b кратно 4, если m кратно 4. В приложении приведены две программы датчиков равномерных псевдослучайных чисел на автокодах машин ЕС и БЭСМ-6. В датчике D\ были использованы постоянные а = 843314861, с = 453816693, m = 23', а в D2 — постоянные а = 431777206549, с = 232354146751, m = 2й. Обе программы вызываются оператором Y = = RAN(K), где К — произвольное целое число из отрез- отрезков [1, 2—1] и [1, 241 —1] соответственно. 18
Наличие полного периода, однако, еще не обеспечи- обеспечивает хороших свойств псевдослучайных чисел. Даже в датчиках, рекомендованных для широкого использова- использования, нередко обнаруживаются существенные недостатки. Проверка «качества» последовательностей, выраба- вырабатываемых датчиками, проводится с помощью различных статистических критериев [8]. При этом обычно ограни- ограничиваются проверкой равномерной распределенности s-цепочек (s = 1, 2, ...) последовательности A.5) и далее используют эту последовательность для решения модель- модельных задач. Приведем несколько примеров моделирования выбо- выборок. Для получения п равномерно распределенных чисел Х[, Хо, ...,'Хп можно воспользоваться программой DIMENSION А{\ 0 0) К = S DOl/= 1,10 0 1 A(I)= RAN(K) STOP END, где оператор Y = RAN(K) вызывает подпрограмму датчи- датчика случайных чисел. Результаты вычислений при п = 100 приведены в табл. 1.1. Таблица I.: 0,168 718 549 099 550 100 571 121 012 562 0,273 823 754 304 855 405 976 526 517 067 A00 0,878 428 459 009 660 210 881 431 522 072 равномерно 0,983 533 664 214 965 515 286 836 027 577 0,588 138 369 919 770 320 191 741 032 562 распределенных случайных чисел) 0,693 243 574 124 075 625 596 146 537 087 0,298 848 279 829 880 430 501 051 542 092 0,403 953 484 034 185 735 906 456 047 597 tf,008 558 189 739 990 540 811 361 052 602 0,113 663 394 944 29'5 845 216 766 557 107 Воспользовавшись программой «ВР» (см. Приложение), получаем вариационный ряд выборки, приведенной в табл. 1.1. На рис. 1 приведен график эмпирической функ- функции распределения Fn(x), вычисленной по этому вариа- вариационному ряду. Воспользуемся теперь программой «НЧ» (см. Прило- Приложение) для получения п нормально распределенных 19
Рис. 1 случайных чисел Х\, Хп с параметрами ц = ЕЛ",-, а2 = DA',-. На рис. 2—4 приведены три гистограммы при ц = 1, а2 = 4 и п = 10, 100, 1000. Разобьем ось Ох на интервалы длины А, равной при п = 10, 100, 1000 соответственно 3; 1,5; 0,75. Точка х = 1 при любом п являлась граничной точкой интервалов. В табл. 1.2 приведены значения оценок у l > V С'2 параметров ц = 1 и а2 = 4. - xf S -и -3 -2 -1 0 1 2 3 20
Таблица 1.2. л X S'2 10 0,676 3,901 100 1,016 4,315 1000 0,988 4,306 1.1. Предложить способ моделирования последова- последовательности испытаний Бернулли Х\, Х2, ..., Хп, ..., где Р(Хп = 1) = 1 — Р(Х„ = 0) = р. Указание. Использовать последовательность псев- псевдослучайных чисел, равномерно распределенных на отрезке [0, 1]. 0,20 у б--2 J. -0,10 I I I -5 -Ч -3 -2 -7 0 7 2 3 4 5 6 7 х Рис. 3 (х-и? 21
1.2. Смоделировать последовательность испытаний Бернулли, указанную в задаче 1.1, с р — 0,4 и п = 1000. Вычислить частоты \u,/k, где \х.к = Xt + ••• + Хк, при k= 100, 200, ..., 900, 1000. В системе координат хОу построить график, соединив прямыми соседние точки (k, \Lk/k), k = 100, 200, ..., 1000. 1.3. Указать способ моделирования независимых испытаний в полиномиальной схеме с исходами 1, 2, ..., N и вероятностями исходов соответственно р{, р2, ..., ры- 1.4. Указать способ моделирования симметричного блуждания с дискретным временем по целым точкам прямой с началом в точке 0 (вероятности перехода в соседние точки за один шаг предполагаются одинако- одинаковыми). 1.5. Пусть случайная величина | равномерно распре- распределена в интервале [0, 1], F(x)—непрерывная функция распределения. Найти функцию распределения случайной величины Ti = F~*(g), где х = F~\y) — функция, обрат- обратная функции у = F(x). 1.6. Предложить способ моделирования случайной последовательности Х\, Х2, ..., Х„, ..., где Р(Х„ ^ t) = = 1 — е~//а, t ^ 0 (а > 0 — постоянная). | Указание. Воспользоваться предыдущей задачей. 1.7. Смоделировать независимые показательно рас- распределенные величины Х\, Х2, ..., Хп с а = 1, п = 100. Построить график эмпирической функции распределения и гистограмму; вычислить первый и второй выборочные моменты Ап\, Ani. Указание. Использовать предыдущую задачу и про- программу «ВР». 1.8. Указать способ моделирования эрланговской слу- случайной последовательности {Xj} с параметрами (а, т.) (т.е.ВД) = Г(а, /и), / = 1, 2, ...). 1.9. Используя центральную предельную теорему, указать способ моделирования приближенно нормально распределенных случайных чисел Хп, п = 1, 2 1.10. Пусть XN\, ..., XNn — реализация последователь- последовательности приближенно нормально распределенных чисел, каждое из которых получено суммированием N равно- равномерно распределенных слагаемых (см. предыдущую задачу). Получить три реализации (при N = 2, 4, 12) выборок с п = 100, а = 0, о2 = 1. Для каждой выборки построить эмпирические функции распределения и гисто- гистограммы; получить оценки а и а2. 1.11. По выборкам предыдущей задачи вычислить 22
3-й и 4-й выборочные центральные моменты и сравнить их с истинными значениями теоретических моментов. 1.12. Указать способ моделирования выборки из бино- биномиального распределения Bi(k, p). 1.13. Пусть vn — число успехов в п испытаниях Бер- нулли с вероятностью успеха р ? @, 1). При больших п вычислить границу бу такую, чтобы событие I — — р\ ^ 6V имело вероятность ту. Укладываются ли r эти границы при у = 0,98 результаты следующего экспе- эксперимента (эксперимент Бюффона): при « = 4040 броса- бросаниях монеты наблюдалось h = 2048 выпадений «герба»? Указание. Применить теорему Муавра — Лапла- Лапласа; монету считать симметричной. 1.14. Используя такой же подход, как в предыдущей задаче, проверить соответствие теории следующих дан- данных: среди п = 10000 «случайных чисел» 0, 1, ..., 9 чис- числа, не превосходящие 4, встретились h = 5089 раз. 1.15. Смоделировать выборку объема п = 1000 из распределения Бернулли Bi(l, 3/5) и аналогично зада- задаче 1.13 проверить соответствие экспериментальных данных предсказанию теории. |Указание. Воспользоваться задачей 1.1. 1.16. Проводились опыты с бросанием одновременно 12 игральных костей. Наблюдаемую случайную величи- величину | считали равной числу костей, на которых выпало 4, 5 или 6 очков. Пусть /г,- — число опытов, в которых наблюдалось значение ? = i, с = 0, 1, ..., 12. Данные для п = 4096 опытов приведены [3, с. 38] в следующей таблице: 1 hi 0 0 1 7 2 60 3 198 4 430 5 731 6 948 7 847 8 536 9 257 10 71 11 11 12 0 Всего п = 4096 а) Построить график частот Ы/п и сравнить его с графиком функции ce~x/i. б) Вычислить выборочные среднее и дисперсию, а также выборочные коэффициенты асимметрии и эксцесса. в) Принимая L(?) = Bif 12, —). найти б из условия Р(\Х — а, | ^ б) = 0,998 и сравнить с б вычисленное по указанным данным отклонение выборочного среднего от теоретического а.\. 23
Указание. При оценке указанной в п. в) вероят- вероятности использовать теорему об асимптотической нор- нормальности выборочного среднего. 1.17 (продолжение задачи 1.16). В предыдущем экспе- эксперименте наблюдалась также случайная величина |, равная числу костей с 6 очками. Таблица наблюдавшихся данных в этом случае имеет [3, с. 45] вид 1 Л/ 0 447 1 1145 2 1181 3 796 4 380 5 115 6 24 >7 8 Всего п=4096 Ответить на вопросы задачи 1.16, считая при этом 1.18. Смоделировать выборку объема п = 1000 из распределения /,(?) = BiU, —) и проанализировать соот- соответствующие данные аналогично задаче 1.16. | У к а з а н и е. Воспользоваться задачей 1.12. 1.19. Наблюдались показания 500 наугад выбранных часов, выставленных в витринах. Пусть i — номер про- промежутка от /-го часа до (/+ 1)-го, ( = 0, 1 11, а Л,- — число часов, показания которых принадлежат i-му про- промежутку. Результаты таким образом сгруппированных наблюдений оказались следующими [4, с. 459]: ft/ 0 41 1 34 2 54 3 39 4 49 5 45 6 41 7 33 8 37 9 41 10 47 11 39 Всего я=500 а) Построить полигон частот и сравнить его с графи- графиком функции f(x) = с, 0 ^ х ^ 12. б) Рассматривая эти данные как независимые наблю- наблюдения над дискретной случайной величиной \, принимаю- принимающей значения, совпадающие с серединами соответствую- соответствующих интервалов (т.е. значения 0,5; 1,5; ...; 11,5), вычис- вычислить выборочные среднее и дисперсию. в) Принимая, что в п. б) случайная величина | имеет равномерное распределение, найти б из условия Р(|Х — ail ^ б) = 0,98 и сравнить с ним наблюдавшееся значение отклонения \Х — ail. 1.20. Смоделировать выборку из полиномиального распределения М E00; 1/5, 1/5, 1/5, 1/5, 1/5) и, рассмат- 24
ривая эти данные как наблюдения над случайной вели- величиной |, принимающей значения — 2, — 1, 0, 1, 2, про- проанализировать соответствующие данные аналогично за- задаче 1.19. |Указание. Воспользоваться задачей 1.3. 1.21. В опытах наблюдалась неотрицательная непре- непрерывная случайная величина ?. Ее значения (упорядочен- (упорядоченные по величине и округленные с точностью до 0,01) для п = 50 опытов оказались равными: 0,01 0,01 0,04 0,17 0,18 0,22 0,22 0,25 0,25 0,29 0,42 0,46 0,47 0,47 0,56 0,59 0,67 0,68 0,70 0,72 0,76 0,78 0,83 0,85 0,87 0,93 i ,00 1,01 1,01 1,02 1,03 1,05 1,32 1,34 1,37 1,47 1,50 1,52 1,54 1,59 1,71 1,90 2,10 2,35 2,46 2,46 2,50 3,73 4,07 6,03. По- Построить эмпирическую функцию распределения и гисто- гистограмму; сравнить гистограмму с графиком функции се~х/а, х > 0. Вычислить выборочные среднее и диспер- дисперсию. 1.22. Получена выборка объема п = 100: 0,144 0,937 1,787 —1,052 —0,192 0,169 2,623 2,135 1,759 0,811 0,724 — 0,110 1,752 —0,378 0,417 1,360 1,365 2,587 1,621 2,344 1,379 0,560 1,858 2,453 —0,356 1,503 —0,134 2,950 — 0,816 0,717 2,468 1,131 1,047 1,355 1,162 —0,491 0,261 — 0,183 0,467 0,502 —0,805 0,228 2,286 0,364 —0,312 — 0,045 2,559 0,129 0,898 0,877 3,285 1,554 1,418 0,423 — 0,489—0,255 1,092 0,402—0,051 0,020,0,398 1,399 2,121 — 0,026 1,087 2,018 —0,437 1,661 1,091 0,363 1,229 0,416 1,705 1,124 1,341 2,320 0,176 —0,541 0,837 3,329 2,382 — 0,454 2,537 —0,299 1,363 0,644 0,975 1,294 3,194 0,605 1,978 1,109 2,434 —0,094 0,735 0,143 —0,421 —0,773 1,570 0,947. Построить эмпирическую функцию распределения и гистограмму. Вычислить выборочные среднее и диспер- дисперсию, а также выборочные коэффициенты асимметрии и эксцесса. 1.23. При проведении п = 2608 опытов по наблюде- наблюдению числа а-частиц (|), излучаемых радиоактивным веществом за определенный период времени G,5 с), по- получены следующие данные (hi — число опытов, для ко- ко| i i 0 1 ) торых число 1 hi 0 57 1 203 частиц ? 2 383 3 525 4 532 = 1 5 408 , 1 = 6 273 = 0 7 139 . 1. 8 45 9 27 10 10 11 4 3*12 2 Всего л— =26ДО Построить график частот hi/п. и вычислить выбороч- выборочные среднее и дисперсию [7, с. 177]. 25
В следующих ниже задачах X = (Х\, ..., Х„) — выбор- выборка из некоторого распределения L (?), F (х) и Fn (x) — соответствующие теоретическая и эмпирическая функции распределения (см. A.1)). 1.24. Для заданной точки х0 такой, что 0 < F(x0) < 1, и заданного числа t оценить при больших п вероятность события \Fn(x)- F(xQ)\ < tHn. Указание. Воспользоваться теоремой Муавра — Лапласа. 1.25. Пусть х\ < х2 — две заданные точки на числовой прямой такие, что 0 < F (x\) ^ F (х2) < I. Доказать фор- формулу cov (Fn (xs), Fn (x2)) = 1 F (*,) A - F (x2)). Указание. Представить случайные величины \in (х\) и An(*i, хг) = \in(xi) — \in(x\) в виде сумм независи- независимых индикаторов: при Х,-<| х\, i = 1,...,«, при Xi > Х[, 1 при Х\ < X; < х2, = Ч\ + ... + д„, где S/- / = 1, ..., п, О в остальных слу- случаях. 1.26. Пусть х\ < х2 < ... < Xjv-i — заданные точки на числовой прямой такие, что 0 < F (х\) < F (х2) < ... ... < F(xs-\) < 1. Рассмотрев случайные величины V,- = \in(xi) — \in(Xi-\), i = 1, .... Л/ (здесь \in(x0) = 0, ]1п(хы) = п), убедиться в том, что случайный вектор v = (vi, .... vjv) имеет полиномиальное распределение М (п; pi, .... pN), где р,- = F (xi) — F (*,-_i), i = 1, ..., N, F (xo) = 0, F (xN) = 1. Получить отсюда результат зада- задачи 1.25. 1.27. Вывести следующие формулы для моментов выборочных моментов: Е Апк = Е 1к = ak, cov (х, = Е (| - а,)*, cov 26
Вычислить значения этих моментов для случая L(t) = ЛГ(ц,а2). 1.28. Доказать, что для любых фиксированных г ^ 2, 1 ^ k\ < ... < k, совместное распределение выборочных моментов Ank,, ..., Ank, при п -*¦ оо асимптотически нор- нормально ff(a = (а*,, ..., а*,),-^- 2). гДе 2 = II0'/ = «*. + *, — - ч*,сй(||1, т. е. L (Vn (Л*, - а*,), i = 1, .... г) -> N (О, 2) (предполагается, что все указанные теоретические момен- моменты существуют). Кроме того, если <р (*), х = (xj, ..., х,), — любая дифференцируемая функция, то L(-\n (<p (A,*,, ... • ••, Л.*,) — ф (а))) -> N @, v2) при условии, что v ф 0, где Указание. Применить центральную предельную теорему для векторных случайных величин и утверж- утверждение 4°, п. 4, гл. 1. 1.29*. Доказать, что при п -> оо выборочная диспер- дисперсия Si асимптотически нормальна Л?(ц2, (ц,4 — м!)/я) и при этом Е Sn ~ ц-2, D 5я ~ (р.4 — M-2)/rt (предполагает- (предполагается, ЧТО |Х4 < 00 )¦ Указание. Воспользоваться утверждением 2°а), п. 4 гл. 1. 1.30. Доказать, что совместная функция распределе- распределения двух порядковых статистик Х^) и Л"E) A ^ г < s ^ п) имеет вид m = r j =шах @, s — in) - F(Xi)Ul ¦ если xi < Х2, и Fr.s(xi,x2) = Р№ если X| ^ xi. Вывести отсюда формулу для F, (x) = - Р (Х{г) < х). 1.31. Пусть распределение L (^) абсолютно непрерыв- непрерывно и его плотность /^(х) = f(x). Вывести следующую формулу для плотности совместного распределения по- порядковых статистик Х^,), •••, Х^,) A ^ k\ < ... < k, ^ n): 27
&,...*.(*¦. .... Xr) - (ft) _ ,)!(ftl_ftl _ ,}! { - F (*,_,)»'-*--'(l - F(xr)f-'"f(xi)...f(xr), x\ < ДГ2 < ... < л:,. В частности, совместная плотность всех п порядковых статистик Aji), ..., Х(я) равна gi...n(x\, ..., *„) = я! f (х\)... f {хп), Х\ < х2 < ... < хл. 1.32*. Доказать, что если в некоторых окрестностях квантилей с^'и §,,{0 < pi < р2 < 1) плотность / (*) не- непрерывна вместе с производной и /(&,,) > 0, i = 1,2, то при п -*¦ оо выборочные квантили Zn,Pi = X^np,\+ i), i = 1,2, асимптотически нормальны #((&,, &»)• — lloi/lli), где а,;- = _ р<( — Pi) t- ^ • Обобщить на случай л квантилей. 1.33*. Доказать, что для выборки из абсолютно не- непрерывного распределения крайние порядковые статисти- статистики Х(г) и X(n_s+i) при п-*оо и фиксированных г, s ^ 1 асимптотически независимы. Указание. Перейти к случайным величинам хп = nF (Х(,)) и т|„ = n[l — F(X(n-s + [))] и воспользо- воспользоваться результатом задачи 1.31. 1.34. Пусть L(|) = Г A, 1). Доказать, что случайные величины Yr = {п — г + 1){Х{г) — Х{г-\)\,г = 1,..., п[Хт = = 0) независимы и одинаково распределены с плот- плотностью f (х) = е~", х > 0. Основываясь на этом, вы- вычислить ЕА^*), DX(k) и исследовать асимптотическое пове- поведение ЕХ(П) и DX{n) при п->-<х>. Указание. Воспользоваться представлением п п % хг =: "Zin —г + \){хг — Xr-i), xq = 0, и резуль- татом задачи. 1.31. 1.35. Убедиться в том, что для случая М!) = = R @, 1) распределения порядковых статистик имеют вид L (Xw) = р (/г, п - k + 1), ((о = р(/ — А, и — / + k + 1), 1 ^ /г < / <: п. Вычислить средние и дисперсии этих распределений, а также cov (Xw, Х) 28
1.36. Пусть L(?) = R(a,b). Показать, что плотность совместного распределения экстремальных значений вы- выборки Aio и Х(„, имеет вид "(я ~'J (х2 — хх)"~2, а< Х\ < Получить следующие формулы: a -\- nb па п -f- + (п EX (ft - af п + 1 ' (я + \f(n + 2) • 1.37. Пусть L (?) есть распределение Вейбулла W (a, a, b). Найти распределение минимального значения выборки X(D и вычислить ЕХ(|) и D-Yfi). 1.38. Пусть Xi = (Хи, Хц), i= \,...,n, — независи- независимые наблюдения над двумерной случайной величиной 6= (Ей Ы с функцией распределения F {х\, х2). Эмпи- Эмпирическая функция распределения определяется в данном случае формулой п с / ' \ !\^/ v \ / v \ гп(Х],х2) =— у, е\х\ — л,-|j е(х2 — Л12) ^ ¦ — 1 (ср. с A.1)). Вычислить YLFn{x\, х2) и DFn(x\, х2) и по- показать, что Fn(x\, х2) -*¦ F (х\, х2), когда п -> оо. Построить выборочный коэффициент корреляции ря и. показать, Р по что р„ -*- р = korr (Ei, E2), если E(EiEi) < 00 и Щ;- > О, /= 1,2. 1.39. Говорят, что распределение La, зависящее от параметра а, является воспроизводящим по этому пара- параметру, если для независимых случайных величин Ei и \2 с распределениями соответственно La, и La, выполняется свойство L(Ei + E2) = Lo,+o,; это записывается также в виде La,%.La, =La, + a2, где 4е означает операцию свертки. Убедиться в справедливости следующих утверждений: 2) Г (a, h) * Г (а, К2) = Г (а, h + К2); Pi, •¦-, P/v); в частности, Bi (ti\, р) %. Bi (п2, р) = Bi (ti\ + п2, р); 4) П (h) * П (Х2) = П (Я,1 + Л*); 29
5) Bi (rtl p) * Bi (r2, p) = Bi (n + r2, p). Указание. Использовать тот факт, что харак- характеристическая функция суммы независимых случай- случайных величин равна произведению характеристиче- характеристических функций слагаемых; при этом для дискретных случайных величин вместо характеристических функ- функций Ее*'6 удобно использовать производящие функ- функции Ел^. 1.40*. Пусть случайный вектор У имеет невырожден- невырожденное нормальное распределение ЛДц, 2) и Q = (Y — — ц)'А(У — \х), где матрица А удовлетворяет условию А = А 2 A.i Доказать, что L(Q) = х2('"). где т = = tr(i4Z). В частности, при А — 2~' число степеней свободы т совпадает с размерностью вектора Y. 1.41. Совместное распределение двух случайных вели- величин X и Y описывается следующим образом: условное распределение Jl при условии Y = у нормально N(y, o\), a L{Y) = JV(|*, о\). Доказать, что L(X) = N(ц, а] + of). Указание. Вычислить плотность распределе- распределения Л' по формуле со fx(x) = \ fxiy(x, у) fY(y) dy, где fxiY(x,y) — плотность условного распределения L(X\Y = y). 1.42. Случайные величины A^i и X<i независимы, при- причем ВД) = Г (а, к), L(Xt + Х2) = Г (а, Я. + jx), м- > 0. Как распределена случайная величина Л^? I Указание. Вычислить характеристическую функ- I цию для X? (см. решение задачи 1.39 п. 2)). 1.43. Пусть ^ и \i — независимые равномерно рас- распределенные величины на отрезке [0, 11. Показать, что / 1 B|i), TJ=V~21^iBi) р величины t]i =-\/ — 21ng2cos независимы и нормально распределены с параметрами @,1). | Указание. Воспользоваться формулой A.2). 1.44. Пусть случайные величины Х\ и Х2 независимы и L(Xi) = Г (a, Xi), i=l,2. Доказать, что случайные величины У] = X] -f ^2 и У2 = Х\/{Х\ -\- Х2) независимы и при этом L (У|) = Г (а, Х\ -\- Я,г) — воспроизводимость по параметру Я, (см. задачу 1.39 п. 2), ?(Уг) = Р (^-ь ^г). 30
1.45. Доказать, что L( У" -")-*- N@, 1) при п -»- оо. V -\/2л / Установить формулу Е (xl)k = п (п + 2)... (п + 2(k — 1)), Л = 1,2, ... . Указание. Воспользоваться свойством воспроиз- воспроизводимости по параметру А, распределения Г (а, X) и применить центральную предельную теорему. 1.46. Убедиться в том, что ь(а-\-Щ = К {а), где случайные величины ? и ц независимы и нормальны N @, о2), а также L{a + tgl) = K(fl), где L&) = #(-|,|). 1.47. Проверить, что если L(tn) = 5 (я), то моменты Е/* существуют лишь при k < п и равны F/2' — 1-3...Bа - IK or <r- n F/2'+ ; — П Ып ~ (п-2){п-4)...(п-2г)' АГ < П' Un - °' 2л + 1 < П. Доказать, что S (я) -> Л/ @, 1) при п-+оо и, более того, плотность sn(x) -»- -7—-е"*'/2. Установить, что //-—L-Д = 4 Указание. Использовать формулу Стирлинга для гамма-функции: Г (z) ~ -JInz zz~ [е~г', z -*- оо, и при- применить закон больших чисел к случайной величине Хп/п (см. решение задачи 1.45). При вычислении моментов учесть, что /„ = л у 4-, а также независи- независимость сомножителей. Использовать задачу 1.44. 1.48*. Пусть F (х; п{, п2) — функция распределения закона Снедекора S (пи п2), а В (х; а, Ь) — функция рас- распределения закона р (а, Ь). Установить равенство Получить отсюда выражение для плотности {„,,„,(х) рас- распределения 5 (ль п2). Найти моменты этого распределения. 1.49* (продолжение задачи 1.48). Доказать, что при любых фиксированных jcg@, 1) и а > 0 lim у In [1 — В{х; a, b)] = In A - х). Получить отсюда, что при любых фиксированных t > О и т ^ 1 31
lim — In [1 — F (tn\ m, n)]= — -1 In A + ml). Указание. Воспользоваться формулой Стирлинга (см. указание к задаче 1.47) и теоремой о среднем значении: i i \ и" - 'A - и)" - ldu = С " ~ ' \ A - и)" - ldu = (\-х)\ се[х, 1]. 1.50*. Показать, что плотность sn(x) распределения Стьюдента S(n) выражается через плотность fi.n(x) рас- распределения Снедекора S(l, n) следующим образом: Sn(x) = \x\fi,n(x2). Доказать соотношение lim — lnP(/n>dV«)= —4~1п A +d<i) V d>0. I Указание. Использовать тот факт, что L(t%) = S(\, n). 1.51. Пусть X={Xt, ..., Xt, X,+ u ..., Xi + m)~ выбор- выборка из экспоненциального распределения L(l) = Г(а, 1). Рассмотрев случайную величину У = -—-—' "Г " , J—> доказать, что L(Y) — 5B/, 2m). Указание. Использовать тот факт, что L(t'i) = 1.52. Пусть целочисленный случайный вектор v = = (v , vN) имеет полиномиальное распределение М(п\ р\, ..., рм). а) Показать, что производящая функция для (vi Vk), k < Л/, имеет вид в частности, Z-(vi) = Bi(n, p\). б) Вывести следующую общую формулу для смешан- смешанных факториальных моментов: E(v i )*.,... (хц\„ = (n)kl + k'! в) Пусть V = 2 Civ,-, С' = 2 C'lpi, /= 1, 2, "СТСТ= 32
N _ = 2 CJCf pi. Показать, что Etj' = л С', cov(V, т}2) == I = 1 —*ц С* С* — и С* л Указание. Использовать результат, приведенный в решении задачи 1.39 п. 3). 1.53* (продолжение задачи 1.52). Доказать, что для любого k<N при п -у оо и фиксированных р,¦? @, 1), = ИМ?), где оч={Р'A-Р0 при «_ = 'v ri/ r . '.; при этом — piPi при г =^ / г Указание. Воспользоваться теоремой непрерыв- непрерывности для характеристических функций. 1.54. Доказать, что если случайные величины |i, ..., |л/ независимы и L(^) = П(Х/-), / = 1, ..., N, то условное распределение L{\ Ь\Ъ\ + - + 1ы = п) = Щп; рь .... pN), где р.- = -—¦—Ц——, / = 1, ..., N. Отсюда, в частности Л.1 + ... + Кы следует, что Щ\\Ъ\ + ¦¦¦ + In = п) = Bi(n, p{). 1.55. Пусть имеются две случайные величины ? и Л. причем ?(Л) = Г(а, г) при некотором а > 0 и целом г 2^1, а условное распределение L(|| Л = Л,) = ЩХ,). Показать, что безусловное распределение L(|) = В/(г, р) 1.56. Пусть А^ = (Х\, ..., А'п) — выборка из JV(|j,, a2). Доказать, что X и (Х\—Х, ..., Хп — Х) независимы. Получить отсюда независимость выборочных среднего X и дисперсии S2. Указание. Воспользоваться тем, что для нормаль- нормальных случайных величин из их некоррелированности следует независимость. 1.57*. Пусть X = (Хи ..., Хп) — выборка из распреде- распределения ^@, 1) и квадратичная форма Q —Х'Х разложена на сумму двух квадратичных форм Q = Qi + Q2, где Qi — X'AiX и rangA; = n,-, i = 1, 2. Доказать, что если /ii + n2 = «, то Q\ и Q2 независимы и L{Qi) = %2{ni), i= 1,2. 2—190 33
Указание. Проверить, что матрицы А\ и А2 идем- потентны и A\Ai = 0; далее результат следует из утверждений 1° и 2°, п. 6, 1) гл. 1. Замечание. Справедливо более сильное утверж- утверждение, именно, если Q = Qi + ... + Q*, где Q, = X'АХ, rang At = tii, 1=1, ..., k, то п = tti + ••¦ + nk o o- Qi, ..., Qk независимы и L(Qi) = x2("<). ' = 1. •¦•. k. 1.58*. Пусть Х = (Х\, ..., Х„) — выборка из нормаль- нормального Щ[1, а2) распределения. Найти распределение случай- ной величины г\ = ' /л- IS 1.59*. Использовать обозначения, введенные в зада- задаче 1.38, и ее решении, и пусть а) Доказать, что (Х\, X2) и E?, S12, Si) независимы; б) пусть Q = n(Xl-[ii, Xi-vuYX^iXi-ni, X2- — |л2), доказать, что L(Q) = х2B); в) пусть п > 2 и Г = д/л — 2р„Д/1 — р^, где ря = = S12/S1S2 — выборочный коэффициент корреляции. До- Доказать, что при р = 0 = S(n-2), получить отсюда распределение р„. Указание, а) См. задачу 1.56 и ее решение; б) воспользоваться задачей 1.40; в) использовать следующий факт [4, с. 435]: плотность совместного распределения случайных величин (S?, S12, Si) имеет вид (при р = 0) ¦-¦* 2 ~~2~\ —s—1—!Р I jfi, x2 < 0, x\2 < x\X2. Далее рассмотреть новые случайные величины v sfn Su v n i e2 S?2 \ v " c2 '1 = ?— . J2=-r(Ol -j I, /3=-5-'J2 01 i>2 oi \ Si J ai и учесть, что Т — Yi/^Y2/{n — 2). 1.60*. Пусть X и S2 — выборочные среднее и диспер- дисперсия для выборки объема п из распределения Щк). Дока- Доказать, что при п->оо и любом X > 0 34
!)¦ Указание. Воспользоваться задачами 1.27—1.29 и установить сначала асимптотическую нормальность N@, 1) случайной величины qn=-Ji-^—(х — ^—-S2)/X; далее использовать тот факт, что Х/Х-^*- 1 при п -*- оо и утверждение 2° в) п. 4 гл. 1. При вычислении моментов использовать следующие формулы для центральных моментов пуассоновского распределения П(Х): Ц2 = Цз = X, р.4 = X -f- ЗА,2. 1.61. Пусть Х\, ..., Хп — независимые наблюдения над случайной величиной g с Eg = [i, Dg = а2 > О, Eg4 < оо и ^, S2 — соответствующие выборочные среднее и дис- дисперсия. Доказать, что при п —>- оо L(Tn = -\[п(Х — |x)/S) —>-Л/@, 1). Указание. Воспользоваться центральной пре- предельной теоремой, сходимостью S/a-^-1 при п -> оо и утверждением 2° в) п. 4 гл. 1. 1.62. Пусть Z,(|i, I2) = М ((Xi, jx2), 01 °2СГ2^||), где — 1 <р = когг(||, Ы< 1- Доказать, что условное распределение L(g2|gi = х) = = N{tn(x), о2), где условное среднее — функция регрессии g2 на gi, являющаяся в данном случае линейной по х, а условная дисперсия о2 = = D(?2|gi = х) = а|A — р2) не зависит от х. Установить, существуют ли другие распределения L(|i, Ь), отличные от нормального, обладающие такими же свойствами условного распределения L(g2|gi = jc). Указания. 1. Вычислить условную плотность ?2 при условии |i = х по формуле fi,\i,{y\x) = h,b(x> У)/НХХ) и убедиться в том, что она равна , expj —(У~т(хЩ . . 2 V2^^ ^l 2a2 ) с указанными m(jc) и a . 2. Рассмотреть совместную плотность fz,i,(x, у) = = kXx)fu\iXy\x)> r^e fE2iEi(i/lx) — указанная выше условная, а ДДх) — произвольная плотности распре- распределения. 35
1.63* (обобщение задачи 1.62). Пусть Х°\ *B) — два случайных вектора произвольной размерности, E(A^W) = ?l 21 \ 2i [% )< ^ — у у • |2j | ФО. ||/J21 ^J 22 Доказать, что условное распределение L "), В), где - ,.B) 4- Л(г^ цО)\ Л V V ~ ' ~ И1 *^ л\\л \л. у, гХ ^^ 2I^J I I * Убедиться в том, что в случае dim ЯB) = 1, dimX(l) = - J?r(a",a2V..,0'-|/')) В=ру, где Z = ||o"||f. Указания. 1. Рассмотреть линейное преобразо- преобразование У(|) = Л4", У<2) = Хт — АЛ:A) и убедиться в том, что К(|) и УB) независимы; отсюда следует, что XW = х0)) = L(Ym = L (УB) 2. Записав совместную плотность = С ехр{ - 1 2 (*¦¦ - 11.0 (*/ - Ц,0 4 = = Сехр{ -у[^Р - Ы2°РР + получить, что переменная хр войдет в выражение условной плотности в виде ехр { - 1 а" ( хр - 1.64. В основе алгоритма моделирования значений случайной величины с пуассоновским распределением 36
П (X) лежит следующий факт (доказать!): пусть Uit i = 0, 1, 2, ... — независимые случайные величины с рав- k номерным распределением R@, 1) и ? = max| k-.JjUi > ^ е-к) , тогда L (?) =П (X). > k Указание. Используя соотношение L[ — 2 Ini/Л = = Г A, k), вычислить вероятность события (| = k) = * * +1 = { - 2 I" U,: < Л, - 2 I" U, > Я.) . 1.65. Пусть на отрезке [а, Ь\ задана ограниченная плотность распределения f (х), с— max. f (х). Определим случайную величину "<l?l v = min (i > 1 : с (Уи-i < / (а + F - а) (У2,-)}, где {(У,} те же, что и в предыдущей задаче. Доказать, что случайная величина | = а + (Ь — а) l/2v имеет плотность распределения f (x). Замечание. Этот результат дает способ модели- моделирования распределения с произвольной плотностью, удовлетворяющей указанным ограничениям. Глава 2 ОЦЕНИВАНИЕ ПАРАМЕТРОВ РАСПРЕДЕЛЕНИЙ 1. Пусть задана статистическая модель F= {F} для схемы повторных независимых наблюдений над некото- некоторой случайной величиной % и X = {Х\, .... Хп) — выборка из L (?)• Всякая случайная величина Т = Т (X), являю- являющаяся функцией лишь от выборки, называется статисти- статистикой. Часто требуется по выборке А^ оценить истинное значение некоторой неизвестной теоретической характе- характеристики g = g(F), т. е. построить такую статистику Т(X), значение которой можно было бы считать разум- разумным приближением для истинного значения характерис- характеристики g. В этом случае статистику Т (X) называют оцен- оценкой g (для g). Для оценивания g можно использовать различные оценки, и их качество сравнивают, исходя из той или иной меры точности оценок (меры близости оценки к истинному значению оцениваемой характерис- характеристики). Если определен некоторый класс оценок Те и 37
выбрана мера точности, то оценку, оптимизирующую эту меру, называют оптимальной (в классе Т е). Наиболее распространенной мерой точности является среднеквадратическая ошибка Е (Т(Х) — gJ. Эта мера порождает и соответствующий критерий оптимальности оценок — критерий минимума среднеквадратической ошибки. Часто ограничиваются рассмотрением лишь класса Tg несмещенных оценок: Т = Т (X) ? ^«^ о Е Т = g V F 6 F. Для несмещенных оценок Е (Т — g)г = = D7", т. е. мерой точности таких оценок является величи- величина их дисперсии, а критерием оптимальности для несме- несмещенных оценок является критерий минимума дисперсии. Если модель F параметрическая: F = {F (х; 9), G е еб), то любая теоретическая характеристика является функцией от параметра 9. Таким образом, в данном слу- случае речь идет об оценивании параметрических функций, для которых будем использовать обозначение т (9). Ста- Статистика Т = Т (X) является несмещенной оценкой для т (9), если выполняется соотношение Е»Т — т(О)-\/Ое0. Оптимальной в классе 7\ несмещенных оценок функции т = т (9) является статистика 7"*, для которой D07"* ^ ^ DT\/T^ Тх и V0g6. Для оптимальной оценки Т* иногда используют обозначение т*, чтобы подчеркнуть, что она относится к функции т @). Оптимальная оценка Т* (в заданной модели F и для заданной параметрической функции т (9)) существует не всегда, но в тех случаях, когда она существует, она единственна [1, с. 42]. Важным гвляется линейность свойства оптимальности: если Т? — оптимальная оценка т,- = т,@), j = 1,2, ..., то оптималь- оптимальной оценкой линейной комбинации 2 ciri является ста- тистика 2 с,-7? ['. с. 44]. 7 Обязательным для любого правила оценивания являет- является свойство состоятельности, которое означает, что при неограниченном возрастании объема выборки п оценка должна сходиться по вероятности к оцениваемой харак- характеристике каким бы ни было истинное распределение на- наблюдений. Таким образом, состоятельность — это асимп- асимптотическое свойство оценок (в отличие от свойств не- несмещенности и оптимальности). Когда хотят подчеркнуть зависимость рассматриваемых статистик от объема вы- выборки, их отмечают индексом п. При установлении свой- свойства состоятельности полезен следующий простой крите- критерий [1, с. 72]: если ЕОГЛ = т(9) + е„, Do7"n = 6„ ие„ = 38
= е„@)->-0 (т. е. Тп— асимптотически несмещенная оценка т (9)), б„ = б„(9) ->- 0 при п -»- оо для всех 6е8, то Тп — состоятельная оценка т F). 2. Рассмотрим кратко общие критерии существования оптимальных оценок и способы их нахождения в рамках общей параметрической модели F=(F(j(,8),6e8). Пусть / (х; 0) — плотность распределения наблюдаемой случайной величины ? (или вероятность события {! = *} в дискретном случае) и х = (х\,...,х„) — реализация выборки X = (Х\, ..., ХП). Функция L (х; 0) = f (х\\ 0)Х ... Xf (х„; 0), рассматриваемая при фиксированном jteX как функция параметра ОеО, называется функцией правдоподобия. В дальнейшем предполагается, что L (х\ 0) > 0 при всех jceX и 8ев и дифференцируема по 0. Более того, справедливо следующее правило пе- перемены порядка дифференцирования и интегрирования (в случае скалярного параметра 0): для любой статис- статистики Т (в частности, для Т = const) -^-\ T (x) L (х; Q)dx=\T (x)^- L (х- 0) dx (dx = dx\ ... dxn) (интегрирование ведется по всему выборочному простран- пространству X, указанные интегралы, по предположению, абсо- абсолютно сходятся при всех 6е 0, везде для дискретных мо- моделей интегрирование заменяется соответствующим сум мированием). Наконец, введем случайную величину // (Y- Й\ — dlnZ.(X;0) _ у d\nf(X,;O) U ^Л> "> = dO ,f, dO ' называемую вкладом выборки, и будем предполагать, что о < Еои\х- о) < coveee: Модели, для которых выполняются все перечисленные условия, называют регулярными. Для регулярной модели EoU (X; 6) = 0 V в е 8 и опре- определена функция г„@) = DaU{X; 0) = EeU2(X; 0), называе- называемая функцией информации (функцией Фишера). Величину ; (П\ — ; (ы F / d\nj(X,;0)\2 _ F / д> In f (Xr, 0) i @) = j, (9) = Ц Tq ) - - Ео^ ш называют также количеством (фишеровской) информа- информации, содержащейся в одном наблюдении (последнее вы- выражение используется в тех случаях, когда функция 39
/ (jc; 6) дважды дифференцируема по 0). Для схемы по- повторных независимых наблюдений 4(8) = ni(Q). Введенные понятия непосредственно обобщаются на случай векторного параметра 9 = @|, ..., О,). В этом слу- случае под вкладом выборки понимается случайный вектор U = (?/,(*; 0) Ur(X; 9)), где U,(X; 9) = -±-1пЦХ; 0), /== [,..., г, а аналогом функции информации является информационная матрица выборки /„ = /л@) = De(U) = == E§(f/f/')- Информационную матрицу одного наблюде- наблюдения /, = / = \\gij\\\ можно вычислить по формулам —^ —) - ) - Ч 39, (последнее равенство справедливо для дважды диффе- дифференцируемых функций / (х; 8). Для схемы повторных независимых наблюдений /„@) = п/@). В данном случае в определении регулярной модели предполагается, что матрица 7(8) невырождена при всех 9е9. Для регулярных моделей можно установить нижнюю границу для дисперсий несмещенных оценок заданной дифференцируемой параметрической функции т(8). Имен- Именно (неравенство Рао — Крамера): для любой оценки Т — Т (X) е 7\ и всех 8ев имеет место неравенство De^ ^ . ^ , если параметр в скалярный, и неравенство 6'(в)/л-'(в) 6(8), Ь (в) = если 0 = @1, ..., 8,). Оценка РеГ,, для которой дости- достигается указанная нижняя граница, называется эффек- эффективной. Если такая оценка существует, то она является, следовательно, оптимальный (в классе 7\) и единствен- единственной. Критерием эффективности является следующее пред- представление [1, с. 47, 52]: Т (X) — т (8) = а (8) U {X; 6), если 8 — скаляр, Т{Х) - т(в) = a'{Q)U{X\ 0), если 0 — вектор, где а@) (соответственно а (8)) — некоторая функция (вектор-функция) 0. В заданной модели F эффективная оценка может су- 40
шествовать только для какой-то одной параметрической функции т.F) (с точностью до преобразования ат(9) -+- Ь, где а и & — константы). В тех случаях, когда эффективной оценки не суще- существует, для отыскания оптимальной оценки Т* = т* (в классе несмещенных оценок TV) можно использовать следующий алгоритм (критерий Бхаттачария) [1, с. 50, 53]: учитывая старшие производные функции правдопо- правдоподобия L = L (X; 0), подбирают такую их линейную комби- комбинацию, чтобы получить представление вида Т — т — ' ГУ dL I V d2jL -и у a d'L 1- при этом последовательно полагают s = 2, 3, ... . Если при некотором значении s > 2 и коэффициентах а. = а. F) это удается сделать, то статистика Т = Т (X) является оптимальной оценкой функции т = т. F). 3. Наиболее эффективным способом построения опти- оптимальных оценок является использование так называе- называемых достаточных статистик. Статистика Т = Т (X) (вооб- (вообще говоря, векторная) называется достаточной для мо- модели F= {F(x; 6), 0 е 0) (или достаточной для парамет- параметра 9), если условная плотность (или вероятность — в дис- дискретном случае) L{x\t;Q) случайного вектора (выборки) X = (Х\, .... Хп) при условии Т (X) = t не зависит от пара- параметра 0. Эквивалентным определением достаточности яв- является следующее: для любого события А а X условная вероятность Ро (X е А | Т (X) = t) не зависит от 6. Это свой- свойство статистики Т означает, что она содержит всю инфор- информацию о параметре 9, имеющуюся в выборке. Действи- Действительно, вероятность любого события, которое может произойти при фиксированном Т, не зависит от 0, и, следо- следовательно, оно не может нести дополнительной информа- информации о 9. Сама выборка X, очевидно, является достаточной статистикой, но обычно стремятся найти достаточную статистику наименьшей размерности, представляющую исходные данные в наиболее сжатом виде, в этом смысле говорят о минимальной достаточной статистике. Мини- Минимальная достаточная статистика является функцией лю- любых других достаточных статистик. Практически доста- достаточные статистики обычно находят на основании следую- следующего критерия факторизации [1, с. 55]: статистика Г (ДО 41
достаточна для параметра 8 тогда и только тогда, когда функция правдоподобия L (х; 6) представима в виде где g и h — неотрицательные функции и h не зависит от 9. Если Т — достаточная статистика, то таковой же являет- является и любая взаимно однозначная функция от Т. Роль достаточных статистик в теории оценивания определяется теоремой Рао — Блекуэлла — Колмогорова [1, с. 58], согласно которой для любой несмещенной оцен- оценки Т\ заданной функции т. (9) можно построить новую несмещенную оценку Т* == EoG"i ] Г), зависящую от до- достаточной статистики Т, для которой D07"* ^ DaTi. Сле- Следовательно, оптимальную оценку надо искать среди функ- функций от достаточной статистики. При отыскании явного вида оптимальных оценок важную роль играет свойство полноты достаточной статистики. Статистика Т называется (ограниченно) пол- полной, если для всякой (ограниченной) функции фG"), из того, что ЕофG") = 0-V9. следует, что ф(/) = 0 на мно- множестве значений Т. Для полной достаточной статистики всякая функция от нее является оптимальной оценкой своего среднего. Следовательно, если оценивается заданная параметриче- параметрическая функция т (8), то оптимальная несмещенная оценка т* — такая функция т* = Н(Т) от полной достаточной статистики Т, которая удовлетворяет уравнению несме- несмещенности Ее Н{Т) = т (8). Это уравнение либо имеет един- единственное решение, либо решений нет. В последнем случае класс Тх несмещенных оценок т F) пуст. Многие модели математической статистики уклады- укладываются в схему г-параметрического экспоненциального семейства, т. е. когда функция f (х; 8), 8 = @i, ..., 8,)е ебс/?' представима в виде г / (х; 0) = ехр{ 2 B,Bj(x) + С (8) + D (х)\ (или приводится к такому виду заменой параметров). В этом случае Т = (Ти ..., 7",). Т1 = Т1(Х) = 2 B^Xl), j = i = i = 1, ..., г, — минимальная достаточная статистика, и она полная, если dim в = г. 4. Одним из наиболее универсальных методов оце- оценивания неизвестных параметров распределений являет- 42
ся метод максимального правдоподобия. По этому ме- методу оценкой максимального правдоподобия (о.м.п.) в„ параметра 0 по выборке X = (X , Х„) является такая точка параметрического множества 0, в которой функция правдоподобия L (х; 0)л при каждом X = х достигает максимума, т. е. L (х; §„) > L {x; 6)V 6, или L (х; 0„) = = sup L (х; 8). Если для каждого х е X максимум L (х; 8) достигается во внутренней точке G и L (х; б) дифферен- дифференцируема по 0, то о.м.п. 0„ удовлетворяет уравнению правдоподобия dln^;Q) = 0 (или dln^;6) = 0, / = = 1, ..., г, если 0 = @, 0,)). Если оценивается некоторая параметрическая функ- функция т (8), то ее о.м.п. тл = т Fл) — это так называемое свойство инвариантности оценок максимального правдо- правдоподобия. В тех случаях, когда уравнение правдоподобия не удается решить точно, прибегают к различным прибли- приближенным методам решения. Одним из них является ре- рекуррентный метод накопления Фишера, согласно кото- которому (k + l)"e приближение для о.м.п. вычисляется по формуле = 0* + U(x\ е*)/л/(84), k = 0, 1, 2, ... ; при этом в качестве начального приближения 0О берут значение какой-нибудь легко вычисляемой состоятельной оценки 0. Для регулярных моделей оценки максимального прав- правдоподобия обладают рядом важных асимптотических свойств. Именно [1, с. 73—75], если Qn существует, единственна и лежит внутри 0, то она является состоя- состоятельной оценкой 0, причем ее распределение является асимптотически нормальным: Ьо(л/пфп - в)) -^ JV(O,/"'(в)). п->оо если дополнительно предположить, что функция / (х; 0) трижды дифференцируема по 0 и при этом if' 2 ^ М (х), где функция М (х) не зависит от 0 и интегри- интегрируема: ЕоМ (!) < оо. Если элементы матрицы /@) не- непрерывны по 0, то также Ф - 0)) ~ N{0,I-\Qn)). 43
Более того,лесли тл@) — непрерывно дифференцируемая функция и тп = т (9„) — ее о.м.п., то при п-> оо 1о(Уй (тя - а также где а?(8) = Ь'(в)/-'(в)Ь(в), 6(8) = (^- ^). Вели- чина о?@)/« называется асимптотической дисперсией статистики т„ и совпадает с границей Рао — Крамера для дисперсий несмещенных оценок функции т (8). Такое свойство оценок максимального правдоподобия называет- называется асимптотической эффективностью. Если имеется некоторая другая состоятельная и асимп- асимптотически нормальная оценка Тп для функции т@): Lo (У я {Тп — т @))) -»¦ N (О, а? @)), то еб «качество» можно л—»-оо измерять величиной eff (Т„; 9) е= a?(8)/arF), называемой асимптотической эффективностью оценки Тп: оценка тем асимптотически «лучше» (точнее), чем больше ее асимп- асимптотическая эффективность; для о.м.п. же эта величина равна 1. 5. Наряду с точечным оцениванием неизвестных пара- параметров распределений в математической статистике ис- используется оценивание с помощью доверительных ин- интервалов или (в случае векторного параметра) дове- доверительных множеств. Пусть 0 — скаляр. При интер- интервальном оценивании ищут две такие статистики 7", = = Ti(X), i = 1,2, что Т\ < 7*2, для которых при задан- заданном доверительном уровне у е @, 1) выполняется условие Ро (Г, (X) < 6 < Т2(Х)) > y V 6 е= в. (*) Такой (случайный) интервал G"i, 7) с: в называют у-до- верительным интервалом для 0. Длина этого интервала Ti — Т\ характеризует точность локализации неизвест- неизвестного параметра, а доверительный уровень у — его «на- «надежность»: вероятность ошибиться, утверждая, что 6ё(Т|, Г2), не превышает 1 —у. Поэтому на практике величину у выбирают обычно близкой к 1 (у = 0,95; 0,99 и т. д.), и при выбранном у стремятся построить крат- кратчайший (в том или ином классе) интервал. Иногда рассматривают односторонние доверитель- доверительные интервалы: верхний (вида 0 < Ti{X)) или нижний (вида Г|(Х)<0), определяемые условиями, аналогич- 44
ными (^), в которых опускают соответствующую вто- вторую границу. Аналогично определяют доверительный интервал для отдельной компоненты (например, 8i) в случае векторно- векторного параметра: Ро(Г, (ДО < 6, < Т2 (X)) а также доверительный интервал для параметрической функции т (G): РвG| (X) < т (9) < Т2 (X)) >vV8e9. Если оценивается векторный параметр б = (8i, ..., 6,), то ^-доверительная область для него есть такое случай- случайное подмножество С,(Я)сгв, которое удовлетворяет условию Такое подмножество строят обычно с помощью некото- некоторой статистики Т {X), распределение которой известно. Если требуется оценить скалярный параметр 6 и су- существует такая случайная величина G (X; 0), зависящая от наблюдений X = (Х\,..., Хп) и оцениваемого парамет- параметра, что: 1) распределение G(X; 8) не зависит от 0 и 2) при каждом дсеХ функция G (х\ 0) непрерывна и строго монотонна по 0 (в этом случае G (X; 6) называют цент- центральной статистикой), то -у-доверительный интервал для 9 строят следующим образом. Определим числа g\ < gi из условия Pe(gi < С (Я; 8) < g2) = V и решим урав- уравнения G(X;Q) = g\,g2 относительно 0. Обозначая через Ti = Ti(X), i= 1,2, 7"i < Г2, эти решения, получаем искомый интервал вида {T\,Ti). Методику, основанную на использовании центральных статистик, можно приме- применять и для оценивания отдельных компонент парамет- параметрического вектора в = @i 8,), а также для оценива- оценивания скалярных параметрических функций т = т (8). Если уже имеется некоторая точечная оценка Т = = Т (X) параметра 0 и ее функция распределения F (t; 0) непрерывна и монотонна по 0, то, определив из уравнений (относительно 0) F (Г; 8) = A - v)/2, 1 - F (Т - 0; 0) = A - у)/2 два случайных числа 7",- = Ti(X), i = 1,2, Т\ < 7ъ, полу- получим центральный -у-доверительный интервал G\, 7"г) для 0. Для больших выборок в ряде случаев удается по- построить приближенные доверительные интервалы, осно- 45
ванные на оценках максимального правдоподобия. Так, если т (б), 8 = (бь ..., 0,), — непрерывно дифференцируе- дифференцируемая функция и т„ = т F„) — ее оценка максимального правдоподобия, то в случае регулярной модели асимпто- асимптотическим ^-доверительным интервалом для т @) является интервал (тя ± суах Fn)/V« ), где ст?F) = 6'(в)/ (9N(9), *(В) =(^...,^-), cv = Ф-^) • В частности, асимптотическим "уД°веРительным интервалом для ска- скалярного параметра 6 является интервал @„ ± cy/^Jni (Qn))- Подобные интервалы являются асимптотически наикрат- наикратчайшими и они основаны на стандартной нормальной аппроксимации для о.м.п.: 1в(тв)~ЛГ(т(е),о?(вв)/я). § 1. Оценки и их общие свойства 2.1. Убедиться в несмещенности и состоятельности следующих статистик: а) Тп(Х) = Fn(x) как оценки теоре- теоретической функции распределения F (х) в заданной точке х; б) Тп(Х) = Ank как оценки теоретического момента а* = Eg*; п в) Тп(Х) = — 2 {%i — aiJ как оценки дисперсии \i2 = п t — i = D| в случае, когда среднее см = Е| известно; г) Тп(Х) = —^—— S2 ^ 5'2 как оценки \i2 в общем слу- случае. Является ли S2 состоятельной оценкой ji2? Указание. Воспользоваться задачей 1.27 и нера- неравенством Чебышева (предполагается, что соответ- соответствующие теоретические моменты существуют). 2.2. В каких случаях статистика Тп(Х) = л]АП2/2 яв- является состоятельной оценкой теоретического среднего а,? 2.3. По выборке X = (Х\, ..., Хп) из распределения L (|) построить несмещенную оценку его характеристиче- характеристической функции (х. ф.). | Указание. Рассмотреть эмпирическую х. ф. 2.4. Пусть X = р,,, Xi2), ..., {Хп\, Хпг)) — выборка из распределения двумерной случайной величины | = = (|i, |2). Доказать, что несмещенной оценкой для цп = = cov(|i,b) является статистика Т(Х) = —^-Si2, где S\2 — выборочная ковариация (см. решение задачи 1.38). 46
Указание. Рассмотреть случайную величину |i -f- Ъ и воспользоваться решением задачи 2.1 п. г). 2.5. Пусть X = (Х\, ..., Х„) — выборка из распределе- распределения В/A,0). Описать класс параметрических функций т (G), для которых существуют несмещенные оценки Т (X). Убедиться, что в этот класс не входят, в частности, функ- функции т (9) = 1/0" при а > 0 и т (9) = О4 при Ь > п. 2.6*. По результатам п испытаний оценивается не- неизвестная вероятность «успеха» 0 в схеме Бернулли В1{\, 9). Обозначая через г„ число успехов в этих испыта- испытаниях и рассматривая класс оценок вида Г = f ,вы- числить ср^днекзадратическую ошибку оценки Т и срав- сравнить ее с ошибкой «обычной» оценки г„/п. 2.7. Пусть 1 (|) = Bi (k,0) и /z=l. Рассмотрим функции вида т,5(9) = 0'A — G)s при целых г, s ^ 0. Показать, что несмещенная оценка для т,5 @) существует лишь при r + s^ Ьв этом случае она имеет вид T(X) = (X)r(k - X)s/{k)r + s, где (а)г = а(а - 1)... (а - г + 1), г S* 1, (а)о = 1. 2.8. Пусть Л! = (Х|, ...,А"„) — выборка из распределе- распределения Bi(k, 0) и Т = Х\ + ... + А'л. Описать класс пара- параметрических функций т @), для которых существуют не- несмещенные оценки вида Н(Т). Построить несмещенную оценку такого вида для тДО) = 0'. Указание. Воспользоваться свойством воспроиз- воспроизводимости распределения Bi(k,0) (см. задачу 1.39 п. 3) и задачу 1.52 п.б)). 2.9. Пусть Щ) = П@) и п = 1. Проверить, что ЦХ) = = (X)j — несмещенная оценка т@) = 0' (/ = 1, 2, ...), а для функций т@) = 0~а при а> 0 несмещенных оценок не существует. Построить несмещенную оценку для A+в)-1. 2.10. Пусть по одному наблюдению над дискретной случайной величиной ? с распределением {(х; 0) = = е~° — /A —е~°), х = 1, 2, ... (урезанное в нуле пуас- ооновское распределение), требуется оценить функцию т@) = 1 — е~°. Убедиться в том, что здесь имеется един- единственная несмещенная оценка, но она практически бес- бесполезна. 2.11. Пусть L(|) = Bi(r, 0) и ii = 1. Построить несме- несмещенную оценку функции т@) = 0s (s ^ 1 —целое) и 47
убедиться в том, что при г = 1 эта оценка практически бесполезна. Указание. Воспользоваться формулой A — Q)~r = оо = 2 Cj + ,-,8''. / = о х , 2.12. Показать, что Т(Х) = 2 — — единственная ¦ = 1 ' несмещенная оценка функции т(8) = 1пA—8) в модели Щ\, 6) при п = 1. 2.13. Убедиться в том, что Т* = X2 — — — несме- п щенная оценка функции т(8) = б2 в модели N(Q, а2). 2.14. В модели Л/(ц, 82) требуется оценить тF) — б2 по выборке объема п. Показать, что выборочная дисперсия S2 имеет меньшую среднеквадратическую ошибку, чем несмещенная оценка т* = — 2 №~М'J- Какая из двух п' п ' несмещенных оценок т* и S (см. задачу 2.1 п. г)) точнее? 2.15. Доказать, что Т„{Х) = л1^-• — 2 IX- —М-1 — не- 1 п п = 1 смещенная и состоятельная оценка параметра 9 в моде- модели #(ц, б2). 2.16*. Путгь X = (Х\, ..., Хп) — выборка из распреде- п ления N{p, 92) и 72 = 2 (X — м^J- Доказать, что несме- i = 1 щенной оценкой для функции т*(9) = 6* при любом целом г(т) k~^ 1 является статистика т? = j_ )—ттг^'- Срав- нить оценку if с оценкой, указанной в предыдущей задаче. Указание. Использовать тот факт, что 1о(Г2/92) = 2.17. Дана выборка X = (X, Х2, Х3) из распределения ЩО, б2) и пусть Т = Т(Х) = лЩЦ^ХТ+Хз- Рассмотрим статистику рт(х) = —-1(\х\ < Т), где /(•) — индикатор, которая как функция переменного х представляет собой плотность равномерного распределения на отрезке 48
[-T, Т]. Убедиться в том, что рт(х) при любом х является несмещенной оценкой для плотности исходного распре- распределения ЛГ(О, 02). Указание. Воспользоваться тем, что L0(T2/Q2) = 2.18. Рассмотрим задачу оценивания неизвестной дис- дисперсии 02 в общей нормальной модели N(Q\, в2). Пусть X = (Xi, ..., Хп) — соответствующая выборка и S' — несмещенная оценка 0| (см. задачу 2.1 п. г)). Рассмот- Рассмотрим класс оценок вида 7\ = XS'\ Убедиться в том, что при —'ТТ~<^^<~ 1 статистика 7\ имеет меньшую средне- квадратическую ошибку, чем 5'. При каких целых k этому подклассу принадлежат статистики —тт2 (^ ~~ — Xf} Найти оптимальную (по критерию минимума среднеквадратическои ошибки) оценку в классе G\). 2.19* (продолжение задачи 2.18). Построить опти- оптимальные оценки вида 7\ = XS'2, минимизирующие меры ЕоG\ — Q2)* и Ее I 7\ — 021 соответственно. I Указание. Воспользоваться теоремой Фишера и задачей 1.45. 2.20. Доказать, что в модели задачи 2.18 несмещен- несмещенной оценкой для функции т*@) = 02 при любом целом k ~> 1 является статистика • / " \ \ ^ / с*; т* == ( тг) —;:—r~i—гт-5 > где 52 — выборочная дисперсия. Рассмотреть случай п = 2 и вычислить смещение статистики \Х\—Х2\ как оценки 02. | Указание. Учесть, что La(nS2/82) = %2(п — 1). 2.21. Пусть X = (Х\, ..., Хп) — выборка из распреде- распределения Г@, X) и Т = Xt + ••• + Хп. Убедиться в том, что статистика т'а = Т~а — несмещенная оценка функции та@) = 6~а при любом а< Хп. Указание. Воспользоваться свойством воспроиз- воспроизводимости гамма-распределения (см. задачу 1.39 п. 2)). 2.22*. Продолжительность горения электрических ламп имеет распределение Г@, 1). Чтобы оценить 0, берут выборку из п ламп и наблюдают «времена жизни» пер- 49
вых г перегоревших ламп Х^) < Х&) < ••• < Х(Гу Постро- Построить оптимальную несмещенную оценку вида Т(Х) — Указание. Перейти к величинам Yr =п ~д + ' {Х,г) — — Х(г - \)), г= 1, ..., п (Х(о) = 0), и воспользоваться задачей 1.34. 2.23. По выборке Х = (Х\, ..., Хп) из распределения /?(8, 29) требуется оценить параметр 0. Рассмотреть класс оценок вида Т = Т(Х) = аХ(П) + р^о), а, р ^ 0, и найти в этом классе оптимальную несмещенную оценку. | У к а з а н и е. Воспользоваться задачей 1.36. 2.24. Оценивается параметр 0 равномерного распреде- распределения /?@, G) по выборке X = (Х\, ... , Х„). Убедиться в том, что обе статистики Tt =-^-i—х^„) и Гг = (п -\- \)Хщ несмещенные. Какая из них предпочтительнее? Указание. Воспользоваться задачей 1.36; устано- установить, что оценка 7*2 не является состоятельной. 2.25. Пусть Х = (Хи .... Х„) — выборка из /?@,, 02). Доказать, что статистики Т\ = (A'(i) + Х(„))/2 и 7 = = " ZII (^t") ~ ^С)) — несмещенные и состоятельные оценки функций т,@) = F| + 02)/2 и т2@) = 02 — 0| соот- соответственно. (Указание. Воспользоваться задачей 1.36. 2.26. Убедиться в том, что если X = (Х\, ..., Х„) — вы- выборка из распределения Вейбулла с неизвестным пара- параметром сдвига 0 — W( 6, а, Ь), то статистика Т{Х) — = Х(\)— bli I -\ )п~]/а — несмещенная и состоятельная оценка параметра 0. Указание. Воспользоваться решением зада- задачи 1.37. 2.27. Показать, что для логистического распределения с плотностью f(x\ 0) — e~* + u(l + e~x + l])~i, — оо <х< оо, 0е(- со, оо), несмещенной и состоятельной оценкой па- параметра 0 является выборочное среднее X. 2.28. Показать, что выборочное среднее X для модели Коши К@) не является состоятельной оценкой пара- параметра 0. Указание. Воспользоваться свойством среднего арифметического для распределения Коши. 50
2.29. Оценивание для полиномиального распределе- распределения. Пусть случайная величина | принимает конечное число значений а.\, ..., ац с неизвестными вероятностями р\, ..., pN (р\ + ... + pN = 1). Чтобы оценить параметры О = (ри ..., рл/-0 (параметр pN = 1 — р, — ... — pN-\), про- произведено п независимых наблюдений над ?. Пусть vr — число членов выборки, равных а,, г = 1, ..., N. а) Показать, что статистики ТГ=—^—, г = \ N — несмещенные и состоятельные оценки параметров рь ..., ры соответственно. б) Описать класс параметрических функций т@), для которых существуют несмещенные оценки вида Н{Ти ..., TN). в) Построить несмещенную и состоятельную оценку N ФУНКЦИИ т(б) = 2 CiPi . i = I Указание. Учесть, что L(vi, ..., v/v)= M(n; p\, ..., pN), и воспользоваться решением задачи 1.52. 2.30. Оценивание по методу моментов. Пусть Я = = (Х\, ..., Х„) — выборка из распределения L(|) e {F(x; 8), 6 = (9,, ..., в,)^е) и моменты ак(в) = Ее1к, k=\,...,r, существуют. Тогда, решая относительно 9|, ..., 0Г уравне- уравнения а*(8) = АПк, k = 1, ..., г, где Апк = А„к(Х) — выбороч- выборочный момент /г-го порядка, получаем значения оценок параметров, найденных методом моментов. Найти по методу моментов оценки параметров гамма- распределения r(Gi, G2) и убедиться в их состоятельности. 2.31. Найти методом моментов оценки параметров «двойного» распределения Пуассона, задаваемого веро- вероятностями х = 0,1,2,..., е = (е,,е2),о<е,<е2. Такое распределение описывает, например, число столк- столкновений с молекулами газа в камере Вильсона частиц, получающихся при распадении ядра урана в результате бомбардировки его нейтронами. Вычислить значения полученных оценок для следую- следующих данных, полученных при п = 327 наблюдениях над случайной величиной | (через пх обозначено число на- наблюдений, в которых I = х): 51
X 0 28 1 47 2 81 3 67 4 53 5 24 6 H13 7 8 9 3 9 2 10 1 2.32. Смоделировать выборки, объемы которых п = = 10,100,1000 из равномерного распределения /?@, Q) при 0 = 1, и оценить методом моментов параметр 0. 2.33.* Выборочный контроль. В некоторых системах статистического контроля качества продукции поступают следующим образом. Из партии, содержащей N изделий, случайным образом без возвращения отбирают на конт- контроль п изделий, каждое из которых проверяют на добро- доброкачественность. Если число k обнаруженных в выборке дефектных изделий удовлетворяет неравенству k^Lko, где k0 — задаваемый заранее некоторый уровень (kQ<.n), то их заменяют на исправные, после чего вся партия прини- принимается. Если же k>ko, то контролю подвергают все N изделий и все дефектные изделия заменяют исправными. Обозначим через D неизвестное число дефектных изделий в партии (D = 0, 1, ..., N) и пусть случайная величина | — число обнаруженных при описанном способе дейст- действия дефектных изделий. Тогда Ро(? = /г) = /(Л; D, п) = с&Сг_*0/СЙ, k = 0, 1, .... *0, pD(|=D)= 2 f(k;D, n) (при D>ka). к = *„ + I Предположим, что требуется оценить заданную функцию x(D) от числа дефектных изделий в партии. Доказать, что всегда существует и притом единственная статистика ТA), являющаяся несмещенной оценкой x(D), т.е. усло- условиями Ed Щ) = 2 T(k)f(k; D, п) + T(D) ? f{k; D, n) = t(D) , к = 0 * = *з + I D = 0, 1, ...,Л/, функция T(k) однозначно определена. Рассмотреть случай t(D) = D. Указание. Использовать тот факт, что при D^Lka гипергеометрические вероятности f(k; D; п) = 0 для k>k0. 2.34*. Оценивание для конечной совокупности. Пусть имеется конечная совокупность U = [u\, ..., и^} из N объек- объектов, каждый из которых характеризуется некоторой ве- 52
личиной х(и), ые U. Значения х, = х(щ), i = 1, ..., /V, неизвестны, и требуется оценить их сумму Т = Т(х) = N = 2 ¦*>¦ Предположим, что можно наблюдать каждое <¦ = i подмножество (выборку) s = {щи ..., щф)) элементов из U с некоторой вероятностью p{s). Таким образом, если S = {s}—совокупность всех выборок, то 2 P(s) = 1- В s e S этом случае говорят, что задан выборочный план Л = = (U, S, Р). В качестве оценок для Т рассматриваются статистики e(s, x), которые зависят от х только через те Xi, для которых щ е s (т. е. оценка есть функция вы- выбранных объектов и их наблюдавшихся х-значений). Оценкой Гореица — Томпсона называется статистика MS х) = у *(") где п(и) = 2 P(s)—вероятность включения в выборку объекта и. а) Доказать, что e(s, х) — несмещенная оценка Т(х), т. е. и что других несмещенных оценок вида 2 а(и)х(и) не су- ществует. б) Вывести формулу для дисперсии оценки Горви- ца — Томпсона: ) . где п(и, и) = 2 P(s) — вероятность включения в вы- борку объектов и и v. в) Проверить, что несмещенной оценкой для De(s, x) является статистика \ts х\ _ у х» ( ' Л , у *Щи) ( Ф. у) Л 53
г) Показать, что среднее и дисперсия объема n(s) выборки s для выборочного плана A=(U, S, Р) выра- выражаются через вероятности включения п(и) и п(и, v) сле- следующим образом: t ) = 2 (п(и, v)- п(и)л{и)) + + 2 п(«Х !-"("))• и Указание. Ввести индикаторные случайные величи- !1 РОЛИ 1J С— ^ ~ О,' если u<?s и записать n(s) и Ф. *) в виде /i(s) = 2v(«). Ф. ж) = 2 v(«W«)/n(«) • U U 2.35* (продолжение задачи 2.34). Рассмотрим выбо- выборочный план А* = (U, S, Р), порождающий равновероят- равновероятные выборки без повторения объема п. В этом случае множество S состоит из (N)a всех упорядоченных комби- комбинаций длины п из различных элементов U и p(s)= а) Показать, что оценка Горвица — Томпсона имеет в данном случае вид 1 " б) Обозначим через \l = T(x)/N, a2 =— —2 (*; — — ц) соответственно среднее и дисперсию совокупности U. Тогда — e(s, х) = х (выборочное среднее наблюден- наблюденных ^-значений) является несмещенной оценкой для ц. Проверить, что Dx = ( лг)°2- в) Доказать, что статистика является несмещенной оценкой а2. Замечание. Справедлив более сильный результат: a2(s, x) является оптимальной оценкой о2 в классе всех несмещенных квадратичных оценок, т. е. оце- оценок вида 2 а{и, v){x(u) - x){x(v) - х). U, U? S 54
2.36.* Оценивание размера конечной совокупности. Пусть имеется конечная совокупность U, число элементов которой N неизвестно. Из этой совокупности п раз извле- извлекается простая бесповторная выборка объема m (каж- (каждый раз любая из Cf} возможных комбинаций элементов U может быть извлечена с равной вероятностью). Обоз- Обозначим через ц, — (xr(n, m, N) число наблюдавшихся эле- элементов, каждый из которых повторился ровно г раз (г = 1, 2, ..., п). Рассматривается задача оценивания па- параметрических функций t(N) по выборочным данным Доказать, что в классе линейных статистик L = {/ = п = 2 1г\у-г) несмещенная оценка для x(N) существует лишь в случае, когда x(/V)—полином от -гг- степени k^n — 1. В этом случае, если t(N) = 2 Ci/N', то единственной / = i несмещенной оценкой для i(N) является статистика х = 1 В частности, — У г(г — \)аг — единственная m*n(n- l),f, линейная несмещенная оценка для r(N) = 1//V. Указание. Представить \х.г в виде суммы индикато- индикаторов: цг = ^(|' + ... + ?$, где ^/' = !, если i-й элемент U повторился г раз, и ti] =0 в противном случае, i=\, ...,N. 2.37.* (продолжение задачи 2.36). Пусть rj = jxi -J- -\-...-\-цп — общее число наблюдавшихся элементов и Н — класс статистик вида //(т|). Доказать, что: а) если Л/^тл, то для любой функ- функции t(N) несмещенной оценкой в классе Н является статистика т*= 2 {-\T-ii j = m б) если же априори N может быть любым целым чис- числом (N^tn), то указанная статистика является несме- 55
щенной оценкой функции x(N) при дополнительном усло- условии, что т(Л/) = /(yV)(Cw)~n, где /(Л/) — многочлен степени не выше тп, удовлетворяющий условиям /@) = /A) = = ... = f(m — 1) = 0. 2.38. Метод Монте-Карло. При отыскании значений различных величин (определяемых, например, некоторы- некоторыми уравнениями или интегралами) часто используют вычислительный метод, основанный на вероятностной интерпретации искомых величин и использовании реали- реализаций случайных испытаний, — так называемый метод Монте-Карло, или метод статистических испытаний. Сущ- Сущность этого метода состоит в следующем: исходя из смысла вычисляемой величины а, подбирают такую слу- случайную величину |, чтобы а = Eg; далее моделируют выборку Х = {Х\, ..., Х„) из распределения L(|) ив каче- качестве оценки а используют выборочное среднее X. Тогда (см. задачу 1.61) при /г—»-оо таким образом, ошибка в определении а этим методом с вероятностью у не превышает cyS'/-\fn, когда п велико. Пусть, например, требуется вычислить интеграл a=\...\f(tl,...,tr)dt]...dt,, где v, = ((/i, ..., <r):0<<;< I, i — 1,...,г}. Здесь, очевидно, можно положить ? = f(r\ Цг), где r)i, ..., цг — незави- независимые равномерно распределенные на [0, 1] случайные величины, и смоделировать выборку X возможно, следо- следовательно, с помощью последовательности A.5). 1 Оценить указанным методом интеграл а ==\ exdx, о используя 100 чисел последовательности A.5), и срав- сравнить полученное значение а* с точным значением а. При каком S будет выполняться соотношение Р(|а — ) 2.39. Вычислить методом Монте-Карло значение инте- интеграла =^- § ехр{—±- при т = 3, ел = 1, сг2 = 2, моделируя соответствующую выборку объема п — 100. 56
Указание. Если |i, g2 — независимые случайные величины и 1(|;) =N(O,af), / = 1, 2, то Далее воспользоваться задачей 1.61. 2.40.* Случайное блуждание. Частица, «стартуя» в момент / = 0 из точки k @<?<jV), блуждает по целым точкам отрезка [0, /V]. Если в момент t частица находи- находилась в точке /, то в момент t + 1 она находится в точке / + 1 с вероятностью р или в точке /—1с вероятностью q = 1 — р{\ <| /<! N — 1). В точках 0 и N частица погло- поглощается и случайное блуждание прекращается ([7], гл. XIV). 1) Найти вероятность л*л/ поглощения частицы в точке N. 2) Вычислить Шк = Ет*, где т* — время до поглоще- поглощения частицы. 3) Смоделировать 100 реализаций описанного случай- случайного блуждания при N = 7, k = 3, р — 0,6 и р = 0,5 и найти оценки величин я/w и т.к. Указание. 1) Составить для f(k) = ям уравне- уравнение в конечных разностях: = pf(k+l)+qf(k-\), k= I,..., N-l, и убедиться в том, что единственным его решением является пкц = A — Х*)/A —к"), к = q/p, если р Ф ф q, и щц — k/N, если р = q = -^-. 2) Составить для Шк уравнение в конечных разнос- разностях: т,к = prrik + i + qm.k-i + 1, k = 1, ..., jV — 1, m0 = = ты = 0, и убедиться в том, что единственным его k N решением является т* = Пкы, если q—rq—p рф q, и тк = k(N — ft), если р = q = —. 3) Поступать как и при решении задачи 1.4. § 2. Оптимальные оценки 2.41.* Доказать, что оптимальная несмещенная оцен- оценка всегда является симметричной функцией наблюдений. | Указание. Если Т= Т(Х) — несмещенная оценка 57
т@), то рассмотреть симметрическую статистику Т* = — ^Т(лХ), где п = ( ¦ '".") — перестановка из п элементов, пХ = (Хц, ..., Xin) и суммирование про- производится по всем п\ перестановкам. Показать, что д:г*О7\ 2.42. Доказать следующие свойства оптимальных оце- оценок: если Т* = Т*(Х) — оптимальная несмещенная оцен- оценка некоторой функции т = т@), то: 1) для любой ста- статистики гр = гр(Л) с Eov|j = О \/Q^Q выполняется равенство cov0 (T*, \\>) = 8V0'. 2) для любой другой несмещенной оцен- оценки Т={Х) cov0G"*, T)=D0T*. Указание. В первом случае рассмотреть несмещен- несмещенные оценки вида 7\ = Т* -\- Хгр, Ае/?1. Во втором случае положить гр = 7* — Т. 2.43. Проверить, что количество информации г(8) для соответствующих моделей имеет указанный в таблице вид. Модель i@) N{ 0,a2) I/O2 2/02 Г (ОД) ?i/02 К@) 1/2 Bi(*,6) */[0A- -0)] П@) 1/0 Bi(r.O) /[0A- -0)г1 /F) 2.44. Показать, что информационная матрица для об- общей нормальной моделиЛ^би б!) имеет вид 1/61 Oil О 2/911|. 2.45.* Показать, что информационная матрица для модели задачи 2.29 имеет вид 7(9)= ||&,(8||Г~', где е = (pi,..., ри-\), l/p.v при i = j, _ . _ _ при i =Ф j, Вычислить /~'F). Указание. Записать вероятности f(a,; 0) = Ро(| = = аг) = рг, г — 1, ..., N, в виде А/ О-г', ") z= 11 Pj ==l' — Pi — •¦• — PN —\) X У = ' ^-l X LL Pi " ' . У = 1 где б(а,-, a;) = 1 при I = j и 6(a;, a,-) = 0 при i ф /. 58
2.46.* Модель F= [F(x; 0),0e6j называется экспонен- экспоненциальной, если функция f(x; 0) имеет вид f(x; 0) = exp[A(Q)B(x) + С@) + D(x)}. Доказать, что эффективная оценка т* для некоторой параметрической функции т(8) существует тогда и только тогда, когда модель F— экспоненциальная; при этом тF)= - дС(О) I dA(O) -I- дО, если б — скаляр , О- если 0 = F|, Вывести следующие формулы для дисперсии Dux*: т'@) Dot* = р. * 1 Dot* =- пА'ф) если Н — скаляр , Указание. Воспользоваться критерием эффектив- эффективности. 2.47. Доказать, что для экспоненциальной модели со скалярным параметром функция /@) = (С'F)Л"(8) — - C"(Q)A'{Q))/A'(Q) и ЕоВ(?) = - СЩ/АЩ. Указание. Сравнить выражение для Dot* в преды- предыдущей задаче с границей Рао — Крамера. 2.48. Проверить, что для заданных регулярных моде- моделей функция т@), допускающая эффективную оценку т*, эта оценка и ее дисперсия Dot* имеют указанный в таблице вид: Модель N(O.a-) "(и,е2) Г@,>.) Г(а,0) 0@,1) т(о) 0 0^ 0 Г'@)/Г@) 1/0 т* I " х= — 2 X, " /= i х/х — У li\Xi—lna "<= 1 1 " " ,-=1 Dot* O2//l 2 0Vn 9'2/Xn т'@)//1 1 «О2 59
Продолжение Модель Bi(k.Q) 11@) ВЦг,0) т(о) G 0 rO/(l-d) 1* X/k X X Dot* 0A — 0) /kn Q/n rO/K-0J] I Указание. Воспользоваться задачей 2.46. 2.49. Проверить непосредственно, что выборочное среднее X в логистической модели (см. задачу 2.27) не является эффективной оценкой G. Указание. Воспользоваться результатом задачи 2.27. 2.50. Доказать, что оценка Т* в задаче 2.13 является оптимальной. Указание. Рассмотреть линейные комбинации ви- вида -у|^а@) —qq--\- b(Q) -ттг] и воспользоваться крите- критерием Бхаттачария. 2.51. Рассматривается задача оценивания функции т@) = G2 в модели Г@Д) по выборке X = (Хи .... Хп). Доказать, что Т* = Т*{Х) =¦ X2 — оптимальная несмещенная оценка тF); вычислив D07"*, убедиться в том, что эта оценка не является эффективной. Указание. Воспользоваться задачами 2.21, 2.43 и указанием к задаче 2.50. 2.52. Пусть X = (Х\, ..., Хп) — выборка из распределе- распределения Л/@|, Щ). Применив критерий Бхаттачария, доказать, что X и S' (см. задачу 2.1 п. г)) являются оптимальны- оптимальными несмещенными оценками соответственно для 9| и 0|. Сравнить дисперсии этих оценок с соответствующими границами Рао — Крамера. Указание. В первом случае достаточно рассмот- рассмотреть —^—, во втором — рассмотреть линейные ком- комбинации вида вать задачу 2.44. использо- 60
2.53.* Пусть Xi, S'i и X2, 52 — оптимальные несме- несмещенные оценки для среднего и дисперсии одного и того же нормального распределения, вычисленные по двум независимым выборкам объемов п\ и п2 соответственно. Какие функции от этих статистик являются наилучшими оценками тех же параметров, учитывающими всю исход- исходную информацию? Сравнить точность новых оценок с исходными. I Указание. Использовать задачи 2.52 и 2.14. 2.54*. Пусть X = {Х\ Хп) — выборка из обратного гауссовского распределения, задаваемого плотностью [(х; 1) Убедиться в том, что X — оптимальная несмещен- несмещенная оценка параметра ц в любом случае, известен или нет параметр К. Получить отсюда, что EXl=\i, DXi = (x3/X. 2) Найти эффективную оценку k~l в случае известно- известного (X. Указание. Воспользоваться задачей 2.46 и крите- критерием Бхаттачария. 2.55. Предположим, что ищется оценка для диффе- дифференцируемой вектор-функции т@) = (ti@), ..., тт@)), 9 = = F|, ..., 9,). Показать, что в случае регулярной модели для произвольной несмещенной оценки Т = (Т\(Х), ..., Тт{Х))) справедливо неравенство информации De(T)= l!covo(r;, | где В(В) = II —-^—1| , и неравенство Ai^A2 между мат- матрицами одинаковой размерности означает, что матрица А\ — Л2 является неотрицательно определенной. В част- частности, для тF) = 8 D0(T)^lnlF). Указание. Рассмотреть произвольную линейную комбинацию С|Т|@) -f- ••¦ + с,птт(в) = с'т(9), несмещен- несмещенной оценкой которой является с'Т, и применить нера- неравенство Рао — Крамера для скалярных оценок. 2.56. Показать, что если для некоторой функции т@) существует эффективная оценка, то она является доста- достаточной статистикой. Таким образом, для регулярных экспоненциальных моделей (см. задачу 2.46) достаточ- достаточная статистика всегда существует и имеет вид Т(Х) = п =: 2 — B(Xi) (что следует из критерия факторизации). 61
2.57. Доказать полноту достаточной статистики л Тп = 2 Xi Для биномиальной модели B(k, 0) (см. зада- задачу 2.48). Получить отсюда, что в данном случае несме- несмещенные оценки существуют лишь для полиномов т@) = г = 2 а;8' степени r^kn, и при этом оптимальная оценка / =0 Г т* = 2j aj\Tn)i/(kn)j. i = 0 Сравните этот результат с задачами 2.5, 2.7 и 2.8. Указание. Воспользоваться свойством воспроизво- воспроизводимости распределения Bi(k, 0) (см. задачу 1.39 п. 3). 2.58. Доказать полноту достаточной статистики л Тп = 2 -^i Для пуассоновской модели П@) (см. задачу ? = I 2.48). Показать, что оптимальной оценкой для сходяще- сходящегося при всех 0>О степенного ряда т@) = " Указание. Воспользоваться свойством воспроизво- воспроизводимости распределения П@) (см. задачу 1.39 п. 4) и задачу 2.9). 2.59. (продолжение задачи 2.58). Построить оптималь- оптимальные оценки для функций т(в) = е°<2-" , я*(В) = e-°Q"/k\ , k = 0, 1, ..., и т,(9)= Р0(|>0. г= 1,2, ... 2.60*. Пусть Х= (Х\, ..., Хп) — выборка из распределе- распределения степенного ряда, задаваемого вероятностями f(x- 0) = фH7Я0), х = 1,1+1,..., f@) = E a(x)Qx, 0?E0, х = 1 где в = @, R) и /?>0 — радиус сходимости ряда /@). 1) Показать, что в данной модели эффективная оценка существует лишь для функции т@) = 0/'@)//@), и она имеет вид т* = X. 2) Доказать, что Тп = 2 ^< — полная достаточная ? = I статистика и ее распределение имеет вид: 62
Pa(Ta = t) = О'йя(О//я(О), где bn{t) = coef 2,f"(z). 3) Убедиться в том, что статистика . _ (b,,(Tn — s)/bn(Tn) при Tn^nl +s, Ts ~~ \ 0 при Tn<nl + s — оптимальная оценка функции xs@) = 8s для любого s = 1,2 4) Построить оптимальную оценку функции т(9) = = 2) я/9'> где степенной ряд предполагается сходящимся / = ' на G; получить отсюда, в частности, что оптимальная оцен- оценка функции /@) имеет вид /* = bn+i(Tn)/bn(Tn), если Т„^(п+ 1I, и /* = 0 при Тя<(п + \I. Указание. 1) Применить критерий эффективности для экспоненциальной модели (см. задачу 2.46). 2) Использовать производящую функцию со Ф\ б) = 2 z"l(x; G) = /(z х = / k—nl 3) Учесть соотношение 2 a(j)bn(k — j) = 6я + |(?) при +1)/ 2.61. Показать, что оптимальной оценкой для т@) = G урезанного в нуле пуассоновского распределения (см. за- задачу 2.10) по выборке X =(Л"|, ..., Х„) является статистика т* = ГДп0г-7Аг при Т = X, + ... + Х„^п+ 1 и т* = 0 при Т - п, где Д* = 2 (- \f~rCrnrk. /• =0 I Указание. Применить задачу 2.60. 2.62. По выборке X = (Xi, ..., Х„) из распределения Ш(г, 0) построить оптимальные оценки для Т|@) = 8s при целом s> 1 и т2@) = Рв(| = 0) = A — 8)Л. Указание. Воспользоваться решением задачи 2.60; см. также указание к задаче 2.11. 2.63*. Рассмотрим модель с конечным числом N воз- возможных исходов и неизвестными вероятностями исходов р\, ..., ры (см. задачу 2.29). Показать, что r=(vi,..., ...,va'_i) — минимальная полная достаточная статистика. Получить отсюда, что несмещенные оценки в этой модели существуют лишь для полиномов от pi, ...,pN степени, мень- меньшей или равной п, и найти явный вид этих оценок. 63
Указание. Воспользоваться критерием для /--па- /--параметрического экспоненциального семейства и зада- задачами 2.29 и 2.45, а также 1.52 п. б.). 2.64. Доказать оптимальность оценок, указанных в за- задачах 2.13 и 2.16. Указание. Воспользоваться свойством полных достаточных статистик. 2.65. Пусть Х= {X , Хп) — выборка из распределе- распределения /.(?) = Л/F, а2). Построить оптимальную оценку для т(Э) = Ро(|^*о), где х0 — заданное число. Указание. Рассмотреть несмещенную оценку 7", = /(Xi<xo), где /(Д) — индикатор события А, и воспользоваться теоремой Рао — Блекуэлла — Кол- Колмогорова (см. при этом решение задачи 2.64 и 1.56). 2.66. Проверить, воспользовавшись критерием для г- параметрического экспоненциального семейства, что в случае модели Л/[9|, б2) минимальной полной достаточной л статистикой является пара (X, 2 %Ь< а также (X, S2). Ус- i = i тановить оптимальность оценок, указанных в задаче 2.20 (ср. с задачей 2.52). Указание. Перейти к новым параметрам 01 = 2.67. Показать, что в модели Мб, V292) достаточной статистикой является пара Т = (X, S ), но эта статистика не полная. Указание. Рассмотреть функцию ср(Г) = (га + у2)X XS2[(« — 1)y2]~^2 и вычислить ее среднее. 2.68. По результатам п~^2 независимых измерений диаметра 0i круга построить оптимальную несмещенную оценку его площади. Указание. Погрешности измерений считать нормаль- нормальными N@, 0|) случайными величинами; использовать задачу 2.66. 2.69*. Доказать следующее утверждение (теорема Басу): если для модели F = [F(x; 6),Эе6} существует пол- полная достаточная статистика Т и если статистика Т\ имеет распределение, не зависящее от параметра 9, то Т\ и Т не- независимы. Указание. Установить, что для любого события А условная Рй(Т\^А\Т) и безусловная Ра{Т\^А) веро- вероятности совпадают. 64
2.70*. Пусть (Xi, Х2, Х3) — выборка из распределения Щ) == W@, б2). Построить оптимальную оценку для т@) = Р() Указание. См. указание к задаче 2.65, задачу 2.69 и решение задачи 1.58. 2.71*. Пусть X = (Х[, ..., Хп) — выборка израспределе- ния N(d[, 0i). Доказать, что статистики Т = {Х, S2) и U = Х,-Х . , \ — , i = 1, ..., п\ независимы. Указание. Установить, что распределение U не зависит от 0 = @i, 02), и применить теорему Басу (см. задачу 2.69). 2.72*. По выборке Х=(Х\, ..., Ха) из распределения N(Q[, 0г) построить оптимальную несмещенную оценку для функции т@) = Pol Указание. Рассмотреть несмещенную оценку Т\ = = /(A"i^^o), где 1{А) — индикатор события А, и вы- вычислить Н\Т)=Еа{Т\\Т), где Т=(Х, S2); использо- использовать задачи 2.71 и 1.58. 2.73. Убедиться в оптимальности оценок, указанных в задаче 2.21; показать, что при а — Хп^О — целом не- несмещенных оценок для ти@) = 6~а не существует. Указание. Воспользоваться полнотой достаточной статистики Т. 2.74*. Пусть Х= (Х\, ..., Хп) — выборка из распределе- распределения Г(9, Я), Т = Xi + ••• + Хп и ф(х) — заданная функция, для которой т(в) = Eo<p(g) существует. Доказать, что опти- оптимальна» оценка т@) имеет вид Г(Х)Г(Х(л - l))nJ TV ' v ; Получить отсюда результаты задач 2.48, 2.51 и 2.73. | Указание. Установить равенство Еот* = т@). 2.75* (продолжение задачи 2.74). Проверить, что опти- оптимальной оценкой функции надежности т@;/) = Ре(|^0 является статистика гдеВ(;к; а, Ь) — функция бета-распределения Р(а,6) и е(х) — функция Хевисайда. В частности, для распределения Г@,1) функция т@; t) = e-"\ а т* = A — t/T)n~*e{T — t). I Указание. Положить в задаче 2.74 <р(х) = e(x — t). 3—190 65
2.76*. Доказать, что для распределения Вейбулла с неизвестным параметром масштаба G — W@, X, 8) полной п достаточной статистикой является Т = Т(Х) = 2 %Ь а i = 1 оптимальная оценка т(9) = Ео<р(|), где <р(х) — заданная функция, имеет вид т* = (п - 1) \ ф((/ГI/хХ1 - (f-2dt. о В частности, Ев?* = 8х и потому Т/п — оптимальная оценка б*". 2.77. Показать, что для двухпараметрического экспо- экспоненциального распределения W(Q±, 1,62) достаточной ста- статистикой является пара 7* == (AJi>AT). Построить несмещен- несмещенные оценки вида аХ^)-\-рХ для неизвестных параметров модели. Указание. Применить критерий факторизации и воспользоваться решением задачи 1.34, приняв во внимание, что Ы———\ =ГA,1). 2.78. Пусть наблюдаемая случайная величина | имеет область изменения [a(Q),b], где а(8) — заданная монотонная функция 0. Показать, что минимальное значение выборки X(i) является достаточной статистикой для 8 тогда и только тогда, когда плотность /6(х; 6) имеет вид /5(х; 8) = g{x)/h(Q), a(Q)^.x^.b. Этот же результат справедлив и для статисти- статистики Х(„) в случае области [а,6(8)], где 6F) — заданная моно- монотонная функция 8. | Указание. Применить критерий факторизации. 2.79. Пусть Х= (Xi, ..., Хп) — выборка из распределе- распределения R(O,B). Доказать, что Х{„) = max Xi — полная дос- 1 ^i ^ п п таточная статистика для 0. Получить отсюда, что Т* = ^iХ(П) — оптимальная несмещенная оценка 6. Рас- Рассмотреть класс статистик 7\ = ^7"* и убедиться в том, что в нем имеются оценки с меньшей среднеквадратической ошибкой, чем у оценки Г*. | Указание. Использовать задачу 2.24. 2.80. Доказать полноту достаточной статистики Т = = (Х{\), Х(п)) для модели Я(8ь 82). Убедиться в оптимально- оптимальности оценок, указанных в задаче 2.25. Построить оптималь- оптимальные оценки для 0| и 02. | Указание. Воспользоваться задачей 1.36. 66
2.81*. Показать, что статистика Т = (Хщ, Xw) — доста- достаточная для модели R(a(Q), 6@)), где a(Q)<Lb(Q)\/Q — за- заданные непрерывные функции скалярного параметра 6. Определить, в каких случаях существует одномерная достаточная статистика и установить ее вид. Убе- Убедиться, в частности, что для модели R( — 0, 9) доста- достаточной статистикой является max(|X(i)|, |Х(л)|), а для моделей /?@, 0+ 1) и /?@, 20) минимальной достаточной статистикой является Т. 2.82*. Пусть произведено одно наблюдение X над диск- дискретной случайной величиной с распределением Показать, что X — не полная, но ограниченно полная дос- достаточная статистика. Указание. Решить уравнение несмещенности Еоф(^) = 0-V9 в классе всех функций и в подклассе ограниченных функций. 2.83*. Оценивание размера конечной совокупности. Пусть в задачах 2.36, 2.37 величина m = 1. Доказать, что случайная величина г\ является полной достаточной ста- статистикой, и, следовательно, указанные в задаче 2.37 оценки — оптимальные. Замечание. Этот результат справедлив и для произвольного значения т. § 3. Оценки максимального правдоподобия (о.м.п.) 2.84*. Показать, что если в случае регулярной модели для диффренцируемой параметрической функции т@) су- существует эффективная оценка т*, то о. м. п. 6„ параметра 9 однозначно определяется уравнением т@) = т*. Применив этот результат, найти 6П для моделей, приведенных в зада- задаче 2.48. Указание. Воспользоваться критерием эффективно- эффективности и показать, что —?-\ <0 (предполагает- ся, что функция правдоподобия L — L(x; 9) дважды дифференцируема по параметру 0). 2.85. Вычислить асимптотическую эффективность вы- выборочной медианы 7"n = -^(fn/2]+ i) как оценки среднего 0 модели N(Q, a2). Указание. Воспользоваться задачей 1.32 об асимпто- асимптотической нормальности выборочных квантилей. 67
2.86. Доказать, чтол для общей нормальной модели N(QU ei) о. м. п.0 = (8,я, е2п) = (х, S). I Указание. Составить и решить уравнения правдо- I подобия. 2.87 (продолжение задачи 2.86). Показать, что т„ = = Ф(—-7 ) — о. м. п. функции т(9) = ф(—^——'—) (см. задачу 2.72). Найти асимптотическое распределение тя при п—уоо. Указание. Воспользоваться свойством инвариантно- инвариантности о, м. п. и утверждением об их асимптотической нормальности. 2.88. Доказать асимптотическую несмещенность и сос- состоятельность о. м. п. 0„ параметра 0 модели#(ц, б2) (ср. с задачей 2.16) и исследовать ее предельный при я-»-оо закон распределения. Вычислить асимптотическую эффек- эффективность оценки, приведенной в задаче 2.15. I Указание. Использовать задачи 2.43 и 2.84. 2.89. Пусть Х = (Х\, ..., Хп) —выборка из распреде- ления#@, 20). Найти о. м. п. 0„ и доказать ее состоятель- состоятельность. 2.90. По выборке ((Х[у Ki), ..., (Х„, Yn)) из двумерного нормального распределения #(@, 0), Г 2^2 ) с неизвест- неизвестными а2;>0 и ре( — 1,1) построить о. м. п. а2 и р. Указание. Перейти к новым параметрам ^=(<7i. Яг)< положив ?, = <7,@) = - 2gi('[ _ , q2 = = -; (здесь 8 = (а2, р)\ и воспользоваться свой- а (I — р ) ством инвариантности о. м. п. 2.91*. Имеется выборка ((^i, Y\), ..., (Хп, Yn)) из двумер- A fl \ (О, 0),|L ,||J, е(— 1,1). Составить уравнение правдоподобия для отыс- отыскания о. м. п. 0П и вычислить ее асимптотическую диспер- дисперсию. 2.92 (продолжение задачи 2.91). Рассмотреть в каче- качестве оценки 8 выборочный коэффициент корреляции Тп = = —2 X-iYi и вычислить его асимптотическую эффектив- эффективность. Указание. При вычислении моментов использовать | характеристическую функцию. 68
2.93*. Пусть Х = (Х\, ..., X») — выборка из ^-мерного нормального распределения^ (ц, 2) с неизвестными ц = = (м-,, .... цк) и S = Но,-,-!!?, |2| ф О, т. е. X, = (Х1и ..., Х,„), I = 1, ..., п, — независимые случайные величины с плот- плотностью х = (х Хк), 0 = (ц, 2). Обозначим Х= (Х\, ..., Хк), где X, = — 2 Х„ , 2 = ||S/y||?, где S,-,- = — 2 (^я - ^/)(^/ - i i /=i А"у)—выборочная ковариацня, соответствующая теорети- теоретической ковариации о,,-, так что *=— 2 *, ? = ?(A) = -i-2 (*-ад-А)'. 1) Доказать,_ что о. м. п. параметров ц и 2 равны соответственно X и 2. 2) Убедиться в том, что , У. — несмещенная оцен- оценка 2. "-' 3) Получить следующее выражение для максимума функции правдоподобия: 2{)) B)*11/2()Г''/2 тахЦх; 0) = Цх; х, 2{х)) = Bле)-*11/2|2(л;) Указание. Привести функцию правдоподобия к виду Цх; 6) = [Bл)* 121Г 4«р{ —т<х- n)'Z " [(х - ц) - использовать задачу 2.4. 2.94*. Пусть X = (Xt, ..., Хл) — выборка из логнормаль- ного распределения, т.е. Х,= еу\ где?(К,) =jV@i, б2.). По- Построить о. м. п. для функций Т|@) = Eo/Vi и Т2F) = DaA'i. Вычислить ЕоТ|„ и убедиться в асимптотической несмещен- несмещенности оценки Т|„. I Указание. Воспользоваться свойством инвари- | антности о. м. п. 2.95. Распределение Кептайна. Это распределение за- задается плотностью к*-0) = iS где g(x) — некоторая дифференцируемая монотонно воз- возрастающая функция. Убедиться в том, что справедливо 69
следующее обобщение результата задачи 2.86: о. м. п. 8„ = = (?, Т), где g = -1-2 g(X,-). Г- = i-2 (g(X,) - gf . Яв- ляется ли g эффективной оценкой Oi? Показать, что при известном значении 0\ — а эффективной оценкой 0§ явля- является статистика [ср. с соответствующими результатами для нормальной модели (задача 2.48)]. I Указание. Воспользоваться задачей 2.46. 2.96. Пусть случайная величина ? имеет распределение типа степенного ряда (см. задачу 2.60). Показать, что уравнение правдоподобия для_нахождения о. м. п. 0„ в дан- данном случае имеет вид ц(8) = X, где ц(8] = Ео?. Вычислить асимптотическую дисперсию оценки 6„. Применить эти результаты для оценивания параметра 0 модели Bi(r, 0). 2.97 Записать уравнения метода накопления для при- приближенного вычисления о. м. п. 0„ параметра 0 урезанного в нуле пуассоновского распределения (см. задачу 2.10). | Указание. Использовать решение задачи 2.96. 2.98. Пусть в полиномиальном распределении М(п\ р\, p,v) вероятности исходов р,- = р,F), i = 1, ..., N, где 6 — неизвестный скалярный параметр. Записать уравнения метода накопления для приближенного вычисления о. м. п. бя. 2.99. Рассматривается задача оценивания параметра 0 модели Коши/СF) по соответствующей выборке Х= (X], . , Хп). Записать уравнения метода накопления для прибли- приближенного вычисления о. м. п. б„. Рассмотреть в качестве оценки 9 выборочную медиану Тп = Хлп i \ и вычислить ее асимптотическую эффективность. I Указание. Использовать задачи 2.43 и 1.32. 2.100. Пусть X = (Х\, ..., Хп)—выборка из равномер- равномерного распределения R@, 0). Показать, что в данном случае о. м. п. 6„ = Х(П), убедиться в ее состоятельности и найти ее предельный закон распределения (гс->оо). | Указание. Воспользоваться задачами 2.24 и 2.79. 2.101. Показать, что в случае модели R(O——,Q-\- + —J любое значение 0е|Х(П) —, Хщ + -у] является 70
о. м. п. Qn. Какая точка этого интервала является несме- несмещенной оценкой 0? Указание. Использовать решение задачи 2.80 и задачу 1.36. 2.102. Показать, что для параметра сдвига 9 распре- распределения Вейбулла W(Q,a,b) при 0<сс<1 о. м. п. 0„ = = X(i), убедиться в ее состоятельности и найти ее предель- предельный при я->-оо закон распределения. | Указание. Использовать решение задач 1.37 и 2.26. 2.103. Случайная величина ?, характеризующая срок службы элементов электронной аппаратуры, имеет распре- распределение Релея W@, 2, -\/6), плотность которого f(x; 9) = = Bx/6)e"jr'/e, х^О. Построить по соответствующей вы- выборке Х={Хи ..-, Хп) о. м. п. 6„ (ср. с задачей 2.76). 2.104. По выборке X = (Xt, ..., Х„) из распределения Г(ЭД) требуется оценить функцию т(9) = —. Показать, что о. м. п. тл = %/Х. Убедиться в состоятельности этой оценки и найти ее предельный при п-*- оо закон распреде- распределения. Указание. Воспользоваться задачами 2.21, 2.43 и 2.84. 2.105*. Доказать, что для распределения Лапласа, за- задаваемого плотностью f(x; 9) = —e~l"~*\ Jte/?, о. м. п. Э„ совпадает с выборочной медианой. Можно ли здесь воспользоваться теоремой об асимптотической нормаль- нормальности о. м. п.? 2.106*. Пусть X = (Х\, ..., Хп) — выборка из распреде- распределения^^, 1). Тогда (см. задачу 2.84) о. м. п. Э„ = X и Lq{X) = N{Q, 1/n). Рассмотреть в качестве оценки 9 статис- статистику у _ I оХ при \Х\ >а„ , \bX при \Х\<ап, где константа ая->0, но -фгаа->- оо при п->- оо, и вычислить ее асимптотическую эффективность. „ л2.107. Привести примеры о. м. п. 6Я) для которых e ' () Указание. Рассмотреть модель /?@,9) (см. задачу 2.100) и модель Вейбулла (см. задачи 2.102 и 1.37). 2.108. Рассмотрев задачу оценивания функции т@) = = 6~' в модели П@), убедиться в том, что о. м. п. т„ ни при каком п не имеет конечных моментов, но ее симптотическая дисперсия существует и равна @3я)~'. 71
I Указание. Использовать задачи 2.84, 1.39 и 2.43. 2.109*. Преобразования, стабилизирующие дисперсию. Для моделей Bi(k,B), U{Q),N(\x., в2) и Г(вД) найти такие параметрические функции т(8), чтобы асимптотические дисперсии соответствующих о. м. п. хп не зависели от пара- параметра 0. | Указание. Использовать задачу 2.43. 2.110. Смоделировать выработки объемами п= 10, 100, 1000 и получить о. м. п. параметров следующих распре- распределений: 1) Л^Fь бг), при моделировании положить Bi = ], 0|=4; 2) Bi(\, 6), при моделировании положить 6 = 0,7; 3) R@, 6), при моделировании положить 0 = 1. I Указание. Использовать задачи 2.86, 2.84 и 2.100 | соответственно. 2.111*. Оценивание размера конечной совокупности. В условиях задачи 2.83 установить, что о. м. п. N неизвест- неизвестного размера совокупности jV при т\>\ однозначно нахо- находится из условия где S{N, k) = I n Д+ X_k/\n ^L при N^k>\,S{k- — \, k) = oo. Если же т) = 1, то N = 1. Определить, при каких значениях ц оценка Л/ = т\. Пред- Предполагая, что п, N-*-oo , 0<а0 ^а =—.. ^ai < оо , где ао, ai — некоторые константы, получить приближенное выражение для о. м. п. а = п/(Л/+1)- Обобщить этот результат на случай произвольного значения т. 2.112 (продолжение задачи 2.111). Для оценки неизве- неизвестного числа W рыб в озере проводят следующий экспери- эксперимент. На первом этапе по схеме случайной выборки без возвращения вылавливают т\ рыб, метят их и выпускают обратно в озеро. На втором этапе по аналогичной схеме вылавливают еще т2 рыб и подсчитывают число Ц2 ока- оказавшихся среди них меченых рыб (так что число различных пойманных за оба улова рыб ц = т\-\-т2 — ^г). Показать, что о. м. п. N по данным ц2 определяется равенством Л/ = m'm2 . Сравнить этот результат при т\ = т2 с ре- результатом, полученным в задаче 2.36. Указание. Учесть, что статистика ^2 имеет гипер- гипергеометрическое распределение Н{ш\, N, m2). 72
2.113*. Выборочный контроль. Имеется партия из N из делий, содержащая некоторое (неизвестное) число D де- дефектных изделий. Чтобы оценить параметр D или некото- некоторую заданную функцию от него т(?)), случайным образом без возвращения из всей партии извлекается n{n<lN) из- изделий, каждое из которых проверяется на доброкачествен- доброкачественность. Пусть Xi\= 1, если i-e проверяемое изделие де- дефектно, и X,: = 0 в противном случае, i = 1, ..., п. 1) Показать, что dn = Х{ -\- ... -f- Xn (общее число об- обнаруженных в выборке X = {Х\, ..., Хп) дефектных изде- изделий) есть полная достаточная статистика для D, имею- имеющая гипергеометрическое распределение H(D,N,n), и, ос- основываясь на этом, убедиться в том, что несмещенные оценки существуют лишь в случаях, когда x(D) — много- многочлен степени не выше п. В этом случае, если t(D) = = 2 а;(О)/. (D)i = D(D - 1)...(D - / + 1), (D)o = 1, то on тимальной несмещенной оценкой t(D) является статис- статистика т* = T(dn) = о 2) Получить явный вид оптимальных оценок для функций Ti(D) = D и x2(D) = D{N — D), которые с точ- точностью до множителей являются соответственно средним и дисперсией статистики dn (см. п. 6) гл. 1). 3) Убедиться в том, что о. м. п. Dn = [(N + l)dn/n]. У Ksa з а н и е. Использовать решение задачи 2.33 и формулы для моментов распределения rf(D,N,n). 2.14. Объединение статистической информации. Пусть Xj = (Хц, ..., Xjnj), j = 1, ..., k, — независимые выборки из распределений N(bj\, б2), /=1,...,/г, соответственно и Xj, Sj = S2(Xj) — соответствующие выборочные средние и дисперсии. Доказать, что б = (Х\, ..., Xk, 62) — о. м. п. для е = (9ц, .... Вы, 92), где 6| =^qi—+7^2 nisl: несме- несмещенной же оценкой для общей дисперсии 02 является статистика Я2 "I + - +л* А2 1 VI .. п2 Указание. Использовать решение задачи 2.86. 73
§ 4. Доверительное оценивание 2.115. Показать, что Y¦ДoвePИтeльный интервал для параметра 0 модели#@, 02), 0>О, по выборке X = (Х\,..., ..,*.„) имеет вид {X/(l + с,/Ул), X/(l - Cy/jn)f. Полу- Получить соответствующее решение для моделиУУ@, 6 ), 9<0. Указание. Использовать тот факт, что Lo((X — 2.116. Пусть X = (Х\, ..., Хп) — выборка из распреде- распределения iV(G, о). 1) Убедиться в том, что любой интервал вида АУ(Х) = = (х—т=-^2, X— -r^gi). где gi<g2 — любые числа, удовлетворяющие условию <t>(g2) — <&(g\) = y, является Y-доверительным интервалом для параметра 0. Доказать, что наикратчайшим среди этих интервалов является интервал А'У(Х) =( Х±-т=- су) . 2) Сколько необходимо произвести наблюдений п = = пA,у), чтобы точность локализации параметра при до- доверительном уровне y была равна заданной величине /? Вычислить пA,у) при y = 0,99, I — 0,5 и / = 0,1 (величи- (величина а = 1). Как изменяется доверительный уровень y в за- зависимости от / и п? Указание. Воспользоваться центральной статисти- статистикой G{X; 0) = ^-(Х - 0). 2.117. Доказать, что Y-доверительным интервалом для среднеквадратического отклонения 0 модели N(n,Q2) явля- является любой интервал 6T(^Q = {T/a-i, Т/п\), где Т2 = п — 2 {%'' — М-J > а числа п\<а.2 выбираются из условия \ xkn(x2)dx = y/2, где kn(t) — плотность распределения Х2(п). Определить наикратчайший в этом классе интервал Указание. Воспользоваться тем, что Ц(Т2/д2) = 2.118 (продолжение задачи 2.117). Показать, что центральный Y¦Дoвepитeльный интервал для дисперсии 02 имеет вид 11 Напомним, что су=и11+^/2=<Ь~ ( "о"/" 74
g, = Xi- в то время как наикратчайшим среди интервалов такого вида, где числа g\ < g2 удовлетворяют условию \ kn{t)dt — v, является интервал &'У(Х) = (Т\2, Т'2) (см. ре- шение предыдущей задачи). 2.119. По выборке X ={Х\, ..., Хп) из распределения N@|, 0i) построить односторонние и двусторонний у-дове- рительные интервалы для среднего 6|. Указание. Использовать утверждение 2.120. По выборке Х = {Х\, ..., X.) из распределения NFi, 02) построить односторонние и двусторонний у-дове- рительные интервалы для дисперсии т = 02. | Указание. Воспользоваться теоремой Фишера. 2.121. По реализации B,96 3,07 3,02 2,98 3,06) выборки объема 5 из нормального распределения с неизвестными параметрами рассчитать 0,95-доверительные интервалы для среднего и дисперсии. 2.122. Пусть Х = {Хи...,Хп) и У = (У,, .... Ym) - две независимые выборки, причем первая из распределения L@(l), а\), а вторая из распределения N($2), а2). Построить Y-доверительный интервал для разности средних т = Указание. Установить, что L((X—Y—т)/ст) = = N(Q,l), o2=— -f-^ . ' п m 2.123 (продолжение задачи 2.122). Пусть в отличие от предыдущего случая все наблюдения имеют одинаковую, но неизвестную дисперсию 02, т. e.L{Xi) =N($!\ 02), L[Yj) = =N($i\ 9г). По-прежнему требуется оценить разность средних т = (ft' — 02). Рассмотреть более общую ситуацию, когда дисперсии неизвестны, но различаются лишь изве- известным множителем, т. e.L(X,) =Л^0||), cQl),L(Yj) =Л^@<2), 02), с — известно. Указание. Установить, что случайная величина mn(m-\-n — 2) / р г; имеет распределение Стьюдента S(m -(- п — 2). 2.124. В результате двух равноточных измеренной угла получены следующие результаты (в градусах): 20,76 и 75
20,98. Еще шесть независимых и равноточных измерений того же угла выполнены с помощью другого прибора и были получены такие результаты: 21,64; 21,54; 22,32; 20,56; 21,43 и 21,07. Предполагается, что случайные ошибки результатов измерений распределены нормально, причем известно, что первый прибор менее точен (ему соответству- соответствует дисперсия, превышающая в четыре раза дисперсию, соответствующую второму приб'ору). Рассчитать 0,95-до- верительный интервал для разности систематических оши- ошибок, отвечающих этим приборам. | Указание. Воспользоваться решением задачи 2.123. 2.125 (продолжение задачи 2.124). Пусть, наконец, вы- выборки имеют разные дисперсии, т. е. L{Xi) =N((f{\ &iJ), L(Yj) =N(Cfi\ (ff12). Построить доверительный интервал для отношения т = &2J/0ф . Указание. Установить, что центральной статистикой является в данном случае F _ п{т-\) S\X)/ Г я — I. т—\ — , _ |, с2/у\ / Т • 2.126. В двух лабораториях определялась концентра- концентрация серы (в %) в стандартном образце дизельного топли- топлива. Шесть независимых равноточных измерений в первой лаборатории дали следующие результаты: 0,869, 0,874, 0,867, 0,875, 0,870, 0,869. В результате аналогичных пяти равноточных измерений во второй лаборатории были получены такие значения: 0,865, 0,870, 0,866, 0,871, 0,868. Предполагая справедливым нормальный закон ошибок из- измерений, построить 0,95-доверительный интервал для отно- отношения дисперсий измерений в 1-й и 2-й лабораториях. Если есть основания считать эти дисперсии одинаковыми, то рассчитать аналогичный интервал для разности систематических ошибок, допускаемых в обеих лабора- лабораториях. 2.127. Пусть Х = {Хи ..., Х„) и Y={Ylt .... Ym) — две независимые выборки из распределений Г@1, 1) и Г(82, 1) соответственно. Построить центральный •у"Д°веРНтельный интервал для отношения т = 82/0i. | Указание. Использовать задачу 1.51. 2.128. Убедиться в том, что (ХA) + 1п(' ~ v) , A где Х([) ¦= min X,-, есть v-доверительный интервал для пара- метра 0 экспоненциального распределения с плотностью /(*;0) = <Г('-О) 76
I Указание. Найти распределение статистики Лщ и | учесть, что событие {Aju^G} является достоверным. 2.129. Убедиться в том, что (Х{п), Я|я)/У1 — у) есть у- доверительный интервал для параметра 0 модели /?@, 6) по выборке объема п. Указание. Установить, что Lo((X(n)</Q)")= R@, 1) (см. задачу 1.35). 2.130. Рассмотрим модель ЩО, X, 0) (см. задачу 2.76). Убедиться в том, что центральным у-доверительным ин- интервалом для функции т@) — 0х является интервал BT/x?+j 2л , 2T/x?-j 2п). В частности, при X = 1 имеем соответствующее решение для экспоненциальной модели Г@, I). | Указание. Использовать решение задачи 2.76. 2.131*. Убедиться в том, что у-доверительная область для параметров @,,т = 02) общей нормальной модели iV@|, Gi) по выборке X = (Хи ..., Хп) имеет вид Gy{X) - {(е1,т U где Y1Y2 = V- I Указание. Воспользоваться теоремой Фишера 2.132*. Пусть (Xi = {Xn,Xi2),i= \,...,п) — выборка из двумерного нормального распределения с известной матрицей 2. Используя задачу 1.59, постро- построить 7-ДОверительную область для 0 = @i, 02). 2.133. Пусть X =(Х[, ..., Х„) — выборка из распределе- распределения Bi(\, 0). Основываясь на точечной оценке Т = X па- параметра 0, показать, что центральный у-Д°верительный интервал для него GУ Т2) определяется условиями 2 с'ат\[\ - г,)л-г = s ащ\ - т2у-г = -^р-. г = пТ Построить приближенный доверительный интервал для G при больших п. Указание. Использовать задачи 1.39 п. 3), 2.43 и 2.84. 2.134. По выборке X — (Х\, ..., Х„) для бернуллиевской модели Bi{l,Q) построить асимптотический (при п-+оо) Y-доверительный интервал для 0, основываясь на нор- нормальной аппроксимации Ld^[n{X — 0)/д/ОA — 0)) ~ N@,1) 77
(теорема Муавра — Лапласа). Сравнить полученное ре- решение с решением, основанным на асимптотических свойствах оценок максимального правдоподобия (см. за- задачу 2.133). 2.135 (продолжение задачи 2.134). Убедиться в том, arcsiny.Y ± —¦¦=-) —асимптотический у-доверитель- ный интервал для функции т(8) = arcsin-^/eT I Указание. Использовать задачу 2.109. 2.136. При 540 испытаниях в схеме Бернулли положи- положительный результат наблюдался 216 раз. Рассчитать 0,95- доверительный интервал для дисперсии числа положи- положительных исходов. 2.137. Пусть X = (Х\, ..., Хп) — выборка из распреде- распределения ПF). Основываясь на точечной оценке Т = X, показать, что центральный 7-Д°веРите-'1ЬНЬ1й интервал G"i, T?) для В определяется условиями Приближенный же ^-доверительный интервал (при боль- больших п) есть (X ± Суу/Х/п). 2.138. Построить асимптотический 7'ДовеРительныи интервал для параметра 6 пуассоновской модели _П(§), воспользовавшись нормальной аппроксимацией (y(VV 1) (см. задачу 2.109) или ап- аппроксимацией l/ _X5_p_L\ ~7V@, 1) (центральная пре- предельная теорема). Сравнить с соответствующим решением предыдущей задачи. 2.139. Независимые случайные величины Х\ и Х2 име- имеют распределения Пуассона с параметрами Х\ и Х2 соот- соответственно. Пусть известно значение их суммы Л^+А^ = = п. Построить при этом условии доверительный интер- интервал для 9 = X|/(X| -f- Я,г) по наблюдению над Х\. Указание. Найти условное распределение ЦХ\\Х\ + -f-Хг = п) (см. задачу 1.54) и воспользоваться ре- решением задачи 2.133. 2.140. Построить асимптотический 7"АовеРительныи интервал для параметра 8 распределения степенного ря- ряда (см. задачу 2.60). Применить полученный результат для оценивания параметра Э модели Bi(r, 8). I Указание. Использовать задачу 2.96 и ее решение. 78
2.141. Построить асимптотический 7-Д°веР11тельный интервал для параметра 9 модели Г@, X). Указание. Использовать задачи 2.43 и 2.48, а также аппроксимацию, полученную в задаче 2.109. 2.142. Построить асимптотический 7"Д°веРительный интервал для параметра 6 модели N(^, в2). Указание. Воспользоваться аппроксимацией /.оУ2~/гAп0„ — ln0)~N(O, 1), полученной в задаче 2.109. 2.143. Построить асимптотический 7'Д°веРительный интервал для функции т(8) = Ф(—Ч——) в модели JV@i, 01) (см. задачу 2.72). I Указание. Использовать задачу 2.87. 2.144*. Для полиномиальной модели М(п; р\, ..., pN) с неизвестными параметрами р\, ..., ры (см. задачу 2.29) построить асимптотическую (при л-*- оо) у-Доверитель- ную область для p\,...,pN, основанную на соответствую- соответствующих оценках максимального правдоподобия. Указание. Использование задачи 2.63, 2.45 и асимптотический вариант задачи 1.40: если L(Yn) ~ ~Щр„, 2„) при я-> оо и I2J Ф 0, то /,((У„ - ц,я)'2,Г' X X (Уя — ця)) -*¦ %2(т), где т — размерность вектора Yn. 2.145*. Пусть п,Х и S2 — соответственно объем, выбо- выборочные среднее и дисперсия выборки из распределения MOi, 0i). Показать, что с вероятностью у результат сле- следующего, (л+1)-го испытания находится в интервале -1))- I Указание. Воспользоваться теоремой Фишера. 2.146 (продолжение задачи 2.145). В результате пяти независимых взвешиваний одного и того же тела полу- получены следующие результаты (в граммах): 4,12; 3,92; 4,55; 4,04; 4,35. Считая погрешности измерений нормаль- нормальными N@, 0|) случайными величинами, указать 0,95-дове- рительный интервал для результата предстоящего шесто- шестого взвешивания. 2.147. Пусть L(?) = Х2(п), где число степеней свободы п неизвестно. Рассчитать приближенный 0,9-доверитель- ный интервал для п, соответствующий реализации ? = = 157,4. | Указание. Воспользоваться нормальной аппрокси- | мацией для распределения хи-квадрат (задача 1.45). 2.148. По выборкам, полученным в задаче 2.110, по- 79
строить доверительные интервалы для соответствующих параметров. Указание. Воспользоваться задачами 2.119, 2.120, 2.133 и 2.129 соответственно. Глава 3 ПРОВЕРКА СТАТИСТИЧЕСКИХ ГИПОТЕЗ 1. Статистической гипотезой (или просто гипотезой) называют любое предположение о виде или свойствах распределения наблюдаемых в эксперименте случайных величин. Пусть для исследуемого процесса сформулиро- сформулирована некоторая гипотеза Но (ее называют основной или нулевой гипотезой), тогда задача проверки этой гипотезы заключается в конструировании такого правила (алго- (алгоритма), которое позволяло бы по результатам соответ- соответствующих наблюдений (по имеющимся статистическим данным) принять или отклонить Но- Любое такое прави- правило называют статистическим критерием (или просто критерием) согласия для гипотезы Но. Если гипотеза Но однозначно фиксирует распределение наблюдений, то ее называют простой, в противном случае — сложной. Пусть результат эксперимента описывается некоторой случайной величиной X = (Xt, .... Хп) и Но — некоторая гипотеза о ее распределении. Пусть, далее, Т = Т(Х) — некоторая статистика, характеризующая отклонение эм- эмпирических данных от соответствующих (гипотезе Но) гипотетических значений, распределение которой в слу- случае справедливости Но известно (точно или хотя бы приближенно). Тогда для каждого достаточно малого числа а>0 можно определить подмножество 7"|а = = [t:t= T(x), jteX), удовлетворяющее (точно или хотя бы приближенно) условию Р(ГеТ|а1Яо)<а. C.1) Любое такое подмножество 7\а порождает следующий критерий согласия для гипотезы Но: если t = Т(х) — на- наблюдавшееся значение статистики Т(х), то при t e 7\a гипотеза Но отвергается; в противном случае считается, что данные не противоречат Яо (согласуются с Но); другими словами, если t^ET\a, то гипотеза Но принимает- принимается (подчеркнем, что факт t ф Z\a не является доказа- доказательством истинности Но). Если гипотеза Но истинна, то согласно указанному правилу мы можем ее отвергнуть 80
(т. е. принять неправильное решение) с вероятностью, меньшей или равной а. Число а называют уровнем значимости критерия, а множество Т\а — критическим множеством (областью) для гипотезы Но. Статистику Т в описанной методике называют статистикой критерия, а сам критерий — критерием Т\а. Итак, согласно описанной методике, критерий опреде- определяется заданием соответствующей критической области 7"ia в множестве значений статистики Т при выбранном уровне значимости ос. Для того чтобы иметь возможность сравнивать различные критерии (порождаемые разными статистиками Т), надо ввести понятия альтернативного распределения (альтернативной гипотезы) и мощности критерия. Любое допустимое распределение Fx = F выборки X, отличающееся от гипотетического (т. е. распределения при гипотезе Но), называют альтернативным распределе- распределением, или альтернативой. Совокупность всех альтернатив называют альтернативной гипотезой и обозначают h\. Функцией мощности критерия 7\а называют следующий функционал на множестве всех допустимых распределе- распределений {F): W(F) = W(Tla\ F) = P(reTdF). C.2) Таким образом, W(F) — это вероятность попадания зна- значения статистики критерия в критическую область, когда истинным распределением наблюдений является распре- распределение F. Если Fe Hi, то значение W(F) называют мощностью критерия при альтернативе F; оно характе- характеризует вероятность принятия правильного решения (от- (отклонение Но) в ситуации, когда Но ложна. Из двух кри- критериев с одним и тем же уровнем значимости а лучшим считается тот, мощность которого при альтернативах больше. Желательным свойством критерия Tia является свой- свойство несмещенности, которое означает, что одновременно с условием .; F)<a -We //<, C.3) должно выполняться условие C.4) (т. е. при альтернативе вероятность попадания в крити- критическую область должна быть больше, чем при основной гипотезе). 81
Функцию мощности удается вычислить далеко не все- всегда (для этого надо знать распределение статистики критерия при всех альтернативах), однако часто можно исследовать ее асимптотическое поведение при объеме выборки п-*- оо (чтобы подчеркнуть зависимость функ- функции мощности от объема выборки, пишут Wn(F)). Иссле- Исследуя асимптотические свойства критериев, прежде всего рассматривают вопрос, является ли критерий состоятель- состоятельным. При этом состоятельность критерия означает, что п lirn^ Wn(F) = 1 V/7 е Я,. C.5) Таким образом, состоятельный критерий при большом числе наблюдений «улавливает» любые отклонения от основной гипотезы с вероятностью, близкой к 1: если истинной является любая фиксированная альтернатива, то при больших п. попадают в критическую область с вероятностью, близкой к 1, и, следовательно, отвергают основную гипотезу, которая является ложной (т. е. при- принимается правильное решение). Более детальные свойства состоятельного критерия можно исследовать, рассматривая асимптотическое пове- поведение мощности Wa{Fn) при «близких» альтернативах Fn, т. е. когда последовательность альтернатив {Fn} сбли- сближается (в том или ином смысле) при л->- оо с основной гипотезой Hq. Основной интерес при этом представляет «пороговый» случай, т.е. определение такой последо- последовательности [Fn], Для которой lim Wn{Fn) = y, а<у<1, C.6) и вычисление этого предела y- 2. Наиболее известными критериями проверки прос- простой гипотезы Но: Ft.(x) = F(x) являются критерий Колмо- Колмогорова и критерий X2. Критерий Колмогорова применяют, когда F(x) непре- непрерывна. Статистикой критерия является величина Dn = = Dn(X) = sup \Fn(x) — F(x)\ — максимальное от- — оо <; х <;-оо клонение эмпирической функции распределения Fn(x) от гипотетической F(x). При фиксированном х величина Fn{x) является оптимальной оценкой для F(x) и с ростом п. Fn(x)-+F(x), поэтому по крайней мере при больших п, в тех случаях, когда гипотеза Но истинна, значение Dn не должно существенно отклоняться от нуля. Точное распределение Р(д/яОл</) уже при п>20 хорошо при- 82
ближается предельным распределением Колмогорова оо K(t) = 2 (— l)'expj—2/2/2), для которого составлены / = — оо таблицы. Критическая область критерия определяется неравен- неравенством Vnfln^/O, где K{ta) = 1 — а. Часто исходные статистические данные предваритель- предварительно «группируют», что осуществляется следующим обра- образом. Пусть X = (Хи .... Хп)— повторные независимые наблюдения под некоторой случайной величиной \ с мно- множеством возможных значений Е. Рассмотрим некоторое разбиение Е = Е\[]...[]Ец, ?1;Л?;=0, 1ф\, и пусть v, — число элементов выборки X, попавших в подмноже- подмножество Ej, a pj = pj(F) = ]dF(x) — вероятность попадания в Ej при заданном распределении F величины |, / = 1, ..., ..., N (vi + ... + vjv = п, р, + ... + pN = 1). Тогда вектор частот v = {vi, ..., w) имеет полиномиальное распреде- распределение М(п\ р = (рь ..., pN)), и каждая гипотеза о распре- распределении L(l) трансформируется в соответствующую гипо- гипотезу о векторе р распределения М(п; р). Таким образом, в данной методике переходят от исходных наблюдений X = {Х\, ..., Хп) к частотам v = (v v,v) попадания эле- элементов выборки в соответствующие подмножества E\,...,En. Такой «частотный» способ представления ста- статистических данных называют методом группировки наблюдений, а подмножества Е\, ...,En — интервалами группировки. Относительная частота Vj/n попадания в интервал Е\ является состоятельной оценкой вероятности ps, поэтому в качестве меры отклонения эмпирических данных от гипотетических значений р° можно выбирать различные функции от разностей — р°\ , /= 1,..., ..., N. Наиболее употребительной является мера I = л п = 2j т. . предложенная К. Пирсоном. Если h0 — простая гипоте- гипотеза, однозначно фиксирующая вероятности р° = (р°, ..., ...,p,v), то при 0<р°<1, /= \,...,N, и п^оо соответ- соответствующий критерий согласия, называемый критерием хи-квадрат, асимптотически задается критической об- областью {Х2а^Х[-а.м-\}, где У.2,.г — р-квантиль распределе- 83
ния X \г). Другие применения подобной методики см о A, гл. III]. 3. Важной является задача проверки однородности статистического материала. Пусть имеются две незави- независимые выборки X = (Х[, ..., Хп) и У == (Y\, ..., Ут), описы- описывающие один и тот же процесс, явление и т. д., но полу- полученные, вообще говоря, в разных условиях. Требуется установить, являются ли они выборками из одного и того же распределения или же закон распределения наблюдений от выборки к выборке менялся, т. е. тре- требуется проверить гипотезу однородности Но о том, что F\(x) = Fi(x), где F\(x) и F2(x) — функции распределения выборок X к Y соответственно. Одним из распространен- распространенных критериев однородности является критерий Смирно- Смирнова, применяемый в случае непрерывных распределений. Критерий основан на статистике Dnm = Dnm(X,Y) = = sup \Fln(x) — F2m(x)\, где FXn(x) и F2m(x) — эмпири- — oo<j:<oo ческие функции распределения, построенные по выборкам X и Y соответственно. В случаях, когда справедлива гипотеза Но, функции F[n(x) и F2m(x) с увеличением объ- объемов выборок п и m «сближаются» и поэтому статистика Dnm не должна сильно отличаться от 0. Точное распре- распределение РГу———Dnm^.l\ приближается предельным распределением Колмогорова K(t). Критическая область критерия определяется неравенством у ^ где K(Q - 1 - а. Другим часто применяемым критерием является кри- критерий однородности X2. Его используют для проверки однородности данных, имеющих дискретную структуру или сводимых к этому группировкой. Кроме того, он при- применим для сравнения любого числа выборок. Пусть осуществлено k серий независимых наблюде- наблюдений, объемы которых п\, ..., nk, и в каждой серии наблю- наблюдался некий переменный признак, принимающий одно из s возможных значений (исходов). Пусть vi;- — число s реализаций г-го исхода в /-Й серии B v,,- = «,-, /=!,..., ; = i ..., k). Требуется проверить гипотезу Яо о том, что все наблюдения производились над одной и той же случай- случайной величиной. Статистикой критерия X2 в данном слу- случае является величина 84
xl =n( S 2-^-- 1) где v, = 2 Vi;-, i = 1, ..., s, я = «i + ... -f Критическую область задают в виде X где границу критерия определяют из таблиц квантилей распределения X2. Вероятность ошибочно отклонить при этом истинную гипотезу приблизительно равна а, если я достаточно велико. 4. Если X = (Х\, ..., Хп)—выборка из распределения 1{%) и множество F всех допустимых распределений на- наблюдаемых случайной величины ? задано в параметриче- параметрической форме: F = {F(x; 0), 0 = @|, .... 0,)ев], то гипотезы о распределенииL{%) формулируются в терминах неизве- неизвестного параметра 0 и называются параметрическими. В общем случае (основная) параметрическая гипотеза задается в виде /?o:0e6o при некотором подмножестве 0ос: 0. В этом случае альтернативная гипотеза имеет вид//]: 0 е6| = 0\0о. Таким образом, в рамках пара- параметрической модел-и альтернативная гипотеза конкрети- конкретизируется и имеет такую же форму, как и основная гипо- гипотеза; в данном случае отклонение основной гипотезы эквивалентно принятию конкретной альтернативной гипо- гипотезы. В общей теории проверки параметрических гипотез критерии принято задавать указанием соответствующих критических областей непосредственно в выборочном пространстве Х= {х= (*i, ..., х„)\. Таким образом, при уровне значимости а критерий проверки гипотезы Но задается выбором такого подмножества Х\ааХ, для которого выполняется условие являющееся аналогом условия C.1). В этом случае сам критерий (называемый критерием Х\а.) формируется следующим образом: если х — наблюдавшаяся реализа- реализация выборки X, то при х^Х\а гипотезу Но отвергают (принимают альтернативную гипотезу Н\), если же хе.Х0«=Х]а, то гипотезу ho принимают. Для функции мощности в данном случае используются обозначения (ср. с C.2)): ), Gg6. 85
Вероятности ошибочных решений для критерия Х\а выражаются через его функцию мощности следующим образом: вероятность ошибки первого рода (отклонить //о, когда она верна) равна Щ8), 8е0о (в символиче- символическом виде P(hi\H0)), а вероятность ошибки второго рода (принять Но, когда она ложна) равна 1 — W(Q), 6ев| (в символическом виде P(#ol#i)). Рациональный принцип выбора критической области формулируется в терминах вероятностей ошибок следую- следующим образом: при заданном числе испытаний устанав- устанавливается граница для вероятности ошибки первого рода и при этом выбирается та критическая область, для которой вероятность ошибки второго рода минимальна. Пусть X ia иХ*о — два критерия одного и того же уровня значимости а для гипотезы Но. Если U?(X*O; 0)< <№(Х|«;в) при 0<=0о и ЩХ1,;8)>11Р(Х|а; 8) при 0<=в, (со строгим неравенством по крайней мере при одном GeBi), то говорят, что критерий Х*а равномерно мощнее критерияхia и ему, очевидно, следует отдать предпочте- предпочтение, поскольку он приводит к меньшим ошибкам. Если указанные неравенства выполняются для любого крите- критерия Xio, ToXia называют равномерно наиболее мощным (р. н. м.) критерием. В случае простой альтернативы Н\ (множество <Э| состоит из одной точки) вместо р. н. м. говорят о наиболее мощном критерии. В некоторых слу- случаях указанный принцип сравнения критериев позволяет определить оптимальный (в рассматриваемой задаче) критерий. Иногда задачу построения оптимального кри- критерия удается решить в классе несмещенных критериев, т. е. когда одновременно с C.7) выполняется условие ) В теории часто удобно рассматривать так называемые рандомизированные критерии, когда при наблюдении х гипотезу HQ отвергают с некоторой вероятностью ср(х) и принимают с дополнительной вероятностью 1 — ф(х). Функция ф(х) (О^ф(х)^ 1, хеХ) называется критической функцией; описанная выше конструкция нерандомизиро- нерандомизированного критерия Xia соответствует выбору в качестве ф(х) индикаторной функции множества Х1О'.ф(х)= 1 при xeXia и ф(х) = 0 при х^Хи. Функция мощности рандо- рандомизированного критерия определяется соотношением W(B)= №(ф;6) = ?Оф(Х). 5. В основе большинства способов построения опти- оптимальных критериев лежит фундаментальный результат, полученный Ю. Нейманом и Э. Пирсоном о существова- 86
нии наиболее мощного критерия в задаче проверки простой гипотезы при простой альтернативе. Именно, если 0 = {0о, 6i}, то при любом уровне значимости а наиболее мощный критерий проверки гипотезы Яо: б = 0о при альтернативе Н\\ 6 = 0, существует и задает- задается критической областью 71 где Цх; 0) = П f(xr, 0) — функция правдоподобия (о не- некоторых особенностях, связанных с дискретностью наб- наблюдений, см. подробнее в [1, § 4.2]). Если проверяется простая гипотеза Яо: 0 — 0о против сложной альтернативы Н\: 0е0\{0о), то р. н. м. критерий существует, если критическая область Х'а =X'a(Qo\ 6i), определенная в C.8), не зависит от конкретного 0i e 0\{0oj; в этом случаевia и есть р. н. м. критерий. Такое обстоя- обстоятельство имеет место для важного класса моделей F, об- обладающих монотонным отношением правдоподобия (т. е. таких, которые обладают достаточной статистикой ЦХ), и при этом функция 1(х) = g(T(x); Qt)/g(T(x); 0O) монотонна по Т (см. критерий факторизации в п. 3 гл. 2), и в слу- случае односторонних альтернатив Я^: 0 3? во @ — скаляр) [1, с. 155]. Более того, для таких моделей р. н. м. крите- критерий проверки простой гипотезы Яо: 0 = бо против право- правосторонней альтернативы Hf: 0>0О является одновремен- одновременно р. н. м. критерием проверки сложной гипотезы Яо: 0<10о против Я|+ того же уровня значимости (аналогич- (аналогичное утверждение справедливо и для двойственной проб- проблемы проверки Яо: 9^в0 против Я Г: 0<бо [5, с. 101]). В частности, для экспоненциальной модели, задавае- задаваемой плотностью f(x; 0) =. ехрИ(8)Я(*) + С(в) + ОД , п статистика ЦХ) = 2 В{Х) достаточна, и если функция у4F) строго монотонна, то вид р. и. м. критериев Х'а ука- указан в следующей таблице: А@)\ #П0<0о {Г(х)<гГ) 87
При проверке простой гипотезы Но'- 9 = 9о против двусторонней альтернативы Hi: 9 Ф 9о в ряде случаев также удается построить р. н. м. несмещенный критерий [1, с. 159]. Удовлетворительное решение этой задачи в ряде слу- случаев получают с помощью следующего приема: если для рассматриваемой модели существуют р. н. м. критерии против односторонних альтернатив НГ и Qt (соответ- (соответственно ХГа\ и Л^). то используют критерий вида Xia = — X~al\jXfa2 при cti + a2 = а. Особый интерес представляют малые отклонения от нулевой гипотезы Но: 9 = 9о. В этом случае при иссле- исследовании свойств критерия можно ограничиться анализом локального поведения функции мощности критерия Щв) в окрестности точки 9о. При таком подходе часто удается построить локальный наиболее мощный критерий, даже тогда, когда р. н. м. критерия не существует [1, с. 161]. 6. Часто весьма полезным бывает тот факт, что зада- задача проверки простой гипотезы относительно 9 является обратной по отношению к задаче построения доверитель- доверительного множества для 9. Именно, ewuGy(X) есть v-довери- тельное множество для 6, то XOa=z{x:Qo^Gy(x)} опреде- определяет область принятия гипотезы Нй: 9 = Go с уровнем значимости а = 1 — у. Верно и обратное, т.е. если для каждого боев имеется какой-либо критерий Xta =Ли<х(9о) проверки гипотезы Но: 6 = 9о, то, определив для каждого хеХ подмножество Gy(x) = {Q:x^X[a(Q)}, у — 1 —а, полу- получим, что Gy(X) — 7'Д°веРительное множество для 9. Та- Таким образом, если для некоторой модели известно реше- решение одной из этих задач, то по описанному алгоритму можно получить решение другой. При этом р. н. м. кри- критерии соответствуют наикратчайшим доверительным мно- множествам и наоборот. 7. Одним из наиболее универсальных методов постро- построения критериев проверки сложных параметрических гипо- гипотез является метод отношения правдоподобия. Общий вид критерия отношения правдоподобия (к. о. п.) для проверки гипотезы Но: 8е60 таков: Хы =Х|а(во, в) = {х: kn(x) = supL{x; 9)/supL(*; 9)<ca}, Оев. О ев где граница са выбирается из условия W(Q)= Po(JLn(*)<ce)<a V9e0o. Во многих практических задачах такой подход приводит к удовлетворительным решениям. Кроме того, при неко- 88
торых условиях к. о. п. обладает свойством асимптотиче- асимптотической оптимальности для больших выборок. Если выполняются условия регулярности, обеспечи- обеспечивающие существование, единственность и асимптотиче- асимптотическую нормальность оценки максимального правдоподо- правдоподобия 6„ = F|„, ..., 6,„) параметра 0 = @), ..., 6,) (см. главу 2, п. 4), то при простой гипотезе Яо: 0 = б0 для больших объемов выборки п к. о. п. задается асимптотически критической областью Х1а = {х: -21пЛ.я(х)>Х?_„.,), где Хр,г — р-квантиль распределения Х2(г). При этом он является состоятельным (^„(О)-*-! при п-*-оо -ув=^б0) и его мощность при близких альтернативах вида б^"' = = 0о + P/V". Р — (Pi. •••> fir) Ф 0, удовлетворяет при я->-оо соотношению где X2 = р7@о)р, /@) — информационная матрица моде- модели, a Fr{t\X2)— функция нецентрального распределения X2 с числом степеней свободы г и параметром нецентраль- нецентральности X2 [1, с. 173]. Аналогичными асимптотическими свойствами к. о. п. обладает и при сложных гипотезах Но [1, с. 174—176]. § 1. Критерии согласия 3.1. Для данных задачи 1.13 проверить, согласуются ли они с гипотезой Яо о том, что монета была симмет- симметричной. Уровень значимости положить равным: а) 0,05; б) 0,1. 3.2. По данным задачи 1.14 проверить гипотезу Яо о случайности чисел. При каком уровне значимости гипо- гипотеза Яо отвергается? 3.3. При п = 4000 независимых испытаний события А\, Л2, А3, составляющие полную группу, осуществились соответственно 1905, 1015 и 1080 раз. Проверить, согла- согласуются ли эти данные при уровне значимости 0,05 с гипо- гипотезой Яо: р\ = 1/2, р2 = рз= 1/4, где рг = Р(А). 3.4. В десятичной записи числа я среди первых 10002 знаков после запятой цифры 0, 1, ..., 9 встречаются соответственно 968, 1026, 1021, 974, 1014, 1046, 1021, 970, 948, 1014 раз [6, с. 96]. Можно ли при уровне значимости 0,05 считать эти цифры случайными? При ка- каком \ не значимости эта гипотеза отвергается? 89
3.5. Согласуются ли данные, приведенные в задачах 1.16 и 1.17, с гипотезой о симметричности костей? 3.6. Крупная партия товаров может содержать долю дефектных изделий. Поставщик полагает, что эта доля составляет 3%, а покупатель — 10%. Условия поставки: если при проверке 20 случайным образом отобранных товаров обнаружено не более одного дефектного, то пар- партия принимается на условиях поставщика, в противном случае — на условиях покупателя. Требуется определить: 1) каковы статистические гипотезы, статистика критерия, область ее значений, критическая область; 2) какое распределение имеет статистика критерия, в чем состоят ошибки первого и второго рода и каковы их вероятности. 3.7. Согласуются ли данные задачи 1.19 при уровне значимости 0, 1 с гипотезой Но о том, что показания часов равномерно распределены на интервале @,12)? При каких значениях уровня значимости гипотеза Но не отклоняется? 3.8. В экспериментах с селекцией гороха Мендель наблюдал частоты различных видов семян, полученных при скрещивании растений с круглыми желтыми семена- семенами и растений с морщинистыми зелеными семенами. Эти данные и значения теоретических вероятностей по теории наследственности приведены в следующей таблице: Семена Круглые и желтые Морщинистые и желтые Круглые и зеленые Морщинистые и зеленые 2 Частота 315 101 108 32 /1=556 Вероятность 9/16 3/16 3/16 1/16 1 Следует проверить гипотезу Яо о согласовании частотных данных с теоретическими вероятностями (на уровне значимости а^0, 9). 3.9. Используя таблицу значений какой-либо функции (cosjt, е", \пх и т.д.), записать 100 цифр, выбирая из каждого значения функции второй знак справа. Про- Проверить для такой выборки гипотезу о случайности цифр 0, 1, ..., 9. Уровень значимости положить равным: а) 0,05; б) 0,01. 3.10. Группируя данные задачи 1.21 по N — 4 равно- равновероятным (при гипотезе Но) интервалам, проверить ги- 90
потезу На: F^x) = 1-е ", x^Q (уровень значимости принять равным 0, 1). 3.11. Пусть по выборке X = (X,, ...,Хп) требуется про- проверить гипотезу об экспоненциальное™ распределения наблюдаемой случайной величины ?, т. е. Но: ЛМ = = 1— е~х/0, х^О (параметр 0>О неизвестен). При- Применяя метод группировки с интервалами Е,- = [(/— l)a,ja), / = 1, ..., N— 1, Ew = [(Л'— 1)а,оо) , где а>0 — заданное число, построить критерий согласия X2 для гипотезы Но. Проанализировать данные задачи 1.21 с этих пози- позиций, принимая N = 3, а = 1. 3.12. В генетической модели Фишера [6, с. 79] при- принимается, что вероятности появления потомства, класси- классифицируемого по четырем типам, имеют вид Р.@) = 2 + 0 р2@) - р3(в) = 1 -0 P4(9)=-f, где 9^@, 1) — неизвестный параметр. Как выглядит кри- критерий X для проверки соответствия этой модели реаль- реальным данным? 3.13. При 8000 независимых испытаний события А, В и С, составляющие полную группу, осуществились 2014, 5012 и 974 раз соответственно. Верна ли при уровне значимости 0,05 гипотеза: р(А) = 0,5 — 20, р(В) = 0,5 + + 0, р(С) = 9 (О<0<О,25)? | Указание. См. решение задачи 3.12. 3.14. Для данных задачи 1.23 проверить гипотезу Но' Щ,) = П(8), где 8 — неизвестный параметр. Указание. В качестве оценки неизвестного пара- параметра 0 принять выборочное среднее [ 1, с. 117]. 3.15. Через равные промежутки времени в тонком слое раствора золота регистрировалось число частиц \ золота, попавших в поле зрения микроскопа. По данным наблюдений, приведенных в следующей таблице: Число частиц 0 112 1 168 2 130 3 68 4 32 5 5 6 1 7 1 Итого jnii = 518 проверить гипотезу /Уо: L(?) = П@), где 0 — неизвестный параметр. 3.16. В таблице приведены числа т, участков равной площади 0,25 км2 южной части Лондона, на каждый из которых приходилось по i попаданий самолетов-снаря- 91
дов во время второй мировой войны. Проверить согласие опытных данных с законом распределения Пуассона, приняв за уровень значимости а = 0,05: / , 0 229 1 211 2 93 3 35 4 7 5 и более 1 Итого Sm,=576 3.17. Среди 2020 семей, имеющих двух детей, 527 се- семей, в которых два мальчика, и 476 — две девочки (в ос- остальных 1017 семьях дети разного пола). Можно ли с уровнем значимости 0,05 считать, что количество маль- мальчиков в семье с двумя детьми — биномиальная случай- случайная величина? 3.18. Во время эпидемии гриппа среди 2000 контро- контролируемых индивидуумов одно заболевание наблюдалось у 181 человека, дважды болели гриппом лишь 9 человек. У остальных 1810 человек заболевания не было. Согла- Согласуются ли при уровне значимости 0,05 эти данные с гипо- гипотезой, согласно которой число заболеваний отдельного индивидуума в течение эпидемии — биномиальная слу- случайная величина? I Указание. См. решение задачи 3.17. 3.19*. Исследовать асимптотическое (при п->оо) поведение среднего и^дисперсии статистики Х2п критерия согласия X2 при «близких» альтернативах вида У = / = I Указание. Использовать формулы для Е(у2\Р)и I D(Xl\p), приведенные в [1, с. 113]. 3.20*. Пусть \io = Цо(«, N) — число пустых интервалов при группировке п наблюдений по N равновероятным (при гипотезе Но) интервалам. Рассмотрим гипотезы вида где max |&;|<с< «, 2 Ь, = 0, b\N) = ¦ 92
Доказать, что при п, Л/-»-оо, -jL- = Указание. Использовать формулы C.16), приве- приведенные в [1, с. 120]. 3.21. Поступающие в институт абитуриенты разбиты на два потока по 300 человек в каждом. Итоги экзамена по одному и тому же предмету на каждом потоке оказа- оказались следующими: на 1-м потоке баллы 2, 3, 4 и 5 полу- получили соответственно 33, 43, 80 и 144 человека; соответ- соответствующие же данные для 2-го потока таковы: 39, 35, 72 и 154. Можно ли при уровне значимости 0,05 считать оба потока однородными? 3.22. Следующая таблица содержит данные о смерт- смертности среди матерей, родивших первого ребенка, в четыре различные периода времени [6, с. 102] (л, — число мате- матерей, V, — число смертных исходов) 1072 22 1133 23 2455 49 1995 33 Проверить гипотезу Но о том, что в уровнях смертности между этими периодами не существует различия. Указание. Применить критерий однородности %2 для испытаний с двумя исходными. 3.23* Пусть произведены две серии из п.\ и п^ неза- независимых испытаний, в каждом из которых наблюдается либо исход А, либо исход А. Результаты сведены в сле- следующую таблицу, в столбцах которой указано число реализаций соответствующих исходов для каждой серии: Л А V A) Vll V |=л. B) V|2 VJ; V2 = tl2 2 V| v2 93
1) Убедиться в том, что статистика Xl для проверки гипотезы Но об однородности испытаний представима в виде Xl = Zl, где статистика Л| Лг / V V|V2 2) Доказать, что L(Zn|ЯоI -hV@, 1) при nt, «2->oo и, основываясь на этом, построить критерий проверки ги- гипотезы H0:pi = р2 против односторонней альтернативы #, : Р\>Р2 (здесь р; — вероятность реализации А в испы- испытаниях i-й серии, i = 1, 2). 3.24. Пусть vi,...,vjv — независимые случайные вели- величины, причем L(v,) == П@,), i = 1, ..., N, где параметры 8, неизвестны. Пусть дополнительно известно, что V| -f ... -f- -\-мн — п. Построить при этом условии критерий для проверки гипотезы однородности Яо: 8| = ... = 9^. |Указание. Воспользоваться задачей 1.54. 3.25* (критерий пустых блоков.) Пусть Х = (Х\, ..., ..., Хп) — выборка из распределения L(?) = /?@,1), 0 = = Xlo)^Xll)^sXM^....^.XM^.X(lt + и = 1 —ее вариацион- вариационный ряд и В, = (A"(,_ i), Xa)], i = 1, ..., п + 1, — порожда- порождаемые ею выборочные блоки. Пусть, далее, У = (У|, ..., ..., Ym) — независимая от X выборка из некоторого друго- другого распределения L(r\) на отрезке [0,1], функция распре- распределения которого F(x) имеет плотность f(x) = F (х). Обозначим через х, = у.(п,т) число элементов выборки У, попавших в блок В,, i = 1, ..., п + 1- 1) Доказать, что при гипотезе однородности Яо: ИХ) =L(x\) вектор блоковых частот и = (xi, ...,xn+i) при- принимает все возможные значения с одинаковой вероятно- вероятностью (CS + m); убедиться в том, что такой же вид имеет условное распределение Щ\, ..., JU+illi -f ... + %п + 1 — т), где случайные величины ||, ..., l^+j независимы и имеют геометрическое распределение Ш(\,р), где ре@, 1) — произвольно. 2) Рассмотрев статистику so{n,m) — число пустых блоков: л + 1 so(n,m) = 2 1{у-' — 0). гДе '(¦) — индикатор, i = i и используя вытекающие из п. 1 представление .п+ I L(so(n,m)) =L( 2 /(^ = 0)||i + .-- + Ел+1 = пг\ , 94
доказать, что so(n,m) имеет гипергеометрическое распре- распределение Н(п-\- 1, п + т, п); получить отсюда выражения для среднего и дисперсии статистики so(rt,m) при гипоте- гипотезе HQ. 3) Доказать, что если п,т-+ со так, чтот/п = р>0, то L(so(n,m)\Ho)~N(n/(l + р), пР2/A + рK). 4) Доказать, что в предыдущих условиях для любой альтернативы И\, задаваемой плотностью f(x) ф 1, *е[О,Ц sa(n,m) I ' Основываясь на этих результатах, обосновать критерий пустых блоков для проверки гипотезы однородности Но [1, с. 127]. Указания. 1) Воспользоваться тем, что условное распределение вектора х = (xi, ..., х„+|) при фикси- фиксированных значениях (Хщ, ..., Хм) = (х\, ..., хп) есть полиномиальное распределение М(т; Х\, х2 — х\, ..., у. „ 1 „ \ Далее использовать задачи 1.39 п. 5)и 1.31. 2) Рассмотреть независимые _случайные величины |, имеющие распределение Р(|,- = г) = Р(|/ = г||,> >0), г = 1,2, .... i = 1, 2, ..., и убедиться в том, что РA + - + Is = т) = Cm--\q'pm—, q=\-p. 3) Воспользоваться нормальной аппроксимацией для биномиального распределения: при гг-voo и 0<р<1, k = пр + t-\Jnp,q, \t | < с < со, Записать вероятность P(so(n,m) = k) в виде P(so(rt,m) = ft) = й(/г;п + 1,р)Х Хй(п—k\m^-\,p)/b(n;n-\-m,p), p= 1/A+р)- 4) Вычислить Е[/(х, = 0)|Я,] = P(x,- = 0|#i), исполь- используя при этом задачу 1.31. При оценке интеграла применить неравенство Коши — Буняковского: i i i ( \ gi{x)g2{x)dxY ^ \ g\{x)dx\ g\{x)dx 4 О ' О О при g\(x) = -\/l -\-pf{x), gz(x) = gr'(x). 95
3.26. Проверить гипотезу независимости для следую- следующей таблицы сопряженности двух признаков (уровень значимости принять равным 0, 05): а, аг аъ и ь, 3009 3047 2974 9030 2832 3051 3038 8921 Ьг 3008 2997 3018 9023 S 8849 9095 9030 26974 3.27. Из 300 абитуриентов, поступивших в институт 97 человек имели балл 5 в школе и 48 получили 5 на вступительных экзаменах по тому же предмету, причем только 18 человек имели бив школе и на экзамене. С уровнем значимости 0,1 проверить гипотезу о неза- независимости оценок 5 в школе и на экзамене. 3.28*. Рассмотреть таблицу 2X2 сопряженности двух признаков 1, 1 0 2 Ь 1 Vn V2I V.I 0 Vi2 V22 V.2 V V|. v2. n 1) Убедиться в том, что статистика JPn [1, с. 131] для проверки гипотезы На о независимости признаков gi и |2 в данном случае допускает представление ^? = Zl, где Zn = Л3/2( VI1 ^ V ' j/ -VVl-V2-V.lV.2 = 96 V|.V2.
2) Показать, что выборочный коэффициент корреля- корреляции рл = Zn/^Jn и, следовательно, Zn/VnA-p = когг(|т, |г) при п-»-оо (см. задачу 1.38); установить равенства = Р(АВ)-Р{АЩВ) = [р(л , fl. _ -<]Р(А)Р(А)Р(В}Р(В) где события А = {\\ = \), Л = {gi = 0}, В = {?2=1}, В = {Ъ = 0}. 3) Доказать, что L{Zn\ HQ)^N(Q, 1) при п-+оо, и, осно- основываясь на этом, построить критерий проверки гипотезы Но против альтернативы Н\\ Р(Л|В)>Р(Л\В), означаю- означающей положительную сопряженность событий Л и В (Л в паре с В встречается с большей вероятностью, чем в паре с В). 3.29. Имеются две группы данных о приеме в вуз, классифицированные _ по двум признакам: «принято (Л) — не принято- (Л)» и пол «мужчины (В)—жен- (В)—женщины (В)». А А S В 97 263 360 В 40 42 82 X 137 305 п=442 Л А 2 В 235 35 270 В 38 7 45 2 273 42 п=315 Для каждой таблицы проверить гипотезу Но о независи- независимости признаков Л и В против альтернативы Н\\ Р(Л|В)>Р(Л|В). 3.30. В следующей таблице [3, с. 722] приведены 818 случаев, классифицированных по двум признакам: наличию прививки против холеры (признак Л) и отсут- отсутствию заболевания (признак В): А А 2 В 276 473 749 В 3 66 69 2 279 539 818 Построить критерий проверки гипотезы Но о независимо- независимости признаков Л и В против альтернативы Н\ о положи- 1—190 . 97
тельной сопряженности Л и В (т. е. об эффективности вакцинации). 3.31. Можно ли с уровнем значимости 0,001 считать, что последовательность чисел 1,05; 1,12; 1,37; 1,50; 1,51; 1,73; 1,85; 1,98 является реализацией случайного вектора, все 8 компонент которого независимые одинаково распре- распределенные случайные величины? 3.32*. Основываясь на следующем представлении производящей функции статистики Та — числа инверсий в повторной случайной выборке объема п [I, с. 135]: Ф„B) s EZT" = -L "П A + 2 + ... + 2Q , доказать, что L(Tn)~N( "^ ~ ' , -^Н при п-^оо. Указание. Перейти к характеристической функции и убедиться в том, что при rt->-oo и |/|^< 3.33. Проверить гипотезу случайности для данных задачи 1.22. Указание. Воспользоваться асимптотическим ва- вариантом критерия, основанного на статистике Тп (см. предыдущую задачу). 3.34. Получить выборки, объемы которых п = 20, 50, 100, равномерно распределенных случайных чисел. Проверить по этим выборкам гипотезу о равномерности распределения по критериям %2 и Колмогорова. 3.35. Получить выборки объема п = 100 приближенно нормально распределенных чисел, используя суммиро- суммирование jV равномерно распределенных слагаемых (Л/ = 4, 8, 12). Проверить гипотезу о нормальной распределен- ности при помощи критериев х2 и Колмогорова. 3.36. Получить выборку (-Y,) объема п = 200 равно- равномерно распределенных случайных чисел. С помощью кри- критерия Смирнова проверить, что подвыборки {Хц, i = 1, 2, .... 100) и (Ai+i, i — 0, 1, ..., 99) являются выборками из одного и того же распределения. 3.37. Смоделировать последовательность {А",} полино- полиномиальных псевдослучайных величин, принимающих зна- значения 1, ..., N. Образовать из этой последовательности две выборки (X2i, /=1,...,л) и (Хц+i, i = 0, ..., п — 1). С помощью критерия %г проверить гипотезу независимо- 98
сти величин, соответствующих этим выборкам. Расчеты провести для N= 2, 4, 10, п = 100. 3.38. Получить выборки, объемы которых п = 10, 20, 40, 100, равномерных псевдослучайных чисел. С помощью статистик Тп (числа инверсий в вариационном ряду вы- выборки) проверить гипотезу случайности. § 2. Выбор из двух простых гипотез 3.39. Пусть X = {Х\, ..., Хп) — выборка из биномиаль- биномиального распределения Bi(k; 0). Построить критерий Нейма- Неймана — Пирсона для проверки гипотезы Но: 0 = 0о против альтернативы Нп 0 = 9| (О<0о<0|<1) и вычислить его мощность. 3.40 (продолжение задачи 3.39). Показать, что при п->оо этот критерий асимптотически задается критиче- критической областью -во)}, 7"== 2 Х1гф(иа) = а, и его мощность Wn{8\) при 0i = 9(i") = 0О + -т=- , Р>0, удовлетворяет соотношению Указание. Воспользоваться теоремой Муавра — Лапласа. 3.41. По выборке X = (Х|, ..., Хп) из пуассоновского распределения П@) построить критерий Неймана — Пир- Пирсона для проверки гипотезы Но: 0 = Во против альтер- альтернативы Яг. 8 = 0i(O<0o<0i) и вычислить его мощность. Исследовать асимптотическое поведение характеристик этого критерия при больших объемах выборки. Указание. Использовать задачу 1.39 п. 4) и нормальную аппроксимацию для пуассоновского распределения с растущим параметром. Рассмот- Рассмотреть «близкую» альтернативу такого вида, как и в задаче 3.40. 3.42. Чтобы проверить гипотезу Яо: 6 = 0о против альтернативы Ни 0 = 0i (O<0o<6i<l) в схеме Бер- нулли с неизвестной вероятностью «успеха» б, осуществ- осуществлен эксперимент, в котором наблюдается число «успе- «успехов», предшествующих первому «неуспеху». Построить наиболее мощный критерий при уровне значимости 4* 99
a = Go, где s^l—заданное целое число, и убедиться в том, что вероятность ошибки второго ряда этого крите- критерия р = 1 —6]. 3.43. Пусть X = (Хи ...,Хп) — выборка из экспонен- экспоненциального распределения Г@, 1). Построить наиболее мощный критерий для проверки гипотезы Но: 0 = 90 против альтернативы Н\: 0 = 0| и вычислить его функ- функцию мощности. Указание. Воспользоваться тем, что LoB^,/0) = = х<2) (см. задачу 1.51), и решением задачи 1.39 п. 2). 3.44. Пусть для распределения Коши, K(Q) проверяется гипотеза Но: 6 = 0 против альтернативы Н\\ 0 = 1. Показать, что при уровне значимости а = —к- — arctg—«0,352 наиболее мощный критерий по од- одному наблюдению имеет вид х'\а = [Х^ 1/2} и его мощ- мощность равна -i--j-—arctg-i-« 0,648. Если же а = = —(arctg3 — arctgl) «0,148, то критерий имеет вид Хла = A ^Х^З}, а мощность равна —arctg2«0,352. 3.45*. Как выглядит критерий проверки гипотезы Но: L(l) = R( — a,a) против альтернативы Н\\ Щ) = Щ0,а2) (параметры а и а заданы), если известно, что наблюдае- наблюдаемая непрерывная случайная величина | имеет распреде- распределение, симметричное относительно нуля? Рассмотреть случай большой выборки. Провести с этих позиций ана- анализ следующих данных: —0,460 —0,114 —0,325 +0,196 — 0,174 при а = 1/2, а2 = 0,09. Указание. Применить центральную предельную теорему 3.46. В последовательности независимых испытаний вероятности положительных исходов одинаковы и рав- равны р. Построить критерий проверки гипотезы h0: p = 0 против альтернативы Н\\ р = 0,01 и определить наи- наименьший объем выборки, при котором вероятности оши- ошибок первого и второго рода не превышают 0,01. 3.47. Дана выборка X = (Х\, ..., Хп) из распределения N@ а2). Как выглядит наиболее мощный критерий для различения двух простых гипотез Ho:Q = 0о и Н\ :0 = 0i? Вычислить его мощность и убедиться в том, что он не- смещен. 100
3.48 (продолжение задачи 3.47). Определить мини- минимальный объем выборки п* = п*(а, р), при котором ве- вероятности ошибок первого и второго рода не превыша- превышают соответственно аи р. 3.49. Пусть X и У — выборочные средние двух выбо- выборок, объемы которых п и т, из распределений #(9, о?) и Л^92, ст|) соответственно. Основываясь на статистике Т = {Х — Y)/a, где а2 = а2у/п + о2/т, построить крите- критерий проверки гипотезы Но\ А = 9| — 9г = 0 против аль- альтернативы Ну: А > 0. Пусть заданы вероятности ошибок первого и второго рода а и р и объем п первой выборки. Определить мини- минимальный объем т* второй выборки, необходимый для того, чтобы ошибочные заключения могли быть сделаны с вероятностями, не превосходящими аир. Указание. Воспользоваться решениями задач 3.47 и 3.48. 3.50. По выборке объема п построить наиболее мощ- мощный критерий для различения двух простых гипотез от- относительно неизвестной дисперсии нормального распреде- распределения (среднее известно). Найти мощность критерия. 3.51.* Пусть по наблюдению X требуется различить два распределения с плотностями }0{х) (гипотеза Но) и fy(x) (гипотеза Ну). Рассмотрим критерий вида ВД = [х: /,(*) > cfo(x)}, c> 0, и пусть а(с) и р(с) — соответствующие вероятности оши- ошибок первого и второго рода. Показать, что: () а(с) ' 2) а(с) + р(с) ^ 1 — несмещенность; 3) min(a(c) + p(c)) = a(l) + p(l), т. к. критерий, мини- минимизирующий сумму вероятностей ошибок, есть ^i(l); 4) пусть X — повторная выборка объема п, т. е. л X = (Xi Х„), fj(x) = Ш/(*/). / = 0, 1. Вероятности ошибок критерия Xt(\) обозначим в этом случае ап и р„. Доказать, что если \fo(x)\n(f\{x)/fo{x))dx = б < 0, то а„, ря -*¦ 0 при п -*¦ оо (таким образом, при бесконечно большой выборке возможно полное разделение гипотез Но и Ну). 101
Указание. Записать АГ(( 1) = [х: Тп{х) = = — 2 In yff1' > 0] и применить к статистике Т„(Х) закон больших чисел. Заметим также, что согласно неравенству Йепсена всегда 6^0 [1, с. 121]. 3.52.* Пусть ? = (|i, .... |,) — нормальный случай- случайный вектор, имеющий при гипотезе Н, распределение Л/(ц('>, Л), t = 0, 1 (общая ковариационная матрица А предполагается невырожденной). Построить критерий Неймана — Пирсона для различения гипотезы Нй при альтернативе И{ по одному наблюдению над ?, а также критерий, минимизирующий сумму вероятностей ошибок. § 3. Сложные гипотезы 3.53. Для биномиальной модели Bi(k, 0) построить р.н.м. критерий по выборке объема п для проверки ги- гипотезы Иа: 0 ^ 0о против альтернативы Н\\ 0 > Во. Указание. Воспользоваться свойством модели с монотонным отношением правдоподобия и решением задачи 3.39. 3.54. Убедиться в том, что построенный в задаче 3.41 критерий Неймана — Пирсона (для пуассоновской моде- модели П@)) является одновременно р.н.м. критерием для про- проверки гипотезы На'- 0 ^ Оо против альтернативы Н\\ 0>00. | У к а з а и н е. См. решение задачи 3.53. 3.55. Пусть в схеме Бернулли с неизвестной вероят- вероятностью «успеха» 0 испытания продолжаются до получе- получения r-го «неуспеха» и Тг — наблюдаемое число «успе- «успехов». Построить р.н.м. критерий проверки гипотезы Но: 0 ^ 00 против альтернативы Н\\ 0 > Go и показать, что при г —*¦ оо соответствующая критическая граница при уровне значимости а имеет вид ta = (r00 — иал//-00)/( 1 — GO), Ф(на) = а. Указание. Воспользоваться свойством модели с монотонным отношением правдоподобия, представле- представлением Тг = Xi + ... + Хг, где Х\, ..., Хг — независимые одинаково распределенные случайные величины и ЦХ[) = В/A,0), и применить центральную предель- предельную теорему. 3.56. Показать, что построенные в задаче 3.43 крите- критерии являются р.н.м. критериями в задачах проверки слож- сложных односторонних гипотез соответственно Яо: 0 ^ 6о против //i: 0 > Оо и Но'- 0 ^ Оо против Н\\ G <С 0о- 102
3.57 (выборочный контроль). Пусть партия из iV изде- изделий содержит неизвестное число 8 дефектных изделий, 0 е {0, 1, ..., N]. Чтобы проверить гипотезу Яо: 9 ^ 8о про- против альтернативы Я(: 0 > Эо, берут на контроль п изделий и каждое из них проверяют. Основываясь на статистике Т — обнаруженное в выборке число дефектных изделий, построить р.н.м. критерий. Указание. Убедиться в том, что распределение статистики Т (гипергеометрическое распределение #(8, N, л)) имеет монотонное отношение правдоподо- правдоподобия. 3.58. Для нормальной модели N(Q, о2) с неизвестным средним построить р.н.м. критерии для проверки гипо- гипотез Яо: 9 < 0о против Ht: 0 > 0О и Яо: 0 > 60 против Н\\ 9<9о. Указание. Использовать решение задачи 3.47 и свойства экспоненциальной модели. 3.59. Убедиться в том, что построенный в задаче 3.50 критерий для случая 0o>9i одновременно является р.н.м. критерием проверки сложной гипотезы Но: 8 ^ 00 при левосторонней альтернативе Н\\ 0 < 0<ь аналогично, критерий для случая 0о < 0i является р.н.м. критерием проверки гипотезы Яо: 0 ^ во при правосторонней аль- альтернативе Н\\ 8 > в0. Указание. Воспользоваться свойствами экспо- экспоненциальной модели (см. п. 5 введения к гл. 3). 3.60.* Основываясь на задачах 3.47 и 3.58 и приме- применяя прием объединения двух односторонних критических областей, построить несмещенный критерий для проверки гипотезы о среднем Яо: в = во против двусторонней аль- альтернативы Н\\ 8=^в0. Является ли этот критерий р.н.м. критерием? 3.61.* Пусть X = (Х\, ..., Хп)— выборка из нормаль- нормального распределения N(\i, 02). Построить р.н.м. несмещен- несмещенный критерий проверки простой гипотезы Яо: 6 = во при двусторонней альтернативе Н\: 0 Ф 9о. Указание. Применить теорему 4.5 [1, с. 159] об общем виде р.н.м. несмещенного критерия и исполь- использовать решение задачи 3.50. 3.62. По выборке объема п из распределения Г(8, 1) построить р.н.м. несмещенный критерий для проверки гипотезы Яо: 8 = во против альтернативы Ни О Ф 0О. Указание. Использовать решение задач 3.43 и 3.61. 3.63. По выборке большого объема п построить ло- 103
кальный наиболее мощный критерий проверки гипоте- гипотезы Яо: 0 = во против общей альтернативы Н\\ 6 Ф 0о для модели Bi{k, 6). Показать, что его функция мощно- мощности Wn(Q) при уровне значимости а и локальных альтер- альтернативах вида 0 = 0(л) = 0о + Р/У" удовлетворяет пре- предельному соотношению lim fM= yeo(i-eo) Указание. Воспользоваться общим видом асимп- асимптотического (при больших п) двустороннего крите- критерия для регулярных моделей: *« = [\Щх; во)| >-иа/2Л/Ш(в0)}, где U(x\ 8) — функция вклада выборки X = = (Х\, ..., Х„) и г(8) — функция информации Фишера [1, с. 162]. Использовать решения задач 3.39 и 3.40. 3.64. По выборке большого объема п построить ло- локальный наиболее мощный критерий проверки гипоте- гипотезы Но: 0 = Во против альтернативы Н\\ 0 ф 0О для мо- модели ПF). Показать, что его функция мощности й?„F) при уровне значимости а и локальных альтернативах вида 0 = 0(л) = 0о + рУл/я удовлетврряет предельному соотношению n(Q^) - Ф( Указание. Использовать указание к задаче 3.63 и решение задачи 3.41. § 4. Проверка гипотез и доверительное оценивание В задачах 3.65—3.72 воспользоваться принципом со-' ответствия между задачами доверительного оценивания и проверки гипотез (см. п. 6 введения к гл. 3). 3.65. Используя построенные в задачах 2.119—2.120 доверительные интервалы для параметров 0i и 02 нор- нормальной модели iV@i,0i), построить критерии проверки нулевой гипотезы Яо против альтернативы Я, в следую- следующих задачах: 1) 2) 3) 4) 5) 6) Яо: 0i Яо: 0, Яо: 0i Яо: 02 Яо: 62 Яо: 62 = 8 = 8 = 0 = 8 = 8 = е 10, Я1 ю, Н\ ю, Я| 20, Н\ 20, Н\ 20, Н\ 0, 01 е, е2 е2 е2 > < ф > < ф 6|0 01О) 6|0 020 02О; 020 104
3.66. Используя решения задач 2.122—2.123, убедить- убедиться в том, что критерий уровня значимости а для гипотезы о равенстве средних двух нормальных моделей в случае известных дисперсий имеет вид ХХа = {(х, у): \х — у\ > Ut-a/2-^a'i/n + a'i/m}, а если дисперсии неизвестны — следующий вид: > /¦ -а/^т-л1 пПт + ™т _ 2) (nS\x) + mS\y))). 3.67. Основываясь на решении задачи 2.125, показать, что для проверки гипотезы о равенстве диспер- дисперсий двух нормальных моделей можно использовать кри- критерий У) ^/' либо п{т-\) m(n-l) S2(j/) -" ri-^-,n-i.m 3.68. В условиях задачи 2.127 построить критерий проверки гипотезы однородности Но', т = 02/91 = 1 (т. е. 0| = 0г) и вычислить его функцию мощности. 3.69. Основываясь на доверительном интервале зада- задачи 2.128, построить критерий проверки гипотезы Но: 8 = во для соответствующей модели. Вычислить функ- функцию мощности этого критерия и убедиться в том, что он несмещенный. 3.70. Используя результаты задачи 2.129, построить критерий проверки гипотезы #о: 0 = 60 для равномер- равномерного распределения У?@,9) ^ вычислить его функцию мощности и убедиться в том, что он несмещенный. 3.71. Основываясь на результате задачи 2.130, убе- убедиться в том, что критерий проверки гипотезы На: 8 = 0О для модели Вейбулла W{0, X, 9) имеет вид Чтобы получить несмещенный критерий, величины у%,,2П и х?-в1,2л выбираются так же, как в задаче 3.62. 3.72. Используя условие задачи 2.131 и ее результат, построить критерий проверки гипотезы Но: @i, 02) = = (8ю, 02о). 105
§ 5. Критерий отношения правдоподобия (к.о.п.) 3.73.* Получить форму к.о.п. для гипотезы о среднем Яо: 0, = Эю нормальной модели N(Q\, 0i) и показать, что для больших выборок он имеет вид Х\а = {х: Угс— 1 \х — Q\0\/S(x) > —иа/г), а его мощность при альтернативе 0^п) = 0io + P/V" пРи п ->- оо равна 1 — F\(ul/2; p2/0i) (см. п. 7 введения к гл. 3). Указание. Использовать задачи 1.47 и 2.44 и асимптотическую теорию к.о.п. [1, с. 175]. 3.74.* Убедиться в том, что к.о.п. для гипотезы о дис- дисперсии Яо: 02 = 020 нормальной модели Л/"@1, 0|) имеет вид Х[а = {nS2(x)/Qld^H^i,.n-l} U {nS2(x)/Qlo ^ X2-a*. я-l}, где oci + яг = а и S2 — выборочная дисперсия для вы- выборки объема п. Вычислить функцию мощности этого критерия и определить, при каких значениях cci и <*2 он будет несмещенным. Указание. Воспользоваться тем, что Lo(nS2(X)/Ql) — — Х2(я — 1). и решением задачи 3.61. 3.75. Построить к.о.п. для гипотезы Яо: 0 = 60 в моде- модели Bi(l,0) и убедиться в том, что его асимптотический (при больших объемах выборки) вариант совпадает с локальным наиболее мощным критерием, построенным в задаче 3.63 (при значении параметра k = 1). Указание. Воспользоваться общей теорией к.о.п. для полиномиального распределения [1, с. 170— 171]. 3.76. Построить к.о.п. для гипотезы Но: 0 = 0о в мо- модели П@) и убедиться в том, что его асимптотический вариант для больших выборок совпадает с локальным наиболее мощным критерием, построенным в задаче 3.64. Указание. Воспользоваться тем, что при п -*¦ оо предельные распределения при гипотезе Но статис- статистик — 2 In А.,, и Q(n] = U2n(Q0)/ni{Qo) совпадают [1, с. 169. 3.77.* Пусть Xi Xk — выборочные средние для независимых выборок объемов п\ п* из совокупностей Bi(l,0i), ..., Bi(\,Qk) соответственно. Построить и рассчи- рассчитать асимптотический (при п\, ..., я*-»-оо) вариант к.о.п. для гипотезы однородности Яо: Gi = ... = 0*. Убедиться 106
в том, что этот критерий имеет такой же вид, как и кри- критерий однородности х2 [1, с. 124—126]. |Указание. Использовать решение задачи 3.75. 3.78.* Пусть X; = (Хц, .... Х/л), / = 1, ..., k, — незави- независимые выборки из совокупностей n@i), ..., П@*) соответ- соответственно. Построить и рассчитать асимптотический (при п\, ..., rt/i^-oo) вариант к.о.п. для гипотезы однородно- однородности На'. 9i = ... = 0*. Проанализировать с этих позиций следующие данные: выборочные суммы для четырех вы- выборок, объемы которых 120, 100, 100 и 125, из пуассо- новских совокупностей оказались равными соответствен- соответственно 251, 323, 180 и 426. Одинаковы ли генеральные сред- средние? 3.79.* Пусть и,-, X; и 5/ — соответственно объем, вы- выборочные среднее и дисперсия для выборки из совокуп ности JV(9i,-, 62), / = 1, .... k (выборки предполагаются независимыми). Построить к.о.п. для гипотезы однород- однородности Но: 0ц = ... = 01*. Убедиться в том, что в случае двух выборок (k = 2) этот критерий имеет вид (ср. с за дачей 3.66) Xta = {|Г| >*1-„/2.„,+„,-г), где IV Y \~\ I П[П2(п, + П2 — 2) - (А, - Х2)Д/ Указание. Использовать задачи 2.86 и 2.114, а также утверждение, что ЦТ\М0) = S(n — 2) [1, тео- теорема 1.12]. 3.80.* Пусть 5?, ..., S2k — выборочные дисперсии, по- построенные по независимым выборкам объемов ti\, ..., rik из совокупностей N(Q[j, О^), / = 1, ..., k, соответственно. Построить к.о.п. для гипотезы о равенстве дисперсий Но'. 021 = ... = 02*. Убедиться в том, что в случае двух выбо- выборок (fe = 2) этот критерий имеет (ср. с задачей 3.67) вид Х\а — {F ^ Fa,.* - Lin - l) U \F ^ F\ _ aj.n, - 1,я, - I), где a, -f a2 = a, F = [я,(я2 - l)S?l/[rt2(«, - 1)S|J. Указание. Использовать решение задачи 3.79, а также утверждение L(F\H0^ = S(nt — 1, «j — 1) [1, теорема 1.13]. § 6. Разные задачи 3.81. Наблюдаемые случайные величины X , Хп не- независимы и нормальны, но, вообще говоря, имеют разное распределение. Требуется проверить гипотезу Но о том, что они одинаково распределены. Используя задачу 1.58, убедиться в том, что соответствующая критическая об- 107
ласть при уровне значимости а может быть задана в виде Х\а = (|тI > у«). гДе v<x определяется через функцию бе- бета-распределения с помощью соотношения В ( 1 — ь\; ^—^—, -у-j = а (для нахождения va могут быть исполь- использованы таблицы бета-распределения р(^Чг—, ~о~))- 3.82. Пусть Xt = (Xi\, Xi2), i — \, ..., n, — независимые наблюдения над двумерной случайной величиной | = = (ti,h)< имеющей нормальное распределение с неиз- неизвестными параметрами, и р„ — построенный по этим дан- данным выборочный коэффициент корреляции. Основываясь на результатах задачи 1.59, убедиться в том, что критическая область Ala =(lpJ > - задает критерий уровня значимости а для гипотезы Но о независимости компонент || и |2- 3.83. Пусть наблюдаемые случайные величины Х\, ..., Хп независимы и L(Xi) = U(Qi), i = 1, ..., п. Требуется проверить гипотезу однородности Яо: 0| = ... = 9„. Осно- Основываясь на результате задачи 1.60, убедиться в том, что при больших п можно использовать критерий Х\а = = {|7\,| > -U./2). 3.84. Какой критерий согласия может быть построен на основе результата задачи 1.61? 3.85.* (Асимптотическая эффективность критериев). Рассмотрим задачу проверки простой гипотезы Нй: 0 = 0О против альтернативы /Л: 0 > 00 для некоторой модели со скалярным параметром 6g0, где в — некоторый ин- интервал действительной оси. Предположим, что в данной задаче используются критерии вида Х\ = [Тп ^ у,,}, где Та — некоторая статистика для выборки объема п, обла- обладающая следующими свойствами: а) существуют функции ц.@) и а@) > 0 такие, что равномерно по 0 в интервале 0о^О^0о + "П. гДе т] > 0 — любое число, при п -*¦ оо U{Tn) ~ ЛГ(ц@), a2(G)/n); б) ji(Q) дифференцируема в точке 0О и |а'@о) > 0, а о@) непрерывна в 0О. Доказать, что: 1) критическая граница уп при уровне значимости а асимптотически имеет вид Уп == ц@о) — 108
2) при близких альтернативах вида 0(л) = Go + V р > 0, мощность №„(9(я)) критерия удовлетворяет пре- предельному соотношению е(Р, а)з= lim №„@(п)) = Ф(Рц'(в0)/о(в0) + ы«). П-ЮО Замечание. Величина е = е(р\ а) называется эффективностью Питмена критерия Xia = {Г„ ^ > (л@о) — uaa@o)/V«) и ее часто используют в качестве меры сравнения различных критериев: мера е дает представление о локальном поведении кривой мощ- мощности критерия в окрестности точки 0О для больших выборок. 3.86* (продолжение задачи 3.85). Пусть ?j\ j = = 1, 2, — две статистики, удовлетворяющие сформули- сформулированным условиям; соответствующие им характеристики будем отмечать индексом /. Предположим, что для каж- каждого п существует целое Nn такое, что т. е. мощности соответствующих критериев при альтерна- альтернативе 8(п) равны, если п — объем выборки в первом слу- случае и Nn — во втором. Пусть также Nn-> <x> при гс->-оо. Доказать, что 1 = lim JL. = (ЛШЛ2 /( ^@о)\2 _ _± n-lL Nn \ о2@о) ) I \<т,(Оо)/ е\ ' где е' = (ц'@о)/а@о)J. Замечание. Величина е', являющаяся возрас- возрастающей функцией эффективности Питмена еф, а) при фиксированных р и а, также может служить мерой асимптотической эффективности критерия. Сформулированное утверждение означает, что отно- относительная эффективность второго критерия по отно- отношению к первому равна пределу обратного отноше- отношения выборочных объемов, необходимых для того, чтобы достичь одинаковой мощности при указанных альтернативах 0(л). 3.87. Пусть требуется проверить гипотезу Но'. 0 = 0о против альтернативы Н\: 0> 0о для нормальной модели iV(9, a2). Построить критерии вида Х\ = (Г„ ^ уп}, осно- основываясь на статистиках 1\Р = X — выборочное среднее и 7(„2) = Zn. i/2 — выборочная медиана, и показать, что от- относительная эффективность второго критерия по отноше- отношению к первому X = 2/л = 0,637... 109
Указание. Воспользоваться решениями задач 3.86, 3.85 и 1.32. 3.88.* Пусть наблюдается случайный вектор X = = (Xi, ..., Хп), имеющий распределение L0(X) = = N@t, 2 = ||а,;||"), где 0 — неизвестный скалярный па- параметр, / = (/,, ..., tn), 0<tt < t2< ... <tn — известные константы и ац = /,-, i^j. (Если г)(/), / ^Э О, — винеров- ский процесс [2, с. 221], т. е. однородный случайный процесс с независимыми приращениями, причем L(r\(t)) = = N(Qt, t), то Xi = r\(ti), i = 1, .., и, т. е. X — наблюде- наблюдения над r\(t) в моменты t\, ..., tn.) Убедиться в том, что достаточной статистикой для 8 является последнее наблюдение Хп и, основываясь на этом, построить критерии проверки гипотезы Но: 0 = 0, т. е. гипотезы об отсутствии систематического тренда (смещения, сноса) (рассмотреть альтернативы #i+: 9>0, НГ: 9<0hWi:8^0). Указания. 1. Воспользоваться критерием фак- факторизации, установив при этом равенство f2 = = @...01). 2. Использовать решения задач 3.47, 3.58 и 3.60. Глава 4 ЛИНЕЙНАЯ РЕГРЕССИЯ И МЕТОД НАИМЕНЬШИХ КВАДРАТОВ 1. Под линейной регрессионной моделью понимают такую ситуацию, когда наблюдаемые случайные величи- величины Х\, ..., Х„ «в среднем» линейно зависят от некоторых неслучайных факторов z\, ..., Zk {k < п), значения кото- которых могут меняться от опыта к опыту. В этом случае исходные статистические данные состоят из множества наблюдавшихся значений «откликов» Х\, ..., Хп и соот- соответствующих значений факторов, т. е. имеют вид (хг, гу, .... z^0), t=l, .... п, и считается, что где р = (pi, ..., р*) —совокупность неизвестных парамет- параметров, называемых коэффициентами регрессии. Если ввести случайные величины е,; = Xt — z(l)p, называемые «ошиб- «ошибками» измерений, и матрицу плана Z = ||z(l)...z(/I)|| разме- размером kXn, то в матричных обозначениях модель записы- записывается в виде X = Z'$ + e, X - {X Х„), г = (в,, .... ея). D.1) 110
Здесь Е(е) = 0 и обычно предполагается, что наблюдае- наблюдаемые случайные величины некоррелированы и имеют оди- одинаковые дисперсии, т. е. матрица вторых моментов век- вектора наблюдений X имеет вид D(X) = D(e) = Еее' = а2Еп. D.2) Величина а2 называется остаточной дисперсией и обычно также неизвестна. Если неслучайные переменные имеют вид Zj = a,{t), где а,(?) — полином, то говорят о параболи- параболической регрессии. В приложениях часто параметр k = 2, а векторы 2^ имеют вид 2@ = A, /,¦), т. е. в данном случае EX; = Pi + + Р26, i = 1, •-., п (среднее значение наблюдений являет- является линейной функцией одного фактора /). Этот случай на- называют простой регрессией, прямую ср(/) = р, + р2< — линией регрессии, а коэффициент р2 — ее наклоном. В ряде задач регрессионного анализа делаются до- дополнительные предположения о виде распределения «ошибок» е и часто считается, что они нормально рас- распределены, т. е. L(e) = N@, о Еп). В этом случае модель имеет вид ЦХ) = N(Z'fi, o2En) D.3) и ее называют нормальной регрессией. К модели линейной регрессии сводятся многие задачи прикладных исследований, в которых речь идет об опре делении вектора неизвестных параметров р = (Pi, .... р*), причем обычно можно измерить лишь некоторые функции от этих параметров, а прямое их измерение невозможно. К задачам такого типа относятся, в частности, задачи восстановления функциональной зависимости. В этом случае неизвестными параметрами являются коэффици енты разложения восстанавливаемой функции по какой- либо системе функций. 2. Основными задачами регрессионного анализа яв- являются задачи оценивания неизвестных параметров р = = (р , р«) и а2 модели D.1) — D.2), а в случае нор- нормальной регрессии D.3) — их доверительное оценивание и проверка гипотез о параметрах. Основным методом построения оценок для коэффи- коэффициентов регрессии р является метод наименьших квад- квадратов, в соответствии с которым оценки этих параметров находят из условия обращения в минимум квадратичной формы: ш
S(P) = S(X; p) = (X - Z'P)'(X - Z'P). D.4) л л л Точку р = (Pi, ..., рД удовлетворяющую равенству S(p) = minS(p), называют оценкой наименьших квадра- р тов (о.н.к.) параметра р. Определяющую роль в решении этих задач играет матрица А = ZZ'. В дальнейшем считается, что эта матрица невырождена (или, что эквивалентно, rangZ = = k). При этом предположении о.н.к. единственна, опре- определяется нормальным уравнением Лр = Y = ZX и имеет вид р = A~[Y == A~[ZX. При этом оценка р" является несмещенной (Ер = Р) с минимальной дисперсией (т. е. дисперсии всех компонент вектора р" минимальны) в клас- классе всех линейных (т. е. линейно зависящих от наблюде- наблюдений X) несмещенных оценок р. Более того, такими же свойствами обладает и любая линейная функция i = Гр как оценка параметра t = TfL (здесь Г —заданная мат- матрица некоторого размера mXk); при этом D(t) = = а*ТА-1Г, в частности D(P) = o^A Несмещенной оценкой остаточной дисперсии а2 явля- является [1, с. 181 —184) статистика а2 = -!-S(P) = —1—Х'ВХ, В = En-Z'A-'Z. D.5) В задачах интерполяции, когда для неизвестной функ- функции х = /(/), связывающей переменные t и х, по измере- измерениям {U, Xi = xt + Si), xi = f(ti), i = 1, ..., n, подбирают интерполяционный многочлен вида ф('; Р) = 2 Р,-а,-@. где в качестве a\{t), a2(t), ... используют ортогональные многочлены Чебышева, о.н.к. неизвестных коэффициен- коэффициентов р, вычисляют по формулам Р/= 4-S atfi)Xt, aj = i a%U\ /=1,2, .... п л при этом величина S(P) = 2 Xf — 2 afp,2 характеризует i=i y=i точность приближения; первые три многочлена Чебыщева имеют вид: а, (/) == 1 иг
где t = —2 ti, sk = sk{tu .... tn) = —2 (U - Г)* [!, с 189-191]. Метод наименьших квадратов применяют также в случае, когда зависимость ЕЛ/ от р не является линейной. Пусть *,- = /(/.-, Р,, .... Р*)+е„ i=l, .... и, где Ее,- = 0, De^ = a2, cov(e,, е,) = 0 (/ ф\)- Тогда о.н.к. р параметров р минимизируют по Р выра- выражение = 2№-/(i- Р., -¦ иг- Таким образом о.н.к. р являются решением системы уравнений ~арГ = 0> ' = '• -¦ к- Приведем пример вычисления оценок параметров р. Пусть требуется определить неизвестные коэффициенты (pi, Рг, рз) функциональной зависимости x{t) = р, + tfa + t%- Будем предполагать, что в точках /,¦ = 2 -\—-, i = = 1, ..., п, измерены значения функции x{t). Ошибки из- измерений е,, / = 1, ..., п, будем считать независимыми и нормально распределенными с Ее, = 0, De, = а2. В этом случае имеем линейную модель X, = x(ti) + е, = р, + /,-ра + /?Рз + е„ i = 1, .... п, и оценки Pi, ^2, Рз удовлетворяют системе уравнений ;= i .= 1 ' ' i • D.7) П Л Л Л Пусть Pi = 3, р2 = — 1, рз = 1, а2 = 0,04. Смоде- Смоделируем е, в случае п = 25, п = 100 и найдем соответст- соответствующие Xi. Из системы D.7) находим: 113
1) n = 25 p = 2,983; p2 = —0,828; p3= 0,895; a2 = 0,034. 2) n = 100 p\= 2,992; p2 = —1,007; p3 = 1,001; o2 = 0,046. На рис. 5 и 6, относящихся к случаям п = 25 и п = 100 соответственно, приведен график точной функ- функциональной зависимости x(t) = Pi -4- р2^ + Рз^3. знаком О отмечены результаты измерений (tiyXi), а также приве- приведены графики функций x(t) = Pi + fct + Рз^3- 3. Для схемы нормальной регрессии D.3) о.н.к. ^ со- совпадают с оценками максимального правдоподобия (о.м.п.) параметров р. В этом случае 7"Д°веРительный интервал для параметра р, имеет вид D.8) где а" — /-й диагональный элемент матрицы А ', а для остаточной дисперсии 2 5(Р)/1,„_;> D.9) Y-Доверительная область для вектора t = Гр, где 7"— заданная матрица размера my.k и rangT = m, строится по формуле Gy(X) = {<:(Гр - t)'D-\T§ - t) <_^T D.10) где D = ГЛ-'Г [1, с. 194—196]. Если требуется одновременно оценить некоторые ли- линейные комбинации параметров р, т. е. величины Х'р, г = 1, ..., т, где "К, — заданные векторы, то система со- совместных доверительных интервалов с доверительным уровнем, большим или равным 7. имеет вид КЬ - «y(*; k) < A/rp < Kb + uJX; К), г = 1, .... m, D.11) где tii(X;*.) = [Tt-IS(toFy,k,a-kWA-lk)\1'2 [1, с. 198]. Наконец, для проверки линейной гипотезы вида Но: Ре Во = (р: Тр = /о}, где Г — заданная матрица коэф- коэффициентов ограничений размера mXk и rangj = m, t0 — заданный вектор, используют F-критерий с критической областью вида 114
2,5 - 10 t Рис. 5 где ST = min S(P) — условный (при гипотезе Яо) ми- нимум 5(Р) [1, с. 199—200]. 4.1. Для линейной модели D.1) лв случае k = 2 за- записать явно выражения для о.н.к. (рь р2) через (A"i Хя) и z@ = BA'), 2«), i=l, ..., п. 4.2. Для модели простой регрессии X,- = Pi + М." + е,-, i = 1, •.., /г, найти явный вид о.н.к. ([3i, C2), проверить их несмещен- несмещенность и найти условие их состоятельности. 4.3. Вычислить оценку о2 (см. D.5)) остаточной дис- дисперсии а2 в задаче 4.2. Указать достаточное условие ее состоятельности. 4.4. Найти cov(Pi, ?2) оценок Pi, p2, определенных в задаче 4.2. 4.5. Значения функции x(t) = Pi + Рг^ + Рз^2 измерены в точках /,¦ (i = 1, ..., п): X: = р, + p2f, + p3f? + е,; Ее, = 0, De, = a2. Найти: 1) о.н.к. Pi, p2, Рз параметров Pi, p2, р3; 2) Ер,, Dhi= 1.2, 3; cov(p,-, %). 4.6. Является ли статистика ь 7= \x{t)dt а 115
3,5 3,0 -0.5 0,0 W i Рис. 6 несмещенной оценкой интеграла / = )x(t)dtt где x(t) = а = fti + M + pV^ a x(t), Pi, р2, Рз определены в зада- задаче 4.5? Найти D/. 4.7. Смоделировать наблюдения Xt = Pi + p2*/ + ?/. i = 1, ..., п, если п = 100, ti = 21/п, р, = 2, р2 = 1, е,-— независимые равномерно распределенные случайные ве- величины на отрезке [—1,386; 1,386]. Построить графики функций x(t) = 2+t, x{t) = Pi + p2< на отрезке [0, 2]; отметить также точки (/,-, Х{), i = 1, ..., п. 4.8. Решить задачу 4.7 с е, распределенными нормаль- нормально с Ее,- = 0, De,- = 0,16. 4.9. В предыдущей задаче построить 7"Д°веритель- ные интервалы для параметров р,, р2 и а2 (см. D.8) — D.9)), а также у-доверительный эллипс Gy(X) (см. D.10)) для вектора р = (Pi, р2); считать у = 0,9 и у = 0,95. | Указание. Использовать решения задач 4.2—4.3. 4.10. По данным независимых равноточных измерений (X/, ti), I = 1, ..., п, значений некоторой линейной функ- функции x(t) = Pi + p2/ (погрешности измерений подчиняются нормальному распределению N@, а2) с неизвестной дис- дисперсией) построить доверительный интервал для интегра- интеграла от этой функции на отрезке — а</^а (а задано). Пб
Произвести соответствующие вычисления для следующих данных: B,96; —2), C,20; —1), C,41; 0), C,63; 1), C,79; 2) при а — 2 и доверительном уровне у = 0,95. 4.11. Координаты a(t) движущейся равномерно и пря- прямолинейно точки в моменты t = 1, 2, 3, 4, 5 оказались соответственно равны 12,98; 13,05; 13,32; 14,22; 13,97. Предполагая погрешности измерений независимыми и нормальными N@, о2), построить 0,95-доверительный эл- эллипс для точки (<з@), и), где v — скорость точки. 4.12. Смоделировать наблюдения Xi = pi + р2/,-f- + Рз<? + е„ i = 1, ..., я, с р, = -8, р2 = 10, р3 = —2, п = 100, /,¦ = 1 -\-2i/n, е,-независимые равномерно рас- распределенные случайные величины на отрезке [—1,386; 1,386] .лПостроитьлграфики функций x(t) = р, + fat + р2/2, x{t) = Pi + pV + pV2 на отрезке [1, 3]; отметить также ТОЧКИ (/,-, Xi), L = 1, ..., П. 4.13. Решить задачу 4.12 в случае нормально распре- распределенных е, с Ее, = 0, De,- = 0,16. 4.14. В предыдущей задаче построить у-доверитель- ные интервалы для параметров Pi, р2, р3 и о (см. D.8) — D.9)), а также систему совместных доверительных ин- интервалов уровня, большего или равного у, для Pi, p2, Рз (см. D.11)). I Указание. Использовать решение задачи 4.5. 4.15. В четырехугольнике ABCD результаты незави- независимых и равноточных измерений углов ABD, DBC, ABC, BCD, CDB, BDA, CDA и DAB (в градусах) соответст- соответственно таковы: 50,78; 30,25; 78,29; 99,57; 50,42; 40,59; 88,87; 89,86. Считая, что ошибки измерений распределе- распределены нормально #@, о2), найти о.н.к. углов р, = ABD, р2 = DBC, Рз = CDB и р4^= BDA. Построить 0,95-дове- 0,95-доверительный интервал для а2. 4.16*. Доказать, что о.н.к. р является оптимальной оценкой р в классе всех линейных (т. е. линейно завися- зависящих от X) несмещенных оценок рл (т. е. дисперсии Dp, минимальны V); получить, что D(P) = а2Л~' = а2||а''||. 4.17. Доказать несмещенность оценки а2 для остаточ- остаточной дисперсии ст2. Получить явную зависимость а2 от X, указанную в формуле D.5). Указание. Использовать разложение S(fi) = = 5(р).+ (р - р)'Л$ - р) и формулы cov(p,-, P/) = = о а1' (задача 4.16). 4.18. Пусть матрица плана Z обладает свойством, что ее стирки ортогональны. Как выглядят в этом случае о.н.к. Pi, .... р* и их вторые моменты? 117
4.19.* Пусть имеются к предметов, веса которых рь ..., Р* неизвестны. Для определения этих весов взве- взвешивают комбинации предметов: каждая операция (одно взвешивание) состоит в том, что несколько предметов кладут на одну чашу весов, несколько — на другую и добавляют равновес для приведения весов в равновесие. В результате получают соотношения z\'% + ... + zf$k = у, (для i-ro взвешивания, i = 1, ..., п), где z^ = 1, —1, О в зависимости от того, лежит /-и предмет на левой чаше весов, на правой или вообще не участвует в данном взве- взвешивании, а у-, — добавляемый равновес. Считая погреш- погрешности измерений независимыми и нормальными N@, а2), оценить веса четырех предметов по данным следующей таблицы восьми взвешиваний: Pi Рз Р« Вес 1 1 1 1 20,2 1 -1 1 -1 8,1 1 1 — 1 -1 9,7 1 -1 -1 1 1.9 1 1 1 I 19,9 1 -1 1 -1 8.3 1 1 -1 -I 10.2 1 -1 -1 1 1.8 Найти матрицу ковариаций оценок, а также оценку для а2. Сравнить точность этих оценок с точностью оце- оценок, получаемых обычным способом, когда каждый пред- предмет взвешивают несколько раз и в качестве оценки его веса принимают среднее арифметическое результатов взвешиваний. Указание. Использовать решение предыдущей задачи. 4.20. Для данных предыдущей задачи построить си- систему совместных доверительных интервалов для Pi, .... р4 уровня, большего или равного 0,95. 4.21. Найти оценки максимального правдоподобия параметров р и о2 нормальной регрессии D.3) и вычис- вычислить их смещения. 4.22. Убедиться в том, что ^-доверительный интервал к для произвольной линейной комбинации Х'Р = 2 X,,-pj ко- /=i эффициентов нормальной регрессии D.3) имеет вид 118
4.23. Построить 7-ДОверительный интервал для орди- ординаты ф(/) == Cj —(— fi2t линии регрессии в произвольной точке t (модель предполагается нормальной). Произвести соответствующие выч-исления для данных задачи 4.8 для t = 1,5, у = 0,95. Указание. Использовать решения задач 4.2—4.4 и 4.22. 4.24. Убедиться в том, что интервалы _ р\ ±Г к 5#)/г 1Я_4(а« _ 2ач + а")]1'*), образуют систему совместных доверительных интервалов уровня >y Для разностей р,— р,, i > /. 4.25. Построить систему совместных доверительных интервалов для средних значений всех наблюдений Х\, ..., Хп в модели нормальной регрессии. 4.26.* Пусть Г —заданная матрица размера mXk (т < k) и rang7 = т, t0 — заданный m-мерный вектор такой, что система Гр = /0 совместна. Обозначим St = = min S(P) и назовем обобщенной о.н.к. ВТ то значе- ние р, при котором St = S(Pr). Доказать, что где матрица D = ТА~ХТ' положительно определена. Найти разложение ST = S(P) + Gр - to)'D-\Tb - t0). 4.27. Убедиться в том, что критерий уровня значимо- значимости а для проверки гипотезы Но- Рг = Рго, фиксирующей значение наклона линии регрессии (в нормальной мо- модели), задается критической областью Указание. Использовать решение задач 4.2—4.3 и соотношение D.12). 4.28. При каких значениях уровня значимости а от- отклоняется гипотеза Но: р2 = 1,2 по данным задачи 4.8? 4.29. Значения независимых случайных величин А^A) (i = 1, 2, 3, 4; / = 1, 2) приведены в следующей таб- таблице: 119
x 1 2 1 8,67 10,03 2 9,71 10,23 3 10,16 9,26 4 13,65 13,79 Предполагая, что L(X^) = N(\iit а2) (все параметры неиз- неизвестны), построить оценки для ц,, ц2, Цз, ц4 и о2 и про- проверить гипотезу однородности Hq: p-i = цг = (Аз = 1*4 (уровень значимости принять равным 0,1). 4.30. Построить интерполяционный многочлен вида к Ф*(/, Р) = 2 Р/а/@ Для ^ = 2 и 3, где а/@ —многочлены /=| Чебышева (см. 4.6)) по следующим данным, отражаю- отражающим неизвестную зависимость х = f(t): t, Xl 0,40 0,39 0,52 0,50 0,61 0,57 0,70 0,65 0,79 0,71 0,86 0,76 0,89 0,78 0,95 0,81 0,99 0,84 Как изменяется точность интерполяции при переходе от k = 2 к k = 3? 4.31. Решить задачу, аналогичную предыдущей, для следующих данных: и Xl 0 66,7 4 71,0 10 76,3 15 80,6 21 85,7 29 92,9 36 99,4 51 113,6 68 125,1 4.32. Выписать четвертый многочлен системы ортого- ортогональных многочленов Чебышева Указание. Использовать рекуррентное соотно- соотношение ат+,(/)= где а = - ?. Р = - 2 (см. D.6)). 4.33. Смоделировать наблюдения X, = /, + е,, i = 1, ..., п, если п = 100, /,¦ = 2 + 0,1(г— 1), е,- — независимые 120
равномерно распределенные случайные величины на от- отрезке [0; 0,7]. 1) Построить по этим данным интерполя- * ционный многочлен <р*(/; Р) = 2 Р,а/@ Для k = 2, 3, 4, где aj(t), j= I, ..., 4,— многочлены Чебышева. 2) По- Построить графики функций х = t2, х = ф*(/; р), k = 2, 3, 4. 3) Как изменяется точность интерполяции с ростом k? 4.34. Решить предыдущую задачу при е, нормально распределенных с Ее, = 0, De, = 0,04. 4.35. Решить задачу 4.33 с Xt = e'1' + е,. 4.36. Решить предыдущую задачу при е,- нормально распределенных с Ее, = 0, De, = 0,04. 4.37. Пусть Y\ Yn — независимые случайные вели- величины с общей функцией распределения F0((x — РО/Рг), где Fq(x) — известная непрерывная функция распределе- распределения, а параметры сдвига р( и масштаба р2 > 0 неизвест- неизвестны. Тогда У,- = pi + Рг^/, где случайные величины U\, ..., Un независимы и имеют функцию распределения F0(x). Записав для соответствующих порядковых статис- статистик представление У(д = pi + а;р2 + Ргву, где е,- = [/(,-) — а,-, а,- = Ef/y), / = 1, ..., п, получить оценки параметров Pi, рг методом наименьших квадратов. Указание. Здесь случайные величины У = = (УA) У(„)) удовлетворяют модели линейной ре- регрессии с коррелированными наблюдениями: cov(e,-, е,) = cov(f/(,), U(j))z=gij известны, поэтому на- надо перейти к некоррелированным величинам X = __ g~w2Y, где матрица G = llg./ЦГ является, по предположению, невырожденной. Глава 5 РЕШАЮЩИЕ ФУНКЦИИ 1. Пусть на выборочном пространстве X = [х\ значе- значений наблюдаемой случайной величины X задана функ- функция 8(х), значения которой принадлежат множеству D = {d} возможных решений, которые могут быть при- приняты при наблюдении конкретного значения X. В этом случае 6(х) называют решающей функцией (правилом, процедурой). Пусть, далее, ЦХ)еF = {F(x; б), бев), и для каждой пары @, d) е бхЬ задано число L(Q, d) ^ 0, интерпретируемое как убыток (ущерб, потеря) от приня- принятия решения d, когда X имеет распределения F{x; 8). В этом случае говорят, что задана функция потерь 121
L@, d). Например, в задачах точечного оценивания реше- решениями являются значения оценки параметра 0, поэтому множество решений D совпадает обычно с параметриче- параметрическим множеством в, решающая функция б называется оценкой, а ущерб L(8, d) отражает расхождение между значением 0 и оценкой d. Поэтому в таких задачах обычно полагают L(Q,d) = to(|0 — d\), где со — строго возрастаю- возрастающая функция ошибки \d — 0|. Величина Я(9, б) = EoL(8, 8(Я)) называется функцией риска процедуры 5, т. е. это средние потери, которые име- имеют место при применении решающего правила б, когда наблюдаемая случайная величина X имеет распределение F(x; 8). Если для двух правил б' и б выполняется условие /?(в, б') < же, б) v 0 е= в, E.1) причем имеет место строгое неравенство хотя бы для од- одного 0, то правило б' предпочтительнее б; в этом случае правило б называют недопустимым. Решающее правило, не являющееся недопустимым (т. е. для которого не су- существует предпочтительного правила), называется допус- допустимым. В практических ситуациях ограничиваются рас- рассмотрением класса допустимых решающих правил, ника- никакие два из которых уже несравнимы в смысле E.1). Для выбора наилучшего из допустимых правил в статистике применяют байесовский либо минимаксный подходы. 2. При байесовском подходе предполагается, что па- параметр 0 — это случайная величина с некоторым (апри- (априорным) распределением L@), задаваемым плотностью распределения (или вероятностью в дискретном слу- случае) л(8). В этом случае можно вычислить полную сред- среднюю потерю для процедуры б: г(8) = (или 27?(9ii 6)л(9|) в дискретном случае), называемую байесовским риском, и упорядочить все решающие пра- правила по величине этого риска. В данном случае опти- оптимальным, или байесовским, решением является процеду- процедура б*, минимизирующая байесовский риск г(б). Алгоритм нахождения байесовского решения при за- заданном априорном распределении параметра л(9) имеет следующий вид [1, с. 224—225]: а) для X = х находят апостериорное распределение л@|х) по формуле п(в|*) = Я*;в)я(8)//(*), где Я*) = 122
= Ef(x; 6) = \f(x; O)n(O)dG( или ?/(*; 0;)л@,) в дискретном случае) ; б) вычисляют среднюю потерю для решения d отно- относительно этого апостериорного распределения Е(Ц0, d)\x) = = \Ц0, d)n(O\x)dO (или ? L(G,-, rf)n@,U)); в) в качестве искомого выбирают решение d* = 6*(jc), для которого эта средняя потеря минимальна. 3. При отсутствии априорной информации о Э для сравнения допустимых решающих правил используют максимальный риск /,/(б) = sup/?@, б), и наилучшим счи- 0е6 тают правило б, минимизирующее т(б); это правило на- называется минимаксным решающим правилом. В ряде случаев такое правило удается построить, если можно найти априорное распределение параметра я@)>О, для которого функция риска соответствующего байесовского правила б* постоянна: R(Q, б*) = const (такое распреде- распределение л называют наименее благоприятным априорным распределением), в этом случае б = б* [I, с. 225]. 4. В важном частном случае 0 = {0Ь ..., 0*}, т. е. воз- возможными распределениями наблюдаемой случайной ве- величины X являются лишь конечное число k распределе- распределений F,(x) = F(x;Bi), i = I, ..., k, и требуется выбрать одно из них в качестве истинного по наблюдению над X. Такие задачи называют задачами классификации. В данном случае множество возможных решений D = [d\, ..., d).), где решение d, означает, что в качестве истинного следует выбирать распределение F-,, г= 1, ..., k, и каждое решающее правило Ь(х) порождает разбиение выборочного пространства X = UPi U ¦ ¦ U W7*. Wt f) W; = = 0, 1ф\, где Wi = [х: б(х) = di\, i = 1, ..., k. При этом байесовское решение б* определяется разбиением А: = W* U ... U W%, в котором Wf = [х: Цх) = min п,{х)), / = I, ..., k, где функции /,,.(*) = 2 l(jU)ntf,(x), /(/10 = L(G,, d^, n,- = n@,-) ;= i (если указанный минимум достигается при нескольких значениях /', то в качестве значения индекса i берут мини- минимальное из них). Если потери l(j\i) = 1, j ф-i, или же они неизвестны, или их трудно оцепить числом, то байе- байесовское правило заменяется принципом максимума апо- апостериорной вероятности: относить объект с наблюде- 123
нием х к тому классу, апостериорная вероятность к ш(х) = /|(*)л,/2 n.sfs(x), i = 1, .... k, которого максималь- s= I на, т. е. в таких случаях [1, с. 230]: Wf = \х: л,/,(х) = max л;Ых)\, i = 1 k. Для построения минимаксного решения б ищут наи- наименее благоприятное априорное распределение л = = (я|, ..., л*) из условия равенства компонент вектора риска /?F*) = (/?iF*), .... /?*(б*)) соответствующего байе- байесовского решения, где Я,F*) = /?@„ б*) = 2 W*), i = 1, .... k. 5.1. Пусть L{X) = Bi(l,0), в ={о, = -i- , 02= множество решений D = {d\, d2) и функция потерь L(Oitdj) задана таблицей 1 0 2 «2 1 0 1) Определить все допустимые решающие правила в данной ситуации и найти среди них минимаксное. 2) Найти байесовское решение б* для произвольного априорного распределения л@,) = а, л@2) = 1 — а, ае [0,1], и построить график байесовского риска р(а) = г(б*) как функции а. 5.2. Найти все байесовские решения в следующей ситуа- ситуации: Цх) =Bi(\,Q), в ={в| = -J-, 62 = |-},Z) = [du d2, d3) и функция потерь Z.@,, d,) задана таблицей. Построить график байесовского риска р(а) = г(б*) как функции а=п(в),ае[0,1]. 0i 02 d, 0 4 d2 1 0 d, 1 У 1 2 124
Указание. Сравнить средние потери относитель- относительно апостериорного распределения, данного в реше- решении 2 предыдущей задачи. 5.3. Пусть ЦХ) = Bi(l,Q), 0 = @,, 62), D = {</,, d2) и функция потерь 1@,, dj) задана таблицей (а, Ъ > 0). Рас- 2 1 смотреть два случая: 0i = -g-, 02 = -тг- 3 1 и 0| = -^-, 02 = -5- 0 b а 0 о, 02 Убедиться в том, что в обоих случаях множества до- допустимых решающих правил совпадают, но во втором случае при любом априорном распределении параметра байесовское решение предпочтительнее. | Указание. Воспользоваться решением задачи 5.1. 5.4. Пусть ЦХ) = В/C,0), G = @, = 1(Г2, 02 = 10-'}, множество решений D= [d\, cf2) и функция потерь Z.@,, df) задана таблицей 0 1 2 0 Рассмотрим следующие решающие правила б,- = F,@), 5,A), 6,B), 6,C)): б| = (d\, d2, d2, d2), 62 = (di, d\, d2, d2), 63 = (d\, d\, d\, d2). Убедиться в том, что эти правила между собой несравнимы и найти среди них минимаксное. 5.5. Пусть ЦХ) = Bi(l,Q), в = {8,,в2), D=[dud3} и функция потерь задана таблицей 0 b а 0 125
Определить минимаксную решающую функцию среди фун- функций ,;_ 1 о х = 0' 1. -.'- 2 при х = i,i+ 1,..., 5.6. Убедиться в том, что если в условии предыдущей задачи заменить L(X) на пуассоновский закон ПF), то 6 = 6i при аA —e~Ol)^.be~ 2, а соответствующий вектор риска есть (а{\ — е'), be2). 5.7. Пусть X — случайная величина, имеющая распре- распределение F\(x) = F(x; 0i) либо Fz(x) = F(x; 92); множество решений D= {di, d2} и функция потерь задана таблицей 0 6 а 0 о, 02 Построить байесовское решение для заданного априорного распределения (щ, лг) и вычислить соответствующий риск (ср. с задачей 3.51). Рассмотреть случай, когда Fi — нор- нормальное распределение Л/(Э;, о2), i = 1, 2. 5.8*. Предположим, что наблюдается случайная вели- величина А", распределенная по нормальному закону с неизвест- неизвестным средним 0 и известной дисперсией а'2, множество решений D={di,d2, сЫ и функция потерь L(Q,d) задана следующей таблицей: X <о =0 >о di 0 1 2 1 0 1 d, 2 1 0 Рассмотрим решающие функции вида (di при х<а, &ab(x) = I <^2 При а<*<^6, I d3 при х>Ь, где а<0<6. Убедиться в том, что функция риска имеет вид 126
Ф(а/ст) + Ф(— b/a) при 9 = 0, и построить ее график при Ь = — а. 5.9. Предположим, что в = @, 1}, D= [d\ = [0, 1]и фун- фунL(Q d) |0 d\a 1. Р р ( } [\ [ ] фу кция потерь имеет вид L(Q, d) = |0 — d\a, a~^ 1. Рассмот- Рассмотрим класс решающих функций вида Ь(х) = const (т. е. ре- решение принимается без предварительных наблюдений). Найти в данном классе байесовское решение, соответ- соответствующее априорному распределению параметра л@) = = а, лA)= 1 -а, ае[0, 1]. 5.10*. 1) Показать, что для риска баейсовского реше- решения в задаче классификации (см. п. 4) справедливо пред- представление (ниже для дискретной случайной величины все интегралы заменяются соответствующими суммами) г(8*) = \ min hi(x)dx . 2) Введем величины /ц = \min(mfi(x), njfi(x))dx, I = maxl(j\i), I = minl(j\i). Доказать следующие оценки для л(б*): fZ тах/ч<г(б*)<Г 2 /,-/. В каком случае эти оценки совпадают? Указание. Использовать тождество (при доказа- доказательстве воспользоваться методом индукции по k) к к 2 CLi = max <3/+ 2 min(ai, maxa;). 5.11* (продолжение задачи 5.10). Пусть F,(*) — фун- функция распределения r-мерного невырожденного нормаль- нормального Л^(ц('], А) закона, i = 1, 2. Доказать формулу /i2= Я|Ф( ^ — 1п-^- где р = (цA) — р.B))'Л '(цA) — цB)) — расстояние Махала- нобиса между распределениями^^''1, А) нЩцB\ А). Вывес- 127
ти аналогичную формулу для Л2 в случае двух пуассонов- ских распределений. 5.12* (продолжение задачи 5.11). Построить байесов- байесовское и минимаксное решения в задаче классификации с двумя нормальными распределениями, указанными в предыдущей задаче (ср. с задачей 3.52). 5.13*. Пусть Я = (Xi, ..., Х„) — выборка из распределе- распределения L(QgF = [F(x; 0), 0ев}, а априорное распределение параметраL(8)eF*. Семейство распределений параметра F* называется сопряженным к F(обозначается F*<]F), если при X = х апостериорное распределениеL@|х)ef*. Убедиться в справедливости следующих утверждений л (ниже х = 2 Xi): ;= i 1) p(a,6)<]B/(m,e), при этом L(Q\x) = P(a + х, b + + пт — х); 2) р(а,й)<Ш(/\е), при этом L(Q\x) = Р( 6 ) 3) Г(а,Х)<]П@), при этом1(9|ж)= г( 4) Г(аД) сопряжено к экспоненциальному распреде- распределению с плотностью f(x; 0)^ 0е~0*, л;>0, при 3tomL@|^) = 5) распределение Парето, задаваемое плотностью л@) = ааа/&1 + \ 0>а (а, а>0), сопряжено к равномерно- равномерному распределению #@, 0), при этом л@|х) есть плотность Парето с параметрами (тах(а, х\, ..., дг„), a + п); 6) распределение Дирихле D(a), a=(ai, ..., ал/), а,>0, / = 1, ..., W, задаваемое плотностью сопряжено к полиномиальному распределению М(п; 6 = = @1, ..., О*]), при этом L{Q\h = {hi, ..., hN)) = D{a + h); 7) N{\l, o)<]N(Q, b2), при этом L(Q\x) = N{\ii, о?), где = Л-Lj.^ ct2 =/'J_j__A_Vi Указание. Плотность любого распределения достаточно вычислить с точностью до нормирующего множителя, поэтому, используя для любой случайной величины I запись Д(/) — cp(t)szp{t) (здесь постоян- постоянная с определяется условием c\p{t)dt = 1), при на- нахождении апостериорной плотности л@|дс) = f{x; 0) л@)//(ж) достаточно ограничиться вычислением чис- 128
лителя л@) f(x; 0); аналогично следует поступать и при вычислении плотностей л@) и f(x; В). 5.14. Рассматривается задача оценивания неизвестной вероятности «успеха» 0 по наблюдению числа успехов X в п испытаниях Бернулли (таким образом, здесь в =Z) = = @, 1)). Пусть функция потерь имеет вид а априорное распределение параметра 6 является равно- равномерным на интервале @, 1). Доказать, что байесовское решение есть Ь*(х) = —. Является ли это решение мини- минимаксным? 5.15 (продолжение задачи 5.14). Найти байсовское решение б* для случая, когда функция потерь Ц0, d) = = (d — 9}2, а априорное распределение L(Q) = р(а, Ь). При каких значениях параметров а и b решение б* являет- является одновременно минимаксным? (ср. с задачей 2.6). Указание. Воспользоваться решением задачи 5.13 п. 1). 5.16. Рассмотрим задачу точечной оценки скалярного параметра 0 с позиций теории решений, т. е. когда мно- множество решений D совпадает с параметрическим множест- множеством в и решение d^D— это значение оценки параметра 0ев. Пусть функция потерь имеет вид L@, d) = (d — Qf, тогда функция риска R(Q, б) = Ео(б(Я) — 0) есть средне- квадратическая ошибка оценки Ь(Х). Доказать, что при наблюдении X = х байесовское решение (байесовская оценка) 6*{х) имеет следующий вид: «•(*) = Е(В|*) = \Qn(Q\x)dQ, т. е. совпадает с апостериорным средним параметра, а со- соответствующий риск л(б*) = ED@|X), где D@U) = Е[@ - Ь*(х)J\х] = 5(9 - 6*(*)Jn@U)d0 есть дисперсия апостериорного распределения параметра, а математическое ожидание вычисляется относительно плотности (или вероятности в дискретном случае) f(x) (предполагается, что все соответствующие моменты суще- существуют). Применить этот результат при решении задачи 5.15. 5.17. Пусть испытания Бернулли продолжаются до по- получения г-го «неуспеха» и X — число «успехов» в этих испытаниях. По наблюдению над X построить байесовскую 5-190 129
оценку неизвестной вероятности «успеха» 8 в случае, когда функция потерь L(8, d) = (d — ВJ, а априорное распределение L(8) = Р(а,6). I Указание. Воспользоваться решениями задач | 5.16, 5.13 п. 2). 5.18. По выборке X =¦ (X Х„) из пуассоновского распределения П(9) построить байесовскую оценку для параметра, если функция потерь L@, d) = (d — 8J и апри- априорное распределение L(9) = Г(а, X); вычислить риск этой оценки и определить оптимальный объем выборки при цене с>0 одного наблюдения (т.е. минимизирующий общие потери г(б*) + сп). I Указание. Воспользоваться решениями задач I 5.16, 5.13 п. 3) и 1.39 п. 4). 5.19 (продолжение задачи 5.18). Убедиться в том, что если функция потерь ЦО, d) = (d — Qf/в, то байесовская л оценка при Х+ 2 Я,->1 имеет вид и ее риск г(б*) = —а I Указание. При вычислении моментов восполь- воспользоваться формулой Щ+ 1) = ZT(Z). 5.20. Рассмотрим задачу оценивания параметра 8 экс- экспоненциального распределения с плотностью f(x; 0) = = ве~вх, х>0, по выборке X = (Х\ Х„). Пусть функция потерь Ц8, rf)=(-g dJ и априорное распределение Ij[Q) = Г(а, X), Х>2. Доказать, что байесовская оценка имеет вид и ее риск г{Ь*) = (а\К + п — 1)(Я,— 1ХХ + 2))-'. Убедить- Убедиться в том, что оптимальное число наблюдений при цене с > 0 одного наблюдения равно 1 -JI+I. aylcVi.-lXi.-2) Указание. Использовать решения задач 5.13 п. 4) и 1.39 п. 2). 130
5.21. Пусть X — (X], ..., Х„) — выборка из распределе- распределения /?@, 9), где априорное распределение параметра 8 есть распределение Парето с параметрами а и а>2 (см. за- задачу 5.13 п. 5). Убедиться в том, что байесовская оценка О имеет вид = max х,, вычислить ее риск; определить оптимальный объем выбор- выборки при цене с>0 одного наблюдения. У к а за н и е. Использовать решения задач 5.16, 5.13 п. 5) и 1.35. 5.22. Предположим, что по наблюдению X оценивается параметр в равномерного распределения /?@, в), когда параметр имеет априорную плотность л(9) = Qe~°, 9>0. Доказать, что байесовская оценка в случае квадратичной функции потерь имеет вид 6*(,Y) = X + 1, а ее риск гF*) = = 1 . Указание. Записать среднюю апостериорную потерю для решения d в виде интеграла и продиффе- продифференцировать по d\ использовать формулу для гамма- оо функции Г(я + 1) = \ t"e-'dt = п\ 5.23*. Пусть вектор v = (vi vN) имеет полиномиаль- полиномиальное распределение М(п; 9 = (9| 9/v)). Требуется по наб- наблюдению над v оценить 0, если функция потерь L(Q,d)= 2(d,-e,J, d = (d ,dN), i= 1 в предположении, что априорное распределение параметра 0 есть распределение Дирихле D{a) (см. задачу 5.13 п. 6). Показать, что при v = А = (h\, ..., hN) байесовская оценка 8*(А) = (fil(A), ..., Ьн{ h )) имеет вид ОД = -j±^-, i = N = 1, ..., N, где а = 2 ot/, а ее риск  - 2 «', Г() = v > a(o+l)(o + n) ' Указание. Воспользоваться решениями задач 5.13 п. 6), 1.52 и следующими формулами для момен- моментов распределения D(a): S* 131
5.24. По выборке X = (Х\, ..., Хп) из распределения ,62) построить байесовскую оценку параметра, миними- минимизирующую среднеквадратическую ошибку, если априорное распределение L@) =#(ц,а2); вычислить риск построенной оценки и определить оптимальное число наблюдений при цене с>0 за одно наблюдение. Указание. Воспользоваться решениями задач 5.16 и 5.13 п. 7). 5.25*. Рассмотрим задачу оценивания скалярного па- параметра 0, если функция потерь А@, d) = |0 — d\, 0,rfe/?'. 1) Доказать, что при X = х байесовское решение d* = = Ь*(х) при любом априорном распределении L@) есть медиана апостериорного распределенияL{Q\x), т. е. такое число, что 2) Использовать этот результат при оценивании сред- среднего модели #@, Ь2), когда L@) = N([i, a2). Указание. 1) Установить неравенство Е(|0 — ) 2) Использовать решение задачи 5.13 п. 7). Глава 6 СТАТИСТИКА СТАЦИОНАРНЫХ ПОСЛЕДОВАТЕЛЬНОСТЕЙ Бесконечная в обе стороны последовательность случай- случайных величин [Xi], t = ..., — 1, 0, 1 называется стацио- стационарной, если выполняются следующие условия: EX, = m + const, cov{Xk+uX,) = E(Xk+i — т\Х, — in) = Rk. Последовательность чисел {/?*}, k = ..., —1,0, 1, ..., называют ковариационной функцией последовательности {X/}. При этом R-k = Rk при всех k и Ro = DXt = a2 = = const. Будем предполагать, что 2 l/?*l<°o- F-1) * = i В качестве оценок т и Rk по наблюдениям Х\, ..., Хп ис- используют соответственно статистики 132
? = 0, 1 я-1. Для иллюстрации смоделируем п членов стационарной последовательности X, = Ь-| + 6/ + Ь + |, /= 1,2,...,«, F.2) где |/, t = 0, ±1, ±2, .... — независимые случайные вели- величины, равномерно распределенные на отрезке [0,2А]. Нетрудно проверить, что здесь ЕЛ/ = ЗЛ, Ro=-^-, R\ = h h = —, /?2 = —,/?/ = 0, /^3. В табл. 6.1 и 6.2 приведены значения статистик X и С*(п) для различных п. Таблица 6.1 п 10 100 1000 X 1,70 1,41 1,50 Йо(«) 0,372 0,270 0,262 См 0,264 0,185 0,178 h = 0,5 (EX, = 1,5; Ra = 0,25; Л, = 0,166 л 10 100 1000 X 2,040 1,690 1,800 е„(Я) ] 0,535 0,389 0.378 С, (л) 0,381 0,266 0,257 С,(п) 0,088 0,092 0,089 Си 0,127 0,132 0,126 СзС) -0,128 0,026 0,002 С,(п) -0.242 0,047 -1.0Х хит' 0,0833...) Таблица 6.2 -0,184 0,039 0,003 с.(«) -0.349 0,068 -2,0Х Л = 0,6 (ЕХ, = 1,8; Ro = 0,3; Rt = 0,2; Ri = 0,1). Важной характеристикой стационарной последователь- последовательности {Xi} является ее спектральная плотность f(x), представляющая собой преобразование Фурье ковариа- ковариационной функции {/?*): 133
2 Rkcoskx, ie[-л, л]. F.3) = _ оо Спектральная плотность (когда она существует) и кова- ковариационная функция находятся во взаимно однозначном соответствии. В качестве оценок \(х) по наблюдениям Х\, ..., Хп используют статистики вида Ш = -%г 2 wa(k)Ck(n)coskx, F.4) где {wn(k)}—некоторая последовательность весовых коэф- коэффициентов (wn( — k) = wn(k)). В частности, при wn{k) = — 1 !—1_ получаем периодограмму выборки. Если сред- среднее т = ЕХ, известно, то в формуле F.4) X заменяют т. 6.1. Доказать, что среднее арифметическое X = = (Х\ -f ... + Хп)/п является несмещенной и состоятель- состоятельной оценкой для т = EXt. 6.2. Доказать, что статистика Ск(п) = —!—? (X, - m)(Xk + i - т), 0 < k < п, является несмещенной оценкой Rk. 6.3*. Доказать, что статистика является при л_->- оо асимптотически несмещенной оцен- оценкой Rk, т.е. ECk(n)—*¦ Rk {k фиксировано). 6.4. Пусть | и т) — случайные величины с Е| = Ег) = = О, D| = Dri = a3, cov(|, ti) = 0. Доказать, что после- последовательность X, = tcosM + 4sinM. t = 0. ±1. ±2, ..., А, е @, л), является стационарной и вычислить ее кова- ковариационную функцию. 6.5. Пусть ?,, t = 0, ±1, ±2 — некоррелирован- некоррелированные случайные величины, т = Eli, a2 = D|/. Является ли последовательность {^} стационарной? Доказать, что последовательность Xt = 2 о,-!/-,-, / = 0, ± 1, ±2, ..., является стационарной. Найти ЕХ/ и /?*. 134
6.6*. Для последовательности F.2) доказать состоя- состоятельность оценки Ck{n), найденной в задаче 6.2. 6.7. Смоделировать последовательность F.2) в слу- случае, когда ?< распределены нормально с Е?/ = 0,5, D|i =0,1; п = 100. Составить таблицу, аналогичную табл. 6.1. 6.8*. По значениям Xt, t = — п, — п -f 1. •¦•, — 1, 0, предсказать значение Xi — найти оптимальный линейный о предиктор Xfn = 2 fifnXt, т. е. определить р< так, чтобы 1=—П 0 выражение Е(Х\ — 2 РЛJ было минимальным. Вы- числить о2(л) = E(^i — Xfnf — минимальную средне- квадратическую ошибку прогноза. 6.9. Пусть v(, * = 0, ±1, ±2, ..., —стационарная цепь Маркова с состояниями 1, 2 ([2], с. 167). Доказать, что матрица ||р</@1|?, где Pii(t) = P(vs+, = y|vs = 0, /, /=1,2, определяется формулой iwoii=Kll!!ll+('-2«)'ll-i"! если О < а < 1. Найти стационарное распределение этой цепи. 6.10. Составить программу для моделирования после- последовательности vi, t = 0, 1 п, определенной в зада- задаче 6.9. 6.11. Пусть {v/j—стационарная цепь Маркова, опре- определенная в задаче 6.9. Является ли стационарной после- последовательность (т)/), где 1, если V/ = 2, — 1, если v/ = 1 ? Найти Ет]( и Rk. 6.12. Смоделировать последовательность г\[, ..., г\[оо, где т]/ определено в предыдущей задаче, а = —. Вычис- О лить оценки величин Er\t, Rk. 6.13. Пусть v( — цепь Маркова, определенная в зада- задаче 6.9, ?i(/), I2(t), t = 0, ±1, ±2, .... — независимые 135 _ ( 1
стационарные последовательности с Е?,(/) = 0 и ковариа- ковариационными функциями R['\ /=1,2. Положим r\i = t>,(t). Является ли последовательность {т^} стационарной? Найти Er\i и Rk. Указание. Воспользоваться формулой полного математического ожидания. 6.14. Смоделировать последовательность r\t, .... т|юо, где r\i определено в задаче 6.13, а = —, ?,-(/) равномер- равномерно распределены на отрезке [—1, 1]. Вычислить оценки величин Ет]/, Rk. 6.15. Решить предыдущую задачу для случая L(li(t)) = = N@, 1). 6.16. Убедиться втом, что при условии F.1) спектраль- спектральная плотность f(x) (см. F.3)) существует, непрерывна и определяет ковариационную функцию по формуле = ) f(x)coskxdx. 6.17. Вычислить спектральную плотность для стацио- стационарной последовательности некоррелированных случай- случайных величин. 6.18. Существует ли спектральная плотность у после- последовательности {Xi}, определенной в задаче 6.4? Убедиться л в том, что в данном случае Rk = \ coskxdF(x), где — я F(x) — ступенчатая функция со скачками в точках ±А, и величинами скачков 2—, F( — n) = 0, F(k) = о2 {F(x) назы- называется спектральной функцией последовательности 6.19. Получить следующее представление периодо- периодограммы (см. F.4)) через выборочные значения последова- последовательности {Xi} (среднее m известно): Цх) = -^R2(x), Rl{x) = Al[x) + В2п(х), где Bn(x)i - n Ъ^1 m'\smxt. 6.20*. Убедиться в том, что для математического ожи- ожидания периодограммы при известном среднем m = EXt справедливо представление 136
ЕЦх) = S ka(x - y)f(y)dy, — П где kn{x) = -^¦(s\n(nx/2)/s\n(x/2)f— ядро Фейера. Доказать, что Efn(x)—*¦/(*), —я ^ х ^ л. Замечание. Периодограмма является асимптоти- асимптотически несмещенной оценкой спектральной плотности и при неизвестном т, однако эти оценки не являются состоятельными. Состоятельные же оценки можно получить при специальном выборе «весов» wn(k) в F.4). 6.21*. Пусть среднее m = EXt известно и wn{k) = = П ——j s'"f . Доказать, что /„(?) — асимптотически несмещенная и состоятельная оценка величины 1 + е 4г ) f(y)dy, 0 < е < л, X е= [-л + г, л - е]. Ze 1-е Замечание. Результат верен и при неизвест- неизвестном т. 6.22*. Пусть т известно и wn(k) = ( 1 ^Л ( 1 — — -^-) при \k\ < /„ и о)п(А) = 0 при |й| > /„. Доказать, «л / что если п, /„-> оо, /„/п-^-0 и 2lfe^*l < оо, то/„(*)— к асимптотически несмещенная оценка f(x). Замечание. Результат верен и при неизвест- неизвестном т. Эти оценки при широких условиях являются состоятельными. ОТВЕТЫ И РЕШЕНИЯ Глава 1 1.1. Положить Х„ = 1, если и„ < р, и Х„ = 0, если [/„ > р, где (/„ — последовательность A.5). 1.3. Отрезок [0, 1] разбить на N отрезков Д|, Дг Д/v, где Д| = [0. pi], Д( = \р\ + ... + Р/-1, Pi + .-. + Pi], I = 2, 3, .... Л/; поло- положить ^4 = /, если Uк s Д;, / = 1 N, где ?/„ — последовательность A.5). Числа Х\ Х„ образуют реализацию п первых испытаний поли- полиномиальной схемы с указанными в задаче вероятностями исходов. 1.4. Положить 5о = 0, Sn = S,_i + Х„, п ^ 1, где Хп = 1, если Un < — , Хп = — 1, если ?/,, > — ,где ?/„ — последовательность A.5). 137
I.e. Положить Х„ = — aln(l — Un), где Va — последователь- последовательность A.5). 1.8. Пусть fj , |m — независимые случайные величины, имеющие показательное распределение с параметром а. Тогда случайная величи- величина т) = || + — + \т имеет распределение Эрланга с параметра- параметрами (а, /л). 1.9. Положить Хп = ¦ где Uа — последовательность A.5). Удовлетворительное приближение к нормальному распределению получается уже при Ы — 12; это значе- значение параметра N обычно и используют для вычислений. 1.12. Если |i, ..., |* — независимые бернуллиевские случайные величины с параметром р (см. задачу 1.1), то L (|i + ••• + ?*) = = Bi(k, р). 1.13. При больших п по теореме Муавра — Лапласа имеем / \щ-пр\ к \ V л/npq / Следовательно, чтобы выполнялось соотношение Р ( I —2- — Р I ^ \ I л I —, а < = Ф~' ( Т"т J = s u i+<. При у = 0,98 квантиль Ио.ээ = 2,326 и для приведенных экспе- 2 Ih II -т-1 = 0,0069, т. е. согласие с теорией хорошее. 1.14. Согласно предположению, появление числа, не превосходяще- превосходящего 4, можно рассматривать как «успех» в испытаниях Бернулли с ве- вероятностью «успеха» р = 1/2. Поэтому (см. решение задачи 1.13) гра- граница в данном случае равна бо,9а = 0,0116, а наблюдавшееся значение отклонения частоты «успеха» ¦ —| = 0,0089 < 6о,98- Следова- Следовательно, согласие экспериментальных данных с теорией хорошее. 1.16. При больших п имеем p(~\J—\X - oi I < А « 2Ф@ - — 1 или Р(|* - а, | < 8) « 2Ф ( V l^6) ~ ' В данном случае «| = 6, цг = 3, п = 4096 и правая часть приближен- приближенного равенства равна 0,998 при б =~\/-^-«0999 = 3,090-УЗ/4096 = V п = 0,0836... Наблюдавшееся значение \х — 61 = 0,1389 оказалось го- гораздо больше этой границы, т. е. в данном случае в эксперименте на- наблюдалось маловероятное событие. 138
1.17. В данном случае (см. предыдущее решение) at =2, ц2 = = 5/6, б = т/5/F ¦ 4096)- 3,090 = 0.044. Наблюдавшееся же значение I* — 2| = 0,003 укладывается в эти границы, т. е. с позиций этой ха- характеристики данные рассматриваемого эксперимента лучше согласу- согласуются с теорией. 1.19. Используя результаты решения задач 1.13 и 1.16, имеем б = Vm/""o.99 = V11,9167/500-2,326 = 0,359; наблюдавшееся же зна- значение отклонения равно \х — oil = 15,942 — 61 = 0,058, т. е. согласие с теорией хорошее. 1.24. Поскольку Fn(xo) = Ц"^ и Ц\х.„{х0)) = Bi{n, р0), где р0 = = F(x0), при /1-х» по теореме Муавра — Лапласа имеем р/ц„ы^_пр„ <2ч ф(г) qo = ,_po \ л/лро<7о ' Отсюда P(\F.(xo) - pol < t/^)-+o(—L=) - ф( -LJ) = * "VPo<?o' * VPo^o' 1.25. Имеем cov(F,,(*,), Fn(x2)) = -lj-cov(|i.,(jr,), Д„(лг,, jc2) Здесь D(i,,(a-,) = ri^ri) A — F(jti)) (см. решение задачи 1.24.), a п cov(fin(jri). Д«(*1| •«'г)) = 2 cov(t),-, s;). В силу независимости наблю- ¦¦.;=| дений, при i Ф j индикаторы tj/ и g; независимы и, следовательно, cov(t),-, gy) = 0. Далее получаем covfa,, s,) = Ел«.- - Ет),Е& = Р(л.- = & = I) — - Р(П< = 1)Р(& = 1) = - Р(Л1 = 1}РF- = 1) = - F(x,XF{xi) - F(*,)). поскольку (т],- = ?, = 1)— невозможное событие. Отсюда Объединяя эти формулы, приходим к требуемому результату. 1.26. Рассмотрим полную группу из N событий Et = (? <! xt), Ег = {х, < I < х2) ?«_, = (хдг_2 < 5 < хдг-i). ?д/ = (I > ж»_|); их вероятности соответственно равны pi, ..., р«. Тогда v,, очевидно, есть число реализаций событий Et в п независимых и однородных испы- испытаниях, i = 1, ..., N. Следовательно, I(v) = M(n; ри ..., pN). Далее HMGCM — npip2 = cov(v,, v2) = = cov(|in(JCi), Отсюда 139 = np,(I — p. — p2) = = nF(jr,)(l - /=(*,)), что эквивалентно результату, полученному в задаче A.25).
1.27. Случайные величины X*, < = 1, ..., п, при любом k независимы и имеют такое же распределение, как |*, поэтому В частности, DA- = D/l,, = |-(a2 _ a?) = -^-. При исследовании выборочных центральных моментов можно счи- считать, что Oi = 0, и, следовательно, ц4 = at. Учитывая это, имеем ES2 = ЕЛ„2 - ЕЛ2, = ц2 - -^ = -^V Далее, (S2J = Л22 — 2А\\Апг + /lli, и непосредственные вычисления дают n л 2 xjJ = ' е Отсюда + -V |t4~|t| что эквивалентно приведенной в условии задачи формуле. Наконец, соу(Я, S2) = E^XS2), так как по-прежнему можно считать, что ai =0. Записав 2 у \ 2 ^ — 1 V» y2 V1 v у получим Для распределения N(\i, о2) моменты а\ = ц, цг = о2, цз = 0, ц4 = 140
2 J = За4, поэтому EX = ц, DX = ——, ES2 = — -a2, DS2 = П П = 2(1)g<, COv(X, S2) = 0. n 1.28. Рассмотрим r-мерные векторы & = (Jf*1 Я*'), s = 1 n. Они независимы, одинаково распределены и E(?i) = a, D(|i) = = ||cov(Xf', Л"*j)||T = J (а и 2 указаны в условии задачи). Следова- Следовательно, по центральной предельной теореме при п -*¦ оо имеем ^(Ц=К|| + ... + In - па)) -> N@, 2) ] Остается заметить, что ——(?, + ... + 6л — по) = -фг(ЛП1,, — а/,,, ., V" ^nft, — a*,)- 1.29. Можно считать, что а, = Е| = 0 (см. решение задачи 1.27). Положим ?)„ = л/Ч^л — Цг) = In -+• б», где 5л = У"Ил2 — ji2), бл = Положим ц« л/Ч5" Цг) I + VH 1) = — ->/пЛп1. Поскольку при сделанных предположениях ?Fл) ( ti4 — м-Ъ (CM-i например, решение задачи 1.28), достаточно убедиться в том, что 6„ -5- 0. Но -Е|в.| =^-ЕЛ2, =^-D^,= J^-^0. е е е еуа что и требовалось показать. Асимптотика моментов следует из зада- задачи 1.27. 1.30. События [Х(г) < х,, Хм < х2) и {ц„(*|) > г, цл(лг) > s) экви- эквивалентны, поэтому F,s(x,, хг) = Р(ц„(Х|) ^ г, (inta) ^ s). Пусть сначала xt < лг2. Рассмотрим случайные величины v, = |i/i(-ti), v2 = \Ln{x2) — — |*л(*|). v3 = п — Hn(x2). Тогда (см. решение задачи 1.26) Z.(V|, v2, v3) = М(п; pi, р2, рз), где р, = F(x,), P2 = F(xi) - F(*,), p3 = 1 - F(^2). Отсюда Р(ц.(лг|) > г, ц„(х2)> s) =2P(v, = m, v2 = /), где суммирование производится по всем т и /, удовлетворяющим условиям т ~^ г, s ^ m -\- j ^. п. Поскольку P(V1 = m, v2 отсюда следует приведенная в формулировке задачи формула. Если же Х[ 5= *2, то событие \Х(,) < xi, X(S) < x2) = {^(S) ^ л2); формулу же для одномерной функции распределения можно получить, например, из предыдущего результата: F,(x,) = lim Frs(x\, x2). JT2-»-0O 1.31. Пусть г = 2 (общий случай рассматривается аналогично) и точки Х\ < Х2 заданы. Событие {X(i|)e(*i; x\-\-dx\), Х(*,)е(*2; хг + + d*2)) осуществляется тогда и только тогда, когда k\ — 1 из всех наблюдений меньше х\, одно попадает в интервал (*,, х\ + dxi), k2 — kt — 1 наблюдений — в интервал между х\ + d*i и х2, одно на- наблюдение — в интервал (хг, х2 + &х2) и остальные п — k2 наблюдений больше Xi + dx2. В силу независимости наблюдений, вероятность ука- 141
занного события при малых dx\ и dxi с точностью до членов, имеющих более высокий порядок малости, равна С*'-'F*'-¦(*,)(« - к, + ЩхМх,Ск>-&-\р(х2) - Разделив на dx\dx% и устремляя dx\ и йхг к нулю, получим указанную формулу для#*,*,(*1, лг2). 1.32. Обозначим А, = [пр,\ i = 1, 2, и пусть г)„/ = (Znpi — SPi)V". i = 1, 2. Совместная плотность распределения случайных величин Цп> и т)„2 по формуле A.2) равна (см. задачу 1.31) где a —ft, — 1)^я—/t2— 1I Mn) = (-Lf (е„ + JjL] ii-j.-iX Из формулы Стерлинга следует, что At(n)-i '2 —PiX' —Р2) Далее, так как плотность f(x) непрерывна, то Л2(я) -»• /(sP,)/(SP,)- Наконец, поскольку несложно получить, что 1 Учитывая, что /(SPi)/(sp,)/Vpi(P2 — PiXl — Р2) = (det||n,,||) 2, окончатель- окончательно может записать, что ( 1 2 1 т. е. в пределе имеем плотность двумерного нормального распределения с нулевыми средними значениями и матрицей вторых моментов ||б,/||. 1.33. Согласно решению задачи 1.31, совместная плотность распре- распределения Х(,) и X^-s+n равна (при х, < х2) 142
e. .-. Поскольку якобиан преобразования yt — nF{x,), y2 = n[\ — F(x2)] равен J(xi, x2) = — п2((х\)Цх2), по формуле A.2) совместная плотность распределения случайных величин х„ = nF{X(r)) и т], = л[1 — F(X,+ ,))] имеет вид Л уЛ\\- "' если л -»¦ оо, а л, s — фиксированы. Таким образом, х, и л», следовательно, Л(,) и Х(„_,+ |) асимптоти чески независимы; при этом ?.(ч„) -»¦ Г(I, г), /-(т]„) —>¦ ГA, s). 1.34. Якобиан преобразования yt = пх\, у2 = {п — 1 Х-^г — *i). ¦••. у, = х„ — л:„_1 равен /(jfi дг„) = л!. Отсюда по формуле A.2), при- принимая во внимание указание, имеем, что совместная плотность распре- распределения величин Y\, ..., Yn есть ехр( — у\ — ... — уп}- Далее, Х(»; = = 2 Y,/{n — / + 1), поэтому Но среднее и дисперсия экспоненциального распределения Г A,1) равны 1, следовательно, окончательно имеем 1  уг DXm = 2 -г l ' / = п — * + I ' В частности, если п -*¦ оо, то ЕА-(П) = 2-!-= 1пл + с + оA), с = 0,5772... — константа Эйлера, DXM= 2-p- = -^- + o(l). 1.35. Согласно решению задачи 1.31, совместная плотность распре- распределения случайных величии Х^ и Х^ есть О < дг, < дг2 < I. Отсюда (см. A.2)) совместная плотность распределения Vi = X^) и Уг = Хм — Х(*) имеет вид 143
/)i^"Vrt-'(i - у, - yir-1, ?/i, Уг > 0. у, + 1/2 < 1. Теперь, чтобы получить плотность распределения Уг, достаточно вычис- вычислить интеграл 0 < у, < 1. Аналогично, плотность распределения -V^j равна Далее, так как среднее и дисперсия распределения р(а, 6) равны а аЬ —гт" и —ггж—, ¦ , ,ч соответственно, то а + Ь (а + Ь)\а + Ь+1) U (Л(,) — Хт) — ¦ Наконец, поскольку D(*@ - Xw) = DXW + DX(n - 2cov (Xw, из этих формул получаем, что 1.36. Заметив, что Lf — 1 = R(Q, I), можно воспользоваться решением предыдущей задачи. В данном случае Хц) = F — ( Л(П) = (Ь — а)Х(„) + а, где Xfi), Х(П) — экстремальные значения выборки объема п нз распределения R@, 1), совместная плотность распределения которых имеет вид gi»(jti, *г) = п{п — 1)(лг2 —дг,)". 0<*i <*s< 1. /,-. \* 1.37. Р(^о, > jt) = Р(ХУ >*,/= 1 я) = [1 - F{x)X = е Ч * У х ^ а. Отсюда _ .,_. .« <jt) = 1 — е~Ч » J.^^a, а также Р(п|/в(Х(,) - а)/6 < /) = 1 - е-'°, / > 0. Таким образом, случайная величина п'/а(Х(\) — а)/Ь имеет распределе- распределение, не зависящее от объема выборки, именно распределение №@, а, I). Отсюда -- а + ЬГ 144 (\ ¦+ -^п
1.38. Слагаемые в Fn{x,, x2) независимы и имеют такое же распре- распределение, что и величина t\ = e(xt — li)e(xi — |2), поэтому ЕЛ,(*|, х,) = Ет, = Р(л = 1) = Р(Ь < х,, I, < х3) = F(Xl, *,), Dfn(r,, *2) =-^-D4 = -^[Ет, - (Ел)*] = -^f(x,, x,)(\- F(xt. x2)). Отсюда согласно неравенству Чебышева РA^л(*1. x2)—F{xl, хг)\ > е)<-L-D'Fn(j;i, х2) -*¦ 0 при п -»- оо. Обозначим, далее, через X, = (*,, *„,), j = 1, 2, У,, S,2 = S2(*/) соответствующие выборочные средние и дисперсии и через Si? = 2 0^ ^)(f ^) 2 KK ^^ выборочную кова- ривацию. Тогда статистическим аналогом для коэффициента корреля- корреляции р = cov(|i, b)/VDIiDb является р„ = Su/S\S2. Если ЕE?|*)< <». то существует о( —2 Х„хЛ = — 1)(Б|Ы и из неравенства Чебы- шева следует, что — 2 А-,,А-,24.Е(|,Ы при лч-оо. л /• =. 1 Но также Х(-5-Ei(, S2(*y) -5- D|j. / = I, 2, поэтому р„ -5- р, если толь- только D|,>0. / = 1.2. /,„--21," 1.39. 1) Если Щ) = ЛГ(ц. I2), то Ее = е 2 . 2) Если Щ) = Г(а, X), то Ее'"- = .^ . 3) Если i(v, va,) = М(п; р pN), то Щ*}'1...**") = (jfip. + 4) Если Ц?) = ЩХ). то Ел:5 = е4' ' ". 5) Если L(|) = Bi'(*-, р), то Е (I -рх)' 1.40. Пусть I/ — ортогональная матрица, приводящая 2 к диаго- диагональному виду: U'^U = D. Обозначим В = UD'n; тогда 2 = &В' и Y = ВХ + ц, где компоненты вектора X независимы и нормальны ЩО, 1). Далее, Q = Х'В'АВХ ^ X'AtX и по условию А] = В'АВВ'АВ = = В'ЛВ = Л|, т.е. матрица Л| идемпотентна. Следовательно (см. утверждение 2°, п. 6 гл. 1) L(Q) = х2(*г А,). Но tr Л] = tr (ABB1) = tr (^2) = "i. что и требовалось показать. 1.44. Совместная плотность распределения Х\ и Л2 равна »., - II, - I _ г, + х, ' ' е " , д-,, а-2 > 0. и + )-Т()Г(М 145
Рассмотрим преобразование у\ = Х\ -\- х2, у? = • Оно взаимно- Х\ + Х2 однозначно отображает область \х,, х2 > 0) на область {i/, > 0, 0<(/2< 1] и его якобиан J(xl% х2) = . Отсюда по формуле Х\ + Х2 A.2) плотность совместного распределения Y, и У2 равна ,,»¦.+ >-i -\.-yi /a „*i-i/i „ \*->-1 1.45. Формула для моментов следует из общей формулы для момен- моментов распределения Г(а, X) при а = 2. Я = — и свойства гамма-функ- гамма-функции: Г(Х + \) = XV(X). В частности. Ex' = I. Dx? = 2. Согласно свойству воспроизводимости гамма-распределения х» = 5i + ••• + Ь>< где слагаемые независимы и имеют одинаковое распределение Г( 2, —1 = х2@. Следовательно, по центральной предельной теореме случайная величина (х^ — п)/л/2п при п -*¦ оо асимптотически нормаль- нормальна ЛГ(О. 1). 1.46. Первое утверждение есть прямое следствие формулы A.4). Во втором случае имеем P(a ¦+¦ (g | ^ x) = P(| < arctg (x — a)) = —(-o" + arctg [x — a)). Отсюда искомая плотность распределения равна — arctg' (x — а) = г-. л е л 1 + (х - аJ 1.47. Поскольку E/J' = п'Ег|2'Е(х2)~', при 2г <. п из общих формул для моментов распределений Nlfl, 1) и Г ^2, —J имеем г(т-') ЕП2'= 1-3-B/-1), E(x»)-'=_i 2 У - Остальные утверждения о моментах следуют из вида плотности sn(x). Утоерждение о сходимости плотности sn{x) является следствием свотно- ше.шй я-' Наконец, по закону больших чисел Х"/п -¦ '• Но тогда ил/п/х* -* 1 л. следовательно, Ц1«)-*¦ Цд) = Л?@, 1) (см. утверждения 1° и 2° в), п. 4 гл. 1). 1.48. Положим У = X"i/(x«i + Х«а): тогда fni „2 = — ^- = П | у 9 Я V / !¦* \ = — *1 гг • Но (см. задачу 1.44) ЦУ) = р ( —- , -^1 , поэтому 146
Поскольку У = ^-^—, имеем также равенство L I——"'  и 1 = р , "г \ '•„,.„2-т — 1 ' Я|,Я1 Т "Jf" "I = Р( -?-, -?А . Моменты можно вычислить по формуле EF'null] = = \~) Е(Хп,)'Е(Хп,)~', используя формулу для моментов гамма-рас- гамма-распределения. При этом моменты существуют лишь при ^- <л<-~ и они равны ЕГ„,,„2 = (^-) * V 2 / в 4acTH0CTHi при пг > 2 Efa,.BJ = Цг-, а при п8 > 4 имеем DFnun2 = til t i )() 1.49. По теореме о среднем значении имеем При 6 ->- оо и фиксированном а по формуле Стирлинга— 7^ следовательно, -i-ln[I-B(x; a, 6)]= Второе соотношение является следствием первого соотношения и зада- задами 1.48. 1.50. Распределение случайной величины 1„ = г\/л]у$,/п симмет- симметрично (так как распределения — г\ и г| совпадают), поэтому Р(/2<Х2)= Р(-|*| </„< UD= Щ1а< \Х\)- 1 или Р(/„ < \х\) = -g" +-jf Р('л ^ х^- Отсюда ПРИ х > 0 получаем Р'(/„ ^ л:) = — Р'(/2 ^ х1), т. е. s,(jc) = xfi,n(x2). Из этих соотношений также имеем, что Р(<„ > rfV") = [' ~ F(d'1n; 1, л)]/2. Отсюда и из задачи 1.49 следует указанное предельное соотношение. 1.51. Поскольку l(— (AT, + ... + А",)) = х2B/), L (—№+ i + ... + + Xi + m)J = x2Bfn) и указанные случайные величины независимы, утверждение следует из определения закона Снедекора. 1.52. Обозначим <р(* xN) = Е(^' ..jf«*) =(xlPl + ...+ хырнТ. 147
Тогда Etf1...*»*) = фг х„, 1 1) = = (ATip, + ... +Х„р1,+ 1 — pi — .. —phf. Далее, и непосредственное вычисление этой производной приводит к искомой формуле. Наконец, N 2 f = COY (л', Л2) = 2 С] С] COV (V,, V;) =Л^ Wc?p,(l - Pi) - I. / = 1 1=1 -Л 2 C'C/W/ = "( 2 Л!С?Р/- 2 d ¦i # / М = 1 I./ = I = «(с? - с?). 1.53. Обозначим v* = (vf vjf), где vf = (v; — npj)/^fn, j = 1, ... , k. Достаточно показать, что характеристическая функция для любого фиксированного ^. Из предыдущей задачи следует, что Ее"'"' = e-'VSi-pfl + 2 /»Xe"l/V"-'l)l". Р = (Р /»*)¦ Логарифмируя это соотношение и учитывая формулу In A + е) = е — — + О(е3), е -»• 0, в условиях задачи получаем к In Ее"'"' = - «Vn *'Р + " 2 Pi(e"'/V!i - ') - 1=1 U что и требовалось показать. Наконец, в результате непосредственных вычислений получаем I 2*1 = р\ ... р*A — pi — ... — р*) ф 0 при k < N. 1.54. Для любых целых неотрицательных k\,...,kn таких, что fci + ... + кц = п, имеем 148
Здесь числитель в силу независимости ?|,..., ?n равен w w », П «-Ч,*'/*;! = a П ТТ • * = *!+¦¦¦ + ** Далее, так как (см._задачу 1.39 п. 4) L (|| + ... + Е«) = П(Х), то знаменатель равен е~\л/п1. В результате искомая вероятность равна п ! *, tA, -г-: j—j-Pi — Pn< что и доказывает утверждение. 1.55. Вычислим безусловные вероятности Р (| = ft), k = 0, 1,... Имеем _Г(к + г)( а _ k\l'(r)\a+ [ J ST l"+*-'Va + 1 ) (а + 1)' 1.56. Вектор (X, Xi — X Х„ — X) распределен по нормальному закону, поскольку представляет собой линейное преобразование .нор- .нормального вектора X. Здесь cov (X, X, — X) = cov (X, Xi) — D X = = — D X, — D X = = 0, i=l, ..., n, следовательно, пер- n n n пая компонента не зависит от остальных. 1.57. Пусть U — ортогональная матрица, приводящая А\ к диаго- диагональному виду: 1/'Л| V = D\, где по условию п — п\ = я2 диаго- диагональных элементов D\ равны нулю. Введем вектор т) = U'X; тогда X = Ur\ и можно записать, что Q = ЛЛ' = r\'U'A,Ur\ + i\'U'A2Ur\ = = r\'D,i\ + n'D2T). где D2 = U'A2U = Е„ — Di является диагональной матрицей и rang Х>г = rang Аг = п2. Отсюда следует, что диагональные элементы матрицы ?>2, отвечающие нулевым элементам D\, равны 1, а осталь- остальные — нулю. В свою очередь, это означает, что все ненулевые эле- элементы D\ равны 1. Следовательно, матрицы А\ и Аг идемпотентны. Из предыдущих рассуждений также следует, что D\D2 = 0, а значит, и А,Л2 = 0. 1.58. Если перейти к нормированным величинам X,'= —'¦ , то вид 11 не изменится, поэтому можно считать, что параметры (ц, о) = = @, I). Пусть В — матрица размера лХ", все элементы которой I " равны — . Тогда nS = 2 № ~ ^J = Х'АХ, где матрица А = Е„ — — В идемпотентна, следовательно, rang Л = tr А = п — I. Отсюда следует, что р — 1 собственных чисел А равны 1 и одно равно 0. Пусть ut и„_1 — собственные векторы А, отвечающие собственному чнс- п-\ лу 1; тогда спектральное представление А имеет вид А = 149
_ _, / n / n — I При этом непосредственно можно проверить, что и\ = \1 -( , - — , ..., - —\ "У " , (X, -Х) = и[Х и nS2 = " Таким образом, обозначая Yt = u'tX, k = 1, ..., п — 1, получим представление причем У ,Уп-] независимы и нормальны N@,1), которое можно записать также в виде ц = Y\/^Y\ + &-i, где х»-а не зависит от У, и L(xl-2) = Х2(п — 2). Отсюда уже с помощью непосредственных вычислений можно найти распределение t). Прежде всего заметим, что это распределение сосредоточено на интервале (—1,1) (так как ту2 < 1) и симметрично (так как распределения — Yt и Y\ совпадают), поэтому для 0 < и < I К, > и) _ 1 Р(,- > „¦) _ 1 Р ^ ^ = yf(<^—•¦)¦ где F (х; п\, п?) — функция распределения закона Снедекора S(n,,ih). Воспользовавшись результатом задачи 1.48, можем записать Таким образом, окончательно имеем, что для 0 < и. < I Для отрицательных значений и F,(и) = 1 — F4( — и}. 1.59. а) Совокупность случайных величин (Хи Х2, Хц — Х\, Х,2 — Л, I = 1, .... п) имеет нормальное распределение, поскольку пред- представляет собой линейное преобразование нормального вектора (Хц, Х1г, i_=l,^., л). Непосредственно проверяется, что первые две компоненты Х\ и ^2_некоррел^рованы с остальными. Отсюда следует, что (Х\,Х?) и (Ха.— Х\, Хц —Хг, i = 1, ..., п) независимы, следовательно, независи- независимы (Хи Х%) и (Sf, S,2, Si). б) Из предыдущего следует, что L(X], Хг) = n((\1[, \i2), — поэтому, положив в задаче 1.40 А = п Е~ , получим требуемое ут- утверждение. _; — 2 в) Имеем S? = ^-(У? + У2), S12 = ^- У1Л/Уз, Si = ^У3 и модуль якобиана указанного преобразования м =- """ (oiojrvl/з По формуле A.2) плоность совместного распределения (У[, У2, Уз) равна 150
<P (</i¦ Уг, Уз) = -^ e "s y2 2 e *'y3 2 e 2/2 л/2л Г (л - 2), т. е. представляет собой произведение плотностей распределений N{0,\), х2(п — 2) и х2(« —') (здесь коэффициент преобразуется к нужному виду с помощью формулы Г (р) Г (р + — } 22р~' = -у/я ГBр)). Таким образом, случайные величины Уь У2 и К3 независимы и при этом 1(У,) = JV(O, 1), ?(У2) = х2(п -2), 1(У3) = х> - 0- Отсюда L (Г = У./л/^Дп - 2)) = S (л - 2). 7" Наконец, р„ =— ——, и по формуле A.3) находим, что плот- плотность распределения случайней величины р„ равна A - У5) 2 , - 1 <у < 1. 1.60. Как следует из решения задачи 1.29, асимптотические рас- распределения статистик S2 и А„2 одинаковы, следовательно (см. зада- задачу 1.28), совместное распределение X и S2 асимптотически нормально. Отсюда и распределение любой их линейной комбинации асимптоти- асимптотически нормально, поэтому достаточно вычислить среднее и дисперсию разности X — S2. Используя решение задачи 1.27, находим D(X - п — 3 n ti — 1 Отсюда заключаем, что L (gn) -*- N @t 1). Ho Tn = c,nX/K откуда с уче- учетом указания получаем утверждение. 1.62. Здесь ?(!,) = ЗГ(ц,, а?) и /,,(*) = ^= exp j - _ 2 {-« — Ц|) (У — Цг) + (У - ИгJ 1) Далее, в результате простых вычислений приходим к указанному вы- выражению для условной плотности ft,n,(y\x). II Е О || 1.63. Пусть L = . рB) II — матрица указанного преоб- 151
разования. Тогда ?(У°\ У<2>) = N(L (§*>)• L1L) и в результате не- непосредственных вычислении имеем Е<" ° II II 2" 2'2 -а е«'11 -Us,, z II Е<" -А'II _ || ?¦¦ О || II О Е<2' II ~ || О В || (в частности, это приводит к следующему равенству для определи- определителей: |2| = |2пЫВ1)- Из структуры матрицы LEX/ следует, что у(п и уB) НеКоррелированны, следовательно, и независимы. Кроме того, отсюда получаем, что /.(У12') = Л/(ц2 — Лц(|), В). Но тогда L(X™\Xil) = ж(") = ?(K<J> + /U<») = JV(A1 («<'>). В). 1.64. По формуле полной вероятности вероятность указанного события = ft) = \P'(- Jin У, < Л-Р(- 1п 1.65. Так как Р (cU, < f (л-)) = Цх)/с и Р {cU, > f(a + (b-a) U,)) = \ A _ J- / (а + (Ь - а)л)) ^ = 0 \ с / = I - 1/сF - а), то плотность распределения случайной величины ? в точке дг g [a, b] вычисляется по формуле Глава 2 2.1. Решение сформулированных задач сводится к вычислению средних, а также дисперсий указанных статистик и асимптотическому при п -*¦ оо анализу этих характеристик. Например, в задаче а) имеем Fix) = , где ц„(д;) — число элементов выборки X = (Х|, ..., Х„), п принявших значение <! дг, т. е. ?(ц„(д:)) = Bi{n, F(x)); отсюда при п—*¦ оо , что означает несмещенность и состоятельность ^„(д:) как оценки F(x). Рассмотрим задачу г). Так как (см. задачу 1.27) '-LVD52=("-1)V "-3 |ри ц< < оо, 152
то S — состоятельная, но смещенная оценка цг; чтобы устранить сме- смещение, надо использовать статистику — S2 = S' , дисперсия кото- п — 1 рой равна) 7-)DS2 = O(—), т.е. S'2 также состоятельная \n-l J \ п)' оценка цо. 2.2. Согласно решению предыдущей задачи п. б, Т„(Х)Л- У<*2/2 — а{ол[\11 = «ь т. е. когда среднеквадратическое отклонение и среднее равны. В част- частности, это имеет место для распределений Г(а, 1), N(a, а2), а > 0. 2.4. Для случайной величины г\ = gi + \г выборочными данными являются (У, = Хц + Хи, 1=1 п), а ее дисперсия Dt| = D?i + + Щг + 2cov (|i, \i). На основании задачи 2.1 п. г) несмещенной оценкой Dr| является статистика Первая и вторая суммы этого разложения являются несмещенными оценками дисперсий D?i и D?2 соответственно. Поэтому 1 " Е-——г- 2 {Хп - Х,)(Х,2 - X,) = cov (|,, Ь). i=i что и требовалось установить. 2.5. Для произвольной статистики Т(Х) имеем EJ(X) = 2 ЦхH1х{\ - 0)"-Ijr' = * = (* *,) к ' v ; xi = 0. 1. I = 1 , .... Я п = 2 о-A — о)— 2 П4 г = 0 х : Zx,' = г Здесь правая часть представляет собой полином от 0 степени не выше п. Следовательно, в данной модели несмещенные оценки можно строить S лишь для полиномов т@) = 2 а*0* при 5 <С п.. к = 0 2.6. Вычислим первые два момента статистики Т. Так как Lf(rn) = = ВЦп. G), то Е.7- = —L 0 + п + Е,7* = (я + РJ 153 n + (Е„л„J + 2аЕ0л„ + а2) =
Отсюда Д(о, Р; 9) = ЕоG- - 9J = ЕаТ* — 29Е07' + 92 = _ 92(р2 - и) + в(п - (я + РJ В частности, Д@, 9; 9) = ?>о(-?-) = 6('~6) , л(^. лА»: в) = ¦ не зависит от 9. 1J Рассмотрим оценку Т' = ——-^-——. Ее среднеквадратическая п + V" ошибка меньше ошибки несмещенной оценки Т* = —— (т. е. < —! -) при 9 g( — ± v Д.—!—); длина этого интервала стре- л V 2. 2(V« + 1) / мится к 0 при п-*-оо. При остальных же значениях параметра 6?@,1) более точной является оценка Т*. Таким образом, по критерию средне- среднеквадратическои ошибки оценки V и Т* не сравнимы, и чтобы выбрать какую-то из них, необходимы дополнительные рассуждения. Напри- Например, можно принять правило считать ту оценку лучшей, для которой максимальное значение среднеквадратическои ошибки меньше (принцип минимакса). Поскольку max 6A — б) = — и — <——, согла- 0 4 4(У^ + 1J 4п сно принципу минимакса оценка Т' лучше оценки Т*. 2.7. Условие несмещенности Е07"(Л) = т„(9), V6 6@i 1), принимает в данном случае вид * 2 Г(/)С1в'A - 9)* " ' = 0'A - 9I, V6 6 @, 1). / = о При любом Т выражение в левой части этого тождества представляет собой многочлен от 0 степени не выше k, следовательно, указанное тождество может иметь место лишь при г + s < k. Далее непосред- непосредственно проверяем, что указанная в формулировке задачи статистика удовлетворяет условию несмещенности. Покажем, наконец, что это единственная несмещенная оценка в данной задаче. Предположим, что Т'[Х) — другая несмещенная оценка. Тогда статистика Т\{Х) = = Т{Х) — Т'(Х) удволетворяет тождеству k 27\(/)CiO'( I _ 0)* " ' = 0, 0 < 0 < I, / = о * 9 или 2 7"i(/)CU' = 0. 0 < * < оо, где х = _ . Но из тождест- / = о венного равенства нулю многочлена следует равенство нулю всех его коэффициентов, т. е. T'(j) = T(j) для у = 0, 1, ... , k. 2.8. Согласно свойству воспроизводимости биномиального распре- распределения L4J) = Bi(kn, б), поэтому ЕоЯG")= 2 Я / = о 154
При любой функции Н это среднее представляет собой полином от в степени не выше kn, следовательно, несмещенные оценки вида Н(Т) в данной модели можно строить лишь для функций вида т(б) = s = 2 а'О' ПРИ 5 ^ kn. Пусть т;@) = 0', j < kn, тогда, поскольку г = О Еи(Л/ = (kn)iQ1 (см. задачу 1.52), несмещенной оценкой для т,@) явля- является статистика if = (T)j/(kn)i. To, что это единственная несмещенная оценка, являющаяся функцией от Т, устанавливается так же, как аналогичное утверждение в предыдущей задаче. 2.9. Первое утверждение следует из цепочкн равенств Чтобы убедиться в справедливости второго утверждения, запишем условие несмещенности ЕаТ(Х) = т@) V0>0, в виде 2 Щ) ., = 2 -г v о > о. ft = 0 *' г = 0Л' Ясно, что не существует не зависящей от 0 функции Т{к), удовлетворяю- удовлетворяющей этому тождеству. 2.10. Условие несмещенности Е07"(Х) = т@) V 0 > 0 принимает в данном случае вид V °* п -20-и v °2' ft = o ~bT~e '~е ~е +е - - ^iB,)i V0> Единственная функция T(k), удовлетворяющая этому тождеству, имеет вид при k > 0 четном, в остальных случаях. Такая несмещенная оценка Т{Х) практически бесполезна. 2.11. В данном случае условие несмещенности 2 Т{К)Ск, + к- |0*A — 0)' = 0s V 06@, 1) fe = О можно переписать в виде °° 0! °° 2 щ) с?+* _ ,о* = г = 2 с'' + / -'°! +' v о е (о, 1). * — О С — 0)' у = о Из тождественного равенства двух степенных рядов следует равенство соответствующих коэффициентов, поэтому единственной функцией T(k), удовлетворяющей этому тождеству, является функция Отсюда следует, что единственной несмещенной оценкой в данной задаче является статистика 0 при X ^ s — I, [XU(X + r-l)s при X^s. 155
Если г = 1, то эта статистика принимает лишь два значения 0 и 1, не принадлежащие параметрическому множеству модели в = @, 1), поэто- поэтому она практически бесполезна. 2.13. Так как L{X) = ы(в, -^-) , то Ео(Л2) = = Ь 02i откуда и следует утверждение. 2.14. Для распределения N(\i, О2) второй и четвертый центральные моменты соответственно равны ц2 = О2 и ц4 = '. б4 = 3G4, поэто- поэтому (см. решение задачи 2.1) Отсюда имеем E(<S2-02J = Eo((s2— e4 Ео(т* - О2J = Dot* = -^ Р^ v * - -^ ^ --"' Таким образом, Ee(S2 - О2J < Dot* < De(S'2). т. е. согласно критерию минимума среднеквадратической ошибки стати- статистика S2 точнее оценивает теоретическую дисперсию О2, чем статисти- статистика т*, но в классе несмещенных оценок т* точнее, чем 5'2. 2.15. Так как *¦</*'"**) = W, 1). то E,|Jf, - |i| = O-i- \ \x\e-*'/2dx = e"V- ^xe^~dx = tfV—, л/2п - «о V "J V я — 2 Ea\Xi — ц| = 0 — несмещенность; f) состоятельность. \ ti / 2.16. Из того, что ЦР/&) = х2(л) = iY 2, yV и из формулы для моментов гамма-распределения следует, что т. е. несмещенность указанной оценки. 156
Чтобы сравнить оценку nf для 8 с оценкой Т„, полученной в пре- предыдущей задаче, надо вычислить D0Tf = EefrfJ — в2. Имеем Eo(xfJ = ¦ "(I) лГ: Е0Р = ¦ (т) 2 / \ 2 (здесь использована формула Г(* + 1) = *Г(д:)), следовательно, — 1 1 б2. Это выражение надо сравнить с D Г2 я-2 2л б2 (см. решение задачи 2.15). При п = 1 обе статистики (и их дисперсии) совпадают; Doxf = 1 1JG2 х 0,273-в2 при п = = 2, a D0r2 =(^ — -i-J б2 =« 0,285-в2, т. е. оценка tf точнее, чем 7 (здесь учтено, что rf — j = У". ГA) = 1); аналогично, Doif =(-3 — 1)G2 « 0,17862< D0r3 » 0,190-0' при п. = 3. Доказательство того, что оценка tf при любом п точнее оценки Т„, следует из результата, полученного в задаче 2.64. 2.18. Среднеквадратическая ошибка произвольной оценки 7\ равна Е„G\ - В2-J = '2 - G2) + (к - 1H2J = '2) + (к - 1J62 = 2кг 2к (см. решение задачи 2.14, где вычислено Do(S'2)), Ч>М = л _ | + + (Я. — IJ. График функции (р(Х) изображен на рис. 7. Поскольку 1) для — < Я < 1, при этих значениях Я, . - е22J < Eo(S'2 - e22J Для определения k имеем условие удовлетворяют лишь значения k = О, I, 2, 3. Наконец, min ЕцG\ — -3 л-1 <—г-г< 1. которому __ /7-7 2 П-3 )* П-1 Рис. 7 157
2 — olf = ф(Х*)вг = j-Ог и, следовательно, оптимальной по крите- критерию минимума среднеквадратической ошибки является оценка 7V = 2.19. Из решения задачи 1.45 имеем з (я + 1)(я + 3) „ , , = А «2. to/i = А, «2. to/i = А, (n-\f (n-lf Отсюда мера б,(в) = е<(п - <яу = е„(Л[ - 4Ш +-6ПШ - 4Г,.ее + о!) = где _ ,(Л+1)(Я + 3) f AJ — 4Я.+ 1. Уравнение »1>'(Х) = 0 с помощью подстановки Х = —цтг( ' Н ) приводится к виду = 0, ря = Поскольку дискриминант Dn = pj + q\ > 0, это уравнение имеет един- единственный действительный корень х„ = У— qn + VDn + y^q, — VD/. • (формула Кардана), для которого при больших п справедливо асимпто- асимптотическое представление х„ = ——(- О[—j=-). Таким образом, оценка, минимизирующая в классе статистик (ТЛ = Х5'2) меру 6,(9), имеет вид Г* = -^Ц^Г 1 + —}s'2. Рассмотрим теперь вторую меру 62(Э) = EolTi - Oil = x(».Hi. где у(Х) = Е —х« i — ' ¦ Дх»-|) == У2('! — ')¦ I л — 1 Если kn-i(t) — плотность распределения %2(п — 1), то п— I ~. ~т— X = \ г/ - О 158
Отсюда следует, что уравнение х'М = 0 эквивалентно уравнению которое определяет единственное значение к* = К, а тем самым и оп- оптимальную оценку 7\«. 2.20. Поскольку L^nS1 /0i)=xV — 0 = ГB, "~ ), из формулы для моментов гамма-распределения имеем откуда следует несмещенность указанной оценки. При п = 2 S = = -т-\Х\ — Х?\ и поэтому Отсюда Хг\ - 02 = 2.21. Утверждение непосредственно следует из того факта, что LoG") = Г@, \п), и формулы для моментов гамма-распределения. 2.22. Если t«(|) = Г(8, 1), то L^g/O) = ГA, I) и по задаче 1.34 случайные величины Y, = (Х(,) — ^(,_i)), r = \ п, незави- независимы и L<{Y,) = ГA, 1) для любого г. Отсюда (см. решение задачи t 1.34) Xw = е?У,/(л - ; + 1) и поэтому т = цх) = 2 *.*х(Ч = 02—^гт^. л, = 2^*. '" = '. -. <¦ Из этого представления сразу получаем, что ЕоГ = в2Л,/(я - i + 1), Dor = 622Л?/(п - ' + IJ ,=.1 i-i г Условие несмещенности эквивалентно условию 2Л,/(и — i + 1) = '. при котором надо минимизировать выражение 2л?/(п — i + IJ *-1 Метод неопределенных множителей Лагранжа дает следующий резуль- результат: оптимальный выбор Л; таков: Л,* = , i — I г Окон- Окончательно получаем, что оптимальная несмещенная оценка 0 имеет вид 159
T* = 1-2 Y, = i-2(» - '¦ + ')№/) - Jfp-i)) = 7-2/co o2 и ее дисперсия D07"* = —. 2.23. Из решения задачи 1.36 следует, что FT FVJ-fiFV ( 2"+' \ /1+1 DJ- = a'DAi + Р2ОД(„ + 2арсоу(ДГ,„), *A)) = Отсюда имеем, что оптимальными являются значения аир, минимизи- минимизирующие форму а2 + р2 + 2ар/я при условии a'fin + \)/(п + I) + + Р(л + 2)/{л + 1) = 1. Решение этой экстремальной задачи (напри- (например, методом неопределенных множителей Лагранжа) имеет вид а* = ————, р* = ——¦—. Таким образом, оптимальной несметен- 5л+ 4 5л+ 4 ной оценкой 0 в рассматриваемом классе оценок является Т* = 2.24. Несмещенность указанных оценок непосредственно следует из задачи 1.36. Далее, D07"i = —;—-^г- < D07 = —пг0, т.е. оценка п{п+2) п + 2 Т\ точнее. Более того, Do7"i -*¦ 0 при п -*¦ оо, т. е. оценка Т\ состоятель- состоятельна. Оценка же Тг не обладает этим свойством. Действительно, так как < 0 = i - A - ^)". о < / ^ о, \ О/ - 01 < е) = Po(| — ( \ _ в~~Е У _ ( \ _ 0 + е ^ я „-(O-fl/0 _ - 2.25. Из формул задачи 1.36 непосредственно следует несмещенность указанных оценок и следующие выражения для их дисперсий: Do*,,, + 2cov(A-(l), *<„,))= л 4-1 Ул 4-21 ' n + DoXw - 2cov(X(l), XM)) = 2F2 —О,J При л ->- оо эти дисперсии стремятся к нулю, т. е. обе оценки состоя- состоятельны. 2.26. Из формул, приведенных в решении задачи 1.37, непосред- непосредственно следует несмещенность указанной оценки и тот факт, что Do/1 -»¦ 0 при л -+ оо, т. е. ее состоятельность. 2.27. В данном случае теоретическое среднее совпадает с 0, поэтому результат следует из решения задачи 2.1 п. б). 160
2.28. Согласно свойству среднего арифметического для распреде- распределения Коши L&X) = К@), т. е. распределение статистики X не зависит от л и поэтому величина Р^\Х — 61 J? е)одна и та же для всех л. 2.29. Из задачи 1.52 следует. Е„Г, = р„ DJ, = -V(EoV,(v, - I) + Eov, - (E0v,J] = n при n -> oo, что доказывает утверждение п. а). Далее имеем 2 Н{± ±L Здесь при любой функции // правая часть представляет собой много- многочлен от р рн степени ^ л, следовательно, несмещенные оценки в данном случае можно строить лишь для многочленов степени ^ п от параметров р\, .... pN. | V N Наконец, если Н — —?c'v'- то ЕцН = ^cpt = т@), ?>аН = = —( 2 ejbi — tj@))-»¦ 0 при п-»-оо, т.е. Н — несмещенная и сос- " 4-1 тоятельная оценка т@). 2.30. Так как а, = а2@) = 0,Г@2 + 1)/Г(вя) = 0,02, а2 = аг@) = = 0?Г@5 + 2)/Г@,) = О?е2@2 + I), откуда 0, = (а2 - а? /а,, 0г = = а?/(аг — а\), то искомые оценки имеют вид 8, = (Л„, - Л2„,)/Ля1 = S2/-?, б2 = Ah/(А.г - Ah) = *7-S2. Эти статистики представляют собой непрерывные функции от выбороч- выборочных моментов, поэтому они являются состоятельными оценками соот- соответствующих параметров. 2.31. Здесь а,@) = Ео? = 1@, + 02). а,@) = Е0|г = 1@? + + 02 + 0, + 02) и решением уравнений а„@) = Л»», /г = 1, 2, явля- являются оценки б,. г = Ащ Т V^-2 - Л^, - Лл| Для приведенных данных б| = 2,17 .... б2 = 3,57 ... . 2.33. Если D ^ ко, то условия несмещенности эквивалентны сис- системе уравнений %T(k)f(k; D, п) = x(D), D = 0, \,...,kQ. Это треугольная система, в которой диагональные коэффициенты f(D; D, п) = С"ц-°о/С% Ф 0. Следовательно, значения 7"@), ГA) Т{кй) отсюда определяются однозначно. Для значений же т > k» пола- полагаем - 2 К*;т- 6-190 161
*» что возможно, так как 1 — 2 /(*; т, п) Ф 0 при т ~> кв. Далее, поскольку 2 *Л*; о, п) = On (см. формулу для среднего гипергеометрического распределения H{D, N, п) во введении к гл. 1), для случая x(D) = D функция Т имеет вид T(k) = kN/n при k = 0, !, .... k<, и [Л/ *° 1 Г *" 1 га 2№т. л}/ I- 2/(*;m,n) [Л/ * о при m > fto. В частности, если положить кц — п (контроль всей партии не пре- предусматривается), то несмещенной оценкой для числа D дефектных из- изделий является статистика Г(|) = —?. л 2.34. а) Поскольку (см. указание) Еу(«) = Р(ы е. s) = л(ы), из представления e{s,x) = 2v("W")/n(") следует несмещенность оценки Горвица — Томпсона. Далее, так как 2 о(и)х(и) = 2y("M"W"). to условие несмещенности такой оценки означает, что Выбирая, в частности, в качестве х координатные векторы евклидова пространства R", получим, что л(и,) a{ut) = I, i = 1 N. Таким обра- образом, оценка Горвица — Томпсона является единственной линейной не- несмещенной оценкой для Т(х). б) Так как e*(s, х) = 2 У(и)у(и)х(и)х[и)/ф)ф) + 2>(«)л:2(")/л2(«) н Ey(")y(u) = Р{и е s, v e s) = л(и, и), и =?^= о, то s, х) = E?(s, *) - (Еф, ж)J = 2 nlwl ^"М") + что эквивалентно указанной в формулировке задачи формуле, в) Несмещенность следует из представления 162
г) Указанные формулы являются прямым следствием представ- представлений ¦ . . Ф) = 2v("). As) = 2 v(")v(«) + Ev("). u u =f= и а 2.35. а) Для любого фиксированного элемента а существуют л(Л'— l)/i-i различных выборок, содержащих этот элемент, поэтому 6) Формула для D* следует из общей формулы для De(s, х) (см. п. б) предыдущей задачи), если учесть, что в данном случае в) Несмещенность o'(s, x) следует из представления S\s, х) = - 2 v 2.36. Вычислим сначала Ец,. Используя указание, имеем Ец, = '=/УЕЙ''= Л/Р(Йг)= 1), где, согласно классическому определению вероятности, Окончательно имеем Отсюда следует, что среднее любой линейной статистики имеет вид т.е. представляет собой многочлен от -тт степени не выше п— 1. Это означает, что несмещенные оценки в классе L могут существовать лишь * для параметрических функций вида t{N)= 2 Cj/N1 при ft<n —1. /-' Пусть x(N) — такая произвольная функция. Тогда условие несме- несмещенности означает, что Отсюда следует, что коэффициенты /, искомой оценки однозначно определяются через коэффициенты с,. То, что I, имеют указанный в формулировке задачи вид, можно проверить непосредственно, учи- учитывая (см. задачу 1.52 п. б) формулу 2.37. Найдем сначала распределение случайной величины х\. Обозначим через Л, событие, состоящее в том, что i-й элемент не 6* 163
наблюдался (i = 1, ..., N), и пусть р.о(я, т, N) = N — х\ — общее число ненаблюдавшихся элементов. Тогда по формуле для вероятности суммы событий [2, с. 109] Р(Мп. т. N) > 0) = р( И А,) =?(- 1У+| 2 Р(Ак,..А„). 2 Во внутренней сумме все слагаемые равны (CJ_/)"/(C'X)", а их число равно C'N, поэтому РЫ«, т. Л/)>0)= ^(-' Далее, p(T] = ft)=p((l0(n, m, N)=N-k)= где (/ /») = {!,..., A/)\(i jat-J- В последней сумме все слагаемые равны друг другу, а их число равно С^,. По теореме умножения ве- вероятностей Здесь и P(Aii...Aik\Ail...Aitl_k) = P(,io(«, /и, А) = 0) = ? (- / = 0 Из этих соотношений окончательно получаем, что Р(П=А;) = С*, 2 (- 1)»-'С1(СУТ/(СХ)°. * = m, m + I min(m л, Л/). /-о Пусть теперь /V ^ тл, тогда Ет*= 2 т*(*)Р(ч = *) = (с%— 2 с*д/ S (-1)'- = (СХГ" 2 тУ)(С7)"Ся 2'(-')'^_; = ;=ш г = о Если же N > тп, то, учитывая свойства функции /(/V), можем запи- записать, что Ет' = (С™)-" 2 С", 2 (-!)'-.'«/(/). *=0 ;-0 4 Для этого достаточно убедиться, что 2 (— 1 )* 'Ci/(/) = 0 при k>mn. 1 = 0 В свою очередь это следует из цепочки равенств * к- г l=a s = о 164
Теперь имеем Ex* = (Q-" 2 , 2.41. Так как для схемы повторных независимых наблюдений рас- распределения векторов X и лХ совпадают, то ЕцТ' = ЕаТ = т, т. е. т — несмещенная оценка т(8). Пусть теперь DaT{X)= б2, тогда и ИаТ{пХ) = = б2, а согласно неравенству Коши — Буняковского Отсюда , П\+П\(П\- 1) 2 <6—щ—=б- Таким образом, для любой несмещенной оценки можно указать сим- симметрическую несмещенную оценку, дисперсия которой не превышает дисперсии исходной оценки. Следовательно, оптимальную оценку (когда она существует) надо искать среди симметрических функций наблюдений. 2.42. 1) Рассмотрим статистику 7\ = Т" + Хф, которая при любом X является несмещенной оценкой т. Тогда, в силу оптимальности Т, De7\ = D07" + ^Doif + 2Xcov0(r\ ф) > DJ'. Но это возможно при всех X только лишь, если coveG"*, ф) = О V9- 2) Пусть >Т — произвольная несмещенная оценка т. Тогда ста- статистика \|) = Т' — Т имеет нулевое среднее и на основании предыдущего О = соуо(Г, Г - Т) = DoГ - coveG", T). (' - 0)' 2.43. Для модели N(Q, б2) функция /(х; О) = е 28' . От- -\/2л 6 сюда зтгг'п/(х; ^) =—? и поэтому г(9) = -лг- Для модели N(\i, 02) OD О О *. 6) = g, -г. откуда Для модели Г@, X) функция f(x; 6) = ,,— и . ^-1п^(дг; 0) = ¦ 2х X 2 X X = -тгз ?П"- Отсюда [(е) = -з-ЕД, —-,- = —т. Для модели Коши и и и и и а ... .. 2(л: — в) -1п/(дг;8)= , j(jc_^. поэтому 165
Для биномиальной модели /(*; 0) = С{0*A — 0)*"*, у X k — X = -трг—I—г-: 7ГГД-, следовательно. Щ Для пуассонопской модели f[x; 0) = е~с ——, гкз-1п/0с; 0) = —т, сле- довательно, Для модели В|'(л, 0) функция /(лг; 0) = C+«_i0*(l — 0)', 1п/(дг; 0) '( ' , следовательно, г 0A-0) 2.44. В данном случае *; 0) = Этот факт с учетом предыдущих результатов приводит к указанной в формулировке задачи формуле. 2.45. Вид матрицы /@) следует из формул непосредственно можно проверить, что /~'@) = 2^_|, где матрица 2/v-i определена в задаче 1.53. 2.46. Пусть F — экспоненциальная модель. Тогда при 0 = @ , 0,) ULX; Щ = ^„Ц* в) » ±^пКХ,.. в) = ™&m + пЩ_ , где Т(Х)= 2 В(Х,). Отсюда, полагая 0,@)= (п ^^ ) , /= 1 г, можем записать, что 2 ФМХ-. 0) = ^ЦХ) +±Jm.Jm^: т@). Обратно, если имеет место представление a'@)U(X; 0) = Т„(Х) — т@) при некоторых а@) = (ai@), ..., а,@)), Т„[Х) и т@), то, в частности, 166
Отсюда следует, что функция j(x; G) имеет указанный вид. Чтобы получить формулу для дисперсии Dot*, заметим, что ДтF) _. . д\пЦх; 9) _ Е/Т«п«у./Х. ву, _ = cove(T*(X), (//(*; в)), так как Е0У;(Х; 9) = О V 9. Отсюда = cov0(t", t" — т(в)) = Dot*. 2.47. Так как дисперсия эффективной оценки совпадает с границей Рао—Крамера, то из предыдущей задачи имеем соотношение , = = ! , откуда следует указанное выражение для «(в). Далее, /(в) = - Eo3'ndff:e) = -Л"(в)ЕвВ© - С"(9) = -?Ц-Л"(9) - С"(8), т.е. Е(,ВA)=-С'(е)/Л'(9). 2.48. Проверка состоит в прямом применении результатов задачи 2.46. Например, для модели Bi{r, 9) f(x; 6) = exp(^ln9 + dn(l - 6) + InCi+I_il, т. е. Л(9) = 1п9, В(х) = jc, С(9) = МпA — 6). Следовательно, ,(в)= -С'(в)/Л'(в) = гв/A -9), х- = Х, В»'—7^— 2.49. В рассматриваемом случае J^ ' = 2{(х; 8), откуда Далее, Отсюда 2.50. Утверждение следует из равенства и критерия Бхаттачария. 2.51. Иэ задачи 2.21 следует, что Е„Г = б2, В*Г = ^Д *j" f} Нижняя же граница Рао—Крамера для функции т(9) = б2 равна (см. задачу 2.43) б1, что меньше DaT', следовательно, Г' не явля- 167
ется эффективной оценкой т@). Оптимальность Т следует из ра- равенства 'ре3 dL V a*L-> n и критерия Бхаттачария. 2.52. Оптимальность указанных оценок следует из равенств 61 d\nL _ - 1/93 TVn-i dL и критерия Бхаттачарня. Информационная матрица модели iV(9i, Oj) вычислена в задаче 2.44., откуда получаем, что граница Рар—Крамера для функции Т|F) = 9i равна Ql/n, что совпадает с DoX, т. е. X — эффективная оценка ti(9). Для функции же т2(9) = 9* эта граница равна 29г/л, что меньше D<(S'2) = 2Qi/(n — 1) (см. решение задачи 2.14), т.е. S'2 не является эффективной оценкой тг(9). 2.53. На основании предыдущей задачи наилучшей оценкой для среднего является выборочное среднее объединенной выборки, т. е. статистика X——(гцЛ| -f- П2Х2), где п = П\ + пг, при этом Аналогично, наилучшей оценкой для дисперсии, учитывающей всю информацию, является статистика Но пЛ,2 = П\А^2 + п2Л^, где Л(,?2 — выборочный момент второго порядка i-й выборки, i = 1,2. Из формулы имеем /ii-4(^2 = (ni— I)S/2 + n>Xb Отсюда окончательно находим, что S'2 = —1—гЦП1 - l)S При этом (см. задачу 2.14) 2.54. 1) Пусть *. известно. Рассматриваемая модель является экспоненциальной, для которой (см. задачу 2.46) В(х) = х, -4(9) = = 2вг'^^ = 1Г| где ® = ^' СлеД°вательн0- в Данном случае эф- эффективная оценка т* = X, а соответствующая параметрическая функ- .1 1 и3 ция т(9) = ц. При этом Dx* = — D-Yi =— =J-— Если X неиз- п пА @) п\ вестно, то, вычисляя
a\nL и применяя критерий Бхаттачария, получаем утверждение. 2) В данном случае мы имеем экспоненциальную модель с B(x) = ^r + ,A@)=, C(O) = A + i.|nOl где 0 = X, и согласно решению задачи 2.46 статистика т' = I " / Х- \ \ 12 = — V (—j- + ~v~) есть эффективная оценка для т@) = — -\ . 2 Следовательно, искомая оценка имеет вид т* . 2.55. При yc?Rm согласно неравенству Рао—Крамера для ска- скалярных оценок D0(eT)> бЩГ'@NF). где Таким образом, Это и означает, что матрица DdT) — В'F)/,Г'(в)ВF) является неотри- неотрицательно определенной. 2.56. Если для т@) существует эффективная оценка, то модель является экспоненциальной (задача 2.46). Следовательно, Цх; 0) = ехрИ@OМ + яС@) + 2 О(*)). Г(«) = 2 BW. и согласно критерию факторизации Т(Х) — достаточная статистика. 2.57. Достаточность статистики Т„ следует из задач 2.56 и 2.48. Проверим ее полноту, т.е. покажем, что условию E09G'/i) = 0 \/в^ е@, 1) удовлетворяет лишь функция ф, для которой ф(/) = 0,/ = 0, 1, ..., гп. На основании свойства воспроизводимости L^Tn) = Bi(kn, 6), поэтому и условие полноты эквивалентно условию 4л 2 Но из тождественного равенства нулю многочлена следует равенство нулю всех его коэффициентов, что и требовалось установить. Из пол- 169
ноты статистики Тп следует, что в данном случае несмещенные оценки существуют лишь для таких параметрических функций т(9), которые имеют вид Е$//G"л), т.е. представляют собой полиномы от 8 степени не выше kn. В частности, несмещенной (а следовательно, и оптималь- оптимальной) оценкой степени в' при j ^ kn является статистика (Tn)i/(kn)j (см. задачу 1.52), а из линейности свойства оптимальности следует, что несмещенная оптимальная оценка полинома т(8) = У а,0' при г < /=о <! kn имеет указанный в формулировке задачи вид. Этот результат обобщает и усиливает результаты задач 2.5, 2.7 и 2.8. 2.58. Достаточность статистики Т„ следует из результатов задач 2.56 и 2.48. Имеем, Lt{Tn) = П(я9) и поэтому условие полноты экви- валентно условию У, f(k) О V9 > 0. Но из тождественного равенства нулю степенного ряда следует равенство нулю всех его коэффициентов. Таким образом, этому условию удовлетворяет лишь функция ср, для которой <f(k) = 0, k = 0, 1,2 Это означает полноту статистики Г„. Из задачи 2.9 следует, что оптимальной несмещенной оценкой для 9' является статистика G"„))/«'; отсюда, учитывая линей- линейность свойства оптимальности, получаем последнее утверждение за- задачи. 2.59. Из предыдущей задачи имеем, что для функции т(9) = оо = 2 СК2 ~~'))'//! оптимальная оценка имеет вид ;=0 B-1У '*=S- / 6*+' 6 для функции л*F)= 51 (— li—ггг, следующий вид: • _ v I iv Г"-* для функции т,(9)= 2 л*(9) — эта оценка такова: О при Г„ < г. 2.60. 1) В данном случае /(*; 6) = ехр{А(в)В{х) + С(в) + D{x)\ при /4(9) = 1п9, В(х) = х, С(9)= — 1п/(е), D{x)= \na(x), и утверждение не- непосредственно следует из результата задачи 2.46. 2) Из вида функции правдоподобия на основании критерия факторизации следует достаточность Т„. Чтобы иайти распределение Тп, заметим, что ее производящая функция равна (см. указание) 170
Выделяя в правой части коэффициент при г', получаем указанный результат. Пусть теперь <р(/) — произвольная функция, заданная на множе- множестве (я/, л/+1, ...), и такая, что Е0<рG'я) = О V0 е в, т.е. f <р(О&«(Ое' = О V0 е в. t — al Отсюда следует, что q(t) = 0 для всех t, для которых bn(t) ф 0, т. е. <р(<)=0 на множестве всех возможных значений статистики 7V Таким образом, Т„ — полная достаточная статистика. 3) На основании предыдущего пункта достаточно проверить, что EoxJ = в*. Имеем 00 h It И °° Е°т*= 2 i,A }HT.=°t)= 2 ь«(/-«)в| поскольку 2 6»@°' = /"(О)- 1-и/ 4) Используя линейность свойства оптимальности и результат п. 3, находим \Т„) Т"%"а,Ь„(Та - j) при Т. > п 1 + г, т* = 2 aiV = ', /-' О при Т„ < nl + Г. Наконец, если Т„ ^ (п -\- 1)/, то отсюда в силу указания следует вид оценки /'. 2.61. Рассматриваемая модель — частный случай модели предыду- предыдущей задачи (при /@) = е°— 1), поэтому т*= Ь„(Т — \)/Ь„(Т), где л при ft>n и 6„(А) = 0 при ft < п. Отсюда следует сформулированный результат. 2.62. Полагая в задаче 2.60 /@) = A — 0)"' и учитывая разложение ое /"@) = A _ 0)-'"= 2С;„-м_|8' (см. задачу 2.11), находим, 1-0 ТТ (^ 0 при Т„<5 (это значительное усиление результата задачи 2.11). Далее, т2@) = /~'@) и аналогично задаче 2.60 устанавливается, что 2.63. Из указания к задаче 2.45 следует, что функцию f(x; 0) можно представить в виде 171
f(x; 0) = где e;=ln-^-, j= I N— I. Pw Отсюда по критерию для л-параметрического экспоненциального се- семейства (при г = N — 1) следует, что Г = (Т\, .... 7"д,_1), где Г; = = ? S(Xi, flj) = vj, / = 1 /V — 1, — минимальная полная достаточ- ная статистика. Следовательно, в данной модели несмещенные оценки существуют лишь для таких параметрических функций, которые имеют вид Ео/^Г). Но класс таких функций совпадает с классом полиномов от pi, ..., pN степени <я (см. решение задачи 2.29). Из задачи 1.52 п. б) следует, что оптимальной оценкой т(8) = pf '—Рн при kt +... + kN^ n является статистика т* =1^|)а|...(ул)*д/(л)а1 + ... + kN- Оценки для произ- произвольных полиномов строят с помощью линейных комбинаций этих статистик (на основании линейности свойства оптимальности). 2.64. Модель N(Q, о2) является моделью экмпоненциального типа и выборочное среднее X является для нее полной достаточной статистикой, поэтому Т' — оптимальная несмещенная оценка функции т(9) = 9 (ср. с задачей 2.50). Аналогично доказывается оптимальность оценок, указанных в задаче 2.16, поскольку Г2 — полная достаточная статистика для модели N(\i, в2). 2.65. Имеем E07"i = Ро(| ^ *о) = т (9), т. е. Г, — несмещенная оценка т (в). Поскольку в данном случае (см. решение задачи 2.64) полная достаточная статистика есть X, оптимальная оценка может быть вычислена по формуле 0- Х\Х). Ho Xi — X и X независимы (см. задачу 1.56) и La(Xi — А) = = N{0, o2j, поэтому т* = Р„(Х, -*<*.- Л) = ф(-\1 п"_х Х°~ )¦ 2.66. Функцию f (х; 0) можно в данном случае записать в виде f (х- 8) = ехр [ Q\x + Qix2 + с (95, в',)} , 81 = -jjj-, В'2 = - -щ ¦ Согласно критерию для /--параметрического экспоненциального семей- л п ства отсюда следует, что ( 2 Xit 2 X?) — минимальная полная до- статочная статистика. Таковой же является и эквивалентная ей пара (Л; S2), поскольку эти две статистики взаимно однозначно определяют друг друга. Отсюда следует оптимальность указанных в задаче 2.20 оценок. 2.67. Так как ЕоE2) = " ~ ' u2 = —-fti1 (см. задачу 1.27), п я ЕьО?) = 9а + — v202 = " + Y О2 (см. задачу 2.13), то V 6 ЕофG") = п п = 0, т. е. критерий полноты не выполняется. 2.68. Пусть X = (X,, .... Х„) — соответствующие измерения; тогда 172
A — выборка из распределения #(81,62) и речь идет об оценивании параметрической функции т (б) = — в|. Используя решение зада- задачи 2.67, находим, что Е,(У Ц- S2) = 9? + - 0| \—.Л—± 61 = в?. \ п — 1/ п п — 1 п Отсюда в силу полноты достаточной статистики Т = (Л, S2) (см. зада- задачу 2.66) следует, что оптимальной несмещенной оценкой т(8) является статистика т* = -^- (х2 г- S2\ 2.69. Для любого события А условная <$л{Т) = PeG"i ?A\T) и безус- безусловная ул = Pe(Ti?A) вероятности по условию не зависят от пара- параметра в, при этом Еофд(Г) = ул, т. е. Ец?(Г) = 0-ув, где g{T) = = <р,|(Г) — уд. Отсюда и из условия полноты статистики Т следует, что фл(Г) в Yd, т. е. указанные условная и безусловная вероятности совпадают. Но это и означает, что статистики Т\ и Г независимы. 2.70. В данном случае 7 = X? + XI + X, — полная достаточная статистика (см. решение задачи 2.64) и Tt = l(Xi ^ хо) — несмещен- несмещенная оценка т F), поэтому оптимальная оценка Здесь статистика t| = Xt/T = У|/л/И + %1 где Yt = X,JQ, i = 1,2,3, xi = Уг + Уз, имеет распределение, не зависящее от параметра 9 (по- (поскольку L0(Yi) = N@, 1), 1= 1,2,3), следовательно, по теореме Басу (см. задачу 2.69), т) и Т независимы. Итак, т* = ^л(~5г)' где F^(u) = = P(tj ^ и). Вид функции распределения f,(u) получен в задаче 1.58 для произвольного объема выборки. Полагая п — 4, в данном случае имеем: при 0 ^ и ^ 1 при — 1 < и < 0 f,(«)= 1 /%(и) = . Таким образом, ?(т]) = Л(— 1,1) и окончательно получаем, что 1 при дго > Т, 4-(> +т)при Uo1 *»т< 0 при Хо < — 7". V — ft 2.71. Введем случайные величины Yt = я . i = \ п, рас- распределение которых не зависит от в = F|, 62). Тогда Y,- ) S(Y) т. е^_ распределение статистики U не зависит от 8. Поскольку Т = = (X,S2(X)) — полная достаточная статистика для модели JVFi,6l) 173
(задача 2.66), по теореме Басу (см. задачу 2.69.) Т и U независимы. 2.72. Так как ЕвТ, = Ро(^| < х0) = т F), то 7\ — несмещенная оценка т @). Следовательно, оптимальная оценка может быть найдена по формуле (далее Т = (X, 52)) т* = E0G'i|7') = Р0(Х, =g; хо\Т) = Р0(т1 < ио\Т), где ц = —====: , и<\ = —;= . Но на основании решения пре- / 1С ( \ С -ул — 1 о ~уп — 1 о дыдущей задачи статистики т) и Т независимы, поэтому т* = Fп("о). Функция распределения статистики т) вычислена в задаче 1.58. Ис- Используя этот результат, получаем \ — -^В\\ — и\\ —g—• "г")' еСЛИ Х< Хй> 1 / п — 2 1 \ — Bll — ul; —^—, -уУ. если X ^ x<j. Для расчетов можно использовать таблицы функции бета-распределе- бета-распределения В (/; а, Ь). 2.73. Модель Г (9, X) является моделью экспоненциального типа и для нее Т = %Х<¦— полная достаточная статистика. Следовательно, /—I указанные в задаче 2.21 оценки — оптимальные. Чтобы доказать вто- второе утверждение, достаточно убедиться в тон, что не существует функ- функции Н{Т), удовлетворяющей условию Е0Я(Г) = 9"'V9 > 0. Это усло- условие можно записать в виде > 0, где 2 = 4". W,(*) = Н(х)хх"-1/Г(кп). Если m = а — Я.п + I — целое, то, продифференцировав это тож- тождество по z m раз, получим \Hi(x)x"e-"dx = 0. о Этот интеграл есть преобразование Лапласа от хтН[(х), поэтому от- отсюда следует, что Н(х) — О при х > 0. 2.74. Так как Т — полная достаточная статистика, то достаточно убедиться в несмещенности оценки; т* L0(T) = Г F, Ы), поэтому аи Е0<р(/Г) = \<f{tx)xln->e-"o о Далее, 174
Отсюда, так как можно менять порядок интегрирования, получаем = Еоф(|). о В частности, если а > — X, то для <р(дг) = xf среднее ЕОфA) сущест- существует и т @) = Еоф (I) = — . 6а Поэтому i Т* = „ ,. ^ „ ,. , 7ТГ \^ ~*~в~ М — /)"л~ '~ dt = „ /я t „ / т—г Тв. При а = 1,2 приходим к результатам, полученным в задачах 2.48 и 2.51 соответственно. 2.75. Имеем т(9; t) = Еое(? - 0 = Ро(? > 0. поэтому т* — Здесь е (хТ — /) = 1 ¦»¦ х > 1/Т, поэтому, если Г < t, то интеграл равен нулю, а при Г > I он выражается через функцию бета-распре- бета-распределения: j ^"'A -xf-^-'dx = В(\,Х(п - 1))A - В(^;ХЛ(п - 1». ЦТ В частности, при X = 1 в(*; '¦л-!) - что позволяет получить указанный результат для экспоненциального распределения. 2.76. Записав функцию правдоподобия в виде согласно критерию факторизации получаем, что Т — достаточная ста- статистика. Найдем ее распределение. Заметив, что Р0 (?/оI < х) = р,(б < о (yI") = ' - е~Т' т. е. 10B (?/0I) = х2B), находим 10BГ/0)-) = х2Bл). Отсюда плотность распределения Т имеет вид Условие Еоф {Т) = 0V0 > 0, в данном случае имеет вид О Отсюда следует, что <р (х) = 0, х > 0, т. е. статистика Т - полная. Теперь достаточно проверить равенство Еот* = т @). Имеем (так как можно менять порядок интегрирования) 175
1 00 Ест* = (я - I) J(l - О-'Пфй/дгУ'Ч/гЮлЛл = о L n J 1 во = -gr $<Р (У) У'~ 'e-iym'dy = ЕОф A) = т @). о При ф(*) = Xх функция т@) = 91 и т* = (л — 1)Г \t (I — t)"-2dt = о = Tin. 2.77. Используя функцию Хевисайда е (х), функцию правдоподобия можно записать в виде --?.(*-О,)}. Согласно критерию факторизации отсюда следует требуемое утверж- утверждение. 2.78. Как и в задаче 2.77, запишем функцию правдоподобия в виде л t(«; в) =.П/(*: в) «(*(D-а (в)). Отсюда видно, что одномерной достаточной статистикой может быть только X(i) и только в том случае, когда / (*г, 0) разлагается в произ- произведение двух функций, одна из которых зависит от xi, а другая — от в, т. е. если f (jc; 8) = g (x)/h (9). 2.79. Достаточность Хм следует из решения предыдущей задачи. Чтобы проверить полноту, надо сначала найти распределение Х(л> Имеем Отсюда, если о то, продиференцировав по G тождество }ф(*)*"~'^* ^ 0, получим, что о Ф @) = 0, 9 > 0. Это означает полноту Х^у Поскольку Т* — несмещен- несмещенная оценка 9 (см. задачу 2.24), она как функция полной достаточной статистики является оптимальной среди всех несмещенных оценок. Да- Далее находим Е4П - бJ = Е„[Х (Г» _ 9) + (X - I) 9? = • = XJDer* + (Я. - 1J02 = if W 92, 176
где (см. решение задачи 2.24) i)i (X) = ,*,„.+ (X — if. Здесь п (п + 2.) min ij> (X) = if (X*) = -—;——«- и X* = ——¦—-J-. Таким образом, для х A + 1) (л + 1) оценки 7\. = ¦—г*(") среднеквадратическая ошибка л + 1 0г 0' _ (л + iy < л(л + 2) ~ ° ' 2.80. Для модели /? @i. 02) функция правдоподобия может быть записана в виде Цх; 0) = е(82 — дг(л))фгA) — 0i)/@2 — Oi)", где е(х) — функция Хевисанда, следовательно, Т = (Хц), Х(п]) — достаточная ста- статистика. Плотность распределения Т задана в задаче 1.36. Исполь- Используя этот результат, получаем, что условие Евф(Г) = 0-ув эквива- эквивалентно условию *i.*2)(*j — xi)"~sd*2dxi = 0 V 0. Дифференцируя это тождество сначала по 0|, а затем по Oj, сводим его к тождеству <p@i,0j)@2 — 0i)"~2 = 0 V 0. Отсюда следует, что Ф @i. вг) = 0 V 0i < 02, т. е. статистика Т—полная. Оценки, по- построенные в задаче 2.25, представляют собой функции от Т, следова- л9| + 02 тельно, они оптимальны. Наконец, поскольку Е(Хп = —г- , Л 4- fl Д- nfl ЕХ = 2 (см. задачу 1.36), статистики (n(Xw — Х1л))/(л — 1) п + 1 и (л (Х{„) — Х(|))/(л — I) являются несмещенными, а следовательно, и оптимальными оценками параметров 0t и 02 соответственно. 2.81. Записав, как и в предыдущей задаче, функцию правдоподо- правдоподобия в виде L (х; 0) = е (*,„ - а @» е F (в) - х^ЦЬ (9) - а (в))", убеж- убеждаемся в достаточности статистики Т. Если а @) \, Ь F) \ при возраста- возрастании 0, то {*,„> а F), *(„,< 6 (8)] о 10 < a-'(*(.i), 0 ^ Ь-'(*(»1» о@ < Г,(х) = min (a-ЧЫЬ-'('(-.)))). следовательно, функцию правдоподобия можно переписать в виде L {х; 0) = е G", (лс) — 0)/F @) — а @))". Это означает, что в рассматри- рассматриваемом случае существует одномерная достаточная статистика, именно статистика Т,{Х) = min (a^^), 6~' (ДГ t»j». Аналогично, если a(O)J, 6 (8) \ при возрастании в, то одномерная достаточная статистика существует и имеет вид Т2(Х) = max (a~l(X^), Ь~1(Х{„)). Этими двумя случаями исчерпываются ситуации, когда в модели R (а @), Ь @)) су- существует одномерная достаточная статистика. В частности, для модели Л (—0,0) статистика Т,(Х) = max (-*„> *(„,) = max(|X(,,|, \Xin)\). 2.82. Условие Еоф (X) = О V 0 можно записать в виде или (см. указание к задаче 2.11) в виде оо ф (о) + 2 [ф М + х ф (~~ ')} о* — о. 177
Этому условию удовлетворяют функции <р, для которых ф @) = О, Ф (х) = — *ф(— 1), х = 1,2,... Единственной ограниченной функцией такого типа является функция ф(дг) = 0, х = — 1,0.1,.... Таким об- образом, X — ограниченно полная достаточная статистика, не являю- являющаяся полной. , 2.83. Распределение выборочных данных \i = (pi,, ..., ц„) сосредото- сосредоточено на множестве /.«.„ векторов / = (/, /„) с целыми неотрица- неотрицательными компонентами, удовлетворяющими условиям I, + ... + /„ «S N, U + 2/2 + ... + nla = л. Найдем функцию правдоподобия Р*(ц = /), I е LM,- Общее число воз- возможных исходов эксперимента равно N", число же исходов, совмести- совместимых с событием (ц = 1\, можно подсчитать следующим образом. Зафиксируем сначала те к = 1, -f ...-)- 'п элементов совокупности U, которые будут представлены в выборке. Это можно сделать Скы раз- различными способами. Для каждого такого подмножества элементов су- существует одно и то же число способов формирования выборки из эле- элементов данного подмножества с заданным значением / статистики ц и при условии, что все k элементов должны войти в выборку. Обозна- Обозначим это число А (I; к, п). Тогда общее число благоприятных исходов равно С?/А (I; к, п) и согласно классическому определению вероятности где первый множитель g (к; /V) = C%N~" зависит от параметра N, а от выборочных данных зависит лишь через к = /| -f ••¦ + /я-совмес- тимое с событием (ц = /) значение статистики ц, а второй множитель A (t; к, п) от параметра N не зависит. Согласно критерию факториза- факторизации г) — достаточная статистика для N. Для доказательства полноты ц требуется проверить, что для всякой функции ф (ft) из ЕЛф(т|) = = 0VW следует, что ф (к) = 0 для всех возможных значений ста- статистики т) (при всех N ^ 1). Распределение т) имеет (см. решение задачи 2.37) вид Р*(г| = к) = g(fe;/VJ(- O'-'CiA Ae/C(/V) = A.2 min (n, N)\, 1-0 следовательно, надо проверить, что ф (I) = ф B) = ... = ф(п) = 0. Если N = I, то Е,ф(т1) = <p(l)g(l; 1) = фA) = 0. Если N = 2, то Е2ф(л) = ЧРA)Р2(Т1 = 1) + ФB)Р2(л=2) = фB)еB;2)B"-2) = 0. т. е. фB) = 0. Аналогично, полагая N = 3, находим, что условие Е3ф (ti) = 0 вместе с уже установленными равенствами ф (I) = ф B) = 0 означает, что фC) = 0 и т. д. Таким образом, последовательно прове- проверяется, что ф (к) = 0 при всех к ^ л, т. е. статистика т| — полная. 2,84. Согласно критерию эффективности справедливо соотношение откуда следует, что (Г„ удовлетворяет уравнению т@) = т*. Чтобы до- доказать ее однозначность, вычислим вторую производную дг\п L(x; 0) _ о@)т'@) + (т* — т@))а'@) Так как в данном случае речь идет об экспоненциальной модели (см. решение задачи 2.46). то Dot* = о @)т'@) > 0 и поэтому 178
d2lnZ.(jt;6) * de2 < 0, т. е. каждое решение уравнения т (G) = т* яв- ляется локальным максимумом функции правдоподобия. Если бы было больше одного максимума, то между последовательными максимума- максимумами должен находиться минимум (т. е. в точках минимума, которые также удовлетворяют уравнению т(@) = х*, должно быть —^—> 0), а так как минимумов нет, то не может быть более одного максимума. Отсюда и из задачи 2.48 получаем следующую таблицу значения 0„ для некоторых моделей: Модель а, N(8.aJ) X М(ц.е2) Г, г (оду Х/Х Р@,1) Г2 Bi(k.B) X/k П@) X Bi(r.o) X/(r+X) Здесь 2.85. Для распределения N (в, о3} точка в является теоретической медианой, поэтому выборочная медиана Г» является в данном случае состоятельной оценкой 0, распределение которой, согласие решению задачи 1.32, удовлетворяет асимптотическому соотношению ?,о(Т») ~ ~2—Y т. е. для нее оЦв) = па2/?. В данном случае о.м.п. ?„ = X (см. решение предыдущей задачи) и La$n) = N (в, —У Отсюда etf (Г„; 0) = о2/о2г(@) = — = 0,637... Это означает, что при больших и выборочное среднее .К для выборки объема п' = 2п/п оценивает 9 с та- такой же точностью, как н выборочная медиана Х$,/ц+ ц выборки объе- объема п. независимо от значений 6 н аг. 2.86. В данном случае 1 " - 1 " где s2 = — 2(*' ~ xf- х = — 2 х" поэтому уравнения правдоподо- правдоподобия л din/. dO, din/. = 0 имеют вид х = о,, el = s2 + (i - е,)а. Они однозначно определяют решение 6 = (дс, s). Покажем, что в этой точке функция правдоподобия достигает максимума. Для этого пере- перепишем формулу для Цх; 9) в виде L(x; 6) = Bnes2)-"/2exp(-ml)(x; 6), 179
(x — Q,J 1 / s2 \ s где -ф(дс; G) = —— г +*o"('oi—' ) ~'n fi~' и ^Удем минимизировать по 8 = (8|, 82) функцию -ф(ж; 6). Используя легко устанавливаемую оценку lna<a— I Va>0, из которой при а — b2 следует также оценка Inй <(Ь2 — 1)/2 V* > 0 (знак равенства им*ет место лишь при 6 = 1), получаем, что i]>(.r; 8) 2& 0 (знак равенства имеет место только в точке 8 = (*, s))._ Следовательно, Цх; 8)< Bяе$2)~"/2 (знак равенства лишь при в = (х, s)). Тем самым доказано^ что о. м. п. ®„ = F|„, 82л) сущест- существует, единственна и пр^и этом 8n = (-V, S). 2.87. Вид оценки т„ следует из задачи 2.86 и свойства инвариант- инвариантности оценок максимального правдоподобия. При п-*оо I -т(8)))->Л7(О, а2(8)), где (см. задачу 2.44) 261 } 2.88. Вид оценки 8„ указан в задаче 2.84. Используя этот результат, можем записать, что 8„ = ti, где ti — несмещенная оцен- *'(т) ка 8, полученная в задаче 2.16. Отсюда имеем, что Е08„ = с„в, с„ = . Используя формулу Стирлиига для гамма-функции Г(г)~ V2г' 'е ', г-*-сю, получим с„->-1 при п-*оо, таким образом, имеет место асимптотическая несмещенность В„. Далее имеем DA = Еоб? - (Ео9"„J = в'A - d) -+ 0, п -* оо, откуда следует состоятельность (Гл. Наконец, Le(-JnFn-B)) » Af(O, Г lF)) = iV@> 02/2)(см. задачу 2.43). Рассмотрим теперь оценку Т„=~\1-т 2 I-& —ц1 (см- задачу 2.15). По центральной предельной теореме, используя решение задачи 2.15, находим, что L<{Jn)~А/(в, —-z—6М при п-+оо. Отсюда ее асимптоти- асимптотическая эффективность e[fG.; G) = -|- /^G2 = -1^- = 0,88... 2.89. Здесь функция правдоподобия и уравнение правдоподобия имеет вид 02 + 28 Т 0 Т 1 02 + 28 - Т„ = 0, Тп = -1 180
Это уравнение имеет единственное положительное решение 0„ = = VI + Тп — К которое максимизирует Цх; 0). По закону больших чисел Т„ сходится по вероятности при л-»-оо к " "? = 20 + б2, следовательно, А К о2 -1=0. 2.90. В данном случае плотность распределения наблюдений учитывая указание, можно записать в виде Я*. У\ Я) = ^ехР И*2 + У2) + где т(?) = -g- InD<7? — <7г). Отсюда уравнения правдоподобия для на- нахождения оценок $i и $2 имеет следующий вид: "| "<?2 4<7i — <?2 Но а2 = — 8- -—5", р= —^—, поэтому из предыдущих уравнений сразу получаем искомые о. м. п.: S2 = -^ 2 (X2 + V?). Р = 2 2 X,Y,/ 2 (X? + У,2). z" /-1 1 = 1 /=1 2.91. Для данной модели плотность распределения имеет вид поэтому lnL= -п!пBл)-у1пA-02)- оп"_пч,(Ти- 267-12 + Г22), где " .-1 n 1-1 Отсюда находим 3lnL nO лЭ п -(Гц — 20Г|2 + Т22) + ~.—рпгГ12 и уравнение правдоподобия приводится к виду 0A -О2)+ A +е2)Г,2-0(Г,, + Г22) = 0. Это кубическое уравнение, имеющее три корня, два из которых могут быть комплексными. Если все три корня действительны и принадлежат интервалу (—1, 1), то в качестве 0~„ выбирают тот из них, который максимизирует функцию правдоподобия L С помощью подстановки 181
0 = * + — 7"i2 уравнение правдоподобия приводится к каноническому О виду *3 + Зр„х + 2д„ = 0, Зр„ = 71,, + Та-^-П, - I, 2</„ = Г, 2 (у (Л, + Ы-1Л- Условием того, что оно имеет единственный действительный корень, является неравенство р\ + ql > 0, (см. решение задачи 2.19), которое очевидно при р„ > 0. Так как выборочные моменты сходятся по вероят- вероятности при я-»-оо к соответствующим теоретическим моментам (см. ре- решение задачи 1.38), то р„ сходится по вероятности к величине — (\ + 1 — — О2 — Л = — (\ — — оЛ > 0. Таким образом, при боль- больших значениях п уравнение правдоподобия имеет один действительный корень, который и является оценкой максимального правдоподобия 0„. Асимптотическая дисперсия оценки 0„ равна \/Ц0), где 1+0' 40 I + 30' + Т - 20Г,2+ ГИ)]= -я[(| _ Таким образом, при п-*оо 2.92. По центральной предельной теореме статистика Т„ асимпто- асимптотически нормальна с центром в 0 и асимптотической дисперсией — Da(X,Yi) = —[Е0(^2К?) — О2], поэтому задача сводится к вычислению смешанного момента Е0(А2У?). Так как в данном случае характеристи- характеристическая функция (fit, t2) = Eoe/(/'x' + /l>'') = exp j - y((? + 20/,h + /lj. TO di(i. B) I 1 1 on2 =1+20. /5 О2 Таким образом, Dt(XlY])= I + 0 и поэтому асимптотическая эффектив- эффективность оценки Т„ равна _ Л2ч2 2.93. 1) Рассмотрим функцию правдоподобия л *; 0) = П /(*/; 0) = ГBл)" 1211 2 ехр {- -!¦ 2 (*/-ii)' 2 ~ '(*/-»»)). 182
Здесь S (*< - и)' 2 ~ '(*' - I1) = ? (*' ~ *)' 2 ~ '(*( - *) Использовав легко проверяемое равенство у'Ву = tr(BY), где Y = yy', и линейность оператора tr, получим ^1 / ~у ^Л V ~\ Я t Г I V ~ ^V*^ I Из этих соотношений следует приведенная в указании к задаче формула, из которой следует, что максимизация по 8 функции Цх; в) эквивалентна минимизации по ц и 2 Функции Обозначим через ki X» корни характеристического уравнения 12 2>'M~kE*l = 0 или, что то же, уравнения |2^W~ ^2 I =^- Тогда выражение в квадратных скобках равно Я.l +... + Я.* — k — — ln(Xi...Xi) и можно записать Поскольку 2~ положительно определена и Ь— I — 1пХ > О, V^ > 0. из последнего представления получаем т|)(дг; ц, 2)=^ ^> причем ра- равенство нулю имеет место только при ц = х и Xi =...= X* = f, т. е. когда 2 = ?<*)• 2) Согласно задаче 2.4, несмещенной оценкой оу является ста- статистика pS,,, следовательно, ЕГ—^ГГ^/ = 2j- 3) Чтобы получить указанное выражение для тахЦх, 8), доста- в точно учесть, что tr (^ (x) 2^W) = tr E» = ft. = Еое'71/| = ехр ^б, --yQ'J; тогда (^ 2) 2.94. Моменты Ee(-V*) можно вычислить следующим образом. Пусть б, --yQ'J; тогда = Еве*У' = Ф (у) = ехР {fe9' + у6'}- Отсюда т2F) = DoAT, = ЕД? - (ЕД,J = т?F)(е0? - 1). Поскольку о. м. п. (й|„. ©1„) = (F, S*(Y)), то согласно свойству инвариант- инвариантности оценок максимального правдоподобия т,« = ехр(У + S2(y)/2], т2„ = Tl(es'm - 1). 183
Далее, поскольку У и S\Y) независимы (см. задачу 1.56), Е0Т|„ = О ClfVWO / 8?\ = Еое Еце ' . Здесь /„(Й = /V( 0,,—) и аналогично предыдущему \ я / Еов? = ехр(О, + 822/Bл)]. Далее имеем HnS\Y)/0\) = г\п-\) (см., на- например, решение задачи 1.58), поэтому Eoes^Y'li'2 — г|)(82/Bш)), где \|)(/) = = Ее'7*--' = (I — 2<7) ^~ (см. решение задачи 1.39). Отсюда Еое5''1^7'2 = ( 1 -) 2 . Из этих соотношений окончательно находим \ п / 2.96. Здесь -A-ln Ц*; 0) = -^- ( где ц@) = 0/'(9)//F) = 2-caW0'//F) = Ео?- Отсюда следует, что уравне- X ние правдоподобия имеет указанный вид. Асимптотическая дисперсия оценки*^ равна (т@))""', где функция информации равна «0) = - Е0^1п/E; 0) = Е„(-Ц^ + Ш) = ц'(в)/в. В частности, для распределения Bi{r, 6) среднее ц(8) = -—— и реше- 1 —о нием уравнения ц(8) = X является 6„ = Х/(г + X) (что совпадает с ре- результатом, полученным при решении задачи 2.84), а «'(О) = — д — = ==~Н7Т -TTJ- (результат, приведенный в задаче 2.43). 2.97. В данном случае КО) = е° — 1, цF) = 0/A — ет9) н уравнение правдоподобия 0 — хA—е~") точно решить нельзя, поэтому для при- приближенного вычисления о. м. п. 0„ можно воспользоваться методом накопления. Здесь (см. решение задачи 2.96) ; G) = ^-ln^; 6) = |(Г- ,@)), и искомые уравнения имеют вид 0*+, = 0„ + ?/(*; 04)/(ш(9*)), А = 0, I,... 2.98. Для записи этих уравнений (см. решение предыдущей задачи) надо знать функцию вклада 11@) = — . и функцию информации /„(8) = — Ео—=q-- B данном случае поскольку ЕЛ = пр,-@) и 2 Я'(°) = ' V0. 184
2.99. Так как здесь /@) = '/г (задача 2.43), то итерационная про- процедура имеет вид В качестве начального приближения 80 можно взять зиачение выбороч- выборочной медианы Т„ = Х1у/^+ ,), которая является состоятельной оценкой 9, поскольку теоретическая медиана в данном случае совпадает с 0. Из задачи 1.32 следует, что при п-»-оо Следовательно, eff<rn; 6) = Дг- = 0,8... 2.100. Записав функцию правдоподобия в виде Цх; 8) = е(9 — — ДГ(„))/О" (см. решение задачи 2.78), видим, что она монотонно убывает по 9 для 0 2г *(„;, т.е. принимает наибольшее значение при 9 = х^. Отсюда следует, что 6„ = Л'(„). Используя решение задачи 2.24, находим Ео8„ =—г-г-0 = 0 —-, т.е. оценка 0„ асимптотически несмещена, п+ I л+ 1 D9-82-»-0 при п->оо, т.е. оценка б„ состоятельна. Do9n=-7—, ,.ii,—-7тг- (п+ 1) {п + 2) Функция распределения Х(П) приведена в решении задачи 2.79. Отсюда имеем, что при t ^ 0 т. е. в данном случае распределение Зл не является асимптотически нормальным (модель не регулярная). 2.101. Из вида функции правдоподобия Цх; 0) = e(d +-т— xwJX Хе(ц)—0 + —\ следует, что Цх; 0) = 1 при всех 8 s Гл-(„, — —, ХA)+ —I, следовательно, любое значение 0 из этого интервала макси- максимизирует Цх; 8). Произвольная точка 7"е|Х(Л)——, ^(i) + -^-l может быть записана в виде Г = а( Х^) ^-j + A — ад Х^) + —I, a e е [0, 1]. Отсюда для нахождения несмещенной оценки 8 получаем ус- условие Е0Г = у - а + аЕД(п) + A - а)ЕоХ(,) = 8 V0. Воспользовавшись решением задачи 1.36, получим, что а = —, . 7" = -p"(^(i) + -^(л)) — средняя точка интервала. 2.102. В данном случае плотность f(x; 8) = 6~"сфг — 0)а~' X Хехр(—Ь~*{х — 0)а), х ^ 0, поэтому функция правдоподобия имеет вид 185
~т/а Цъ 0) = Ш*-. s) = b-°"a"e(Xi - О)П (*со - 0)- ^хр[-(-^~.)'\. (=i 1=1 Она монотонно возрастает на интервале — оо < 8 <; X(i; и равна нулю при б > jt(i), следовательно, 0 = х(]) — точка ее максимума. Рассматри- Рассматриваемая модель не является регулярной, но о. м. п. б„ = Х(>) в силу реше- решения задачи 2.26 асимптотически несмещена и состоятельна. Асимптоти- Асимптотическое распределение -Y<i) приведено в решении задачи 1.37 н оно не является нормальным. — \ е " 2 . d\nL n = 2 Jt,- и уравнение правдоподобия ¦ = 0 имеет единственное ре- решение 6„ = Т/п, максимизирующее Цх; 6). Данная модель является частным случаем модели Вейбулла сЛнензвестным параметром масштаба (см. задачу 2.76), поэтому о. м. п. 6„ совпадает с полной достаточной статистикой и является, в частности, несмещенной оптимальной оцен- оценкой 6. 2.104. Вид о. м. п. т„ следует из решения задачи 2.84 и свойства инвариантности оценок максимального правдоподобия. Из решения „ -, л Кп . . Хя— I задачи 2.21 имеем, что т„ = r-ц, где xi =—= несмещенная Хп — 1 Т оценка 9~'. Отсюда имеем Е^ е~1 8~'+ т. е. т„ — асимптотически несмещенная оценка. Далее получаем 1. задачу 2.43). -2) Хп ш(9) /1 1 \ Отсюда следует состоятельность т„ и тот факт, что LJjn) ~ NI —, а ). 2.105. В данном случае максимизация функции правдоподобия сво- сводится к минимизации суммы 2 [*< —в| = 2 1*@~0|, откуда сле- i-i <-¦ дует, что е„ совпадает с выборочной медианой. Здесь нельзя восполь- воспользоваться теоремами об асимптотической нормальности о. м. п. или выбо- выборочных квантилей, так как плотность f(x; 6) в точке 8 не дифференци- дифференцируема. Тем не менее, справедлив следующий результат: tF) n(q, —J, имеющий такой же вид, как и в задаче 1.32. йдем предельный закон распределения оце м -9) < х) = р.Р^^-в) <*) + (! -Рп)?4-ф<ЬХ-Щ < 4 2.106. Найдем предельный закон распределения оценки Г„ при оо. Имеем где 186
Таким образом, при п-»оо jN(O, 1) |0| >0, Отсюда еПG"„; 0)= I . , v ' \6 при 0 =0, т. с. еПG„; 0) Js 1 при 161 <1; строгое неравенство имеет место в точке 0 = 0, которая является, следовательно, точкой сверхэффективности. 2.107. Для модели Я@, 0) (см. решение задачи 2.100) 6„ = Х<„) и Di,0n = 0{л~2). Для модели Венбуллал (см. решения задач 2.102 и 1.37) при 0 < a 3SJ 1 о. м. п. 0» = Х(') и DuQ/i = 0(л~2/°), т. е. в данном случае в зависимости от значения а. дисперсия о. м. п. может иметь сколь угодно высокий порядок малости. 2.108. Здесь (см. решение задачи 2.84)_0„ = X и согласно инвариант- инвариантности т„ = Х~'. Но (см. задачу 1.39)L0(nAr) = П(лО), откуда Р^(Л = 0) = = е~м > 0. Следовательно, с положительной вероятностью при любом п случайная величина X принимает нулевой значение, и поэтому ста- статистика т, не имеет конечных моментов. В то же время ее асимптоти- асимптотическая дисперсия равна (T'(O)f /[пЩ] = @3л)~' |см. задачу 2.43). 2.109. Асимптотическая дисперсия о. м. п. т„ не зависит от пара- параметра 0 тогда и только тогда, когда функция т@) удовлетворяет соот- соотношению о?@) = (т'@)J/<@) = const. Отсюда и из задачи 2.43 следует, что для модели Bi(A, 0) соответствующее уравнение имеет вид т'@) = = с/-^0(I — 0). Решением его является функция T@) = arcsin V^ (с точ- точностью до постоянного множителя), для которой а2@) =-—-. Анало- Аналогично, для модели П@) искомая функция есть решение уравнения т'@) = -^-, т.е. т@) = л/0~~и о2@) = —; для моделей N(\i, О2) и Г@, X) Vo 4 имеем уравнение т'@) = —, т.е. т@) = 1п0. Таким образом, используя решение задачи 2.84, имеем следующие, полезные для многих целей аппроксимации: для модели Di(li, 0): /.fl(arcsin д/§7) ~ #( arcsin "\/o , -гг—J, 0„ = = Х/к; для модели П@): L^O») ~ N\ д/0, ——1,0„ = Х; / 1 \ - Г 1 " Л7' для модели ЛГ(ц, О2): ?.„Aп0„)~Л/Пп0,-^—J, 0,= -^(^-цП ; для модели Г@, X): /.u(ln 6„) ~ JV ( 1п 0, ), 0„ = Х/Х. \ Хп / 2.111. Из решения задачи 2.83 следует, что при заданном т\ = k (числе различных наблюдавшихся в выборке элементов) максимиза- максимизация по N ;$ к функции правдоподобия эквивалентна максимизации по /V функции g(U; N) = CkNN~" или, что эквивалентно, функции к-\ t(N) = 2 In (/V - i) - п In /V, N 5= k. 187
Рассмотрим разность N+i -n\n -k+\ Л/ ) n]\n Здесь функция S{N,k) монотонно убывает по Л/ при k > 1. Действи- Действительно, если ввести функцию <p(jt) = In M * о)^п (' ~ л/4- I )' О < х < Л/ + 1, то неравенство S{N,k) > S(N + l,k) будет экви- эквивалентно неравенству <р(й) < фA). Функция же ф (х) монотонно убы- убывает, так как неравенство ф'(х) < 0 сводится к неравенству (tf+l -*)ln(l -^J- ) > (А/ + 2-*Iп(. -^). которое вытекает из того, что функция \|) (у) = (у — х) In M ), у > х, монотонно убывает (ф'(у) = 1п М 1 -\ < 0). Таким об- \ у / у / разом, при заданных значениях п и k > 1 неравенства S (Л/, k) < п < <S(N—\,k) однозначно определяют целое число Л/о = Л/о (А, л). При этом Д/(Л/)>0 при Ns?,Na—\, if (Л/0) < 0, Д/ (Л/) < 0 при Л/> Л/о + 1. Это означает, что функция /(Л/) монотонно возрастает при Л/ ^ Л'о и монотонно убывает при Л/ > Л/о, если S (Л/о, k) Ф п. Если же S (Л/о, ft) = п, то f (Л/о) = / (Л/о + 1). а левее Л/о и правее Л'о + 1 значения / (Л/) < / (Л/о). Таким образом в любом случае max/(Л/) = /(Л/о), что и требовалось установить. Пусть, наконец, N k= 1. Тогда g(l; Л/) = 1/Л/"~' и значение этого выражения достигает максимума при Л/= I. Значение Л? = г\ тогда и только тогда, когда выполняется усло- условие S (t], ц) <; я (так как S (г\ — I, г\) = <х> по определению функции S), которое можно переписать в виде In (г\ -\- 1) ^ п In . В указанных асимптотических условиях приближенное решение для а получим из соотношения Отсюда — » а (а), где а (а) = , или, обозначая a~'(t) функ- функцию, обратную к а (а), имеем а.ха~[(—J. Для произвольного значения т вместо функции g (k; M) получаем функцию gm{k; N) = Скн(Сн)~", максимизация которой по Л/ приводит к следующему результату: при ц > т о.м.п. Nm определяется нера- неравенствами Sm(A?m, л) < п < Sm(Rm — 1, л), где Sm(*-l,fe) = oo; если же т) = /п, то Л?т = т. 188
2.112. Если Ц2 = k, то Л7 есть значение Л/, максимизирующее функцию правдоподобия Р*(ц2 = k) = ckmc7-lic7 = g (Щ. _ g(N) (N-m,)(N-m2) 3*есь g{N_l) = ^(Л/_т|_т2 + й). откуда получаем, что нера- венства g(N) gg(W-l) эквивалентны соответствующим неравенствам Nk ^ т,т2. Обозначим Л/о = —г~" • где Н означает целую часть. Тогда из предыдущего следует, что при N ^ Л/о функция g (Л/) воз- растает, а при Л/ ^ Л/о убывает, если число —-— не целое, т. е. в этом я случае No — точка максимума. Если же /Vo = —т—. то максимум достигается в двух точках: Л/о — 1 и No. Таким образом, в любом слу- случае значение оценки N совпадает с Л/о. В задаче 2.36 было найдено, что (при л = 2 и mi=mi = m) единственная несмещенная оценка для т (Л/) = \/N, являющаяся линейной функцией от цгЛ имеет вид цг/m2. Оценка же максимального правдоподобия х =1/Л7 = , /Гт2-| V-2 /, ец2 \-| т2 г т2 "| = 1 п = -^т- ( 1 Чг-) , где е = , и является, L Ц2 J т' \ т' } ц2 L Иг J таким образом, смещенной. 2.113. 1) Докажем сначала, что dn — достаточная статистика и воспользуемся для этого критерием факторизации, т. е. убедимся в том, что для функции правдоподобия Pd(X = х), х = (х\, .... х„), Xi = = 0, 1, i = 1,..., я, справедливо представление Pd(X = jc) = = g {dn; D) h (x), dn = 2*'- По формуле умножения вероятностей мо- f= i жем записать PD(X = х) = PD(X, = х,) PD(X2 = xi\Xt = Xl)... Р0(Х„ = х„\Х, = xu Далее имеем D — х\ — ... — х,-\ N-j+l ПРИ"=1' i-D-;-:-+-;JC<-|npHxJ=o< Из этих формул находим PD(X = x) = D'\D - *,)"... (D - х, - ... - xn-,)'XN - D)'""X Х(Л/ - ?> - A — л,))'-'\..(Л/ - D - (я-1 -х,-... -х.-,)I ~'7(Л0»- Наконец, воспользовавшись формулой а М'\М - г,)"... (М - е, - ... - е„- ,)'' = /М (М - 1)... (М - 2 8; + >) = 189
где tj = О, I, которая легко устанавливается, например, индукцией по п, окончательно получим, что Убедимся теперь, что dn — полная статистика. Для этого требуется доказать, что если ЕОф(</„) = 0 при D = О, I, ..., N, то <f(k) = О, k е @, 1,.... rain (О, я)} при всех возможных D, т. е. при k = О, I п. Поскольку Lo{dn) = H (О, N, я), предыдущее условие имеет вид min [D, п) /СЬ = О, D = О, I N. Полагая здесь последовательно D = О, D = 1 и т. д., последовательно получаем ф(О) = 0, <рA) = 0 и т. д. Пусть теперь т (?>) — подлежащая оцениванию заданная функция параметра ?>. Тогда оптимальная оценка для нее — это решение урав- неаия несмещенности = т@), О = О, 1 N. Но при любой функции Т левая часть здесь является многочленом от О степени ^ п, поэтому, если т (О) не многочлен степени ^п, то урав- уравнение (^с) решения не имеет, и, следовательно, для таких функций несмещенных оценок не существует. Пусть, наконец, т(О) — указанный в формулвровке многочлен. Проверим, что т.* удовлетворяет уравнению (*). Имеем и Еот*. = ]_ = 2 */— Здесь *-/ поэтому Еот* = Следовательно, т* как функция полной достаточной статистики являет- является оптимальной оценкой т (D). 2) Функция Ti(D) является многочленом первой степени, поэтому несмещенная оценка для нее всегда существует и имеет, очевидно, вид if = Nda/n. Функция tj(O) = (N — 1H — @J является многочленом второй степени, поэтому для нее несмещенная оценка существует, если объем выборки л > 2. В этом случае из предыдущего находим, что tJ = выборки л > 2. В этом случае из предыдущего находим, что t = <Мя-АО(ЛЪ/(я)»- 3) Чтобы получить о.м.п. параметра О, надо максимизировать величину g (dn; D) = CDN-J;fC% Но
g{da;D + i) _ (D + l)(N — n+dn- D) ~~gTd~DJ (D + 1 - d.) (N - D) ' откуда находим, что g (dn; D + I) ^ g (dn; D) при D •§ — {N + 1) — 1. n Следовательно, если число —— (/V -j- 1) не целое, то максимум дости- достигается в точке Do = |—— (Л/+ 1I В противном случае максимум до- достигается в двух точках: Do и Do— 1. Таким образом, в любом случае о.м.п. Д, = Do. 2.114. Функция правдоподобия для /-Й выборки имеет вид = цк о*, оо =772^ ехр{ (см. решение задачи 2.86), а поскольку выборки независимы, функция правдоподобия для всех выборок равна L - П = Bл^2)"техр{ -JLj. 2 n,(i, - 0л)г - -41D -) -4'I- где 1г = — 2Л15?- и = "I + •¦¦ + 1*. Отсюда следует, что показатель экспоненты не положителен и обращается в нуль лишь при Oyi = х,, j = 1,..., k, 62 = t. Тем самым о.м.п. параметров имеют указанный в задаче вид. Далее имеем (см. решение задачи 2.1) 1 * 1 * t0u2 = — 2j nito'->/ — ~ 2j ni—д— Ul ~ ^— U2> следовательно, несмещенной оценкой 0] является в данном случае статистика — О?. а — k 2.115. Учитывая выбор константы с-,, имеем с,)= Ро@A - су[ В случае модели с отрицательным параметром исходное равенство принимает вид у_= Ро (Vя 1-^—01/161 < с,\ откуда следует, что ис- искомый интервал (Л/A — Cj/^Jn), Х/(\ + ст/т/п )). 2.U6. 1) Здесь L0{G(X: 6)) = N @, 1) и, следовательно, G {X; 0) — центральная статистика. Далее получаем Ро (gi < G (X; 0) < gi) = Ф {gi) - Ф (g,) = 7 и решениями уравнений G {X; 0) = gi, g2 являются f, = X ?==Й2. V" 7 = X р^б'- ^ем самым доверительный интервал Дт(^) имеет 191
указанный вид. Его длина / = (g2 — gi), поэтому, чтобы по- построить наикратчайший интервал, надо минимизировать разность Si — Si пРи условии Ф (g2) — Ф (gi) = у. Для этого воспользуемся методом Лагранжа нахождения условного экстремума. Составив функ- функцию Лагранжа н (g>. St. ?0 = gi-gi + * (Ф {gi) - ф (gi) - v) и приравняв все ее частные производные нулю, получим систему уравнений Ф'(?\) = Ф'(&2), Ф (g2) — Ф (gi) = Y- В силу четности функ- функции Ф'(х) = I. е~"/г, из первого уравнения получим gi = — g2. Учитывая второе уравнение и соотношение Ф(— *) = 1 — Ф (*), полу- получим 2Ф (g2) — 1 = Y. откуда g2 = с,. 2) Длина / доверительного интервала &*(Х). доверительный уро- уровень у и объем выборки л связаны в данном случае соотношением / = — . Отсюда имеем, что при заданных / и у необходимое число 2 2 наблюдений п = п (I, у) = И —тгЧ. а ПРИ заданных ли/ доверитель- доверитель2 2 И —тгЧ. ный уровень v = Y(". О = ^("^—) ~ 1- В частности, со.ээ = 2,5758 и для / = 0,5 (при а = I) величина п = 106, а для / = 0.1 п. = 2653. 2.117. Плотность распределения случайной величины 7/0, являю- являющейся в данном случае центральной статистикой, равна (тг < 0 -1 поэтому т Ро @ е 6,(Х)) = Р„(а, < — < аг) = 2\xka(x2)dx = у. 9 Наикратчайший из рассматриваемых интервалов находится минимиза- цией отношения аг/а.\ при условии }хк„{х2)<1х = -^-. Метод неопреде- ленных множителей Лаграпжа приводит в данном случае к уравне- уравнениям a\kM) = a\kM). \k*{x)dx = y, о! которые в обозначениях а? = Ха,.я> аг = Х*-«..л сводятся к уравнениям Х1-«,.л/х2«,.п = ехр| —(х!-«,.» - х«,.л)} . а, + а2 = 1 - 7- Эти соотношения однозначно определяют а* и а2, а тем самым и Xal.n. x'-af.n С. с. 86, табл. 2.3]. Таким образом, оптимальный интервал имеет вид в?(Х) = (ГГ. 71) = (Г/х,-а,.я. Г/х.г.0. 2.118. Здесь центральная статистика G (X; т) = 7/т, т = О2, и ут- утверждения следуют из предыдущей задачи. 192
2.119. На основании указания имеем Ро (V" — \(Х — 0\)/S < ^ (v.n-i)_== Y. откуда следует что нижний у-доверительный интервал таков: (X— /,, „_]S/V« — I < 0,). Аналогично, из соотношения Ро (V'!— '(^— Oi)/S 2г — /v, n_i) =_t получаем верхний у-Доверитель- пый интервал: @, < X -\- /v. „_|S/V« — 1)- Наконец, центральным дву- двусторонним у-доверительпым интервалом является интервал (X ± ± /i+v S/V" — 1). Этот интервал имеет наименьшую длину среди всех у-доверительных интервалов вида (X— a^S. X-\- a^S), что дока- доказывается так же, как аналогичное утверждение в задаче 2.116. 2.120. Здесь я52/т — центральная статистика и центральным Y-доверительным интервалом является интервал а нижним и верхним ^"Доверительными интервалами — соответственно интервалы (rtS2/x?. „_, < О2,) и (О?. < nS2/j(?_Vl „_,). 2.122. Выборочные средние Л и У независимы и нормальны Л/ @п>. а?/я) и ЛГ(о"', а|/п) соответственно, поэтому ДЛ — У) = N (т, а2). Следовательно, (X — У — т)/а — центральная статистика для т; У:доверительный интервал находится, как и в задаче 2.116 и имеет вид (X - Y ± c^ai/n + с(Гт). 2.123. Поскольку ± силу независимости выборок L[ ) = ЛМО, ) = Щ0, 1), t\m + n - 2), при этом случайные величины X— Y и nS2(X) + mS2(Y) независимы (на основании теоремы Фишера). Отсюда L(tm + „ _ 2) = S(m + п — 2) и, следовательно, /„, + „_ 2 — центральная статистика для т. Соответствую- Соответствующий v-доверительный интервал строится так же, как и в задаче 2.119, и имеет вид (nS2(X) + тл(т + п — 2) 2.125. По теореме Фишера Z.(«S2(X)/9i1)a) = х2(л — 1), Цт X X S2(y)/0^2)) = x2(m — 1) и S2(X) и S2(r) независимы, следовательно, L(Vn_ 1, m_ 1) = S(n — 1, m— 1). Отсюда получаем, что центральный •у-доверительный интервал для т имеет вид / п{т-\) S\X) I n(m-l) S2(A:) / \ \ m(n-l) S2(y)/ Ц^.я-!.™-!1 m(rt-i) S2(y)/ ^ » - '¦ - - '/ ' 2.127. Так как ЩпХ/Ь^) = %\2п\ Ц2т?/в2) = %2{2т), то ЦтХ/7) — 5Bл, 2т). Отсюда, как и в предыдущей задаче, получаем, что искомый интервал имеет вид (F ,-v Y/X, 7-190
2.128. Так как PIXW > х) = РЦХ{ > х) = е~п<х ~ 0) при х ^ 6, то <Х(о<* + 0)= 1 — е~"' = у при х = —i-In A - v), t. e.(xw + -\ In A — v), X(i) I — искомый интервал. 2.129. Так как L0(Xi/Q) = R{Q, 1), то L0(XM/6) = р(л, I) (см. зада- ' чу 1.35). Отсюда при 0 ^ i < 1 Po((xw/ey < t) = ро(л'(„,/о < tl/n) = n\ о Отсюда Р) < 0 < V^ ^ 2-130. Та к как ^/) х\) ofx < Xi +v ) = V, что эквивалентно утверждению. ¦2 • 2.131. Имеем . т) € GV(*)) = PO(V^|X-0, |02- ^[^ — 0, |Q2-' < cvl)P0(z;jJL, <«S2/0l = TlY, = V- 2.132. Согласно задаче 1.59 п. 6) квадратичная форма Q = —^ГЛ№ - СО2 - -^-(^i - 00 № - е2) + -L(х2 - е2J] 1 — р L o\ fia2 02 J при любых 8 и 2 имеет распределение х2B). поэтому 7 = Л.(<э<хЬ) = Ро(еесу(*)). где GVW = {9:Q = п(Х, -О,, Х2 - 02)'S~ '№ - 9,, 12 - 92) < xhl Таким образом, G^(X) — искомая у-доверительная область для 9 = = @i, 92). Это внутренность эллипса с центром в случайной точке (Х[, Хг), граница которого задается уравнением С? = х2,2. 2.133. Поскольку LipJ)— Bi(n, 6) (задача 1.39 п. 3)), случайная величина Т принимает значения 0, 1/л, 2/и, ... , п/п и ее функция распределения f(~- g) = 2 c;,o'(i-o)"~r V п ' г = 0 является непрерывной и монотонно убывающей по 8 (при k<n): F'( — \ 0\ = — лС;_|в*A - 0)"-*-' <0, к < п. Следовательно, искомый интервал определяется решениями уравнений F(J; Q) = \—F(T — 0; 9) = A — v)/2, которые имеют указанный в формулировке задачи вид. 194
Если число наблюдений п велико, то для быстрого нахождения приближенного доверительного интервала для б можно воспользоваться асимптотической теорией оценок максимального правдоподобия. В дан- данном случае о.м.п. 6„ = X (см. задачу 2.84) и функция информации ('(9) = [9A — б)] (см. задачу 2.43), поэтому искомый интервал имеет вид (X ±суЛ[Х(\ — Х)/п). 2.134. При больших п имеем = Р„((9 - Г,) (9 - Т2) < 0) = РВ(Г, < 9 < Г,), где Таким образом, G"i, Тг)—искомый приближенный 7-Д°веРительный интервал. Если пренебречь членами порядка \/п, то этот интервал сводится к интервалу (X + су-^Х(\ — Х)/п), полученному в предыдущей задаче. 2.135. Поскольку L0BV"(t(X) — т@))) ~ Л/@, 1), при больших п tf)-T@)| <ст) = Р„(т(*) %г < т(9)< т(Х) + -! что эквивалентно утверждению. 2.137. Решение данной задачи аналогично решению задачи 2.133. Здесь L(nT) = П(лб), величина Т принимает значения ft//!, k = 0, I, 2, ... , и ее функция распределения непрерывна и монотонно убывает по G: Поэтому искомый интервал определяется решениями уравнений F{T; G) = 1 — F(T — 0; G) = A — у)/2, которые имеют указанный вид. При больших п (согласно задачам 2.84 и 2.43) справедлива аппроксимация для о.м.п. 0„ = X: г ^(Х -0)\ ~ ЛГ(О, 1), откуда следует указанный вид приближенного интервала. 2.138. В первом случае имеем 7* 195
Отсюда следует, что М max ( 0, л[Х ^—Л I , ( л[Я -\ — j ) — ис- искомый приближенный у-доверительный интервал для 0. Аналогично, используя другую аппроксимацию, имеем V ж Pa(-fn\X - 01/л/О < Су) = Р0Р - ОJ < с?9/я) = Таким образом, (Гь Гг) — другой приближенный у-доверительный интервал для 6. С точностью до членов порядка \/п оба эти интервала эквива- эквивалентны интервалу (X ± с^л/Х/п), полученному в предыдущей задаче. 2.140, Из решения задачи 2.96 следует, что искомый интервал имеет вид @„ ± с,л/§л/гщ'@„)), где 0„ — решение уравнения ц(9) = Я, а ц(9) — теоретическое среднее распределения. В случае распределения Bi(r, 8) этот интервал принимает вид ( — ± с7\/ г—). V r + X V nlr + XfJ г + Х nJ + Xf 2.141. Искомый интервал имеет вид F"„ ± cv/Vn/(ffn)), где в дан- данном случае i(8) = А/92, б„ = Х/Х. В результате получаем интервал Если воспользоваться аппроксимацией ?0(-\/Я.пAп 0„ — In 8)) ~ N@, 1) (см. решение задачи 2.109), то будем иметь V « Р0(л[Хп\\х\ б„ — In 91 < су) = Р(\п ё„ ^=r< In 0 < In б„ + т. е. другим приближенным 7"Д°веРительным интервалом является интервал (ХХ~^e~ci'^", Х^'е^^'1"), который с точностью до членов порядка 1//2 совпадает с предыдущим. 2.142. Согласно решению задачи 2.109, имеем [1 ст |/2 — 2(^' — иJ ¦ Полученный интервал сводится к интер- п i = i -I валу б„(| ± Су/л/2/i), если пренебречь членами порядка \/п и восполь- зоваться ста //) рр дартной аппроксимацией L0(9n)~VV( 0, -5—) (см- зада- задачу 2.88). 2.143. Из решения задачи 2.87 следует, что искомый интервал, основанный на стандартной аппроксимации для о.м.п., имеет вид (т„ ± с,а,(б„)/лМ), где т„ = ф( *° J*) . §» = (^".. «2,,) = (^, 5), ст?( (см. задачу 2.87). 196
2.144. В данном случае модель определяется (Л/ — 1)-мерным па- параметром в = (pi, ... , Рд/_|) (см. задачу 2.63) и функция правдоподо- правдоподобия выборки X — (Xi, ... , Х„) равна N N - 1 ЦХ; 0)= П Р? = ехр{ 2 v,-ln ^ + ; = 1 1У = | ' -Pi -...-Рд/-1 ¦f/iln A — р, — ... -р„_ А где V; — число членов выборки X, равных a,, j = 1, ... , Л/. Отсюда непосредственно находим, что решение уравнений правдоподо- правдоподобия — = 0, / = 1, ... , /V — 1 (т. е. оценки максимального правдо- правдоподобия параметров р , рн-i) имеет вид р; = —'-1 y= i_ п N— I. Информационная матрица этой модели /(8) указана в зада- задаче 2.45. Согласно асимптотической теории оценок максимального правдоподобия, /-0(Л/лE'„ — в)) ~ Л/@, 1~\0„)) при »-и» и поэтому io(QnF)) >- х2(Л/ — 1), где квадратичная форма N — 1 <2„(8) = пф„ - е)'/(§„) (е„ - в) = п 2 (Р' - Р') (Ps - Р'Урн + Отсюда Л/- 1 2 (i г = 1 ъ - P,f '/Pr r,s = N = 2 г = = 1 (V,- 1 2 К - "P'Ov, < Xv. а/ - i) ^^ V- г = 1 ' Это означает, что искомая асимптотическая v-доверительная область для параметров р\, ... , р« имеет вид =\(p ры): 2 (v,-np,)Vvr<x2»./v-i> 0 •¦ г = 1 i= I N, 2 P. = В данном случае эта область представляет собой пересечение внутрен- ности W-мерного эллипсоида 2 ^-<Xv.«-i c гиперплоско- стью pi + ... + Рл = 1. принадлежащее зоне 0 < р; < 1, i = 1 /V. При N = 2 полученное решение аналогично результату задачи 2.134. 2.145. По теореме Фишера (см. также задачу 1.56) X и S2 незави- независимы, следовательно, независимы также X — Х„+\ и S2. Но ^ _ х„ + i) = Л/( 0, Ог———) , a LJ —г-) = х2(" — О- Следовательно, 1 п- 1 1 + 1 отношение Стьюдента /„ _ , = "Д/ " , , -"+ ' . Отсюда имеем 197
что и требовалось показать. 2.146. Для приведенных данных х = 4,196; 5 = 0,226; /0.975; 4 = = 2,776; следовательно, искомый интервал C,43; 4,96). 2.147. При больших п V « Ру^Ч^- < <•<) = Р^ - «Г < 2nc?) = = Р(л2 - 2л(| + с?) + ?2 < 0) = Р(л, < я < л2), где Л],2 = П],2A) = I + с2 Т cYV2? + с?. В данном случае сОэ = 1,645, поэтому искомый интервал A31; 189). Глава 3 3.1. Имеем две группы данных с частотами hi = 2048 и /i2 = п — — fti = 1992. Для проверяемой гипотезы Но : р = q = 1/2 и ожидае- ожидаемые частоты равны пр = nq = л/2 = 2020. Статистика критерия X2 = 2 — ^— = 0,776. При больших п эта величина распределе- распределена приближенно по закону хи-квадрат с одной степенью свободы. По таблице квантилей распределения %2 находим хо.эз; i = 3,84; хо,9; i = = 2,71. Поскольку 0,776 меньше значений этих границ, можно считать, что данные совместимы с гипотезой Яо. 3.3. Статистика критерия X2, = 2 tLl—— 11,13 сравнивает- сравнивается с критической границей хо.эз; г = 5,99. Поскольку 11,13 > 5,99, ги- гипотеза Но отвергается. 3.7. Ожидаемое число показаний часов в каждом интервале равно пр, = 500/12 = 41,67. Статистика критерия равна Х\ = 10,00, что меньше критической границы Хо.э-.п = 17,3, т.е. согласие хорошее. Гипотезу Wo не отклоняют при уровне значимости а < 0,55. 3.8. Здесь статистика критерия XI = 0,47, хо.э; з = 6,25, т. е. согла- согласие при а ^ 0,9 хорошее. 3.10. Границы интервалов находим из уравнений 1 — е~х' = = 1/4, e~xi — e-*' + i = 1/4, / = 1,2. Имеем х, = 0,288, х2 = 0,693, дз = 1,386. При группировке по этим интервалам получаем вектор час- 4 (я._Пр.\2 тот h = (9, 9, 17, 15). Статистика критерия Х\ъ = Ц— — = 4,08 ,= i nPi меньше критической границы хо,О;3 — 6,25, т.е. гипотеза #о не отвер- отвергается. 3.11. Поскольку Р(| <: x\Hq) = 1 — е~'/а, вероятности р,@) = = Р(| е Ej\M0) в данном случае равны Pi(B) = е-^~х)а/\\ — е-а/0), '\ = 1, ..., N — 1, рл(В) = е~^-^а'й, 198
и уравнение для нахождения мультиномиальной о. м. п. 6„ имеет [1, с. 116] вид Л/ . N— I 2 А,р;(О)/р,@) = 2 АДу - 1 - je-o/0)/(l - е-°/0) + (Л/ - l)/i,v = 0. j = i ;=i Обозначая 2 = е~а/\ отсюда находим z( 2 /А, — АИ = 2 /А/ — п. Следовательно, о. м. п. г„ = ( 2/А/ — п)/{ 2/А; — Ад/), а соответ- соответствующие оценки вероятностей рДО) имеют вид Р; = ZJvT'U - 2л,), /^ 1 N -'П'рл, = Z&-'. В соответствии с общей теорией [1, с. 115—116], если при больших значениях п выполняются условия /г, 5= 5, / = 1, ..., N, то соответству- соответствующий когда ющий критерий согласия -/отклоняет гипотезу Яо тогда и только тогда, N "ft = 2 (Aj - npif/(npi) > х'-а. Д/-2, / = l где а — выбранный уровень значимости. Для данных задачи 1.21 при указанном выборе параметров N к а имеем /г, = 28, Лг = 16, /гз = 6, 2„ = —^ т^- = -г^- и значение ста- 2п — h\ \о тистики Ю, = 1,96... Поскольку хо.э; I = 2,71, при уровне значимости а ^ 0,1 гипотеза Но подтверждается данными. 3.12. Здесь имеет место полиномиальная модель с N = 4 исходами и вероятностями р\ р<, имеющими при нулевой гипотезе Wo указан- указанный вид, т. е. являющимися функциями одного неизвестного параметра. 4 Для оценивания параметра G надо решить уравнение 2 А;р/@)/р/(8) = |=| = 0, которое в данном случае принимает вид Ai hi + /г3 _Aj_ _ . 2 + 9 1—0 + 6 ~~ ' Это уравнение сводится к следующему. ф@) == п02 + (h, + 2А2 + 2А3 — Л,H — 2/г, = 0. Поскольку ф@) = — 2hi < 0, фA) = 3(/г2 + Аз) > 0, последнее урав- уравнение имеет в интервале @, 1) единственный корень 0а. Следовательно, в данном случае критерий согласия х2 при уровне значимости а. откло- отклоняет гипотезу На лишь в случае 2 А?/(ПР/(О„)) - П 1=5X1-*;,, 0„)) + Л5/(„) > tfl-*:2 + '0/4. 199
3.14. Используем критерий согласия х2- Оценка параметра 9 равна б" = 2 'Л/ = 3,870. Вычисляем оценки вероятностей р, = е~в —, / = ю __ Л 2 = 0, 1, ... , 10, и значение статисики А! = 2 —'—т.— — 13,05. Число степеней свободы k = 9. Поскольку хо.95.9 = 16,9 > 13,05, гипоте- гипотеза Но не отвергается. 3.15. Здесь 9=1,54, Х\ = 7,95, 6 = 6, Хо.9:б=Ю,6. Согласие имеет место. 6' 3.16. Здесь 9 = 0,928, р, = е~й-^, i = 0, 1, ..., 5, Xl= 2,172, k = 6, X о,95; 4 = 9,49. Согласие хорошее. 3.17. Для L(!) = BiB, 6) вероятности исходов имеют вид р,(8) = Р(| = 0) = A - бJ, р2F) = РA = I) = 26A - 6), Рз(в) = P(S = 2) = б2. Отсюда уравнение для нахождения оценки параметра 0 имеет следу- следующий вид: й + 5A + 0 а сама оценка §„ = (А2 + 2Лз)/2п. В данном случае ft, = 476, А2 = 1017, й3 = 527, п = 2020, поэтому 0„ = 0,513. Далее имеем Я = 2 (А/ ~ лрДОРЛлрД.» - 0,116; ; = | результат надо сравнить с х?-*о i- Поскольку хо.з; i = 0,148, при любом уровне значимости а ^ 0,7 гипотеза принимается. 3.19. Подставляя в формулу цх*\Р) = п 2 (ш - рЧ?/рЧ + 2 р,A - л)/р? Л/ значение р = р',"' = (р{°', ..., р(/?') и учитывая равенства 2р? = 1. 2 Р; = 0, найдем '=' n Е(^1рм) = /V - 1 + 2 Р//Р/ Далее, так как Л. = 2 p{'"Vp?s = 2 р? 200
K22 = JV + 0A/л/л). Км = N + 0A/л/я), Ki2 = 0A). Отсюда, используя формулу ЩХ\\р) = 4— (Язг — Я||) + 2 "~ (ЗК22 — 2Я21Я11 — - К2,), 4 2 Р?/р? найдем 2 /¦¦=1 3.20. Так как A - М"Т = exp{nln(l - pW)| = expj- = ехр(-р - р6,/«|/4 + 0(/i-')) = e-'\ 1 - P N то, подставляя это разложение в формулу Е(цо[Ма>) = 2 С — Р/"')". / = | получаем искомое представление для среднего. При анализе дисперсии будем исходить из формулы Оцо = 2 2 [A - Pi - PUT - A - P/)"(l - Р/)"] - 2 A - РуJ" + Ецо. Асимптотика второй суммы при гипотезе Мл) находится так же, как и выше, и с точностью до главного члена она равна Л/е~2р. Оценим общий член первой суммы. Имеем A - р, - р,У - A - р,)"A - PiT = A - Pi - Pi)" - A - Pi - Pi + PiPiT = = exp|-n(p,- + Pi) - |(р; + Pif + O(N-2)) - exp(-rc(p, + p,) + np,Pi - - |(P< + Pi? + O(/V)] = expl-nfa + p,) - |(Pi + РЛехр(О(ЛГ2)] - expfnp.p, + O(N~2))]= - np.pie-""'-"!" + O(/V). Отсюда первую сумму можно представить в виде N В этом разложении второй член есть 0A), а 2 Pie ~ "Р| = е ~р + оA). /=' Таким образом, все выражение равно — Npe~Q" -\- 0A). В результате имеем 201
О(ц0|Мл>) = - /Vpe-2" - We-2" + Ne~> + 0(Л/1/2). 3.21. Применим критерий однородности х2- Статистика критерия критическая граница критерия х^ —«: (s —ix*— i) = Хо.э;з = 6,25. Таким образом, XI < Хо.9:з, согласие хорошее. 3.23. 1) Рассмотрим разность Д;,- = V,, — Vj.v./n, /, / = 1,2. Не- Непосредственно проверяется, что все суммы Дл -(- Д/2 и Дiy -f- Д2у равны 0. Например, л i л i v>-v-i vi-v.2 v, o|| -J- A]2 —— V|| -r- V|2 — — =: V]. — [V | -p V 2) -= П П П = Vi. — Vi. = 0. Таким образом, модули всех четырех величин Д,,- равны и поэтому 2 А?/ 2 1 = n3A?i/(vi.v2.v.,v.2). Далее имеем [V|j "I /Vlj V|2\ — (v.| + v.2) — (vii + vi2) = v.iv.2( 1; V.| J \ V., V.2/ окончательно получаем V,.V2. \ V., V.2 2) Заметим, что случайные величины vn и vi2 независимы по усло- условию и Z.(vi,) = Bi(n.j, р) при некотором р е @, 1), / = 1, 2, если спра- справедлива гипотеза Но. При п.\, Пч -*¦ оо по теореме Муавра — Лапласа L(vi/) ~ N\njp, tijpq), q = 1 — p, или H\\j/nj) ~ Л Отсюда Таким образом, при гипотезе На случайная величина V|| X асимптотически нормальна iV@, 1). Но Гп2p и при гипотезе Но имеем -^--S-p, следовательно, ~\/— >¦ 1. От- П ' V|.V2. сюда следует, что при гипотезе Но предельные распределения случайных величин 2л и ?„|Пг совпадают, что и требовалось показать. Наконец, при рассматриваемой альтернативе среднее значение раз- 202
Vll V12 - ности равно pi — 02 > 0, следовательно, проверяя Но про- тив Hi, критическую область разумно выбрать в виде (Z, > /„]. По- Поскольку P(Zn > <ol//o) « Ф( —/„), при уровне значимости а критиче- критическая граница имеет вид /„ = — ф-'(а) = Ф~'A — а) = щ-а. ¦ Замечание. Так как при любой гипотезе, задаваемой вероят- вероятностями pi, p2, при tit, 12 -*¦ °° 2L _ 22.) „ N(px -P2,H? I2SL\ п2 ) то, рассуждая аналогично, можно показать, что для «близкой» альтернативы М"': (р\ — p2)/VPi'7i = а/л/п, а Ф О, Этот результат позволяет вычислять мощность критерия при таких альтернативах. 3.24. Так как (см. задачу 1.54) Иуи ..., vw|vi + ... -\- \N = п.) = М(п; р\, ..., Ри) N при Pi = б// 2 б;, / = 1, ..., Л/, то гипотеза На эквивалентна в данном случае гипотезе о равновероятности исходов в полиномиальной схеме. Следовательно, критерий согласия %2 имеет вид Замечание. Обозначим через v, S2 = —г- 2(v/ — vJ выбо- /-I рочные среднее и дисперсию; тогда статистику Х\ можно записать в виде Х\ = NS2/v. При гипотезе Но теоретические среднее и дис- дисперсия наблюдений равны, поэтому, если гипотеза Но верна, то S2/v 4- 1 при п. -*¦ оо или Х\ 4. N. 3.25. 1) Так как в данном случае совместная плотность распреде- распределения порядковых статистик X(i) Х(„) есть g(xi х„) = п\, 0 < Х\ < xi < ... < х„ < 1, (см. задачу 1.31), то по формуле полной вероятности безусловное рас- распределение вектора х = (xi и„+|) имеет вид Р(ч, = kit i = 1 п fe|! ...,xn)dx\...dxn= , ,т'"" , \dxi\dxi... \ П(^ — xt-K)k4ixn k,\...kn+li J ^J J^/-, (здесь fe[ + ... + fert + i = m, x0 = 0, л„+, = 1). Интегрируя последо- последовательно по х„, xn-i и т. д. и применяя формулу 203
получим (/г„_,+й„ + <!л + 1+2)! "¦ ( _ т.п. _ , ~ (m + л)! -lc"'+"J С другой стороны, при к\ + ... -\- к„ + , =т и произвольном ре (О, I), q = 1 —р, "(si + •¦• + 5n + i = т) л + I П (/>*'?) = ^г^п^гТт = (с«" + <»Г'. поскольку L (I, + ... + ?„+,) =В,• (п + 1,р) (см. задачу 1.39 п. 5)). Таким образом, если справедлива гипотеза однородности Но, то 2) Вычислим л+ I P(so(n, m) = k) = Р( 2 ' (ii = 0) = fclti + ... + бл + i = tn\ = /=| ' = т). Чтобы найти числитель этого выражения, зафиксируем номера тех величин, которые принимают значение 0. Это можно сделать С* + 1 раз- различными способами. Тогда числитель можно записать в виде С„+|Р(|, > 0,1=1,..., л + l-k,li = 0, у = л + 2 -k п+ 1)Х XP(si + ... + ln + i = mil, > 0, i= 1 л + 1 — k, Ъ, = 0, (см. указание 2). Здесь при /• = 1,2, ... Р (?, = г) = Р (|, = г)/р (|, > 0) = -*—1- = р'" '<?, т. е. L (I,) = i (Б, + 1). Отсюда L (|, + ... + i) = L (|, + ... + Ь + s) и поэтому Р (It + - +i = m) = Р (I, + ... + ?s = m -5) = CST-'iO1"-'. Окончательно можем записать, что С ft f*n — ft //^я Таким образом, L (so(i, m)) = H (n + 1, n + m, n). Используя формулы для моментов гипергеометрического распределе- распределения, получаем, что при гипотезе На 204
_ , , n (n + 1) ^ , . tnfm — \)n(n 4- 1) Eso(n, m) = —Ц-!—-, Dsa(n, m) = -.—) ... ,—¦—Vr . n -\- m (n -\- m) \n -\- m — 1) Если n, m -> оо так, что т/п = p > 0, то Es0 (л, m) = —-^ (- О A), Dso(fl, m) = "f1 a + О A). 1 + P I1 + P) 3) Из решения предыдущего пункта следует формула для Р (so(n, т) = ft), приведенная в указании. Пусть ft = (п + 1)р -j- t -\jnpq, \t\ < с < оо. Тогда Innpq n — k = (m — 1) p — ^[пpq и поэтому Vp наконец, п = (п + т) р, следовательно, Ь(п;п + т, р) =—1? n(/t + m)pq ' Объединяя эти оценки, получаем Но это означает, что если ft = ——; \- x-Jnp2/(l + рK, |л:| ^ с < оо, т. е. имеет место локальная {а тем самым и интегральная) нормаль- нормальная предельная теорема. " + 1 E[so(n, га)|Я,]= 2 Р(я, ^~0|//i). I = 1 Рассмотрим сначала слагаемые при (' = 2, ..., п. Вероятность того, что при фиксированных X{i_\)=x\ <.XV)=x2 блок В, пуст, равна [1 — F (x-i) + F [xCjf, поэтому по формуле полной вероятности = 01//.) = Для (' = 1 и (' = n + 1 эти вероятности будут иными, но если их выражения разделить на п + I, то в пределе они дадут нулевой вклад в сумму и, следовательно, им можно не уделять внимания. Суммируя эти выражения, в результате получим 205
+ F (A-,)f(l - л-2 + x^f-Чхг + е„, где Еп < 2/(/г + 1). Сделав замену переменных xt = уи х2 = у\ + перепишем эту формулу в виде е- Переходя здесь к пределу при п, т -*¦ оо, т = рп, и учитывая, что функция F дифференцируема, получим Теперь (см. указание) 1 = = A + р))- + р/ М „ 1 +P/W ' так как \/(.t)rf.t = I. Знак равенства имеет место лишь в том случае. о когда функции g\[x) и gi{x) пропорциональны. В данном случае это означает, что 1 + р/ М — const, т. е. / (х) ^ const. Но так как f (x) — функция плотности, то I (х) = 1. Таким образом, если справедлива альтернатива, то неравенство будет строгим и поэтому при альтернати- альтернативе статистика sa{n, m) асимптотически стремится принимать большие значения, чем при гипотезе //0. Следовательно, критическую область для гипотезы 1/0 разумно задавать в виде {so(n, га) > с]. При уровне значимости а критическая граница асимптотически имеет вид 3.26. ИмсемА2 = лС2— 0 = 8.09 < Уооз-4 = 9,49. Гнпоте- \^ v,y, / за не отвергается. 3.28. I) См. решение задачи'3.23 п. 1). 2) Пусть (X,, У|), ..., (Х„, У„) — независимые наблюдения над AЬ |2) и X = (X , Х„), Y = (У|, ..., К„). Тогда выборочные средние А'= V [ — V | = — , Y= —— , выборочные дисперсии S? = 206
наконец, выборочная ковариация S — ' У X У ~XY = V" V|V ' i = i Отсюда (см. решение задачи 1.38) Теоретический коэффициент корреляции VPlii = i) р F."^~о) Р(Б, = 1) Р(|, = о) Р(АВ) — Р(Л)Р(В) Но р{АВ)- Р(Л)Р(й) = = Р(В) Р(Щ [Р (/1В)/Р (В) - Р (ЛВ1/Р (В)], откуда следует второе представление для р. 3) Рассмотрим случайную величину s» = ,-=i Так как при гипотезе На = E(Xt - Р(А)) Е(У,- - Р(В)) = 0, - Р(В)) = E№ - P(A)f(Y, - Р(В)J = _ = Е (Xi - P(A)f Е (У,- - Р(В)J = D Xt D У,- = Р(Л) Р(Л) Р(В) Р(В), то ?я представляет собой нормированную сумму независимых одина- одинаково распределенных случайных величин. Следовательно, на основании центральной предельной теоремы при п -*¦ оо /.E„)-^Л/@, 1). Теперь, так как 2 № - л) (У,- -ч=2№: '=' -п(х- рСа))(? то на основании п. 2 задачи можем записать Zn в виде _Г п'/2(Х — Р(А)) У —Р(В)  Г Р(Л)Р(Л)Р(В) Р(ВI  L " л/Р{А) Р[А) ->/Р(В) P(B)J L Х(\ - X) ?(\ — У) J По теореме об асимптотической нормальности выборочных моментов при п -> оо 207
— р — р а согласно закону больших чисел X -*¦ Р(Л), Y ->¦ Р(В). Следовательно, при л —>• оо ¦о, Х(\ - X)Y\ -Y) F— Р(Д)) л/'Р(/1)Р(Л))Р(й)Р(В) и поэтому предельные распределения Z,, и g,, при гипотезе Яо совпа- совпадают. Итак, при гипотезе //о имеем р = 0, а при альтернативе Н\ р > О и, следовательно, 1п -*¦ + °° при л-»- оо. Поэтому естественно рас- рассматривать слишком большие значения статистики 2„ как свидетельство в пользу альтернативы. Другими словами, если проверяется гипотеза Но против альтернативы Ht, то критическую область разумно выбрать в ви- виде [Zn > /с). Поскольку при выбранном уровне значимости а критическая граница имеет вид /„ = — ф-'(а) = ф-'A — а) = и,_а. Замечание. Рассуждая аналогично, можно показать, что если «близкая» альтернатива задается условиями /Л"': Р(ЛВ) = Р(Л)Р(В) + О(п-1/2), р = р<"> = ап-"\ а Ф О, то L (Zn\H\")) -*¦ N (а, 1) и, следовательно, при а > 0 мощность построен- построенного критерия удовлетворяет предельному соотношению Wn(H\n)) ->- Ф (а + иа). (97 40\ / 360 ~ W v 360-82-442 137-305 ~ ~ —3,86, а Х2„ = Zl ~ 14,89. Так как хо.9999. i = 10,8, то гипотеза о независимости признаков должна быть отвергнута (вероятность со- совершить при этом ошибку меньше Ю). В то же время данные опро- опровергают и гипотезу Ни поскольку 2Л < 0 (этот факт можно интерпрети- интерпретировать, например, как отсутствие дискриминации в отношении женщин при приеме в вуз). 3.S0. зд» z. . (? - UV^F- "* ¦ »" « - ~ 29,70. Следовательно, на основании полученных данных (см. реше- решение предыдущей задачи) гипотеза Яо отклоняется. Далее, так как Zn > > Ф~'@,9999) ~ 3,72, то (см. решение задачи 3.28 п. 3)) данные под- подтверждают гипотезу Hi. Вероятность ошибки отклонить Но в пользу Hi при этом меньше 10~4. 3.31. Здесь речь идет о проверке гипотезы случайности Но [1,с. 133]. В данном случае число инверсий Те = 0 и вероятность получить та- такое значение при гипотезе Но равна (8 !)"' ~ 0,25-10"*. Следователь- Следовательно, при любом разумном уровне значимости гипотеза Но отвергается. 3.32. Обозначим Т'„ = б(т„ ——-) л~3/2; тогда характерис- характеристическая функция 208
При |/| ^ с < оо, п-у оо и любом k = 1, ..., п expFi7ftrt-3/2) - 1 = eitkn- - 18/2ft2n + 0{k3n~V2). Отсюда I '-', c,«,,-v . 3,7 (#¦ - 1) &'(/•- l)Br- I) ~S, " —^ ^ + Переходя к логарифмам и используя формулу In (I +x) = x- — + 0 (х3), х получим откуда и следует утверждение. 3.39. Здесь статистика отношения правдоподобия W = il: л'! = П chhi - 0iL"x /П rf'oj'd - _ re,(i-Go)f/ 1 — о. \*я " ~ Loo(i-e,)J \~Y=%) • ' ~ ,.f, '¦ и при 0| > 9о величина — тгт> '• Поэтому неравенстио 1~^ с 6оA — Э|) эквивалентно неравенству 7^/. Пусть а — заданная вероятность ошибки первого рода. Определим целое число ta из условия Если здесь а = а', то искомый критерий является перандомизированным и имеет вид Х'а = [Т ^ <о). Так как Lt(T) = Bi(kn, Q) (см. задачу 1.39 п.З), то вероятность ошибки первого рода этого критерия равна ЩХ'ы\ во) = Ро„(Г 5* fa) = a' = a, а мощность такова: №(*;„; 0,) = Р0,(Г 5*/«) = 2 Cfnor(l-O,)*"-M. m = la Если же в (*) имеет место строгое неравенство (а. < а'), то критерий Неймана — Пирсона является рандомизированным и задается критиче- критической функцией 209
I при T^zla+ 1, а — а" — при Г=/а а —а" О при Т < U — 1. Его мощность U%;; 0,) = Е0|ф^Г) = Р0|(Г > г.+ 1) = 2 са о г (i - of - - - + (О - « m =/„ + 1 В этом случае (при а < а') можно также использовать нерандомизи- нерандомизированные наиболее мощные критерии Х\а' = G" ^ /„) и Х'а" = (Г ^ /а+ Ij с уровнями значимости соответственно а' > а и а" < а. 3.40. При п-*-оо по теореме Муавра—Лапласа LJJ)~N{knO. knQ{[ - 0)), поэтому условие (*) для определения критической границы ta можно заменить приближенным условием Отсюда следует указанный вид критической области. Далее имеем -Л! Ы (№ 0 1 и -л/ °"( V о^)(| _ oW)@' ~ Оо) ~ й" V ov>( что эквивалентно второму утверждению. 3.41. Критерий строится по той же схеме, что и в задаче 3.39. Здесь достаточная статистика имеет вид Т= 2 ^ и ПРИ эт0^ L,(T) = П(пО), i = i 1{Х)= [-77—J еп1-°°~°'\ Для определения критической границы U при за- V Оо / данной вероятности ошибки первого рода а имеем условие m При а = а' критерий имеет вид Х'а = [Т ^3 /о), а при а < а' он является рандомизированным-и его критическая функция ць.{Т) имеет такой же вид, кап и в задаче 3.39 (с учетом обозначений, принятых в (*)). В любом случае мощность вычисляется по формуле Если п->-оо, то ?о(Г)~ W(nO, nO), и рассуждая как и при решении задачи 3.40, имеем, что асимптотическая форма критерия имеет вид 210
G' ^ nOa — Uv^fnOa], а его мощность при близкой альтернативе 0( = OV = = Оо + Р/-\/й, Р > 0, удовлетворяет предельному соотношению lim ^(OV1) = Ф (-s— + „Л 3.42. Наблюдаемая случайная величина X имеет геометрическое распределение fli(l[0) и статистика отношения правдоподобия 1(Х) — ( 6, \х 1—0, 1 ~ ( ~7Г~] ~i 7Г~- Следовательно, нерлвенство / ^ с эквивалентно нера- \ Do / 1 — Но венству X > ( и для определения критической границы / = /„ имеем соотношение а. = 05 = Poi* >Ц= 2 °"A - О») = Ой", откуда находим („ = 5. Таким образом, в данном случае критерий Неймана — Пирсона имеет вид Х'а = [X ^ s] и его мощность 3.43. Статистика отношения правдоподобия 1(Х) = I -^-1 X , Т = 2^'. ioB?"/O) = х2Bя) (см. указание). Если Go<Gi, то неравенство 1~^с эквивалентно неравенству Т ^ I и для определения критической границы t = ta при уровне значимости о имеет соотношение « = Ро„G- ^ /„) = Ро„B77Оо > 2/„/0о) = P(xi» ^ 2/о/00). Отсюда 2/о,/0о =xi-a.2n и, следовательно, оптимальный критерий имеет вид Х'ъ = \Т > -^-у}-а.чп V Его мощность равна W@i) = Ро, (Т" > -^-Х?-..2») = Ро,BГ/в, > ОоХ2-..2„/О,) = где F2n(/) — функция распределения закона х2B")- Аналогично, при 00 > 0i оптимальный критерий имеет вид Х'а = IT ^.-^-%1.2„\ и его мощность 3.44. В данном случае множество критических значений наблюдения определяется из условия которое эквивалентно условию (с — 1 )х2 — 2сх + 2е — I ^0. Если е=1, то неравенство выполняется при х^ 1/2. Это означает, что критерий Х'а = [X ^ 1/2) имеет уровень значимости 211
и его мощность равна I \ If" dx 1,1 ,1 Положив с = 2, получим неравенство (х7 — 2J ^ 1 или 1 ^ х ^ 3. Это означает, что критерий Х'а = A < X <: 3) имеет уровень значимости .3 а= РоA < Л1 < 3) = — \ \2 = — (arctg3 — arctgl) и мощность 3.45. Пусть X = (Х|,..., Л1,,) — выборка из распределения ?(?). Если хотя бы одно \ХЛ > а, то при гипотезе //о это невозможное собы- событие, и поэтому в данном случае Но следует отвергнуть. В остальных слу- случаях, т.е. при 71,'1 s= max IXI^a, решение принимается на основе I < i < п анализа статистики отношения правдоподобия СТГТ ' -*'2'1/ ' W \1 ft2' = 2 X,2. В данном случае неравенство / ^ с эквивалентно неравенству 7i,2) и поэтому искомый критерий имеет вид Х'а = (ft"> a) U (Л11 < а, П2) < /а) = {71," > а либо П2) < Ц где при уровне значимости а граница ta определяется из условия S-S (так как при гипотезе На событие G(„" ^ а) достоверно). Для мощности этого критерия имеем, очевидно, оценку Я,) ^ Р(П" > а|Я,) = 1 - P"(U,| Следовательно, при любом значении а вероятность ошибки второго ро- рода |5 удовлетворяет неравенству * Фихтенгольц Г. М. Курс дифференциального и интегрального исчисления. М., 1960. Т. 3., с. 392. 212
„<[,-*,(-?)]«. Если п—»• оо, то на основании центральной предельной теоремы ЦРР\На) где Следовательно, для определения tn можно использовать приближенное ^/Л na2\ / равенство а ~ Ф1 I /« 5"")/ V —Тк/1 0ТКУда 3.46. Обозначим через Т„ число положительных исходов в л испы- испытаниях; тогда Lp(Tn)— Bi{n, р) и при гипотезе Но событие [Т„ > 0) не- невозможно. Следовательно, в рассматриваемом случае критерий естест- естественно задать в виде X, = [Т„ > 0), т. е. при наблюдении Т„ = 0 при- принимаем гипотезу Но, а в остальных случаях — гипотезу Н\. Тогда ве- вероятности ошибок соответственно равны а = Р(Г„ > 01//о) = 0, р = Р(Г„ = 01//,) = 0,99". Для определения п имеем следующее условие: 0,99" ^ 0,01, откуда п > 454. 3.47. Здесь статистика отношения правдоподобия приводится к виду - 63)}. поэтому, если 0] > Qo, то критическое множество Xfa имеет вид Xfa =\х > Оо --^-««1. а мощность равна ^ (^Ч0, - 0о)+ и.) > а. В случае Оо > 8| 3.48. Для определения п имеем два уравнения Ф(«„) =а, ф(^-{в, — Go) + ыЛ = | — р, откуда находим, что п* — минимальное целое число, не меньшее чем а\иа + ирO(е, - ОоJ. 213
3.49. Поскольку ЦТ\На) = N@, 1), Щ\Н{) = N(\/a, 1), речь идет о различении двух простых гипотез о среднем нормального распреде- распределения с единичной дисперсией по одному наблюдению над случайной величиной Т. Из решения задачи 3.47 следует, что искомый критерий имеет вид Х]Л — [Т > — uj, при этом р = Ф(— и„ — Д/а). Отсюда, учиты- учитывая, что иа = Ф~'(а), получаем уравнение для определения ш: — иа — Д/о = Ф-'(Р) = U(, или а2 = Л2(иа + щ)'2. Разрешая последнее равенство относительно ш, окончательно находим, что /я* — минимальное целое число, не меньшее чем ,2/ГД2 оГ Л UpJ/ — f(ua + Uf,f \. L 02 02 J 3.50. Пусть Hi: 8 = 9,, i = 1,2, и 90 > G|. Если X = {X Х„) — соответствующая выборка, то статистика отношения правдоподобия и при этом ieG"/92) = х2(л). В данном случае неравенство / 5= с эквива- эквивалентно неравенству Т ^ t, поэтому при уровне значимости а критиче- критическая граница t = ta определяется из условия а = РОоG- < Q = Podtr/e2, < /./62) = FB(/./e|), где Fn(t) — функция распределения закона %2(п). Отсюда IJQl = у.1.« и искомый критерий имеет вид Его мощность Щ9,) = POlG- < 9Щ,„) = Ро,GУ92 < (-^- -'¦((*)*•)¦ Аналогично находим, что при 80 < Э| критерий имеет вид Xf. = [Т 5= Qltf-«.n) и его мощность ^ = '-^(Ш2^—)¦ 3.51. 1) Утверждение следует из соотношений *(с) = \ fo(x)dx < — \ f,(x)dx = -1A - р(с)), Р(с) = 5 /,WrfAr < с J /oWd* = сA - а(с)), Х0(с) = Х,(с). Хс(с) Х„(с) 2) Пусть с > 1, тогда, используя первое из предыдущих соотноше- соотношений, имеем 214
a(c)+ (VX-jK1 - P^+ P(C)< L 6 При с <j 1 используем второе неравенство: а(с) + Р(с) < о(с) + сA - а(с)) < 1. 3) Пусть с > 1. Тогда исходим из соотношения а(с) + р(с) = \ fo(x)dx + \ U{x)dx =1-5 (ЛМ - fo(x))dx. Х,(с) Хо[с) Х,{с) Очевидно, ^i(c)^Xi(l) и на множестве ЛчA) функция /i(jc) — fo(x) ^ 0. Следовательно, 5 (ft(x)-f0(x))dx, откуда а(с) + Р(с) ^ аA) + рA). При с < I рассуждаем аналогично, исходя из соотношения а(с) + р(с) =I-J (fa(x) - U{x))dx. 4) Если верна гипотеза Но, то на основании закона больших чисел Тп{Х) -5- Е ( In ('j '; 1 Яо) = б, когда я ->- оо. Поэтому при б < О ап = РG'Л(АГ) 5= 0|Я0) < Pdr,^) - б| > |б||Яо)->О, если п -> со, На основании симметрии (если поменять ролями #о и #|) также и р\, —0. 3.52. В данном случае и область Х\(с) = (jc: fi(x)/fa(x) ^ с) имеет вид Х,(с) = (х: а'х - уа'(И@) + ИA)) < с, = - In с). а = A" V°> - ц(|)). Для случайной величины Y = а'| ^-а'(ц<0) + t1'1') имеем ,) = #((- 1У-Н-. р). где р = (jiW - ( ) — так называемое расстояние Махаланобиса между распределениями Л^(ц'0', Л) и N(^'\ А). Отсюда находим вероятности ошибок первого и второго рода критерия Х[(с): а(с) = Р(У < с,|Яо) = Р(с) = Если задана вероятность ошибки первого рода а, то соответству- соответствующий критерий Неймана — Пирсона задается критической областью Х\(с) при Ci = р/2 + Ур"а. и.о. = Ф~'(а); при этом вероятность ошибки нторого рода равна р = Ф(— у/р — иа). Критерием, минимизирующим сумму вероятностей ошибок, являет- является Х\(\) (см. предыдущую задачу) и эта сумма равна 2Ф(— т/р/2). 215
3.53. Из решения задачи 3.39 следует, что рассматриваемая модель обладает монотонным отношением праводоподобия, поэтому получен- полученный в задаче 3.39 критерий Неймана — Пирсона является одновремен- одновременно р. и. м. критерием данной задачи. 3.55. Поскольку La(T,) = В,(л, 0) — распределение экспоненциаль- экспоненциального типа с монотонно возрастающей функцией Л@) = 1п9, р. и. м. кри- критерий в рассматриваемой задаче существует и задается критической областью вида [Т, ^ /} (см. п. 5 гл. 3). По центральной предельной тео- теореме Li,(Т,) ~ Лм ——g-, -г ^rj-l при г-*- ос, поэтому для расчета критической границы t = ta при больших г можно воспользоваться соотношениями откуда следует указанная формула для ta. 3.57. В данном случае Р„ (Т = х) = 1(х; 9) = аО-'о/СХ, х = О, 1 9, поэтому функция Я*; 6+1) = 6+1 N-Q-n + x {> /(*; 6) Л/-0 в+1-х монотонно возрастает по х. Следовательно, в данной задаче р. н. м. критерий существует и имеет вид {Т > /|, т. е. гипотеза Но отвергается, когда Т чрезмерно велико. 3.60. Рассмотрим класс критериев вида - во) < «Ц U где cti + а.2 = а, и рассмотрим также функцию мощности W{X,*; 6) = ФG«Д/а +ип1) + Ф(— УяЛ/ст + "а,), Д = б — 0о. Легко убедиться в том, что мощность минимальна при Д = До = = tj(uc.i — "a2)/BV")- Так как W{X^; 90) = а (т.е. при Д = 0), то несмещенность имеет место лишь при До = 0, т. е. при cti = а2 = а/2. Таким образом, искомый критерий имеет вид | " Л I .. — |л — Со I z? — UQ Этот критерий является р. н. м. критерием среди всех несмещенных кри- критериев. 3.61. Здесь функция правдоподобия ->'-¦'>¦ Поэтому неравенство Цх; 8,) > сЦх; 0о) + C[U(x\ 80), определяющее наилучшую критическую область, имеет в данном случае вид (см. реше- решение задачи 3.50) еаТ > с' + с\Т или [Т < Л) U [Т > t2]. 216
Итак, искомый критерий имеет вид *. = (Г < /,) U [Т > U]. где границы /i < 1г определяются при заданном уровне значимости а двумя условиями: U7(80) = a, W'(Qa) — 0, где 117@) — функция мощнос- мощности. Но (см. решение задачи 3.50) W'(8) = Р0(Д: е X,) = Р0(Г < /,) + Р0(Г ^ U) = Л,(Л/02) + I - - Fn(l2/tf), откуда имеем два уравнения Fn{i,/Ql) + 1 - Fn(l2/Ql) = а. /,*„(/,/в§) = /2й„(/2/в§), где kn(l) = F'n(t). Полагая /, = боХечя. h — 6ох1 -о2. я, получим, что должны выполняться условия Х2сч. А(х1,.я) = х1-аг. пЛп(х1-а2, я), а, + а2 = а. Этими условиями Хв,,я и х1-а2, я. а тем самым /i и г2, однозначно опре- определяются. Следовательно, искомый критерий имеет вид х,„ = {г < efo2*,. я) и (г ^ еад-Яг,«) и представляет собой объединение двух односторонних р. н. м. критериев задачи 3.59. Значения (ха,, я, Х2-«2.я) для а = 0,05 и п = 2, 5, 10, 20 см. в [1, с. 86]. 3.62. Схемы решения данной и предыдущей задачи аналогичны. Используя решение задачи 3.43 и введенные там обозначения, найдем, что критерий имеет вид Х[ = [Т < /,) U [Т ^ Ц и его функция мощ- мощности равна Щв) = Ы2'./6) + 1 - Ы2Ь/9). Для определения границ /[ и /г имеем два уравнения: Щбо) = а, U7'Fo) = 0, которые при замене /, = -уКи,,2я, h = -^-а^-аг.2я при- принимают вид Хи,, 2я*2п(х?|. 2я) = х1-а2, 2яА2л(х1-а2, 2л), «I + «2 = а. Определив отсюда xi,. 2и и х^-аг, 2я, получим, что при уровне значи- значимости а искомый критерий имеет вид А?,. = | 2 *¦ < -^-Ха,, 2я либо и представляет собой объединение двух соответствующих односторон- односторонних р. н. м. критериев для альтернатив ИГ : Э < Во и Hf : 0 > 60, которые следует из задачи 3.43 и свойств экспоненциальной модели. 3.63. В данном случае (см. решение задачи 3.39) функция правдо- правдоподобия Цх;в) = ЙС?'6*'A — 9)*--", поэтому Кроме того (см. задачу 2.43), /(В) = ?/[0A — 0)], поэтому искомый критерий (см. указание) имеет вид = [\Т - Ша\/л1Шй{[ - во) > - и,/2]. 217
Мощность этого критерия при указанных альтернативах вычисляется так же, как и в задаче 3.40. 3.G4. В данном случае Цх; 0) = e-"°0rM/(*,! ... *„!), Т(х) = 2 */¦ поэтому U(x; 6) = (Г(х) — лО)/В, a i@) = I/O (см. задачу 2.43). Отсюда искомый критерий имеет вид Х,„ = {\Т — п%\л[а0а ^ — и„/2). Его мощность вычисляется так же, как и в задаче 3.41. 3.65. Используя обозначения, введенные при решении задачи 2.119, находим, что критическая область Х\а для сформулированных задач имеет следующий вид: 1) Х,„ = {* : х Зг в,о + /|-д. .-iSW/Vn - 1); 2) _Y,a = (х : х < Gio — /,_„, „_iS(x)/V« — 1) (ср. с решениями для случая известной дисперсии — задачи 3.47 и 3.58); UQ I — t)|01 , - . jj л,а =\х:^п — 1 j-t-t—^ 'i—^ _|< (СР- с результатом за- о(х) 2 ' " дач 3.60 и 3.73); 4) Х,„ = (*:nS2W 5= eioX?-.. — i);' 5) Xia = (х : nS2(x) ^ бгоХпа-il (ср. с результатом задач 3.50 и 3.59); 6) *,„ = {x:nS2(x) < ebx2i.,,_, л»60 «52W > 6ioX2_i.„_,) (СР- с результатом задач 3.61 и 3.74). Действительно, рассмотрим, например, первую задачу (для осталь- остальных задач рассуждения аналогичны]. Используя для 6, нижний v-ДО- верительный интервал Gy(X) = {8, : X — /,,„_,S(X)/^jn — 1 < 8i < оо], пдлучаем, что область принятия^ гипотезы Яо с уровнем значимости а = = 1_ — у имеет вид ХОа = [х: х — t-,%n-\S{x)/^n — 1 <: 6,о). Но Х\а = = Хо« имеет вид, указанный в ответе задачи. 3.68. Используя 7-ДовеРительный интервал для отношения т, пост- построенный в задаче 2.127, находим, что область принятия гипотезы Яо имеет в данном случае вид хо. = к*, у)-- f-^.2,,2m < 1 < -j^i^.a..sJ. « = i - v. Отсюда искомый критерий задается критической областью Xla = {(x, </):4-< F, либо ^~> F » 2„ „ ), и его мощность „(т-|- > xf,_. ,2„ ,ая) = = F{tF« 2п2т, 2п, 2т) + 1 - FixF^u Ь1Ъ1- Чп, 2т), т = -^ . 3.69. Обращая построенный в задаче 2.128 v-довернтельный интер- интервал, находим критическое множество для гипотезы Яо: Х\а = [х:Х(\) ^ бо либо а'(|) ^ Оо — (In a)/n]. Так как /1 при / < 9, > (> = \е-»('-») при / > 0, 218
= { (см. решение задачи 2.128), то функция мощности этого критерия равна W@) = Р<(Хт < во) + PoOVo, S3 00 - (\па)/п) = 1, 9 > во — Aпа)/л "(°-°»), 0о < 9 < Оо - Aпа)/л, 1 _ A _ а^в-Оо^ о < е0. Отсюда следует, что Ц7@) > а при всех 0. 3.70. Искомый критерий имеет вид Х\л = {х: Х{„) < боа17" либо *(„) Js во), а его функция мощности Щв) = 1, 6 < |„\ 5а Оо, 1 - A - а)[ уЛ", 0 > 6а. Отсюда следует, что W(B) ^ a -V9- 3.71. Утверждение о выборе границ в несмещенном критерии сле- следует из совпадения распределений соответствующих статистик. 3.72. Обращая построенную в задаче 2.132 доверительную область, находим, что критерий имеет вид v Iv- n/Z д Z д vv*— и*, а *, а \ — «,2 \ Л|д — (Л. li\X\ — "lOi -*2 — ^Jia) 2и \Х\ — О|0, Л2 — 0^ ^ А1—а. 2|- 3.73. Здесь в = @ = @,, 92): — со < 0, < со, 02 > 0) и (см. ре- решение задачи 2.86) supL(*; 8) = Цх; (х, s)) = Bnes2)~"/2, 52 = S2(x). Далее, Go = {8 = @,, 02): 0, = 9,0, 02 > 0) и supL(*; G) = Цх; @10, s0)) = {2nesl)-, во где si = —-2 (xi — ОюJ — о. м. п. для 02 при гипотезе На. Так как sl = = s2 + (х - 9|0J, то Х„ = \„{х) = (sl/s1)-"'* = A + /2/(/i - 1))""/2, где / = t(x) = л]п — \(х — Ою)Д. Поэтому неравенство Хя ^ с эквива- эквивалентно неравенству |/| ^ с'. Таким образом, в данном случае к. о. п. имеет вид Х[а = [х : л/п — 1 \х — 9ю1Д > с'). Так как статистика критерия t(X) имеет при гипотезе На распределение Стыодента S(n — 1), то граница с' = t a_ (ср. с задачей 3.65 п. 3). 2'" Распределение S(n — 1) при больших п аппроксимируется распре- распределением Л/@, 1) (см. задачу 1.47), поэтому критическую границу с' можно полагать приближенно равной — ц„/2. Отметим также, что и\п = х?-ч. I- Далее, информационная матрица /(9) модели Л?@|, 81) 219
вычислена в задаче 2.44, откуда имеем, что первый главный минор мат- матрицы /"'(б) есть 0?.. Согласно асимптотической теории о. м. п., предел мощности при рассматриваемых альтернативах равен 1 — Fi(x2,-a. ь X2), где в данном случае X2 = E2/0j. 3.74. В данном случае (см. решение задачи 3.73) supL(x; 0) = Цх; (*, s)) = Bл«2)-"/2, s2 = S2(x), в supL(x; 0) = Цх; (х, 020)) = BnOio)-"/2e-"s!/2O4 откуда Х„(ж) = (le~'+ Y\ I = sVelo. Здесь неравенство Х„ < с, определяющее критическую область к. о. п., записывается в виде {/ ^ /j) (J С > 'г), t\ < '2, поэтому критерий имеет вид А:, = {х: 52(ж)/О2о < 'i либо S\x)/d22u > Ц. Из указания следует, что функция мощности такого критерия равна Отсюда, выбирая I, = Ха,.п — \/п, /г = х1 -а,,п-\/п при ai + «2 = a, получаем, что U?(90) = а. Тем самым получаем указанный в формули- формулировке задачи результат (ср. с задачей 3.65 п. 6)). Чтобы получить несмещенный критерий, надо обеспечить выполне- выполнение условия U*"(9o) = 0, которое сводится к уравнению Замечание. Асимптотический (при п -*¦ оо) вариант рассмат- рассматриваемого критерия исследован в [1, с. 175—176]. 3.75. Поскольку оценка максимального правдоподобия параметра 9 в модели Bi A,9) по выборке объема п равна (Г,, = X (см. задачи 2.84 и 2.48), статистика Но в данном случае имеет место полиномиальная модель с N = 2 исхо- исходами, поэтому (см. [1, с. 170—171]) при п -*- оо предельные распре- распределения при гипотезе Но статистик — 2 1пХ„ и 2 (Г - п90J (п-Т-п(\-во)Т = (Т - пОоJ - п90 + rt A — во) л90A - во) совпадают н есть х2(')- Это отражает тот факт, что LOt(T) ~ А^(пв0, п90A — 90)) при п -»- оо. Таким образом, к.о.п. (Х„ ^ с) асимптотически эквивалентен критерию (X2 > /), который совпадает с критерием, по- построенным в задаче 3.63 (при k = \}. 3.76. В данном случае о.м.п. 0„ = X = Т/п (см. задачу 2.109), поэтому статистика Хп = (nG0/T)TeT~n '. Далее, из решения задачи 3.64 следует, что статистика Qi2) = (Т — ndof/nQo, следовательно, асимпто- асимптотически к.о.п. эквивалентен критерию ( | Т — /z90|/V"(Jo > (), исследо- исследованному в задаче 3.64. 3.77. Обозначим через L,(9;) = 0,"ЛA — б,)"'""^1 функцию правдо- правдоподобия для /-й выборки, j = 1 k. Тогда, в силу независимости 220
выборок, функция правдоподобия для всех данных есть L (Oi, ..., 0*) = = /.1F1)... Lk(Ot). Далее, так как о.м.п. параметра бернуллиевской модели совпадает со средним арифметическим выборки, то отсюда имеем к k max Мб,, -.9*) = Птах Мв,0 = Il^W О, 0. ;=l °i /=| к max L (О,, .,., 64) = max Z. (О G) = max 0"^1 - 0)"A "*> = i = ... = 0» 0 О где X=—{n,Xi + ... + л***), п = «1 + ... + я*. Таким образом, в данном случае статистика отношения правдо- правдоподобия имеет вид х„,...я. = х"Ь - л)"(|-*>/^ ^ * /АЛ «Л = ц W Наконец, размерность нулевой гипотезы dim Ha = 1 (одна степень сво- свободы), поэтому асимптотически к.о.п. [1, с. 175] имеет вид Хи = { 22 п, [i, (In ij - In x) + A - *,) (In A - ~Xj) - Стандартный же критерий однородности х2 ['. с. 126] имеет вид 3.78. Схема решения такая же, как в предыдущей задаче. Ис- Используя те же обозначения и учитывая, что в данном случае У^Л 1= 1 к, найдем, что '=1 и при л , пи ->- оо к.о.п. имеет вид Х„ = { 22 "Л (In ^ - In i) ^ xi-„,/,-,] • 3.79. Обозначим через /-;@|,, О2) функцию правдоподобия для у-й к выборки, / = \,...,k, и через Д@] Oit, (Ь) = f^L^Oi;, 02) — для 221
всех данных. Кроме того, положим п = Л| + ... + гг4, So = •—¦ 2 n;S/. 1 ' - Х = — 2"Л' ПУСТЬ S2 — выборочная дисперсия для всех данных. /=' Тогда _(см. задачу 2.1 Н) о.м.п. параметров @ц, ..., От, 02) являются (X Л*. So) и L(X, X,, So) = BneSl)'"^. При гипотезе Но все дан- данные можно рассматривать как выборку объема п из совокупности JV @1, в!) и поэтому (см. задачу 2.86) max Z.@ 0,,G2) = L (X ..., X, S) = BneS2)-"'2- о,, d Таким образом, статистика отношения правдоподобия в данном слу- случае равна Число параметров, определяющих модель, равно k + 1, а размерность нулевой гипотезы равна 2, поэтому асимптотическая форма к.о.п. имеет вид X,« = {n(\nS2 - In Sg) ^ X'-a.*-il- Если к = 2, то непосредственно проверяется, что «S2 = «,S? ^ откуда *,,,,, = (i + гуся - ед-я/2. где 7" задано в формулировке задачи. Здесь неравенство Х„,„, ^ с эк- эквивалентно неравенству I T\ ^ t, откуда и следует указанный в форму- формулировке вид критерия. 3.80. Пусть Lj(Q\j, 02/) — функция правдоподобия для у-й выборки, к j = 1, ..., k, a /. = Yi ^/(9i/i Ог/) — для всех данных. Тогда, как и в пре- /¦=' дыдущей задаче, имеем, что для общей модели к к max L = Дтах 1,@,,-, 02/) = Д BncS])~"'/2, а при гипотезе На k maxL = тахПМЭ|Л02) = Bnt-S?)-"/2. / = i Отсюда /¦-I /=l В данном случае число параметров, определяющих модель, равно Ik, а размерность нулевой гипотезы равна k + 1, поэтому асимптотически при П|, ..., /и -»¦ оо к.о.п. имеет вид 222
к = { 2 "/ (|п 5° - |п sl) При ft = 2 имеем n2si) \ niS'i + n2s'i I «2 - 1 / \ ' «2 - 1 и неравенство Х„:П1 ^ с эквивалентно условию {F ^ с,) и (F ^ с2), Ci < С2. Отсюда, используя указание, получаем приведенный в форму- формулировке задачи вид критерия. 3.81. При гипотезе Но все Xi имеют некоторое распределение #F1,62). Но_ в этом случае (см. решение задачи 1.58) статистика ц = I , „ имеет распределение, не зависящее от параметров (9|, 6г), симметричное относительно нуля, и при этом Следовательно, Р(Ди//„) = В(\ - vl; ^~^, Pi = a, т. е. вероятность ошибочно отвергнуть гипотезу Но при \r\\ > va равна а. Таким образом, Х\а — подходящая критическая область. 3.82. Так как гипотеза Но эквивалентна в данном случае утвержде- утверждению cov (||, 1о) = 0, то согласно задаче 1.59 п. в) L (p. V(n -2)/A -р»)|//о) = S (я - 2), откуда можем записать (в силу симметрии распределения Стьюдента), что РAр„1 ф= Но последнее неравенство эквивалентно неравенству, определяющему область Х[а, следовательно, P(Xia|Wo) = а. Это означает, что вероят- вероятность ошибочно отвергнуть гипотезу Но при р„^Х\„ равна а, т. е. X[i — искомый критерий. 3.83. Согласно задаче 1.60, L G"„[//0) -> N@, 1) при л-юо, поэтому Р ([ 7"„| > — иа/2\Н0) -*¦ 2Ф (иа/!) = а, что и утверждается. 3.84. Пусть наблюдаемые случайные величины Х\,...,ХЛ независи- независимы, имеют одинаковое и известное среднее (х и конечные дисперсии. Если гипотеза На означает, что все Л, одинаково распределены, то при больших п статистика Г„ имеет при На приближенно нормаль- нормальное N @, 1) распределение. Следовательно, статистика Тп позволяет построить критерий согласия для Но, который имеет такой же вид, как и в задаче 3.83. 3.85. 1) Так как и/ЛF0) = РОй(Г„ > V») = Po.(V" (Г. - цF0))/а (Оо) > - и«), то согласно свойству (а) Wn@0) —>- Ф (иа) = а при п -*¦ оо, т. е. крите- критерий Х\а асимптотически имеет уровень значимости а. 2) Аналогично имеем у») = Р 223
где - 2. (я) = Vrt (и. @(">) - р. @„))/а (е«) + ««а @0)/а @<">). Согласно свойству (б) — 2„ (п)->-р ц'@0)/а F0) + ua при я -> оо. Из этих соотношений в силу свойства (а) получаем указанное предельное равенство. 3.86. Из предыдущего доказательства имеем = Mm Отсюда д/ё, = Ve5/X или X = 3.87. В рассматриваемом случае Lo(T^'i) = Л/_@, о2/п), поэтому (см. задачи 3.86 и 3.85) критерий имеет вид Х\2 = [X ^ 0О — ила/^1п }, его эффективность Питмена е, (р, а) = Ф (р/а + и„) и е! = а. Анало- Аналогично (см. задачу 1.32) имеем Л0G'(„2') ~ Л/ (б, ——V откуда Х?1 = 00- u.a-\/^J /^ 2 = т-. Следовательно, X = e-i/el = 2/п. ла 3.88. Запишем функцию правдоподобия L (х; 0) в виде где квадратичная форма Q0(x) = (ж — 0<)'2~'(дг — 0/) может быть раз- разложена в сумму Q0(x) = Q0(x) - 20/' 2* + 62Q0@- Замечая, что / — последний столбец (а значит, и последняя строка) матрицы 2- т- е- @...01) 2 = /', находим /'2~' = @...0I). Отсюда г'^~'х = х„ и, таким образом, Q0(x) = Qo(x) + в21„ - 2вх„. Это означает, что L (х; 9) = g (Т (х); 0) А (ж), где Г (ж) = ж„, а g (Г; 6) = = expj ОТ т- О2/Л . Отсюда согласно критерию факторизации сле- следует, что Х„ — достаточная статистика; и тем самым все статистические задачи в рассматриваемой модели надо решать, основываясь на этой статистике. Но Lo(Xn) = N @/„, 1„), следовательно, имеет место нормаль- нормальное распределение, у которого неизвестно среднее. Таким образом, сформулированная задача эквивалентна задаче проверки гипотез о неизвестном среднем одномерного нормального распределения по одно- одному наблюдению, которая решена в задачах 3.47, 3.58 и 3.60. 224
Глава 4 4.1. Имеем 2 .m,C0\2 \' 2 2?>22^ - B 4.2. Если не все /, одинаковы, то С' - О2- 1=1 При этом Е% = E„ «=1,2, p, = — 2 ч s «, - о», d^2 = о2/ i; F - о»,  = 1 i = 1 1 = 1 поэтому, если 2 (ti — tf-»-°° при п-+оо, то оценки Р,- состоятельны, i = 1 4.3. Имеем /! - 2), где — ^2 2 С'~ О2. ft = ($t. ^з) указаны в предыдущей задаче. Если ($) = а(п2) при п->-оо, то а2 — состоятельная оценка а2. В частно- частности, для нормальной модели L(S(P)/a2) — х2(п — 2) ([1], с. 193), поэтому (ft) = 2а'(п - 2) = о(л2). 4.4. Имеем cov$,, $2) = -о2/"/ 2 ('< - О2- 1 = I 4.6. Здесь /= 2 Р; (Ь Т а)' , ^=2 Р/^ . поэтому ?Г= / = 1 = 2 ),Л = 1 (Ь - of +' 4.9. Доверительные интервалы находятся соответственно по фор- формулам: . «(«-2J с» - о2]). , „ _ 2V /. - 2) 2 (/; - 8—190 225
Y-доверительный эллипс имеет вид G/X) =/p:(p, -$,J + 2f(Pi-Pi)(p2-Pj) + i- 2 F \ 2 < п(п — 2) где Pi, $2 и S(P) указаны в задачах 4.2 и 4.3. 4.10. Поскольку \ x(t)dt = 2а$\, речь фактически идет о довери- — а тельном интервале для р,, указанном в предыдущей задаче. 4.11. Здесь теоретическая зависимость имеет вид alt) = а@) + vt, поэтому доверительный эллипс строится по правилу, указанному в задаче 4.9. 4.14. Положив в D.11) т = 3, X, =A00), Хг = @10), Х3 = @01), получим, что искомая система имеет вид *-э) . / = I. 2. 4.15. Обозначив через Xi, ... , Хг результаты указанных последо вательных измерений, получим, что в данном случае речь идет о сле- следующей модели нормальной регрессии: X, = р, + е,, Х2 = р2 + Е2, Xi = р, + р2 + вз, А'4 = 180 - р2 - Рз + е4, Хъ = рз + е5, X6 = р4 + и, Х7 = рз + Р< + е7, Х8 = 180 - р, - р4 + Е8. 4.17. Учитывая указание, имеем ES(fi) = ES(P) - ?(р - Э)'Л(р - р). П Здесь ?S(P) = ? 2 е,2 = па- (см. D.4)) и i = i ?(Р - р)'Л(Р - Р) = 2 ft;cov (Р„ р;) = с2 2 "„-а" = cr2tr (ЛЛ) = <-,У = i i.i = 1 = Аа2. В результате получаем ES($) = (п — k)a2. Далее, так как X — 2'Р = ВХ (см. D.5)) и В2 = В, то S(P) = Х'В2Х = ДГ'ВД:. 4.18. В данном случае матрица А = ZZ' является диагональной, ее диагональные элементы равны z'z;, / = 1, ... , k, где z/ — /-й столбец матрицы Z', поэтому р,- = z'A'/z'z;, D^ = a2/z,'z;, cov (^;, 3') = 0, j Ф r. 4.21. Функция правдоподобия для модели D.3) имеет (см. D.4)) вид ^ { н максимизация ее по р эквивалентна минимизации квадратичной формы S(x; р); отсюда следует, что о.м.п. р совпадает с о.н.к. О.м.п. о2 — это то значение а2, которое минимизирует 5(р)/а2 + я1п а2, откуда о2 = S(p)/n. Учитывая задачу 4.17, имеем Еа 226 2 / п — k Д „ k 2 — а = ( 1 ) а~ = a .
4.22. Решение следует из D.10) при т = 1, Т = X'; при этом необходимо учесть, что F,,M_* = /2, +l0/2.„ _* (см. задачу 1.50). 4.23. Полагая в предыдущей задаче X = A, t) и используя резуль- результаты задач 4.2—4.4, получим искомый интервал: + (t - 0р2 ± (я_ 2) s([ _ 4.25. Положить в D.11) X, = z(/), / = 1, ... , п. 4.27. В данном случае в D.12) m = I и л л ST = min 2 № - Pjo'i - PiJ = S(P) + ($2 - P20J 2 № - О2: P' ; = l ; = 1 кроме того, Fi_<1in_2 = <2 ,. (см. решение задачи 4.22). i —Г'" Отсюда следует, что F-крнтерий D.12) имеет указанный вид. 4.29. Здесь мы имеем модель нормальной регрессии с п = 8, (J = = (ц|, ц.2, Aз, р.») и соответствующей квадратичной формой s(P) = 2(*S" - и<J = ZW - *@J + 22 (^° - W)'. x<o = l(xV> + ^). Отсюда о.н.к. ^ = Xw, i = 1 4, min S(P) = 2 ixf ~ ^f = Si и '¦. i о2 = Si/4. При гипотезе Но ST = min 2 (*/° - НJ = min ( 2 (^° - XJ + "(^ = 2 (*S° - ^J = S, + 2 2 (^C0 - Xf, поэтому F-критерий D.12) при m = 3 имеет вид Xia = {2 (^<0 - ^)VSl >YF>- '*] ¦ 4.37. Обозначив Z' = ||lo|| матрицу размера п X 2, составленную из вектор-столбцов 1 = A, ... , 1) и а = (oi, ..., а„), получим решение в виде р = Л-'ZG-'K, где А = ZG~[Z' = II *', II G-'||la||. При- II а. II меняя далее обычные правила-умножения блочных матриц («строку на столбец», если матрицы-блоки рассматривать как элементы), результат можно привести к виду Р = (Pi, рг) = -г- (a'QY, —I'QY), где Д = (\'G-4)(a'G-'a)-(l'G->a)\ а матрица Q = G'^aV- — 1a')G~'. Матрица вторых моментов этих оценок имеет вид 8* 227
Глава 5 5.1. 1) В данном случае выборочное пространстпо Я = @, 1} состо- состоит из двух точек и для каждого х ? X возможны лишь два решения, поэтому всего имеется четыре решающие функции б, = (fii(O), 6,A)), i = 1, 2, 3, 4:6, = {du dt), 62 = (du d,\ 63 = (rf2, dt), 6< = (rf2, d2). Пусть Ri = (R@,, б,), /?(Q2, б,))— вектор риска процедуры б,, где Я(в, б,) = Цв, 6,@)) A -0)+ Цд, 6,A )H. Тогда для рассматриваемой ситуации Л| = @, 2), *2 =(±, |) , R, =(|, 4") • *«=0. О- Процедура б2 предпочтительнее 63, а процедуры 6|, й2, 64 между собой несравнимы и, следовательно, образуют совокупность допустимых решающих правил; при этом mF2) < mF4) < m(fii), т. е. 62 — минимакс- минимаксная процедура. 2) Решение I. Для байесовских рисков г(б,-) = cc/?(Oi, б,) + -f A — а)#@2, 6,) имеем следующие значения: rFi) = 2A — а), лF2) = 2 —а 1 = —т—, г(б4) = а. Отсюда находим, что если а ^ — , то min г(б,) = о 2 i I 4 = гF4), т. е. здесь б* = б4; если -=- < а < -=-, то min лF,) = г(б2), т. е. / о i 4 здесь б* = б2; наконец, б* = б| при а > -=-. Следовательно, график D байесовского риска имеет вид, изображенный на рис. 8. Решение 2. Вычислим апостериорное распределение лF,|дг) = /(*; e,-)n@i)//(jc), х = 0, I, 1 = 1, 2, где в данном случае /(*; 6) = 0*( I — - 0)' " *, 1(х) = 1(х; 0,) я (9,) + /(*; 62) л @2) = 61A - 9,I - 'о + 95A - -02)'-'A -а). Имеем я(9, |0) = сс(! - 0,)//Г01, л@2|0) = A - а)A - (' )9 -02)//@), л@,|1) = а0,//A), л@2|1) = Для рассматривае- рассматриваемого случая средняя потеря относительно этого апостериорного рас- распределения при х = 0 для решения 6@) = d\ равна = це,. а для решения 5@) = di она равна 1 Сравнивая эти потери, 3/@) ¦ получаем, что при a ^Lk~ потери для решения d? меньше, т. е. б*@) = d2, если же а>-^-, то 6*@) = d\. Аналогичный анализ для случая наблюдения х = 1 дает, что при а^ 4 4 <— 6*(l) = rf2, если же а>—, О О то б*A) = d\. Тем самым получены значения байесовского решения Ь*{х) в каждой точке х = 0, 1 при любом априорном распределении. 5.2. Для априорного распределе- распределения яF|) = а, ае [0, I], искомые средние потери Е(Ц0, d)\x), вычислен- рис g ные по указанным формулам, приве- приведены в следующей таблице. 228 i 5
d, A-а)//@) 3(l-a)//(l) di 3a/4/@) a/4/(l) d3 (l+2a)/8f@) C-2a)/8/(l) x=0 Сравнивая указанные значения для определения минимального в каж- каждой строке (а тем самым и отыскание значения б*(*)), получаем следую- следующие результаты: б*@) = di при а < —, б*@) = d3 при — < а ^ — , 6*@) = rf, при а > -^- ; б*A) = di при a < -|- , б*A) = d3 при ~ < 21 21 <а^-—^-, б*A) = d\ при а>-^г-. Тем самым искомые байесовские решения б* = (б*@), б*A)) имеют вид: б* = при a < — ; б* = 17 7 3 = (d3, d2) при — < a <^q-; S* = (du d2) при — < a < — ; 6* = как 3 21 21 при — < a <2~; 6* = (d\, d,) при a > -^. Далее, так p(e) = г(б*) = , 6*(х))\х), то, беря соответствующие значения E(LF, 8*{x))\x) из таблицы, для функции р(а) получаем следующее представление: а при 0 < а < 1/4, A+4о)/8 при 1/4 < а < 7/10 . D-За)/4 при 7/10<а<3/4 , A1 — 10а)/8 при 3/4 <а< 21/22, 4A -а) при 21/22 < а < 1 График этой функции приведен на рис. 9. 5.3. Для приведенных в решении задачи 5.1 решающих функций векторы риска для первой ситуации имеют вид а для второй — следующий вид: Отсюда заключаем, что в обоих слу- случаях процедура б3 предпочтительнее бг, следовательно, допустимыми яв- являются процедуры 6|, бз, б,; при Рис. 9 229
этом для тех значений а = я@|), при которых соответствующее байесов- байесовское решение 6* = бз, соответствующие риски удовлетворяют неравен- неравенству лB'F*)<г<'>F*). 5.4. В данном случае функция риска имеет вид з Же, б) = 2 Ф. ед)с3*е*A-оK-' k = О и векторы риска Я, = (Л(8|, б,), /?№, б,)) для указанных процедур соот- соответственно равны R, = E,94-Ю; 0,792), /?2 = E,96 • КГ"; 0,972), /?з = B-10~ь; 0,999). Отсюда минимаксное решение б = б| и т{Ь) = = 0,792. 5.5. Здесь /(х-; в) = (I — 8H', х = 0, 1, 2... , поэтому функция риска оо i — \ /?(е, в,-) = 2 Цв, б,(х))!(х- о) = L(e, «/,) 2 ft*; 8) + + цо, rf2) 2 Я*; 9) = Де. d,)(i - с) + цо, d2)e;. Вектор риска для /-й процедуры равен R, = («(8,, б,), Я(8г, 6,)) = (aOi, 6A - GS)). Здесь с ростом i первая координата убывает, а вторая возрастает, поэтому при а0\ ^6A — 6г) максимальный риск тF,) = 6A —0'^) и, следовательно, минимаксная процедура б = б,. Если же aOi > 6A —92), то, определив целое /о условиями будем иметь т(8 ,)=('' • .~~ °' Следовательно, в данном случае б = б,0, если a8i0^ 6A — 820"'), и б = б,0 + i в противном случае. 5.7. В соответствии с общей теорией (см. п. 4 гл. 5) в данном случае функции h\(x) = блг/гМ, h2{x) = anifi(x), поэтому байесовское решение Ь*(х) имеет вид **, ч f^i ПРИ ¦*€ й7?. ГД° 6*(jc) =.' v ¦ при х ? WT, а соответствующий вектор риска равен (aPai(X ? Wf)* ЬРи.(Х ? WT)). Следовательно, байесовский риск г(б*) = ал,Р01(А-е Wf) + bn, Для указанных нормальных распределений при 0i < 02 область Wf = ( G 9 2 6л2 а = ф( 4 <J, С = Ш 1+1/1) , Р„д ё irf) = ф(с-Р/2) , где р = @, - 02J/а2. Vp ' v Vp ' Если 8i > 02, то область Щ задается противоположным неравенством, остальные же выражения остаются прежними. 5.9. В данном случае для решающей функции 6(jc) = d функция риска /?@, б) = L(Q, d) и поэтому байесовский риск r(d) = аЦО, d) + (\ — a)Z.(l, d) = ad" + (\ -a)(l —df. 230
Минимизация этого выражения по d дает искомое решение d*: если а = 1, то d* = О при а > -^-; d* = 1 при а <—-, а при а = — в качестве d* может быть взято любое d 6 [0, 1]; если же а> \, то W?) = \ wf 5.10. 1) Записав Ро,(Х 6 W?) = \ /,(*) d* (в абсолютно непрерыв- ном случае), из определения функций hj(x) имеем * k /-(б*) = 2 "/*.<«*) = 2 i=i у = I Но из определения областей Wf следует, что последнее выражение можно записать в указанном в формулировке виде. 2) Очевидно, что / * \ / * \ I = 1 / \ j¦ = 1 (здесь учтено, что l(j\j) = 0, / = 1, ... , А). Отсюда к L ( 2 Л'М*) — max л/fX*)) < min h,(x) X:=l X=| или (см. указание) I 2 mi" (л'/'(л:). max nifi(x)) ^ min A/W ^ / 2 m'n (n'/'W> max nifi(x))- i = 2 ' < ' ' ; = 2 ' < ' Ho min(n,/,(^), max я,7,-(лс)Х 2 min (я,-/,<д:), n,-/^)). ' <' у < i что после интегрирования дает верхнюю оценку для гF*). Далее имеем, min (nifi(x), max n,-fj(jc)) ^ min (ntf(x), nfifoc)), / = 1, ... , i — 1, I <' поэтому \ min (njfi(x), max jiifj(x))dx ^ max K,,-, J ; < i / < i что дает нижнюю оценку для гF*). Указанные оценки превращаются в точные равенства при k = 2, /B11) = /A|2) = 1. 5.11. В данном случае У,2 = я, \ f , где А!, = {х : ni/i(*) < я2Ь(*I и 231
Простые преобразования позволяют записать область Xi в виде X, = L : а'х - 4-а'(ц<0 + И<2)) < In —} , а = 4" '(ц(" - V-(% Рассмотрим случайную величину У = a'-Y——а' (цA) + цB)). Если = ЛГ(ц">, Л), то 1(У) = Лг(у, p) и Аналогично имеем Из этих формул следует указанный результат. В частности, /,2 = = Ф( ;г—I При Я| = Л2 = -^г-. \ ?> / А В случае пуассоновских распределений П(А.,) и П(Х2) при Я., > Х2 /|2 = Л1б ' V г- + Я2Й 2 У, —7- , rtx Г riX In -— Л2 целая часть.- Таким образом, /12 = л,П(г0; Xi) + п2A - П(л0; Х2)), где П(г; Я) = 2 г1^-. t = О 5.12. Используя решение предыдущей задачи и введенные там обозначения, находим, что область наилучшей классификации Wf имеет вид WT = {*: А,(*) = /(I |2)п2^(х) < А2(дс) = /B| 1)я,/,(дг)) = Таким образом, байесовское решение б* состоит в том, что при наблю- наблюдении х? Wf истинным считается распределение N(\i'\ А), в противном же случае (т. е. при х? W$ = WT) — распределение Л^(цB), А). Соот- Соответствующий вектор риска равен (см. предыдущее решение) /?F*) = (/B11) J /,(*)<**, /A12) j h(X)dx) = 232
следовательно, байесовский риск 1 |2)ф( -?±В?) . Ур ч Vp ' При. /B|!) =/A|2) = 1, л, = л2 = -у величина с = 0 и /-F*) (?) Для получения минимаксного решения б имеем следующее урав- уравнение для определения константы с (а тем самым и наименее благо- благоприятного априорного распределения (л|, л2)) ^)=/A|2)ф( Vp ' ч Vp В частности, при /B11) =/A12) = I решением является с = 0 (т.е. Л| = Я2 = -S-1 и в этом случае максимальный риск тF) = Ф( — -^--) ; T само же минимаксное правило задается указанной выше областью WT при с = 0. 5.13. 1) Если Щ) = В1(т, 6), то /(х; 6) s 8s "(I - 6)S""""' = = 8r(l—e)"m~r, априорная же плотность распределения параметра л(9) й6°"'A —6)*~'. Следовательно, для апостериорной плотности имеем пт - " ~ ' л(9|*) ^ п(8)/(х; 6) ^ 6" + * - 'A - 6)" + т.е. я@|х) — плотность бета-распределения Р(а + х, b -f пт — х). 2) Здесь /(*; 9) ^ 6^''A —6)"', лF) указано выше, поэтому я(в|ж) s е"-1"-^ -9)"+ "'-'. 3) Здесь f(x; 9) s е-"°9Е", лF) s 8х ~ 'е-0/о, следовательно, —плотность гамма-распределения /" ^ + ) -9Ух, 4) Здесь /(дс; 6) = 9"е , я(8) указано выше, поэтому л(8|х) s 5) Используя функцию Хевисайда е(х), запишем плотность выборки /(дс; 8) в виде j(x; 0) = 9~"е@ — Х(„)), Цп) = max {x\, ... , Jtn). Аналогично, я(9) s 0~"~'е(9 — а), откуда -я@|х) ?* 0-°-"-|e(e-max(a, ж(л))). 6) Если А|, ..., Лд/—целые неотрицательные чи^сла, удовлетворяю- удовлетворяющие условию Л| + ... + Лд/ = п, то ДА; в) == в?' ... Эд/"'. Отсюда я(в|А) s 8Г'+'"-'... 8^ + »«-', т. е. снова получаем плотность распределения Дирихле D(a + Л). 7) В данном случае плотность выборки ; 9)^ехр{-11т2 (*, - 8J} = {(х; 9)^ехр{-11т2 (*, - 8J} = ехр{--^-(8 - iJ- 233
априорная плотность л(б) т expj —7гз~(®~ \>)( ¦ Отсюда *; 9) - ехр { - -^г (9 - цJ - -^ (9 - ^J} - здесь опущены выражения в показателях экспонент, не зависящие от 0. Последнее выражение пропорционально expj——j-(9 — HiJ}, что и доказывает утверждение. 5.14. Пусть Х = лс?{1, ... , п — 1). В данном случае апостериорное распределение nFU)s 6'(l-0)""* и средняя потеря для решения 6(jc) = d относительно этого распределения пропорциональна Минимум этого выражения достигается при d = —. Если же х = = о(п), то лишь при d = 0 (соответственно d = 1) указанный интеграл конечен. Таким образом, 6*(*) = — при любом х. Далее, Я(9, б*) = eJ^--q) /9A-9) = Do(—Wl -9) = — = const, следовательно, б* также и минимаксное решение и его риск /-F*) = \/п. 5.15. В силу задачи 5.13 п. 1) апостериорная плотность ji(9U) s= ^ 0О + * ~ 'A — 9)' + "~ *~ ' и средняя потеря относительно этого распре- распределения пропорциональна Ч/В = Отсюда следует, что &*(х) = ———цГа" ^ычислим Функцию риска: -9) но, минимаксное решение 6(х) = —'¦—""'" , а его риск Условие /?@, 6*) = const выполняется при а = Ь = -\fn/2, следователь- -. х + - jeHHe 6(*) = —— тF) = Я@, 6) = • 4A 234
5.16. Запишем среднюю потерю для решения &{х) = d относительно апостериорного распределения n(Q\x) в виде ?[F - df\x] = ?[F - 6*(х) + 6*W - df\x] = DFU) + F*W - df 2s Равенство здесь имеет место при d = 6*(*), следовательно, 6*(*)— искомое решение и его условный (при условии X = х) риск равен D(8U). Отсюда байесовский риск имеет указанный вид. В задаче 5.15 апостериорное среднее параметра равно первому моменту распределения C(а + х, Ъ + п — х), т. е. 5.17. Здесь LdX) = Bl(r, 6) и в силу задачи 5.13 п. 2) апостериор- апостериорное распределение Цв\х) = р(а + х, Ь + г). Используя формулы для моментов бета-распределения (см. введение к гл. 1), отсюда (см. зада- задачу 5.16) находим, что искомая байесовская оценка имеет вид 5.18. В силу задачи 5.13 п. 3) апостериорное распределение ?(8|*) = г( паа+1 , X + xj , х = (х х„), х = 2 *;. Используя формулы для моментов гамма-распределения (см. введение к гл. 1), отсюда на основании задачи 5.16 находим, что при этом, поскольку L((X) = П(/гО) (см. задачу 1.39 п. 4), по формуле полного математического ожидания EX = EfE^X)) = Е(лЭ) = пак и поэтому гF») = ED@1 Х)= * , (X + ЕХ) = Х°2 па+\ ¦ Ха* , Наконец, минимизируя величину —+сп по п, получаем опти- оптимальное число наблюдений \ с J а Замечание. Число п* должно быть целым неотрицатель- неотрицательным. Поэтому, если получаем отрицательное значение, то полагаем п* = 0 (т. е. наблюдений делать не нужно), в остальных случаях в качестве искомого числа наблюдений берется наименьшее целое, большее или равное получаемого по указанной формуле значения. Это замечание относится н к последующим аналогичным задачам. 5.20. В силу задачи 5.13 п. 4) значение d* байесовской оценки при X = х находится минимизацией по d 235
Решая относительно d соотношение -т-г Е(Ц0, d)\x) = 0, получаем указанный вид б*. Далее, так как Lo( 2 Х<) — ^("' ") (см- заДачУ 1 -39 п. 2), то р я* 8 +an п А* - IJ ' Отсюда находим функцию риска Л@, б*) = Е.(в* -1)' = Оо6*У _ а2л +@ — a(l— 1)J 6V(A + n- IJ ' Наконец, гE*) = Е/?@, б*) и используя формулы для моментов гамма- распределения, приходим к указанному результату. Число п.* находится минимизацией по п величины л(б*) + сп. 5.21. Среднее и дисперсия распределения Парето с параметрами „ аа аа1 а и а>2 равны соответственно и ^ г- Отсюда а — 1 (а — 1) (а — 2) (см. задачу 5.13 п. 5) на основании задачи 5.16 имеем указанный вид оценки б*. Кроме того, получаем также, что = („ + —?(+ —2) Для нахождения риска rF*) = ED(G[AT) достаточно вычислить E(max(a, XM)f = Е[Е„(тах (а, Х(„,)J]. Запишем (max (а, *(,0)J = (а!(Хм < а) + ХМ1(ХМ > a)f = аЧ(Х(п) < а) + + ХУ(ХМ > а), где 1(А) — индикатор события А. Тогда, поскольку плотность распре- распределения Х{„) при заданном G равна пГ~'/Оя, 0^/^0 (см. зада- задачу 1.35), имеем Далее находим Е82 = D9 + (EGJ = _??L следовательно, Е[^тах(а, ^)))'I = ff ^ Z g) • Окончательно получаем, что риск байесовской оценки равен = аа2 Г( > (*-2){п + а-\у 236
Наконец, минимизируя величину г(8*) + сп по п, находим, что опти- оптимальное число наблюдений п'=(-?Ёщ)' -a+L 5.23. Искомое решение — это значение d, минимизирующее следую- следующее математическое ожидание: N N Е(Ц9, d)\h) = 2 Е[(в, —d.-JIA]= 2 Е[(9,-Е(9,|Л)J|Л] + 1=1 1=1 + 2 (Е(В,|Л)-4J = S D(9i|A)+ S (E(9,|A)-d,J. i = 1 i=l i = I Минимум этого выражения достигается при d, = Е(ОЛЛ), i = 1, ... , N, N и равен 2 D@;IЛ). Здесь (см. задачу 5.13 п. 6) и указание) i = I Е(Ш) = ^±^, р(о,|л) = ^ .; . а + п (а + пу(а + п + \) Первая формула определяет вид байесовской оценки б,*(Л), а вторая N позволяет вычислить соответствующий риск: гF*) = 2 ED(9J/i), если i = I при этом воспользоваться формулами (см. задачу 1.52 и указание) ЕЛ, = Ei^hi) = EnQi = nai/a, Eft.<A, - 1) = E(E,ft^ - 1)) = Ея(П - 1)9? = 5.24. Используя обозначения задачи 5.13 п. 7), на основании задачи 5.16 имеем, что искомая оценка при этом D(9|x) = а? ^ const, следовательно, риск г(8*) = (о~'! + + п?>~2)~'. Минимизируя по п общие затраты лF*) + сп, находим оптимальный объем выборки 5.25. 1) Пусть rf > rf*. Тогда id* — d при 9> rf, 19-d| - |9-d*l =| d + d*-29 при rf* < 9 < d, 1 d — d* при 6< d*. Так как d + d* - 29 > d* - d при d* < 9 < d, то E[A9 — rfI -|9-d*|)|*]>(d*-d)P(9>dU) + + (d *- d)P(d* < G < dU) + (d- d*)P{Q < d*U) = = {d- d*) [P(9 < d* \x) - P(9 > d*|^)]. Поскольку d* — медиана, последняя разность больше или равна 0. Аналогично рассматривается случай d < d*. Таким образом, решение 237
d* минимизирует среднюю условную (при X = х) потерю, т. е. это — байесовское решение. 2) В силу задачи 5.13 п. 7) медианой апостериорного распределе- распределения L@\x) является точка d* = \ii, следовательно, байесовская оценка по выборке X = (X Х„) имеет вид 6*Ш= " " ' "* и ее риск равен г(б*) = Е|8 - б*(ЛГ)| = Е[Е(|0 - &*(Х)\ \Х)]. Но так как условное (при X = х) распределение случайной величины О - &*(Х) есть JV(O, a?) н для L(Y) = ЛГ(О. с?) E| Y\ = -\Д-<п. то Если цена за одно наблюдение равна О 0, то, минимизируя общие затраты л(б*) + сп по п, находим оптимальное число наблюдений /а - а-2) Глава 6 6.1. Для дисперсии X справедливо представление 1 " 1 " D^=-r 2 cov (Х„, Xs) = Ar 2 Я» k.s = 1 " k.s = 1 -1[Л + ."|'A-4L к из которого при условии F.1) следует, что DX = О(—I при п-»-оо, т. е. X — состоятельная оценка. 6.3. Для среднего ЕС*(п) можно получить представление п — ft п - rt ЕС»(п) = Л* ? тг- 2 2 {Ri-, + Ri + k-,)+-r 2 Л'-.. в котором добавок к #t при условии F.1) имеет порядок о(—) , когда п-*- оо. 6.4. Здесь ЕЛ", = 0 и cov (Х„ + 1. X,) = Е(Х„ + ,, X,) = a2(cos Щ + t)cos Xt + + sin Щ + /)sin Xt) = a2cos XJf. Г 6.5. Здесь EX/ = m 2 ai и 1 при=|А°1 </" О п~ри'|/г|>г, 238
поскольку cov B;* + i _,-, !;*_;) = а2 при i — j = k и равна нулю при i - \ Ф k. 6.8. Значения коэффициентов оптимального предиктора определя- о клея по формулам р?„ = 2 R''Ri-\, где ||Я''||-= \\R,-j\\-\t, j = i = — ч = 0, —1, .... —л). Для величины а2(п) справедливо представление \) |/?(+ 2)|/|ДA)| ( [1] 2 а\п) = |/?(л () р р |, где (см. [1], с. 218) матрица Kotfi R. R\ АО /? RnR«-\...Ro 6.9. Поскольку ||р;,(ОИ = llPi/OII'i достаточно проверить равенство W+Oll = 11Рч@11 IIP./OII- Так как матрица ||ро<1)|| дважды стоха- стохастическая, то стационарное распределение является равномерным. 6.10. Пусть U, Uo, U — последовательность независимых равномерно распределенных на отрезке [0, 1] случайных величин. Определим случайные величины: 1 (i)iт Я при U< — , s l-U> =\2 ПРИ U < \ — а, 2 при и > f ; при при 1 -а; Тогда реализация цепи Маркова определяется формулами vo = So(^o), v, = s<v'-"(CA), t>\. 6.11. Имеем Ег), = 0, = A - 2а)*. 6.13. Здесь Ег|, = E[E(|v/')iv/)] = 0, так как Е?,@ = 0. Далее (см. задачу 6.9) имеем Егц + сп, = E[E(lvt + /ft + OSv/Olv<, + /, v,)]= P(v* + , = v, = + P(v4 + , = v, = 2)Ri2) = i- A + A - 2a)*) (Й' + M,2)).
ПРИЛОЖЕНИЯ 1. Нормальное распределение 1 С' Квантили распределения: р = —^^ } V2 л _ р 0,50 0,51 0,52 0,53 0,54 0,55 0,56 0,57 0,58 0,59 0,60 0,61 0,62 0,63 0,64 0,65 0,66 0,67 Up 0,000 0,025 0,050 0,075 0,100 0,126 0,151 0,176 0,202 0,228 0,253 0,279 0,305 0,332 0,358 0,385 0,412 0,440 Р 0,68 0,69 0,70 0,71 0,72 0,73 0,74 0,75 0,76 0,77 0,78 0,79 0,80 0,81 0,82 0,83 0,84 0,85 Up 0,468 0,496 0,524 0,553 0,583 0,613 0,643 0,674 0,706 0,739 0,772 0,806 0,842 0,878 0,915 0,954 0,994 1,036 Р 0,86 0,87 0,88 0,89 0,90 0,91 0,92 0,93 0,94 0,95 0,96 0,97 0,98 0,99 0,999 0,9999 0,99999 Up 1,080 1,126 1,175 1,227 1,282 1,341 1,405 1,476 1,555 1,645 1,751 1,881 2,054 2,326 3,090 3,720 4,265 2. Распределение Пуассона °° X* Значения функции 2 ~ьГе~Х k=x k- 0,1 0,2 0,3 0,4 0,5 0,6 0 1 2 3 4 1,000 0,095 005 1,000 0,181 018 001 1,000 0,259 037 003 1,000 0,330 062 008 001 1,000 0,394 090 014 002 1,000 0,451 122 023 003 240
— 0<DC040)U1^WW- О ~ CO Co — — — СП — • оооооомсослм oop- со о> со со оо а> со ЮСП44ЮСОСС0О*Г ооооооо — ооомслю^ о О О О — С О О СО СЛ О О О — СЛ О О О ^ Ф С" О — 00 -*J — — О о- о о о ю "ел "о О — CJ) N3 С?Э О Ю ** СО 00 ОО О о — оо — сосл'со'о ооо —сослало — СОООООСЛ-чЮСЛО
(О 3. Биномиальное распределение 95%-ные доверительные пределы (9|, 02) для параметра 0: Р0(Э, < 9 < е2) = 0,95 10 12 0 1 2 3 4 5 6 — 1,00 0,03 1,00 0,16 1,00 0,29 1,00 0,40 1,00 0,48 !,00 0,54 0,98 0,00 0,99 0,01 0,99 0,09 0,99 0,19 1,00 0,29 1,00 0,36 1,00 042 0,84 0,00 0,91 0,01 0,93 0,07 0,95 0,15 0,96 0,22 0,96 0,29 0,97 0,35 0,71 0,00 0,81 0,01 0,85 0,05 0,88 0,12 0,90 0,18 0,92 0,25 0,93 0,30 0,60 0,00 0,72 0,01 0,78 0,04 0,82 0,10 0,84 0,16 0,86 0,21 0,88 0,26 0,52 0,00 0,64 0,00 0,71 0,04 0,76 0,09 0,79 0,14 0,81 0,19 0,83 0,23 0,46 0,00 0,58 0,00 0,65 0,03 0,70 0,08 0,74 0,12 0,77 0,17 0,79 0,21 0,41 0,00 0,53 0,00 0,60 0,03 0,65 0,07 0,69 0,11 0,72 0,15 0,75 0,19 0,37 0,00 0,48 0,00 0,56 0,03 0,61 0,06 0,65 0,10 0,68 0,14 0,71 0,18 0,34 0,00 0,45 0,00 0,52 0,02 0,57 0,06 0,61 0,09 0,65 0,13 0,68 0,16 0,31 0,00 0,41 0,00 0,48 0,02 0,54 0,05 0,58 0,08 0,62 0,12 0,65 0,15 0,29 0,00 0,39 0,00 0,45 0,02 0,51 0,05 0,55 0,08 0,59 0,11 0,52 0,14 0,27 0,00 0,36 0,00 0,43 0,02 0,48 0,04 0,52 0,07 0,56 0,10 0,59 0,13
7 8 9 10 11 12 1,00 0,59 1,00 0,63 1,00 0,66 1,00 0,69 1,00 0,72 1,00 0,74 Прим 1,00 0,47 1,00 0,52 1,00 0,56 1,00 0,59 1,00 0,62 1,00 0,64 е ч а н и е. 0,97 0,40 0,98 0,44 0,98 0,48 0,98 0,52 0,98 0,57 0,98 0,57 Значения i 0,93 0,35 0,94 0,39 0,95 0,43 0,95 0,46 0,95 0,49 0,96 0,52 0,89 0,31 0,90 0,35 0,91 0,39 0,92 0,42 0,92 0,45 0,93 0,48 О2 помещены в 0,85 0,28 0,86 0,32 0,87 0,35 0,88 0,38 0,89 0,41 0,90 0,44 первых строках 0,81 0,25 0,82 0,29 0,84 0,32 0,85 0,35 0,86 0,38 0,87 0,41 0,77 0,23 0,79 0,27 0,80 0,30 0,82 0,33 0,83 0,36 0,84 0,38 , значения <Ь — 0,73 0,21 0,75 0,25 0,77 0,28 0,79 0,31 0,80 0,34 0,81 0,36 во вторых 0,70 0,20 0,72 0,23 0,74 0,26 0,76 0,29 0,77 0,32 0,78 0,34 0,67 0,18 0,69 0,22 0,71 0,24 0,73 0,27 0,74 0,30 0,76 0,32 0,64 0,17 0,67 0,20 0,69 0,23 0,70 0,26 0,72" 0,28 0,73 0,31 0,62 0,16 0,64 0,19 0,66 0,22 0,68 0,24 0,69 0,27 0,71 0,29 to Ы
4. Распределение /'(«) ¦&, i yj. Квантили распределения: р = ^ k,,(x)dx = —^5-—-— J *"/2 '<? x/2dx о 2 1 (л/2) 0 0,1 0,3 0,5 0,7 0,9 0,95 0,999 0,9999 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 24 25 26 27 28 29 30 0,016 0,211 0,584 1,06 1,61 .2,20 2,83 3,49 4,17 4,87 5,58 6,30 7,04 7,79 8,55 9,31 10,09 10,9 11,7 12,4 13,2 14,0 14,8 15,7 16,5 17,3 18,1 18,9 19,8 20,6 0,148 0,713 1,42 2,20 3,00 3,83 4,67 5,53 6,39 7,27 8,15 9,03 9,93 10,08 11,7 12,6 13,5 14,4 15,4 16,3 17,2 18,1 19,0 19,9 20,9 21,8 22,7 23,6 24,6 25,5 0,455 1,39 2,37 3,36 4,35 5,35 6,35 7,34 8,34 9,34 10,3 11,3 12,3 13,3 14,3 15,3 16,3 17,3 18,3 19,3 20,3 21,3 22,3 23,3 24,3 25,3 26,3 27,3 28,3 29,3 1,07 2,41 3,67 4,88 6,06 7,23 8,38 9,52 10,7 11,8 12,9 14,0 15,1 16,2 17,3 18,4 19,5 20,6 21,7 22,8 23,9 24,9 26,0 27,1 28,2 29,2 30,3 31,4 32,5 33,5 2,71 4,61 6,25 7,78 9,24 10,6 12,0 13,4 14,7 16,0 17,3 18,5 19,8 21,1 22,3 23,5 24,8 26,0 27,2 28,4 29,6 30,8 32,0 33,2 34,3 35,6 36,7 37,9 39,1 40,3 3,84 5,99 7,82 9,49 11,1 12,6 14,1 15,5 16,9 18,3 19,7 21,0 22,4 23,7 25,0 26,3 27,6 28,9 30,1 31,4 32,7 33,9 35,2 36,4 37,7 38,9 40,1 41,3 42,6 43,8 6,63 9,21 11,3 13,3 15,1 16,8 18,5 20,1 21,7 23,2 24,7 26,2 25,7 29,1 30,6 32,0 33,4 34,8 36,2 37,6 38,9 40,3 41,6 43,0 44,3 45,6 47,0 48,3 49,6 50,9 10,8 13,8 16,3 18,5 20,5 22,5 24,3 26,1 27,9 29,6 31,3 32,9 34,5 36,1 37,7 39,3 40,8 42,3 43,8 45,3 46,8 48,3 49,7 51,2 52,6 54,1 55,5 56,9 58,3 59,7 244
i+v 5. Распределение Стьюдента S(n) Значение функции t[,,n 1 t 2 i 3 5 4 5 5 5 6 7 8 9 10 12 14 16 18 20 22 24 26 28 30 ,314 ,920 ,353 ,132 ,015 ,943 ,895 ,860 ,833 ,812 ,782 ,761 ,746 ,734 ,725 ,717 ,7M ,706 ,701 ,697 ,645 12,706 4,303 3,182 2,776 2,571 2,447 2,365 2,306 2,262 2,228 2,179 2,145 2,120 2,101 2,086 2,074 2,064 2,056 2.048 2,042 1,960 31,821 6,965 4,541 3,747 3,365 3,143 2,998 2,896 2,821 2,764 2,681 2,625 2,584 2,552 2,528 2,508 2,492 2,479 2,467 2,457 2,326 63,657 9,925 5.841 4,604 4,032 3,707 3,499 3,355 3,250 3,169 3,055 2,977 2,921 2,878 2,845 2,819 2,797 2,779 2.763 2,750 2,576 245
to О, о 6. Распределение Снедекора S(n\,/i2) Значения функции Fp,n,^ при р=0,95 и р=0,99. ^ ( ) f v / Л I -J-Ло  «Левые» границы доверительных интервалов находятся из условия 10 12 20 50 100 1 2 3 4 5 6 161 4052 18,51 98,49 10,13 34,12 6,71 21,20 6,61 16,26 5,99 13,74 200 4999 19,00 99,01 9,55 30,81 6,94 18,00 5,79 13,27 5,14 10,92 216 5403 19,16 99,17 9,28 29,46 6,59 16,69 5,41 12,06 4,76 9,78 225 5625 19,25 99,25 9,12 28,71 6,39 15,98 5,19 11,39 4,53 9,15 234 5859 19,33 99,33 8,94 27,91 6,16 15,21 4,95 10,67 4,28 8,47 239 5981 19,37 99,36 8,84 27,49 6,04 14,80 4,82 10,27 4,15 8,10 242 6056 19,39 99,40 8,78 27,23 5,96 14,54 4,74 10,05 4,06 7,87 244 6106 19,41 99,42 8,74 27,05 5,91 14,37 4,68 9,89 4,00 7,72 248 6208 19,44 99,45 8,66 26,69 5,80 14,02 4,56 9,55 3,87 7,39 252 6302 19,47 99,48 8,58 26,35 5,70 13,69 4,44 9,24 3,75 7,09 253 6334 19,49 99,49 8,56 26,23 5,66 13,57 4,40 9,13 3,71 6,99
en — in о en со to — см см o> en 1Л 00 CO LO со со со" lo" о со 4- LO см" со" CO CO en со —"cm" s; in со — со со in 77 см 41 Ч" LO 00 см со см •* — а> см см СО LO СП Ю — см 00 СО t~- см — см 00 СО to О — см см t» СО СП оо а> ю оо 00 Г-- <N tO CO LO en CM en со CO — CM •* 00 CO CM <N CM CO en ^ о oo CM CM LO CO en Ю — CM in со 00 CO —, CM о 00 00 CM to о f- CM — CM ¦4" CM CO 00 со" in CO О t~- CO "" LTi t^ CO CO CD 00 — en of cm" CM О o_c-_ cm" cm" 58 со to 00 С- ю со со со оо со ю СМ СП см со со m LO О 00 LO см ч- о см О ОО со ч- 45 56 «п о t- СО 00 см со О! —• см со см t— Ч* Ч- см со СО 00 — 00 см см ел оо см — см со СО СП о со см см ело. см см 00 О СП СО — см ч< о — СП см см 1С СО СП LO — см о см — 00 см см ?0 оках IX стр сни ricnec ц л 00 О Ь- СП О LO Ч" f-- 00 СП Ч1 СО со in — LO с- in со со to — СМ Ч1 •Ч1 LO СП LO •Ч1 СП со ш f- СО 00 Ч- СМ Ч1 о ч- — СП СО Ч1 а> см СО О СМ Ч1 см — СП LO см ч- со см LO t^- см со СП О t^. см см ч- со — ч- ю см со О 00 г- со см со см со LO 00 со оо см со 00 Ч* со со см со — о со оо см со 3 Ч „. помеще ни свободь 00 СО 00 СП со" со" О) 1П •* оо со"ю" 22 § со'ю" СП СМ О со СО Tf" о см о со со" -«г" га х к о « Я- со см ю" —" !Я Я2 со h- о — •* о спел ел со 00 t^ ю со 00 СО со со со со — и S .. Ч X (U х Э а1 о о, о 2 к 247
7. Критерий Колмогорова Значения функции Х„: р = Р(О„ = sup\Fn{x)- F(x)\ > Хр) \ 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 0,10 0,950 776 636 565 509 468 436 410 387 369 352 338 325 314 304 295 286 279 0,05 0,975 842 708 624 563 519 483 454 430 409 391 375 361 349 338 327 318 309 0.01 0,995 929 829 734 669 617 576 542 513 489 468 449 432 418 404 392 381 371 Nv P П >ч 19 20 25 30 35 40 45 50 55 60 65 70 75 80 85 90 95 100 0,10 0,271 265 238 218 202 189 179 170 162 155 149 144 139 135 131 127 124 121 0,05 0,301 294 264 242 224 210 198 188 180 172 166 160 154 150 145 141 137 134 0,01 0,361 352 317 290 269 252 238 226 216 207 199 192 185 179 174 169 165 161 248
) О О О О О 01 01 01 01 01 01 0) 01 3 О О О О О 0) 0) 01 01 01 О") 0"э 01 _" ^Г ^.Г ^Г _Г ^-Г о* 000000001COS(DirtfO-00 0000000010H10H1010100 00000000H100001001 ^-Г ^-" _Г ^-Г —Г —Г -," о" I "'1 <Г^ l*'^J <Г^ С^*3 ^^ QQ f^-, |^ ^^ 00000010HH101 ^-Г —Г ~ ^" „_" о" ^- ^ч —, О 2 Q о s <- E - о ¦?• g- V/ Id о oo ОО О О г —цзо 00 00 00 _1ООРОООС10)СО —¦ЮГч-00о0 1^-1-О'^'Сч1_-. - О010H1ООГ^СО1Л-^СЧООО<Х51^СЧОООЮСО O0101iJliJl010101CJ)CJ01OOOOOOOOOOt-.r^N- Oaooi^-coaoi-oo^i 3 00 — ) Г-- Ю ЗЮ1/3 О h- СМ О О1 " —*о* о — О 24»
9. Равномерно распределенные на [0, 1| случайные числа 0,5916 6562 3127 0690 3617 7128 6635 9162 9313 8216 9470 3361 5303 1039 9031 9481 8922 5725 4398 3652 9612 6836 4601 9154 2212 7158 9192 3072 2380 3290 4448 7042 5978 7147 4386 10. — 0,486 -0,256 0,065 1,147 — 0,199 1,237 - 1,384 -0,959 0,731 0,717 3406 7463 1413 0120 6700 6396 5477 3901 5889 8851 2099 6387 5501 9430 4215 4474 6145 6542 7198 5889 0448 0101 8247 7397 8036 2036 9019 2267 4955 8562 1790 4161 5412 7403 9362 6079 8203 9711 3993 5940 6787 9121 7480 0399 4184 1992 3374 4237 6838 1197 8315 5759 2141 5643 8865 9632 8861 6883 3584 6484 5270 7880 6512 7803 2558 1932 9279 2154 5033 6122 Нормально распределенные 0,856 — 0,212 0,415 — 0,121 — 0,246 1,046 0,360 0,424 1,377 -0,873 — 0,491 0,219 — 0,169 1,096 1,239 -0,508 -0,992 0,969 0,983 - 1,096 N@, I) — 1,983 0,779 0,313 0,181 — 2,574 -1,630 -0,116 — 1,141 -1,330 -1,396 4101 1643 6253 3136 9629 3147 4513 6319 2226 0471 0836 4963 5307 4188 8764 1752 5489 7449 3687 2378 3741 2786 2196 2139 9953 7441 4728 5673 1907 5986 0833 4049 9202 8549 0193 случайные — 1,787 -0,105 - 1,339 1,041 0,279 -0,146 -1,698 -1,041 1,620 1,047 5314 5825 4135 3821 1094 2625 6213 2645 7919 9664 5050 1255 8954 2383 8382 8546 1479 1653 2311 2198 4776 5132 6570 1019 8382 4387 0115 2943 5803 1904 7005 1693 7586 6005 1987 числа — 0,261 — 0,357 1,827 0,535 — 2,056 -0,392 - 2,832 0,362 -1,040 0,089 250
1,805 1,186 0,658 0,439 1,399 0,032 0,151 0,290 0,873 0,289 0,291 2,828 0,247 0,584 0,446 0,034 0,234 0,736 1,206 0,491 1,334 0,287 0,161 •1,346 1,250 2,923 ¦1,190 0,192 0,942 1,216 0,499 0,665 0,754 0,298 1,456 0,593 -1,127 -0,142 -0,023 0,777 0.241 0.022 -0,853 -0,501 0,439 — 2,008 1,180 — 1,141 0,358 -0,230 0,079 -0,376 -0,902 -0,437 0,513 1,221 — 0,439 1,291 0,541 — 1,661 — 2,127 — 0,656 1,041 — 0,899 — 1,114 1,278 -0,144 -0,886 0,193 — 0,199 0,500 -0,318 -0,432 1,045 0,733 — 0,431 -0,135 -0,732 1,049 2,040 0,993 -1,407 — 0,504 — 0,463 0,833 — 0,957 0,525 -1,865 -0,273 -0,035 - 1,633 1,114 1,151 — 1,939 0,385 0,199 0,159 2,273 0,041 -1,132 1,119 — 0,792 0,063 0,484 1,045 0,665 0,340 0,008 0,110 1,297 -0,568 — 0,254 -0,921 -1,202 -0,288 0,630 0,375 - 1,420 — 0,151 — 0,309 1,705 — 0,145 — 0,066 1,810 -0,124 -0,106 — 1,579 0,532 — 0,899 0,410 - 1,885 -0,255 -0,423 0,857 -0,260 0,542 0,882 — 1,210 0,891 — 0,649 0,208 0,272 0,606 — 0,307 — 2,098 0,004 — 1,275 — 1,793 —0,986 -1,363 0,084 — 0,086 0,427 -0,528 — 1,433 -0,109 0,574 - 0,509 0,394 1,810 -0,537 — 1,941 0,489 — 0,243 0,531 1,164 -0,498 1,006 2,885 0,196 0,116 -1,616 1,381 — 0,394 — 0,349 0,371 -0,702 — 0,973 — 0,465 0,120 0,250 1,265 — 0,927 -0,227 -0,577 — 1,083 -0,313 0,606 0,121 0,921 0,768 0,375 -0,513 0,292 1,026 — 0,880 — 0,158 -0,831 — 0,813 -1,345 -0,515 — 0,451 1,410 -1,045 1,378 0,782 0,247 -1,711 — 0,430 0,416 0,424 0,593 0,862 0,235 — 0,853 0,484 1,458 0,022 -0,538 — 1,094 -2,830 0,953 — 1,016 -1,691 -9,558 -0,166 -0,202 0,425 0,602 0,237 -0,219 0,084 -0,747 0,790 0,145 0,079 — 1,656 — 0,344 -0,521 2,990 — 1,473 — 0,851 0,210 1,266 -0,574 - 0,566 -1,181 -0,518 0,843 0,584 0,060 — 0,491 — 1,186 — 0,762 - 1,541 — 0,444 0,658 — 0,885 -0,628 0,402 - 1,272 1,262 — 0,281 1,707 0,580 — 0,238 -0,869 - 1,726 0,417 0,056 251
11. Д-1. Датчик случайных чисел на автокоде ЭВМ серии ЕС RAN START USING *,15 STM I, 15, SA L 9,0A) L 3, 0(9) SR 2, 2 M 2,= F*843314861T О 3,=XT80000000* A 3,= F*4 53816693* N 3,=XT7FFFFFFF* ST 3,0(9) SRL 3, 7 A 3, = XT40000000T ST 3, X LE 0, X LM 1, 15, SA BR 14 SA DS 15F X DS F END 12. Д-2. Датчик случайных чисел на автокоде БЭСМ-6 RAN ,NAME, ,ATI,9 ,NTR,3 9.ХТА, ,E + N,24 ,А#Х, = 1431777206549 ,YTA, ААХ, = 0017 77777777 7777 ,АОХ,= :642 ,А + Х,= I 23235414675I ,ААХ, = 7757 7777 7777 7777 9, АТХ, NTR, 6 13.UJ. ,END, 13. Подпрограмма «ВП» (вариационный ряд) SUBROUTINE RANK (X,N) DIMENSION X(N) M=N —1 DO 2 1=1,M K=l 1 J=K+1 IF(X(K),,LE.X(J)) GOTO 2 R = X(K) X(K) =X(J) X(J) = R I/_ l( 1 IF(K.GE.l) GOTO 1 252
2 CONTINUE RETURN END Подпрограмма располагает в неубывающем порядке числа массива X(N). 14. Подпрограмма «НЧ» (нормальные числа) REAL FUNCTION RNORM (К) S=0 DO I 1=1, 12 1 S = S + RAN (K) PNORM = S-6. RETURN END Подпрограмма вызывается оператором Y=RNORM(K) УКАЗАТЕЛЬ РАСПРЕДЕЛЕНИЙ 1. Нормальное I: 9, 10, 11, 27, 29, 32, 39, 41, 43, 46, 47, N(n,aQ) 56, 57, 58, 60, 61. 2: 13, 14, 15, 16, 17, 18, 19, 20, 43, 48, 50, 52, 53, 64, 65, 66, 67, 68, 70, 71, 72, 84, 85, 86, 87, 88, 89,94, 106, 109, ПО, 114, 115, 116, 117, 118, I 19, 120, 121, 122, 123, 124, 125, 126, 131, 142, 143, 145, 146, 148. 3: 35, 45, 47, 48, 49, 50, 58, 59, 60, 61, 65, 66, 67, 73, 74, 79, 80, 84, 87. 4: 8, 9, 10, 11, 13, 14, 15, 19, 20, 21, 22, 23, 24, 25, 27, 28, 29, 34, 36. 5: 7, 8, 13, 24, 25. 2. Многомерное нормаль- |: 28, 40, 53, 59, 62, 63. 2: 39, 44, 90, ное Л/(ц, ?) 91, 92, 93, 132. 3: 52, 72, 88. 5: 11, 12. 3. Биномиальное Г: 1, 2, 12, 13, 14, 15, 16, 17, 18, 39, 52, ВЦп, р) 54. 2: 5, 6, 7, 8, 43, 48, 57, 84, 109, ПО, 133, 134, 135, 136, 148. 3: 1, 2, 5, 17, 18, 39, 40, 46, 53, 63, 75, 77. 5: 1,2, 3, 4, 13, 14, 15, 16. 4. Полиномиальное 1:3, 19, 20, 26, 39, 52, 53, 54. 2: 29, 38, М(п; pt...pN) 45, 63, 144. 3: 3, 4, 7, 8, 9, 12, 13, 20, 24, 34, 37, 38. 5: 13, 23. 5. Пуассона \- 39, 54, 55, 60, 64. 2: 9, 10, 31, 43, П(Х) 48, 58, 59, 61, 84, 97, 108, 109, 137, 138, 139. 3: 14, 15, 16, 41, 54, 64, 76, 78. 5: 6, 11, 13, 18, 19. 6. Отрицательное биноми- I: 39, 55. 2: 11, 12, 43, 48, 62, 84, 96, альное Bi(r, p) 140. 3: 42, 55. 5: 5, 13, 17. 7. Гамма Ца, X) 1:6, 7, 8, 21, 34, 39, 42, 44, 51, 55. 2: 21, 22, 30, 43, 48, 51, 73, 74, 75, 84, 104, 109, 127, 128, 130, 141. 3: 10, 11, 43, 56, 62, 68, 69. 5: 13, 18, 20. 8. Равномерное I-. 5, 19, 35, 36, 43, 46. 2: 23, 24, 25, 32, R{a,b) 79, 80, 81, 100, 101, 107, ПО, 129, 148. 253
9. Вейбулла Ща.а.Ь) 10. Коши К(а) 11. Гипергеометрическое H{r,N,n) 12. хи-квадрат х'(") 13. Бета Р(а,в) 14. Стьюдента S{n) 15. Снедекора 5(п|,п2) 16. Логистическое 17. Степенного ряда 18. Парето 19. Дирихле 20. Лапласа 21. Кептайна 22. Обратное гауссовское 23. Конечная совокуп- совокупность 3: 25, 36, 21, 22. 1: 37. 2: 3: 71. 1: 46. 2: 2: 33, 112 1: 40, 45, 1: 44, 47, 1: 47, 50, 1: 48, 49, 2: 27, 49 2: 60, 96, 5: 13, 21 5: 13, 23 2: 105 2: 95 2: 54, 2: 34, 35, 45, 26 28 1. 3: 47, 48, 59 50, 70. 4: 7fi 77, 43, 99. 57. 51, 57, , 49. 2: 51 140 36, 37, 83, 7, 12, 33, 35. 5: 13, 102, 103, 107, 130. 3: 44. , 59, 147. 3: 19. 48 5: 13, 17. Ill, 112
ЛИТЕРАТУРА 1. Ивченко Г. И., Медведев Ю. И. Математическая статистика. М., 1984. 2. Чистяков В. /7. Курс теории вероятностей. М., 1982. 3. Кендалл М., Стьюарт А. Теория распределений. М., 1966. 4. Крамер Г. Математические методы статистики. М., 1975. 5. Леман Э. Проверка статистических гипотез. М., 1964. 6. Бикел П., Доксам К. Математическая статистика. М., 1983. Т. 2. 7. Феллер В. Введение в теорию вероятностей и ее применения. М., 1984. Т. 1. 8. Ивченко Г. И., Глибоченко А. Ф., Иванов В. А., Медведев 10. И. и др. Статистический анализ дискретных случайных последовательно- последовательностей. МИЭМ. — М.: 1984. 9. Кнут Д. Е. Искусство программирования (т. 2. Получисленные алгоритмы). М., 1977. 10. Ермаков С. М., Михайлов Г. А. Статистическое моделирова- моделирование. — М., 1982.
Учебное издание Ивченко Григорий Иванович, Медведев Юрий Иванович, Чистяков Александр Владимирович СБОРНИК ЗАДАЧ ПО МАТЕМАТИЧЕСКОЙ СТАТИСТИКЕ Зав. редакцией учебно-методической литературы по физике и математике Е. С. Гридасова Редактор Ж. И. Яковлева Мл. редакторы Г. В. Вятоха, Н. П. Майкова Оформление художника И. Д. Блынского Художественный редактор В. И. Пономаренко Технический редактор В. М. Романова Корректор Г. Н. Буханова ИБ № 8011 Изд. № ФМ-942. Сдано в набор 10.03.89. Подп. в печать 19.10.89. Формат 84хЮ8'/з2- Бум. тип. М2. Гарнитура литературная. Печать высокая. Объем 13,44 усл. печ. л. 13,65 усл. кр.-отт. 14,44 уч.-изд. л. Тираж 25 000 экз. Зак. № 190. Цена 55 коп. Издательство «Высшая школа», 101430, Москва, ГСП-4. Неглинная ул д. 29/14. Ярославский полиграфкоыбинат Госкомпечати СССР, 150014, Ярославль, ул. Свободы, 97.