Текст
                    М АТ ЕМ АТ И ко-CT АТ И СТ И Ч Е С К И Е
МЕТОДЫ ЗА РУБЕЖОМ


STATISTICAL INFERENCE BASED ON RANKS THOMAS P. HETTMANSPERGER Pennsylvania State University JOHN WILEY & SONS New York • Chichester • Brisbane • Toronto • Singapore
Т. Хеттманспергер СТАТИСТИЧЕСКИЕ выводы, ОСНОВАННЫЕ НА РАНГАХ Перевод с английского Д.С. ШМЕРЛИНГА МОСКВА ’’ФИНАНСЫ И СТАТИСТИКА” 1987
ББК 22.172 Х41 МАТЕМАТИКО-СТАТИСТИЧЕСКИЕ МЕТОДЫ ЗА РУБЕЖОМ ВЫШЛИ ИЗ ПЕЧАТИ 1. Ли Ц., Джадж Д., Зельнер А. Оценивание параметров марковских мо¬ делей по агрегированным временным ря¬ дам. 2. Райфа Г., Шлейфер Р. Приклад¬ ная теория статистических решений. 3. Клейнен Дж. Статистические ме¬ тоды в имитационном моделировании. Вып. 1 и 2 4. Бард И. Нелинейное оценивание па¬ раметров. 5. Б о л ч Б. У., Хуань К. Д. Много¬ мерные статистические методы для эко¬ номики. 6. И б е р л а К. Факторный анализ. 7. Зельнер А. Байесовские методы в эконометрии. 8. Хейс Д. Причинный анализ в стати¬ стических исследованиях. 9. Пуарье Д. Эконометрия структур¬ ных изменений. 10. Драй мз Ф. Распределенные лаги. 11. Мостеллер Ф., Тьюки Дж. Анализ данных и регрессия. Вып. 1 и 2. 12. Бикел П., Доксам К. Математи¬ ческая статистика. Вып. 1 и 2. 13. Лимер Э. Статистический анализ неэкспериментальных данных. 14. Песаран М.. Слей тер Л. Дина¬ мическая регрессия: теория и алгорит¬ мы. 15. Дидэ Э. и др. Методы анализа дан¬ ных. 16. Бартоломью Д. Стохастические модели социальных процессов. 17. Дрейпер Н., Смит Г. Приклад¬ ной регрессионный анализ. Кн. 1 и 2. v 0702000000—108 X 100-87 010(01)—87 ГОТОВИТСЯ К ПЕЧАТИ Дэйвисон М. Многомерное шка¬ лирование. Редколлегияу А. Г. Аганбегян, Ю. П. Адлер, С. А. Айвазян, Б. В. Гнеден- Ёршов, ко, Э. Б Е. М. Четыркин Т. В. Рябушкин,| © 1984 by John Wiley & Sons, Inc. © Перевод на русский язык, предисловие, «Финансы и статистика», 1987
# ПРЕДИСЛОВИЕ К РУССКОМУ ИЗДАНИЮ Непараметрические ранговые методы — бурно развивающаяся об¬ ласть математической статистики. Сегодня этими методами можно ре¬ шать многочисленные задачи анализа экономических, статистических, инженерных, естественнонаучных, социологических, медицинских дан¬ ных, возникающие в процессе работы большинства ВЦ, НИИ. При их решении по традиции применяются классические методы, основан¬ ные на нормальном (гауссовском) или другом известном распределении. Этот подход имеет ряд достоинств: используется хорошо разработан¬ ный математический аппарат, по этому вопросу есть обширная литера¬ тура, но следование этой традиции создает некоторые проблемы. Во- первых, для проверки нормальности, экспоненциальности и т. п., т. е. конкретного закона распределения, необходима выборка достаточно большого объема, построение которой затруднительно и требует боль¬ ших затрат. Во-вторых, методы классического подхода могут приводить к совершенно неверным выводам из-за появления так называемых за¬ грязняющих наблюдений (выбросов и т. п.). Как показали исследования, проведенные за последние 10 —15 лет, ранговые методы в значительной мере лишены этих недостатков, они хорошо приспособлены для работы с малыми выборками, распределе¬ ния которых мы не знаем. Однако в настоящее время все еще сказывает¬ ся нехватка специальной литературы по этому вопросу. Мы надеемся, что книга Т. Хеттманспергера «Статистические выводы, основанные на рангах» частично восполнит этот пробел. Ее можно считать учебным руководством по современным непара¬ метрическим методам математической статистики с одной оговоркой — лишь методам, основанным на рангах наблюдений. Не рассматривается та часть непараметрической статистики, которая основывается на выбо¬ рочных функциях распределения и порядковых статистиках. Непараметрическую статистику, которой посвящена предлагаемая вниманию читателей книга, обычно по традиции называют ранговой. Название не вполне точное, потому что для выводов в различных си¬ туациях можно использовать и знаки наблюдений, и ранги их абсолют¬ ных значений, и знаки их разностей, и т. д. Ранговые методы выделились в особое направление непараметри¬ ческой статистики не только вследствие природы исходного материала, 5
но и по идеям его дальнейшего использования. Попытаемся дать чита¬ телю общую схему статистического вывода в таком виде, в каком она сложилась в ранговой статистике. Начнем с того, что составляет основу любого применения матема¬ тико-статистических методов — со статистической модели. Предста¬ вим ее в той форме, в какой она фигурирует в книге Т. Хеттманспер- гера. Предположим, что у нас имеются наблюдения Х1У ..., Хп, которые составляют доступный нам статистический материал — источник для наших дальнейших выводов. Каждое из этих наблюдений, по нашему убеждению, состоит из двух составляющих — закономерной и случай¬ ной. Нас интересует в первую очередь закономерная. Мы считаем, что ее величина предопределяется действием некоторого числа скрытых причин. Их в дальнейшем будем называть «параметры» и обозначать через а1У ..., ар. Нам известно, что они собой представляют и как они формируют закономерную часть каждого Хх, ..., Хп. Иными словами, неслучайная часть Xt есть известная функция ft (•) от неизвестных величин а1у ..., aq. Ту часть наблюдения Xiy которую не удается объяснить действием введенных выше параметров ах, ..., ар, мы толкуем как случайную. Обычно эти случайные части наших наблюдений Х1У ..., Хп (обозна¬ чим их через ег, ..., еп) мы предполагаем независимыми в том смысле, в котором это понимается в теории вероятностей (статистически незави¬ симыми). Кроме того, считают, что во всех случаях их порождает еди¬ ный случайный механизм, так что случайные ошибки ех, ..., еп одина¬ ково распределены. Наиболее популярна схема, где каждое наблюдение мы записываем как сумму закономерной и случайной составляющих, т. е. %i ~ fi (0) + eiy i = 1» • • • f п- (1) Если fly ...у fn — суть линейные функции, мы приходим к так назы¬ ваемой линейной модели. В определенном смысле можно считать, что линейная модель является главным объектом приложения ранговых методов в этой книге. Сказанное не означает, что экспериментальные данные могут быть описаны лишь с помощью аддитивной схемы (1) и/или, тем более, с по¬ мощью линейной модели. Например, в теории надежности для предска¬ зания срока службы изделия более подходящей может оказаться муль¬ типликативная схема, согласно которой наблюдаемые в опыте сроки безотказной работы Xt = ft (0) где ..., есть независимые, одинаково распределенные случайные величины, а множители ft (0) отражают влияние условий изготовления и/или условий работы изделия (они выражены параметрами 0). Непараметрические, в частности ранговые, статистические методы пригодны и в этом случае. Если случайные ошибки еъ ... еп в схеме (1) распределены 6
по нормальному закону, то мы имеем дело с хорошо изученной гауссовской моделью. Исходным пунктом для построения теории статистического вы¬ вода для этой модели служит задача оценивания неизвестных параметров 0 по наблюденным значениям Ль Хп. Для этого применяют метод наименьших квадратов, который широко изве¬ стен и в указанных условиях в определенном смысле является оптимальным. Если для трактовки схемы (1) применяются ранговые методы, то все начинается с проверки гипотезы #о:Ы0)=О, i=h •••> п (ну¬ левая гипотеза). Напомним, что ранговые методы базируются на переходе от исходных наблюдений Хь •••, Хп к их рангам; обозначим их через R1, ..., Rn. Рангом Ri наблюдения X* среди величин Хь ..., Хп назы¬ вают тот порядковый номер, который получит значение Xi при рас¬ становке чисел Хь ..., Хп в порядке возрастания. Поскольку значе¬ ния Ль ..., Хп зависят от случая, случайными величинами оказыва¬ ются и их ранги. Замечательно то, что при нулевой гипотезе все ранговые последовательности (общим числом п!) оказываются равновероятными — при дополнительном предположении, что слу¬ чайные ошибки распределены по непрерывному закону. (При этом предположении возможность совпадений среди Ль ..., Лп имеет вероятность 0, а потому переход от Ль Хп к их рангам происхо¬ дит однозначно.) Итак, оказалось, что при Н0 вероятность распределяется между воз¬ можными значениями ранговой статистики R (X) = (Rly ..., Rn) по правилу, свободному от влияния конкретного закона распределе¬ ния случайных величин е1у ..., еп в схеме (1). Поскольку последний за¬ кон мало известен и его применение зачастую вызывает сомнения, пере¬ ход к рангам позволяет преодолеть эти трудности. Вот главное досто¬ инство ранговых методов и причина их популярности среди исследова- телей-прикладников. Такой «свободой от распределения» при нулевой гипотезе, если сде¬ лать дополнительные предположения о свойствах распределения оши¬ бок, обладают не только ранги, но и некоторые другие статистики. Так, когда равны нулю медианы ошибок, можно использовать знаки наблю¬ дений; когда распределение ошибок симметрично (относительно ну¬ ля), — знаки и ранги абсолютных величин и т. д. Итак, пусть Y — результат такого преобразования исходной сово¬ купности данных X, что при Н0 распределение Y известно (и тем самым не зависит от закона распределения ошибок, что важно, если этот за¬ кон неизвестен). Благодаря этому гипотеза Н0 становится простой. По¬ этому для проверки '#0 оказывается возможным указать статистиче¬ ские критерии (основанные на Y)y контролируемый уровень значимости которых сохраняется при любом (из многих допустимых) законе рас¬ 7
пределения ошибок. В ряде случаев для выбора таких непараметриче¬ ских критериев (ранговых, знаково-ранговых и т. д.) удается восполь¬ зоваться теми или иными соображениями оптимальности, благодаря чему улучшаются свойства мощности этих критериев. Сама по себе проверка нулевой гипотезы бывает нужна не так уж часто. Зато с ее помощью можно оценивать неизвестные параметры. При этом сначала мы получаем для них доверительные множества, от которых затем можно перейти к точечным оценкам. Итак, предположим, что для проверки Н0 в схеме (1) мы имеем ка¬ кой-либо критерий описанного выше типа, например, основанный на рангах. Пусть А — множество принятия гипотезы Н0 с помощью этого критерия; если г — выбранный уровень значимости, то Р((Хъ..-,Хп)£А |Я0) = 1-е. (2) Теперь по наблюденному X с помощью А можно указать для неиз¬ вестного 0 доверительное множество (коэффициент доверия при этом равен 1 — е): {0 : (Хх —/1 (0),..., Хп —fn (0)) б Л}. (3) От доверительных множеств обычно легко перейти к точечной оцен¬ ке неизвестного 0. Разумеется, свойства такого рода оценок находятся в зависимости от свойств функции мощности исходного, так сказать «опорного», статистического критерия. Разумеется, переход от самих наблюдений к их рангам сопровожда¬ ется определенной потерей информации. Удивительным может пока¬ заться то, что потери эти невелики. Сравнение ранговых правил с, ус¬ ловно говоря, точными (последние можно использовать, когда изве¬ стен закон распределения ошибок) показывает это. К сожалению, для многомерных наблюдений Xt описанный выше план не действует. Многомерными здесь названы такие ситуации, ког¬ да каждое Xt представляет собой некий набор численных характери¬ стик, а не одну, как было до сих пор. В многомерном пространстве не существует линейного упорядочения, согласованного с естественной то¬ пологией. Поэтому в многомерном случае естественный переход к ран¬ гам невозможен. Не существует пока и стройной теории многомерного непараметрического анализа. «По инерции успеха» одномерных ранговых методов в многомерном случае предлагают использовать покоординатное ранжирование. К со¬ жалению, из-за взаимной зависимости отдельных составляющих каж¬ дого наблюдения получить «свободные от распределения» статистиче¬ ские правила таким путем не удается. Приходится довольствоваться перестановочными критериями, вычислительно сложными; уровень их значимости известен лишь в асимптотике. Особо следует сказать о том, как изучают асимптотические свойст¬ ва статистических правил описанного типа, в частности ранговых. 8
Для простоты будем считать, что информация о параметре накапли¬ вается со скоростью, пропорциональной числу наблюдений п. Для ранговых критериев, упоминавшихся выше, множества принятия гипо¬ тезы Н0 обыкновенно имеют вид A={X:qn(R(X))<const\, (4) где qn (•) — какая-то функция от рангов. В книге Т. Хеттманспергера qn (•) — квадрат линейной ранговой статистики. Обычно в (4) функция qn (•) должным образом нормирована, так что при п—>■ оо случайная величина qn (R (X)) при гипотезе Н0 имеет невырожденное предельное распределение. Оценка неизвестного истинного значения 0О, сделанная с помощью (3), теперь имеет вид 0„ = argmin<7 (R{X—J (0)), (5) где / (0) = (/i (0), ..., fn (0)). Трудности изучения асимптотических свойств (5) связаны с тем, что по отношению к 0 функция qn (•) не яв¬ ляется непрерывной. —>■ Путь к асимптотическим свойствам 0П лежит через замену qn(R(X — / (0)) гладкой функцией 0, скажем dn (X, 0), такой, что в окрестности (размера 1/1/п) истинного значения 0 = 0О она оказы¬ вается эквивалентной qn{')- Это означает, что их разность при оо стремится к 0 равномерно по 0 (из указанной окрестности), т. е. при П —у- оо sup | qn {R (X -/ (0)) -dn (X, 0)| -> 0, (б) 0 : ]/я |0 — 0°|< const. В таком случае (5) и Q*n=aTgmmdn(Xy 0), 0 : У'п | 0 —0° | < const асимптотически эквивалентны: при п^оо Vn{Qn-Q*n)^ 0. Изучать асимптотические свойства (7) можно с помощью методов дифференциального исчисления, подобно тому как в регулярном слу¬ чае изучают асимптотические свойства оценок наибольшего правдопо¬ добия. Та же замена qn (•) на dn (•) позволяет теми же методами вы¬ яснить и поведение функции мощности ранговых (и им подобных) кри¬ териев против альтернатив, близких к #0, единообразно вычислять 9
относительную асимптотическую эффективность ранговых статисти¬ ческих решений относительно прочих и т. д. В книге Т. Хеттманспер- гера соотношение (6) установлено с привлечением довольно сложной концепции контигуальности. Это путь непрямой и трудный. Локально¬ равномерную замену ступенчатой функции qn(-) гладкой функцией dn (•) можно провести непосредственно. Нам кажется, что в рамках подня¬ тых в книге проблем в привлечении понятия контигуальности нет осо¬ бой необходимости. Итак, мы предположили, как могла бы развиваться ранговая тео¬ рия, трактуемая в книге Хеттманспергера. В ней дается систематиче¬ ское изложение основ теории ранговых методов, представленных до на¬ стоящего времени на русском языке книгой Я. Гаека и 3. Шидака [68], справочным руководством М. Холлендера и Д. Вулфа [249а], а также «Справочником по непараметрической статистике» Р. Рунио- на; есть ряд книг по применению теории ранговых методов в биологии, экономике и т. д. Книга Т. Хеттманспергера имеет по сравнению с другими зару¬ бежными учебными пособиями [120], [152] ряд преимуществ: так, автор подробно освещает двойственность критериев и оценок, причем описа¬ ние нового материала сочетается с систематическим изложением важных для обучения вопросов. В частности, последовательно излагаются свой¬ ства классических ранговых критериев и оценки для одной, двух и k (k > 2) выборок, а также двухфакторного плана, причем обсужда¬ ются их устойчивость, чувствительность*. По книге Т. Хеттманспергера начинающий статистик-математик мо¬ жет серьезно изучить ранговые методы, а специалисту она будет весьма полезна и для чтения курсов по математической статистике, и как руко¬ водство по применению методов, не описанных до настоящего времени на русском языке. Книга снабжена обширным списком литературы, кото¬ рый поможет читателю быстро найти необходимый критерий или оцен¬ ку. Читатель, заинтересовавшийся вопросами программного обеспече¬ ния, может обратиться к [230]—[233] и [159], [160]. Ю. Н. Тюрин, Д. С. Шмерлинг * См. рецензию на книгу в Australian J. of Statistics. — 1968. — № 2. — С. 259—260. — Примеч. пер.
Посвящается Анне «О горе, горе! Тягостны последствия скоропалительных выводов!» Из современной мадригальной оперы «Сказка о маленьких цыплятах». Либретто Алисии Карпентер. Музыка Грэга Смита ф ПРЕДИСЛОВИЕ История современных непараметрических методов, основанных на рангах, довольно коротка — примерно сорок лет. Я указал несколько основных результатов. Их перечень далеко не полон. Непараметри¬ ческая статистика представляет собой область активных исследований и обязана своим развитием нескольким основным результатам. В нашей книге прослеживается последовательное развитие непара¬ метрических методов и дается их оценка, начиная с работ Ф. Уилкок- сона (F. Wilcoxon) 1945 г. и Г. Б. Манна и Д. Р. Уитни (Н. В. Mann, D. R. Whitney) 1947 г. В последующее десятилетие исследовалась асимптотическая относительная эффективность Питмена непараметри¬ ческих критериев сдвига для выяснения их локальной мощности. Дж. Л. Ходжес (J. L. Hodges) и Е. Л. Леман (Е. L. Lehmann) открыли и опи¬ сали в серии статей неожиданное свойство: небольшую потерю эффек¬ тивности непараметрических критериев в сравнении с ^-критерием в нормальной модели при значительно большей эффективности в моделях с тяжелыми хвостами распределений. В эти годы материал, посвящен¬ ный непараметрическим критериям, появляется в элементарных учеб¬ никах по анализу данных. В 1956 г. С. Зигель (S. Siegel) опубликовал первую прикладную книгу по непараметрической статистике. Она имела большой успех, особенно среди специалистов по поведенческим наукам, и даже заняла 2-е место в списке наиболее цитируемых математических и статистиче¬ ских книг за 1961—1972 гг. (на нее найдено 1824 ссылки). С 1970 г. новые книги по непараметрическим методам выходят в среднем раз в год. В 1960-е годы Дж. Л. Ходжес и Е. Л. Леман предложили точечные оценки и доверительные интервалы для параметра положения (сдвига) и доверительные интервалы, основанные на ранговых критериях. По¬ мимо этого они показали, что методы оценивания «наследуют» свойства эффективности у порождающих их статистик ранговых критериев. Было обнаружено также, что эти оценки устойчивы (робастны) по тем показателям, которые ввели Дж. У. Тьюки, П. Дж. Хьюбер и Ф. Р. Хампель (J. W. Tukey, P. J. Huber, F. Hampel) для изучения устойчивости оценок. В это же время Я- Гаек (J. Hajek) развил но¬ вый и мощный метод асимптотической теории ранговых критериев с И
метками общего вида. Дж. Л. Ходжес и Е. Л. Леман в начале 1960-х годов ввели ранговые критерии с выравниванием (aligned rank tests), которые затем интенсивно исследовали М. Л. Пури (М. L. Puri) и П. К. Сен (Р. К. Sen). Дж. Н. Адичи (J. N. Adichie) предложил и изучил ран¬ говые критерии и соответствующие оценки для простых регрессион¬ ных моделей. В 1970-х годах исследования, посвященные критериям и оценкам, основанным на рангах в линейных моделях, успешно про¬ должались. Значительная часть асимптотической теории, нужной при работе с линейной моделью, является следствием получения основных резуль¬ татов Я. Юречковой (J. Jureckova), опубликованных в 1970-х годах. Ее исследования позволяют выработать единый подход к анализу набо¬ ров сложных данных, основанный на рангах. В настоящее время бла¬ годаря развитию вычислительной техники сфера применения упомяну¬ тых эффективных и устойчивых методов значительно расширилась. Развитие единого и логически последовательного направления ис¬ следований статистических методов, основанных на рангах, для прак¬ тических приложений — вот главная цель данной книги. Изложение начинается с описания простой модели с параметром положения одной выборки, затем описывается модель с параметром сдвига для двух вы¬ борок и далее однофакторная и двухфакторная таблица, а затем общая линейная модель. В последней части исследуются методы для многомер¬ ных моделей с параметром сдвига. Проверка гипотез и оценивание ана¬ лизируются вместе, как взаимосвязанные методы, для каждой модели» По мере необходимости приводятся основные результаты и методы математической статистики. Методы делятся на 2 группы: методы выявления статистических свойств процедур и методы выявления свойств устойчивости. К первой группе относятся методы, позво¬ ляющие определить асимптотическую относительную эффективность и асимптотическую локальную мощность. Во вторую группу входят кривая влияния (influence curve) и толерантность* (tolerance) или излом ** (break-down). Показатели устойчивости занимают центральное место в современ¬ ной теории устойчивых (робастных) методов. Свойства статистической эффективности описаны для всех методов, которые приводятся в кни¬ ге. Свойства устойчивости подробно описываются для модели с одной выборкой и коротко — для простой регрессионной модели. Все статистические выводы и методы анализа данных описываются при помощи статистических моделей. Освоив материал о свойствах простых моделей и методах их построе¬ ния, читатель сможет перейти к изучению методов для общей линейной модели. Для методов, основанных на суммах рангов, мы приводим строгие доказательства. К этим методам относятся критерии, основан¬ * Выносливость, допустимое отклонение (см. [91]). — Примеч. пер. ** Поломка, распад (см. [91]). — Примеч. пер. 12
ные на статистиках знаковых рангов Уилкоксона, Манна — Уитни — Уилкоксона, Крускала — Уоллиса, Фридмена, а также ранговые кри¬ терии, базирующиеся на остатках в линейной модели. Более общие сум- мк ранговых меток обсуждаются в специальных разделах со ссылками нц источники, где есть строгце доказательства. Мы подробно рассмат¬ риваем суммы рангов по двум причинам: они хорошо известны исследо¬ вателям и их свойства могут быть изучены с наименьшей долей матема¬ тической софистики. 'Линейные модели, в том числе модели множественной регрессии и модели для различных планов дисперсионного анализа, до сих пор сис¬ тематически в работах по непараметрической статистике, как приклад¬ ных, так и теоретических, не описывались. Это серьезное упущение, поскольку большая часть исследований, посвященных анализу дан¬ ных, выполняется в рамках линейной модели. Одна из причин недоста¬ точно широкого применения непараметрических методов — отсутствие систематических разработок по приложению непараметрических мето¬ дов для линейной модели. В предлагаемой читателю книге развиваются эти методы. Более того, в ближайшем будущем для них появится про¬ граммное обеспечение. В вычислительной статистической системе Mini tab, содержащей основные программы, описывающие непарамет¬ рические методы для простых планов, появятся программы по ранго¬ вой регрессии, одновременно выполняющие проверку гипотез и оцени¬ вание параметров. Поэтому будут реализованы описанные в книге про¬ цедуры, и исследователи смогут их использовать для анализа сложных по структуре данных. В каждой главе есть задачи и упражнения. Основные результаты упражнений приводятся полностью. Для того, чтобы читатель не терял время, даны формулы. В приложении помещены основные результаты (без доказательства) математической статистики. Действие основных методов продемонстрировано на примерах. Первые три главы посвящены моделям сдвига для одной и двух вы¬ борок. В них рассматриваются конечные выборки и асимптотическая теория распределения. Приведены соответствующие критерии, точеч¬ ные оценки и доверительные интервалы. Изучаются их свойства асимп¬ тотической относительной эффективности, их кривые влияния и допус¬ тимые отклонения (излом). Большая часть материала по устойчивости процедур помещена в конце разделов. Об устойчивости, однофакторном и двухфакторном дисперсионном анализе говорится в гл. 4. Многомерная версия одно¬ выборочного и двухвыборочного критериев описана в гл. 6. Ранговым методам для линейной модели посвящена гл. 5. Материал гл. 5 требует более основательного знания математической статистики, чем преды¬ дущие. Кроме того, читатель должен быть знаком с линейной моделью в матричной записи. Книга написана на основе лекций, прочитанных автором в коллед¬ же университета штата Пенсильвания за последние 15 лет. Мой инте- 13
pec к предмету возник в ходе совместной работы в университете штата Айова с Бобом Хоггом (Bob Hogg) и Тимом Робертсоном (Tim Ro¬ bertson). Я признателен им за многие часы бесед, побуждающих к раз¬ мышлениям. Студенты и аспиранты, с которыми я общался эти годы, своей заинтересованностью способствовали развитию многих идей. Я особенно признателен Джо Маккину (Joe* МсКеап) и Джей Аубу- чон (Jay Aubuchon). Я рад возможности выразить свою благодарность Биллу Хакнесу (Bill Harkness), заведующему отделом статистики (Head of the Statistics Department) университета штата Пенсильвания, за поддержку. Я весь¬ ма благодарен Военно-морскому исследовательскому управлению (Of¬ fice of Naval Research) за финансовую поддержку исследований, отра¬ женных в гл. 5. Беа Шуб (Bea Shube) ** из издательства Джон Уайли (John Wiley) оказывала мне помощь в течение всей работы над книгой. Наконец, я благодарю машинисток Джейн Урин (Jane Ubrin), Пегги Линч (Peggy Lynch), Бонни Кейн (Bonnie Cain), Барбару Итингер (Barbary Itinger) и особенно Бонни Хеннингер (Bonnie Henninger), которая расшифровала мою рукопись. Колледж университета штата Томас П. Хеттманспергер Пенсильвания, январь 1984 г. * Joe — от Joseph. — Примеч. пер. ** Beatrice Shube — редактор издательства John Wiley, редактировала многие книги по теории вероятностей и статистике, значительная часть кото¬ рых переведена на русский язык. — Примеч. пер.
Глава 1 • МОДЕЛЬ С ПАРАМЕТРОМ ПОЛОЖЕНИЯ А ДЛЯ ОДНОЙ ВЫБОРКИ и \ ПРОИЗВОЛЬНОГО НЕПРЕРЫВНОГО РАСПРЕДЕЛЕНИЯ 1 \ 1.1. ВВЕДЕНИЕ Начнем с обсуждения ситуации, в которой наблюдения извлечены из одной генеральной совокупности, относительно которой сделаны лишь минимальные допущения. Предположим только непрерывность исходного распределения и сделаем выводы относительно параметра сдвига. Исходя из этого, мы определим меру положения для произволь¬ ного непрерывного распределения. Поскольку мы не делаем предполо¬ жений о форме распределения, две наиболее распространенные меры, среднее (математическое ожидание) и медиана, вообще говоря, не сов¬ падают. При симметрии распределения они совпадают и указывают нам центр исходного распределения. Вообще говоря, медиана имеет два преимущества перед средним. Во-первых, она всегда существует в виде точки, разделяющей распре¬ деление совокупности пополам, в то время как среднее может и не су¬ ществовать, например, в случае распределения Коши. Во-вторых, ме¬ диана весьма устойчива к небольшим возмущениям исходного распреде¬ ления. Следовательно, если в генеральной совокупности есть выбросы или грубые ошибки, их влияние на медиану будет невелико, тогда как среднее совокупности может очень сильно измениться. Далее в этой главе мы подробнее рассмотрим свойства устойчивости среднего и медианы, а пока будем пользоваться медианой совокупности как мерой положения. Настоящая глава посвящена критерию, доверительному интервалу и точечной оценке для 0 и исследованию некоторых свойств этих про¬ цедур. Многие из введенных здесь понятий понадобятся нам в дальней¬ шем, а простая модель с параметром сдвига доставляет нам весьма под¬ ходящий материал для их обсуждения. В данной главе обсуждаются асимптотические приближения уровня значимости и мощность крите¬ рия, состоятельность критерия, а также получение процедуры оцени¬ вания из статистики критерия. 15
Предположим, X — случайная величина с произвольной и непре¬ рывной функцией распределения F (х) = Р (X < х), при этом мы бу¬ дем говорить о медиане X или медиане F, что одно и то же. Эта медиана определяется как точка 0, такая, что i P(X<0) = P(X>0)>-^-. (1.1.1) В общем случае это значение медианы не единственно (см. упражне¬ ние 1.8.1). В данном случае такую неоднозначность можно устранить путем уточнения специального правила выбора медианы. В нашей книге предполагается, что медиана единственна и F — аб¬ солютно непрерывная функция распределения с плотностью распреде¬ ления / (л:) = F' (.х). Этот класс распределений мы обозначаем Q0=|F:F — абсолютно непрерывная и F(0)=-^ единственная точка| . (1-1-2) В роли выборочной модели выступает случайная выборка Хг, ..., Хп независимых, одинаково распределенных случайных величин, каждая из которых распределена по закону (функции распределения) F (х —0), F£Q0. Первая из рассматриваемых проблем вывода — проверка ги¬ потезы #0: 0 = 0 (1.1.3) против На : 0 > 0. Из всех обсуждаемых односторонних гипотез эта гипотеза — наи¬ более общая. Критерий для нулевой гипотезы Н0 : 0 = 0О, где 0О — известная постоянная, против альтернативы НА : 0 > 0О сводится к критерию (1.1.3), если заменить переменные на Y1 = X1— 0О, ..., Yn = = Хп — 0О из выборки с функцией распределения F £ £20 при Н0. Более того, мы будем, как правило, говорить о проверке односторон¬ ней гипотезы, поскольку обычно ясно, как построить соответствующие двусторонние процедуры. Наконец, отметим, что и нулевая, и альтер¬ нативная гипотезы — сложные. Но это свидетельствует лишь о том, что выборка извлекается из некоторого произвольного, абсолютно не¬ прерывного распределения с единственной медианой 0, т. е. НА фик¬ сирует только произвольное распределение с медианой больше 0. Пример 1.1.1. В начале 1950-х годов Метьюз с соавторами (G.V.T. Matthews) провел интересный опыт, основанный на ориентировании птиц в окружающей среде. Отчет об этом исследовании см. в [123], [124]. В одной из работ описывается, как голуби возвращаются «до¬ мой», преодолевая значительное расстояние по заранее намеченной трассе. Для того чтобы установить, каким образом голуби находят до- 16
pfory обратно по незнакомым ориентирам, они были выпущены по на¬ правлениям, идущим под углом 90° и 180° к истинному направлению. \ Нас интересует угол между линией полета птиц до горизонта и об¬ ратным направлением. Эти угловые ошибки измерялись от 0° до 180° выше или ниже линии возвращения. Пусть 0 — медиана совокупности угловых ошибок. Если птицы не возвращались, 0 = 90°. По одной из рассматриваемых гипотез курс прокладывался по Солнцу и фактиче¬ ски! 0 < 90°. Таким образом, нам надо построить критерий Яо:0 = 9О° против НА : 0 < 90°. Если мы обратимся к данным о птицах, выпу¬ щенных только в солнечные дни, то не сможем сделать вывод о прокла¬ дывании курса по Солнцу при отклонении Н0 : 0 = 90°, а можем за¬ ключить лишь, что птицы возвращаются (см. пример 1.5.1). В гл. 3 мы расскажем о двухвыборочных критериях, которые можно применить для Проверки факта возвращения птиц в солнечные и пасмурные дни, причем мы случайным образом распределяем птиц по солнечным и пас¬ мурным дням и сравниваем результаты. 1.2. КРИТЕРИЙ ЗНАКОВ И ЕГО РАСПРЕДЕЛЕНИЕ В настоящем разделе мы остановимся на простейшем из критериев для (1.1.3) — критерии знаков. Он описан еще Арбетнотом в 1710 г., который установил, превышает ли доля рождений мальчиков в Лондоне 1/2. Критерий знаков довольно прост, но на его базе, а также на ос¬ нове его «считающей» формы позднее были разработаны некоторые ран¬ говые критерии. Поэтому мы развиваем далее теорию критерия знаков, хотя обсуждение некоторых свойств анализируемых далее ранговых критериев — рутинная работа. Пусть S = # (А, > 0), i = 1,..., л; (1.2.1) 5 =2 s№)> /= 1 5 (х) = 1, если * > 0, и 0 — в противном случае. Правило таково: отклонить Н0 : 0 = 0 в пользу НА : 0 >0, если S > k. Само крити¬ ческое значение k определяется таким образом, что Рн0 (S ^ k) = а, где а — уровень значимости критерия. Ясно, что мы сначала должны найти распределение S в случае Я0. При Н0 : 0 = 0 s (Xj), ..., s (Хп) — независимые, одинаково рас¬ пределенные случайные величины, причем каждая из них — биноми¬ альная с параметрами 1 и р — Р (X >> 0) = 1 — F (0) = ^ и обозначается В (1, 1/2). Тогда S есть сумма п независимых, одинаково распределен¬ ных, как В (1, 1/2), случайных величин и потому имеет распределение В (л, 1/2). Критическое значение k можно найти по таблице биномиаль¬ ного распределения. 17
Заметим, что распределение S не зависит от распределения элементов нашей выборки и, следовательно, критическое зна¬ чение k можно найти, не зная F. Именно в этом смысле мы говорим о том, что S — свободная от распределения или непараметрическая случай¬ ная величина при выполнении #о:0 = 0. С другой стороны, при выпол¬ нении НА : 0 = 0' > 0 случайная величина S имеет В (/г, р)-расп|ре- деление, но теперь I р=Р (X >0) = l —F ( — в') (1.^.2) зависит от F. Следовательно, S не свободно от распределения при вы¬ полнении НА. 1 Поскольку при обеих гипотезах S = (Хь) — сумма независи¬ мых, одинаково распределенных случайных величин 5.(1, Д) с Var [s (Xf)] = Р (1 — Д) < °°, мы можем согласно центральной предельной теорс ле (теорема А8 приложения), утверждать, что -~ES (1.2.3) УЖ имеет приближенное стандартное нормальное распределение со сред¬ ним 0 и дисперсией 1 при 0 < р С 1. Эту сходимость по распределе¬ нию можно обозначить S—ES о Z ~ п (0,1). "j/"var S Учитывая (1.2.2) и В (/г, р)-распределение S, мы получаем ES=n [1—f(—0)]; varS=n[l_F( — в)| F (— 0) с ES = /г/2 и var 5 = п!4 при Н0 : 0 = 0. Эти результаты могут быть использованы для приближения критического значения &, если нет таблицы биномиального распределения. Именно а—Р (S >fe)--=P/ S~ES > *~я/2\=1—ф ) , (1.2.5) (УЖ УЖ I (уж! где через Ф (•) обозначена стандартная нормальная функция распре¬ деления. Пусть Za — верхняя a-процентная точка стандартного нор¬ мального распределения, т. е. а = 1 — Ф (Za). Тогда k—п/2 v (L2'6) kz=n/2Za У ч /2. Как видно из рис. 1.1, точность приближения можно улучшить, если учесть дискретность биномиального распределения. 18
Рис. 1.1. Нормальное приближение биномиального рас¬ пределения Выражение (1.2.6) преобразуется вычитанием 0,5 из k, k = л/2 + 0,5 + Za Vn~/2. (1.2.7) Удовлетворительное приближение к а в (1.2.5) достигается для столь малых объемов выборки, как 3 или 4. Это происходит потому, что имеет место симметрия биномиального распределения в случае Н0 : 0 = = 0. Далее мы увидим, что у ранговых критериев статистики симмет¬ рично распределены в случае Н0 : 0 = 0, и опять нормальная ап¬ проксимация уровня значимости будет неожиданно точной для малых выборок *. Табл. 1.1 иллюстрирует качество приближения для крите¬ рия знаков. Вычисления для знакового критерия приведены в примере 1.5.1. Таблица 1.1 Нормальное приближение к биномиальному распределению для р = 1/2 ил=5 с поправкой на непрерывность k Функция 0 1 3 P(S<k) 0,03125 0,1875 0,5 ф(.) 0,0367 0,1867 0,5 1.3. СОСТОЯТЕЛЬНОСТЬ СТАТИСТИЧЕСКОГО КРИТЕРИЯ В этом разделе мы обсудим понятие состоятельности критерия. Оно соответствует понятию состоятельности или сходимости по вероятно¬ сти оценок и связано с их присутствием в неравенстве Чебышева (см. * См. также [202, с. 90, формула (32)] и [207, разделы 3.1; 3.2; 3.3], где пере¬ водчик М. С. Никулин привел нужные сведения, в частности приближения Мо- ленара [321] — Примеч. пер. 19
теорему А4 приложения). Состоятельность критерия есть асимптоти¬ ческое свойство, по которому можно судить о поведении критериев в выборках больших объемов. Критерий называется состоятельным для некоторой альтернативы, если мощность обнаружения альтернативы стремится к единице при росте объема выборки и отграниченном от нуля уровне значимости. Любой подходящий критерий будет состоятельным для некоторого мно¬ жества альтернатив. Ниже мы приведем теорему, помогающую опреде¬ лить это множество. В нашей книге нулевая гипотеза обычно сложная, и мы запишем множество распределений, обозначающих нулевую гипотезу, как -null. Аналогично Qalt — сложная альтернатива. Надо проверить где G — выборочное распределение. Сейчас мы предположим, что ста¬ тистика критерия Vn, построенная по выборке размера /г, удовлетворя¬ ющая условию и определению А1 приложения, при функции \х (•), удовлетворяет ус¬ ловию Таким образом, установив стохастический предел р, (G) для стати¬ стик критерия, можно отличить нулевую гипотезу от подкласса аль¬ тернативной гипотезы. Именно это свойство критерия определяет со¬ стоятельность. Класс Йс, определяемый через p(G) в (1.3.3), называется классом состоятельности Vn. Статистики непараметрических критериев, описываемых в книге, обычно асимптотически нормальны, например критерий знаков (1.2.3). Поэтому можно найти такое критическое значение йп, что ап = Ра (Vn > kn) ->■ а при /гоо у G£ Qnuii. (1.3.4) Критерий, удовлетворяющий (1.3.4), будем называть критерием асимп¬ тотического размера а. В следующей теореме комбинируются стохастическая сходимость * и разделение по (1.3.2) и (1.3.3) с асимптотической нормальностью для получения асимптотического размера и состоятельности критерия. Допущение об асимптотической нормальности сильнее, чем это необ¬ ходимо, поскольку состоятельность по существу есть сходимость по ве¬ роятности (см. [112], где сходимость доказывается при слабых допу¬ щениях неравенства Чебышева). H0:G£ ^nuii против На z G £ &^а1ь (1.3.1) (1.3.2) \i (G) =|х0, у G£ Qnuii; И (G) > Цо, V (1.3.3) * В данном случае — сходимость по вероятности, см. определение А1 из приложения. — Примеч. пер. 20
Теорема 1.3.1. Предположим, что Vn —статистика критерия для (J.3.1), отклоняющего Н0 при больших значениях, которая удовлетво¬ ряет (1.3.2) и (1.3.3). Пусть существует такая постоянная сг0, что •)/7Г(—:~Ио) -^Z ~ п (0,1) yGg QnuU. (1.3.5) ао Торда существует такая последовательность критических значений {kn}, что Vn имеет асимптотический размер а, причем Ра {Vn > kn) -+■ 1 vG€ й0. Доказательство. Обозначим верхнюю a-процентную точку стан¬ дартного нормального распределения через Za и определим + Sr. (1-3.6) Vn При этом =Ра <Уп > К) ~Ра Vn ^ Za сг0 ап а по (1.3.5), и Vn имеет асимптотический размер а. Выберем G* из Qc и определим e=jHG^-£o_ (137) Из (1.3.3) следует, что е >0 и для достаточно больших п kn < < р0 + е, поскольку из (1.3.6) kn р0. Далее, из (1.3.7) получа¬ ем р0 = р (G*) — 2е, откуда kn< p(G*)-e. (1.3.8) Итак, | Vn — р (G*)| < е влечет за собой Vn — р (G*) >— е, откуда Vn > Р (G*) — е, откуда, в свою очередь, Vn ^ kn, причем последний вывод следует из (L3.8). Таким образом, Ра* (I Fn-p (G*) | < е) < Р0* {Vn > К) < 1. Согласно (1.3.2) левая часть стремится к 1, поэтому Pq* (Vn ^ k) 1. Поскольку G* выбрано из йс произвольно, теорема доказана. Пример 1.3.1. Состоятельность критерия знаков. Пусть S — Sin, где 5 определено в (1.2.1). Из (1.2.4) и неравенства Чебышева (теорема А4 приложения) вытекает, что Р (F, 6) — 1 Р ( 9), где F £ О0. Таким образом, ^ (f. 0)VF € йо. 0 = 0 р (F, 0) > , у F £ Q0, 0 > 0, 21
и знаковый критерий позволяет отличить нулевую гипотезу F£Q0, 0 = 0 от всех альтернативных ей F£ Q0, 0 >0. Множество состоятельности для критерия знаков есть класс абсо¬ лютно непрерывных распределений с единственной положительной ме¬ дианой. Требуемая асимптотическая нормальность следует из (1.2.3) С Р'О = 4 и а° = т • Любой подходящий критерий должен быть состоятельным, так что состоятельность не является показателем различия критериев. Если критерий не состоятелен для разумного множества альтернатив, его следует исключить из рассмотрения как непригодный (пример 1.3.2). Пример 1.3.2. Пусть Х1,...,Х71—случайная выборка из распределе¬ ния Коши с плотностью /(х—0) = ! , — 00 < X< °°. м ' я[1 + (*-0)а] Характеристическая функция равна ф(/) = exp {—|f| + idtj. Пред¬ положим, что для проверки Я0 : 0 =0 против НА : 0 >0, мы от¬ клоняем Н0 при X ^ с. Тогда характеристическая функция для X рав¬ на ' п <Ы<>=[ф(-7 = ф (/). Отсюда X имеет то же самое распределение, что и X*, т. е. независимо от п. Это означает, что функция мощности для X не зависит от п и не мо¬ жет стремиться к 1 при любом 0 >0, а таким образом статистика X не обеспечивает состоятельного критерия для любого разумно выбран¬ ного множества альтернатив. 1.4. НАИБОЛЕЕ МОЩНЫЙ КРИТЕРИЙ Теперь мы разовьем подход Неймана — Пирсона, чтобы построить равномерно наиболее мощный критерий для односторонних альтерна¬ тив. На первый взгляд может показаться весьма неожиданной сама возможность найти оптимальный критерий при такой общей постанов¬ ке задачи. Здесь дело в том, что критериев размера а весьма мало для рассматриваемой сложной нулевой гипотезы, и если один из них будет найден, то он может оказаться оптимальным. Нулевая гипотеза означает попросту, что выборка ведется из F£ £ Q0> а альтернативная гипотеза означает, что выборка берется из </ (*) = К(х—0), где A' g Q0 и в > 0. Мы используем различные обозна¬ чения для нулевой гипотезы и альтернативы (F и /С), чтобы показать их сложную природу. Можно записать гипотезы в несколько иной форме: H0:F(0) = -±-, 22
HA: l-G(0)>-i-. Любую функцию распределения G можно представить следующим обра¬ зом: G(x)=P (X <х) = = Р (X < х| X < 0) Р (X < 0) + Р (X < х| Х> 0) Р (Х>0). Напомним, что согласно (1.2.2), р = 1 — К (— 0) = 1 — G (0), и определим g_ = 0), ах если х < 0, 0 — в противном случае, то же сделаем и для g,.. (х). Теперь плотность G выглядит так: ?W=(1-P)g- (x) + pg+ (X). (1.4.1) Это позволяет отличить проверяемый параметр (медиану) от параметра формы распределения и сформировать гипотезу в терминах р. Пример 1.4.1. Положим g (х) = 1/3 для —1 < х < 2 иО — в про¬ тивном случае, причем G (х) = 0, х ^ —1, (х + 1)/3, — 1 < х< 2, 1, 2^х. При — 1 < х < 0, Р (X < х\Х < 0) = х + 1; g_ (х) = 1 при —1 < х <; 0 и 0 — в противном случае. Аналогично при 0 < х < < 2Р (Х< х | X > 0) = у ; g+ (х) = ^ при 0<х<2и 0 — в против¬ ном случае. Теперь р = 1 — G (0) = 2/3. Значит, g (х) можно рас- 2 сматривать как равномерные плотности, взятые с весом р = у . В общем случае мы можем определить распределение выборок трой¬ ки (р, g_); в нашем примере это — (2/3, g+, g_). Гипотезы превращаются в g+, <?-); НА: (р, А+, А_), где G и Н — произвольные функции распределения, соответствующие плотности. Посредством леммы Неймана — Пирсона* построим равномерна наиболее мощный критерий й обратимся затем к методу наименее бла- * См. [114, гл. 3, раздел 2]. Обсуждение теории проверки гипотез Неймана— Пирсона см. [24, разделы 5.2, 5.3 и гл. 6]. — Примеч. пер. 23
гоприятных распределений. Подход состоит из следующих четырех шагов 1. Установим альтернативное распределение и попытаемся выбрать по этому распределению сложную нулевую гипотезу так, чтобы ее как можно труднее было отличить от установленной (фиксированной) аль¬ тернативы. Если распределение выбрано правильно, это и будет наиме¬ нее благоприятное распределение. 2. Построим наилучший критерий Неймана — Пирсона размера а для этой простой гипотезы против простой альтернативы. 3. Покажем, что критерий сохраняет размер айв случае сложной нулевой гипотезы. Если это не так, то наименее благоприятное распре¬ деление, вероятно, выбрано неверно. 4. И, наконец, продемонстрируем независимость критерия от фиксированной альтернативы; таким образом, критерий равномерно наиболее мощный. Проверим это для одновыборочной задачи о сдвиге. 1. Выберем р=р' >-7f и h+1 h_ так, что альтернативой станет (ру h+, h-). Естественно предположить, что наименее благоприятным будет распределение (1/2, Л+, Л_). Используя h+ и /i_ и полагая р = 1/2, мы надеемся сделать так, чтобы было как можно труднее различить нулевую и альтернативную гипотезы. Следовательно, мы пытаемся проверить с определенными рг >1/2, h+i h_. Пример 1.4.2. Принимая во внимание пример 1.4.1, мы предпола¬ гаем, что наименее благоприятное распределение есть 2. Из леммы Неймана — Пирсона следует, что гипотеза Н0 должна быть отклонена при против НА : (р', h+, А_) — g- (*> + -у 8+ (*) = —1<%<0, 2 1/4, 0 < х < 2, О— в противном случае. П -уЛ-(*г)+Т Л+(•*«)] (1.4.2) П П [(1— р') h_ (xt) + p' h+ (*,)] 24
Пусть лг(г) — i-я порядковая статистика, и для нашей выборки стоянная, мы увидим, что наш критерий эквивалентен отклонению Н0 при S ^ ky где 5 — статистика критерия знаков. 3. Критерий знаков — критерий размера а для сложной нулевой гипотезы, поскольку он свободен от распределения. 4. Критерий знаков — равномерно наиболее мощный, поскольку критическая область не изменяется для всех р' >1/2 и любых дру¬ гих /г_, h+. Отсюда можно заключить, что если о форме распределения исход¬ ной совокупности нельзя делать каких-либо предположений, то крите¬ рий знаков будет равномерно наиболее мощным. Это означает, что для любой фиксированной альтернативы с положительной медианой нет критерия размера а с большей мощностью. Однако существует не так уж много критериев размера а для рассматриваемой здесь нулевой ги¬ потезы. Определение 1.4.1. Критерий размера а для гипотезы H0:G£ £ Qnun против На : G £ Qalt с критической областью V ^ k называ¬ ется несмещенным, если Критерий знаков для проверки Н0 : 0 = 0 против НА : 0 >0 при F£ Q0 —несмещенный критерий (см. упражнение 1.8.3). В действи¬ тельности критерий знаков не смещен в случае проверки двусторонней гипотезы Н0 : 0 = 0 против НА : 0 Ф 0; более того, он равномерно на¬ иболее мощный несмещенный критерий. Подробнее обсуждение равно¬ мерно наиболее мощных критериев см. в [114, с 147]. х(1) < .. .<*(*) < 0 < ЛГ(Л_1) < ...<Х(Л), тогда мы можем переписать (1.4.2) в виде t п (1/2)" nft- (*<«) П А+(*(0) J t±± и, следовательно, в виде Поскольку р' > -s- логарифмируя, с учетом того что k— нужная по- Ра (V > k) J ^ а для всех G£Qnuii, ^ а для всех G£Qait- 25
1.5. ОЦЕНИВАНИЕ В этом разделе мы опишем получение точечных и интервальных оце¬ нок 0, базирующихся на критериях проверки гипотез. После этого мы применим этот метод к критерию знаков. Поскольку некоторые не¬ параметрические критерии можно выразить через критерии знаков или в виде «считающей» функции, результаты, основанные на критерии зна¬ ков, непосредственно используются в таких процедурах. Это позволяет по существу без усилий строить точечные и интервальные оценки, ос¬ нованные на критерии знаковых рангов Уилкоксона и критерии ран¬ говых сумм Манна — Уитни — Уилкоксона. Необходимые нам понятия введем по ходу рассмотрения примера одновыборочного ^-критерия. Пусть jq, ..., хп — наблюдаемые значения выборки. Определим где s2 — обычно применяемая несмещенная оценка а2. На рис. 1.2 график Г(0) изображен в координатах 0, t. По горизон¬ тали расположено пространство параметров, по вертикали — выбо¬ рочное пространство статистики критерия. Нулевое распределение t (0) при допущении нормальности изображено на вертикальной оси с критическими точками двустороннего критерия размера а гипотезы Н0: 0 = 0 против На : 0 ф 0. Гипотеза проверяется путем сопоставления точки пересечения t (0) вертикальной оси с критической точкой на ней, т. е. мы отмечаем точку t (0), а (1—а)* 100-процентный доверительный интервал получает¬ 26 i в Рис. 1.2. График *(0)
ся обращением области принятия нулевой гипотезы критерия. Ясно, что на горизонтальной оси получается интервал от ©l к 0£/. Очевидно, Pq (0l < 0 < ©с/) = Pq (l^(e)l < ta/2) = I — а. Заметим, что t (0ь) = *а/2 и t (0f) = — t a/2, например, ви = x + ta/2'Sln1i2. Принцип, по которому определяем точечную оценку соответст¬ вующей t (0), таков: выбрать значение 0, соответствующее точке сим¬ метрии нулевого распределения t (0) (см. следующие разделы книги). Для приемлемых критериев эта точка—мода нулевого распределения статистики критерия. По существу мы собираемся оценивать 0 тем зна¬ чением, которое мы находим при помощи статистики критерия как цент- S Рис. 1.3. График 5(0) ра своего нулевого распределения, т. е. посредством наиболее правдо¬ подобного значения статистики критерия. Это осуществляется при t (0) = 0, откуда 0 = х. Таким образом, все выводы — и проверка гипотез, и оценивание — могут быть увязаны посредством графического представления. Бо¬ лее формально мы опишем оценки позже, а пока воспользуемся эври¬ стической интерпретацией, которую дает рис. 1.2. Для критерия знаков определим S (0) = # (Х£ > 0), i = 1, ..., п. Это можно переписать в виде S (0) = # (Хц) >0), i = 1, ..., п, где Хц) — i-я порядковая статистика. На рис. 1.3 представлена 5 (0) как функция 0 для четного размера выборки п. Нулевое распределение 5 (0), являющееся биномиальным, строится на вертикальной оси, т. е. на выборочном пространстве. Понятно, чго S (0) — неубывающая ступенчатая функция, возрастающая на каж¬ дой порядковой статистике. Более того, S (0) непрерывна справа. Та¬ ким образом, мы получаем следующие неравенства: 27
лг(Аг+1) ^ 9, если и только если S (0) ^ п—k — 1; 0< X(n-k), если и только если /г+ 1 ^ S (0). Отсюда X(k+1) < 0 < X(n_ft), если и только если k + 1 < S (0) < я — k —1, откуда (X(k+1) ^ 0 <С X(n—k) = Pq (k + I <S (0) ^ n— k — 1) = = 1 —Pq (S (0) < k) — Pe (S (0) > n -k). Заметим, что Pq (S (0) < k) = P0 (S (0) < k). Если мы из таблицы биномиального распределения выберем k так, что Р (S < k) = а/2, то [Х(ь+1), Х(П_к)] будет (1 —а) 100-процентным доверительным ин¬ тервалом для 0, не зависящим от F £ Q0. В дальнейшем мы для про¬ стоты будем использовать замкнутый интервал (отрезок) [X(fe+1), Этот интервал будет (1 —а) 100-процентным доверительным интервалом в случае непрерывности исходного распределения. Напом¬ ним, что k можно приблизить с помощью центральной предельной тео¬ ремы (см. (1.2.6)). Поскольку точка симметрии биномиального нулевого распределения есть п/2 (при четном п), то мы будем искать значение 9 так, чтобы 5 (0) = п/2*. Подойдет любое значение между Х{п/2) и X(,i/2+1), и мы договоримся брать -£• (Х(п/2) + Х(п/2+1)) е“ а ' т. е. медиану выборки. Если размер выборки — нечетное число, скажем п = 2r + 1, то доверительный интервал строится так же. В этом случае существуют два средних столбца в биномиальной гистограмме и оценкой 0 будет Х(г+1) — единственная медиана (упражнение 1.8.5). Поскольку выборочная медиана — естественная точечная оценка, полученная на основе критерия знаков, то и доверительный интервал, построенный на базе порядковых статистик, — естественный довери¬ тельный интервал с доверительным уровнем, найденный с помощью ну¬ левого распределения знаковой статистики. Теперь мы обсудим об¬ щую формулировку задачи оценивания, предложенную Дж. J1. Ход¬ жесом и Е. Л. Леманом [82], [115]. Определение 1.5.1. Предположим, Х1У ..., Хп — случайная выборка из распределения с функцией распределения F (х — 0), F£Q, а V — статистика для проверки #о:0 = 0. Определим V (0) путем за¬ мены Xt на Xt — 0,i = 1, ..., п. Пусть V (0) — невозрастающая функция 0, и нулевое распределение V = V (0) симметрично относи¬ тельно р0 и свободно от распределения F. * Так же, как для критерия Стьюдента, когда из t (0) = 0 мы получили 0 = х. — Примеч. пер. 28
Определим 0* = sup {0 : V (9) > Po}. (1 5 jx 0**== inf {0 : У (0) < p0}, 9*+ 6** Оценка 0 называется оценкой Ходжеса — Лемана параметра 0. В дополнение к этому мы определим 0l = inf{0:K(0)<C1}, (152) 0у = sup {0 : V (0) > С2}, ,^4 где Р (V > С+ = Р (V < С2) = а/2; тогда интервал [0L, 0с/] будет (1 — а) 100-процентным доверительным интервалом, основанным на V. В примере со знаковым критерием при четном п 0* = Х(п/2) и 0** = Х(п/2+1), тогда как для нечетного п = 2г +10* = = 0** = Х(Г+1). Ранговые критерии, изучаемые в этой книге, есть ступенчатые неубывающие функции от 0 с графиком, подобным изоб¬ раженному на рис. 1.3. Нулевые распределения ранговых критериев симметричные и невозрастающие (неубывающие) слева (справа) от точки симметрии. Точка (точки) максимальной вероятности называется модальной точкой. При четном п существует единственная модальная точка S; если же п — нечетное число, т. е. п = 2г +1, мы имеем 2 модальные точки: г иг+1. Оценки Ходжеса — Лемана соот¬ ветствуют этим модальным точкам, и их можно рассматривать как оценки максимальной вероятности по отношению к распределению ста¬ тистики критерия *. Если критические значения Сх и С2 — целые числа, мы можем определить 0L и как наименьшее и наибольшее решения, такие, что |/ (0^) = Сх— 1 и V(0u) = C2 + 1. Далее мы приведем теорему, согласно которой эти процедуры дают нам сдвиговые статистики (translation statistics), так что если мы при¬ бавим постоянную ко всем наблюдениям, то к оценкам надо лишь до¬ бавить эту же постоянную. Это свойство сдвига позволяет нам поло¬ жить 0=0 без потери общности при изучении свойств распределения оценок. Теорема 1.5.1. Предположим, 0, 0 L, 0 v — сдвиговые статисти- /X ки, т. е. 0 (хх + а, хп + а) = 0 (хх, хп) + а и аналогично для 0Ь и 0V * Сравните этот подход с методом наибольшего правдоподобия. — Примеч. пер. 29
Доказательство. Обозначим через Vа статистику V, вычисленную по хг + а, хп + а при некотором фиксированном а. Пусть тогда Va (0) найдено по хг — 0 + а, хп — 0 + а и потому Va (0) = = 1/(0 — а). Теперь sup {0 : Va (0) > ро} = sup {0 : V (0— а) > р0} — а + а = = sup (0 —а : V (0 - - а) > р0} -f- а = — sup {6 : V (б) > р0} 4- а. Следовательно, 0* + я, ..., + а) — 0* (*i, х,г) + Те же доводы справедливы и для 0**, 0 L, 0 v. Пример 1.5.1. Вернемся к примеру 1.1.1, где упоминается экспери¬ мент, в котором выпущенные на волю птицы летели по траекториям, проходящим под углом 90° и 180° к заранее заданным направлениям. Нас интересует угол между направлением полета, измеренный в точке исчезновения птиц за линией горизонта и обратным направлением. В табл. 1.2 приведены данные измерений траекторий полета 28 птиц в солнечный день. Все углы лежат между 0° и 180° выше и ни¬ же линии обратного направления, что не различается. Обозначим через 0 медиану совокупности угловых ошибок. Относи¬ тельно формы соответствующего исходного распределения никаких до¬ пущений не делается. Если птицы не возвращаются домой, то полага¬ ем 0 = 90°, следовательно, нам надо проверить Н0 : 0 = 90° про¬ тив НА : 0 < 90°. Обратимся к критерию знаков и соответствующей ему оценке. Для проверки #0: 0 = 90° против НЛ : 0 < 90° мы получаем S = = 2, где S = Ф (наблюдении >90°). При п = 28 мы отклоняем Н0 на уровне а = 0,018 при S <8*. Поскольку S = 2, мы легко откло¬ няем #0 на этом уровне. Оценка угловой ошибки есть медиана выбор¬ ки, и поэтому 0 = 45°. Доверительный 91-процентный интервал для 0 есть [Х(10), Х(19)) = [35, 53) с Р (S < 9) = 0,045. Следовательно, анализируя критерий знаков и его оценки, мы можем с уверенностью утверждать, что в солнечный день птицы неуклонно стремятся возвра¬ титься домой. Основное внимание уделяется сравнению двух выборок. В одной выборке птицы выпускаются в солнечный день, в другой — в пасмурный. Тогда можно установить, как птицы ориентируются по Солнцу (см. пример 1.8.11). Таблица 1.2 Измерения траекторий полета птиц в солнечный день (искусственные данные) 6, 7, 9, 17, 18, 18, 22, 28, 32, 35, 36, 42, 42, 42, 48, 48 51, 52, 53, 55, 56, 57, 58, 63, 72, 83, 91, 97 * См., например, [212]. — Примеч. пер. 30
Если наблюдения в выборке равны, то значения статистики крите¬ рия знаков для проверки нулевой гипотезы вычисляются без них, с соот¬ ветствующим уменьшением объема выборок. Эти значения не исполь¬ зуются и для оценивания. Обсуждение данной задачи и возможные аль¬ тернативы ее решения см. в [116, с. 123]. 1.6. УСТОЙЧИВОСТЬ До сих пор мы обсуждали статистические свойства критерия знаков. Робастность * статистических методов можно рассматривать как устой¬ чивость самой статистической процедуры. В частности, мы хотим из¬ бежать чрезмерного влияния на статистические процедуры небольшой доли данных. Сам ^-критерий и соответствующая ему статистика X да¬ ют нам пример процедур с высокой мощностью и эффективностью при специфической (нормальной) модели, но в значительной степени не¬ устойчивых. С одной стороны, достаточно лишь одного наблюдения для изменения t и X на произвольно большую величину. С другой стороны, критерии знаков и выборочная медиана весьма устойчивы. Можно изменить несколько наблюдений, но критерий или оценка при этом не изменятся. В последней части данного раздела мы остановимся на не¬ которых свойствах устойчивости и рассмотрим описанные ранее стати¬ стические методы в свете приведенных выше соображений. Определение 1.6.1. Предположим, для заданной оценки 0 параметра 0 существует такое целое число а, что (а) Х(а + 1) ^ 0 ^ Х(п—а)\ (б) если для любых фиксированных значений х(а+2), ..., х(п), х(а+1) —— оо, ТО 0 — оо; (в) если для любых фиксированных значений х(1), ..., х(п_а_1}, Х(п-а)-* + °°> ТО 0 -^ + ОО. Если а* — наименьшее такое целое, то 0 допускает по крайней мере а* плохих наблюдений. Толерантность** определяется как а* Т п= • п Понятие толерантности ввел Дж. J1. Ходжес [78]. Оно связано с по¬ нятием точки скачка (пороговой точки — breakdown) оценки (о поро¬ говой точке см. подробнее [69], а также [91]). Зачастую lim т77 = т, и * Здесь автор использует термин robustness (устойчивость) в узком смыс¬ ле. — Примеч. пер. ** Термин tolerance можно переводить и как «допустимая доля». — Примеч. пер. 31
асимптотическая толерантность есть пороговая точка*. При прочих равных условиях мы стремимся получить оценку с высокой толерантно¬ стью. Пример 1.6.1. Выборочное среднее X имеет толерантность 0, так как Х(1) < X < Х(п)1 откуда а* + 1 = 1 и а* = 0. Если п = 2/*, то толерантность медианы равна (г— 1)/2г; если п = 2г + 1, то толерантность равна /7(2г + 1); и в том, и другом случаях асимптоти¬ ческая толерантность есть т = 0,5. Так называемое а -усеченное сред¬ нее (а - trimmed mean) есть среднее арифметическое из лежащих в се¬ редине выборки п — 2 [ап] наблюдений, полученных после отбрасы¬ вания (отсечения) [ап] наблюдений с каждого из концов упорядочен¬ ной выборки. Поскольку а* = [ап], асимптотическая толерантность усеченного среднего равна т = а. Определение 1.6.2. Пусть V —статистика критерия, с помощью которой мы отклоняем Н0: 0 = 0 в пользу НА : 0 >0, если V > k. Предположим, существует такое целое а, что для заданных фиксирован¬ ных значений х(а+2), ..., хп значения xlf ..., х(а+1) можно выбрать так, чтобы V < k. Пусть а* — наименьшее такое целое число, тогда то¬ лерантность принятия определяется следующим образом: а* тп (принять) =—. * На с. 22 русского издания (1984 г.) книги П. Дж. Хьюбера [91] обсуждается определение пороговой точки. Пусть F — основное распределение, т. е. F — -функция распределения исходных наблюдений хъ ..., хп, статистика Тп = Тп (хъ ..., хп), LF (Тп) — функция распределения статистики. Пусть последовательность Тп получена при помощи функционала Т :Тп = Т (Fn), где Fn — эмпирическая функция распределения, причем статистика Тп состоятельна как оценка (т. е. Тп->Т (F) по вероятности) и асимптотически нормальна Ln {Vп [Тп — Т (Z7)]}—► -► N (0, A (F, Т)). Асимптотическое смещение Т (F) — Т (F0) и асимптотическая дисперсия A (F, Т) используются для количественного изучения робастности функционала Т в некоторой «окрестности» распределения F0, обозначаемой (Fo). Пример «окрестности» загрязнения: (^.)= [/=*1 F = (l—е) Fo + e^t, tf£pi}, где р, — пространство вероятностных мер. Пусть максимальное асимптотическое смещение равно b (е)= lim sup | pi (F, Тп)|, П-+00 где pi (£, Тп) — медиана распределения LF [Тп — Т (F0)]. Для указанной окрест¬ ности &}1 = pi — множество вероятностных мер в выборочном пространстве и b( 1) — наихудшее возможное значение b (обычно равное оо). Асимптотическая пороговая точка (asymptotic breakdown point) функционала Т для F0 есть е* = е* (F0, Г) = sup {е | Ь (е) < b (1)}. Пороговая точка дает, образно говоря, предел той доли резко выделяющихся наб¬ людений, с которой может «совладать» оценка [91]. Часто е не зависит даже от вы¬ бора F0. Асимптотическая пороговая точка дисперсии определяется аналогич¬ но. — Примеч. пер. 32
Поскольку V не может быть усилено для принятия нулевой гипотезы с а* или меньшим числом наблюдений, можно допустить по крайней ме¬ ре а* плохих наблюдений. Более того, для заданной выборки мы можем контролировать V при изменении а* + 1 выборочных значений *. Подобным же образом толерантность отклонения определяется как такое наименьшее целое Ь*, что для любых фиксированных значений Хь*+2, хп мы можем выбрать значения хг, ..., л>+1 так, чтобы вы¬ полнялось неравенство V ^ k. Тогда тп (отклонить) = Ь*/п. Подоб¬ ные определения для толерантности проверки гипотез дал Д. Илви- сейкер [196], а затем обсуждал X. Ридер [154]. Пример 1.6.2. Посредством критерия знаков мы можем отклонить Н0 : 0 = 0 в пользу НА : 0 >0 при S ^ k. Если зафиксировано п — k +1 меньшее нуля наблюдение, то отсюда, вне зависимости от значений оставшихся наблюдений, следует, что S <С. k. Откуда а* = = п — k и тп (принять) = (п — &)/я**. Воспользовавшись приближен¬ ным значением k из (1.2.7), получаем тп (принять) = 4— Z« 1—г ; 2 2 У п п т (принять) = lim тп (принять) =-^- . Таким образом, толерантность принятия критерия знаков зависит от уровня значимости а и сходится к толерантности медианы*** (см. ни¬ же). (О величине %п (отклонить) говорится в упражнении 1.8.6.) В упражнении 1.8.7. указано, что для статистики t величина т71 (принять) = 0. Д. Илвисейкер [196] показал, что тп (отклонить) = = [k2/(n + k2)] — 1 In, где k — критическое значение ^-критерия. Так же, как и для оценивания, для принятия или отклонения гипо¬ тезы, желательно использовать критерии с высокой толерантностью, поскольку они не подвержены изменению малой доли данных. В табл. 1.3 приведены некоторые значения толерантности критерия зна¬ ков и ^-критерия. Далее мы рассмотрим влияние изменения одного наблюдения в выборке на оценку параметра. Определение 1.6.3. Если оценка 0П построена на основании выбор¬ ки из п наблюдений, а затем добавляется наблюдение со значением х, то дифференциальное влияние на оценку измеряется кривой чувстви¬ тельности (sensitivity curve): SC (*) = (/!+ 1) (?„+!--?*). В [6] дан несколько другой, «стилизованный» вариант кривой чув- * Из определения мы видим, что а*//г = тп — допустимая доля наблюдений, изменение которых не влияет на решение о принятии нулевой гипотезы. — Примеч. пер. ** См. формулу (1.2.1) и определение (1.6.2). — Примеч. пер. *** Сравните это свойство со свойствами эффективности (АОЭ) критерия зна¬ ков и медианы. — Примеч. пер. 2 Зак. 284 33
Таблица 1.3 Толерантность критерия знаков и ^-критерия (а = 0,05) п Хп (принять) Хп (отклонить) t S t S 10 0 0,20 0,15 0,70 13 0 0,23 0,11 0,69 18 0 0,28 0,08 0,67 30 0 0,33 0,06 0,63 100 0 0,40 0,02 0,59 оо 0 0,50 0 0,50 ствительности. Девятнадцать случайных величин — математических ожиданий порядковой статистики из нормального распределения бра¬ лись из основной «выборки», и производилось изменение добавленного х, а затем вычислялась упомянутая «стилизованная» чувствительность. График «стилизованной» кривой чувствительности приведен в [6, раз¬ дел 5 Е]. Ф. Р. Хампель [69] указывает, что кривая чувствительности, под¬ ходящим образом нормализованная, в пределе соответствует кривой влияния (influence curve)*. Кривая влияния измеряет влияние доли загрязнения в исходном распределении на оцениваемый параметр' ге¬ неральной совокупности (например, на среднее или медиану совокуп¬ ности). Определение кривой влияния оценки зависит от того, можно ли представить оценку в виде функционала от эмпирической функции рас¬ пределения. Например, среднее и медиану функции распределения Я (х) можно записать в виде А (Я) = J xh (х) dx = J х dH (х) и М (Н) = (Об интеграле Стилтьеса J g (х) dH (х) см. в приложении.) Мы пред¬ полагаем существование Л (Я), а если медиана неединственна, то мы полагаем ЛГ (#) = inf {х:Я(х)> 1/2}. Вот естественные оценки А (Я) и М (Я): л {Hn) = ^xdHn (х) = п--1 т. е. выборочное среднее, М (Нп) = Нп1 (1/2), т. е. выборочная медиа¬ на. * Иногда переводится как «функция влияния» и обозначается 1с. — Примеч. пер. 34
Для измерения влияния «массы», сосредоточенной в точке у, Ф. Р. Хампель [69] предложил вычислять производную Гато * от функ¬ ционала Т (Н) по направлению функции распределения, согласно ко¬ торой вероятность для значения у равна 1. Эта производная в точности равна обыкновенной производной Т (Ht) по вещественной переменной t, вычисленной при t =0, где при х < у и 1 при у. Подробнее см. [91, разделы 1.5 и 2.5] **. Определение 1.6.4. Кривая влияния для функционала Т (•) есть Чтобы судить о робастности, желательно располагать оценками с ог¬ раниченными чувствительностью и кривой влияния. Это означает, что единичное наблюдение не может произвольно влиять на оценку. Дру¬ гое желательное свойство, может быть, лучше учитываемое кривой влияния,—это непрерывность. Наличие скачков или, наоборот, непре¬ рывность кривых чувствительности или влияния указывают на неустой¬ чивость в точке скачка. Например, оценка с такой кривой чувствитель¬ ности может неблагоприятно влиять на округление ошибки в этих точ¬ ках. Пример 1.6.3. Мы можем предположить (общность при этом не те¬ ряется), что имеется выборка из п наблюдений и по счастливой случай¬ ности выборочное среднее и медиана равны 0. Легко проверить, что для выборочного среднего SC (х) = х***. Таким образом, чувствительность линейная и неограниченная. Это означает, что изменение одного наблю¬ дения может изменить выборочное среднее на произвольно большую величину. Теперь предположим, что п = 2г, т. е. четное число, и а ее график дан на рис. 1.4. * О производной Гато см. [215], [223]. — Примеч. пер. ** А также книгу [248, с. 21—23], где Р. Хогг обсуждает эти понятия. — Примеч. пер. *** SC (хп+1) = х7г+1 — х = xn+lt так как х — 0. — Примеч. пер. Ht (х) =--(1 -0 Н (x)+tby (х), 6„ (х) = 0 Q(y) = ^-T[(l-t) H + t8y]\t=0. at X(i) < ... < X{r) <0< X(r + i) < ... < X(n). Тогда кривая чувствительности для медианы выглядит так: г), если х^ х(г), если х(г) х <;-х(г +1), г + 1), если x(r+ 1) < х, 2* 35
Пример 1.6.4. Пусть Ht (х) = (1 — t) Н (л;) + tby (х), откуда А (Я,) = J xdH (х) = j xd [(1 — t) ■ Я (х) + tbg (х)]. Следовательно, 4 A (Ht) = J xd 6У (х) - j' xd Н(х) = у — А (Я)*. Мы видим, что математическое ожидание А (Н) имеет неограничен- ную линейную функцию влияния, подобно кривой чувствительности. Если же мы положим математическое ожидание равным 0, то Q (у) =у. SC (х) Рис. 1.4. Кривая чувствительности для медианы при четном п Теперь заметим, что -j = Ht [Ht 1 = Я (Ht 1 + ПбуХ X ^Я,-1 (j)) — Я (яг1 (^))]- Значит, если h (•) — плотность рас¬ пределения для Я (•), то * Здесь используется следующее свойство интеграла Стилтьеса: если 6у (х) — 1 при х ^ у и 0 — в противном случае, a g (х) — непрерывна, то J g (*) dby {х) -= g(y). — Примеч. пер. 36
Используя определение 8и (•), предположим, что Н (•) без потери общности имеет медиану 0, тогда £2 (у) = 2h (0) 1 2h (0) 1 при у < 0, при у > 0. Это выражение можно сравнить с кривой чувствительности на рис. 1.4. Кривая влияния Q (у) — предельный случай кривой чувствительно¬ сти и имеет скачок непрерывности в точке, являющейся медианой гене¬ ральной совокупности. Обе они — кривая чувствительности и кривая влияния — ограничены, т. е. медиана совершенно нечувствительна к выбросам *. Когда оценка 0 —функционал Т (•), построенный по эмпириче¬ ской функции распределения, мы получаем 0 = Т (Fn) и 0 = Т (F). Зачастую функция влияния Q (у) имеет вид, предполагающий асимпто¬ тическое распределение оценки. П. Дж. Хьюбер [91, раздел 2.5] пока¬ зал, что при некоторых условиях регулярности 1/т (Т (Fn)-T (F)) = —1— У Q(Xt) + op( 1), (1.6.1) V П i = 1 причем Op (1) сходится к нулю по вероятности **. Центральная пре¬ дельная теорема применяется к первому члену в правой части, и, по¬ скольку а1/2 (0 — 0) = м1/2 (Т (Fn) — Т (У7)), мы получаем / ОО \ КТ(9— 0)Д Z ~ л^О, j Q2 (х) dF (jt)j , (1.6.2) ОО если функция влияния центрирована, т. е. J Q (х) dF (х) = 0. ОО Для развития более строгой теории требуется тщательный анализ остаточного члена Ор (1) для каждой оценки. Однако (1.6.2) дает нам отличный эвристический подход, обычно предполагающий предвиде¬ ние истинного асимптотического распределения. В примере 1.6.4 мы предположили, что выборка берется из Н (х — 0). Тогда кривая влияния для медианы выглядит так: f Q2 (a:) dH (х) = l/[4/t2 (0)]. * О чувствительности к выбросам см. Barnett V., Lewis О. Outliers in Statistical Data/2 nd. ed. — N.Y. e. a.: Wiley, 1984. — Примеч. пер. ** См. определение А1 приложения. — Примеч. пер. 37
При этом (1.6.2) наводит на мысль, что если 0 = med Xt, то Подробное обсуждение этого подхода можно найти в [175, гл 61. 1.7. ЗАКЛЮЧЕНИЕ. ВЛИЯНИЕ ЗАВИСИМОСТИ ДАННЫХ Если мы предполагаем, что наша выборка извлечена из абсолютно непрерывного распределения с единственной медианой 0 (1.1.2), то простой критерий знаков (1.2.1) будет равномерно наиболее мощным критерием размера а гипотезы Н0 : 0 = 0 против НА : 0 >0. При обеих гипотезах — нулевой и альтернативной — теория распределе¬ ний основана на биномиальном распределении. При Н0: 0=0 рас¬ пределение критерия знаков не зависит от распределения, из которого извлекалась выборка; таким образом, критерий знаков свободен от распределения. При обеих гипотезах статистика критерия знаков выражается как сумма независимых, одинаково распределенных случайных величин, поэтому можно воспользоваться центральной предельной теоремой для приближения вероятностей и уровней значимости. Критерий знаков не только оптимален, но и состоятелен и несмещен для любой альтер¬ нативы распределения с ненулевой медианой. К тому же, толерантно¬ сти, как принятия, так и отклонения гипотез, положительны, и пото¬ му малые доли данных влияют на процедуру не слишком сильно. Естественные точечные и интервальные оценки могут быть легко получены из знакового критерия. Точечная оценка — это медиана вы¬ борки, а интервальная оценка определяется по соответствующим поряд¬ ковым статистикам. Коэффициент доверия получается из нулевого рас¬ пределения биномиального критерия. Медиана является робастной оценкой, она имеет положительную толерантность и ограниченные кривые чувствительности и влияния. В разделе 6.2 критерий знаков обобщается на случай многомерной модели с параметром сдвига для одной выборки. В этой главе мы предполагали, что данные — независимые наблю¬ дения, подчиняющиеся модели с параметром сдвига. Большая часть свойств статистики знаков существенно зависит от допущений незави¬ симости. Для иллюстрации того, что происходит при нарушении неза¬ висимости, рассмотрим простую модель сериальной корреляции: Xlf Х2, распределены нормально со средним 0, дисперсией 1 и коэффи¬ циентом корреляции рij = р при / = i + 1 и 0 — в противном слу¬ чае. Коэффициент корреляции ограничен: — 0,5 < р < 0,5 (см. [164, раздел 10.21). Таким образом коррелируют лишь стоящие рядом слу¬ чайные величины. Предположим также, что (X,, Х*+1), i = 1,2,... имеют двумерное нормальное распределение со средним 0, дисперсией 1 и корреляцией р. Без предположения о наличии сериальной корреля- 38 (1.6.3)
дии данных для больших п, воспользовавшись критерием с номиналь¬ ным уровнем 5%, основанным на S, можно отклонить Н0 : 0 =0 в пользу НА : 0 >0 при S > п/2 + 1,645 (п) У2/2. Здесь мы прибегли к (1.2.6) и пренебрегли поправкой на непрерывность. В случае, когда выполняется нулевая гипотеза Н0 : 0 = 0 и дела¬ ется предположение о ненулевой сериальной корреляции, мы имеем ES = E2s (Х,)=пР (X > 0) = —, varS=£{v(s (X,)—!■)}* = = п var (s (Хх)) + 2 (га —1) cov^X^.s (Х2)) = = + 2 (га-1) |Р (X, > 0, Х2 > 0) —LJ , (1.7.1) поскольку vars (Хх) = Е (s (Хх))2 — ^ = ~ — \ = Таким обра¬ зом, var 5 изменяется *, появляется член с Р (Хх >0, Х2 >0), по¬ этому можно заключить, что 5 не будет теперь свободным от распреде¬ ления при Н0. В упражнении 1.8.14 требуется показать, что Р (Хг >0, Х2 >0)= = 1/4 + (1/2 я) sin-1 р. Следствием является var S = — + ——- sin-1 p. (1-7.2) 4 п В упражнении 1.8.15 нужно проверить условия теоремы А16 и, пользуясь ею, доказать, что (S — ES)/ (var S)1/2 в пределе распределено как п (0,1). Сейчас мы можем аппроксимировать истинный уровень критерия и сравнить с номинальным 5-процентным уровнем, который можно рас¬ сматривать как истинный. Пусть ат— истинный уровень значимости, тогда для больших п ат = Р (s>—+ 1,645 -bllL.) =1_ф( 1,645Г'п + = 2 2 ' \ fvarS / 1—ф(—— Л. (1.7.3) sin-1 р j 1,645 V 1 + (4/я) sin" Итак, пренебрегая сериальной корреляцией, мы получаем крите¬ рий с номинальным уровнем 5 %, основанный на выборочном среднем, и с помощью этого критерия мы отклоняем Н0 : 0 = 0 при n1/2 X > > 1,645. Если справедлива Н0 : 0 = 0 и приложима модель сериаль¬ ной корреляции, то Е (пУ2Х) = 0, var (пг/2Х) =1 + 2 (п — 1) pin При нулевой корреляции var S = я/4 (см. раздел 1.2). — Примеч. пер. 39
и статистика /г1/2 X распределена нормально, поскольку она — ли¬ нейная комбинация нормально распределенных случайных величин. Истинный уровень значимости равен ат: gT = Р(]/я~Х> 1.645) = /Т ^П Х — >— 1,645 = L ]Л + 2(п-1) р/я 1^1+2 Xfl-1) р/п. = (1.7.4) I Kl + 2p / В табл. 1.4 мы приводим истинный уровень значимости для критериев знаков и X при различных значениях р. Таблица 1.4* Истинные уровни значимости для 5-процентных критериев 5 и X р Критерии — 0,49 — 0,4 — 0,3 — 0, 2 — 0, 1 0 X 0,000 0,000 0,005 0,017 0,033 0,05 S 0,003 0,009 0,018 0,028 0,039 0,05 ра 0,000 0,000 0,006 0,018 0,033 0,05 Р Критерии 1 0, 1 1 1 1 1 0,2 1 0,3 0,4 0,49 X 0,067 0,082 0,097 0,109 0,121 S 0,061 0,071 0,081 0,092 0,100 ра 0,067 0,081 0,095 0,107 0,119 Та — критерий знаковых рангов Уилкоксона, см. (2.7.12). Мы видим, что истинные уровни значимости обоих критериев могут быть весьма далеки от номинального уровня. Критерий знаков не толь¬ ко перестает быть свободным от распределения при Я0, но и изменяется почти так же, как критерий X. Когда корреляция положительна, мы стараемся учитывать «слишком много» отклонений при больших значе¬ ниях наблюдений, которые как бы подтягивают другие наблюдения. Так, если р = 0,4, критерий отклоняют Н0 примерно в 10 % случаев вместо ожидаемых 5 %. * Здесь полезно вычислить относительную ошибку, см., например, [225]; б = (а* — а)/а, где а — номинальный уровень значимости критерия, а* — уровень значимости при*аппроксимации или в изменившихся условиях. Например, для Х\ р = 0,2 б = 6(р) = 6_ (0,2) = (0,082 — 0,050)/0,05 = 0,032/0,050 = 64%. — Примеч. пер. 40
Ясно: даже наиболее робастные процедуры могут быть весьма не¬ надежны при самых простых моделях зависимости данных. Дж. Л. Гаствирт и Г. Рубин [61] сделали те же самые выводы для более общих моделей авторегрессии. Они же в 1975 г. изучили поведение робастных оценок для зависимых данных. 1.8. УПРАЖНЕНИЯ 1.8.1. Постройте распределение с несколькими медианами. 1.8.2. При п = 10, а = 0,547: А. Постройте критерий знаков для Н0: 0 = 0 против НА: 0 > 0. Б. Найдите точное значение мощности для п (1,1) и двойного экспоненциаль¬ ного распределения с В. Найдите приближенную мощность для распределения п (1,1), при нор¬ мальном приближении с поправкой на непрерывность. Г. Предположив, что F есть л (1,1), найдите мощность критерия, основан¬ ного на X. 1.8.3. Докажите, что при проверке Я0: 0 = 0 против Нл: 0 > 0, F£Q0 кри¬ терий знаков строго не смещен, т. е. что для допускаемых значений а, Рн (5 ^k) = а и PG (S > ^ > а. для любой функции распределения G £ Qalt- Указания. Воспользуйтесь представлением биномиального распределения через интеграл — бета-функцию. 1.8.4. Предположим, что с помощью критерия V можно отклонить Яо:0=О в пользу НА : 0 >0 при k. Пусть V (0) равно У, вычисленному по Хг — 0, ..., Хп— 0. Причем (V ^ k) = а и V (0) — невозрастающая функция 0. Докажите, что PQ (V ^ k) а для всех G из йац. Таким образом будет доказано, что V — несмещенный критерий. 1.8.5. Постройте график 5 (0) для нечетного п и укажите точечные и интер¬ вальные оценки. 1.8.6. Для критерия знаков найдите толерантность и покажите, что она схо¬ дится к толерантности медианы при п. 1.8.7. Покажите, что для критерия t толерантность принятия равна нулю. 1.8.8. Постройте кривую чувствительности для медианы при четном п. 1.8.9. Постройте кривую чувствительности для усеченного среднего, опре¬ деленного в примере 1.6.1. 1.8.10. Предположим, что F — симметричная относительно нуля функция, и определим Т (F) = 0 дает точку симметрии. Тогда Ха = Т (Fn) есть a-усеченное среднее. Покажите, что функция влияния равна * Это распределение лучше называть двусторонним экспоненциальным, по- /(л:)=2-!ехр { — \х— 11}*.
Таким образом, если выборка производится из F (х — 0), F £ Qs, по (1.6.2) мы получаем, что случайная величина п^2 (Ха — 0) асимптотически нормальна при среднем 0 и дисперсии. ”■ II! '*1 т d‘+2a |f “'М ■ где b = — а = — F-1 (a), a Qs определено в разделе 2.1.1. 1.8.11. В примере 1.5.1 приведены ошибки измерений угла между направле¬ нием полета, измеренного в точке исчезновения птиц за линией горизонта и об¬ ратным направлением для 28 птиц, выпущенных в солнечный день. Следующие данные относятся к выборке из 13 птиц, выпущенных в пасмурный день (угловые ошибки измерены в градусах): 8, 10, 38, 43, 45, 57, 73, 76, 83, 105, 112, 126, 141. Постройте приближенный 5-процентный критерий знаков Я0: 0 = 90° про¬ тив ЯА : 0 < 90° и примените его к данным. Также найдите оценку 0 и прибли¬ женный 90-процентный доверительный интервал для 0. Как и в примере 1.5.1, 0 — медиана совокупности угловых ошибок. 1.8.12. Определим S* = # (Xi >0) —# (Xt < 0). Найдите среднее, дис¬ персию и распределение S*. Пусть sgn (х) = 1, 0, или — 1 при х > 0, = 0 или п <0, соответственно. Тогда S* = 2 s£n №)• Определите соотношение между 1 5и 5*. Вычислите предельное распределение S* и опишите построение довери¬ тельного интервала для 0, основанного на S*. 1.8.13. Пусть Xlf Х2, ..., Х2п — независимые наблюдения, причем распреде¬ ление Xt имеет функцию распределения F (х — 0^), где F — симметричная отно¬ сительно 0 функция. Для проверки Я0: 01 = ... = 02п против НА : 0Х< ... ^ гДе хотя бы одно неравенство строгое, рассмотрим критерий знаков Кокса—Стьюарта [39] для тренда: 5= 2 s(^n+i — s (х) = 1 при х>0 и 0 —в противном случае. i= 1 A. Определите pt = Р (Xn+i > Хь), i = 1,2 ... и qt = 1 — pt. Пусть Z( = s (Xn+i — Xt) — pt. Воспользуйтесь теоремой A6 приложения для доказательства того, что S-|> о >Z ~ /1(0, 1), ]/ SpiVi причем 2*? PiQi — расходящийся ряд. Б. Обсудите случай малой выборки и асимптотическое распределение 5 при Я0. B. Покажите, чго S = S/ti дает состоятельный критерий, откуда 42
Покажите, что, в частности, при 0П+* —9* = Л>Одлявсех/ = 1, 2, ..., 2 п критерий состоятелен. Указание. Используйте факт асимптотической нормаль¬ ности при альтернативах, приведенных в п. А. 1.8.14. Пусть случайная величина (X, У) имеет двумерное нормальное рас¬ пределение со средним О, дисперсией 1 и коэффициентом корреляции р. Пока¬ жите, что Р (X < О, Y < 0) = Р (X > 0, У > 0) = 1/4 + (1/2я) sin-1 р. Указание. Перейдите к полярным координатам. 1.8.15. Пусть ХгХ2, ... — нормально распределенные случайные величины с математическим ожиданием 0, дисперсией 1 и корреляцией согг (Xiy Xj) = p при / = i + 1 и 0 — в противном случае. Покажите, что в данном случае можно при¬ менить теорему А16 приложения, и докажите, что д1/2 ^5 — распределено асимптотически нормально со средним 0 и дисперсией о2 — 1/4 + 2 {Р (Хх > 0, Х2 > 0)— 1/4}, гдeS = /i“1 2s (X*). 43
Глава 2 # МОДЕЛЬ С ПАРАМЕТРОМ СДВИГА ДЛЯ ОДНОЙ ВЫБОРКИ С СИММЕТРИЧНЫМ НЕПРЕРЫВНЫМ РАСПРЕДЕЛЕНИЕМ 2.1. ВВЕДЕНИЕ В первой главе мы установил и,что при отсутствии допущений об ис¬ ходном распределении критерий знаков — равномерно наиболее мощ¬ ный критерий размера а при выполнении односторонней гипотезы о медиане. Таким образом, если не сделать дополнительных предположе¬ ний, нет причин применять другие критерии. Если же мы делаем бо¬ лее ограничительные предположения, например исходную совокуп¬ ность предполагаем нормальной, то можно опять пытаться найти опти¬ мальные процедуры. В случае задачи о сдвиге подобные процедуры для нормальной модели основаны на выборочном среднем. В настоящей гла¬ ве мы обойдемся без предположения нормальности, а воспользуемся предположением о симметрии исходной совокупности, выясняя, как можно строить другие статистические процедуры, например ранговые критерии, используя эту информацию. Как правило, теория распределений для рангового критерия более сложна, чем для критерия знаков. При выполнении нулевой гипотезы статистику рангового критерия можно представить в виде суммы хотя и независимых, но неодинаково распределенных случайных величин. Когда мы переходим к альтернативным гипотезам, процедуры утра¬ чивают свойство независимости. Значит, необходимо прибегнуть не к центральной предельной теореме, а к какой-то другой. Для сравнения статистических процедур мы также вводим понятие асимптотической эффективности. Эффективность — локальная мера качества и хорошо действует лишь вблизи нулевой гипотезы. Несмотря на то что она не так информативна, как кривая мощности, работать с ней легко. Упоми¬ наемые исследования показывают, что часто на практике асимптоти¬ ческие результаты, относящиеся к эффективности, получаются для малых выборок *. В примере 2.1.1 мотивируется допущение симметрии для парных данных в зависимости от мощности. * См., например, [229], где приведены ссылки на подобные работы. — При¬ меч. пер. 44
Пример 2.1.1. Допустим, что пары случайных величин (7\ С), представляющие собой отклики по обработке и контролю *, имеют сов¬ местную функцию F (t, с). Предположим, что обработка и контроль на¬ значаются объектам эксперимента независимо и случайно. Тогда сог¬ ласно нулевой гипотезе об отсутствии различия между обработкой и контролем F (t, c) — F (с, t). Далее мы определим X = Т — С как обычную переменную для анализа данных. Тогда задача сводится к работе с одновыборочной мо¬ делью, где наша гипотеза относится к G (х) = Р (X < х). Если нулевая гипотеза справедлива для F (ty с) = F (с, t), то Р (Т — С < х) ■-■= Р (С — Т < х) = Р (— (Т — С) < *), и пото¬ му X и — X имеют одинаковые распределения. Это означает, что при нулевой гипотезе разность X = Т — С распределена симметрично относительно 0. Если же альтернатива такова, что вследствие влияния обработки прибавляется постоянная к контролируемой переменной, то мы будем проверять Н0 : 0 =0 против НА : 0 >0, где 0 — центр генеральной совокупности разностей, из которой мы извлекали выборку. Конечно, можно привести неопровержимые доводы, подтверждаю¬ щие наличие симметрии у исходного распределения в одновыборочной задаче о параметре сдвига. Мы можем судить об этом по данным, полу¬ ченным согласно планам парных наблюдений. Другой подход, которого придерживаются многие специалисты в области анализа данных, за¬ ключается в преобразовании данных. Однако преобразование зачастую базируется на данных, и это затрудняет интерпретацию уровней зна¬ чимости и доверительных коэффициентов. Введем подкласс Qs симметричных распределений, центрируемых в 0. Пусть Q8 = {F:F£Q0 и F(x)=\-F (-х)}. (2.1.1) Поэтому X (или F) называется симметричным относительно нуля, а О есть единственная медиана или среднее (если оно существует). Модель выборки задается случайной выборкой Xlt ..., Хп с функцией распреде¬ ления F (х — 0), F£ Qs. Тогда 0 — единственная медиана и среднее (если оно существует), и центр распределения. В этой модели выбора мы предполагаем, что влияние эксперимента проявляется исключительно в изменении параметра положения. Так бывает не всегда; позже мы увидим, что эффект может приводить * Автор пользуется обычной терминологией математической статистики и планирования эксперимента, речь может идти об обрабатываемой и контрольной совокупностях, например, больных, которым давали или не давали новое лекар¬ ство (см. [211, гл. 2]). — Примеч. пер. 45
к асимметрии, так что ранговые критерии будут стремиться отклонить нулевую гипотезу (пример 2.5.1). Однако, если далее не уточнять, гипо¬ тезы таковы: Яо:0- О, НА : 0 > О при F£QS. Пример 2.1.2. М. Розенцвейг и его соавторы [155] исследовали в 1960 г. влияние окружающей среды на формирование мозга. Гипотеза о наличии такого влияния встречается в работах итальянского анатома Гаэтано Малакарне (1780-е годы). В одном из более поздних экспери¬ ментов по три самца крысы из 12 пометов были рассажены случайным образом по стандартным лабораторным клеткам. В одну клетку поло¬ жили разные игрушки («обогащенная среда»), другая была пуста («не- обогащенная среда») — в ней крысы жили в изоляции. В ходе опыта использовались различные меры веса мозга и его энзимной * деятель¬ ности. Например, вес коры головного мозга крыс измерялся через опре¬ деленное время. Если мы сравним параметры мозга крыс из разных кле¬ ток, то получим данные парного опыта. Пары составляются по данным о крысах всех пометов с соблюдением генетического состава пометов. Пусть X (Y) — измерение в необогащенной (обогащенной) среде, тог¬ да основная интересующая нас случайная величина есть D — Y — — X. При нулевой гипотезе об отсутствии различия в воздействии двух сред D имеет симметричное относительно нуля распределение. Если мы обозначим через 0 центр распределения, тогда опыт даст 12 наблю¬ дений Dlf ..., D12 для проверки Н0 : 0 ==0 против НА : 0 >0. Данные приведены в примере 2.3.1. 2.2. КРИТЕРИЙ ЗНАКОВЫХ РАНГОВ УИЛКОКСОНА Для построения критерия знаков со статистикой S 2s (Xj) используется информация лишь о знаках наблюдений, нет никакой метрической информации о том, насколько наблюдения отстоят от ну¬ ля. Однако для симметричного относительно нуля распределения век¬ тор абсолютных значений служит достаточной статистикой (см. [114]). Абсолютное значение в точности равно расстоянию величины от 0, если распределение симметрично, поэтому разумно использовать эту инфор¬ мацию. В общем случае ранг величины Zt относительно Zl9 ..., Zn — число Zh < Zb k = 1, ..., п. Таким образом, ранг наблюдения Zt есть его место в упорядоченном наборе Z(i) < .. .< Z(n). * Энзимы — это ферменты. — Примеч. пер. 46
Вернемся к модели выборки: Xi, Хп — независимые, одинако¬ во распределенные случайные величины с функцией распределения F (х — 0), F£ мы ранжируем IXJ, |ХП| и определяем статистику Т как сумму рангов положительных элементов выборки относительно абсолютных значений. Мы отклоняем Н0 : 0 = 0 в пользу НА : 0 >0 при Т > k, где k определяется из нулевого распределения Т. Статистику Т предложил Ф. Уилкоксон [193]. Она известна как ста¬ тистика знаковых рангов Уилкоксона. Если 0 >0 и симметричное распределение сдвинуто вправо, то положительные наблюдения стре¬ мятся быть дальше от нуля, чем отрицательные наблюдения. Отсюда Т стремится быть больше и отклонять Н0 : 0 = 0. В отличие от статисти¬ ки критерия знаков статистика Т учитывает расстояние наблюдений от¬ носительно 0 посредством ран¬ гов. Как было замечено выше, может случиться так, что меди¬ ана — ноль, а распределение скошено вправо (см. рис. 2.1). Из рисунка видно, что Т стремится быть больше, даже если медиана равна 0. Поэтому допущение о симметрии необхо¬ димо, чтобы можно было одно¬ значно интерпретировать боль¬ шие значения Т. Если известна медиана генеральной совокупности, то Т дает критерий симметрии. Определим Wj = 1, если |Х|(7) соответствует положительному наблюдению*, 0 — в противном случае, (2.2.1) причем |X|(i) < ... < |Х|(П) — упорядоченные абсолютные значения. Тогда Рис. 2.1. Скошенное вправо распределе¬ ние с медианой 0 Г= 2 IWj =ZRjs(Xj)- (2.2.2) / =i /= i статистика критерия знаковых рангов Уилкоксона, где Rj — ранг |Для изучения теории распределения Т нам понадобятся сле¬ дующие обозначения. Определение 2.2.1. Если Rj —ранг \Xj\, то |Х7| = \X\(Rj). Антирангом называется такая величина Djy что \XD.\ = Значит, Dj есть индекс такого X, которое соответствует /-му абсолют¬ ному значению. * Т. е. если наблюдение X, которому соответствует |Х|(7-), положительно.— Примеч. пер. ** Здесь s (Xj) = 1, если Xj >0, и 0 — в противном случае. — Примеч. пер. 47
Из определения Dj и из (2.2.1) следует, что WJ = s(XD.)t (2.2.3) где s (х) = 1 при х >0 и 0 — в противном случае *. Теорема 2.2.1. При нулевой гипотезе Н0 : 0 = 0, F£ Qs, s (Xj), ..., s (Xn) и вектор (Rlt ..., Rn) взаимно независимы. Доказательство. Поскольку пары случайных величин (s (Хг), |Хг|), i = 1, ..., п независимы, нам надо сначала показать, что s (Xi) и |Х*| независимы. Рассмотрим P(s (Xi)=l,\Xi\^x) = P(0<Xi <*) = = F(x)-F( 0) = = (1/2) (2F (х)-1) = = P(s (Xi)=l).P(\Xi\^x). Аналогично для Р (s (Х() = 0, [Х;1 < *)• Таким образом, s (Хг) и |Х;| независимы. Поскольку Rn) — функция от |Х]|, |Х„|, тео¬ рема доказана. Теорема 2.2.2. При нулевой гипотезе #о:0 = 0, F£QS, Wx,...,Wn независимы и одинаково распределены с Р (Wi = 0) = Р (Wi =1)= 1/2. * Антиранги наряду с рангами применяются при построении статистиче¬ ских критериев (см., например, [342]). Другое определение антирангов таково: если rj — ранг Xj, причем г;- — k, то антиранг k-vo объекта равен Dk ~ /, /, k = 1, ..., п. Пример № наблюдения 1 2 3 4 5 6 Наблюдение, Xj 7 12 ,3,8 40,5 0,6 4,2 Порядковая статистика, Х(;) Х(1) < . . . <.Х(П) 0,6 3,8 4,2 7 12 40,5 Ранг, rj 4 5 2 6 1 3 Антиранг, Dh 5 3 6 1 2 4 По формуле: если rj = k, то Dh = j\ вычисляем /?i=4, /?2 = 5, #з = 2, /?4 = 6, Rs== 1, #6 = 3, откуда D4 = 1, D5=2, D2=3, D6 = 4, £>i = 5, D3=6. Данные сведены в приведенную выше таблицу. — Примеч. пер. 48
Доказательство. Пусть D = (Dly ..., Dn) и d = (dl9 ...,dn), тогда *, ифюльзуя (2.2.3) и теорему 2.2.1, мы получим p\W1 = W1,...,Wn = Wn)=: = 2 £ (S (Xd.) = шх, . .., s (XDj1) = IL> = d) P (D = d) = d = (s (**.) = Wu...ts (Xdn) = wn) P (D = d) = = (1/2)». Отсюда P (W± =wl9 Wn= wn) = Щ P (Wt = wt)9 P (Wt = = wt) = 1/2, и теорема доказана. Итак Т = 'ZjWj представляет собой линейную комбинацию неза¬ висимых, одинаково распределенных случайных величин, В (1,1/2)** при Н0 : 0 = О, F£ Qs. Этот результат непосредственно приводит нас к теории распределения при #0, и можно видеть, что Т — свободный от распределения критерий при Н0. Хотя распределение Т и нельзя представить аналитически, из следующего примера видно, что распре¬ деление можно просто вычислить. Пример 2.2.1. Для выборки размера 4 приведем возможные ранги абсолютных значений с произвольно выбранными знаками с вероят- ностью 1/2. Мы приводим 24 = 16 конфигураций (наборов знаков). Поскольку каждой конфигурации знаков соответствует вероятность (1/2)4 = 1/16, мы можем перечислить все вероятности для Т. Напри¬ мер, Р (Т = 10) = 1/16, Р(Т = 6) = 2/16 и т. д. Если мы договоримся отклонять Н0 :0 = 0 при Т > 9, то размер критерия равен а = Р (Т ^ 9) = £• Ранг Значение Г 1 2 3 4 Знак + + + ■ + 10 — + + + 9 + — + . + 8 + + — + 7 + + + — 6 — — + + 7 — + — + 6 — + + — 5 * Здесь Dud — векторы антирангов. — Примеч. пер. ** В (п, р) — биномиальное распределение, п — число испытаний; р — вероятность успеха. — Примеч. пер. 49
Среднее и дисперсию Т при Н0 легко получить с помощью теоремы 2.2.2 (см. упражнение 2.10.1): Ен,Т = п(п + 1)14; varи„ Т = п (п + 1) (2л + 1)/24. И действительно, производящую функцию моментов легко найти, при¬ бегнув к теореме 2.2.2. Пример 2.2.2. При Н0 : 0 = 0, F £ производящая функция мо¬ ментов Т равна: Л*(0 “ri (1 +е*1). (2.2.5) 2П 1= 1 Доказательство. Из определения М (t) и теоремы 2.2.2. следует, что М (t) = E(eiT) = -Ее*™*’- = ПЕетС Теперь вычислим Et/Wj = е°/2 + efi/2 = (1 + et})!2, и теорема доказана. Моменты распределения из (2.2.4) можно получить из (2.2.5) *. Поскольку плотность распределения Т нельзя представить аналити¬ чески, производящая функция моментов дает нам альтернативный ме¬ тод построения вероятностей Т. Именно если М (t) = a0e0i + ахег + + a2e2t + ..., то Р (Т = j) = aj. В следующем примере мы по¬ кажем, как вычислять эти вероятности. Пример 2.2.3. Начнем с п = 2: М (*) = ( 1/22) (1 +е*) (1 +e2t) = (1 /22) (1 + в* +e2t+ e3t). Выпишем степени и коэффициенты производящей функции момен¬ тов: 0 1 2 3—степени; (2 2 6) 1/4x111 1—коэффициенты. Таким образом, Р (Т — 0) --- Р (Т = 1) = ... = Р (Т 3) — 1/4. При п - 3 М (О = (1 /23) (1 + .(*) (1 + е2‘) (1 + е3‘), * Здесь полезно сравнить подход автора с представленным в [68, гл. II, раз¬ делы 1 и 3]; особое внимание нужно обратить на (7) — (9), откуда можно полу¬ чить (2.2.4). См. также [116, гл. 3, раздел 2 и приложение] (другое доказательст¬ во (2.2.4)). Подробные доказательства даны в [152, гл. 10], например, (2.2.4) до¬ казано в примере 10.1.14. Интересное обсуждение вопросов, затронутых в дан¬ ной главе, см. в [326, гл. 3 (особенно разделы 5 и 6)]. В этих книгах и в [149] со¬ держится много полезного материала о ранговых критериях и оценках, описан¬ ных в данной книге. — Примеч. пер. 50
а степени и коэффициенты из (2.2.6) следующие: О 1 2 3 | 4 5 6—степени; 1111 ■ ill ^ 1/8x1 1 1 2 1 1 1—коэффициенты. Вертикальная разделяющая линия в (2.2.7) указывает, куда добав¬ ляются степени для следующего размера выборки. При п = 4 мы полу¬ чаем АГ(0 = ( 1/24) (1+ **).■• (1+е4*)- Теперь из (2.2.7) мы имеем 0 1 23456|7 89 10—степени; 1112 111 1112 11 1 1/16 х 1 1 1 2222 2 1 1 1—коэффициенты; например, Р (Т = 7) = -+ = +. 1Ь О Из этого примера все становится ясно. Можно легко написать про¬ грамму для ЭВМ для вычисления значений Т в случае #0. Более того, пример делает очевидной симметрию распределения Т (см. упражне¬ ние 2.10.2). Рекуррентная формула для распределения Т приводится в упражнении 3.7.3. Так же, как и в случаях критерия знаков, если размер выборки ве¬ лик или у нас нет таблиц распределений, важно получить нормальную аппроксимацию распределения Т при Н0. При независимости Wly...f Wn (теорема 2.2.2) мы можем вполне полагаться на центральную пре¬ дельную теорему. Однако Т — линейная функция Wly Wn, и по¬ этому обычная центральная предельная теорема должна быть обобще¬ на. То обобщение, которым мы пользуемся как теоремой А9 приложе¬ ния, доказано в самом приложении. В упражнении 2.10.4 предлагается применить теорему А9 и показать, что Т — п (л+1)/4 п (п + 1) (2/1+1) 24 имеет стандартное нормальное распределение. Таким образом, если мы отклоняем Н0 : 0 = 0 в пользу НА : 0 >0 при Т ^ С, то критиче¬ ское значение критерия размера а может быть приближено (с поправ¬ кой на непрерывность) следующим образом: -j-0,5 + Zal/n(n+1) (2-^+1+ (2.2.9) 4 У 24 где Za — верхняя a-процентная точка стандартного нормального рас¬ пределения. 51
Таблица 2.1 Нормальная и Эджворта аппроксимации нулевого распределения Т с поправкой на непрерывность Р(Т <к) Нормальная Эджворта 0,031 0,029 0,027 0,062 0,053 0,055 0,094 0,089 0,096 0,156 0,140 0,152 0,219 0,212 0,227 0,312 0,295 0,309 0,406 0,394 0,402 0,500 0,500 0,500 Точность приближения обычно можно увеличить, прибегнув к ап¬ проксимации Эджворта (см. [40, разделы 12.6 и 17.7]). Если V имеет симметричное распределение, то приближение дается формулой Р (V < V) = Ф (0 — К If — Ы) У (0, (2.2.10) 24 где —- {E(V — EV)4/[E (V — ЕЕ)2]2} называется эксцессом и есть функция скошенности (kurtosis*), ф (•) — стандартная нормальная плотность распределения, t= (v — EV)/(var У)1/2. (Если V дискрет¬ ное, в величине t обычно учитывается поправка на непрерывность.) Для статистики знаковых рангов Уилкоксона в [48] показано, что 3я2 + 3я — 1 (/3 —30Ф(0, (2.2.11) Р (Г < к) = Ф (0 . 4 7 W 10я (я+1) (2я+1) где / = (k + 0,5 — ЕТ)/(Уаг Т) V2. По вычислениям примера 2.2.2 можно найти нужные моменты рас¬ пределения. П. Дж. Бикел [23] показал, что это — строгое асимптоти¬ ческое разложение до членов порядка п~г ** (см. табл. 2.1). Есть и другие подходы к доказательству предельной нормальности Т. Некоторые основаны на моментах и производящих функциях мо¬ ментов (см. [66], [136])***. 2.3. ТОЧЕЧНЫЕ И ИНТЕРВАЛЬНЫЕ ОЦЕНКИ, ОСНОВАННЫЕ НА СТАТИСТИКЕ ЗНАКОВЫХ РАНГОВ УИЛКОКСОНА Напомним раздел 1.5, в котором мы определили для критерия зна¬ ков S (0) -- # Xt > 0, i = 1, ..., п. С помощью графика 5 (0) не¬ возрастающей ступенчатой функции со скачками в точках — упорядо- * Иногда также переводится как «эксцесс». — Примеч. пер. ** Существует другой подход к аппроксимации распределения ранговых ста¬ тистик, например, для Т [296] и [221, с. 57], при котором аппроксимируются процентные точки распределения Т, а не вероятности Р (Т ^ k), что зачастую удобнее. Большие таблицы нулевого распределения Т см. в [221]. — Примеч. пер. *** См. также [68, гл. III, раздел 6 и гл. V, раздел 1, п. 7]. Много сведе¬ ний о предельном распределении ранговых статистик дано в [292, т. 4] и [328]. — Примеч. пер. 52
ченных значениях выборки — легко получить оценки Ходжеса—Ле¬ мана и интервальные оценки G, основанные на S. В настоящем раз¬ деле мы определим считающую форму (counting form the Wilcoxon signed rank statistic) статистики Уилкоксона знаковых рангов, позво¬ ляющую легко строить соответствующие точечные и интервальные оценки. Определение 2.3.1. При заданной вы¬ борке Хъ Хп п(п+ 1)/2 средних Уолша определяется как (X* + Xj)/2, i < / — попарные средние. Так их на- х о х. звал Джон Тьюки, ссылаясь на работу Джона Уолша. Дж. Тьюки [184] развил Рис. 2.2. Вычисление положи- метод попарных средних, дав следующее тельных средних Уолша представление. Теорема 2.3.1. Статистика знаковых рангов Уилкоксона Г, оп¬ ределенная в (2.2.2), может быть представлена как т=Ф{-^— >о\,i<j. Таким образом, Т есть число положительных средних Уолша. Доказательство. Пусть Xiv ..., Xip есть р положительных эле¬ ментов выборки, тогда Т — сумма рангов этих элементов относитель¬ но их абсолютных значений. Изобразим круг с центром в начале координат и радиусом Х^, как на рис. 2.2. Тогда ранг Xit равен числу точек выборки, включая X/,, поскольку мы ранжируем расстояние от 0. Каждую среднюю вели¬ чину * получают из точки выборки в круге и положительного Xit. Таким образом, рангХ^ в точности равен числу средних Уолша, по¬ строенных по Xit, и точкам выборки, меньшим или равным Xix. Если проделывать эту процедуру последовательно для i2, ..., ip, то сумма рангов окажется равной числу положительных средних Уолша **. Сейчас мы видим, что / Xi + Xj \ Т (6) = # ( 2 >9j ,t</, (2.3.1) — это невозрастающая ступенчатая функция со скачками — ступенями в точках — средних Уолша. Из определения 1.4.1 и упражнения 1.8.4 следует, что критерий ги¬ потезы #0 : 0 = 0 против НА : 0 >0, F £ £JS, не смещен. * Среднюю Уолша. — Примеч. пер. %.** Проверьте это для выборки из табл. 1.2 (раздел 1.5) или ее части для п ----- 5—6. — Примеч. пер. 53
Исходя из знаковой или «считающей» структуры Т и симметрии ее нулевого распределения (упражнение 2.10.2), мы можем сразу запи¬ сать оценку Ходжеса —Лемана параметра 0 (см. раздел 1.5) в виде т. е. медиану средних Уолша. Если Wfr) < ... < W(N)y N = п (п + 1)/2, — упорядоченные средние Уолша и Р (Т < а) = а/2 = Р (Т ^ N — а), есть (1 — а)* 100-процентный доверительный интервал для 0, основан¬ ный на Т. Воспользовавшись (2.2.9), величину а можно приблизить (с поправкой на непрерывность): Даже если п не слишком велико, то число средних Уолша доволь¬ но большое. Едва ли практично вычислять оценки и доверительный интервал вручную. Вычислительная система Минитаб (Minitab statis¬ tical computing system) содержит программы WTEST и WINT, кото¬ рые обеспечивают применение критерия знаковых рангов, точечные и интервальные оценки. Теорема 2.3.2 позволяет заключить, что в большинстве ситуаций-в выборках 0 — несмещенная оценка 0. Позднее (теорема 2.6.5) мы по¬ кажем, что 0 приближенно нормально распределена. Теорема 2.3.2. Если F£ Qs, то распределение 0 симметрично отно¬ сительно 0. Доказательство. Заметим, что Ре (0 — 0 С х) = Р0 (0 < х) (по теореме 1.5.1). Отсюда мы можем положить 0=0 без потери общности. Далее, X = (Х1у ..., Хп) и — X = (—Хг, ..., — Хп) имеют одина¬ ковые распределения, так как F£ Qs. Если мы пишем 0 (X), обозна- чая med (Xf + Xj)/2, i < /, то 0 (X) и 0 (— X) имеют то же распре¬ деление, а 0 (— X) =— 0 (X) влечет за собой совпадение распределе¬ ний для 0 и — 0*. Значит, теорема доказана. У медианы средних Уолша есть недостаток — при ее вычислении необходимо находить большое число средних по Уолшу. К примеру, при п = 50 существует п (п + 1)/2 = 1275 средних Уолша. Получение * Напомним, что для симметричного распределения с функцией распределе¬ ния Q (•) и плотностью распределения q(-) имеют место равенства Q (у) = 1 — — Q (—У)\ Я (У) = Я (—У)‘ — Примеч. пер. 54 (2.3.2) [W^(a+ 1), W'(W-a)) (2.3.3) = п (п+1) —0,5 4 п (/г+ 1) (2/г+ 1) 24
других оценок, таких, как медиана выборки и оценка Гальтона (см. упражнение 2.10.7), требует меньше вычислений, причем эти оценки имеют положительную толерантность. Если их статистические свойства хороши, то они могут быть удачной альтернативой медиане всего набора средних Уолша. Статистические свойства оценок мы обсудим в следующих разделах этой главы. Резюме. Когда выборка извлекается из симметричного распределе¬ ния с точкой симметрии 0, то 7 — сумма рангов абсолютных величин положительных элементов выборки — дает нам естественный критерий Н0 : 0 = 0 против На : 0 > 0. Этот критерий построен с учетом инфор¬ мации о симметрии, полученной путем ранжирования расстояний наб¬ людений от начала координат. Критерий свободен от распределения при Я0, и можно надеяться, что он будет иметь большую мощность об¬ наружения симметричного сдвига, чем критерий знаков. Мощность и эффективность обсуждаются в разделах 1.5 и 1.6. Ниже демонстрируют¬ ся естественные точечные и интервальные оценки, основанные на 7, так же как и для критерия знаков. При реализации допущения для мо- дели 7£ Qs, 0 — несмещенная оценка 0, 7 дает несмещенный критерий Н0 : 0 = 0 против На : 0 > 0. В следующем разделе мы рассмотрим свойства устойчивости процедур Уилкоксона. Пример 2.3.1. В примере 2.1.2 мы описали опыт с крысами разных пометов, произвольно помещенными в «обогащенную» и «необогащен- ную» среду. Был измерен вес коры головного мозга в миллиграммах после определенного периода времени. Наблюдения для 12 пар приве¬ дены в табл. 2.2. Предположим, что распределение разностей симмет¬ рично относительно 0,- при этом мы хотим проверить Н0 : 0 = О против НА : 0 > 0, основанную на 12 наблюдаемых разностях. При уровне значимости а = 0,01 мы отклоняем Н0 : 0 = 0 в том случае, если 7 > 68 (нормальное приближение по формуле (2.2.9) дает 7 > 70). Наблюдаемое значение 7 равно 75, таким образом, мы отклоняем Н0 : 0 = 0, и ясно, что на уровне а = 0,01 вес коры мозга крыс, развивавшихся в «обогащенной» среде, значимо больше, чем у крыс, Таблица 2.2 Вес коры головного мозга крыс (мг) Искусственные данные Среда Пары 1 2 3 4 5 6 7 8 9 10 11 12 «Обогащенная» «Необогащенная » 689 657 663 646 653 642 740 650 699 698 690 621 685 647 718 689 742 652 651 661 687 612 679 678 Разность 32 17 11 90 1 69 38 29 90 -10 75 1 55
развивавшихся в «необогащенной» среде. Точечная оценка 0 равна 0 = 36,5 — это медиана 78 средних Уолша. 94,5-процентный дове¬ рительный интервал для 0 получается из 15-й и 64-й квантили [11,0, 59,5]. Часто требуется «обрабатывать нули» (т. е. наблюдения, которые гипотетически равны нулю) и выявлять связи между абсолютными значениями *. Так же, как и для критерия знаков, мы отбрасываем ну¬ ли и уменьшаем размер выборки до вычисления статистики критерия знаковых рангов Уилкоксона. При оценивании нули не используются. Для построения процедур для набора наблюдений с одинаковыми абсо¬ лютными значениями используются средние (усредненные) ранги (ave¬ rage rank или midranks)**. Эти усредненные ранги используются при вы¬ числении. Это соответствует присвоению нулевому среднему Уолша 1/2. Есть другие методы выявления связей, но в данной ситуации они не лучше описанного. Метод усредненных рангов — один из наиболее известных в практике. У. Дж. Коновер [36] обсуждает и сравнивает несколько методов (см. также [116], [147]). Г. Е. Нетер [135] показал, что при дискретности исходного распределения замкнутый доверитель¬ ный интервал всегда имеет коэффициент доверия, ограниченный сни¬ зу известной величиной коэффициента доверия. 2.4. УСТОЙЧИВОСТЬ РАНГОВЫХ КРИТЕРИЕВ И ОЦЕНОК В упражнении 2.10.5 нужно вычислить толерантность принятия и отклонения гипотез и показать, что асимптотически обе толерантности равны 0,29. Таким образом, Г представляет собой критерий с положи¬ тельной толерантностью, находящейся по степени толерантности меж¬ ду высокотолерантным критерием знаков и нетолерантным ^-критерием. Изучим толерантность оценок, выведенных из средних Уолша (см. [78]). Заметим, что медиана выборки является медианой множества средних Уолша при i = \ (см. определение 2.3.1). Пусть В — подмножество индексов (/, /), содержащееся в множе¬ стве {(/, /) : i < /}. Определим оценку 0 посредством e = med Х^ ~Ф. t (2.4.1) (<.».€ В 2 где Х(1) < ... < Х(п) — упорядоченные значения выборки. Напри¬ мер, В = {(/, /) : i = /} дает нам выборочную медиану, В = ~ {(*» /) : ^ /} — медиану из средних Уолша. Другая оценка, кото¬ рую Ходжес [78] приписывал Ф. Гальтону (F. Galton), определяется * Речь идет о значениях Xt = 0 и о равных (связанных) рангах абсолютных значений. Об этом см. также [68, гл. III, раздел 8]. — Примеч. пер. ** Эти два термина могут относиться к разным способам усреднения. — Примеч. пер. 56
• В2 # • г • В. • • 1 В = {(iy j) : i + j = n + 1}. Удобный способ представления множе¬ ства индексов В дан на рис. 2.3. Множество {(iy /) : i < /} выглядит как точки решетки в верхнем треугольнике*. Множества Вх и В2у определяющие медиану выборки и оценку Гальтона соответственно, показаны на этом же рисунке. Другие оценки будут демонстрироваться позже. Если из принадлежности пары (i, j) множеству В следует, что (я — / + 1, я — i + 1) также при¬ надлежит Ву то множество В назы¬ вается симметричным. Из теоремы 2.4.1 видно, что симметричное мно¬ жество индексов дает несмещенные оценки 0, когда выборка извлечена из симметричной совокупности. Теорема 2.4.1. Если модель вы- з- борки задается F (х — 0), F £ Qs и 2 - В — симметричное множество, то 1 _ # оценка 0 (2.4.1) распределена сим- —j—^^ п метрично относительно 0. Доказательство. Положим 0 = Рис- 2 3- Множества индексов оценок = 0, общность при этом не теряет¬ ся. Рассматривая форму совместного распределения пары порядковых статистик, легко видеть, что (Х(0, Х^)) и (—Х(п_7-+1), —X{n-i+1)) распределены одинаково. Следовательно, оценка 0 (X), основанная на X = (Х1у ..., Хп), имеет то же распределение, что и 0 (— X). Однако, 0 (—X) = — 0 (X), откуда у 0 и — 0 одинаковые распределения и 0 распределена симметрично относительно 0. Теорема 2.4.2. Предположим, В — симметричное множество. Тог¬ да толерантность 0 из (2.4.1) равна alny где а — такое наибольшее целое, что -!-{#£ +1><К0 + 1, (2.4.2) где Kt = {(iy j):t < i < j} и # есть число элементов в множестве. Доказательство. Докажем теорему для # В = 2qy т. е. четного числа. Для нечетного числа читатель может провести доказательство самостоятельно (упражнение 2.10.6). Пусть теперь а — такое наибольшее целое, что j [2q -f 1 ] — q -f- 1 /2 ^ =ff= Ka + * Над диагональю первого квадранта прямоугольных осей координат. — Примеч. пер. 57
Отсюда q + 1 < # Ka+i- Это означает, что # Ka+i превышает полови¬ ну ф/= В. Далее, ф Ка+2 < Q согласно максимальному свойству а. Если (i, /) б Ка+1, то a + 1 < i < j и v -— (О 1 Л (a + 1) ^ (/) 2 Таким образом, более чем половина средних Уолша, определенных Вг ограничена снизу Х(а+1), откуда следует *«> + *«’ -9. в 2 как это записано в определении 1.6.1. Теперь зафиксируем X(a+2)t ..., Х(п), и пусть Х(а+1)->— оо. Если i <а+ 1, то Х(ач1)-^оо. •Y(0 + X(/) <- Х(а + 1) + Х(/) 2 2 Так как /Са+2 = {(*, /) : а + 2 < i < /}, i < а + 1, па- ра (i, /) принадлежит дополнению Ка+2- Отсюда все средние Уолша, определенные по дополнению Ка+2., стремятся к — оо. Мы видим, что # Ка+2 < Qy так что число элементов в дополнении /Са+2 равно по крайней мере q + 1, т. е. более чем половине # В. Это означает, что —S /'S 0 содержится в дополнении Ка+2 и потому 0 оо при Х(а+1) оо, как и требуется в определении 1.6.1. Остальные условия из определения 1.6.1 следуют из симметрии В. Пример 2.4.1. Пусть В = {(/, /): i < /}, так что 0 — медиана сред¬ них Уолша (2.3.2). В этом случае # В = п (п + 1)/2. Множество К(а+1) = {(*, /): a + 1 < i < /}, и потому # Ха+1 = (п — а ) + + (п — а — 1) + ••• + 1 = (я — л) (п — а + 1)/2. Теорема 2.4.2 гласит, что мы должны найти такое наибольшее ау что 1 | п (/1+1) + J j ^ (/г—а) (п—а+ 1) ^ ^ ^ Это неравенство сводится к квадратичному неравенству а2 — (2п + 1) а + (п2 + п — 2)/2 ^ О, причем а — наибольшее целое от 2п+1-У(2п* + 2п + 5) ' (2 4 4) Другое решение квадратного уравнения доставляет нам значение вне области чисел между 1 и п. Если не принимать во внимание то, * По-видимому, автор хочет сказать, что 0 построено на базе множества индексов Ка+2- — Примеч. пер. 58
что (2.4.4) дает нецелое число, то формулу для толерантности (опреде¬ ление 1.6.1) можно переписать в виде тп==-1+“- —|/" 2я2-4-2я-|-5 2 п 2 п И т = lim хп = 1 Х— ~ 0,29. V2 Мы видим, что толерантность проверки гипотез критерия Уилкок¬ сона знаковых рангов (упражнение 2.10.5), так же как и толерантность критерия знаков и выборочной медианы, сходится к толерантности асимптотического оценивания оценки Ходжеса — Лемана — медиан¬ ных средних Уолша, тп сходится к т довольно быстро; об этом можно судить, например, по некоторым значениям (я, тп): (4, 0,286), (6, 0,297), (10, 0,300), (20, 0,298). Настоящий раздел мы завершаем обсуждением кривых чувстви¬ тельности и влияния медианы средних Уолша. Результат из следующе¬ го примера можно сравнить с результатом из примера 1.6.4. Пример 2.4.2. Рассмотрим оценку Ходжеса — Лемана 0 = = med(X* + Xj)/2, / (2.3.2) для параметра 0, полученную с по¬ мощью статистики знаковых рангов Уилкоксона. Предположим, что 0 построена на основе выборки размера я из распределения Н (х) = = F (х — 0), F£ Qs. Для построения функции влияния нам надо представить 0 в виде функционала от эмпирической функции распре¬ деления Нп (х). Этот функционал мы можем получить, непосредственно заменив функцию распределения (Xt + Xj)/2 на 1/2. Рассмотрим 0* = = med (Xt + Xj)/2, i, j = 1,2, ..., я, чтобы упростить рассуждения. Функция распределения для (Xt + Xj)/2 задается формулой оо 2 Z — U ОО Р ^^ z j = j | h (х) h (и) dx du — J H (2z—u) h (и) du. — oo — oo — oo Определим функционал T (H) — медиану распределения случай¬ ной величины (Xt + Xj)/2 — непосредственно через оо j Н (2Г (H) — Ujh (и) du = 1/2. (2.4.5) — оо Сначала мы покажем, что 0* = Т (#п), а затем выведем кривую влияния. Заменим Н на Нп в (2.4.5), положив ^ Нп (2Т {Нп) -и) dHn (и)= 1/2 59
Теперь Нп (27 (Нп) — х;) = 2"= i / (лу < 27 (Нп) — xt)/n где / (•) — индикаторная функция. Отсюда ! Xi + Xj 1 -т- / = 1 /=1 Х что и определяет Т (Нп) как медиану п2 средних (х£ + Xj)/2, /, / = = 1, 2, я. Воспользуемся определением 1.6.4, чтобы найти кривую влияния. При Ht = (1 — t) Н + t Sy — Н + t (by — H) (если учитывать (2.4.5)) ^ ^ {Н (2Т (Ht) - и) + < [б„ (2Т (Я() - и) - Н(2Т (Ht) -«)]} X X d [Н (и) + t (6V (и) — Н (u))] = -i- . Разложим это выражение на подынтегральную функцию и интегри¬ рующее выражение * и затем продифференцируем по t. Действия диф- • ференцирования и интегрирования можно выполнять в любом порядке, поскольку можно использовать теорему А18 приложения, а подынтег¬ ральная функция ограничена и дифференцируема. Вот результаты вычисления при t = 0: -i-T(Ht) 1^ = 0 2 Г h(2T(H)-u)dH (и)+ Г Н(2Т(Н)~ dt J оо J —оо —и) dby (и) — Г Н (2T(H)-u)dH (и) + Г Ьу (2Т(Н) -u)dH(u) — J —ОО J —оо — р Я (27 (Я) — и) dH (и) = 0. J —ОО Так как Н (х) = F (х — 0), 7£ Qs, положим 0 — 0 (общность при этом не теряется). Это означает, что в предшествующем уравнении мы можем положить 7 (Я) = 0, как мы положили равным нулю среднее и медиану в примере 1.6.5. Теперь 7 (— и) = 1 — F (и), f (— и) = f (и) и потому j F (—и) X XdF (и) = 1/2, J Ьу (—и) dF (и) = F (— и) = 1 - F (и) и j F (—u) X * В интеграле Стилтьеса. — Примеч. пер. 60
Xd8y (и) = F (— у) =1 — F (у). Предшествующее уравнение пре¬ вращается в i = o 2 j> (и) du^(\-F(y))- 1/2 + (1-F (у)) -1/2 = О Q(y) = -LT(Fl) I = at |f=o 2f (y)-l F(y)~ 1/2 2J'F*(u)du \F(u)du ' (2.4.6) Таким образом, кривая влияния — центрированная и масштабиро¬ ванная функция распределения. Это означает, что 0* (и 0) имеет огра¬ ниченную, непрерывную кривую влияния и есть робастная оценка. Теперь, так как j IF (у) — 1/2]2 dF (у) = 1/12, из (2.4.6) мы имеем :j‘Q2(Z/) dF (у)=\/\2[\Г(у) dy\ Согласно (1.6.2) это позволяет нам заключить, что асимптотическое распределение/!1/2 (0 —0) естьп (0, а2). Попросту говоря, кривая чувствительности для 0 ограничена: это — неубывающая ступенчатая функция, такая же, как эмпирическая функ¬ ция распределения, центрированная и шкалированная. Для больших п кривая чувствительности выглядит так, как в (2.4.6) (см. [6, раздел 5Е]). 2.5. ОБЩАЯ АСИМПТОТИЧЕСКАЯ ТЕОРИЯ ДЛЯ СТАТИСТИКИ ЗНАКОВЫХ РАНГОВ УИЛКОКСОНА Рассмотрим случайную выборку Xlt ..., Хп из произвольного, не¬ прерывного распределения с функцией распределения Н (х). Позже нам понадобится описать модель с параметром сдвига Н (х) = = F (х — 0). Сначала мы найдем среднее и дисперсию Т и установим состоятельность критерия, основанного на Т. Заметим, что при альтер¬ нативных гипотезах уже не удается представить Т в виде независимых случайных величин. Это значит, что центральная предельная теорема не может быть использована непосредственно. Для того чтобы найти предельное распределение, надо спроектировать Т на класс случайных величин, представляемых в виде суммы независимых случайных ве¬ личин. Доказательство состоит в том, что центральная предельная теоре¬ ма применяется для вычисления суммы и демонстрации сходимости к нулю по вероятности разности между Г и ее проекцией *. После иссле- * Сравните с разделом 3 гл. II [68]. — Примеч. пер. 61
дования асимптотического распределения Т в общем случае мы рас¬ смотрим асимптотическую мощность. При изучении мощности необхо¬ димо исследовать асимптотическую эффективность (см. раздел 2.6)*. В общем случае среднее и дисперсия определяются следующими зависящими от исходного распределения параметрами: />,=/> (Х^О), р2 = Р(Х 1 + Х2>0), (2.5.1) Ря = Р(Хг + Х2>0, Хг>0). Pi = Р (Xi +Х2 Г> О, Х1 -\--Х3 0). В упражнении 2.10.8 указано, что р3 — (р2 Jr р\)!2, поэтому до¬ статочно знать лишь р1У р2У и р4. Однако при использовании р4 теория строится более естественно. Теорема 2.5.1. £Г/Т| I ^ 1) ЕТ = пр1 Н ръ var Т - nPl (l — Pl) + п {п~ U р2 (1 — р2) + + 2п (п— 1) (Pa-Pi р2) + п (п — 1) (п~2) {pi—pl). (2.5.2) Доказательство. Определим в соответствии с теоремой 2.3.1 Xi + Xj !. если >0. (2 5 3) 0, в противном случае, и, следовательно, Т = 'Z'ZTijl где суммирование производится по всем индексам i < /**. Теперь мы имеем ЕТ - 2 2 ETtj = пЕТп + £Т1Ъ / ^ / 2 а ЕТп = Р {Хг > 0) = Pl а ЕТ12 - Р (X, + Х2 > 0) = р2. Далее, var Г = var ^22 Tti + ^Thh\. Ти = k * Насколько известно, в данной книге впервые в монографической и учеб¬ ной литературе приводится столь подробное доказательство основных теорем для задачи о сдвиге в одной выборке, которая (как впрочем и задача о сдвиге 2 выбо¬ рок) может быть примером, на котором учатся проводить доказательства для ран¬ говых статистик. По этому вопросу см. также [326, гл. 3,4], [116, гл. 10], [152], [278], [274], [68]. — Примеч. пер. ** Эту формулу полезно сравнить с (3.2.2) для статистик Уилкоксона—Ман¬ на — Уитни, где дана аналогичная считающая форма, и (4.4.5), а также Q* и теоремой 4.4.1 — Примеч. пер. 62
Запишем эти суммы подробнее Лг + ТГА + ... + Т1п + Т"2з + • • • + ^2п Н~ • • • + Т j/r 1 + • • • + Тjn + ... + Тп— in + 7\i-f ~гТ,1П. (2.5.4) Дисперсия суммы равна сумме дисперсий плюс удвоенная сумма ковариаций. Здесь нужно рассматривать три типа ковариаций: cov (Ти, Г12), cov (Г12, 7\3), cov (Т12, Т34). Сначала, учитывая незави¬ симость Х1} ..., ХПУ мы заметим, что cov (Г12, Т34) = 0. Первый тип, cov (Тп, Т12), получается из набора трех индексов. Есть п способов выбора Т jj (представленного посредством Ти). Затем Тjk или Thj появляются п — / раз в /-м блоке (2.5.4)* и j — 1 раз, по одному разу в каждом блоке перед /-м, а всего п — / + / — 1 = п — 1 раз. Следовательно, у нас есть п (п — 1) ковариаций типа cov (Тп, Т12). Второй тип, cov (Г12, 7\3), получается из двух наборов индексов. Имеется п (п — 1)/2 способов выбора Tjh. В /-м блоке выражения (2.5.4) есть п — j — 1 величин Т jh и есть по одному Ttj в предшествую¬ щих j — 1 блоках, а всего (п — / — 1) + (/ — 1) = п — 2. Таким об¬ разом, имеется п (п — 1) (п — 2)12 ковариаций типа cov (Г12, Г13) **. Исходя из этого, мы можем переписать дисперсию Т в виде var Т — /г var Tn -f-2^—— var 7\2-j- + 2 2 п (п— 1) cov (Т11ьТ14) —п (п~[) {п~2)- cov (Ги, Т13) Наконец, заметим, что var Т12 = ЕТЬ2 — (£Г12)2 = Рг—рЪ и соv(rn, TU) = E (TnT12) — ЕТц ЕТ12 = ря—р2 и аналогично var Ги-=/?! — — р\ и cov (Т12, Tvs) = pt — ph Пример 2.5.1. Определим класс абсолютно непрерывных функций распределения Йр, а именно Н £ Яр, если Н (х) + Н (— *) < 1 для всех х, причем строгое неравенство выполняется в некотором ин¬ тервале значений х. Мы назовем Яр классом стохастически поло¬ жительных распределений, поскольку для л: > 0 Р (X ^ х) = = 1 — Н (х) > Н (— х) = Р (X < х)***, и выясним состоятельность критерия знаковых рангов Уилкоксона при распределениях из Яр. * Здесь блоки — это 7\2 + Т13 + ••• + Tlllt Г23+ ... Г2П и т.д. — При¬ меч. пер. ** Выводы трех последних абзацев полезно проверить самостоятельно по % (2.5.4) и формуле cov ( 2 Xq) =2 2 cov (^g> X8). — Примеч. пер. q= 1 1<<7. *** Можно сказать, что это плотности распределения с правым хвостом, ко¬ торый «тяжелее» левого. — Примеч. пер. 63
Предположим,_Хг, ..., Хп — случайная выборка из распределения G (х), и пусть Т = Tin (п + 1), тогда из (2.5.2) Таким образом, Т удовлетворяет (1.3.2) с p. (G) = р2/2*. Теперь 2р (G) =р2 = Р (Х1 + Х2> 0) = \°° С- g (хх) g (x2) d*2 = J—oo J— J-2 = ^ [ 1 — G y—x2)] g (x2) dx2. Если G£ £2S, to G (x) =1 — G (—x) ир2^ J G (x) g (x) dx = 1/2. Если G £ Qp, to G (x) < 1 — G (— x) для некоторого интервала и сти и потому ** мы можем применить теорему 1.3.1, в данном слу¬ чае утверждающую, что Т есть состоятельный критерий для стохасти¬ чески положительных альтернатив. Заметим, что модель с параметром положения, задаваемая услови¬ ем G (х) = F (х — 0), F £ Qs, доставляет нам пример стохастически по¬ ложительного распределения при 0 > 0***. Таким образом, критерий знаковых рангов Уилкоксона состоятелен для симметричных сдвиговых альтернатив. Если в опыте обработка изменяет симметрию контрольной совокуп¬ ности и оставляет медианы в нуле, то это может привести к стохастиче¬ ски положительному распределению. Тогда Т будет стремиться попасть в критическое множество и, таким образом, можно отклонить #о:0=О. Поэтому важно точно определить проверяемую гипотезу. Критерий знаковых рангов Уилкоксона можно рассматривать так же, как крите¬ рий симметрии при фиксированном параметре положения. Пример при¬ веден на рис. 2.1. Вернемся теперь к асимптотическому распределению Т. Из тео¬ ремы 2.2.2 мы видим, что при Н0: 0 = 0 и F£ статистика Т есть линейная комбинация независимых случайных величин, в этом случае для установления нормальности применялась соответствующая форма центральной предельной теоремы. На следующем простом примере по¬ кажем, что в случае альтернативной гипотезы независимость наруша¬ ется. * См. определение сходимости по вероятности А1 приложения. — Примеч. пер. ** У нас выполняются условия (1.3.2) с ц (G) = pj2 и (1.3.3) с р0 = j- . — Примеч. пер. *** Поскольку Р (X ^ х) ^ Р (X ^ — х). — Примеч. пер. (2.5.5) varc Т 0. оо — оо р2 > Y' РазДела 2.2 мы знаем об асимптотической нормально- 64
Пример 2.5.2. Предположим, что имеется выборка Хг, Х2 из рав¬ номерного распределения на (—1, 2). Кроме того, извлечем выборку из F(x- 0), F£GS, 0 > 0. Из определения и W2 (2.2.1) мы получаем Wx = 0 и W2 = 1, если и только если — 1<К1<;0< — Кх < К2 < 2, и Kj и У2 — порядковые статистики. Следовательно, Р (Wx = 0, Wt = 1) = j°_ i J2 2! -L dy2 dyx = 3/9. Подобным же образом Р (W± =0, W2 = 0) = 1/9, Р (Wx = 1, W2 = 0) = 1/9 и Р (W1 =1 W2= 1) = 4/9. Маргинальные вероятности равны Р (W1 = 0) = 4/9, Р (Wx = 1) = 5/9, Р (W2 = 0) = 2/9, Р (W2 = 1) = 7/9, так что, например, P(Wx^0)P(W2= 1 )#P(U71 = 0, №а=1). Для изучения Т в общем случае мы обратимся к методу проекций. Я. Гаек [67] дал превосходное обсуждение метода. По существу стати¬ стика Т проектируется с помощью условных математических ожида¬ ний, заданных величинами Х*, на класс сумм независимых случайных величин. Асимптотическая нормальность случайной величины — про¬ екции следует из центральной предельной теоремы, которая остается основным средством доказательства асимптотической нормальности. Идея проекции и идея малости по вероятности будет более формально развита далее. Теорема 2.5.2 (о проекции). Предположим, что Хх, ..., Хп — слу¬ чайная выборка из произвольного распределения с функцией распре¬ деления Н (.х). Пусть V — V (Xlt ..., Хп) —случайная величина, причем EV = 0. Если W = 2 Pi №)> т0 Е (Г — W) 2 миними- i = 1 зируется выбором такой функции Pi (х): p*(x) = E(V \Xt = x). (2.5.6) ri Случайная величина V р = 2 P*i №) называется проекцией, и при i= 1 этом Е (V —Vp)2 = \ат V — var Vp. (2.5.7) Доказательство. Прибавляя к (2.5.7) и вычитая из него Vp> мы получаем Е (V — W)2 = Е (V~ Vp\2 -f Е (Vp— W)2+ 2Е (V —Vp) (Vp - W). 3 Зак. 284 65
Член, содержащий произведение, равен* E(V-Vp) (Vp-W) = = £ £ [Р:(Хд-Рг(Хг)]\У~Ур}^ i= 1 = %ЕЕ\[р] (Xt)-Pl (Хг)] lV-Vp\\ Xt} -= = 2^{[Р* (Xt)-Pt (X,)]E\V-Vp |X,1J (2.5.8) ElV-Vp\Xt\ = E V-p)(X0-2 PjM) \Xi Но из определения (2.5.6) E[V-p-(Xt)\Xt] = 0. Далее, Е[р](Х,)\Хг]=Ер;(Х,) = = EE (V\Xj) = = EV = 0. Отсюда выражение (2.5.8) равно 0 и Е (V — W)2 = Е (V —Vp)2 + E(Vp — W)2, которое минимизируется выбором W = Vр. Если мы выберем W = 0, то также отсюда следует и (2.5.7), и доказательство закончено. Заметим, что для случая независимых, но необязательно одинаково распределенных Хг, ..., Хп справедливо то же доказательство. Пример, в котором случайные величины зависимы, см. в [68]. В общем случае р* (•) могут для различных i быть разными. Однако в большинстве при¬ меров настоящей книги эти величины одинаковы, поскольку все Xt оди¬ наково распределены. Пример 2.5.3. Мы обсудим метод проекции, рассматривая выбороч¬ ную дисперсию для выборки размера п из распределения со средним р и дисперсией а2. Основные приложения будут даны в примере 2.5.5. S2- 1 л—1 1 п (п— 1) 1 2 (xt —х)2 = '0i-i)2X?-2 22** = * < / ) i<i (2.5.9) * О свойствах условных математических ожиданий см. [250, раздел 8, гл. 1, раздел 7, гл. II, особо (16) с. 90], [114], [236 гл. 2, раздел 2в, с. 93—96, напри¬ мер, (2в, 3, 4)]: EY = Е [Е (Y/T)\, где Т под знаком Е означает, что £ берется относительно функции распределения Т. — Примеч. пер. 66
Положим V — S2 — а2, поскольку ES2 =- о2. Тогда (Xj-Xk)2 Х,=х (x-Xky , если i — j или к\ (Xj—Xky в противном случае; X2 2 \1х-{-\12 + о2 . . и ' 2 , если i — ] или я; в противном случае; (2.5.10) p*(x) = E(V |Х, = *)--= Е (я-1) V у id Jmd /= 1 *=/+1 (Xj—XhY С) (х2—2цх + [А2 — а2) 2 (2.5.11) Множителем будет (п — 1), поскольку если i — /, то i = j < k и получается я — д членов, а если k = iy то /<С k — i и получается i — 1 член, а ,всего п — i + i — 1 = я — 1 член. Отсюда проек¬ ция Vp центрированной выборочной дисперсии S2 — а2 равна п— 1 п 2 Xf — 2рЛ{ + (X2 —а2 = — V [№-р)2-а2], (2.5.12) 4=1 которая представляет собой среднее независимых, одинаково распре¬ деленных случайных величин. Гарантируя £Х4 <С оо, мы, как следует из центральной предельной теоремы, получаем асимптотическую нор¬ мальность п 1/2 Vp. С помощью метода проекций далее можно доказать, что и п 1/2 X X(S2 — а2), и я1/2 Vp имеют одинаковые предельные распределения — в этом его сила. Нам нужен следующий результат. Теорема 2.5.3. Пусть Wn имеет в пределе распределение п (0, а2) и и Е (Un — Wn)2 —0. Тогда Un имеет то же предельное распреде¬ ление п (0, а2), что и Wn. Доказательство. Определим Rn -■=- Un — Wn. Теперь в соответ¬ ствии с теоремой АЗ А приложения мы можем написать Un = Wn + + Rn. Заметим, что по неравенству Чебышева из теоремы А4 ER2 Р(|Яп|>е)<—f- Е (Un-Wn)2 -0. 67
Таким образом, Rn сходится к нулю по вероятности, и наша теорема получается из теоремы АЗ А с с = 0. В приложениях Wn — проекция Uny так что по теореме 2.5.2 Е (Un — Wn)2 = var Un — var Wn9 и надо, чтобы эта разность сходилась к нулю *. Пример 2.5.4. Завершим предыдущий пример демонстрацией приб¬ лиженной нормальности случайной величины п 1/2 (S2 — а2). Опреде¬ лим [ik = Е (X — |х)* и, вернувшись к (2.5.12), заметим, что var Vn Vp =р4—а4. Из книги Г. Крамера [40, с. 348] varj/n S2=^|i4 —^ ja4. (2.5.13) Поскольку в соответствие с (2.5.7) Е (Л1/2 S2—п1/2 Vp)2 = var я1/2 S2 — var я1'2 Vpy что стремится к нулю **, то из теоремы 2.5.3 следует, что я 1/2 (S2 — а2) имеет то же предельное распределение, что и я 1/2 Vpy а именно я (0, ц4 — а4). В следующем примере эти теоремы будут использованы для опреде¬ ления асимптотического распределения Т. Основной результат будет установлен в теореме, помещенной в конце примера 2.5.5. Наш план состоит из четырех пунктов: найти проекции К, скажем, Vp\ доказать асимптотическую нормальность Vp\ найти var V и var Vp\ показать, что var V — var Vp 0. Пример 2.5.5. Пусть Xl9 ..., Хп — случайная выборка из произ¬ вольного распределения с абсолютно непрерывной функцией распре¬ деления Н (.х). Будем, как и ранее, использовать считающую форму для 7\ определенную в (2.5.3): 7,=SS7,w+SS7’«*** <2-5Л4> i < / к Из (2.5.2) определим V — Т — ЕТ, т. е. v=T-^f^-p2-npi=22(T«“^ (2-5-15> i < / к * Как это обычно понимается в математическом анализе. — Примеч. пер. ** var Vп 5л — var /л Кр= а4/л — i — из формулы (2.5.13) и формулы для var "[/п Vpy идущей перед (2.5.13). — Примеч. пер. *** Формула (2.5.14) дает разложение статистики критерия знаковых рангов Уилкоксона в сумму индикаторов Тtj на парах (t, /), i Ф j и статистику критерия знаков S -- 2 Тц. Об этом разложении весьма полезно знать, чтобы 1 ^ < п понимать структуру Т и действие соответствующего ей критерия — При¬ меч. пер. 68
1. Сначала мы покажем, что проекция, обозначаемая Vpy задается выражением Vp = (п-1) 2 [ 1 -Н (-Х')-р2] + 2 (Ткк-рг). (2.5.16) Второй член в правой части (2.5.16) в точности совпадает с центриро¬ ванной статистикой знаков. Поскольку это—сумма независимых, оди¬ наково распределенных случайных величин, то она и есть своя собст¬ венная проекция. Теперь мы рассмотрим первый член в правой части (2.5.15). Исходя из определения (2.5.3), получаем Е{Т„-р,\ХК-х)-\Р(*>-*>-Р.. <**“ * = ' »™ / [О-- в противном случае; _ j 1—Н(—х)— р2у если k = i или / 1.0— в противном случае. (2.5.17) Отсюда я [2 2 (Tij - й) IX, = х] - (п -1) [ 1 - Я (- х) - Л1, L / < / J поскольку в сумме есть лишь п — 1 ненулевых членов. При i ~= k ин¬ декс / может принимать п — k значений, больших i = ky а при / = k индекс i может принимать k — 1 значение менее k, а всего /г — k + + k — 1 = п — 1 значение. Теперь (2.5.16) следует из теоремы 2.5.2. Далее мы покажем, что статистика пт3/2 Vp асимптотически распре¬ делена, как п (0, р4 — pi). 2. Вернемся к (2.5.16) и изучим 1 = ^ S(Tftk-Pl) = „3/2 " „3/2 ~ „3/2 = + (2‘5Л8) Сначала мы рассмотрим член п~1/г V'p = п~х!г 2 [ 1 — Я (—Xt) — — р2]. Пусть Кг = 1 — Я (— Хг), тогда =j“oo(l — H( — x))h(x)dx = =S” ос h м dydx= = Я (Xj> Хъ) = где р2 из (2.5.1), Xlt Х2 — независимые, одинаково распределенные случайные величины с функцией распределения Я (*). Более того, EYf - j (1 — Я (— *))2 h (х) dx 1 < 00. 69
Следовательно, центральная предельная теорема дает нам асимптоти¬ ческую нормальность п~1/2 Vp со средним 0 и дисперсией var (1-Я ( —Х)) = £(1— Я {-Х)у-р1 = = Jl-Н (-X)f h (ж) dx—pl = _ro° i*oo гоо dydzdx—pl = — оо J — X J — X = Р (X, + Х2 > 0, Ху + ха >0)-р1 = =р*—р1 Теперь мы перепишем (2.5.18) в виде ^77 у,=■-jjrv;~ к+•^ S <т-„.-й). Последние два члена равны среднему из независимых, одинаково рас¬ пределенных случайных величин, умноженному на п~1/2. Поскольку у обеих случайных величин Yt — р2 и Thh — рг математические ожи¬ дания равны 0, а дисперсия ограничена 1, из неравенства Чебышева следует сходимость к нулю по вероятности. Таким образом, из теоре¬ мы 2.5.3 вытекает*, что n~3/2Vp асимптотически нормально со сред¬ ним 0 и дисперсией р4 — р\. На самом деле, var (n~3/2Vp) р4 — — pi **. 3. Для того, чтобы показать, что я~3/2 V = ггъ/2 (Т — Е Т) рас¬ пределена асимптотически так же, как /г~3/2 Vр, мы рассмотрим Е (п~3/2 V — п~ъ!2 Vp)2 — var V — var Vp, n3 Я3 как в теореме 2.5.2). Теперь по (2.5.2) -^var V -*■ р^ —pi и, поскольку var п~3/2 Vpy как уже было показано в части 2 доказа¬ тельства, сходится к р4— pi, из теоремы 2.5.3 следует, что п~3/2Х X (Т — ЕТ ) асимптотически нормально распределено со средним О и дисперсией р4 — р\. Суммируем полученный результат в следующей теореме. О,о / D * См. также теорему Слуцкого АЗ (А) приложения: я ' VpZn-+ Z ~ я (О, р D Р4 — Pi)* Уп = второй и третий члены) -► С — 0 =>- Zn-\-Yn -*■ Z — При¬ меч. пер. ** См. условие E(Vn — W п)2 — Е(п~3 ^ 2V— я-3/2 l/p = var(n~3^2V)— — var (я~~3/21/р) =var (я“3/2(Г—ЕТ)) — уаг(я_3/2Кр)-<-0 из теоремы 2.5.2.—При¬ меч. пер. 70
Теорема 2.5.4. Если Н (х) — непрерывная функция, такая, что О < Н (0) < 1, а в остальном — произвольная функция распределе¬ ния, то (Т — £T)/(var Т)1/2 асимптотически распределена нормально, как п (0,1), с дисперсией var Г, заданной (2.5.2). Доказательство. Заметим, что р4 — р\ = var (1 — Н (—X)) > > 0. Эта дисперсия равна 0 только тогда, когда распределение — X постоянно на множестве значений X. Поскольку 0 < Н (0) < 1, то этого не может быть, отсюда р4 — р\ > 0. Откуда мы получаем, что статистика Т—ЕТ V пА (Pi—Pl) асимптотически распределена нормально, как п (0,1), и теорема сле¬ дует из var Т ^ j п3 (Р4 р\) В модели с параметром положения Н (х) = F (х — 0), F£ Qs. Следовательно, для 0 >0 Н (0) = F (—- 0), и, если 0 < F (0) < 1, то из теоремы 2.5.4 следует асимптотически нормальное распределение (Т — ЕТ)!(уar Т) 1/2 с параметрами ЕТ и var Т по формулам (2.5.2). Таким образом, требование, чтобы ноль лежал в области значений X, интуитивно обосновано тем, что существует распределение /С (х), ко¬ торое сдвинуто по положительной оси. В этом случае Т = п (п + 1)/2 с вероятностью 1, и для этой вырожденной случайной величины дис¬ персия равна 0. Итак, упомянутое выше условие необходимо для обес¬ печения невырожденного распределения Т. В упражнении 2.10.35 описывается другое приложение теоремы о проекции. В общем случае теорема о проекции основана на построении асимптотической теории распределения для широкого класса так назы¬ ваемых fZ-статистик. Эти статистики можно представить как симметрич¬ ные функции наблюдений, и многие оценки и статистики критериев за¬ писываются в виде [/-статистик. Дальнейшее обсуждение см. в [152, гл. 3], [149, гл.З], [11-6, раздел 5 приложения] *. Теперь мы можем сделать предварительное сравнение критерия зна¬ ков и критерия знаковых рангов Уилкоксона. То, что Т — несвобод¬ ный от распределения критерий при альтернативных гипотезах (см. пример 2.5.2), делает весьма трудными вычисления в общем случае точных вероятностей 7**. Мы обсудим более подробно эти вероятности в следующей главе. В то же время теорема 2.5.4 дает основу для при¬ ближенных вычислений мощности. В следующем разделе будет показа¬ но, что даже асимптотический подход приводит к затруднениям в вы¬ числениях в модели с параметром положения. По этим соображениям * См. также [326], [328] и, конечно, [68]. — Примеч. пер. ** Т. е. вероятностей для точного распределения. — Примеч. пер. 71
мы не будем рассматривать мощность как средство сравнения критери¬ ев и перейдем к асимптотической эффективности. Напомним, что Х1у ..., Хп —случайная выборка из F (х — 0), F£ Qs. Поскольку сравнение S и Т — асимптотическое, мы приведем Т в такую форму, которая позволяет исключать члены более высокого по сравнению с математическим ожиданием и дисперсией порядка. Пусть, как в примере 2.5.1, п (п+ 1) Таким образом, мы имеем из (2.5.2) ЕТ 2 и из теоремы 2.5.4 var Vn Т (Рь—рЪ) Y7 (Т—р2/2) (2.5.19) У (р^—pi) приближенно нормально п (0,1). Поэтому для больших п нам придется вычислить р2 и р4, необходимые для приближения мощности. Для знаковой статистики 5 из (1.2.3) и определения S — S/n мы имеем --п — (2.5.20) У Pi (•—Pi) приближенно нормально п (0,1). Итак, помимо р2 и р4 нам надо вы¬ числить рг. В упражнении 2.10.9 предлагается вычислить р1у р2, р4 для рав¬ номерного распределения на интервале (—1, 2) и отсюда найти при¬ ближенную мощность для двух критериев. Если это сделано для выбо¬ рок разных объемов, то мы наблюдаем следующее. С одной стороны, Т кажется более мощным, чем S, а с другой стороны, мощность обоих критериев приближается к 1 при росте объемов выборок. Последнее явление отражает состоятельность критериев. Такой подход к сравнению по асимптотической мощности не вполне удовлетворителен. Нам приходится предполагать наличие выборок большого объема, необходимых для того, чтобы пренебречь членами вы¬ сокого порядка, по отношению к среднему и дисперсии, и получить нор¬ мальную аппроксимацию высокой точности, однако при этом мощность становится для выборок этих объемов близкой к единице. Вычислить параметр р4 особенно трудно, а для многих функций распределения да¬ же невозможно. В следующем примере показан один из случаев, когда при некотором усилии вычисления возможны. 72
Пример 2.5.6. Пусть Xlf ..., Хп — случайная выборка из /г(0, а2). Тогда Итак, р4 можно найти по таблицам двумерного нормального распреде¬ ления со средним 0, дисперсией 1 и коэффициентом корреляции 1/2*. Для примера возьмем п = 10, а = 0,0527, так что критическая область определяется неравенством 7" > 44. В этом случае мощность при в = о приближенно равна Ф(1,475) = 0,93 или Ф (1,586) = — 0,94 с поправкой на непрерывность. Точное значение, вычисленное Дж. Клотцем [104], равно 0,89. Таким образом, мощность завышается, если не учитывать члены высокого порядка. Для наших вычислений рг = 0,8413, р2 = 0,9213 и р4 = 0,8657, и при использовании полных выражений для среднего и дисперсии Т и нормального приближения оказывается, что мощность равна примерно 0,90. Приближение мощности к 1 можно отчасти компенсировать выбором близкой к нулевой гипотезе альтернативы. Однако для любой фиксиро¬ ванной альтернативы критерий все равно будет состоятельным. Из приведенного ниже расчета мы увидим, что для достаточно близ¬ ких к нулевой гипотезе альтернатив уже нет необходимости вычислять этот «неприятный» параметр р4. Этот способ приближения затем заста¬ вит нас ввести асимптотическую эффективность, посредством которой мощность измеряется локально (т. е. вблизи нулевой гипотезы). * См., например: См и р н о в Н. В., Большее Л. Н. Таблицы для вы¬ числения функции двумерного нормального распределения.— М.: Изд-во АН СССР, 1962.— 204 с. Обзор, посвященный вычислению двумерного нормаль¬ ного распределения, см. .'Мартынов Г. В. Вычисление функции нормаль¬ ного распределения // Итоги науки и техники /Серия: Теория вероятностей. Ма¬ тематическая статистика. Теоретическая кибернетика.— Т. 17. — М., 1979.— С. 57—84, где есть ссылки на программы: Algoritm 462. —Commun. ACM, 1973. — V. 16, №> 10,— P. 638 и AS 76. — Applied Statistics, 1974.— V. 23, №3.—P. 455—457 и др. Справочные сведения о вычислении: формулы, графики, примеры, см: Спра¬ вочник по специальным функциям: Пер. с англ. / Под ред. М. Абрамовича, И. Стиган. —М.: Наука, 1979. —Примеч. пер. < Теперь с помощью прямых вычислений можно показать, что Е(Хг + Х2) (Хг + Х3)=а2 + 402 и р = 1/2. 73
Пример 2.5.7. Пусть Хи ..., Хп — выборка из F (х — Q), Fd ^s- Приближенное критическое значение с для проверки Н0 : 0 = 0 про¬ тив На : 9 > 0 с помощью Т определяется из (2.2.9). Таким образом, для фиксированной альтернативы мощность приближенно равна Р(7>с)=ь1—(2.5.21) \ Kvar Т ) с ЕТ и var Т из (2.5.2). Теперь мы запишем и потому (2.5.22) Далее мы по-другому приблизим рх и р2. Эти функции 0 мы разложим в точке 0 = 0, оставив линейные члены, пренебрегая членами высокого порядка. Это приближение справедливо для небольших значений 0. Напомним, что р,=Р{Х>0) = = 1 F ( 6) — — 1 — F (0) + 0/ (0) = = -f+e/<P) и —рг = —0/(0). Подобным же образом р2 = Р(Х,+Х2> 0) = = 1 —F* (—20) = — “— 20/* (0), где F* — распределение свертки—функция распределения случайных величин Хг + Х2У причем Х1у Х2 — независимые, одинаково распределен¬ ные случайные величины с функцией распределения F (х), у — р2 = = 20/* (0). Более того, по непрерывности параметр 0 близок к 0, var Т- п (д+1) (2/г+1) 24 т. е. равна значению при Н0 : 0 =0. Подстановка var Т в (2.5.22) и и (2.5.21) дает Р (Т > с) = 1 —Ф fza — еГ (0) + ”6^ (0) ] . (2.5.23) л Г Я (я+1) (2л + 1) V 24 74
Заметим, что для вычисления (2.5.23) не обязательно знать р4. Далее мы подробнее опишем плотность свертки /*. Если мы предполо¬ жим, что выполняются достаточные условия регулярности, то, диффе¬ ренцируя под знаком интеграла, получим F* (о=f (*•) f (**)dx^dx*= =$eLo,F (*-*)/(**)<*** и /* (0 = _те / (* — Хг) f (х2) dx2. Таким образом, поскольку F£ Qs и /(—х) = / (х), f*(P) = ^”"P(x)dx. (2.5.24) Если F — функция распределения п (0,ст2)-распределения, то ясно, что /(о)=—L-, 1/ 2л а /* (0) /> (Г >с) = 1_ф 2 /яа п (п— 1) п г V п (л+1) (2/1+1) Г l/" JI 24 . (2.5.25) В примере 2.5.6 при п — 10, а = 0,0527, Za = 1,645 и 0 = а дают величину 0,91 вероятностей для (2.5.25). Приближение (2.5.23) действует для значений 0, близких к 0. За¬ метим, что при фиксированном 0 > 0 и я, стремящемся к бесконечно¬ сти, Р (Т^с)^ 1— Ф( —оо) = 1. Таким образом, если мы хотим стабилизировать мощность, отделив ее от 1, мы должны приближать 0 к 0 при росте я. Для больших я, ис¬ пользуя (2.5.24), (2.5.23), можно записать Р (Т ^ с) = 1— Ф (z« — УТ2 (f /2 (*) dx) ej/n”) (2.5.26) и потому, выбрав последовательность 0П = а/я */2, 1 Ф (^а "[/" 12 ( j /*(х)Лс)а) (2.5.27) можно рассматривать асимптотическую локальную мощность критерия знаковых рангов Уилкоксона. 75
В упражнении 2.10.10 предлагается найти подобное выражение для критерия знаков. Это позволяет получить локальное сравнение для асимптотической мощности Т и S для различных исходных наблюде¬ ний. Мы видим, что в этом упражнении для исходного нормального распределения Т приведен более мощный критерий, чем 5, однако в случае двустороннего экспоненциального распределения (Лапласа) дело обстоит как раз наоборот. Отсюда мы можем заключить, что даже критерий знаков, для которого, как кажется, требуется совсем мало ин¬ формации из выборки, для симметричной совокупности может быть бо¬ лее мощным. Рис. 2.4. Стабилизация мощности на последовательно¬ стях альтернатив Предыдущее приближение обеспечивает возможность эвристиче¬ ского анализа с точки зрения локальной мощности. Понятно, что для отделения мощности от 1 надо рассматривать ее на последовательности альтернатив {0Д}. Последовательность 0П = а/я1/2 из примеров, при¬ веденных выше, сходится к 0 со скоростью 1/я1/2. В следующем разделе эти понятия формализуются, и понятие ло¬ кальной асимптотической мощности заменяется понятием асимптоти¬ ческой относительной эффективности (см. рис. 2.4). 2.6. АСИМПТОТИЧЕСКАЯ ОТНОСИТЕЛЬНАЯ ЭФФЕКТИВНОСТЬ Появлением излагаемой ниже теоремы асимптотической эффектив¬ ности мы обязаны Питмену, который представил свои результаты в лет¬ нем курсе лекций в университете штата Колумбия в 1949 г. Г. Е. Нетер 76
[134] впервые опубликовал этот материал*. Начнем с определения эф¬ фективности для случая выборок конечных объемов. Определение 2.6.1. Обозначим через Vhl), i = 1,2 критерии размера а гипотезы Н0: 0 = 0 против Н А : 0 >0, основанные на Х1у ..., Хп — случайной выборке из F (х — 0), где F — фиксированная функция распределения из Q0. Для заданных 0 и Р, а< р< 1 обозначим через л(/), i = 1, 2 объем выборки, требующийся для P*,f №>№)=-- р. Тогда эффективность 1/(п1) относительно Vn2) есть отношение п{2)/п{1). Итак, если п(2)/ц(1> = 0,5, то для достижения той же мощности V(n] требуется в 2 раза больше наблюдений. Заметим, что нам надо знать распределение Vlt\ i = 1,2 при альтернативных гипотезах для вы¬ числения эффективности. Для того чтобы избежать трудностей, свя¬ занных с решением этой задачи, мы будем рассматривать лишь боль¬ шие выборки, причем мы опять имеем дело с задачей сравнения двух состоятельных критериев, мощность которых приближенно равна еди¬ нице. Напомним пример 2.5.7 и рис. 2.4. Дадим следующее определе¬ ние асимптотической относительной эффективности. Определение 2.6.2. Пусть Vhl), i = 1,2 дает два критерия гипо¬ тезы Н0 : 0 =0 против На : 0 > 0, основанных на случайной выборке Хх, ..., Хп из совокупности с F (х—0), F — фиксированная функция распределения из Q0. Пусть размер наших критериев асимпто¬ тически равен ос, т. е. PH.{VW>k<p)-+*ti=\,2. Предположим, что для фиксированного р, ос < Р < 1 {0/}— такая последовательность альтернатив, что 0/->- 0, с соответствующей ей по¬ следовательностью объемов выборки {n)l)}, i = 1, 2, причем РеЛ(№ >*<*>)->Р, i=l,2. Здесь мы опустили индекс п()} при V(lK Теперь у нас для 07- эффектив¬ ность V{1) относительно V{2) равна n(/Vnn/, и если предел п<2> *1® = Нп1-^— (2.6.1) /-►оо пу) * Е. Дж. Г. Питмен (Е. J. G. Pitman) разработал теорию асимптотической относительной эффективности (АОЭ) несколько раньше, чем это стало известно широкой научной общественности, см. его воспоминания в книге: The Making Statistitions/Gani J. ed. N Y. e.a.: Springer—Verlag, 1982, перевод более поздней книги Питмена выпущен издательством «Мир» в 1986 г. —Примеч. пер. 77
существует и не зависит от {07*}, а, и |3, то он называется асимптоти¬ ческой эффективностью К(1) относительно К(2)*. Как мы видим, асимптотическую относительную эффективность лег¬ ко вычислять и часто сходимость к пределу довольно быстрая. Это озна¬ чает, что е12 предоставляет нам существенную информацию об отноше¬ нии объемов выборки, которые необходимы для достижения того же самого уровня значимости и мощности для альтернатив, близких к ну¬ левым гипотезам. Заметим, что эффективность, как и ожидалось, зави¬ сит от F, фиксированного в £20. Пример 2.6.1. В этом примере мы предлагаем несколько иной эври¬ стический подход к Т и S. При допущениях и обозначениях примера 2.5.7 мы видим, что согласно (2.5.26) критерий знаковых рангов Уилкок¬ сона имеет приближенную мощность При фиксированном р, а < р <1 требование приближенного ра¬ венства мощности 1 — Ф (Zp) — р означает Если существует последовательность {0;}, то rij можно определить из (2.6.2). Подобным же образом для критерия знаков из упражнения 2.10.11 мы получаем 02 4/2 (0) Итак, для одних и тех же а, р и {07} отношение объемов выборок, рав¬ ное дает нам асимптотическую эффективность. Если / — стандартная нор¬ мальная плотность, то у нас е12 = 2/3. Таким образом, если выборка берется из нормального распределения с альтернативой, близкой к ну¬ левой, критерий знаковых рангов Уилкоксона требует примерно 2/3 от числа наблюдений, необходимых для нахождения критерия знаков, до¬ стигающего тех же самых уровня и мощности. Сейчас мы приведем условия регулярности, предложенные Питме- ном, и облегчающие во многих случаях вычисление эффективности. * Обычные обозначения и/или аббревиатуры ARE (от Asymptotic Relative Efficiency), АОЕ. — Примеч. пер. 1 — Ф (za —У 12 j /2 (*) dx е \f п ) . Zf) =Za — V 12 j' f\(x) dx е У п . Решая это уравнение относительно п, находим (2.6.2) (2.6.4) 78
Мы предполагаем, что Vn —статистика для проверки Н{) : 0 = О против НА : 0 > 0 с критической областью Vn > kn. 1. Vn дает состоятельный критерий*. 2. Существуют такие последовательности {рп (0)} и {ап (0)}, что (Vn — |ып (0)) /оп (0) асимптотически распределено, как п (0, 1), при¬ чем равномерно в окрестности 0 = 0. 3. Существует -к (е) =-4-»а» (°) =к (°)- 0 = 0 dv 4. Для последовательности {0П} такой, что 0Л0, при п-+оо <М0п) 1 М-л (0п) л пК ■ -> 1 и —- >■ 1, при п —> оо. (°) ^ (0) 5. Рп (°) с>0. VП оп (0) Определение 2.6.3. Величина с называется эффективностью (ef¬ ficacy)** критерия, основанного на Vn. При больших п она измеряет в стандартизованных единицах скорость изменения «асимптотического» среднего Vn при нулевой гипотезе. Критерий с относительно большой эффективностью с быстрее реагирует на альтернативы, и можно ожи¬ дать, что он обладает достаточно большой локальной мощностью. Условия 3 и 4 — это условия гладкости параметров Vn как функций р от 0. Часто статистика строится так, чтобы Vn р (0) или Eq Vn ->■ |л (0) и п var Vn стремилось к а2 (0) таким образом, чтобы можно бы¬ ло положить \хп (0) = р (0) для всех п и ап (0) = а (0)/я */2. При этом условие 2 трансформируется в следующее: п 1/2 (Vn — р (0))/ /а (0) асимптотически распределено, как п (0, 1), и к тому же равномер¬ но по 0 в окрестности 0; эффективность легко вычисляется по асимп¬ тотическим параметрам р (0) и о (0): с — р' (0)/а (0). Условия 1 и 2 — условия, накладываемые на асимптотические рас¬ пределения. Для выполнения условия 2 равномерной сходимости к нор¬ мальному распределению в окрестности нулевой гипотезы требуется центральная предельная теорема в несколько более сильной форме.- Важный инструмент для доказательства равномерной сходимости — теорема Берри — Эссеена (А 14, приложения), действие которой мы по¬ кажем на примере критерия знаков. * Здесь Р (Vn ^ kn) 1, подробнее см. теорему 1.3.1 из гл. 1, которая и да¬ ет некоторые достаточные условия состоятельности, т. е. стремления мощности к единице при любой фиксированной альтернативе. Определение см.: Н и к у- л и н М. С. //Математическая энциклопедия. — Т. 5, с. 93—95 (1985), или [194]. — Примеч. пер. ** Это эффективность не относительная в отличие от «efficiency». — Примеч. пер. 79
Пример 2.6.2. Пусть Xlt..., Хп — случайная выборка из F (х — 0), F £ Q0> с / (0) < 00• Для проверки Я0: 0 = 0 против На'- 0 > 0 мы используем критерий знаков, определенный в (1.2.1) как 5 = 2s (Хг) с вероятностью р (0) = Р (X >0) = 1 —F (— 0), заданной в (1.2.2). В обозначениях, использованных для записи условий Питмена, мы получаем (0) = пр (0), а* (0) = пр (0) (1 — р (0)). Наши усло¬ вия гладкости — в точности условия гладкости, относящиеся к исход¬ ным функциям распределения. Применим теорему Берри — Эссеена ks (Хх), ..., s (Хп): о3 (в) —Р (0) (1 —Р (0)) = Р (0) Я (0) р3 (0) = Е | s (Хг)-р (0) |3 = р (0) q (0) [р2 (0) + q3 (0)]. Мы видим, что для постоянной К Кр3 К р (9) д (9) [р2(6) + <72 (8)] < К 1 Vno* VT (р (0) <7 (0))3/2 ^ V7 Vp (0) q (6) ' (2.6.5) Предположим теперь, что в окрестности 0 = 0 дисперсия а2 (0) = = р (0) q (0) ^ М > 0, т. е. отграничена от 0. Тогда о /па3 У п VM равномерно в окрестности относительно 0. Итак, имеет место равномер¬ ная сходимость распределения критерия знаков к нормальному. Условие р (0) q (0) > М > 0 в окрестности вполне разумно, по¬ скольку при 0 = 0, р (0) q (0) = 1/2, и функция распределения F не¬ прерывна. Обычно на практике нам нужна верхняя граница для треть¬ его абсолютного момента и положительная нижняя граница для вто¬ рого момента (см. теорему А15 приложения). В этом случае мы можем доказать, используя теорему 2.5.2, равномерную сходимость распре¬ деления проекции к нормальному, и доказательство завершается при¬ менением теоремы Слуцкого (АЗ приложения). Требование отграничен¬ ное™ моментов, упомянутое выше, обычно не приводит к затруднениям при нахождении ранговых критериев, поскольку их моменты выража¬ ются через вероятности, ограниченные сверху 1 (см. например, теоре¬ му 2.5.1). Поэтому по существу новым является лишь требование отгра¬ ниченное™ дисперсии от 0, что имеет место, когда асимптотическая дисперсия непрерывна по 0 около 0 и положительна при 0 = 0. Далее мы проследим за развитием теории асимптотической относительной эф¬ фективности. Теорема 2.6.1. Предположим, что Vn удовлетворяет условиям ре¬ гулярности 1—5 и дает нам критерий размера а для гипотезы Н0 : 0=0 против На: 0 > 0. Пусть 0П = 0/я1/2 для фиксированного 0 > 0. 80
Тогда асимптотическая мощность задается формулой lira Р% (Vn > kn) = 1 -Ф (Za-вс), П-+оо (2.6.6> где lim P0(Vn>k„) = l-<$>(Za) = a, (2.6.7) и с — эффективность, определенная в условии 5. Доказательство. Используя условия регулярности и теорему А1, мы имеет для е > 0 и достаточно большого п для всех 0 в окрестности 0. Затем мы раскладываем (0) в окрестно¬ сти 0 и получаем Исходя из свойства равномерной сходимости условия 2 для достаточ¬ но больших п в окрестности О0П равна 0/я1/2, что можно подставить в (2.6.9). Умножив и разделив правую часть (2.6.9) наап (0) и заменив 0П на 0,получим Теперь (2.6.6) следует отсюда при замене 0П на 0 в (2.6.8). Зная все это, мы можем формально приблизить мощность состоятель¬ ного критерия в окрестности нулевой гипотезы. Этот подход обсужда¬ ется в примере 2.5.7. Для приближения мощности в (2.6.6) нужно знать асимптотическую дисперсию, вычисленную при Я0, и асимптотическое математическое ожидание при На, что позволяет вычислить эффектив¬ ность с. Результаты теоремы 2.6.1 можно записать в различной форме. (2.6.8) (0) = ^п (°)+еК (0*)- где 0 < 0* <0. Отсюда аргумент Ф равен kn-Vn (6) _ fen-Hn (0) еМ9*) On (0) On (0) оп (0) (2.6.9) к — Нп (0) I Оп (0) \ 0 Н-п(0п) Оп (0) \ оп (0п) / п ^ где о < е; < 0„. Из (2.6.7) Нп (0) Оп (0) # / Оп (0) \ \ Оп (0„) ) ’ И 81
Предел (2.6.7) можно переписать с kn =Mti (0) — ton (0) в виде V °п (0) ) ИЛИ [Vn-n„ (0)]/on(0)^0Z~n(0,l), где D0 — сходимость по распределению при 0 = 0. Аналогично этому (2.6.6) при 0П = 0/л1/2 выглядит так: р (Vn-Pn (0). ^ л_>ф(/_0с) "I Оп( 0) / ИЛИ lVn-Pn (0)]/ап (0y^Z ~ п (Вс, 1). Следовательно, асимптотическое распределение [Vn — P7i(0)]/an(0) изменяется лишь в части математического ожидания от 0 до 0с, где аль¬ тернатива допускает сходимость к 0. Теперь перейдем к эффективно¬ сти двух критериев. Теорема 2.6.2. Пусть статистики У (л, i =1,2 дают нам два кри¬ терия Н0 : 0 = 0 против На : 0 >0. Предположим, что оба они удовлетворяют условиям регулярности 1—5 и, кроме того, усло¬ виям из определения 2.6.2. Тогда асимптотическая относительная эф¬ фективность V{\] относительно V{V равна 4. (2-бл°) 2 где ct — эффективность У(п1)у i== 1, 2*. = lim /-* оо п{1) * Здесь Ci — lim (0)1~\/п сггп (0) из условия 5 Питмена, причем (ы/л (0) = П-+оо dQ » где \iin — математическое ожидание V% (для 1-го критерия) 0 = 0 как функция (т. е. при НА), ofn (0) — дисперсия Vi при Я0. Эта теорема дана Г. Е. Нетером [134], с работой которого полезно познакомиться.Вычисление АОЭ е±2 показано далее, см. также [144]. Дальнейшее изложение АОЭ в этой книге весьма подробно, хотя далеко не весь круг проблем АОЭ охвачен, поэтому мы ре¬ комендуем статьи Я. Ю. Никитина в «Математической энциклопедии», т. 5 (1985), стб. 1025—1027 и его статьи последних лет в Ученых записках ЛОМИ им. В. А. Стеклова АН СССР и журнале «Теория вероятностей и ее применения», см. также [285],[292], [337] —[340], [320], [289], [313], [365]. — Примеч. пер. 82
Доказательство. Мы опустим пока индекс и рассмотрим Vn. В со¬ ответствии с определением 2.6.2 мощность сходится, и поэтому стан¬ дартное критическое значение fen-Hn (еп) = Ьп-Уп (0)-еп Vn№ _^constant Оп (®n) On (®n) Умножив и разделив дробь в правой части на п1/2, получаем *n-^n(0) VnQnVnK) °п (fin) Vn ап (6n) constant Vn 0n = constant -f о (1). Если теперь мы обозначим эту постоянную 0, то увидим, что сходи¬ мость мощности следует из формы представления 0п — 0/я1 /2 +о (1)//г1 /2. Затем из теоремы 2.6.1 при i = 1,2 % (П° ^ 1 - Ф с,). Поскольку мощности должны быть равны, 0(1) с± __ 0(2) ^ Более того, из (2.6.11), с учетом того что последовательности должны быть одни и те же (см. определение 2.6.2), е<1) . o(i) е<2> . о(1> 1f V п^ VnV V а это можно переписать в виде ]/ 0(2) - ——(1+0(1)) - 0(1) +0(1) -—.+0(1). Теперь rij2)/n(y -+■ с\ !с\, что завершает доказательство. Пример 2.6.3. Пусть Хь..., Хп — случайная выборка из F (х — — 0), Eg Qs. Эффективность статистики знаков S (1.2.1) равна с. = 2/(0). (2.6.12) 83
При ixn (0) = ES = n (1 — F (- 0)), [in (0) = n f (0), a* (0) = nl4- это немедленно следует из определения 2.6.3. * Эффективность статистики знаковых рангов Уилкоксона Т (2.2.2) равна 12 \P(x)dx. (2.6.13) Для того чтобы это показать, запишем рг и р2 с помощью F: (0) =n (1-F (-0)) +П-^~-1-) J(1- F (-ДС-0) f (х-0) dx = = n(l—F(—0)) + ■" J(1 — Г(—У—20)) f(y) dy**. (2.6.14) Отсюда I*; (0) = nf (0) +n (n— 1) f P (x) dx***. Воспользуемся a2 (0) из (2.2.4) и определением 2.6.3, откуда и следует выражение для ст. Дифференцирование под знаком интеграла в (2.6.14) разрешено теоремой А17 приложения. Для этого достаточно предположения об абсолютной непрерывности F и j f2 (х) dx < оо. Равномерная сходимость нормальности из условия 2 обсуждается в упражнении 2.10.12. Рассмотрим статистику t = п1/2 Х/S, где X, S — выборочные сред¬ ние и стандартное отклонение соответственно. Эффективность равна С<=- —, (2.6.15) °7 где of = I х2 f (х) dx — дисперсия случайной величины с функцией распределения F. Это прямо следует из р п (0) = /г1/2 Q/of и оп (0)=^ 1, если применить определения эффективности)****. См. формулы (1.2.4) и формулу = lim П-* оо cs = lim Л-*- оо dE^S (0) е = о j У п. VvarHi>S J = / V'1-]/Гуаге = о ^ • —Примеч. пер. | / 0=0 | ** См. определение АЗ о свертках в приложении. — Примеч. пер. *** См. теоремы А17, А18 приложения. — Примеч. пер. **** КраМер приводит для распределения Стьюдента и исходного распреде¬ ления п (т, а), по которому распределена статистика t, varn (t) = nl (n — 2). У него же можно найти выражение для плотности при H0:Sn-i (*) = Г X xfl+ ^ /У(п—1) л; г/ ), откуда можно получить оп (0). Для про- \ л—1/ V 2 / извольного распределения F приведенные у Крамера результаты верны асимпто¬ тически, так как X и 5 — сумма п (т, а) случайных величин и их квадратов, от¬ куда <тп (0) = varn (/) 1 при л —► оо. — Примеч. пер. 84
Теперь мы готовы привести выражения для эффективности по Пит- мену для различных критериев. Напомним, что относительная эффек¬ тивность К(1> относительно V{2) есть е (Г(1), Т(2)) = с\!с\ по (2.6.10). Итак eiS'T)- 3(1 PwW • <2'616> e(S,t) = 4o?P(0), (2.6.17) e (T, t) = 12af (j f2 (x) dxj2. (2.6.18) Как указано в упражнении 2.10.13, эти эффективности инвариантны относительно преобразования масштаба. Таким образом, значение от¬ носительной эффективности не зависит от величины дисперсии исход¬ ного наблюдения of. Пример 2.6.4. Пусть Х1у ..., Хп —случайная выборка из Fe(x) = (1 — б)Ф(х)+еФ (.х/3). Это соответствует выбору из рас¬ пределения — «смеси» п (0, 1) и п (0,9). Для малых е большая часть наблюдений извлекается из п (0, 1) с попадающимися время от времени большими по величине наблюдениями из п (0,9). Эта модель называет¬ ся загрязненной нормальной моделью (contaminated normal model). Она была детально рассмотрена Дж. У. Тьюки [185]. Эта модель труд¬ но отличима от нормальной для всех от малого до умеренного значений е. Более того, загрязнение может оказывать большое влияние на свой¬ ства процедуры при небольших е. Например, Тьюки указал два рас¬ пределения, вносящих равный «вклад» в дисперсию /е (х) при е = = 0,10*. Будем вычислять эффективность Т относительно t для этой модели: /« (*) = (! — е) Ф (*) + е-£- ф (-у) . где <р (.х) — плотность для п (0, 1). Отсюда 2Vn °fe 3 (1+8е) бУ Л = 1 +8е, р2 (1-е)2+-J Vb Ул 2е (1 — е) УТ (2.6.19) Таблица 2.3 Эффективность Т относительно t е 0 0,01 0,03 0,05 0,08 0,10 0,15 е(Т, t) 0,955 1,009 1,108 1,196 1,301 1,373 1,497 См. [248], [91]. — Примеч. пер. 85
Таблица 2.3 иллюстрирует (2.6.19). Заметим, что при е = 0 мы вы¬ бираем наблюдения только из нормальной совокупности и относитель¬ ная эффективность Т по отношению к t равна 0,955. Это значит, что потерей эффективности при переходе от оптимального критерия t к кри¬ терию Г, можно пренебречь. Более того, небольшое загрязнение (5%) делает критерий Т эффективнее (на 20 %), чем /-критерий. По существу пример показывает, что / теряет оптимальность очень быстро с перехо¬ дом от нормальной модели к модели из ее окрестности. В упражнении 2.10.14 предлагается вычислить е (7, /) для различ¬ ных моделей. Результаты говорят о высокой эффективности Т для ши¬ рокого класса моделей. Если хвосты исходных распределений доста¬ точно «тяжелые», скажем, подобно распределениям — двустороннему экспоненциальному (double exponential distribution) илй Лапласа, 5 более эффективен, чем / или Т. В рассматриваемых примерах хвосты исходных распределений «тя¬ желее» хвостов нормального распределения и / никогда не является весьма эффективным. В примерах и упражнениях сравниваются Т - и / -критерии для нескольких характерных исходных распределений и двух довольно больших семейств моделей. Возникает вопрос о наличии исходных рас¬ пределений, при которых /-критерий значительно превосходит Т. Ответ отрицательный, как гласит следующая теорема Ходжеса и Ле¬ мана [79]. Теорема 2.6.3. Пусть Х1у ..., Хп — случайная выборка из F (х —0), F £ Qs. Тогда inf е(Ту /)=0,864. (2.6.20) Эта теорема показывает, что вне зависимости от типа исходного распре¬ деления эффективность Т относительно / не падает ниже 0,864. Из упражнения 2.10.14 мы уже знаем, что в (Г, /) может быть произволь¬ но большой. Доказательство. Из (2.6.18) е (Г, = 12 of (J f2 (х) dx)2. Если of = = оо, то ясно, что e(Tyt)> 0,864, так что можно ограничиться рассмотрением случая тех F£QS1 при которых сг* < оо. Более того, согласно упражнению 2.10.13 е(Т, /) инвариантна относительно изменения масштаба, мы можем рассматривать лишь те F£ Qs, у ко¬ торых of = 1, поскольку общность при этом не теряется. Опустим фиктивную переменную интегрирования. Таким образом, задача состоит в минимизации J /2 при j / = = I *2/ = 1 и I xf = Это эквивалентно минимизации j/2 + 2fc j*8/—2Ъаг j/, (2.6.21) где а, b — положительные постоянные, которые мы определим позже. 36
Теперь запишем (2.6.21) в виде j [/2 + 2Ь (х2-а2) /] = ju |<se [f2 + 2Ь (х2—а2) /] + + f [f2 + 2b (х2—а2) f]. (2.6.22) J\ х\>а Сначала дополним квадрат первого члена в правой части (2.6.22): '/+ - J',, <*’ <2-6-23> Теперь (2.6.22) равно сумме двух членов (2.6.23) и второго члена правой части, и мы можем записать плотность / минимизирующую (2.6.21). Если |*| > а, то возьмем / (х) = 0, поскольку х2 > а2, а при |*| < а возьмем / (х) = Ъ (а2 — х2), поскольку интеграл в первом члене (2.6.23) неотрицателен. Теперь определим величины а и Ь из дополнительных условий. Из J / =1 мы получаем д b (a2—*2) dx= 1, откуда следует а?Ь = 3/4. Далее, из j*2/ = 1 мы получаем ]а_ах2Ь(а2— — x2)dx= 1, откуда абЬ = 15/4. Решение относительно а и b дает а—51/2 и ft = [3 (5)1/2]/100, тогда С — __ /2 = (3 У 5/1000 (5 —*2)]2d*--= 3 У5/25 , J J -Vs и, завершая доказательство (2.6.20), заметим, что inf е (Т, /) = - 12 (ЗУ5/25)2= 108/125 = 0,864. Наконец, из примеров, упражнений и последней теоремы мы заключа¬ ем, что е (Ту t) = 0,955 для исходной нормальной модели, = 1,50 для исходной модели Лапласа, ^0,864 для исходной симметричной модели*. Рассматривая этот тип эффективности, мы можем сделать два основ¬ ных замечания: сравнение лишь асимптотическое и требует выборки большого объема, затем — сравнение лишь локальное и справедливо только в окрестности нулевой гипотезы. Последний факт указывает на то, что с помощью единичного показателя, такого, как эффектив¬ ность, нельзя достаточно хорошо описать относительное поведение кри¬ териев при всякой альтернативе. Эффективность по Р. Р. Бахадуру [15] дает нам кривую, подобную функции мощности. Для многих ин¬ тересных случаев, когда альтернативы близки к нулевой гипотезе, эф¬ фективность по Бахадуру близка к эффективности по Питмену. Об этом * На эти величины АОЭ мы советуем обратить особое внимание, поскольку они позволяют в значительной степени мотивировать применение ранговых мето¬ дов. — Примеч. пер. 87
Таблица 2.4 см. у Дж. Клотца [106], где даны и Эффективность Т относительно t другие сведения об эффективности при конечной выборке по Бахадуру и сравнении S, Т и t. для распределения п (0,25, 1) Клотц показал, что эффективность по Бахадуру возрастает от 0,955 до величины, приблизительно равной 0,98 при сдвиге 0,75 ау, и умень¬ шается примерно до 0,60 для боль¬ ших величин параметра положе¬ ния *. Первый из этих недостатков рассматривал Дж. Клотц в работе [104], где он описал эффективность Т относительно t для конечных /г. Фиксируем для критерия Т размер выборки, уровень значимости, ис¬ ходное распределение F и параметр положения 0. Если исходное рас¬ пределение нормально, то можно найти точную мощность Т. (Общая задача вычисления мощности для конечной выборки подробно обсужда¬ ется в разделе 3.3.) Теперь вычислим мощность t для заданных а и 0, чтобы получить такие объемы выборки п' и п' +1, Для которых значе¬ ния мощности t меньше или больше мощности Т. Затем используем ли¬ нейную интерполяцию при определении /г* = 6п' + (1 —6) (п' + 1)— объема выборки для t. Эффективность для конечных выборок критерия Т относительно t равна п*/п. Результаты Клотца сведены в табл. 2.4. Кроме того, он приводит и другие подобные таблицы. Приведенные выше результаты показывают, что асимптотическая относительная эффективность довольно точно соответствует относитель¬ ной эффективности при конечных выборках с общим уровнем значимости и умеренных 0. Г. Арнольд [9] получил похожие результаты при сдви¬ говых альтернативах и не обязательно нормальном распределении. Другая проверка правильности асимптотических результатов про¬ изводится посредством метода Монте-Карло моделированием мощности критериев t, знаков, знаковых рангов Уилкоксона. В [151], [152, с. 116] моделируется мощность для равномерного, нормального, логи¬ стического, двустороннего распределений и распределения Коши. В большинстве случаев эмпирическая мощность при выборках размера 10, 15, 20 не противоречит результатам, предсказанным с помощью эф¬ фективности по Питмену. Например, у критерия знаков при двусторон¬ нем экспоненциальном распределении наибольшая эффективность по Питмену, и потому у него должна быть наибольшая мощность при аль¬ тернативах, близких к нулевой гипотезе. Это именно так при 0 = 0,2 а, однако, при нелокальных альтернативах критерий Уилкоксона лучше. * Здесь мы рекомендуем некоторые обзоры и значительные работы: [343], 1262], [289], [320], [313], [365], [337], [340], [307], [308], [292, гл. 9. 10]. — При¬ меч. пер. 88 п а Эффективность 5 0,0625 0,986 8 0,05469 0,980 10 0,05273 0,968
Таким образом, эмпирические исследования мощности приносят нам дополнительную информацию. Теперь, используя теорему 2.6.1, мы покажем, что оценка Ходжеса— Лемана асимптотически нормальна. Это демонстрируется на приме¬ ре оценки Ходжеса — Лемана, полученной из критерия знаковых рангов Уилкоксона в примере 2.6.5 и подтверждается асимптотическим распределением из примера 2.4.2. Заметим, что это асимптотическое распределение критерия при последовательности альтернатив, опреде¬ ляющих асимптотическое распределение оценки. Начнем со следующей предварительной теоремы. Теорема 2.6.4. Пусть V —статистика, удовлетворяющая услови- ям определения 1.5.1, а 0 —соответствующая оценка, тогда * P(V (а) < р0)< Р (0 < а)< Р (V (а) < р0). Доказательство. Из определения 1.5.1 мы получаем 0** < ау откуда V (а) < |х0, и потому 0** < а. Эти неравенства влекут за собой Р (0** < а) ^ Р (V (а) < р0) ^ Р (0** ^ а)• Поскольку 0** — непрерывная случайная величина (см. [82]), мы по¬ лучаем Р (0** < а) = Р (V (а) С р0). Аналогично Р (0* <а) = = Р (V (а) < р0). Поскольку 0* < 0 < 0**, если 0** < я, то 0 < а и 0* < а. Отсюда Р (0** < а) < Р (0 <С а) < Р (0* < а). И окон¬ чательно Р (V (а) < р0) < Р (0 < а) < Р (У (а) Ро)• Теорема 2.6.5. Пусть 0 — оценка Ходжеса — Лемана, соответст¬ вующая статистике У, которая удовлетворяет условиям Питмена 1—5 при эффективности с. Тогда \\тР\Уп (0 — 0)<а|=Ф(ас), Л—*>оо т. е. я1/2 (0 — 0) асимптотически распределена, как п (0, с~2). Доказательство. Из теоремы 1.5.1 мы получаем Ре iVn (6-0) < а] =Р0 (Vn'Q < а) = Р0 ^Г< —^ j . Из предыдущей теоремы мы можем получить (2.6.24) * Здесь ро —точка, относительно которой нулевое распределение V = = V (0) симметрично. — Примеч. пер. 89
Поскольку р0 — точка симметрии нулевого распределения V, то Р0 (V (0) <С Ро) сходится к 0,5, что по теореме 2.6.1 соответствует ^0,5 = 0. Затем p. (V < и.) = P-,iv;ty (0) < с). которая по теореме 2.6.1 сходится к Ф (ас) = Ф (а/(с~2) 1/,г), к такому же пределу стремится правая сторона (2.6.24), и потому Рв (п^Х X (0 — 0) < а) сходится к Ф (ас). Асимптотическая эффективность двух асимптотически нормальных оценок в общем случае определяется как обратное отношение их асимп- тотических дисперсий. Итак, поскольку 0*, i = 1,2, асимптотически п (0, a?), i = 1,2; эффективность 0Х по отношению к 02 равна е (01, 9г) =—f- • (2.6.25) Из теоремы 2.6.5 следует, что эффективности по Питмену двух оце¬ нок Ходжеса — Лемана, полученных из обычных критериев, равны эффективностям по Питмену соответствующих критериев. Следователь¬ но, свойства эффективности критериев «наследуются» оценками Ход¬ жеса — Лемана *. Пример 2.6.5. Приведем асимптотическое распределение для medXb med (Xi +Xj)l2 и X и их асимптотические эффективности. Это оценки Ходжеса — Лемана, полученные по 5, Т и t соответственно. Из примера 2.6.3 следует, что они асимптотически нормальны с асим¬ птотическими дисперсиями 1/4/2 (0), 1/12 (J /2 (л:) dx)2 и of соответст¬ венно. Например, из теоремы 2.6.5 следует, что в (med = 12а/ (j /» (х) dx)2 = = е (Т, 0 > > 0,864. 2.7. АСИМПТОТИЧЕСКАЯ ЛИНЕЙНОСТЬ СТАТИСТИКИ ЗНАКОВЫХ РАНГОВ УИЛКОКСОНА. РЕЗЮМЕ. ВЛИЯНИЕ ЗАВИСИМОСТИ В этом разделе мы обсуждаем приближенную линейность Т (0) (2.3.1) как функции 0. Этот замысел будет уточнен в теореме 2.7.1. Приближенная линейность Т (0) дает возможность изучить асимпто¬ тическую длину доверительного интервала, построенного по Т. Далее, * Точнее оценками, построенными по соответствующим критериям. — Примеч. пер. 90
мы можем предложить эвристическое развитие теории асимптотиче- ского распределения 0 и асимптотической локальной мощности Т. Таким образом, приближенная линейность Т (0) прочно связывает точечные и интервальные оценки. Асимптотическая линейность — ре¬ шающий фактор в построении теории распределения ранговых крите¬ риев и оценок в линейных моделях. В конце раздела мы еще раз напомним о свойствах процедур Уил¬ коксона и обсудим последствия утраты данными независимости. Мы будем работать с где Tij (0) = 1, если (Xt + Xj)/2 >0 и 0 — в противном случае. Для упрощения обсуждения мы предположим, что истинное значение пара¬ метра 0 равно 0, общность при этом не теряется. Позже мы установим результат для истинного значения 0О. Заметим, что из примера 2.5.1 при Qs Далее, var0T (0) = var_e Т (0) 0 при п-+ оо, т. е. Г (0) сходится по вероятности (при истинном значении 0, равном 0) к р2 (—0)/2. Это можно записать в виде Т (0) = р2 (—0)/2 + ор (1), где ор( 1) — член малого порядка, который сходится к 0 по вероятности (при 0 = 0) с ростом п. В общем случае мы будем использовать следующую запись: ор (6), которая означает, что ор (6)/6 сходится к 0 по вероятности при стремлении б к 0. Если мы можем дифференцировать (2.7.2) по 0 под знаком интегра¬ ла, то где о (0)/0 0 при 0 ->■ 0 и р2 (0) = — 2 J /2 (х) dx. Отсюда с высокой вероятностью для малых 0 и больших п 7(0) = (2.7.1) £0 Т (0) =£_е Т (0) -* -^р2 (-0), (2.7.2) где = [i—F(~x + 2Q)U(x)dx = = "2~ „о F ^Х~ 29^ ^ ^ dX' 2 J Рч (— 0) = Рч (0) + 0р2 (0) + 0 (0)
и это дает основание предполагать, что Т (0) — «приближенно» линейная по 0 функция с тангенсом угла наклона j f2 (х) dx. Прежде чем дать строгое обоснование того, что Т (0) асимптотиче¬ ски линейна, мы докажем вспомогательную теорему. Теорема 2.7.1. Пусть Vn (b) = Un (b) + сп 6, где Un (Ь) — моно¬ тонная по b функция, и \сп | < оо. Предположим, что для каждого Ь р Vn(b) —>-0 при л->• оо. Тогда для любого В>0 и любого е>0 при Я—+- ОО Р (sup | V,, (6) | > к! -v 0. \ IMsgB I Доказательство. Пусть заданы е > 0, у >0. Разобъем [—В, В) на d интервалов: — В = />0 < < ... <С bd — В так, что [bt — — bj-x 1 < е/2 с для i = 1, d. Поскольку есть конечное число bi, мы можем найти такое целое N, что из я > N следует Р (max | Vn (bi) | <-yJ > 1 —у. Предположим, что Un (b) не убывает, общность при этом не теря¬ ется. Если \Ь\ <5, то б*-! < b < bt для некоторого i. Сначала пред¬ положим Vn (Ъ) ^ 0. Тогда \Vn (6)| = Vn (6), и мы можем записать \Vn(b)\ = Un(b)+cnb^ ^;Un (bi— l) + Cn ft|_l + Cn (b bi— l) ^ <|V„ (&,_.) | +\Cn\ (b-bi-i)^ < max | Vn (6i_x) 14—. i 2 Подобные соображения применяются и в случае Vn (b) < 0, откуда sup \Vn (й) К шах|Уп(&г)|+4- • I Ы*£В i 2 Наконец, при я ^ N P I sup •|Vn0)|>el<Pfmax|Vn(6i)|+-^>e)< J I i 2 J < Р jrnax | Vn (bi) | > -|-} < V. что завершает доказательство. Теперь формализуем идеи приближенной линейности для статисти¬ ки знаковых рангов Уилкоксона. оо Теорема 2.7.2. Предположим, что F £ Qs и j” f2 (*) dx < оо. Пусть — оо истинное значение 0 = 0. Тогда, обозначив вероятность, вычисленную при 0 = 0, через Р0 (•), имеем для 8>0иВ>0 lim Р0 jsupj Vn [Т (b/Vn)~T (0)] + b J* ^ p (x) dx | > e} =0. (2.7.3) 92
Доказательство. Пусть в теореме (2.7.1) ип (Ь) = п'/Ч?(Ып1/2) —Т (0)] и сп = | /2 (х) dx, тогда мы сначала должны показать, что Un (b) ^ — b J /* (х) dx- Теперь ^ = (°- b'VK) п (я + 1) 2 И £{/„ (fr)- -V* №^-[F*(blVK)~F* (0)] + п(п+ 1) L +п [F (b/Vn)-F (0)]j , где F* (/) = Р ((Хх + Х2)/2 < /)= F (2t—x)f\x) dx. Отсюда £t/n (6) K/TlF*(6/Vn )-£*(0)]/2. Предполагая существование производных, мы имеем EUn (b) ~ — )-f> (°)1, _Ё_ до |,=0. 2 6/Кя 2 d< Поскольку Т7* — свертка двух абсолютно непрерывных функций рас¬ пределения, согласно теореме А17 она также абсолютно непрерывна с плотностью распределения в 0: = 2 Г f (2t—х) f (х) dxl =2 Г f2 (х) dx. t = 0 J \t= 0 J Это означает, что EUn (b) ->- — b J f2 (x) dx. Теперь мы должны рас¬ смотреть var Un (b). Пусть =1, если (Xt + Xj)/2 £ (0, bln1!2], и 0 —в против¬ ном случае, тогда var Un (b) ~ var [VV hj] ■ ra2(n+l)2 ») Используя доводы из теоремы 2.5.1, получаем var(22 /«) =iLfcII Var In+n (n-1) (n-2) cov (/„, /13), так что var Un (b) ~ cov (I12,I13) и I cov (/u, /13) | = | EIn I13-(EIn)21 < EIn+(EIu)2. 93
Ho EI12 = F* (b/n1/2) — F* (0) 0, так что var Un -> 0. По теореме A5 Ua (b) ^ — b J f2 (x) dx и Vn (b) -> 0. Поскольку Un (b) не убывает no b, мы можем применить теорему 2.7.1, что завершает до¬ казательство. Теперь (2.7.3) можно разложить и переписать разными способами. Выражения (2.7.4) — (2.7.6) дают нам три формы записи. Во-первых, Vn f(b/Vn)-Vn T(a/[/n) = —(b—a) j./2 (x) dx + op (1) (2.7.4) равномерно по таким a, b, что — Л <; a < fr < Л. Заметим, если мы возьмем 0 = Ь/п1/2 и 0О = а/л1/2, так что я1/2 |0 — — 0О| < А, то Vnf(Q) = VnT{%)— Vn (0— %)^f2(x)dx, (2.7.5) а это обеспечивает нам приближение с помощью ряда Тейлора для /г1/2 Т (6) в 0О. Если 0О — истинное значение 0, так что Eq0 Т (0о) ~ ~ 1/4 и vare0 Г(0) ~ 1/12 /г, то мы имеем при м1/2 |0 — 0О[ < А, ~\/п\Т (0)— 1/4] _ У^[Г(90)-1/4] 1/77Т2 1/ТТТ2 — Vn (0 — 0о) V12 5 /2 (х) dx. (2.7.6) Согласно (2.7.6) тангенс угла наклона стандартизованной статистики Т (0) равен /г1/2 сШУ т. е. эффективности Т из (2.6.13). Это означает: свойства критериев те же, что и свойства полученных из них оценок. Первое наше приложение (2.7.6) — получение асимптотической длины доверительного интервала (2.3.3), построенного на базе критерия знаковых рангов Уилкоксона Т. Напомним, что если Р (Т < С2) = Р (Т ^ N — Сг) = а/2 (пусть С2 = N — Сг — верхняя критическая точка), то 0l есть (Сх +1) или (N — С2 + 1)-е порядковое среднее Уолша. Из обсуждения, следующего за определением 1.5.1, вытекает, что Т (0 L) = С2— 1. Поскольку речь идет об асимптотическом результате, мы будем исполь¬ зовать Т с ЕТ = и var Т ~ 1/12 м. Поскольку Т приближенно нор¬ мально, мы можем написать 1/n[f(e2)— /1712 где Za/2 — верхний a/2-процентиль нормального распределения. Из упражнения 2.10.17 мы видим, что л1/2 (0 ь — 0О) имеет асимптотиче¬ ски нормальное распределение. Отсюда для е >0 существует такое 94 1/4] Za/2, (2.7.7)
положительное целое число N и положительное число Л, что при п > N, Р (/z1/2|0l — 0О| ^ А) > 1 — е, и мы будем говорить, что п1/2 (0 L — 0О) ограничена по вероятности *. Наличие свойства ограниченности по вероятности п1/2 (0l — 0О) позволяет совместно применять (2.7.7) и (2.7.6) в случае больших п с высокой вероятностью и записать Zal 2 =±-Vn (?L - е«) Kl2 f /2 (X) dx. Аналогично _Za/2 = — Vn (jdu —0O) У12 j /2 (X) dx. Вычтем из второго выражения первое и преобразуем полученную раз¬ ность: _ 1 (2J8) 2^а/2 ~\/12 § j2 (х) dx причем аппроксимация имеет место при высокой вероятности для боль¬ ших п. Говоря более формально, стандартизованная длина дове- /N /—ч рительного интервала по Уилкоксону /г1/2 (0 v — 0 ь)/22&/2 сходится по вероятности к 1/(12)1/2 j./2 (х) dx = Нет, т. е. к величине, обратной эффективности (неотносительной). Заметим, что для замены 0 в (2.7.6). /ч ✓— на 0 L и 0 и нам нужна равномерная сходимость. Позднее мы увидим, что общие свойства доверительных интервалов следуют из свойств критериев. В упражнениях предлагается проверить этот факт для критерия знаков и ^-критерия. Отношение квадратов длин двух интервалов есть мера относительной эффективности интер¬ валов, причем это отношение сходится по вероятности к питменовской эффективности соответствующих критериев. В этом смысле критерии, точечная оценка и доверительный интервал обладают общими свойст¬ вами эффективности. Результаты примеров 2.6.3 и 2.6.5, относящиеся к процедурам знаков. Уилкоксона, и t теперь распространяются на до¬ верительные интервалы**. Следующее приложение (2.7.6) — эвристический вывод асимптоти¬ ческой нормальности п 1/2 (0 — 0О), где 0О — истинное значение па¬ * По существу это определение ограниченности по вероятности случайных величин | = — Примеч. пер. ** Такого рода факты весьма важны и часто имеют место. — Примеч. пер. 95
раметра, 0 = medj</ (Xt + Xj)f2; см. пример 2.6.5. Оценку 0 можно записать в виде ((|о) 2 1/4] —Vп (Г—0О) У12 J/2 (х) dx. Уп IT (в)-1/4] Q 1/1712 Уд [Г (А,)-1/4] VTTT2 Отсюда j/й(e-е,) =—! vwwj-ml . Vl/12 Второй множитель — стандартизованная форма статистики крите¬ рия знаковых рангов Уилкоксона, которая асимптотически имеет стандартное нормальное распределение. Таким образом, выражение в правой части асимптотически нормально со средним 0 и дисперсией 1/12 (J /2 (х) dx)2. Это эвристическое представление показывает, как асимптотическое распределение критерия и оценки связано через приближенную линейность с эффективностью, играющей важную роль. Для получения строгих выводов требуется сначала показать, что п1/2Х X (0 — 0О) ограничено по вероятности (теорема 2.6.4). Последнее приложение (2.7.6) — эвристический вывод формулы ло¬ кальной асимптотической мощности (см. теорему 2.6.1). Пусть 0П = = 0//Z1/2. Критическая область асимптотического размера а для Т оп¬ ределяется следующим образом: Уп[Т( 0)— 1/4] _ 1/1/12 где Za — верхняя a-процентная точка стандартного нормального рас¬ пределения. Отсюда мощность равна Ре { VniT (0J-1/4)]„ >z\=po {У "If (-e/lg.)-L/4) >z\ ^ Ч 1/1/12 J { V1/12 J Уп[Г(0)— 1/4] -Vn (_%/Yn) У12 j> (*) dx > Za J = Vl/12 ГУ„[Г(0)-1/4] Za_Qyi2 Г ft (*) dx\ I Vl/12 J ) = 1 —Ф (za —0 yi2 jf (x) dxy 96
Теперь мы приведем все свойства процедур Уилкоксона. Предпо¬ лагается, что Хи ..., Хп — независимые, одинаково распределенные F (х — 0), F £ Qs, таким образом, мы имеем симметричную модель с параметром положения. Статистика знаковых рангов Т свободна от распределения при #о:0 = 0. Критерий не смещен (если применить упражнение 1.8.4), состоятелен и обладает положительной толерант¬ ностью (асимптотически равной 0,29), как принятия, так и отклоне¬ ния. Легко табулировать симметричное распределение Т при Я0, а асимптотическое распределение нормально при нулевой и альтернатив¬ ной гипотезах. Неотносительная эффективность по Питмену задается формулой ст = 121/2 j/2 (х) dx, а относительная асимптотическая эф¬ фективность по Питмену по отношению к критерию t равна 0,955 для исходного нормального распределения, 1,19 — для нормального рас¬ пределения с 5 °/о загрязнения и никогда не бывает менее 0,864. Для распределений с «тяжелыми» хвостами, расположенных в окрестности двустороннего экспоненциального распределения, более эффективен критерий знаков. Далее, эффективность по Питмену довольно хорошо отражает свойства Т в малых выборках и нелокальные его свойства при альтернативах. В разделе 6.2 критерий знаковых рангов Уилкоксона обобщается на многомерную модель с параметром положения для од¬ ной выборки. Оценка Ходжеса — Лемана параметра 0 равна 0 = med (Xt + + Xj)/2, i < /. Она не смещена и симметрично распределена относи¬ тельно 0; у нее положительная толерантность (асимптотически 0,29) и ограниченная, непрерывная кривая влияния. Значит, эта оценка робастна. Более того, /г1/2 (0 — 0) асимптотически нормальна с асимп¬ тотической дисперсией 1 /с* = 1/12 (j* /2 (х) dx)2. Следовательно, 0 «на¬ следует» свойства эффективности Т. Доверительный интервал, порожденный Г, свободен от распреде¬ ления, и /г1/2 (длина)/22а/г сходится по вероятности к \!cj. Таким об¬ разом, если эффективность доверительных интервалов определять с по¬ мощью их длины, эффективность доверительного интервала Уилкоксо¬ на «наследует» свойства эффективности непосредственно у Т. Наконец, Т (0) как функция 0 — невозрастающая ступенчатая функция со скач¬ ками (ступеньками), зависящими от средних Уолша * и приближенно линейная по 0 для больших п.Тангенс угла наклона прямо пропорцио¬ нален ст. Можно использовать приближенную линейность для выяснения того, как ст определяет эффективность критерия (посредством локаль¬ ной асимптотической мощности), асимптотическую дисперсию, асимп¬ тотическую длину доверительного интервала. Теперь мы рассмотрим простую модель сериальной корреляции, по¬ явившуюся в конце раздела 1.7. По модели паре случайных величин * См. (2.3.1), (2.3.2), (2.5.3). — Примеч. пер. 4 Зак. 284 97
<Х„ Xi+1), i = 1, 2, ... приписывается двумерное нормальное рас¬ пределение со средним 0, дисперсией 1 и коэффициентом корреляции р. Результаты Дж. Л. Гаствирта и Г. Рубина [62], доказательство кото¬ рых здесь не приводится, говорят нам о том, что для модели сериаль¬ ной корреляции проекционный метод дает нам предельное распреде¬ ление статистики знаковых рангов (см. формулу 3.25 из их работы). В нашей модели маргинальное распределение — стандартное нормаль¬ ное распределение с функцией распределения —обозначается Ф (•) . Таким образом, из (2.5.18) примера 2.5.5. посредством статистики я_1/2 х X Vp= я_1/2 2 (Ф (Xj) — 1/2) можно определить предельное распреде¬ ление Т при Н0 : 0 =’0. Последовательность Ф (Хх), Ф (Х2),... есть однозависимая последовательность, и из теоремы А16 вытекает, что п~1/2 V' р асимптотически п (0, а2) с а2 = var Ф (Х^ + 2 cov (Ф (Хх), Ф №)). Отсюда и из примера 2.5.5 мы получаем, что я-3/2 (Т — ЕТ) или я-1/2 (Т — 1/4) имеет то же предельное распределение, что и я~1/2 V' р. Случайная величина Ф (Хх) равномерно распределена на интерва¬ ле (0, 1), так что var Ф (Хх) = 1/12. Далее мы рассмотрим cov(Ф(Xj), Ф(Х2))=£[Ф(Х1)Ф(Х2)]-£Ф(Х1)£Ф(Х2). (2.7.9) Математическое ожидание берется по отношению к двумерному нор¬ мальному распределению, обозначаемому Ф (х, у). Пусть U и V — независимые п(0, 1)-переменные, независимые от (Xlf Х2), тогда ЕФ (Хх) Ф (Х2) = j j Р (U < Xj) Р (V < х2) йФ (хи х2) = = P(i/<Xj, V^X2)=P(U—X1^ 0, V— X2s^0). (2.7.10) Заметим, что Е (U — Хх) (V — Х2) = ЕХгХ2 = р и var (U — — Хх) = var (V — Х2) = 2, так что корреляция между U — — Xj и V — Х2 равна р/2. В действительности (U — Xly V — Х2) имеет двумерное нормальное распределение со средним 0, дисперсией 2 и коэффициентом корреляции р/2. Вероятность Р (U — Xj < 0, V — Х2 < 0) не зависит от дисперсии (разделим неравенства на 21/2), отсюда упражнение 1.8.14 дает нам вероятность, равную 1/4+ (1/2 л) х X sin-1 (р/2). Поскольку ЕФ (Xj) ЕФ (Х2) = 1/4, (2.7.9) превращается в (1/2 я) х sin-1 (р/2) и °2 — -гг' + ~ sin-1 (р/2). (2.7.11) IZ л Таким образом, п112{т— асимптотически распределено, как п (0, а2), и если мы предположим, что выбор делается из последователь¬ ности независимых, одинаково распределенных случайных величин, 98
то критерий уровня 5 % для больших п задается неравенством Т > 1/4 -j- 1,645/(12 л)1/2. Однако, истинный уровень значимости равен ат = Р (Т > 1/4 + 1,645/|/'Т2л) = Р (1Тп (Т — 1 /4) > 1,645/J/12 ) = У л (Г— 1/4) ^ 1,645 (Р/2) = 1-Ф 1,645 12 1 + sin-i (р/2) (2.7.12) К табл. 1.4 можно добавить еще одну строку, где будет отражен ис¬ тинный уровень Т. Однако строка для Г почти идентична строке для X. Это не удивительно, поскольку sin-1 t = t + /3/6 + ..., так что 1 + (12/я) sin-1 (р/2) = 1 + (12/2 я) р = 1 + 2 р, т. е. равно асимптотической дисперсии для X. Итак, в этой простой модели зави¬ симости данных превосходство в устойчивости уровня Т над / утрачи¬ вается. 2.8. СТАТИСТИКИ С МЕТКАМИ ОБЩЕГО ВИДА В первых семи разделах мы развивали методы проверки гипотез и оценивания, основанные на статистике знаковых рангов Уилкоксо¬ на. Необходимая нам теория распределений для конечного и асимптоти¬ ческого случаев, чтобы можно было строить критерии и доверительные интервалы, была развита в разделах 2.1—2.3. В последующих разделах мы выстраиваем теорию локальной асимптотической мощности и эф¬ фективности Т. В частности, мы выясним, что при симметрии исходной совокупности Т часто доставляет нам более эффективный набор мето¬ дов, чем критерий знаков или /-критерий. Однако, Т не есть равномер¬ но лучший критерий и для него отсутствует теория оптимальности, как та, что приведена в гл. 1 для критерия знаков. В этой главе мы обобщаем статистику Г, основанную на рангах аб¬ солютных значений наблюдения, на статистику, основанную на функ¬ циях рангов (так называемых метках) абсолютных значений. Мы постро¬ им асимптотическую теорию, необходимую для построения прибли¬ женных критериев и интервалов. В следующем разделе мы эвристиче¬ ски изучим свойства эффективности и рассмотрим задачу нахождения наиболее эффективных статистик с ранговыми метками для заданного исходного распределения. Определение 2.8.1. Пусть 0 = а (0) < а (1) < ... < а (п) — по¬ следовательность, где хотя бы одно неравенство строгое, определим V= £ “ (Ъ) * (Xj) = 2 ajS (XD ) = £ a, Wj% /= i 1= i i= i 4* (2.8.1) 99
где Rj — ранг \Xj\ среди \Хг\, ..., \Хп\; Wj дается (2.2.1), Dj — антиранг из определения 2.2.1. При этом V называется статистикой ранговых меток. Заметим, что если aj = 1, / = 1, ..., я, то V = S, а если dj = /, / = 1, ..., /г, то V = Т. В упражнении 2.10.4 предлагается показать, что если Хъ ..., Хп — независимые, одинаково распределенные случайные величины с функ¬ цией распределения F (х), F£ Qst то i= i varVi*— ^ a} (2.8.2) /=1 cov(Vlf v2) = — v ajbj, 4 £1 где Vx = и V2 = hbjWj. Из теоремы A10 приложения сразу следует, что (V — EV)/(var V)1/2 имеет стандартное нормальное распределение, а это обеспечивается требованием шах а{ Hm =0. (2.8.3) П-* оо l/?*» Отсюда, используя (2.8.2) и (2.8.3), мы можем легко определить, ког¬ да возможно нормальное приближение для статистики знаковых ранго¬ вых меток V. Часто метки даются так называемой функцией, порожда- щей метку (score generating function)*. Определение 2.8.2. Предположим, что <р (и), 0< и< 1— неотрица¬ тельная и невозрастающая функция. Далее, пусть j ф (u) du < оо и о 1 0 < .( Ф2 (и) du<ioо. Определим a (i) — ср ((И(п + 1))], тогда 0 * В [68] такие функции называются ср-функциями. — Примеч. пер. 100
есть статистика, полученная с помощью функции, порождающей метку Ф (•). Заметим, что ф (и) = 1, 0< и< 1, даетнам5,аф(и) = ыдает7\ Теорема 2.8.1. Если ф (•) порождает V, то £P=-JL при п varK =— 2ф2(—-—Г* ф2(u)du при п->- оо 4п \ ге+1 / 4 J о <«)**) и — ИЛИ - У L j/"var V i Г 1 р 1 7 1 " (а) асимптотически нормальные статистики. Доказательство. Формулы для моментов получают прямо из (2.8.2)* и определения интеграла Римана. Для установления наличия асимп¬ тотической нормальности согласно (2.8.3) мы должны показать, что шах ф [ —) \n + \J ~ ■ - -»0 при п^со. Перепишем квадрат левой части последнего выражения в виде —W—) П+1 Г \ П+1 ) (тЬ Теперь достаточно показать, что числитель сходится к 0, поскольку знаменатель сходится к 0 < J ф2 (и) du < оо. Так как ф (и) — не¬ убывающая функция**, мы получаем О < (—1-—) ф2 (—-—) < Г ф2 (и) du. [ п+\ Г U+1 J Jn/(«+l) Поскольку 0< J ф2 (и) du < оо при п —оо, то и правая сторона стремится к 0. Эта теорема показывает, что для приближения распределения боль¬ шого класса возможных статистик критериев можно использовать нор¬ * Формулы (2.8.2) полезно сравнить с формулами (2.2.4). — Примеч. пер. ** В этом случае при а = п/(п + 1), b — 1, ф2 (и) = ф (и), ф (а) (Ь — а) < Ь
мальную аппроксимацию при построении критических значений кри¬ териев. В упражнении 2.10.20 требуется показать, что (Vly V2), соот¬ ветствующим образом стандартизованные, асимптотически двумерно нормальны. П. Дж. Бикел [23] получил разложение Эджворта для статистики с общими метками. Обеспечивая выполнение условий регулярности, об¬ суждаемых Бикелом, мы вычисляем и Ev \ f1 Ф4 (и) du <t =Ф(0 + Ттг11 (2.8.4) VwarV ) \2п(^ц?(и) duf где ф (х) — плотность распределения случайной величины п (0,1). Можно эвристически развить понятия и теории толерантности асимп¬ тотической проверки гипотез (см. определение 1.6.2) для критерия с метками общего вида. В соответствии с определением толерантности принятия для заданных значений ха+2, ..., хп мы будем брать хъ ..., ха+1 отрицательными с большими абсолютными значениями. Отсюда п — а— 1 . ^<-2 ф(-гг)- п t^\ ' п+{ • и мы не сможем отклонить гипотезу, если 1 Ц> (и) dU+Za!2^/Г-J-j1 Ф2М du. Мы использовали асимптотическое математическое ожидание и стан¬ дартное отклонение для получения приближенного критического зна¬ чения. Толерантность принятия гипотезы есть такое наименьшее а; при подобном эвристическом подходе мы будем предполагать, что для больших п, а = еп. Отсюда е — асимптотическая толерантность при¬ нятия гипотезы. _ 1 ~~е Тогда для больших nV ~ J ф (и) du и е — решение о Г* 6 ф (и) du = — Г* ф (и) du, (2.8.5) Jo 2 Jo поскольку второй член в определении критического значения стремится к 0. В случае толерантности отклонения (гипотезы) мы зафиксируем хь+2, ...,хп и выберем jq,..., хь+1 положительными с большими аб¬ солютными значениями. Тогда I =п — о уу если V du + Za/2 у^j*\2(u)du. i = n — b и мы отклоним гипотезу, если 102
И опять, если мы предположим, что b = 6п для больших /г, то асим¬ птотическая толерантность отклонения определяется с помощью В типичных случаях б = е, и эта асимптотическая толерантность совпадает с той, которую куда более абстрактным способом вводит Г. Ридер [154]. Это то же самое, что точка скачка оценки, полученная из ранговой статистики (см. [91, с. 73]). Пример 2.8.1. Статистика с нормальными метками. Пусть Ф(-) — функция распределения стандартного нормального распределения, а Ф+ (х) = 2Ф (х) — 1 = Р (\Х\ < х). Пусть ф (и) = Ф+1 (и), тог¬ да статистика V равна т. е. предложенная Д. А. С. Фрэзером [55] одновыборочная статистика с нормальными метками. Заметим, что Ф+1 (il(n + 1) = Ф-1 (1/2 + + i/2 (п + 1)) примерно равны E\X\\t). В упражнении 2.10.21 пред¬ лагается показать, что ф (и) = Ф+1 (и) удовлетворяет определению 2.8.2 и поэтому является функцией, порождающей метки. Приближен¬ ная нормальность следует из теоремы 2.8.1. Поскольку Ё] . Х|<*) в вы¬ числениях V используют чаще, чем Ф71 (i/(ti + 1)), то именно они табулированы в [64] и [104] **. Простая аппроксимация Ф”1 (и) есть 4,91 [и°'и—(1—ы)0’14]. Она основана на ^-распределении Тьюки и обсуждается в [97]. Поскольку Ф+1 (и) = Ф"”1 [(и + 1)/2], асимптотическая толеран¬ тность принятия определяется с помощью Аналогичные выкладки показывают, что асимптотическая толерант¬ ность отклонения также равна Ю,239. Это немного меньше, чем асимп¬ * Здесь |X|(*) — t-я порядковая статистика среди |ДГХ|, ..., |ХП|,'причем Xt ~ ~ п (0,1). См. также [68, гл. III, раздел 5, п. 5.1]. — Примеч. пер. ** Е. Л. Леман в [116] советует пользоваться таблицами критических точек [363], где 11 < п < 17, поскольку в [104] п < 10. Большие таблицы для кри¬ терия знаковых рангов см. [269], где предусмотрены и связанные ранги (связи). Для критерия Фрэзера после 1957 г. могли появиться и более обширные таблицы. По теме этой главы см.[292, т. 4, гл. 3]. — Примеч. пер. Упражнение 2.10.21 дает возможность свести это к и е = 2 (1 —Ф {V log 4)) = 0,239. 103
тотическая толерантность критерия знаковых рангов Уилкоксона, рав¬ ная 0,293 (упражнение 2.10.5), однако критерий нормальных меток не¬ сколько более устойчив к выбросам, чем критерий t. Пример 2.8.2. Винзоризованная знаковая ранговая статистика. Пусть ф (и) = min (ы, 1 — у), 0 < и <. 1, см. рис. 2.5. Для статистики V = гг1 2ф (Rt 1(п 1)) s (Xt) назначается ранг (1 — у)* 100% наименьшим по абсолютному значению наблюдениям и (1—у) раз берется 5 (х) для (у)-100% наблюдений с наиболь- (1 —у)-100% уилкоксоновских и (у) 100% знаковых меток. Термин «винзоризация» (winsorization) распределена. Сравнение точного и асимптотического параметров об¬ суждается в упражнении 2.10.23. Асимптотическая толерантность при¬ нятия е определяется из Если 1 — г <1 — у, то (1 — е)2/2 = (1 — у2)/4 и е = 1—[(1^-у2)/ /2]1/2. Если 1 — е > 1 — у, то (1 — у)2/2 + (1 — у) (у — е) == — (1 — у2)/4 и е == (1 +у)/4. Заметим, что в первом случае 1 —е= = [(1 —у2)/2]1/2 <1 —у. Поэтому требуется выполнение неравен¬ ства у < 1/3. Отсюда асимптотическая толерантность равна Легко проверить, что асимптотическая толерантность отклонения та же самая. Оценивание толерантности обсуждается в конце примера Изменяя у от 0 до 1, мы меняем статистику от статистики знаковых рангов Уилкоксона до статистики критерия знаковых рангов. Некото¬ рая априорная информация о «тяжести» хвостов распределения исход- 104 шими абсолютными значениями. Таким образом, V представляет смесь Рис. 2.5. Винзоризованная функция зна¬ ковой ранговой метки ф(и) 1 1 — V{\—у2)/2, если Y<-g-. (l + V)/4, если . 3 2.8.4.
ной совокупности может принести пользу при выборе критерия с высо¬ кой эффективностью, сведения о близости исходного распределения к нормальному приводят к выбору у около 0, а сведения о близости ис¬ ходного распределения к двустороннему экспоненциальному распре¬ делению приводят к выбору у, близкого к 1. Г. Ридер [153], [154] по¬ строил теорию асимптотической робастности ранговых критериев. По его результатам можно заключить, что некоторая винзоризация может быть желательна в любом случае для получения тех свойств устойчиво¬ сти, которые он обсуждает в своих работах. Дальнейшее описание вин- зоризованных знаковых ранговых статистик см. в [146] и [77]. Пример 2.8.3. Модифицированные знаковые статистики. Пусть ф(ц)=0, если Ос w < 1—у и 1, если 1—у < w < 1. Тогда V = а-1 2ф (Rjl(n + 1)) s (Xj). Пусть V = п V, откуда V — число положительных наблюдений, для которых ранги абсолютных значений больше, чем (1 —у) (п + 1). При у = 1 статистика V = S. Заметим, что V = 2 Wj9 /=[<1-V)(n+1)] + L где [ • ] — наибольшее целое от числа в скобках и Wj определена в (2.2.3). Теперь из теоремы 2.2.1 следует, что при нулевой гипотезе V распределена биномиально с параметрами р= 1/2 и п—[(1—у) (л+1)], так что легко определить критические значения. Изменяя у, мы порождаем семейство модифицированных знако¬ вых статистик. Позже мы увидим, что эффективность можно уве¬ личить более, чем эффективность критерия знаков, путем разумно¬ го выбора у. В отличие от знаковой статистики при альтернативных гипотезах распределение уже не будет биномиальным, см. пример 2.4.2. Асимптотическое распределение при нулевой гипотезе обсуж¬ дается в примере 2.10.24. Дальнейшее обсуждение этих статистик см. в [137] и [121]. Теперь мы вернемся к статистике с ранговыми метками общего вида V = Ha(Rj)s (Xj)t определенной в (2.8.1), и рассмотрим изученные оценки V. Определим, как обычно V (0) = 2а (Rj (0)) s (X—0), (2.8.6) где Rj (0) — ранг \Xj —0| относительно \Хг —0|, ..., \Хп — — 0|. Порядковые статистики выборки обозначаются Х(Х) < ... < Х<п). Далее мы приведем теорему Д. Ф. Бауэра [17], описывающую V (0) в виде зависимости от средних Уолша, записываемых так: (Х<*) + + Х(Л)/2, 1 <*'</< /г. Теорема 2.8.2. Функция V (0) как функция 0 — такая невозрас¬ тающая ступенчатая функция, что V (в) убывает на величину аг на каждой X(j),V (0) убывает на величину a7_i+1—a7_i на (Х(*> -\-Х^))!2. Доказательство. Сначала рассмотрим 0 слева от Х(;>. Величина X(j) — 0 положительна и мала и имеет ранг 1 относительно абсолют¬ ных значений. Таким образом, ах входит в У (0). Однако, рассматривая 105
величину 0 справа от Х(7), мы видим, что Х(7) — 0 отрицательна, но ранг ее абсолютного значения все еще равен 1. Следовательно, аг не включается в У (0), и потому V (0) должна уменьшаться на величи¬ ну аг на значениях Х(л, j = 1, ..., п. Теперь рассмотрим Хц) и X(j) для некоторой пары i < /. Пусть величина 0 находится слева от (Ха) 4- X(j) )/2. Величина Х(7) — 0 несколько больше, чем |Х(*> — 0|, а также больше, чем \X(h) —Q\,i<zk С/, т, е. для порядковой статистики, лежащей между X(t) и Х(;). Отсюда ранг Х(Л — 0 дол¬ жен быть / — (i — 1) = / — i + 1, и поскольку Х<7) — 0 > О, то 1 используется при вычислении V (0). Для величин 0 справа от (X (/) + Хи))/2 ситуация обратная. Теперь |X(i) — 0| чуть больше, чем — 0, и ранг Х<7) — 0 уменьшается на / — i. Отсюда в (X(j) -f- X(j))/2 график функции V (0) делает скачок, умень¬ шаясь на величину aj-i+1 = а^-Ь, Определив 7^(0) = 1, если (Х(0 + Х(;-))/2>0, и равно 0 — в про¬ тивном случае, мы можем строить считающую форму V (0). Поскольку V (0) — ступенчатая функция, ее значение (высота) — сумма накоп¬ ленных высот ступенек на средних Уолша, находящихся справа от 0. Отсюда V (0) = 2 2 to-i+1-а,-») ти (0). (2.8.7) *</ Из упражнения 2.10.2 при реализации модели выбора из симметрич¬ ного распределения F (х — 0), F £ QS1 мы вддим, что V (0) симметрич¬ но распределена относительно 1>аь/2. Так же как обычно, оценку Ход¬ жеса— Лемана из определения 1.5.1, можно получить из V (0) == = 2ai/2. Если мы ограничим рассмотрение такими метками, что Oj-i+i—=—7-7- или 0, (2.8.8) п-\г 1 то скачки (ступеньки) постоянны и происходят на некоторых средних Уолша, см. (2.4.1) в разделе 2.4. Пусть множество В определяется как В = ((t, /): 1 < i < j < П, aj-i+1—aj_i = (n + l)-1). (2.8.9) Таким образом, В описывает множество тех средних Уолша, для кото¬ рых имеют место скачки. Теперь мы запишем V (0) следующим образом: F(0) = -L 22 (а,-,+1-а,_,) Т„ (0) = —L— 2 2 Тч (0) = П /</ П (/,/)€=£ =~TZK*{ Х{ЧХф >9’ (2-8.10) n(rt+l) ( 2 I Условие (2.8.8) сводит статистику к функции, перечисляющей средние Уолша. В примере 2.8.4 мы обсудим точечные и интервальные оценки 0, построенные по винзоризованной статистике из примера 2.8.2. Мы также получим толерантность оценивания и сравним-ее с толерантно¬ 106
стью усеченного среднего. Пример 2.8.4. Рассмотрим винзоризованную знаковую ранговую статистику Уилкоксона из примера 2.8.2 (формула (2.8.10)) с at = = ф (И(п + 1)) = min (i /(п + 0» 1 — У)• Итак, если [•] — наи¬ большее целое число, то at = если Ос С 1 —у, т. е. [(1 —у) (п + 1)1, tl-f- 1 л -f- 1—у, если 1—у< ——^ 1, т. е. [(1—y)(n+l)]<i<n+l, л+ 1 И если /—t<[(l—у)(п+ 1)]. (2.8.11) п-\- 1 [Если (1 — у) (п + 1) — целое число, то в (2.8.11) его надо умень¬ шить на 1.] Теперь мы видим, что винзоризация рангов приводит к ог¬ раничению на входящие средние Уолша от тех порядковых статистик, которые отстоят слишком далеко в выборке. К примеру, полуразмах (Х(1) + АГ(/г))/2 сразу будет исключен. Оценка Ходжеса — Лемана есть med [(Хц) +Х(/>)/2), где Теорему 2.4.1 можно прямо использовать для доказательства сим¬ метрии 0 относительно 0. Пусть теперь Nv =-- [(1 —у) (п + 1)1, значит, имеется N* = = {п (п + 1) — (п — Ny — 1) (я — Ny)}!2 таких пар (i, /'), что у — i < Ny. Пусть V — п (п + 1) V в (2.8.10), так что V = = ф (Хц) + X(j)) /2 > 0, (/, /) g В, т. е. V — число положитель¬ ных средних Уолша, удовлетворяющих ограничениям, налагаемым множеством В. Исходя из того, что V асимптотически нормальна, мы можем записать (см. пример 2.8.2). р (V < с) - Р (V < cjn (п + 1)) = = Ф Уп [с/п (п+ 1) — (1 — Т2)/4] 1 _ а/2 V(I-V)2(1 + 2y)/12 J и, приравнивая стандартизованное критическое значение к—Za/2, т. е. нижней стандартной a/2-процентной точке, мы получаем ../1 ^п(п+1) 7 , f (1 — У)2 (1 + 2у) п (п-\-\)2 C = (l-V) a/2 у й (1 — а) 100-процентный приближенный доверительный интервал для 0, основанный на винзоризованной знаковой ранговой статистике, представлен в виде [№*<•+1), №<л/*-с)], где W*< ... < W*n*) — упо- 107
рядоченные средние по Уолшу, определенные посредством множества £, причем интервал следует сравнить с тем, что задается (2.3.3). Теперь мы покажем вычисления на простом примере, где исполь¬ зуются первые шесть наблюдаемых разностей из табл. 2.2. Возьмем у = 1/3, так что Ny = [14/3] = 4 и /V* = 20. Теперь мы видим, что средние по Уолшу (Х(0 + Х(Л)/2 таковы, что j — i < 4. Упо¬ рядочим наблюдаемые разности и построим средние Уолша, располо¬ женные на пересечении диагоналей следующим образом: 1 17 32 69 90 6 ^-14 24,5 50,5 79,5 9 21,5^ 43 61 16,5 40\ 53'5 35 50,5 Например, 21,5 = (11+32)/2. Ограничение / — i <4 означает, что мы должны брать 5 напечатанных строк. Оценка 0 равна (№(Ю) + + W\\\))!2 = (32 + 35)/2 = 33,5. Для приближенного 90-процент- ного доверительного интервала требуется взять Za/2 .= 1,645 и вычис¬ лить с = 2,33, а чтобы он был консервативным *, мы полагаем с =2. В этом случае интервал [№(3)> W*i8)) = [9,69). Теперь мы рассмотрим асимптотическую толерантность оценки 0, полученной из винзоризованной статистики знаковых рангов. Рис. 2.6 поможет нам выделить пары (i, /), входящие в В. Число точек на решетке в' трапециидальной области рав- > но #5, требующихся в теоре¬ ме 2.4.2. Далее, # В = N* = = {n(ti + 1) — (п — Ny — 1) X X(n — Ny) }/2, где Ny = [(1 — — Y) (п + 1)1- Нас интересует асимптотическая толерант¬ ность, так что в дальнейших рассуждениях мы заменяем п + 1 на п и Ny = [(1 —у)Х X (п + 1)] на (1 —у) п. Отсюда ' ФВ=[п*—(п — Ny)2}/2 = Рис. 2.6. j—i<Nv =[(1-y)(M-1)] = (1—Y2)n2/2. * Доверительный интервал, область, границы, коридор называются консер¬ вативными, если коэффициент доверия принимает известное минимально возмож¬ ное значение. Критерий называется консервативным в том случае, когда извест¬ но, что вероятность ошибки I рода не превышает заданную величину (в частно¬ сти — номинальный уровень значимости). См. [285, т. 2, с. 146].— Примеч. пер. 108
Теперь нам требуется # Ка+1, и опять мы рассмотрим # Ка> посколь¬ ку 1 не играет роли при больших п. Заштрихованная область на рис. 2.6 содержит точки на решетке, определенные Ка при а С п — — Ny = nyy и область, заштрихованная пересекающимися линиями, соответствует случаю а ^ пу. Площадь этих двух областей примерно равна Ка, т- е- ФК =( а^2/2 ПРИ «>** а 1 (1 — у2)п2/2 — а(1 — у)п при а^пу. Величина # Ка Для случая а < пу вычисляется из Ny/2 для треуголь¬ ника и из Ny (п — Ny — а) для параллелограмма. Теперь мы можем решать относительно а —Фв=Фка 2 “ ИЛИ (1—у2)п2 _ ( (п — а)2/2, если а>пу, 4 j (1 — у2)п2/2—а (1 —у) л, если а ^ пу. При выполнении условия а> пу мы получаем квадратное урав¬ нение по а с (допустимым) решением — = 1 —К(1 — Т2)/2. П Это дает приближение к толерантности, доставляемое а!п > у, т. е. при 1 — [(1 — у2)/2] 1/2 > у. В свою очередь это обеспечено у < < 1/3. Второе условие а < пу дает — П + У) л 4 и совместимо с условием у > 1/3. Отсюда асимптотическая толерант¬ ность 0 равна х= ( 1 —]/(1—у)2/2 при у< 1/3, 1 (1 +v)/4 при у ^ 1/3. Заметим, что если у = 0, то т =1 — (у) 1 , т. е. равна толерантно- сти 0 = med (Х( + Х})/2, i < /, а при у = 1 у нас т =1/2, т. е. толерантность равна 0 = medXj*. Эти результаты сравни¬ мы и с асимптотической толерантностью из примера 2.8.2. Теперь мы вернемся к примеру 1.6.1 и вспомним, что усеченное сред¬ нее, основанное на п — 2 [па] средних наблюдениях, имеет толеран¬ тность т (Ха) = а. Если мы сравним эту толерантность с толерантно- стью оценки 02а, построенной по винзоризованной уилкоксоновской * Точнее 0 = med {Xit i = 1, ..., п}. — Примеч. пер. 109
статистике, учитывающей (2а) 100 % знаковых меток и (1 — 2а) X X 100 % уилкоксоновских меток, то найдем, что т (02а) > т (Ха) для всех а, 0 <а < 1/2. Итак, эти оценки более устойчивы к выбросам* (more resistant to outliers), чем усеченные средние (см. [77], где есть обсуждения). Подобный анализ оценок, полученных из модифицированной знако¬ вой статистики примера 2.8.3 **, приведен в упражнении 2.10.25. Структура этих оценок проще, чем оценок, построенных по винзоризо- ванной знаковой ранговой статистике. Для удобства вычисления кривой влияния оценки из V мы перепи¬ шем статистику в более симметричной форме. Пусть sgn (х) = —1, если л: < 0; 0, если х = 0 и + 1, если х> 0. Отсюда определим V* (0) = — У Ф р-Щ sgn (X, -0). (2.8.12) Заметим, что V* (0) = 2V (0) — гг1 2ср (i!(n + 1)), так что оценку Ходжеса — Лемана, упоминаемую в (2.8.7), можно записать эквива¬ лентно с помощью уравнения К* (0) == 0. Пусть Н (х) = F (х — 0) — исходная функция распределения и Нп (х) — эмпирическая функция распределения. Как и в примере 2.4.2, мы непосредственно определяем функционал 0 — Т (Я). Нач¬ нем с записи V* (0) через эмпирическую функцию распределения. Сна¬ чала обобщим ф из определения 2.8. 2 с (0, 1) на (— 1,1) с ф (— и) = = — Ф (")• _ Теорема 2.8.3. Уравнение К* (0) асимптотически эквивалентно уравнению .ф(т+г[Нп {х)~Нп {~х+20)J)dHn {х)=0 (2А13) и функционал 0 = 7" (Н) получается из ^ Ф (Я (ж) —Я (—ж + 20)) dH (ж) = 0. (2.8.14) Доказательство. Ранг Rt (0) равен числу таких xj, для которых |Xj —0| <|жг— 0|. Теперь мы можем переписать (2.8.12) в виде 2 Ф \ —тт Х1 3 ~xi + 20 < Xj < Xj)l — ■s<x. L”+1 J — ф (^ Xj Э + *i Xj ^ •— Xi 20)1. i:b>x. 1 -j * Можно также говорить о нечувствительности к выбросам. — Примеч. пер. Когда учитываются не все положительные наблюдения. — Примеч. пер. * * 110
Используя определение эмпирической функции распределения, мы по¬ лучим 2 ц>{-^—[Нп(х1)-Нп(-Хг + 2д)_]}~ 1Л+1 } - 2 ф + 20) /: 6>*; >-га+1 -1 Поскольку ф (—и) = — ф (ц), две суммы можно объединить, и пер¬ вое уравнение получается, если представить сумму в виде интеграла Стилтьеса. Второе уравнение получается при п —оо. Отсюда следует, что функционал положения 0 = 7" (Я) прямо мож¬ но вывести из (2.8.14), а оценка Ходжеса —Лемана 0 (асимптоти¬ чески) эквивалентна решению (2.8.13). Теперь мы найдем кривую вли¬ яния функционала 0 = Т (Я). Типичная функция меток, применяе¬ мая в симметричной модели положения, удовлетворяет Ф (2u — 1) + ф (1 —2ц) = 0. (2.8.15) В теореме 2.8.4 мы получим кривую влияния при этом условии. Все примеры этой главы удовлетворяют (2.8.15). Теорема 2.8.4. Пусть F£ Qsy ф удовлетворяет определению 2.8.2, дифференцируемости и условию (2.8.15). Тогда кривая влияния функ¬ ционала Т (F) есть а (у)- 2 f" т' <2f 11) — I) /2 U) dx J OO Доказательство. Начнем с Я (х) ~F (х — 0) и определим 7 (Я) через (2.8.14) посредством j1 соФ 1Н(х)—Н(—х + 27 (/0)1 dn (X) = 0. (2.8.16) Определим Я, (х) = Н (х) + i (Ьу (х) — Я (х)), и применим опре¬ деление 1.6.4. Подставляя Я, (л:) в (2.8.16), получаем ^ ф [Я, (х)-НД-Х + 2Т (Я,))] dH (х) + +1 J“ ^ Ф [Ht (х)-Ht (-х + 27 (Я,))] d [8„ (х) - Я (х)] = 0. Продифференцируем по t и положим / = 0. Далее, положим 0=0- что упростит производную, общность при этом не теряется. Отсюда про¬ изводная представлена при t = 0 и 0 = 0, так что Ht (х) можно за- 111
менять на F (х). Наконец, напомним, что £2 (у) — производная Т (Н), вычисленная в точке t = 0. Отсюда ф 'IF (X)-F (~х)]{ 8У (x) — F(x)—f( — X) 2Q (у) - О — оо — Ьу(—х) + F( — x))dF (х) + j“ ^ ф [f (х) —F ( — х)] dby (х) — - ^ ф IF (х) -F (- х)] dF (х) = 0. Теперь f(x)-F(-x) = 2F(x)-l, /(-х)=/(х). Откуда — 2Q (у) f°° ф' (2F (х)— 1)/2(х) dx+ Г°° у (2F(x)-1)8у (x)dF(x)- J — ос J — оо - м ф' (2F (х) -1) (2F (х) -1 )dF (х) - -С“ ?'(2F (x)-l)6y(-x)dF (х) + J — оо + С°° ф (2F (х) — 1) dfij, (х) — f00 ф (2F (х) — 1) dF (х) = 0. J— оо J —оо Заменим переменную t = — х в четвертом интеграле; тогда, по¬ скольку ф (2и — 1) = — ф (1 — 2и) и ф' (2и — 1) = ф' (1 — 2и), исчезают второй и четвертый интеграл. Третий интеграл равен 2-1 |1_1 шр7 (и) du = 0 как результат интегрирования по частям. По-, следний интеграл также равен 0, поскольку ф (и) = — ф (— и). Теперь, решая уравнение относительно Q (у), получаем Г°° __ ф (2F (*) — l)d6v (х) Q (*/) = J -°° Т — --- - 2^9' (2F(x)-l)f* (х) dx ф(2/^ (£/)— 1) 2{!100Ф' (2F «-1)/2 (x)dx’ П. Дж. Хьюбер [91, с. 71] дает функцию влияния для общего случая асимметричной функции распределения F. Он указывает на то, что ис¬ пользование асимметричной F может приводить к произвольно боль¬ шим величинам функции влияния. Отсюда следует, что ранговые оцен¬ ки, такие, как медиана средних по Уолшу, могут терять свою высокую робастность при наличии несимметричного загрязнения. Напомним, что функция влияния предполагает наличие асимптоти¬ ческого распределения я1/2 (9 —0), описываемого (1.6.2). У нас получается QW(</) = - • 4{{!100Ф' (2F (x)-\)1Hx)dxY 112
Заметим, что j°° ф2 (2F (у)— 1) dF (у) = -i- ф2 (и) du = ф2 (и) du, и потому (2.8.17) тогда п1/2(0_е)Л2~п(о, jQ2 (у) dF (у)). Пример 2.8.5. Винзоризованная оценка Уилкоксона из примера 2.8.4 порождается функцией ср (и) = min (и, 1 —у), 0 < и < 1. Пусть k определяется из уравнения F ( — k) = у/2. Тогда ф (2F(x) — — 1) = min (2 F (х) — 1, 1 — у) = 2 F (х) — 1 при 0 < 2F (х) — — 1 < 1 — у или 0 < *< F-1 (1 — у/2) = k и 1 —у, если х > k. Расширим область определения ф (х) на (—1, 1), положив Ф (— и) = — ф (ц), тогда Следовательно, влияние не только ограничено, но и винзоризовано. Описание кривой чувствительности, в частности, можно найти в [77]. Результаты Л. А. Джекла [9] говорят о том, что оценки с винзоризован- ной кривой влияния имеют минимаксную асимптотическую дисперсию в моделях загрязнения (см. пример 2.9.5), а также [91, с. 10-3—104] Пример 2.8.6. Оценка из нормальных меток определяется посред- ру 2.8.1 функцию меток можно записать в виде ф (и) = Ф^1 (и) = = Ф 1 [(и + 1)/2]. Для вычисления кривой влияния нам нужна 2Т(Ф-1[(и+1)/2]) ’ где (х) = Ф' (х), т. е. плотность распределения для случайной ве¬ личины, распределенной как п (0, 1). Следовательно **, * Здесь Ф+ (*) = 2Ф (jc) — 1 = Р (|Х| < х). — Примеч. пер. ** См. определение 1.6.4 и следующий за ним материал.— Примеч. пер. Q(y) = (1 —v) sgn (у)/2 /2 (х) dx, | у | > k, (2F(y)-\)l2jk_J*(x)dx, |y\^k. и [153]. ством V (0) = g 2Ф+1 (,i/(n + I))*- Напомним, что согласно приме- Q (у) =Ф~' (F (у)) / ^ [P(x)/W (Ф-i (F (х)))] dx). 113
Предположим, что исходное распределение нормально, так что F = = Ф. В этом случае знаменатель Q (у) равен 1, и потому Q (у) = уу т. е. та же самая неограниченная кривая влияния, что и у X! Особен¬ ность оценок, получаемых из нормальных меток,— положительная асимптотическая толерантность оценивания, равная 0,239 (см. [91, с. 73]), и наличие неограниченной функции влияния. При наличии нор¬ мальной модели с е-загрязнением асимптотически минимаксной ранго¬ вой оценкой будет оценка Ходжеса — Лемана, построенная по винзо- ризованной функции меток с нормальными метками. В результате винзоризации кривая влияния становится ограниченной. (Подроб¬ ности см. [91, раздел 4.7].) 2.9. ЭФФЕКТИВНОСТЬ СТАТИСТИК С МЕТКАМИ ОБЩЕГО ВИДА В предыдущем разделе мы развили строгую асимптотическую тео¬ рию, необходимую для построения критериев и оценок из статистики с метками общего вида. В этом разделе мы обсудим теорему 2.6.1 и, те¬ перь уже не доказывая, применим ее, чтобы найти эффективность кри¬ терия с метками общего вида. Затем мы установим верхнюю границу эффективности и найдем функцию меток, при которой достигается на¬ ибольшая эффективность для заданного распределения. Кроме того, мы найдем наибольшую нижнюю границу эффективности критериев с нормальными метками из примера 2.8.1 по отношению к /-критерию,- причем полученный результат подобен границе эффективности Т отно¬ сительно / из теоремы 2.6.3*. Мы рассмотрим упорядочение распределе¬ ний по весам их хвостов (an ordering on the tailweight of distributions), которое используем для сравнения процедур Уилкоксона с имеющими нормальные метки. Наконец, мы построим асимптотически максимин- ные критерии и оценки с асимптотически минимаксной дисперсией в модели с загрязнением. Определение 2.9.1. Выражение называется информацией Фишера для /, причем требуется абсолютная непрерывность / и / (/) < оо. (См. [91, с. 77], где строится обобщение на случай I (/) = оо.) Я. Гаек и 3. Шидак [68, гл. VII, раздел 1] показали, что если функция Ф (м), порождающая метки, удовлетворяет условиям определения 2.8.2, то теорема 2.6.1 выполняется для той статистики, которая порождается Ф (и)Л причем требуется конечность информации Фишера для выбороч¬ * Речь идет о том, что наименьшее возможное значение е (Т, /) равно 0,864.— Примеч. пер. 114
ного распределения, см. определение 2.9.1. Именно, если 0П = 0//г1/2, то L%z~„(co, 1), (и) du где с —эффективность (неотносительная), определенная в 5-м из ус¬ ловий Питмена в разделе 2.6. Для вычисления с надо знать асимптотическое среднее при фикси¬ рованной альтернативе. Пусть Xlf ..., Хп — случайная выборка с G (х) = F (х — 0), F££ls и пусть Gn (х) =(ФХ( < х)1п — эмпирическая функция распределения. Тогда Н (х) = Р(\Х\ ^ х) = G (х) — G ( — х) и Нп (х) = (ф | Xt\ < х)1п. При Xj > 0 ранг относительно абсолютных значений можно записать в виде Rj = п Нп (Х7). Статистику с метка¬ ми общего вида можно записать так: = (2.9.1) Поскольку Нп (.х) и Gn (х) сходятся по вероятности к Н (х) и G (х), то можно показать, что при обсуждаемых позже условиях регулярно¬ сти V-^^<p(H(x))dG(x). Определив Н (х) и G (х), в дальнейшем можно продемонстрировать, что асимптотическое среднее р (0), если предположить, что существует стохастический предел V, задается формулой |! (0) == ф [F (х—0)—F (—х — 0)] f(x—0) dx = = j~0q>[F(;c) —F( — x—2Q)]f(x)dx. (2.9.2) Для вычисления эффективности нам надо найти р' (0) по формуле I*' (0) = 2j~cp' (2F(x)-l)P(x)dx, так как F £ Qs. Более того, о2 (0) = j ф2 (и) du/4> следовательно, „ _ 21о Ф' <2F (x)-l)P(x)dx Ф2 (и) du /ij: 115
Преобразования, приводящие к (2.9.3), проделаны строго в книге М. JI. Пури и П. К. Т^ена [149, раздел 3.6]. Они дают для <р (и) более ограничительные условия на ср (и), чем Я- Гаек и 3. Шидак [68], од¬ нако, они не требуют конечности фишеровской информации. Главное допущение Пури и Сена таково: |ср (и) | ^ К [и{ 1 — ^)]6“1/2 и |ф' (и)| ^ ^ К [и (1 —и) ]б~3/2 для некоторого 6 > 0. Теперь мы получим другую форму с. Пусть I = ф' (2F (у) — — О /2 (У) dy и сделаем замену переменных х = 2F (у) — 1. Тогда Теперь F (F 1 (*)) = х, так что дифференцирование обеих частей дает нам J-(F-i(x)) = ! . dx f (F~i (*)) Пусть и = f (F-1 ((x + l)/2)) и dv = ~ cp' (x) dx, так что du = = /' (F_1 ((х -p l)/2)) /2 f (F~l ((x -f- l)/2)) dx и v = q> (x)/2. Нако¬ нец, если ф (x) f (F-1 ((x + 1)/2)) 0 при x -v 0 или 1, то интегрирование по частям приводит к 'И^)) а с из (2.9.3) можно записать в виде f I ф W Ф f (и) du с = J°T (2.9.4) : Ф2 («) du где ’(-■mi Заметим, что эта форма не требует дифференцируемости ф (и). Она получена Гаеком и Шидаком [68] при условии конечности фишеровской информации. Рассматриваемая в разделе 2.8 оценка 0 находится из статистики с метками общего вида, она имеет нормальное распределение. В самом деле, из теоремы 2.6.5 следует, что я1/2 (0 — 0) приближенно нормаль¬ на с математическим ожиданием 0 и дисперсией 1/с2, где с задается фор¬ мулами (2.9.3) или (2.9.4). Данное утверждение совпадает с тем, что получено в (2.8.17) из свойств кривой влияния. 116
Это проистекает из линейности V (0) согласно теореме 2.7.1. По той версии, которая соответствует (2.7.6), Уп [V (0)— ф (и) du/2] Уп [V (0О) —Jo ф (и)du/2] У (и) da \/±-§\*(u)du — \fn (0—0О) с, (2.9.6) где с вычислено по (2.9.3). Это приближение равномерно по вероятно¬ сти в том же смысле, что и в теореме 2.7.2 (см. [187]). Если [0 L, 0 ^1 — доверительный интервал, полученный из V, то приближенную линейность можно использовать для того, чтобы пока¬ зать, что Упри)—К) р 2Za/2 1/с, (2.9.7) а это соответствует (2.7.8) уилкоксоновского случая (см. также [170]). Пример 2.9.1. Из примера 2.8.2 мы знаем, что функция метки для винзоризованной знаковой ранговой статистики равна ср (и) = = min (и, 1 — у). Отсюда <р' (и) = 1 при 0< м <1 — у и 0 — в противном случае, что дает 1 при 0<2F(x) —1^1—у, <р'(2Е (*)-!) = (2.9.8) 0 при 1—у <2 F (х)—1 < 1. Если мы положим л: (а) = F 1 (а), т. е. а — процентиль исход¬ ного распределения, то (2.9.8) превращается в <p'(2FW-l) = ( 1 "РИ °< Т/2). (0 при дс(1 —y/2)<jc< 1, а эффективность превращается в 2 fo °~y/2}PMdx УТ2]~Х~2 J/24Hx)dx У(1-у)2(1 + 2у)/12 У(1-у)2(1 + 2у) Относительная эффективность винзоризованных критериев знаковых рангов Уилкоксона, оценки или доверительного интервала равна (l-v)!(l + 2v) В табл. 2.5 приводятся величины е для разных значений у и нор¬ мального, двустороннего экспоненциального Коши-распределения. Заметим, что оптимальная винзоризация для распределения Коши может быть найдена при у =-■■ 0,75, а не при у = 1, чего можно было бы ожидать при распределении со столь «тяжелыми» хвостами. 117
Таблица 2.5 Относительная эффективность винзоризованных процедур Уилкоксона по отношению к критерию Т* Распределение Y 0, 1 0,2 0,5 0,7 0,8 0,9 0,98 Нормальное 0,99 0,94’ 0,92 0,81 0,75 0,70 0,66 Двустороннее экспонен¬ 1,01 1,03 1,13 1,20 1,25 1,29 1,33 циальное Коши 1,03 1,09 1,34 1,43 1,44 1,40 1,35 * Т — это критерий знаковых рангов Уилкоксона со статистикой Т = = 2 S (Xj) (2.2.2), см. раздел 2.2; критерий Стьюдента автор по традиции !</<« обозначает t.—Примеч. пер. Теперь, обеспечив выполнение условий определения 2.8.2 для Ф/ (и), мы покажем, что vf — статистика, порождаемая фу (и), обладает максимальной неотносйтельной эффективностью. Поэтому критерий и оценки, полученные по V/, оптимальны в смысле асимптоти¬ ческой эффективности. Теорема 2.9.1. Пусть Xlt ..., Хп —случайная выборка из F (х— 0), F £ Qs, которая удовлетворяет определению 2.9.1. Пусть фу (и) из (2.9.5) удовлетворяет 2.8.2 и порождает Vf. Если V — любая другая статистика, порождаемая функцией ф (и), тогда c<vm и c, = VW, где с и cf — эффективности V и Vf соответственно. Доказательство. Из (2.8.4) и неравенства Коши — Шварца мы име¬ ем S'0 Ф (ц) Фf(u)du Vк ф2 (“) j; фf (и) du _ V j; <ра май — У j Q<Pf (“) du . 118
Теперь, сделав замену переменных у = F 1 [(и + 1) /2], получаем 2 cpf2 (и) du -■ du = Теперь из (2.9.4), су= jjcpf2(«)du / (u)dM)1/2 = [/(/)],/2. Определение 2.9.2. Предположим, что F £ £2S и — log / (х) — вы¬ пуклая функция. Тогда / (х) называется сильно унимодальной*. Заметим, что если / — сильно унимодальная и 0 </(/)< < оо, то фу (и) удовлетворяет определению 2.8.2 и является функцией, порождающей метки. Более того, сильная унимодальность необходима. Согласно теореме 2.6.1 асимптотическая локальная мощность крите¬ рия, основанного на 1/у, равна 1 — Ф (Za — 6 cf). При сравнении по¬ следнего выражения с 1—Ф (Za — 0с) для некоторой другой статисти¬ ки V мы получаем 1 — Ф (Za — 6cf) >1 — Ф (Za — 0с) при Су > с. Теперь мы будем говорить о 1/у как о асимптотически наиболее мощном ранговом критерии (AHMPK) (asymptotically most powerful rank test (AMPRT)). Асимптотическая толерантность проверки гипотез для 1/у дана в упражнении 2.10.30. Оптимальные критерии разных типов, на¬ зываемые локально наиболее мощными ранговыми критериями (ЛНМРК) (locally most powerful rank test (LMPRT)), строятся для двухвыбороч¬ ной сдвиговой модели в следующей главе. В конце раздела 3.5 мы по¬ кажем, как можно построить соответствующий одновыборочный ЛНМРК. См. (3.5.15) и (3.5.16). Заметим также, что оценка 0у, полученная из 1/у, обладает тем свой¬ ством, что случайная величина я1/2 (0у — 0) асимптотически нормальна со средним 0 и дисперсией 1 /cf = 1/1 (/), равной нижней гра- нице для дисперсии Рао — Крамера. Значит, 0у имеет ту же асимпто¬ тическую дисперсию, что и оценки максимального правдоподобия. В этом смысле 0у — асимптотически эффективная оценка. П. Дж. Би- кел и К. А. Доксам [24] кратко описывают свойства асимптотиче¬ ской эффективности оценок максимального правдоподобия и дают до¬ полнительные ссылки на библиографию. См. также М. Дж. Кендалл и * Иногда говорят, что / — сильно одновершинная функция.— Примеч. пер. т
А. Стьюарт [103, гл. 18]. Кривая влияния для 6f приведена в упраж¬ нении 2.10.31. Пример 2.9.2. Пусть ф (*) — стандартная нормальная плотность распределения, тогда —ф' (х)/ф (х) = ху и мы получаем (о)=Ф-.р±!), где Ф (•) стандартная нормальная функция распределения. Из при¬ мера 2.8.1 мы знаем, что Ф+ (х) = Р (\Х\ < х) = 2Ф (х) — 1. Отсюда Ф (х) = [Ф+ (х) + П/2. Если t = Ф (.х), то х = Ф-1 (/), и аналогично t = [Ф+ (.х) + 1]/2, откуда х = Ф+1 (21—1). Итак, ф* (“) = Ф_1 (=ф+ ‘ и оптимальная ранговая статистика V^ — одновыборочная статистика нормальных меток из примера 2.8.1. Теперь заметим, что 2i|) (-m) Отсюда, если исходное распределение имеет функцию распределения F, то <P*(2F(*)-1) = 24» (Ф-1 {F (*») Из примера 2.10.21 мы видим, что J ср% (и) du = 1, а из (2.9.3) мож¬ но заключить, что эффективность равна : р —рм—dx J -со V (Ф-1 (F (*))) Относительная эффективность процедур с нормальными метками (кри¬ терия и оценок) по отношению к /-процедурам при симметричном ис¬ ходном распределении F, равна е (V^y /) = а|, где of— диспер¬ сия, вычисленная на основе F. Учитывая инвариантность от¬ носительного преобразования масштаба, мы можем положить of = 1 (общность при этом не теряется) и записать е(7*. 0 = [Г° dx Г- (2.9.10) ’ U-со ^(Ф-MfW)) J Заметим, что если выборка берется из нормального распределения, когда /-процедуры оптимальны, и F(x) = Ф(*), f(x) = ф (х)у 120
то (2.9.10) становится равным е (V$y t) = 1. Таким образом, при нор¬ мальном распределении процедуры с нормальными метками полностью эффективны по Питмену. В следующей теореме мы увидим, что проис¬ ходит с эффективностью в том случае, когда F — функция распреде¬ ления, отличная от нормальной. Этот результат впервые получили Г. Чернов и И. Р. Сэвидж [31]. Наше доказательство предложено Дж. Л. Гаствиртом и С. С. Вольфом [63]. Теорема 2.9.2. Пусть Х1у ..., Хп —случайная выборка из F (х — 0), F £ Qsy тогда Таким образом, в случае выборки из симметричного распределения эф¬ фективность процедур с нормальными метками никогда не бывает менее 1. Доказательство. Если of = оо, то е (V^y t) >1, значит, of = 1. Из (2.9.10) следует, что Применяя неравенство Йенсена (теорема А20 приложения) к выпуклой функции h (х) = \1ху получаем Интегрируя по частям и преобразуя выражения, имеем и = = W<S>-\F(x)))y du = xр' (Ф-1 (F(x))) • f (x)dx/q> (Ф-1 (F (x))) = = —Ф 1(/r (*)) f (x)dxy так как ф' (л;)/ф(х) = —х. Теперь, при dv = dxy Преобразуем *ф (Ф-1 (F (*)) в F“1 (Ф (w)) ф (w) сначала заменой t = F (х)у а затем w = Ф'1 (t). Интеграл J f,_1 (Ф (w)) ф (w) dw = = I xf (x) dx < оо, так что предел подынтегрального выражения должен быть равен 0 при х->- ± 00• Получается, что первый член о, Уе = Е f (X) } [ * (Ф-i (F (X))) = Е ^(ф-1 (р (тп (X) Ve> £№ (Ф-1 (F (X)))/f (Л)] Отсюда j г|) (Ф-1 (F (х))) dx. J♦ (ф_1 ^ (*») dX = ** (F W)) |“ ОС + + f°° xKDr-i(F(x))f(x)dx. (2.9.11) J —оо 121
правой части (2.9.11) равен 0. Обратимся к неравенству Коши— Шварца: так как j x2f (х) dx = 1 и J* х2ф (х) dx = 1. Поскольку е1/2 > 1 и е ^ 1, доказательство закончено. Заметим, что неравенство строгое для всех распределений, кроме нормаль¬ ного. Таким образом, процедуры с нормальными метками строго более эффективны, чем /-процедуры, за исключением случая, когда при¬ меняется модель с нормальным распределением, когда асимптотическая относительная эффективность равна 1. Анализируя результаты этого раздела, мы приходим к выводу о не¬ обходимости использования статистических процедур, позволяющих уменьшать значимость экстремальных значений выборки при увеличе¬ нии весов хвостов исходного распределения. Устойчивые методы дают нам возможность такой «защиты» от экст¬ ремальных значений и обладают хорошими свойствами устойчивости. Примерами служат свойства обычных или винзоризованных процедур Уилкоксона и нормальных меток в сравнении со свойствами /-процедур. Если хвосты распределений достаточно «тяжелые», то также хорошо действуют знаковые процедуры. Теперь формально определим упорядочение распределений по весу хвостов, и разовьем этот подход для процедур Уилкоксона и нормаль¬ ных меток. Определение 2.9.3. Пусть/7 и G из Qs. Будем говорить, что хвос¬ ты F «легче» хвостов G (или G имеет хвосты «тяжелее», чем у F), что обозначается F < -G, если G_1 (F (х)) выпукло при х > 0. Это определение ввел У. Р. Ван Цвет [190] в исследовании, посвя¬ щенном выпуклым преобразованиям случайных величин. Обзор дру¬ гих определений упорядочения хвостов дан в [73], а также [59]. Заметим следующее: (1) F <-F и (2) F<z-G и G<-tf влечет за собой F <•//. Следовательно, <• —слабое упорядочение*. Если F<i-G и Go/7, то мы называем F и G эквивалентными. Пусть F (х) = G (ах) при а > 0, тогда G-1 (F (*)) = ах, так что F OG, также F~l (G (х)) = х!а и потому Go F. Отсюда мы видим, = С“ xVf{x)®~4F{x)) V / (X) dx < J — оо ^5 [ [°° x2f(x)dx^°° (Ф-1 (F (х))}2 X X f(x)dx]'/2 = 1, * См., например, [285, Т. 6, с. 485—494]. — Примеч. пер. 122
что распределения, различающиеся лишь по параметрам масштаба, эквивалентны*. Это означает, что упорядочение хвостов — свойство семейства и не зависит от масштаба. Предположим, что Z7, G£QS с положительной плотностью в 0. Далее положим / (0) = g (0) (общность при этом не теряется), что достигается преобразованием масштаба для функции распределения: F (*) = Fx (х /а) с о = f (0)/g (0). Теперь допустим, что F <• G, при¬ чем они не эквивалентны. Тогда q (х) = G-1 (F (*)) строго выпукла для некоторого ху a q (х) = f (.x)lg (G-1 (F (*))) строго возрастает для некоторых х. Поскольку q (0) = f (0) Ig (0) = 1, то q' (х) > 1 для некоторого х и, наконец, G~l (F (*)) > х. Отсюда F (х) > G (х) и 1 — — G (х) > 1 — F (х), так что вероятность попадания наблюдения «на хвост» G больше**. В следующем примере мы опишем упорядочение не¬ скольких распределений, используемых для вычисления эффективнос¬ тей. Пример 2.9.3. Равномерное <• нормальное < • логистическое < • двустороннее экспоненциальное о Коши. Часть этих утверждений, мы докажем, а остальные утверждения оставим до упражнений. Пред¬ положим, что F£ Qs и / (х) — невозрастающая функция для х > 0. Пусть U (х) = 0, если х < — 1, (х + 1)/2, если — 1 < х < 1 и 1, если 1 <*, равномерная функция распределения на интервале (—1, 1). Тогда, если q (х) = F~x (U (*)) = F~x [(*+ 1)/2], то мы получаем qf (х) = 1/[2/ (F~x [(х + 1)/2])], которая не убывает при х > 0 и U<- F. Обозначим функцию распределения логистического распре¬ деления L (.х) = 1/(1 + е~х)у — оо < х <С оо. Покажем, что Ф < -L. Обратная функция равна L~l (у) = log у — log (1 — у). Допустим, ф (.х) = Ф' (*) — плотность распределения п (0,1). Заметим, что ф' (х) = —хф (х)\ повторное дифференцирование дает —L-1 (Ф (х)) = (ф (X) (2Ф (х)- 1)-*Ф (х) (1 —Ф (*))}. dx* v w/ [Ф(*)(1—Ф(*))Г Мы видим, что L-1 (Ф (*)) будет выпуклой, если функция в скобках, которую мы обозначим г (лс), такова, что г (х) > 0***. Поскольку г (0)=0 и г (х)->- 0 при Х-+- оо, достаточно показать, что г" (х) изменяется от отрицательной к положительной величине. Теперь г" (х) = — ф (х) + 2ф (х) Ф (х) —4хф2 (х) = = ty(x)s(x). * Например, распределения N (a, af) и N (а, а|), Ф а2, эквивалентны.— Примеч. пер. ** Т. е. хвосты стандартного нормального распределения «легче» хвостов логистического (также стандартизированного, но по-другому) распределения. — Примеч. пер. *** Здесь нам требуется неотрицательность второй производной, а ф (.х)1 ([Ф (х) (1 — Ф (*))]2 >0. — Примеч. пер. 123
Знак этой функции меняется, когда меняется знак s (л:), где s(x)= — 1 + 2Ф (х) —4гф (х). Заметим, что s (0) = 0, s (х) 0 при л; оо и s'(0) = — 2ф (0) < 0. Теперь s' (л:) = 2ф (л:) (2л:2 — 1), так что s' (х) < 0, если л:< 1/21/2 и > 0, если х > 1/2 1/2. Ясно, что s (х) меняет знак только один раз. Из этого следует, что г" (л;) один раз меняет знак и L~l (Ф (х)) — вы¬ пуклая функция, т. е. Ф <С • L. Остальные соотношения легко прове¬ ряются, они помещены в упражнении 2.10.31. Пример 2.9.4. Напомним, что согласно определению 2.9.2 функция / (х) называется сильно одновершинной, если — log / (х) — выпуклая функция. В этом примере мы покажем, что двустороннее экспоненци¬ альное распределение — сильно одновершинное распределение с са¬ мыми «тяжелыми» хвостами. Пусть D (х) — функция распределения двустороннего экспонен¬ циального распределения. Тогда для х ^ 0 D (х) =/1.(1/2) X Хехр{—|f|} dt = 1 — (1/2) е х. Таким образом, при х > 0 D~1(y) = — log [2(1— у)]. Предположим, что F £ Qs и f — сильно одновершинная плот¬ ность распределения, а мы хотим показать, что F < • D. Мы проде¬ монстрируем D-1 (F (х)) = — log [2(1 — F (х))) — выпуклая функ¬ ция при х > 0, выяснив, что ее производная / (х) / (1 — F (х)) не убы¬ вает для х > 0. На первом шаге надо установить, что если — log / (х)— выпуклая функция, то / (х — y')/f (х — у) < / (х' — y')/f (х’ — — у) для всех х < х' и у<. у'. Пусть t = (х' — х)/(х' — х + у' — — у), тогда х у = t (х — у’) + (1 — /) (х' —у) и (х' — у') = — (1 — t) (х — у') + t (х' — у'). Поскольку — log f (х) — выпуклая функция, мы имеем — 1 og / (х—г/)<—t log f (х—у') — (1 — 0 log f{x' — у) И — log / (х'—у’) <— (.1 — t) log f (х —у’) — Hog f (х' — у'). Суммируем эти два неравенства и будем потенцировать эти выраже¬ ния. На самом деле, условие.необходимо, и отсюда следует, что выпук¬ лость — log / (х) эквивалентна тому, что отношение правдоподобия у / (х) монотонно (см. [114, с. 330]). Теперь мы покажем, что / (х)/ (1 — F {х)) — невозрастающая функ¬ ция при х > 0. Пусть tx < тогда следующие утверждения эквивалентны: f (*i) < f (t2\ 1 ^1 ~F(t2) ’ f (k) + k) dv ^f(h)^f(v + k) dv, 124
о if (t2) t (v+h) -f (h) f {v+12)\ dv. Обозначая tx = x — yf < t2 = x' — у', получим x < x', и, обозначая v = у' — у > 0, получим у <С у'. Теперь + и = х —у и г2 + ^ = а:' — у, и первый шаг доказательства дает / (^)// + +у) ^ / (^2)// (^2 + *0- Это влечет за собой неотрицательность интег¬ рала, и потому f (х)/( 1 — F (х)) — неубывающая функция. Значит, Ь-1 (Z7 (х)) — выпуклая функция * для х > 0 и F <• D. Теорема 2.9.3. Предположим, что Z7, G£ Qs. В этом случае F <*G, если и только если / (Z^1 (*/))/£ (G-1 (у)) — неубывающая функция для всех у > 1/2. Доказательство. Пусть q (х) = G-1 (Z7 (х)). Тогда (х) = = f (x)/g (G-1 (F (x))) — неубывающая функция при х > 0. Далее, х = F~l (у) — неубывающая функция, а х > 0 при у > 1/2. Отсюда q' (Z7-1 (*/)) не убывает при у > 1/2. Теперь мы обсудим влияние «тяжести» хвостов на относительную эф¬ фективность процедуры Уилкоксона относительно процедур с нормаль¬ ными метками. Более подробное обсуждение см. [80]. Заметим, что из определения эффективности (2.6.13) и (2.9.9) Поскольку F, Ф лежат в величины интегралов равны удвоенным ве¬ личинам интегралов от 0 до оо. Принимая это во внимание и заменив переменную и = Z7-1 (х), получаем Полагая / (х) = a"1 fx (ха-1) и вычисляя eF (TyNS)t мы видим, что е (Т, NS) не зависит от а. Теорема 2.9.4. Для любого F£QS, для которого существует eF (TfNS), имеет место 0 < eF (Т, NS) < 1,91. Доказательство. При 1/2 < х <С у, Ф-1(х) < Ф-1 (у) и посколь¬ ку (1/ф (Ф-1 (х))) < (1/ф (Ф-1 (у))). Из (2.9.12) следует, что * Напомним,. что под выпуклой функцией автор понимает (как это обще принято), выпуклую вниз функцию. — Примеч. пер. eF(T,NS) = 12 J_.Bf2(x)dx 2 г. (2.9.12) и e(T,NS)^ 12 (-£"))}* = 12^s(0) = 6 /я == 1,91. 125
Пусть f (.х) = 1/2 при |*| < 1 и 0 — в противном случае; тогда зна¬ менатель (2.9.11) равен оо и е (7\ NS) = 0. В упражнении 2.10.33 по¬ казано, что это точная верхняя граница. Итак, в отличие от /-процедур процедуры с нормальными метками могут быть более эффективными, чем процедуры Уилкоксона, по край¬ ней мере для распределений, приближающихся к равномерному рас¬ пределению с «легкими» хвостами. В теореме 2.9.5 заданы соотноше¬ ния между еР(Т, NS) и весом хвостов F. Теорема 2.9.5. Пусть F, G £ и F <С • G. Тогда eP(T,NS)^eG (7, NS). Доказательство. Поскольку величина eF(Ty NS) инвариантна от¬ носительно преобразования масштаба, то мы можем выбрать шкалу переменной. Пусть а'1 = | g2 (х) dx/ J /? (*) dxy где / (*) = a-1/i (яа-1). Тогда { f*(x) dx = о~1 J f\ (х) dx = J g2 (х) dx. Отсюда мы берем f Z2 (х) dx = j g2 (х) dx, общность при этом не утрачивается. Из (2.9.11) или (2.9.12) вытекает, что для доказательства теоремы достаточно показать, что f. М(С-'Ш du (29,3) J 1/2 1|>(ф-г(«)) J 1/2 Tj> (<D—1 (U)) Поскольку 2 j 1/2 fiP-1 (U))du = J*^ р (х)dx*5“ ^ g2 (x)dx = 2\\/2g(G-1 (и))du, мы получаем о = j;/2 g (G-1 (и)) du -j;/2 / (F-1 («)) du = =L^°-H'-T^r}iu (2'914) Так как g (G-1 («)) >0 и из теоремы 2.9.3 f (F*1 (u))lg (G~l (и)) не убывает при и > 1/2, из равенства нулю интеграла следует, что суще¬ ствует точка с + 1/2, с > 0, благодаря чему 1 — / (F~l (u))/g (G 1(и)) изменяется от положительного к отрицательному значению при переходе и через с + 1/2. Ясно, что / (F~l (и)) — g (G-1 (и)) < 0 или > 0 при и < с-\- 1/2 или S* и + 1/2. Напомним, из доказательства 126
теоремы 2.9.4 мы можем судить о том, что 1/ф (Ф 1 (и)) не убывает при и > 1/2. Заметим, интеграл меняет знак, а (2.9.13) приводит к Г ■{nF-1(u))-g(G-1(u))}du> J 1/2 1|)(Ф-Ми)) >[Ч2 + С lttti (/ (р--1 (“)) - g (G"1 («))) + J 1/2 г|> (Ф-1 (с+1/2) + f * , ^ ‘ , ,"/9;\ I f (F-1 («)) -g (G-1 («)) | du = Ji/2 + с 'l5 (Ф—1 (с+ 1/2)) = , 1<и ‘ ,/9и Г (/(F-1(«))-g(G-1(«))M«- Лр (Ф—1 (с+1/2)) J 1/2 Однако интеграл от разности, как отмечено в (2.9.14), равен 0; доказа¬ тельство закончено. Итак, лишь только хвосты становятся «тяжелее», эффективность Т относительно NS возрастает. Для нормального распределения е Ф (Г, NS) = 0,955. Отсюда 0,955 < ер (Т, NS) < 1,91 для любого Этакого, что Ф < - F. В упражнении 2.10.34 дается аналогичный результат для eF (S, Т). Более общий результат для функций меток дан в [58]. Теперь мы представим результат, проанализировав который можно заключить, что желательна винзоризация функции меток. Рассмотрим модель симметричного загрязнения, введенную П. Дж. Хьюбером [89] и в его книге [91, гл. 4]. Пусть G £ Qs есть заданное распределение с сильно одновершинной плотностью из определения 2.9.2. Предположим, зафиксировано 0 < е < 1, тогда мы определим Q (г) = {F = (1 —е) G + гН : Н £ S2s, / (h) < оо ), где / (h) — информация Фишера из определения 2.9.1. Мы будем на¬ зывать G гипотетической моделью (assumed model), a F из Q (е) — истинной моделью. Заметим, что G может быть и истинной моделью, по¬ скольку также принадлежит Q (е). В теореме 2.9.7 мы покажем, что винзоризованный вариант асимп¬ тотически наиболее мощного рангового критерия, соответствующий G, имеет максимальную асимптотическую мощность в Q (е). Таким об¬ разом, этот ранговый критерий максимизирует минимум асимптоти¬ ческой локальной мощности на загрязненных распределениях. Мак- симинный критерий получается из функции, порождающей метки, ф0 (2.9.5), соответствующей наименее благоприятному распределению F0 из Q (е). Пусть 0О — оценка Ходжеса — Лемана, соответствующая ф0 (•); мы покажем, что она имеет минимаксную асимптотическую дисперсию на множестве Q (е). Ясно, что робастные процедуры, базирующиеся на винзоризованной функции, порождающей метки, подобны тем, что 127
дают хьюберовские ф-функции, из которых получаются робастные М-оценки. В общем случае мы положим с (ср, F) — эффективность для рас¬ пределения F и критерия V, порожденного ср(-). Мы ищем функцию, порождающую метку infc((p, F)<infc(9o, F). (2.9.15) й(е) П(е) В этом случае мы говорим, что К0, соответствующий ср0 (•), обладает максимальной эффективностью на множестве Q (е). Итак, если истин¬ ная модель из Q (е), то V0 наименее подвержено неблагоприятному влия¬ нию загрязнения в том смысле, в котором это понимается в (2.9.15). В теореме 2.9.6 будет построено наименее желательное распреде¬ ление F0 в Q (е) в том смысле, что асимптотическая эффективность на¬ илучшего критерия минимальна в «точке» F0. В примере 2.9.4 предпо¬ лагается, что наименее желательное распределение имеет вид g в сред¬ ней * части области изменения и экспоненциальные хвосты. Отсюда получается сильно одновершинное распределение, которое нелегко от¬ личить от G. Теорема 2.9.6. Пусть х0 > О и k> 0 — такие постоянные, что — g' (x0)fg (*о) = k и (1 —е)-1 = 2G (х0) —1 + 2g (x„)/k. Предположим, ( (1—e)g(—*о) exp {£(* + *„)}, если — х0, /о(*) = | (1 — e)g(x), если —л:0^х^д:0, (2.9.16) 1 (1 —е) g (хо) exp {— k(x— х0)}, если х0 х. Тогда а) /о (х) — плотность распределения, причем ее функция распределе¬ ния принадлежит Q (е); б) с (ф0, F) ^ с (ф0, F0), где фд (*) — оптимальная функция, поро^кда- ющая метки, определенная в (2.9.5) с помощью F0. Доказательство, а) Возьмем интеграл от /0 (х): J/о (*) dx = (1 —е) g ( — x0)lk + (1 — е) [G (*„) — G (—х0)] + + 0—*)£(*о)/* = = (1 -е) [2G (jg -1] + (1 -е) 2g (x0)/k = 1. Определим h0 (х) посредством /0 (х) = (1 — г) g (х) + еЛ0 (х) так, что h0 (.х) = [/о (х) — (1 — е) g (х)]/е. Отсюда J h0 (х) dx = 1. Покажем, что Л0 (х) > 0 для всех х. * Т. е. оно сильно одновершинно и симметрично. — Примеч. пер. 128
Заметим, что е/г0 (х) = /о (х) — (1 — е) g (х) = (1 —е) [g(—х0) exp {k (х 4- х0)) — ц (х)], если х ^ — х, еели л ■—aq, если —х0 ^ х ^ х0, О, О—jе)[&(*о)ехр { — k(x—х0)\— g(x)], если *0<л;. Для л: < — х0 мы продемонстрируем, что g (— х0) exp {k (*+*0)}— — ё (х) > 0. Поскольку — log g (х) — выпуклая функция, она лежит ниже своей касательной в — х0у откуда — log g (х) > —log g (—xQ) + + (— g' (— xo)!g (— *o)) (x + xo) при — x0. Далее, согласно свойству симметрии — g' ( — x0)/g (— x0) = — k. Тогда Итак, у нас есть первая строка выражения eh0 (х), вторую можно получить таким же образом. Отсюда h0 (х) > 0 и F0 из Q (е). б) Из (2.9.3) следует, что знаменатель с (ф0, F) не зависит от F. Теперь рассмотрим числитель Воспользовавшись определением ф0 (и) из (2.9.5) и прибегнув к /0 (х) из (2.9.16), мы получаем Покажем, что / (F 1 (и)) ^ /0 (F01 (и)) при 1 /2 и ^ F0 (х0). При 0 ^ х < х0 /о (х) = (1 — е) g (х) < (1 — е) g (х) + еЛ (х) = /(х). (2.9.20) Откуда (х) < Т7 (х) и Fq (Т7"1 (и)) < F (F~l (и)) = и при 1/2 < < и < (х0). Преобразуем с помощью Fо 1 обе части —bg g (х) > — log g (—х0) — ft (х + х0) и gW<?( ~ Х0) exp j ft (х + х0)}. (2.9.17) —g'(x)/g(x), если — х0<х<х0, (2.9.18) k, если х<Сх0. Отсюда ф6(2F(x)—1) —0 при |х|>х0, и потому J(F) = 2 J^° фо (2F (х) — 1) /2 (х) dx = = 2 Фа (2а—1) / (f-1 («)) du. (2.9.19) 1 (и) (2.9.21) ^ Зак. 284 129
при 1/2 < и < Fо (*0)- Поскольку — log g (х) — выпуклая функция, то это относится и к — log /о (х). Далее, из — /о (x)/f0 (х) > 0 мы мо¬ жем заключить, что — log/0 (х) и log/0 (х) не убывает и, наконец, /о (х) — неубывающая функция. Отсюда и из (2.9.20) и (2.9.21) / (.F-1 (и)) > /о (F-1 (и)) > /о (Fo1 (и)): Неравенства f (F~x {и)) > > /о (Fv1 (и)) и Fo (*о) < F (*о). а также (2.9.19) дают J (F) >J (F0). Отсюда вытекает, что с (<p0, F)^c(ф0, /^о), чем и завершается дока¬ зательство. Теперь мы готовы показать, что ср0, построенная по /0 (х) в (2.9.16), порождает максиминный критерий со свойством (2.9.15). Теорема 2.9.7. Пусть G£ Q 8, с сильно одновершинной плотностью и /'g Q (е). Предположим, ф0 — функция меток, построенная по /0 (л:) из (2.9.16), V0 — критерий, порожденный ф0, и с (ф, F) — эффектив¬ ность критерия, порожденного ф. Тогда inf {1 —Ф (Za— 0с (ф0, Т7))} ^ inf {1 —Ф (Za — вс (ф, F))} П(е) Й(е) для любой другой функции ф. Выражение 1 — Ф (Za—0с (ф, F)) — асимптотическая локальная мощность на последовательности аль¬ тернатив 0д = 0/п1/2 для критерия с асимптотическим размером а (см. также теорему 2.6.1). Доказательство. Из последней теоремы мы знаем, что с (ф0, F) > >с(Фо. Fo)> откуда inf с (ф0, F)^c(фо, F). Ще) Из теоремы 2.9.1 следует, что с (фу, F) > с (ф, F). Это неравенство вер¬ но и в том случае, когда фу не есть функция, порождающая метки, по¬ скольку с2 (фу, F) = I (/). Отсюда с (фо, Fo) > inf с (ф/, F) ^ inf с (ф, F). ft(e) Q(e) Комбинируя эти неравенства, получаем inf с (ф0, F) > inf с (ф, F). (2.9.22) Q(e) Й(е) Откуда 1 —Ф (Za—0 inf с (ф, F)< 1 —Ф (Za—0 inf с (фо, F)). Q(e) Q(e) Теперь нужный результат прямо вытекает из того, что Ф (•) — воз¬ растающая функция. Пусть 0Ф — оценка Ходжеса — Лемана 0, основанная на V, ко¬ торая порождена <р. Предположим, а2 (ф, F) — асимптотическая дис¬ персия, где п1/2 (0Ф — 0) асимптотически имеет распределение п (0, а2 (ф, F)). Напомним, что о2 (ф, F) = 1/с2 (ф, F). Будем исходить из 130
того, что 0О соответствует ср0, описанной в теореме 2.9.6. Тогда (2.9.22) влечет за собой Таким образом, асимптотическая дисперсия 0О минимизирует мак¬ симум асимптотической дисперсии на множестве Q (е). Л. А. Джекл [93] развивал теорию, связанную с (2.9.23); он показал, что существуют R и L — оценки, с помощью которых можно решить минимаксную за¬ дачу Хьюбера для £2 (е). Хьюбер [91] указал, что минимаксный резуль¬ тат (2.9.23) не может быть обобщен для случая ранговых оценок на более общий тип окрестностей, чем £2 (е). Дж. Сакс и Д. Илвисейкер [161] дают подобный пример (см. [35]). Теперь мы обсудим формулу функции, порождающей метки ф0 (и)г которая соответствует предположительно сильно одновершинной функ¬ ции G. Пусть <pg (и) — порождающая функция, построенная по плот¬ ности g, из (2.9.5). Из теоремы 2.9.6 следует, что —g' (x0)/g (х0) = k. Определим и0 так, что срg (и0) = —g' (G-1 [(и0 + l)/2])/g (G_1X х[(ц0+ 1)/2]) = k. Тогда согласно (2.9.18) мы имеем для 0< и < 1 Ясно, что оптимальная функция, порождающая метки, ф0 — винзо- ризованная версия ф^ (и). Доля винзоризации зависит от доли загряз¬ нения. Если предполагаемая модель — нормальная, то винзоризованные нормальные метки — наилучшие. Винзоризация приводит к тому, что функция влияния становится ограниченной и мы можем «обойти» особую ситуацию из примера 2.8.6, где оценки нормальных меток име¬ ют неограниченную функцию влияния (об этом см. [91]). Пример 2.9.5. Приведем вычисления, относящиеся к минимаксной асимптотической дисперсии, для модели логистически загрязненного распределения. В этом случае наилучшей будет винзоризованная ста¬ тистика Уилкоксона. Мы имели дело с различными аспектами вычисле¬ ния винзоризованных процедур Уилкоксона в примерах 2.8.2, 2.8.4, 2.8.5, 2.9.1. Пусть g (*)— логистическая плотность распределе¬ ния, g (х) = е~х/(1 + е“*)2, — оо <х < оо. Функция распреде¬ ления G (х) = 1/(1 -р е~~х), — оо < х < оо, а соотношение g (х) = G (х) (1 — G (;с)) упрощает многие вычисления. Заметим, что — ё' (х) / g (х) = 2G (х)—1, поэтому условие из теоремы 2.9.6 бу¬ дет выглядеть так: sup а2 (ф0, F) < sup а2 (ф, F). (2.9.23) ф0 (и) = min (ф^ (и), k). (2.9.24) и g(Xo) £-&L = 2G(Xo) — \=k (1 — g)-1 = 2G (х0) — 1 + (2.9.25) 131
Из (2.9.24) ф0 (и) = min {иу k) и k = 1 — у из примера 2.8.2*. Поскольку 0< у< 1, 1, решая (2.9.25) относительно ky мы нахо¬ дим корень k = (l — г)-1 (1 — У е (2—е) ) - 1 —у. (2.9.26) Так как эффективность дана в примере 2.9.1, мы можем вычислить а2 (ф0, Fо) из l/с2. Заметим, что р1 -V/2> g2 {х) dx = p<-V/2) G{x)(l_G {х)) dQ {х) = с' о Jo (2—3y2-f-y3) 24 где х (1 —у/2) = G_1(l—у/2). Теперь, используя формулу для эф¬ фективности из примера 2.9.1 и делая некоторые преобразования, получим °2 (Фо, F0) = sup а2 (ф0, F) = 12 (1 + 2у)/[3 —(1 —у)2]2. й(е) В табл. 2.6 приведены 1 — у и а2 (ф0, F0) как функции е. Из нее видно, что смесь примерно 2/3 уилкоксоновских меток и 1/3 знаковых меток обеспечивает достаточную защиту процедур от небольшого или среднего загрязнения. В табл. 2.5 сравниваются процедуры Уилкок¬ сона (лучшие для предлагаемой здесь модели) с винзоризованной про¬ цедурой Уилкоксона [минимаксной на Q (e)j. Таблица 2.6 1—у и а2 (<ро> F0) как функции е 8 Функции 0,05 0,07 0, 10 0, 12 0,15 0,20 1—Y ог(Фо- F0) 0,72 3,00 0,69 3,00 0,63 3,00 0,60 3,00 0,56 3,01 0,50 3,02 2.10. УПРАЖНЕНИЯ 2.10.1. Покажите, что при нулевой гипотезе Яо:0 = 0, F £ Qs, математиче¬ ское ожидание и дисперсия знаковой статистики Уилкоксона равны ЕТ — = п (п + 1)/4 и var Т = п (п + 1) (2п + 1)/24, где п — размер выборки. 2.10.2. Пусть Хъ Хп — независимые, одинаково распределенные слу¬ чайные величины с функцией распределения F из Qs. * Это пример, где появляется винзоризованная ранговая статистика V = = 2 ф (Ri/(ti + 1)*5 (Xj), ф (и) = min (и, 1 — у), 0 < и < 1, в которой учи¬ тывается (1 —у) 100% наименьших по абсолютным значениям рангов. — Примеч. пер. 132
А. Покажите, что g (Л+..., Хп) и g (— Хг, ...,— Хп) имеют одинаковые рас¬ пределения. Указание. Покажите, что P(g(X1,...i Xn)^t)=P(g( — Xlt...t-Хп) < t). Б. Докажите, что если g (Хъ ..., Xn)-\-g (—Xlf ..., — Хп) = |Л0, то g (Л+..., Хп) симметрично распределена относительно pj2. Указание. Покажите, что Р (g(X 1, Хп) < [i0/2 - t) = Р (g(Xl9 ..., Хп) > ii0/2 + t). В. Примените п. Б к знаковой ранговой статистике Уилкоксона и покажите, что распределение Г симметрично при нулевой гипотезе. Где находится точка симметрии? 2.10.3. В этом упражнении мы рассмотрим условия, накладываемые на мар¬ гинальные (частные) распределения пары случайных величин (Г, С), возможно зависимых, таких, что случайная величина Т — С распределена симметрично. Докажите, что А. Если маргинальные распределения одинаковы (но не обязательно симмет¬ ричны), то Г — С распределена симметрично. Б. Если маргинальные распределения симметричны (но возможно с различ¬ ными параметрами масштаба), то распределение Г — С симметрично. 2.10.4. Пусть Vx = 'LaiWi и У2 — 26*1^, где Wlt ..., Wn — независимые, одинаково распределенные случайные величины В (1, 1/2). Покажите, что 1 var ^х = — cov (К,, К2)=+2«г6<- 4 Используя теорему А9 приложения, докажите, что статистика знаковых рангов Уилкоксона Г (2.7.2) при Н0 такова: Т~п(п+1)/4 D ^ , - п(0,1). Уп(п + 1) (2/г+ 1)/24 Найдите lim pn (S, Г), где рп (S, Г)—коэффициент корреляции между статисти¬ ками знаков и Г-критерия. Наконец, используя теорему А13, покажите, что 5 и Г, должным образом стандартизованные, имеют асимптотическое двумерное нормальное распределение. Указание. Запишите Г* = 0/(я+1)я1/2)2/(Г;— 1/2) и S*=(1/«1/2)S(^-1/2). 2.10.5. Покажите, что толерантность знаковой ранговой статистики Уилкок¬ сона задается формулами 2п— 1 — J/T +8Са тп (принятия)= тп (отклонения) =' 2 п 2гг— 1 — У (2п+1)2—8Са 2 п Используя приближение для критического значения критерия Са, покажите, что обе толерантности сходятся к т= 1 — 1/21 , т. е. к толерантности оценива¬ ния для медианы средних Уолша в примере 2.4.1. 2.10.6. Докажите теорему 2.4.2 для фВ = 2^+1, четного. 133
2.10.7. Определите В = {(t\ j):i ^ /, i + j = n + 1}. При этом 0 = = med (Xt + Xj)/2, где (/, j) из В, названа Дж. Л. Ходжесом [78] оценкой Галь- тона. Найдите толерантность 0. 2.10.8. Покажите, что р3 = (р\ + р2)/2; обозначения приведены в (2.5.1). 2.10.9. Вычислите plt р2 и р4 из (2.5.1) для равномерного распределения на интервале (—1, 2). Аппроксимируйте мощность критерия знаков и знакового ран¬ гового критерия Уилкоксона из примера 2.5.5 при п = 40 и ос = 0,05. С по¬ мощью центральной предельной теоремы постройте соответствующую аппрокси¬ мацию для /-критерия. 2.10.10. Покажите, что асимптотическая мощность критерия знаков при по¬ следовательности альтернатив вп = а/п1/2 равна 1 —Ф (Za — 2/(0)a). Сравните это выражение с (2.5.27), где дана асимптотическая мощность критерия зна¬ ковых рангов Уилкоксона при f (х) — плотности распределения п (0,1). 2.10.11. Докажите, что для критерия знаков верно выражение (2.6.3) при объеме выборки из примера 2.6.1. 2.10.12. Здесь мы изложим доказательство того, что статистика знаковых рангов Уилкоксона, должным образом стандартизованная асимптотически нор¬ мальна, причем равномерно около 0= 0, при условии отграниченности дисперсии от нуля. Пусть Х1у ..., Хп — выборка из F (х — 0), F £ Qs, и предположим, о2 (0) = р4 (0) — р\ (0), где р4 (0) и р2 (0) определены в (2.5.1). Предположим также, что есть постоянная /С, 0 < К ^ (J2 (0) для всех 0 в окрестности 0. Это верно при а2 (0) > 0 и а2 (0) — непрерывной функции. Определим Понятно, что асимптотическое распределение Т и Т* одинаково, однако Т* лег¬ че вычислять. Б. Определите В. Пусть теперь Yt = 1 — Н (—Х{)у Н (х) = F (х — 0), покажите, что проекция V* равна где Ти из (2.5.3). А. Покажите, что в окрестности 0=0 Уп(т-р2( 9)) уп(Т*-рг( 9)) 2Уп а (0) a (0) ^ К(п+1) G (0) П (П— 1) (0» /</ и покажите, что EV* = 0 и var V* -- р2 (0) (1 — р2 (Q)) п — 2 2а2 (0) (п— 1) + п— 1 Далее покажите, что EVp = 0 и var Vp = 1. 134
Г. Пусть R = V* — Vp. Покажите, что при е > О P(y;^t-z)-p(\R\> в)< < Р (V* < t) < Р (V; < t + s) + Р (I RI >е). Д. Покажите, что для некоторой постоянной С и заданного 6 > О, p(i«i>e)< 2(ДТ <6. IP(VP<t±e)-0(t±e)l< К3 У и для достаточно большого п. Е. Следовательно, мы заключаем, что для любого е > О, Ф (/—е) — 26 — Ф (t) < Р (V* < 0 — Ф (t) < ■<Ф(/ + 8)+2б —Ф(0. Теперь, поскольку Ф ( • ) — непрерывная функция, при е -► 0 мы имеем |P(V*<0 — Ф (0 / < 26 для достаточно больших п, равномерно по 0 в окрестности 0. 2.10.13. Покажите, что выражения (2.6.16)—(2.6.18) инвариантны относи¬ тельно изменения масштаба. Указание. Положите g {х) = т-1 f (т_1х) и докажи¬ те, что формулы не зависят от т. 2.10.14. А. Вычислите е (Г, /) по (2.6.18) для логистического распределения, / (*)= = е~~х/(1 + е~х)2, — оо < х < оо, распределения Лапласа, т. е. двустороннего экспоненциального, / (х) = е~~ * х ' /2,—оо< х < °°, равномерного распределе¬ ния f (х) = 2-1, —1 < х < 1. Б. Как будет выглядеть е (Г, t) при / (х) = 1/я (1 + х2), — оо < х < оо, т. е. при распределении Коши? 2.10.15. Пусть / (х\ %) = хе~ I * I т/2Г (т-1), —оос х <оо. Параметр т опреде¬ ляет семейство распределений. Например, при т = 2 получается нормальное, а при т = 1 — двустороннее экспоненциальное распределение. А. Найдите ех (S, Т) по (2.6.16) как функцию от т. Б. Постройте график е% (5, Т) как функции от т, и найдите точку, где ех (S, Т) — 1. Она покажет, как «далеко» мы должны «отойти от нормальности», чтобы критерий S стал эффективнее, чем Т. 2.10.16. Найдите е (S, t) по (2.6.17) для нормального и двустороннего экспо¬ ненциального распределения. 2.10.17. Пусть [0L, 0^] — (1 — а) 100-процентный доверительный интервал, построенный на основе статистики знаковых рангов Уилкоксона Т. Предполо¬ жим, 0О — истинное значение параметра; покажите, что л1/2 (0^ — 0О) асимпто¬ тически распределено, как п (— ^af2^cT9 1/сг)» где Za/2 — верхняя а/2-процент- ная точка стандартного нормального распределения, и ст = 12 ( J /2 (х) dx) 2. Указание. Используйте доводы теоремы 2.6.5. 2.10.18. Приведите доводы в пользу того, что для S и / можно получить ре¬ зультат вроде (2.7.8). Другими словами, /г1/2 (0^ — 0L) 2Za^3 приближенно (по 135
вероятности) равно 1/2 / (0) и а/ для 5 и / соответственно. В частности, докажите, что если F £ Q0> / (0) С оо, то где 5 = п~г 2 s (Хг-). 2.10.19. С помощью результата из упражнения 2.10.2 покажите, что V из (2.8.1) имеет симметричное распределение при нулевой гипотезе, если выборка произведена из симметричной относительно 0 совокупности. Какова точка сим¬ метрии для распределения V? 2.10.20. Покажите, что Уг и V2 из (2.8.1) при нулевой гипотезе имеют асим¬ птотическое двумерное нормальное распределение, стандартизованное должным образом. Какова асимптотическая матрица ковариаций? Указание. Используйте теорему А13 приложения. 2.10.21. Покажите, что нормальная функция, порождающая метки из приме¬ ра 2.8.1, удовлетворяет условиям, налагаемым на <р (и) из определения 2.8.2, вы¬ яснив, что JoO^T1 (и) du = (2/я)1/2 и jo [Ф+1 (и)]2 du = 1. 2.10.22. Покажите, что для винзоризованной статистики знаковых рангов Уилкоксона из примера 2.8.2 2.10.23. Составьте таблицу EV и nvar V для различных значений п, кото¬ рая будет иллюстрировать скорость сходимости к асимптотическим значениям параметров. 2.10.24. Вычислите точные и асимптотические математическое ожидание и дисперсию при нулевой гипотезе для статистики знаков из примера 2.8.3 и об¬ судите вопрос об асимптотическом распределении. Найдите асимптотические то¬ лерантности проверки гипотез. A. Постройте оценку Ходжеса — Лемана по модифицированной статистике знаков из примера 2.8.3. Покажите, что можно вычислить оценку без построения средних Уолша. Б. Запишите формулы для концевых точек доверительного интервала, полу¬ ченного по модифицированной знаковой статистике. B. Найдите асимптотическую толерантность оценивания как функцию у. 2.10.26. Пусть функция меток ф (•) ограничена и ф (0) = 0. Предположим также существование /' (х). Покажите, что с из (2.9.3) можно записать в виде А. Найдите эффективность модифицированного критерия знаков, используя упражнение 2.10.26. Б. Для плотности распределения п (0, 1) найдите величину у, которая мак¬ симизирует эффективность. Сравните относительную эффективность по отноше¬ нию к / этого критерия с относительной эффективностью обычного критерия зна¬ ков по отношению к /-критерию. EV-> (I —у2)/4, п var К —> (1 — у)2 (1+2у)/12. 2.10.25. 2.10.27. 136
2.10.28. Недавние исследования показали, что лекарства от гипертонии, та¬ кие, как пропранолол (propranolol), могут помочь справиться с волнением перед выходом на сцену [Time Magazine от 5 июля 1982, с. 58]. Проверьте эту гипотезу на данных о 29 профессионалах и учащихся, которые давали сольные концерты с последующим их обсуждением критиками и преподавателями. Им давали про¬ пранолол или плацебо за девять минут до выступления. В течение всего выступ¬ ления велся электрокардиографический мониторинг сердечных сокращений. / частота сердечных сокращений — 70 ударов в минуту. Искусственные (artificial) данные для 8 исполнителей таковы: Исполнения Обработки 1 2 3 4 5 6 7 8 Лекарство 85 107 69 122 106 121 137 87 Плацебо 126 140 95 148 142 172 133 143 Пусть 0 — медиана распределения разностей «лекарство» — «плацебо». Используйте процедуру уилкоксоновских знаковых рангов для проверки гипо¬ тезы #о:0 = 0 против НА : 0 > 0 на уровне а = 0,05; постройте точечную оцен¬ ку 0 и приближенный 95-процентный доверительный интервал для 0. 2.10.29. Пусть Qs из (2.1.1) и из — подкласс одновершинных симмет¬ ричных распределений. Найдите следующие инфимумы (нижние грани) inf e(S, Т) и inf е (S, Т). 2.10.30. Покажите, что асимптотическая толерантность проверки для Vf, порожденной фу (и) в (2.9.5),. равна такой е, что f (F~x (1 — е/2)) = f (0)/2. 2.10.31. Покажите, что кривая влияния для 0/, т. е. оценки соответствующей Vf, которая порождена фу (и) (см. 2.9.5), есть о/* Г{у) й (у)-. / (f) f (у) где / (/) — информация Фишера из определения 2.9.1. 2.10.32. Найдите фу (х) по формуле (2.9.5) для логистического и двусторон¬ него экспоненциального распределений. 2.10.33. Пусть Fa' е (х) = Ф (х), если |х| ^ е, и Ф (е + а (х — е)), если |х| > е. Используйте это распределение для демонстрации точности верхней гра¬ ницы из теоремы 2.9.4. 2.10.34. Пусть F, G £ Qs и F <• G. Докажите, что eF (S, Т) eQ (S, Т). 2.10.35. Пусть Хг, Хп — независимые случайные величины X* ~ ~ F (х — 0г-), F £ Qs. Для проверки Н0 : 0Х = ... = 0Д против Нл : 02 ^ ... ^ 0^, где хотя бы одно неравенство строгое, есть критерий Манна [118] для трен¬ да со статистикой S* = 2 s (Xj — Xt). Посредством статистики S* Xf срав¬ нивается со всеми наблюдениями с большими номерами, и поэтому можно сделать больше сравнений, чем с помощью критерия Кокса — Стьюарта из примера 1.8.13. А. Ясно, что ES* = п (п—1)/4 при Я0. При некотором усложнении доводов, касающихся перечислений, подобных тем, что приведены в теореме 2.5.1 для по¬ строения дисперсии знаковой ранговой статистики Уилкоксона, можно показать, 137
что при Н0 var S* = п (п — 1)(2п + 5)/72. Используйте теорему 2.5.2 и по¬ кажите, что стандартизованная должным образом S* асимптотически нормальна при Я0; постройте приближенное критическое значение критерия размера а. Б. Пусть (Хх, КД, ..., (Xn, Yn) — двумерная случайная выборка из F (х,у) абсолютно непрерывного распределения. Два наблюдения (Xj, Y t) и (Xj, Y /) согласованы, если оба элемента одной пары превышают по величине соответст¬ вующие члены другой пары. Свойство согласованности можно записать в виде (Xj — Xj) (Yi — Yj) > 0. Если (Xj — Xj) (Yt — Yj) < 0, то наблюдения на¬ зываются несогласованными*. Пусть Р и Q — число согласованных и несогласо¬ ванных пар,определим 2 (Р —(?) п (п— 1) ’ называемый т Кендэла. Покажите, что — 1 1. Для проверки И о : (X, Y) независимы, отклоняем Я0, если |т| ^ к. Найдите среднее и-дисперсию т при Я0. Докажите, что (т — £T)/(var т)1/2 асимптотически распределено, как л (0,1) при Я0 и вычислите приближенное критическое значение уровня а. (См. теорему 4.4.2 об альтернативном подходе.) 2.10.36. Пусть Xlf ..., Хп — независимые, одинаково распределенные слу¬ чайные величины с функцией распределения F (х — 0), F£Q0, f (0) < оо и а2 = J х2/ (х) dx < оо. Для проверки Н0 : F £ Qs против ЯА : F £ й0 — в [60] предложен знаковый критерий симметрии: отклонить Я0, если \S (X) — — /г/21 > к, где £(Х) = 2s (Xj — X). А. Пусть 5 (X) = п'1 S (X). Докажите, что в случае Я0 W (S (Х) — 1/2)-^Z ~ ~ п (о, 1/4 +сг2 Р (0) —f (0) j” \х | / (х) dx) Набросок доказательства. 1) Положим 0 = 0, общность при этом не теряется, и используем результат из упражнения 2.10.18, записав „1/2 (S-l/2)=rt1/2(S (0)—1/2)—nl/2f (0) Х+Ор (1); 2) Возьмем результат теоремы АП приложения и покажем, что 1 /2 Is (Xt)-l/2]\D^ у—\ f (0) 2 (°U °“У • ДО/ \огха <W_ где сгц = 1 /4, a12 = f (0) xf (х) dx, а22 =/2 (0) а2; 3) Примените теорему А2 (Б) для вектора. Б. Из пункта А этой задачи мы видим, что S (X) не свободен от распределе¬ ния при Я0. Предположим, что неискушенный пользователь стр_оит критерий 5-процентного номинального уровня для отклонения Я0 при |5 (^0_— п/ 2| > > 1,96 п1'2/2. Критическая область строится так, как если бы 5 (X) было рас¬ * В оригинале используются термины «concordant, discordant» для пар, а согласованность — «concordance». — Примеч. пер. 138
пределено приблизительно, как В (я, 1/2). Используйте сведения из пункта А для приближения истинного уровня критерия, если исходное распределение — нор¬ мальное, двустороннее экспоненциальное и симметричное распределение, Паре¬ то с плотностью распределения / (х) = 3/2 (1 + |*|)4, — оо < х < оо. 2.10.37. Пусть Xlt ..., Хп — независимые, одинаково распределенные слу¬ чайные величины с функцией распределения F (х — 0), F £ Qs. Разобьем выбор- р ку из я наблюдений на р групп размера а : а — фиксировано. Пусть Т = 2 ^i 1 и будем отклонять #о:0 == 0 в пользу НА : 0 > 0 при Та ^ k. В [49] Га называ¬ ется. смешанным критерием Уилкоксона. A. Докажите, что (Та — £Га)/(уагГа)1/2 асимптотически распределена, как я (0,1) т. е. k можно приближать по таблице нормального распределения. Б. Для вычисления Т требуется я2 операций, в то время как для вычисле¬ ния Т необходимы ра2 операций. При больших я экономия на числе операций мо¬ жет быть значительной. Для выяснения величины потери в эффективности вследствие группирования найдите эффективность еа критерия Та по отношению кТи изобразите еа как график функции от а. B. Найдите й интерпретируйте lim е оь-» 1
Глава 3 # МОДЕЛЬ С ПАРАМЕТРОМ ПОЛОЖЕНИЯ ДЛЯ ДВУХ ВЫБОРОК 3.1. ВВЕДЕНИЕ В этой главе мы рассмотрим задачу сравнения двух совокупностей. Будут описаны ранговые методы проверки гипотез и оценивания для проверки различия параметров положения при одинаковом, но произ¬ вольном распределении. Основное внимание при этом уделяется ре¬ зультатам для конечных выборок, а не асимптотическим результатам. Мы обсудим асимптотические распределения и проанализируем, как распространяются результаты, касающиеся эффективности, в случае одной выборки, на случай двух выборок, результаты, связанные с ро¬ бастностью мы не обсуждаем, поскольку они аналогичны результатам для одной выборки. Обсуждения см. [154], где есть ссылки, и работу [111] и ссылки, которые в ней даются. Модель выбора такова: Х1у ..., Хт —случайная выборка из F (х — 0*) и Уг, ..., Yn — из F (х — 0^), F £ Q0- Следовательно, F не предполагается симметричной, однако форма распределения долж¬ на быть одинаковой для двух совокупностей. Пусть А = 0*, — 0* — разность между медианами совокупности. Мы хотим проверить Н0: А = 0 против На'Л> 0 и построить точечные и интервальные оцен¬ ки Д. Мы можем положить 0Х = 0 (общность при этом не теряется), т. е. совокупности, из которой выбираются наблюдения, описываются функциями распределения F (х) и F (у — А) соответственно. Будем рассматривать не сами параметры, положения, а лишь раз¬ личия между ними. Пример 3.1.1. Модель рандомизации. Начнем с N предметов (об¬ разцов), случайным образом разбитых на группы обрабатываемых и контрольных*. Пусть X — контрольное измерение, Y — измерение по обрабатываемому объекту. Если действие обработки состоит в при¬ бавлении положительной постоянной А к величине, измеряемой по конт- * Обычно употребляются термины «treatment group», «control group» соот¬ ветственно. Проблема рандомизации весьма важна. Что касается терминов: «обработка, обрабатываемая совокупность», то они означают любой вид воздей¬ ствия на обрабатываемые образцы, на контрольные образцы такого воздействия нет. — Примеч. пер. 140
рольному образцу, то мы должны проверять Я0:А = 0 против На'- А > 0. Поскольку N предметов первоначально извлекаются из одной совокупности, то\предшествующая модель требует единой формы рас¬ пределения при соответствующей Я0. Обработка может действовать на распределение не тйк, как сдвиг параметра положения. Будет ли кри¬ терий сдвига чувствителен к другим изменениям, мы решим при обсуж¬ дении вопроса о состоятельности. (См. пример 3.5.1, где есть описание критерия Манна — УиЦш — Уилкоксона, который вводится в следую¬ щем разделе.) \ Заметим, что при сравнении каких-либо свойств, когда рандомизация объектов невозможна, до%щение об общей форме распределения не сле¬ дует автоматически из Я0,\например, сравнение среднего балла успе¬ ваемости в двух учебных заведениях, когда мы не можем случайно вы¬ бирать субъектов из школы. Пример 3.1.2 иллюстрирует это положе¬ ние *. Ранговый критерий Беренса — Фишера вводится в разделе 3.5. Пример 3.1.2. В [162] описано исследование успокаивающего воз¬ действия ритмичной работы сердца матери на функционирование орга¬ низма новорожденного сразу после рождения. Дети находились в спе¬ циальном помещении в течение четырех дней, за исключением времени кормления. На обрабатываемую группу (п = 102) непрерывно воз¬ действовал звук сердцебиения взрослого человека (72 удара в минуту, 85 децибел). Контрольная группа (т =112) состояла из всех осталь¬ ных детей, помещенных в той же комнате. Нам кажется, что новорож¬ денные попадали в обрабатываемую и контрольную группы не случай¬ ным образом. Измерялось изменение веса в граммах со дня, следующего за днем рождения, по четвертый день. Предполагалось, что дети из группы, слу¬ шавшей удары сердца, будут набирать больший вес, чем новорожден¬ ные из контрольной группы, поскольку ожидается, что первые должны плакать меньше. Пусть X (К) означает измерение при обработке (контроле). Предположим, что Х1у ..., Хт и Ylt ..., Yn извлекались из F (х) и F (х — A), F £ Q 0. Мы хотим проверить Я0:А = 0 против Нл : А > 0. Заметим, что подобное этому допущение о форме есть само¬ стоятельная часть модели и не следует автоматически из Я0, как это было в случае рандомизированного эксперимента. Наблюдая за ходом эксперимента с детьми, описанного выше, Л. Салк заметил, что дети первой группы (прослушавшие сердцебиение) плакали 38 % времени, а дети из контрольной группы — 60 % . Более того, 70 % детей, под¬ вергнутых воздействию, прибавили в весе, против 33 % детей контроль¬ ной группы. Медиана изменения веса 1-й группы +40 грамм (прибав¬ ление в весе), а медиана изменения в весе 2-й группы 20 грамм (потеря веса). В примере 3.2.2 мы приводим соответствующие данные и применяем критерий Н0: А = 0 против.Ял : А > 0. * Вопрос о рандомизации и связанной с этим возможности допустить, что форма распределения одинакова, весьма важен, но часто игнорируется.— Примеч. пер. 141
3.2. РАНГОВАЯ СТАТИСТИКА / МАННА—УИТНИ—УИЛКОКСОНА Для проверки Н0:А = 0 против НА\Д > О Ф./Уилкоксон [193]* предложил следующую простую процедуру: сначала ранжировать объединенные данные обеих выборок от наибольшего к наименьшему значению, а затем вычислить U, сумму раЩюв наблюдений Yy а затем отклонить #0, если U «достаточно велцко». Большие значения U указывают на сдвиг выборки Y-ов относительно выборки Х-ов. Для определения критической величины критерия со статистикой U остается лишь найти ее (точное или приближенное) распределение при Н0:А = 0. В разделе 6.3 этот критерий обобщается на случай сдвига в двухвыборочной многомерной модели. Рассмотрим совместное распределение рангов наблюдений Y в сов¬ местной выборке и применим результаты к U. Пусть N = т-\-пу Ri — ранг Yt в объединенной выборке, таким образом, Rt наблюдений меньше или равны Yt, а N — Rt — больше Y t. Теорема 3.2.1. Пусть Rly..., Rn — ранги Yly...y Yn в объединенной выборке и верна Н0: Д 0; тогда где N = т-\- п и i Ф j. Доказательство. При Н0:Д = 0 объединенные данные представля¬ ют собой случайную выборку размера N = т+п из F (х), F Отсюда ясно, что каждая перестановка в объединенной выборке одина¬ ково вероятна. Событие Rt = s описывается (N — 1)! последователь¬ ностями из т Х-ов и п Y-ов, где Yt всегда находится на s-й позиции. Отсюда Вероятность Р (Rt = s, Rj = t) определяются тем же путем. По¬ скольку F £ Й0, то вероятность связи ** Р (Rt = s, Rj = s) равна нулю. * Со времени публикации этой работы прошло более 40 лет и теперь ясно, что она стимулировала бурное развитие теории и приложений ранговых методов. Автор далее приводит теоретические сведения о критериях и некоторые ссылки. См. также [326], [116]. — Примеч. пер. ** Одинаковых или связанных рангов. — Примеч. пер. P(Rt=s) = -±-, N, N 142
В упражнении 3.7.1 предлагается показать, что при Н0:А = О, ERi = (N—\)/\ var Ri = (N2—1) /12 и cov (Ru Rj) = — (N + 1)/12 при i ф j. Таким образом для U = 2?/?г \ EU = n(N+1)/2, \ var U — mn [N + 1)/12. (3.2.1) Можно привести считающую форму статистики. Напомним, что число объектов в объединенной выборке, меньших или равных У\, откуда Я, = #(Х,-<У;)\#(УА<Гг), /= 1,..., т, k — 1,..., п И 2Я*=#(Х,<У,)+л(л+1)/^ /=1 /п, f = l,...,n. I Здесь гг (п + 1)/2 — число случаев, когда наблюдение Y меньше или равняется другим наблюдениям Y и может быть легко получено упоря¬ дочением У-ов. Так, U = V R. = # (Yi -X] > 0) + п (п + 1)/2, 1 г = 1,...,я, т, и пусть W = 4^(yi—Х^>0) так, что U=W + n(n +1)/2. (3.2.2) У этих двух статистик, U и W, одинаковые статистические свойства: U — так называемая ранговая форма, предложенная Уилкоксоном, a W — считающая форма, предложенная Манном и Уитни [1191. Эту форму Крускал [1081 нашел в работе Густава Дехлера (Gustav Deuch- 1ег)я опубликованной в Германии в 1914 г. Заметим также, что EW = тп/2, var W==mn(N+ 1)/12. (3.2.3) ‘ Мы получили среднее и дисперсию для U и W, и теперь нам нуж¬ но знать распределение при Н0 : А = 0 для построения критериев и доверительных интервалов. Обратимся сначала к точному распре¬ делению, а затем применим теорему 2.5.2 о проекции для построе¬ ния асимптотического распределения. В примере 3.2.1, так же как и в примере 2.2.1, рассматривается одновыборочный случай. Пример 3.2.1. Положим т = п = 2 и допустим, что верна ну¬ левая гипотеза, так что есть выборка из четырех наблюдений: из двух 143
Х-ов и двух Y-ов. Существует ^2j = 6 равновероятных упорядоче¬ ний, которые могут быть записаны следующим образом: Ранги: 1 2 3 4 W U / Упорядочения: у у х х 0 3 у х у х 14/ У х х у 2 0 х у у х 2 /5 * */ л: у 3/6 х х у у f 7 Распределение U? (или U) при Н0: А = 0 можно записать так: w 0 12 3 4 P(W=w) 1/6 1/6 2/6 1/6 1/6 Заметим, что W по существу свободно от распределения, поскольку не вводится никаких допущений о F, необходимых для получения ве¬ роятностей W. Так же, как и в случае одной выборки при альтернати¬ вах, статистика перестает быть независимой от распределения. Этот пример показывает, что задача построения распределения сводится к перечислению последовательностей, у которых W = w. Видна и сим¬ метрия нулевого распределения W. Определим Рт,п (к) как число таких последовательностей из т х-ов и п у-ов, что W = к. В предыдущем примере Р2,2 (2) = 2. Можно построить рекурсивные уравнения. Теорема 3.2.2. При заданных т х-ах и п у-ах Рт ,п <*) = Рт ,71—1 (Л — /Я) + ~Рщ—1,п (k), гдеР^- (6) = 0, если k < 0, Р*,0 (/г) равно 1 или 0 при k = 0 или к =^= 0. Доказательство. Разделим последовательность при W = k на две группы: последовательности, кончающиеся на х, и последователь¬ ности, кончающиеся на у. В первом случае W вычисляется по всем наб¬ людениям, но последнее х должно равняться k, так как достижение значения л: не изменяет W = # (Кг >Х7«). Таким образом, для этих по¬ следовательностей /7г — 1 х -ов и п у-ов W = к. В последнем случае W вычисляется по всем наблюдениям, но последнее у должно равнять¬ ся k — m, поскольку при достижении последнего у оно превышает т х-ов. Ясно, что для этих последовательностей т х-ов и п — 1 у-ов статистика W равна k — т. Рассматривая оба случая вместе, мы полу¬ чаем выражение для Ртт. Теорема 3.2.3. Обозначим вероятности при Я0: А = 0 через Рт п (k)= = Рно (W = к). Тогда Рт,п = —(Л ■-т) + ~ ” Р7П'— 1,п (к) m + /i т-\~п с граничными значениями из предыдущей теоремы. 144-
Доказательство. Поскольку каждая из последовательно¬ стей из т х-оъ и п у-ов равновероятны при Н0 : А = 0, согласно теоре¬ ме 3.2.3 Pm,n(k) Рт.п (k) т-\-п п т\ п\ г 77 (т + п) I п Р* [Лп,п-3 (Л — т) + Рт-1,п (*)] = -1 (k—m) 1 ,п (k) т-\-п /т~\~п—1\ /m + n—1\ [ т ) [ п ) Рт.п-1 (k — m) + т • Р т—1,п {Щ. т-\-п ' т + п Можно использовать это выражение, чтобы вычислить на ЭВМ таб¬ лицы вероятностей для W (или £/)*. Аналогичные выражения для ста¬ тистики знаковых рангов Уилкоксона могут быть получены из упраж¬ нения 3.7.3. В теореме 3.2.4 мы прибегнем к теореме о проекциях 2.5.2 для построения предельного распределения W при #0, из которой можно получить приближенные критические значения. Теорема 3.2.4. Пусть /п, п-^оо так, что тШ-^Х, 0<Х< 1, причем N = т + п. Тогда (W — EW)!{var W)1/2 и (U — EU) / /(Var f/)1/2 имеют предельное распределение n (0,1), если верна Н0: А = 0. Доказательство. Пусть Тц = 1, если Yj >Xt, и 0 — в противном случае, тогда W = 227\7-. В случае выполнения H0ETtj = 1/2, по¬ этому мы положим W* = 22 (Тц — 1/2) и заметим, что EW* = 0. Теперь отметим, что E[(Tij~l/2)\Xk = x] = P(Yj>Xi\Xk==x)~l/2 — х 0, если кф1, Р (У > х) если k — iy Ьг~ у. = в 0, если k Ф j, Р (у >Х) —если k * Таблицы точного распределения см., например, в [221], [249а]. — Примеч. пер. 145
Поскольку у X и Y одно и то же распределение F при #0, то мы имеем 1 Xh=x = п [1— F (х)] — Yh = y Проекция W* есть i=i — F(Xt)} + m V [f(y.)_J_ Теперь рассмотрим (N1i2lmti) Vр /= 1 (WWm) 2 Vi+iWVn) 2 VU i= 1 / = 1 где Vt (и VI) равномерно распределены на интервале (— 1/2, 1/2) со средним 0 и дисперсией 1/12. Мы можем применить центральную пре¬ дельную теорему к каждому из двух членов правой части. Например, (Л/1/2 /т) (1 /X)1/2 Zx, Zj оо п (0, 1/12). Заметим, что если Vn^> Zj, Vn Z2w Vn, Vn независимы, то характеристическая функ¬ ция Vn + Vn сходится к характеристической функции Zx + Z2. Отсюда Vn V^]/ TZl+ V' za, тп у К - \ (1 — X) imeZx, Z2 — независимы и распределены, как п (0, 1/12), и }—JL l/n Z со л (О, 1/I12A, (1—Я,)]. тп Далее, var (NVp/mn) 1/[12 К (1 — X,)], и из (3.2.3) var (Л/1/2 W*/mn) — N (N+ l)/(12mn) -> 1/[12Х (1 — X}]. Из теоремы 2.5.2 (формула 2.5.7) получаем Е (VN W*/(mn) — VN Vp (тп))2 0. так что по теореме 2.5.3 N1/2 W*/(mn) имеет то же нормальное распре¬ деление, что и N1/2 Vp /(тп). Для завершения доказательства запишем (W — EW)/(Vav W)1/2 и воспользуемся теоремой Слуцкого АЗ прило¬ жения, а также утверждением о предельной нормальности N1/2 W*/ /(тп). 'г Согласно доказанному ранее Р (W < w) = Ф (/), где t = (w + -f 0,5 — тп/2)/[тп (т + п + 1)/12] */2. В стандартизованную пере¬ менную входит поправка на непрерывность. Это приближение можно улучшить, если применить разложение Эджворта подобно тому, как 146
это было сделано для статистики знаковых рангов Уилкоксона в (2.2.11). Е. Фикс и Дж. J1. Ходжес [52] показали, что т2 + п2-|- шп + т + п Р (W < w)^= Ф (0 + 20тп (m + п + 1) где г|з (•) — плотность распределения п (0,1). Фикс и Ходжес дали таб¬ лицу, в которой сравниваются нормальная и Эджвортова аппроксима¬ ция. Простое нормальное приближеннее поправкой на непрерывность пригодно в большинстве случаев*; П. Дж. Бикел [23] обсуждает ошибку при разложении Эджворта. п Для проверки гипотез удобнее использовать форму U = ^Rh 1 поскольку для ее вычисления достаточно ранжировать (упорядочить) т + п наблюдение. Считающая форма W= # (Yt—Xj>0) требует вычисления тп разностей, что может быть затруднительно при средних (а не ма¬ лых) значениях т и п. С другой стороны, считающая форма важна для оценивания А. Заметим, что статистика W= # (Yt — Xj >0), i = 1, n, 7 = 1, ... ,m — это статистика знаков, вычисленная на тп разностях. Отсюда, если учитывать результаты обсуждения из раздела 1.5, оценка Ходжеса—Лемана параметра А равна A-med (Yt—Xj). (3.2.4) /. / Более того, если РНо (W < k) = а/2, причем распределение W симметрично при #0:Д =.0, из упражнения 3.7.5 следует, что iP{k-f- 1)» D(mn — k)) (3.2.5) — (1 — а)- 100-процентный доверительный интервал для А, где < ... < D(mn) — упорядоченные разности Y\ — Х7-, i = 1, ..., пу j = 1, ..., т. Посредством нормального приближения величину k из (3.2.5) можно получить (используя поправку на непрерывность) сле¬ дующим образом: и тп п к 7 лГ tnn(m + n+1) U’5~ Za/2 |/ й ’ (3.2.6) где Za/2 — верхняя a/2-процентная точка стандартного нормального распределения. В пакете прикладных программ Минитаб содержатся программы вычисления соответствующих точечных оценок и довери¬ тельного интервала для критерия Манна — Уитни — Уилкоксона. Пример 3.2.2. Вернемся к примеру 3.1.2. Дети были разделены на три группы в соответствии с весом при рождении. Мы рассмотрим груп¬ * Это относится скорее к аппроксимации вероятностей, чем к аппроксимации критических точек. Для приближения последних мы рекомендуем формулы Л. Р. Имана [297]; см. также примечания к [249а], [221]. — Примеч. пер. 147
пу крупных детей с весом при рождении не менее 3150 г. Их было п = 20 в обрабатываемой* группе (Y) и т = 36 в контрольной группе (.X). Данные приведены в таблице 3.1. Эти данные восстановлены по точечному графику из [162]. Для проверки N0: А = 0 против НА: А >0, если выбирается а = 0,05, нормальное приближение используется для нахождения кри¬ тического значения с = п (т + п + 1)/2 + 0,5 + 1,645Лтпх 20 X (т + п + 1У12]1/2 = 666,7 и £/ = 2 Ri> гДе Rif •••> R20 — 1 ранги наблюдений в объединенной выборке. По данным табл. 3.1 мы получаем U = 762,5 > с, вследствие чего Н0 : А = 0 отклоня¬ ется на уровне а = 0,05 и влияние обработки объявляется значимым. Для оценивания величины эффекта обработки мы построим точеч¬ ную и интервальную оценки. Имеется тп = 720 разностей Yj — — Xh j = 1, 20, / - 1, ..., 36, А = med (Yj — Xt) = —■ 60,0. Из (3.2.6) при Za/2 = 1,96, k = 244,8. Если мы положим k = 244, то [D(245), D(476)) = [29,9, 100) несколько более, чем 95-про- центный доверительный интервал. Заметим, что, как только довери¬ тельный интервал перестает накрывать 0, возникает строгое отклонение Я0: А = 0. Вычисление проводилось по программе «Мапп» из Ми- нитаб [160]. Заметим, со связями обычно «справляются», назначая средние ран¬ ги (tied ranks)** в группе связанных наблюдений, что соответствует приписыванию 1/2 нулевой разности Y — X. Это называется методом Таблица 3.1 Прибавка в весе у крупных детей Обработка (м=20) Контроль (т=36) Обработка (п=20) Контроль (т=36) Обработка (п= 20) Контроль {т — 36) 190,0 140,0 0,0 —30,0 — 100,0 80,0 100,0 -10,0 —30,0 — 110,0 80,0 100,0 —25,0 —45,0 — 130,0 75,0 70,0 -30,0 —45,0 — 130,0 50,0 25,0 —45,0 —45,0 — 155,0 40,0 10,0 -60,0 —50,0 —155,0 30,0 0,0 —85,0 —50,0 — 180,0 20,0 —10,0 —50,0 —240,0 20,0 - 10,0 —60,0 —290,0 10,0 —25,0 —75,0 10,0 —25,0 —75,0 10,0 —25,0 —85,0 0,0 —30,0 —85,0 * Т.е. группе, подвергаемой воздействию. — Примеч. пер. ** Некоторые авторы (например, Ruymgaart) не смешивают этот термин с «average rank».— Примеч. пер. 148
средних рангов (midrank (method)) и довольно подробно обсуждается у Е. Л. Лемана [116, гл. 1, разд. 4]. (См. еще [150].) Мы также можем изучить поведение истинного уровня значимости W на данных с сериальной корреляцией. Модель, подобная модели се¬ риальной корреляции, вводится в конце раздела 1.7 и затем еще раз обсуждается в конце раздела 2.7, а именно : пусть (Хь Х*+1), i = 1, 2,..., имеет двумерное распределение со средним 0, дисперсией 1 и корреля¬ цией рл.. Аналогично определим последовательность (Yh Кг+1), i= = 1,2, ..., не зависящую от последовательности X, которая имеет нор¬ мальное распределение со средним 0, дисперсией 1 и корреляцией ру. Результаты Р. Дж. Серфлинга [174] свидетельствуют о том, что проек¬ ция Vpj введенная в доказательстве теоремы 3.2.4, подходит и для вы¬ числения асимптотического распределения W. В частности, из теоре¬ мы А16, мы видим, что (Nl/2/mn)Vp сходится по распределению к (1/Х)1/2 + [1/(1—X)]1/2 Z2, где Zx, Z2 —независимые, нормаль¬ но распределенные случайные величины с распределениями п (0, (1/12) + (1/я) sin-1 (р*/2)) и п (0, (1/12)+ (1/я) sin-1 (р^/2)), соответствен¬ но (см. (2.7.11)). Теперь, как в теореме 3.2.4, (Л/1/2 /тп) (W — EW) асимптотически распределена, как п (0, [12 к (1 — К)]"1 + (к я)_1х Xsin-1 (р*/2) + [(1 — А,)я]-1 sin-1 (pv/2)). Таким образом, при нали¬ чии сериальной корреляции статистика Манна — Уитни — Уилкок¬ сона W так же, как и статистика знаковых рангов Уилкоксона, не остается свободной от распределения даже асимптотически. Влияние сериальной корреляции на истинный уровень значимости W то же, что и для Т. 3.3. РАСПРЕДЕЛЕНИЕ РАНГОВ ПРИ АЛЬТЕРНАТИВАХ В этом разделе мы рассмотрим общую задачу вычисления совместно¬ го распределения рангов. Хотя результаты могут быть использованы для вычисления точной мощности ранговых критериев, наша цель — построение локально наиболее мощного рангового критерия для за¬ данной исходной модели. Такой локально оптимальный-критерикможно' сравнить с двухвыборочными версиями асимптотически наиболее мощ¬ ных ранговых критериев, обсуждаемых после теоремы 2.9.1 в одновыбо¬ рочной задаче о ранговых критериях. Пусть Хг, ..., Хт и У+ ..., Yn — случайные выборки из произволь¬ ных, абсолютно непрерывных распределений, обозначаемых G (х) и Н (у) соответственно, с плотностями g (х) и h (у). Предположим, /?(1) < ... < RM — ранги У(1) С ... < YM в объ¬ единенных выборках. Следующий результат дан В. Гефдингом в [84]. Теорема 3.3.1. Пусть h (х) >0 влечет за собой g (х) >0. Тогда Р (Р(\) —П,..., R(n) — rn) — ГГ) [п!М1 149
где V(1) < ... < V(m+7l) —порядковые статистики выборки разме¬ ра т + п из G. Доказательство. Рассмотрим события /?(1) = rlf ..., /?(П) = = гп при заданных */(1) < ... < У(П)- Здесь есть гг — 1 х-ов мень¬ ших, чем -(/(!), и г2 —гг —1 х-ов находятся между #(1) и у(2). Пусть г0 = 0 и rn+1 = т + п + 1. Условное распределение мож¬ но записать в виде полиномиальной вероятности, если рассмотреть раз¬ мещение (tossing) /я х-ов в п -f 1 ячейках, полученных из фиксированных упорядоченных у-ов. Итак, Р (R(i) =ги ..., R(n) = rn\y(l) < . ..<#(„)) = G (у(1)у>-' [G (yi2))-G ... х П (г/+1 — о —1)! /-=0 X [1-0{у{п))Г+п-\ где, например, вероятность попадания х во вторую ячейку равна р (0ш < X < у(2)) = G (г/(2)) — G (0(1)). Теперь умножим на /г! Uh (уц)) совместную плотность Уц) <...<К(П) и проинтегри¬ руем по */(1), ..., у(п) частное распределение R(1) < ...< R(n). Затем мы умножим и разделим полученное выражение на (т + п)\ Пg (*/(*)): т\ п\ П h (Уц)) X (т + ft)! ПЯ(0(«)> P{R(\)=ru ...,R(n,=rn)= j* ... j* 1П(г/+1-о-1)! X n £ ('/«•))] dy,\)...dy{n). Ясно, что функция в фигурных скобках — совместная частная плот¬ ность V(Г V(r . из взятых из вариационного ряда ... < < V,J,) (ш. [194, с Й71). С помощью этого результата можно вычислить вероятности в раз¬ личных специальных случаях. Для большинства интересных распреде¬ лений это выражение мало дает непосредственно (см. [113] или [72]). Мы используем это выражение для совершенствования конструкции ло¬ кально оптимальных ранговых критериев в модели сдвига. Соответ¬ ствующие результаты для одновыборочной модели см. в упражнении 3.7.18. В упражнении 3.7.20 обсуждаются локально оптимальные ран¬ говые критерии для модели с параметром масштаба. Остановимся на модели с параметром положения, для которой G (х) = F (х) и Н (у) = F (y — A)F £ £20. При Н0: Д = 0 распределение (т + п\ Ray...< R(n) равномерно на множестве I т (равновероят¬ но
ных последовательностей. Это можно сразу же заключить из теоремы = а, то любое множество С из k ранговых векторов (rls гп) — крити¬ ческое множество размера а для Н0: А = 0. Наша задача — найти наилучшее критическое множество относительно заданного критерия. Мощность критической области С размера а задается формулой где V(m+„) — порядковые статистики выборки объема т + п из F (х). Определение 3.3.1. Локально наиболее мощный ранговый критерий размера а задается такой критической областью при уровне значи¬ мости а, что Р' (0) максимальна. Здесь Р' (0) — производная от р (А), вычисленная в точке А = 0. Это определение несколько отличается от общепринятого 7(см. [114]). При более сильном определении требуется, чтобы ранговый кри¬ терий был равномерно наиболее мощным относительно всех ранговых критериев в достаточно малой окрестности А = 0. В нашем определе¬ нии мы требуем лишь максимизации наклона функции мощности при А = 0, т. е. наш локально наиболее мощный ранговый критерий имеет возрастающую наиболее быстро функцию мощности при нулевой гипо¬ тезе. При непрерывной функции мощности, если пренебречь «патоло¬ гической ситуацией», локально наиболее мощный ранговый крите¬ рий из определения 3.3.1 будет оптимален в окрестности А = 0. В те¬ ореме 3.3.2 мы предполагаем, что плотность дифференцируема и произ¬ водную по А можно переносить через знак математического ожидания. Теорема 3.3.2. Задана F£ £20; предположим, что законна операция дифференцирования под знаком математического ожидания, тогда с помощью локально наиболее мощного рангового критерия можно от¬ клонить Н0: А = 0 в пользу Н0:А >0, если где с определяется из Рн0 (V > с) = а. Доказательство. В (3.3.1) продифференцируем Н0 под знаком мате матического ожидания и получим 3.3.1 при g = h. Следовательно, если k такое целое, что k! Р(А) = (3.3.1) 151
и Р' (0) (3.3.2) С —любое такое множество k ранговых векторов (г1? ..., гп)у что Максимизируя (3' (0), мы строим G, включая те ранговые векторы (ri> гп)у которые порождают k наибольших значений V = Отсюда мы можем найти такую постоянную с, что неравенство V > с доставляет нам критическую область размера а, максимизирующую Р' (0). Доказательство завершено. Предположим, что мы строим метку а (i) так: где У(1) < ... < У(т+„) — порядковые статистики из выборки с функцией распределения F (х). Тогда локально наиболее мощный ран¬ говый критерий даст нам статистику V = 2"=! a (Ri), где Rly ..., Rn — ранги наблюдений Y в объединенной выборке. Далее мы рассмот¬ рим три примера, а затем вернемся к статистике с метками общего ви¬ да для двухвыборочной модели сдвига. Пример 3.3.1. Пусть f (х) —стандартная нормальная плотность распределения, поэтому — /' (x)/f (х) = х. Локально наиболее мощ¬ ный ранговый критерий задается посредством статистики V — 2"аХ X (Ri), которая называется статистикой нормальных меток, причем a (i) = £(1/(П), Kd) < . .. < У(m+n) — порядковые статистики из распре¬ деления п (0, 1). Для некоторых выборок имеются таблицы ожида¬ емых значений этих нормальных порядковых статистик, полезные для вычисления V по каким-либо данным (см. [51]). Первоначально этот критерий предложили Р. А. Фишер и Ф. Йейтс. Естественное приближение Е (У<о) Дает Ф-1 (il(m + п + 1)), где Ф (•) —стандартная нормальная функция распределения. От¬ сюда статистика с приближенными нормальными метками, впервые предложенная Б. Л. Ван дер Варденом [189], равна У* = 2 Ф 1 X XlRi/(N + 1)]. Сравним У* с одновыборочной статистикой из примера 2.8.1. Если учитывать гладкость Ф(-), то можно заключить, что статисти¬ ки V и V* довольно близки. В компьютерных пакетах может содержать¬ ся программа вычисления У* так же, как и программа вычисления нормальных меток. Простая формула с точностью до первых, четырех 152 (3.3.3) п
десятичных знаков для вычисления нормальных меток (см. пример 2.8.1) такова: £^<0 —4,91 [р0,14—(1—р)0,и], Р — ~^~Т~Йг ' (3-3-4> я+1/4 Дополнительно это обсуждается в [181] и [105] *. Пример 3.3.2. Пусть f (х) — логистическая плотность распределе¬ ния / (х) = е~х/(1 + е~х) 2, — оо < х < оо.' Функция распреде¬ ления равна F (х) = 1/(1 + е~х), — оо < х < оо. Легко заметить, что / (х) = F (х)[1—F (х)]. Далее, —/' (х)//(х) = 2F (х) — 1. Применив (3.3.3), мы по¬ лучим a (i) = Е [2F (V(i))— 1]. Из упражнения 3.7.7 следует EF (^(г)) = i/(m + п + 1), откуда У = i[—^ ll = 2 y\Rt +*1 т + д+1 m + n + 1 2 l L Ясно, что для исходного логистического распределения локально наиболее мощный ранговый критерий — критерий с ранговыми метка¬ ми Манна — Уитни — Уилкоксона. Пример 3.3.3. Пусть / (х) — плотность распределения двусторон¬ него экспоненциального распределения f (х) = е-Ш/2, — оо <х<оо. Исключим точку х = 0, в которой не существует производная, — ¥ (*)// (х) = sgn (*)• Таким образом, локально наиболее мощный ранговый критерий задается выражением a (i) = Е sgn V(i)t где У(1> < ... < V(m+n) —порядковые статистики из / (х). Также, как и в примере 3.3.1, нам нужны таблицы значений математических ожиданий знаков для порядковых статистик двустороннего экспонен¬ циального распределения. Но эти таблицы в литературе встречаются гораздо реже, чем таблицы нормальных меток. Подобные таблицы мож¬ но найти в [64]. Можно также рассмотреть приближение а (г), полученное путем переноса математического ожидания в аргумент функции. Заметим, что х >0 тогда и только тогда, когда 2F (х) — 1 >0, и поэтому Определим V = '£Esgn V(Ri) = = yiEsgn[2F(V{R.))~l]. , V*=2sgn [2£7ЧУ(*4))-1] = = 2 sgn [2 ■ Ri : 2 sgn [ Ri m + n+ 1 См. также [116] и [152].— Примеч. пер. 153
Обратим внимание на то, что sgn [Rt — (т + п + 1)/2] = 1, если и только если Rt >(m + п + 1)/2, т. е. если и только если Yt больше, чем медиана объединенной выборки. Пусть VI\-(V—) число наб¬ людений Y, которые больше (меньше), чем медиана объединенной вы¬ борки, тогда V\ — VL. Окончательно, при четном т + пу V++ /г, V* = 2V\ —п. Немного иначе дело обстоит при нечетном m+n, но это не важно для больших выборок. Статистика V+ называется медиан¬ ной статистикой Муда (Mood) и обсуждается в его работе [131]. Ста¬ тистика V + дает нам приближение к локально наиболее мощному ранго¬ вому критерию, основанному на V. В этом случае мы переносили мате¬ матическое ожидание в аргумент негладкой знаковой функции. Отсюда может проистекать некоторая потеря в мощности для выборок малых объемов. У. Дж. Коновер и др. [37] показали, что локально наиболее мощный ранговый критерий несколько лучше V+ для малых выборок даже в случае двустороннего экспоненциального распределения. Мож¬ но показать, что они эквивалентны, и на практике большинство людей будет пользоваться v+, поскольку под рукой не всегда есть таблица ло¬ кально наиболее мощных меток *. Далее в этой главе говорится о том, что критерий Муда — аналог критерия знаков, почему двухвыбороч¬ ный критерий и имеет ту же эффективность, что и критерий знаков в од¬ новыборочной модели. В общем случае, если а (i) = — Е [/' (У<о)// (У(о)Ь то прибли¬ женные метки определяются так: а* (0 = — У Мт+”+|») (3.3.5) f (F-1 [//(т +«+!)]) где сначала К(г) приближается величинами F~x (Ua))y где (/(1) < ... < < U(m+n) — порядковые статистики из равномерного распределения на интервале (0,1), а затем математическое ожидание вносится под знак функции и учитывается, что EU= И(т + п +1) из упражнения 3.7.7. Таким образом, в дополнение к статистике Манна — Уитни — Уилкоксона из раздела 3.2, выявив различные плотности распреде¬ ления /, мы можем получать множество ранговых критериев. В об¬ щем случае приближение У* = 2 а* (Rt) — более практично, чем ло¬ кально наиболее мощный ранговый критерий со статистикой V = = ^a(Rt). В следующем разделе мы изучим распределение статистики с мет¬ ками общего вида при нулевой гипотезе. Будет установлено наличие предельной нормальности, что дает возможность аппроксимировать критические точки критериев. * И тем более распределения соответствующей статистики, — Примеч. пер. 154
3.4. МЕТКИ ОБЩЕГО ВИДА В этом разделе мы изложим основные результаты для асимптоти¬ ческой теории распределения при нулевой гипотезе. Данная ситуация более сложна, чем ситуация в одновыборочной мо¬ дели с параметром положения, где независимость дает возможность ис¬ пользовать центральную предельную теорему, которая обеспечивает асимптотическую нормальность статистики с нормальными метками. В двухвыборочной модели у случайных величин уже нет требуемой независимости и приходится прибегнуть к методу проекции. Основные результаты получили Я. Гаек и 3. Шидак [68, гл. V]. Они смогли дока¬ зать теорему 2.8.1 для случая двух выборок, доказательство мы приве¬ дем позже. Прежде, чем установить это, займемся моментами статистик с общими метками. Как и ранее, у нас есть т наблюдений X и п наблюдений Y с ранга¬ ми Rly ..., Rm наблюдений Yl9 ..., Yn в объединенных данных. По ана¬ логии с определением 2.8.1 дадим следующее определение. Определение ЗАЛ. Пусть 0 = а (0) < а (1) < ...< а (Л/), N = = т + п — последовательность, в которой элементы не равны один другому, тогда V = (Ri) называется статистикой с метками об¬ щего вида. Мы можем записать также at = а (i). Теорема 3.4.1. В модели с параметром положения и при выполне¬ нии Н0: А = 0 Доказательство. Заметим, что EV = ^ Еа (Rt) =пЕа (.Rх). Из теоремы 3.2.1 Еа (R1) = ^i^f a (i) Р (R1 = i) = ^r at/N. Далее, £а2 (/?!) = = 2?' af IN и Var a (R1) = Ea2 (RJ-lEa (RJf = 2>? /N—a2 = = 2\i (ai—a)2jN. Из теоремы 3.2.1 получаем* cov (a (Ri), a (R2)) = £ l(a (R^ —a)(a (R2) —a)] = * cov (Xiy Xj) = E [(Хг — EXi) (Xj — EXj)]. Автор часто пользуется формулами для дисперсии, ковариации; сводку таких формул см., например, [236, раздел 2, с. 101 —102; раздел 4а, с. 194]. —Примеч. пер. N N i¥^i 155
Поскольку 2 (at—а) = 2 (at—я)—(Oj—cl) = —(oj—а), мы имеем i¥=l i cov (a (Rj), a (R2)) = ^ 2 ^ai~~af И N var V = var ^ я (Ri) = l = n var [a (Rx)] + cov (a (/?x), a (Я2))= = ^- Y (at~Ef- n(n~]) У (аг —a)2, J N (N — 1) ^ V 1 ; ’ откуда приведением подобных членов получается нужный результат. В дополнение ко всему сказанному в упражнении 3.7.4 указывается, что при нулевой гипотезе V — симметрично распределенная случай¬ ная величина, что следует из наличия у at + а^_г+1 одного и того же значения при всех i = 1, ..., N. Точка симметрии распределения рав¬ на па. Теперь для двухвыборочной задачи мы введем функцию, порождаю¬ щую метку. Определение 3.4.2. Пусть ф (и) — неубывающая функция, где О < и < 1. Предположим, что 0 < (ф(и) —ф)2 du < оо, где ф = JJ ф (и) du. Определим a (i) = ф (i/(N + 1))» N = т + я, тогда V = —ста¬ тистика с метками общего вида, получаемая по функции, порождающей метки (scores-generating function). Я. Гаек и 3. Шидак[68, с. 163] доказали, что если V удовлетворяет определению 3.4.2 и min (/и, п)-*~ оо, то IV — £V]/(var V)1/2 име¬ ет предельное стандартное нормальное распределение. Теперь предпо¬ ложим, что N -+- оо и m/N 0 < X < 1, так что асимптотичес¬ ки ни одна из выборок не доминирует по объему. Отсюда EV = — a= — — Уф(—Х)ф, (3.4.1) N N N \N+\ ) ' ; N var V — — 'S (di —a)2 -> A/2 (N— 1) JU ->■ к (1--X) |^(ф (и) — ф)2 du. (3.4.2) 156
Следовательно, факт асимптотической нормальности можно записать через асимптотические параметры так: имеет стандартное нормальное распределение. Дальнейшее обсуждение и развитие этих результатов см. в [152, гл. 8]. Если мы положим ф (а) = —/' (F~1 (u))!f {F~\u)) и введем до¬ пущение о конечности информации Фишера для / и выполнении опреде¬ ления 2.9.1, то определение 3.4.2* будет выполняться, как показали Я. Гаек и 3. Шидак [68]. Итак, из (3.3.5) статистика Г* = 2а* (/?*)— приближение к локально наиболее мощному ранговому критерию и асимптотически нормально распределена. Метки (3.3.3) порождающие локально наиболее мощный ранговый критерий Г, вовсе не имеют функции, порождающей метку, в том смысле, в котором это имеется в виду в определении 3.4.2**. Однако Я. Гаек и 3. Шидак [68] показа¬ ли, что У и У*, стандартизированные должным образом, имеют оди¬ наковые предельные распределения. Действительно, существует строгий результат, относящийся непо¬ средственно к (3.4.1), (3.4.2) и (3.4.3). А именно, если ср удовлетворяет 3.4.2 и если мы определим at = £ф {V^))y где U{ 1} <. ... < U(U) — порядковые статистики из равномерного распределения на интервале (О, 1), то (3.4.1) — (3.4.3) выполняются для У = (RiVN. Это озна¬ чает, что мы можем использовать либо £ср (t/(i)), либо ф (Е £/(*>) для оп¬ ределения статистики У, не изменяя асимптотические результаты**. Пример 3.4.1. Пусть ф (и) = Ф-1 (а), где Ф (•) — стандартная нормальная функция распределения. Тогда — приближение для локально наиболее мощного рангового критерия при исходном нормальном распределении, обсуждаемого в примере 3.3.1. Проверим условие квадратичной интегрируемости из определе¬ ния 3.4.2. Заметим, что * Приближенных меток а (i) = Ф (г/ (N + 1)) вместо меток а (i) = = - E{f' (V{i))/f(V(i))} (3.3.3). - Примеч. пер. ** На этом читатель должен сосредоточить свое внимание. — Примеч. пер. Vn (1/—(1—Я) <р) (3.4.3) У % (1— к) j (ф (и) — у)2 du п ф = JJ ф-1 (и) du-- = ^Ф(0=о, 157
откуда |‘(ф(и) — ф)2 = j О 1 ^)2 du== = j"00 ** йф (0 = !• Заменив Я, на m/N и 1 — Я на n/jV, мы получим, что (N^lmri)1^ V приближенно нормально распределена, как п (0, 1). Если воспользо¬ ваться этим приближением и формулой (3.3.4) для вычисления крите¬ рия нормальных меток, то он будет вполне применим на практике. Пример 3.4.2. Рассмотрим статистику Муда из примера 3.3.3. Статистику V*, равную числу наблюдений Y, превышающих медиа¬ ну объединенной выборки, можно записать в виде = 2? Ф (#*/ Рассмотрим подробно случай N = т + /г = 2 г, п < /п. Посколь- при i = 1, 2, ..., г и 1 при i = г + 1, ..., N, легко проверить, что При п < т точное распределение при нулевой гипотезе — гипер¬ геометр ическое распределение с вероятностью для k = 0, 1, ..., п. Поскольку ф (•) ограничена, можно применить определение 3.4.2, и [V+ — п/2]1[тп1Цт + п — I)]1/2 имеет пре¬ дельное распределение п (0, 1). В разделе 2.8 мы привели несколько примеров одновыборочных ста¬ тистик меток, в частности в примерах 2.8.2, 2.8.3. Обсудим теперь по¬ строение двухвыборочных статистик посредством одновыборочных. Пример 3.4.3. Пусть у нас есть одновыборочная функция, порожда¬ ющая метку ф+ (и), 0 < и < 1, удовлетворяющая определению 2.8.2. 158 /(N + 1)), где ку а* = <f(U(N+l)) = 0 N тп 4 (N — 1)
Обозначим через V+ одновыборочную статистику из (2.8.4). Распростра¬ ним ф+ (и) на интервал (—1, 1) с помощью выражения ф+ (— и ) = = — ф+ (и) и определим ф (и) = ф+ (2и — 1), 0 < и < 1. Аль¬ тернативно определим ф (и) = ф+ (2и — 1) при 1/2 Си С 1 и — Ф+(1 — 2п), если 0 < и < 1/2. Пусть V — соответствующая двух¬ выборочная статистика. Далее, Ф = Jo Ф (u)du = = jo ф+ (2и~ ^ du = = -i-|^Ф+ (V) dv = = -i-|—j° ф+(—у) dv + j '<p+ (y) = = -i-j—j*1 ф+ (y) dv + j** ф+ (y) dvj=0 и jo (<p (“) —ф)2 du = jo [ф+ (2м — du = =T f_i1ф+ ^dv = —{j^_, [ф+(—1>)]2 rft» + j‘[cp+ (o)]*dt>} = = jo [ф+ (°)12 dv. Продемонстрируем немедленно приложение этого подхода: пусть Ф+ (и), 0 < и С 1, V+'—статистика знаковых рангов Уилкоксона. Тогда ц (и) = 2и — 1,0 Си С I и V — центрированная статистика Манна — Уитни —Уилкоксона. Если мы положим ф+(ц) = 1, 0 С < ц < 1, что соответствует статистике знаков -V+, то ф (и) = 1 при 1/2 < и С 1 и ф (и) = — 1 при ОС и < 1/2, откуда V — цент- , / И + 1 \ рированная статистика Муда. Если ф+ (и) = Ф Ч—-—I — по¬ рождающая функция для одновыборочной статистики нормальных ме¬ ток, то ф (и) = Ф~* (и) — порождающая функция для двухвыбороч¬ ной статистики нормальных меток. В упражнении 3.7.8 обсуждаются двухвыборочная статистика, соответствующая винзорированной знако¬ вой ранговой статистике, и модифицированная знаковая статистика из примеров 2.8.2 и 2.8.3. Позднее мы увидим, что V+ и V обладают од¬ ними и теми же асимптотическими свойствами. В частности, если V+ — асимптотически наиболее мощный ранговый критерий (см. 159
обсуждение после теоремы 2.9.1), то V будет асимптотически наиболее мощным в двухвыборочной модели (см. раздел 3.5). Асимптотическая теория Я. Гаека и 3. Шидака [68], которую мы об¬ суждали выше, дает возможность приближать критические точки раз¬ нообразных двухвыборочных критериев. Приведенное в (3.3.3) мате¬ матическое ожидание можно найти или табулировать; критическую точку асимптотически наиболее мощного рангового критерия можно приблизить. Аппроксимация локально наиболее мощной метки (3.3.5)— одно из нескольких применений функций, порождающих метку. Нали¬ чие асимптотической нормальности статистики в случае меток общего вида — это очень важный вопрос, поскольку в отличие от статистики Манна — Уилкоксона, точное распределение таких статистик при ну¬ левой гипотезе табулировалось редко и его таблицы малодоступны *. В большинстве случаев нулевое распределение статистики критерия симметрично, и нормальное приближение дает хороЩую точность даже для малых выборок **. Далее мы обсудим считающую форму двухвыборочной статистики с метками общего вида и используем ее для построения оценки Ходже¬ са — Лемана параметра Д. В разделе 3.2 говорилось, что U = 2= = W + п (п + 1)/2, где Г = #(К,-ХУ >0), i =1, ... , п, j = 1, ..., т. Для статистики с метками общего вида определим V (А) = (Ri (А)), где Rt (А) — ранг Yt — А среди Х19 ..., Хту Yx — А, ..., Yn — А. В упражнении 3.7.9 предлагается пока¬ зать, что V (А) убывает на величину ai+j — сц+j-i при пересечении А разности Y(j) — Хц). Следовательно, тп попарных разностей играют ту же роль в двухвыборочной задаче, что и среднее Уолша в од¬ новыборочной. Если Тij (А) = 1 при Y(j) — X(i) >0 и 0 — в про¬ тивном случае, то V (A) =Q (Д) + 2^1, (3.4.4) 1 где тп п Q (А) = 2 2 (*£+/-*+/ - О Ти (А). (3.4.5) ;=1/=1 Если аь = i, i = 1, ..., m + я, то Q = W (см. раздел 3.2). Сравним эти определения и результаты с приведенными в разделе 3.2. Действуя, как в разделе 2.8, мы ограничимся такими метками, что * Рекомендуем для поиска таблиц обращаться к [249а], [291, т. 4], [202, с. 404—412], а также реферативному журналу: «Statistical Theory and Met¬ hods Abstracts». — Примеч. пер. * * Следует заметить, что это далеко не всегда так. Нормальное приближение процентных точек для т, п ^ 6ч-8 может быть плохим и для критерия Манна— Уитни — Уилкоксона, см. [297, с. 587—598]. Поэтому для малых выборок и ста¬ тистик с разными метками в последнее время появляются таблицы точного рас¬ пределения. — Примеч. пер. 160
ai+j — Яг-к/-1 равно 1 /(N +1) или 0, а это упрощает описание оценок А. Пусть в = {(*\ 1) • aL+i—ai+!-\ =l/(N + 1)}, (3.4.6) тогда при условии, что распределение V симметрично (см. упражне¬ ние 3.7.5), Л= med [YU) — X{i)]. (3.4.7) i) e в В заключение этого раздела проиллюстрируем приведенные выше соображения на примере медианной статистики Муда. Дополнитель¬ ные примеры можно найти в упражнениях. Пример 3.4.4. Этот пример — продолжение примера 3.4.2, посвя¬ щенного медианной статистике Муда. Рассмотрим случай N = = т + п •= 2/*, п < т. Пусть at = 0 для i = 1, ..., г и 1 при i = = г + 1, •••, N. Статистика Муда равна V*+ = 2" a (Rt) и ai+j — — cti+j-1 = 1 лишь для / + i = г + 1. Отсюда, поскольку = О, V*+ = # (К(л — Хц) >0) при / + i = г + 1, и оценка А равна Д= med [YU)—X{i)] = / + /= Г+1 = med [Уф— X(r+\-j)]- i= i п В этом случае мы можем упорядочить соответствующие разности, зная лишь порядковые статистики для индивидуальных выборок. За¬ метим, что Y(1) —Х(Г) < Y(2)—Х(Г-1) <С • • • < У(п) —Х(Г_л+1). В случае п = 2п* — 1 и т = 2т* — 1 имеем А = Y(П*) — — ХТ_п*_х = Y(n*) —X(m*) = med Yj— med Xt. Напомним, что = 0, V = Q, и считающая форма не отличается от ранговой формы. Отсюда, если pH0(V+^.k) = а/2, определенная из гипергео- метрического или нормального приближения, то нижний и верхний концы (1 — а) 100-процентного интервала для А равны ^L = Y(k + i) — Х(Г—щ (3.4.8^ и А и — Y {п —k) — Х(Г—n+k + о- Напомним об эквивалентности проверки гипотез и доверительных интервалов. При проверке Н0 : А = 0 против НА : А Ф 0 мы откло¬ няем Н0 на уровне а в том случае, когда V+ < k или У+ > п — k, где Рн0 (V+ < k) = а/2. Это эквивалентно отклонению Н0 на уровне а в том случае, когда а не содержится в [А ь, А ^1, т. е. в (1 — а)-про- центном доверительном интервале. 6'Зак. 284 161
Эта формулировка показывает, что если наблюдения берутся после- i довательно, т. е. мы берем порядковые статистики, то можно вычислить статистику и применить критерий еще до того, как будут получены т + п наблюдений. Это свойство используется при проверке длитель¬ ности «жизни» изделия, когда фиксируется время до выхода изделия , из строя. Из последнего утверждения следует, что если PHq (V+ < k) = = а/2, то с помощью критерия Муда можно отклонить Н0 : А =0 при о < &L = Yik + 1) —Х(г_Аг) ИЛИ X(r-k) < Y(k + l), или ^ 0 Д(У — Y (ri\—k) ^(r — л + k-\-1) ИЛИ Г (л _&) Отсюда, например, если мы наблюдаем X(T__h) раньше, чем Y(k+1)y то можем закончить эксперимент и отклонить Н0 : А =0. Дальнейшее обсуждение см. в [57]. Сравнение с другим медианным критерием см. в упражнении 3.7.11. Обсуждение результатов, полученных в ранний пе¬ риод исследований, для критерия Манна — Уитни — Уилкоксона см. в [4]. Теперь мы соотнесем этот вывод о А, основанный на процедурах Муда, со знаковыми процедурами из гл. 1. Рассмотрим простой слу¬ чай т = /г, пусть т + п =2п = 2г, г = п. Теперь у нас есть AL = Yih+1) — Х(п_ю и А и = Y(n_h) — Х(к+1). Этот интервал можно разделить на два следующим образом: [X(ft+1), X(n_h)'] и l^(fc+i)> Г(п_к)]. Здесь A L — разность нижних и верхних кондов интервалов для Y и X соответственно и для A v аналогично (см. рис. 3.1). Из рис. 3.1 видно, что 0 не содержится в [A L, Ajy] тогда и только тогда, когда два интервала [X(k+1), X(n_h)] и [У(л+1), Yin_k)] не пере¬ секаются. Таким образом, с помощью критерия Муда можно отклонить Н0:А = 0 тогда и только тогда, когда интервалы, полученные из зна¬ ковой статистики, не пересекаются. Наконец, нам нужны доверитель¬ ные коэффициенты для знаковых интервалов. Они определяются ве¬ личиной РНо (S < k), где k первоначально находят из Ри0 (У+ < k) = = а/2. Например, если использовать нормальное приближение, при¬ чем 1 — а = 0,95, так, что k = п/2 — 2[/г2/4 (2п — 1)11/2 (см. Y Y | | (* + 1) [п - к) Х{к + 1) Х{п-к) 162 Рис. 3.1. Доверительные интервалы знакового ти¬ па для 0* и 0„
пример 3.4.2) с равными объемами выборок, то Рн (S < k) = =Ф (— 21/2) = 0,08. Отсюда следует, что у знакового интервала примерно 84-процентные доверительные коэффициенты. В заключение нужно отметить: для рав¬ ных объемов выборок, если мы отклоняем #0: А =0 при непересече- нии двух 84*процентных доверительных интервалов, то это соответст¬ вует 5-процентному медианному критерию Му да. Оценки Ходжеса — Лемана А = 0Z/ — 0* — разность медиан, а 95-процентный доверительный интервал для А можно найти подбо¬ ром подходящих разностей в концах 84-процентных знаковых довери¬ тельных интервалов. В упражнении 3.7.14 приводятся результаты для случая выборок неравных объемов. Пример 3.4.5. В этом примере мы построим двухвыборочную статис¬ тику Колмогорова — Смирнова*. Определим метку о,(0 = (°,есл" ( 1, если /<1 i ^ N. Эта метка может быть получена из ср, (и) = 0 при 0 < и < t и 1 при t<. и<. 1, где / = [t (N + 1)], [•] — наибольшая целая часть числа **. Пусть Vj = 2?=i aj (#*)• Заметим, что если N = 2 г, то Vr = V+, т. е. равна статистике Муда. Отсюда Vj — двухвыборочный аналог одновыборочной модифициро¬ ванной знаковой статистики из примера 2.8.3***. В упражнении 3.7.8 речь идет о центрированной версии Vj. Статистика Vj — число наблюдений во второй выборке (у-ов), имеющих ранг больше /. При выполнении нулевой гипотезы о том, что две выборки извлечены из одного распределения, математическое ожи¬ дание равно EVj = (N — /) n/N. Пусть Z(1) < ... < Z(N) — по¬ рядковые статистики из объединенной выборки, и It равно 1, если Z(£) взята из второй выборки (у-ов), и 0 — в противном случае. Теперь мы имеем Vj = 2 -S ft- /=/+1 /= 1 * См. также [249а, гл. 10]. — Примеч. пер. ** См. определение метки a (i) = Ф | | из определения 3.4.2. — Примеч. \N+ 1/ пер. п *** В примере 2.8.3 V= 2 ^7 » гДе Wj= \ при |Х/а|, соответст- / = [(l-v)(n+i)] + i вующей положительному наблюдению, 0 — в противном случае (Wj — перемен¬ ная-счетчик), [•] — целая часть числа. — Примеч. пер. 6* 163
Следовательно, Введем эмпирические функции распределения двух выборок Gm (х) и Нп (у). Запишем их разности при ZU) следующим обра¬ зом: Второе выражение следует из того, что Gm и Нп — ступенчатые функ¬ ции со скачками в Z(1), Z(U). Покажем, что статистика Колмогорова — Смирнова не есть ли¬ нейная ранговая статистика. Однако ее можно записать как мак¬ симум из конечного числа линейных ранговых статистик, а именно, модифицированных статистик Муда. Исходя из этого при нулевой ги¬ потезе D — свободная от распределения статистика, ее нулевое рас¬ пределение табулировано *. Нулевое распределение статистики D не симметрично, и ее предель¬ ное распределение отлично от нормального. У Я. Гаека и 3. Шидака [68 гл, V] показано, что \\тр(^/~-2HL £><*) = 1—2^ 1)* + 1 k = 1 С помощью статистики D измеряется различие между эмпирически¬ ми функциями распределения. Таким образом, посредством построен¬ ного критерия можно отклонить Н0 : G = Н в пользу альтернативы общего вида (произвольной альтернативы) На : G ф Н. Это отличает данный критерий от рассматриваемых выше ранговых критериев, по¬ строенных при предположении о наличии альтернативы сдвига. Кри¬ * См., например, [249а, табл. 23, 24], [202, табл. 6.5а], [206], [221], [311]. — Примеч. пер. Статистика Колмогорова — Смирнова равна £> = max |Gm (г) —Нп (г) | = шах \Gm(ZU))~ X 164
терий, основанный на D, используется для обнаружения несдвиговых альтернатив, а также в ситуациях, когда мощность критерия Муда вы¬ сока. Существуют односторонние одновыборочные случаи этого крите¬ рия (см. упражнение 3.7. 19). В одновыборочном случае эмпирическая функция распределения сравнивается с теоретической функцией распределения. Если теорети¬ ческая функция распределения параметризована*, то параметры можно оценить минимизацией max* | Fn (х) — F (х, 9) |**. В работе [141] приведена библиография, содержащая работы, посвященные этим методам. К. А. Доксам [43], дает обзор нескольких графических методов сравнения двух выборок, базирующихся на статистике Колмогоро¬ ва — Смирнова. Если G (t) = F (t) и Н (t) = F (t — А (£)), то A (t) — обобщенная функция сдвига: ее можно использовать для измерения различия двух совокупностей при отсутствии параметров сдвига и масштаба. К. А. Доксам описал построение доверительных границ для A (t)y основанных на D. 3.5. ТЕОРИЯ АСИМПТОТИЧЕСКОГО РАСПРЕДЕЛЕНИЯ ПРИ АЛЬТЕРНАТИВАХ Обсудим статистику Манна — Уитни — Уилкоксона W. Ее нуле¬ вое асимптотическое распределение получено в теореме 3.2.4, опираю¬ щейся на теорему о прбекции. В упражнении 3.7.15 с помощью теоремы о проекции предлагается доказать, что W асимптотически нормальна при общих альтернативах. Моменты W будут вычислены позже. Мы ус¬ тановим состоятельность критерия Манна — Уитни — Уилкоксона и опишем класс состоятельности, как в разделе 1.3, используя извест¬ ные для общей ситуации асимптотическую нормальность при нулевой гипотезе и моменты. Для случая распределений разной формы мы по¬ строим на основе W критерии типа критерия Беренса — Фишера. Наконец, мы вычислим эффективность критерия по Питмену и завер¬ шим этот раздел обсуждением относительной эффективности статистик с метками общего вида. Пусть Х19 ..., Хт и Ylf ..., Yn — случайные выборки из произволь¬ ных непрерывных распределений G (х) и Н (у) соответственно. Напом¬ ним, что W = где Тtj = 1, если Yj —Х( >0, и 0—в противном случае; это считающая форма статистики Манна — Уитни— Уилкоксона. Теперь мы определим следующие параметры: Pi = Р (У > X) = Г” G (у) h (у) dy = [ 1 — Н (*)] g (X) dx, J — 00 — oo P2 = P {Yi > Хъ Уг > Я,) = Wl2 8 W dx, (3.5.1) * Этот случай следует отличать от предыдущего (изменяется распределение статистики критерия); см. [242], [243], [234]. —Примеч. пер. ** Минимизацией по 0, конечно. — Примеч. пер. 165
Рз=Р (Yi > *ъ Yj, > Xt) = 1“^ G2 (у) h (у) dy. Теорема 3.5.1. Математическое ожидание и дисперсия; IF равны EW =тпрл Var W = тп (р,—/>!) + тл (п — 1) (р2—р?) + тл (m —1) (д, —р?). Доказательство. Заметим, что EW — тпЕТ^ — тп Р (Y > X) и Р (Y > X) (у) dydx = [1 — Н (х)] g (х) dx. Теперь EW2=£ [2 2 Fi/Г = £ [2 2 2 2 7” 7*,' = Lг / J I * / * < -£(22^ + 222^ Ти + I i i Ф1 +222 ^-+2222 Тч т\ А = j i^k i^k J = mnET\ \ -\-mn (n — \)ETn Tl2-\- mn(m — I) ET12T22-{- + mn(m—1) (n — 1 )ETuT22. Например, ЕТъТ^РфгЖи У2>Хх) = JT jT ^ ^ h л ^*) dy! dy*dx = = <*, t1 W)2 £ (*) = =pt- Остальные математические ожидания вычисляются аналогично. Упростив преобразования и применив формулу Var W = EW2 — — [fttP]2, получим то, что требовалось. Теперь пусть т, п с» так, чтобы m/JV Я, 0 < А, < 1; в упражнении 3.7.15 надо показать, что при 0 < рг < 1, [W — Е W]/ /(var UP)1/2 асимптотически распределено, как п (0, 1). Более точно, если W = W/mti, то из упражнения мы имеем следующее: NV2 (U7 — — рх) асимптотически распределено, как п (0, (р2 —Р?)/^ + (р3 — — р?)/(1 —Я)). Определение 3.5.1. Будем говорить, что Н (х) стохастически больше G (х), если G (х) > Н (х) для всех х, причем хотя бы для одного х неравенство строгое*. (См. упражнение 3.7.19, где дан критерий сто¬ хастического упорядочения.) ** * Лучше: случайная величина £ с функцией распределения Н (х) стохасти¬ чески больше случайной величины т] с функцией распределения G (х). См. [114].— Примеч. пер. **0 критериях такого рода см. [68, гл. III] — Примеч. пер. 166
Пример 3.5.1. Рассмотрим вопрос о состоятельности критерия Манна — Уитни — Уилкоксона. Определим р (G, Н) = EW = J [1 — — Н (х)] g (х) dx. Пусть QSo — подкласс стохастически упорядоченных распределений. При этом \i (G, Н) = —, если G (х) = Н (х), j (3.5.2) > — , если G, Н £ Qso, где неравенство имеет место потому, что G, Н — непрерывные функ¬ ции распределения, причем G (х) (х) для некоторого х и потому для некоторого интервала, содержащего х. Таким образом, с помощью W можно получить нулевую гипотезу G (х) = Н (х) для всех х и функ¬ ции распределения из класса стохастически упорядоченных наблюде¬ ний. Легко проверить, что var W стремится к 0, так что W по вероят¬ ности сходится к р (G, Н). Имеется требуемая асимптотическая нор¬ мальность при нулевой гипотезе, откуда согласно теореме 1.3.1 следует, что критерий, основанный на W, при стохастически упорядоченных альтернативах состоятелен.Если G (х) = F (х), Н (у) = F (у — Д), А > 0, то G, Н £ Q50- Ясно, что критерий состоятелен при альтерна¬ тивах сдвига. Следует заметить, что понятие стохастического упорядо¬ чения более общее, чем понятие сдвига распределения. Сравните эти понятия с определением стохастически положительных распределе¬ ний в одновыборочной модели из примера 2.5.1*. До сих пор мы рассматривали модель выбора из генеральной сово¬ купности при предположении, что две совокупности имеют одну и ту же форму функции распределения. Теперь рассмотрим модель, где Х19 ..., Хт — независимые, одинаково распределенные случайные вели¬ чины с функцией распределения G (х), G£ Q0 и Yl9 ..., Yn — независи¬ мые, одинаково распределенные случайные величины с функцией рас¬ пределения Н (у — А), Н £ Q0. Для проверки Н0 : А = 0 тре¬ буется критерий — непараметрический аналог тех, что используется при решении задачи Беренса — Фишера. Пусть G и Н — две нор¬ мальные функции распределения с различными дисперсиями. Б. JI. Уолш [192] дал удачную модификацию обычно применяемого двухвыборочного /-критерия. Сейчас нам надо проанализировать эту задачу при произвольных G, Н £ Q0. Мы хотим использовать предельную нормальность W при произ¬ вольных G и Н и ввести в описание состоятельную оценку дисперсии W. Из упражнения 3.7.15 мы знаем, что и в этом случае (W—EW)/ /(var Ц7)1/2 в пределе распределена, как п (0,1)**. При G = Н и А =0 * Qр = {случайная величина X с функцией распределения Я (л:)} г {Р(Х ^ ^ х) = 1 — Я (х) ^ Я (—х) = Р (X С — х) для х >0} — класс стохастиче¬ ски положительных распределений. — Примеч. пер. ** Так же, как и в классическом случае теоремы 3.2.4. — Примеч. пер. 167
EW и var W заданы (3.2.3) и не зависят от общей функции распределен ния G = Н. Мы вычисляем состоятельную оценку Var W. Из (3.5.1) с помощью несложных преобразований получаем По этим формулам можно построить естественные оценки, заменяя функции распределения G и Н эмпирическими функциями распределе¬ ния Gm и Нп соответственно. Эти оценки довольно просто выражаются с помощью расстановок (placement)*, которые определяются ниже. Обсуждение использования расстановок для построения статистик критериев см. в [139]. Определение 3.5.2. Заданы Х19 ..., Хт и Yl9 ..., Yn\ расстановкой Xt относительно Yl9 ..., Yn называется число р* (х) --= # Yj < Xiy j = 1, ..., п. Аналогично этому расстановкой Yk называется pfe (у)= = <Yh, i= 1, ..., т. Теперь ** рх-р\={ {j G (0 dH (0| X {j Я (t) dG (0}, (3.5.3) ра-р\ = j G2 (t) dH (0-{ j G (t) dH (0}2 • Est j \H(t) dG (0}=$Яп (0 dGm(t) 1 m — y Hn(Xt) m (3.5.4) и Est (px-p\) p W p (*/)• (3.5.5) tun Далее, Est {5 H2 (0 dG (0) = j H% (t) dGm (t) = (3.5.6) * Здесь мы избегаем перевода «размещение». — Примеч. пер ** Est {• } означает оценку от {•}. — Примеч. пер. 168
Est(/v- pi 1 mn2 1 mn* 1 i= 1 m -pW mn* 1 2 p? (4—■щ>* (4j = ч 2 (P*(4—p(4)2= mn* i= 1 S2(x), (3.5.7) где S2 (x) = 2 (Pi (*) — P (*))2 — центрированная сумма квадратов i= l расстановок. Если мы в теореме 3.5.1 для упрощения вычислений заменим т —1, п — 1 на m и /г, то состоятельная оценка var W будет выглядеть так: var W = p(*)p(*/) + S2(.x;) + S2(*/). (3.5.8) Заметим, что расстановки — функции рангов, так что статистика W — mn/2 (3.5.9) W- V var W — ранговая статистика. При Д = 0 и G = Н статистика W сво¬ бодна от распределения, и ее перестановочное распределение для вы¬ борок некоторых объемов табулировано М. А. Флайнером и Г. Е. По- лицелло [53]. Однако, для того чтобы W была хотя бы асимптотически свободна от распределения при А = 0 и G Ф Н, надо сделать допу¬ щение о G, Н £ Qs*. Теорема 3.5.2 [53] дает основу для построения критерия. Теорема 3.5.2. Пусть А = О, G, Н £ Qs*. Тогда W асимптотически распределена, как п (0, 1). Доказательство. Из теоремы 3.5.1 следует, что при G, EW = mn\G{y)h(y)dy = = mn § [ 1 — G(—y)]h(y)dy = = mn§[l — G(—y))h{—y) dy— = mn {1 — §G(«/) h (y) dy }. !s — множество симметричных * Напомним, что см. (2.1.1). — Примеч. пер. распределении, 169
Сравнение первой и последней строк показывает, что J G (у) h (у) dy= = 1/2, и потому EW = тп12 при G, Н £ £2S. Теперь наша теорема следует из теоремы Слуцкого (АЗ приложения), так что мы получаем (IF— £lF)/(var IF)1/2 в пределе распределенную, как п (0,1) из уп¬ ражнения 3.7.15, и var IF —состоятельная оценка. Посредством критерия, основанного на IF, мы можем отклонить ги¬ потезу Н0 : А =0 в пользу Н А : А >0 при W > Za, где 1 — - <D(Za) = a. В табл. 3.2, которая взята из [53], представлены величины эмпири¬ ческого уровня значимости, полученные в результате 10 ООО испыта¬ ний по методу Монте-Карло для IF, W, t и tw (критерия Уолша). Нормальное и загрязненное распределения (пример 2.6.4) модели¬ ровались при Н (t) = G (a-1 t); а изменялось от 0,1 до 10*. Крите¬ рий, основанный на JF, наиболее стабилен, превосходя tw для загряз¬ ненного нормального распределения. В [53] приведены модели для дру¬ гих исходных распределений, которые изучаются при рассмотрений мощности критериев. Критерий, основанный на 1F, оказался лучше, чем другие, поскольку его легче воспроизвести и к тому же он обеспе¬ чивает достижение высокой мощности. В упражнении 3.7.16 предлага¬ ется исследовать поведение уровня значимости обычного критерия Ман¬ на — Уитни — Уилкоксона W при G Ф Я. О модификации критерия Муда в случае, когда G, Н не принадлежат Qs, см. [74] и [54]. Т а б л и ц а 3.2 Эмпирические уровни, умноженные на 1000, при номинальном уровне значимости а==0,05, т=11, п= 10; а — параметр масштаба распределения Распределение о W Г t V Нормальное 0,1 81 48 48 48 0,25 69 54 50 52 1 50 48 48 47 4 71 54 60 47 10 82 62 69 52 Загрязненное 0,1 76 51 33 34 нормальное 0,25 65 52 33 33 1 48 46 35 33 4 68 52 43 32 10 83 63 50 35 Замечание. tw — критерий Уолша t. Используется загрязненное нормальное распреде¬ ление из примера 2.6.4 с е=0,1. Каждый уровень вычислялся по 10000 испытаний. Воспроиз¬ ведено с разрешения American Statistical Association. * Эмпирический уровень — число случаев из всего числа испытаний, когда имела место ошибка I рода. — Примеч. пер. 170
Мы не будем обсуждать условия регулярности, на которых бази¬ руется теория эффективности W. Эти условия (такие, как равномерная сходимость) описываются способом, аналогичным тому, что применялся в случае одновыборочной модели (см. обсуждение, следующее за условиями регулярности Питмена в разделе 2.6). Приведем вычисле¬ ния эффективности. Напомним, что нам нужны асимптотическая дис¬ персия при нулевой гипотезе и асимптотическое математическое ожида¬ ние при альтернативе. Величина N1/2 (W — рг) асимптотически рас¬ пределена, как п (0, а2), где О2 = (Р2—р\)1Ь+ (Рз—р\)1(\ — *■)• При Н0а2 (0) = 1/12Ц1 — А). Далее, Ц(Л)=Р1 =|"оо[1 — F(x—&))f(x)dx И и' (0) = ]Za,f4*)dx. Значит, эффективность W равна С = Ц' (0)/а (0) = у 12^(1 — X) J /2 (*) dx. (3.5.10) Заметим, что с равна просто величине [X (1 — А,)]1/2, умноженной на эффективность (не относительную) соответствующего одновыборочного критерия. В табл. 2.4 для конечной выборки даны величины относи¬ тельной эффективности для критерия знаковых рангов Уилкоксона от¬ носительно критерия /. Подобный подход рассмотрен Г. Уиттингом [195] при вычислении эффективности двухвыборочного критерия Ман¬ на — Уитни — Уилкоксона относительно /-критерия. Уиттинг аппроксимировал относительную эффективность для вы¬ борок малых объемов, используя численное приближение функции мощности для малых выборок. В рассматриваемых случаях относитель¬ ная эффективность даже для столь малых выборок, как т = п =10, не падает ниже 0,94 при исходной нормальной модели. Таким образом, как и предполагал Дж. Клотц [104], дело в том, что ранговый крите¬ рий имеет весьма высокую эффективность относительно /-критерия при нормальной модели и для малых выборок. Заметим даже, что с макси¬ мально при X = 1/2, т. е. лучше брать выборки равных объемов. Из теоремы 2.5.5 можно также заключить, что если Д= med (Yt — Xj), т. е. равна оценке Ходжеса — Лемана Д, то Л/1/2 (Д — Д) асимпто¬ тически распределена, как п (0, l/с2) при величине с из (3.5.10). Для изучения свойств статистики Манна — Уитни — Уилкоксона обычно удобнее использовать считающую форму W. Например, проек¬ ционную теорему 2.5.2 мы применяем к W, а не к сумме рангов /У*. * У автора обозначения не очень удачны. Обычно обозначают так: W — сумма рангов (от Wilcoxon), a U — считающая форма.— Примеч. пер. 171
Однако свойства U в точности те же, что и W, поскольку они связаны линейной зависимостью *. Обсуждая статистики с метками общего ви¬ да, мы прибегнем к ранговому представлению из определения 3.4.2: ^-т^^тйт)- <3'5'И) Из обсуждения, предшествующего (3.4.1), мы получаем N var V (1 — Я) Jo (ф (и) — ф)2 du. Асимптотическое математическое ожидание V при альтернативе получается так же, как (2.9.2) в одновыборочном случае. Ранг Yt равен Rt — числу таких наблюде¬ ний в объединенной выборке, которые меньше или равны Yit и потому Ri = tnGm (Yt) + пНп (Yt), где Gm (•), Нп (•) — эмпирические функ¬ ции распределения выборок Х-ов и F-ов соответственно **. Статисти¬ ку V можно записать в виде V=— ) = N ^V N + 1 ) -f Л * (^ + »тг "■»)dH* Так как Gm (х) и Нп (у) сходятся по вероятности к С(х) и Н (у) соот¬ ветственно, мы надеемся, что при выполнении некоторых условий регу¬ лярности будет верно V Д (1 - X) ф (XG (у) + (1 —X) Н (у)) dH (у). (3.5.12) Для модели с параметром положения при G (х) = F (я), Н (у) = — F (у — А) мы имеем*** р (А) = (1 -X) Ф (AJ7 (у) + (1 — X) F (у-A)) f (у-A) dy. Заменим переменную t = у — А и, дифференцируя по А, получим р' (0) = Д^р (А) |д=0 = X (1 -X) ф' (F (0) г (0 dt. * Линейная зависимость — частный случай эквивалентности статистик (см. раздел 2.1 книги: Барра Ж.-Р. Основные понятия математической статис¬ тики: Пер. с фр./ Под ред. А. Н. Ширяева.— М.: Мир. — 1974.— 275 с.). — При- меч. пер. ** Читателю следует обратить особое внимание на это отношение. — Примеч. пер. *** (Lt (А) — математическое ожидание статистики (см. определение 2.6.3, а также предшествующий ему и следующий за ним текст). — Примеч. пер. 172
Отсюда эффективность по Питмену равна с= угтг=яр.,,-(М0)/-(0* (3513> V$l(4>(u) — q>fdu . Условия регулярности, необходимые для строгого вывода этого ре¬ зультата, подобны условиям для одновыборочного случая, которые об¬ суждаются после формулы (2.9.3). В (3.5.2) можно сделать такую же замену переменной и так же проинтегрировать по частям выражения, как и для вычисления (2.9.4) по (2.9.3). В результате мы получим с ^ Ух (1 — X) fo ф (и) ф/ (и) da (3.5.14) Vil (ф (U) — ф)2 du при Ф/ (и) = — f (F-1 (и)) Поскольку |оф/ (и) du = 0 и Jo ф2 (и) du = I (/), т. е. равна информации Фишера из определения 2.9.1, можно сразу же обобщить теорему 2.9.1 на двухвыборочный случай с заменой [/ (/)]1/2 на [X (1 — X) I (/)]1/2. Отсюда следует, что Vf — двухвыборочная статистика, порожденная фу (ц), т. е. статистика, дающая асимптотически наиболее мощный ран¬ говый критерий при исходном распределении F£Q0. Заметим также, что Vf — приближение к статистике локально наиболее мощного ран¬ гового критерия. (См. (3.3.3) и (3.3.5)*.) В примере 3.5.2 мы покажем, что величина эффективности критерия Уилкоксона в одновыборочном и двухвыборочном случаях из (3.5.10) справедлива и для статистик с метками общего вида. В примере 3.4.3 мы построили двухвыборочную функцию, порождающую метку, на ос¬ нове одновыборочной функции, порождающей метку. Теперь мы по¬ пробуем обратить этот процесс и обсудим построение одновыборочной функции, порождающей метку, на базе заданной двухвыборочной * Речь идет о метках = —E{f' (V(i))/f (Т(*))}, порождающих локально п наиболее мощный ранговый критерий со статистикой У = 2 а №)> так называе- /= 1 мых приближенных метках а*(/) = — {Г('р-1[г7(т +л + l)]//(p~1U7(w +л+ 1)])}, основанных на приближении порядковых статистик V(i) величинами F-1 (£/(*))> i = 1, ..., т + п. Здесь случайная величина U( *) — порядковая статистика из равномерного распределения на интервале (0, 1), / = 1, m + я. Помимо этого приближения переход от а (i) к a* (i) требует введения операции математического ожидания Е {•} под знак функций и использования свойства ЕЦц) = // (т + я+ + 1). Р. Г. Рэндле и Д.А. Вулф [152 раздел 8.4, с. 287—288] называют послед¬ ние метки «expected value scores». В теореме 8.4.19 из [152] устанавливается асимптотическая эквивалентность а (i) и а* (i). См. также теорему V.1.4A и лемму V. 1.6. А из [68]. — Примеч. пер. 173
функции, порождающей метку. Успешная реализация этого плана есть следствие общности свойств эффективности одновыборочных и двухвыборочных критериев, порожденных одной и той же функцией меток. Пример 3.5.2. Предположим, что F£QS, и определим для заданной функции ср, порождающей метку и удовлетворяющей ус¬ ловию ф (и) = — ф (1 — и). Таким образом, ф — нечетная функция, центрированная в точке и = 1/2. Отсюда следует, что ф = 0, и Эффективность одновыборочного критерия, порожденного ф+(-)> вы¬ числяем из (2.9.2) рочном случае равна эффективности в одновыборочном случае, увели¬ ченной в [к (1 — к)]1/2 раз*. Поскольку относительная эффективность есть отношение квадратов (неотносительных) эффективностей и множи¬ тель к (1 — к) сокращается, ясно, что свойства эффективности одновы¬ борочного и двухвыборочного критериев одинаковы. Критерий Манна — Уитни — Уилкоксона соответствует знаково¬ му ранговому критерию Уилкоксона, а медианный критерий Муда со¬ ответствует критерию знаков; другие случаи даны в примере 3.4.3. * См. (3.5.13). — Примеч. пер. 174 ф+(м) = ф(^у^-) I, 0<«< 1, J * [ф+ («) ]2 du=2 j \ / 2 ф2 (и) du = j ‘ ф2 (и) du. Далее, используя получаем 2 J“q>+'(2F(jc)-l)/*(x)<ix) = 2 (F(x))Fi(x)dx-- = -j- ф' (F (*)) /* (х) dx. С = причем ф = 0; сокращая мы видим, что эффективность в двухвыбо
Вычисление относительной эффективности для одновыборочных крите¬ риев из раздела 2.5 можно теперь интерпретировать и для двухвыбо¬ рочного случая. Мы завершим этот раздел, показав, как с помощью результатов из примера 3.5.2 можно выявить форму локально наиболее мощного ран¬ гового критерия для одновыборочной модели положения. Начнем с меток для локально наиболее мощного рангового критерия (3.3.3): а (0 .= — Е = — Е • f [F 1 /(‘Wl I /[f-1(t/(/))l J где t/(1) < ... < U(N) — порядковые статистики из равномерного на интервале (0, 1) распределения. Из примера3.5.2следует, что одно¬ выборочные метки должны иметь вид д+(0=— е\ f [f 1^t/<<)+ ), (3.5.15) I flF-4{um+im I Предположим, что F£ Qs, и определим F+ (x) = P(|X|<x) = (0, + w Vl 1 ' \2F(x) — 1, x>0. Тогда /+ (x) = 2f (x), если x >0, и 0 —в противном случае. Пусть у = F+ (х), тогда х = F+1 (у) и х = F-1 [(у + 1)/2]. Отсюда F+1 (у) = F-1 [(у + 1)/2], и (3.5.15) превращается в a+(i) = — Е = (3.5.16) I MW где V(\) < ... < — порядковые статистики из распределения F+ (*)• На самом деле, одновыборочный критерий, основанный на статисти¬ ке К+ = (RU)) s (Xt), где R? — ранг |Х*| среди \Хг\, ..., 1-ЛГлг |, — локально наиболее мощный ранговый критерий (см. [68, гл. II] или [152, гл. 10]). Для построения можно использовать либо (3.5.15), либо (3.5.16). Асимптотически наиболее мощный ранго¬ вый критерий, который мы обсуждали после теоремы 2.9.1, есть крите¬ рий, приближенный к локально наиболее мощному ранговому крите¬ рию. В обеих моделях с параметром положения— одновыборочной и двух¬ выборочной — асимптотически наиболее мощный ранговый критерий и локально наиболее мощный ранговый критерий имеют одинаковые свойства эффективности. Эти критерии эквивалентны «с точки зрения» 175
эффективности по Питмену, однако, как уже отмечалось, асимптоти¬ чески наиболее мощный ранговый критерий более практичен. Прямое развитие понятия локально наиболее мощного рангового критерия, вве¬ денного для одновыборочной модели, подобное описанному в разделе 3.3, может быть основано на результатах из упражнения 3.7.18. 3.6. СРАВНЕНИЕ ПЛАНОВ Завершим эту главу сравнением двух способов рандомизации для проверки эффекта обработки (Т) против эффекта контроля (С). Для про¬ верки значимости эффектов определенного типа, например, способно¬ сти пользоваться одной рукой чаще, чем другой, можно построить и од¬ но- и двухвыборочный критерий. Рассматриваемые планы сравниваются с точки зрения обеих процедур, следовательно, можно воспользоваться материалом из глав 1 и 2. В полностью рандомизированном плане (completely randomized design) мы имеем N пар предметов. Для каждой пары случайно назна¬ чаются обработка и контроль, например бросанием монеты. В этом слу¬ чае обычно одновыборочный критерий применяется к разности Т — С, т. е. к величине превышения Т на рис. 3.2. Предположим, что каждая пара состоит из элементов (предметов) типов А и В, например левой и правой руки, и имеет место влияние ти¬ па на данные. В рандомизированном плане с ограничением (restricted- ly randomized design) мы случайно выбираем а пар из А и воздейству¬ ем обработкой на предметы типа А. По оставшимся b = N — а парам производится обработка для типа В. Затем к двум множествам величин превышения для элементов А применяется двухвыборочный критерий. Оба плана изображены на рис. 3.2. Рассмотрим модель для рандомизированного плана с ограничением. Пусть т — эффект типа предмета, a Хх, ..., Xn — величина превы¬ шения для типа А. Тогда до обработки у нас есть случайная выборка объема А из F (х —т), F £QS. Пусть б — эффект обработки. Пред¬ положим, Х1у ..., Ха —выборка из F (х—т —б) и Хп+1, ..., Xn, которую мы обозначим Х{, ..., Х'ь, — выборка из F (х — т + б). Таким образом, 26 — разность величин параметра положения, полу¬ чающаяся из-за эффекта обработки, причем мы хотим проверить #0:6 = = 0 против НА : б >0. Допустим, N оо, a/N а, 0 < а < 1, b/N —Р, 0 < Р < 1. Эффективность критерия Манна — Уитни — Уилкоксона есть cMw = (°Ф)1/2 2 (12)1/2 J /2 (x)dx. Дополнитель¬ ный множитель 2 появился за счет разности величины параметров поло¬ жения 26. Эффективность двухвыборочного /-критерия равна сп = = (оф)1/2 2/aF, где <т£-дисперсия от F £ Qs. Эффективность мак¬ симальна при а — р = -i- , поэтому мы будем рассматривать лишь случай, когда N делится на равные доли и а = Ъ. 176
Полностью рандомизи¬ рованный план (CRD) Типы элементов Превышение за счет обработки Пары А в 1 т С Т—С 2 с т N с т т—с Рандомизированный план с ограничением (RRD) Типы элементов Превышение А Пары А в 1 Т С Т—С 2 Т с а Т с т—с 1 С т с—т b с т с—т Рис. 3.2. Два типа рандомизированных планов В плане CRD с вероятностью 1/2 мы получаем элемент типа А. Пусть Zly ..., Zn — превышение обработки. Тогда с вероятностью 1/2 Z* — превышение А и с вероятностью 1/2 — превышение В. Пусть Zt — превышение А, тогда Р (Zt < z) = F (z — т — б), если же Z% — превышение В, то Р (Zt < z) = F (г + т — б), где F£ Qs. Это сле¬ дует прямо из предшествующего обсуждения RRD. Теперь, если G (•) — функция распределения для превышения Т (обрабатываемого эле¬ мента), то G(2) = P(Z,<z)=-^F(z-T-6) + -i-F(z + T-e) с плотностью распределения g{z)=-jf{z—т — 6) + -i-/(z + T — 6). Среднее и дисперсия для G (•) равны б и + т2 соответственно. От¬ сюда эффективность одновыборочного /-критерия равна си = 1/(а| + 177
+ т2)1/2. Для того чтобы найти эффективность знакового рангового критерия Уилкоксона, мы вычислим (°° g2(z)dz= f“ -Lf*(z)dz+[°° f(z)-f(z + 2t)dz; J —OO J —OO £ J —oo Z тогда cw -= 121 /2 j g2(z)dz. Сравним план CRD с планом RRD по относительной эффективно¬ сти Питмена. Для /-критериев (относительная эффективность одно¬ выборочного критерия /, при плане CRD, относительно двухвыбороч¬ ного критерия /, при плане RRD) мы имеем Если применить ранговые процедуры к данным, мы получим отно¬ сительную эффективность критерия знаковых рангов Уилкоксона (для плана CRD) по отношению к критерию Манна — Уитни — Уил¬ коксона (для плана RRD) *, которая равна Из неравенства Коши — Шварца {j / (z) / (z + 2т) dz}2 < J f2 (z)dzx X J f2 (z + 2i)dz = {j /2 (z) dz}2. Отсюда < e (W, MW) < 1 для всех т. И в том, и в другом случае планы RRD лучше планов CRD. Если тип данных не влияет на результаты, т. е. т = 0, относительная эф¬ фективность равна 1, и потому использование RRD ничего не меня- В упражнении 3.7.17 предлагается вычислить фактический выиг¬ рыш в эффективности при нормальном распределении совокупности. 3.7. УПРАЖНЕНИЯ 3.7.1. Пусть Rlt ..., Rn — ранги Ylt Yn в объединенной выборке объема N = т + п. Покажите, что при Н0: А = О ER( = (N + 1)/2, var Rt = (N2 — — 1 )/l2, cov (Ri, Rj) = — (N + 1)/12 при i ф /.После этого покажите, что если U = 2 Rit то EIJ = п (N + 1)/2 и var U = тп (N + 1)/12. * Т.е. одновыборочного рангового критерия с двухвыборочным ранговым критерием, метки которых оптимальны для одного и того же логистического рас¬ пределения.— Примеч. пер. ** Этот пример нуждается в более подробной интерпретации. Так, можно сказать, что для случая попарного сравнения обработки с контролем (это одна из самых известных задач проверки гипотез) есть не один тип элемента, а два (А и В); тогда рандомизацию следует производить не N раз в каждой паре изучаемых элементов (предметов), как это принято, а случайно (как бы «один раз») разде¬ лить элементы на две подвыборки (лучше — равных). Затем в первой следует из¬ мерять разность (обработка — контроль), а во второй разность (контроль — об¬ работка), как на рис. 3.2. Интересно, распространяется ли этот вывод на двух¬ факторный план из гл. 4? — Примеч. пер. е{\/, 21) ^ 1 для всех х. о} +т* (3.6.1) (3.6.2) 178
3.7.2. Пусть Xlt ..., Хп независимые, одинаково распределенные случайные величины с F — произвольной непрерывной функцией распределения, математи¬ ческим ожиданием ]ы и дисперсией о2. Предположим Rlt ..., Rn — ранги Хь..., Хп. Зная, что условное распределение при заданном R1 = / совпадает с распреде¬ лением /-й порядковой статистики, покажите, что 1 EXlR1=—y jE (X, I Ri = j) = " /-I = (</) to) f to) dy■ Исходя из этого, выясните, что коэффициент корреляции между Хг и Rx равен ц + (п — 1) yf (у) F (у) dy—ц (п+1)/2 Рп= а (п2— 1) /12 Найдите рп и lim рп при f — я (0, 1)-нормальной плотности распределе- tl—юо НИЯ. 3.7.3. Напомним, что Т — статистика знаковых рангов, обсуждаемая в раз¬ деле 2.2. Получите следующее рекуррентное выражение для распределения Т при Я0: Рп (k) P(T=k)= пу - 2 при k =0, 1, ..., я (я + 1)/2, где Рп W=Pn_ 1 (Л) + Яя-1 Р0 (0) = 1, Р0 (k) = 0,7>n (k)=0 при Л <0. Указание. Рассмотрите Рп (k) как число таких подмножеств {/i, ..., rj} из {1, ..., я}, для которых = k. 3.7.4. Пусть Х(г ) < ... < Х(П) и F(!) < ... < К(п) — порядковые стати¬ стики из двух выборок размера п. Статистика Гальтона, которую можно приме¬ нять для сравнения двух спортивных команд с ранжированными членами, опре¬ деляется так: V = ф (Уа) > i = 1, •••> л. Предположим, PmU (k) — число последовательностей из таких т наблюдений х и п наблюдений у, что V =k\ получите рекуррентную формулу для Ртп (Щ- Вычисляя распределение V для различных я, попробуйте определить форму распределения V. 3.7.5. Пусть V= a (Rt) из определения 3.4.1. Докажите, что распреде¬ ление V при Я0 симметрично относительно па при условии, что а (i) + a (N — — i + 1) = К для всех i = 1, 2, ..., Я и К — постоянная. 3.7.6. В примере 1.1.1 делалось предположение об ориентировании по солн¬ цу возвращающихся домой голубей. В примере 1.5.1 и упражнении 1.8.11 при¬ водились данные о птицах, выпущенных на волю в пасмурные и солнечные дни, причем предполагалось, что частота возвращений голубей в солнечные дни боль¬ ше. Эту гипотезу можно проверить с помощью критерия Манна—Уитни—Уил¬ коксона. Обратимся к случайному набору данных: Солнечные дни | 17 32 42 42 55 72 97 Пасмурные дни | 10 38 105 126 141 Измерялась угловая ошибка относительно направления к дому при исчезновении птиц за горизонтом. Пусть А — разность медиан совокупностей солнечных и об¬ лачных дней. Проверьте Я0: А = 0 против НА : А < 0 на приближенном уров- 179
не 0,05; постройте точечную оценку А и приближенный 95-процентный довери¬ тельный интервал. Проанализируйте эту же ситуацию с помощью процедур Муда из примеров 3.4.2 и 3.4.4. 3.7.7. Пусть Хг, ..., Хп — независимые, одинаково распределенные случай¬ ные величины с функцией распределения F (*), F £ Qs. Покажите, что Yx = = F (Л^), ..., Yn = F (Хп) независимые, одинаково распределенные случай¬ ные величины U (0, 1)*. Покажите, что плотность распределения случайной величины У(*), т. е* i-й порядковой статистики, равна е(ч)= Г о'-1 (1 _u)m + n-‘ Г (0 Г (т+п —1+1) при 0 < у < 1. Покажите затем, что EY(o = i/(n + 1). 3.7.8. Постройте двухвыборочные функции меток, которые соответствуют винзоризованной статистике знаковых рангов Уилкоксона и модифицированной знаковой статистике из примеров 2.8.2 и 2.8.3. Найдите асимптотические моменты из (3.4.1) и (3.4.2)* используемые в предельном распределении. 3.7.9. Пусть V = a (Ri) — статистика с общими метками из определе¬ ния 3.4.1. Положим, V (А) = 2" a (Rt (А)) из (3.4.4). Докажите, что V (А) убы¬ вает на величину ai4v'-i ПРИ пересечении величиной А разности Y(j) — — X (i). Ясно, что свойства статистик с общими метками определяются их пове¬ дением на тп попарных разностях. Проверьте (3.4.4) и (3.4.5). 3.7.10. Обсудите построение оценок А, соответствующих статистике из уп¬ ражнения 3.7.8, прибегнув к (3.4.6). 3.7.11. Пусть Х1у ..., Хт и Уъ ..., Yn — случайные выборки из F (х) и F (у — A), F£ Q0. Рассмотрим критерий, предложенный Г. К. Матисеном [122] и конкурирующий с критерием Муда, проверки Н0 : А = 0 против НА : А > 0. Предположим для простоты т = 2q— 1, определим М — # (Yt > X(q))„ i = 1, ..., п. Таким образом, М — число величин Y-ов, которые превосходят медиану выборки Х-ов. Покажите, что (ч— l + t\ln — t + q— 1 \ Р (М=*>= q~] rm+nl""1 [Г] при / = 0, 1, ..., п. Кроме того, докажите, что ЕМ = л/2, Var М = л (т + я + 1)/[4 (т + 2)]. В обозначениях знаковой статистики М = S (X(q)) = 2s (Yt —-X(g)). В случае tf0 из упражнения 2.10.18 можно записать ' [*<*,)-f]- Vn = -7=- \s (0) —~] + V7f (0) X(q)+op (1). Vn 1 Z J m, < ! M — y]~^z ~ n (0, 1/[4Я]). Покажите, что при т,я, стремящихся к бесконечности таким образом, что т/(т + п) X, 0 < к < 1, 1 V * Т. е. равномерно распределенные на интервале (0, 1). — Примеч. пер. 180
3.7.12. Продолжение упражнения 3.7.11. Мы отклоняем Н0: А = 0 в поль¬ зу НА :Д > 0 на приближенном уровне а в том случае, если М > с, где с = = л/2 + Za (л/[4Я])1/а. Покажите, что М > с, если и только если K(n_c+1) > > *(g)- Следовательно, можно «остановить» процедуру критерия Матисена, как толь¬ ко мы наблюдаем V (n—c+i) или X(q). Покажите, что процедуру одностороннего критерия Муда из примера 3.4.4 можно прервать, как только мы наблюдаем X(r-n+d) или ^ (n-d+i)*> гДе Р (V+ ^ d) = а и d = -у Za (пХ/4)1/2. Покажите, что при больших л критерий Матисена будет «останавливаться» раньше критерия Муда. Таким образом, критерий Матисена более экономичен в этом смысле. 3.7.13. Используйте 5-процентный критерий Муда и постройте 95-процент- ный доверительный интервал и точечную оценку А по данным примера 3.2.2. 3.7.14. Напомним, что V*+ = # (Yt больше медианы объединенной выбор¬ ки) — это статистика Муда из примера 3.4.4. Пусть л < т и Р (V% ^ k) = = a/2, где k = л/2 — Za/2{tfm/[4(/V—I)]}1/2 и /V = лг + л из примера 3.4.2. Согласно.(3.4.8) двусторонний знаковый доверительный интервал, порождаемый критерием Муда, есть [*(Лк+1)’ X(m~dx)] И (dy+x)' Y(n-dy)\' где dx = г — л + k + 1, dy = k. Заметим, что dx = dy + (m — л)/2. По¬ кажите, что доверительные коэффициенты этих двух интервалов можно прибли¬ зить посредством нормального распределения T*=S=*(-.Ze/2[m/(JV-l)]I/2) У у — Ф (— Za/2 [m/(N — 1)1 )• 3.7.15. Пусть Xl9 ..., Хт — независимые, одинаково распределенные случайные величины с функцией распределения G (х) и Уъ ..., Уп — независимые, одина¬ ково распределенные случайные величины с функцией распределения Н (<у), где G и Н — произвольные непрерывные функции распределения. Пусть V~N~ ^ V *" = “^гт2 2 (Ta-pj, т п ti=i/=i где Тij = 1 при Yj > Xt и 0 — в противном случае. Пусть т, л -> оо так, что ml N -► X, 0<Я < 1, jV = m + л. Докажите, что ^'асимптотически распределено, как л (0, а2), где а2=Т ^*-^)+"7гЬг(л-р?-)- Далее покажите, что var W -+■ о2 и при 0 < < 1 (U?' — EW')/(vаг W')1!2 асимптотически распределено, как л (0,1). (Это упражнение обобщает теорему 3.4.2.) 3.7.16. Пусть Xlt ..., Хш — независимые, одинаково распределенные слу¬ чайные величины с функцией распределения G (х); УЛ, ..., Yn — независимые, оди¬ наково распределенные случайные величины с функцией распределения Н (у — — А), где G, Н £ Q0- Положим, W* = (W — тл/2)/[тл (т + п + 1)/12] х/2 — стандартизированная статистика Манна — Уитни — Уилкоксона. При А =0 * Видимо, речь идет о наблюдении наибольшей из пары величин, входящих в неравенства, приведенные в упражнении 3.7.12. — Примеч. пер. 181
и G = Н W* распределено в пределе, как п (0,1). Мы хотим исследовать влияние на уровень значимости W* параметров распределения при G Ф Н. Пусть ат = Р (W* > Za), тогда при А = 0 и G = Н, ат =^= а. Будем на¬ зывать а номинальным уровнем, а <%т — истинным уровнем. Предположим til, п оо так, что m/N X, 0 < X < 1. Покажите, что для произвольных G, Н £ Q0 1 0, если р1 1 1, если рх > —, Г Z« 1 1 1 —Ф I — ■■■ , если Pi = —, ' ' J Ръ Р-2у Рз взяты из (3.5.1). Для изучения изменения ат у нас должно быть р1 = = 2 Достаточные условия рх = -1- состоят в том, что G, Н £ Qs. Рассмотрим случаи Н (у) = G (у/о)-, G £ Qs так, что распределения отли¬ чаются одно от другого масштабным множителем о. Покажите, что Р2—Р\ = Г[1—0 (*/a)]2 dG (х)— -J- -Л '^4 ПРИСТ^0’ J 4(0 при a —► сю. Аналогично величина р3 — р\ равна 0 или 1/4 при a -► 0 или оо соответственно. Теперь покажите, что 1 — <S>{zalVz (1 —Я.) ) при ст —0, 1-ф(га/]/зГ) при а -> оо И, наконец, покажите, что для случая равных выборок иа = 0,05 величина ат изменяется от 0,05 до 0,087 при о 0 или оо. Это означает, что если распреде¬ ления симметричны и различаются лишь масштабным множителем, то истинный уровень W* не намного уклоняется от номинального. 3.7.17. Пусть F есть функция распределения п (0, сг2). Найдите е (W, М W) из (3.6.2) как функцию а2 и т. Табулируйте и постройте график е (W, MW) как функцию т/а. 3.7.18. Пусть Х1у ..., XN — независимые, одинаково распределенные слу¬ чайные величины с функцией распределения F £ Qs. Предположим, F+(x) = = Р (|Х| ^ х) — функция распределения для случайной величины |Х|. Соглас¬ но разделу 1.4 распределение F+ выражается через тройку (р, G, Н), где р= Р (X > 0), G (х) = Р (\Х\ < х\Х < 0) и Н (*) = Р (|Х| < х | Х> 0). Допустим, N+ — число положительных наблюдений X. При заданном N+ = п пусть R+— ранги положительных наблюдений среди абсолютных вели¬ чин. Покажите, что P(Rtn=r!• • • •«(%=»■». iv+ = n) = = (!)рП(1~Р)Л'-"Р№=Г1’ ••• .*<t) = rn\N+ = n), где Р (#(][) =?1> • • • » R(п) —rn I N+ = п) задается теоремой 3.3.1. 182
3.7.19. Статистика одностороннего критерия Колмогорова —Смирнова равна D+ = max* {Gm (z) — Нп (z)} см. пример 3.4.5). Ее мож1. применять для проверки стохастического упорядочения (см. определение 3.5.1). При D+ ^ с нулевая гипотеза H0 :G = Н должна быть отклонена в пользу НА : Н со строгим неравенством хотя бы в некоторых точках. А. Пусть т = п, т. е. объемы выборок равны. Используем принципы отраже¬ ния (см. книгу В. Феллера)* и покажем, что при нулевой гипотезе ( 2п ) Р (D+ > h/n) = ——, h = 1,2, ... , п. й Б. В общем случае можно показать, что D+ < t Ul_e- 2'2. (см. [68, гл. 5]). При т, п -► оо проверьте, что для получения предельной веро¬ ятности используется результат А). Указание. Примените формулу Стирлинга для факториала k\ ~ (2л)1/2 kk+l/2 e~k. 3.7.20. Результатами теоремы 3.3.1 можно воспользоваться для построения локально наиболее мощного рангового критерия в модели с параметром масшта¬ ба. Пусть Хъ ..., Хт — случайная выборка из F (х), Ylt ..., Yn — случайная выборка из G (у) = F (у/т); F £ П0. Будем предполагать, что модель позволяет менять порядок операций дифференцирования и математического ожидания. А. Покажите, что локально наиболее мощный ранговый критерий проверки Н0: т = 1 против :т > 1 можно построить, основываясь на статистике l/ = _ V Е\у * (V(Rj)) /Г, I 'О,))!' где К(!) < ... < V(m+n) — порядковые статистики из выборки с функцией рас¬ пределения F. Б. Одна из наиболее важных моделей с параметром масштаба, применяемая при изучении продолжительности жизни и надежности изделий, — это экспонен¬ циальная модель. Для нее плотность распределения f (х) равна е~х при х > 0 и 0 — в противном случае. Пусть Xlt ...., Хп — выборка из экспоненциального распределения. Совместная плотность распределения Хц) < ... < Х(п) равна 2>г х п\е 1 *, 0 ^ Xj х2 ^ ... ^ < оо и 0 — в противном случае. Пусть ^i=^(i)» ^2 = ^(2) — ^(i)» •••» Wn = ^(n)-“^(7i-i)* Найдите совместную плот¬ ность распределения Wit ..., Wn. Докажите, что Wlt ..., Wn независимы и Wt * Автор не дает сведения о работе Феллера, на которую ссылается. О прин¬ ципе отражения см. гл. III (особенно раздел 2) книги: Ф е л л е р В. Введение в теорию вероятностей и ее применения. — 2-е изд.— М.: Мир, 1964. — Примеч. пер. 183
имеет экспоненциальное распределение с плотностью распределения (п — i+ 1)Х Хе~(п~~* + D w у со средним EWf = (п — i+ I)"-1, i= 1, п. Покажите, что Ха) = + ... + Wt и ЕХ{1) = 2 (П-/+1)-1. /=1 В. Используя п. Б, покажите, что локально наиболее мощный ранговый критерий для гипотезы Н0\ т = 1 против НА: т > 1, где F (х) =1 — е~х, * > О и 0 — в противном случае, основан на статистике V= %а(Ъ), /= 1 где a (i) = ^lk== j (п — /г 1) 1. Покажите, чю EV ~ пи N var V = ■ тп N— 1 -—2 Г1 N J /=1 Для нахождения критических точек можно применять нормальную аппроксима¬ цию. Этот критерий предложил И. Р. Сэвидж [163].
Глава 4 ф ОДНОФАКТОРНЫЕ И ДВУХФАКТОРНЫЕ ПЛАНЫ И РАНГОВЫЕ КОРРЕЛЯЦИИ 4.1. ВВЕДЕНИЕ В гл. 3 анализировались методы изучения различия величин пара¬ метра положения двух совокупностей. В данной главе мы рассматри¬ ваем обобщение этих методов более чем на две совокупности. Здесь мы будем описывать методы лишь для рангов (но не для общих ранговых меток). В настоящей главе развивается асимптотическая теория распре¬ деления, необходимая для аппроксимации при нулевой гипотезе и вы¬ числения асимптотической эффективности. Мы подробно обсуждаем одно-и двухфакторные планы *. В первом случае у нас есть 6-выборок и надо проверить нулевую гипотезу о том, что все выборки извлечены из одной и той же совокупности. Во втором случае мы хотим сравнить 6-совокупностей, но данные пронумерованы по дополнительной переменной **. В этом случае у нас есть данные, классифицированные двумя способами: по совокупностям и по блокам. Одно- и двухфакторные планы — частные случаи планов для более об¬ щей линейной модели (см. гл. 5). Мы выбрали эти специальные случаи для данной главы, поскольку критерии Крускала —Уоллиса [110] для обработки данных в одновходовой таблице и Фридмена [55а] весь¬ ма просты, не требуют обращения к ЭВМ и широко распространены. Эту главу можно рассматривать как введение в проблематику следую¬ щих глав, посвященных общей линейной модели. Вместе с критериями приводятся и обсуждаются множественные сравнения. Это важный шаг в любом сравнении совокупностей по зна¬ чимости, поскольку сравнения помогают выявить источники значимости. Затем мы переходим к критерию нулевой гипотезы, который проверяем против альтернатив, состоящих в упорядочении величин параметров положения совокупностей. Эти критерии для альтернатив упорядо¬ ченности есть обобщение односторонних критериев для простой сдви¬ говой модели. В последнем разделе данной главы мы будем говорить о методах ранговой корреляции. В частности, мы объясним действие * В этом случае часто говорят о таблицах с одним и двумя входами. — Примеч. пер. ** Т. е. данные зависят еще от одного фактора. — Примеч. пер. 185
критериев Крускала — Уоллиса и Фридмена, прибегнув к ранго вым корреляциям. Это позволяет мотивировать действия двух крите риев. Кроме того, мы обсуждаем меры (согласия) экспертов (measures of concordance or agreement) внутри групп и между группами. Эти ме¬ ры построены на базе ранговых корреляций и связаны также с крите¬ рием Фридмена. 4.2. ОДНОФАКТОРНАЯ СХЕМА. КРИТЕРИЙ КРУСКАЛА—УОЛЛИСА Выборочная модель содержит k выборок Хп, ..., X/llb ..., Xlht...r XUhk из F(x —0Х), ..., F (х —0h) соответственно, где F £ £20*. Это можно переписать так: Хцу i = 1, ..., пу, j = 1,..., k с функцией распределения F (х — 07), F £ Q 0. Мы строим критерии проверки гипотезы Н0 : 0Х = ... = 0fe про¬ тив НА : эффекты 0Х, ..., 0ft не все равны. Эта нулевая гипотеза просто означает равенство параметров сдвига в случае, когда не задана вели¬ чина общего параметра положения. Можем положить, что 0Х = О (общность при этом не теряется), и определить А,- = 07+1 — 07-, / = 1, ..., k — 1. Тогда нулевая гипотеза выглядит так: Н0 : Аг = ...= — Afc-i = 0. Пример 4.2.1. При исследовании влияния состава крови на пове¬ дение Дж. Теркел и Дж. С. Розенблатт [179] наблюдали за поведением самок крысы, еще не имевших потомства, делая им инъекцию плазмы крови самок, у которых только что родились детеныши. К первым были подсажены новорожденные крысята, и затем исследователи засекали время, через которое у этих самок начинал проявляться материнский инстинкт. Обычно в такой ситуации крысы-«матер и» начинали забо¬ титься о своем потомстве в течение 48 часов после его рождения. Извест¬ но также, что у нерожавших самок материнский инстинкт по отноше¬ нию к чужим детенышам проявляется в течение 5 суток. Следователь¬ но, вопрос в том, будет ли инъекция плазмы способствовать уменьше¬ нию времени реагирования крысы на детенышей. Опыт производился с 32 самками в возрасте 60 суток, еще не имев¬ шими потомства. Они были случайным образом разбиты на четыре груп¬ пы по 8 особей. Группы состояли из: 1) крыс, которым вводили плазму крови «матерей»; 2) крыс в состоянии proestrus (до течки), которым вводилась плазма крови крыс-«матерей», находившихся в том же со¬ стоянии; 3) крыс в состоянии diestrus (течки), получивших плазму кро¬ ви от крыс-«матерей», находившихся в том же состоянии; 4) крыс, ко¬ торым ввели вместо плазмы соляной раствор (плацебо). Рассмотрим дан¬ ные из четырех совокупностей с соответствующими функциями распре¬ деления F (х — 0f), i = 1, ..., 4, F£ й0. Мы хотим проверить Я0: 01 = 02 = 03 = 04 против НА: эффекты 0Х, 02, 03, 04 не все рав¬ * См. (1.1.2).— Примеч. пер. 186
ны. Когда с помощью критерия мы отклоняем #0, то хотим выяснить, какая группа значимо отличается от остальных. Данные этого примера обрабатываются в примере 4.2.2. Данные можно представить в виде таблицы с двумя входами (two — way array), где каждый столбец — выборка. Таким образом, есть k столбцов и /-й столбец содержит rij наблюдений из F (х — 0;), F£ £20. Основной подход — ранжировать множество объединенных данных как выборку размера N = и сравнить суммы или средние по столбцам. Пусть Rtj — ранг Xtj в объединенных данных и пусть i Ru и R.j-R.j/nj. (4.2.1) 1 При k = 2 Rл — сумма рангов в первой выборке из двухвыбороч¬ ной задачи. Поскольку R ± + R 2 = N (N + 1 )/2, дополнительной информации вторая сумма рангов R 2 не несет и может быть отброше¬ на. То же самое верно в общем случаев выборок, поскольку 2/=i Rj= = N (N + 1)/2. Однако мы будем сохранять полное множество /?л, ..., R k и в последующем учитывать алгебраическую зависимость этих величин в уравнениях для статистик критериев. Это значит, что мы не будем решать, какую сумму отбросить. Для случая выполнения нулевой гипотезы свойства Rtj описаны теоремой 3.2.1. Таким образом, упражнение 3.7.1 дает нам математи¬ ческое ожидание, дисперсии и ковариации рангов и для случаев k вы¬ борок. Соответствующие результаты приводятся в теореме 4.2.1. Теорема 4.2.1. Пусть существует k выборок с одним и тем же рас¬ пределением, так что выполняется нулевая гипотеза, причем Rj и R j определены в (4.2.1). Тогда ER.]=rij(N+ 1)/2, ERj = (N+ 1)/2, var R j = rij(N—rij) (N + 1)/12, var RaJ= (N—rij) (N + 1)/{\2п^ COv (R.i, /?.;•) = — ninj(N+ 1)/12, COv{R'i, R })=—(N+ 1)/12. Доказательство. Будем рассматривать Xl7-,..., X,w- как одну вы¬ борку, а все остальные данные — как другую выборку. Из упражне¬ ния 3.7.1 мы сразу получаем ERj = rij (N + 1)/2, var Rj = rijX X (N — rij) (N + 1)/12, где rij и N —rij — два размера выборки. Ве¬ личина cov (Rj, Rj) вычисляется следующим образом. Пусть R.(ij)— сумма рангов выборки, полученной объединением i-и и /-й выбо¬ рок. Тогда var R.aj) = (я* + rij) (N — nt — rij) (N + 1)/12. Одна¬ ко R. as) = R.i + Rj> var R. an = var (R.i + Rj) = var Rj + + var Rj + 2 cov (RA, Rj). Отсюда cov (R.i, Rj) = ~y (var Rjij) — var Rj—var Rj)\ 187
в правую часть подставим предшествующие выражения для диспер¬ сии и, упрощая полученное выражение, находим cov (/?.*, Rj) = = — tiitij (N + 1)/12. Формулы для R.i сразу получаются из формул для R i согласно свойствам математического ожидания. Заметим, что Rj — (N + 1)/2 — отклонение от математического ожидания при нулевой гипотезе. При больших накопленных разностях мы стремимся отклонить Я0: 0Х = ... = 0Л. Это дает возможность выбрать следующую статистику: н = У cfN + (4.2.2) I V var Rj J Весовые коэффициенты с1Лг, ..., chN выбраны так, чтобы Я-статистика была асимптотически распределена как %£-i (хи-квадрат с k — 1 сте¬ пенями свободы). Обозначение cfN удобнее, чем cjN. На первый взгляд естественно выбрать cjNy равным 1. Тогда Я будет суммой квад¬ ратов стандартизированных средних рангов. Однако, как было замече¬ но ранее, Rly •••> R.u коррелированы и требуется некоторое уточнение, что достигается подходящим выбором сгмУ ...yckN. Исходя из тех же соображений, что и в примере 3.2.1, поскольку появление Я!/^!...^!) последовательностей из объединенной выборки равновероятно при нулевой гипотезе, мы можем табулировать рас¬ пределение статистики Я при любом фиксированном выборе clNy chN. Однако для любого k и любой конфигурации размеров выборки здесь требуется своя таблица. Таким образом, этот способ построения распределения не очень удобен, и мы обратимся к асимптотическому распределению как к альтернативе этого способа *. На теореме 4.2.2 основана теория асимптотического распределения, необходимая для построения однофакторной схемы. Теорема 4.2.2. Предположим, k выборок извлечены из генеральной совокупности с одинаковым распределением. Пусть пу->- оо, /= 1, ..., ky так, что rij/N —Xjy О <С Xj < 1, где Я = 2* njy a c^v Cj при j = 1, ..., k. Определим T' = (Tly...y Th), где * Мы не можем рекомендовать приближение (тем более ^-распределе¬ нием; см. теорему 4.2.4) для аппроксимации точного распределения Н при Н0 и малых выборках. Приближение может привести к большой ошибке в величине ошибки I рода. Поэтому для 2 ^ п3 ^ п2 ^ пх ^ 6, к = 3; пг = п2 = п3 = = 7,8, к = 4; 2 < п4 < ... < пг < 4, 2 < пъ < ... < пг < 3, к = 5 и а = 0,001; 0,005; 0,01; 0,05; 0,1 следует пользоваться таблицами из [221, табл. 22] и [302]. Улучшенное приближение процентных точек дано в [300]; см. также [249а] и [221]. — Примеч. пер. 188
Тогда Т асимптотически распределено, как MVN (О, В)*, где (cf (1 — Я,г)/(12Хг) при i= /, Ьи = -CiCj/12 при i Ф j. Доказательство. Перенумеруем наблюдения i = 1, rif, j = 1, k, обозначив их YXl ..., N = -2/гг, где первые /гх наб¬ людений Y — это первая выборка Хц\ i = 1, пг и т. д. Предполо¬ жим, J — индексы первой выборки, J — дополнение к множеству этих индексов, таким образом Yj, /£ J есть j-я выборка Yh a i £ J — ос¬ тавшаяся объединенная выборка. Пусть Rj = # (Y„ >У„) + tij (п} + l)/2, ug T, o£ А Пусть Г,,,, равно 1, если Yv >YU, и 0 — в противном случае. Тогда R.j-ER.j = ^ 2(7В0- 1/2). ыб*/ При нулевой гипотезе О, и Ф i и v Ф i. E(TU0-l/2\Yt = y) = F (у)— 1/2, o = i, 1/2 — F(y), и = i. Отсюда мы получаем E(R.j-ER.)\Yt=y)='Si %Е(Тив- 1/21 У, = у) = «6^ ugj ^ ((Л/— «;•) [£ (у) — 1 /2], t 6 A \njlH2-F(y)], iO- Поскольку Rj — (N + l)/2 = (Rj — ERj)/nj, проекция Tj за¬ дается следующей формулой: V) = с/дг -4=г У [F (Yt) —1/2] + УЛ' 1 nj jU + 2 [1/2-£(У,)]) = i£J ^ I = cin-±— У а, [£(7,)-1/2], (4.2.3) где at = (N — tij) /tij, i£ J и а,= — 1, если i £ А Далее, из упраж¬ нения 3.7.7 1/ 2 1 1 i (N — tlj)* . var V, — cfN —.— in, +- + ’ 1 N 12 \ 1 nf + (N nj) | = cfN VW-nj) , .» d-А) 12rij N ' 12Xj Многомерное нормальное. — Примеч. пер. 189
Аналогично из упражнения 4.5.1 cov (Viy Vj)-+- — Ci сjl 12. Для доказательства асимптотической нормальности Vj, / = 1, ..., k применяется теорема А10 приложения, а для доказательства асимпто¬ тической многомерной нормальности V' = (Vly ..., Vh) с вектором ма¬ тематических ожиданий 0 и матрицей ковариации В из теоремы 4.2.2 применяется теорема АП приложения. Из теоремы 4.2.1 По теореме о проекции 2.5.2 Е (Tj — Vj)2 = var Tj — var Vj 0 при j = 1, ...,£, и потому разность векторов Т — V по вероятности сходит¬ ся к нулю. Отсюда следует, что предельное распределение Т то же, что и у V. Доказательство завершено. Прежде чем обсуждать выбор таких clNy ..., CkN, что при вычис¬ лении статистики Н (4.2.2) она будет распределена асимптотически, как х2, мы приведем результаты, полученные согласно нормальной тео¬ рии. Из теории матриц следует, что матрица А идемпотентна,если А2= = А; при этом ранг идемпотентной матрицы равен сумме ее диагональ¬ ных элементов (следу). Теорема 4.2.3. Пусть (Zlf ..., Zh)' имеет распределение MVN (О, А). Предположим, что А — идемпотентная матрица с рангом г. Тогда 2имеет хи-квадрат распределение с г степенями свободы, обозна¬ чаемое х2 (О* Доказательство. Существует такая ортогональная матрица G, что G'A G — диагональная матрица D с г единицами и k — г нулями. Оп¬ ределим вектор U = G'Z, где Z' = (Zlt ..., Zk), тогда U будет иметь распределение MVN (О, D) (см. [11, с. 46]*). Теперь 2JZ? = Z'Z= = U'G'GU = U'U = 2jf/2, т. e. равна сумме квадратов независимых, одинаково распределенных, как п (0, 1), случайных величин. Таким образом, 2\Z\ имеет х2(г)"РаспРеДеление- Теорема 4.2.4 дает нам такие значения схы, •••, ckN, что статистика Н (4.2.2) имеет асимптотическое распределение х2- Теорема 4.2.4. При выполнении нулевой гипотезы о том, что k вы¬ борок извлечены из совокупности с одним распределением * См. также [236, раздел 8,а2, теоремы (IV), (VIII), с. 467, 469]. По поводу •ссылки автора см. [250], [239, раздел 46, с. 165], [198, теорема 2.4.1, с. 32]. — Примеч. пер. k 190
12 V tij (N + l)/2 ]2 = N(N+l) 12 У ) — 3 <jV + 1), N(N +1) n} имеет асимптотическое %2 (Л — 1)-распределение. Доказательство. Определим согласно формулировке теоремы 4.2.2. 77=7УК(1-Л)/(12^), откуда следует, что Т*' = (Т\, ..., Т\) имеет асимптотическое распре¬ деление MVN(0, В*) с элементом ь*.= 1с‘?’ 1 = /* " I - с, с, Vh ty[(l —К) (1 -У). i Ф /• Поскольку tij/N-^Xj, мы имеем из (4.2.2) приближенно н= уса Rj-iN+м—} W(N-n- { R.i-(N i= i l У(N—nj) (N + l)/(\2rij) ] - i {Tif. i= i Из теоремы А2Б следует, что Н сходится по распределению к 2JZ?, где (Zx,..., Zky имеет распределение МVN (О, В*). Далее, из теоремы 4.2.3 2* Z2 будет иметь распределение %2 при условии идемпотентно¬ сти В*. Итак, у нас есть такие постоянные съ ..., cht что (В*)2 = В*. Сравнивая (В*)2 с В*, можно подобрать решение. Мы выпишем это решение и проверим идемпотентность В*. Пусть ф=-£= N Отсюда bij* = 1 — при i = j и b*/ = — Xj) 1/2 при i Ф j. Мы можем затем написать В* = 1—66', где 6'= [(Xj)1/2, ..., (Яь)1/2] и I — единичная матрица размера k X k. Поскольку 6'6 = 2*^- = 1, легко проверить идемпотентность В*. Ранг В* равен trace В* = 2\Ь*и = 2* (1 —%t) ■= k — 2* Xt = = k — 1. Таким образом, число степеней свободы равно k — 1. Теоре¬ ма доказана. 191
В упражнении 4.5.2 предлагается выполнить алгебраические пре¬ образования для проверки других выражений для Я*. Третье из них наиболее удобно*. Статистика Я* называется статистикой Крускала — Уоллиса [110], и с помощью критерия, основанного на этой статистике, можно отклонить Я0 : Q1 = ... = на приближенном уровне а при Я* ^ Ха (k — 1), где %а (k — 1) есть (1 — а) -процентная точка распреде¬ ления х2 с k — 1 степенями свободы. Если посредством критерия Крускала — Уоллиса отклоняется ги¬ потеза Я0, мы можем произвести попарные множественные сравнения для выявления источника значимости. Всего есть k (k — 1)/2 по¬ парных сравнений, каждое из них основано на различии средних ран¬ гов столбцов**. Пусть В случае нулевой гипотезы EDti = 0 из теоремы 4.2.1 следует, что В теореме 4.2.2 возьмем cjN = 1, / = 1, ..., fe, тогда, применив тео¬ рему А2 Б к разностям, получим асимптотическое п (0, а2)-распределе¬ ние Dtj с дисперсией а2 из (4.2.5). Обозначим через а назначенную общую долю ошибок в опыте (prescribed overall error rate)***, и пусть a =2a/[k(k — 1)] — для оши¬ бок в попарных сравнениях. Будем считать 0£ и 07- значимо различны¬ ми с общим уровнем а, если Теорема 4.2.5 дает нам интерпретацию а как общей доли ошибки. Теорема 4.2.5. В случае выполнения нулевой гипотезы вероятность того, что произойдет хотя бы одна ошибка в (4.2.6) при 1 < i < ограничена а при больших N. * Для вычисления вручную. — Примеч. пер. ** Столбцы отвечают выборкам в нашей схеме. — Примеч. пер. *** В глоссарии книги [249а] используется термин: вероятность ошибочного решения (probability error rate, experimentwise error rate). — Примеч. пер. (4.2.4) var Di} — -j—[vartf j + var/? ;— 2 cov (R. h #.*)] = (4.2.5) \Dij\^Za'i2 KvarDij или 192
Доказательство. Пусть Etj — событие \Dtj\ ^ Zf///2 (var D*,)1/2. Согласно свойству асимптотической нормальности мы имеем при нуле¬ вой гипотезе Р (Etj) = а . Следовательно, вероятность совершить ошиб¬ ку, применяя Dijy примерно равна а . Вероятность хотя бы одной ошиб¬ ки равна Это неравенство упоминается в литературе как неравенство Бонферрони *. Предыдущую процедуру множественных сравнений предложил О. Дж. Данн [46]. Другие подходы обсуждает Р. Г. Миллер [130] **. Пример 4.2.2. Данные опыта с крысами (из примера 4.2.1) сведены в табл. 4.1. Измерялось время проявления материнского инстинкта. За единицу времени была взята продолжительность одного цикла наб¬ людений (опыта). Таким образом, величина 0,5 означает, что материн¬ ский инстинкт начинал действовать в середине первого цикла наблюде¬ ний. При ранжировании связанным наблюдениям присваивались сред¬ ние ранги. Проверяя #0:0!= ...= 04 против НА: не все эффекты 0j, 02, 03, 04 равны на уровне а, мы отклоняем Н0 при Я* > %о,о5 (3), где Я* — статистика Крускала — Уоллиса из теоремы 4.2.4. и %о,о5 (3) = 7,81. Таблица 4.1 Время до проявления материнского инстинкта (искусственные данные) При введении плазмы материнской крови При введении плазмы до течки При введении плазмы во время течки При введении соляного раствора (плацебо) 0,5(2)! 0,7(3) 1,0(5) 1,2(7) 1,7(9) 2,3(12) 2,4(13,5) 3,1(17) 1,1(6) 1,6(8) 3,7(18) 4,3(20) 4,7(21,5) 5,6(24) 6,6(26,5) 8,8(29) 0,4(1) 1,9(10) 2 4(13,5) 2,8(15) 3,9(19) 5,4(23) 11,4(31) 20,4(32) 0,9(4) 2,1(П) 3,0(16) 4,7(21,5) 6,4(25) 6,6(26,5) 8,5(28) 10,0(30) R.j 68,5 REtj 132 153 144,5 162 132 132 132 1 Число в скобках — ранг наблюдения. * См. например, [248 а, т. 1,с. 129, 160]. Подробная статья есть в [285]. — Примеч. пер. ** См. также [249а, раздел 6.3], [291, т. 1]. — Примеч. пер. 7 Зак. 284 193
По нашим наблюдениям мы по¬ лучаем Я* = 7,85 и потому от¬ клоняем Я0 и делаем вывод о различии совокупностей. В табл. 4.2 занесены абсо¬ лютные значения разностей |Я.7* — R.i|. Поскольку размеры выборок равны, из (4.2.6) можно получить условие для ранговых сумм \Rj-R.i\>za'/2yr'nN(N6 + l) . Из табл. 4.2 ясно, что значимость вывода о различии совокупностей объясняется из различия между группой особей, которым делали инъек¬ ции плазмы, и всеми остальными группами. Между другими группами нет различий. Если мы возьмем общую ошибку а = 0,12, то а' = = 0,02, Ztt'/2 = 2,326, и мы получаем неравенство |R.j— R.t\^ ^87,3. Если а = 0,24, то \R.j —R.t\>77,1. Итак, мы будем считать различия значимыми и должны иметь в ви¬ ду, что общая величина доли ошибок довольно велика. В данном слу¬ чае это не удивительно, поскольку Я* едва значима на 5-процентном уровне и объем выборки, на которой основаны множественные сравне¬ ния, мал *. Понятие эффективности по Питмену можно обобщить на критерий со статистиками, имеющими асимптотическое распределение %2. Здесь требуется многомерный вариант теоремы 2.6.1. Мы приведем эвристи¬ ческое доказательство; строгое построение можно найти в [68, гл. VI]. Напомним (см. обсуждение после теоремы 2.6.1), что асимптотическое распределение статистики критерия при последовательности альтер¬ натив, сходящихся к пулевой гипотезе, изменяет лишь математическое ожидание. Таким образом, если мы знаем асимптотическое распреде¬ ление при Я0, надо исследовать поведение математического ожидания статистики критерия при последовательности альтернатив. В теореме 4.2.4 мы показали, что вектор Т*' = (Г*, ..., Т£), {Ъ . е]5 . ) —,J 'J , асимптотически распределен, как ]/var R j j MVN (0, В*). В определении Т] мы заменяем Xj на rij/N. В следующей ниже теореме описывается поведение ЕТ* на последовательности альтернатив. Вычисления здесь аналогичны вычислениям примера 2.5.7. * Выше автор привел элементы теории ранговых критериев для задачи о сдви¬ ге & выборок (однофакторного дисперсионного анализа). (См. также [249а, раздел 6.1], где на с. 135 есть дополнительные ссылки на литературу, [68, гл. III, раздел 4] и [292].) — Примеч. пер. 194 Таблица 4.2 Абсолютные величины сумм рангов МР РР DP рр 84,5 DP 76 8,5 S 93,5 9 17,5
Теорема 4.2.6. Пусть выполняются условия регулярности по Питмену из раздела 2.6. Предположим, 0jv = (0,, ..., 0fe) = = (а + Pi / N4\ ..., а + pfc/jV 1>г). Тогда при N -к оо E*nT} -> Cj V12V( 1 -h) J /2 (*) d* (р, -p). (4.2.7) при /= 1, ..., /г, где cjN-+ch р = 2Я,р*. Доказательство. Сначала предположим, что функция распределе¬ ния Хц равна F {х — 0^) , i = 1 = 1, ..., k. Поскольку R.j= = где Rij — рангЛ^-, мы получаем ER.j = E'2iWij+ п>(п!+1) , <>/' 2 где W',/= #(Xui<X^), w = l, ..., лг; о= 1, ..., п}. Далее, EWu = nln)P(Xui^Xv}) = = ninj j F {t—Qi)f(t — Qj)dt = =«*• «j J (0j—e,)) / (О Воспользуемся разложением как функции (0г-, 0;) в (0, 0): EWtj±ni л; j-i + 0,- jf(;c)dx—0f | /*(x)djc|, где ошибка приближения имеет порядок меньше 0* и 0;*. Это дает ER.J ±n}{N- tij) |Д. + 0j j/2 (х) dx)- —л, 2 ni 0i f z2 (■*) dJt + n) (n'+1} / k \ ЕТ1~с,ыл/ ^I Si— У — e,) f/,(x)dx. |/ (N-n,)(N+i) .f* лг 'уj Подставим Qj ~ a + (3//V1/2 в предыдущее выражение и перейдем к пределу E*NT',+c, j/ ^-2^-iPi jjf(x)dx при N -^ оо. Теорема доказана. * Т. е. ошибка приближения — бесконечно малая высшего порядка по от¬ ношению к бесконечно малым величинам 0*, 0/. — Примеч. пер. 7* 195
Так как нас интересует статистика Крускала — Уоллиса Н*, мы полагаем cjN = l(N — n})/N] 1'2 -» (1 — Xj) У2. При этом обоб¬ щение теоремы 2.6.1 означает, что Т*' = (Т*, ..., Т%) асимптоти¬ чески распределена, как MVN (ц, В*), где Ьц = 1 — Х( при i = /, bij= — (XiXj)1/'2, если iV=/, 121/2 j f2 (*) dx Xх/2 ф;— p), с p = = 2Я,рг. Наконец, напомним, что Н* = (Т*)2. Эта статистика по-преж¬ нему асимптотически распределена по %2. Однако это нецентральное “/^-распределение с k — 1 степенями свободы. Параметр нецентрально- сти вычисляют путем подстановки математических ожиданий в Н*\ 6Н.= 2 [ETj}2 = 1= 1 = 12 ($f2(x)dxj 2 ЯЛР/-Р)8. (4.2.8) i= i Значение асимптотической мощности на последовательности ло¬ кальных альтернатив определяется параметром нецентральности. По¬ скольку математическое ожидание для нецентрального распределения X2 с г степенями свободы и параметром нецентральности б равно г +6, большие значения б соответствуют большим значениям асимптотиче¬ ской мощности. (Дальнейшее обсуждение см. в [7].) Здесь требуется определение асимптотической эффективности как отношения парамет¬ ров нецентральности (см. [70]). Пусть (k — 1) F есть увеличенная в (k — 1) раз статистика обыч¬ ного /^-критерия однофакторного дисперсионного анализа. При усло¬ виях регулярности, которые обсуждаются в [11, гл. 10], (k—1) F имеет асимптотическое распределение х2 ПРИ в/v == (а + &/N V2, а + Рь IN1/2). Параметр нецентральности вычисляется посредст¬ вом подстановки математического ожидания в выражение для F: 6F = -L-2Mfb-p)2, (4-2.9) где о2 — дисперсия F, Р = hX} (см. [11, с. 93]). Отсюда е(Н*, F) = 8„,/8f = 12а2 (J Z2 (x)dxf ’> (4.2.10) это есть эффективность по Питмену критерия знаковых рангов относи¬ тельно одновыборочного /-критерия или эффективность по Питмену критерия Манна — Уитни —Уилко*-юна по отношению к одновыбо¬ рочному /-критерию. Таким образом, критерий Крускала — Уоллиса сохраняет те же свойства, что и одновыборочные и двухвыборочные ранговые критерии*. * Сравнение (по эмпирической мощности) критерия Крускала — Уоллиса с другими критериями см. в [267]. — Примеч. пер. 196
Может случиться так, что альтернативы типа «омнибус» (omnibus alternatives)* о неравенстве величин параметра положения не отве¬ чают условиям опыта. Исследователь может попытаться выделить воз¬ растание или убывание изучаемого эффекта. Эта задача похожа на одностороннюю альтернативу в задачах с одной-двумя выборками. Критерий Крускала — Уоллиса здесь не годится потому, что он пост¬ роен для выявления любого отклонения от гипотезы о .равенстве вели¬ чин параметра положения. Можно попытаться найти критерии выявле¬ ния альтернативы возрастания с большей мощностью. Допустим, что существует k выборок, как это описано в начале на¬ стоящего раздела. Предположим, мы хотим проверить Н0 : 0Х = ... = 0ь против НА : 0! < < 0fc, где хотя бы одно неравенство строгое. Мы построим статистику, которая оценивает (измеряет) сте¬ пень согласия между наблюдаемыми средними рангами j = 1,..., k и гипотетическим упорядочением. Пусть причем большие значения L свидетельствуют в пользу альтернативной гипотезы. При выполнении нулевой гипотезы EL = 0 и <«•«> см. упражнение 4.5.3. Если все объемы выборки равны /г, то var L= (k2 — 1) (nk + 1)/(144лг). Из теоремы 4.2.2 при c/n = / — — (k + 1)/2, / = 1, ..., k и теореме А2 Б следует, что L распределено асимптотически нормально, как п (0, а2), с дисперсией а2 из (4.2.12). Ясно, что при проверке HQ : = ... = Qk против НА : 0Х < ... <0ft хотя бы с одним строгим неравенством, следует отклонять Н0 на приближенном уровне а при L ^ Za (var L) 1/2, где Za — верх¬ няя a-процентная точка стандартного распределения**. Эта задача напоминает задачу о регрессии. Если упорядочение, даваемое альтернативной гипотезой, носит скорее количественный, чем качественный характер, то для решения упомянутой задачи пригодны регрессионные методы из следующей главы. Если же мы имеем дело с качественным упорядочением (в порядковой шкале), то можно приме¬ нять критерии, основанные на L. Если же применять критерий Крус- * Видимо, Н'А : 02 = .. . =6/<0Z+1 — ... =6Л. — Примеч. пер. ** Для /г = 3, 2 ^ пг ^ п2 ^ п3 ^ 8; k = 4, 5, 6, п1 = ...= =2 (1)6 и может быть некоторых ближайших k, п\ здесь были бы желательны процентные точки точного распределения, поскольку нормальное приближение для малых k> nj* 1= 1» •••> £ может приводить к значительной неточности в величине ошибки I рода. —Примеч. пер. 197
Таблица 4.3 кала — Уоллиса при альтерна- Время выживания тиве упорядоченности (ordered alternatives), то может произойти значительная потеря мощности*. Пример 4.2.3. В Станфорд- ском исследовании, посвящен¬ ном трансплантации сердца, фиксировались различные коли¬ чественные и полуколичествен- ные (semiquantitative) показате¬ ли состояния больных. Одно измерение, балл неправильного подбора (mismatch score) харак¬ теризует степень неправильнос¬ ти подбора донора и рецепиента для пересадки тканей (tissue type). Можно предположить, что* время выживания (продолжите^ льность жизни больного после операции) имеет тенденцию воз¬ растать при уменьшении балла неправильного подбора. Данные- о времени выживания из [133, е. 571] приведены в табл. 4.3. Баллы делятся на низкие (0—1), сред¬ ние (1 — 2) и высокие (2—). Если через 0 L, 0д* и 0Л обозначены медианы времени выживания больных из определенной совокупности, соответствующие трем груп¬ пам, то нам требуется проверять Н0 : 0 L = 0^ = 0Л против НА: : 0 ь > 0м > 0Я хотя бы с одним строгим неравенством. Если мы по¬ ложим а = 0,05, то HQ следует отклонять при L < — Za (var L)1/2. Теперь пх 14, п2 = 13, л3 = 12, N = 39, var L = 0,52, — Za = = — 1,645, и мы отклоняем Н0 при L < — 1,19. При k = 3,L = = 11/(39) 1/2]-(/?.3 — R.t) = —0,8, и мы не можем отклонить Н0. Таким образом, при а = 0,05 гипотеза о том, что время выживания возрастает с убыванием балла неправильного подбора не подтверждает¬ ся. Другие переменные, как, например, возраст или время ожидания операции для донора или общее физическое состояние больного, могут оказывать сильное влияние на продолжительность жизни после опера¬ ции. Т. Дж. Терпстра [180] и А.Р. Джонкхиер [9] независимо один от другого предложили критерий альтернатив упорядоченности, основан¬ ный на попарных статистиках Манна — Уитни — Уилкоксона. Срав- * Выше автор пишет о регрессии в порядковой (ординальной) шкале. К ней близки методы упорядочения по сумме рангов как обобщенная медиана Кемени с коэффициентами ранговой корреляции Спирмена, Кендэла (т. е. расстоянием Хемминга) и т. п. См. [245, раздел 9] и [246]. — Примеч. пер. 198 ' Группы (по баллам неправильности подбора) Низкие баллы Средние баллы Высокие баллы 44(H)1 551(33) 127(26) 1(1) 297(31) 46(12) 60(19) 65(22,5) 12(4) 1350(39) 730(35) 47(13) 994(37) 26(8) 15(5) 280(30) 1024(38) 253(29) 66(24) 29(9) 161(28) 624(34) 39(10) 51(16,5) 68(25) 836(36) 51(16,5) 3(2) 136(27) 65(22,5) 25(7) 64(21) 322(32) 23(6) 54(18) 63(20) 50(15) 10(3) 48(14) R.j 21 23 16 1 Числа в круглых скобках — ранги объединенной выборки.
нение выборок i и / при этом не зависит от оставшейся части данных. Для проверки Н0 : 0Х = ... = вк против НА : 0J < ...< 0ft, где хотя бы одно неравенство строгое, положим J=ySSi^ib (4.2.13) i<j где Wtj = # (Xvj >Xui), v = 1, ..., fij\ и — 1,..., nu это обсужда¬ лось в разделе 3.2. Мы будем отклонять Н0 при больших значениях J. Пусть W' - (В712> ..., Wlh, W2з, ..., W2h, ..., - вектор из k (k — l)/2 компонент статистики Манна — Уитни — Уилкоксона; М = 21 f /г£ — объем объединенной выборки. Предположим, что nj/N-* -+Xjy01. При Н0 предельное многомерное нормальное распре¬ деление М-3/2 (W — ЕW) получается из покомпонентной предельной нормальности проекции (см. теорему 3.2.4) и сходимости матрицы ко¬ вариации (из теоремы А13 приложения). Для того чтобы критерием было можно пользоваться, нам нужны ковариации. При Н0 из (3.2.3) EWij = tiitij/2, var Wtj = tiitij (я* + tij + 1)/12. Далее, cov (Wst, Wuv) = 0, где s, t оба отличны от a, v. В упражнении 4.5.4 предлагается найти другие ковариации. Если мы хотим найти дисперсию /, то должны определить Wt=2lWui, (4.2.14) и= 1 так что / = S?=2 Далее, C0V(WS, COV (*2 Wu; *2 ^ \u=l U= 1 =s2cov(irus/2 Wvt) = 2‘cov(^us, ru(+^st). u= 1 V V = 1 } U= 1 Однако из упражнения 4.5.4 cov(U?us, Wut+Wst) = cov(Wus, Wul)+COv(Wus, Wst) = 0. Отсюда cov (Ws, Wt) = 0 и vary = 2 varW',. (4.2.15) i = 2 Мы видим, что Wt — статистика Манна — Уитни — Уилкоксона, вы¬ численная по i-й выборке и выборке, состоящей из объединения эле¬ ментов первых i — 1 выборок. Если мы положим N; = 2/=i tij, где = лх и Nh = N, то из (3.2.3) var Wt=tii Nt-ANt+iyH. 199
Следовательно, i k vary = -i- V mNi-^Nt + l). (4.2.16) i=2 A. P. Джонкхиер [98] нашел производящую функцию кумулянтов и из нее получил другое выражение для (4.2.16) !k I Л/2(2Л/ + 3) — 2 n;(2n7- + 3)J. (4.2.17) Из (4.2.13) EJ = '2g£.nln]l 2= (V-£ n?) j 4, (4.2.18) где второе равенство следует из (Sni)a = Sn?+‘222/<//il/iy. Критерий Джонкхиера — Терпстры позволяет отклонить Н0: 0! = ... = 0Л в пользу НА :0j < ...< 0ft с хотя бы одним строгим не¬ равенством на приближенном уровне а при J > EJ + Za (var /)1/2, где EJ и var J вычислены по (4.2.18) и (4.2.16) или (4.2.17), Za — верхняя a-процентная точка стандартного нормального распределения *. Свойство некоррелированности Wh, определенных в (4.2.18), можно уточнить. На самом деле эти величины независимы. Это свойство независимости можно использовать как довод, альтернативный преды¬ дущим соображениям об асимптотической нормальности J. В упражнении 4.5.5 описано соотношение между статистикой L (4.2.11) и статистикой, которая основана на попарных статистиках Манна — Уитни — Уилкоксона**. * Точное распределение J табулировано (см. [249а]), причем k = 3, 2 ^ п2 < п3 < 8, k = 4,5,6, /г = ...= tik = 2(1)6 [323]. О мощности / см. [322], другие сведения и ссылки см. [249а, с. 140] и обзор [266]. В [364] даны ве¬ личины АОЭ при k = 4(1) 15; см. также [335] и [333]. — Примеч. пер. ** Соотношение между формулами J = 2 2 Wij и L = <! — 2 2 (/ — i)X i<j У Л/ t п i<j nk(k2— Ш X Wn— у весьма похоже на соотношения между коэффициентами ранго- 4 J 4 вой корреляции Кендэла т = 1 — 2 2 hij и Спирмена rs = п(п— 1) ,:</ 12 = 1— 2 2 (/— i) hij, где hij = s (Rj — Rj) (см. теорему 4.4.1 и формулы п{п2 — 1) icj (31.23), (31.37), (31.38) из [213]. Эта связь отражает «близкое родство» между J и т, L и rs. См. также следующий раздел данной книги. — Примеч. пер. 200
Р. В. Трайон и Т. П. Хеттманспергер [183] рассмотрели линейную комбинацию с весами из статистик Манна — Уитни — Уилкоксона. Другие подходы даны в [28] и [96]. В монографии [16] дан превосход¬ ный обзор тематики статистических выводов при ограничениях упорядо¬ ченности *. 4.3. ДВУХФАКТОРНАЯ СХЕМА. КРИТЕРИЙ ФРИДМЕНА В предыдущем разделе мы говорили о сравнении выборок, которое производилось для выявления значимых различий между совокупно¬ стями. Там рассматривалась рандомизационная модель N объектов (предметов), случайно размещенных по ^-обработкам. Имеющиеся между k обработками различия нелегко заметить из-за относительно большой изменчивости объектов в выборках. Часто зада¬ чу выявления различий можно облегчить, разбив объекты на однород¬ ные подгруппы, т. е. на так называемые блоки. Здесь мы рассмотрим полностью лишь план с рандомизированными блоками с одним наблюдением в клетке. В этом случае у нас имеется N= nk объектов, составляющих я блоков, причем эти объекты случай¬ ным образом назначаются для каждой из k обработок **. Повторные измерения также могут служить нам важным примером. В этом случае один объект составляет блок и над ним производится k измерений. Порядок, в котором производятся измерения, зачастую ран¬ домизируется, причем мы хотим получить картину последовательности различий между объектами. К примеру, я экспертов могут ранжиро¬ вать k образцов, пользуясь этим планом. Модель выборки можно описать двумя способами (1). Есть случай¬ ные величины Xij, i = 1, ..., я, / = 1, ..., k с функцией распределения Ft (х — 0у), Й0, i = 1, ..., я. Таким образом, Ft — функция рас¬ пределения в i-м блоке, и внутри i-го блока. 07- — медиана, соответст¬ вующая /-му измерению. Все наблюдения независимы (2). Есть слу¬ чайные величины Хп, ..., Xik с совместной функцией распределения Fi (*i — 01, *k — 0*), i = U п, где Fi (хг, ..., xh) = Fi(yl9 ..., Уь) и (ylt ..., yh) — перестановка чисел xlf ..., xk. Случайные величи¬ ны Xilt ..., Xik называются взаимозаменяемыми (exchangeable) слу¬ чайными величинами. Эта модель годится для повторных измерений в том случае, когда предположение о независимости случайных величин в блоке неуместно. * В разделе 4.2 автор дает обзор однофакторного рангового дисперсионного анализа — важного инструмента анализа данных. См. в том числе работы [249а], [270], [286], [312], [344], [357], [359], пользуясь которыми можно составить себе представление о предмете. Здесь будет полезен и обзор [267]. — Примеч. пер. **0 планах со случайными блоками см. [249]. — Примеч. пер. 201
Пример 4.3.1. Дж. Т. Тодд и его соавторы [182] пытались выделить формальное преобразование, воспринимаемое человеком как описание роста. Идея о том, что геометрическое преобразование может быть по¬ лезно в описании морфологического изменения растений, впервые вы¬ двинута в работе Д’Арси Уентворта Томпсона *, который занимался этой проблемой в начале 1900-х годов. Большинство работ на эту те¬ му содержали лишь качественные исследования до тех пор, пока Тодд и его соавторы не изучили влияние нескольких специальных математи¬ ческих преобразований изображений профилей детских лиц. Они рас¬ сматривали пять разных преобразований: кардиоидное растяжение (cardioidal strain — CS), спиральное растяжение (spiral strain — SS)r аффинный сдвиг (affine shear — AS), отраженный сдвиг (reflected shear — RS) и вращение (rotation — R). С помощью кардиоидного преобразования круг превращается в фи¬ гуру, напоминающую сердце, а посредством сдвига круг превращается в ориентированный по диагонали эллипс. В [1821 есть иллюстрации. После предварительного исследования авторы предположили, что кардиоидное растяжение воспринимается эквивалентно морфологичес¬ кому изменению головы человека при нормальном росте. Испытуемым предъявлялись пять разновидностей профилей лица в различных пос¬ ледовательностях, причем предполагаемый возраст детей изменялся (увеличивался, если смотреть на изображения слева направо). В од¬ ном случае профили были реально увеличены путем фотографирова¬ ния в Х-лучах. Изображения, которые были порождены математиче¬ скими преобразованиями, в начале последовательности были схожи с реальным изображением. В контрольных группах (С) все 5 профилей были одинаковы. Испытуемым предлагалось оценить каждую последо¬ вательность баллами от 0 до 4 по тому, насколько изображения соответ¬ ствуют действительному возрасту. Таким образом, у нас есть двухфакторная схема с k = 7 «обработ¬ ками»: AG, CS, SS, AS, RS, R и С и испытуемые, которые дали нам (по¬ вторные) измерения, составляющие блоки этой схемы. Будем надеять¬ ся, что данные из примера 4.3.2 позволят отклонить нулевую гипотезу об отсутствии различий между этими обработками и обнаружить связь между преобразованиями растяжения, CS и SS, и действительным рос¬ том. Мы хотим проверить Н0 :0Х = ... = 0& против НА : не все 0г* равны. Пусть Rtj — ранг Xtj среди Xil9 ..., Xih, т. е. среди наблюде- п ний в i-м блоке; пусть также R.j = 2 Rtj — сумма рангов, соответ- i= 1 ствующих /-й обработке. Ранги можно поместить в таблицу с двумя входами: * Thompson D’ Агсу. On growth and form. — New York: Cambridge, 1942. — 1116 p. — Примеч. пер. 202
Обработка Блоки 1 2 k 1 Ян Rl 2 R\k 2 Я 21 Я22 Яг/е п Яя1 Я/12 Rnk 1 R.i Я.2 R.k При нулевой гипотезе Rtl, ..., Rik распределены так, как в теореме 3.2.1, даже для модели взаимозаменяемости. Отсюда ERtj = (k + 1)/2, var Rij = (ik2—1)/12 и ERj = n (k T~1)/2, var Rj = n(k2— 1)/12, (4.3.1) cov (Rf, Rj)= —n(k+ 1)/12; см. упражнение 4.5.6. М. Фридмен [55a] предложил статистику следующей формы: (4.3.2) I Т/var R i ' /= l где весовые коэффициенты выбираются так, чтобы /С асимптотически было распределено, как %2(k — 1). Пусть V = (Тъ ..., 7\), где ^ = (4-3.3) Тогда асимптотическое распределение Т есть MVN (О, В), где cf (^2— 1)/12, i — /, b w vv 4,/4^ (4.3.4) 1 -cic,(*+l)/12f i^/ и Cj-jv ->■ Cj-, / = 1, ..., k. Доказательство этого результата см. в упраж¬ нении 4.5.7. На этом результате основана асимптотическая теория рас¬ пределения, необходимая для получения плана с двумя входами, ко¬ торая аналогична теории для получения однофакторного плана. 203
Далее, в упражнении 4.5.7 показано, что с помощью статистики можно отклонить нулевую гипотезу Н0 : 0Х = ... = на прибли¬ женном уровне а при /С* ^ %£ (£ — 1), где (k — I) — верхняя a-процентная точка ^-распределения с k—1 степенями свободы*. Если посредством критерия Фридмена отклоняется Я0, то мы мо¬ жем построить попарные множественные сравнения, основанные на ранговых суммах R. 1у ..., R.h. Из упражнения 4.5.7 и теоремы А2Б следует, что (Я.; — R. j)/[var (R.j— Я.г)11/2 имеет нормальное рас¬ пределение п (0, 1) при #0• Обратившись к (4.3.1), легко увидеть, что var (R.j — R.i) = tik (k + l)/6. Поэтому мы можем, так же как и в (4.2.6) для однофакторного плана, объявить 0* и 0;* значимо разными на общем уровне а, если где" а' = 2a/k (k—1) и 1—Ф (Za'/2) = а'/2. По тем же соображениям, что и в доказательстве теоремы 4.2.5, мы можем заключить, что вероятность совершить хотя бы одну ошибку ограничена при Н0 сверху величиной а. Пример 4.3.2. Продолжение примера 4.3.1. Пяти испытуемым** были предложены объекты в виде «возрастающей» последовательно¬ сти. Они оценивали их баллами от 0 до 4, причем нуль означал отсут¬ ствие роста. Различные последовательности были представлены в слу¬ чайном порядке и каждый испытуемый видел 5 последовательностей каждого из 7 типов. В табл. 4.4 приводятся 5 баллов средних каждого * В приведенном выше тексте автор не упоминает о таблицах точного распре¬ деления статистики критерия Фридмена. Однако при малых k, п использовать Х2-приближение не стоит — могут быть большие ошибки, см., например, табл. 4.1 в [230], где приведены относительные ошибки вероятностей ошибки I рода б для k = 3, 4, 5 и некоторых п от 4 до 15. Эти величины б изменяются от — 1,7 % до + 316 %. Вместо %2-приближения надо пользоваться точным распределением или его процентными точками (см. [249а, табл. А15], [221, табл. 22]), где к — 3, п = 3(1)25; к = 4, п = 2 (1)10, k = 5, п = 2(1)6, к = 6, п = 2, 3. При больших &, п мы советуем пользоваться приближением из [300], которое приведено нами в примечаниях к переводам книг [249а], [221] и введено в ГОСТ 23554.2—81.— Примеч. пер. ** Или экспертам. — Примеч. пер. Фридмена k (4.3.5) I R.j — R.i | ^ Zaf /2 ]^tlk (k + l)/6, (4.3.6) 204
Таблица 4.4 Средние баллы для последовательностей «роста»* (ratings of «growth» sequences) (искусственные данные) Испытуе¬ мый AG CS SS AS RS R с 1 3,9(7)i 3,5(6) 2,8(5) 1,5(4) 0,5(2) 0,6(3) 0,2(1) 2 3,4(6,5) з,4(6,5) 2,5(5) 1,0(4) 0,8(3) 0,1(1) 0,2(2) 3 3,8(7) 3,0(5) 3,1(6) 0,9(4) 0,6(3) 0,2(1) 0,4(2) 4 3,2(6) 3,4(7) 3,0(5) 1,2(4) 0,4(3) 0,2(1) 0,3(2) 5 3,7(7) 3,2(6) 2,7(5) 1,0(4) 0,2(2) 0,3(3) 0,1(1) Rj 33,5 30,5 • 26 20 13 9 8 * Часто 1 Число ' переводят словом «рейтинг», школьная оценка. — Примеч. пер. в скобках — ранг срееди наблюдений в строке. типа последовательностей и ранги среди 7типов. Проверим Н0 : 0!= ... ... = 0Л против НА: не все параметры равны на уровне а = 0,05; мы должны отклонить Н0 при К* ^Хо.об (6) = 12,6. Из (4.3.5) мы полу¬ чаем К* = 27,5 при п — 5, k = 7 и потому отклоняем Я0, заключая на приближенном уровне а = 0,05, что различия между обработками есть *. Всего имеется k (k — 1)/2 = 21 попарных сравнений. Если мы зададимся общей вероятностью ошибочного решения а = 0,21, то веро¬ ятность ошибочного решения в сравнении равна а' = 2аIk (k — 1) = = 0,01 и Za'/2 = 2,576. Согласно (4.3.6) пара будет считаться значи¬ мо различимой, если — /?.£| ^ 17,6. Анализ показывает, что AG и CS значимо отличаются от RS, R и С, и это подкрепляет гипотезу о том, что результат координатного растя¬ жения воспринимается как рост в отличие от результатов отраженного сдвига и вращения. В упражнении 4.5.8. описывается поведение /С* на последователь¬ ности сходящихся к нулевой гипотезе альтернатив. Из [11, с. 87] мы знаем, что (k — 1) F, т. е. увеличенная в (k — 1) раз обычная ста¬ тистика F для проверки #0, имеет в асимптотике нецентральное х2- распределение с к — 1 степенями свободы и параметром нецентрально- сти (4-3-7> ° т * Для k = 7, п = 5 лучше применить упомянутое приближение, см. [249а, п. 3, с. 12]. — Примеч. пер. 205
Здесь предполагается использовать ту же модель, что и в упражнении 4.5.8. Поэтому так же, как при обсуждении (4.2.10), относительная эф фективность /С* по отношению к F равна е{К\ F) = 8k*/8f = = 12о*(| r(x)dx)2-^T. (4.3.8) Удивительно, что К* не наследует величину относительной эффек¬ тивности уилкоксоновских одновыборочного и двухвыборочного кри¬ териев относительно /-критерия, как это было с критерием Крускала— Уоллиса. Если исходное распределение нормально, то e(K*,F)=3kl[(k+l)n]. (4.3.9) Отсюда при k = 2, е (/С*, F) = 2/л = 0,64, т. е. полученная эффек¬ тивность равна эффективности критерия знаков относительно /-крите¬ рия. (См. упражнение 4.5.9.) Она свидетельствует о потере информации из-за ранжирования внутри блоков, особенно заметной при малом чис¬ ле обработок. Потеря эффективности почти исчезает при росте k и е (К*, F) -> 3/я = 0,955 при k-^oo. Вот некоторые величины k, е (К*, F)) ■ (2; 0-64), (3; 0,72), (4; 0,76), (5; 0,80), (10; 0,87), (20; 0,91). Методы, с помощью которых учитывается внутриблоковая инфор¬ мация, описаны в следующей главе *. В планах со случайными блока¬ ми можно избавиться от потери эффективности. Соответствующие ме¬ тоды, которые обычно требуют построения ранговых статистик как функций остатков, получающихся после устранения эффектов блоков, более сложны и менее удобны в применении, чем критерий Фридмена. Критерий Фридмена, несмотря на его низкую относительную эффектив¬ ность при малых k, достаточно универсален и пригоден как для получе¬ ния планов со случайными блоками, так и для получения планов с по¬ вторными измерениями **. Критерий Фридмена можно обобщать на случай нескольких наблю¬ дений в ячейке. Общий случай неравного количества наблюдений в ячейке рассматривали А. Бенард и П. Ван Элтерен [19]. Если в каж¬ дой клетке есть в точности т наблюдений, то мы советуем обратиться к упражнению 4.5.10, где представлена статистика и ее асимптотиче¬ ское распределение. * См. в конце раздела 5.3.2 и обзор [331], а также книгу [328] и статью [255], где есть ссылки на конкурирующие методы. — Примеч. пер. ** Критерий Фридмена весьма популярен, удобен в применениях и интер¬ претации, допускает обобщения на разные случаи. Обсуждение этой темы содер¬ жится в 5-м томе [292]. На русском языке см. [230, гл. 4]. — Примеч. пер. 206
Так же как и в случае однофакторного плана, альтернатива «омни¬ бус» может быть непригодна *. Мы можем захотеть проверить Н0 : 0Х = ... = 0fc против НА : 0J < ... < 0&, где хотя бы одно нера¬ венство строгое. Для случая одного наблюдения и двухфакторной схемы статистику критерия предложил Е. Б. Пейдж [140]: «"^-2 (4'3'10> Она подобна (4.2.11). При Н0 EQ = 0, что следует из упражнения 4.5.11 так же как и var Q = k2 (k2—l)(k + 1)/144. (4.3.11) Статистика Q/(var Q)1/2 асимптотически распределена, как п (0,1). Следовательно**, посредством критерия Пейджа можно отклонить Н0 на приближенном уровне а при Q ^ Za (var Q)1/2, где 1 — Фе (Za) = a. Есть и аналог критерия Джонкхиера — Терпстры У (4.2.13) для двухфакторного плана: надо вычислить статистику для каждого блока и объединить статистики разных блоков. Дж. Г. Скиллингс и Д. А. Вулф [177] рассматривали именно эту статистику. Она позволяет оперировать неравным числом наблюдений в клетках и различными весами для различных блоковых статистик У. Пусть Уг — статистика, вычисленная по наблюдениям i-то блока, и У* = 2]У,. (4.3.12) 1 Сведения о среднем, дисперсии и асимптотической нормальности У* приведены в упражнении 4.5.12***л Есть другой аналог критерия Джонкхиера — Терпстры (4.2.13) в двухфакторном случае — статистика А = 22 /</ Tij, где Тij — знако¬ вая ранговая статистика Уилкоксона на паре i-и и /-й выборок. Эти статистики изучали М. Холлендер [87] и М. JI. Пури, П.К. Сен [148]. Может случиться, что критерий А не намного теряет эффективность (подобно критерию Фридмена) при малых /г, поскольку при вычисле¬ ниях учитывается межблоковая информация. При использовании критерия Пейджа предусматривается лишь ранжирование внутри блоков ****. * Т. е. альтернатива хотя бы двух «этажей» в 0Х, ..., 0*. — Примеч. пер. ** Для малых k = 3, п = 2 (1)20; k = 4 (1)8, п = 2(1)12 лучше использо¬ вать критические значения точного распределения из [249а] и табл. А16 приложе¬ ния к данной книге. См. также ГОСТ 23554.— 81. — Примеч. пер. *** См. таблицы точного распределения критерия со статистикой [356], см. также [230]. О таких критериях с весами блоков см. [331], [229]; ряд критериев введен в обзорах [264], [265]. — Примеч. пер. **** Применяя критерии с весами, в какой-то степени можно учитывать меж- блоковую информацию. Например, для этого существуют веса — ранги внутри- блочных выборочных дисперсий, см. [229]. Если L* — статистика /-го блока (4.2.11), то, так же как в (4.3.12), можно построить L* = 2 где Pi — вес. 1</<л С неполными данными можно работать по критерию из [252]. — Примеч. пер. 207
У. Р. Пири [144] проделал основательное сравнение критериев, ос¬ нованных на А и Q. Он рассматривал асимптотическую относительную эффективность при фиксированном k и п->- оо и фиксированном tiy оо и показал, что предпочтительность критерия зависит и от ис¬ ходного распределения, и от k и п. При этом критерий А не обязатель¬ но более эффективен, чем Q. В дополнение к этому статистика крите¬ рия А не свободна^от распределения при Н0 и не проста в вычислении. Исходя из этого, мы рекомендуем критерий, основанный на Q, и не при¬ водим здесь подробностей, касающихся критерия, основанного на А*. «Последняя вариация на ту же тему» — планы с неполными блока¬ ми — обсуждаеФся в упражнении 4.5.13, где приведен критерий Дар- бина [47] с его асимптотическим распределением **. Эффективность критерия Дарбина относительно F-критерия вычислена в [188]. Если есть t обработок и внутри каждого блока ранжируется k < t обрабо¬ ток, то эффективность равна е(К*> F) (4.3.8). Такая ситуация возника¬ ет при парных сравнениях, когда п экспертов сравнивают t объектов попарно, т. е. у нас k = 2 и эффективность опять та же, что и у крите¬ рия знаков по отношению к /-критерию ***. 4.4. РАНГОВАЯ КОРРЕЛЯЦИЯ И СВЯЗЬ В этом разделе мы введем понятия ранговой корреляции и связи как мер согласия между двумя наборами ранжировок. Мы подробно рассмотрим двумерную модель, где данные ранжируются отдельно по каждому компоненту. В теории распределения предусматривается и случай, когда исходные данные — набор рангов. На практике такая ситуация встречается часто, например, когда эксперты сообщают о своих предпочтениях, приписывая ранги объек¬ там. Кроме того, мы интерпретируем различные критерии, предложен¬ ные в предыдущих разделах этой главы, в зависимости от интерпрета¬ ции степени согласия между суммами рангов наблюдений и альтерна¬ тивными гипотезами. Эта интерпретация позволяет лучше понять дей¬ ствия критериев и представить себе соотношение между корреляцией и суммами квадратов. Р. А. Фишер [50] весьма успешно использовал это соотношение для развития теории дисперсионного анализа на базе предшествующего корреляционного подхода. Выборочная модель такова: есть выборка (Х5, Кх), ..., {ХПУ Yn) из F (ху у)у где F(.,.) — абсолютно непрерывная функция распреде- * См. [249 ] — Примеч. пер. ** Дж. Г. Скиллингс и Г. А. Мак лишь недавно построили таблицы точного распределения статистики критерия Дарбина для небольших планов (см. [358]). Эти таблицы в сокращенном виде приведены в [230]. — Примеч. пер. *** Двухфакторные схемы с неполными данными в последние годы привле кают к себе большое внимание, см. обзор в [231]. — Примеч. пер. 208
ления с абсолютно непрерывными частными функциями распределения F* (О и F„ (•)• Мы представляем данные двумя строками: х1хг... хп Y.Y...Y. <4-4» и предполагаем, что Хх < ... < Хп, общность при этом не теряется. Пусть Rly ..., Rn — ранги, соответствующие Yly ..., Yny тогда у нас получится следующая таблица рангов: 1 2 ... п (4.4.2) R1 R2 ... Rn Теперь мы представим два основных метода выяснения степени сог¬ ласия между двумя наборами рангов в (4.4.2). У. П. Крускал в [109] дает исторический обзор мер связи (agreement association). Мера Спир- мэна [178] — просто коэффициент корреляции смешанных моментов (Пирсона), вычисленный на рангах (product-moment correlation coef¬ ficient): п v i= 1 I tl 1 \ / tl —j- 1 \ )(«■--H =====- • (4-4.3) V Так как ранги — перестановка чисел от 1 до п, то знаменатель ра¬ вен (i — (п + 1)/2)2 = п (п2 — 1)/12, что вытекает из теоремы А21 приложения. Поскольку 2 [i — (ti + 1)/2] = 0, то -■-тть-,;?.*-**- (4'4-4> Последнее выражение наиболее удобно для вычислений (см. упражне¬ ние 4.5.14). Поскольку rs — коэффициент корреляции, его обычное свойство таково: — 1 < rs < 1. Легко проверить, что экстремальные значения достигаются. Если мы имеем дело с независимостью, т. е. две ранжировки независимы, то совместное распределение Rn равномерно на п\ перестановках. Следовательно, если нет связи, то Е rs = 0 из (4.4.4). Таким образом, rs лежит между — 1 и + 1 и около О в случае независимости ранжировок. Вторую меру связи ввел М. Дж. Кендэл [101]. Мы будем говорить, что пары (Хь Yt) и (X/, Y7) согласованы (concordant), если X* > >Х;- и Yi > Yj или Xt < Xj и Yi < Yj. Пусть sgn (x) = 1,0, —1 209
при х >0, 0, < О, тогда пары будут согласованы при sgn (Xj — Xt)X XsgnfF, — Yi) = 1. Таким же способом мы введем несогласованные (discordant) пары: sgn(X,-X,) sgn (У,-У,) = -1. Предположим, Р и Q — число согласованных и несогласованных пар соответственно. Тогда превышение согласованности над несогласо¬ ванностью равно S=P-Q= = 22sgn (X,_X,)sgn(J0-y,). (4.4.5) *</ Возможные значения 5 изменяются от —п (п — 1)/2 до п (п — 1)/2. Например, maxS = п (п — 1)/2 достигается при идеальном согла¬ сии порядка Хг, ..., Хп и Yl9 ..., Yn, т. е. при идеальном согласии их ранжировок, М. Дж. Кендэл [101] предложил коэффициент 5 т = = max S 2 (P-Q) ___ п(п— 1) = 1 (4-4-6> п (п— 1) так как Р + Q = п (п — 1)/2. Заметим, что упорядочение Y можно преобразовать в упорядоче¬ ние X путем перестановки соседних пар значений Y. Величина Q необходимое число перемен местами (interchange), или инверсий, превращающих последовательность значений Y-ов в последователь¬ ность, члены которой идут в том же порядке, что и Х-ы. Таким обра¬ зом, Q (или т) можно считать мерой неупорядоченности (disarray) F-ов относительно Х-ов Легко проверить, что — 1 < т < 1 и экстремальные значения до¬ стигаются. Далее, если X и Y независимы, то £sgn (Yj — Yt) = 0 и Ex = 0, аналогично и для rs. Поскольку Хг < ...< Xn, Q = s (Yt — Yj) = 22f</ sx X(Ri — Rj)t где s (x) = 1, если jc >0, и 0 — в противном случае. Это говорит о том, что Q можно вычислить или по данным строки, или по рангам. Простую модификацию Q можно построить взвешиванием, причем веса пропорциональны расстоянию между рангами. Напри¬ мер, s (1—2) получит вес меньше, чем s (1—5), как слагаемое, состав¬ ляющее меру беспорядка. Если мы возьмем вес / — i для s (Rt — — Rj), то новая мера равна Q* =2 2 (/-О* (Я—Я;). </ * Анализ мер зависимости ранжировок или упорядочения с этих позиций см. [280], [102], сравнение таких мер близости см. [246], см. также [303], [276]. — Примеч. пер. 210
В теореме 4.4.1 мы покажем, что rs Спирмэна—функция от Q*. Это' позволит нам лучше понять смысл соотношения rs и т*. Теорема 4.4.1. 7^22</-os<r,-r,>, Доказательство. Мы уже приводили выражение для т в (4.4.6). Воспользовавшись (4.4.4), достаточно показать, что О* = (2 (i — -Rtf}/ 2. Далее, О* = 22 js (Ri -Ri) - 2 2 is (Ri - Rj) 4- i<i i<i + 22 is (Ri—R])~22 is (Ri - Rj) = i<i i<i = 2 2 js (Ri - Rj)-2 21 {s (Ri-Rj) + s (Rj-Ri)) = i,f i<j n n n — 1 n = 2/2 s(Ri-R])~ 2 i 2i 1 = / = 1 i = 1 i= 1 j' = i + 1 = 2 Н*-Ъ)-2 »'(«- 0- /=1 /=1 Последнее равенство следует из того, что s (Ri — Rj) = = ф >Rj)y i = 1, ..., я, а это равно n — Rj. Заменяя n — 1 на ti в верхнем пределе второй суммы и приводя подобные члены-суммы, получаем q* .1 1 Заметим, что 2 (t-tfi)2 = 22 i"2—^ 2 = 2Q*, 1 1 1 теперь формула для rs следует из (4.4.4). Из теоремы следует, что за исключением крайних ситуаций ** rs и т, вообще говоря, не равны. Поскольку rs придает больший вес инверсиям тех рангов, которые отстоят дальше, то обычно rs по абсолют¬ ной величине больше т. Может показаться, что rs указывает на боль¬ шее согласие (или несогласие) ранжировок, чем т, но это различие — артефакт, порожденный строением rs и т. Кендэл и Стьюарт [103] * Сведения о других свойствах xs и т можно извлечь из обзора [303] и лите¬ ратуры, указанной в [249а]. Из последних работ упомянем [325]. —Примеч. пер. ** Т. е. при rs = % = 1 или — 1. — Примеч. пер. 211
указывают, что при независимости X и У rs и т высококоррелированы. В действительности их корреляция изменяется от 1 при п = 2 да 0,98 при п = 5, а затем стремится к 1 при росте п. Таким образом, при проверке независимости они асимптотически эквивалентны при нуле¬ вой гипотезе. Главный источник сведений о свойствах rs и т — книга М. Дж. Кендэла [102], где он утверждает, что со многих практических и тео¬ ретических точек зрения т предпочтительней, чем rs (см. [102, раздел 1.24]). Укажем на некоторые теоретические трудности, возникающие при работе с rs, для чего выясним, какие параметры совокупностей нтенивают т и rs. Предполагаем, что выборочная модель такова: (Хг, T’i), ..., (Xnt Yn) — независимые, одинаково распределенные случай¬ ные величины с функцией распределения F (ху у); она введена в начале раздела и согласно (4.4.5) и (4.4.6) выглядит так: Ет = 2 2 Е № (Xj-Xt) sgn (У,-У-,)} = = £(sgn[(X2-X1)(y,-y1)]| = = P{(X2-JC1) (y.-yjJ^O}— -Р((Х2-Х1)(У2-У1)<0} = = 1-2Р{(Х2-Х1)(У2-У1)<0). (4.4.7) Значит, интересующий нас параметр—вероятность несогласован¬ ности (discordance). Ясно, что при независимости X и Y вероятность несогласованности равна 1/2 и Е т = 0. Ситуация с rs более сложна, и нет простого параметра для rs. М. Дж. Кендэл [102, гл. 9] показал, что |£т + (п-2)(2Т-1)), (4.4.8) п-\-1 где у = Р [(Х2 — Хг) (Y3 — Кх) >0] и называется парамет¬ ром согласованности (конкордации) 2-го типа. При больших п Ers = = 6 (у— 1/2), что нелегко интерпретировать как вероятность прос¬ того согласия. Как следствие, интерпретация rs в качестве коэффици¬ ента корреляции наблюдений довольно ограничена в отличие от коэффи¬ циента корреляции двух ранжировок. Однако, как мы увидим позже в этом разделе, свойства rs дают возможность обосновать и интерпрети¬ ровать ранговые критерии в одно-двухфакторной схемах *. * Заменим Xt и Yt на Fx (Xj), F2 (Г*), где Fx (•), F2 (•) — функции распре¬ деления. Можно показать, что асимптотическое математическое ожидание rs равно W-l) {2Ft{y)-\}dF{x,y), где 2Fx (х)— 1 выбрано вместо Fx (х) для симметризации равномерного распреде¬ ления относительно 0. Приведенное выражение — обычный (product moment) коэффициент корреляции Fx (X) и F2 (Г). См. [303, с. 81]. — Примеч. пер. 212
При выполнении нулевой гипотезы о независимости ранги К-ов распределены равномерно на множестве всех перестановок п целых чи¬ сел. По результатам упражнения 4.5.15 можно заключить, что Ers = 0, var rs. = 1 /(/г — 1), причем (п—1 )1/2 rs асимптотически распределена, как лг (0,1)- От¬ сюда легко построить основанный на rs критерий проверки гипотезы. Об асимптотической нормальности статистики т при нулевой гипо¬ тезе говорится в упражнении 2.10.35 Б. Предлагается построить про¬ екцию и доказать асимптотическую нормальность этой статистики. Дисперсия равна varr = 2 (2п + 5)/[9л (п — 1)]; ясно, что она получена с помощью сложных выкладок. В теореме 4.4.2, доказанной в [95], приводятся весьма простые соображения, касающиеся полу¬ чения var т, и доказательства ее асимптотической нормальности, при¬ чем основой является рекурсивная формула для распределения т, подобная формуле из теоремы 3.2.3 для статистики Манна — Уитни — Уилкоксона, интерпретируемого как свертка. Теорема 4.4.2. Пусть X и Y независимы. Положим Р (S = s) = = рп (s), где S из (4.4.5) построена по выборке объема п. Тогда Рп (s) Рп-1 (s — 2j + n+ 1) п /= 1 при /t >3 и s = — я (я — 1)/2, я (я — 1)/2 и р2 (s) = 1/2 при s = — 1,1. Далее, ES = 0, var S = (п — 1) я (2я + 5)/18 и S/(var S)1/2 асимптотически распределена, как л (0,1). Доказательство. Предположим, Хг < ... < Хп,' так что нам надо рассмотреть лишь R1 Rn — ранги Yn. Пусть рп (s) — число таких перестановок 1, ..., л, что S — s. Эти перестановки можно пост¬ роить по 1, .... л — 1, добавив л. Именно Рп (S) = рп-1 (S + (я — 1)) + Рп_! (s 1 -{- + (л — 2)) + ... -f Рп-1 (s — (п —2) + 1) + + Pn-1 (S — (л — 1)). Напомним, что S =Р— Q, и рассмотрим (s + (п — 1)). Этот член строится при л, Rlf ..., Rn-i• Величина п в первой позиции дает добавку 0 к Р к п — 1 к Q. Отсюда S, вычисленное по Rlf ..., Rn-x уменьшается на п—1, если мы помещаем п вначале. Для получе¬ ния второго члена мы рассмотрим Rlf п, Rn-1- Здесь Р возраста¬ ет на 1, a Q убывает на п — 2. 213
Теперь мы можем записать Pn(s)= — /) — 0’—1)1 = /= i = S Fn-i[s — 2/ + Л+ 1]. /= i Поскольку все /г! перестановок равновероятны при независимости, Рп (s) = “ Рп (s) — п\ 1 п ~ 2 Рп-i [s — 2/-f-/г + 1]. п. /= 1 Очевидно, что р2 (s) = 1/2 при s = — 1,1. Пусть k = 2/ — az — 1; перепишем pn (s) в виде /?71 (s) — 7*71 —1 (s fe) • k Л Знак ' у суммы показывает, что суммирование ведется по k = = — м + 1, —/г + 3, ..., /г — 3, п — 1. Определим (/n (k) = 1/п при k = — л + 1, — н + 3, л — 3, п — 1 и 0 — в противном случае. Тогда рп (s) = 2 Рп-1 (s Щ Qn {Щу k где рп (s) — свертка двух дискретных весовых функций* и qn (см. определение АЗ приложения). Мы запишем рп = qn *pn-i• Прибегнув к этим доводам еще раз, мы показываем, что Рп=<7п*.-.*<78*/>2- Однако р2 = q2 , поэтому рп = qn * q2, и это означает, что S имеет такое же распределение, что и 2" Ziy где Z2, Zn — неза¬ висимые случайные величины, и Р (Z* = k) = Mi для k= — i + + 1, — i + 3, ..., i — 3, i — 1. Дисперсия S равна сумме дисперсий n var S varZj = 1=2 -2 T(i*_1)= = (/2 —1)л(2л +5)/18. * Т. e. двух плотностей распределения (в оригинале mass functions). — Примеч. пер. 214
Заметим, что EZt = 0, так что var Z\ = EZj = (i2 — l)/3. Так как Z2, - у Zn независимы, но не одинаково распределены, мы восполь¬ зуемся теоремой А6 для установления факта асимптотической нормаль¬ ности S/(var S) х/2. В обозначениях теоремы А6 приложения В2 =~ = 2" var Zi ~ п3. Поскольку \Zt \ i —1, Е [Zf / (I Z, | > еВп)} < (i- l)2 P(\Zt\> гВп) < <(i- l)2 (EZf)/z2Bl Таким образом, условие Линдеберга трансформируется в yE[ZfI(\Zi\>eBn)}^ ап Т V-W'-1) .JLn»-, О, ^ е2 В* ^ 3 е2 л6 поскольку по теореме А21 приложения 2"/4 = п (п + 1) (2п + + 1) (Зп2 + Зп + 1)/30 ~ пь. На этом доказательство заканчивается. Теперь мы приведем пример сравнения rs и т. Пример 4.4.1. Возьмем из «World Almanac» за 1982 г. сведения о результатах победителей в забеге мужчин на дистанции 400 м, 1500 м и в марафоне (данные занесены в табл. 4.5). Одинаковым наблюдени¬ ям мы присваиваем связанные ранги. Если читателю в расчетах встре¬ тится много связей, он должен обратиться к [102, гл. 3], поскольку различные формулы rs ( и т) уже не будут вычислительно эквивалент¬ ны. В нашем случае есть 2 связи в данных для дистанции 400 м, в в 1932 и 1948 гг., но они не сильно повлияют на вычисления. В табл. 4.6 мы приводим rs из (4.4.3) и т из (4.4.5). В круглые скобки заключе¬ ны величины rs/(var rs) 1/2 и т /(var т)1/2. Из таблицы можно заключить, что rs стремится быть численно больше, чем т. Однако в масштабе стан¬ дартных отклонений т дальше от 0, чем rs. М. Дж. Кендэл (см. [102, гл. 81) показал, что т (в отличие от rs) можно обобщить на случай частной корреляции; он указывает на заме¬ чательное свойство (по-видимому это лишь совпадение): форма част¬ ного коэффициента т та же, что и у обычного коэффициента корре¬ ляции. Именно Кендэл показал, что т xy-z = ■ (4.4.У) У 0~~'Txz) (1_~tyz) — частный коэффициент ранговой корреляции между X и Y при фикси¬ рованном Z. В предшествующем примере т1500, м = 0,695. Нас не удив¬ ляет, что время забегов олимпийских победителей уменьшается с го¬ дами. 215
Таблица 4.5 Время в секундах на Олимпийских играх Год 1896 1900 1904 1906 1908 400 м 1500 м Марафон1 54,2(20) 373,2(20) 3530(18) 49,4(16) 246,0(18) 3585(19) 49,2(15) 245,4(17) 5333(20) 53,2(19) 252,0(19) 3084(16) 50,0(18) 243,4(16) 3318(17) Год 1912 1920 1924 1928 1932 400 м 1500 м Марафон1 48,2(14) 236,8(14) 2215(14) 49,6(17) 241,8(15) 1956(11) 47,6(12) 233,6(13) 2483(15) 47,8(13) 233,2(12) 1977(12) 46,2(8,5) 231,2(11) 1896 (10) Год 1936 1948 1952 1956 1960 400 м 1500 м Марафон1 46,5(10) 227,8(9) 1759(9) 46,2(8,5) 229,8(10) 2092(13) 45,9(7) 225,2(8) 1383(7) 46,7(11) 221,2(7) 1500(8) 44,9(5) 215,6(2) 916(5) Год 1964 1968 1972 1976 1980 400 м 1500 м Марафон1 45,1(6) 218,1(4) 731(3) 43,8(1) 214,9(1) 1226(6) 44,7(4) 216,3(3) 740(4) 44,3(2) 219,2(6) 595(1) 44,6(3) 218,4(5) 663(2) 1 Фактически ное в табл. [ время на марафонской дистанции равно 2 часа + время, указан- Вычисления (см. табл. 4.5) показывают, что т150(Ь год =^тМ год = = — 0,832. Отсюда x1500t м.год = 0,009. Итак, при учете временного тренда уже нет тесной связи между временем бега на 1500 м и ма¬ рафонскую дистанцию. В настоящее время нет критериев значимо¬ сти для частного т*. Таблица 4.6 Ранговые корреляции Событие Критерий 4 00 м. Марафон 400м, 1500 м 1500 м, Марафон 0,940(4,10) 0,905(3,95) 0,878(3,83) г. 0,800(4,94) 0,695(4,29) 0,695(4,29) * См. [330], [347], [304], [315], [316]. Вероятно, есть и другие работы по этому вопросу. Библиографию можно найти в «Statistical Theory anb Method Abstracts» .за последние 6—8 лет. — Примеч. пер. 216
Вернемся к обсуждению соотношения между ранговой корреляци¬ ей и критериями для одно -и двухфакторных схем. Некоторые связи между ними очевидны. Например, критерий Пейджа (4.3.10) для аль¬ тернатив упорядоченности можно записать следующим образом: Выражение в фигурных скобках — числитель rs Спирмэна, найден¬ ного по i-й строке и гипотетическому упорядочению. Из (4.4.3), умножив и разделив (4.4.10) на 2* [/ — (k + 1)/2]2 = = k (k2 — 1)/12, получим где rt есть fs Спирмэна между 1-й строкой и гипотетическим упорядо¬ чением. Таким образом, Q означает степень согласия строк (или бло¬ ков) с гипотетическим упорядочением. Если нет особого упорядочения, с которым можно соотнести стро¬ ки, то мы можем рассмотреть средний коэффициент ранговой корреля¬ ции всех п (п — 1)/2 строк в двухфакторной схеме. Средний коэффи¬ циент ранговой корреляции — мера согласия строк, но она не показы¬ вает, какие из них согласованы. Запишем средний коэффициент кор¬ реляции Спирмэна: (4.4.11) k X ^[Rit— (k+ 1)/2] [Rjt—(fe+ 1)/2]). (4.4.12) Заметим, что {2 [Rn - (* + i)/2l}2 == 2 lRn~(k + i)/2]a+ +?2№,-(Н1)/2К«л- -(*+1)/2). (4.4.13) 217
Поскольку lRit — (k + 1) / 2]2 = nk (k2 — 1)/12 и левая часть (4.4.13) равна [R.t — п (k + 1)/2]2, (4.4.12) трансформируется в Гауе = n (n-l)k(k*-l) {2 lR t~ —n(k-{- 1)/2]2—nk (k2— 1)/121 - (4.4.14) Согласно этой формуле rave более удобно для вычислений, чем непосред¬ ственное вычисление п (п — 1)/2 корреляции, поскольку нам нужно знать лишь k сумм рангов по столбцам. Можно указать также связь предыдущего с К* Фридмена из (4.3.5). Мы имеем [/С*-(Л-1)1 (я—1) (Л—I) и, обращая это выражение, получим /С* = (п — 1) (Л — 1) rave + (k - 1). (4.4.15) Мы видим, что rave легко вычислить, а /С* Фридмена — линейная функция от гауе. Это значит, что /С* — количественная мера согла¬ сия строк (или блоков). При высокой степени согласия К* будет боль¬ шой, и гипотеза об отсутствии эффекта обработок отклоняется. Если п экспертов должны ранжировать k объектов, то данные об¬ разуют тот же двухфакторный план. В [102] эта задача называется зада¬ чей п ранжировок. Величина rave — мера конкордации или согласия (agreement)* экспертов. Кендэл ввел коэффициент конкордации k W = - У (R j—n (k + l)/2)\ (4.4.16) /г2 k (k2— 1) где R.j — сумма рангов /-го объекта. В упражнении 4.5.16 предлагается показать, что 0 < W < 1 и W = ^-r3ve + — , п п W = —!—к*. п(к- 1) Если нулевую гипотезу отсутствия конкордации среди экспертов интерпретировать как результат действия группы экспертов, назна¬ чающих ранги случайно, то мы можем отклонять нулевую гипотезу на приближенном уровне а при (Л-1)), * В книге Кендэла этот термин резервируется для парных сравнений. Тер¬ мин «concordance» чаще переводится как «конкордация», хотя иногда пишут «сог¬ ласованность». — Примеч. пер. 218
где Ха (k — 1) — критическое значение %2 с k — 1 степенями свобо¬ ды. Мы видели, что на самом деле W, rave и К* связаны линейными пре¬ образованиями, так что критерии значимости для них одни и те же и могут быть основаны на статистике К*, которая сравнивается непо¬ средственно с процентной точкой х2 *• У. Р. Шукени и Д. У. Фроли [167] обобщили понятие меры конкор- дации на случай задачи о согласованности ранжировок двух групп экспертов. Предположим, имеются 2 группы экспертов, каждого из которых просят проранжировать k объектов, и мы хотим узнать, есть ли согласие внутри двух групп и согласие между двумя группами. Пусть Ru, i = 1, ..., т\ j = 1, ..., k —ранги, назначаемые т экспертами из группы 1, и R' ц, i = 1, ..., я; / = 1, ..., k — ранги, назначаемые п экспертами из 2-й группы; /?./и R'.j, j = 1, ..., k — ранговые суммы объектов для каждой из них. Статистика Шукени— Фроли равна L*= 2 R.jR'i- (4.4.17) /=i Для нулевой гипотезы о равномерном распределении всех ранжиро¬ вок математическое ожидание и дисперсия приведены в упражнении 4.5.17; здесь же даны величины max L* и min L*. Обобщенный коэффициент конкордации двух групп экспертов, из¬ меняющийся от —1 до + 1, определяется так: г * FJ * W* = — — . (4.4.18) max L* — EL* Коэффициент W* получен из L* с помощью простых операций центри¬ рования и масштабирования в замкнутом интервале [—1, + 1]. Интуитивное обоснование W* (или L*) дается в упражнении 4.5.18, где предлагается показать, что п т <4'4Л9> /=1/=1 * Теорию двухфакторного дисперсионного анализа и теорию проверки сог¬ ласованности можно построить не только на rs Спирмена, но и на т Кендэла. Элементы ее можно найти в [283], [305], [251], [253], [356], [258]. Можно было бы развить это направление, воспользовавшись так называемым коэффициентом где l\k21 простого правила Спирмена: d (R, Q) = 1—22 | Ri — Q;| / — , Qj — ранги ранжировок R> Q соответственно, \х\ — целая часть х (см. 1246]): Выше автор обсуждает важную задачу проверки согласованности ранжиро¬ вок экспертов с помощью статистических ранговых методов, см. [324], [360], [348]. О нелинейных ранговых критериях см. [349]. Общие результаты, касающиеся распределения широкого класса статистик см. [362]. Для справок советуем обратиться к статье «Ранговая корреляция» Е. В. Кулинской в энциклопедии «Вероятность и математическая статистика».— М.: Сов. энциклопедия, которая выйдет в 1988. — Примеч. пер. 219
причем rtj есть rs Спирмэна для i-го эксперта группы 1 и /-го эксперта группы 2. Интерпретация W* такова: большие значения, около + 1, говорят о высокой степени согласия внутри обеих групп и высокой степени согласия между группами, малые значения, вблизи — 1, свидетельствуют о высоком согласии внутри обеих групп и сильной степени несогласия между группами, а значения коэффициента вблизи О указывают либо на несогласие внутри групп, либо на согласие внут¬ ри групп, но отсутствие связи между группами. Задача проверки гипотезы здесь не вполне применима, поскольку отклонение нулевой гипотезы о равномерности всех ранжировок при¬ водит к двум различным решениям. Предельное распределение дается следующей теоремой и также неудобно для применения. При фикси¬ рованном k предельное распределение при т, п-+ оо отлично от нор¬ мального. Однако для умеренных k существует предельное приближе¬ ние (обсуждение см. в [117]). Теорема 4.4.3. При нулевой гипотезе о равновероятности всех перестановок в строках и при фиксированном km, п оо k— 1 Т * FJ * D 1 т-1 L L -> — У Vi Wu VvarL* ~|A—1 i=\1 где Vl9 ..., Vft-i, Wly ..., Wh-X независимо распределенных, как n (0,1), случайных величин. Доказательство. Заметим, что согласно (4.3.3.) при cjN = 1 ——£L*) = -Lr(S-Jm i)/2)' -L-(U — Y mn ~Ym "l/я — in (fe+ l)/2), где S' - (R.l9 ..., R.k)9 U' = (R'.l9 ..., R[h), Г = (1, ..., 1). ER.j= = m (k + l)/2 и ER'.j = n (k + l)/2. По результатам упражнения 4.5.7 и теореме А1 —l-(L*-EL*)-^Z[Z2, у тп гдег^ есть MVN (0, В), i = 1,2, и В определяется из (4.3.4) при Cj =1. Векторы Ъг и Z2 независимы. Воспользовавшись (4.3.4), получаем 12 \ k I Пусть Y; = (\2j[k (&+ 1)]}1/2 Zj, i = 1, 2. Теперь Yf распределен, как MVN (0, I — (l/k) JJ'), и ковариацион¬ ная матрица идемпотентна с рангом k— 1, т. е. существует такая орто¬ гональная матрица Г, что вектор иг- = Г'Уг, i= 1,2, распределен, как MVN (0, D), где D — диагональная матрица с k — 1 единицами и од¬ ним нулем на диагонали. Это означает, что компоненты статистик их 220
и U2 — (k — 1)-независимые, одинаково нормально распределен¬ ные, как п (0, 1), случайные величины, и один из них равен 0 с веро¬ ятностью 1. Перепишем ZJ Z2 в виде Z,'Z2= М* + 1} Y| Y2 = =3 *(fe+1}.Ui Г' TU2 = =±it±}l^viwu /= 1 где определения Vl9 ..., Vh-ly Wly ..., даны в формулировке тео¬ ремы. Из упражнения 4.5.17 varL* = тп (k — 1) k2 (k + 1)2/144. Следовательно, k— i 1 —{L'-EL«)= 1 V V,W,. у .f (*-■)»■№+!)■ V*-i -i, V V 144 Теорема доказана. В теореме 4.4.4. мы построим производящую функцию моментов* для 2*-1 Vt Wt и обсудим предельное распределение. * Производящая функция моментов похожа на характеристическую функ¬ цию случайной величины X и играет ту же роль. Определение характеристической функции для случайной величины %х(9)=Ее‘ЧХ = '£е1ЧХ Р (х), 9GR1- X Определение производящей функции моментов для случайной величины X: Мх (s) = Eesx = 2 е$х Р (х) ■ X где s — любое комплексное число, для которого ряд сходится абсолютно, р (*) — вероятность, соответствующая значению дискретной случайной величины X. Другое определение производящей функции моментов для случайной вели¬ чины X (см. [248а, т. 1, с. 289—290]): оо мх (s)= 2 (mr/r0 sr, r=0 где mr = E (Xr) — момент r-го порядка случайной величины X, причем произ¬ водящая функция для X px(s)= 2 PnSn< п— 0 ряд сходится при s0 > 1, моменты тг существуют. Тогда ряд для Мх (s) сходится хотя бы для \s\ < log s0. О производящей функции и производящей функции моментов см. [237]v [212а], [285]. — Примеч. пер. 221
Теорема 4.4.4. Пусть Vlt ..., Vh-i, Wlf ..., — независимые, одинаково нормально распределенные, как п (0,1), случайные вели¬ чины. Тогда производящая функция моментов для = V'W равна М (t) = (1 — *а)-(*-п/2. Доказательство. Пусть V' = (Vlt ..., Уь-i) и W' = (Wl9 ..., Wk-i)- Для того чтобы найти воспользуемся условным математическим ожиданием. Однако услов¬ ное математическое ожидание — производящая функция моментов случайного вектора W, имеющего распределение MVN (0, I). Отсюда * так как V'V распределена по %2 (k — 1). Доказательство завершено. Заметим, что Следовательно, производящая функция моментов предельного рас¬ пределения равна Приближение действует при k -> оо; е-*2/2 — производящая функ¬ ция моментов для распределения п (0, 1). Поэтому стандартизованная статистика L* будет приближенно нормальна лишь для больших га, п и k. Л. Ли и У. Р. Шукени [117] предполагают, что при для больших га, п пригодно нормальное приближение. Но это странно, так как при малом га или малом п величина k не должна быть столь большой. Наконец, как пример предельного распределения, не являющегося нормальным, рассмотрим случай k = 3. Здесь М (t) = 1/(1 — t2). Это как раз производящая функция моментов для двустороннего экс¬ поненциального распределения с плотностью распределения f(x) = = e-l*l/2 при — оо < х < оо. Отсюда при k = 3 и га, п-+ оо где Z — случайная величина с двусторонним экспоненциальным рас предел ением. М (t) = Е (e*v'w) = = Е [Е (eiv'w | V = v)}, M(t) = £{*<**/2)V'v}_ "l/varL* ~[/k—1 Vk—i L*—EL* D ~|/var L* * См. [212а]. — Примеч. пер. 222
М. Холлендер и Дж. Сетураман [88] отметили, что У. Р. Шукени и Д. У. Фроли [167] не предложили верной нулевой гипотезы. Холлен¬ дер и Сетураман * переформулировали задачу и построили условно свободный от распределения критерий. Шукени дал комментарии к их работе. Выше мы показали, что критерии Фридмена и Пейджа для двух¬ факторного плана родственны ранговой корреляции Спирмена. Сей¬ час мы вернемся к однофакторному плану и изучим соотношение между ранговой корреляцией и статистикой Крускала — Уоллиса. Мы долж¬ ны заменить известный коэффициент корреляции смешанных момен¬ тов коэффициентом корреляции внутри группы (класса) (intraclass correlation coefficient) (см. [50, гл. 71). Потребность в подобной корре¬ ляции возникает тогда, когда отсутствует естественный способ упо¬ рядочить X и Y в паре X, Y. Например, если мы хотим в психологи¬ ческом тесте IQ** измерить корреляцию близнецов, то нет способа оп¬ ределить, какой из близнецов должен быть записан первым. Для заданных (Х1У Ух), ..., (Xky Yh)k дополнительных пар пост¬ роим пары (Yly Хг)у ..., (Yhy Xh) и вычислим смешанный коэффициент корреляции на 2k парах. Так уничтожается влияние порядка предъ¬ явления объектов в парах. Результат равен k '•-—Г* ; ^(Х,-М)* + 2(^-М)г 1 1 где М = (X + Y)/2. Таким образом, /7 в коэффициенте корреляции внутри класса заменяются на индивидуальные выборочные средние, а выборочные суммы квадратов на их средние. Рассмотрим одновыборочный план с п наблюдениями для каждой из k выборок. Выше мы обсуждали случай однофакторного плана с п = 2. В общем случае есть п (п — 1)/2 возможных пар для каждой обработки, и если мы добавляем пары с обратным порядком предъявле¬ ния объектов, то получаем п (п — 1) пары из каждой обработки. Внут¬ риклассовый коэффициент корреляции (interaclass correlation) транс¬ формируется в к г,= <=1 1<-'к— •, (4.4.20) (Л—1) S 2 <хн~Щ* t= 1 4=1 где М — общее среднее. * Описание метода см. в [231], [232]. — Примеч. пер. ** Речь идет о так называемом коэффициенте интеллекта. — Примеч. пер. 223
Внутриклассовую ранговую корреляцию в однофакторном плане получают, применяя г7 к nk рангам объединенных данных.В этом слу¬ чае М = (kn + 1)/2 и 22 (Rif —М)2 = nk (n2k2 — 1)/12, так что k 24 2 22(/?^“(A;ri+1)/2)(^-(^+1)/2) Rj = t=]_i<i (п— 1) nk (п2 k2 — 1) 12 ' к {n—\)nk(n*k?—\) «*.<«***—»)! (4.4.21) 12 О втором равенстве см. в упражнении 4.5.20. Если объемы выборок равны, то N = nk и из теоремы 4.2.4 следует, что У [Rj — n(N+ 1)/2]а = ”(*»*) («*+») 12 где Я* — статистика Крускала — Уоллиса. Значит, внутриклассовый коэффициент корреляции равен R,= — — (4.4.22) (rt— 1) (я*— 1) /1—1 V ’ Ц(л-1)Я, + 1]. П Таким образом, если внутриклассовый коэффициент ранговой кор¬ реляции велик, то степень согласия рангов при каждой из обработок высока. В этом случае статистика Кр>ускала — Уоллиса также будет велика и нулевая гипотеза об отсутствии влияния способа обработки будет отклонена. Заметим также, что Я* можно использовать для про¬ верки значимости внутригрупповой корреляции при большом п, так что здесь можно применять теорему 4.2.4. Поскольку Я* ^ 0, из (4.4.22) вытекает, что — 1/(п — 1) ^ Rf ^ 1. Из-за этой асимметрии необходима некоторая осторожность в интерпретации Я/. Известно аналогичное соотношение между статистикой F для однофакторного плана и г/. Если размеры выборок не равны, то так же можно вычислять внут¬ риклассовую корреляцию, однако упомянутая линейная связь между статистикой критерия однофакторного дисперсионного анализа и тj не сохраняется. 224
4.5. УПРАЖНЕНИЯ 4.5.1. Для доказательства теоремы 4.2.2 покажите, что cov (Vt, Vj)-> —ct cjl 12. 4.5.2. Проверьте, что Я* сводится к выражению, приведенному в утвержде¬ нии теоремы 4.2.4. 4.5.3. Проверьте, что верна формула дисперсии L, заданная (4.2.12). У/са- зание: 2*=1 [/ — (k + 1) /2]2 = k (k2 — 1) /2 и ft 1 ft ft 2 2 2 [*‘-(*+l)/2] [/-(A+l)/2] = -2 [<-(A + l)/2]*. /=1 /=/+1 /=1 4.5.4. Пусть J = 2 Ss. < • DTj-j задается посредством (4.2.13). Покажите, что при Я0 COV (ГUD, Wu()=cov №?<11)=/ги яю «г/12, cov (Г„„, r<lt)=cov (Гсц, Г„4) = —я„ „„ nt/\2. Указание. Заметим, что + Wut — статистика Манна — Уитни — Уил¬ коксона, вычисленная по и-й выборке по отношению к и-й и t-й выборкам, и var («7u0 + ";7ut)=var U7UB+var №u< + 2cov (Wuv, Wut). 4.5.5. Пусть у нас есть k выборок размера п, т. е. N = nk. Покажите, что L (4.2.11) можно записать в виде 1 1 XT' (&2 — 1) Таким образом, статистика L эквивалентна взвешенной сумме попарных стати¬ стик Манна — Уитни — Уилкоксона.* 4.5.6. Проверьте, что в (4.3.1) даны моменты для Ял, ..., R ^ в двухфактор¬ ном плане при нулевой гипотезе. 4.5.7. Пусть у вектора Т' = (7\, ..., 7\) / -й компонент Tj задается (4.3.3). Покажите, что при нулевой гипотезе предельное распределение Т есть MVW(0,B), где В определено в (4;3.4). Указание. Обратите внимание на то, что строки рангов в двухфакторном плане — независимые, одинаково распределен¬ ные векторы, так что можно прямо применить многомерную центральную пре¬ дельную теорему, обсуждаемую после теоремы А8 приложения. 4.5.8. Предположим, в двухфакторной схеме Xtj — независимые случай¬ ные величины с функцией распределения F (х — р — at — Pj/Я1/2), i = 1, ..., n, j = 1, ..., k. Пусть Qn = (p + ax + Pi/M1 /2, ..., p + aft + Pft/Я1^2) и Я t) = 4n' 4 4 V var R.j А. Так же, как и в теореме 4.2.6, покажите, что при Cjд. Cj E»N Ti -* cjVm/w-i) Jp (x) dx <p,-P), k где p = 2 Wk. .1 * Сравните приведенное выражение с формулой для статистики Терпст- ры — Джонкхиера 7=22 Wfj. Соотношение этих статистик аналогично соот- i < / ношению rs и т в теореме 4.4.2. — Примеч. пер. 8 Зак. 284 225
Б. Пусть CjN — (k — \)!k, покажите, что статистика Фридмена К* (4.3.5) асимптотически имеет нецентральное %2-распределение с k — 1 степенями свобо¬ ды и параметром нецентральности j * 8К< = 12 (j' р (х) dx)* - 2 (р, -р)^. 4.5.9. Покажите, что при k = 2 статистика Фридмена сводится к знаковой статистике. 4.5.10. Рассмотрим двухфакторный план с т наблюдениями в ячейке. Наша модель предполагает существование независимых случайных величин i= 1п, / = 1,...,&, / = 1, ..., т с функцией распределения F (х —р,— — at — Ру), F £ Q0. Мы хотим проверить Н0:^1= ... = pft против НА: эф¬ фекты Pl5 ..., Рь не все равны. Проранжируем данные внутри i-го блока, i = 1, ..., п, т. е. ранги меняются от 1 до mk. Пусть R j. —сумма рангов для i-и обработки, /= 1, ..., k. Покажите, что при Н0 ER j =пт (mk+ 1)/2, уаг R'h =пт2 (mk+ 1) (k—\)/\2 cov (R'U. , 7?. = — nm2 (mk + 1)/12. Далее покажите, что «■-2 (• j 1 4 *, \ f R.j-ER.j. ,= i ' • ' i ^ var *-/- 12 /t&m2 (т/г+1) i *vl- /=1 J 3/г (ш& + 1) асимптотически распределена, как %2 с k — 1 степенями свободы. Применение указано в упражнении 5.5.8*. 4.5.11. Покажите, что статистика Пейджа Q (4.3.10) имеет среднее 0 и дис¬ персию (4.3.11). Далее покажите, что статистика Q/(var Q)1^2 асимптотически распределена, как п (0,1). 4.5.12. Статистику J** (4.3.12) можно использовать для проверки альтер¬ нативы упорядоченности в двухфакторной схеме с несколькими наблюдениями в клетке. Допустим, есть k обработок, п блоков и пи наблюдений в клетке (/, /). Пред¬ положим, нулевая гипотеза tfo:0i = ...= 0& верна. Пусть ni% = по¬ кажите, что EJ »?/]/«■ var./-- 2 |»? <2»,. + 3)-Д + 72. Покажите, используя теорему А6, что статистика (J* — EJ*)!(var J*)1/2 асимптотически распределена, как п (0,1)*, если фиксированы и л->- оо. * Задача со многими наблюдениями в клетке весьма важна. См. [358], [334], [216]; обзор дан в [230], [231]. — Примеч. пер. ** См. также [356]. — Примеч. пер. 226
4.5.13. Сбалансированный неполноблочный план: критерий Дарбина [47]. В этой схеме имеется п блоков (экспертов) и i обработок; k ^ t обработок наб¬ людения ранжируются внутри каждого блока, каждая обработка появляется в г ^ п блоках, каждая обработка появляется в паре с любой другой обработкой равное число раз. Такие планы обсуждаются у У. Г. Кокрена и Г. М. Кокс [34]*. Пусть Rj— сумма рангов наблюдений при /-й обработке, /=1, Пока¬ жите, что при нулевой гипотезе ER f = r (&+ 1) /2, var R } =r (k2 — 1)/12, cov(tf.*- Я./) = -г (^2—1)/[12 (t— 1)]• Докажите, что при нулевой гипотезе D -а t , , , ч { R j—ER j Уvar R j J 3r (/-1) (k+\) k—l i= i асимптотически имеет %2 = распределения с k — 1 степенями свободы **. 4.5.14. Покажите, что верно (4.4.4). Указание. Разложите 21. п+ 1 D , п+1 у 2 * 2 ) ‘ 4.5.15. Предположим, что X и Y независимы, покажите, что var rs = 1/ l(n — 1), где rs из (4.4.4). Мы уже знаем, что Ers = 0. Пусть S* = 2"=1 /X X(Rj — (п + 1)/2) в (4.4.4). Покажите, что проекция равна Е [S*\Yk = y] = n [*_(л+1)/2] [Fy (у)-1/2], где (t/) — частная функция распределения Y. Покажите, что (п — l)1/2 rs асимптотически распределено, как п (0,1). Указание. Полезно записать ранг Yj в виде Rj = 1 + ^i=^jS(Yj — У^). Вычислите сначала Е [s (У / — YА — 1/2|У& = г/], а затем £ [Rj — (п + 1)/2| Ук = у1 4.5.16. Покажите, что коэффициент конкордации Кендэла удовлетворяет условию 0 ^ W ^ 1. Получите линейные функции, с помощью которых можно представить W, rave и К* одно через другое. 4.5.17. Покажите, что при нулевой гипотезе о равновероятности всех пере¬ становок для статистики Шукени — Фроли L* (4.4.17) Е1ъ rank (/г_+1)2 var L* 4 тп (k — l) k2 (k-\- l)2 144 * См. [249], где дан пример из [224, раздел 7] с подробным описанием; каталог планов см. [241, с. 169—292]. Планы называются BIB (Balanced Incomplete Block)]. — Примеч. пер. ** При небольших п следует применять точный критерий, основанный на точном (а не приближенном %2 (k — 1)) распределении статистики D (см. [358]). Небольшие таблицы процентных точек см. в [230], [231]. — Примеч. пер. S* 227
Далее, max L* = min L* = mnk (&+ О (^ + 2) 6 mnk (lfe+1) (26 + 1) 6 4.5.18. Проверьте формулу (4.4.19), которая связывает W* со средним из коэффициентов ранговой корреляции между двумя группами. 4.5.19. Покажите, что при нулевой гипотезе о равновероятности всех пере¬ становок статистика Шукени — Фроли L* некоррелирована со статистиками Фридмена /('{, Kt каждой из групп. 4.5.20. Получите формулу (4.4.21) аналогично тому, как была получена (4.4.14). 4.5.21. Предположим, что у нас есть две выборки размера п. Пусть U из (3.2.2) — сумма рангов в объединенной выборке для первой выборки. Пусть R — внутриклассовый коэффициент ранговой корреляции; покажите, что Эта формула дает нам соотношение внутриклассового коэффициента ранговой кор реляции и статистики Манна — Уитни — Уилкоксона.
Глава 5 ф ЛИНЕЙНАЯ МОДЕЛЬ 5.1. ВВЕДЕНИЕ. ПРОСТАЯ РЕГРЕССИЯ Теперь мы вернемся к линейной модели. В этой книге мы сосредо¬ точили внимание на моделях с набором независимых переменных Yl9 Y-n с функцией распределения F (у —0!), F(y—0N) соответственно, причем F£Q0. Основные задачи формулируются как задачи проверки гипотез и оценивания параметров положения 0А, 0^. В одновыборочной сдвиговой модели неизвестные параметры положения одни и те же: 0Х = ... = QN = 0. В двухвыборочной сдвиговой модели 0Х = ...= 0т = |хь 0т+1 = ... = 0дг = р2> а внимание сосредоточивается на Д = щ — р2. В однофакторном плане двухвыборочная модель обобщается на несколько выборок. При двухфакторном плане удобнее всего использовать двойной индекс наб¬ людений, указывающий на два фактора, например, на обработку и блок. Таким образом, мы имеем Yijt i = 1, ..., n, j = 1, ..., k сфунк- цией распределения Ft (у — 07). В этой главе нас интересует частный случай Ft (у — 07) = F (у — 0^), причем nk наблюдений не¬ зависимы. Данные можно представить в виде таблицы с двумя входа¬ ми, в которой с помощью индекса i нумеруется каждая из п строк (бло¬ ков), а с помощью индекса /—каждый из k столбцов (обработок). В этом случае аддитивная двухвходовая модель записывается в виде Qtj — = р Н-а* + Pjy i = 1, ..., rt\ j = 1, ..., k. Гипотезы формализу¬ ются посредством эффектов обработок р1? ..., с р и а1у ..., ап, кото- рые рассматриваются как мешающие параметры. В предыдущей гла¬ ве, обсуждая двухфакторные планы, мы не оценивали параметры с по¬ мощью ранжирования внутри блоков. Формула (4.3.9) указывает на потерю эффективности при таком ранжировании. В этой главе разви¬ ваются методы, позволяющие устранить потерю эффективности, однако они непараметрические лишь асимптотически. В общей линейной модели у нас есть вектор Y' = (Yl9 ..., Yn) независимых наблюдений с функциями распределения F (у — 0Х), ..., F (У — 9w)» Оо. Штрих означает транспонирование вектора. Ус¬ ловие линейности, налагаемое на 0Ь означает, что параметр есть ли¬ нейная функция от р заданных независимых переменных xilf ..., xip. * См. (1.1.2). — Примеч. пер. 229
Отсюда 0i = *(i Pi+ Р„. (5.1.1) Коэффициенты p1( ..., P;, — неизвестные параметры. Если мы обозна¬ чим соответствующие векторы х) = (.г, xip) и Р' = (Plf РР), то можно записать 0« = х/ Р- (5.1.2) Мы можем также записать Yt = 0, 4- еь = х,- р + ег, где е' = = (е,,..., eN) — вектор, состоящий из независимых, одинаково рас¬ пределенных случайных величин с функцией распределения F£Q0. Пусть X— (N Хр)-матрица, где — i-я строка. Теперь в мат¬ ричных обозначениях линейная модель транспонируется в Y =хр + е. (5.1.3) Эта общая линейная модель охватывает планы регрессии, дисперсион¬ ного анализа и ковариационного анализа (примеры см. в разделе 5.4.). Если X — (N • 1) -вектор из единиц, то мы приходим к одновыбо¬ рочной сдвиговой модели*. Если мы возьмем -В •j где второй столбец состоит из п единиц, то у нас получается двух¬ выборочная модель спи N — п наблюдениями в соответствующих выборках. В этом случае 0* = Pi + Р2 ПРИ * 1, •••» п и 0* = Рх при i = п + 1, N, А = р2**. Пусть где каждая малая единица означав п обычных единиц. Это дает нам план двухфакторной схемы с двумя обработками, двумя блоками и п наблюдениями в клетке. В этом примере 0П = Рх + Р2 + Рз> 0х2 — Pi “Г Р2 Рз> ®21 = Pi Р2 “Ь Рз И ®22 = Pi Р2 Рз так, что pi соответствует общему среднему (grand mean), 2 р2 представ¬ ляет собой изменение при переходе от первого ко второму блоку, 2рз * Т. е. р=\, Y = (1...1)' ■ (Pi) = {(Nx 1) (1x1)] = (Pi, Pi)' = {(Nx 1)] в квадратных скобках — размеры. — Примеч. пер. ** О линейной модели см. [236], [114], [24], где наряду с допущениями об¬ суждаются частные случаи р — 1,2 и др. — Примеч. пер. 230
представляет собой изменение в уровнях обработки. Гипотеза об от¬ сутствии эффекта обработки есть Н0: рз = 0. Н. Дрейпер и Г. Смит [45, гл. 9] обсуждают множественную регрессию, обращаясь к задачам дисперсионного анализа, причем особое внимание уделяется схеме с двумя входами. (См. пример 5.4.2, где показана работа с данными.) Прежде чем мы обратимся к изучению задачи оценивания и провер¬ ки гипотез в линейной модели, обсудим простую регрессионную мо¬ дель *. В этом случае Yt = Pi + xt р2 + eiy i = 1, ..., N. Независи¬ мые переменные хъ ..., xN —заданные числа, поэтому мы сосредо¬ точим внимание на неизвестном параметре наклона р2. Обычный кри¬ терий Н0 : Р2 =0 против На : Р2 Ф 0 основан на статистике — — x)Yt. Как и в предыдущих главах, мы приходим к статистике рангового критерия где Rx, ..., RN — ранги Yly ..., YN. Мы отклоняем Н0 : Р2 =0 при экстремальных значениях U. Нам потребуются моменты статистики U и ее асимптотическое распре¬ деление при #0 : Р2 = 0 — те и Другие для приближения крити¬ ческих значений. При Н0 •Р2 — 0 YХу ..., Yn — независимые, одинаково распре¬ деленные случайные величины с функциями распределения F (у — Следовательно, упражнение 3.7.1 дает нам теорию распреде¬ ления Rl9 .^, Rn. Теперь EU = 0, а дисперсия U задается формулами где мы используем тождество 0 = [2 (xt — х)]2 = 2 (xt — х)2 + + 22;^- (*г — x)(xj — х). В теореме 5.1.1 мы получим проекцию статистики U и обсудим пре¬ дельное распределение U. * Автор пишет о линейной модели и регрессионном анализе. На русском язы¬ ке имеется ряд книг по этим вопросам, помимо упоминавшихся книг в сноске на с. 400. Это [45], [238], [210], [197], [222]. По этим книгам читатель может соста¬ вить представление об этом важном направлении статистики. — Примеч. пер. N (5.1.4) (N +1) 12 (5.1.5) 231
Теорема 5.1.1. Пусть в простой регрессионной модели верна Н0 : р2 = 0 и 1 N — 'У (xt — х)2-^ 62> 0. Тогда 1 * и* =- У (Xt-x) (Ri-(N + 1)/2) -»• Z - п (0, б2/12). (N + \)Vn Доказательство. Соображения здесь аналогичны тем, что приводят¬ ся в теореме 3.2.4 и в упражнении 4.5.15 как частном случае. Для на¬ чала мы заметим, что ранг Yj относительно Yly ...yYN можно записать так: Rj= 1+ 2 s(Yj-Yt)9 i= i где s (*) = 1 при х > 0 и 0 — в противном случае. Тогда, поскольку ( F(y), k = U £[5(^-Уг)|П = «/]= 1 ~F(y), k=i, [ 1/2, fe^/или/, получаем Е [Rj I Yh = у] = 1 + 2 E [s (Y}~ Yt) | Yh = y) = i= 1 l + (N-l)F(y) k = i 1 + (N— 2)/2 + (l —F (у)), кф\. -! Теперь, благодаря несложным преобразованиям, мы имеем Е [U* | Yh=y] = — |2 (xj-x) [ U2-F(y)] (n+i)Vn 1/7* + (xh-x) [(N— 1) F (y) -(N- l)/2]j = (xh — x) F(y)~ 4 ] (N + 1) Таким образом, проекция Vp статистики U* равна VP = -nj&T 2 (П)-1/2]. k= 1 Поскольку F (Y h) — равномерно распределенная на интервале (0,1) 232
случайная величина с математическим ожиданием 1/2 и дисперсией 1/12, мы получаем м N _ 1 var Vp = - У (xh — x)*^—6*. Р 12 (N +1)2 12 Из (5.1.15) var U* -> 62/12, так что согласно теореме о проекции 2.5.2 Е (U* — Vp)2 ->■ 0. Итак, U* и Vp имеют одно и то же предельное рас¬ пределение. Из теоремы А10 приложения следует, что Vp (и с ней {/*) асимптотически нормально распределена, как п (0, б2/12). Результаты теоремы можно переформулировать так: f//(vаг £/)1/2 асимптотически распределена, как п (0,1). Следовательно, Н0 : р2 = О отклоняется в пользу НА : р2 Ф 0 на приближенном уровне а при \U\> Za/2/(vаг U) V* и 1 - Ф (Za/2) - a/2. Для того, чтобы обсудить оценивание р2, введем t/(P2) = S(xl-jT)/?l(Wf (5.1.6) где 7?f (р2) — ранг Vg — рх — хф2, i = 1, ..., N. Заметим, что ранг Rt (Р2) — инвариант относительно изменения Рх и его можно вычислять при рх = 0. Если р2 — истинная величина параметра, то EU (Р2) = 0. Отсюда следует, что оценка Ходжеса — /N Лемана р2 есть такое значение р2, что U (Р2) = 0. Дж. Н. Адичи [1], [2] впервые ввел ранговые оценки для простой регрессионной моде¬ ли. За исключением случаев одновыборочных и двухвыборочных за¬ дач для оценки р2 нет простого представления, и ее надо искать с по¬ мощью численных методов. Для того чтобы выбрать необходимые численные методы, рассмот¬ рим график U (р2) как функции от р2. Пусть хг <С х2 < ... < хц. Если р2 = (Yj — Y— Xi), j > i, тогда Y} — Xj p2 = Yt — x&2 и эти остатки получат средние ранги. Если, напротив, Р2 С (Y j— Y\)! (xj — xt), то Yt — х&2 CYj — х$2. Предположим, что р2 так близка к этому наклону *, что ранг Yj — х7р2 на единицу больше, чем ранг Yt — х?Р2. Как только р2 из¬ меняется и пересекает этот наклон так, что (Yj — Yi)/(xj — xt) < Р2, ранги Yt—xt р2 и Yj — х;Р2 меняются величинами. Это говорит о том, что U (Р2) — убывающая ступенчатая функция, кото¬ рая делает скачок в точках N (N — 1)/2 попарных наклонов. Едва лишь р2 станет ниже (Yj — Уi)!{Xj — xt), ранги Yt — xt p2 и Yj—Xj p2 становятся равными Rt (P2) и Rt (p2) + 1 соответственно. Они входят в U (Р2) как (xg — х) Ri (р2) и (xj — x) lRt (Р2) + 11. Изменение i/JP2) при пересечении р2 этого наклона равно (xt — х) Rt (Р2) + (xj — х)Х (Р2) +П — {(xi—х) tRi (Рг) + П + (xj — х) Ri (Р2)} = Xj — Xj. * Речь идет о величине (У/ — Yi)/(*j — *i), называемой в оригинале «slope». — Примеч. пер. 233
Таким образом, U (Р2) уменьшается на величину Xj — xt на накло¬ не (Yj — Yi)!{Xj — Xi). Этим наш случай отличается от случая, когда надо применять одно- и двухвыборочные модели, для кото¬ рых шаг постоянный на разностях Уолша и попарных различиях соот¬ ветственно. Эти переменные величины размера шага — результат применения взвешенной медианы в качестве оценки р2 (см. [94]). Простой способ вычисления состоит в следующем: упорядочить на¬ клоны и построить шаги размера Xj—xt. Тогда, начиная с max U (Р2) = = 2 (xt — х) i, «накапливаем» шаги до тех пор, пока U (Р2) не пере¬ сечет ноль или шаги не попадут в нулевой интервал (см. пример 5.1.1; сравните с материалом из разделов 1.5, 2.3 и 3.2). В разделе 5.4 есть дальнейшее обсуждение вычислений. Будем рассматривать статис¬ тические свойства р2 в рамках общей линейной модели из раздела 5.2, где показано, что jV1/2 (р2—р2) распределена асимптотически нормально. На первый взгляд естественной оценкой р2, основанной на U (Р2), будет медиана попарных наклонов. Это, однако, в общем случае не так, как показано было ранее. Из упражнения 5.5.1 следует, что эта оценка основана на т Кендэла (см. обсуждение в [171]). Наконец, заметим, что из-за инвариантности рангов по отношению к сдвигу на постоянную величину, представленный подход не дает нам оценку или критерий для рх как параметра пересечения (intercept parameter)*. Естественная оценка рх— медиана остатков Yx — /ч /ч — •••» Yn —%n р2, обозначаемая рх; если же мы предполагаем симметрию F, то в качестве оценки берется медиана средних Уолша хч /ч остатков**. Совместное распределение 7V1/2 (Р2, р2)' описано в конце раздела 5.2. Пример 5.1.1. Закон Хаббла (Hubble) в астрономии гласит: скорость удаления галактики прямо пропорциональна расстоянию. Следователь¬ но, если один раз оценить отношение скорости к расстоянию, то удале¬ ние галактики можно предсказать по оценке расстояния. В табл. 5.1 мы приводим расстояние в миллионах световых лет и скорость в сотнях миль в секунду для И галактических созвездий (galactic clusters) из [33, с. 337]. Если х — расстояние, у — скорость, то нам нужно подо¬ гнать модель Y = $х + е к данным. Отрезок на оси ординат должен быть нулем. График скорости (у) как функции дистанции {х) показы¬ вает зависимость, близкую к линейной. Задача довольно проста, и мы используем данные для того, чтобы показать, как ведет себя (У (Р) = 2 (.хг — х) Rt (Р), где Rt (Р) — ранг Уг — хф. Величина таxU (р) = 2 (xt — х) i равна 10 320. Имеется * Intercept — отрезок, отсекаемый на координатной оси. — Примеч. пер. ** Т. е. f^med {(К*-*, Р2 + К,-*/?2)/2}, (см. раздел 2.3)—Примеч. пер. 234
Таблица 5.1 Созвездие* Расстояние (*) Скорость (У) У/х Дева (Virgo) 22 7,5 0,341 Пегас (Pegasus) 68 24 0,353 Персей (Perseus) 108 32 0,296 Волосы Вероники (Coma Berenices) 137 47 0,343 Большая Медведица (Ursa Major No. 1) 255 93 0,365 Лев (Leo) 315. 120 0,381 Северная Корона (Corona Borealis) 390 134 0,344 Близнецы (Gemini) 405 144 0,356 Волопас (Bootes) 685 245 0,358 Большая Медведица (Ursa Major No. 2) 700 260 0,371 Гидра (Hudra) 1100 380 0,345 * См., например: Р е й Г. Звезды. Новые очертания старых созвездий / Пер. с англ.; Под ред. К. А. Любарского. — М.: Мир, 1969. — 168 1 с. — Примеч. пер. 11(10)/2 = 55 попарных наклонов*, начиная с наименьшего 0,187 для Льва и Северной Короны при «скачке» расстояний 75. При 23-м наклоне график U ((5) изменяется скачком от 332 до —90. Отсюда (3 = = 0,353, что близко к среднему отношению 0,350. Оценка |3, которая соответствует т Кендэла (см. упражнение 5.5.1), равна медиане 55 на¬ клонов. Она в данном случае равна 0,359, т. е. 28-му наклону. Оценка наименьших квадратов равна 0,353. В разделе 1.6 мы ввели понятие кривой влияния оценки; у робаст¬ ных оценок кривые влияния ограничены, так что одно наблюдение не может оказывать бесконечно большое воздействие на оценки. При¬ меры 1.6.4 и 2.4.2 показывают нам, что обычная медиана наблюдений и медиана средних Уолша в отличие от выборочного среднего имеют ог¬ раниченные кривые влияния. При обсуждении (1.6.1) затрагивается соотношение кривой влияния и асимптотической дисперсии оценки. Теперь мы обсудим кривые влияния для метода наименьших квад¬ ратов и ранговых оценок параметра наклона в линейной регрессии. С небольшими изменениями результаты из раздела 1.6 можно распро¬ странить на случай общей линейной модели, поэтому мы не пов¬ торяем обсуждение в общем случае. Р. Д. Кук и С. Уэйсберс [38] детально описали использование кривых влияния и их конечновы¬ борочных двойников в диагностическом анализе данных с помощью линейной модели. * (yj — y{)Kxi — xi), 1 < i < j < N = 11. — Примеч. пер. 235
Напомним, что простая линейная модель записывается в виде Y\ = = Pi + х$2 + ei, i = I, Предположим, что независимые пере¬ менные центрированы таким образом, что х = 0, общность при этом не теряется. Определим V®2)=N-12xi(yi-xifo), (5.1.7) тогда оценка наименьших квадратов равна р2 = 2 *^/2 xf и есть решение V (Р2) = 0. Пусть H# (х, у) — эмпирическая двумер¬ ная функция распределения, тогда (5.1.7) можно записать в виде К фй) = j 5 X (у-хЪ) dHN (х, у), (5.1.8) так как Ни (х, у) «приписывает» вес N~l точкам (xiy yt), i = 1, ..., N. Для фиксированного значения х F (у — рг — р2х) представляет со¬ бой условное распределение Y при заданном X = х. Мы немного обоб¬ щим эту задачу и будем рассматривать х как реализацию случайной ве¬ личины X с частной функцией распределения М (х). Совместное распре¬ деление X и Y обозначается Н (*, у). Параметр р2 можно определять как решение р2 = Т (Н) уравнения ^x[y-xT(H)]dH(x,y) = 0, (5.1.9) и при замене Н на Ни (5.1.8) трансформируется в V (Р2) — 0. Для вычисления кривой влияния мы заменим Н на ее вариант с за¬ грязнением (contaminated version) Ht (X, у) = (1-0 Н (х, у) + (*, у), (5.1.10) где бХо Уо (х9 у) «помещает» единичную массу в точку х0, у0, и будем диф¬ ференцировать по t (см. определение 1.6.4). Подставив Ht в (5.1.9), получим ^x[y~xT{Ht))d[H (х, у) +1 (6,..,. (х, у) — Н(х, у))} =0. (5.1.11) Продифференцируем по t и положим t = 0: + j § X [у-хТ (Я)] d {б,..,. (х,у)-Н(х,у)\=0. (5.1.12) Вследствие этого кривая влияния при х = х0 и у = у0 будет выглядеть так: Q(*0, Уо) = 4- T(Ht)\t=0 = Xliyo~X^2) ■ (5.1.13) dt J х2 dM (x) где j* j x2dH (xy y) = J x2dM (x). Кривую влияния можно получить бо¬ лее прямым методом из формулы для р2. Мы применим этот метод, по- 236
скольку он дает нам схему получения кривой влияния ранговой оцен- кй р2* Анализируя (5.1.13), можно заметить, что оценка по методу на¬ именьших квадратов имеет неограниченную «кривую влияния по на¬ правлениям х и у». Поскольку влияние не ограничено, то либо экстре¬ мальное значение ху либо большой остаток окажут большое воздействие на оценку. Здесь обобщается случай неограниченного влияния для вы¬ борочного среднего, который дан в примере 1.6.4. Уравнение, определяющее /?-оценку, задается выражением (5.1.6). Мы введем множитель N~2 для того, чтобы получить уравнение, опре¬ деляющее параметр (32- Следовательно, мы рассмотрим Поскольку х = 0, величина 1/2 не изменяет уравнение, а дает более удобное центрирование для последующего получения кривой влияния. Далее, поскольку ранг не зависит от plf мы можем положить — О, общность при этом не теряется. Теперь, поскольку Rt (Р2) = NFmX X(yt—*ip2), где Fn (•)—эмпирическая функция распределения для остатков yt —*fp2, i = 1, ..., Ny мы имеем где Нм каждой точке (xiy yt)y i = 1, ..., N «приписывает» массу N~l. Пусть р2 = Т (Я), где Я (х, у) — совместная функция распреде¬ ления X и У, как описано в предыдущем обсуждении оценки наимень¬ ших квадратов. Тогда уравнением, определяющим р2 = Т (Я), будет Вариант Я с загрязнением задается выражением (5.1.10). Заметим, что Ьх0,у0 (X, у) = ЬХо (х) 6Уо (у), так что при xQy у0 мы имеем вырожден¬ ную функцию распределения с такими же множителями, как в незави¬ симых вырожденных функциях распределения. Вариант с загрязнени¬ ем функции распределения Y при X = х есть При следующих вычислениях мы предположим, что у М (х) скачок Ьх0 отсутствует. Это разумно, поскольку если М (х) — мера на плане, позволяющая назначить массы А/""1 каждой точке xiyi = 1,..., ..., Я, то точке выброса х0 соответствует нулевая масса. Теперь мы должны подставить Ft и Я* в (5.1.16), дифференцировать по t и положить t = 0. Сначала мы получаем (5.1.14) j j x[FN(y — *р2)— l/2]d.HN(x, у) = 0, (5.1.15) ^x[F(y~xT(H))-l/2)dH(x, у) = 0. (5.1.16) / —лгр2), если jc Ф х0, V. (у), если х = х0. (5.1.17) (l-t) ^ x[Ft (у~хТ (Ht))~ 1/2] dH (х, у) + +1 j j x [Ft (y-xT (Ht)) - 1 /2] d6x„v, (x, y) = 0. 237
Согласно (5.1.17) (\-t)^x[F{y-xT (Я,))- 1/2] dH (х, у) + + tx0[Ft (уо—х0 Т (Я,))— 1/2] = 0. Дифференцируя и используя (5.1.16), получаем ~^4r-[=Mx4{y-xT{H))dH{x'y) + + хо (Г (Уо — х0 Т (Я)) — 1/2] = 0. После замены Т (Н) на р2 кривая влияния, вычисленная в точке х0у у0 принимает вид Q (Хо, Уо) = ■■■•** (Уо—-»С6Р«)—1/2] . (5Л. 18) j* J -Ж2 / («/—x$z)dH (х, у) Напомним, что Н (ху у) строится по частной функции распределения Ху М (х) и условной функции распределения Y при заданной X = ху F (У — х$2)- Следовательно, fjx*f (у-х|32) dH (х, у) = j J X2 / (у-х$2) dF (у-Хр2) dM (х) = = j *2 j Р (У — хР>2) dydM (х) = = J х2 dM (х) j* /2 (и) du. Результат в последней строке получается при замене переменной и = у — х$2 под знаком интеграла, причем интеграл теперь не зави¬ сит от х. Теперь (5.1.18) трансформируется в Q (х0, уо) = -°[F-Уо~х°Рг)~ ‘/2] • (5.1.19) | f2 (и) du j х2 dM (х) Эта кривая влияния похожа на кривую влияния для медианы сред¬ них Уолша в одновыборочной (см. 2.4.6). Величина влияния ограниче¬ на для относительно больших величин или экстремальных остатков. Однако величина влияния не ограничена по отношению к точкам плана. Точки экстремального плана (иногда они называются точками с высокой «подъемной силой» (high leverage points) (см. [91], [38])) могут оказать большое воздействие на R-оценки. Отсюда мы заключаем, что R-оценка робастна относительно отклоняющихся остатков, но не робаст¬ на относительно отклонений величин х. То же самое происходит в общей линейной модели; это можно оставить как упражнение для случая, когда параметры оцениваются при наличии точек с высокой «подъемной силой». (О регрессии с ограниченной «подъемной силой» см. [92].). Мы видели, что линейная модель включает в себя большое число важных моделей. В следующих разделах мы изучим эти модели как ли¬ нейные. В предыдущих главах мы сначала вводили статистики крите- 238
pWeB, а затем на их основе строили оценки. Теперь мы обратим этот подход и сначала займемся задачей оценивания. После этого мы про¬ анализируем три подхода проверки гипотез. Наконец, в разделе 5.4 ме!тод будет проиллюстрирован. \ 5.21 РАНГОВЫЕ ОЦЕНКИ В ЛИНЕЙНОЙ МОДЕЛИ 1 \Мы усовершенствуем обозначения линейной модели (5.1.3), в яв¬ ном виде выделив параметр пересечения ( intercept parameter)* из чис¬ ла регрессионных параметров. Примеры раздела 5.1 содержат параметр пересечения — часть необходимого плана. Положим Y = [lX](“) + e, (5.2.1) где Y — (NX 1)-вектор наблюдений, 1 — (NX 1) -вектор-столбец из единиц, X — (Л^Хр)-матрица известных регрессионных постоянных, а— скалярный параметр пересечения, Р—(рх1)-вектор неизвест¬ ных регрессионных параметров, е —(Л^Х 1)-вектор независимых, одинаково распределенных ошибок ** с функцией распределения F £ Q0. Таким образом, медиана распределения Yt равна а + хф, где х1 — i-я строка X. Центрируем матрицу X, вычитая из нее столбец средних, что дает ХС=Х—1 (х1у ..., лгр), где xt — среднее i-го столбца X. Тогда (5.2.1) можно записать в виде Y = [l Хс]^*) + е, (5.2.2) где а* = а + *Р и х' = (хг, ..., хр). Теперь подпространства, натя¬ нутые на 1, и столбцы Хс ортогональны. Отсюда следует некоррелиро¬ ванность оценок а* и р подобно соответствующим оценкам наименьших квадратов. Мы сосредоточим усилия на оценивании р и проверке ги¬ потез о нем. Оценивание Р, производимое отдельно от оценивания а* или а, выполняется путем минимизации меры рассеяния остатков. Строение этих мер описано следующим определением. Определение 5.2.1. Пусть D (•) — мера изменчивости (measure of variability), удовлетворяющая следующим двум свойствам: 1) D (Z + -f 1 а) = D (Z) и 2) D (—Z) — D (Z) для любых (Nx 1)-вектора Z и ска¬ ляра а. В этом случае D (•) называется четной, свободной от сдвига мерой рассеяния (location-free measure of dispersion). Если D (•) — четная функция, свободная от сдвига, то D (Y — 1а — — ХР) = D (Y — 1а* — Хср) = D (Y — ХСР) = D (Y — ХР). Та¬ ким образом, работая с D (•), мы можем использовать X или Хс, * Т. е. расстояние от нуля до точки пересечения оси ординат линией регрес¬ сии. — Примеч. пер. ** Т. е. случайных величин. — Примеч. пер. 239
не изменяя результаты. Поэтому мы будем обозначать меру изменчи¬ вости либо как D (Y — ХР), либо как D (Y — ХСР). Минимизируя D (Y — Хр) как функцию р, мы будем, используя (различные) D (•), получать оценки р. Например, если D (Z) = (Z — 1Z)' (Z — 1Z), где Z = ZZJN, то D (Y - Хср) = (Y — ХСР)' (Y - Хср)+ NY\ Полученная оценка р — обычная оценка наименьших квадратов. Наша цель — определить четную, свободную от сдвига меру рас¬ сеяния, порождающую ранговую оценку р. Эту оценку можно рассмат¬ ривать как обобщение оценки Ходжеса — Лемана для двухвыбороч¬ ной сдвиговой модели на регрессионную модель (см. пример 5.2.1). Пусть а1 < ... < адг — последовательность, не состоящая из по¬ стоянных, причем ак + ам-k+i = О- Они могут быть построены по функциям, порождающим метки (гл. 3; пример см. в определении 3.4.2). Л. А. Джекл [94] определил следующую меру разброса вектора Z' = (Zlf ..., zNy. D(Z)= 2 a(i)Z{il, (5.2.3) Х=1 где Z(d < ... < Z(N). Далее, если Rl9 ..., Rn— ранги Z2, ..., ZN, мы также можем записать D(Z) = 2 a(Ri)Zu (5.2.4) i = 1 где одинаковым значениям Z мы присваиваем средние метки. Определение 5.2.2. Ранговой оценкой (R-оценкой) параметра р на¬ зывается такое значение Р, которое минимизирует D (Y-ХР) = 2а [R (Yt - х/ Р)] (Yt -х/ р), (5.2.5) где X/ — i-я строка X и R (Yt — х$) — ранг Y t — x# относитель¬ но уг — х;р, ..., yn — х^р. Эта четная, свободная от сдвига мера — линейная, а не квадратич¬ ная функция остатков, причем коэффициенты определяются рангами или размером остатков. Таким образом, можно надеяться, что получен¬ ные по (5.2.5) оценки будут более устойчивы (робастны), чем оценки на¬ именьших квадратов, поскольку влияние выбросов (outliers) входит в (5.2.9) линейным, а не квадратичным способом. Теорема 5.2.1 по¬ казывает, что D (Y — ХР) — подходящая мера рассеяния. Теорема 5.2.1. D (Y — ХР) — неотрицательная, непрерывная и выпуклая функция р. Доказательство. Пусть Zt = Yt — х'р, i= 1, ..., N. Предпо¬ ложим, величина t такова, что а (1) < ... <а(^—1)^0^ а (t) < ^... < а (N). Тогда d(z) = 2 ° (о (£</)—ад. i= 1 240
Цк как 2а (i) Z(c) = Z(i) 2а (i) = 0. Теперь, поскольку каждый устъ р = (р (1), р (N)) — перестановка 1, N, определим Это значит, что D (Y — Хр) — максимум конечного множества линейных функций. Отсюда следует, что D (Y — ХР) — непрерыв¬ ная и выпуклая функция от р. Кроме того, JL А. Джекл [94] заметил, что если Хс — матрица пол¬ ного ранга, то D (Y — ХР) достигает минимума, и множество р, для которого эта мера достигает минимума, ограничено. Следовательно, в качестве оценки из определения 5.2.2 можно брать любое значение, минимизирующее D (Y — ХР). Область (пространство Р) для D (Y — ХР) можно представить в ви¬ де конечного числа выпуклых многоугольных областей, на каждой из которых D (Y — Хр) — линейная функция р. Частная производ¬ ная (градиент) D (Y — ХР) существует почти всюду и задается фор¬ мулой при / = 1, ..., р. Во втором равенстве мы используем условие 2,ah=0 для построения центрированного плана. Таким образом, для каждого / = 1, ..., р отрицательная величина частной производной от рассея¬ ния равна регрессионной ранговой статистике: Если мы обозначим через VD (•) градиент D (•) и положим S' (Y — - Хр) = (S, (Y - Хр), ..., Sp (Y - Хр)) , то аналогом линейных 241 чЛен a (i) [Z(i) — Z(t)] > 0, то D(Z) = D(Y— XP)>0. N i = 1 еорема 368 из [71] гласит: N N шах 2 a(i)Zp{i)= ^ a(0Z(o, N D( Y-XP) = max V a (i) (Yp{i)-x'p{i) p). p i= l N = (xtj-4)alR(Yt-xi№ (5.2.6) N Sj (Y — XP) = 2 (Xij-xjjalRiYt-xi p)]. (5.2.7) i= 1
нормальных уравнений наименьших квадратов будет система нелиней¬ ных уравнений —\D (Y —Хр) = S (Y — Хр) = 0. (5.2.8) Равенство нулю — приближенное, поскольку по природе своей ран¬ говые статистики дискретны. Все это обобщает обсуждение простой регрессии в конце раздела 5.1. Таким образом, минимизация D (Y — —Хр) эквивалентна решению (5.28). Причем этот метод есть обобще¬ ние оценки Ходжеса — Лемана на линейную модель, поскольку ES (Y — ХР) = 0, где Р — истинное значение параметра. В упраж¬ нении 5.5.2 читателю предлагается проверить, что ES (Y —Хр) = 0. В предыдущих главах мы в основном сосредоточили свое внимание на уилкоксоновских метках. Пусть а (i) = ср (i/(N + 1), где Ф (и) = )/Т2 (и —1/2). (5.2.9) Именно эта стандартизация удобна, поскольку J ф (и) du = 0 и J Ф2 (и) du = 1. В случае простой линейной регрессионной задачи (5.2.8) соответ¬ ствует (5.1.6). Пример 5.2.1 иллюстрирует идеи, развитые выше, при¬ менительно к двухвыборочной сдвиговой модели. Пример 5.2.1. Двухвыборочную сдвиговую модель можно записать так: Y = Уп У*+1 ■(1 !■)(!) + е. Следовательно, если т = N — л, то первые п наблюдений извлечены из распределения с медианой а + Р, а последние т наблюдений — из распределения с медианой а. Разность медиан совокупности равна А = а + р — а = р. В этом примере р — 1, так что мы опускаем индекс у S, (Y — ХР). Вектор X — второй столбец в полной матрице плана. Пользуясь уилкоксоновской функцией меток (5.2.9) получаем .V D(Y-XP) [Л (К,— х, р)—(Л^ Ч-1)/2] (У,—дс, р), ' /=1 242
S(Y-Xp) = -^- У (x* — jc) [/? (Y, _ p) _(Л/- + 1)/21 = i=\ = ТГТг2 I«(^-P)-(^+i)/2]. /=1 Из равенства 2л: [R (Yt — xt Р) — (N + 1)/2] = 0 легко выво¬ дится третье выражение. Если S (Y — ХР) = 0, то 2£=i R (Yt —Р) = «•''ч = п (N + 1)/2, и р — медиана попарных разностей элементов из двух выборок, поскольку у нас имеется статистика в форме ранговой суммы для статистики Манна—Уитни (сравните с (3.2.4)). Отметим, что для этого примера т “ ХС N т —п —п и х;х„ = тп ~ где есть п величин т и т величин п. Теперь мы выясним предельное распределение N1/2 (Р — po)t где Р — это 7?-оценка, полученная путем минимизации (5.2.5) или ре¬ шения (5.2.8), а ро — истинное значение параметра. Мы напомним (см. раздел 2.7), что знаковая ранговая статистика Уилкоксона п1/2 Т (0) в некотором смысле приближенно линейна, а это приводит нас к эвристическому доказательству асимптотической нормальности п1/2 (0 — 0О). Подобный результат получается для регрессионной ран¬ говой статистики Sj (Y — ХР). Стратегия получения предельного распределения такова: 1) на основе линейной аппроксимации S (Y — — Хр) = — VD (Y — ХР) мы строим квадратичную аппроксима¬ цию; 2) затем будет показано, что для величины р, которая минимизи¬ рует эту квадратичную аппроксимацию, М1/2 (Р — р0) имеет предель¬ ное нормальное распределение; 3) затем мы покажем, что Р близка к р и N 1/2 (Р — Ро) имеет такое же предельное распределение, что и N4* (р - Р„). Начнем с того, что докажем линейность вектора ранговых стати¬ стик. Пусть Ро — истинное значение параметра и предположим, что мы используем уилкоксоновские метки (5.2.9). Тогда 243
-[Л2 j>(x)dx-^X'cXcN'/*(V-h) + op(l), (5.2.10) где Op (1) стремится к нулю по вероятности равномерно для всех та¬ ких векторов р, что А1/2 ||Р — р0|| <С при любом С > 0. Здесь Л* || — расстояние Евклида. Этот результат получен Дж. К. Аубучо- ном [12] при слабых допущениях, приведенных в (5.2.11). Доказатель¬ ство подобно доказательству теоремы 2.7.2, но несколько более сложно. а. Юречкова [99], [100] вывела (5.2.10) для меток общего вида с заме¬ ной 12 х/2 J /2 (х) dx на Jocp (у) ф/ (и) duy где <р (и)—функция, порождаю¬ щая метки, причем J ф (и) du = 0, J ф2 (и) du = 1, к тому же она удовлетворяет определению 3.4.2; фу (и) дается в (3.5.14). Ее доказа¬ тельство требует больше «технических допущений» на построение мат¬ рицы плана, чем доказательство Аубучона. Исходя из этого, мы соберем вместе допущения, которые использу¬ ются в этой главе. Время от времени мы будем указывать более общие результаты, справедливые для произвольных функций меток и отсы¬ лать читателя к первоисточникам, где приведены доказательства. Итак, мы предполагаем Б. [IX] обладает полным столбцовым рангом, равным р + 1. В. N~l [IX]' [IX] сходится к положительно определенной матрице, откуда следует, что N-1\'CXC^ 2 (5.2.11), причем последняя матрица положительно определена (см. следующую лемму). Г. F£ Q0 и / (•) обладает конечной информацией Фишера (опреде¬ ление 2.9.1). Два следствия этих допущений выделяются в следующую лемму (ее доказал Дж. К. Аубучон [12]), которая понадобится нам далее. Лемма. Из условия (В) следует, что А_1ХсХс->2, причем последняя матрица является положительно определенной матрицей; из условия (Г) следует /2 (*) dx < со. Доказательство. Заметим, что где х' = (х1у ... хр)у и предельная матрица положительно опреде¬ лена. Определим сходящуюся матрицу А. ф(а) = уг12(м—1/2), a(i)==Vl2[i/(N + l)— 1/2]. 244
Тогда Ai = 1 *' к-р ° хЛМХ'Х J L0yV_1X^ сходится к А' А А, которая положительно определена. Первая часть леммы доказана. Теперь, доказывая вторую часть леммы, мы заметим, что если функция распределения Y равна F £ Q0, то — Y имеет вид функции распределения 1 — F (—у) £ Й0 с плотностью распределения f(—у). Пусть X и —Y независимы с плотностью распределения f (х) и f (— у) соответственно. Из теоремы А17 приложения следует, что форма плотности свертки такова: Г (х) == J“ ^ f (х—у) f (—у) dy = = $”_J(x + f)f(t)dt = poo м f (x + z)f(t)dzdt ,) — oo J — оо < Г°° Г°° IГ (x + z)\f(t)dzdt== J — 00 J — 00 =r—$-Jr{u)\f{t)dudt!= = f“ |/»|d«p = J OO J — oo =Г J — oo ~\/f (u) Мы использовали свойство абсолютной непрерывности, неравенство Коши — Шварца (теорема А19 приложения) и определение 2.9.1. Те¬ перь /* (0) = /2 (х) dx < оо. J — оо Результат из (5.2.10), верный при допущениях (5.2.11), обеспечива¬ ет линейное приближение градиента VD (Y — Хр). Это дает возмож¬ ность построить квадратичное приближение D (Y — ХР). Пусть N~l ХсХс — матрица, которая сходится к положительно определен¬ ной матрице S, и пусть ро — истинное значение параметра. Опреде¬ лим Q (Y - X Р) = D (Y - X ро) - (Р - ро)' S (Y - X р0) + + ±yj2j^(x) dxN (Р -р0)' Ц (Р - Р„). (5.2.12) 245 00.
Квадратичная часть от р обладает тем свойством, что Q (Y—Хро) = = D (Y — Хро), и градиент Q (Y — ХР) — линейное приближе¬ ние правой части. Из теоремы 5.2.2, которую доказал J1. А. Джекл [94], видно, что Q (Y — ХР) обеспечивает хорошую аппроксимацию D (Y — Хр). Теорема 5.5.2. Для любых В >0 и е >0 и при выполнении до¬ пущений (5.2.11) р( sup | Q (Y—XP)—D (Y—X|J) | ^ e \ 0 ^\V7j IIP~NI<B ) Доказательство. Пусть о) — j-я строка матрицы 2. При этом из (5.2.10) для всех j = 1, ..., р sup /лЧ|3-Р.|Кв У> +VT2 j>(x)djcMr;(p-Po) S,(Y-Xp)-S,(Y-Xp0) + > о. Отсюда Р \ sup -£-Q(Y-XP)- ар j D( Y —хр) (5.2.13) вУр Рассмотрим такую точку р* Ф ро, что АЧ2||р* — р0|| < В. Точка = Ф* + (1 — 0 Ро = Ро + t (Р* — Ро) при 0 < t < 1 ле¬ жит на отрезке, соединяющем Р* и ро. Применяя цепное правило, по¬ лучаем [Q (Y — Хр,)—D (Y—Хр()] = at = 2 (Р;-Ро;) /=1 а Q (Y — хр() J-D( Y-XP() ар,- ар; С большой вероятностью при больших N мы можем заключить из <(5.2.13), что dt [Q (Y — X р,)—D (Y — X Р()1 <-^i |p;-p«i < ву р /= 1 вУР VN 8 о л 246 ^ е.
Теперь определим h (t) = Q (Y — X pf) — D (Y — ХР*) и на¬ помним, что р* = /р* + (1 — t) р0. Заметим, что h (t) дифференци¬ руема почти всюду и h | (1) —А-(0)|< JJ|A' (t)\dt. Более того, Л (0) = Q (Y — хро) — D (Y — Хр0) = 0 и |А'(0К < е при 0< /< 1. Следовательно, \h (1)| < е, и мы получаем |Q (Y — Хр*)—D (Y — Хр*)|-<е при таком р*, что /V1/2 ||Р* — — р0|| < В с высокой вероятностью. Поскольку Q (Y — ХР) — — D (Y — Хр) непрерывна, sup |Q (Y—ХР) — D (Y—X P) | < e Л-1/2 11 P-P0||<B с большой вероятностью. Теорема доказана. , Напомним, что р минимизирует D (Y — Хр) и является решением уравнения S (Y — Хр) = 0. Определим Р=Ро + ——L- V-1 -J-S(Y-XP0), (5.2.14) Vl2 SrWdx* N где Po — истинное, неизвестное нам значение параметра; р минимизи¬ рует квадратичное приближение Q (Y — Хр) и является решением линейного приближения — правой части (5.2.10). Читателю предла¬ гается найти предельное распределение N1!2 (Р — ро) в упражнении 5.5.3 (п. Б). Теперь можно показать, что р асимптотически «ведет себя» подобно p. J1. А. Джекл [94] доказал этот результат для меток общего вида. Теорема 5.2.3. Пусть р — любая точка, минимизирующая D (Y — -хр). Тогда, если ро — истинное значение параметра и выполняют¬ ся допущения из (5.2.11), КлГф—Ро) -^z ~mvn (о, 5 У~1)- ^ ™ \ 12 (J7*(jc)d*)* <4 ) Доказательство. Выберем е > 0 и б > 0. Вследствие асимптоти¬ ческой нормальности N1!2 (Р — ро) (см. упражнения 5.5.3) сущест¬ вует такое С0, что р (II p-Ро II >С0/КЛП< 6/2 (5-2Л5> для достаточно больших N. Определим (см. упражнение 5.5.12) r = min {Q (Y—X Р): || р~р || = еу ЛГ}-<2 (Y —X Р). Заметим, что Т > 0, поскольку р — единственный минимум Q (Y — ХР). Тогда по теореме 5.2.2 Р{ sup _|Q(Y-Xp)-D(Y-Xp)|>r/2]<6/2, lllp-e, ||«<С. + е)/Улг J (5.2.16) 247
Теперь для больших N с вероятностью большей, чем 1—6, из (5.2.15) и (5.2.16) следует ||р — р0|| < С0 /Я1/2: D (Y — X р) < Q (Y — X р) + Т/2. Для всех таких р, что ||0 — р|| = е/ЛМ/2, || 0 — р01|< || 0—р|| + + II Р~-Ро II < e//V1/2 + C0//V>/2 = (с0 + е)/Я'/2. Значит, по (5.2.16) | Q (Y — Хр) — D (Y — Хр)| < Т/2, откуда D (Y — Хр) > Q (Y — ХР) — Т/2. Теперь D (Y — X Р) > Q (Y—X Р) —Т/2 > >min (Q (Y — X Р): || р — Р || = г/УТГ} — Т/2 = = T + Q (Y—X Р)—Т/2 = = T/2 + Q(Y-Xp)>D(Y-Xp). Таким образом, D (Y —Хр) > D(Y —X(J) для всех таких Р, что || Р — р || = e/7V1 /2. Поскольку D (Y — ХР) выпукло, согласно теореме 5.2.1, D (Y — XP)>D(Y — ХР) для всех таких р, что ||р — РП^ > e/TV1/2. Тогда D (Y — Хр) > min D (Y — хр) = D (Y — Xf), откуда следует, что ||р — р 11 <С e/TV1/2. Но это означает, что TV1/21|р — р|| < в с высокой вероятностью для больших N. Таким образом, N1!2 (Р — ро) — Nll2 (Р — ро) сходится по вероятности к 0 и имеет то же предельное распределение, что и в при¬ мере 5.5.3. Теорема доказана. JI. А. Джекл [94] доказал, что Bn = {Р : D (Y —ХР) = min} ограничено. Поскольку D (Y — ХР) непрерывна и постоянна на множестве Вм, то Bn — замкнутое множество. Этот факт так же, как и последняя теорема, говорит о том, что N1/2 (диаметр Bn) по вероят¬ ности сходится кО. Следовательно, если N умеренное, а тем более боль¬ шие, то множество точек, минимизирующих D (Y — Хр), должно быть мало. Покажем простое применение приведенных выше результатов на двухвыборочной задаче о сдвиге из примера 5.2.1. Ранее было указа¬ но, что ХсХс = mnIN, где т + п = N. Предположим, что m/N->- 0 < 1, тогда ХДС ->Я(1 —X). Оценка р —меди¬ ана тп разностной, и из последней теоремы следует асимптотическое нормальное распределение N1/2 (Р — ро), а именно /г(0,1/Щ1 — К) 12х 248
X(f f2 (x) dx)2]). Этот результат был упомянут после (3.5.10)—формулы эффективности критерия Манна — Уитни — Уилкоксона. В простой регрессионной модели, обсуждаемой в предыдущем разделе, A1/2 X х (Р — Ро) имеет предельное нормальное распределение со средним 0 и дисперсией 1/[6212 (J /2 (х) dx)2], где N-1 2 (хл — х) 2 б2.5 С. С. Уилкс [194, с. 546] определил обобщенную дисперсию много¬ мерной оценки как определитель ковариационной матрицы. Теперь мы определяем асимптотическую относительную эффективность двух асим¬ птотически многомерных нормальных оценок как умноженный на (1 /р) корень обратного отношения их асимптотических обобщенных дисперсий. (Об этом см. [21, раздел 4].) В тексте приложения, следую¬ щем за теоремой А13, говорится, что если р* — оценка наименьших квадратов, то А1/2 (р* — ро) асимптотически распределено, как MVN (0, а22-1), где а2 — дисперсия F. Отсюда асимптотическая дисперсия ранговой оценки р относительно оценки наименьших квад¬ ратов р* равна Это выражение — эффективность уилкоксоновских методов относи¬ тельно методов наименьших квадратов, оно многократно обсуждалось в данной книге. (Об этом см. раздел 2.6.) За исключением случая модели сдвига оценку р не просто вычислить. Для нахождения минимума D (Y — Хр) можно использовать такие методы поиска, как пошаговый метод спуска, поскольку D образует выпуклую поверхность. В вычислительной системе Minitab* содер¬ жится программа RANK REGRESSION, которая выдает р на печать. Линейную аппроксимацию (5.2.10) и ее решение р (5.2.14) можно применить для построения одношаговой R-оценки. Предположим, ро— начальная оценка р, скажем, по методу наименьших квадратов. Пусть т — состоятельная оценка величины * Речь идет о пакете прикладных программ Minitab: Dr. Thomas A. Ryan Minitabe Inc., — 3081 Enterprise Drive, — State College. — PA 16801, USA.— Примеч. пер. e (p, p*) = 12a2 i^f2 (x) dx f . (5.2.17) 12 (j p (x) dx) С , КГг]> (x) dx Теперь, заменяя в (5.2.14) E_1 на N (X^X,.)-1, определим т (5.2.18) Pi = Fo+^(X; Xr)-1 SfY-xft). (5.2.19) 249
Оценка — одношаговая оценка. Можно быстро получить оценку на £-м шаге, повторяя итерации. Для одновыборочной сдвиговой модели, где предполагается сим- метрия исходного распределения, F £ £2S; в (2.7.8) указано, что длина уилкоксоновского доверительного интервала, стандартизирован¬ ного соответствующим образом, дает нам состоятельную оценку т. Дж. У. Маккин и Т. П. Хеттманспергер [125] показали, что и для ли¬ нейной модели при вычислении этой оценки как функции от остатков У^1 —- х{р, ..., Yn —х^р она будет состоятельна. Таким образом, если мы готовы предположить, что F £ QSy то можно вычислить рг по (5.2.19) или итерациями (Jft, т. е. R-оценку на k-м шаге. В упражнении 5.5.4 приводится неожиданный результат, свидетель¬ ствующий о совпадении предельного распределения jV1/2 (Pj — ро) и дц/2 ф — Таким образом, одношаговая оценка асимптотиче¬ ски столь же эффективна, сколь и «настоящая» (многошаговая) R- оценка, полученная минимизацией D (Y —Хр) (см. [126]). Следует отметить, однако, что предельное распределение N 1/2 (р — ро) из теоремы 5.2.3 не требует предположения о симметрии исходного рас¬ пределения. С другой стороны, если т взято из формулы для оценки рх, построенной по уилкоксоновскому доверительному интервалу, вычис¬ ленному на остатках, то для доказательства состоятельности т надо де¬ лать предположением симметрии. Параметр т = 1/I121/2 J f2 (х) dx] часто появляется в книге. На¬ пример, т-1 —основная часть (не относительной) эффективности по Питмену ранговых критериев, основанных на уилкоксоновских мет¬ ках; она появляется и в асимптотической линейной аппроксимации ранговых статистик. Далее, т2 присутствует в асимптотической диспер¬ сионной или ковариационной матрицах R-оценок при уилкоксонов¬ ских метках и является стохастическим пределом стандартизированно¬ го* квадрата длины уилкоксоновского доверительного интервала. Эта величина появляется и в квадратичном приближении D (Y — Хр), а позже мы увидим ее в качестве стандартизированного параметра в ран¬ говых критериях, основанных на остатках в линейных моделях. Ясно, что важно иметь состоятельную оценку т при отсутствии допущения о симметрии исходного распределения. Теперь мы предложим различные оценки т, построение которых не требует предположений о симметрии. Этот метод основан на оценке плотности распределения. Рассмотрим случай независимых, одинаково распределенных случайных величин Yif ..., Yjv, которые образуют вы¬ борку из F£Qо с плотностью распределения / (х). Оценку / (*), * Т.е. нормированного соответствующим образом. — Примеч. пер. 250
которую называют «ядерной» или типа «окна» (kernel or window estimate), предложил М. Розенблатт [158], а затем исследовал Э. Пар- зен [143]. Дж. Уегман [191]; С. Дж. Бин и К. П. Чокос [18] напи¬ сали обширные обзоры по теме «оценивание плотности» *. Определение 5.2.3. Предположим, с плотностью распреде¬ ления / (х). Пусть w (.х) —плотность распределения, квадрат которой •мы интегрируем, симметричная относительно 0, hu — последователь¬ ность таких постоянных, что и NhN^ оо. Тогда называется оценкой типа «окно» от f (у). Сама функция w (х) назы¬ вается функцией типа «окна» или «ядерной», hu называется шириной «окна» (window width or bandwidth) ** или шириной полосы. Мы ограничимся рассмотрением равномерного «окна» »<*) = (' --1/2<*<1/2’ (5.2.20) 10 —в противном случае. Мы поступаем так, поскольку с равномерным «окном» легко рабо¬ тать, а С. Дж. Бин и К- П. Чокос [18, с. 277] указывают, что выбор «окна» не так важен, как выбор его ширины. Используем индикаторную функцию / (£)=1, если имеет место ис¬ ход Е и 0 — в противном случае; с учетом (5.2.20) мы получаем Ь=1 \ 1 i= 1 ' = -Г- ^Fn (y + hN/2)-FN (у—А*/2)1, (5.2.21) % где Fn (•)—эмпирическая функция распределения. Следовательно, /n (у) из (5.2.21) — эмпирическая производная от эмпирической функ¬ ции распределения. В упражнении 5.5.5 предлагается показать, что /tv (у) сходится по вероятности к f (у). Теперь по /tv (у) мы можем построить оценку т (5.2.18). Рассмотрим параметр Y= §P(y)dy = $f(y)dF(y). (5.2.22) hN * См. также: Ибрагимов И. А., Хасьминский Р. 3. Асимпто¬ тическая теория оценивания. — М.: Наука, 1979. — Примеч. пер. ** О выборе ширины «окна» см.: SheatherS. J., Hettmansper- ge г Т. P. A data based algorithm for choosing the window width when estimating the integral of /2 (*)// Tech. reports and preprints. — The Pennsilvania State Univ. — N 52. — 1985. — 26 p. — Примеч. пер. 251
Оценка задается формулой Т = J/w (у) dFN (у) (5.2.23) где 1ц = 1 при —/i/v/2 <.Vi —YjChu/2 и 0 — в противном случае согласно (5.2.20). Оценку у (5.2.23) предложил впервые Э. Шустер [168], а затем для ситуации случайной выборки — Г. Шведер [169]. Г. Шведер [169] анализировал и асимптотическую нормальность оценки у, основанной на «окнах» и метках общего вида. Помимо того, он высказал неко¬ торые практические соображения по вычислению оценки. Б. К. Бхаттачария и Г. Г. Русас [20] получали J (х) dx, а К. Ф. Ченг и Р. Дж. Серфлинг [29] обобщили эту оценку на случай меток общего вида. Можно показать, что при использовании уилкоксоновских меток оценка Бхаттачариа — Русаса — специальный случай оценки у (см. упражнение 5.5.6). Здесь мы ограничимся изучением у (5.2.23). Теорема 5.2.4. Пусть Yl9 ..., Yn — независимые, одинаково рас¬ пределенные случайные величины F£ Q0 с плотностью распределения / (•). Предположим, что J /2 (х) dx<i оо. В этой ситуации у (5.2.23) сходится по вероятности к у — J /2 (х) dx. Доказательство. Прежде всего вычислим математическое ожида¬ ние: Пусть Z = Уг — Y2t тогда из теоремы А17 приложения F* (z) = Р (Z < z) = F (г -|- у) / (у) dy с плотностью распределения /* (Z) = jZco + f ^ dy- Отсюда Еу—-f- [F* (hN/2)-F* (-Ы2)] Еу -> /* (0) = j f2 (у) dy. 252
Теперь N* h% (N N \ EilSSSVtjIkt-EIijEIkt)}- var T= Ni ,, " var I 2 2 Jij I = Г7Г7Г- var 712 + 1 N*h% ,J) Nl h% Вспомним, что A7i;v —оо; воспользуемся доводами из теоремы 2.5.1 и теоремы 2.7.2 и получим var V ~ ~1^Г VI* Iit—EIiz EI»}. Nh% Теперь | £/„ /„-£/„ £/181 < £/„+ (£/i2)2 и 1 .£/„111 +ад —о, NhN hN поскольку Nh,N-+ оо, l/(WAw) 0, h^EI^-*- /* (0) и 1 + £/12 ог¬ раничено сверху величиной 2. Мы имеем £7-^7 и var 7 -> 0, так что по теореме А5 7 — со¬ стоятельная оценка 7. Обсудим некоторые практические вопросы, касающиеся вычисле- ния у. Заметим, что члены при i = / в (5.2.23) не случайные, и у мож¬ но записать в виде f= J_ О, (0)+—!— У у ш (hzlL NhN т № hN \ hN Мы будем рассматривать следующую модификацию 7: у* = — -I 5 У У —■—-4) , (5.2.24) Х NK N (у—1) hN **** [ hN )’ У где К — постоянная. Очевидно, что теорему 5.2.4 можно доказать лишь для 7*, и 7* —состоятельная оценка 7. Поскольку /* (z) = = J / (У + z) f (У) dy — плотность распределения случайной вели¬ чины Y1 — Y2, то £7* = — 1 !— Г w (z]hN) f* (z) dz=—— _j_ r NK hN }_OQ w л;/ w NK.^ + Г°° w (и) f* (Hn u) du = J —с© —~-'r J“ oo“'(“) [f* (°) + h» “/*' (°) + + ЛЦ, ы2 /*" (0)/2l du + hlo (1) (5.2.25) 253
при непрерывной /*" (у) в 0. Поскольку w (и) — симметрична отно¬ сительно 0 и у = /* (0), мы имеем * Bias (у*) = —!— + — h% /*" (0) Г и2 w (и) du + o (h%). (5.2.26) N К 2 J — оо После двукратного дифференцирования /* (г) и интегрирования по ча¬ стям, мы получаем /*" (0) = — ^ [/' (х)]2 dx. (5.2.27) Оценку у* мы используем в следующем разделе для стандартиза¬ ции статистик критериев и больше будем говорить о смещении оценки у*, чем об ее эффективности. Мы хотели бы, чтобы Лд/ стремилась к ну¬ лю так быстро, как только возможно. Теория, которую развил Дж. К. Аубучон [12, раздел 4.3], предполагает использование оценки у*, основанной на независимых остатках в линейной модели со случайным h,N> Из этой теории следует, что Лд/ может стремиться к нулю не быст¬ рее, чем N~1!2. Таким образом, hN = KN-il2t при этом, если пренебречь членом о (/i$), смещение станет равным Bias (7*) = (0) ^ и1 w (и) du. (5.2.28) Здесь имеет место смещение порядка MN. Положим (5.2.28) равным ну¬ лю и решцм уравнение относительно К- /*" (0) с°° 1-1/3 \ и2 w (и) du J —ОО к = 2 Пусть / (у) = б-Vi (б-1 у), тогда из (5.2.27) -Г (0)=6-3j“oo[/; (*)i2dx И К = б |^- J00 [/' (х)]2 dx J°° и2 w (и) du| 1/3. (5.2.29) Итак, оценка у* (5.2.24) при Hn = KIN1/2, где К — любая фик¬ сированная постоянная, есть состоятельная оценка у. Смещение у* стремится к нулю со скоростью \Ш, и мы ранее показали, что если мы знаем форму f (•), то можем выбрать К (5.2.29), устраняя члены поряд¬ ка MN из смещения. Конечно, мы не знаем /(•)• Будем рассматривать выражение (5.2.29), разбив его на две составляющих: параметр масштаба б и стандартизированную форму f (•), а именно /х (•) * Здесь Bias (у*) — смещение оценки у* относительно у, т. е. Еу* — у. — Примеч. пер. 254
Т. Шведер [169] предложил использовать данные для одновремен¬ ного оценивания 6 и J [/[ (x)]2dx. Простой способ — взять в качестве 6 такой робастный параметр масштаба, как среднее абсолютное отклоне¬ ние от математического ожидания или интерквартильный размах, оце¬ нить его по данным, затем, опираясь на предположение о распределе¬ нии, например нормальном, вычислять j [f[ (х)]2 dx. Смещение остает¬ ся все того же порядка 1 /Л/, и мы рассматриваем вычисления, приводя¬ щие к (5.2.29), как практическое решение задачи выбора /С, и отсюда можем перейти к выбору ширины «окна», имеющей решающее значе¬ ние. Дальнейшее обсуждение свойств у* см. в [14]*. Приведем простой пример, иллюстрирующий вычисления 6 = = F-1 (3/4) — F~l (1/4) — интерквартильного размаха, где / (•) — нор¬ мальная плотность. Стандартизированная плотность /х (•) —нор¬ мальная плотность с 6 = 1. Поскольку 6 = о [ф-i (3/4)—Ф-1 (1/4)] = о (1,348), где о —стандартное отклонение, /х (•) — нормальная плотность со средним 0 и дисперсией 0,5503. Простые вычисления показывают, что I f/i (х)]2 dx = 0,3455. Мы используем прямоугольное «окно» (5.2.20), для которого J u2w (и) du = 1/12, однако уравнения справедливы для любого гладкого симметричного «окна». Таким образом, из (5.2.29) мы получаем К = 4,11 6, и 6 оценивается по интерквартиль- ному размаху выборки. Используя прямоугольное «окно» для w (•) и выборочный интер¬ квартильный размах для оценивания 6, мы получаем оценку у (5.2.22): 7*= ~ + "7= ~ZZW I =1 4,11Мб У N (N-1)4,116 \ 4,116/yOv / 4,11^6 4,116 { \2 У N (5-2.30) V 2V N }) где F*n (•) —эмпирическая функция распределения, вычисленная по N (N — 1)/2 разностям Yt — Yjy 1 < i <С j < N. Напомним, что наша цель — введение оценки у (или у*), предназ¬ наченной для оценивания у = J /2 (х) dx или т = 1/П21/2 { f2 (х) dx], без предположения о симметрии /(•)• Так, например, одношаговую оценку рх (5.2.19) можно вычислять без предположения о симметрии. * См. также: AubuchonJ. С., Hettma nsperger Т. P. A note on the estimation of the integral of /2 (x)//J. Statist. Plan. Inf. — 1984. — V. 9. — P. 321—331. — Примеч. пер. w,J Y~Yi V 255
В следующем разделе строятся критерии, зависящие от оценок у (или т), допущение о симметрии при этом не делается. Таким образом, в дальнейшем рассматривается случайная выборка Ylf ..., Yn- Вернемся опять к линейной модели (5.2.1) или (5.2.2) с наблюде¬ ниями Yl9 ..., Yn. Предположим, что F£Q0 и выполняются допущения (5.2.11). Пусть /tv (у) удовлетворяет определению 5.2.3 с j и2 w (и) du с °°, hN =K/N{ /2 и Л/1/2 (К —К) ограничено по вероятности. Исходя из этого, Дж. К. Аубучон [12] показал, что теорема 5.2.4 справедлива и при вычислении у по зависи- /ч /ч хч мым остаткам Y± — х(Р, ..., YN — х^Р. Таким образом, у или у* дают состоятельную оценку у = { /2 (х) dx без допущения симметрии. Нам надо оценить ]ф' (F (*)) /2 (х) dx. Очевидная оценка есть jq/ (FN (*))/wX Х(х) dFu (х). Состоятельность оценки обсуждается в [169] для ситуа¬ ции случайной выборки. Однако эти результаты не подлежат обобще¬ нию на случай оценок, основанных на остатках из линейной модели. Сравнивая (5.2.30) и (5.2.21), мы видим, что у* — оценка плотно¬ сти (или производной) от F* (функции распределения разности) в ну¬ ле. Г. Л. Сивере и Дж. У. Маккин [176] * предложили несколько отлич¬ ную от у* оценку. Они рассмотрели у** = НjV (t/N^2)/(2 i/Nl/2)y где Ндг (•)—эмпирическая функция распределения абсолютных вели¬ чин разностей остатков: t —а-процентная точка HN (•), 0 <С а <1. Эта оценка состоятельна и без предположения о симметрии /(•). Заме¬ тим, что если Х19 Х2 — независимые, одинаково распределенные случайные величины с функцией распределения F £ Q0, то Хх — Х2 имеет функцию распределения G£ Qs. Д. К. Дрейпер [44] без предпо¬ ложения о симметрии / (•) для планов с несколькими наблюдениями в ячейке предложил оценку j /2 (х) dx путем объединения отрезка двух¬ выборочных интервалов Ходжеса — Лемана, построенных на парах ячеек. Доверительный интервал описывается выражением (3.2.5). До настоящего времени сравнительные исследования различных спо¬ собов оценивания j* f2 (х) dx отсутствуют **. Остановимся на вопросе использования у*; приведем вычисления, необходимые для построения приближенного 95-процентного довери¬ тельного интервала для р из примера 5.1.1. В этом примере Р = 0,353, остатки равны rt = Yt — 0,353 xit i = 1, ..., 11, а именно: — 8,3, — —6,124,—3,670,—1,364,—0,226,—0,004, 1,035, 2,985, 3,195, 8,805, * См. [260] и [346]. — Примеч. пер. ** Работа, на которую ссылаются авторы, уже опубликована, см. [353].— Примеч. пер. 256
12,9. Квартили равны — 3,67 и 3,195, интерквартильный размах есть ? = 6,865. Для вычисления у* (5.2.30) нам надо построить 55 разностей rt — — О, 1 < /< / < 11. Тогда из (5.2.20) и у* = 0,003+0,034 = 0,037. Теперь т* - 1/(12V2 у*) = 7,734. Этот результат сравним с оценкой, построенной по методу наимень¬ ших квадратов, s = 6,48, основанной на остаточных суммах квадра¬ тов. Теперь в теореме 5.2.3 2-1 заменяется на (N~x 2 (xt —jc)2)-1 = = 0,00001. Отсюда A1/2 (Р — Р) приближенно нормально распре¬ делено с дисперсией т*2 2-1 = (59,81) (0,00001) = 0,0006. Оконча¬ тельно приближенный 95-процентный доверительный интервал ра¬ вен (0,353 ± 2 (0,0006)1/2 /II1/2) или (0,338, 0,368). В заключение этого раздела мы проанализируем получение пара¬ метра пересечения а. Этот параметр оценивается с помощью одновыбо¬ рочного метода, применяемого к остаткам Yx — х[ Р, ..., YN — Хд/Р, где Р — ранговая оценка, построенная ранее. Если мы будем пред¬ полагать, что есть симметрия (E£QS), и воспользуемся уил- коксоновскими метками, то оценкой а будет медиана средних по Уолшу остатков (см. (2.3.2)). Пусть допущения (5.2.11) выполняются. Предположим, что а0 и ро—истинные значения параметров в линейной модели (5.2.1), а матрица А/-1 [1 X]' [1 X] стремится к А — матрице полного ранга. Тогда теорему (5.2.3) можно немедленно обобщить, показав, что Этот результат справедлив также для одношаговых (или й-шаговых) ранговых оценок (5.2.19). (Об этом см. [126], где приведено дальней¬ шее обсуждение этого вопроса.) Если мы не предполагаем наличие симметрии (F £ Q0), то нам при¬ ходится считать, что параметр положения представляет собой отрезок, отсекаемый на координатной оси *. В качестве а берется медиана рас¬ пределения Yt — X/ р. Следовательно, а — медиана Y± — х[ Р, ..., * См. работу Дж. К. Аубучона и Т. П. Хеттманспергера [261], авторы печа¬ таются также в ряде журналов, но чаще всего «JASA, Commun. Statist., Ann. Statist., J. Statist. Plan. Inf.». Список статистических журналов см.: Указатель журналов по теории вероятностей математической статистики и их приложениям/ Сост. Шмерлинг Д. С., Яковлева Е. Е. —М., 1986. — 35 с. — В надзаг.: Матем. ин-тим. В. А. Стеклова АН СССР; найти нужную статью можно по алфа¬ витному указателю к «Current Mathematical Publications». — Примеч. пер. 9 Зак. 284 257 если | rt — rj I < 4,254, VN \Л Z ~ MVN I 0 0, : ^ 12(| p (X) dx) A-1 . (5.2.31)
Yn — x^p, причем P строится по уилкоксоновским меткам. При до¬ пущениях (5.2.11) Аубучон [12] показал, что р0)]-^2 ~MVN (0, У)> (5-2-32) где у = Г[4/2(0)]-‘+х^'2-> -т>'2-Ч [ _T22-v т22-‘ и т=1/[12V*$f2(x)dx} из (5.2.18). Асимптотическая матрица ковариации получается из проекции, ес¬ ли применить знаковые метки к отрезку, отсекаемому на координат¬ ной оси, и уилкоксоновских меток для регрессионных параметров. 5.3. РАНГОВЫЕ КРИТЕРИИ В ЛИНЕЙНЫХ МОДЕЛЯХ Вернемся к задаче проверки гипотез в линейных моделях. Основная модель задается формулой (5.2.1) или формулой (5.2.2). Так же, как в предыдущем разделе, мы ограничимся рассмотрением р X 1-вектора регрессионных параметров р. Разложим вектор р следующим образом: »-(у. М.,, где и р2 — (р — q) X 1- и q X 1-векторы соответственно. В этом случае линейную модель можно записать в виде Y = la* + Xlcp1 + X2cp2 + e, (5.3.2) где Х1с и Х2с — NX (р — q)- и N X ^-матрицы, причем [Х1с, Х2с] = = Хс. Наша задача построить критерии Н0: р2 = 0, рх не определен, против (5.3.3) НА : р2 Ф 0, р! не определен. Альтернативная формулировка основана на спецификации q ли¬ нейно независимых, оцениваемых функций Нр, где Н — заданная матрица размера q X р. Например, Н = (О, I), где I — единичная матрица размера q X qy причем HP = р2. Вектор р2 специфицирует проверяемые параметры, а рх объединяет мешающие параметры. Напомним, что при рассмотрении примеров, следующих за (5.1.3), приведена двухвходовая таблица с двумя обра¬ ботками и двумя блоками, а также критерии Н0: рз = 0 против НА : Р„ ф 0 с неспецифированным р2, так что Р' = (Р2, рз), причем в наших предыдущих обозначениях «р2» = рз и «рх» = р2. Этот при¬ мер легко обобщить на случай критерия взаимодействия, где главные эффекты рассматриваются как мешающие параметры. Такая ситуация 258
рассматривается в следующем разделе, где представлены иллюстри¬ рующие ее данные. Наше описание носит достаточно общий характер. Рассматривае¬ мые методы применимы к критериям главных эффектов и взаимодейст¬ вий в таблицах со многими входами, критериям значимости сопутст¬ вующих переменных (covariates) при анализе “ковариации, критериям для коэффициентов регрессионных моделей. 5.3.1. КРИТЕРИИ, ОСНОВАННЫЕ НА D(Y—X|J) В предыдущем разделе функция D (Y — ХР) из (5.2.5) применя¬ лась для оценивания р. Таким образом, D (Y — Хр) выступает как мера подгонки линейной модели к данным. В действительности D(Y— ХР) представляет собой минимум расстояния, измеряемого с по¬ мощью D (Y — Хр), от вектора до подпространства, определяемого линейной моделью. Пусть ро есть р X 1-вектор, определяемый гипоте¬ зой Н0 ; р2 = 0. Отсюда Ро = (Р1, 0'), и можно переписать (5.3.3) в виде #0: Р = Ро против На'$Ф р0. (5.3.4) Далее, пусть ро — это F-оценка ро, т. е. то значение, которое минимизирует D (Y — Х(10) = D (Y — Х^). Оценку ро называют оценкой уменьшенной (сокращенной, редуцированной) модели. Оцен- ^•ч ка, полученная по полной модели, обозначается Р; она минимизирует D (Y — ХР). Проверяя Н0 : Р = ро против НА : Р Ф ро, мы будем сравнивать D (Y — Хр0) с D (Y — ХР) и отклонять Н0 : р = ро при боль¬ ших значениях D (Y — Хро) —D (Y — ХР). Стратегия та же, что и при построении F-критериев, основанных на уменьшении сум¬ мы квадратов при подгонке редуцированной и полной моделей *. Для того чтобы критерием можно было пользоваться, мы должны най¬ ти хотя бы предельное распределение при нулевой гипотезе. Заметим, что для конечных объектов выборки критерий не свободен от распреде¬ ления. В теореме 5.3.1 показано, что при нулевой гипотезе критерий асимптотически свободен от распределения. Результат этой теоремы показывает, что статистика D (Y — X fij) —Р (Y-Xpj (т/2) где т = 1 /(121/2 J /2 (х) dx), асимптотически распределена, как с q степенями свободы. Мы собираемся использовать т* = 1/(1/12 7*), (5.3.5) * См. [24], [236], [45]. — Примеч. пер. 9* 259
где v* = ^ + ' NK~ N(N— 1)/C i*i \ hN ) ?i ~ Уi— X/ P> i = U • ••, Л/, p — ^-оценка p полной модели; К — оценка /С; hN = К/N1/2. В (5.2.30) К = 4,116, где 6 — интерквартильный размах остатков. Гипотеза Н0 : р = ро (или Н0 : р2 = 0) отклоняется на прибли¬ женном уровне а, если D, = g(v-x&-0(v-»S (5 з 6) где Ха (q) — критическое значение распределения %2 с q степенями свободы. В применении к данным этот критерий рассматривается в сле¬ дующем разделе. Теорема 5.3.1. Пусть данные удовлетворяют линейной модели (5.3.2) и выполняется нулевая гипотеза Н0 : р2 = 0. При допуще¬ ниях (5.2.11) D D (Y—X Ро) — D (Y-XP) (т/2) имеет асимптотическое х2 (^-распределение, где ро, Р — R-оцен¬ ки соответственно по сокращенной и полной моделям, а т — = 1/(121/2 J* р (х) dx). Доказательство. При доказательстве используется приближение D (•) величиной Q (•) (5.2.12) и приближение ^-оценки р величиной Р (5.2.14), минимизирующей Q (Y — ХР). Сначала покажем, что асим¬ птотическое поведение D (Y — Хро) — D (Y — ХР) опреде¬ ляется таким же поведением Q (Y — X ро) — Q (Y — X Р). В заключение мы продемонстрируем, что Q (Y — Хро) — — Q (Y — ХР), будучи соответствующим образом стандартизировано, имеет асимптотическое распределение х2- В ходе обсуждения мы упро¬ стим обозначения — вместо D (Y — Хр) запишем D (Р) и аналогич¬ но для Q (Р). Итак, напишем D (?о) - £> (Р) = D (Ро) -Q (ро) + Q (Ро) - - Q (Ро) + Q (Ро) - Q (Р) + Q (Р) -Q (Р) + + Q (Р)—D (р). (5.3.7) 260
При нулевой гипотезе по теореме 5.2.3 и N1/2 (Р0 — Ро). и N1/2 X Х(Р — Ро) асимптотически нормально распределены и потому ог¬ раничены по вероятности. Можно теперь обратиться к теореме 5.2.2. для установления того, что первая и пятая разности в правой части (5.3.7) сходятся к нулю по вероятности, т. е. они имеют порядок ор (1). Подставим Р и р в Q (Р) (5.2.12) — — ~ VJ2([ f2 (х) dx) N Q(P)-Q(P) = (P-P)'S(P„) + v u 2 ' x X KP-Po)' 2 (P-Po)-(P-Po)' 2 (P-Po)l. Если из выражения в квадратных скобках во втором члене исключить множитель, то можно записать (~Р-Р)2(Р-Ро + Р-Ро)- Отсюда Q(P)-Q(P) =Vn (p-р)' 1 Уицгм**) .. — S (Ро) X V N Х^УТГ (Р-Ро+P-Po)j • (5-3.8) Из теоремы 5.2.3. следует, что М1/2 (Р — р) = ор (1), М1/2Х Х(Р — Ро) и М1/2 (р —ро) асимптотически нормально распределе¬ ны. Поскольку случайная величина iV-1/2S (р0) также асимптотиче¬ ски нормально распределена (упражнение 5.5.3), то второй член в (5.3.8) ограничен по вероятности. Таким образом, устанавливаем, что четвертый член в (5.3.7) также имеет порядок ор (1). Исходя из подоб¬ ных соображений можно заключить, что второй член в (5.3.7) также имеет порядок ор (1). Теперь мы можем записать (5.3.7) в виде D (p0)-D (Р) = Q (Ро) Q (Р) + ор (1). Напомним, что Л/-1 (ХсХс) стремится к 2, которая является по¬ ложительно определенной матрицей. Разложение 2 соответствует раз¬ ложению Р: 2= (l" 2.Л (5,3.9) \Zj21 Zj22 / где 2П есть матрица (р — q)X(p — q)\ 222 есть матрица qXq и 212= ^ ^21. 261
Подставим Р из (5.2.14) в Q (р) и после упрощения получим 1 Q(P) = 0(M 2N V 12 J /2 (х) dx Используя разбиение (5.3.9), имеем 1 Отсюда Q(Po) = 0(Po)- 2N Kl2j/2 (*) Ас s' (Po)2-!s(p0). S' (ро) X X 2Г.‘ 0\ s О о (Ро). Q (Ро)—Q (РО 2N V}2$ Р (a:) djc S' (Ро) X X О о 2-1- S (Ро) р Р(Ро)-Р(Р) (т/2) X К Л/ 1 = S' (Р„) 2~‘- 2г.1 о о о VOv -S(Po)+Op(l). (5.3.10) По результату обращения матрицы, разбитой на блоки (клеточной матрицы (a partitioned matrix)) (см. 11 С. 450)*, получаем * (г Э-(-ьГг X (2м—2n2ri‘ Si*)-1 (-SoiSr,1.*). (5-3.11) где (АВ,С) обозначает матрицу, разложенную в произведение АВ и С. Правая сторона (5.3.10) трансформируется J=[(-Sa 2гЛ 1) s(Ро))' (222-22! 2r‘ 2i2)-‘ х Vn х-!=[(—2*12г,!. ,)S(Po)i- V N (5.3.12) См. [198], [236]. — Примеч. пер. 262
Из упражнения 5.5.3 Vn -S(p0)-^U ~ MVN (0, 2), (5.3.13> так ЧТО (-221 2г.1. «) -7=S(p,)-^ v ~ MVN (О, А), (5.3.14) Vn где 1 1 ^12 \ _ — ^22 2j21 2ц1 2l2- (5.3.15) Как следует из (5.3.10), D по распределению сходится к V'A^V. Это квадратичная форма многомерного нормального вектора, где мат¬ рица формы обратна ковариационной матрице. Распределение такой квадратичной формы есть распределение %2 с числом степеней свободы, равным рангу А (см. [11, с. 49)]. Однако ранг А равен q, поскольку она невырождена, что завершает доказательство. Эта теорема доказана Дж. У. Мак Кином, Т. П. Хеттманспергером [125] для общей функции меток. В этом случае т-1 задается формулой j ф (и) фf (и) du, где J ф (и) du =0, J ф2 (и) du = 1 и (и) получает¬ ся из (3.5.14). Состоятельная оценка тоснована на длине одновыбороч¬ ного доверительного интервала, построенного по остаткам полной мо¬ дели. Такой подход к оцениванию т требует симметрии F-pacnpe- деления ошибки. Состоятельность оценки типа «окно» для т в об¬ щем случае строго не доказана. Вернемся к обсуждению, следующему за формулой (5.2.30). Ключевой результат теоремы задается формулой (5.3.10), в которой D выражено с помощью квадратичной формы вектора ранговых стати¬ стик S (ро), где Ро = (Рь 0') — величина р, специфицированная (опре¬ деленная) при нулевой гипотезе. Поскольку рх по отношению к р0, вообще говоря, неизвестный вектор мешающих параметров, квадра¬ тичная форма от S (Ро) не есть статистика критерия. Далее мы приве¬ дем пример, в котором вектор ро полностью определен (т. е. нет меша¬ ющих параметров) и критерий, основанный на S (ро), сводится к из¬ вестному критерию. Пример 5.3.1. Рассмотрим однофакторный план. Мы имеем неза¬ висимые, одинаково распределенные случайные величины Хц> i =U Я/, /= 1, k, а именно: Xtl ~ F (х — 0Х), i = 1, ... > пъ Xih ~ F (х— 0ft), i = 1, ..., AZft, F £ й0 и хотим проверить #0 : 02 = ... = 0ft против НА : эффекты 0Х, Qh не равны. Для 263
того чтобы сформулировать эту задачу в терминах линейной модели с невырожденной матрицей плана, положим Y' = (Хп, Xnil,..., Xih, Xnhb) и Y = К 0 о 1„3 о + е, где индексы элементов указывают длину векторов. Эта линейная мо¬ дель связана с нашей первоначальной однофакторной схемой следую¬ щим образом: д1 = а 02 = а (32 р2 — 0-2 — 01 0/i — а + Рь P/i — 0/i 01* Говоря на языке линейной модели, мы будем проверять //0 : Р2 = — ... = рЛ =- 0 против НА\ эффекты р2, ..., pft не все равны нулю, или #0 : Р = 0 против НА : Р Ф 0, где Р' = Рй). У матрицы X есть столбцовые средние х' = (n2/N, ..., nk/Nf где N = 2i ni• Напомним, что Хс = X — 1х', и потому, если tii/N 0 < < 1, i = 1, ..., k, то — x;xc = N ° N N П2П3 n2nk n^nk N2 Я2(1-Х2) Д/2 = V _ ^3 К ^/i)_ Матрицу, обратную этой, приводит Ф. А. Грейбил [65, с. 170—171]: 2Г= 1 >> ** 1 . О . м о 0 + К1 - 1 . .. г 0 ' • А*1_ i . •• i_ 264
где = 1 — V У вектора S (р0) = S (0) /-й компонент равен si(0) -2 2 (ка-ф) - V12 п} /р ЛГ+1 / = 2, &, где /?£у-— ранг Xj в объединенной таблице данных, и Rj = 2"ii Rijlnj- Мы воспользуемся тем, что сумма центрирован¬ ных рангов Rij равна 0 и хц = 1, если i пробегает множество индек¬ сов /-й выборки. Квадратичную форму из правой части (5.3.10) можно записать так: — S' (0) y-iS(0) = — N ^ N j=2 3 1 \у=2 __ 1 v 1 с2 *% '■ поскольку S± = — Заменим Xj на /г7/Я, тогда 1 1 ^ /— — =— У —\Rj- N W l W yW (.V + l)2 V W+l 12 (A'+l)2 /=1 где Я* — статистика Крускала — Уоллиса из теоремы 4.2.4. Таким образом, в однофакторной схеме квадратичная форма из правой части (5.3.10) есть по существу статистика Крускала — Уоллиса *, и мы мо¬ жем не прибегать к статистике D* (5.3.6), требующей оценки т. Этот пример показывает, что D* асимптотически эквивалентна Я*. Если в модели имеются мешающие параметры и ро не полностью оп¬ ределена при Я0, то мы оцениваем т и используем D*. В следующем разделе мы покажем, что если оценки мешающих параметров подста¬ вить в S (Ро), то можно построить критерий, основанный на квадратич¬ ной форме из (5.3.10) со статистикой S (ро), замененной на S (р0). В разделе 5.4 обсуждаются практические аспекты этих вычислений. * Это значительно упрощает проверку гипотез (5.3.4) и может склонить ча¬ шу весов в пользу статистики D. — Примеч. пер. 265
5.3.2. КРИТЕРИЙ, ОСНОВАННЫЙ НА S(Y—Х0) Из теоремы 5.3.1 при Н0 : р = ро, где Ро = (Ро, О'),* мы имеем ■yFS' (Y-XW [S"‘-( о7 о) W1S<Y-XW_ “jK-SttSn. i)S(Y-xp0)]'x X [2j22 S21S111 S12]-1 X Х^=г[(-2п2!гI1. I)S(Y-XPo), (5.3.16) эта статистика распределена в пределе, как %2 с q степенями свободы (см. (5.3.10) и (5.3.12)). Поскольку ро содержит неопределенный вектор Рх, критерий не может быть основан на этой квадратичной форме, пока Рх не оценен. Сокращенная модель с р2 = 0 такова: Y = la* + XlcP1 + e. (5.3.17) R — оценка по сокращенной модели из (5.2.8) обозначается как р10; (р — я) X 1-вектор регрессионной ранговой статистики обозначает¬ ся через Sx (Y — Х1с Рю). Заметим, что Sx (Y — Х1с р10) = 0. Поскольку Po=(Pi°), (5.3.18) мы можем записать S, (Y — Херо). Обозначим через S2(Y — Хсро) оставшиеся q компонент S (Y — Хр„), тогда S(Y-XC р0) = (MY-XCP„)W ° _ V (5.3.19) S2(Y—Хс р0) / VS2(Y- Xcp0) Если мы подставим Р„ в (5.3.16), то получим статистику критерия. Для построения статистики критерия заменим 2 на /V-1 (ХС'ХС), 2и— на N-1 (XJCX1C), а 212— на N*1 (Х'1сХ2с). Теперь из (5.3.19) и (5.3.16) S* = S' (Y — Хс р0) (Хс КГ1 ~ ((Xl'coX]c) 1 | S(Y-XC ро) - = S2 (Y-Хс ро) [(Хгс Х2с) — \'2с Х1с (XIc Xle)-i X xX,'cX2c1-1S2(Y-Xc Ро). (5.3.20) * Напомним, что Ро — транспонированный вектор р. — Примеч. пер. 266
Остается показать, что, подставив ранговую оценку ро в (5.3.16) по сокращенной модели ро, мы не изменим предельного распределения. Теорема 5.3.2. Пусть задана линейная модель (5.3.2) и верна нуле¬ вая гипотеза Я0 : Р2 = 0- При условии, что допущение (5.2.11) выполняется, статистика 5* (5.3.20) имеет асимптотическое распреде¬ ление х2 с q степенями свободы. Доказательство. Обратим внимание на второе выражение S* из (5.3.20). Напомним, что т дается формулами (5.2.18) и (5.2.10), и это приводит к для всех таких р, что Я1/2 ||Р — ро|| <С при постоянной С > 0. Перепишем это в форме разложения где Ро = (Pi'o, 0'). Поскольку случайная величина Я1/2* (Р0 —Р0) ограничена по вероятности при Н0 (теорема 5.2.3), мы можем заме- нить р на р0: ^=-s (Р) = -Л- S(p0)-x-1Jrx;xcKiV(P-Po) + Mi) -ф=- S2 (Р0) = -ф=- % ( Ро) -т-1 (Х2С х1с) X X КШр10-р10)+ор(1). (5.3.21) Воспользуемся (5.2.10) для сокращенной модели yrSl(^° У=- Sx (Рю)- т-1 ^(Х(с Xlc) VN (Рхо-Рхо) + +°р 0)> мы имеем Vn (Рхо- Рхо) = X Х(сх1с) Sx (Рхо)+Op (1). 267
Подставляя это выражение в (5.3.21), получим -у=- s2 (Ро) =-- -у=- s2 (Ро) - (х2е х1с) (jj- х ;с х1с) X Vn Из упражнения 5.5.3 1 /Sx(Po) х WSi(Po) + oP(l)- (5.3.22) . . _ MVN (О, У), Vn~ Vs2 (Ро)/ где IV-1 ХсХс стремится к положительно определенной матрице 2. В (5.3.22) заменим с на S21 и N-1 X'icXlc на 2и. Теперь 1 1 Уы s2(P0) = (-221Sn, Vn _i L Vn Sx(Po) S2(P0) oP(l) = = (-2и2Г.\ I)^S(P0)-| Op(l). В пределе это выражение распределено, как MVN (0, Е22 — —E^EjVE^) по (5.3.14) и (5.3.15). Поскольку S* из второго равенства (5.3.20)—квадратичная форма, полученная обращением (ее) ко¬ вариационной матрицы, она асимптотически распределена, как х2 с числом степеней свободы, равным рангу ее матрицы, а именно q. Теорема доказана. Критерий для гипотезы Н0 : р2 = 0, а параметр не определен, против альтернативы НА : р2 ф 0, а параметр не определен, описы¬ вается следующим образом: на первом шаге нужно найти /^-оценку параметра рх по сокращенной модели, обозначаемую р10, или 06 = = (Pio = 0'). Вычислить остатки сокращенной модели Yx — — xiPo, ..., Yu — х^Ро и вычислить qX 1-вектор по ранговым ста¬ тистикам S2 (Y — XiPjo) = S2 (Y — Xpo). Затем надо вычис¬ лить квадратичную форму S* (5.3.20) и отклонить Н0 на приближен¬ ном уровне а при S* ^ Ха (?)> где Ха (?) — критическое значение х2- распределения с q степенями свободы. Практические вопросы вычисле¬ ния S* обсуждаются в следующем разделе. Вектор ранговых статистик S2 (Y — Хро) иногда называется вектором выравненных (aligned)* ранговых статистик. Первоначаль¬ ные данные были выравнены или центрированы сдвигом на величины эффектов от неопределенных мешающих параметров рг еще до построе¬ ния критерия для р2. Если нулевая гипотеза Н0 : р2 - 0 верна, * Иногда переводится как «критерий с выравниванием» — Примеч. пер. 268
\ —4 то \S2 (Y — ХоРо) — 0. Это позволит при необходимости построить критерий, основанный на S* и учитывающий величину S2 (Y — Хро). Еслк S2 (Y — Хр0) велика, то мы можем отклонить Н0 : р2 = 0. Стандартный статистический метод определения размера критерия для случайного вектора, имеющего многомерное нормальное распределе¬ ние, Построение квадратичной формы с компонентами вектора с помо¬ щью ковариационной матрицы. Использование этого метода приводит к статистике с х2-распределением, откуда можно получить критиче¬ ские значения. Это уточняет построение S*. Выравненные ранговые критерии ввели Дж. Л. Ходжес и Э. Леман [81]. Дж. Н. Адичи [1], [2] рассматривал ранговые выравненные кри¬ терии для простой ранговой регрессионной модели. Адичи [3] дал доказательство теоремы 5.3.2 для меточной функции общего вида, не требующее, чтобы оценка по сокращенной модели была jR-оценкой. Необходима лишь ограниченность по вероятности N1/2 X X (Рю Рю) • Следовательно, для некоторых моделей статистику 5* можно построить по остаткам, полученным методом наименьших квад¬ ратов, сокращенной модели (см. раздел 5.3.3). Адичи [3] исследовал первый член 5* из (5.3.20). П. К. Сен и М. Л. Пури [172] изучали вто¬ рой член 5* из (5.3.20). Они доказали многомерную версию теоремы 5.3.2 для общей функции меток, используя при этом ^-оценки меша¬ ющих параметров. Статьи [3] и [172] содержат дополнительные ссылки на работы о выровненных ранговых критериях. 5.3.3. КРИТЕРИИ, ОСНОВАННЫЕ НА Третий подход к решению задачи проверки Н0:$2 = 0, параметр не определен, основан непосредственно на ^-оценке из полной моде- ли р, определяемой путем минимизации D (Y — ХР) или решения нелинейной системы уравнений S (Y — ХР) = 0. Удобно исполь¬ зовать формулировку, приведенную ниже формулы (5.3.3). Пусть матрица Н = (О, I) размера qXo} где I — единичная матри¬ ца размера (qxq). Тогда гипотезу Н0 : р2 = 0, параметр рх не опреде¬ лен, можно переписать в виде Н0 : HP = 0 против НА : Нр Ф 0. Критерий, основанный на НР, строится на основе квадратичной формы, имеющей асимптотическое ^-распределение. В упражнении 5.5.7 требуется получить асимптотическое распре- деление A1/2 (HP — НР). Квадратичная форма, включающая в себя асимптотическую ковариационную матрицу, равна V# (нр)' [HS-ifTj-1 V~N (Н Р) т2 где т задается формулой (5.2.18): она имеет х2-распределения с q сте¬ пенями свободы. 269
Заменяя 2 наЛ^ХсХс и используя т* из (5.3.5), получим ста¬ тистику критерия В* = (н?)' [н(Хс хс)-1н,]~1(н'р) ,5 3 23 (Т*)2 * ’ Теперь гипотеза Н0:р2 = 0, рх не определена и отклоняется на при¬ ближенном уровне а при В* > Ха (<7), где Ха (<7) — критическое зна¬ чение х2‘РаспРеДеления- Статистика В* называется статистикой Вальда после того, как Абрахам Вальд (Abraham Wald) предложил строить квадратичныё формы от оценок, используя их асимптотиче¬ ские матрицы ковариаций. Результат, приведенный выше, верен для меток общего вида. За¬ мечание, которое следует за доказательством теоремы 5.3.1, справедли¬ во и для этого случая. Все три статистики —D* из (5.3.6), S* из (5.3.20), В* из (5.3.23)— имеют одинаковые асимптотические распределения при нулевой ги¬ потезе. В рамках линейной модели мы развиваем понятие эффектив¬ ности по Питмену, причем анализируем предельное распределение на последовательности альтернатив, сходящихся к нулевой гипотезе, так же, как для рассмотренных ранее моделей положения. Если у изу¬ чаемых статистик асимптотическое распределение х2, то эффективность есть отношение параметров нецентральности *. По результатам из [125], [172], [3] можно заключить, что эффективность каждого из трех критериев по отношению к критерию наименьших квадратов F равна е (Rank, LS) = 12а2 (j /2 (*) dx)*. (5.3.24) Таким образом, все три критерия эквивалентны в смысле эффективно¬ сти по Питмену, и к тому же они «наследуют» эффективность критери¬ ев знаковых рангов Уилкоксона, Манна — Уитни — Уилкоксона и Крускала — Уоллиса, т. е. в случае двухфакторного плана эти ранго¬ вые критерии обладают эффективностью большей, чем критерий Фридмена (см. обсуждение выше и ниже формулы (4.3.8)). Однако заметим, что у критерия Фридмена есть некоторые привлекательные свойства: он свободен от распределения не только в асимптотике, его просто вычислить вручную, можно обобщить на планы с повторным измерением **. * Речь идет о х2-распределениях с одинаковым числом степеней свободы. >0 различных числах см. [337], [340]. Весьма интересны статьи о двухфакторном ранговом дисперсионном анализе [338], [339] — Примеч. пер. ** Описание «соперничающих» ранговых критериев для двухфакторного пла¬ на и их сравнение см. [149], [328], [337], [338], [339], [340], [331], [334], [293], 1350], [351], [301], [314], [318], [332], [354], [257], [317]. На русском языке часть этих результатов приводится в [230]. О задачах проверки гипотез при неполных блоках или альтернативах упорядоченности см. [231], [232]. О других критериях см. [230]. — Примеч. пер. 270
'Ранговые критерии и оценки обладают той же самой эффективно¬ стью относительно их «соперников» из теории наименьших квадратов, что юбсужденные ранее модели положения. Выражение (5.2.17) для эффективности R-оценок относительно оценок наименьших квадратов то жё, что и в (5.3.24). Рассматривая D*, S* и В*, мы отдаем предпочтение D*. Статисти- ка Dr и ранговая оценка Р получаются естественным путем из мини¬ мизируемой функции, с помощью которой мы приближаем данные D (Y — Хр). ётная, не зависящая от места положения мера близости — ХР) (5.2.5) — псевдонорма и позволяет интерпретировать геометрически критерий и оценку аналогично методу наименьших квад- ратов\(см. упражнение 5.5.10). Дальнейшее обсуждение геометриче¬ ских Свойств робастных оценок и критериев можно найти в [127], [76]. 1 Результаты из (5.3.24) обобщаются и на случай критериев с метка¬ ми общего вида. Обсуждение из примера 3.5.2 переносятся с двухвыбо¬ рочной модели положения на общую линейную модель. В следующем разделе мы проанализируем применение этих крите¬ риев. Рассматриваются и такие практические вопросы, как вычисле¬ ние и модификация процедур для малых и умеренных выборок. Кри¬ терии и оценки демонстрируются на данных, описываемых регрессион¬ ной и дисперсионной моделями. Прежде чем вернуться к примерам, мы поговорим о некоторых под¬ робностях вычисления винзоризованной уилкоксоновской функции меток из примера 2.8.2 для одновыборочной задачи, которая была пере¬ несена на двухвыборочный случай в примере 3.7.8. По результатам^ помещенным в конце раздела 2.9, мы можем сделать заключение о не¬ котором превосходстве винзоризации в робастности над обычными ранговыми критериями (см. пример 2.9.5). В этой главе мы имеем дело преимущественно с функцией меток Уилкоксона (5.2.9). Для обсужде¬ ния мы выбрали винзоризованную функцию меток Уилкоксона, по¬ скольку для нее есть машинные программы вычисления оценок и кри¬ териев RANK REGRESSION, объединяющие различные программы в пакете Minitab. Можно записать решение упражнения 3.7.8 в следующей стандар¬ тизированной форме: (— (1 —T)/2, 0<и<у/2 Ф*(“)= « —1/2, у/2<ы<1—v/2 (5.3.25) 1(1—V)/2, 1 —v/2 < ы < 1. Далее, 271
Теперь мы определяем j ф (и) = 1 / ф* (и). (5.4.26) У (l-v)2(l+2v) ( Затем, j j^2(u)d«=l; j * ф (и) du = О.- I Г ' В примере 2.9.1 мы заменим параметр т-1 = (12)1/2 J /2 (x)dx на т-i = У12 £ f (х) dx/V( 1 —y)2 (1 + 2у), (р.27) где a = F~1 (y/2) и b = F-x (1—7/2). Заметим, что у представляет собой долю меток знакового типа в винзоризации уилкоксоновских меток. При у = 0 приведенные выше выражения сводятся к случаю, изученному Уилкоксоном, а при у, приближающемся к 1, формулы «превращаются» в те, что должны быть в случае Lx*. Возьмем a (i) = ср [i/(N + 1)] и подставим в (5.2.5); дисперсион¬ ная функция D (•) тем самым определена, и соответствующая R- оценка р находится путем минимизации D (Y — ХР). Теорема 5.2.3 по-прежнему верна, и статистика N1!2 (Р — р) асимптотически рас¬ пределена, как MVN (0, т22-1). Если мы предполагаем, что F$Qsy то параметр т состоятельно оценивается величиной N1/2 L/2Za/2, где 1 — Ф (Za/2) =1 — ос и L — длина доверительного интервала, построенного по винзоризованной знаковой ранговой статистике Уил¬ коксона, примененной к остаткам Yi-X'; р, i = 1, ..., N. Этот подход детально описан в примере 2.8.4. Если же мы предпо¬ лагаем лишь, что Fd Q0, то можно использовать подход с оценивани¬ ем плотности. Оценка типа оценки Шведера [169] величины р (х) dx такова: ( ф' (Fn (*)) fN (х) dFN (х) -= Ji fN (х) dFN(x), где а, Ь — у/2 и 1 —у/2 —выборочные процентили, FN—эмпи¬ рическая функция распределения, /N — оценка плотности типа «окно», все они вычисляются по остаткам полной модели. Здесь не приводится строгое доказательство состоятельности оценки, когда учитываются все необходимые условия регулярности для оценок типа плотности в случае линейной модели при метках общего типа. Для заданного значения у программа RANKREGRESSION из пакета Minitab получает R — оценку и критерии, построенные либо * См. также примеры 2.8.2, 2.8.4, 2.8.5, 2.9.1. — Примеч. пер. 272
no\D* (5.3.6), либо по 5* (5.3.23), причем используются либо интер¬ вальная оценка, либо оценка плотности т. Доказательство результа¬ тов) относящихся к линейной модели с метками общего вида (за исклю¬ чением подхода с оцениванием плотности), можно найти в [94], [125]. 5.4. ВЫЧИСЛЕНИЯ И ПРИМЕРЫ Вычисления, необходимые для получения ранговой оценки или критерия в линейной модели, в общем случае довольно трудоемки, и по¬ этому необходимо обращаться к ЭВМ. Из теоремы 5.2.1 мы знаем, что D (Y — ХР) — непрерывная и выпуклая функция, так что можно использовать для поиска минимума такие методы, как пошаговый спуск! Здесь применим и итеративный метод, основанный на идее по¬ строения /г-шаговых оценок (5.2.19). Поскольку минимальное зна¬ чение не всегда единственно, его величина зависит от того, какое из решений даст алгоритм. Если выборка одна, то это означает, что по су¬ ществу выбирается одно из значений между двумя средними порядковы¬ ми статистиками, как в случае выборочной медианы при четном разме¬ ре выборки. К тому же, поскольку для нахождения минимума приме¬ няются итеративные методы, доверительные множества зависят от то¬ го, когда итеративный процесс прекращен, что и повлияет на числовой ответ. Обсуждение вычислительных вопросов поиска ранговых оценок и критериев можно найти в [13], [76], где даны также ссылки на соот¬ ветствующую литературу. Пакет Minitab дает возможность обрабаты¬ вать данные посредством программы RANK REGRESSION, вычисляю¬ щей -оценки и критерии, основанные на D* и В*. Благодаря этой программе можно также вычислить критерии и оценки по уилкоксонов- ским и винзоризованным уилкоксоновским меткам, полученным как в результате оценивания т с помощью доверительных интервалов, так и при подходе, предполагающем оценивание плотности. Помимо вопросов вычисления существуют еще статистические ас¬ пекты. Анализируя модели из [126], [75], [76], мы видим, что номинальный уровень значимости ранговых критериев довольно близок к истин¬ ному уровню значимости при замене критической точки (q) на умноженное на q критическое значение F-распределения, равное qFaX- X(q, N — р — 1). Обычно полученное согласно асимптотической теории критическое значение %2 приводит к завышению числа отклонений при выполнении нулевой гипотезы и влияет на уровень значимости. Справиться с этой неприятностью во всех последующих ситуациях мы можем, прибегнув к критическому значению F. Поправка на непрерывность применяется в общем случае к доверительному интервалу для оценивания т. На¬ пример^ можно домножить на [N/(N —р — I)]1/2 —этот мно¬ житель для оценки о получен из теории наименьших квадратов. По¬ правка на непрерывность, найденная с помощью подхода, предусмат- 273
ривающего оценивание плотности, обсуждается при построении оцен¬ ки у* (5.2.24) параметра т. / Оставшиеся примеры взяты из литературы, в которой читателе мо¬ жет найти различные подробности об обсуждаемом предмете и Даль¬ нейший его анализ. Мы приведем и решения по методу наименьших квадратов, которые нужны для сравнения с решением по обсуждаемому методу. j Пример 5.4.1. Этот пример предназначен для иллюстрации проце¬ дуры оценивания коэффициентов регрессии. Табл. 5.2 содержи^ дан¬ ные 21 наблюдения над переменной отклика Y и тремя независимыми переменными х19 х2 и х3, характеризующими окисление аммиака в азотную кислоту: Y—процент аммиака, выбрасываемого при химиче¬ ской реакции в атмосферу, и умноженный на 10; хг — скорость про¬ цесса, измеряемая количеством воздуха, вступившего в реакцию, х2 — температура воды, применяемой для охлаждения реактора; х3 — концентрация азотной кислоты в абсорбционной жидкости (сдвинутая на — 50 и домноженная на 10). Рассмотрим выражение Yi — Ро + Х1 i Pi + X2i Р2 + X3i Рз ~ ei» i = 1, ..., 21. Зависимая переменная — мера неэффективности про¬ цесса. Таблица 5.2 Данные о выходе аммиака через трубу Количество Концентрация № технологи¬ воздуха, Температура азотной кислоты Выброс аммиака, ческого цикла вступившего в реакцию, xt воды, х2 в абсорбционной жидкости, хй Y 1 80 27 89 42 2 80 27 88 37 3 75 25 90 37 4 62 24 87 28 18 5 62 22 87 6 62 23' 87 18 19 20 15 14 14 13 11 12 8 7 7 62 24 93 8 62 24 93 9 58 23 87 10 58 18 80 11 58 18 89 12 58 17 88 13 58 18 82 14 58 19 93 15 50 18 89 16 50 18 86 17 50 19 72 / 8 8 Q 18 50 19 79 19 50 20 80 20 56 20 82 У 15 15 21 70 20 91 274
Таблица 5.3 Оценка параметров \ По методу Р* Pi Р2 Рз т наименьших квад¬ ратов —39,9 0,72(0,17)1 1,30(0,37) —0,15(0,16) наименьших квадра¬ тов (без выбросов) —37,6 0,80(0,07) 0,58(0,17) —0,07(0,06) Уилкоксона —40,1 0,82(0,13) 0,89(0,35) —0,12(0,15) 3,06 33-процентная вин- зориЗация —38,0 0,85(0,10) 0,72(0,28) —0,13(0,12) 2,49 50-процентная вин- зоризация —38,5 0,85(0,08) 0,67(0,22) —0,11(0,09) 2,00 знак (Lx) —39,7 0,83(0,06) 0,58(0,14) —0,06(0,06) 0,89 Эндрюса —37,2 0,82(0,05) 0,52(0,12) —0,07(0,04) 1 Число в скобах — ■ оценка стг шдартного otkj юнения. Анализ этих данных по методу наименьших квадратов дан у К. А. Браунли [27, с. 454]*, JI. Н. Дрейпера и Г. Смита [45 с. 361] **, К. Дэниела и Ф. С. Вуда [41, гл. 5]. Дэниел и Вуд после детального анализа исключают четыре наблюдения с номерами 1,3, 4 и 21 как вы¬ бросы, соответствующие временным состояниям процесса. Перемен¬ ная х3 была отброшена как незначимая. Рассматриваются оставшиеся 17 наблюдений. Данные табл. 5.2 анализировались по методу наименьших квадра¬ тов с помощью ЭВМ и программы REGRESS из Minitab, была построе¬ на регрессия Y на три переменные из столбцов 2—4. График остатков относительно подогнанных значений дан на рис.. 5.1. Обратите внима¬ ние на четыре экстремальных остатка и понижающийся наклон линии регрессии по оставшимся точкам. Д. Ф. Эндрюс [5], Т.П. Хеттманспергер, и Дж. У. Мак Кин [75], применяя М- и R-оценки и оставляя для анализа четыре точ¬ ки — выброса, достигли по существу того же согласия, что было достигнуто по методу наименьших квадратов по данным без четырех точек. В табл. 5.3 приведены R-оценки (30, р1? (32, Рз» т Для различных функций меток. Основа сравнения — линия, построенная по методу наименьших квадратов по данным без выбросов. * В русском переводе книги Браунли эта глава опущена. — Примеч. пер. ** В русском переводе книги Дрейпера и Смита в упражнениях к гл. 6 опыт описан подробнее, а также приведен подбор всевозможных регрессий. О вычислительных методах наименьших квадратов есть специальная книга: Л о- усонЧ., Хенсон Р. Численное решение задач метода наименьших квадра¬ тов: Пер. с англ. — М.: Наука, 1986. — 232 с. — Примеч. пер. 275
Оценки стандартных отклонений вычисляются по оценке т 2(ХсХс)~\ предложенной в теореме 5.2.3. Поскольку ст2/т2 — оценка эффектив¬ ности рангового метода по отношению к методу наименьших квадра¬ тов, то меньшее значение т указывает на то, что для выбранных данных функция меток более эффективна. Это неформальная точка зрения вы¬ бора функции меток по выборке позволяет сделать вывод о том, что оценки по меткам соответствующие минимизации суммы абсолют¬ ных величин остатков, хорошо подогнаны и наилучшие среди тех, что 6,00 + *(4) {3) (D g 0,00 + о — • * • • (21) -12,00 + 0,00 9ЛЮ 18 ЛЮ 27ДЮ 36+00 45ЛЮ Предсказанные значения Рис. 5.1. График остатков, построенный по методу наимень¬ ших квадратов относительно подогнанных значений мы рассматривали. Оценки, соответствующие знаковым меткам, близ¬ ки к оценкам наименьших квадратов по данным без выбросов. J1. Ден¬ би и К. Л. Мэллоуз [42] пришли к тому же выводу, используя диагностические графики робастной регрессии. К сожалению, в общем случае мы можем ожидать не такой чувстви¬ тельности анализа по методу наименьших квадратов, как у Дэниела и Вуда. Поэтому разумно использовать уилкоксоновские или винзоризо- ванные уилкоксоновские функции меток, например, с 33-процент¬ ной винзоризацией из примера 2.9.5. Если результаты вычисления приходят в противоречие с результатами анализа по стандартному ме¬ тоду наименьших квадратов, требуется глубокое изучение опыта, дабы можно было установить источник расхождения в результатах. Оценки стандартных отклонений для R-оценок получены по методу, основанному на использовании длины доверительного интервала. Этот подход базируется на предположении симметрии распределения ошиб¬ ки*. В нашем примере для уилкоксоновских меток метод, основан¬ * См. [353], где есть соответствующая библиография. —Примеч. пер. 276
ный на использовании доверительного интервала, дает т =3,06. Метод, предполагающий оценивание плотности, дает т = 2,68. Оцен¬ ки Pi, р2 и рз и их распределения не зависят от допущения симметрии. Параметр пересечения ро зависит от того, сделали ли мы предполо¬ жение о симметрии. При допущении симметрии для уилкоксоновских меток Ро — медиана из средних Уолша остатков полной модели. Она равна р0 = — 40, 10. 7,00+ * (4) (3) (1) ш 0,00 + -7,00 + 2 * (21) -14,00 + н н н + + 0,00 9,00 18,00 27,00 36,00 45,00 Предсказанные значения Рис. 5.2. График 33-процентных винзоризованных уилкоксо¬ новских остатков относительно подогнанных значений Без этих допущений ро — просто медиана остатков ро = —40,14. Напомним здесь то, что мы обсуждали в «окрестности» формул (5.2.31) и (5.2.32). Для проверки значимости оценки коэффициента ру, который был отброшен в ходе анализа по методу наименьших квадратов, мы мо¬ жем сравнить квадрат отношения оценки и ее стандартного отклоне¬ ния с критическим значением F-распределения Fa (1, 17). Это в точно¬ сти критерий, основанный на В* (5.3.23). Для уилкоксоновских ме¬ ток из табл. 5.3 В* =-:(—0,12/0,15) 2 = 0,64, что не будет значимо при любом разумном уровне значимости а. Снова воспользуемся уилкоксо- новскими метками, но основанными на D (Y — ХР); пользуясь про¬ граммой RANG REGRESSION из Minitab, мы получим D* из (5.3.6), равную 0,81. И, правда, даже при беглом взгляде на табл. 5.3 можно обнаружить, что все ранговые критерии меток, основанные на 5*, «потерпят неудачу» при отклонении Н0: Р5 = 0 при любом разумном уровне значимости. В заключение мы советуем применять уравнения, основанные или 277
на уилкоксоновских, или на 33-процентных цензурированных уилкок- соновских функциях меток. Вот соответствующие уравнения: у — — 40,1 + 0,82 + 0,89 х2 — 0,12 х3 или у = — 38,0+0,85 х1 + 0,72х2 — 0,13х3. Мы не исключаем ни выбросы, ни член с х3. На рис. 5.2 изображен график остатков относительно подогнанных величин для 33-процентного винзоризованного уилкоксоновского случая. Заметим, что четыре вы¬ броса отклоняются больше, чем на рис. 5.1, иллюстрирующем приме¬ нение метода наименьших квадратов, а оставшаяся часть «рисунка» выглядит лучше. Уравнение, осно¬ ванное на знаковых мет¬ ках, также привлекатель¬ но и предпочтительно с точки зрения эффективно¬ сти. В любом случае урав¬ нения, построенные по D (Y — ХР), лучше уравне¬ ний, полученных по методу наименьших квадратов в смысле согласия по пол¬ ным данным. В [30] обсуждается альтернативный изложенному вы¬ числительный подход, базирующийся на итеративных изменениях весов из метода наименьших квадратов, и приведены оценки для этого же примера, они очень близки к числам из табл. 5.3. Пример 5.4.2. В этом примере регрессионный анализ показан на опытах двухфакторного анализа. Одновременно приводятся двухфак¬ торный дисперсионный анализ и анализ по методу наименьших квад¬ ратов. Данные из [25] сведены в табл. 5.4. Речь идет о времени вы¬ живания (продолжительности жизни) 48 животных, подвергшихся воз¬ действию трех различных ядов при четырех различных обработках. При четырех наблюдениях в ячейке мы пользовались факторным пла¬ ном (3x4). Мы хотим проверить наличие значимого воздействия и значимости главных эффектов. Из графика медиан ячеек (рис. 5.3) видно, что могут быть представлены все эффекты. График имеет две особенности: 1) вторая обработка кажется более эффективной*; 2) третий яд почти рав¬ номерно дает летальные исходы**. Сначала мы должны построить линейную модель с невырожденной матрицей из этого примера. Начнем с модели Yijk = \i + Pt + Tj + * В смысле более длительного времени выживания. — Примеч. пер. ** Т. е. почти по всем обработкам. — Примеч. пер. 278
+ Iij + eijk, t =1,2,3; j = 1,2, 3,4; k = 1, 2, 3, 4. Условие 2Pt = j = 2ilij = 2jlij = О используется для идентификации параметров. Обозначим через Ръ Р2, Р3 и Т19 Т2, Г3, Г4 эффекты ядов и обработки соответственно. Член«отвечает» за взаимодействие фактов. Теперь построим матрицу плана. Продемонстрируем построение матрицы для однофакторного плана из примера 5.3.1. Наблюдения Y мы запишем в виде вектора размера 48x1 в порядке РгТ19 PiT2i Р{Г3, РгТ^ Р2Тг, гд$Р1Т1 — наблю¬ дения, соответствующие первому яду и первой обработке, и т. д. Ис¬ пользуем также следующие обозначения: 1 для (4 X 1)-вектора из еди¬ ниц, a D*7- для (4х 1)-вектора из Y из ячейки (i, /). Теперь мы можем представить наблюдения так: Л Рг ps 7\ Т2 Т3 т, Du l 0 0 1 0 0 0 d12 l 0 0 0 1 0 0 D13 l 0 0 0 0 1 0 d14 l 0 0 0 0 0 1 По этому образцу строятся и другие ячейки. Для того чтобы преоб¬ разовать матрицу в невырожденную и учесть члены, «отвечающие» за взаимодействие, мы вычтем столбец Р3 из столбцов Р1 и Р2 и столбец Таблица 5.4 Время выживания (единица = 10 часов) Яд Обработка А в с D I 0,31 0,82 0,43 0,45 0,45 1,10 0,45 0,71 0,46 0,89 0,63 0,66 0,43 0,72 0,76 0,62 II 0,36 0,92 0,44 0,56 0,29 0,61 0,35 1,02 0,40 0,49 0,31 0,71 0,23 1,24 0,40 0,38 III 0,22 0,30 0,23 0,30 0,21 0,37 0,25 0,36 0,18 0,38 0,24 0,31 0,23 0,29 0,22 0,33 279
Г4 из Тг, Т2 и Т3. Затем мы сформируем для столбцов со звездочка¬ ми следующую таблицу: РI PI т\ n n /ll Лг h 3 In 122 123 Du 1 0 1 0 0 1 0 0 0 0 0 d12 1 0 0 1 0 0 1 0 0 0 0 ^13 1 0 0 0 1 0 0 0 1 0 0 d34 1 0 —1 —1 —1 —1 —1 —1 0 0 0 Для вычисления фиктивной переменной взаимодействия столбец Iij получают умножением i-го столбца Р* на /-й столбец Г*. Параметры со звездочкой — просто контрасты*, например . Р\ = Ру —Р3, ис¬ пользуемые для формулировки гипотез. Полные данные (данные столбца Y и И столбцов единиц, один отрицательный элемент и нули) вводятся в ЭВМ. Теперь мы можем определить некоторые интересные гипотезы. Пусть Р' = (Р1, Р2, ТI, Т%, 7"з, /12, ..., /2з) с 11-ю компонентами. Пусть матрица Н/ раз¬ мера (6x11) задана в виде Н/ = [0,1], где I — единичная матрица раз¬ мера (6x6). Тогда Я0 : Н/Р = 0 специфицирует гипотезу отсутствия взаимодействия. Пусть ИР = [1, 0], где I — единичная матрица раз¬ мера (2x2). Тогда Я0 : Нр р = 0 определяет гипотезу об отсутствии эффекта ядов. Заметим, Нр р = 0 означает, что Р\ = 0 и Р1 = 0, так что Р\ = Р1 — Р3 = 0 и Р*2 = Р2 — Рз = 0 и Рг — Р2 = Р?,- Запись матрицы Нр, необходимой для спецификации гипотезы об отсутствии эффекта обработки, читатель может сделать самостоятельно. В вычислениях поможет пакет Minitab. Поскольку время жизни может быть распределено несимметрично, то следует применять оцен¬ ку т через плотность. Воспользуемся также уилкоксоновскими метка¬ ми и статистикой D* (5.3.6). Табл. 5.5 позволяет сравнить D*/df с Fa(df, N — р — 1) при N = 48 и р = 11, как предлагалось в начале раздела. В столбце, озаг¬ лавленном «Т7», приведены значения классического /^-критерия. Таблица 5.5 Анализ данных о выживании Источник df D* tdf f.,05 (df; 36) F p 2 42,53 3,26 23,22 T 3 22,85 2,87 13,81 PxT t* = 0,084 6 = 0,149 i 6 3,35 2,36 1,87 * Линейные функции от эффектов. — Примеч. пер. 280
Основываясь на ранговом критерии D* из табл. 5.5, мы видим, что имеются значимый член взаимодействия и высокозначимые главные эффекты. С другой стороны, /♦’-критерий не позволяет отклонить на 5- процентном уровне гипотезу об отсутствии взаимодействия. На рис. 5.4 изображен график значений остатков, полученных в ходе решения за¬ дачи на основе приведенных выше данных. График демонстрирует сильную неоднородность дисперсий в ячей¬ ках. В лекциях памяти Вальда (1972 г.) П. Дж. Хьюбер [90] указал на 0,70 + о _ S 0.35 + » * • | 0,00 + 44 5* 2 3 2 § 22 -0,35 2 + + + + Н + 0,20 0,35 0,50 0,65 0,80 0,95 Предсказанные значения Рис. 5.4. График остатков относительно подогнанных значе¬ ний при уилкоксоновских метках «неуправляемую неоднородность дисперсии переменных и наличие оши¬ бок, существенно характерных для распределений с длинными хвоста¬ ми, которые имеют почти не различимые эффекты*, причем оба этих явления ухудшают эффективность оценок [наименьших квадратов].» Анализ, основанный на рангах остатков, также зависит от допуще¬ ния однородности дисперсий. Некоторые авторы предлагали преобра¬ зования, улучшающие ситуацию (см. [25], [26]). Были рекомендованы обратные величины, табл. 5.6 позволяет анализировать преобразован¬ ные данные. Следует заметить, что эти статистики ранговых критериев в линей¬ ных моделях, вообще говоря, не инвариантны относительно монотон¬ ных преобразований, как в случае простой линейной модели. В слу¬ чае сдвиговой модели мы ранжируем не остатки, а данные. Таким об¬ разом, критерии, основанные на рангах, могут быть чувствительны к преобразованиям данных. При таком подходе ситуация улучшилась. Ранговый анализ и ана¬ лиз по методу наименьших квадратов дают близкие результаты. Из * Это крайне затрудняет проверку стандартных гипотез ANOVA. — При¬ меч. пер. 281
рис. 5.5 видно, что дисперсии в ячейках более однородны. Метод, ко¬ торый мы предложили, основан на применении статистики D*, пост¬ роенной по уилкоксоновской функции меток с оценкой плотности, и применяется к данным, преобразованным в обратные. Мы описали применение статистики D*-критерия для подгонки мо¬ дели при проверке гипотез. Подход к анализу данных, предложенный в примере 5.4.2, заключается в сравнении рангового анализа и анализа по методу наименьших квадратов и более углубленном изучении тех данных, при которых эти методы расходятся. В нашем случае предла¬ гается обратное преобразование. 1,80 + J2 0,90 + ■ 8 * 2 2 * 22 | 0,00 + * 2 <2 -***** — * * — * * * —0,90 + н н н н Н + 1,00 2,00 3,00 4,00 5,00 6,00 Предсказанные значения Рис. 5.5. График остатков относительно подогнанных значений для обратных значений Обращались также и к ранговому критерию с выравниванием. Алгоритм, необходимый для регрессии по методу наименьших квадра¬ тов, есть, однако нет специальной программы для рангового вектора чисел. Проверяя гипотезу Н0 : Н/Р = 0 об отсутствии взаимодейст¬ вия, мы сначала находим остатки по методу наименьших квадратов для сокращенной модели, скажем, r0i, ..., row• Потом вычисляем a (#,), ..., a (Rn), где a (Rt) = У12 [щ] ~ \ ]> и — Ранг 701 отно- сительно г01, ..., rQN. Затем приписываем значения a (Rj), ..., a (RN) соответствующим переменным из программы метода наименьших квад¬ ратов и получаем S* как числитель — сумму квадратов в статистике /^-критерия для гипотезы об отсутствии взаимодействия. Если сделать это для строчных данных, то будем иметь S* = 14,77. Критическое значение для шести степеней свободы есть %о,о5 (6) = 12,59, и мы должны отклонить нулевую гипотезу об отсутствии взаимодействия. Для данных — обратных величин — S* = 7,39, что не позволяет 282
отклонить нулевую гипотезу на любом разумном уровне. Таким образом, анализ дан¬ ных с помощью S* аналоги¬ чен анализу, проводимому с помощью D*, и приведен в табл. 5.5 и 5.6. Если вычис¬ лить статистику критерия с выравниванием для главных эффектов, то остатки для но¬ вой сокращенной модели надо искать отдельно в каждом случае. Если мы предположим, что модель аддитивна (взаимодействие отсут¬ ствует), то у нас будет двухфакторный план с четырьмя наблюдениями в ячейке. Критерий для эффектов ядов и обработки можно построить как обобщение критерия Фридмена из упражнения 4.5.10. В упраж¬ нении 5.5.8 читателю предлагается провести соответствующие вычисле¬ ния. Подобным образом можно рассматривать другие более слбжные пла¬ ны. Надо лишь ввести фиктивные переменные, порождающие невырож¬ денную матрицу плана для многофакторных планов или ввести подхо¬ дящую матрицу в случае регрессии. Ковариационный анализ можно провести так же, объединяя фиктивные и регрессионные переменные. Другие стороны робастного дисперсионного анализа рассматривались в [166], [128]. Обсуждение робастного дисперсионного анализа, осно¬ ванного на М-оценках, см. в [165]. 5.5. УПРАЖНЕНИЯ 5.5.1. Рассмотрим модель простой линейной регрессии из раздела 5.1: Yi = Рх + Р2*г + ei> i = !»•••> N. Предположим, что elt ..., eN — независи¬ мые, одинаково распределенные случайные величины, F £ Й0. Вместо U (5.1.4) для проверки Н0:$2 = 0 против НА : Р2 Ф 0 применим т Кендэла из (4.4.6). Так же мы можем использовать 5 — числитель т из (4.4.5). Если хг < ... < xN, то 5 = 22£</- s (Yj — Yt) — статистика критерия; ее среднее, дисперсия и предельное распределение при Н0 : Р = 0 приведены в теореме 4.4.2. Для получения оценки Ходжеса — Лемана определим 5 (р2) =22*</s *t) и покажем, что S <Р,) = 2 {# [{Yj-Yi)/(xj-xt)> М-(^) = = 25* (Р,)—JV (N—1)/2, а также, что sr , ( Yj~Yi \ P2 = med . /</ \ Xj—Xi J 283 Таблица 5.6 Анализ обратных величин И сточник df D*/df F0,ob (df, 36) F р 2 56,32 3,26 72,56 т 3 25,26 2,87 28,36 РХТ т* = 0,435 а = 0,490 6 1,45 2,36 1,09
Далее, (1 — а) 100-процентный доверительный интервал для Р2 задается с помощью [S(h+1y S(N*_k)], где N* = N(N— 1)/2, S(d < ... < S(N*}— упорядо¬ ченные попарные наклоны, причем Р (5* ^ k) = а/2. Заканчивая решение, покажите, что k можно приблизить посредством ЛЧЛ'-l) ^ ! / N (N-\) (2/V + 5) ■z„/0 j7 -а/2 |/ ?2 где ^ Ф (^а/2) = а/2• 5.5.2. Покажите, что при Р — истинном значении параметра — ES (Y — - Хр) - 0, где Sj (Y — ХР) взято из (5.2.7), / = 1, ..., р. 5.5.3. А. Предположим, что верна линейная модель (5.2.1). Пусть р0 — истинное значение, и S (Y — Хр0) есть вектор ранговых статистик размера (рх 1) с j-ком¬ понентом из (5.2.7) и пусть выполняется (5.2.11). Покажите, что 1 D =1 S (Y — X Ро)—^ Z ~ MVN (О, 2). Vn Б. Покажите, что при выполнении А 1—1 V N ((Г— ро) Z ~ MVN о, ! £" 12 (J /2 (*М*)2 где р взято из (5.2.14). 5.5.4. Предположим, что (j}0 — р0) — ограниченная по вероятности случайная величина. Покажите, что при допущениях (5.2.11) N1у^2 (рх — р0) — одношаговая оценка из (5.2.11); она асимптотически распределена, как MVN (0, т2!-1), где т = 1 /(121 ^2 | f2 (х) dx). Указание, Запишите VT (Pi —Ро) —т У-' S (Р„) = Vn ^ = КлЧРо-Ро)+т—Y~‘ [S (Ро) —S (Ро)]- У N Покажите, используя асимптотическую линейность (5.2.10) и ограничен¬ ность по вероятности N*'2 ф0 — Ро)» что правая сторона есть ор (1). Это дает нам асимптотическое распределение второго члена в правой части. 5.5.5. Обратимся к оценке плотности (5.2.21). Покажите, что при любом фиксированном у Получите аналогичную формулу для var fN (у). После этого покажите, что EfN(y) + f(y) и Var fN {у) 0, а отсюда fN(y) — состоятельная оценка f (у). 5.5.6. Пусть /v (х) задается (5.2.21). Покажите, что j (х) dx — J f*N (х)Х XdFN (х), где (х) удовлетворяет определению 5.2.3 с «окном» до* (х), что рав¬ но до * до (х) — плотности свертки (см. определение АЗ приложения). 284 Ef n (У)— -г- Л;
5.5.7. Пусть Р — ранговая оценка полной модели из определения 5.2.2. t/О Докажите, что N ч* (Нр-Нр) имеет в асимптотике многомерное нормальное распределение, если выполняются допущения (5.2.11). Найдите ковариационную матрицу предельного распределения. 5.5.8. Используя данные табл. 5.4 и предполагая отсутствие взаимодейст¬ вия (аддитивная модель), примените обобщенный критерий Фридмена из упраж¬ нения 4.5.10 для проверки нулевой гипотезы отсутствия эффекта обработки. За¬ тем проверьте нулевую гипотезу отсутствия эффекта ядов. 5.5.9. Средняя мера различия Джини (Gini’s mean difference)* изменчивости X' = (Хх, ..., Хп) определяется формулой А. Пусть X7 = (Xlt ..., Хп) —случайная выборка из нормального распреде¬ ления с дисперсией а2; покажите, что Eg (X) = а, т. е. g (X) — несмещенная оценка стандартного отклонения. Б. Покажите, что если Rf — ранг Xit то 2 ]/' я / nJr 1 \ Следовательно, R-оценка 0 в линейной модели минимизирует меру изменчивости Джини. 5.5.10. Рассмотрим D (Z), определенную в (5.2.3). Докажите следующее: A. Для любого Z из Rn , D (Z) > О. Б. Для любого Z, W из RN D (Z + W) < D (Z)+D'(W). B. Для любого скаляра b D (b Z) = | Ь | D (Z). Г. D (Z) = 0, если и только если = ...= ZN. В этом упражнении мы показываем, что D (Z) с метками, которые удовлетво¬ ряют условиям, приведенным выше, есть псевдонорма (или семинорма). Таким образом, ранговая оценка Р из определения 5.2.2, определяемая выражением Хс р, есть вектор, ближайший к вектору Y в подпространстве, определяемом моделью Хр, причем расстояние определяется псевдонормой D (Y — Хр). 5.5.11. В этом упражнении показано, что D* (5.3.6)—естественная стати¬ стика критерия; статистика измеряется сравнением расстояния от Y до подпро¬ странства, специфицирующего нулевую гипотезу, и расстояния от Y до подпрост¬ ранства, определяемого полной моделью. Ясно, что D* аналогична статистике наименьших квадратов, которую можно интерпретировать как уменьшение суммы * См., например, [103], [210а]. — Примеч. пер. 285
квадратов при подгонке сокращенной и полной моделей. Аналогична F-статисти¬ ке также статистика критерия D(Y-Xf0)-D(Y-Xp) N~lD( Y—х'Ро) Приведите эвристические аргументы для доказательства того, что N—1 Dx X (Y - ХР) сходится по вероятности к х ср(F (х)) dF (х) = 6, где ф (и) — — общая функция меток, так что J ф (и) du = 0, j ф2 (и) du = 1. Покажите, что в случае уилкоксоновской функции меток (5.2.9) 6 не равно т/2. Следовательно, критерий, основанный на D°, асимптотически не имеет размера а, и D* предпочтительнее. 5.5.12. В рамках доказательства теоремы 5.2.3 покажите, что Т = = а*е2 З1/2 j f2 (х) dx, где а* — минимальное собственное число 2. 286
Глава 6 • МНОГОМЕРНАЯ МОДЕЛЬ С ПАРАМЕТРОМ ПОЛОЖЕНИЯ 6.1. ВВЕДЕНИЕ В этой главе мы показываем, как одно-и двухвыборочные одномер¬ ные критерии и оценки можно обобщить на многомерный случай. Если в многомерной задаче есть р компонент, то нас интересует век¬ тор одномерных статистик, вычисленных для каждой из р компонент. Например, мы будем рассматривать вектор знаковых статистик для многомерной одновыборочной модели, представленной в следующем разделе. Обозначим р-компонентный вектор статистик S' = (S^ ..., Sp)r причем статистика St центрирована так, что ESt = 0 при нулевой гипотезе. Даже если для одномерной модели статистика свободна от распределения, вектор уже не будет оставаться свободным от распре¬ деления в многомерном случае. Сложности возникают при анализе Cov (Si, Sj); они связаны с совместным распределением наблюдений. Решение этой задачи — оценка ковариации и построение асимптоти¬ чески свободных от распределения критериев. Таким образом, упор делается на асимптотическое распределение. Можно строить условные перестановочные критерии и критерии рандомизации, которые свободны от распределения, для конечных вы¬ борок. Они практичны лишь для небольших выборок*, и мы не обсуж¬ даем их здесь. Обсуждение условных перестановочных свободных от распределения критериев см. в [120], где показаны приложения, и [149], где изложены теоретические вопросы. Вот наша стратегия построения критерия. 1. Доказать, что при нулевой гипотезе л-1/2 S асимптотически рас¬ пределено, как MVN (0, V). 2. Найти состоятельную оценку V для V. 3. Исходя из этого S* = п~х S' (V)^1 S = S' (ftV)-1 S будет асимпто¬ тически распределено, как х2 (р)- С помощью критерия можно откло¬ нить нулевую гипотезу на приближенном уровне а, если S* ^ Ха (р) — верхнее критическое значение х2-распределения с р степенями свободы. * В последнее время эта точка зрения пересматривается. — Примеч. пер. 287
Оценка параметра положения в многомерной модели определяется вектором одномерных оценок Ходжеса — Лемана, соответствующим од¬ номерным оценкам на S. Доверительные области с приближенными коэффициентами доверия можно построить, преобразуя векторы кри¬ терия. Другой подход к построению доверительных областей — нахож¬ дение оценки Ходжеса — Лемана для 0, оценивание ковариационной матрицы W асимптотического многомерного нормального распреде¬ ления п1/2 (0 — 0), а затем определение (1 — а) 100-процентного до¬ верительного эллипсоида (0 :п (в_0)' W-1 (0-8) < х?-« <Р) }, где %?-а (р) — верхняя (1 — а)-процентиль распределения с р сте¬ пенями свободы. Следует заметить, что ранговые процедуры не инвариантны отно¬ сительно вращения осей. Однако относительно преобразований сдви¬ га и масштаба процедуры инвариантны. Этим они отличаются от мето¬ дов, основанных на использовании вектора с компонентами — сред¬ ними, которые инвариантны относительно невырожденных преобразо¬ ваний. 6.2. ОДНОВЫБОРОЧНАЯ МНОГОМЕРНАЯ МОДЕЛЬ С ПАРАМЕТРОМ ПОЛОЖЕНИЯ Выборочная модель — набор п независимых, одинаково распреде¬ ленных р-мерных случайных векторов Хь ..., Хп, каждый с р-мернбй функцией распределения F (/х — 0lf ..., tp — 0Р). Предположим, что р-мерная функция распределения F абсолют¬ но непрерывна с абсолютно непрерывными маргинальными (частны¬ ми) функциями распределения F г (tr — 0Х), ..., Fv (tp — 0Р) и аб¬ солютно непрерывными двумерными частными функциями распреде¬ ления —0*, tj — 0j), i, / = 1, p. Параметры положе¬ ния 0X, ..., 0P — частные медианы; Fly ..., Fp£ £20. Данные можно представить в виде таблицы размера рхп: Хп Х12 ... Х1п Xpi Хр2 ... ХрП Здесь i-й столбец — р-вектор X*, а /-я строка— случайная выборка размера п, взятая по /-му компоненту. Такая модель получается при выполнении р измерений по каждому из п объектов. Мы хотим проверить Н0 : 0 ==.0 против НА . 0 Ф 0, где 0' = = (0i, ..., 0Р) и 0' = (0, ..., 0). Гипотезу Н0 : 0 = 0* можно пре¬ образовать в Н0: 0 = 0, вычитая заданный вектор 0* из вектора наб¬ людений. Поскольку не делается дополнительных предположений о структуре F (tl9 ..., tp), то для построения критерия мы берем вполне 288
подходящий вектор статистики знаков. Мы используем форму знако¬ вой статистики, имеющей нулевое математическое ожидание при нуле¬ вой гипотезе. Итак, при i = 1, ..., р пусть S, = S sgn Xi( = # (Xit > 0)— #(Xit < 0), /= 1, (6.2.1) t= 1 где sgn (x) равно —1, если x < 0, 0, если x = 0, и + 1 при x >0. Допустим, что наблюдений, равных 0, нет (это верно с вероятностью единица). Знаковая статистика (1.2.1) связана с поскольку# (Х^> >0) + # (Xit < 0) = п, t = 1, ..., /г, причем St = 2 # (Xff >0)—п (см. упражнение 1.8.12). Симметричная форма более удобна. Предположим, S' = (S1? ..., Sp), тогда теоремаЪ.2.1 предоставляет нам необходимую асимптотическую теорию. Сначала введем некото¬ рые дополнительные обозначения. Так, X' = (Х2, ..., Хр)— слу¬ чайный вектор с совместной функцией распределения F (•). Пусть Ри(0, 0) = Р(Х*<0, Х,< 0) и ри(0, 1)=Р(Х,<0, Xj > 0), р„(1, 0)=Р(Х;>0, Х7.^0) и I) =Р (Xt > 0, > 0). Теорема 6.2.1. При нулевой гипотезе Н0: 0 = 0 V), где V = ((ou)), i,j— 1, ..., р и = 0, 0)Ч-Ре>(1, 1)—/?,Д0, 1)—/?0(1, 0). Доказательство. ESt = 0 и Var = п, откуда пгг = 1. Рассмот¬ рим Соv(Sf. S,) = 2 £[sgnX<(sgnX*] = <= i = n[ptj(0,0)+pu(l, 1)-р„(0, 1)—PijiU 0)], (6.2.2) где vtj дается в утверждении теоремы. Из теоремы А12 приложения следует, что предельное распределение п1/2 S есть MVN (0, V). Для построения критерия нам нужна оценка V. Из (6.2.2) по закону больших чисел получим = — 2 sgn xtt sgn Xh Л vu. (6.2.3) П t= 1 Теперь определим V посредством vH = 1 и Оц из (6.2.3). При нуле- вой гипотезе V — состоятельная оценка V и статистика S* = S'(nV)~1S (6.2.4) асимптотически распределена, как х2(р)- Ю Зак. 284 * 289
Для S* при р = 2 есть простая форма. В упражнении 6.4.1 мы предлагаем показать, что S* можно записать в виде S* = (А'оо-Л'и)2 , (N0l-N10) ^00 + ^1 ^01 +^10 (6.2.5) N п N где Woo :J= # (X1(- <0, X2i < 0), iV*i = # (Х1г <0, X2i >0) и i = 1, ..., п. Их величины удобно представить в форме таблицы с дву¬ мя входами: 10 = # (Хц >0, Х2г- >0); = # (Xlf >0, Х2, <0), Хи <0 >0 <0 No о Na >0 Nlt Nn Асимптотическое распределение вектора выборочных медиан описано в упражнении 6.4.4. Полезно ввести допущение симметрии совместной функции распре¬ деления F (tly ..., tp). Если совместная плотность распределения / (/2, ..., tp) удовлетворяет условию f(ti, tp)=f(-ti, -<Р), (6.2.6) то мы будем говорить, что / — диагонально симметрична относитель¬ но нуля. Ясно, что частные плотности /х, ..., /р симметричны, а век¬ тор положения 0' = (0!, ..., 0Р) будет центром симметрии частных распределений. Рассмотрим при этих допущениях вектор уилкоксоновских знако¬ вых ранговых статистик,вычисленных по р компонентам наблюдаемых векторов. Пусть при i = 1, ..., р Т‘= 2-^sgn(XJt), (6.2.7) t&x n+1 где, как и в (2.2.2), RH — ранг |Х^| относительно |Xfl|, ..., |Xin|, и пусть Т' = (7\, ..., Тр). Теорема 6.2.2 дает нам предельное распре¬ деление, необходимое для построения критерия гипотезы Н0 : 0 =0 против НА : 0 =т^= 0. Теорема 6.2.2. Предположим, F (f3> ..., tp) соответствует плотность /(А» •••> tp)y диагонально симметричная относительно нуля. Тогда 290 ±=-T^Z~MVNp{0, V),
где 1 Va =—» 3 Vij = 4 j Ft (и) Fj (V) dFi} (и, о) — 1. Доказательство. Запишем Tt в виде Tt = | 2 s Wit) - j, (6.2.8) где Tt = 2 Rit s (Xit) — та форма статистики, которую мы изучали в упражнении 2.5.5. Используя проекционную теорему из примера 2.5.5, определим "|/ п Мы использовали то, что Ft £ Qs, откуда 1 — Ft (— х) = Ft (я). Пусть U' = (Ult ..., Up), тогда л-1/2 т — U сходится по вероятно¬ сти к О. Таким образом, предельное распределение п~ги Т — то же, что для U. Заметим, что Var Ut = 4(1/12) = 1/3, поскольку Ft (Xit) рав¬ номерно распределена на интервале (0, 1). Теперь Cov (Uh Uj) = 4ElFt (Xn) Fj (Xn)]-1 = = 4 JZc J "со Fi _(“) FS (v) dFU (“. &)— 1 • Итак, формулы для vu и vtj получены. Из теоремы А12 приложения следует, что U предельно многомерно нормально. Для построения критерия нам нужна состоятельная оценка V при нулевой гипотезе. Из (6.2.8) и (2.2.4) var Т 4 п(п+1)(2п+\) = (л+1)2 24 _ п (2я+ 1) п 6(л+1) ~ 3 Таким образом, С+ — varr,= 2/1 + 1 . (6.2.9) п 6(п+1) Далее мы приведем эвристические доводы в пользу того, что vijy опре¬ деляемая посредством (6-210> 10* 291
есть состоятельная оценка vtj. Пусть Fti (х) — эмпирическая функ¬ ция распределения, вычисленная для абсолютной величины i-го ком¬ понента. Мы можем записать (6.2.10) в виде (-^2-- Fal (| S I) Pni (| t I) sgn (s) sgn (t) dFniJ (s, t), где Fnij(s,f) — двумерная эмпирическая функция распределения, которая «приписывает» вес п~х каждой паре (xit, xjt), t = 1, ..., п. Поскольку эмпирическая функция распределения сходится, можно по¬ казать, что *>и Л JZ» FT( | S |) FJ (| t \) sgn (s) sgn (0 dFif(s, t). Правую часть можно переписать так: J0 $0 Ft (s)Fr (QdFti(s, i)~ ~i-SFi(s)Ft (—t)dFij(s, t) — —Sr J-o0Ft(-s)Ft(t)dFiJ(s, t) + + j'U-co^ (-s)Ff(-t)dFtJ(s, t). (6.2.11) Напомним, что Ft (x) = P(|Xj| < x) = Ft (x) — Ft (— x) = = 2Ft (x) — 1 при x >0 и Ft (*) = 0 при x < 0, а также F+ (—x) -^1 — 2F (x) при л: < 0 и F+ (—x) = 0 при x > 0. Подставляя приведенное выше выражение в (6.2.11), перемножая сом¬ ножители в каждом подынтегральном выражении и группируя инте¬ гралы, получим JI. П14F* (s) Fj (0 -2F£ (s)-2F, (f) + U dFtj (s, t). (6.2.12) Воспользуемся JJ Ft (s) dFtj (sy t) = § Ft (s) J dFtj (s, t) = J Ft (s)X XdFt (s) = 1/2, тогда (6.2.12) сводится к vtj из теоремы 6.2.2. Определив V = /, / = 1, р с vit из (6.2.9) и vtj из (6.2.10), мы видим, что при нулевой гипотезе T* = T/(nV)-1T (6.2.13) асимптотически распределена, как х2 (р). Обе статистики, 5* и 71*, легко вычислять; в примере 6.2.1 приве¬ дено вычисление Г*. В упражнении 6.4.2 показано, что стратегия много¬ мерного критерия имеет значительное преимущество над наивной стра¬ тегией применения одномерных критериев отдельно по каждому ком¬ поненту. Если мы предположим, что f — Qly ..., tp — 6Р) — много- 292
мерная нормальная плотность, центрованная величиной 0' = (0Х, ..., 0Р) с ковариационной матрицей 2, то статистика Хотеллинга — основа для проверки Н0 : 0 = 0 против НА : 0 =^= 0. Необходимая статистика задается формулой Н2 = пХ' V-1 X, (6.2.14) где X' = (Х„ Х„), 2 = ((cTf/)). j = 1 Р ПРИ = (п ~ 0_1х х2?= 1 — Xj) (Хл — X;). С помощью критерия Хотеллинга мож¬ но отклонить Я0 : 0 = О на уровне а, если Н2>[{п— \)pl(n— p)]Fa{py п р), где Fa (р, п — р) — критическая точка /^-распределения с р и п — р степенями свободы *. Пример 6.2.1. В работе Т. А. Райана [159, с. 276] дана таблица ве¬ личин кровяного давления у мужчин — перуанских индейцев в возрас¬ те 21 год, родившихся высоко над уровнем моря, родители которых так¬ же родились в высокогорье. В табл. 6.1 даны величины систолического и диастолического давления крови 15 индейцев. Мы предполагаем, что двумерное распределение диагонально симметрично относительно 0' = (0Х) 02), где 0Х — центр частного распределения систолического давления и аналогично 02. Мы хотим проверить Н0 : 0' = (120; 80) против НА : 0' Ф (120; 80), последние две величины — стандартные для мужчин в возрасте 21 год в США. Мы предполагаем, что давление Таблица 6.1 Данные о давлении крови Xt Xt — 120 - 12 01) X Xsgn (X,—120) Xt X, - 80 Я(|Х,-80\)Х Xsgn (Х2 — 80) 170 50 15 76 —4 —3,5 125 5 5 75 —5 —5 148 28 14 120 40 15 140 20 13 78 —2 —1,5 106 — 14 —10 72 —8 —8 108 —12 —8 62 —12 —10,5 124 4 3 70 — 10 —9 134 14 10 64 — 16 13,5 116 —4 3 76 —4 —3,5 114 —6 —6,5 74 —6 —6,5 118 —2 —1 68 — 12 — 10,5 138 18 12 78 —2 —1,5 134 14 10 86 6 6,5 124 4 3 64 — 16 —13,5 114 —6 —6,5 Ьб — 14 — 12 * О критерии Хотеллинга см. [198]; многомерный знаково-ранговый крите¬ рий для этой задачи предложила Жаклин Дитц [281]. — Примеч. пер. 293
крови у индейцев отличается от давления их американских сверстни¬ ков. Пусть X' = (Х1у Х2)у где Хг — величина систолического, а Х2 — величина диастолического давления. Из (6.2.9) = 0,323. Возьмем 3-й и 6-й столбцы табл. 6.1 и формулу (6.2.10), имеем*х}и = 0,1387. Теперь а из (6.2.13) Г* = 7,07. Если сравнить это число с %2о>о5 (2) = 5,99, то мы можем отклонить Н0 : 0' = (120; 80) на приближенном уров¬ не а = 0,05. Отсюда мы заключаем, что на этом приближенном уров¬ не очевидно различие давления крови у перуанцев и американцев. Точечная оценка 0' = (0j, 02) — пара медиан средних Уолша. Мы находим 0' = (126, 73). Из табл. 6.1 имеем Хг — 127, 533, Х2 — 87,267 и Если мы сделаем предположение о двумерной нормальности исходного двумерного распределения, то можно применять критерии Хотеллинга. При 0о = (120, 80) находим 0,05-критическая точка для этого критерия есть \(п — 1) pl(n — р)1х xFa (р, п — р) = (2,15) -4,965 = 8,19. Посредством критерия Хо¬ теллинга можно отклонить гипотезу при а -= 0,05. Заметим, что, об¬ суждая значимость Т*, мы говорили о приближенном уровне,основан¬ ном на асимптотическом, а не на точном распределении. Нужны даль¬ нейшие исследования распределения, приближающего распределение Т* для малых и умеренных выборок. Поскольку ковариации компонентов S и Т зависят от исходных одно¬ мерных и двумерных распределений, то многомерные обобщения крите¬ рия знаков и критерия знаковых рангов Уилкоксона уже не будут сво¬ бодны от распределения. Здесь мы имеем асимптотически свободные от распределения крите¬ рии. Этот подход* — вполне общий, и его можно применить к другим функциям меток. Многомерные критерии, основанные на винзоризо- ванных уилкоксоновских знаковых ранговых статистиках, проил¬ люстрированы на примерах в [186]. Случай общих меток описан в [149, гл. 4]. * Имеется в виду, видимо, построение статистик — квадратичных форм на суммах знаков, рангов, знаковых рангов в многомерном случае. — Примеч. пер. Я2 =п(Х—воГи-ЦХ-е о) = 8,88. 294
Асимптотическую эффективность можно получить способом, подоб¬ ным тому, что применялся в одномерном случае. Необходимо выяснить предельное распределение вектора /г-1/2 S на последовательности аль¬ тернатив 0„. = /г-1/2 0, сходящейся к нулю. По результатам этих вы¬ числений мы можем установить, что предельное распределение отлича¬ ется от асимптотического лишь математическим ожиданием. Вспомнив, о чем говорилось в разделе 6.1, мы видим, что п~1/2 S имеет асимптоти¬ ческое распределение MVN (jla, V) на последовательности 0П. Например, для заданного вектора знаковых статистик S, £'en (m_1/2S) сходится к ja = 2 (QJ1 (0), ..., Qpfp (0))'. Предельное распределение статистики S* на последовательности 0П — нецентральное ^-распределение с р степенями свободы и параметром нецентральное™ jui'V-1^. Поскольку асимптотическая локальная мощность есть возрастающая функция от параметра нецентральное™, эффективность двух таких статистик критериев — соотношение их параметров нецентральное™. П. Дж. Бикел [22] дал развернутый анализ свойств эффективности многомерного знакового критерия, многомерного критерия Уилкок¬ сона и критерия Хотеллинга. Он заключает, что лучше применять первые два критерия, чем критерий Хотеллинга, если существуют грубые ошибки (выбросы), но при наличии значительной вырожден¬ ное™* ими надо пользоваться с осторожностью. Вектор оценок Ходжеса — Лемана получается из вектора ранго¬ вых критериев, которые обычно имеют многомерное нормальное рас¬ пределение. Эффективность оценок определяется через обобщенную дисперсию — определитель асимптотической ковариационной матри¬ цы. Таким образом, в многомерном случае в отличие от одномерного случая выражения для эффективности оценивания и проверки гипотез разные. Свойства эффективности в обоих случаях, однако, очень схо¬ жи. Случай оценивания обсуждается в [21]. В упражнениях 6.4.4 и 6.4.5 строится асимптотическое распределение и приводятся некоторые результаты для оценок. 6.3. ДВУХВЫБОРОЧНАЯ МНОГОМЕРНАЯ МОДЕЛЬ С ПАРАМЕТРОМ ПОЛОЖЕНИЯ Сравним две многомерные выборки размера тип. Пусть Х1? ..., Хт и Yj, ..., Yn — выборки из р-мерного распределения с функциями распределения F (ult ..., up) и F {vx — Дх, ..., vp — Др) соответствен¬ но. Данные можно представить в виде Xlm Yn ... У17г Х.р\ ... ^pl **• Ypn * Видимо, речь идет о вырожденности распределения. — Примеч.. пер. 295
Предположим, что F — абсолютно непрерывна с абсолютно непре¬ рывными частными распределениями. Допущения о симметрии не дела¬ ются. Параметр А' = (Ax, ..., Ар) представляет величину сдвига по каждому компоненту при движении от распределения X к распределе¬ нию Y. Мы хотим построить критерий гипотезы Я0 : А =0 против Рассматриваемый нами критерий — многомерное обобщение крите¬ рия Манна — Уитни — Уилкоксона из раздела 3.2. Пусть LT = N = т + п. Ясно, что Ut — статистика, центрированная сумма ран¬ гов, где Rit — ранг Yи в объединенных выборках по t-му компоненту. При Я0 : А = 0, Е\) = 0. Теорема 6.3.1 дает нам предельное рас¬ пределение ЛЛ-1/2U при нулевой гипотезе. Теорема 6.3.1. Пусть верна нулевая гипотеза Я0 : А = 0. Предпо¬ ложим, что /л, п оо и m/N X, 0 < К < 1. Тогда где V = ((vl})), i, j= 1, р, и vtJ=mi - л.)! Гос I-* F> w Fi wFu (*• y) -1 /4I •' ^ /• Доказательство. Здесь приводится лишь набросок доказательства, поскольку оно подобно доказательству теоремы 6.2.2. Заметим, что где W* определено в доказательстве теоремы 3.2.4*. Следовательно, проекция задается формулой = (f/j, ..., Up), где (6.3.1) ^=-U -^Z~MVN(0, V), где ZH, t = 1, ..., N имеет функцию распределения Ft {а) и * Здесь следовало бы снабдить W* индексом i, i = 1, ..., p. — Примеч. пер. 296
Поскольку случайная величина Ft (Zit) — у равномерно распределе¬ на на интервале (—1/2, 1/2), мы получаем Далее (x)F,(y)dFtl(x, у)- 1/4) . (6.3.2) Проекция в пределе многомерно нормальна, что вытекает из теорем А12 или теоремы А13 приложения при at = bt/(N + 1). По теореме 2.5.2 о проекции A_1/2U имеет такое же многомерное нормальное предельное распределение. Теорема доказана. Для построения критерия гипотезы Н0 : А = 0 против НА : А Ф О нам сначала нужна состоятельная оценка V асимптотической матрицы ковариации. Для vit Если мы подставим одномерные и двумерные частные эмпирические функции распределения в (6.3.2), то получим состоятельную оценку Vtj. Вот слегка модифицированный результат: Прямая подстановка в (6.3.2) дает N2 вместо N (N — 1). Выражение (6.3.4) — подходящее выражение ковариации для условного совмест¬ ного распределения Ut и Uj при заданных наблюдениях объединенной выборки. Выражение (6.3.4) удобно применять для перестановочного критерия при конечной выборке. (См. [120, гл. 71.) Используя (6.3.3) и (6.3.4), получим статистику критерия 0jf = V аг 12N (iV+l) тп (6.3.3) ( N N N (М+\)2 тп (6.3.4) W2 (N 1) (W+ 1)2 и* = N-1 U' (V)-1 U = U' (Л/V)-1 и. (6.3.5) 297
Таблица 6.2 Уровни содержания биохимических составляющих Контрольная группа 1 1,21 2 0,61 0,92 0,43 0,80 0,85 0,98 0,35 0,48 0,42 1,15 0,52 1 ,10 0,50 1,02 0,53 1,18 0,45 1 ,09 0,40 Обрабатываемая группа 1 1,40 1,17 2 0,50 0,39 1,23 0,44 1,19 1,38 1,17 1,31 0,37 0,42 0,45 0,41 1,30 0,47 1,22 0,29 1,00 0,30 1,12 0,27 1,09 0,35 При Н0 : А = 0 статистика U* асимптотически распределена, как X2 с р степенями свободы. Итак, мы отклоняем Н0 : А = 0 на прибли¬ женном уровне а при U* ^ Ха (р)« Пример 6.3.1. Этот пример взят из [132, с. 167]*. Данные — уровни содержания двух биохимических составляющих в мозгу мышей. Двадцать четыре мыши одной и той же породы были случайным образом разделены на обрабатываемую группу (которая по¬ лучала лекарство) и контрольную группу. Предполагается, что у двух групп уровни содержания биохимических составляющих в мозгу будут различаться. Пусть А' = (Alt Д2) — разность медиан в двух двумер¬ ных совокупностях. Две мыши в контрольной группе умерли. Таким образом, у нас есть контрольная выборка Х1? ..., Х10 из F (tly t2) и об¬ рабатываемая выборка Y1( .... Y„ из F (tx — Aj, t2—Д2); мы хотим про¬ верить Н0 : А =0 против На : А ф 0. В табл. 6.2 приведены вели¬ чины уровней содержания в микрограммах ** на грамм ткани мозга. Анализу данных предшествует объединение величин первого компо¬ нента контрольной и обрабатываемой выборок и запись рангов. То же относится ко второму компоненту. Связанным (одинаковым) величинам присваиваются средние ранги. Эти ранги приведены в табл. 6.3. Из (6.3.1) мы находим Ut = 1,80 и U2 = — 1,43. Далее, vn = v22= rnnt[\2N (N + 1) 1 = 0,1976 и v12 = 0,0029. Итак, при N = 22 WV)~' = l 2’3523 - 3'49Ч \—3,496 2,3523/ * Есть и более позднее издание: Morrison D. F. Multivariate Statisti¬ cal Methods. — 2nd ed. — Tokyo: McGraw— Hill Kogakusha, 1976. — Примеч. пер. ** Микрограмм — 10~e грамма. — Примеч. пер. 298
Ранги данных Таблица 6.3 Контрольная группа 1 16 3 1 2 4 И 9 6 14 7,5 2 22 12 4,5 17 10,5 20 18,5 21 14,5 8 Обрабатываемая группа 1 22 12,5 18 15 21 12,5 20 19 17 5 10 7,5 2 18,5 7 13 6 10,5 14,5 9 16 2 3 1 4,5 и U* = LT (iVV^U = 14,22. Критерии приближенного уровня 0,05 требуют сравнить U* с Хо.об (2) = 5,99, после чего с помощью U* лег¬ ко отклонить Н0:А = 0. Оценка Ходжеса — Лемана А' есть (0,19, —0,08) (см. (3.2.5)). Дж. С. Мариц [120, с. 243] применил критерии нормальных меток. Он получил величину * 15,00, которую сравнивал также с Хо,об(2) = = 5,99. Отсюда следует тот же вывод. В упражнении 6.98 приведен ме¬ тод, основанный на многомерном обобщении критерия Муда. Критерий из нормальной теории можно построить на базе двухвыборочной стати¬ стики Хотеллинга (см. [132, гл. 4]**). Теория для функций меток общего вида описана у Пури и Сена [149]. Они же обобщили результаты с двухвыборочного на многовыбороч¬ ный многомерный случай. В [172] развита теория ранговых критериев с выравниванием и метками общего вида и распространена на много¬ мерную линейную модель ***. * Имеется в виду величина статистики критерия. — Примеч. пер. ** См. также [198], [213]. — Примеч. пер. *** В этой последней главе автор рассмотрел лишь одновыборочный и двух¬ выборочный многомерный случаи для сдвиговой модели. При этом он вскользь упоминает о многовыборочной ситуации. К настоящему времени Пури и Сен опуб¬ ликовали продолжение своей книги 1971. г.: Puri М. L., S е n Р. К. Nonpa- rametric Methods in General Linear Models. — N. Y. e. a.: Wiley, 1985. В нем и в [292, т. 4] содержатся вновь полученные ими результаты и обзор по этой теме. Весьма важна также задача двухфакторного дисперсионного анализа (см., на¬ пример, [288], [254]). Литературу по теме данной главы следует искать по рефе¬ ративному журналу «Математика», раздел «Математическая статистика», и особо по «Statistical Theory and Method Abstracts», разделы 04:160, 05:120, 08:110. — Примеч. пер. 299
6.4. УПРАЖНЕНИЯ 6.4.1. Проверьте, что (6.2.5) можно получить из (6.2.4). 6.4.2. Предположим, многие университеты беспокоятся, что болыцую часть стоимости учебной программы составляет стоимость изучения языков. Для проверки этой гипотезы ста юношам был задан психологический тест SAT (Scholastic Aptitude Test — университетский тест проверки способностей). У нас есть пары измерений: (V, Q) — вербальная и количественная части теста SAT соответственно. В следующей ниже таблице приведены числа измерений, кото¬ рые ниже (меньше) и выше (больше) национального среднего по двум компонен¬ там: Q V Ниже Выше Ниже 34 22 Выше 8 36 Пусть Sv — число наблюдений, значения которых больше национального вербального среднего (0у), и — число наблюдений, значение которых боль¬ ше национального количественного среднего (0q). Воспользуемся S* для провер¬ ки Н0 : 0' = (0?, 0q) против НА: 0' Ф (0у, 0q) на приближенном уровне а. С помощью критерия знаков из 1.2 проверьте каждый компонент на уровне а = 0,05 по отдельности. 6.4.3. Покажите, что в (6.2.2) ptj (0,0) + ptj (1,1) — ptj (0, 1) — ptj (1,0)= = 4pij (0, 0)—1. Указание. Используйте равенство маргинальной медианы нулю. 6.4.4. Пусть 0 — р-компонентный вектор выборочных медиан. Тогда S(0) —0, где 5, (0) = Z"=1 sgn (Xit - 0,) (см. (6.2.1)). А. С помощью 2.10.18 покажите, что ^)ws(0,+°'(1)' где мы (общность при этом не теряется) положили, что истинное значение 0 равно 0; diag (alt а2> •••» av) — диагональная матрица размера (рХр) с диагональ¬ ным элементом а*; 0р (1)-вектор размера (рх 1), сходящийся к 0 по вероятности. Б. Пусть D — диагональная матрица из А, докажите что 1/п'е Д-2 ~MVN(0, DVD'), где V из теоремы 6.2.1. 300
В. Покажите, что при р = 2 У DVD' = 4 /?(0) fi (0) f 2 (0) v 1 fi (0) /, (0) /I (0) _ где у = 4Р(Х1<0, Х2<0)—1. Г. Пусть применима двумерная центральная предельная теорема и УпХ-^+Z ~ MVN (0, 2) с дисперсиями of, а| и корреляцией р. Тогда эффективность 0 относительно X равна 1 /р, умноженному на корень из отношения асимптотических обобщенных дисперсий. Напомним, что обобщенная дисперсия — определитель ковариацион¬ ной матрицы. Теперь покажите, что Д. Пусть исходное распределение — двумерное нормальное. Покажите, что- в этом случае эффективность Г сводится к Постройте график е (0, X) как функцию р и обсудите свойства эффективности. Указание. Используйте упражнение 1.8.14. 6.4.5. Пусть 0 — р-компонентный вектор с компонентом 0* — медиа- ной средних Уолша при п наблюдениях по i-му компоненту. Тогда Т (0) —0,. где А. Применяя теорему 2.7.2 и предполагая истинное значение 0 равным 0, (без потери общности), покажите что и (в)—ранг | Xif—0г / среди |ХЦ—0г| | Х*„—04|. JWТ'Ш~ TWr‘ 'I <*>■“>• 301
Покажите, что отсюда n1/2'? = diag ((2/*)—1, .... (2/;)-1)^=Т(0) + Ор(1), где f* = fj (х) dx и diag (ax, ap) — диагональная матрица размера pXp с i-м диагональным элементом at. Б. Пусть D — диагональная матрица из п. А данного упражнения. Пока¬ жите, что Уп'е -?+Z ~ MVN (О, DVD'), где V задается теоремой 6.2.2. В. Покажите, что при р = 2DVD' = ((dtj)), /, j = 1,2, и тогда 1 da=- : , i = 1, 2, 12 [J-oo ff (•«) dx]* 4 1-00 j-ос Fi (*) F* ЩР12 (*, y) - 1 4 J-oo fl (X) dx J-co ft M dx ’ 1 h Г. Покажите, что эффективность 0 относительно X при р = 2 равна —\ foo f*oo Г 1 —р2 ЛХ/2 е{ 0, X ) = 12a, а2 j /? (х) dx \ f\ (х) dx [^3^7 j , где 6 = 4 JjZoc ^ w f 2 (if) (Зе. у)—1. Д. Покажите, что если F12 — двумерное нормальное распределение, то /— 3_Г 1-Р2 Н/2 е ’ х ' _ л 1 1 —(36/я2) [Sin-1 (p/2)]2 J Нарисуйте график е (0, X) как функции от р и обсудите ее поведение относитель- -—. но0 и X. Указание. Используйте (2.7.9). 6.4.6. Примените знаковые метки для поиска точечной оценки 0 по данным примера 6.2.1 и проверьте гипотезу Н0 :0' = (120; 80) против HA:Q' ф (120; 80), где 0 — вектор маргинальных медиан. 6.4.7. В этом упражнении критерий Муда из примера 3.4.2 обобщается на многомерную двухвыборочную сдвиговую модель, описанную в начале раздела 6.3. Рассмотрим проверку Я0 : А = 0 против НА : А^=0. Пусть при i = 1, ..., р Mt = ф (Yit > Сг) — п/2, t— 1, ..., п, где Ct — медиана объединенных данных по i-и координате. Таким образом, Mt — центрированная статистика Муда. Пусть М' = (МА, ..., Мр), покажите, что при т, п -*■ оо так, что т/ N X, где 0 < X < 1, А = т + п, тогда
где V = ((Vij)), i, / = 1 p, vu = \(\-X)/4, Vij = k (l-X) {p(Ki>0, Yj>0) - “J"}' Далее, покажите, что vit = mn/[4n (N — 1)] и mti | A/n 1 ^ Vii= N(N— 1) \ N— 1 ~ T ) (здесь Nlt — число всех тех пар наблюдений по i-й и j-й компонентам в комбини¬ рованной выборке, которые одновременно положительны — состоятельные оценки Уц и vtj соответственно. Наконец, докажите, что М* = М' (N\)~1 М асимптотически распределена как %2 с р степенями свободы. 6.4.8. Примените критерии упражнения 6.4.7 к данным примера 6.3.1. Най¬ дите оценку А, основанную на М. 6.4.9. Пусть А — оценка Ходжеса — Лемана параметра А, основанная на U (6.3.1). Предположим, что т, п -+■ оо, так, что ml N -*- А, 0 < К < 1, N -~ = т + п. Пусть (без потери общности) А = 0, покажите, что VF A ~ MVN (О, [Л, (1 —я.)]-1 DVD')|. где DVD' определена в упражнении 6.4.5 (Б).
• ПРИЛОЖЕНИЕ НЕКОТОРЫЕ СВЕДЕНИЯ ПО ТЕОРИИ ВЕРОЯТНОСТЕЙ И МАТЕМАТИЧЕСКОЙ СТАТИСТИКЕ* В этом приложении мы даем некоторые результаты, касающиеся асимптоти¬ ческой или предельной теории распределения, многократно используемые в кни¬ ге. Мы приводим доказательство или отсылаем к литературе, где обсуждается этот результат. Асимптотическая теория важна по двум причинам. Во-первых, распределение статистик критериев и оценок параметров может быть приложено для решения практических задач, во-вторых, асимптотическое распределение ста¬ тистик критериев оценок обеспечивает основу для изучения мощности и сравне¬ ния эффективности при больших выборках. Кроме того, в книгу включены дру¬ гие сведения, например, об интегралах Стилтьеса. Вначале мы определим два основных типа предельного поведения последова¬ тельности случайных величин. Будем обозначать последовательность случайных величин Zlt Z2, ... с помощью {Zn}. Определение А1. Последовательность случайных величин {Zn} сходится по вероятности к постоянной с, если для любого е > 0 Игл Р ([Zn—с | е) = 0. р Это обозначается Zn -* с, и говорят о сходимости Zn по вероятности к с. Заметим, что с можно заменить в определении на случайную величину Z. Тогда говорят о сходимости Zn по вероятности к Z. Определение А2. Последовательность случайных величин {Zn} сходится по распределению к случайной величине Z, если lim Fn (t) = F (t) во всех точках, где непрерывна F (/), причем Fn и F — функции распределения (кумулятивные функции распределения) (обычное сокращение cdf—для одной и cdfs — для мно¬ гих) для Zn и Z соответственно. Мы будем записывать Zn —»> Z. Случайная вели¬ чина Z вырождается в постоянную с, если Р (Z = с) = 1. Определение А2 вклю¬ чает в себя определение А1; поскольку Zn —> Z, Z вырождается в константу с тогда р и только тогда, когда Zn с. Описывая стохастическую сходимость, Р. Хогг и А. Крейг [86, с. 186] обсуждают этот вопрос. Однако свойства сходимости по ве¬ роятности и сходимости по распределению сильно различаются, и удобно приво¬ дить их по отдельности**. Стандартное нормальное распределение со средним 0 и дисперсией 1 обозна¬ чается п (0,1). Его функция распределения обозначается Ф it). Часто, согласно определению А2, Z будет иметь распределение п (0, 1), что обозначается как Z ~ п (0,1), а про Zn мы будем говорить, что Zn асимптотически (в пределе) распределена, как п (0,1). Следующая ниже теорема несколько разъясняет понятие сходимости по рас¬ пределению в таких случаях, как предельные нормальные распределения. Теорема А1 (Пойа). Предположим, что в рамках определения А2 Zn Z и функция распределения непрерывна, причем Fn (/) стремится к F it) равномерно * В настоящем приложении автор приводит нужные читателю сведения по теории вероятностей и математической статистике, ссылаясь на доступные за¬ рубежному читателю учебники и курсы лекций. По ходу изложения читателю рус¬ ского издания будет сообщено, где можно найти соответствующий результат или доказательство. Мы предлагаем обращаться к общим курсам [ 203], [209], [214], [239], [250]. — Примеч. пер. ** Обсуждение видов сходимости случайных величин можно найти в [250, гл. II, § 10, с. 267—278] или [203, гл. 6, § 2, с. 133—140]. В частности, из сходимости р D по вероятности Zn —> Z следует сходимость по распределению Zn —> Z. — Примеч. пер. 304
по /; тогда supt | Fn (t) — F (/)l 0 при /z oo. Доказательство есть в [142, с. 438]. Теорема А2. Пусть g (х) — непрерывная функция. Р Р А. Если Zn—у с, то g(Zn) —*g(c). Б. Если Zn —*■ Z, то g (Zn) g (Z). Доказательство для случайных величин и случайных векторов см. в [175, с. 24]*. В утверждении теоремы АЗ Слуцкого фигурирует сходимость по вероятности и сходимость по распределению. Это утверждение часто используется в данной книге. D Р Теорема АЗ (Слуцкого). Предположим, что Zn Z и Yn -> с, где с — ко¬ нечная постоянная, тогда верно следующее. A. Zn + Yn^Z + c. Б. Zn Yn cZ, а если с = 0, то ZnYn—y 0. B. Zn/Уп Z/c, если с ф 0. Доказательство (которое справедливо и для случайных векторов) см. в [175, с. 19]**. Заметим, что Yn может вырождаться в константу сПУ так что Yn-> с в теореме можно заменить на сп -+■ с. Обратимся теперь к критериям сходимости по вероятности и по распределе¬ нию. Теорема А4 (Чебышева). Для любой случайной величины и любой положи¬ тельной постоянной с EZ2 P(\Z\)>c)<——. сй Это неравенство обычно доказывается в вводных курсах математической стати¬ стики, см., например***, [86, с. 58]. Теорема А,5. Пусть последовательность случайных величин {Zn} такова, Р v что EZn с и Var Zn 0, тогда Zn —» с. Доказательство. Из теоремы А4 получаем Р (|Zn — с| > е)^ Е (Zn — с)2/е2. Однако Е (Zn — с)2= Е (Zn—EZn + EZn — с)2 = Var Zn + [EZn — с]2 0. P Следовательно, по определению А1 Zn -> с. Заметим, что эта теорема распростра¬ няется и на случай EZn = р, и на случай Var Zn -► 0. Теперь предположим, что Хъ Х2, ... — независимые и одинаково распреде- _ р ленные случайные величины с EXt = ц и Var Xt = о2 <С оо. Тогда X р. Этот факт прямо следует из теоремы А5 при Zn = X и известен как слабый закон боль¬ ших чисел. Есть много других более сильных утверждений. Примером может слу¬ жить так называемый сильный закон больших чисел, согласно которому X схо¬ дится к (х с вероятностью 1 лишь при условии EXt = ц < оо. Обсуждение см. [175, с. 27]****. * См. также [204, гл. 1, § 5] и [203, гл. 6, § 2, с. 134]. — Примеч. пер. ** См. также [215а, § 20.6, с. 281—282]. — Примеч. пер. *** См. [250, с. 58, 209], [203, с. 94— 95]. — Примеч. пер. **** См. [250, гл. IV, § 3]. — Примеч. пер. И Зак. 284 305
Теперь мы снова обсудим сходимость по распределению. Основной инстру¬ мент анализа в этом случае — центральная предельная теорема. Приведем на¬ иболее общую форму этой теоремы и специальные ее случаи для ситуаций, встре¬ чающихся в книге. Обозначим через / (•) индикаторную функцию / (Л), равную 1, если произошло событие Л, и 0 — в противном случае. Теорема А6 (центральная предельная теорема Линдеберга). Предположим, для любого п Zln,...,Znn— независимые случайные величины, причем EZin= п = 0 и Var Zin = oJn С оо для i — 1, ..., п. Пусть Bn==^o2in. Если для лю- i=l бого е > О 1 п lim "яГ 2 Е lZin 1 (I zin I > еВп)] = 0, П-+ОО D п 1= 1 ТО п 2 zin i=i _^Z~/t(0, 1). ^71 Доказательство этой теоремы есть в [32, с. 187]*. Результат достаточно общий, и по существу условие необходимо и достаточ¬ но **. Двойные индексы у случайных величин порождают треугольное упорядо¬ чение случайных величин, и независимость предполагается лишь в строках такой таблицы, т. е. для Zl7l, ..., Znn. Заметим также, что случайные величины не обя¬ зательно должны быть одинаково распределены. Теперь мы приведем очень важную теорему из теории функции веществен¬ ного переменного, дающую нам условия, при которых пределы и производные можно переносить за знак интеграла. В статистической теории это означает воз¬ можность перестановки операций дифференцирования и математического ожида¬ ния. Действие этой теоремы подкрепляется примером вывода центральной пре¬ дельной теоремы из теоремы А6. Теорема А7 (теорема Лебега о мажорируемой сходимости). Пусть имеются интегрируемая функция h (х) и такая последовательность (измеримых) функций (?п(*)). что \gn (х) I ^h(x) и lim gn (х) = g(x). Тогда lim j gn (x) dx = = j [lim gn (x)] dx = j g (x) dx. Доказательство см. [157 с. 229] ***. В статистическом смысле мы имеем случайную величину X и такую после¬ довательность функций {gn(x)}, что gn (х) -*■ g (х). Кроме того, есть такая функ¬ ция h (*), что |gn (х)\ < к (х) для всех п и Е \h (X)| < оо. Тогда lim Egn (Х)= = Eg(X). Теорема А8 (центральная предельная теорема). А. Пусть Xlt Х2, ... — независимые, одинаково распределенные случай¬ ные величины, причем EXt = |и и var Xt = а2, 0 < а2 < оо. Тогда 2 (Xt — — р,)1опх12 Z ~ п (0, 1). Б. Пусть Хх, Х2, ... — независимые, одинаково распределенные р-компо- нентные случайные векторы, причем E\t = ju, и положительно определенной матрице ковариации 2. Тогда Wn (X., — Их), Уп (Х.р- Цр)У Лг ~ MVN (О, S), где X.j — среднее по /-й компоненте; п. А. утверждения можно получить из теоремы А6; п. Б сле¬ дует из примечания к АН. * См. [250, гл. III, § 4, с. 350]; [203, гл. 7, § 3, с. 162]. — Примеч пер. ** См. [250, с. 355]. — Примеч. пер. *** См., например, [250, гл. II, § 6, с. 204]. — Примеч. пер. 306
Доказательство. А. Воспользуемся теоремой А6 и обозначим — (Xt — |ы), i = 1, ..., я, тогда EZin — О Положим \1 О (мощность при этом не теряется), тогда 1 В1 Var Zin = о2 < оо и = по2. lim 2 ^ ^ (I Zin | > eBn)] = t= 1 1 = lim — EX\ I (\X, | ri—►оо О > £G 1/n). По теореме A7 и при gn (*) = х2 / (|*| > еа (я)1/2) и Л (д:) = *2. Затем £|Л (А")| = = ЕХ2 < оо и (*) 0; отсюда ЕХ\ I (|| > ео (я)1/2) Е (0)= 0, и ус¬ ловия Линдеберга выполнены. Можно по-разному записать условия центральной предельной теоремы. Ча¬ сто в математической статистике мы имеем дело со средними X. Если Xlt ..., Хп— независимые, одинаково распределенные случайные величины с математическим ожиданием р и дисперсией о2, то из теоремы А8 п1^2(Х — р, ) —> Z ~ я (0, а2), и мы можем сказать, что п{-/2(Х — (ы) асимптотически (или в пределе) имеет распределение я (0, о2). Это означает, что для больших я мы можем применять следующие аппроксимации: Уп (X — ц) ——-—— < М = ф (0 \ а или р (х < х) = ф { л/п (*—ц) Эти приближения можно использовать для вычисления приближенных кри¬ тических значений критериев, основанных на X. Далее мы обсудим некоторые дополнительные результаты типа центральной предельной теоремы. Теорема А9. Пусть Wlt W2. ... — независимые, одинаково распределенные случайные величины, причем EWt — 0, var Wt = а2, 0 < а2 < оо. Определим 5 = 2"=1 at Wi/nx/2, причем max | aj | n тогда S/(VarS)1/2 Д-Z ~n(0, 1) с VarS = a2s; af /п. Доказательство. В теореме А6 были определены случайные величины Zin = = aiWiln1/2 с EZin ~ 0, Var Zin = a2ia2/n<. оо и В% ~ о22а?/я. Проверка условия Линдеберга сводится к рассмотрению ущ \] Wt I > ест ——— < а? Wf / af W\ / | Г, | > ест max | a; | И7, | > ест af \ at I / 11" 307
При выполнении предположения нашей теоремы (2а/)1^2/max|al* | оо, и следующие далее доводы те же, что в доказательстве теоремы А8. Таким обра¬ зом, условие Линдеберга выполняется, и доказательство закончено. Простой вариант этой теоремы часто используется при изучении асимптоти¬ ческого поведения параметров. Это адаптированный вариант доказательства лем¬ мы из [11]. Теорема А10. Пусть Wlt W2, ... — независимые, одинаково распределен¬ ные случайные величины, причем EWt = 0, var Wj = а2, 0 < о2 < оо. Определим случайные величины S=2”=1 aiWjn1//2. Если 1 П 2 af ~+т2’ 0 < Т2 < ОО , п /= 1 то S Д-Z ~ п (О, о2 т2) и S/(VarS)l/2 Д-Z ~ л (О, 1). Доказательство. Заметим, что 2 , п /1ч , п—1 _22_= _!_ V4 ? («—О 1 v п п А а‘ /-1 п (п~1) iTi -0. Отсюда пГ\ап\ 0 при п оо. Доказательство следует из теоремы А9, если п~ max \at\-► 0. Пусть л-1/2 шах |а*| не стремится к нулю. Тогда существует такое е>0, что для лю¬ бого целого N есть целое nN ^ N, такое, что пmax \at\ ^ е при 1< i ^ Положив jV = 1,2, ..., можно построить последовательность пг < я2 < ••• • Выберем для /г* величину mt ^ /г^ таким образом, что \ат | = шах |а^|, 1^ При этом 6 < пГ 1/2 J /в|| = «Г1/2|вт| | < *Г,/8|«т,|. что противоречит утверждению из первого абзаца. Отсюда п~^2 тах|а*| -► 0 и S/(Var S)1/2 Д- Z ~ п (0,1). Кроме того, Var 5 = а22а//я а2т2, от¬ куда 5 —у Z ~ п (0, а2т2) по теореме Слуцкого АЗ. Теорема доказана. Нам нужны многомерные варианты приведенных выше предельных теорем. Эти многомерные обобщения можно получить с помощью «приема Крамера — Уолда». Теорема All. Последовательность случайных векторов {2п } сходится по рас¬ пределению к 2 тогда и только тогда, когда последовательность (одномерных) случайных величин {X/Z;l} сходится по распределению к к'2 для любого вектора постоянных к с компонентами, удовлетворяющими условию 2Я? = 1. Доказа¬ тельство см. в [175, с. 18]*. Многомерная центральная предельная теорема (теорема А8Б) следует из од¬ номерного случая и теоремы АП. Теперь мы рассмотрим обобщение теоремы А9. Теорема А12. Пусть Wlt №*, ... — независимые, одинаково распределен¬ ные случайные величины, причем EWi ~ 0 и var Wi = а2, 0 < or2 <С оо. Оп¬ ределим 5ft = j. aik Wilnxt2 при k= 1,2,..., р. Положим s_| : U^A'w. * Сравните с теоремой 1 из § 13 гл. II (с. 320) [250]. — Примеч. пер. 308
Если — А'А стремится к положительно определенной матрице А, то S -2- Z ~ ~ MVN (0, а2 Л)*. Доказательство. Предположим X,— вектор размера рх 1, рассмотрим Т — ---- X/S = X/A'W/я1/2. Пусть С = АХ,, тогда 71 = 2С/№г-/я1/2 и нужно показать, что С удовлетворяет условию из теоремы А10**. Теперь заметим, что поскольку А положительно определена и я-12С?=я-1Х/ А' АХ, -> X,7 АХ. > 0, мы можем положить т2 = X/ АХ, > 0. Отсюда Х/S Д» Z ~ /г (0, о^Х,1 А X). Таким образом, наша теорема следует из теоремы АП. Следующая теорема является небольшой модификацией теоремы А12. Теорема А13. Здесь предположения будут те же, что и в теореме А12. Если ковариационная матрица вектора S сходится к положительно определенной мат¬ рице, то вектор S имеет многомерное нормальное распределение. Доказательство следует из записи матрицы ковариаций cov (S). Пример приложения теоремы А12 нам доставляет асимптотическое распреде¬ ление вектора оценок коэффициентов регрессии линейной модели. Пусть Y = = Хр + е, где Y—(ях 1)-вектор*** наблюдений; X — (яхр)-матрица плана пол¬ ного ранга р\ Р — (рх 1)-вектор регрессионных коэффициентов и е — (ях ^-век¬ тор независимых, одинаково распределенных случайных величин. Мы предпо¬ лагаем Ее,- = 0, Var et = а2, 0 < а2 < оо. Наконец, предположим, что я-1 Х'Х стремится к положительно определенной матрицей. Оценка наименьших квадратов (а при предположении нормальности — оценка максимального правдоподобия) вектора р равна р — (Х'Х)-1 X'Y. Это можно переписать следующим образом: ^=(\' Х)-1Х7 (ХР + е) =р + (Х' Х)-хХ' е. В обозначениях теоремы А12 это выглядит так: Уп(р— р) = Уп(Х' Х)-^' е = —^ А' е, у п где А7 = (я-1Х,Х)“*1Х/. при этом я—1 А'А = я (Х'Х)-1 -+■ 2-1, и условие теоре¬ мы А12 выполнено. * MVN(a, 2) — многомерное нормальное распределение с математиче¬ ским ожиданием а — (alt ..., ар) и матрицей ковариаций 2 = (аи), i, j = 1, См., например [250, гл. II, § 3, 8, 13, с. 177,248—251,316—320]. — При¬ меч. пер. п ** Т. е., что коэффициенты clt ..., сп удовлетворяют условию ^Сс/п-+ -^т2,0<т< оо при я —► оо.— Примеч. пер. *** Для сокращения записи вектора с я компонентами и матрицы с я строка¬ ми и р столбцами мы пишем: (я х 1)-вектор, (я X р)-матрица соответственно. — Примеч. пер. 309
Тогда можно применить теорему А12, и оценка я1/2 ф — Р) асимптотически распределена, как MVN (0, о22~х), или р имеет (приближенно) распределение MVN (р, а2(Х'Х)-1). Альтернативный подход можно найти в [91, раздел 7.2]*. Центральная предельная теорема А8 для независимых, одинаково распре¬ деленных служебных величин с конечной дисперсией — наиболее общая форма центральной предельной теоремы, обсуждаемой в статьях и учебных курсах по математической статистике. Она означает, что Из теоремы А1 Пойа мы знаем о том, что эта сходимость равномерна по t. Однако, учитывая предыдущее, мы не можем сказать что-либо о скорости сходи¬ мости. При наличии некоторых сведений о третьем моменте можно выяснить ско¬ рость сходимости. Теорема А14 (Берри —Эссеена). Пусть Хг, Х2, ... — независимые, одинако¬ во распределенные случайные величины; EXt = р, Var Xt = о2, 0 < о2 < оо и и E\Xt — jllj3 = р3, 0 < р3 < оо. Тогда для всех п где с — постоянная, не зависящая от п. Доказательство есть в [32, с. 206]; автор приводит значение с = 28. Серфлинг в своей книге [ 175]** указал, что значение может быть уточнено: с = 0,7975. Теорема А15 полезна для установления наличия равномерной сходимости на классе исходных распределений. Как приложение теорем А1 и А14 мы имеем сле¬ дующие теоремы. Теорема А15. Пусть Xlt Х2, ... — независимые, одинаково распределенные случайные величины с функцией распределения Fq (х), 0£Q. Пусть к тому же существуют константы К и М, такие, что 0 < /С ае < °о и ре ^ Л4 < оо для всех 0 £ Q. Тогда ходится к Ф (0 равномерно по 0 £ Q так же, как и по t. В приведенной ниже теореме заданы условия, при которых утверждение цент¬ ральной предельной теоремы справедливо и в случае, когда Xlt Х2, ... перестают быть независимыми. Последовательность Хъ Х2, ... называется стационарной, если совместное распределение (Xt, Xi+1, ..., Х*+г) не зависит от i при всех г***. Последовательность называется m-зависимой, если (Xlt ..., Хг) и (Xs, Xs+1,...) не зависимы при s— г > т. Теорема А16 — специальный случай более общей теоремы Гёфдинга и Роббинса [85]. Дальнейшее обсуждение см. в [55, раздел 6.4] ч [173]. * См. с. 162 перевода книги [91] на русский язык. — Примеч. пер. ** О теореме Берри — Эссеена см. [235а]. — Примеч. пер. *** Сравните с определением 1 из § 1, гл. VI (с. 403) [250]. Последователь¬ ность комплексных случайных величин £ = (£n), п£ Z с £|£п|2< оо, n£Z на¬ зывается стационарной в широком смысле, если для всех п £ Z Е\п = ££0, cov (1ь+л, lh) = cov (In, £0),k£Z.— Примеч. пер. 310 Р (п[/2 (Х — р)/о < t) -*Ф (/), где EXt = (1 и VarXj = or2, 0<а2<оо.
Теорема А16. Предположим, что ХЪХ2стационарная m-зависимая после¬ довательность; ЕХ1 = |А и £| Хг\3 <с оо. Тогда п^2 (X — М-)-5- Z ~ п (0, а2), причем а* = var Х\ + 22^ 1 cov (Хх, Xi+1). В нашей книге используется важное понятие абсолютно непрерывной функ¬ ции. Функция F (х) абсолютно непрерывна на вещественной прямой, если есть такая интегрируемая функция / (х), что для всех х < у F (у) — F (х) — = j'*f (t) dt. Отсюда следует, что у F (х) есть производная, равная / (х) (почти всюду), а отсюда F (х) — неопределенный интеграл от этой производной. Если F (х) — абсолютно непрерывная функция распределения, то / (х) — ее плот¬ ность распределения. Определение АЗ. Свертка двух функций распределения (.х) и F2 (*) опре¬ деляется как Z7! (х) * F2 (х) = ooF1 (х — у) dF2 (у), и есть функция распределе¬ ния случайной величины Хх + Х2, где Хъ Х2 — независимые случайные вели¬ чины с функцией распределения Fx (х) и F2 (х) соответственно. Теорема А17 важна для анализа свойства ранговых процедур Уилкоксона. Об интеграле Стилтьеса см. определение А4. Теорема А17. Пусть Fx (х), F2 (х) — абсолютно непрерывные функции рас¬ пределения с плотностями распределения (х), /2 (х) соответственно. Тогда сверт¬ ка Fx*F2 (х) абсолютно непрерывна с плотностью h*f2 (*) = /1 (*—</) /2 (У) dy ■ Доказательство см. в [32, с. 135]. Эта теорема дает возможность дифференциро¬ вать под знаком интеграла, определяющего свертку. Поэтому, если F* (х) = = Р (Х\ + Х2 ^ х), где Х1у Х2 — независимые, одинаково распределенные случайные величины с абсолютной непрерывной функцией распределения F(x), то /* (л) =]L F* (х) = F (х — у) f (у) dy = \-„ f(x —у) f (у) dy. dx dx Дальнейшее обсуждение этого интеграла и ранговых процедур Уилкоксона см. в [129] и [138]. Для определения свертки совершенно не обязательно, чтобы случайные величины были одинаково распределены. В доказательстве теоремы 4.4.2 содержится приложение операции свертки для дискретных, неодинаково распределенных случайных величин. Теорема А7 Лебега о мажорируемой сходимости применяется для перемены порядка операций перехода к пределу и интегрирования в теоремах А8 и А9. Другое важное применение теоремы А7 — перестановка операции дифференциро¬ вания и взятия математического ожидания. Теорема А18. Предположим, что функция h (х, 0) абсолютно непрерывна, как функция от 0 £ Q, где Q — открытый интервал. Пусть производная д ^0 h (х, 0) существует и ограничена функцией q (х) для всех 0£ й. Кроме того, пусть J (did 0) h (х, 0) dx и J q (х) dx существуют. Тогда (d/dQ) JA (л:, 0) dx=§ (д/дд) h (х, 0) dx. В статистической версии этой теоремы мы предполагаем существование Е (d/dQ)h (X, 0) и Eq (X). При этом теорема А8 означает, что (d/dQ) Eh(X,Q)=E (d/dQ) h (X, 0). Приведенные в теореме А19 известные в математике неравенства очень важны и играют большую роль в статистике. 311
Теорема А19 (неравенство Коши — Шварца)*. Пусть g (х) и h (х) — квад¬ ратично интегрируемые функции. Тогда (Jg (-«) h (х) dxf < J g2(x) dx j Л2 (x) dx. Равенство имеет место тогда и только тогда, когда существуют такие постоянные а и Ь, что ag (х) + bh (х) = 0. Говоря языком статистики: имеются две случай¬ ные величины X и У: ЕХ2С оо, EY2 < оо. Тогда (EXY)2 < EX2-EY2. Равенство имеет место тогда и только тогда, когда аХ + bY = 0 с вероятностью 1. Это ста¬ тистическое утверждение иногда называют корреляционным неравенством, по¬ скольку X и Y можно стандартизировать так, чтобы математическое ожидание равнялось 0, а дисперсия — 1; после этого неравенство Коши Шварца озна¬ чает, что р2 ^ 1, где р — коэффициент корреляции между стандартизированны¬ ми X и' Y. Будем называть функцию q (х) выпуклой, если для любого X £ (0,1) g (Ajc+ + (1 -X)y)<Xg(x)+ (1 —X) g (у). Теорема А20 (неравенство Иенсена). Пусть X и Y — случайные величины с конечными математическими ожиданиями. Предположим, что g (х) — выпук¬ лая функция. Тогда Eg (X) ^ g(EX). Если g (х) — строго выпуклая функция, то Eg (X) > g(EX), при условии, что X — не вырождена. Об этом см. в [57, раздел 2.2] **. Наиболее известный пример: g (х) = х2, так что ЕХ2 ^ {ЕХ2)У от¬ куда var X > 0. Теперь обсудим интеграл Стилтьеса, который удобен для определения мате¬ матического ожидания случайной величины. Определение А4. Пусть заданы g (х) и h (х), причем g (х) неотрицательны, и пусть а — х0 <хх, < ...< хп = b есть разбиение \а. Ь]. Интеграл Стилтьеса от g (.х) по h (х) определяется посредством выражения h \bag(x)dh(x) = lim 2 g (xi) (■*»)—■h > i= 1 где предел берется по разбиениям с шах (xt — **-i) -► 0. Интеграл Стилтьеса на вещественной прямой определяется посредством а-»- — оо и/или 6-> + оо. Мы будем говорить, что существует интеграл от произвольной функции / (х) по h (х), если j |/ (х)| dh (д:) С оо. Простой пример доставляет нам случай функции распределения с массой 1, сосредоточенной в точке у. Пусть 6у (х) равно 1 при х у и 0 — в противном случае. При этом, если g (х) — непрерывная функция, то J g (х) d 6у (х)— = ё (У)- Это немедленно следует из определения, поскольку 6у (х*) — 6у (х*_х) = = 1 лишь при у £ (Xi-i, xt) и g (jCj) g (у) при xt -► у***. Представленное выше есть просто формальный способ показать, что при вырождении X в точку-i/и непрерывной функции g (.х) имеет место равенство Eg (X) — g (у). Предположим, что F (х) — дискретная функция распределения со скачками в х1( х2, тогда, если существуют математические ожидания, мы имеем Eg (X) = 2g (Xi) [F (Xi)-F (*,_,)] = J g (x) dF (x). Например, пусть Fn (x) — эмпирическая функция распределения [Fn (x) «при¬ писывает» каждому наблюдаемому значению хъ х2, ..., хп массу 1/л], тогда * Или неравенство Буняковского. — Примеч. пер. ** См., например, [240 гл. II, § 6, с. 209 — 210]. — Примеч. пер. *** Т. е. J* g(x)by (х)= Нш 2g (xt) • 1 = lim g (x,) ->■ g (у) при xt xn (последнее обеспечено условием сближения точек разбиения хх, ..., хп\ шах (xt — ^i-i) ->-0). — Примеч. пер. 312
J xdFn (x) = 2Xf [Fn (x{) — Fn (*j_i)], т. e. равняется 2xf (1 In) = x—выбороч¬ ному среднему. Если функция распределения F (х) обладает плотностью / (х) = = F' (х)у то мы получаем Eg (Х)= $g (х) f(x)dx= lg{x)dF(x) при условии, что интеграл существует. Таким образом, при работе с интегралом Стилтьеса не надо рассматривать отдельно дискретный и непрерывный случаи определения математического ожи¬ дания. В общем случае, если X имеет функцию распределения F (*), дискретную или непрерывную, Eg (X) = J g (х) dF (*) при условии, что математическое ожидание существует. Как указано выше, это определение приводит к коррект¬ ным выражениям в частных случаях. Большинство свойств интеграла Римана обобщается и на случай интеграла Стилтьеса. Часто используется интегрирование по частям по формуле ]„£(*) dh (•*) =е (х) h (х) [*—(х) dg (х). В книге Г. Крамера [40, гл. 7] приводятся другие сведения об интеграле Стилть¬ еса. При вычислении моментов сумм рангов час^о применяются формулы сум¬ мирования целых чисел. Теорема А21. п п 2 1 = п(п+1)/2, 2 i* = «(n+l)(2n+l)/6, i= 1 i = 1 п п 2 0—7)*=я (п2—1)/12, т= 2 </». i = 1 i — 1 п 2 Р = п*(п+ 1)2/4, i= 1 п 2 i4 = «(rt+l) (2n+l) (3п2 + 3п— 1)/30, i= 1 П 2 tfe=o(n*+i). i = 1 Доказательство. Опишем прием, который можно использовать, если нужно получить формулы для любого k. Заметим, что п + 1 п 2 /*- 2 t*=(«+i)‘-i. i= 2 i= 1 ti-\- 1 ti Заменим переменную / = i— 1 в первой сумме слева. Тогда 2 = 2 0 ~Ь . ь 1=2 /—1 + l)ft. Комбинируя ее с первой суммой, получаем 2 (/+*)*- 2 /*= 2 ш+1)*-/‘]=(я+1)*-1. /=1 /=1 /=1 313
Ясно, что [(/+ 1)* — jk] —многочлен от / степени & — 1; суммирование по k j дает возможность получать 2jk~1 из первоначальной суммы. Пусть, например, /= 1 k = 2, тогда 2 Ш+1)а-/г]=2(2/+1) = 2 2 / + « = (« + ip-1. /= 1 /= 1 /= 1 п Это дает 2 j= п (п + 1)/2. Если мы положим k = 3, то /= 1 л п 3 /2 -j- 3 j -{- ti = я2 -j- 3/г2 -{- 3/х /= l /= l п можно решить относительно 2/2. /= 1
+ ЛИТЕРАТУРА 1. Adi chi e J. N. (1967a) Asymptotic efficiency of a class of nonpa- rametric tests for regression parameters// Ann. Math. Stat.— 38.— 884—893. 2. A d i с h e J. N. (1967b) Estimates of regression parameters based on rank tests //Ann. Math. Stat.— 38.—894—904. 3. A d i с h i e J. N. (1978) Rank tests of sub-hypotheses im the general linear regression // Ann. Stat.— 6. —1012—1026. 4. A 1 1 i n g D. W. (1963) Eariy decision in the Wilcoxon two-sample test // J. Am. Stat. Assoc. — 58.—713—720. 5. A n d г e w s D. F. (1974) A robust method for multiple linear regression // Technometrics. —16.—523—531. 6. Andrews D. F., Bickel P. J., Hampel F. R., HuberP. J., Ro¬ ger sW. H. and T u к e у J. W. (1972) Robust estimates of location: Survey and advances. — New Jersey Princeton University Press, Princeton. 7. A n d г e w s F. C. (1954) Asymptotic behavior of some rank tests for analy¬ sis of variance // Ann. Math. Stat.— 25.—724—736. 8. Arbuthnott J. (1710) An argument for devine providence taken from the constant regularity observed in the birth of both sexes // Philos. Trans.— 27. —186—190. 9. Arnold H. (1965) Small sample power for the one-sample Wilcoxon test for nonnormal shift alternatives// Ann. Math. Stat. — 36. — 1767—1778. 10. Arnold S. F. (1980) Asymptotic validity of F test for the ordinary linear model and the multiple correlation model // J. Am. Stat. Assoc.— 75. — 890—894. 11. Arnold S. F. (1981) The theory of linear models and multivariate analy¬ sis. — New York: Wiley. 12. A u b u с h о n J. C. (1982) Rank test in the linear model: Asymmetric errors //Unpublished PhD Thesis. — Department of Statistics, The Pennsylvania State University. 13. Aubuchon J. C. and Hettmansperger T. P. (1982a) On the use of rank tests and estimates in the linear model // Tech. Rpt. # 41.— Department of Statistics, The Pennsylvania State University // Handbook of Statistics.— V. 4: Nonparametric Methods/Eds. Krishnaiah and Sen. Amsterdam: North — Holland,1984.— 259—274. 14. Aubuchon J. C. and Hettmansperger T. P. (1982b) Rank- based inference based on Wilcoxon scores without symmetric errors// Tech. Rpt. 4± 42.— Department of Statistics, The Pennsylvania State University //J. Stat. Inference and Planning. 15. В a h a d u г R. R. (1967) Rates of convergence of estimates and test statistics //Ann. Math. Stat.— 31.—276—295. 16. В a г 1 о w R. E., Bartholomew D. J., Bremner J. M. and Brunk H. D. (1972) Statistical inference under order restrictions. — New York: Wiley. 17. В a u e г D. F. (1972) Constructing confidence sets using rank statistics// J. Am. Stat. As.soc.— 67.-687-690. 18. В e a n S. J. and T s о к о s С. P. (1980) Developments in nonparametric density estimation // Int. Stat. Rev. —43.—267—287. 19. Benaid A. and van E 1 t e г e n P. (1953) A generalization of the method of m rankings /7 Indagationes Math. — 15.— 358—369. 20. Bhattacharyya В. K. and Roussas G. G. (1969) Estimation of a certain functional of a probability density // Skand. Aktuar. Tidskr. — 52.— 201—206. 315
21. В i с к е 1 P. J . (1964) On some alternative estimates for shift in the p-varia- te one sample problem // Ann. Math. Stat.— 35.— 1079—1090. 22. В i с к e 1 P. vJ. (1965) On some asymptotically nonparametric competitors of Hotelling's T2//Ann. Math. Stat. — 36.— 160—173. 23. В i с к e 1 P. J. (1974) Edgeworth expansions in nonparametric statistics /V Ann. Stat.— 2. —1—20. 24. В i с к e 1 P. J. and Doksu m K. A. (1977) Mathematical statistics. — San Francisco: Holden — Day. Русский перевод: Бикел П., До ксам К. Математическая статистика.— Вып. 1 и 2/Пер. с англ. —М.: Финансы и статистика, 1983.— 278 с; 254 с. 25. В о х G. Е. P. and Сох D. R. (1964) An analysis of transformations// J. R. Stat. Soc. — B. —2. — 211—252. 26. Brown М. B. (1975) Exploring interaction effects in the ANOVA // Appl. Stat.— 24.-288—298. 27. Brown 1 ее K. A. (1965) Statistical theory and methodology. — 2nd. ed. New York: Wiley. Русский перевод: Браунли К. А. Статистическая теория и методология в науке и технике/Пер. с англ.; Под ред. Л. Н. Большева. — М.: Наука, 1977. —407 с. 28. С h а с к о V. J. (1963) Testing homogeneity against ordered alternatives //Ann. Math. Stat. — 34.—945—956. 29. Cheng K. F. and S e г f 1 i n g R. J. (1981) On estimation of a class of efficiency-related parameters//Scand. Actuarial; J. — 83—92. 30. С h e n g K. and HettmanspergerT. P. (1983) Weighted least squares rank estimates // Commun. Stat. — Theor. Meth. — 12(9). — 1069—1086. 31. Cher no ff H. and S a v a g e I. R. (1958) Asymptotic normality and efficiency of certain nonparametric test statistics//Ann. Math. Stat. —39.— 972—994. 32. С h u n g K. L. (1968) A course in probability theory. — New York: Harcourt, Brace and World. 33. С 1 a s о n С. B. (1958) Exploring the distant stars. — New York: G. P. Putnam’s Sons. 34. С о с h г a n W. G. and Cox G. M. (1957) Experimental designs.— 2nd ed. — New York: Wiley. 35. С о 1 1 i n s J. R. (1983) On the minimax property for R-estimators of locati¬ on//Ann. Stat. — 11.— 1190—1195. 36. С о n о v e r W. J. (1973) On methods of handling ties in the Wilcoxon signed rank test // J. Am. Stat. Assoc.— 68.— 985—988. 37. Conover W. J., WehmanenO. and Ramsey F. L. (1978) A note on the small-sample power functions for nonparametric tests of location in the double exponential family // J. Am. Stat. Assoc. — 73. —188—190. 38. С о о к R. D. and WeisbergS. (1982) Residuals and inference in regres¬ sion. — New York: Chapman and Hall. 39. С о x D. R. and S t u a г t A. (1955) Some quick tests for trend in location and dispersion // Biometrika. — 42.—80—95. 40. С r a m e r H. (1946) Mathematical methods of statistics. — New Jersey: Princeton University Press, Princeton. Русский перевод: Крамер Г. Ма¬ тематические методы статистики / Пер. с англ.; Под ред. А. Н. Колмогоро¬ ва. — Изд. 2-е, стереотип. — М.: Мир, 1975.—648 с. 41. D a n i е 1 С. and W о о d F. S. (1971) Fitting equations to data. — New York: Wiley. 42. D e n b у L. and Mai 1 о w s C. L. (1977) Two diagnostic displays for robust regression analysis// Technometrics. — 19. —1—13. 316
43. D о к s и ш К. А. (1977) Some graphical methods in statistics. A review and some extensions// Stat. Neerl. — 31.— 53—68. 44. Draper D. C. (1983) Rank-based robust analysis of linear models. II. Estimation of the asymptotic variance of rank-based estimators and associated statistics // Unpublished manuscript. 45. D г a p e r N. and S m i t h H. (1981) Applied regression analysis. — 2nd ed.— New York: Wiley. Русский перевод: Дрейпер H., Смит Г. Приклад¬ ной регрессионный анализ. — Изд. 2-е, перераб. и доп. — Кн. 1 и 2. — М.: Финансы и статистика, 1986. — 366 с.; 351 с. 46. Dunn О. J. (1964) Multiple comparisons using rank sums//Technomet¬ rics.— 6. — 241—252. 47. Durbin J. (1951) Incomplete blocks in ranking experiments//Br. J. Psychol. — 4. — 85—90. 48. F e 1 1 i n g h a m S. A. and Stocker D. J. (1964) An approximation for the exact distribution of the Wilcoxon test for symmetry // J. Am. Stat. Assoc.— 59. — 899—905. 49. F e u s t a 1 E. A. and Davisson L. D. (1967) The asymptotic relative efficiency of mixed statistical tests// IEEE Trans on Inf. Theory IT-13.— 247—255. 50. F i s h e r R. A. (1970) Statistical methods for research workers. — 14th ed.— New York: Hafner. Русский перевод: Фишер P. Статистические методы для исследователей/Пер. с англ. — М.: Госстатиздат, 1958. — 268 с. 51. Fisher R. A. and Yates F. (1938) Statistical tables for biological, agricultural and medical research. — Edinburgh, London: Oliver and Boyd. 52. Fix E. and H о d g e s J. L., Jr. (1955) Significance probabilities of the Wil¬ coxon test.// Ann. Math. Stat. — 26. — 301—312. 53. F 1 i g n e г M. A. and P о 1 i с e 1 1 о G. E., II (1981) Robust rank procedures for the Behrens — Fisher problem // J. Am. Stat. Assoc. — 76. — 162—168. 54. F 1 i g n e г M. A. and R u s t S. W. (1982) A modification of Mood’s median test for the generalized Behrens — Fisher problem// Biometrika. — 69. — 221—226. 55. F г a s e г D. A. S. (1957) Nonparametric methods in statistics. New York: Wiley. 55a. Friedman M. (1937) The use of ranks to avoid the assumption of norma¬ lity implicit in the analysis of variance // J. Am. Stat. Assoc. — 32.— 675—701. 56. F г i e d m a n M. (1940) A comparison of alternative tests of significance for the problem of m rankings// Ann. Math. Stat. — 11. — 86—92. 57. GastwirthJ. L. (1968) The first median test: A two — sided version of the control median test // J. Am. Stat. Assoc. — 63. — 692—706. 58. GastwirthJ. L. (1970a) On asymptotic relative efficiencies of a class • ’ of rank tests // J. R. Stat. Soc. — B. — 32. — 227—232. 59. Gastwirth J. L. (1970b) On robust rank tests // Proc. First Int. Symp. on Nonparametric Techniques in Statistical Inference. —Cambridge: Cam¬ bridge University Press. 60. G a s t w i г t h J. L. (1971) On the sign test symmetry // J. Am. Stat. Assoc. — 66.— 821—823. 61.. GastwirthJ. L. and Rubin H. (1971) Effect of dependence on the level of some one-sample test // J. Am. Stat. Assoc. — 66. — 816—820. 62. G a s t w i г t h J. L. and Rubin H. (1975) The behavior of robust esti¬ mators on dependent data // Ann. Stat. — 3. — 1070—1100. 63. G a s t w i г t h J. L. and WolffS. S. (1968) An elementary method for obtaining lower bounds on the asymptotic power of rank tests// Ann. Math. Stat. — 39.—2128—2130. 317
64. G о v i n d а г a j u 1 u Z. and Eisenstat S. (1965) Best estimates of location and scale parameters of a chi distribution using ordered observations // Nippon Kagaku Gijutus. — 12. — 149—164. 65. G г a у b i 1 1 F. A. (1969) Introduction to matrices with applications in sta¬ tistics. — Wadsworth, Belmont, CA. 66. H a i g h J. (1971) A neat way to prove asymptotic normality // Biometrika. — 58. _ 677—678. 67. H a j e к J. (1968). Asymptotic normality of simple linear rank statistics under alternatives //Ann. Math. Stat. — 39. — 325—346. 68. H a j e к J. and S i d a к Z. (1967) Theory of rank tests. — New York: Aca¬ demic. Русский перевод: Гаек Я., Ш и д а к 3. Теория ранговых критери¬ ев // Пер. с англ.; Под ред. Л. Н. Большева. —М.: Наука, 1971. — 375 с. 69. Hampel F. R. (1974) The influence curve and its role in robust estimation // J. Amer. Stat. Assoc. — 69. — 383—393. 70. H a n n a n E. J. (1956) The asymptotic power of tests based upon multiple correlation // J. R. Stat. Soc. — B. — 18. — 227 — 233. 71. HardyG. H., Littlewood J. E. and Polya G. (1952) Inequali¬ ties. — 2nd ed. — Cambridge: Cambridge University Press. Русский перевод с издания 1934 г.: Харди Г. Г., Литтльвуд Дж. Е., Полна Г. Неравен¬ ства / Пер с англ.; Сдоп.В.И. Левина и С. Б. Стечкина. —М.: ИЛ, 1948. — 456 с. 72. Н а у m a n G. Е. and GovindarajuluZ. (1966) Exact power of the Mann—Whitney tests for exponential and rectangular alternatives // Ann. Math. Stat. — 37.— 945—953. 73. H e t t m a n s p e r g e r T. P. and Keenan M. A. (1975) Tail weight, statistical inference and families of distributions — a brief survey / Patil et al., eds// Statistical distributions in scientific work. — IV. — 161 —172.— D. Reidel; Dordrecht,Holland. 74. Hettmansperger T. P. and M a 1 i n J. S. (1975) A modified Mood’s test for location with no shape assumptions on the underlying distributions // Biometrika. — 62. — 527—529. 75. Hettmansperger T. P. and McK e a n J. W. (1977) A robust alterna¬ tive based on ranks to least squares in analyzing linear models // Technomet¬ rics. — 19.—275—284. 76. Hettmansperger T. P. and McK e a n J. W. (1983) A geometric interpretation of inferences based on ranks in the linear model // J. Am. Stat. Assoc. —78.— 885—893. 77. Hettmansperger T. P. and U t t s J. M. (1977) Robustness pro¬ perties for a simple class of rank estimates // Comm. Stat. — A6 (9). — 855— 868. 78. Hodges J. L., Jr. (1967) Efficiency in normal samples and tolerance of ext¬ reme values for some estimates of location // Proc. 5th Berkeley Symp. Math. Stat. Prob. — 1. — 163—186. — Berkeley: University of California Press. 79. H о d g e s J. L., Jr. and Lehmann E. L. (1956) The efficiency of some nonparametric competiors of the t-test // Ann. Math. Stat. — 27. — 324 — 335. 80. H о d g e s J. L., Jr. and Lehman E. L. (1960) Comparison of the nor¬ mal scores and Wilcoxon tests //Proc. 4th Berkeley Symp. — 1. — 307— 317. 81. HodgesJ. L., Jr. and LehmannE. L. (1962) -Rank methods for combi¬ nations of independent experiments in analysis of variance // Ann. Math. Stat. — 33.—482—497. 82. HodgesJ. L., Jr. and LehmannE. L. (1963) Estimates of location ba¬ sed on rank tests // Ann. Math. Stat. — 34. — 598—611. 318
83. Н о d g e s J. L., Jr. and Lehmann E. L. (1973) Wilcoxon and t-test for matched pairs of typed subjects // J. Am. Stat. Assoc. — 68. — 151 —158. 84. H о e f f d i n g W. (1951) Optimum nonparametric tests // Proc. 2nd Berkeley Symp. on Math. Stat. and Prob. — 83—92. 85. H о e f f d i n g W. and Robbins H. (1948) The central limit theorem for dependent random variables// Duke Math. J. — 15. — 773—780. 86. H о g g R. V. and С г a i g A. T. (1978) Introduction to mathematical statis¬ tics. — 4th ed. — New York: Macmillan. 87. H о 1 1 a n d e г M. (1967) Rank tests for randomized blocks when the alter¬ natives have an a priori ordering // Ann. Math. Stat. — 38. — 867—877. 88. Hollander M. and Sethuraman J. (1978) Testing for agreement between two groups of judges/Biometrika. — 65. — 403—411. 89. HuberP. J. (1964) Robust estimation of a location parameter // Ann. Math. Stat. — 35.—73—101. 90. Huber P. J. (1973) Robust regression: Asymptotics, conjectures and Monte Carlo/Ann. Stat. — 1. — 799—821. 91. H u b er P. J. (1981) Robust statistics. — New York: Wiley. Русский пере¬ вод: X ь ю б e p П. Робастностные статистики / Пер. с англ.; Под. ред. И. Г. Журбенко. — М.: Мир, 1984. 92. Н u b е г P. J. (1983) Minimax aspects of bounded-influence regres¬ sion (with discussion) // J. Am. Stat. Assoc. — 78. — 66—80. 93. J a e с k e 1 L. A. (1971) Robust estimates of location: Symmetry and asym¬ metric contamination // Ann. Math. Stat. — 42.— 1020—1030. 94. J a e с k e 1 L. A. (1972) Estimating regression coefficients by minimizing the dispersion of the residuals//Ann. Math. Stat. — 43. — 1449—1458. 95. J i г i n a M. (1976) On the asymptotic normality of Kendall's rank correla¬ tion statistic // Ann. Stat. — 4.—214 — 215. 96. J о h n s о n R. A. and Mehrotra K. G. (1971) Some с-sample nonpara¬ metric tests for ordered alternatives // J. Indian Stat. Assoc. — 9. —8—23. 97. Joiner B. L. and Rosenblatt J. R. (1971) Some properties of the range in samples from Tukey's symmetric lambda distribution // J. Amer. Stat. Assoc. — 66. — 394—399. 98. J о n с k h e e г e A. R. (1954) A distribution-free k-sample test against ordered alternatives.— Biometrika. — 41. — 133—145. 99. J urecko va J. (1969) Asymptotic linearity of a rank statistic in regres¬ sion parameter// Ann. Math. Stat. — 40: — 1889—1900. 100. J urecko va J. (1971) Nonparametric estimate of regression coeffi¬ cients // Ann. Math. Stat. — 42. —1328—1338. 101. К e n d a 1 1 M. G. (1938) A new measure of rank correlation // Biometrika.— 30. —81—93. 102. Kendall M. G. (1970) Rank correlation methods. — 4th ed. — New York: Hafner. Русский перевод: К e н д э л М. Ранговые корреляции/Пер. с англ. — М.: Статистика, 1975. — 214 с. 103. К е n d а 1 1 М. G. and S t u а г t А. (1973) The advanced theory of statistics. — Vol. 2.—3rd ed. — New York: Hafner. Русский перевод: Кендалл М. Дж., Стьюарт А. Статистические выводы и связи/Пер. с англ.; Под ред. А. Н. Колмогорова.— М.: Наука, 1973.—899 с. 104. К 1 о t z J. (1963) Small sample power and efficiency for the one-sample Wilcoxon and normal scores tests // Ann. Math. Stat. — 34. — 624 — 632. 105. К 1 о t z J. (1964) On the normal scores two-sample rank test// J. Am. Stat. Assoc. — 59.— 652—664. 319
106. Klotz J. (1365) Alternative efficiencies for signed rank tests// Ann. Math. Stat. — 36.— 1759—1766. 107. К г u s к a 1 W. H. (1952) A nonparametric test for the several sample problem // Ann. Math. Stat. — 23.—525—540. 108. К г u s к a 1 W. H. (1957) Historical notes on the Wilcoxon unpaired two- sample test //J. Am. Stat. Assoc. — 52.—356 — 360. 109. К г u s к a 1 W. H. (1958) Ordinal measures of association // J. Am. Stat. Assoc. — 53.— 814—861. 110. Kruska 1W. H. and W a 1 1 i s W. A. (1952) Use of ranks in one criterion variance analysis // J. Am. Stat. Assoc. — 47.— 583 — 621. 111. Lambert D. (1982) Qualitative robustness of tests // J. Am. Stat. Assoc.— 77. — 352—357. 112. L e h m a n n E. L. (1951) Consistency and unbiasedness of certain nonpara¬ metric tests // Ann. Math. Stat. — 22. —165—179. 113. L e h m a n n E. L. (1953) The power of rank tests // Ann. Math. Stat. — 24.— 23—43. 114. L e h m a n n E. L. (1959) Testing statistical hypotheses. — New York: Wiley. Русский перевод: Леман Э. Проверка статистических гипотез /Пер. с англ. — 2-е изд., испр. — М.: Наука, 1979. — 498 с.' 115. Lehmann Е. L. (1963) Nonparametric confidence intervals for a shift parameter // Ann. Math. Stat. — 34. — 1507—1512. 116. L e h m a n n E. L. (1975) Nonparametrics: Statistical methods based on ranks. — San Francisco: Holden — Day. 117. Li L. and SchucanyW. R. (1975) Some properties of a test for concor¬ dance of two groups of rankings // Biometrika. — 62. — 417—423. 118. Mann H. B. (1945) Nonparametric tests against trend // Econometrika. — 13.—245—259. 119. Mann H. B. and Whitney D. R. (1947) On a test of whether one of two randon variables is stochastically larger than the other // Ann. Math. Stat. — 18.-50—60. 120. M a г i t z J. S. (1981) Distribution-free statistical methods. — London: Chapman and Hall. 121. Markowski E. P. and Hettmansperger T. P. (1982) Inference based on simple rank step score statistics for location model // J. Am. Stat. Assoc.— 77.-901—907. 122. Mat h isenH.C. (1943) A method of testing the hypothesis that two samp¬ les are from the same population // Ann. Math. Stat. — 14. — 188—194. 123. M a t t h e w s G. V. T. (1952) Sun navigation in homing pigeons //J. Exp. Biol. — 30.— 243—267. 124. Matthews G. V. T. (1974) On bird navigation, with some statistical undertones (with discussion)// J. R. Stat. Soc. — B. — 36. — 349—364. 125. M с К e a n J. W. and Hettmansperger T. P. Tests of hypotheses based on ranks in the general linear model // Comm. Stat. — Theory and Methods. — A5 (8). — 693—709. 126. M с К e a n J. W. and H ettmanspergerT. P. (1978) A robust analysis of the general linear model based on one-step R-estimates // Biometrika. — 65.— 571 — 579. 127. M с К 6 a n J. W. and S с h r a d e г R. M. (1980) The geometry of robust procedures in linear models // J. R. Stat. Soc. — B. — 42. — 366 — 371. 128. M с К e a n J. W. and Schrader R.M. (1982) The use and interpreta¬ tion of robust analysis of variance / Launer R. L. and Siegel A. F., eds. Modern data analysis. — New York: Academic. — 171 — 188. 320
129. Mehra К. L. and S а г a n g i J. (1967) Asymptotic efficiency of certain rank tests for comparative experiments // Ann. Math. Stat. — 38.— 90—107. 130. M i 1 1 e г R. G., Jr. (1981) Simultaneous statistical inference. — 2nd ed. — — New York: Springer — Verlag. 131. M о о d A. M. (1950) Introduction to the theory of statistics. — New York: MacGraw — Hill. 132. Morrison D. F. (1976) Multivariate statistical methods. — 2nd ed. — — New York: McGraw — Hill. 133. M о s t e 1 1 e г F. and T u к e у J. W. (1977) Data analysis and regression.— Reading, MA: Addison —Wesley. Русский перевод: Мостеллер Ф., Т ь ю к и Дж. Анализ данных и регрессия. — Вып. 1 и 2/Пер. с англ.; Под ред. Ю. П. Адлера. — М.: Финансы и статистика, 1982.—371 с.; 239 с. 134. Noether G. Е. (1955) On a theorem of Pitman // Ann. Math. Stat. — 26. — 64—68. 135. Noether G. E. (1967) Wilcoxon confidence intervals for location para¬ meters in the discrete case// J. Am. Stat. Assoc. — 62. — 184—188. 136. Noether G. E. (1970) A central limit theorem with nonparametric appli¬ cations // Ann. Math. Stat. — 41. — 1753—1755. 137. Noether G. E. (1973) Some simple distribution-free confidence intervals for the center of a symmetric distribution // J. Am. Stat. Assoc. — 68. — 716—719. 138. О 1 s h e n R. A. (1967) Sign and Wilcoxon tests for linearity // Ann. Math. Stat. —38.—1759—1769. 139. О г b a n J. and Wolfe. D. A. (1982) A class of distribution-free two- sample tests based on placements // J. Am. Stat. Assoc. — 77. — 666—671. 140. P a g e E. B. (1963) Ordered hypotheses for multiple treatments: A signifi¬ cance test for linear ranks // J. Am. Stat. Assoc. — 58. — 216—230. 141. P a г г W. C. (1981) Minimum distance estimation: A bibliography // Comm. Stat. — Theory Method. — A20 (12). — 1205—1224. 142. P a r z e n E. (1960) Modern probability theory and its applications. — New York: Wiley. 143. P a г z e n E. (1962) On estimation of a probability density function and mode // Ann. Math. Stat. — 33. —1065—1076. 144. P i г i e W. R. (1974) Comparing rank tests for ordered alternatives in ran¬ domized blocks//Ann. Stat.— 2.—374—382 (Corr. 1975.— V. 3.— 796). 145. Pitman E. J. G. (1948) Notes on nonparametric statistical inference.— Unpublished notes. 146. P о 1 i с e 1 1 о G. E., II and Hettmansperger T. P. (1976) Adaptive robust procedures for the one-sample location model //J. Am. Stat. Assoc. 71.— 624—633. 147. P г a t t J. W. (1959) Remarks on zeros and ties in the Wilcoxon signed rank procedures / J. Am. Stat. Assoc. — 54.— 655 — 667. 148. P u г i M. L. and Sen P. K. (1968) On Chernoff — Savage tests for ordered alternatives in randomized blocks // Ann. Math. Stat. — 39. — 967—972. 149. P u г i M. L. and S e n P. K. (1971) Nonparametric methods in multivariate analysis. — New York: Wiley. 150. P u t t e г J. (1955) The treatment of ties in some nonparametric tests // Ann. Math. Stat. — 26.— 368—386. 151. R a n d 1 e s R. H. and H о g g R. V. (1973) Adaptive distribution free tests // Comm. Stat. — 2 (4). — 337 — 356. 152. R a n d 1 e s R. H. and Wolfe. D. A. (1979) Introduction to the theory of nonparametric statistics. — New York: Wiley. 321
153. R i e d е г H. (1981) Robustness of one-and two-sample rank tests against gross errors. — Ann. Stat. — 9.—245—265. 154. R i ed er H. (1982) Qualitative robustness of rank tests// Ann. Stat. — 10.—205—211. 155. Rosenzweig М., Bennett E. L. and Diamond М. C. (1972) Brain changes in response to experiense//Sci. Am. — 234. — 22 — 24. 156. Roussas G. G. (1973) A First Course in Mathematical Statistics. — Reading, Mass.: Addison —Wesley. 157. R о у d e n H. L. (1968) Real analysis. — 2nd ed. — New York: Macmil¬ lan. 1-58. R osend lattM. (1956) Remarks on some nonparametric estimates of a density function // Ann. Math. Stat. — 27.— 832—837. 159. R у a n T. A., Jr., J о i n e г B. L. and R у a n B. F. (1976). Minitab student handbook. — Minitab Project Inc., University Park, Pa. 160. R у a n T. A., Jr., J о i n e г В. L. and R у a n B. F. (1982) Minitab refe¬ rence manual. — Minitab Project Inc., University Park, Pa. 161. Sacks J. and Ylvisaker D. (1982) L-and R-estimates and the minimax property // Ann. Stat. — 10.—643—645. 162. S a 1 к L. (1973) The role of the heartbeat in the relations between mother and infant. // Sci. Am. — 235.—26—29. 163. Savage I. R. (1956) Contributions to the theory of rank order statistics — the two sample case. // Ann. Math. Stat. — 27.— 590—615. 164. S с h e f f e H. (1959) The analysis of variance. — New York: Wiley. Русский перевод: III e ф ф e Г. Дисперсионный анализ /Пер. с англ. — 2-е изд.; Под. ред. Ю. В. Линника. — М.: Наука, 1980. 165. Schrader R. М. and HettmanspergerT. Р. (1980) Robust ana.- lysis of variance baseb upon a likelihood ratio criterion// Biometrika.—67.— 93—101. 166. Schrader R. M. and M с К e a n J. W. (1977) Robust analysis of vari¬ ance // Comm. Stat. — Theory Method. — 46 (9).— 879—894. 167. S с h u с a n у W. R. and F г a w 1 e у W. H. (1973) A rank test for two group concordance // Psychometrika. — 38. — 249—258. 168. Schuster E. (1974) On the rate of convergence of an estimate of a functio¬ nal of a probability density// Scand. Actuarial J. — 1. — 103—107. 1 69. S с h w e d e r T. (1975) Window estimation of the asymptotic variance of rank estimators of location//Scand. J. Stat. — 2. — 113—126. (Corr.— V. 8. — 55(1981)). 170. S e n P. K. (1966) On a distribution-free method of estimating asympto¬ tic efficiency of a class of nonparametric tests /7 Ann. Math. Stat. — 37. — 1759—1770. 171. S e n P. K. (1968) Estimates of the regression coefficient based on Kendall’s tau // J. Am. Stat. Assoc.— 63.— 1379—1389. 172. S e n P. K. and Puri M. L. (1977) Asymptotically distribution — free aligned rank order tests for composite hypotheses for general multivariate linear models// Z. Wahrscheinlichkeitstheorie und werw. Geb. — 39.— 175— 186. 173. Serf ling R. J. (1968a) Contributions to central limit theory for de¬ pendent variables// Ann. Math. Stat. — 39. 1158—1175. 174. S e г f 1 i n g R. J. (1968b) The Wilcoxon two-sample statistic on strongly mixing processes // Ann. Math. Stat. — 39.— 1202—1209. 175. Serf ling R. J. (1980) Approximation theorems of mathematical statis¬ tics. — New York: Wiley. 322
176. S i e v е г s G. L. and McKean J. W. (1983) On the robust analysis of linear models with nonsymmetric error distributions.— Unpublished manuscript.— Dept, of Math. — Western Michigan University, Kalamazoo, Mich. 177. Skillings J. H. and Wolfe D. A. (1978) Distribution-free tests for ordered alternatives in a randomized block design // J. Am. Stat. Assoc.— 73.— 427—431. 178. Spearman C. (1904) The proof and measurement of association between two things // Am. J. Psychol. — 15. — 72—101. 179. T e г к e 1 J. and Rosenblatt J. S. (1968) Maternal behavior indeed by maternal blood plasma injected into virgin rats// J. Comp, and Psych.— 65.-479—482. 180. TerpstraT. J. (1962) The asymptotic normality and consistency of Ken¬ dall’s test against trend, when ties are present in one ranking // Indag. Math.— 14.— 327-333. 181. T e г г у М. E. (1952) Some rank order tests which are most powerful against specific parametric alternatives// Ann. Math. Stat. — 23.—364—366. 182. T о d d J. Т., M а г к L. S., S h a w R. E. and Pittenger J. B. (1980) The perception of growth // Sci. Am. — 242 (Feb.). — 132—145. 183. T г у о n P. V. and Hettmansperger T. P. (1973) A class of nonpa- rametric tests for homogeneity against ordered alternatives// Ann. Stat. — 1. —1061 —1070. 184. T u к e у J. W. (1949) The simplest signed rank tests. — Princeton Univer¬ sity Stat. Res. Group. — Memo Report No 17. 185. T u к e у J. W. (1960) A survey of sampling from contaminated distribut¬ ions, contributions to probability and statistics/, I. Olkin, ed. — Stanford University Press, Stanford, CA. 186. U t t s J. M. and Hettmansperger T. P. (1980) A robust class of tests and estimates for multivariate location // J. Am. Stat. Assoc.— 75.— 939—946. 187. Van E e d e n C. (1972) An analogue, for signed rank statistics, of Jureckova's asymptotic linearity theorem for rank statistics // Ann. Math. Stat.— 43.— 791—802. 188. Van E 1 t e г e n P. and Noether G. E. (1959) The asymptotic efficien¬ cy of the %2 — test for a balanced incomplete block design // Biometrika.— 46.-475—477. 189. Van WaerdenB. L. (1952/1953) Order tests for the two sample problem and their power, I, If, III— Indag. Math. — 14.— 453—458; Indag. Math.— 15.—303—310, 311—316; Correction: Indag. Math. — 15.—80. 190. Van Z w e t W. R. (1970) Convex transformations of random variables. — Mathematical Centre Tracts No. 7. — Mathematesch Centrum Amsterdam. 191. W eg man E. J. (1972) Nonparametric probability density estimation: I. A summary of available methods//Technometrics. — 14. — 533—546. 192. W e 1 с h B. L. (1937) The significance of the difference between two means when the population variances are unequal // Biometrika. — 29.—350—362. 193. Wi 1 cox on F. (1945) Individual comparisons by ranking methods// Biometrics. — 1. — 80—83. 194. W i 1 к s S. S. (1962) Mathematical statistics. — New York: Wiley. Русский перевод: Уилкс С. Математическая статистика /Пер. с англ.; Под ред. Ю. В. Линника. — М.: Наука, 1967. 195. Witting Н. (1960) A generalized Pitman efficiency for nonparametric tests // Ann. Math. Stat.— 31.— 405—416. 196. YlvisakerD. (1977) Test resistance //J. Am. Stat. Assoc. — 72. — 551 — 556. 323
ДОПОЛНИТЕЛЬНАЯ ЛИТЕРАТУРА 197. Айвазян С. А., ЕнюковИ. С., Мешалкин JI. Д. Прикладная статистика. Исследование зависимостей: Спр. изд.: Под ред. С. А. Айва¬ зяна.—М.: Финансы и статистика, 1985.—487 с. 198. Андерсон Т. Введение в многомерный статистический анализ/Пер. с англ.; Под ред. Б. В. Гнеденко.— М.: Физматгиз, 1963.—500 с. 199. Бейдер А. И., Кулинская Е. В. О построении точного распределения стати¬ стик, основанных на сплошном ранжировании // II Всес. конф. по стати- стич. и дискретн. анализу нечисловых данных: Тез. докл. — М.: Таллин, 1984.— С. 57—58. 200. Бернулли Я. О законе больших чисел: Пер. с лат./Под ред. и с предисл. А. Н. Колмогорова и коммент.;Под общ. ред. Ю.В. Прохорова.— М.: Наука, 1986. — 176 с. 201. Благовещенский Ю.Н., Дмитриев Е.А., Самсонова В. П. Применение непараметрических методов в почвоведении.— М.: Изд- воМГУ, 1985. — 98 с. 202. Большее Л. Н., Смирнов Н. В. Таблицы математической статисти¬ ки/ 3-е изд. — М.: Наука, 1983. — 416 с. 203. Боровков А. А. Теория вероятностей. — М.: Наука, 1976.— 352 с. 204. Боровков А. А. Математическая статистика: Оценка параметров. Проверка гипотез. — М.: Наука, 1984 (а). — 472 с. 205. Боровков А. А. Математическая статистика: Дополнительные главы.— М.: Наука, 1984 (б). — 144 с. 206. Боровков А. А., Маркова Н. П., Сычева Н. М. Таблицы для критериев Н. В. Смирнова однородности двух выборок.— Новосибирск: Изд-во АН СССР, 1964. 207. Браунли К- А. Статистическая теория и методология в науке и техни- ке/Пер. с англ.; Под ред. Л. Н. Большева. — М.: Наука, 1977.—407 с. 208. Гиляревский Р. С.,Старостин Б. А. Иностранные имена и на¬ звания в русском тексте: Справочник/ 3-е изд., испр. и доп.— М.: Высш. школа, 1985.—303 с. 209. Гнеденко Б. В. Курс теории вероятностей/5-е изд.— М.: Наука, 1969. 210. Дем и д ен ко Е. 3. Линейная и нелинейная регрессия. — М.: Финансы и статистика, 1981. — 302 с. 210а. Дэйвид. Г. Порядковые статистики: Пер. с англ.; Под. ред. В. В. Пет¬ рова.— М.: Наука, 1979.— 335 с. 211. Д э н и е л К. Применения статистики в промышленном эксперименте/Пер. с англ.; Под ред. Э. К. Лецкого. — М.: Мир, 1979.— 299 с. 212. 3 а к с Л. Статистическое оценивание: Пер. с нем./Под ред. Ю. П. Адлера и В. Г. Горского. — М.: Статистика, 1976.—598 с. 212а. Кендалл М., Стьюарт Дж. Теория распределений/Пер. с англ.; Под ред. А. Н. Колмогорова. — М.: Наука, 1966. 213. Кендалл М., Стьюарт А. Статистические выводы и связи / Пер. с англ.; Под ред. А. Н. Колмогорова.— М.: Наука, 1973.— 899 с. 214. Коваленко И. Н., Филиппова А. А. Теория вероятностей и ма¬ тематическая статистика/2-е изд., перераб. и доп. —М.: Высш. школа, 1982.— 256 с. 215. Колмогоров А. Н.,Фомин С. В. Элементы теории функций и функ¬ ционального анализа/3-е изд., перераб. — М.: Наука, 1972. — 496 с. 324
215а. Крамер Г. Математические методы статистики: Пер с англ./Под. ред. А. Н. Колмогорова/2-е изд., стереотип. — М.: Мир, 1975.— 648 с. 216. Кулинская Е. В. О локально-оптимальных критериях в ранговом и дисперсионном анализах // Теор. вероятн. и ее примен., 1986.— Т. 31, No. 3. — С. 583—588. 217. Кулинская Е. В. О весах блоков в ранговом дисперсионном анализе // III Всес. конф.: Применение многомерного анализа в экономике и оценка качества продукции.— М. — Тарту, 1985. — С. 38—40. 218. Кулинская Е. В. Локально-оптимальные ранговые критерии в двух¬ факторных моделях//Дис. канд. физ.-мат. наук. — М., 1986. — 164 с. 219. К у л и н с к а я Е. В. Веса блоков в ранговом дисперсионном анализе // Труды ВНИИСИ, вып. 14, 1986. 220. Кулинская Е. В. Асимптотические свойства линейных ранговых ста¬ тистик // Сообщ. по прикл. математике. — М.: ВЦ АН СССР, 1986. — 21 с. 221. Ликеш И., Ляга Й. Основные таблицы математической статистики/ Пер. с чешек. — М.: Финансы и статистика, 1985. — 356 с. 222. Л и н н и к Ю. В. Метод наименьших квадратов и основы математико-ста¬ тистической обработки наблюдений/2-е изд. — М. : Физматгиз, 1962. 222а. Лоусон Ч., X е н с о н Р. Численное решение задач метода наимень¬ ших квадратов: Пер. с англ.— М.: Наука, 1986.— 232 с. 223. ЛюстерникЛ. А., Соболев В. И. Краткий курс функционального анализа. — М.: Высш. школа, 1982.—271 с. 224. Маркова Е. В., Лисенков А. Н. Планирование эксперимента в условиях неоднородностей.— М.: Наука, 1973. 225. Методические указания: Прикладная статистика. Методы обработки дан- ных/2-я редакция.— М., 1985. 226. Непараметрические и робастные методы статистики в кибернетике // Лит. с 1975 по 1985 г.: Библиографический указатель. —№ 25251.— Новоси¬ бирск: Сиб. отд. АН СССР/ГПНТБ, 1985. . 227. НикитинЯ. Ю. Локальная асимптотическая оптимальность по Бахаду¬ ру и задачи характеризации//Теор. вер. и ее прим., 1984.—Т. 29.—С. 79—82. 228. Никитин Я. Ю. Эффективность асимптотическая критерия// Матема¬ тическая энциклопедия /Гл. ред. И. М. Виноградов.— М.: Сов. энциклопе¬ дия.—Т. 5, 1985.—Стб. 1025—1027. 229. Нискина Н. П., Т е й м а н А. И.,Шмерлинг Д. С. О некоторых статистических критериях упорядочения в двухфакторной схеме//Труды ВНИИСИ.— Вып. 11, 1984.— С. 28—41. 230. Нискина Н. П., Т е й м а н А. И., Шмерлинг Д. С. Непарамет¬ рические методы статистики, основанные на рангах и их применения// Препринт. —М., 1986.— 60 с. 231. Нискина Н. П., Т е й м а н А. И., Шмерлинг Д. С. Двухфактор¬ ный непараметрический дисперсионный анализ для неполных данных // Препринт. — М., 1986. — 44 с. 232. Нискина Н.П.,Тейман А. И., Шмерлинг Д. С. Специальные задачи двухфакторного анализа: Альтернативы упорядоченности обработок// Препринт.— М., 1986.—55 с. 233. Нискина Н. П. Тейман А. И., Шмерлинг Д. С. Алгоритмы непараметрических методов статистики, основанных на рангах: Пакет при¬ кладных программ // Препринт. — М., 1986. — 58 с. 325
234. О р л о в А. И. Распространенная ошибка при использовании критериев Колмогорова и омега-квадрат// Заводская лаборатория.— 1985.— Т. 51.— No 1. — С. 60—62. 235. Питмен Э. Основы теории статистических выводов: Пер. с англ./Под ред. А. Н. Ширяева. — М.: Мир, 1986. — 104 с. 235а. Прохоров Ю. В., Розанов Ю. А. Теория вероятностей/2-е изд.— М: Наука, 1973. 236. Р а о С. Р. Линейные статистические методы и их применения/Пер. с англ.; Под ред. Ю. В. Линника. — М.: Наука, 1968. — 648 с. 237. Р и о р д а н Дж. Введение в комбинаторный анализ/Пер. с англ.; Под ред. Л. Я. Куликова. — М.: Изд-во иностр. лит., 1963. — 287 с. 238. С е б е р Дж. Линейный регрессионный анализ/Пер. с англ.; Под ред. М. Б. Налимова.— М.: Мир, 1980.— 456 с. 239. Севастьянов Б. А. Курс теории вероятностей и математической ста¬ тистики.— М.: Наука, 1982.— 256 с. 240. Смирнов Н. В. Теория вероятностей и математическая статистика // Избранные труды.— М.: Наука, 1970.—290 с. 241. Таблицы планов эксперимента для факторных и полиномиальных моделей: Справочное издание/Бродский В. 3. и др.; Под ред. В. В. Налимова. — М.: Металлургия, 1982. — 752 с. 242. Тюрин Ю. Н. Непараметрические методы статистики.— М.: Знание, 1978.— 64 с. 243. Тюрин Ю. Н. О предельном распределении статистик Колмогорова — Смирнова для сложной гипотезы // Известия АН СССР. —Сер. матем., 1984. — Т. 48, № 6. — С. 1314—1343. 244. Тюрин Ю. Н. Исследования по непараметрической статистике: Непара¬ метрические методы и линейная модель // Дисс. докт. физ.-мат. наук. —М., 1985. .245. Тюрин Ю. Н., Л и т в а к Б. Г., Орлов А. И., Сатаров Г. А., Шмерлинг Д. С. Анализ нечисловой информации // Препринт. — М., 1981.— 80 с. 246. Тюрин Ю. Н., Шмерлинг Д. С. О некоторых статистических мето¬ дах анализа ранжировок: Обзор // Заводская лаборатория. —1985. — Т. 51, № 7. — С. 42—48. 247. Указатель журналов по теории вероятностей и математической статистике и их приложениям.— М., 1986.—35 с. 248. Устойчивые статистические методы оценки данных / Под ред. Р. Л. Лонера, Г. Н. Уилкинсона: Пер. с англ./Под ред. Н. Г. Волкова. — М.: Машиност¬ роение, 1984.—232 с. 248а. Ф е л л е р В. Введение в теорию вероятностей и ее приложения. — Т. 1, 2/Пер. с англ.; Под ред. А. Н. Колмогорова, Ю. В. Прохорова.— М.: Мир, 1967. 249. Хикс Ч. Основные принципы планирования эксперимента/Пер. с. англ.; Под ред. В. В. Налимова. М.: Мир, 1967.— 406 с. 249а. Холлендер М., Вулф Д. Непараметрические методы статистики/ Пер. с англ.; Под ред. Ю. П. Адлера и Ю. Н. Тюрина. — М.: Финансы и статистика, 1983. — 518 с. 250. Ширяев А. Н. Вероятность. — М.: Наука, 1980. — 575 с. 251. Шмерлинг Д. С. О проверке согласованности мнений экспертов // Статистические методы анализа экспертных оценок // Ученые записки по статистике.— Т. 29. — М.: Наука, 1977. — С. 77—83. 326
251а. Шмерлинг Д. С. Критерии упорядоченности в двухфакторном дис¬ персионном анализе, основанные на межблоковом ранжировании наблюде¬ ний // Сб. трудов ВНИИ системных исследований. Методы анализа дан¬ ных, оценивание и выбор. — Вып. 180. — 1986. 252. Шмерлинг Д. С. Свободные от распределения ранговые критерии для неполных блоков при альтернативе априорного упорядочения // Эксперт¬ ные оценки//Вопросы кибернетики. — Вып. 58. —М.: 1979. —С. 52— 65. 253. Шмерлинг Д. С. Разработка и исследование ранговых методов анали¬ за информации для задач упорядочения объектов // Дис. канд. физ.-мат. наук.— М., 1982. 254. Шмерлинг Д. С. Ранговый критерий для многомерных наблюдений в случайных блоках при альтернативе априорного упорядочения // Ученые записки по статистике.— Т. 43. — М.: Наука, 1983. — С. 59—71. 255. A d i с h i е J. N. Rank Tests in linear models // Handbook of Statistics. — V. 4/Krishnaian P. R., Sen P. K., eds. — Amsterdam e. a.: Ncrth — Hol¬ land Publishing Co., 1984. — 229—258. 256. A 1 v о М., CabilioP. A comparison of approximations to the distribu¬ tion of average Kendall tau//Commun. Statist. —Theor. Meth., 1984. — V. 13. — 3191—3216. 257. A 1 v о М., С a b i 1 i о P. Average rank correlation statistics in the presence of ties//Commun. Statist. — Theor. Meth., 1985.— V. 14, № 9.—2095— 2108. 258. A 1 v о М., CabilioP., F e i g i n P. D. Asymptotic theory for measures of concordance with special reference to average Kendall tau // AS, 1982. — V. 10. — 1269—1276. 259. A r a k i T. Inadmisibility of signed rank test in the Bahadur efficiency //Math. Jap., 1985. — V. 30. — 111 — 116. 260. Aubuchon J. C., HettmanspergerT. P. A note on the estimati¬ on of the integral of f2 (*)// J. Statist. Plan. Inf., 1984.—V.9.—321—331. 261. Aubuchon J. C., HettmanspergerT. P. Rank-based inference for linear models: Asymmetric errors // Tech. Rep. anb Preprints. — Dept, of Statist. — Pennsylvania State Univ., N. 48 (febr. 1984). —25. 262. Bahadur R. R. Some limit theorems in statistics // SIAM. — Philadel¬ phia, 1971. 263. Barbour A. D., Gartwright D. I., D о n e 1 1 у J. B., Eagle- son G. K. A new rank test for the k-sample problem // Commun. Statist.— Theor. Meth., 1985. — V. 14. — 1471 — 1484. 264. Berenson M. L. Some useful nonparametric tests for ordered alternati¬ ves in randomized block experiments//Commun. Statist. — Theor. Meth., 1982 (a).—V. 11.— 1681 —1693. 265. Berenson M. L. A study of several useful tests for ordered alternatives in the randomized block design // Commun. Statist. — Sinula Computa, 1982 (b). — V. 11. — 563—581. 266. Berenson M. L., Gross Shulamith T. Designing completely randomized experiments to detect ordered effects: An empirical studies//Commun. Sta¬ tist. — Simula. Computa, 1981.— V. В 10.— 405—431. 267. BhapkarV. P. Univariate and multivariate multisample location and scale tests// Handbook of Statistics. — V. 4. Nonparametric Methods. —Ams¬ terdam e.a.: North — Holland, 1984.—31—62. 268. В о n с e 1 e t C. G., Jr., Dickinson B. W. A variant of Huber robust regression // SIAM J. Sci. Stat. Comput., 1984. — V. 5, N 3. — 720—734. 268a. Brown В. М., Hettmansperger T. P. Affine invariant rank met¬ 327
hods in the bivariate location// Tech Reports and Preprints, N 58. — Pen¬ nsylvania: Penn. State Univ., 1985.—21. 268b. В г о w n В. М., Hettmansperger T. P. Invariant tests in bivariate models and the 1Л criterion // Tech. Reports and Preprints, N 68. — Pennsyl¬ vania: Penn. State Univ., 1986. 269. Buck W. Signed-rank tests in the presence of ties (with extended tables) // Biom. J., 1979. — V. 21. — 501—526. 270. Burke M. D. On the asymptotic power of some к-sample statistics based on the multivariate empirical process / J. Multiv. Anal. —V. 9.— 183—205. 271. Cheng K.-S., Hettmansperger T. P. Weighted least-squa- res rank estimates // Common. Statist. — Theor. Meth., 1983. — V. 12, N 9.— 1069—1086. 272. Claypool P. L., Holbert D. Accuracy of the normal and Edgeworth approximations to the distributions of the Wilcoxon signed-rank statistic// JASA, 1974.— V. 69.— 255—258. 273. CollinsJ.R. On the minimax properties for R-estimators of location // Ann. Stat., 1983. —V. 11, N 4. — 1190—1195. 274. Conover W. J. Practical Nonparametric Statistics/2nd ed. — N.Y. et. al.: Wiley, 1980. 275. Costello P. S., W о 1 f e D. A. A new nonparametric approach to the problem of agreement between two groups of judges // Comm. Stat. — B.— Sim. Comp., 1985.— V. 14, N 4.— 791—805. 276. CritchlowD. E. Metric Methods for Analysing Partially Ranked Data.— Berlin et al.: Springer —Verlag, 1985. — X. — 261 //Lect. Not. in Statist., N 34. 277. С г о g g e 1 D. J., Skillings J. H. Distribution-free tests for main effects in multifactor designs // Amer. Statist.— V. 40, N 2. — 99—102. 278. Daniel W.W. Applied Nonparametric Statistics.— Boston et al.: Hough¬ ton Nifflin Co., 1978.— XIII.—510. 279. D e n к e r M. Asymptotic distribution theory in nonparametric statistics.— Braunschweig/Wiesbaden: Fridrich Wieweg und Sohn, 1985.—VIII.— 204. 280. D i а с о n i s P., G г a h a m P. L., Spearman's footrule as a measure disarray // J. R. S. S. — B, 1977.— V. 39.— 262—268. 281. Dietz E. Jacquelin. Linear signed rank tests for multivariate location// Comm. Statist. — Theor. Meth., 1984. —V. 13, № 12. — 1435—1451. 282. Dionne Louise. Efficient nonparametric estimators of parameters in the general linear hypothesis // Ann. Statist., 1981. — V. 9, № 2.—457—460. 283. E h г e n b e г g A. S. C. On sampling from a population of rankers.— B, 1952. — V. 39.—82—87. 284. Eisenreich G., Sube R. Mathematik. A—Z. Englisch, Deutsch, Franzosisch, Russisch. Mit etwa 35 Wortstellen. — Berlin: VEB Verlag Technik, 1982.—923. 285. Encyclopedia of Statistical Sciences/Kotz S., Johnson N. L., eds. — N. Y. e.a.: Wiley, 1982. —V. 1—6. 286. F 1 i g n e г M. A. Pairwise Versus joint Ranking: Another look at the Krus- kal-Wallis statistics// Biometrika, 1985. — V. 72. — 705—709. 287. F 1 i g n e г M. A., R u s t S. W. On the independence problem and Kendall’s tau//Commun. Statist. — Theor. Meth., 1983. —V. 12.— 1597—1607. 288. G e r i g Т. M. A multivariate extension of Friedman’s test // JASA, 1969.— V. 64. —1595 — 1608. 328
289. Groeneboom P., OosterhoffJ. Bahadur efficiency and probabi¬ lities of large derivations // Statist. Neer, 1977. — V. 31, N 1. 1—24. 290. H a m p e 1 F. R. et al. Robust statistics. The Approach Based on Influence Functions. — N. Y. e. a.: Wiley, 1986. — XXIII. — 502. 291. Handbook of Statistics. —V. 1. Analysis of Variance/Krishnaiah P. R., eds.—Amsterdam et. al.: North — Holland, 1980.— XVIII.— 1002. 292. Handbook of Statistics. —V. 4. Nonparametric Methods / Krishnaiah P. R., Sen P. K., eds. — Amsterdam e.a.: North — Holland, 1984. — XXII.—968. 293. Haux R., Schumacher М., Weckesser G. Asymptotic relative Pitman efficiencies of rank tests for complete block designs. — Statistics, 1975. — V. 16, N 3.— 427—444. 294. Hettmansperger T. P. Two-sample inference based on one-sample sign statistics // ApS, 1984.— V. 33.— 45—51. 295. Hettmansperger T. P., Shiather S. J. Confidence intervals based on interpolated order statistics // Statist. Probab. Lett., 1968. — V. 4, N 2. — 75 — 79. 296. I m a n R. L. An approximation to the exact distribution of the Wilcoxon signed rank test statistic // Commun. Statist., 1974. —V. 3. — 795—806. 297. I m a n R. L. An approximation to the exact distribution of the Wilcoxon — Mann—Whitney rank sum test statistic//Commun. Statist., 1976. — A5.—587—598. 298. I m a n R. L., С о n о v e г W. J. Approximations at the critical region for Spearman’s rho with and without ties present // Commun. Stat., 1978.— B7.— 269—282. 299. ImanR. LM Davenport J. M. New approximations to the exact dist¬ ribution at the Kruskal —Wallis test statistic// Commun. Statist., 1976.— A5. — 1335—1348. 300. Iman R. L., Da venport J. M. Approximations of the critical region of the Friedman statistic//Commun. Statist., 1980.— A9. — 571 — 595. 301. ImanR. I., H о г a S. С., С о n о v e г W. J. Comparison of asymptotical¬ ly distribution — free procedures for analysis of complete blocks // J. Amer. Statist. A 35. 1984. — V. 79, N 387. — 674—685. 302. Iman R. L., Quade D., Alexander D. Exact probability levels for the Kruskal—Wallis test // Selected Tables in Mathematical Statis¬ tics. — V. 3/Harter H. L., Owen D. B., eds. — Provibence// R. I. Amer. Math. Soc., 1975. — 329—384. 303. Joag — Dev K. Measures of dependence // Handbook of Statistics. — Y. 4/Krishnaiah P. R., Sen P. K. — Amsterdam et. a. : North — Holland, 1984. — 79—88. 304. Johnson N. S. Nonnull properties of Kendall’s partial rank correlation coefficient. — B, 1979. — V. 66. — 333—337. 305. JonckheereA. R. A test of significance for the relation between m rankings and к ranked categories. — BrJ Statist. Psychol, 1954.— V.7.— 93 — 100. 306. JureckovaJ.M. M-, L- and R-estimators // Handbook of Statistics. — V. 4/Krishnaiah P. R., Sen P. K., eds. — Amsterdam e. a.: North — Holland, 1984. — 463 — 486. 307. Kallenberg W. Chernoff efficiency and efficiency // AS, 1982. — V. 10.— 583—594. 308. К a 1 1 e n b e r g W. С. M.// Intermediate efficiency, theory and examppls// Ann. Statist (a), 1983. — V. 11. — 170—182. 309. Kallenberg W. С. M. Asymptotic efficiency and defficiency of tests// Bull. Int. Statist. Inst., 1983 (b). — V. 5. — 1173—1189. 329
310. К а 1 1 e n b е г g W. С. М. Testing Statistical Hypotheses: Worked Soluti¬ ons//Amsterdam: Math. Centrum, 1984.— III. —310/CW1 Syllabi, 3. 310a. Khmaladze E. V., Parjanadze A. M. Functional limit theorems for linear statistics from sequential ranks // Prob. Theory and Related Fields, 1986. — V. 73. — 585—595. 311. Ki m P. J., Jennrich R. I. Tables of the exact sampling distribution of two — sample Kolmogorov — Smirnov criterion Dmn, m n II Selected Tables in Math. Statist. —V. l/Harter M. L., Owen D. B., eds. — R. I. — Providence// A. Math. Soc. — Inst. Math. Statist., 1973. — 79—170. 312. К о z i о 1 J. A. On a class of distribution — free tests for growth curves analysis// Zastosow mat., 1984. — V. 18, N 3. — 413—425. 313. К г e m e г E. Bahadur efficiency of linear rank tests — a survey // Acta Univ. Carol. — Math et Phys., 1983. — V. 24, N 1. — 61—75. 314. К г о о n J., de, Laan van der P. A comparison of the powers of generalized Friedman’s rank test and aligned rank procedure based on simulation // Statist. Neer., 1984.— V. 38. — 189—198. 315. Maghsoodloo S. Estimates of the quantiles of Kendall’s partial rank correlation coefficient // J. Statist, comp, simul, 1975. — V. 4. — 155—164. 316. Maghsoodloo S., Pallos L. L. Asymptotic behavior of Kendall’s partial rank correlation coefficient and additional quantile estimates // J. Statist, comp, simul, 1981. — V. 13.—41—48. 317. M a n s о u r i G. S. H., Govindarajuly Z. An asymptotically distribution — free test for ordered alternatives in two-way layouts //J. Statist. Plan. Inf., 1986.— V. 13, N 2. — 239 — 249. 318. Markham R. Small-sample efficiencies of tests based on the method of n rankings // J. Statist, comp, simul, 198U — V. 12. — 193—207. 319. M а г k о w s k i E. P. Inference using near-neighbour trimmed rank sta¬ tistics for simple linear regression models//Biometrika, 1984. —V. 71, N 1. — 51—60. 320. M i k u 1 s k i P. W. On comparison of different approaches to the efficiency of statistical procedures. — Sankhya, 1976.— V. A 38, N 2. — 131 —142. 321. Molenaar W. Approximations to the Poisson, Binomial and Hyperge¬ ometric Distribution Function // Math. Centrum Tracts. — V. 31. — Ams¬ terdam, 1970. 322. О d e h R. E. On the power of Jonckheere’s k-sample test against ordered alternatives// Biometrika, 1972. — V. 59.— 467 — 471. 323. О d e h R. E., OwenD. В., В i r n b a u m Z. W., Fisher L. Pocket Book of Statistical Tables. — N. Y. and Basel: Marcel Dekker Inc., 1977. — X. —166. 324. P a 1 a с h e k A. B., S с h u с a n у W. R. On approximatate confidence intervals for measures et concordance//Psychometrika—P., 1984. — V. 49.— 133—141. 325. Papaioannou Т., Lenkas S. Inequalities on rank correlation with missing data // J. Roy, Statist. Soc. — B, 1984, — V. 46.— 68—71. 326. Pratt J. W., GibbonsJ. D. Consepts of Nonparametric Theory. — N. Y. et al.: Springer — Verlag, 1981. — XVI. — 462. 327. P u г i M. L., R a 1 e s с u S. S. The asymptotic distribution theory of one sample signed rank statistics // Statistical Decision Theory and Related Topics.— III. — Vol. 2/Gupta S.S., Berger J. O., eds. — N. Y. e. a.: Acad. Press, 1982,— 213—232. 328. Puri M. L., S e n P. K. Nonparametric Methods in General Linear Models.— N. Y. et a.: Wiley, 1985. — X, 399. 330
329. Р и г i М. L., W u T.-J. The order of normal approximation for signed li¬ near rank statistics//TeopnH вероятностей и ее применения. — Т. 31, № 1.— 156—163. 330. Q u a d е D. N. Nonparametric partial rank correlation. — Univ. of North Carolina. — Dep. of Statist. Inst, of Statistics, 1967 // Mimeo. ser. — 526. 331. Q u ad e D. Nonparametric Methods in two-way layouts//Handbook of Statistics. — V. 4/Krishnaiah P. K., Sen P. K-, eds. — Amsterdam et. al.: North — Holland, 1984.— 185—228. 332. Q u a d e D., Silva C. Evaluating of weighted ranking using expected signifi¬ cance level // Comput. Statist. Theor.Meth., 1980.— V. 9. — 1087—1096. 333. R а о К. S. М., G о r e A. P. Testing against ordered alternatives in one¬ way layout // Biom. J., 1984. — V. 26. — 25—32. 334. R i n a m a n W. C., Jr. On distribution-free rank tests for 2-way la¬ youts //J. Amer. Statist. Ass., 1983. —V. 78. — 655—659.—Corr. — Ibid, 1985. — V. 80, N 392. — 1084. 335. Robertson Т., Wright F. T. Testing for ordered alternatives with increased precision in one of the samples// Biometrika, 1982. —V. 69. — 579—586. 336. R о b i n s о n D. H. On more powerful tests of judge agreement with a known standart // Psychometrika, 1985. — V. 50, N 3. —343—349. 337. R о t h e G. Some properties of the asymptotic relative Pitman efficiency // Ann. Statist, 1981.— V. 9. — 669—669. 338. R о t h e G. A lower bound for the Pitman efficiency of Friedman tests // Statist, and Prob. Letters, 1983 (a). — V. 1. — 239—242. 339. R о t h e G. Block rank statistics // Metrika, 1983 (b). — V. 30, N 2. — 73— 83. 340. R о t h e G. Asymptotic absolute efficiency of projection tests with an appli¬ cation to N-ranking tests // Statist. Neer., 1984. —V. 38. —169—187. 341. Rothe G. Linear trend test versus global test: A comparison// Statist. Neer., 1986.— V. 40, N 1. — 1 — 11. 342. Salamal. A.,Quade D. Some simple statistics to test against ordered alternatives in complete block designs// Biom. J., 1984. —V. 26, N 8.— 867—882. 343. Savage I. R. Nonparametric statistics: A personal review, — Sankhya, 1969. — V. A31, N 2. — 107—144. 344. SchemperM. A nonparametric к-sample test for data defined by inter¬ vals // Statist. Neer., 1983. — V. 37. — 69 —71. 345. S e n P. K. Nonparametric simultaneous inference for some MANOVA mo¬ dels//Handbook of Statistics. — V. 1. Analysis of Variance / Krishnaiah P. R., ed. — Amsterdam e. a.: North — Holland, 1980. — 673—702. 345a. S e n P. K. Theory and Applications of Sequential Nonparametrics. — Phi¬ ladelphia (PA) // Soc. Ind. Appl. Math., 1985. — VI. — 100//CBMS— NSF Reg. Conf. Series Appl. Math. 346. SheaterS. J., Hettmansperger T. P. A data based algorithm for choosing the window width when estimating the integral of /2 (*) // Tech. Reports and Preprints. — Dept, of Statist. — Pennsylvania State Univ., n 52 (March 1985). — 24. 347. ShirahataS. Tests of partial correlation in a linear model. — B, 1977.— V. 64.— 162—164. 348. ShirahataS. Nonparametric measures of intraclass correlation// Commun. Statist. — Theor. Meth., 1982 — V. 11. — 1707 — 1721. 349. Shirahata S., Wakimoto K. Asymptotic normality of a class of 331
nonlinear rank tests for independence// Ann. Statist, 1984. — V.12. —1124— 1129. 350. S h i г a i s h i T.-A. Semi — aligned rank tests // Ann. Inst. Statist. Math., 1984.— V. 36. — Pt. A. — 463—473. 351. S h i r a i s h i T.-A. An asymptotic acceptance of aligned rank tests under alternatives of contamined distributions in a randomized blocks designs //J. Am. Statist. Ass., 1985.— V. 80, N 391.— 748—752. 352. Sievers G. L. Weighted rank statistics for simple linear regression/J. Amer. statist. Ass., 1979.—V.73, N 363. — 628—631. 353. S i e v e г s G. L., M с К e a n J. W. On the robust rank analysis of linear models with nonsymmetric error distributions//J. Statist. Plann. Inf., 1986. — V. 13, N 2. — 215—230. 354. Silva C., Q u a d e D. Estimating the asymptotic relative efficiency of weighted rankings// comp, statist, theor. meth., 1983. —V. 12, N 5.—511 — 521. 355. Singh K. Asymptotic comparison of tests — a review // Handbook of Statistics. — V. 4. Nonparametric Methods. — Amsterdam: North — Holland, 1984. — 173—184; 212—219. 356. Skillings J. H. On the null distribution of Jonkheere’s statistic used in two-way models for ordered alternatives // Technometrics, 1980.— V. 22. — 431—436. 357. Skillings J. H. Nonparametric approaches to testing and multiple comparisons in a one-way ANOVA // Commun. Statist. — Simula Compu- ta, 1983. — V. 12. — 373—387. 358. S к i 1 1 i n g s J. H., Mack G. A. On the use of a Friedman—type statistics in balanced and unbalanced block designs / / Technometrics, 1981. — V.23.— 171 — 177. 359. So Y. C., Sen P. K. Nonparametric repeated significance tests for one¬ way ANOVA with adaptation to multiple comparisons// J, Statist. Plann. Inter., 1982. — V. 7, N 1. — 83 — 96. 360. S t a v i g G. R. Monotonic measures of agreement for ranked data // BJMSP, Br. J. Math. Statist. Psyen.— V. 37. — 283—287. 361. S t о n e C. J. Consistent nonparametric regression // Ann. Statist., 1977.— V. 5, N 4. — 595—645. 362. T а у 1 о г D. С. Asymptotic distribution theory for general statistical func¬ tionals // Ann. Inst, statist. Math, 1985. —V. 37.—131 —138. 363. Thompson R., Govindaraju luZ., Doksum K. A. Distribution and power of absolute normal scores test for N = 11 (1) 20, a= 0,001, 0,05,0,1 for N = 1 (1) 17, a = 0,025, 0,05. 0,1//JASA, 1967. — V. 62. — 966 — 975. 364. W а к i m о to K. К-multiple chart and its application to the test for homo¬ geneity against ordered alternatives// J. Japan Statist. Soc., 1981; —11. — 1—7. 365. W i e a n d H. S. A condition under which the Pitman arid Bahadur appro¬ aches to efficiency coincide//Ann. Statist., 1976.— V. 7. — 1003—1011. 366. The Software Catalog Science and Engineering/3-d ed. Produc. from MENY R. — The Int. Software Database TM.— N. Y. et al.: Elsevier. — 1986. — X, 614 p. 332
• ОГЛАВЛЕНИЕ Предисловие к русскому изданию 5 Предисловие 11 Глава I. Модель с параметром положения для одной выборки и про¬ извольного непрывного распределения 15 1.1. Введение 15 1.2. Критерий знаков и его распределение 17 1.3. Состоятельность статистического критерия 19 1.4. Наиболее мощный критерий 22 1.5. Оценивание 26 1.6. Устойчивость 31 1.7. Заключение. Влияние зависимости данных 38 1.8. Упражнения 41 Глава 2. Модель с параметром сдвига для одной выборки с симметрич¬ ным непрерывным распределением 44 2.1. Введение 44 2.2. Критерий знаковых рангов Уилкоксона 46 2.3. Точечные и интервальные оценки, основанные на статистике зна¬ ковых рангов Уилкоксона 52 2.4. Устойчивость ранговых критериев и оценок 56 2.5. Общая асимптотическая теория для статистики знаковых рангов Уил¬ коксона . 61 . 2.6. Асимптотическая относительная эффективность 76 2.7:’ Асимптотическая линейность статистики знаковых рангов] Уилкоксо¬ на. Резюме. Влияние зависимости 90 2.8. Статистики с метками общего вида 99 2.9. Эффективность статистик с метками общего вида 114 2.10. Упражнения 132 Глава 3. Модель с параметром положения для двух выборок .... 140 3.1. Введение 140 3.2. Ранговая статистика Манна — Уитни — Уилкоксона . 142 3.3. Распределение рангов при альтернативах 149 3.4. Метки общего вида 155 3.5. Теория асимптотического распределения при альтернативах . . . 165 3.6. Сравнение планов 176 3.7. Упражнения 178 Глава 4. Однофакторные и двухфакторные планы и ранговые корреля¬ ции 185 4.1. Введение 185 4.2. Одофакторная схема. Критерий Крускала — Уоллиса 186 333
4.3. Двухфакторная схема. Критерий Фридмена 201 4.4. Ранговая корреляция и связь 208 4.5. Упражнения 225 Глава 5. Линейная модель 229 5.1. Введение. Простая регрессия 229 5.2. Ранговые оценки в линейной модели 239 5.3. Ранговые критерии в линейных моделях 258 5.3.1. Критерии, основанные на D (Y — X Р) 259 5.3.2. Критерий, основанный на S (Y — X (3) ... . 266 5.3.3. Критерии, основанные на Р 269 5.4. Вычисления и примеры 273 5.5. Упражнения 283 Глава 6. Многомерная модель с параметром положения 287 6.1. Введение . 287 6.2. Одновыборочная многомерная модель с параметром положения . 288 6.3. Двухвыборочная многомерная модель с параметром положения . 295 6.4. Упражнения 300 Приложение. Некоторые сведения по теории вероятностей и математиче¬ ской статистике 304 Литература 315 Дополнительная литература ... ... ... ... 324
Хеттманспергер Т. Х41 Статистические выводы, основанные на рангах/ Пер. с англ.; Предисл. Ю. Н. Тюрина и Д. С. Шмер- линга. ,— М.: Финансы и статистика, 1987. — 334 с., ил. — (Математико-статистические методы за рубе¬ жом) . Первое систематическое введение в теорию статистического выво¬ да для случая, когда исходные данные преобразуются в ранги, что приводит к непараметрическим процедурам оценивания и статистиче¬ ского вывода. Рассматриваются одно- и двухвыборочные модели про¬ извольных и симметричных непрерывных распределений, дисперсион¬ ный анализ с двусторонней классификацией, теория ранговой корре¬ ляции и теория линейных регрессионных моделей. Дается введение в теорию статистического вывода для многомерных данных. Для специалистов-статистиков, работников вычислительных цент¬ ров, а также студентов и аспирантов вузов. v 0702000000—108 Х ~1,„, v 100—87 ББК 22.172 010(01)—87
Монография Томас П. Хеттманспергер СТАТИСТИЧЕСКИЕ ВЫВОДЫ, ОСНОВАННЫЕ НА РАНГАХ Книга одобрена на объединенном заседании редколлегий серий «Математико статистические методы за рубежом» и «Библиотечка иностранных книг эконо мистов и статистиков» 26.02.85 Зав. редакцией К. В. Коробов Редактор О. Б. Степанченко Мл. редакторы Т. Т. Гришкова, Н. Е. Мендрова Техн. редактор J1. Г. Челышева Худож. редактор Ю. И. Артюхов Корректоры А. К. Кирсанова, Н. П. Сперанская ИБ № 1925 Сдано в набор 9.04.87. Подписано в печать 27.08.87. Формат 60X847i6. Бум. кн.-журн. Гарнитура «Литературная». Печать офсетная. Уел. п. л. 19,53. Уел. кр.-отт. 19,53. Уч.-изд. л. 21,24. Тираж 5000 экз. Заказ 284 Цена 3 р. 70 к. Издательство «Финансы и статистика», 101000 Москва, ул. Чернышевского, 7. Московская типография № 4 Союзполиграфпрома при Государственном комитете СССР по делам издательств, полиграфии и книжной торговли 129041, Москва, Б. Переяславская, 46.